RU2812852C2 - Non-viral dna vectors and options for their use for expression of therapeutic agent based on factor viii (fviii) - Google Patents
Non-viral dna vectors and options for their use for expression of therapeutic agent based on factor viii (fviii) Download PDFInfo
- Publication number
- RU2812852C2 RU2812852C2 RU2021129628A RU2021129628A RU2812852C2 RU 2812852 C2 RU2812852 C2 RU 2812852C2 RU 2021129628 A RU2021129628 A RU 2021129628A RU 2021129628 A RU2021129628 A RU 2021129628A RU 2812852 C2 RU2812852 C2 RU 2812852C2
- Authority
- RU
- Russia
- Prior art keywords
- vector
- itr
- sequence
- cccdna
- fviii
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 601
- 230000014509 gene expression Effects 0.000 title claims abstract description 279
- 229960000301 factor viii Drugs 0.000 title claims abstract description 153
- 239000003814 drug Substances 0.000 title description 23
- 229940124597 therapeutic agent Drugs 0.000 title description 4
- 108010054218 Factor VIII Proteins 0.000 claims abstract description 423
- 102000001690 Factor VIII Human genes 0.000 claims abstract description 417
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 218
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 196
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 146
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 128
- 238000000034 method Methods 0.000 claims abstract description 108
- 208000009292 Hemophilia A Diseases 0.000 claims abstract description 49
- 102100026735 Coagulation factor VIII Human genes 0.000 claims abstract description 46
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 claims abstract description 45
- 201000003542 Factor VIII deficiency Diseases 0.000 claims abstract description 39
- 239000000203 mixture Substances 0.000 claims abstract description 35
- 108020004705 Codon Proteins 0.000 claims abstract description 16
- 238000001415 gene therapy Methods 0.000 claims abstract description 15
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 11
- 108020004414 DNA Proteins 0.000 claims abstract description 10
- 108091036055 CccDNA Proteins 0.000 claims description 351
- 210000004027 cell Anatomy 0.000 claims description 215
- 125000003729 nucleotide group Chemical group 0.000 claims description 145
- 239000002773 nucleotide Substances 0.000 claims description 142
- 239000002299 complementary DNA Substances 0.000 claims description 129
- 230000001105 regulatory effect Effects 0.000 claims description 101
- 102000039446 nucleic acids Human genes 0.000 claims description 76
- 108020004707 nucleic acids Proteins 0.000 claims description 76
- 238000012217 deletion Methods 0.000 claims description 54
- 230000037430 deletion Effects 0.000 claims description 54
- 230000027455 binding Effects 0.000 claims description 48
- 241000238631 Hexapoda Species 0.000 claims description 46
- 230000003612 virological effect Effects 0.000 claims description 40
- 241000283073 Equus caballus Species 0.000 claims description 38
- 239000003623 enhancer Substances 0.000 claims description 38
- 241000283707 Capra Species 0.000 claims description 33
- 241000238557 Decapoda Species 0.000 claims description 33
- 241001494479 Pecora Species 0.000 claims description 32
- 241000283690 Bos taurus Species 0.000 claims description 31
- 241000282465 Canis Species 0.000 claims description 31
- 238000003780 insertion Methods 0.000 claims description 30
- 230000037431 insertion Effects 0.000 claims description 30
- 238000006467 substitution reaction Methods 0.000 claims description 29
- 241000272814 Anser sp. Species 0.000 claims description 28
- 241000271566 Aves Species 0.000 claims description 28
- 241000580270 Adeno-associated virus - 4 Species 0.000 claims description 25
- 241001634120 Adeno-associated virus - 5 Species 0.000 claims description 25
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 25
- 241000649045 Adeno-associated virus 10 Species 0.000 claims description 23
- 241000649046 Adeno-associated virus 11 Species 0.000 claims description 23
- 241000649047 Adeno-associated virus 12 Species 0.000 claims description 23
- 241001164823 Adeno-associated virus - 7 Species 0.000 claims description 22
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 22
- 241001655883 Adeno-associated virus - 1 Species 0.000 claims description 21
- 241000202702 Adeno-associated virus - 3 Species 0.000 claims description 21
- 241000702421 Dependoparvovirus Species 0.000 claims description 21
- 241000700605 Viruses Species 0.000 claims description 21
- 241000125945 Protoparvovirus Species 0.000 claims description 20
- 210000000234 capsid Anatomy 0.000 claims description 20
- 238000001727 in vivo Methods 0.000 claims description 19
- 230000001124 posttranscriptional effect Effects 0.000 claims description 17
- 241000300529 Adeno-associated virus 13 Species 0.000 claims description 16
- 108091034057 RNA (poly(A)) Proteins 0.000 claims description 14
- 230000001965 increasing effect Effects 0.000 claims description 13
- 241000270295 Serpentes Species 0.000 claims description 11
- 238000007792 addition Methods 0.000 claims description 10
- 238000000338 in vitro Methods 0.000 claims description 7
- 230000001404 mediated effect Effects 0.000 claims description 7
- 239000002105 nanoparticle Substances 0.000 claims description 7
- 108020005345 3' Untranslated Regions Proteins 0.000 claims description 6
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 6
- 238000001802 infusion Methods 0.000 claims description 6
- 150000002632 lipids Chemical class 0.000 claims description 6
- 210000005229 liver cell Anatomy 0.000 claims description 6
- 206010021143 Hypoxia Diseases 0.000 claims description 5
- 210000002966 serum Anatomy 0.000 claims description 5
- 150000003384 small molecules Chemical class 0.000 claims description 5
- 230000007954 hypoxia Effects 0.000 claims description 4
- 101710150114 Protein rep Proteins 0.000 claims description 3
- 101710152114 Replication protein Proteins 0.000 claims description 3
- 230000028709 inflammatory response Effects 0.000 claims description 3
- 230000005855 radiation Effects 0.000 claims description 3
- WYTGDNHDOZPMIW-RCBQFDQVSA-N alstonine Natural products C1=CC2=C3C=CC=CC3=NC2=C2N1C[C@H]1[C@H](C)OC=C(C(=O)OC)[C@H]1C2 WYTGDNHDOZPMIW-RCBQFDQVSA-N 0.000 claims 21
- 241000702423 Adeno-associated virus - 2 Species 0.000 claims 18
- 235000015277 pork Nutrition 0.000 claims 16
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 claims 7
- 108010085443 Anserine Proteins 0.000 claims 4
- SLRNWACWRVGMKD-UHFFFAOYSA-N L-anserine Natural products CN1C=NC(CC(NC(=O)CCN)C(O)=O)=C1 SLRNWACWRVGMKD-UHFFFAOYSA-N 0.000 claims 4
- 241000210053 Potentilla elegans Species 0.000 claims 4
- MYYIAHXIVFADCU-QMMMGPOBSA-N anserine Chemical compound CN1C=NC=C1C[C@H](NC(=O)CC[NH3+])C([O-])=O MYYIAHXIVFADCU-QMMMGPOBSA-N 0.000 claims 4
- 244000309464 bull Species 0.000 claims 4
- 238000010255 intramuscular injection Methods 0.000 claims 1
- 239000007927 intramuscular injection Substances 0.000 claims 1
- 238000010253 intravenous injection Methods 0.000 claims 1
- 244000144977 poultry Species 0.000 claims 1
- 238000002604 ultrasonography Methods 0.000 claims 1
- 239000003795 chemical substances by application Substances 0.000 abstract description 29
- 238000012384 transportation and delivery Methods 0.000 abstract description 26
- 230000000694 effects Effects 0.000 abstract description 24
- 239000000126 substance Substances 0.000 abstract description 5
- 235000018102 proteins Nutrition 0.000 description 127
- 239000013612 plasmid Substances 0.000 description 105
- 108700019146 Transgenes Proteins 0.000 description 102
- 230000001225 therapeutic effect Effects 0.000 description 86
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 69
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 58
- 230000000295 complement effect Effects 0.000 description 50
- 239000013604 expression vector Substances 0.000 description 48
- 230000004048 modification Effects 0.000 description 44
- 238000012986 modification Methods 0.000 description 44
- 201000010099 disease Diseases 0.000 description 43
- 239000002585 base Substances 0.000 description 42
- 102000040430 polynucleotide Human genes 0.000 description 40
- 108091033319 polynucleotide Proteins 0.000 description 40
- 239000002157 polynucleotide Substances 0.000 description 40
- 239000004055 small Interfering RNA Substances 0.000 description 40
- 108090000765 processed proteins & peptides Proteins 0.000 description 38
- 230000008520 organization Effects 0.000 description 37
- 241000701447 unidentified baculovirus Species 0.000 description 36
- 238000011282 treatment Methods 0.000 description 35
- 241000282414 Homo sapiens Species 0.000 description 34
- 102000004196 processed proteins & peptides Human genes 0.000 description 34
- 229920001184 polypeptide Polymers 0.000 description 33
- 230000000875 corresponding effect Effects 0.000 description 31
- 108020004459 Small interfering RNA Proteins 0.000 description 30
- 238000004519 manufacturing process Methods 0.000 description 30
- 239000012634 fragment Substances 0.000 description 29
- 208000035475 disorder Diseases 0.000 description 26
- 230000001939 inductive effect Effects 0.000 description 25
- 238000013518 transcription Methods 0.000 description 25
- 230000035897 transcription Effects 0.000 description 25
- 230000006870 function Effects 0.000 description 23
- 230000000670 limiting effect Effects 0.000 description 22
- 230000002441 reversible effect Effects 0.000 description 21
- 210000001519 tissue Anatomy 0.000 description 21
- 108700026244 Open Reading Frames Proteins 0.000 description 19
- 239000002679 microRNA Substances 0.000 description 19
- 239000013607 AAV vector Substances 0.000 description 18
- 241001465754 Metazoa Species 0.000 description 17
- 239000000499 gel Substances 0.000 description 17
- 210000004185 liver Anatomy 0.000 description 17
- 230000035772 mutation Effects 0.000 description 17
- 230000037361 pathway Effects 0.000 description 17
- 208000024891 symptom Diseases 0.000 description 17
- 230000010076 replication Effects 0.000 description 16
- 108060001084 Luciferase Proteins 0.000 description 15
- 230000002452 interceptive effect Effects 0.000 description 15
- 125000006850 spacer group Chemical group 0.000 description 15
- 239000005089 Luciferase Substances 0.000 description 14
- 108700011259 MicroRNAs Proteins 0.000 description 14
- 230000000692 anti-sense effect Effects 0.000 description 14
- 230000008901 benefit Effects 0.000 description 14
- 241000699670 Mus sp. Species 0.000 description 13
- 101710163270 Nuclease Proteins 0.000 description 13
- 108091027967 Small hairpin RNA Proteins 0.000 description 13
- 230000004913 activation Effects 0.000 description 13
- 238000010367 cloning Methods 0.000 description 13
- 230000014616 translation Effects 0.000 description 13
- 108091034117 Oligonucleotide Proteins 0.000 description 12
- 230000015271 coagulation Effects 0.000 description 12
- 238000005345 coagulation Methods 0.000 description 12
- 229940079593 drug Drugs 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 12
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 11
- 108091026890 Coding region Proteins 0.000 description 11
- 108010000499 Thromboplastin Proteins 0.000 description 11
- 102000002262 Thromboplastin Human genes 0.000 description 11
- 230000006378 damage Effects 0.000 description 11
- 210000001808 exosome Anatomy 0.000 description 11
- 238000001990 intravenous administration Methods 0.000 description 11
- 108091008146 restriction endonucleases Proteins 0.000 description 11
- 108010073385 Fibrin Proteins 0.000 description 10
- 102000009123 Fibrin Human genes 0.000 description 10
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 description 10
- 208000031220 Hemophilia Diseases 0.000 description 10
- 108090000190 Thrombin Proteins 0.000 description 10
- 108091023040 Transcription factor Proteins 0.000 description 10
- 102000040945 Transcription factor Human genes 0.000 description 10
- 239000000074 antisense oligonucleotide Substances 0.000 description 10
- 230000008859 change Effects 0.000 description 10
- 229950003499 fibrin Drugs 0.000 description 10
- 230000002068 genetic effect Effects 0.000 description 10
- 230000002401 inhibitory effect Effects 0.000 description 10
- 239000003550 marker Substances 0.000 description 10
- 230000008488 polyadenylation Effects 0.000 description 10
- 229960004072 thrombin Drugs 0.000 description 10
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 9
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 9
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 9
- 108090000565 Capsid Proteins Proteins 0.000 description 9
- 102100023321 Ceruloplasmin Human genes 0.000 description 9
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 9
- 241000700159 Rattus Species 0.000 description 9
- 108020004440 Thymidine kinase Proteins 0.000 description 9
- 238000012230 antisense oligonucleotides Methods 0.000 description 9
- 238000002869 basic local alignment search tool Methods 0.000 description 9
- 239000003114 blood coagulation factor Substances 0.000 description 9
- 230000028327 secretion Effects 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 241000701022 Cytomegalovirus Species 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 8
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 8
- 208000032843 Hemorrhage Diseases 0.000 description 8
- 102000006601 Thymidine Kinase Human genes 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- 150000001413 amino acids Chemical class 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 230000002950 deficient Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 239000012636 effector Substances 0.000 description 8
- 230000007613 environmental effect Effects 0.000 description 8
- 229940088598 enzyme Drugs 0.000 description 8
- 108020001507 fusion proteins Proteins 0.000 description 8
- 102000037865 fusion proteins Human genes 0.000 description 8
- 239000005090 green fluorescent protein Substances 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 208000015181 infectious disease Diseases 0.000 description 8
- 238000002347 injection Methods 0.000 description 8
- 239000007924 injection Substances 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 8
- 108091070501 miRNA Proteins 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 239000000758 substrate Substances 0.000 description 8
- 230000004083 survival effect Effects 0.000 description 8
- 241000649044 Adeno-associated virus 9 Species 0.000 description 7
- 102000053642 Catalytic RNA Human genes 0.000 description 7
- 108090000994 Catalytic RNA Proteins 0.000 description 7
- 108010014173 Factor X Proteins 0.000 description 7
- 108091081021 Sense strand Proteins 0.000 description 7
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 7
- 239000008280 blood Substances 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 7
- 229940012426 factor x Drugs 0.000 description 7
- 239000000411 inducer Substances 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 108091092562 ribozyme Proteins 0.000 description 7
- 230000002103 transcriptional effect Effects 0.000 description 7
- 239000013603 viral vector Substances 0.000 description 7
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 6
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 6
- 102100026189 Beta-galactosidase Human genes 0.000 description 6
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 6
- 241000282412 Homo Species 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- 241000701945 Parvoviridae Species 0.000 description 6
- 108020004566 Transfer RNA Proteins 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- 108010005774 beta-Galactosidase Proteins 0.000 description 6
- 208000034158 bleeding Diseases 0.000 description 6
- 230000000740 bleeding effect Effects 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 6
- 230000001276 controlling effect Effects 0.000 description 6
- 210000003494 hepatocyte Anatomy 0.000 description 6
- 230000000977 initiatory effect Effects 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 239000003446 ligand Substances 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000003248 secreting effect Effects 0.000 description 6
- 238000002560 therapeutic procedure Methods 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 239000003981 vehicle Substances 0.000 description 6
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 5
- 241000288906 Primates Species 0.000 description 5
- 241000714474 Rous sarcoma virus Species 0.000 description 5
- 108020005202 Viral DNA Proteins 0.000 description 5
- 208000027418 Wounds and injury Diseases 0.000 description 5
- 238000010171 animal model Methods 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- -1 coatings Substances 0.000 description 5
- 230000023597 hemostasis Effects 0.000 description 5
- 102000051631 human SERPINA1 Human genes 0.000 description 5
- 230000028993 immune response Effects 0.000 description 5
- 208000014674 injury Diseases 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 210000003734 kidney Anatomy 0.000 description 5
- 210000001161 mammalian embryo Anatomy 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000011987 methylation Effects 0.000 description 5
- 238000007069 methylation reaction Methods 0.000 description 5
- 238000004806 packaging method and process Methods 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- 210000002027 skeletal muscle Anatomy 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 239000003053 toxin Substances 0.000 description 5
- 231100000765 toxin Toxicity 0.000 description 5
- 210000002845 virion Anatomy 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 108091023037 Aptamer Proteins 0.000 description 4
- 108090000204 Dipeptidase 1 Proteins 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 108020004422 Riboswitch Proteins 0.000 description 4
- 241000700584 Simplexvirus Species 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 101150044878 US18 gene Proteins 0.000 description 4
- 239000012190 activator Substances 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 102000006635 beta-lactamase Human genes 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 210000004204 blood vessel Anatomy 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 230000034994 death Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 102000034287 fluorescent proteins Human genes 0.000 description 4
- 108091006047 fluorescent proteins Proteins 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 210000004072 lung Anatomy 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 210000004379 membrane Anatomy 0.000 description 4
- 239000011859 microparticle Substances 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 230000000144 pharmacologic effect Effects 0.000 description 4
- 230000000069 prophylactic effect Effects 0.000 description 4
- 238000010561 standard procedure Methods 0.000 description 4
- 229940104230 thymidine Drugs 0.000 description 4
- 238000010361 transduction Methods 0.000 description 4
- 230000026683 transduction Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 241000701161 unidentified adenovirus Species 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- 210000004291 uterus Anatomy 0.000 description 4
- 108020005544 Antisense RNA Proteins 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 241000701922 Bovine parvovirus Species 0.000 description 3
- 101100126625 Caenorhabditis elegans itr-1 gene Proteins 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- 101100193633 Danio rerio rag2 gene Proteins 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 108010062466 Enzyme Precursors Proteins 0.000 description 3
- 102000010911 Enzyme Precursors Human genes 0.000 description 3
- 108010000487 High-Molecular-Weight Kininogen Proteins 0.000 description 3
- 101000574648 Homo sapiens Retinoid-inducible serine carboxypeptidase Proteins 0.000 description 3
- 241000702617 Human parvovirus B19 Species 0.000 description 3
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 3
- 102100035792 Kininogen-1 Human genes 0.000 description 3
- 101100193635 Mus musculus Rag2 gene Proteins 0.000 description 3
- 108091081548 Palindromic sequence Proteins 0.000 description 3
- 241000121250 Parvovirinae Species 0.000 description 3
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 3
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 3
- 108091093037 Peptide nucleic acid Proteins 0.000 description 3
- 108090000113 Plasma Kallikrein Proteins 0.000 description 3
- 241000702619 Porcine parvovirus Species 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 102100025483 Retinoid-inducible serine carboxypeptidase Human genes 0.000 description 3
- 108020000999 Viral RNA Proteins 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 210000004100 adrenal gland Anatomy 0.000 description 3
- 108090001015 cancer procoagulant Proteins 0.000 description 3
- 239000003184 complementary RNA Substances 0.000 description 3
- 239000005547 deoxyribonucleotide Substances 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000004907 flux Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000001476 gene delivery Methods 0.000 description 3
- 230000001771 impaired effect Effects 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- VKHAHZOOUSRJNA-GCNJZUOMSA-N mifepristone Chemical compound C1([C@@H]2C3=C4CCC(=O)C=C4CC[C@H]3[C@@H]3CC[C@@]([C@]3(C2)C)(O)C#CC)=CC=C(N(C)C)C=C1 VKHAHZOOUSRJNA-GCNJZUOMSA-N 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 230000001323 posttranslational effect Effects 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 235000004252 protein component Nutrition 0.000 description 3
- 108020001580 protein domains Proteins 0.000 description 3
- 102000005962 receptors Human genes 0.000 description 3
- 108020003175 receptors Proteins 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000005783 single-strand break Effects 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 108091008023 transcriptional regulators Proteins 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 2
- CXNPLSGKWMLZPZ-GIFSMMMISA-N (2r,3r,6s)-3-[[(3s)-3-amino-5-[carbamimidoyl(methyl)amino]pentanoyl]amino]-6-(4-amino-2-oxopyrimidin-1-yl)-3,6-dihydro-2h-pyran-2-carboxylic acid Chemical compound O1[C@@H](C(O)=O)[C@H](NC(=O)C[C@@H](N)CCN(C)C(N)=N)C=C[C@H]1N1C(=O)N=C(N)C=C1 CXNPLSGKWMLZPZ-GIFSMMMISA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- BYXHQQCXAJARLQ-ZLUOBGJFSA-N Ala-Ala-Ala Chemical group C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O BYXHQQCXAJARLQ-ZLUOBGJFSA-N 0.000 description 2
- 108020000946 Bacterial DNA Proteins 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 241000701931 Canine parvovirus Species 0.000 description 2
- 102100023804 Coagulation factor VII Human genes 0.000 description 2
- 206010053567 Coagulopathies Diseases 0.000 description 2
- 230000007067 DNA methylation Effects 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 241000121256 Densovirinae Species 0.000 description 2
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 2
- UPEZCKBFRMILAV-JNEQICEOSA-N Ecdysone Natural products O=C1[C@H]2[C@@](C)([C@@H]3C([C@@]4(O)[C@@](C)([C@H]([C@H]([C@@H](O)CCC(O)(C)C)C)CC4)CC3)=C1)C[C@H](O)[C@H](O)C2 UPEZCKBFRMILAV-JNEQICEOSA-N 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 108010023321 Factor VII Proteins 0.000 description 2
- 108010071289 Factor XIII Proteins 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 108010049003 Fibrinogen Proteins 0.000 description 2
- 102000008946 Fibrinogen Human genes 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 108090000288 Glycoproteins Proteins 0.000 description 2
- 241001517118 Goose parvovirus Species 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 108010007622 LDL Lipoproteins Proteins 0.000 description 2
- 102000007330 LDL Lipoproteins Human genes 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 2
- 102000003792 Metallothionein Human genes 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 241000009328 Perro Species 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 108010094028 Prothrombin Proteins 0.000 description 2
- 102100027378 Prothrombin Human genes 0.000 description 2
- 241000500703 Python regius Species 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 108091027981 Response element Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 241000555745 Sciuridae Species 0.000 description 2
- 108010022999 Serine Proteases Proteins 0.000 description 2
- 102000012479 Serine Proteases Human genes 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 241001345428 Snake adeno-associated virus Species 0.000 description 2
- 241000425549 Snake parvovirus Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 208000007536 Thrombosis Diseases 0.000 description 2
- 102100030951 Tissue factor pathway inhibitor Human genes 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 241000255993 Trichoplusia ni Species 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 102000015395 alpha 1-Antitrypsin Human genes 0.000 description 2
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 description 2
- 229940024142 alpha 1-antitrypsin Drugs 0.000 description 2
- UPEZCKBFRMILAV-UHFFFAOYSA-N alpha-Ecdysone Natural products C1C(O)C(O)CC2(C)C(CCC3(C(C(C(O)CCC(C)(C)O)C)CCC33O)C)C3=CC(=O)C21 UPEZCKBFRMILAV-UHFFFAOYSA-N 0.000 description 2
- 230000001668 ameliorated effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 238000003782 apoptosis assay Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- CXNPLSGKWMLZPZ-UHFFFAOYSA-N blasticidin-S Natural products O1C(C(O)=O)C(NC(=O)CC(N)CCN(C)C(N)=N)C=CC1N1C(=O)N=C(N)C=C1 CXNPLSGKWMLZPZ-UHFFFAOYSA-N 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 230000004663 cell proliferation Effects 0.000 description 2
- 230000003833 cell viability Effects 0.000 description 2
- 208000020832 chronic kidney disease Diseases 0.000 description 2
- 230000035602 clotting Effects 0.000 description 2
- 229940105778 coagulation factor viii Drugs 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- CVSVTCORWBXHQV-UHFFFAOYSA-N creatine Chemical compound NC(=[NH2+])N(C)CC([O-])=O CVSVTCORWBXHQV-UHFFFAOYSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 231100000673 dose–response relationship Toxicity 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- UPEZCKBFRMILAV-JMZLNJERSA-N ecdysone Chemical compound C1[C@@H](O)[C@@H](O)C[C@]2(C)[C@@H](CC[C@@]3([C@@H]([C@@H]([C@H](O)CCC(C)(C)O)C)CC[C@]33O)C)C3=CC(=O)[C@@H]21 UPEZCKBFRMILAV-JMZLNJERSA-N 0.000 description 2
- 230000005014 ectopic expression Effects 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 229940012413 factor vii Drugs 0.000 description 2
- 229940012444 factor xiii Drugs 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 229940012952 fibrinogen Drugs 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 2
- 210000002288 golgi apparatus Anatomy 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 210000002216 heart Anatomy 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 230000000899 immune system response Effects 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 239000003018 immunosuppressive agent Substances 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 239000012212 insulator Substances 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 108010013555 lipoprotein-associated coagulation inhibitor Proteins 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000004020 luminiscence type Methods 0.000 description 2
- 230000036210 malignancy Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical class CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 150000004713 phosphodiesters Chemical group 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 230000005522 programmed cell death Effects 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 210000002307 prostate Anatomy 0.000 description 2
- 229940039716 prothrombin Drugs 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 210000001525 retina Anatomy 0.000 description 2
- 208000037921 secondary disease Diseases 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 229960002930 sirolimus Drugs 0.000 description 2
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 230000010473 stable expression Effects 0.000 description 2
- 210000002784 stomach Anatomy 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 210000001550 testis Anatomy 0.000 description 2
- ZFXYFBGIUFBOJW-UHFFFAOYSA-N theophylline Chemical compound O=C1N(C)C(=O)N(C)C2=C1NC=N2 ZFXYFBGIUFBOJW-UHFFFAOYSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005100 tissue tropism Effects 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 238000005199 ultracentrifugation Methods 0.000 description 2
- 241001529453 unidentified herpesvirus Species 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 108010047303 von Willebrand Factor Proteins 0.000 description 2
- 102100036537 von Willebrand factor Human genes 0.000 description 2
- 229960001134 von willebrand factor Drugs 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 208000030090 Acute Disease Diseases 0.000 description 1
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 description 1
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 102000013918 Apolipoproteins E Human genes 0.000 description 1
- 108010025628 Apolipoproteins E Proteins 0.000 description 1
- 206010003594 Ataxia telangiectasia Diseases 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 102100022548 Beta-hexosaminidase subunit alpha Human genes 0.000 description 1
- 241000157302 Bison bison athabascae Species 0.000 description 1
- 208000035049 Blood-Borne Infections Diseases 0.000 description 1
- 208000005692 Bloom Syndrome Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 241000282461 Canis lupus Species 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 102100030556 Coagulation factor XII Human genes 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 208000003322 Coinfection Diseases 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- 206010053138 Congenital aplastic anaemia Diseases 0.000 description 1
- 208000034656 Contusions Diseases 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 102100026398 Cyclic AMP-responsive element-binding protein 3 Human genes 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 102000000311 Cytosine Deaminase Human genes 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000010567 DNA Polymerase II Human genes 0.000 description 1
- 108010063113 DNA Polymerase II Proteins 0.000 description 1
- 102000007528 DNA Polymerase III Human genes 0.000 description 1
- 108010071146 DNA Polymerase III Proteins 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 101710137619 DNA gyrase inhibitor Proteins 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 1
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010000437 Deamino Arginine Vasopressin Proteins 0.000 description 1
- 241000271571 Dromaius novaehollandiae Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 101150002621 EPO gene Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 102100031939 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 108010054265 Factor VIIa Proteins 0.000 description 1
- 108010080865 Factor XII Proteins 0.000 description 1
- 201000004939 Fanconi anemia Diseases 0.000 description 1
- 102000004315 Forkhead Transcription Factors Human genes 0.000 description 1
- 108090000852 Forkhead Transcription Factors Proteins 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 206010019663 Hepatic failure Diseases 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 208000005176 Hepatitis C Diseases 0.000 description 1
- 208000002972 Hepatolenticular Degeneration Diseases 0.000 description 1
- 108091064358 Holliday junction Proteins 0.000 description 1
- 102000039011 Holliday junction Human genes 0.000 description 1
- 102000009331 Homeodomain Proteins Human genes 0.000 description 1
- 108010048671 Homeodomain Proteins Proteins 0.000 description 1
- 101000855520 Homo sapiens Cyclic AMP-responsive element-binding protein 3 Proteins 0.000 description 1
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 1
- 101000878605 Homo sapiens Low affinity immunoglobulin epsilon Fc receptor Proteins 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- WOBHKFSMXKNTIM-UHFFFAOYSA-N Hydroxyethyl methacrylate Chemical compound CC(=C)C(=O)OCCO WOBHKFSMXKNTIM-UHFFFAOYSA-N 0.000 description 1
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 108060005987 Kallikrein Proteins 0.000 description 1
- 102000001399 Kallikrein Human genes 0.000 description 1
- 108010001831 LDL receptors Proteins 0.000 description 1
- 102100038007 Low affinity immunoglobulin epsilon Fc receptor Human genes 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 241000702623 Minute virus of mice Species 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101000898312 Mus musculus Enhancer of filamentation 1 Proteins 0.000 description 1
- 241000282339 Mustela Species 0.000 description 1
- 108060008487 Myosin Proteins 0.000 description 1
- 102000003505 Myosin Human genes 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 201000011252 Phenylketonuria Diseases 0.000 description 1
- 108091000054 Prion Proteins 0.000 description 1
- 102000029797 Prion Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 102000017975 Protein C Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 208000001647 Renal Insufficiency Diseases 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 201000000582 Retinoblastoma Diseases 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000277331 Salmonidae Species 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 102000007451 Steroid Receptors Human genes 0.000 description 1
- 108010085012 Steroid Receptors Proteins 0.000 description 1
- 241000272534 Struthio camelus Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 208000022292 Tay-Sachs disease Diseases 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 208000002903 Thalassemia Diseases 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 241001648840 Thosea asigna virus Species 0.000 description 1
- 102100026966 Thrombomodulin Human genes 0.000 description 1
- 108010079274 Thrombomodulin Proteins 0.000 description 1
- 102000002689 Toll-like receptor Human genes 0.000 description 1
- 108020000411 Toll-like receptor Proteins 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 108060008539 Transglutaminase Proteins 0.000 description 1
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 1
- 101150110932 US19 gene Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108020004417 Untranslated RNA Proteins 0.000 description 1
- 102000039634 Untranslated RNA Human genes 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 241000282485 Vulpes vulpes Species 0.000 description 1
- 208000018839 Wilson disease Diseases 0.000 description 1
- 241001492404 Woodchuck hepatitis virus Species 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 201000006083 Xeroderma Pigmentosum Diseases 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- OGAQVUGJYFZLEO-KXOMOVGCSA-N [(3s,10r,13s,17s)-17-acetamido-10,13-dimethyl-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1h-cyclopenta[a]phenanthren-3-yl] 2-[4-[bis(2-chloroethyl)amino]phenyl]acetate Chemical compound O([C@@H]1CC2=CCC3C4CC[C@@H]([C@]4(CCC3[C@@]2(C)CC1)C)NC(=O)C)C(=O)CC1=CC=C(N(CCCl)CCCl)C=C1 OGAQVUGJYFZLEO-KXOMOVGCSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 208000037919 acquired disease Diseases 0.000 description 1
- 108091006088 activator proteins Proteins 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 201000010275 acute porphyria Diseases 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001350 alkyl halides Chemical class 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 239000003146 anticoagulant agent Substances 0.000 description 1
- 229940127219 anticoagulant drug Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 208000013404 behavioral symptom Diseases 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000007321 biological mechanism Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 230000023555 blood coagulation Effects 0.000 description 1
- 208000015294 blood coagulation disease Diseases 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 150000007942 carboxylates Chemical class 0.000 description 1
- 241001233037 catfish Species 0.000 description 1
- 230000034303 cell budding Effects 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000022534 cell killing Effects 0.000 description 1
- 210000003986 cell retinal photoreceptor Anatomy 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 210000003710 cerebral cortex Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 238000011097 chromatography purification Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000009852 coagulant defect Effects 0.000 description 1
- 229940105774 coagulation factor ix Drugs 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 229960003624 creatine Drugs 0.000 description 1
- 239000006046 creatine Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000011461 current therapy Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 229960004281 desmopressin Drugs 0.000 description 1
- NFLWUMRGJYTJIN-NXBWRCJVSA-N desmopressin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CC(N)=O)C(=O)N[C@@H](CSSCCC(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(N)=O)=O)CCC(=O)N)C1=CC=CC=C1 NFLWUMRGJYTJIN-NXBWRCJVSA-N 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000011979 disease modifying therapy Methods 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 108010057988 ecdysone receptor Proteins 0.000 description 1
- 150000002061 ecdysteroids Chemical class 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- 210000003038 endothelium Anatomy 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 238000001952 enzyme assay Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006624 extrinsic pathway Effects 0.000 description 1
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 229960002963 ganciclovir Drugs 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 231100000025 genetic toxicology Toxicity 0.000 description 1
- 230000001738 genotoxic effect Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000003292 glue Substances 0.000 description 1
- 239000002271 gyrase inhibitor Substances 0.000 description 1
- 210000005003 heart tissue Anatomy 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 230000002439 hemostatic effect Effects 0.000 description 1
- 208000033552 hepatic porphyria Diseases 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 208000006359 hepatoblastoma Diseases 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 102000057593 human F8 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000001146 hypoxic effect Effects 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 230000001861 immunosuppressant effect Effects 0.000 description 1
- 229940125721 immunosuppressive agent Drugs 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000002743 insertional mutagenesis Methods 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- 230000037041 intracellular level Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 230000002601 intratumoral effect Effects 0.000 description 1
- 230000006623 intrinsic pathway Effects 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 208000028867 ischemia Diseases 0.000 description 1
- 230000000302 ischemic effect Effects 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 210000001865 kupffer cell Anatomy 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 230000021633 leukocyte mediated immunity Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 208000007903 liver failure Diseases 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000000464 low-speed centrifugation Methods 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 230000001926 lymphatic effect Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000002826 magnetic-activated cell sorting Methods 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 239000004530 micro-emulsion Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 229960003248 mifepristone Drugs 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000025608 mitochondrion localization Effects 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 230000000414 obstructive effect Effects 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 210000004923 pancreatic tissue Anatomy 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002572 peristaltic effect Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 238000012247 phenotypical assay Methods 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 108091008695 photoreceptors Proteins 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 239000000902 placebo Substances 0.000 description 1
- 229940068196 placebo Drugs 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 230000010118 platelet activation Effects 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000001566 pro-viral effect Effects 0.000 description 1
- 239000000651 prodrug Substances 0.000 description 1
- 229940002612 prodrug Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 102000003998 progesterone receptors Human genes 0.000 description 1
- 108090000468 progesterone receptors Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 108010014806 prothrombinase complex Proteins 0.000 description 1
- 230000003331 prothrombotic effect Effects 0.000 description 1
- 239000013608 rAAV vector Substances 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 101150066583 rep gene Proteins 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 239000003340 retarding agent Substances 0.000 description 1
- 210000001116 retinal neuron Anatomy 0.000 description 1
- 239000000790 retinal pigment Substances 0.000 description 1
- 102000027483 retinoid hormone receptors Human genes 0.000 description 1
- 108091008679 retinoid hormone receptors Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 210000003079 salivary gland Anatomy 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 239000013017 sartobind Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 1
- 210000002460 smooth muscle Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- JJICLMJFIKGAAU-UHFFFAOYSA-M sodium;2-amino-9-(1,3-dihydroxypropan-2-yloxymethyl)purin-6-olate Chemical compound [Na+].NC1=NC([O-])=C2N=CN(COC(CO)CO)C2=N1 JJICLMJFIKGAAU-UHFFFAOYSA-M 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229960000278 theophylline Drugs 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 210000002972 tibial nerve Anatomy 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 102000003601 transglutaminase Human genes 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 230000000472 traumatic effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- IEDVJHCEMCRBQM-UHFFFAOYSA-N trimethoprim Chemical compound COC1=C(OC)C(OC)=CC(CC=2C(=NC(N)=NC=2)N)=C1 IEDVJHCEMCRBQM-UHFFFAOYSA-N 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000009452 underexpressoin Effects 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 230000004143 urea cycle Effects 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
- 238000011816 wild-type C57Bl6 mouse Methods 0.000 description 1
Abstract
Description
РОДСТВЕННЫЕ ЗАЯВКИRELATED APPLICATIONS
[0001] Настоящая заявка испрашивает приоритет согласно предварительной заявке США №62/817904, поданной 13 марта 2019 г., и предварительной заявке США №62/856432, поданной 3 июня 2019 г., содержание каждой из которых полностью включено в данный документ посредством ссылки.[0001] This application claims benefit to US Provisional Application No. 62/817904, filed March 13, 2019, and US Provisional Application No. 62/856432, filed June 3, 2019, the contents of each of which are incorporated herein by reference in their entirety. .
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙLIST OF SEQUENCES
[0002] Настоящая заявка включает перечень последовательностей, который был подан в электронном виде в формате ASCII, а также последовательности в Таблицах 1-9 в данном документе, каждая из которых полностью включена в данный документ посредством ссылки. Указанная копия в формате ASCII, созданная 11 марта 2020 г., названа 131698-06020_SL.txt и имеет размер 116781 байтов.[0002] This application includes a sequence listing that has been filed electronically in ASCII format, as well as the sequences in Tables 1-9 herein, each of which is incorporated herein by reference in its entirety. The listed ASCII copy, created on March 11, 2020, is named 131698-06020_SL.txt and is 116781 bytes in size.
ОБЛАСТЬ ТЕХНИКИTECHNICAL FIELD
[0003] Настоящее изобретение относится к области генной терапии, включая невирусные векторы для экспрессии трансгена или выделенных полинуклеотидов у субъекта или в клетке. Настоящее раскрытие также относится к конструкциям нуклеиновых кислот, промоторам, векторам и клеткам-хозяевам, включая полинуклеотиды, а также к способам доставки экзогенных последовательностей ДНК в целевую клетку, ткань, орган или организм. Например, настоящее раскрытие обеспечивает способы применения невирусных зкДНК-векторов для экспрессии фактора VIII (FVIII) из клетки, например, экспрессии терапевтического белка FVIII для лечения субъекта, страдающего гемофилией А. Способы и композиции можно применять, например, для лечения заболевания путем экспрессии FVIII в клетке или ткани субъекта, нуждающегося в этом.[0003] The present invention relates to the field of gene therapy, including non-viral vectors for expression of a transgene or isolated polynucleotides in a subject or cell. The present disclosure also relates to nucleic acid constructs, promoters, vectors and host cells, including polynucleotides, as well as methods for delivering exogenous DNA sequences to a target cell, tissue, organ or organism. For example, the present disclosure provides methods of using non-viral cccDNA vectors to express factor VIII (FVIII) from a cell, for example, expressing a therapeutic FVIII protein for treating a subject suffering from hemophilia A. The methods and compositions can be used, for example, to treat a disease by expressing FVIII in cell or tissue of the subject in need.
УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE ART
[0004] Целью генной терапии является улучшение клинических исходов у пациентов, страдающих либо генетическими мутациями, либо приобретенными заболеваниями, вызванными аберрацией в профиле экспрессии генов. Генная терапия включает лечение или предотвращение медицинских состояний, вызванных дефектными генами или аномальной регуляцией или экспрессией, например, недостаточной экспрессией или избыточной экспрессией, что может привести к нарушению, заболеванию, злокачественному новообразованию и т.д. Например, заболевание или нарушение, вызванное дефектным геном, можно лечить, предотвращать или облегчать путем доставки пациенту корректирующего генетического материала, или можно лечить, предотвращать или облегчать путем изменения или подавления у пациента дефектного гена, например, с помощью корректирующего генетического материала, приводящего к терапевтической экспрессии генетического материала в организме пациента.[0004] The goal of gene therapy is to improve clinical outcomes in patients suffering from either genetic mutations or acquired diseases caused by aberrations in the gene expression profile. Gene therapy involves the treatment or prevention of medical conditions caused by defective genes or abnormal regulation or expression, such as underexpression or overexpression, which can lead to a disorder, disease, malignancy, etc. For example, a disease or disorder caused by a defective gene may be treated, prevented, or ameliorated by delivering corrective genetic material to a patient, or may be treated, prevented, or ameliorated by modifying or suppressing a defective gene in a patient, for example, by providing corrective genetic material resulting in a therapeutic effect. expression of genetic material in the patient’s body.
[0005] Основой генной терапии является обеспечение транскрипционной кассеты с активным генным продуктом (иногда называемым трансгеном), например, который может приводить к положительному эффекту усиления функции, отрицательному эффекту потери функции или другому исходу. Такие исходы можно отнести к экспрессии терапевтического белка, такого как антитело, функциональный фермент или слитый белок. Генную терапию также можно применять для лечения заболевания или злокачественного новообразования, вызванного другими факторами. Моногенные нарушения у человека можно лечить путем доставки нормального гена в целевые клетки и его экспрессии в них. Доставку и экспрессию корректирующего гена в клетках-мишенях пациента можно осуществлять с применением многочисленных способов, включая применение сконструированных вирусов и вирусных векторов для доставки генов. Среди многочисленных доступных векторов вирусного происхождения (например, рекомбинантный ретровирус, рекомбинантный лентивирус, рекомбинантный аденовирус и т.п.) рекомбинантный аденоассоциированный вирус (рААВ) приобретает все большую популярность в генной терапии в качестве многоцелевого вектора.[0005] The basis of gene therapy is the provision of a transcription cassette with an active gene product (sometimes called a transgene), for example, which can lead to a positive gain-of-function effect, a negative loss-of-function effect, or other outcome. Such outcomes may be attributed to the expression of a therapeutic protein, such as an antibody, functional enzyme, or fusion protein. Gene therapy can also be used to treat a disease or malignancy caused by other factors. Monogenic disorders in humans can be treated by delivering a normal gene to target cells and expressing it in them. Delivery and expression of the corrective gene in target cells of a patient can be achieved using numerous methods, including the use of engineered viruses and viral vectors for gene delivery. Among the numerous viral vectors available (eg, recombinant retrovirus, recombinant lentivirus, recombinant adenovirus, etc.), recombinant adeno-associated virus (rAAV) is gaining increasing popularity in gene therapy as a multi-purpose vector.
[0006] Аденоассоциированные вирусы (ААВ) принадлежат к семейству Parvoviridae и, более конкретно, составляют род депендопареоеирусое. Векторы, происходящие из ААВ (т.е. рекомбинантные ААВ (рААВ) или ААВ-векторы), являются привлекательным способом доставки генетического материала, поскольку (i) они способны инфицировать (трансдуцировать) широкий спектр типов неделящихся и делящихся клеток, включая миоциты и нейроны; (ii) они лишены вирусных структурных генов, что уменьшает ответы клеток хозяина на вирусную инфекцию, например, опосредуемые интерфероном ответы; (iii) вирусы дикого типа считаются непатологичными у человека; (iv) в отличие от ААВ дикого типа, которые способны интегрироваться в геном клетки хозяина, дефектные по репликации ААВ-векторы лишены гена rep и обычно персистируют в виде эписом, что ограничивает риск инсерционного мутагенеза или генотоксичности; и (ν) по сравнению с другими векторными системами ААВ-векторы обычно считаются относительно слабыми иммуногенами и, следовательно, не вызывают значительного иммунного ответа (см. ii), обеспечивая, таким образом, персистенцию векторной ДНК и, потенциально, долговременную экспрессию терапевтических трансгенов.[0006] Adeno-associated viruses (AAVs) belong to the family Parvoviridae and, more specifically, constitute the genus Dependopareoviridae. AAV-derived vectors (i.e., recombinant AAV (rAAV) or AAV vectors) are an attractive method of delivering genetic material because (i) they are capable of infecting (transducing) a wide range of nondividing and dividing cell types, including myocytes and neurons ; (ii) they lack viral structural genes, which reduces host cell responses to viral infection, such as interferon-mediated responses; (iii) wild-type viruses are considered non-pathological in humans; (iv) unlike wild-type AAVs, which are capable of integrating into the host cell genome, replication-defective AAV vectors lack the rep gene and usually persist as episomes, which limits the risk of insertional mutagenesis or genotoxicity; and (ν) compared to other vector systems, AAV vectors are generally considered to be relatively weak immunogens and therefore do not elicit a significant immune response (see ii), thus allowing vector DNA persistence and potentially long-term expression of therapeutic transgenes.
[0007] Однако применение частиц ААВ в качестве вектора для доставки генов имеет несколько серьезных недостатков. Одним из основных недостатков, ассоциированных с рААВ, является ограниченная емкость вирусной упаковки, составляющая примерно 4,5 тыс.п.о. гетерологичной ДНК (Dong et al, 1996; Athanasopoulos et al, 2004; Lai et al, 2010), вследствие этого применение ААВ-векторов ограничено их способностью кодировать белки размером менее 150000 Да. Вторым недостатком является то, что в результате распространенности инфекции ААВ дикого типа среди населения кандидаты на генную терапию с использованием рААВ должны проходить скрининг на наличие нейтрализующих антител, устраняющих вектор из организма пациента. Третий недостаток связан с иммуногенностью капсида, которая препятствует повторному введению пациентам, которые не были отстранены от начального лечения. Иммунная система пациента может отвечать на вектор, который фактически выступает в роли «бустерной» прививки, стимулирующей выработку высоких титров антител к ААВ иммунной системой, которые исключают возможность лечения в будущем. В некоторых недавних сообщениях выражены опасения, касающиеся иммуногенности в ситуациях, подразумевающих применение высоких доз. Другой заметный недостаток заключается в относительно медленном начале ААВ-опосредуемой экспрессии генов, учитывая, что одноцепочечная ДНК ААВ должна быть преобразована в двухцепочечную ДНК до экспрессии гетерологичного гена.[0007] However, the use of AAV particles as a vector for gene delivery has several serious disadvantages. One of the major disadvantages associated with rAAV is the limited viral packaging capacity of approximately 4.5 kb. heterologous DNA (Dong et al, 1996; Athanasopoulos et al, 2004; Lai et al, 2010), therefore the use of AAV vectors is limited by their ability to encode proteins smaller than 150,000 Da. A second disadvantage is that, as a result of the prevalence of wild-type AAV infection in the population, candidates for gene therapy using rAAV must be screened for the presence of neutralizing antibodies that eliminate the vector from the patient. A third disadvantage relates to the immunogenicity of the capsid, which precludes re-administration in patients who have not been withdrawn from initial treatment. The patient's immune system may respond to the vector, which essentially acts as a "booster" shot, stimulating the immune system to produce high titers of anti-AAV antibodies, which preclude future treatment. Some recent reports have raised concerns regarding immunogenicity in situations involving high doses. Another notable disadvantage is the relatively slow onset of AAV-mediated gene expression, given that single-stranded AAV DNA must be converted to double-stranded DNA before expression of the heterologous gene.
[0008] Кроме того, обычные вирионы ААВ с капсидами получают путем введения плазмиды или плазмид, содержащих геном ААВ, гены rep и гены cap (Grimm et al., 1998). Однако было обнаружено, что такие вирусные векторы на основе заключенного в капсид ААВ неэффективно трансдуцируют определенные типы клеток и тканей, а капсиды также индуцируют иммунный ответ.[0008] In addition, conventional AAV capsid virions are produced by introducing a plasmid or plasmids containing the AAV genome, rep genes and cap genes (Grimm et al., 1998). However, such capsidized AAV viral vectors have been found to ineffectively transduce certain types of cells and tissues, and capsids also induce an immune response.
[0009] Соответственно, применение векторов на основе аденоассоциированного вируса (ААВ) для генной терапии ограничено из-за однократного введения пациентам (вследствие иммунного ответа пациента), ограниченного диапазона трансгенного генетического материала, подходящего для доставки в ААВ-векторах ввиду минимальной емкости вирусной упаковки (около 4,5 тыс.п.о.), и медленной ААВ-опосредуемой экспрессии генов.[0009] Accordingly, the use of adeno-associated virus (AAV) vectors for gene therapy is limited due to single administration to patients (due to the patient's immune response), a limited range of transgenic genetic material suitable for delivery in AAV vectors due to the minimal capacity of the viral packaging ( about 4.5 kb), and slow AAV-mediated gene expression.
[0010] Существует большая неудовлетворенная потребность в модифицирующих заболевание видах терапии при гемофилии А. Современные виды терапии обременительны и требуют внутривенных (в/в) введений. Во-первых, эти инъекционные препараты фактора VIII не обеспечивают непрерывную доставку факторов, при этом минимальные уровни допускают эпизоды кровотечения. Во-вторых, отсутствуют одобренные виды генной терапии гемофилии А, а виды терапии на основе ААВ не могут применяться у 25%-40% пациентов из-за уже существующих антител. ААВ может быть введен только один раз, и полученные уровни фактора VIII могут быть недостаточно высокими, чтобы быть эффективными, или могут превышать нормальные, уровни доз не поддаются титрованию. В-третьих, многие пациенты, страдающие гемофилией А, не могут использовать эти виды терапии из-за выработки нейтрализующих антител к этим экзогенным, искусственным факторам свертывания крови.[0010] There is a large unmet need for disease-modifying therapies for hemophilia A. Current therapies are cumbersome and require intravenous (IV) administrations. First, these injectable factor VIII preparations do not provide continuous factor delivery, with minimal levels allowing bleeding episodes. Second, there are no approved gene therapies for hemophilia A, and AAV-based therapies cannot be used in 25% to 40% of patients due to pre-existing antibodies. AAV may only be administered once, and the resulting levels of factor VIII may not be high enough to be effective or may be higher than normal dose levels that cannot be titrated. Third, many patients with hemophilia A are unable to use these therapies due to the production of neutralizing antibodies to these exogenous, man-made clotting factors.
[0011] Соответственно, в данной области существует потребность в технологии, которая обеспечивает экспрессию терапевтического белка FVIII в клетке, ткани или организме субъекта для лечения гемофилии А.[0011] Accordingly, there is a need in the art for technology that enables expression of a therapeutic FVIII protein in a cell, tissue, or body of a subject for the treatment of hemophilia A.
КРАТКОЕ ОПИСАНИЕSHORT DESCRIPTION
[0012] Технология, описанная в данном документе, относится к способам и композициям для лечения гемофилии А путем экспрессии белка фактора VIII (FVIII) с бескапсидного (например, невирусного) ДНК-вектора с ковалентно замкнутыми концами (называемого в данном документе «ДНК-вектор с замкнутыми концами» или «зкДНК-вектор»), причем указанный зкДНК-вектор содержит последовательность нуклеиновой кислоты FVIII или ее варианты, оптимизированные по кодонам. Этот зкДНК-вектор можно применять для получения белков FVIII для лечения, мониторинга и диагностики. Применение зкДНК-векторов, экспрессирующих FVIII, у субъекта для лечения гемофилии А подходит для: (i) обеспечения модифицирующих заболевание уровней фермента FVIII, (ii) минимально инвазивной доставки, (iii) повторяемости и дозирования до достижения эффекта, (iv) быстрого начала терапевтического эффекта, (v) устойчивой экспрессии корректирующего фермента FVIII в печени, (vi) восстановления функции цикла мочевины, и/или (vii) титрования для достижения соответствующих фармакологических уровней дефектного фермента.[0012] The technology described herein relates to methods and compositions for treating hemophilia A by expressing factor VIII (FVIII) protein from a capsidless (e.g., non-viral) DNA vector with covalently closed ends (referred to herein as a “DNA vector closed ends" or "ccDNA vector"), wherein said cccDNA vector contains a FVIII nucleic acid sequence or codon optimized variants thereof. This cccDNA vector can be used to produce FVIII proteins for treatment, monitoring and diagnosis. The use of cccDNA vectors expressing FVIII in a subject for the treatment of hemophilia A is suitable for: (i) providing disease-modifying levels of the FVIII enzyme, (ii) minimally invasive delivery, (iii) repeatability and dosing until effect is achieved, (iv) rapid onset of therapeutic effect, (v) sustained expression of the corrective FVIII enzyme in the liver, (vi) restoration of urea cycle function, and/or (vii) titration to achieve appropriate pharmacological levels of the defective enzyme.
[0013] Согласно некоторым вариантам реализации зкДНК-вектор, экспрессирующий FVIII, необязательно присутствует в составе липосомных наночастиц (ЛНЧ) для лечения гемофилии А. ЗкДНК-векторы, описанные в данном документе, могут обеспечивать одно или более преимуществ, включая, но не ограничиваясь перечисленными, обеспечение модифицирующих заболевание уровней фактора VIII, минимальную инвазивность при доставке, повторяемость и дозирование до достижения эффекта, обеспечение быстрого начала терапевтического эффекта в течение нескольких дней после терапевтического вмешательства, устойчивую экспрессию корректирующих уровней фактора VIII в кровотоке, возможность титрования для достижения соответствующих фармакологических уровней дефектного фактора коагуляции и/или обеспечение способов лечения другого типа гемофилии, включая, но не ограничиваясь этим, дефицит фактора VIII.[0013] In some embodiments, a cccDNA vector expressing FVIII is optionally present in liposomal nanoparticles (LNPs) for the treatment of hemophilia A. The cccDNA vectors described herein may provide one or more benefits, including, but not limited to, the following: , providing disease-modifying levels of factor VIII, minimal invasiveness in delivery, repeatability and dosing until effect is achieved, ensuring rapid onset of therapeutic effect within days of therapeutic intervention, sustained expression of corrective levels of factor VIII in the bloodstream, ability to titrate to achieve appropriate pharmacological levels of the defective coagulation factor and/or providing treatments for another type of hemophilia, including, but not limited to, factor VIII deficiency.
[0014] Соответственно, настоящее изобретение, описанное в данном документе, относится к бескапсидному (например, невирусному) ДНК-вектору с ковалентно замкнутыми концами (называемому в данном документе «ДНК-вектор с замкнутыми концами» или «зкДНК-вектор»), содержащему гетерогенный ген, кодирующий FVIII, чтобы обеспечить экспрессию терапевтического белка FVIII в клетке. В соответствии с одним аспектом в настоящем раскрытии предложен бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК), содержащий по меньшей мере одну гетерологичную нуклеотидную последовательность между фланкирующими инвертированными концевыми повторами (ITR), причем по меньшей мере одна гетер о логичная нуклеотидная последовательность кодирует по меньшей мере один белок FVIII, при этом указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из любой из последовательностей в Таблице 1. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из любой из последовательностей в Таблице 9. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из группы, состоящей из SEQ ID NO: 207, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 199, SEQ ID NO: 208, SEQ ID NO: 211 и SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 90% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 95% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 96% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 97% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 98% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 99% идентична SEQ ID NO: 210. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 85% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 90% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 95% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 96% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 97% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 98% идентична SEQ ID NO: 214. В соответствии с некоторыми вариантами реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, которая по меньшей мере на 99% идентична SEQ ID NO: 214.[0014] Accordingly, the present invention described herein relates to a capsid-free (e.g., non-viral) covalently closed-end DNA vector (referred to herein as a “closed-end DNA vector” or “ccDNA vector”) comprising a heterogeneous gene encoding FVIII to allow expression of the therapeutic FVIII protein in the cell. In accordance with one aspect, the present disclosure provides a capsidless closed-end DNA (ccDNA) vector comprising at least one heterologous nucleotide sequence between flanking inverted terminal repeats (ITRs), wherein at least one heterologous nucleotide sequence encodes at least one FVIII protein, wherein the at least one heterologous nucleotide sequence that encodes the at least one FVIII protein is selected from any of the sequences in Table 1. In accordance with some embodiments, the ccDNA vector comprises a nucleic acid sequence selected from any of the sequences in Table 9. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence selected from the group consisting of SEQ ID NO: 207, SEQ ID NO: 210, SEQ ID NO: 212, SEQ ID NO: 199, SEQ ID NO: 208, SEQ ID NO: 211, and SEQ ID NO: 214. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 85% identical to SEQ ID NO: 210. In accordance in some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 90% identical to SEQ ID NO: 210. In some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 95% identical to SEQ ID NO: 210. In accordance with some embodiments, the ccDNA vector contains a nucleic acid sequence that is at least 96% identical to SEQ ID NO: 210. In accordance with some embodiments, the ccDNA vector contains a nucleic acid sequence that is at least is 97% identical to SEQ ID NO: 210. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 98% identical to SEQ ID NO: 210. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence acid that is at least 99% identical to SEQ ID NO: 210. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 85% identical to SEQ ID NO: 214. In accordance with some embodiments The cccDNA vector contains a nucleic acid sequence that is at least 90% identical to SEQ ID NO: 214. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 95% identical to SEQ ID NO: 214. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 96% identical to SEQ ID NO: 214. In accordance with some embodiments, the cccDNA vector contains a nucleic acid sequence that is at least 97% identical to SEQ ID NO: 214. In accordance with some embodiments, the ccDNA vector contains a nucleic acid sequence that is at least 98% identical to SEQ ID NO: 214. In accordance with some embodiments, the ccDNA vector contains a nucleic acid sequence that is at least 99% identical to SEQ ID NO: 214.
[0015] Согласно одному варианту реализации в данном документе раскрыт бескапсидный вектор на основе ДНК с замкнутыми концами (зкДНК), содержащий по меньшей мере одну гетерологичную нуклеотидную последовательность между фланкирующими инвертированными концевыми повторами (ITR), причем по меньшей мере одна гетерологичная нуклеотидная последовательность кодирует по меньшей мере один белок FVIII, при этом указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 85% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 90% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 91% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 92% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 93% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 94% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 95% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 96% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 97% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 98% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, имеющей по меньшей мере 99% идентичности с любой последовательностью в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, содержащей любую последовательность в Таблице 1. Согласно одному варианту реализации указанная по меньшей мере одна гетерологичная нуклеотидная последовательность, которая кодирует по меньшей мере один белок FVIII, выбрана из последовательности, содержащей любую последовательность в Таблице 1.[0015] In one embodiment, disclosed herein is a capsidless closed-end DNA (ccDNA) vector comprising at least one heterologous nucleotide sequence between flanking inverted terminal repeats (ITRs), wherein the at least one heterologous nucleotide sequence encodes at least one FVIII protein, wherein the at least one heterologous nucleotide sequence that encodes the at least one FVIII protein is selected from a sequence having at least 85% identity with any sequence in Table 1. In one embodiment, the specified at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 90% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 91% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence, having at least 92% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 93% identity with any sequence in Table 1. In one embodiment, said at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 94% identity with any sequence in Table 1. In one embodiment, said at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 95% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 96% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence, having at least 97% identity with any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 98% identity with any sequence in Table 1. In one embodiment, said at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence having at least 99% identity with any sequence in Table 1. In one embodiment, said at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence comprising any sequence in Table 1. In one embodiment, the at least one heterologous nucleotide sequence that encodes at least one FVIII protein is selected from a sequence containing any sequence in Table 1.
[0016] Согласно одному варианту реализации последовательность в Таблице 1 выбрана из группы, состоящей из SEQ ID NO: 380, SEQ ID NO: 381, SEQ ID NO: 382, SEQ ID NO: 383, SEQ ID NO: 384, SEQ ID NO: 385, SEQ ID NO: 386, SEQ ID NO: 387, SEQ ID NO: 388, SEQ ID NO: 389, SEQ ID NO: 390, SEQ ID NO: 391, SEQ ID NO: 392, SEQ ID NO: 393, SEQ ID NO: 394, SEQ ID NO: 395, SEQ ID NO: 396 и SEQ ID NO: 397. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 380. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 381. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 382. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 383. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 384. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 385. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 386. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 387. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 388. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 389. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 390. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 391. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 392. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 393. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 394. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 395. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 396. Согласно одному варианту реализации последовательность представляет собой SEQ ID NO: 397.[0016] In one embodiment, the sequence in Table 1 is selected from the group consisting of SEQ ID NO: 380, SEQ ID NO: 381, SEQ ID NO: 382, SEQ ID NO: 383, SEQ ID NO: 384, SEQ ID NO : 385, SEQ ID NO: 386, SEQ ID NO: 387, SEQ ID NO: 388, SEQ ID NO: 389, SEQ ID NO: 390, SEQ ID NO: 391, SEQ ID NO: 392, SEQ ID NO: 393 , SEQ ID NO: 394, SEQ ID NO: 395, SEQ ID NO: 396, and SEQ ID NO: 397. In one embodiment, the sequence is SEQ ID NO: 380. In one embodiment, the sequence is SEQ ID NO: 381 In one embodiment, the sequence is SEQ ID NO: 382. In one embodiment, the sequence is SEQ ID NO: 383. In one embodiment, the sequence is SEQ ID NO: 384. In one embodiment, the sequence is SEQ ID NO: : 385. In one embodiment, the sequence is SEQ ID NO: 386. In one embodiment, the sequence is SEQ ID NO: 387. In one embodiment, the sequence is SEQ ID NO: 388. In one embodiment, the sequence is SEQ ID NO: 389. In one embodiment, the sequence is SEQ ID NO: 390. In one embodiment, the sequence is SEQ ID NO: 391. In one embodiment, the sequence is SEQ ID NO: 392. In one embodiment, the sequence is is SEQ ID NO: 393. In one embodiment, the sequence is SEQ ID NO: 394. In one embodiment, the sequence is SEQ ID NO: 395. In one embodiment, the sequence is SEQ ID NO: 396. In one embodiment, the sequence is SEQ ID NO: 397.
[0017] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 85% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 90% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 91% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 92% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 93% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 94% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 95% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 96% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 97% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 98% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, выбранную из последовательности, имеющей по меньшей мере 99% идентичности с любой последовательностью в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую последовательность в Таблице 9. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из последовательности в Таблице 9.[0017] In one embodiment, the ccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 85% identity to any sequence in Table 9. In one embodiment, the ccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 90% identity to any sequence in Table 9. In one embodiment, the cccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 91% identity to any sequence in Table 9. In one embodiment, the cccDNA vector contains a nucleic acid sequence selected from a sequence having at least 92% identity with any sequence in Table 9. In one embodiment, the cccDNA vector contains a nucleic acid sequence selected from a sequence having at least 93% identity with any sequence in Table 9. In one embodiment, the cccDNA vector contains a nucleic acid sequence selected from a sequence having at least 94% identity with any sequence in Table 9. In one embodiment, the ccDNA vector contains a nucleic acid sequence selected from a sequence having at least 95% identity to any sequence in Table 9. In one embodiment, the cccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 96% identity to any sequence in Table 9. In one embodiment, the cccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 97% identity to any sequence in Table 9. In one embodiment, the cccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 98% identity to any sequence in Table 9. In one embodiment, the cccDNA vector comprises a nucleic acid sequence selected from a sequence having at least 99% identity to any sequence in Table 9. In one embodiment, the ccDNA vector comprises a nucleic acid sequence comprising a sequence in Table 9 In one embodiment, the cccDNA vector contains a nucleic acid sequence consisting of the sequence in Table 9.
[0018] Согласно одному варианту реализации последовательность в Таблице 9 выбрана из группы, состоящей из SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 204, SEQ ID NO: 205, SEQ ID NO: 206, SEQ ID NO: 207, SEQ ID NO: 208, SEQ ID NO: 209, SEQ ID NO: 210, SEQ ID NO: 211, SEQ ID NO: 212, SEQ ID NO: 213, SEQ ID NO: 214, SEQ ID NO: 215, SEQ ID NO: 216 и SEQ ID NO: 217. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 197. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 198. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой SEQ ID NO: 199. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 200. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 201. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 202. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 203. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 204. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 205. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 206. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 207. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 208. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 209. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 210. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 211. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 212. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 213. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 214. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 215. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 216. Согласно одному варианту реализации последовательность в Таблице 9 представляет собой 217.[0018] In one embodiment, the sequence in Table 9 is selected from the group consisting of SEQ ID NO: 197, SEQ ID NO: 198, SEQ ID NO: 199, SEQ ID NO: 200, SEQ ID NO: 201, SEQ ID NO : 202, SEQ ID NO: 203, SEQ ID NO: 204, SEQ ID NO: 205, SEQ ID NO: 206, SEQ ID NO: 207, SEQ ID NO: 208, SEQ ID NO: 209, SEQ ID NO: 210 , SEQ ID NO: 211, SEQ ID NO: 212, SEQ ID NO: 213, SEQ ID NO: 214, SEQ ID NO: 215, SEQ ID NO: 216, and SEQ ID NO: 217. In one embodiment, the sequence in the Table 9 represents SEQ ID NO: 197. In one embodiment, the sequence in Table 9 is SEQ ID NO: 198. In one embodiment, the sequence in Table 9 is SEQ ID NO: 199. In one embodiment, the sequence in Table 9 represents is 200. In one embodiment, the sequence in Table 9 is 201. In one embodiment, the sequence in Table 9 is 202. In one embodiment, the sequence in Table 9 is 203. In one embodiment, the sequence in Table 9 is 204 According to one implementation, the sequence in Table 9 is 205. According to one implementation, the sequence in Table 9 is 206. According to one implementation, the sequence in Table 9 is 207. According to one implementation, the sequence in Table 9 is 208. According to In one embodiment, the sequence in Table 9 is 209. In one embodiment, the sequence in Table 9 is 210. In one embodiment, the sequence in Table 9 is 211. In one embodiment, the sequence in Table 9 is 212. In one embodiment According to one implementation, the sequence in Table 9 is 213. In one implementation, the sequence in Table 9 is 214. In one implementation, the sequence in Table 9 is 215. In one implementation, the sequence in Table 9 is 216. In one implementation, the sequence in Table 9 is 217.
[0019] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 90% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 91% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 92% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 93% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 94% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 95% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 96% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 97% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 98% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 99% идентичности с SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую SEQ ID NO: 210. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из SEQ ID NO: 210.[0019] In one embodiment, the cccDNA vector comprises a nucleic acid sequence having at least 85% identity to SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 90% identity to SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 91% identity to SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 92% identity with SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 93% identity with SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 94 % identity to SEQ ID NO: 210. In one embodiment, the cccDNA vector contains a nucleic acid sequence having at least 95% identity to SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least at least 96% identity with SEQ ID NO: 210. In one embodiment, the cccDNA vector contains a nucleic acid sequence having at least 97% identity with SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 98% identity to SEQ ID NO: 210. In one embodiment, the cccDNA vector comprises a nucleic acid sequence having at least 99% identity to SEQ ID NO: 210. In one embodiment, the cccDNA vector comprises a nucleic acid sequence comprising SEQ ID NO: 210. In one embodiment, the ccDNA vector contains a nucleic acid sequence consisting of SEQ ID NO: 210.
[0020] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 85% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 90% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 91% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 92% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 93% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 94% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 95% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 96% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 97% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 98% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, имеющую по меньшей мере 99% идентичности с SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, содержащую SEQ ID NO: 214. Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты, состоящую из SEQ ID NO: 214.[0020] In one embodiment, the cccDNA vector comprises a nucleic acid sequence having at least 85% identity to SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 90% identity to SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 91% identity to SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 92% identity with SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 93% identity with SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 94 % identity to SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 95% identity to SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least at least 96% identity with SEQ ID NO: 214. In one embodiment, the cccDNA vector contains a nucleic acid sequence having at least 97% identity with SEQ ID NO: 214. In one embodiment, the ccDNA vector contains a nucleic acid sequence having at least 98% identity to SEQ ID NO: 214. In one embodiment, the cccDNA vector comprises a nucleic acid sequence having at least 99% identity to SEQ ID NO: 214. In one embodiment, the cccDNA vector comprises a nucleic acid sequence comprising SEQ ID NO: 214. In one embodiment, the ccDNA vector comprises a nucleic acid sequence consisting of SEQ ID NO: 214.
[0021] ЗкДНК-векторы для экспрессии продукции белка FVIII, описанные в данном документе, представляют собой бескапсидные линейные дуплексные молекулы ДНК, образованные из непрерывной цепи комплементарной ДНК с ковалентно замкнутыми концами (линейная, непрерывная и неинкапсидированная структура), которые содержат последовательность 5' инвертированного концевого повтора (ITR) и последовательность 3'-ITR, причем указанные 5-ITR и 3'-ITR могут иметь одинаковую симметричную трехмерную организацию по отношению друг к другу (т.е. симметричную или по существу симметричную) или, альтернативно, 5'-ITR и 3'-ITR могут иметь различную трехмерную организацию по отношению друг к другу (т.е. асимметричные ITR). Кроме того, ITR могут происходить из одного и того же или разных серотипов. Согласно некоторым вариантам реализации зкДНК-вектор может содержать последовательности ITR, которые имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С' и В-В' в трехмерном пространстве (т.е. они одинаковы или являются зеркальными отображениями по отношению друг к другу). Согласно некоторым вариантам реализации один ITR может происходить из одного серотипа ААВ, а другой ITR может происходить из другого серотипа ААВ.[0021] The cccDNA vectors for expression of FVIII protein production described herein are non-capsidated linear duplex DNA molecules formed from a continuous strand of complementary DNA with covalently closed ends (linear, continuous and unencapsidated structure) that contain a 5' inverted sequence terminal repeat (ITR) and a 3'-ITR sequence, wherein said 5-ITR and 3'-ITR may have the same symmetrical three-dimensional organization with respect to each other (i.e., symmetrical or substantially symmetrical) or, alternatively, 5' -ITR and 3'-ITR may have different three-dimensional organization relative to each other (i.e., asymmetric ITRs). In addition, ITRs may originate from the same or different serotypes. In some embodiments, the cccDNA vector may contain ITR sequences that have a symmetrical three-dimensional spatial organization such that their structure has the same shape in geometric space, or have the same A, C-C', and B-B' loops in three-dimensional space (i.e. i.e. they are the same or are mirror images of each other). In some embodiments, one ITR may be derived from one AAV serotype, and the other ITR may be derived from a different AAV serotype.
[0022] Соответственно, некоторые аспекты технологии, описанной в данном документе, относятся к зкДНК-вектору для улучшенной экспрессии и/или продукции белка описанного выше белка FVIII, который содержит последовательности ITR, фланкирующие гетерологичную последовательность нуклеиновой кислоты, содержащую любую последовательность нуклеиновой кислоты FVIII, раскрытую в Таблицах 5, при этом указанные последовательности ITR выбраны из любых из: (i) по меньшей мере одного ITR дикого типа (WT) и по меньшей мере одного модифицированного инвертированного концевого повтора (mod-ITR) ААВ (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию по отношению друг к другу (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию. ЗкДНК-векторы, раскрытые в данном документе, могут быть получены в эукариотических клетках и поэтому лишены прокариотических модификаций ДНК и загрязнения бактериальными эндотоксинами в клетках насекомых.[0022] Accordingly, certain aspects of the technology described herein relate to a cccDNA vector for improved expression and/or protein production of the FVIII protein described above, which contains ITR sequences flanking a heterologous nucleic acid sequence containing any FVIII nucleic acid sequence, disclosed in Tables 5, wherein said ITR sequences are selected from any of: (i) at least one wild-type (WT) ITR and at least one modified AAV inverted terminal repeat (mod-ITR) (e.g., asymmetric modified ITRs) ; (ii) two modified ITRs, wherein the mod-ITR pair has a different three-dimensional spatial organization relative to each other (e.g., asymmetric modified ITRs), or (iii) pairs of symmetric or substantially symmetric WT-WT ITRs, each WT-ITR has the same three-dimensional spatial organization, or (iv) pairs of symmetric or substantially symmetric modified ITRs, each mod-ITR having the same three-dimensional spatial organization. The cccDNA vectors disclosed herein can be produced in eukaryotic cells and are therefore free from prokaryotic DNA modifications and bacterial endotoxin contamination in insect cells.
[0023] Способы и композиции, описанные в данном документе, частично относятся к открытию невирусного бескапсидного ДНК-вектора с ковалентно замкнутыми концами (зкДНК-векторы), который можно применять для экспрессии по меньшей мере одного белка FVIII или более чем одного белка FVIII из клетки, включая, но не ограничиваясь ими, клетки печени.[0023] The methods and compositions described herein relate in part to the discovery of non-viral non-capsid DNA vectors with covalently closed ends (ccDNA vectors) that can be used to express at least one FVIII protein or more than one FVIII protein from a cell , including, but not limited to, liver cells.
[0024] Соответственно, в данном документе в одном аспекте предложены ДНК-векторы (например, зкДНК-векторы), содержащие по меньшей мере одну гетерологичную последовательность нуклеиновой кислоты, кодирующую по меньшей мере один трансген, кодирующий белки FVIII, функционально связанный с промотором, расположенную между двумя различными последовательностями инвертированных концевых повторов (ITR) ААВ, причем один из ITR содержит функциональный сайт концевого разрешения ААВ и сайт связывания Rep, и один из ITR содержит делецию, вставку или замену относительно другого ITR; при этом указанный трансген кодирует белок FVIII; и при этом указанная ДНК при расщеплении рестрикционным ферментом, имеющим один сайт распознавания на ДНК-векторе, отличается наличием характерных полос линейной и непрерывной ДНК по сравнению с контрольными линейными и прерывистыми ДНК при анализе на неденатурирующем геле. Другие аспекты включают доставку белка FVIII путем его экспрессии in vivo с зкДНК-вектора, описанного в данном документе, и, кроме того, лечение гемофилии А с применением зкДНК-векторов, кодирующих FVIII. В данном документе также предусмотрены клетки, содержащие зкДНК-вектор, кодирующий FVIII, описанный в данном документе. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.[0024] Accordingly, this document provides in one aspect DNA vectors (e.g., cccDNA vectors) comprising at least one heterologous nucleic acid sequence encoding at least one transgene encoding FVIII proteins operably linked to a promoter located between two different AAV inverted terminal repeat (ITR) sequences, wherein one of the ITRs contains a functional AAV end resolution site and a Rep binding site, and one of the ITRs contains a deletion, insertion or substitution relative to the other ITR; wherein said transgene encodes the FVIII protein; and wherein said DNA, when digested by a restriction enzyme having one recognition site on the DNA vector, is distinguished by the presence of characteristic bands of linear and continuous DNA compared to control linear and discontinuous DNA when analyzed on a non-denaturing gel. Other aspects include delivery of FVIII protein by expressing it in vivo from a cccDNA vector described herein, and further, treatment of hemophilia A using cccDNA vectors encoding FVIII. Also provided herein are cells containing a cccDNA vector encoding FVIII described herein. In some embodiments, the ccDNA vector is selected from the group consisting of ccDNA FVIII vector 16, ccDNA FVIII vector 19, ccDNA FVIII vector 21, ccDNA FVIII vector 8, ccDNA FVIII vector 17, ccDNA FVIII vector 20, and ccDNA FVIII vector 2 3. In some embodiments, the ccDNA vector is ccDNAFVIII vector 19 or ccDNA FVIII vector 23.
[0025] Аспекты настоящего изобретения относятся к способам получения зкДНК-векторов, которые можно применять для экспрессии белка FVIII в клетке, как описано в данном документе. Другие варианты реализации относятся к зкДНК-вектору, полученному с помощью способа, предложенного в данном документе. Согласно одному варианту реализации бескапсидный (например, невирусный) ДНК-вектор (зкДНК-вектор) для продукции белка FVIII получают из плазмиды (называемой в данном документе «зкДНК-плазмидой»), содержащей полинуклеотидную матрицу экспрессионной конструкции, содержащую, в указанном порядке: первый 5'-инвертированный концевой повтор (например, ITR ААВ); гетерологичную последовательность нуклеиновой кислоты; и 3'-ITR (например, ITR ААВ), причем указанные 5'-ITR и 3'-ITR могут быть асимметричными по отношению друг к другу или симметричными (например, WT-ITR или модифицированные симметричные ITR), как определено в данном документе. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.[0025] Aspects of the present invention relate to methods for producing cDNA vectors that can be used to express FVIII protein in a cell, as described herein. Other embodiments relate to a cccDNA vector obtained using the method proposed herein. In one embodiment, a capsid-free (e.g., non-viral) DNA vector (ccDNA vector) for producing FVIII protein is derived from a plasmid (referred to herein as a “ccDNA plasmid”) containing a polynucleotide expression construct template comprising, in this order: first 5'-inverted terminal repeat (eg, AAB ITR); heterologous nucleic acid sequence; and 3'-ITR (e.g., AAB ITR), wherein said 5'-ITR and 3'-ITR may be asymmetric to each other or symmetric (e.g., WT-ITR or modified symmetric ITR) as defined herein . In some embodiments, the ccDNA vector is selected from the group consisting of ccDNA FVIII vector 16, ccDNA FVIII vector 19, ccDNA FVIII vector 21, ccDNA FVIII vector 8, ccDNA FVIII vector 17, ccDNA FVIII vector 20, and ccDNA FVIII vector 2 3. In some embodiments, the ccDNA vector is ccDNAFVIII vector 19 or ccDNA FVIII vector 23.
[0026] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен с помощью ряда средств, которые будут известны обычному квалифицированному специалисту после прочтения этого раскрытия. Например, полинуклеотидная матрица экспрессионной конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус. Согласно одному варианту реализации зкДНК-плазмида содержит сайт рестрикционного клонирования (например, SEQ ID NO: 123 и/или 124), функционально расположенный между ITR, в который может быть вставлена экспрессионная кассета, содержащая, например, промотор, функционально связанный с трансгеном, например, нуклеиновой кислотой, кодирующей FVIII. Согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII получают из полинуклеотидной матрицы (например, зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса), содержащей симметричные или асимметричные ITR (модифицированные ITR или WT ITR).[0026] The cDNA FVIII protein expression vector disclosed herein can be produced by a number of means that will be known to one of ordinary skill in the art upon reading this disclosure. For example, the polynucleotide expression construct template used to produce the ccDNA vectors of the present invention may be a ccDNA plasmid, a ccDNA bacmid, and/or a ccDNA baculovirus. In one embodiment, the cccDNA plasmid contains a restriction cloning site (e.g., SEQ ID NO: 123 and/or 124) operably located between the ITR, into which an expression cassette can be inserted, containing, for example, a promoter operably linked to the transgene, e.g. , a nucleic acid encoding FVIII. In some embodiments, cccDNA vectors for FVIII protein expression are derived from a polynucleotide template (eg, ccDNA plasmid, ccDNA bacmid, ccDNA baculovirus) containing symmetric or asymmetric ITRs (modified ITRs or WT ITRs).
[0027] В пермиссивной клетке-хозяине, в присутствии, например, Rep, полинуклеотидная матрица, имеющая по меньшей мере два ITR, реплицируется с получением зкДНК-векторов, экспрессирующих белок FVIII. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.д.) посредством белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора. Белки Rep и сайты связывания Rep различных серотипов ААВ хорошо известны обычным специалистам в данной области техники. Обычный специалист в данной области техники понимает необходимость выбора белка Rep из серотипа, который связывается с последовательностью нуклеиновой кислоты и реплицирует ее, на основе по меньшей мере одного функционального ITR. Например, если компетентный по репликации ITR происходит из серотипа 2 ААВ, соответствующий Rep будет из серотипа ААВ, который работает с этим серотипом, такого как ITR ААВ2 с Rep ААВ2 или ААВ4, но не Rep ААВ5, который не работает. После репликации зкДНК-вектор с ковалентно замкнутыми концами продолжает накапливаться в пермиссивных клетках, и зкДНК-вектор предпочтительно является достаточно стабильным с течением времени в присутствии белка Rep в стандартных условиях репликации, например, для накопления в количестве, составляющем по меньшей мере 1 пг/клетку, предпочтительно по меньшей мере 2 пг/клетку, предпочтительно по меньшей мере 3 пг/клетку, более предпочтительно по меньшей мере 4 пг/клетку, еще более предпочтительно по меньшей мере 5 пг/клетку.[0027] In a permissive host cell, in the presence of, for example, Rep, a polynucleotide template having at least two ITRs is replicated to produce cccDNA vectors expressing the FVIII protein. Obtaining a cDNA vector takes place in two stages: first, excision (“extraction”) of the template from the matrix backbone (for example, the genome of a cDNA plasmid, ccDNA bacmid, ccDNA baculovirus, etc.) through Rep proteins, and, second, Rep-mediated replication of the excised cccDNA vector. The Rep proteins and Rep binding sites of various AAV serotypes are well known to those of ordinary skill in the art. One of ordinary skill in the art will appreciate the need to select a Rep protein from a serotype that binds to and replicates a nucleic acid sequence based on at least one functional ITR. For example, if a replication competent ITR is from AAB serotype 2, the corresponding Rep will be from an AAB serotype that works with that serotype, such as the AAB2 ITR with Rep AAB2 or AAB4, but not Rep AAB5, which does not work. After replication, the cccDNA vector with covalently closed ends continues to accumulate in permissive cells, and the cccDNA vector is preferably sufficiently stable over time in the presence of the Rep protein under standard replication conditions, for example, to accumulate at an amount of at least 1 pg/cell , preferably at least 2 pg/cell, preferably at least 3 pg/cell, more preferably at least 4 pg/cell, even more preferably at least 5 pg/cell.
[0028] Соответственно, один аспект настоящего изобретения относится к способу получения зкДНК-вектора для экспрессии таких белков FVIII, включающему этапы: а) инкубации популяции клеток-хозяев (например, клеток насекомых), несущих полинуклеотидную матрицу экспрессионной конструкции (например, зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус), лишенную последовательностей, кодирующих вирусный капсид, в присутствии белка Rep в условиях, эффективных для индукции продуцирования указанного зкДНК-вектора в клетках-хозяевах и в течение периода времени, достаточного для этого, при этом указанные клетки-хозяева не содержат последовательностей, кодирующих вирусный капсид; и b) сбора и выделения зкДНК-вектора из клеток-хозяев. Присутствие белка Rep индуцирует репликацию векторного полинуклеотида с модифицированным ITR с получением зкДНК-вектора для экспрессии белка FVIII в клетке-хозяине. Однако вирусные частицы (например, вирионы ААВ) не экспрессируются. Таким образом, отсутствует ограничение по размеру, налагаемое вирионами. В соответствии с некоторыми вариантами реализации зкДНК-вектор выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23.[0028] Accordingly, one aspect of the present invention relates to a method of producing a cccDNA vector for the expression of such FVIII proteins, comprising the steps of: a) incubating a population of host cells (e.g., insect cells) bearing a polynucleotide expression construct template (e.g., a ccDNA plasmid , cccDNA bacmid and/or ccDNA baculovirus) lacking sequences encoding the viral capsid, in the presence of the Rep protein, under conditions effective to induce the production of said ccDNA vector in host cells and for a period of time sufficient to do so, wherein said host cells do not contain sequences encoding the viral capsid; and b) collecting and isolating the cDNA vector from the host cells. The presence of the Rep protein induces replication of the ITR-modified vector polynucleotide to produce a cccDNA vector for expression of the FVIII protein in the host cell. However, viral particles (eg, AAV virions) are not expressed. Thus, there is no size limitation imposed by virions. In some embodiments, the ccDNA vector is selected from the group consisting of ccDNA FVIII vector 16, ccDNA FVIII vector 19, ccDNA FVIII vector 21, ccDNA FVIII vector 8, ccDNA FVIII vector 17, ccDNA FVIII vector 20, and ccDNA FVIII vector 2 3. In some embodiments, the ccDNA vector is ccDNAFVIII vector 19 or ccDNA FVIII vector 23.
[0029] Наличие пригодного для экспрессии белка FVIII зкДНК-вектора, выделенного из клеток-хозяев, можно подтвердить путем расщепления ДНК, выделенной из клетки-хозяина, рестрикционным ферментом, имеющим один сайт распознавания на зкДНК-векторе, и анализа расщепленного ДНК-материала на денатурирующем и неденатурирующем гелях для подтверждения наличия характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК.[0029] The presence of a cDNA vector isolated from host cells suitable for expression of the FVIII protein can be confirmed by digesting DNA isolated from the host cell with a restriction enzyme having a single recognition site on the cDNA vector and analyzing the digested DNA material for denaturing and non-denaturing gels to confirm the presence of characteristic bands of linear and continuous DNA compared to linear and discontinuous DNA.
[0030] В данном документе также предложены способы экспрессии белка FVIII, который имеет терапевтическое применение, с применением зкДНК-вектора в клетке или у субъекта. Такие белки FVIII можно применять для лечения гемофилии А. Соответственно, в данном документе предложены способы лечения гемофилии А, включающие введение зкДНК-вектора, кодирующего терапевтический белок FVIII, субъекту, нуждающемуся в этом. В соответствии с некоторыми вариантами реализации зкДНК-вектор, кодирующий терапевтический белок FVIII, выбран из группы, состоящей из зкДНКFVIII-вектора 16, зкДНКFVIII-векгора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20 и зкДНКFVIII-вектора 23. В соответствии с некоторыми вариантами реализации зкДНК-вектор представляет собой зкДНКFVIII-вектор 19 или зкДНКFVIII-вектор 23. В соответствии с некоторыми вариантами реализации уровни FVIII в сыворотке субъекта повышены у субъектов, которым ввели зкДНК-вектор, по сравнению с контролем. В соответствии с некоторыми вариантами реализации повышение уровней FVIII составляет более примерно 40% по сравнению с контролем. В соответствии с некоторыми вариантами реализации повышение уровней FVIII составляет более примерно 40%, примерно 45%, примерно 50%, примерно 55%, примерно 60%, примерно 65%, примерно 70%, примерно 75% по сравнению с контролем.[0030] Also provided herein are methods for expressing FVIII protein that has therapeutic use using a cccDNA vector in a cell or subject. Such FVIII proteins can be used to treat hemophilia A. Accordingly, provided herein are methods of treating hemophilia A comprising administering a cccDNA vector encoding a therapeutic FVIII protein to a subject in need thereof. In accordance with some embodiments, the cccDNA vector encoding the therapeutic FVIII protein is selected from the group consisting of ccDNA FVIII vector 16, ccDNA FVIII vector 19, ccDNA FVIII vector 21, ccDNA FVIII vector 8, ccDNA FVIII vector 17, ccDNA FVIII vector 20 and cccDNAFVIII vector 23. In some embodiments, the cccDNA vector is cccDNAFVIII vector 19 or ccDNAFVIII vector 23. In some embodiments, serum FVIII levels in the subject are increased in subjects administered the cccDNA vector compared to with control. In some embodiments, the increase in FVIII levels is greater than about 40% compared to control. In some embodiments, the increase in FVIII levels is greater than about 40%, about 45%, about 50%, about 55%, about 60%, about 65%, about 70%, about 75% compared to control.
[0031] Согласно некоторым вариантам реализации один аспект технологии, описанной в данном документе, относится к невирусному бескапсидному ДНК-вектору с ковалентно замкнутыми концами (зкДНК-вектору), причем указанный зкДНК-вектор содержит по меньшей мере одну гетерологичную нуклеотидную последовательность, функционально расположенную между двумя последовательностями инвертированных концевых повторов, при этом указанные последовательности ITR могут быть асимметричными или симметричными, или по существу симметричными, в соответствии с определением этих терминов в данном документе, при этом по меньшей мере один из ITR содержит функциональный сайт концевого разрешения и сайт связывания Rep, и необязательно указанная гетер о логичная последовательность нуклеиновой кислоты кодирует трансген (например, белок FVIII), и при этом указанный вектор не находится в вирусном капсиде.[0031] In some embodiments, one aspect of the technology described herein relates to a non-viral, capsid-free, covalently closed-end DNA vector (ccDNA vector), wherein the cccDNA vector contains at least one heterologous nucleotide sequence operably located between two inverted terminal repeat sequences, wherein said ITR sequences may be asymmetric or symmetric or substantially symmetric as those terms are defined herein, wherein at least one of the ITRs comprises a functional end resolution site and a Rep binding site, and optionally, said heterologous nucleic acid sequence encodes a transgene (eg, FVIII protein), and wherein said vector is not located in a viral capsid.
[0032] Эти и другие аспекты настоящего изобретения более подробно описаны ниже.[0032] These and other aspects of the present invention are described in more detail below.
ОПИСАНИЕ ЧЕРТЕЖЕЙDESCRIPTION OF DRAWINGS
[0033] Варианты реализации настоящего раскрытия, кратко обобщенные выше и более подробно обсуждаемые ниже, будут понятны со ссылкой на иллюстративные варианты реализации раскрытия, представленные на прилагаемых чертежах. Однако прилагаемые чертежи иллюстрируют только типичные варианты реализации настоящего раскрытия и поэтому не должны рассматриваться, как ограничивающие объем, поскольку раскрытие может допускать другие не менее эффективные варианты реализации.[0033] The embodiments of the present disclosure summarized briefly above and discussed in more detail below will be understood with reference to the illustrative embodiments of the disclosure shown in the accompanying drawings. However, the accompanying drawings illustrate only exemplary embodiments of the present disclosure and therefore should not be construed as limiting the scope, since the disclosure may permit other equally effective embodiments.
[0034] ФИГ. 1А иллюстрирует примерную структуру зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, содержащего асимметричные ITR. Согласно этому варианту реализации примерный зкДНК-вектор содержит экспрессионную кассету, содержащую промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, может быть вставлена в сайт клонирования (R3/R4) между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR) - ITR дикого типа ААВ2 слева (на 5'-конце) и модифицированным ITR справа (на 3'-конце) от экспрессионной кассеты, поэтому два ITR, фланкирующие экспрессионную кассету, асимметричны по отношению друг к другу.[0034] FIG. 1A illustrates an exemplary structure of a cccDNA vector for expression of the FVIII protein disclosed herein containing asymmetric ITRs. In this embodiment, an exemplary cccDNA vector contains an expression cassette containing a CAG promoter, WPRE, and BGHpA. An open reading frame (ORF) encoding the FVIII transgene can be inserted into the cloning site (R3/R4) between the CAG promoter and the WPRE. The expression cassette is flanked by two inverted terminal repeats (ITRs) - the wild-type AAB2 ITR on the left (at the 5' end) and the modified ITR on the right (at the 3' end) of the expression cassette, therefore the two ITRs flanking the expression cassette are asymmetric with respect to each other to friend.
[0035] ФИГ. 1 В иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего асимметричные ITR с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, может быть вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR) - модифицированным ITR слева (на 5'-конце) и ITR дикого типа справа (на 3'-конце) от экспрессионной кассеты.[0035] FIG. 1B illustrates the exemplary structure of a cccDNA expression vector for FVIII disclosed herein containing asymmetric ITRs with an expression cassette containing a CAG promoter, WPRE and BGHpA. An open reading frame (ORF) encoding the FVIII transgene can be inserted into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two inverted terminal repeats (ITRs) - a modified ITR on the left (at the 5' end) and a wild-type ITR on the right (at the 3' end) of the expression cassette.
[0036] ФИГ. 1С иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего асимметричные ITR, с экспрессионной кассетой, содержащей энхансер/промотор, трансген FVIII, посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет встраивать трансген FVIII в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами (ITR), которые асимметричны по отношению друг к другу; модифицированным ITR слева (на 5'-конце) и модифицированным ITR справа (на 3-конце) от экспрессионной кассеты, причем указанные 5'-ITR и 3'-ITR оба представляют собой модифицированные ITR, но имеют разные модификации (т.е. они не имеют одинаковых модификаций).[0036] FIG. 1C illustrates an exemplary structure of a cccDNA FVIII expression vector disclosed herein containing asymmetric ITRs, with an expression cassette containing an enhancer/promoter, an FVIII transgene, a post-transcriptional element (WPRE), and a poly(A) signal. The open reading frame (ORF) allows the FVIII transgene to be inserted into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two inverted terminal repeats (ITRs) that are asymmetrical to each other; a modified ITR to the left (5' end) and a modified ITR to the right (3 end) of the expression cassette, wherein the 5' ITR and 3' ITR are both modified ITRs but have different modifications (i.e. they do not have the same modifications).
[0037] ФИГ. 1D иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген FVIII, вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя модифицированными инвертированными концевыми повторами (ITR), причем 849849949 5' модифицированный ITR и 3' модифицированный ITR симметричны или по существу симметричны.[0037] FIG. 1D illustrates an exemplary structure of a cccDNA expression vector for FVIII disclosed herein containing symmetrical modified ITRs or substantially symmetrical modified ITRs as defined herein, with an expression cassette containing a CAG promoter, WPRE and BGHpA. The open reading frame (ORF) encoding the FVIII transgene is inserted into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two modified inverted terminal repeats (ITRs), with the 849849949 5' modified ITR and 3' modified ITR being symmetrical or substantially symmetrical.
[0038] ФИГ. 1Е иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей энхансер/промотор, трансген, посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет вставить трансген (например, FVIII) в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя модифицированными инвертированными концевыми повторами (ITR), причем указанные 5' модифицированный ITR и 3' модифицированный ITR симметричны или по существу симметричны.[0038] FIG. 1E illustrates an exemplary structure of a cccDNA expression vector for FVIII disclosed herein containing symmetrical modified ITRs or substantially symmetrical modified ITRs as defined herein, with an expression cassette comprising an enhancer/promoter, a transgene, a post-transcriptional element (WPRE), and poly(A) signal. The open reading frame (ORF) allows the insertion of a transgene (eg FVIII) into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two modified inverted terminal repeats (ITRs), wherein the 5' modified ITR and the 3' modified ITR are symmetrical or substantially symmetrical.
[0039] ФИГ. 1F иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные WT-ITR или по существу симметричные WT-ITR, как определено в данном документе, с экспрессионной кассетой, содержащей промотор CAG, WPRE и BGHpA. Открытая рамка считывания (ORF), кодирующая трансген (например, FVIII), вставлена в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами дикого типа (WT-ITR), причем указанные 5' WT-ITR и 3' WT-ITR являются симметричными или по существу симметричными.[0039] FIG. 1F illustrates an exemplary structure of a cccDNA expression vector for FVIII disclosed herein containing symmetrical WT-ITRs or substantially symmetrical WT-ITRs as defined herein, with an expression cassette containing a CAG promoter, WPRE and BGHpA. An open reading frame (ORF) encoding a transgene (eg, FVIII) is inserted into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two wild-type inverted terminal repeats (WT-ITRs), the 5' WT-ITR and 3' WT-ITR being symmetrical or substantially symmetrical.
[0040] ФИГ. 1G иллюстрирует примерную структуру зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, содержащего симметричные модифицированные ITR или по существу симметричные модифицированные ITR, как определено в данном документе, с экспрессионной кассетой, содержащей энхансер/промотор, трансген (например, FVIII), посттранскрипционный элемент (WPRE) и сигнал поли(А). Открытая рамка считывания (ORF) позволяет вставить трансген (например, FVIII) в сайт клонирования между промотором CAG и WPRE. Экспрессионная кассета фланкирована двумя инвертированными концевыми повторами дикого типа (WT-ITR), причем указанные 5' WT-ITR и 3' WT-ITR являются симметричными или по существу симметричными.[0040] FIG. 1G illustrates an exemplary structure of a cccDNA expression vector for FVIII disclosed herein, containing symmetrical modified ITRs or substantially symmetrical modified ITRs as defined herein, with an expression cassette containing an enhancer/promoter, transgene (e.g., FVIII), post-transcriptional element (WPRE) and poly(A) signal. The open reading frame (ORF) allows the insertion of a transgene (eg FVIII) into the cloning site between the CAG promoter and the WPRE. The expression cassette is flanked by two wild-type inverted terminal repeats (WT-ITRs), the 5' WT-ITR and 3' WT-ITR being symmetrical or substantially symmetrical.
[0041] ФИГ. 2А представляет Т-образную структуру стебель-петля левого ITR дикого типа ААВ2 (SEQ ID NO: 52) с идентификацией плеча А-А', плеча В-В', плеча С-С', двух сайтов связывания Rep (RBE и RBE'), а также показывает сайт концевого разрешения (TRS). RBE содержит группу из 4 дуплексных тетрамеров, которые, как полагают, взаимодействуют либо с Rep 78, либо с Rep 68. Кроме того, также полагают, что RBE' взаимодействует с комплексом Rep, собранным на ITR дикого типа или мутированном ITR в конструкции. Области D и D' содержат сайты связывания факторов транскрипции и другую консервативную структуру. ФИГ. 2 В показывает предполагаемую Rep-катализируемую никирующую и лигирующую активность в левом ITR дикого типа (SEQ ID NO: 53), включая Т-образную структуру стебель-петля левого ITR дикого типа ААВ2 с идентификацией плеча А-А', плеча В-В', плеча С-С', двух сайтов связывания Rep (RBE и RBE), а также показывает сайт концевого разрешения (TRS) и область D и D', содержащую несколько сайтов связывания факторов транскрипции и другую консервативную структуру.[0041] FIG. 2A shows a T-shaped stem-loop structure of the left ITR of wild type AAB2 (SEQ ID NO: 52) identifying arm A-A', arm B-B', arm C-C', two Rep binding sites (RBE and RBE' ), and also shows the terminal resolution site (TRS). RBE contains a group of 4 duplex tetramers that are believed to interact with either Rep 78 or Rep 68. In addition, RBE' is also believed to interact with the Rep complex assembled on a wild-type ITR or a mutated ITR in the construct. Regions D and D' contain transcription factor binding sites and other conserved structure. FIG. 2B shows putative Rep-catalyzed nicking and ligation activity in the wild-type left ITR (SEQ ID NO: 53), including the T-shaped stem-loop structure of the AAB2 wild-type left ITR with identification of arm A-A', arm B-B' , the C-C' arm, two Rep binding sites (RBE and RBE), and also shows a terminal resolution site (TRS) and a region D and D' containing several transcription factor binding sites and other conserved structure.
[0042] ФИГ. 3А представляет первичную структуру (полинуклеотидную последовательность) (слева) и вторичную структуру (справа) RBE-содержащих частей плеча А-А', а также плеча С-С' и В-В' левого ITR дикого типа ААВ2 (SEQ ID NO: 54). ФИГ. 3В показывает примерную последовательность мутированного ITR (также называемого модифицированным ITR) для левого ITR. Показана первичная структура (слева) и предсказанная вторичная структура (справа) части RBE плеча А-А', плеча С и плеча В-В' примерного мутированного левого ITR (ITR-1, слева) (SEQ ID NO: 113). ФИГ. 3С показывает первичную структуру (слева) и вторичную структуру (справа) RBE-содержащей части петли А-А' и плеч В-В' и С-С' правого ITR дикого типа ААВ2 (SEQ ID NO: 55). ФИГ. 3D показывает примерный правый модифицированный ITR. Показана первичная структура (слева) и предсказанная вторичная структура (справа) RBE-содержащей части плеча А-А', В-В' и плеча С примерного мутантного правого ITR (ITR-1, справа) (SEQ ID NO: 114). Любая комбинация левого и правого ITR (например, ITR ААВ2 или другого вирусного серотипа или синтетических ITR) может использоваться, как описано в данном документе. Каждая из полинуклеотидных последовательностей на ФИГ. 3A-3D относится к последовательности, используемой в геноме плазмиды или бакмиды/бакуловируса, применяемых для получения зкДНК, как описано в данном документе. Также на каждой из ФИГ. 3A-3D приведены соответствующие вторичные структуры зкДНК, выведенные на основании конфигураций зкДНК-вектора в геноме плазмиды или бакмиды/бакуловируса и предсказанных значений свободной энергии Гиббса.[0042] FIG. 3A shows the primary structure (polynucleotide sequence) (left) and secondary structure (right) of the RBE-containing portions of the A-A' arm, as well as the C-C' and B-B' arms of the left wild-type AAB2 ITR (SEQ ID NO: 54 ). FIG. 3B shows an example sequence of a mutated ITR (also called a modified ITR) for the left ITR. Shown is the primary structure (left) and predicted secondary structure (right) of the RBE portion of the A-A' arm, C arm, and B-B' arm of the exemplary mutated left ITR (ITR-1, left) (SEQ ID NO: 113). FIG. 3C shows the primary structure (left) and secondary structure (right) of the RBE-containing portion of the A-A' loop and arms B-B' and C-C' of the right wild-type AAB2 ITR (SEQ ID NO: 55). FIG. 3D shows an example right modified ITR. Shown is the primary structure (left) and predicted secondary structure (right) of the RBE-containing portion of the A-A', B-B' and C arms of the exemplary mutant right ITR (ITR-1, right) (SEQ ID NO: 114). Any combination of left and right ITRs (eg, AAB2 or other viral serotype ITRs or synthetic ITRs) can be used as described herein. Each of the polynucleotide sequences in FIG. 3A-3D refers to the sequence used in the genome of the plasmid or bacmid/baculovirus used to produce cccDNA as described herein. Also in each of FIGS. 3A-3D show the corresponding cccDNA secondary structures deduced from the configurations of the cccDNA vector in the plasmid or bacmid/baculovirus genome and predicted Gibbs free energy values.
[0043] ФИГ. 4А представляет собой схему, иллюстрирующую подготовительный способ получения инфицированных бакуловирусом клеток насекомых (ВИС), которые можно применять для получения зкДНК-вектора для экспрессии FVIII, раскрытого в данном документе, в способе, описанном на схеме на ФИГ. 4В. ФИГ. 4В представляет собой схему примерного способа получения зкДНК, и ФИГ. 4С иллюстрирует биохимический метод и способ подтверждения получения зкДНК-вектора. ФИГ. 4D и ФИГ. 4Е представляют собой схематические иллюстрации, описывающие способ идентификации наличия зкДНК в ДНК, собранной из осадков клеток, полученных во время способов продуцирования зкДНК на ФИГ. 4В. ФИГ. 4D схематически показывает ожидаемые полосы примерной зкДНК, оставленной неразрезанной или расщепленной рестрикционной эндонуклеазой, а затем подвергнутой электрофорезу либо на нативном геле, либо на денатурирующем геле. Самая левая схема представляет собой нативный гель и показывает несколько полос, свидетельствующих о том, что в дуплексной и неразрезанной форме зкДНК существует по меньшей мере в мономерном и димерном состояниях, наблюдаемых как быстрее мигрирующий мономер меньшего размера и медленнее мигрирующий димер, размер которого в два раза превышает размер мономера. На второй слева схеме показано, что при разрезании зкДНК рестрикционной эндонуклеазой исходные полосы исчезают и появляются быстрее мигрирующие (например, меньшие по размеру) полосы, соответствующие ожидаемым размерам фрагментов, оставшихся после расщепления. В денатурирующих условиях исходная дуплексная ДНК является одноцепочечной и мигрирует как молекула, размер которой в два раза превышает размер, наблюдаемый на нативном геле, поскольку комплементарные цепи ковалентно связаны. Таким образом, на второй схеме справа расщепленная зкДНК показывает распределение полос, сходное с наблюдаемым на нативном геле, но полосы мигрируют как фрагменты, размер которых в два раза превышает размер их аналогов на нативном геле. На самой правой схеме показано, что неразрезанная зкДНК в денатурирующих условиях мигрирует в виде одноцепочечного раскрытого кольца, поэтому размер наблюдаемых полос в два раза превышает размер полос, наблюдаемых в нативных условиях, в которых кольцо не раскрыто. На этой фигуре «тыс.п.о.» используется для обозначения относительного размера нуклеотидных молекул на основании, в зависимости от контекста, либо длины нуклеотидной цепи (например, для одноцепочечных молекул, наблюдаемых в денатурирующих условиях), либо числа пар оснований (например, для двухцепочечных молекул, наблюдаемых в нативных условиях). ФИГ. 4Е показывает ДНК, имеющую прерывистую структуру. ЗкДНК может быть разрезана рестрикционной эндонуклеазой, имеющей один сайт распознавания в зкДНК-векторе, с получением двух фрагментов ДНК с разными размерами (1 тыс.п.о. и 2 тыс.п.о.) как в нейтральных, так и в денатурирующих условиях. ФИГ. 4Е также показывает зкДНК, имеющую линейную и непрерывную структуру. ЗкДНК-вектор может быть разрезан рестрикционной эндонуклеазой с получением двух фрагментов ДНК, которые мигрируют как 1 тыс. п. о. и 2 тыс. п. о. в нейтральных условиях, но в денатурирующих условиях цепи остаются соединенными и образуют одиночные цепи, которые мигрируют как 2 тыс. п. о. и 4 тыс. п. о.[0043] FIG. 4A is a diagram illustrating a preparatory method for producing baculovirus-infected insect cells (BICs) that can be used to produce the cDNA expression vector for FVIII disclosed herein in the method described in the diagram of FIG. 4B. FIG. 4B is a diagram of an exemplary method for producing cccDNA, and FIG. 4C illustrates the biochemical method and method for confirming the production of the cccDNA vector. FIG. 4D and FIG. 4E are schematic illustrations describing a method for identifying the presence of cccDNA in DNA collected from cell pellets obtained during the ccDNA production methods of FIG. 4B. FIG. 4D schematically shows the expected bands of exemplary cccDNA left uncut or digested with a restriction endonuclease and then electrophoresed on either a native gel or a denaturing gel. The leftmost diagram is a native gel and shows several bands indicating that in duplex and uncut form, ccDNA exists in at least monomeric and dimeric states, observed as a faster migrating monomer of smaller size and a slower migrating dimer that is twice the size exceeds the size of the monomer. The second diagram from the left shows that when cccDNA is cut with a restriction endonuclease, the initial bands disappear and faster migrating (i.e., smaller) bands appear, corresponding to the expected sizes of fragments remaining after cleavage. Under denaturing conditions, the original duplex DNA is single-stranded and migrates as a molecule twice the size observed on a native gel because the complementary strands are covalently linked. Thus, in the second diagram on the right, digested ccDNA shows a band distribution similar to that observed on the native gel, but the bands migrate as fragments that are twice the size of their counterparts on the native gel. The rightmost diagram shows that uncut cccDNA under denaturing conditions migrates as a single-stranded open ring, so the size of the observed bands is twice the size of the bands observed under native conditions in which the ring is not opened. In this figure, “kb.” used to indicate the relative size of nucleotide molecules based on, depending on the context, either the length of the nucleotide chain (for example, for single-stranded molecules observed under denaturing conditions) or the number of base pairs (for example, for double-stranded molecules observed under native conditions). FIG. 4E shows DNA having a discontinuous structure. CCDNA can be cut with a restriction endonuclease having one recognition site in the CCDNA vector to produce two DNA fragments of different sizes (1 kb and 2 kb) under both neutral and denaturing conditions . FIG. 4E also shows cccDNA having a linear and continuous structure. The cDNA vector can be cut with a restriction endonuclease to produce two DNA fragments that migrate as 1 kb. and 2 thousand p.o. under neutral conditions, but under denaturing conditions the chains remain connected and form single chains that migrate as 2 kb. and 4 thousand p.o.
[0044] ФИГ. 5 представляет собой примерное изображение анализа на денатурирующем геле примеров зкДНК-векторов с (+) или без (-) расщепления эндонуклеазами (EcoRI для зкДНК-конструкций 1 и 2; BamH1 для зкДНК-конструкций 3 и 4; SpeI для зкДНК-конструкций 5 и 6; и XhoI для зкДНК-конструкций 7 и 8). Конструкции 1-8 описаны в Примере 1 международной заявки РСТ PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Размеры выделенных звездочкой полос были определены и указаны внизу рисунка.[0044] FIG. 5 is an exemplary denaturing gel analysis of example cccDNA vectors with (+) or without (-) endonuclease digestion (EcoRI for cccDNA constructs 1 and 2; BamH1 for cccDNA constructs 3 and 4; SpeI for cccDNA constructs 5 and 6; and XhoI for cccDNA constructs 7 and 8). Structures 1-8 are described in Example 1 of PCT International Application PCT/US18/49996, which is incorporated herein by reference in its entirety. The dimensions of the stripes highlighted with an asterisk were determined and indicated at the bottom of the figure.
[0045] ФИГ. 6 отображает результаты экспериментов, описанных в Примере 7, и конкретно показывает изображения IVIS, полученные у мышей, получавших контроль ЛНЧ-поли(С) (крайняя слева мышь), и четырех мышей, получавших ЛНЧ-зкДНК-люциферазу (все, кроме крайней слева мыши). У четырех мышей, обработанных зкДНК, наблюдается значительная флуоресценция в области печени мыши.[0045] FIG. 6 displays the results of the experiments described in Example 7 and specifically shows IVIS images obtained from mice treated with LNP-poly(C) control (far left mouse) and four mice treated with LNP-cDNA luciferase (all except far left mice). Four mice treated with cccDNA showed significant fluorescence in the mouse liver region.
[0046] ФИГ. 7 отображает результаты эксперимента, описанного в Примере 8. Темные точки указывают на наличие белка, полученного в результате экспрессии трансгена с зкДНК, и демонстрируют ассоциацию введенной ЛНЧ-зкДНК с гепатоцитами.[0046] FIG. 7 shows the results of the experiment described in Example 8. Dark dots indicate the presence of protein resulting from expression of the cccDNA transgene and demonstrate the association of the introduced LNP-ccDNA with hepatocytes.
[0047] ФИГ. 8А и 8В отображают результаты исследований на глазах, описанных в Примере 9. ФИГ. 8А показывает типичные изображения IVIS из глаз крысы, в которые инъецировали JetPEI®-зкДНК-люциферазу (вверху слева), по сравнению с неинъецированным глазом той же крысы (вверху справа) или глазом крысы, в который инъецировали плазмиду-ДНК люциферазы (внизу слева), и неинъецированным глазом той же крысы (внизу справа). ФИГ. 8В показывает график средней светимости, наблюдаемой в обработанных глазах или соответствующих необработанных глазах в каждой из групп обработки. Крысы, обработанные зкДНК, демонстрировали длительную значительную флуоресценцию (и, следовательно, экспрессию трансгена люциферазы) в течение 99 дней, что существенно разнилось с крысами, получавшими плазмиду-люциферазу, у которых наблюдалась минимальная относительная флуоресценция (и, следовательно, экспрессия трансгена люциферазы).[0047] FIG. 8A and 8B depict the results of the eye studies described in Example 9. FIG. 8A shows representative IVIS images from rat eyes injected with JetPEI®- ccDNA-luciferase (top left), compared to an uninjected eye of the same rat (top right) or a rat eye injected with luciferase DNA plasmid (bottom left). , and the uninjected eye of the same rat (bottom right). FIG. 8B shows a plot of the average luminosity observed in the treated eyes or the corresponding untreated eyes in each of the treatment groups. Rats treated with cccDNA exhibited prolonged significant fluorescence (and hence luciferase transgene expression) for 99 days, which was significantly different from rats treated with the luciferase plasmid, which showed minimal relative fluorescence (and therefore luciferase transgene expression).
[0048] ФИГ. 9А и 9В отображают результаты исследования устойчивости зкДНК и повторного введения дозы у мышей Rag2, описанного в Примере 10. ФИГ. 9А показывает график зависимости полного потока от времени, наблюдаемой у получавших ЛНЧ-зкДНК-Luc мышей c57bl/6 дикого типа или мышей Rag2. ФИГ. 9В представляет график, показывающий влияние повторной дозы на уровни экспрессии трансгена люциферазы у мышей Rag2, при этом после введения повторной дозы наблюдали повышенную стабильную экспрессию (стрелка указывает время введения повторной дозы).[0048] FIG. 9A and 9B depict the results of the cccDNA stability and repeat dosing study in Rag2 mice described in Example 10. FIG. 9A shows a plot of total flux versus time observed in LNP-ccDNA-Luc-treated wild-type c57bl/6 mice or Rag2 mice. FIG. 9B is a graph showing the effect of repeated dosing on luciferase transgene expression levels in Rag2 mice, with increased stable expression observed after repeated dosing (arrow indicates time of repeated dosing).
[0049] ФИГ. 10 представляет данные исследования экспрессии люциферазы с зкДНК у обработанных мышей, описанного в Примере 11, показывающие полный поток в каждой группе мышей на протяжении исследования. Высокие уровни неметилированного CpG коррелировали с более низким полным потоком, наблюдаемым у мышей с течением времени, в то время как использование специфического для печени промотора коррелировало с продолжительной стабильной экспрессией трансгена с зкДНК-вектора на протяжении по меньшей мере 77 дней.[0049] FIG. 10 presents data from the cDNA luciferase expression study in treated mice described in Example 11, showing total flux in each group of mice throughout the study. High levels of unmethylated CpG correlated with lower total flux observed in mice over time, while liver-specific promoter usage correlated with prolonged stable expression of the cccDNA vector transgene for at least 77 days.
[0050] ФИГ. 11А и 11В показывают гидродинамическую доставку зкДНК-вектора, экспрессирующего FVIII. ФИГ. 11А показывает уровни экспрессии FVIII в образцах сыворотки на день 3 и 7 от мышей после гидродинамической инъекции трех различных зкДНК-векторов, экспрессирующих FVIII (LPS1-F8-v1; LPS1-F8-v2; LPS1-F8-v3) или контрольного зкДНК-вектора (только зкДНК, экспрессирующая люциферазу) (показано как Носитель). Два из трех зкДНК-векторов, экспрессирующих FVIII, показали экспрессию FVIII. ФИГ. 11В представляет собой график зависимости ответа от дозы для уровней экспрессии FVIII в образцах сыворотки в течение 30-дневного периода от мышей после гидродинамической инъекции небольшого или большого количества трех разных зкДНК-векторов, экспрессирующих FVIII (LPS1-F8-v1; LPS1-F8-v2; LPS1-F8-v3) или небольших количеств зкДНК-вектора в качестве контроля носителя (экспрессирующего только люциферазу).[0050] FIG. 11A and 11B show hydrodynamic delivery of a cDNA vector expressing FVIII. FIG. 11A shows FVIII expression levels in day 3 and day 7 serum samples from mice following hydrodynamic injection of three different cccDNA vectors expressing FVIII (LPS1-F8-v1; LPS1-F8-v2; LPS1-F8-v3) or a control ccDNA vector (ccDNA expressing luciferase only) (shown as Vehicle). Two of the three cccDNA vectors expressing FVIII showed FVIII expression. FIG. 11B is a dose response plot of FVIII expression levels in serum samples over a 30-day period from mice following hydrodynamic injection of small or large amounts of three different cccDNA vectors expressing FVIII (LPS1-F8-v1; LPS1-F8-v2 ; LPS1-F8-v3) or small amounts of cDNA vector as a vehicle control (expressing luciferase only).
[0051] ФИГ. 12 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 4, зкДНКFVIII-вектора 6, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 14, зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 18, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 22). ЗкДНКFVIII-вектор 16, зкДНКFVIII-вектор 19 и зкДНКFVIII-вектор 21 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.[0051] FIG. 12 is a graph depicting plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cccDNA vectors expressing FVIII (ccDNA FVIII vector 4, ccDNA FVIII vector 6, ccDNA FVIII vector 12, ccDNA FVIII vector 14 , cDNAFVIII-vector 16, ccDNAFVIII-vector 18, ccDNAFVIII-vector 19, ccDNAFVIII-vector 21, ccDNAFVIII-vector 22). CccDNAFVIII-vector 16, ccDNAFVIII-vector 19, and ccDNAFVIII-vector 21 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control.
[0052] ФИГ. 13 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 1, зкДНКFVIII-вектора 2, зкДНКFVIII-вектора 3, зкДНКFVIII-вектора 5, зкДНКFVIII-вектора 7, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 13, зкДНКFVIII-вектора 15). ЗкДНКFVIII-вектор 8 показал самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.[0052] FIG. 13 is a graph showing plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cDNA FVIII-expressing vectors (ccDNA FVIII-vector 1, ccDNA FVIII-vector 2, ccDNA FVIII-vector 3, ccDNA FVIII-vector 5 , cDNAFVIII-vector 7, ccDNAFVIII-vector 8, ccDNAFVIII-vector 12, ccDNAFVIII-vector 13, ccDNAFVIII-vector 15). CctDNAFVIII vector 8 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control.
[0053] ФИГ. 14 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 9, зкДНКFVIII-вектора 10, зкДНКFVIII-вектора 11, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20, зкДНКFVIII-вектора 24, зкДНКFVIII-вектора 25, зкДНКFVIII-вектора 26). ЗкДНКFVIII-вектор 17 и зкДНКFVIII-вектор 20 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель.[0053] FIG. 14 is a graph showing plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cDNA FVIII-expressing vectors (ccDNA FVIII vector 9, ccDNA FVIII vector 10, ccDNA FVIII vector 11, ccDNA FVIII vector 12 , cDNAFVIII-vector 17, ccDNAFVIII-vector 20, ccDNAFVIII-vector 24, ccDNAFVIII-vector 25, ccDNAFVIII-vector 26). CccDNAFVIII-vector 17 and ccDNAFVIII-vector 20 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control.
[0054] ФИГ. 15 представляет собой график, который отображает концентрацию FVIII в плазме (МЕ/мл) через 1 день после гидродинамической доставки повышающихся доз зкДНКFVIII-вектора 23 (0,005 мкг-50 мкг). Как показано на ФИГ. 15, FVIII в плазме повышался дозозависимым образом с повышением дозировки зкДНКFVIII-вектора 23. В качестве контроля использовали только носитель.[0054] FIG. 15 is a graph that depicts plasma FVIII concentration (IU/ml) 1 day after hydrodynamic delivery of increasing doses of cDNAFVIII vector 23 (0.005 μg-50 μg). As shown in FIG. 15, FVIII in plasma increased in a dose-dependent manner with increasing dosage of cDNAFVIII vector 23. Vehicle alone was used as a control.
[0055] ФИГ. 16 представляет собой график, который отображает концентрацию FVIII в плазме (MP/мл) через 7 дней после гидродинамической доставки исследуемого препарата ЛНЧ:зкДНКFVIII-вектор 23.[0055] FIG. 16 is a graph that displays plasma FVIII concentration (MP/ml) 7 days after hydrodynamic delivery of the LNP:ccDNAFVIII-vector 23 study drug.
ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
[0056] В данном документе предложен способ лечения гемофилии А с применением зкДНК-вектора, содержащего одну или более нуклеиновых кислот, которые кодируют терапевтический белок FVIII или его фрагмент. В данном документе также предложены зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, содержащие одну или более гетер о логичных нуклеиновых кислот, которые кодируют белок FVIII. Согласно некоторым вариантам реализации экспрессия белка FVIII может включать секрецию терапевтического белка из клетки, в которой он экспрессируется. В качестве альтернативы, в некоторых вариантах реализации экспрессированный белок FVIII может действовать или функционировать (например, оказывать свой эффект) внутри клетки, в которой он экспрессируется. Согласно некоторым вариантам реализации зкДНК-вектор экспрессирует белок FVIII в печени, мышце (например, скелетной мышце) субъекта или в другой части тела, которая может функционировать как депо для продукции и секреции терапевтического белка FVIII во многие системные компартменты.[0056] Provided herein is a method of treating hemophilia A using a cccDNA vector containing one or more nucleic acids that encode a therapeutic FVIII protein or fragment thereof. Also provided herein are cccDNA vectors for expression of the FVIII protein described herein containing one or more heterologous nucleic acids that encode the FVIII protein. In some embodiments, expression of the FVIII protein may involve secretion of the therapeutic protein from the cell in which it is expressed. Alternatively, in some embodiments, the expressed FVIII protein may act or function (eg, exert its effect) within the cell in which it is expressed. In some embodiments, the cccDNA vector expresses the FVIII protein in the liver, muscle (eg, skeletal muscle) of the subject, or other part of the body that can function as a depot for production and secretion of the therapeutic FVIII protein into multiple systemic compartments.
I. ОпределенияI. Definitions
[0057] Если в данном документе не указано иное, научные и технические термины, используемые применительно к настоящей заявке, должны иметь значения, обычно известные обычным специалистам в области техники, к которой относится данное раскрытие. Следует понимать, что настоящее изобретение не ограничено конкретной методологией, протоколами и реагентами, и т.д., описанными в данном документе, и поэтому допускает варианты. Терминология, используемая в данном документе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения объема настоящего изобретения, который определен исключительно формулой изобретения. Определения обычных терминов в иммунологии и молекулярной биологии можно найти в The Merck Manual of Diagnosis and Therapy, 19 изд., опубликовано Merck Sharp & Dohme Corp., 2011 (ISBN 978-0-911910-19-3); Robert S. Porter et al. (ред.), Fields Virology, 6 изд., опубликовано Lippincott Williams & Wilkins, Philadelphia, PA, USA (2013), Knipe, D.M. and Howley, P.M. (ред.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, опубликовано Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908); и Robert A. Meyers (ред.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, опубликовано VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8); Immunology, Werner Luttmann, опубликовано Elsevier, 2006; Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (ред.), Taylor & Francis Limited, 2014 (ISBN 0815345305, 9780815345305); Lewin's Genes XI, опубликовано Jones & Bartlett Publishers, 2014 (ISBN-1449659055); Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4 изд., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414); Davis et al, Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X); Laboratory Methods in Enzymology: DNA, Jon Lorsch (ред.) Elsevier, 2013 (ISBN 0124199542); Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN047150338X, 9780471503385), Current Protocols in Protein Science (CPPS), John E. Coligan (ред.), John Wiley and Sons, Inc., 2005; и Current Protocols in Immunology (CPI) (John E. Coligan, ADA Μ Kruisbeek, David Η Margulies, Ethan Μ Shevach, Warren Strobe, (ред.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737), содержание которых полностью включено в данный документ посредством ссылки).[0057] Unless otherwise defined herein, scientific and technical terms used in connection with this application shall have the meanings commonly known to those of ordinary skill in the art to which this disclosure pertains. It should be understood that the present invention is not limited to the specific methodology, protocols and reagents, etc. described herein and is therefore subject to variations. The terminology used herein is intended solely to describe specific embodiments and is not intended to limit the scope of the present invention, which is defined solely by the claims. Definitions of common terms in immunology and molecular biology can be found in The Merck Manual of Diagnosis and Therapy, 19th ed., published by Merck Sharp & Dohme Corp., 2011 (ISBN 978-0-911910-19-3); Robert S. Porter et al. (ed.), Fields Virology, 6th ed., published by Lippincott Williams & Wilkins, Philadelphia, PA, USA (2013), Knipe, D.M. and Howley, P.M. (ed.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, published by Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908); and Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8); Immunology, Werner Luttmann, published by Elsevier, 2006; Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (eds.), Taylor & Francis Limited, 2014 (ISBN 0815345305, 9780815345305); Lewin's Genes XI, published by Jones & Bartlett Publishers, 2014 (ISBN-1449659055); Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414); Davis et al, Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X); Laboratory Methods in Enzymology: DNA, Jon Lorsch (ed.) Elsevier, 2013 (ISBN 0124199542); Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN047150338X, 9780471503385), Current Protocols in Protein Science (CPPS), John E. Coligan (ed.), John Wiley and Sons, Inc., 2005; and Current Protocols in Immunology (CPI) (John E. Coligan, ADA Μ Kruisbeek, David Η Margulies, Ethan Μ Shevach, Warren Strobe, (eds.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737), contents which are incorporated herein by reference in their entirety).
[0058] В данном документе термины «введение», «введенный» и их варианты относятся к введению субъекту композиции или агента (например, терапевтической нуклеиновой кислоты или иммуносупрессора, описанных в данном документе) и включают одновременное и последовательное введение одной или более композиций или агентов. «Введение» может относиться, например, к терапевтическим, фармакокинетическим, диагностическим, исследовательским методам, к плацебо и к экспериментальным методам. «Введение» также включает способы лечения in vitro и ex vivo. Введение композиции или агента субъекту осуществляют любым подходящим путем, включая перорально, через легкие, интраназально, парентерально (внутривенно, внутримышечно, внутрибрюшинно или подкожно), ректально, введение в лимфатическую систему, внутрь опухоли или местно. Введение субъекту композиции или агента осуществляют с помощью электропорации. Введение включает самостоятельное введение и введение другим лицом. Введение может быть осуществлено любым подходящим путем. Подходящий путь введения позволяет композиции или агенту выполнять их предусмотренную функцию. Например, если подходящим путем является внутривенный, композицию вводят путем введения указанной композиции или агента в вену субъекта.[0058] As used herein, the terms “administration,” “administered,” and variations thereof refer to the administration to a subject of a composition or agent (e.g., a therapeutic nucleic acid or immunosuppressant described herein) and include simultaneous and sequential administration of one or more compositions or agents . “Administration” may refer to, for example, therapeutic, pharmacokinetic, diagnostic, research, placebo, and experimental methods. "Introduction" also includes in vitro and ex vivo treatment methods. Administration of the composition or agent to a subject is accomplished by any suitable route, including orally, pulmonaryly, intranasally, parenterally (intravenous, intramuscular, intraperitoneal, or subcutaneous), rectal, lymphatic, intratumoral, or topical. Administration of the composition or agent to the subject is accomplished by electroporation. Administration includes self-administration and administration by another person. Administration may be accomplished by any suitable route. A suitable route of administration allows the composition or agent to perform its intended function. For example, if the appropriate route is intravenous, the composition is administered by administering said composition or agent into a vein of the subject.
[0059] В данном документе выражения «терапевтическое средство на основе нуклеиновой кислоты», «терапевтическая нуклеиновая кислота» и «ТНК» используются взаимозаменяемо и относятся к любому варианту терапевтического средства с использованием нуклеиновых кислот в качестве активного компонента терапевтического агента для лечения заболевания или нарушения. В данном документе указанные выражения относятся к терапевтическим средствам на основе РНК и терапевтическим средствам на основе ДНК. Неограничивающие примеры терапевтических средств на основе РНК включают мРНК, антисмысловую РНК и олигонуклеотиды, рибозимы, аптамеры, интерферирующие РНК (РНКи), дцРНК-субстрат Dicer, короткую шпилечную РНК (кшРНК), асимметричную интерферирующую РНК (аиРНК), микроРНК (миРНК). Неограничивающие примеры терапевтических средств на основе ДНК включают миникольцо ДНК, миниген, вирусную ДНК (например, геном лентивируса или ААВ) или невирусные синтетические ДНК-векторы, линейную дуплексную ДНК с замкнутыми концами (зкДНК/CELiD), плазмиды, бакмиды, ДНК-векторы doggybone (dbDNA™), минималистичный вектор для иммунологически определенной экспрессии гена (MIDGE), невирусный ДНК-вектор с минимальной цепью (линейный ковалентно замкнутый ДНК-вектор) или гантелеобразный минимальный ДНК-вектор («гантелеобразную ДНК»).[0059] As used herein, the terms “nucleic acid therapeutic,” “therapeutic nucleic acid,” and “TNA” are used interchangeably and refer to any therapeutic option using nucleic acids as the active component of a therapeutic agent for treating a disease or disorder. As used herein, these expressions refer to RNA-based therapeutics and DNA-based therapeutics. Non-limiting examples of RNA therapeutics include mRNA, antisense RNA and oligonucleotides, ribozymes, aptamers, RNA interfering (RNAi), Dicer dsRNA substrate, short hairpin RNA (shRNA), asymmetric interfering RNA (aiRNA), microRNA (miRNA). Non-limiting examples of DNA-based therapeutics include minicircle DNA, minigene, viral DNA (eg, lentivirus or AAV genome) or non-viral synthetic DNA vectors, closed-end linear duplex DNA (ccDNA/CELiD), plasmids, bacmids, doggybone DNA vectors (dbDNA™), minimalist vector for immunologically defined gene expression (MIDGE), non-viral minimal strand DNA vector (linear covalently closed DNA vector), or dumbbell minimal DNA vector (“dumbbell DNA”).
[0060] В данном документе «эффективное количество» или «терапевтически эффективное количество» терапевтического агента, такого как терапевтический белок FVIII или его фрагмент, представляет собой количество, достаточное для получения целевого эффекта, например, лечения или предотвращения гемофилии А. Подходящие анализы для измерения экспрессии целевого гена или целевой последовательности включают, например, исследование уровней белка или РНК с применением методик, известных специалистам в данной области техники, таких как дот-блоттинг, Нозерн-блоттинг, гибридизация in situ, ИФА, иммунопреципитация, функциональный ферментный анализ, а также фенотипические анализы, известные специалистам в данной области техники. Однако уровни дозировки основаны на различных факторах, включая тип повреждения, возраст, массу тела, пол, медицинское состояние пациента, тяжесть состояния, путь введения и конкретный применяемый активный агент. Соответственно, схема дозирования может значительно изменяться, однако может быть определена обычным путем лечащим врачом с применением стандартных способов. Кроме того, термины «терапевтическое количество», «терапевтически эффективные количества» и «фармацевтически эффективные количества» включают профилактические или превентивные количества композиций согласно описанному изобретению. В профилактических или превентивных приложениях описанного изобретения фармацевтические композиции или лекарственные средства вводят пациенту, подверженному или по иным причинам имеющему риск развития заболевания, нарушения или состояния, в количестве, достаточном для того чтобы устранить или уменьшить риск, уменьшить степень тяжести или отсрочить начало указанного заболевания, нарушения или состояния, включая биохимические, гистологические и/или поведенческие симптомы указанного заболевания, нарушения или состояния, его осложнения, и промежуточные патологические фенотипы, возникающие в ходе развития указанного заболевания, нарушения или состояния. Обычно предпочтительным является применение максимальной дозы, т.е. самой высокой безопасной дозы в соответствии с некоторым медицинским заключением. В соответствии с некоторыми вариантами реализации заболевание, нарушение или состояние представляет собой гемофилию А. Термины «доза» и «дозировка» используются в данном документе взаимозаменяемо.[0060] As used herein, an "effective amount" or a "therapeutically effective amount" of a therapeutic agent, such as a therapeutic FVIII protein or fragment thereof, is an amount sufficient to produce the intended effect, such as treating or preventing hemophilia A. Suitable Assays for Measuring expression of a target gene or target sequence include, for example, examination of protein or RNA levels using techniques known to those skilled in the art, such as dot blot, Northern blot, in situ hybridization, ELISA, immunoprecipitation, functional enzyme assay, as well as phenotypic assays known to those skilled in the art. However, dosage levels are based on various factors, including the type of injury, age, body weight, gender, medical condition of the patient, severity of the condition, route of administration, and the specific active agent used. Accordingly, the dosage regimen may vary significantly, but can be determined in the usual way by the attending physician using standard methods. In addition, the terms “therapeutic amount”, “therapeutically effective amount” and “pharmaceutically effective amount” include prophylactic or prophylactic amounts of compositions according to the described invention. In prophylactic or prophylactic applications of the described invention, pharmaceutical compositions or drugs are administered to a patient susceptible to or otherwise at risk of developing a disease, disorder or condition, in an amount sufficient to eliminate or reduce the risk, reduce the severity or delay the onset of said disease, disorders or conditions, including biochemical, histological and/or behavioral symptoms of the specified disease, disorder or condition, its complications, and intermediate pathological phenotypes that occur during the development of the specified disease, disorder or condition. It is usually preferable to use the maximum dose, i.e. the highest safe dose according to some medical opinion. In some embodiments, the disease, disorder, or condition is hemophilia A. The terms “dose” and “dosage” are used interchangeably herein.
[0061] В данном документе термин «терапевтический эффект» относится к последствиям лечения, результаты которого оценивают как целевые и благоприятные. Терапевтический эффект может включать, прямо или опосредованно, остановку, уменьшение или устранение проявления заболевания. Терапевтический эффект также может включать, прямо или опосредованно, остановку, уменьшение или устранение прогрессирования проявления заболевания.[0061] As used herein, the term “therapeutic effect” refers to the consequences of treatment, the results of which are assessed as targeted and beneficial. The therapeutic effect may include, directly or indirectly, stopping, reducing or eliminating the manifestation of the disease. The therapeutic effect may also include, directly or indirectly, stopping, reducing or eliminating the progression of disease manifestations.
[0062] Для любого терапевтического агента, описанного в данном документе, терапевтически эффективное количество может быть изначально определено на основании предварительных исследований in vitro и/или в моделях на животных. Терапевтически эффективная доза также может быть определена на основании данных у человека. Применяемая доза может быть скорректирована на основании относительных биодоступности и эффективности вводимого соединения. Коррекция дозы для достижения максимальной эффективности на основе описанных выше способов и других хорошо известных способов находится в пределах возможностей обычного специалиста в данной области техники. Общие принципы определения терапевтической эффективности, с которыми можно ознакомиться в главе 1 руководства Goodman and Oilman, The Pharmacological Basis of Therapeutics, 10 изд., McGraw-Hill (New York) (2001), включенного в данный документ посредством ссылки, обобщены ниже.[0062] For any therapeutic agent described herein, a therapeutically effective amount may initially be determined based on preliminary in vitro studies and/or animal models. The therapeutically effective dose can also be determined based on human data. The dose used may be adjusted based on the relative bioavailability and potency of the compound administered. Dosage adjustments to achieve maximum effectiveness based on the methods described above and other well known methods are within the capabilities of one of ordinary skill in the art. The general principles for determining therapeutic efficacy, which can be found in Chapter 1 of Goodman and Oilman, The Pharmacological Basis of Therapeutics, 10th ed., McGraw-Hill (New York) (2001), incorporated herein by reference, are summarized below.
[0063] Фармакокинетические принципы обеспечивают основу для модификации схемы дозирования для получения целевой степени терапевтической эффективности с минимумом неприемлемых нежелательных явлений. Дополнительные рекомендации по модификации дозировки могут быть получены в ситуациях, когда концентрация лекарственного средства в плазме может быть измерена и соотнесена с терапевтическим окном.[0063] Pharmacokinetic principles provide a basis for modifying dosing regimens to achieve the target degree of therapeutic efficacy with a minimum of unacceptable adverse events. Additional recommendations for dosage modification may be obtained in situations where plasma drug concentrations can be measured and related to the therapeutic window.
[0064] В данном документе термины «гетерологичная нуклеотидная последовательность» и «трансген» используются взаимозаменяемо и относятся к представляющей интерес нуклеиновой кислоте (отличной от нуклеиновой кислоты, кодирующей полипептид капсида), которая встроена в зкДНК-вектор и может быть доставлена и экспрессирована зкДНК-вектором, раскрытым в данном документе.[0064] As used herein, the terms “heterologous nucleotide sequence” and “transgene” are used interchangeably and refer to a nucleic acid of interest (other than a nucleic acid encoding a capsid polypeptide) that is inserted into a cccDNA vector and can be delivered and expressed by a cccDNA vector. vector disclosed herein.
[0065] В данном документе термины «экспрессионная кассета» и «транскрипционная кассета» используются взаимозаменяемо и относятся к линейному участку нуклеиновых кислот, который включает трансген, функционально связанный с одним или более промоторами или другими регуляторными последовательностями, достаточными для направления транскрипции трансгена, но который не содержит кодирующих капсид последовательностей, других векторных последовательностей или областей инвертированных концевых повторов. Экспрессионная кассета может дополнительно содержать одну или более цис-действующих последовательностей (например, промоторов, энхансеров или репрессоров), один или более интронов и один или более посттранскрипционных регуляторных элементов.[0065] As used herein, the terms "expression cassette" and "transcription cassette" are used interchangeably and refer to a linear stretch of nucleic acids that includes a transgene operably linked to one or more promoters or other regulatory sequences sufficient to direct transcription of the transgene, but which does not contain capsid coding sequences, other vector sequences or inverted terminal repeat regions. The expression cassette may further comprise one or more cis-acting sequences (eg, promoters, enhancers, or repressors), one or more introns, and one or more post-transcriptional regulatory elements.
[0066] Термины «полинуклеотид» и «нуклеиновая кислота», используемые в данном документе взаимозаменяемо, относятся к полимерной форме нуклеотидов любой длины, будь то рибонуклеотиды или дезоксирибонуклеотиды. Таким образом, этот термин включает одно-, двух- или многоцепочечные ДНК или РНК, геномную ДНК, кДНК, гибриды ДНК-РНК или полимер, включающий пуриновые и пиримидиновые основания или другие природные, химически или биохимически модифицированные, неприродные или дериватизированные нуклеотидные основания. «Олигонуклеотид» обычно относится к полинуклеотидам, содержащим от примерно 5 до примерно 100 нуклеотидов одно- или двухцепочечной ДНК. Однако для целей настоящего раскрытия верхнего предела длины олигонуклеотида не существует. Олигонуклеотиды также известны как «олигомеры» или «олиго» (oligos) и могут быть выделены из генов или химически синтезированы с помощью способов, известных в данной области техники. Термины «полинуклеотид» и «нуклеиновая кислота» следует понимать как включающие, применительно к описываемым вариантам реализации, одноцепочечные (такие как смысловые или антисмысловые) и двухцепочечные полинуклеотиды. ДНК может быть в форме, например, антисмысловых молекул, плазмидной ДНК, дуплексов ДНК-ДНК, предварительно конденсированной ДНК, продуктов ПЦР, векторов (Р1, РАС, ВАС, ΥАС, искусственные хромосомы), экспрессионных кассет, химерных последовательностей, хромосомной ДНК или производных и комбинаций указанных групп. ДНК может быть в форме миникольца, плазмиды, бакмиды, минигена, ДНК с минимальной цепью (линейного ковалентно замкнутого ДНК-вектора), линейной дуплексной ДНК с замкнутыми концами (CELiD или зкДНК), ДНК doggybone (dbDNA™), гантелеобразной ДНК, минималистичного вектора для иммунологически определенной экспрессии гена (MIDGE), вирусного вектора или невирусных векторов. РНК может быть в форме короткой интерферирующей РНК (киРНК), дцРНК-субстрата Dicer, короткой шпилечной РНК (кшРНК), асимметричной интерферирующей РНК (аиРНК), микроРНК (миРНК), мРНК, рРНК, тРНК, вирусной РНК (вРНК) и их комбинаций. Нуклеиновые кислоты включают нуклеиновые кислоты, содержащие известные аналоги нуклеотидов или модифицированные остатки или связи остова, которые являются синтетическими, природными и неприродными, и которые имеют связывающие свойства, близкие свойствам референсной нуклеиновой кислоты. Примеры таких аналогов и/или модифицированных остатков включают, без ограничения, фосфотиоаты, фосфодиамидат-морфолиновый олигомер (морфолино), фосфоамидаты, метилфосфонаты, хиральные метилфосфонаты, 2'-О-метилрибонуклеотиды, замкнутую нуклеиновую кислоту (LNA™) и пептидные нуклеиновые кислоты (ПНК). За исключением конкретно указанных ограничений термин включает нуклеиновые кислоты, содержащие известные аналоги природных нуклеотидов, которые имеют связывающие свойства, близкие свойствам референсной нуклеиновой кислоты. Если не указано иное, подразумевается также, что конкретная последовательность нуклеиновой кислоты также включает ее консервативно модифицированные варианты (например, вырожденные замены кодонов), аллели, ортологи, однонуклеотидные полиморфизмы (SNP) и комплементарные последовательности, а также последовательность, указанную явным образом.[0066] The terms "polynucleotide" and "nucleic acid", used interchangeably herein, refer to the polymeric form of nucleotides of any length, whether ribonucleotides or deoxyribonucleotides. Thus, the term includes single-, double- or multi-stranded DNA or RNA, genomic DNA, cDNA, DNA-RNA hybrids, or a polymer comprising purine and pyrimidine bases or other natural, chemically or biochemically modified, non-natural or derivatized nucleotide bases. "Oligonucleotide" generally refers to polynucleotides containing from about 5 to about 100 nucleotides of single- or double-stranded DNA. However, for purposes of the present disclosure, there is no upper limit on the length of the oligonucleotide. Oligonucleotides are also known as "oligomers" or "oligos" and can be isolated from genes or chemically synthesized using methods known in the art. The terms “polynucleotide” and “nucleic acid” should be understood to include, for the purposes of the described embodiments, single-stranded (such as sense or antisense) and double-stranded polynucleotides. The DNA may be in the form of, for example, antisense molecules, plasmid DNA, DNA-DNA duplexes, pre-condensed DNA, PCR products, vectors (P1, PAC, BAC, ΥAC, artificial chromosomes), expression cassettes, chimeric sequences, chromosomal DNA or derivatives and combinations of these groups. The DNA may be in the form of a minicircle, plasmid, bacmid, minigene, minimal strand DNA (linear covalently closed DNA vector), closed end linear duplex DNA (CELiD or cccDNA), doggybone DNA (dbDNA™), dumbbell DNA, minimalistic vector for immunologically defined gene expression (MIDGE), viral vector or non-viral vectors. The RNA may be in the form of short interfering RNA (siRNA), Dicer substrate dsRNA, short hairpin RNA (shRNA), asymmetric interfering RNA (aiRNA), microRNA (miRNA), mRNA, rRNA, tRNA, viral RNA (vRNA), and combinations thereof . Nucleic acids include nucleic acids containing known nucleotide analogues or modified backbone residues or linkages, which are synthetic, natural or non-natural, and which have binding properties similar to those of the reference nucleic acid. Examples of such analogues and/or modified residues include, but are not limited to, phosphorothioates, phosphodiamidate-morpholine oligomer (morpholino), phosphoamidates, methylphosphonates, chiral methylphosphonates, 2'-O-methylribonucleotides, locked nucleic acid (LNA™) and peptide nucleic acids (PNAs). ). Except as specifically stated, the term includes nucleic acids containing known analogues of natural nucleotides that have binding properties similar to those of the reference nucleic acid. Unless otherwise indicated, a particular nucleic acid sequence is also intended to include conservatively modified variants thereof (eg, degenerate codon substitutions), alleles, orthologs, single nucleotide polymorphisms (SNPs), and complementary sequences, as well as explicitly stated sequence.
[0067] «Нуклеотиды» содержат сахар дезоксирибозу (ДНК) или рибозу (РНК), основание и фосфатную группу. Нуклеотиды соединены между собой посредством фосфатных групп.[0067] "Nucleotides" contain the sugar deoxyribose (DNA) or ribose (RNA), a base, and a phosphate group. Nucleotides are connected to each other through phosphate groups.
[0068] «Основания» включают пурины и пиримидины, которые, в частности, включают природные соединения аденин, тимин, гуанин, цитозин, урацил, инозин и природные аналоги, а также синтетические производные пуринов и пиримидинов, которые включают, но не ограничиваются перечисленными, модификации, которые вводят новые реакционноспособные группы, такие как, но не ограничиваясь перечисленными, амины, спирты, тиолы, карбоксилаты и алкилгалогениды.[0068] "Bases" include purines and pyrimidines, which include, but are not limited to, the natural compounds adenine, thymine, guanine, cytosine, uracil, inosine and natural analogues, as well as synthetic derivatives of purines and pyrimidines, which include, but are not limited to, modifications that introduce new reactive groups such as, but not limited to, amines, alcohols, thiols, carboxylates and alkyl halides.
[0069] В данном документе термин «интерферирующая РНК» или «РНКи», или «последовательность интерферирующей РНК» включает одноцепочечную РНК (например, зрелую миРНК, олигонуклеотиды оцРНКи, олигонуклеотиды оцДНКи), двухцепочечную РНК (т.е. дуплексную РНК, такую как киРНК, дцРНК-субстрат Dicer, кшРНК, аиРНК или пре-миРНК), гибрид ДНК-РНК (см., например, публикацию РСТ № WO 2004/078941) или гибрид ДНК-ДНК (см., например, публикацию РСТ № WO 2004/104199), который способен уменьшать или ингибировать экспрессию целевого гена или последовательности (например, опосредуя разрушение или ингибируя трансляцию мРНК, которые комплементарны последовательности интерферирующей РНК), когда интерферирующая РНК находится в той же клетке, что и целевой ген или последовательность. Таким образом, интерферирующая РНК относится к одноцепочечной РНК, которая комплементарна последовательности мРНК-мишени, или к двухцепочечной РНК, образованной двумя комплементарными цепями или одной самокомплементарной цепью. Интерферирующая РНК может иметь существенную или полную идентичность с целевым геном или последовательностью или может содержать область несовпадения (т.е. мотив несовпадения). Последовательность интерферирующей РНК может соответствовать полноразмерному целевому гену или его подпоследовательности. Предпочтительно молекулы интерферирующих РНК синтезируют химическим путем. Раскрытия каждого из упомянутых выше патентных документов полностью включены в данный документ посредством ссылки для всех целей.[0069] As used herein, the term “interfering RNA” or “RNAi” or “interfering RNA sequence” includes single-stranded RNA (e.g., mature siRNA, ssRNAi oligonucleotides, ssDNAi oligonucleotides), double-stranded RNA (i.e., duplex RNA such as siRNA, dsRNA-Dicer substrate, shRNA, aiRNA or pre-miRNA), DNA-RNA hybrid (see, for example, PCT Publication No. WO 2004/078941) or DNA-DNA hybrid (see, for example, PCT Publication No. WO 2004 /104199) that is capable of reducing or inhibiting the expression of a target gene or sequence (for example, by mediating the destruction or inhibiting the translation of mRNAs that are complementary to an interfering RNA sequence) when the interfering RNA is in the same cell as the target gene or sequence. Thus, interfering RNA refers to single-stranded RNA that is complementary to the target mRNA sequence, or double-stranded RNA formed by two complementary strands or one self-complementary strand. The interfering RNA may have substantial or complete identity with the target gene or sequence or may contain a region of mismatch (ie, a mismatch motif). The interfering RNA sequence may correspond to the full-length target gene or a subsequence thereof. Preferably, interfering RNA molecules are synthesized chemically. The disclosures of each of the patent documents mentioned above are incorporated herein by reference in their entirety for all purposes.
[0070] Интерферирующая РНК включает «короткую интерферирующую РНК» или «киРНК», например, интерферирующую РНК из примерно 15-60, 15-50 или 15-40 (дуплекс) нуклеотидов в длину, более типично примерно 15-30, 15-25 или 19-25 (дуплекс) нуклеотидов в длину и предпочтительно составляет примерно 20-24, 21-22 или 21-23 (дуплекс) нуклеотида в длину (например, каждая комплементарная последовательность двухцепочечной киРНК составляет 15-60, 15-50, 15-40, 15-30, 15-25 или 19-25 нуклеотидов в длину, предпочтительно примерно 20-24, 21-22 или 21-23 нуклеотида в длину, и двухцепочечная киРНК составляет примерно 15-60, 15-50, 15-40, 15-30, 15-25 или 19-25 пар оснований в длину, предпочтительно примерно 18-22, 19-20 или 19-21 пару оснований в длину). Дуплексы киРНК могут содержать 3'-липкие концы, имеющие от примерно 1 до примерно 4 нуклеотидов или от примерно 2 до примерно 3 нуклеотидов, и 5-фосфатные концы. Примеры киРНК включают, без ограничения, двухцепочечную полинуклеотидную молекулу, собранную из двух одноцепочечных молекул, причем одна цепь является смысловой цепью, а другая представляет собой комплементарную антисмысловую цепь; двухцепочечную полинуклеотидную молекулу, собранную из одноцепочечной молекулы, в которой смысловая и антисмысловая области соединены линкером на основе нуклеиновой кислоты или на основе, отличной от нуклеиновой кислоты; двухцепочечную полинуклеотидную молекулу со шпилечной вторичной структурой, имеющей самокомплементарные смысловые и антисмысловые области; и кольцевую одноцепочечную полинуклеотидную молекулу с двумя или более петлевыми структурами и стеблем, имеющим самокомплементарные смысловые и антисмысловые области, причем кольцевой полинуклеотид может подвергаться процессингу in vivo или in vitro с получением активной двухцепочечной молекулы киРНК. В данном документе термин «киРНК» включает дуплексы РНК-РНК, а также гибриды ДНК-РНК (см., например, публикацию РСТ № WO 2004/078941).[0070] Interfering RNA includes "short interfering RNA" or "siRNA", for example, interfering RNA of about 15-60, 15-50 or 15-40 (duplex) nucleotides in length, more typically about 15-30, 15-25 or 19-25 (duplex) nucleotides in length and is preferably about 20-24, 21-22 or 21-23 (duplex) nucleotides in length (e.g., each complementary sequence of a double-stranded siRNA is 15-60, 15-50, 15- 40, 15-30, 15-25 or 19-25 nucleotides in length, preferably about 20-24, 21-22 or 21-23 nucleotides in length, and double-stranded siRNA is about 15-60, 15-50, 15-40 , 15-30, 15-25 or 19-25 base pairs in length, preferably about 18-22, 19-20 or 19-21 base pairs in length). siRNA duplexes may contain 3'-overhangs having from about 1 to about 4 nucleotides or from about 2 to about 3 nucleotides, and 5-phosphate ends. Examples of siRNA include, but are not limited to, a double-stranded polynucleotide molecule assembled from two single-stranded molecules, one strand being the sense strand and the other being the complementary antisense strand; a double-stranded polynucleotide molecule assembled from a single-stranded molecule in which the sense and antisense regions are connected by a nucleic acid-based or non-nucleic acid-based linker; a double-stranded polynucleotide molecule with a hairpin secondary structure having self-complementary sense and antisense regions; and a circular single-stranded polynucleotide molecule with two or more loop structures and a stem having self-complementary sense and antisense regions, wherein the circular polynucleotide can be processed in vivo or in vitro to produce an active double-stranded siRNA molecule. As used herein, the term “siRNA” includes RNA-RNA duplexes as well as DNA-RNA hybrids (see, for example, PCT Publication No. WO 2004/078941).
[0071] В данном документе термин «конструкция нуклеиновой кислоты» относится к молекуле нуклеиновой кислоты, будь то одноцепочечная или двухцепочечная, которая выделена из природного гена или которая модифицирована так, чтобы она содержала сегменты нуклеиновых кислот, с помощью способа, который в прочих случаях не существовал бы в природе, или является синтетической. Термин «конструкция нуклеиновой кислоты» является синонимом термина «экспрессионная кассета», когда конструкция нуклеиновой кислоты содержит контрольные последовательности, необходимые для экспрессии кодирующей последовательности согласно настоящему раскрытию. «Экспрессионная кассета» включает кодирующую последовательность ДНК, функционально связанную с промотором.[0071] As used herein, the term “nucleic acid construct” refers to a nucleic acid molecule, whether single-stranded or double-stranded, that is isolated from a naturally occurring gene or that is modified to contain segments of nucleic acids in a manner that is not otherwise would exist in nature, or is synthetic. The term “nucleic acid construct” is synonymous with the term “expression cassette” when the nucleic acid construct contains control sequences necessary for the expression of a coding sequence according to the present disclosure. An "expression cassette" includes a DNA coding sequence operably linked to a promoter.
[0072] Под «гибридизуемая» или «комплементарная» или «по существу комплементарная» подразумевается, что нуклеиновая кислота (например, РНК) включает последовательность нуклеотидов, которая позволяет ей нековалентно связываться, т.е. формировать пары оснований по Уотсону-Крику и/или пары оснований G/U, «ренатурировать» или «гибридизироваться» с другой нуклеиновой кислотой специфичным для последовательности, антипараллельным образом (т.е. нуклеиновая кислота специфично связывается с комплементарной нуклеиновой кислотой) в соответствующих условиях температуры и ионной силы раствора in vitro и/или in vivo. Как известно в данной области техники, стандартное спаривание оснований по Уотсону-Крику включает: спаривание аденина (А) с тимидином (Т), спаривание аденина (А) с урацилом (U) и спаривание гуанина (G) с цитозином (С). Кроме того, в данной области техники также известно, что при гибридизации двух молекул РНК (например, дцРНК) гуаниновое (G) основание спаривается с урацилом (U). Например, спаривание оснований G/U частично отвечает за вырожденность (т.е. избыточность) генетического кода в случае спаривания оснований анти-кодонов тРНК с кодонами в мРНК. Применительно к настоящему раскрытию гуанин (G) связывающего белок сегмента (дуплекса дцРНК) нацеливающей на ДНК молекулы РНК согласно настоящему изобретению считается комплементарным урацилу (U), и наоборот. Таким образом, когда пара оснований G/U может быть получена в определенном нуклеотидном положении связывающего белок сегмента (дуплекса дцРНК) нацеливающей на ДНК молекулы РНК согласно настоящему изобретению, это положение не рассматривается как некомплементарное, а вместо этого считается комплементарным.[0072] By "hybridizable" or "complementary" or "substantially complementary" is meant that the nucleic acid (eg, RNA) includes a nucleotide sequence that allows it to bind non-covalently, i.e. form Watson-Crick base pairs and/or G/U base pairs, "renature" or "hybridize" with another nucleic acid in a sequence-specific, antiparallel manner (i.e., the nucleic acid specifically binds to a complementary nucleic acid) under appropriate conditions temperature and ionic strength of the solution in vitro and/or in vivo. As is known in the art, standard Watson-Crick base pairing includes: adenine (A) pairing with thymidine (T), adenine (A) pairing with uracil (U), and guanine (G) pairing with cytosine (C). In addition, it is also known in the art that when two RNA molecules (eg, dsRNA) are hybridized, a guanine (G) base is paired with a uracil (U). For example, G/U base pairing is partly responsible for the degeneracy (i.e., redundancy) of the genetic code in the case of base pairing of tRNA anti-codons with codons in mRNA. For purposes of the present disclosure, the guanine (G) protein-binding segment (dsRNA duplex) of the DNA-targeting RNA molecule of the present invention is considered to be complementary to uracil (U), and vice versa. Thus, when a G/U base pair can be obtained at a specific nucleotide position of the protein binding segment (dsRNA duplex) of a DNA-targeting RNA molecule according to the present invention, that position is not considered to be non-complementary, but instead is considered to be complementary.
[0073] Термины «пептид», «полипептид» и «белок» используются в данном документе взаимозаменяемо и относятся к полимерной форме аминокислот любой длины, которая может включать кодируемые и некодируемые аминокислоты, химически или биохимически модифицированные или дериватизированные аминокислоты, и полипептиды, имеющие модифицированные пептидные остовы.[0073] The terms "peptide", "polypeptide" and "protein" are used interchangeably herein and refer to the polymeric form of amino acids of any length, which may include encoded and non-encoded amino acids, chemically or biochemically modified or derivatized amino acids, and polypeptides having modified peptide backbones.
[0074] Последовательность ДНК, которая «кодирует» конкретный белок FVIII, представляет собой последовательность нуклеиновой кислоты ДНК, которая транскрибируется в конкретную РНК и/или белок. Полинуклеотид ДНК может кодировать РНК (мРНК), которая транслируется в белок, или полинуклеотид ДНК может кодировать РНК, которая не транслируется в белок (например, тРНК, рРНК или нацеливающую на ДНК РНК; также называемые «некодирующими» РНК или «нкРНК»).[0074] A DNA sequence that “codes” for a particular FVIII protein is a DNA nucleic acid sequence that is transcribed into a particular RNA and/or protein. A DNA polynucleotide may encode RNA (mRNA) that is translated into a protein, or a DNA polynucleotide may encode RNA that is not translated into a protein (eg, tRNA, rRNA, or DNA-targeting RNA; also called “non-coding” RNA or “ncRNA”).
[0001] В данном документе термин «слитый белок», в используемом в данном документе значении, относится к полипептиду, который содержит белковые домены по меньшей мере из двух разных белков. Например, слитый белок может содержать (i) FVIII или его фрагмент и (ii) по меньшей мере один белок, не относящийся к GOI. Слитые белки, охватываемые данным документом, включают, но не ограничиваются перечисленными, антитело или Fc или антигенсвязывающий фрагмент антитела, слитый с белком FVIII, например, внеклеточным доменом рецептора, лигандом, ферментом или пептидом. Белок FVIII или его фрагмент, который является частью слитого белка, может представлять собой моноспецифичное антитело или биспецифичное или мультиспецифичное антитело.[0001] As used herein, the term “fusion protein” refers to a polypeptide that contains protein domains from at least two different proteins. For example, the fusion protein may comprise (i) FVIII or a fragment thereof and (ii) at least one non-GOI protein. Fusion proteins covered herein include, but are not limited to, an antibody or Fc or antigen binding fragment of an antibody fused to an FVIII protein, such as a receptor extracellular domain, ligand, enzyme, or peptide. The FVIII protein or fragment thereof that is part of the fusion protein may be a monospecific antibody or a bispecific or multispecific antibody.
[0075] В данном документе термин «ген безопасной гавани генома» или «ген безопасной гавани» относится к гену или локусам, в которые последовательность нуклеиновой кислоты может быть вставлена так, чтобы последовательность могла интегрироваться и функционировать предсказуемым образом (например, экспрессировать белок, представляющий интерес) без существенных отрицательных последствий для активности эндогенного гена или стимуляции рака. Согласно некоторым вариантам реализации ген безопасной гавани также представляет собой локусы или ген, в которых вставленная последовательность нуклеиновой кислоты может экспрессироваться эффективнее и на более высоких уровнях, чем в сайте, не являющемся «безопасной гаванью».[0075] As used herein, the term “genomic safe harbor gene” or “safe harbor gene” refers to a gene or loci into which a nucleic acid sequence can be inserted such that the sequence can integrate and function in a predictable manner (e.g., to express a protein representing interest) without significant negative consequences for endogenous gene activity or cancer stimulation. In some embodiments, a safe harbor gene also represents loci or a gene at which the inserted nucleic acid sequence can be expressed more efficiently and at higher levels than at a non-safe harbor site.
[0076] В данном документе термин «доставка гена» означает способ, с помощью которого чужеродную ДНК переносят в клетки-хозяева для приложений генной терапии.[0076] As used herein, the term “gene delivery” refers to the method by which foreign DNA is transferred into host cells for gene therapy applications.
[0077] В данном документе термин «концевой повтор» или «TR» включает любой вирусный концевой повтор или синтетическую последовательность, которая содержит по меньшей мере одну минимальную требуемую точку начала репликации и область, содержащую палиндромную шпилечную структуру. Связывающая Rep последовательность («RBS») (также называемая RBE (связывающий Rep элемент)) и сайт концевого разрешения («TRS») вместе составляют «минимальную требуемую точку начала репликации» и, соответственно, TR содержит по меньшей мере одну RBS и по меньшей мере один TRS. Каждый из TR, обратно комплементарных по отношению друг к другу в пределах определенного участка полинуклеотидной последовательности, как правило, называют «инвертированным концевым повтором» или «ITR». Применительно к вирусу ITR опосредуют репликацию, упаковку вируса, интеграцию и освобождение провируса. Как было неожиданно обнаружено, согласно настоящему изобретению TR, которые не являются обратно комплементарными по всей их длине, все еще могут выполнять обычные функции ITR и, таким образом, в данном документе термин ITR относится к TR в геноме зкДНК или зкДНК-векторе, который способен опосредовать репликацию зкДНК-вектора. Обычный специалист в данной области техники поймет, что в зкДНК-векторах сложной конфигурации может присутствовать более двух пар ITR или асимметричных ITR. ITR может представлять собой ITR ААВ или ITR, не принадлежащий ААВ, или может быть получен из ITR ААВ или ITR, не принадлежащего ААВ. Например, ITR может происходить из семейства Parvoviridae, которое включает парвовирусы и депендовирусы (например, собачий парвовирус, бычий парвовирус, мышиный парвовирус, свиной парвовирус, парвовирус человека В-19), или шпилька SV40, которая служит точкой начала репликации SV40, может применяться в качестве ITR, который может быть дополнительно модифицирован путем усечения, замены, делеции, вставки и/или добавления. Вирусы семейства Parvoviridae состоят из двух подсемейств: Parvovirinae, инфицирующих позвоночных животных, и Densovirinae, инфицирующих беспозвоночных. Депендопарвовирусы включают вирусное семейство аденоассоциированных вирусов (ААВ), которые способны к репликации у позвоночных животных-хозяев, включая, но не ограничиваясь перечисленными, человека, виды приматов, бычьих, собачьих, лошадиных и овечьих. Для удобства в данном документе ITR, расположенный в 5-направлении (слева) относительно экспрессионной кассеты в зкДНК-векторе, называется «5'-ITR» или «левым ITR», a ITR, расположенный в 3-направлении (справа) относительно экспрессионной кассеты в зкДНК-векторе, называется «3'-ITR» или «правым ITR».[0077] As used herein, the term “terminal repeat” or “TR” includes any viral terminal repeat or synthetic sequence that contains at least one minimum required origin of replication and a region containing a palindromic hairpin structure. The Rep binding sequence (“RBS”) (also called the RBE (Rep binding element)) and the terminal resolution site (“TRS”) together constitute the “minimum required origin of replication” and, accordingly, the TR contains at least one RBS and at least at least one TRS. Each of the TRs that are inversely complementary to each other within a specific region of a polynucleotide sequence is generally referred to as an “inverted terminal repeat” or “ITR.” In the context of a virus, ITRs mediate viral replication, packaging, integration, and proviral release. Surprisingly, according to the present invention, TRs that are not reverse complementary along their entire length can still perform the normal functions of ITRs and thus, as used herein, the term ITR refers to a TR in a cccDNA genome or a cccDNA vector that is capable of mediate replication of the cDNA vector. One of ordinary skill in the art will appreciate that cccDNA vectors of complex configuration may contain more than two pairs of ITRs or asymmetric ITRs. The ITR may be an AAB ITR or a non-AAB ITR, or may be derived from an AAB ITR or a non-AAB ITR. For example, the ITR may be from the Parvoviridae family, which includes parvoviruses and dependoviruses (eg, canine parvovirus, bovine parvovirus, murine parvovirus, porcine parvovirus, human parvovirus B-19), or the SV40 hairpin, which serves as the SV40 origin of replication, may be used in as an ITR, which may be further modified by truncation, substitution, deletion, insertion and/or addition. Viruses of the Parvoviridae family consist of two subfamilies: Parvovirinae, which infect vertebrates, and Densovirinae, which infect invertebrates. Dependoparvoviruses comprise the adeno-associated virus (AAV) family of viruses that are capable of replication in vertebrate hosts, including, but not limited to, human, primate, bovine, canine, equine and ovine species. For convenience, herein the ITR located in the 5-direction (to the left) of the expression cassette in the cDNA vector is referred to as the “5'-ITR” or “left ITR”, and the ITR located in the 3-direction (to the right) of the expression cassette in a cccDNA vector, is called the “3'-ITR” or “right-hand ITR”.
[0078] «ITR дикого типа» или «WT-ITR» относится к последовательности природной последовательности ITR в ААВ или другом депендовирусе, которая сохраняет, например, активность связывания Rep и никирующую способность Rep. Нуклеотидная последовательность WT-ITR из любого серотипа ААВ может незначительно отличаться от канонической природной последовательности из-за вырожденности генетического кода или дрейфа, и, таким образом, последовательности WT-ITR, предусмотренные для применения в данном документе, включают последовательности WT-ITR, образующиеся в результате природных изменений, происходящих в процессе продуцирования (например, ошибки репликации).[0078] “Wild-type ITR” or “WT-ITR” refers to a naturally occurring ITR sequence in an AAV or other dependovirus that retains, for example, Rep binding activity and Rep nicking ability. The nucleotide sequence of the WT-ITR from any AAV serotype may differ slightly from the canonical natural sequence due to degeneracy of the genetic code or drift, and thus the WT-ITR sequences provided for use herein include WT-ITR sequences generated in as a result of natural changes occurring during the production process (for example, replication errors).
[0079] В данном документе термин «по существу симметричные WT-ITR» или «пара по существу симметричных WT-ITR» относится к паре WT-ITR в одном геноме зкДНК или зкДНК-векторе, которые оба представляют собой ITR дикого типа, которые имеют обратно комплементарные последовательности по всей их длине. Например, ITR может считаться последовательностью дикого типа, даже если он содержит один или более нуклеотидов, отличающихся от канонической природной последовательности, при условии, что указанные изменения не влияют на свойства и общую трехмерную структуру последовательности. Согласно некоторым аспектам отличающиеся нуклеотиды представляют собой консервативные изменения последовательности. В качестве одного неограничивающего примера, последовательность, имеющая по меньшей мере 95%, 96%, 97%, 98% или 99% идентичности последовательности с канонической последовательностью (измеренной, например, с использованием BLAST при настройках по умолчанию), также имеет симметричную трехмерную пространственную организацию с другой последовательностью WT-ITR так, что их трехмерные структуры имеют одинаковую форму в геометрическом пространстве. По существу симметричный WT-ITR содержит одинаковые петли А, С-С' и В-В' в трехмерном пространстве. То, что по существу симметричный WT-ITR представляет собой WT, может быть функционально подтверждено путем определения наличия в нем функционального сайта связывания Rep (RBE или RBE') и сайта концевого разрешения (TRS), который спаривается с соответствующим белком Rep. Могут быть протестированы другие функции, включая экспрессию трансгена в пермиссивных условиях, но необязательно.[0079] As used herein, the term “substantially symmetrical WT-ITRs” or “a pair of essentially symmetrical WT-ITRs” refers to a pair of WT-ITRs in a single ccDNA genome or ccDNA vector that are both wild-type ITRs that have reverse complementary sequences along their entire length. For example, an ITR may be considered a wild-type sequence even if it contains one or more nucleotides that differ from the canonical natural sequence, provided that these changes do not affect the properties and overall three-dimensional structure of the sequence. In some aspects, the differing nucleotides represent conserved sequence changes. As one non-limiting example, a sequence having at least 95%, 96%, 97%, 98%, or 99% sequence identity with a canonical sequence (measured, for example, using BLAST at default settings) also has symmetric three-dimensional spatial organization with a different WT-ITR sequence such that their three-dimensional structures have the same shape in geometric space. An essentially symmetrical WT-ITR contains identical loops A, C-C' and B-B' in three-dimensional space. That an essentially symmetrical WT-ITR is WT can be functionally confirmed by determining whether it contains a functional Rep binding site (RBE or RBE') and a terminal resolution site (TRS) that pairs with the corresponding Rep protein. Other functions may be tested, including expression of the transgene under permissive conditions, but are not required.
[0080] В данном документе выражения «модифицированный ITR» или «mod-ITR», или «мутантный ITR» используются в данном документе взаимозаменяемо и относятся к ITR, который содержит мутацию по меньшей мере в одном или более нуклеотидах по сравнению с WT-ITR из того же серотипа. Указанная мутация может приводить к изменению в одной или более из областей А, С, С', В, В' в ITR и может приводить к изменению трехмерной пространственной организации (т.е. его трехмерной структуры в геометрическом пространстве) по сравнению с трехмерной пространственной организацией WT-ITR из того же серотипа.[0080] As used herein, the expressions “modified ITR” or “mod-ITR” or “mutant ITR” are used interchangeably herein and refer to an ITR that contains a mutation in at least one or more nucleotides compared to the WT-ITR from the same serotype. The mutation may result in a change in one or more of regions A, C, C', B, B' in the ITR and may result in a change in three-dimensional spatial organization (i.e., its three-dimensional structure in geometric space) compared to three-dimensional spatial organization by the WT-ITR organization from the same serotype.
[0081] В данном документе термин «асимметричные ITR», также называемые «парами асимметричных ITR», относится к паре ITR в одном геноме зкДНК или зкДНК-векторе, которые не являются обратно комплементарными по их полной длине. В качестве одного неограничивающего примера, асимметричный ITR в паре не имеет симметричной трехмерной пространственной организации со своим когнатным ITR так, что их трехмерные структуры имеют разные формы в геометрическом пространстве. Другими словами, асимметричные ITR в паре имеют разные общие геометрические структуры, т.е. они имеют разную организацию их петель А, С-С' и В-В' в трехмерном пространстве (например, один ITR может иметь короткое плечо С-С' и/или короткое плечо В-В' по сравнению с когнатным ITR). Различие по последовательности между двумя ITR может быть обусловлено добавлением, делецией, усечением или точечной мутацией одного или более нуклеотидов. Согласно одному варианту реализации один ITR из пары асимметричных ITR может представлять собой последовательность ITR дикого типа ААВ, а другой ITR представляет собой модифицированный ITR, как определено в данном документе (например, последовательность ITR, не относящуюся к дикому типу, или синтетическую последовательность). Согласно другому варианту реализации ни один ITR из пары асимметричных ITR не является последовательностью ААВ дикого типа, и указанные два ITR представляют собой модифицированные ITR, которые имеют разные формы в геометрическом пространстве (т.е. разную общую геометрическую структуру). Согласно некоторым вариантам реализации один mod-ITR из пары асимметричных ITR может иметь короткое плечо С-С', а другой ITR может иметь другую модификацию (например, одно плечо или короткое плечо В-В' и т.д.) так, что они имеют различную трехмерную пространственную организацию по сравнению с когнатным асимметричным mod-ITR.[0081] As used herein, the term “asymmetric ITRs,” also referred to as “asymmetric ITR pairs,” refers to a pair of ITRs in the same ccDNA genome or ccDNA vector that are not inversely complementary in their full length. As one non-limiting example, an asymmetric ITR in a pair does not have a symmetrical three-dimensional spatial organization with its cognate ITR such that their three-dimensional structures have different shapes in geometric space. In other words, asymmetric ITRs in a pair have different overall geometric structures, i.e. they have different organizations of their A, C-C' and B-B' loops in three-dimensional space (e.g., a single ITR may have a short C-C' arm and/or a short B-B' arm compared to a cognate ITR). The sequence difference between two ITRs may be due to the addition, deletion, truncation, or point mutation of one or more nucleotides. In one embodiment, one ITR of a pair of asymmetric ITRs may be a wild-type AAB ITR sequence, and the other ITR is a modified ITR as defined herein (eg, a non-wild-type ITR sequence or a synthetic sequence). In another embodiment, neither ITR of a pair of asymmetric ITRs is a wild-type AAV sequence, and the two ITRs are modified ITRs that have different shapes in geometric space (ie, a different overall geometric structure). In some embodiments, one mod-ITR of a pair of asymmetric ITRs may have a short C-C' arm, and the other ITR may have a different modification (e.g., a single arm or a short B-B' arm, etc.) such that they have a different three-dimensional spatial organization compared to cognate asymmetric mod-ITR.
[0082] В данном документе термин «симметричные ITR» относится к паре ITR в одном зкДНК-геноме или зкДНК-векторе, которые представляют собой последовательности дикого типа или мутированные (например, модифицированные относительно дикого типа) депендовирусные последовательности ITR и обратно комплементарны по всей их длине. В одном неограничивающем примере оба ITR представляют собой последовательности ITR дикого типа из ААВ2. В другом примере ни один из ITR не является последовательностью ITR дикого типа ААВ2 (т.е. они представляют собой модифицированные ITR, также называемые мутантными ITR) и может отличаться по последовательности от ITR дикого типа вследствие добавления, делеции, замены, усечения или точечной мутации нуклеотида. Для удобства в данном документе ITR, расположенный в 5'-направлении (слева) относительно экспрессионной кассеты в зкДНК-векторе, называется «5'-ITR» или «левым ITR», a ITR, расположенный в 3'-направлении (справа) относительно экспрессионной кассеты в зкДНК-векторе, называется «3'-ITR» или «правым ITR».[0082] As used herein, the term “symmetrical ITRs” refers to a pair of ITRs in a single cccDNA genome or cccDNA vector that are wild-type or mutated (e.g., modified relative to wild-type) dependoviral ITR sequences and are reverse complementary throughout. length In one non-limiting example, both ITRs are wild-type ITR sequences from AAB2. In another example, none of the ITRs are the sequence of the wild-type AAB2 ITR (i.e., they are modified ITRs, also called mutant ITRs) and may differ in sequence from the wild-type ITR due to addition, deletion, substitution, truncation, or point mutation nucleotide. For convenience, herein the ITR located in the 5' direction (to the left) relative to the expression cassette in the cDNA vector is referred to as the "5' ITR" or "left ITR", and the ITR located in the 3' direction (to the right) relative to expression cassette in the cccDNA vector is called the “3'-ITR” or “right ITR”.
[0083] В данном документе термин «по существу симметричные модифицированные ITR» или «пара по существу симметричных mod-ITR» относится к паре модифицированных ITR в одном геноме зкДНК или зкДНК-векторе, которые оба имеют обратно комплементарные последовательности по всей их длине. Например, модифицированный ITR может считаться по существу симметричным, даже если он имеет некоторые нуклеотидные последовательности, отличающиеся от обратно комплементарной последовательности, при условии, что указанные изменения не влияют на свойства и общую форму. В качестве одного неограничивающего примера представлена последовательность, которая имеет по меньшей мере 85%, 90%, 95%, 96%, 97%, 98% или 99% идентичности последовательности с канонической последовательностью (измеренной с помощью BLAST при настойках по умолчанию), а также имеет симметричную трехмерную пространственную организацию в отношении ее когнатного модифицированного ITR так, что их трехмерные структуры имеют одинаковую форму в геометрическом пространстве. Иными словами, пара по существу симметричных модифицированных ITR имеет одинаково организованные в трехмерном пространстве петли А, С-С' и В-В'. Согласно некоторым вариантам реализации ITR из пары mod-ITR могут иметь разные обратно комплементарные нуклеотидные последовательности, но все же иметь одинаковую симметричную трехмерную пространственную организацию, т.е. оба ITR содержат мутации, которые приводят к одинаковой общей трехмерной форме. Например, один ITR (например, 5'-ITR) в паре mod-ITR может происходить из одного серотипа, а другой ITR (например, 3'-ITR) может происходить из другого серотипа, однако оба могут иметь одинаковую соответствующую мутацию (например, если 5'-ITR имеет делецию в области С, то когнатный модифицированный 3'-ITR из другого серотипа имеет делецию в соответствующем положении в области С') так, что пара модифицированных ITR имеет одинаковую симметричную трехмерную пространственную организацию. Согласно таким вариантам реализации каждый ITR в паре модифицированных ITR может происходить из разных серотипов (например, ААВ1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 и 12), таких как комбинация ААВ2 и ААВ6, при этом модификация в одном ITR отображается в соответствующем положении в когнатном ITR из другого серотипа. Согласно одному варианту реализации пара по существу симметричных модифицированных ITR относится к паре модифицированных ITR (mod-ITR) при условии, что различие в нуклеотидных последовательностях между указанными ITR не влияет на свойства или общую форму, и они имеют по существу одинаковую форму в трехмерном пространстве. В качестве неограничивающего примера представлен mod-ITR, который имеет по меньшей мере 95%, 96%, 97%, 98% или 99% идентичности последовательности с каноническим mod-ITR, как определено с помощью стандартных способов, хорошо известных в данной области техники, таких как BLAST (Basic Local Alignment Search Tool) или BLASTN, при настройках по умолчанию, а также имеет симметричную трехмерную пространственную организацию так, что их трехмерная структура имеет одинаковую форму в геометрическом пространстве. Пара по существу симметричных mod-ITR имеет одинаковые петли А, С-С' и В-В' в трехмерном пространстве, например, если модифицированный ITR в паре по существу симметричных mod-ITR имеет делецию плеча С-С', то когнатный mod-ITR имеет соответствующую делецию петли С-С', а также имеет сходную трехмерную структуру остальных петель А и В-В' одинаковой формы в геометрическом пространстве со своим когнатным mod-ITR.[0083] As used herein, the term “substantially symmetric modified ITRs” or “substantially symmetric mod-ITR pair” refers to a pair of modified ITRs in a single ccDNA genome or ccDNA vector that both have reverse complementary sequences throughout their entire length. For example, a modified ITR may be considered substantially symmetrical even if it has some nucleotide sequences that differ from the reverse complementary sequence, provided that these changes do not affect the properties and overall shape. As one non-limiting example, a sequence is provided that has at least 85%, 90%, 95%, 96%, 97%, 98%, or 99% sequence identity with the canonical sequence (measured by BLAST at default settings), and also has a symmetrical three-dimensional spatial organization with respect to its cognate modified ITR such that their three-dimensional structures have the same shape in geometric space. In other words, a pair of essentially symmetrical modified ITRs have loops A, C-C' and B-B' identically organized in three-dimensional space. In some embodiments, ITRs from a mod-ITR pair may have different reverse complementary nucleotide sequences, but still have the same symmetrical three-dimensional spatial organization, i.e. both ITRs contain mutations that result in the same overall three-dimensional shape. For example, one ITR (e.g., 5'-ITR) in a mod-ITR pair may be from one serotype, and the other ITR (e.g., 3'-ITR) may be from a different serotype, but both may have the same corresponding mutation (e.g., if a 5'-ITR has a deletion in region C, then a cognate modified 3'-ITR from another serotype has a deletion at the corresponding position in region C') such that the pair of modified ITRs has the same symmetrical three-dimensional spatial organization. In such embodiments, each ITR in a modified ITR pair may be from a different serotype (e.g., AAB1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, and 12), such as a combination of AAB2 and AAB6, whereby a modification in one ITR is mapped to a corresponding position in a cognate ITR from another serotype. In one embodiment, a pair of substantially symmetrical modified ITRs is referred to as a modified ITR (mod-ITR) pair, provided that the difference in nucleotide sequences between said ITRs does not affect properties or overall shape and they have substantially the same shape in three-dimensional space. By way of non-limiting example, a mod-ITR is provided that has at least 95%, 96%, 97%, 98%, or 99% sequence identity with the canonical mod-ITR, as determined using standard methods well known in the art, such as BLAST (Basic Local Alignment Search Tool) or BLASTN, at default settings, and also have a symmetrical three-dimensional spatial organization so that their three-dimensional structure has the same shape in geometric space. A pair of essentially symmetric mod-ITRs have identical loops A, C-C' and B-B' in three-dimensional space, for example, if a modified ITR in a pair of essentially symmetric mod-ITRs has a deletion of the C-C' arm, then the cognate mod- The ITR has a corresponding deletion of the C-C' loop and also has a similar three-dimensional structure of the remaining A and B-B' loops of the same shape in geometric space with its cognate mod-ITR.
[0084] Термин «фланкирование» относится к относительному положению одной последовательности нуклеиновой кислоты по отношению к другой последовательности нуклеиновой кислоты. Обычно в последовательности ABC А и С фланкируют В. То же самое верно для расположения АхВхС. Соответственно, фланкирующая последовательность предшествует фланкируемой последовательности или следует за ней, но не обязательно должна быть смежной с фланкируемой последовательностью или непосредственно прилегать к ней. Согласно одному варианту реализации термин «фланкирование» относится к концевым повторам на каждом конце линейного дуплексного зкДНК-вектора.[0084] The term “flanking” refers to the relative position of one nucleic acid sequence with respect to another nucleic acid sequence. Typically in an ABC sequence, A and C flank B. The same is true for the arrangement of AxBxC. Accordingly, the flanking sequence precedes or follows the flanking sequence, but need not be adjacent to or immediately adjacent to the flanking sequence. In one embodiment, the term “flanking” refers to the terminal repeats at each end of a linear duplex ccDNA vector.
[0085] В данном документе термины «лечить», «осуществлять лечение» и/или «лечение» включают подавление, по существу ингибирование, замедление или обращение прогрессирования состояния, по существу облегчение клинических симптомов состояния или по существу предотвращение появления клинических симптомов состояния, получение благоприятных или целевых клинических результатов. В соответствии с некоторыми вариантами реализации состояние представляет собой гемофилию А. Лечение также относится к достижению одного или более из следующих: (а) уменьшения степени тяжести нарушения; (b) ограничения развития симптомов, характерных для нарушения (ий), которое лечат; (с) ограничения ухудшения симптомов, характерных для нарушения (ий), которое лечат; (d) ограничения рецидивирования нарушения (ий) у пациентов, ранее имевших указанное нарушение (ия); и (е) ограничения рецидивирования симптомов у пациентов, ранее не имевших симптомов указанного нарушения (ий). Благоприятные или целевые клинические результаты, такие как фармакологические и/или физиологические эффекты, включают, но не ограничиваются перечисленными, предотвращение наступления заболевания, нарушения или состояния у субъекта, который может быть предрасположен к указанному заболеванию, нарушению или состоянию, но еще не испытывает симптомов или у него еще не проявляются симптомы указанного заболевания (профилактическое лечение), облегчение симптомов указанного заболевания, нарушения или состояния, уменьшение интенсивности заболевания, нарушения или состояния, стабилизацию (т.е., отсутствие ухудшения) указанного заболевания, нарушения или состояния, предотвращение распространения указанного заболевания, нарушения или состояния, задержку или замедление прогрессирования указанного заболевания, нарушения или состояния, облегчение или временное облегчение указанного заболевания, нарушения или состояния, и комбинации перечисленных, а также увеличение продолжительности выживания по сравнению с ожидаемым выживанием без лечения.[0085] As used herein, the terms “treat,” “treat,” and/or “treatment” include suppressing, substantially inhibiting, slowing, or reversing the progression of a condition, substantially alleviating clinical symptoms of a condition, or substantially preventing the onset of clinical symptoms of a condition, obtaining favorable or targeted clinical outcomes. In accordance with some embodiments, the condition is hemophilia A. Treatment also refers to achieving one or more of the following: (a) reducing the severity of the disorder; (b) limiting the development of symptoms characteristic of the disorder(s) being treated; (c) limiting the worsening of symptoms characteristic of the disorder(s) being treated; (d) limiting the recurrence of the disorder(s) in patients who previously had the disorder(s); and (f) limiting the recurrence of symptoms in patients who have not previously had symptoms of the specified disorder(s). Beneficial or targeted clinical outcomes, such as pharmacological and/or physiological effects, include, but are not limited to, preventing the onset of a disease, disorder or condition in a subject who may be predisposed to the disease, disorder or condition but is not yet experiencing symptoms or does not yet exhibit symptoms of the specified disease (preventative treatment), relief of symptoms of the specified disease, disorder or condition, reduction in the intensity of the disease, disorder or condition, stabilization (i.e., no worsening) of the specified disease, disorder or condition, prevention of the spread of the specified diseases, disorders or conditions, delaying or slowing the progression of said diseases, disorders or conditions, alleviating or temporarily alleviating said diseases, disorders or conditions, and combinations thereof, and increasing the duration of survival compared to expected survival without treatment.
[0086] В данном документе термин «увеличение», «усиление», «повышение» (и подобные термины) обычно относится к акту увеличения, прямо или опосредовано, концентрации, уровня, функции, активности или поведения относительно природного, ожидаемого или среднего, или относительно контрольного состояния.[0086] As used herein, the term “increase,” “enhancement,” “enhancement” (and similar terms) generally refers to the act of increasing, directly or indirectly, a concentration, level, function, activity, or behavior relative to the natural, expected, or average, or relative to the control condition.
[0087] В данном документе термин «минимизировать», «уменьшать», «снижать» и/или «ингибировать» (и подобные термины) обычно относится к акту уменьшения, прямо или опосредовано, концентрации, уровня, функции, активности, поведения относительно природного, ожидаемого, среднего, или относительно контрольного состояния.[0087] As used herein, the term “minimize,” “reduce,” “reduce,” and/or “inhibit” (and similar terms) generally refers to the act of reducing, directly or indirectly, the concentration, level, function, activity, behavior relative to natural , expected, average, or relative to the control condition.
[0088] В данном документе термин «зкДНК-геном» относится к экспрессионной кассете, которая дополнительно включает по меньшей мере одну область инвертированного концевого повтора. ЗкДНК-геном может дополнительно содержать одну или более спейсерных областей. Согласно некоторым вариантам реализации зкДНК-геном включен в виде межмолекулярного дуплексного полинуклеотида ДНК в плазмиду или вирусный геном.[0088] As used herein, the term “ccDNA genome” refers to an expression cassette that further includes at least one inverted terminal repeat region. The cDNA genome may further comprise one or more spacer regions. In some embodiments, the cccDNA genome is included as an intermolecular duplex DNA polynucleotide in a plasmid or viral genome.
[0089] В данном документе термин «спейсерная область зкДНК» относится к промежуточной последовательности, которая разделяет функциональные элементы в зкДНК-векторе или геноме зкДНК. Согласно некоторым вариантам реализации спейсерные области зкДНК удерживают два функциональных элемента на целевом расстоянии для оптимальной функциональности. Согласно некоторым вариантам реализации спейсерные области зкДНК обеспечивают или увеличивают генетическую стабильность зкДНК-генома, например, в плазмиде или бакуловирусе. Согласно некоторым вариантам реализации спейсерные области зкДНК облегчают подготовленные генетические манипуляции с зкДНК-геномом, обеспечивая удобное расположение для сайтов клонирования и т.п. Например, согласно определенным аспектам олигонуклеотидный «полилинкер», содержащий несколько сайтов рестрикционных эндонуклеаз, или последовательность не из открытой рамки считывания, сконструированная так, чтобы в ней отсутствовали известные сайты связывания белка (например, транскрипционного фактора), могут быть размещены в зкДНК-геноме для разделения цис-действующих факторов, например, с помощью 6-членной, 12-членной, 18-членной, 24-членной, 48-членной, 86-членной, 176-членной вставки и т.д. между сайтом концевого разрешения и расположенным в 5-направлении транскрипционным регуляторным элементом. Аналогичным образом, спейсер может быть встроен между последовательностью сигнала полиаденилирования и 3'-сайтом концевого разрешения.[0089] As used herein, the term “cccDNA spacer region” refers to an intervening sequence that separates functional elements in a cccDNA vector or ccDNA genome. In some embodiments, cccDNA spacer regions hold two functional elements at a target distance for optimal functionality. In some embodiments, the cDNA spacer regions provide or increase the genetic stability of the cDNA genome, for example, in a plasmid or baculovirus. In some embodiments, cccDNA spacer regions facilitate prepared genetic manipulation of the cccDNA genome by providing convenient locations for cloning sites and the like. For example, in certain aspects, an oligonucleotide "polylinker" containing multiple restriction endonuclease sites, or a non-open reading frame sequence designed to lack known protein (e.g., transcription factor) binding sites, can be placed in the cccDNA genome to separating cis-acting factors, for example, using a 6-member, 12-member, 18-member, 24-member, 48-member, 86-member, 176-member insertion, etc. between the end resolution site and the 5-direction transcriptional regulatory element. Likewise, a spacer can be inserted between the polyadenylation signal sequence and the 3' end resolution site.
[0090] В данном документе термины «сайт связывания Rep», «элемент связывания Rep», «RBE» и «RBS» используются взаимозаменяемо и относятся к сайту связывания белка Rep (например, Rep 78 ААВ или Rep 68 ААВ), который после связывания белком Rep позволяет белку Rep выполнять его сайт-специфичную эндонуклеазную активность в отношении последовательности, включающей RBS. Последовательность RBS и ее обратно комплементарная последовательность вместе образуют один RBS. Последовательности RBS известны в данной области техники и включают, например, 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), представляющую собой последовательность RBS, идентифицированную в ААВ2. В вариантах реализации настоящего изобретения можно применять любую известную последовательность RBS, включая другие известные последовательности RBS ААВ и другие известные природные или синтетические последовательности RBS. Не ограничиваясь какой-либо теорией, считается, что нуклеазный домен белка Rep связывается с дуплексной нуклеотидной последовательностью GCTC и, соответственно, происходит прямое связывание и стабильная сборка двух известных белков Rep ААВ на дуплексном олигонуклеотиде 5'-(GCGC)(GCTC)(GCTC)(GCTC)-3' (SEQ ID NO: 60). Кроме того, растворимые агрегированные конформеры (т.е. неопределенное число взаимосвязанных белков Rep) диссоциируют и связываются с олигонуклеотидами, которые содержат сайты связывания Rep. Каждый белок Rep взаимодействует как с азотистыми основаниями, так и с фосфодиэфирным остовом на каждой цепи. Взаимодействия с азотистыми основаниями обеспечивают специфичность в отношении последовательности, в то время как взаимодействия с фосфодиэфирным остовом неспецифичны или менее специфичны в отношении последовательности и стабилизируют комплекс белка с ДНК.[0090] As used herein, the terms “Rep binding site,” “Rep binding element,” “RBE,” and “RBS” are used interchangeably and refer to the binding site of a Rep protein (e.g., Rep 78 AAB or Rep 68 AAB) that, upon binding by the Rep protein allows the Rep protein to perform its site-specific endonuclease activity on a sequence including the RBS. The RBS sequence and its reverse complementary sequence together form one RBS. RBS sequences are known in the art and include, for example, 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), which is the RBS sequence identified in AAB2. In embodiments of the present invention, any known RBS sequence can be used, including other known AAB RBS sequences and other known natural or synthetic RBS sequences. Without being limited to any theory, it is believed that the nuclease domain of the Rep protein binds to the duplex nucleotide sequence GCTC and, accordingly, direct binding and stable assembly of two known Rep proteins of AAB on the duplex oligonucleotide 5'-(GCGC)(GCTC)(GCTC) occurs. (GCTC)-3' (SEQ ID NO: 60). In addition, soluble aggregated conformers (i.e., an indefinite number of interconnected Rep proteins) dissociate and bind to oligonucleotides that contain Rep binding sites. Each Rep protein interacts with both nitrogenous bases and the phosphodiester backbone on each chain. Interactions with nitrogenous bases provide sequence specificity, while interactions with the phosphodiester backbone are nonspecific or less sequence specific and stabilize the protein-DNA complex.
[0091] В данном документе термины «сайт концевого разрешения» и «TRS» используются в данном документе взаимозаменяемо и относятся к области, в которой Rep образует тирозин-фосфодиэфирную связь с 5'-тимидином с образованием 3'-ОН, который служит субстратом для удлинения ДНК с помощью клеточной ДНК-полимеразы, например, ДНК-полимеразы дельта или ДНК-полимеразы эпсилон. В качестве альтернативы, комплекс Rep-тимидин может принимать участие в скоординированной реакции лигирования. Согласно некоторым вариантам реализации TRS включает, как минимум, неспаренный тимидин. Согласно некоторым вариантам реализации никирующую эффективность TRS по меньшей мере отчасти можно контролировать за счет расстояния между ним и RBS в пределах одной молекулы. Если акцепторный субстрат представляет собой комплементарный ITR, тогда полученный продукт представляет собой внутримолекулярный дуплекс. Последовательности TRS известны в данной области техники и включают, например, 5'-GGTTGA-3' (SEQ ID NO: 61), представляющую собой гексануклеотидную последовательность, идентифицированную в ААВ2. В вариантах реализации настоящего изобретения можно применять любую известную последовательность TRS, включая другие известные последовательности TRS ААВ и другие известные природные или синтетические последовательности TRS, такие как AGTT (SEQ ID NO: 62), GGTTGG (SEQ ID NO: 63), AGTTGG (SEQ ID NO: 64), AGTTGA (SEQ ID NO: 65), и другие мотивы, такие как RRTTRR (SEQ ID NO: 66).[0091] As used herein, the terms "terminal resolution site" and "TRS" are used interchangeably herein and refer to the region in which Rep forms a tyrosine phosphodiester bond with a 5'-thymidine to form a 3'-OH, which serves as a substrate for DNA elongation using a cellular DNA polymerase, for example DNA polymerase delta or DNA polymerase epsilon. Alternatively, the Rep-thymidine complex may participate in a coordinated ligation reaction. In some embodiments, the TRS includes at least an unpaired thymidine. In some embodiments, the nicking efficiency of the TRS can be controlled at least in part by the distance between it and the RBS within a single molecule. If the acceptor substrate is a complementary ITR, then the resulting product is an intramolecular duplex. TRS sequences are known in the art and include, for example, 5'-GGTTGA-3' (SEQ ID NO: 61), which is a hexanucleotide sequence identified in AAB2. In embodiments of the present invention, any known TRS sequence can be used, including other known AAB TRS sequences and other known natural or synthetic TRS sequences, such as AGTT (SEQ ID NO: 62), GGTTGG (SEQ ID NO: 63), AGTTGG (SEQ ID NO: 64), AGTTGA (SEQ ID NO: 65), and other motifs such as RRTTRR (SEQ ID NO: 66).
[0092] В данном документе термин «зкДНК-плазмида» относится к плазмиде, которая содержит зкДНК-геном в виде межмолекулярного дуплекса.[0092] As used herein, the term “ccDNA plasmid” refers to a plasmid that contains the cccDNA genome as an intermolecular duplex.
[0093] В данном документе термин «зкДНК-бакмида» относится к геному инфекционного бакуловируса, содержащему зкДНК-геном в виде межмолекулярного дуплекса, который способен размножаться в Е. coli в виде плазмиды и, соответственно, может выполнять роль челночного вектора для бакуловируса.[0093] As used herein, the term “ccDNA bacmid” refers to an infectious baculovirus genome containing the cccDNA genome as an intermolecular duplex that is capable of propagation in E. coli as a plasmid and, accordingly, can serve as a shuttle vector for the baculovirus.
[0094] В данном документе термин «зкДНК-бакуловирус» относится к бакуловирусу, который содержит зкДНК-геном в виде межмолекулярного дуплекса в геноме бакуловируса.[0094] As used herein, the term “ccDNA baculovirus” refers to a baculovirus that contains the cccDNA genome as an intermolecular duplex within the baculovirus genome.
[0095] В данном документе термины «инфицированная зкДНК-бакуловирусом клетка насекомого» и «зкДНК-ВПС» используются взаимозаменяемо и относятся к клетке беспозвоночного животного-хозяина (включая, но не ограничиваясь этим, клетку насекомого (например, клетку Sf9)), инфицированной зкДНК-бакуловирусом.[0095] As used herein, the terms “ccDNA-baculovirus-infected insect cell” and “ccDNA-IPV” are used interchangeably and refer to an invertebrate host cell (including, but not limited to, an insect cell (e.g., an Sf9 cell)) infected cDNA baculovirus.
[0096] В данном документе термин «зкДНК» относится к бескапсидной линейной двухцепочечной (дц) дуплексной ДНК с замкнутыми концами для невирусного переноса генов, синтетической или другой. Подробное описание зкДНК приведено в международной заявке PCT/US 2017/020828, поданной 3 марта 2017 г., содержание которой полностью явным образом включено в данный документ посредством ссылки. Некоторые способы получения зкДНК, содержащей различные последовательности и конфигурации инвертированных концевых повторов (ITR), с использованием клеточных методов описаны в Примере 1 международной заявки PCT/US 18/49996, поданной 7 сентября 2018 г., и PCT/US 2018/064242, поданной 6 декабря 2018 г., каждая из которых полностью включена в данный документ посредством ссылки. Некоторые способы получения синтетических зкДНК-векторов, содержащих различные последовательности и конфигурации ITR, описаны, например, в международной заявке PCT/US 2019/14122, поданной 18 января 2019 г., содержание которой полностью включено в данный документ посредством ссылки.[0096] As used herein, the term “ccDNA” refers to capsid-free linear double-stranded (ds) duplex DNA with closed ends for non-viral gene transfer, synthetic or otherwise. A detailed description of cccDNA is provided in International Application PCT/US 2017/020828, filed March 3, 2017, the contents of which are expressly incorporated herein by reference in their entirety. Some methods for producing cccDNA containing various sequences and inverted terminal repeat (ITR) configurations using cellular methods are described in Example 1 of international application PCT/US 18/49996, filed September 7, 2018, and PCT/US 2018/064242, filed December 6, 2018, each of which is incorporated herein by reference in its entirety. Some methods for producing synthetic cccDNA vectors containing various ITR sequences and configurations are described, for example, in international application PCT/US 2019/14122, filed January 18, 2019, the contents of which are incorporated herein by reference in their entirety.
[0097] В данном документе термин «ДНК-вектор с замкнутыми концами» относится к бескапсидному ДНК-вектору по меньшей мере с одним ковалентно замкнутым концом, причем по меньшей мере часть вектора имеет структуру внутримолекулярного дуплекса.[0097] As used herein, the term “closed-end DNA vector” refers to a capsid-free DNA vector with at least one covalently closed end, wherein at least a portion of the vector has an intramolecular duplex structure.
[0098] В данном документе термины «зкДНК-вектор» и «зкДНК» используются взаимозаменяемо и относятся к ДНК-вектору с замкнутыми концами, содержащему по меньшей мере один концевой палиндром. Согласно некоторым вариантам реализации зкДНК содержит два ковалентно замкнутых конца.[0098] As used herein, the terms “ccDNA vector” and “ccDNA” are used interchangeably and refer to a closed-ended DNA vector containing at least one terminal palindrome. In some embodiments, the cccDNA contains two covalently closed ends.
[0099] В данном документе термин «нзДНК» или «никированная зкДНК» относится к ДНК с замкнутыми концами, содержащей одноцепочечный разрыв или пропуск размером 1-100 пар оснований в области «стебля» или спейсерной области, расположенной в 5'-направлении относительно открытой рамки считывания (например, промотора и трансгена, подлежащего экспрессии).[0099] As used herein, the term "nzDNA" or "nicked cccDNA" refers to DNA with closed ends containing a single-strand break or gap of 1-100 base pairs in the "stem" or spacer region located in the 5' direction relative to the open reading frame (eg, promoter and transgene to be expressed).
[00100] В данном документе термины «пропуск» и «одноцепочечный разрыв» используются взаимозаменяемо и относятся к прерванной части синтетического ДНК-вектора согласно настоящему изобретению, создавая участок части одноцепочечной ДНК в двухцепочечной в других местах зкДНК. Пропуск может иметь от 1 пары оснований до 100 пар оснований в длину в одной цепи дуплексной ДНК. Типичные пропуски, разработанные и созданные с применением способов, описанных в данном документе, и синтетические векторы, полученные с применением указанных способов, могут иметь, например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 или 60 пар оснований в длину. Примерные пропуски в настоящем раскрытии могут иметь от 1 пары оснований до 10 пар оснований в длину, от 1 до 20 пар оснований в длину, от 1 до 30 пар оснований в длину.[00100] As used herein, the terms “gap” and “single-strand break” are used interchangeably and refer to the interrupted portion of the synthetic DNA vector of the present invention, creating a portion of a single-stranded DNA portion of an otherwise double-stranded ccDNA. The gap can range from 1 base pair to 100 base pairs in length on a single strand of duplex DNA. Typical gaps designed and created using the methods described herein, and synthetic vectors obtained using these methods, may have, for example, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 or 60 pairs bases in length. Exemplary gaps in the present disclosure may be from 1 base pair to 10 base pairs in length, from 1 to 20 base pairs in length, from 1 to 30 base pairs in length.
[00101] Как определено в данном документе «репортеры» относятся к белкам, которые можно применять для обеспечения детектируемых показателей. Репортеры обычно генерируют измеряемый сигнал, такой как флуоресценция, цвет или люминесценция. Последовательности, кодирующие репортерные белки, кодируют белки, присутствие которых в клетке или в организме легко наблюдать. Например, флуоресцентные белки заставляют клетку флуоресцировать при возбуждении светом с конкретной длиной волны, люциферазы заставляют клетку катализировать реакцию, которая генерирует свет, а ферменты, такие как β-галактозидаза, преобразуют субстрат в окрашенный продукт. Примерные репортерные полипептиды, которые можно применять для экспериментальных или диагностических целей, включают, но не ограничиваются перечисленными, β-лактамазу, β-галактозидазу (LacZ), щелочную фосфатазу (АР), тимидинкиназу (TK), зеленый флуоресцентный белок (GFP) и другие флуоресцентные белки, хлорамфениколацетилтрансферазу (CAT), люциферазу и другие, хорошо известные в данной области техники.[00101] As defined herein, “reporters” refer to proteins that can be used to provide detectable indicators. Reporters typically generate a measurable signal such as fluorescence, color, or luminescence. Sequences encoding reporter proteins encode proteins whose presence in a cell or organism can be easily observed. For example, fluorescent proteins cause a cell to fluoresce when excited by light of a specific wavelength, luciferases cause a cell to catalyze a reaction that generates light, and enzymes such as β-galactosidase convert a substrate into a colored product. Exemplary reporter polypeptides that may be used for experimental or diagnostic purposes include, but are not limited to, β-lactamase, β-galactosidase (LacZ), alkaline phosphatase (AP), thymidine kinase (TK), green fluorescent protein (GFP), and others fluorescent proteins, chloramphenicol acetyltransferase (CAT), luciferase and others well known in the art.
[00102] В данном документе термины «смысловой» и «антисмысловой» относятся к ориентации структурного элемента на полинуклеотиде. Смысловой и антисмысловой варианты элемента обратно комплементарны друг другу.[00102] As used herein, the terms “sense” and “antisense” refer to the orientation of a structural element on a polynucleotide. The sense and antisense variants of the element are inversely complementary to each other.
[00103] В данном документе термин «синтетический ААВ-вектор» и «получение ААВ-вектора синтетическим путем» относится к ААВ-вектору и синтетическим способам его получения в полностью бесклеточной среде.[00103] As used herein, the term “synthetic AAV vector” and “synthetic production of AAV vector” refers to the AAV vector and synthetic methods for its production in a completely cell-free environment.
[00104] В данном документе «репортеры» относятся к белкам, которые можно применять для обеспечения детектируемых показателей. Репортеры обычно генерируют измеряемый сигнал, такой как флуоресценция, цвет или люминесценция. Последовательности, кодирующие репортерные белки, кодируют белки, присутствие которых в клетке или в организме легко наблюдать. Например, флуоресцентные белки заставляют клетку флуоресцировать при возбуждении светом с конкретной длиной волны, люциферазы заставляют клетку катализировать реакцию, которая генерирует свет, а ферменты, такие как β-галактозидаза, преобразуют субстрат в окрашенный продукт. Примерные репортерные полипептиды, которые можно применять для экспериментальных или диагностических целей, включают, но не ограничиваются перечисленными, β-лактамазу, β-галактозидазу (LacZ), щелочную фосфатазу (АР), тимидинкиназу (TK), зеленый флуоресцентный белок (GFP) и другие флуоресцентные белки, хлорамфениколацетилтрансферазу (CAT), люциферазу и другие, хорошо известные в данной области техники.[00104] As used herein, “reporters” refer to proteins that can be used to provide detectable performance. Reporters typically generate a measurable signal such as fluorescence, color, or luminescence. Sequences encoding reporter proteins encode proteins whose presence in a cell or organism can be easily observed. For example, fluorescent proteins cause a cell to fluoresce when excited by light of a specific wavelength, luciferases cause a cell to catalyze a reaction that generates light, and enzymes such as β-galactosidase convert a substrate into a colored product. Exemplary reporter polypeptides that may be used for experimental or diagnostic purposes include, but are not limited to, β-lactamase, β-galactosidase (LacZ), alkaline phosphatase (AP), thymidine kinase (TK), green fluorescent protein (GFP), and others fluorescent proteins, chloramphenicol acetyltransferase (CAT), luciferase and others well known in the art.
[00105] В данном документе термин «эффекторный белок» относится к полипептиду, который обеспечивает детектируемый показатель, либо, например, как репортерный полипептид, либо, более предпочтительно, как полипептид, уничтожающий клетку, например, токсин, или агент, придающий клетке чувствительность к уничтожению выбранным агентом или при его отсутствии. Эффекторные белки включают любой белок или пептид, который непосредственно нацелен на ДНК и/или РНК клетки-хозяина или повреждает их. Например, эффекторные белки могут включать, но не ограничиваются перечисленными, рестрикционную эндонуклеазу, которая нацелена на последовательность ДНК клетки-хозяина (будь то геномный или внехромосомный элемент), протеазу, которая расщепляет полипептид-мишень, необходимый для выживания клетки, ингибитор ДНК-гиразы и токсин рибонуклеазного типа. Согласно некоторым вариантам реализации экспрессия эффекторного белка, контролируемая синтетическим биологическим контуром, описанным в данном документе, может принимать участие в качестве фактора в другом синтетическом биологическом контуре, что расширяет диапазон и сложность восприимчивости системы биологического контура.[00105] As used herein, the term "effector protein" refers to a polypeptide that provides a detectable indicator, either, for example, as a reporter polypeptide, or, more preferably, as a cell killing polypeptide, such as a toxin, or an agent that sensitizes the cell to destruction by the selected agent or in its absence. Effector proteins include any protein or peptide that directly targets or damages the DNA and/or RNA of a host cell. For example, effector proteins may include, but are not limited to, a restriction endonuclease that targets a host cell DNA sequence (whether genomic or extrachromosomal element), a protease that cleaves a target polypeptide essential for cell survival, a DNA gyrase inhibitor, and ribonuclease type toxin. In some embodiments, effector protein expression controlled by a synthetic biological circuit described herein can participate as a factor in another synthetic biological circuit, thereby expanding the range and complexity of the responsiveness of the biological circuit system.
[00106] Транскрипционные регуляторы относятся к транскрипционным активаторам и репрессорам, которые либо активируют, либо репрессируют транскрипцию представляющего интерес гена, такого как FVIII. Промоторы представляют собой области нуклеиновой кислоты, которые инициируют транскрипцию конкретного гена. Транскрипционные активаторы, как правило, связываются поблизости от транскрипционных промоторов и привлекают РНК-полимеразу для непосредственной инициации транскрипции. Репрессоры связываются с транскрипционными промоторами и стерически затрудняют инициацию транскрипции РНК-полимеразой. Другие транскрипционные регуляторы могут служить либо активаторами, либо репрессорами в зависимости от места их связывания и условий в клетке и в окружающей среде. Неограничивающие примеры классов транскрипционных регуляторов включают, но не ограничиваются перечисленными, белки гомеодомена, белки с цинковыми пальцами, белки с мотивом «крылатая спираль» (белки Forkhead) и белки с лейциновой молнией.[00106] Transcriptional regulators refer to transcriptional activators and repressors that either activate or repress the transcription of a gene of interest, such as FVIII. Promoters are regions of nucleic acid that initiate transcription of a particular gene. Transcription activators typically bind in the vicinity of transcriptional promoters and recruit RNA polymerase to directly initiate transcription. Repressors bind to transcriptional promoters and sterically hinder the initiation of transcription by RNA polymerase. Other transcriptional regulators can serve as either activators or repressors depending on their site of binding and cellular and environmental conditions. Non-limiting examples of classes of transcriptional regulators include, but are not limited to, homeodomain proteins, zinc finger proteins, Forkhead proteins, and leucine zipper proteins.
[00107] В данном документе «репрессорный белок» или «индукторный белок» представляет собой белок, который связывается с элементом регуляторной последовательности и репрессирует или активирует, соответственно, транскрипцию последовательностей, функционально связанных с указанным элементом регуляторной последовательности. Предпочтительные репрессорные и индукторные белки, описанные в данном документе, чувствительны к присутствию или отсутствию по меньшей мере одного вносимого агента или фактора внешней среды. Предпочтительные белки, описанные в данном документе, являются модульными по форме и содержат, например, отделяемые ДНК-связывающие и связывающие вводимые агенты, или реагирующие на них, элементы или домены.[00107] As used herein, a “repressor protein” or “inducer protein” is a protein that binds to a regulatory sequence element and represses or activates, respectively, the transcription of sequences operably associated with said regulatory sequence element. Preferred repressor and inducer proteins described herein are sensitive to the presence or absence of at least one introduced agent or environmental factor. Preferred proteins described herein are modular in form and contain, for example, separable DNA binding and input binding agents or responsive elements or domains.
[00108] В данном документе термин «носитель» включает любые и все возможные растворители, дисперсионные среды, основы, покрытия, разбавители, антибактериальные и противогрибковые агенты, изотонические и замедляющие абсорбцию агенты, буферы, растворы-носители, суспензии, коллоиды и т.п. Применение таких сред и агентов для фармацевтически активных веществ хорошо известно в данной области техники. В композиции также могут быть включены вспомогательные активные ингредиенты. Выражение «фармацевтически приемлемый» относится к молекулярным частицам и композициям, которые не приводят к токсической, аллергической или схожей нежелательной реакции при введении хозяину.[00108] As used herein, the term “carrier” includes any and all possible solvents, dispersion media, bases, coatings, diluents, antibacterial and antifungal agents, isotonic and absorption retarding agents, buffers, carrier solutions, suspensions, colloids, and the like . The use of such media and agents for pharmaceutically active substances is well known in the art. Additional active ingredients may also be included in the compositions. The expression "pharmaceutically acceptable" refers to molecular particles and compositions that do not cause a toxic, allergic or similar adverse reaction when administered to a host.
[00109] В данном документе термин «домен, реагирующий на вводимый агент» представляет собой домен транскрипционного фактора, который связывает или иначе отвечает на условие или вводимый агент таким способом, который придает восприимчивость присоединенного к нему ДНК-связывающего слитого домена к наличию указанного условия или вводимого агента. Согласно одному варианту реализации наличие указанного условия или вводимого агента приводит к конформационному изменению в отвечающем на вводимый агент домене, или в белке, с которым он слит, которое модифицирует модулирующую транскрипцию активность транскрипционного фактора.[00109] As used herein, the term “administrative agent-responsive domain” is a transcription factor domain that binds or otherwise responds to a condition or administered agent in a manner that renders the DNA-binding fusion domain attached thereto responsive to the presence of the condition or administered agent. In one embodiment, the presence of the condition or administration agent results in a conformational change in the input response domain, or in the protein to which it is fused, that modifies the transcription modulating activity of the transcription factor.
[00110] Термин «in vivo» относится к анализам или способам, которые реализуют на организме или в организме, таком как многоклеточное животное. Согласно некоторым аспектам, описанным в данном документе, считается, что способ или применение реализуют «in vivo», если используется одноклеточный организм, такой как бактерия. Термин «ех vivo» относится к способам и вариантам применения, которые выполняют с использованием живой клетки с интактной мембраной, находящейся вне организма многоклеточного животного или растения, например, эксплантатов, культивируемых клеток, включая первичные клетки и линии клеток, трансформированных линий клеток, а также экстрагированных тканей или клеток, включая клетки крови, помимо прочего. Термин «in vitro» относится к анализам и способам, которые не требуют присутствия клетки с интактной мембраной, например, клеточных экстрактов, и могут относиться к введению программируемого синтетического биологического контура в бесклеточной системе, такой как среда, не содержащая клеток или клеточных систем, таких как клеточные экстракты.[00110] The term "in vivo" refers to assays or methods that are performed on or in an organism, such as a multicellular animal. In some aspects described herein, the method or use is considered to be performed "in vivo" if a single cell organism, such as a bacterium, is used. The term "ex vivo" refers to methods and applications that are performed using a living cell with an intact membrane located outside the body of a multicellular animal or plant, for example, explants, cultured cells, including primary cells and cell lines, transformed cell lines, and extracted tissues or cells, including but not limited to blood cells. The term "in vitro" refers to assays and methods that do not require the presence of a cell with an intact membrane, such as cell extracts, and may refer to the introduction of a programmable synthetic biological circuit in a cell-free system, such as an environment containing no cells or cellular systems such as cell extracts.
[00111] В данном документе термин «промотор» относится к любой последовательности нуклеиновой кислоты, которая регулирует экспрессию другой последовательности нуклеиновой кислоты за счет управления транскрипцией указанной последовательности нуклеиновой кислоты, которая может представлять собой гетерологичный целевой ген, кодирующий белок или РНК. Промоторы могут быть конститутивными, индуцируемыми, репрессируемыми, тканеспецифическими или могут представлять собой любую комбинацию перечисленных. Промотор представляет собой контрольную область последовательности нуклеиновой кислоты, в которой осуществляется контроль инициации и скорости транскрипции остальной части последовательности нуклеиновой кислоты. Промотор также может содержать генетические элементы, с которыми могут связываться регуляторные белки и молекулы, такие как РНК-полимераза и другие транскрипционные факторы. Согласно некоторым вариантам реализации аспектов, описанных в данном документе, промотор может управлять экспрессией транскрипционного фактора, который регулирует экспрессию самого промотора. В последовательности промотора может быть расположен сайт инициации транскрипции, а также связывающие белки домены, отвечающие за связывание РНК-полимеразы. Эукариотические промоторы часто, однако не всегда, будут содержать «ТАТА»-боксы и «САТ»-боксы. Различные промоторы, включая индуцируемые промоторы, могут применяться для управления экспрессией трансгенов в зкДНК-векторах, раскрытых в данном документе. Последовательность промотора может быть ограничена на ее 3'-конце сайтом инициации транскрипции и простирается в восходящем направлении (в 5'-направлении), включая минимальное количество оснований или элементов, необходимых для инициации транскрипции на уровнях, детектируемых выше фона.[00111] As used herein, the term “promoter” refers to any nucleic acid sequence that regulates the expression of another nucleic acid sequence by driving the transcription of said nucleic acid sequence, which may be a heterologous target gene encoding a protein or RNA. Promoters may be constitutive, inducible, repressible, tissue specific, or any combination of these. A promoter is a control region of a nucleic acid sequence that controls the initiation and rate of transcription of the rest of the nucleic acid sequence. A promoter may also contain genetic elements to which regulatory proteins and molecules, such as RNA polymerase and other transcription factors, can bind. In some embodiments of the aspects described herein, a promoter may drive the expression of a transcription factor that regulates the expression of the promoter itself. The promoter sequence may contain a transcription initiation site, as well as protein-binding domains responsible for binding RNA polymerase. Eukaryotic promoters will often, but not always, contain "TATA" boxes and "CAT" boxes. Various promoters, including inducible promoters, can be used to drive the expression of transgenes in the cDNA vectors disclosed herein. The promoter sequence may be limited at its 3' end by the transcription initiation site and extends upstream (in the 5' direction), including the minimum number of bases or elements necessary to initiate transcription at levels detected above background.
[00112] В данном документе термин «энхансер» относится к цис-действующей регуляторной последовательности (например, 50-1500 пар оснований), которая связывает один или более белков (например, белки-активаторы или транскрипционный фактор) для повышения транскрипционной активации последовательности нуклеиновой кислоты. Энхансеры могут быть расположены на расстоянии до 1000000 пар оснований выше сайта начала гена или ниже сайта начала гена, который они регулируют. Энхансер может быть расположен в пределах интронной области или в экзонной области неродственного гена.[00112] As used herein, the term “enhancer” refers to a cis-acting regulatory sequence (e.g., 50-1500 base pairs) that binds one or more proteins (e.g., activator proteins or transcription factor) to enhance transcriptional activation of a nucleic acid sequence . Enhancers can be located up to 1,000,000 base pairs upstream of the start site of the gene or downstream of the start site of the gene they regulate. The enhancer may be located within an intronic region or within an exonic region of an unrelated gene.
[00113] Можно сказать, что промотор управляет экспрессией или управляет транскрипцией последовательности нуклеиновой кислоты, которую он регулирует.Выражения «функционально связанный», «функционально расположенный», «с функциональной связью», «под контролем» и «под транскрипционным контролем» указывают, что промотор находится в корректном функциональном положении и/или ориентации относительно последовательности нуклеиновой кислоты, которую он регулирует, для контроля инициации транскрипции и/или экспрессии указанной последовательности. В данном документе «инвертированный промотор» относится к промотору, в котором последовательность нуклеиновой кислоты располагается в обратной ориентации так, что цепь, которая была смысловой, становится некодирующей цепью, и наоборот. Последовательности инвертированных промоторов могут применяться в различных вариантах реализации для регуляции состояния переключателя. Кроме того, согласно различным вариантам реализации промотор может применяться в сочетании с энхансером.[00113] A promoter can be said to drive the expression or direct transcription of the nucleic acid sequence that it regulates. The expressions "operably linked", "operably located", "operably linked", "under control" and "under transcriptional control" indicate that the promoter is in the correct functional position and/or orientation relative to the nucleic acid sequence it regulates to control the initiation of transcription and/or expression of said sequence. As used herein, “inverted promoter” refers to a promoter in which the nucleic acid sequence is arranged in reverse orientation such that a strand that was a sense strand becomes a non-coding strand and vice versa. Inverted promoter sequences can be used in various embodiments to regulate the state of the switch. Additionally, in various embodiments, a promoter may be used in combination with an enhancer.
[00114] Промотор может представлять собой промотор, который в естественных условиях ассоциирован с геном или последовательностью, а также может быть получен путем выделения некодирующих 5'-последовательностей, расположенных в 5'-направлении относительно кодирующего сегмента и/или экзона определенного гена или последовательности. Такой промотор может быть назван «эндогенным». Аналогичным образом, согласно некоторым вариантам реализации, энхансер может быть представлен энхансером, который в естественных условиях ассоциирован с последовательностью нуклеиновой кислоты и расположен либо в 3', либо в 5'-направлении от указанной последовательности.[00114] A promoter can be a promoter that is naturally associated with a gene or sequence, and can also be obtained by isolating 5' non-coding sequences located in the 5' direction relative to the coding segment and/or exon of a particular gene or sequence. Such a promoter may be called "endogenous". Likewise, in some embodiments, the enhancer may be an enhancer that is naturally associated with a nucleic acid sequence and is located either 3' or 5' of the sequence.
[00115] Согласно некоторым вариантам реализации кодирующий сегмент нуклеиновой кислоты расположен под контролем «рекомбинантного промотора» или «гетерологичного промотора», оба указанных термина относятся к промотору, который обычно не ассоциирован с кодируемой последовательностью нуклеиновой кислоты, с которой промотор функционально связан, в ее естественной среде. Рекомбинантный или гетерологичный энхансер относится к энхансеру, обычно не ассоциированному с конкретной последовательностью нуклеиновой кислоты в ее естественной среде. Такие промоторы или энхансеры могут включать промоторы или энхансеры других генов; промоторы или энхансеры, выделенные из любой другой прокариотической, вирусной или эукариотической клетки; и синтетические промоторы или энхансеры, которые не являются «природными», т.е. содержат различные элементы разных транскрипционных регуляторных областей и/или изменяющие экспрессию мутации, введенные с применением способов генетического конструирования, известных в данной области техники. Наряду с получением последовательностей нуклеиновых кислот промоторов и энхансеров синтетическим путем, последовательности промоторов могут быть получены с использованием рекомбинантного клонирования и/или технологии амплификации нуклеиновых кислот, включая ПЦР, применительно к синтетическим биологическим контурам и модулям, раскрытым в данном документе (см., например, патент США №4683202, патент США №5928906, каждый из которых включен в данный документ посредством ссылки). Кроме того, также предусмотрена возможность применения контрольных последовательностей, которые управляют транскрипцией и/или экспрессией последовательностей в неядерных органеллах, таких как митохондрии, хлоропласты и т.п.[00115] In some embodiments, the encoding nucleic acid segment is located under the control of a “recombinant promoter” or a “heterologous promoter,” both of which terms refer to a promoter that is not typically associated with the encoded nucleic acid sequence to which the promoter is operably linked in its natural environment. A recombinant or heterologous enhancer refers to an enhancer not normally associated with a particular nucleic acid sequence in its natural environment. Such promoters or enhancers may include promoters or enhancers of other genes; promoters or enhancers isolated from any other prokaryotic, viral or eukaryotic cell; and synthetic promoters or enhancers that are not “natural”, e.g. contain various elements of different transcriptional regulatory regions and/or expression-altering mutations introduced using genetic engineering methods known in the art. In addition to obtaining promoter and enhancer nucleic acid sequences synthetically, promoter sequences can be obtained using recombinant cloning and/or nucleic acid amplification technology, including PCR, in relation to the synthetic biological circuits and modules disclosed herein (see, for example, US Patent No. 4,683,202, US Pat. No. 5,928,906, each of which is incorporated herein by reference). In addition, it is also possible to use control sequences that direct transcription and/or expression of sequences in non-nuclear organelles such as mitochondria, chloroplasts, and the like.
[00116] Как описано в данном документе, «индуцируемый промотор» представляет собой промотор, который характеризуется инициацией или усилением транскрипционной активности в присутствии, под влиянием или при контакте с индуктором или индуцирующим агентом. «Индуктор» или «индуцирующий агент», как определено в данном документе, может быть эндогенным или обычно является экзогенным соединением или белком, которые вводят таким образом, чтобы обеспечить их активность по индукции транскрипционной активности индуцируемого промотора. Согласно некоторым вариантам реализации индуктор или индуцирующий агент, т.е. химическое вещество, соединение или белок, сам может быть получен в результате транскрипции или экспрессии последовательности нуклеиновой кислоты (т.е. индуктор может представлять собой индукторный белок, экспрессируемый другим компонентом или модулем), который сам может находиться под контролем индуцируемого промотора. Согласно некоторым вариантам реализации индуцируемый промотор индуцируется в отсутствие определенных агентов, таких как репрессор. Примеры индуцируемых промоторов включают, но не ограничиваются перечисленными, чувствительные к тетрациклину, металлотионину, экдизону промоторы, промоторы вирусов млекопитающих (например, поздний промотор аденовируса; и промотор длинного концевого повтора вируса опухоли молочной железы мышей (MMTV-LTR)) и другие чувствительные к стероидам промоторы, чувствительные к рапамицину промоторы и т.п.[00116] As described herein, an “inducible promoter” is a promoter that is characterized by initiation or enhancement of transcriptional activity in the presence of, under the influence of, or upon contact with an inducer or inducing agent. An "inducer" or "inducing agent" as defined herein can be endogenous or typically is an exogenous compound or protein that is administered so as to have the activity of inducing the transcriptional activity of an inducible promoter. In some embodiments, the inducer or inducing agent, i.e. chemical, compound or protein may itself be produced by transcription or expression of a nucleic acid sequence (ie, the inducer may be an inducer protein expressed by another component or module), which may itself be under the control of an inducible promoter. In some embodiments, the inducible promoter is induced in the absence of certain agents, such as a repressor. Examples of inducible promoters include, but are not limited to, tetracycline-sensitive, metallothioneine, ecdysone-sensitive promoters, mammalian viral promoters (eg, adenovirus late promoter; and murine mammary tumor virus long terminal repeat (MMTV-LTR) promoter), and other steroid-responsive promoters. promoters, rapamycin-sensitive promoters, etc.
[00117] Термины «регуляторные последовательности ДНК», «контрольные элементы» и «регуляторные элементы», используемые в данном документе взаимозаменяемо, относятся к транскрипционным и трансляционным контрольным последовательностям, таким как промоторы, энхансеры, сигналы полиаденилирования, терминаторы, сигналы разрушения белка и т.п., которые обеспечивают и/или регулируют транскрипцию некодирующей последовательности (например, нацеливающей на ДНК РНК) или кодирующей последовательности (например, сайт-направленного модифицирующего полипептида или полипептида Cas9/Csn1) и/или регулируют трансляцию кодируемого полипептида.[00117] The terms "DNA regulatory sequences", "control elements" and "regulatory elements", used interchangeably herein, refer to transcriptional and translational control sequences such as promoters, enhancers, polyadenylation signals, terminators, protein degradation signals, etc. .p. that mediate and/or regulate transcription of a non-coding sequence (eg, DNA-targeting RNA) or coding sequence (eg, site-directed modifying polypeptide or Cas9/Csn1 polypeptide) and/or regulate translation of the encoded polypeptide.
[00118] «Функционально связанный» относится к размещению в непосредственной близости, при котором описываемые так компоненты находятся во взаимосвязи, позволяющей им функционировать предусмотренным для них образом. Например, промотор функционально связан с кодирующей последовательностью, если указанный промотор влияет на ее транскрипцию или экспрессию. «Экспрессионная кассета» включает гетер о логичную последовательность ДНК, которая функционально связана с промотором или другой регуляторной последовательностью, достаточными для управления транскрипцией трансгена в зкДНК-векторе. Подходящие промоторы включают, например, тканеспецифические промоторы. Промоторы также могут происходить из ААВ.[00118] "Operably coupled" refers to placement in close proximity such that the components so described are in a relationship that allows them to function in the manner intended for them. For example, a promoter is operably linked to a coding sequence if said promoter affects its transcription or expression. An "expression cassette" includes a heterogeneous DNA sequence that is operably linked to a promoter or other regulatory sequence sufficient to control transcription of the transgene in the cDNA vector. Suitable promoters include, for example, tissue-specific promoters. Promoters can also be derived from AAV.
[00119] В данном документе термин «субъект» относится к человеку или животному, которому предоставляют лечение, включая профилактическое лечение, с применением зкДНК-вектора в соответствии с настоящим изобретением. Обычно животное представляет собой позвоночное животное, такое как, но не ограничиваясь перечисленными, примат, грызун, домашнее животное или промысловое животное. Приматы включают, но не ограничиваются перечисленными, шимпанзе, яванских макак, коат и макак, например, макак-резусов. Грызуны включают мышей, крыс, сурков, хорьков, кроликов и хомяков. Домашние и промысловые животные включают, но не ограничиваются перечисленными, коров, лошадей, свиней, оленей, бизона, буйвола, виды кошачьих, например, домашнюю кошку, виды собачьих, например, собаку, лису, волка, виды птиц, например, курицу, эму, страуса, и рыб, например, форель, сома и лосося. В определенных вариантах реализации аспектов, описанных в данном документе, субъект представляет собой млекопитающее, например, примата или человека. Субъект может быть мужского или женского пола. Кроме того, субъект может быть младенцем или ребенком. Согласно некоторым вариантам реализации субъект может представлять собой новорожденного или нерожденного субъекта, например, субъекта in utero. Предпочтительно субъект представляет собой млекопитающее. Млекопитающее может представлять собой человека, не являющегося человеком примата, мышь, крысу, собаку, кошку, лошадь или корову, однако указанные примеры не являются ограничивающими. Млекопитающие, отличные от человека, могут быть предпочтительно использованы в качестве субъектов в моделях заболеваний и нарушений на животных. Кроме того, способы и композиции, описанные в данном документе, могут быть использованы для одомашненных животных и/или домашних животных. Человек-субъект может быть любого возраста, пола, расы или этнической группы, например, может быть европеоидом (белым), азиатом, африканцем, черным, афроамериканцем, афроевропейцем, испаноамериканцем, представителем ближневосточного этноса и т.д. Согласно некоторым вариантам реализации субъект может представлять собой пациента или другого субъекта в клинических условиях. Согласно некоторым вариантам реализации субъект уже проходит курс лечения. Согласно некоторым вариантам реализации субъект представляет собой эмбрион, плод, новорожденного, младенца, ребенка, подростка или взрослую особь. Согласно некоторым вариантам реализации субъект представляет собой плод человека, новорожденного человека, младенца-человека, ребенка-человека, подростка-человека или взрослого человека. Согласно некоторым вариантам реализации субъект представляет собой эмбрион животного или эмбрион, не принадлежащий человеку, или эмбрион примата, не являющегося человеком. Согласно некоторым вариантам реализации субъект представляет собой эмбрион человека.[00119] As used herein, the term “subject” refers to a human or animal receiving treatment, including prophylactic treatment, using a cccDNA vector in accordance with the present invention. Typically the animal is a vertebrate such as, but not limited to, a primate, rodent, pet or game animal. Primates include, but are not limited to, chimpanzees, cynomolgus macaques, coatats, and macaques such as rhesus monkeys. Rodents include mice, rats, marmots, ferrets, rabbits and hamsters. Domestic and game animals include, but are not limited to, cows, horses, pigs, deer, bison, buffalo, felid species such as the domestic cat, canid species such as the dog, fox, wolf, bird species such as chicken, emu , ostrich, and fish such as trout, catfish and salmon. In certain embodiments of the aspects described herein, the subject is a mammal, such as a primate or a human. The subject may be male or female. Additionally, the subject may be an infant or child. In some embodiments, the subject may be a newborn or unborn subject, such as an in utero subject. Preferably the subject is a mammal. The mammal may be a human, non-human primate, mouse, rat, dog, cat, horse or cow, but these examples are not limiting. Non-human mammals may be advantageously used as subjects in animal models of diseases and disorders. In addition, the methods and compositions described herein can be used for domesticated animals and/or pets. The human subject may be of any age, gender, race or ethnicity, such as Caucasian (White), Asian, African, Black, African American, Afro-European, Hispanic, Middle Eastern, etc. In some embodiments, the subject may be a patient or other subject in a clinical setting. In some embodiments, the subject is already undergoing treatment. In some embodiments, the subject is an embryo, fetus, newborn, infant, child, adolescent, or adult. In some embodiments, the subject is a human fetus, a newborn human, a human infant, a human child, a human adolescent, or an adult. In some embodiments, the subject is an animal embryo or a non-human embryo or a non-human primate embryo. In some embodiments, the subject is a human embryo.
[00120] В данном документе термин «клетка-хозяин» включает любой тип клеток, которые являются восприимчивыми к трансформации, трансфекции, трансдукции и т.п. с использованием конструкции нуклеиновой кислоты или зкДНК-вектора для экспрессии согласно настоящему изобретению. В качестве неограничивающих примеров, клетка-хозяин может представлять собой выделенную первичную клетку, плюрипотентные стволовые клетки, CD34+ клетки, индуцированные плюрипотентные стволовые клетки или любую из ряда иммортализованных клеточных линий (например, клетки HepG2). В качестве альтернативы, клетка-хозяин может представлять собой клетку in situ или in vivo в ткани, органе или организме.[00120] As used herein, the term “host cell” includes any type of cell that is susceptible to transformation, transfection, transduction, or the like. using a nucleic acid construct or cDNA expression vector according to the present invention. By way of non-limiting examples, the host cell may be an isolated primary cell, pluripotent stem cells, CD34 + cells, induced pluripotent stem cells, or any of a number of immortalized cell lines (eg, HepG2 cells). Alternatively, the host cell may be an in situ or in vivo cell in a tissue, organ or organism.
[00121] Термин «экзогенный» относится к веществу, присутствующему в клетке, отличной от его природного источника. В данном документе термин «экзогенный» может относиться к нуклеиновой кислоте (например, нуклеиновой кислоте, кодирующей полипептид) или к полипептиду, которые были введены посредством процесса, включающего действия человека, в биологическую систему, такую как клетка или организм, в которой они обычно не обнаруживаются, и введение нуклеиновой кислоты или полипептида в такую клетку или организм является желательным. В качестве альтернативы, «экзогенный» может относиться к нуклеиновой кислоте или полипептиду, которые были введены посредством процесса, включающего действия человека, в биологическую систему, такую как клетка или организм, в которой они обнаруживаются в относительно низких количествах, и увеличение количества нуклеиновой кислоты или полипептида в клетке или организме является желательным, например, для получения эктопической экспрессии или уровней. В отличие от этого термин «эндогенный» относится к веществу, которое является нативным для биологической системы или клетки.[00121] The term "exogenous" refers to a substance present in a cell other than its natural source. As used herein, the term “exogenous” may refer to a nucleic acid (e.g., a nucleic acid encoding a polypeptide) or polypeptide that has been introduced through a process involving human activity into a biological system, such as a cell or organism, in which it is not normally present. are detected and introduction of the nucleic acid or polypeptide into such a cell or organism is desired. Alternatively, "exogenous" may refer to a nucleic acid or polypeptide that has been introduced through a process involving human activity into a biological system, such as a cell or organism, in which it is found in relatively low quantities, and an increase in the amount of the nucleic acid or polypeptide in a cell or organism is desired, for example, to obtain ectopic expression or levels. In contrast, the term "endogenous" refers to a substance that is native to a biological system or cell.
[00122] Термин «идентичность последовательности» относится к сродству между двумя нуклеотидными последовательностями. Для целей настоящего раскрытия степень идентичности последовательностей между двумя дезоксирибонуклеотидными последовательностями определяется с использованием алгоритма Нидлмана-Вунша (Needleman and Wunsch, 1970, выше), реализованного в программе Needle пакета EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et at, 2000, выше), предпочтительно, версии 3.0.0 или более поздней. Используемые необязательные параметры представляют собой штраф за открытие пропуска 10, штраф за продление пропуска 0,5 и матрицу замены EDNAFULL (версия EMBOSS NCBI NUC4.4). Выходной показатель Needle, называемый «наибольшей длиной идентичного фрагмента» (полученный с применением опции «-nobrief») используют в качестве процента идентичности и вычисляют следующим образом: (Идентичные дезоксирибонуклеотиды×100)/(Длина выравнивания - Общее число пропусков в выравнивании). Длина выравнивания составляет предпочтительно по меньшей мере 10 нуклеотидов, предпочтительно по меньшей мере 25 нуклеотидов, более предпочтительно по меньшей мере 50 нуклеотидов и наиболее предпочтительно по меньшей мере 100 нуклеотидов.[00122] The term "sequence identity" refers to the affinity between two nucleotide sequences. For the purposes of this disclosure, the degree of sequence identity between two deoxyribonucleotide sequences is determined using the Needleman-Wunsch algorithm (Needleman and Wunsch, 1970, supra), implemented in the Needle program of the EMBOSS package (EMBOSS: The European Molecular Biology Open Software Suite, Rice et at, 2000 , above), preferably version 3.0.0 or later. The optional parameters used are a pass opening penalty of 10, a pass extension penalty of 0.5, and a substitution matrix of EDNAFULL (EMBOSS NCBI version NUC4.4). The Needle output called "longest identical fragment length" (obtained using the -nobrief option) is used as the percent identity and is calculated as follows: (Identical deoxyribonucleotides x 100)/(Alignment length - Total number of gaps in alignment). The length of the alignment is preferably at least 10 nucleotides, preferably at least 25 nucleotides, more preferably at least 50 nucleotides, and most preferably at least 100 nucleotides.
[00123] В данном документе термин «гомология» или «гомологичный» определяется как процент нуклеотидных остатков, которые идентичны нуклеотидным остаткам в соответствующей последовательности на хромосоме-мишени после выравнивания последовательностей и введения пробелов, при необходимости, для достижения максимального процента идентичности последовательностей. Выравнивание с целью определения процента гомологии нуклеотидной последовательности может быть достигнуто различными путями, известными в данной области техники, например, с применением общедоступного компьютерного программного обеспечения, такого как программное обеспечение BLAST, BLAST-2, ALIGN, ClustalW2 или Megalign (DNASTAR). Специалисты в данной области техники могут определить соответствующие параметры для выравнивания последовательностей, включая любые алгоритмы, необходимые для достижения максимального выравнивания по всей длине сравниваемых последовательностей. Согласно некоторым вариантам реализации последовательность нуклеиновой кислоты (например, последовательность ДНК), например, гомологичное плечо, считается «гомологичной», когда последовательность по меньшей мере на 70%, по меньшей мере на 75%, по меньшей мере на 80%, по меньшей мере на 85%, по меньшей мере на 90%, по меньшей мере на 91%, по меньшей мере на 92%, по меньшей мере на 93%, по меньшей мере на 94%, по меньшей мере на 95%, по меньшей мере на 96%, по меньшей мере на 97%, по меньшей мере на 98%, по меньшей мере на 99% или более идентична соответствующей нативной или неотредактированной последовательности нуклеиновой кислоты (например, геномной последовательности) клетки-хозяина.[00123] As used herein, the term “homology” or “homologous” is defined as the percentage of nucleotide residues that are identical to nucleotide residues in the corresponding sequence on the target chromosome after sequence alignment and the introduction of gaps, if necessary, to achieve the maximum percentage of sequence identity. Alignment to determine percent homology of a nucleotide sequence can be achieved in various ways known in the art, for example, using publicly available computer software such as BLAST, BLAST-2, ALIGN, ClustalW2 or Megalign (DNASTAR) software. Those skilled in the art can determine appropriate parameters for sequence alignment, including any algorithms necessary to achieve maximum alignment over the entire length of the sequences being compared. In some embodiments, a nucleic acid sequence (e.g., a DNA sequence), such as a homologous arm, is considered “homologous” when the sequence is at least 70%, at least 75%, at least 80%, at least by 85%, by at least 90%, by at least 91%, by at least 92%, by at least 93%, by at least 94%, by at least 95%, by at least 96%, at least 97%, at least 98%, at least 99% or more identical to the corresponding native or unedited nucleic acid sequence (eg, genomic sequence) of the host cell.
[00124] В данном документе термин «гетерологичный» означает нуклеотидную или полипептидную последовательность, которая не обнаружена в нативной нуклеиновой кислоте или белке, соответственно. Гетерологичная последовательность нуклеиновой кислоты может быть связана с природной последовательностью нуклеиновой кислоты (или ее вариантом) (например, путем генетического конструирования) с получением химерной нуклеотидной последовательности, кодирующей химерный полипептид. Гетерологичная последовательность нуклеиновой кислоты может быть соединена с вариантом полипептида (например, путем генетического конструирования) с получением нуклеотидной последовательности, кодирующей слитый вариант полипептида.[00124] As used herein, the term “heterologous” means a nucleotide or polypeptide sequence that is not found in the native nucleic acid or protein, respectively. A heterologous nucleic acid sequence can be linked to a naturally occurring nucleic acid sequence (or variant thereof) (eg, by genetic engineering) to produce a chimeric nucleotide sequence encoding a chimeric polypeptide. A heterologous nucleic acid sequence can be joined to a polypeptide variant (eg, by genetic engineering) to produce a nucleotide sequence encoding a polypeptide fusion variant.
[00125] «Вектор» или «экспрессионный вектор» представляет собой репликон, такой как плазмида, бакмида, фаг, вирус, вирион или космида, к которому может быть присоединен другой сегмент ДНК, т.е. «вставка», чтобы вызвать репликацию присоединенного сегмента в клетке. Вектор может представлять собой конструкцию нуклеиновой кислоты, разработанную для доставки в клетку-хозяина или для переноса между разными клетками-хозяевами. В данном документе вектор может быть вирусным или невирусным по происхождению и/или в конечной форме, однако для цели настоящего раскрытия «вектор» обычно относится к зкДНК-вектору в соответствии с использованием этого термина в данном документе. Термин «вектор» включает любой генетический элемент, который способен к репликации, когда он ассоциирован с надлежащими контрольными элементами, и который может переносить генные последовательности в клетки. Согласно некоторым вариантам реализации вектор может представлять собой экспрессионный вектор или рекомбинантный вектор.[00125] A "vector" or "expression vector" is a replicon, such as a plasmid, bacmid, phage, virus, virion or cosmid, to which another DNA segment can be attached, i.e. "insertion" to cause the attached segment to replicate in the cell. A vector may be a nucleic acid construct designed for delivery into a host cell or for transfer between different host cells. As used herein, a vector may be viral or non-viral in origin and/or final form, however, for the purpose of this disclosure, “vector” generally refers to a cccDNA vector as that term is used herein. The term "vector" includes any genetic element that is capable of replication when associated with appropriate control elements and that can transfer gene sequences into cells. In some embodiments, the vector may be an expression vector or a recombinant vector.
[00126] В данном документе термин «экспрессионный вектор» относится к вектору, который управляет экспрессией РНК или полипептида с последовательностей, связанных с транскрипционными регуляторными последовательностями на векторе. Экспрессируемые последовательности часто, но не обязательно, будут гетер о логичными по отношению к клетке. Экспрессионный вектор может содержать дополнительные элементы, например, экспрессионный вектор может иметь две системы репликации, что позволяет поддерживать его в двух организмах, например, в клетках человека для экспрессии и в прокариотическом хозяине для клонирования и амплификации. Термин «экспрессия» относится к клеточным процессам, участвующим в продуцировании РНК и белков и, в соответствующих случаях, в секретировании белков, включая, где это применимо, но не ограничиваясь перечисленными, например, транскрипцию, процессинг транскрипта, трансляцию и укладку, модификацию и процессинг белка. «Продукты экспрессии» включают РНК, транскрибированную с гена, и полипептиды, полученные путем трансляции мРНК, транскрибированной с гена. Термин «ген» означает последовательность нуклеиновой кислоты, которая транскрибируется (ДНК) в РНК in vitro или in vivo, когда она функционально связана с соответствующими регуляторными последовательностями. Ген может включать, но не обязательно, области, предшествующие кодирующей области и следующие за ней, например, 5'-нетранслируемые (5'-UTR) или «лидерные» последовательности и 3'-UTR или «трейлерные» последовательности, а также промежуточные последовательности (интроны) между отдельными кодирующими сегментами (экзонами).[00126] As used herein, the term “expression vector” refers to a vector that directs the expression of RNA or polypeptide from sequences linked to transcriptional control sequences on the vector. The sequences expressed will often, but not necessarily, be heterogeneous with respect to the cell. The expression vector may contain additional elements, for example, the expression vector may have two replication systems, allowing it to be maintained in two organisms, for example, human cells for expression and a prokaryotic host for cloning and amplification. The term "expression" refers to cellular processes involved in the production of RNA and proteins and, where appropriate, the secretion of proteins, including, where applicable, but not limited to, for example, transcription, transcript processing, translation and folding, modification and processing squirrel. "Expression products" include RNA transcribed from a gene and polypeptides produced by translation of mRNA transcribed from the gene. The term "gene" means a nucleic acid sequence that is transcribed (DNA) into RNA in vitro or in vivo when operably linked to appropriate regulatory sequences. The gene may optionally include regions preceding and following the coding region, for example, 5'-untranslated (5'-UTR) or "leader" sequences and 3'-UTR or "trailer" sequences, as well as intermediate sequences (introns) between individual coding segments (exons).
[00127] Под «рекомбинантным вектором» подразумевается вектор, который включает гетерологичную последовательность нуклеиновой кислоты или «трансген», который способен к экспрессии in vivo. Следует понимать, что векторы, описанные в данном документе, в некоторых вариантах реализации, можно комбинировать с другими подходящими композициями и видами терапии. Согласно некоторым вариантам реализации вектор является эписомальным. Применение подходящего эписомального вектора обеспечивает средство поддержания представляющего интерес нуклеотида у субъекта в многокопийной внехромосомной ДНК, что устраняет потенциальные эффекты интеграции в хромосому.[00127] By “recombinant vector” is meant a vector that includes a heterologous nucleic acid sequence or “transgene” that is capable of expression in vivo. It should be understood that the vectors described herein, in some embodiments, can be combined with other suitable compositions and therapies. In some embodiments, the vector is episomal. The use of a suitable episomal vector provides a means of maintaining the nucleotide of interest in a subject in multicopy extrachromosomal DNA, thereby eliminating the potential effects of chromosomal integration.
[00128] В данном документе выражение «генетическое заболевание» относится к заболеванию, частично или полностью, прямо или опосредованно, вызванному одной или более аномалиями в геноме, в частности, к состоянию, присутствующему с момента рождения. Аномалия может представлять собой мутацию, вставку или делецию. Аномалия может влиять на кодирующую последовательность гена или его регуляторную последовательность. Генетическое заболевание может представлять собой, но не ограничивается перечисленными, мышечную дистрофию Дюшенна (МДД), гемофилию, муковисцидоз, хорею Хантингтона, семейную гиперхолестеринемию (дефект рецептора ЛПНП), гепатобластому, болезнь Вильсона, врожденную печеночную порфирию, наследственные нарушения метаболизма печени, синдром Леша-Нихана, серповидноклеточную анемию, талассемию, пигментную ксеродерму, анемию Фанкони, пигментный ретинит, атаксию-телеангиэктазию, синдром Блума, ретинобластому и болезнь Тея-Сакса.[00128] As used herein, the expression “genetic disease” refers to a disease, in part or in whole, directly or indirectly, caused by one or more abnormalities in the genome, in particular, a condition present from birth. The abnormality may be a mutation, insertion, or deletion. The abnormality may affect the coding sequence of a gene or its regulatory sequence. The genetic disorder may include, but is not limited to, Duchenne muscular dystrophy (DMD), hemophilia, cystic fibrosis, Huntington's chorea, familial hypercholesterolemia (LDL receptor defect), hepatoblastoma, Wilson's disease, congenital hepatic porphyria, inherited liver metabolic disorders, Lesch syndrome. Nihana, sickle cell anemia, thalassemia, xeroderma pigmentosum, Fanconi anemia, retinitis pigmentosa, ataxia telangiectasia, Bloom's syndrome, retinoblastoma and Tay-Sachs disease.
[00129] В данном документе термин «ингибирующий полинуклеотид» относится к молекуле ДНК или РНК, которая уменьшает или предотвращает экспрессию (транскрипцию или трансляцию) второго (целевого) полинуклеотида. Ингибирующие полинуклеотиды включают антисмысловые полинуклеотиды, рибозимы и внешние направляющие последовательности. Термин «ингибирующий полинуклеотид» дополнительно включает молекулы ДНК и РНК, например, РНКи, которые кодируют существующие ингибирующие молекулы, такие как молекулы ДНК, которые кодируют рибозимы.[00129] As used herein, the term “inhibitory polynucleotide” refers to a DNA or RNA molecule that reduces or prevents the expression (transcription or translation) of a second (target) polynucleotide. Inhibitory polynucleotides include antisense polynucleotides, ribozymes and external guide sequences. The term "inhibitory polynucleotide" further includes DNA and RNA molecules, such as RNAi, that encode existing inhibitory molecules, such as DNA molecules that encode ribozymes.
[00130] В данном документе «подавление гена» или «подавленный ген» в отношении активности молекулы РНКи, например, киРНК или миРНК, относится к снижению в клетке уровня мРНК гена-мишени.[00130] As used herein, “gene silencing” or “silenced gene”, with respect to the activity of an RNAi molecule, such as siRNA or siRNA, refers to a decrease in the level of mRNA of a target gene in a cell.
[00131] В данном документе термин «РНКи» относится к любому типу интерферирующей РНК, включая, но не ограничиваясь перечисленными, киРНК, кшРНКи, эндогенную микроРНК и искусственную микроРНК. Например, он включает последовательности, ранее идентифицированные как киРНК, независимо от механизма последующего процессинга РНК (т.е., несмотря на то, что киРНК, как полагают, имеют специфичный способ процессинга in vivo, приводящий к расщеплению мРНК, такие последовательности могут быть включены в векторы между фланкирующими последовательностями, описанными в данном документе). Термин «РНКи» может включать как молекулы РНКи, подавляющие ген, так и эффекторные молекулы РНКи, которые активируют экспрессию гена.[00131] As used herein, the term “RNAi” refers to any type of interfering RNA, including, but not limited to, siRNA, shRNAi, endogenous miRNA, and artificial miRNA. For example, it includes sequences previously identified as siRNAs, regardless of the mechanism of subsequent RNA processing (i.e., although siRNAs are believed to have a specific mode of processing in vivo resulting in mRNA cleavage, such sequences may be included into vectors between the flanking sequences described herein). The term "RNAi" can include both RNAi molecules that silence a gene and effector RNAi molecules that activate gene expression.
[00132] В данном документе термин «содержащий» или «содержит» используется в отношении композиций, способов и их соответствующего компонента (компонентов), существенных для указанного способа или композиции, но допускающих включение не указанных элементов, будь то существенных или нет.[00132] As used herein, the term “comprising” or “comprises” is used to refer to compositions, methods and their respective component(s) that are essential to the specified method or composition, but allow the inclusion of unspecified elements, whether essential or not.
[00133] В данном документе термин «состоящий по существу из» относится к элементам, необходимым для конкретного варианта реализации. Термин допускает наличие элементов, которые не влияют существенным образом на основную и новую или функциональную характеристику (характеристики) указанного варианта реализации. Использование термина «содержащий» указывает на включение, а не на ограничение.[00133] As used herein, the term “consisting essentially of” refers to elements required for a particular implementation. The term allows for elements that do not materially affect the core and novel or functional characteristic(s) of the specified embodiment. The use of the term “comprising” indicates inclusion rather than limitation.
[00134] Термин «состоящий из» относится к композициям, способам и их соответствующим компонентам, описанным в данном документе, которые не включают никаких элементов, не перечисленных в указанном описании варианта реализации.[00134] The term “consisting of” refers to the compositions, methods and their respective components described herein, which do not include any elements not listed in the specified embodiment description.
[00135] В данном документе термин «состоящий по существу из» относится к элементам, необходимым для конкретного варианта реализации. Термин допускает наличие дополнительных элементов, которые не оказывают существенного влияния на основную и новую или функциональную характеристику (характеристики) указанного варианта реализации настоящего изобретения.[00135] As used herein, the term “consisting essentially of” refers to elements required for a particular implementation. The term allows for the presence of additional elements that do not significantly affect the basic and novel or functional characteristic(s) of the specified embodiment of the present invention.
[00136] В настоящем описании и прилагаемой формуле изобретения термины в единственном числе (соотв. «а», «an» и «the» в исходном тексте на английском языке) включают их эквиваленты во множественном числе, если иное явным образом не следует из контекста. Соответственно, например, ссылка на «способ» включает один или более способов и/или этапов типа, описанного в данном документе, и/или таких, которые будут понятны специалистам в данной области техники после прочтения настоящего раскрытия, и т.п. Аналогичным образом, предусмотрено, что термин «или» включает «и», если из контекста явным образом не следует иное. Несмотря на то, что при практической реализации или тестировании настоящего раскрытия могут применяться способы и материалы, сходные или эквивалентные тем, которые описаны в данном документе, ниже описаны подходящие способы и материалы. В данном документе «например» (сокращение «e.g.» в исходном тексте на английском языке, произошедшее от латинского выражения «exempli gratia») указывает на неограничивающий пример. Соответственно, «например» синонимично термину «к примеру».[00136] In the present specification and the accompanying claims, the singular terms (respectively "a", "an" and "the" in the original English text) include their plural equivalents unless the context clearly indicates otherwise . Accordingly, for example, reference to “method” includes one or more methods and/or steps of the type described herein and/or those that will be apparent to those skilled in the art upon reading the present disclosure, and the like. Likewise, the term “or” is provided to include “and” unless the context clearly indicates otherwise. Although methods and materials similar or equivalent to those described herein may be used in the practice or testing of the present disclosure, suitable methods and materials are described below. As used herein, “for example” (the abbreviation “e.g.” in the English source text, derived from the Latin expression “exempli gratia”) indicates a non-limiting example. Accordingly, “for example” is synonymous with the term “for example”.
[00137] Группы альтернативных элементов или вариантов реализации настоящего изобретения, раскрытых в данном документе, не должны рассматриваться как ограничения. На каждый член группы можно ссылаться и заявлять его индивидуально или в любой комбинации с другими членами группы или другими элементами, представленными в данном документе. Один или более членов группы могут быть включены или исключены из группы по соображениям удобства и/или патентоспособности. При любом таком включении или исключении в данном документе считается, что описание изобретения содержит группу, измененную таким образом, чтобы она удовлетворяла условию письменного описания всех групп Маркуша, используемых в прилагаемой формуле изобретения.[00137] The groups of alternative elements or embodiments of the present invention disclosed herein are not to be construed as limitations. Each group member may be referred to and stated individually or in any combination with other group members or other elements presented herein. One or more members of the group may be included or excluded from the group for reasons of convenience and/or patentability. Upon any such inclusion or deletion herein, the specification is deemed to contain the group modified so as to satisfy the condition of a written description of all Markush groups used in the appended claims.
[00138] Согласно некоторым вариантам реализации любого из аспектов раскрытие, описанное в данном документе, не касается способа клонирования людей, способов модификации генетической идентичности зародышевой линии человека, вариантов применения эмбрионов человека в промышленных или коммерческих целях, или способов модификации генетической идентичности животных, которые могут причинить им страдания без какой-либо существенной медицинской пользы для человека или животного, а также животных, полученных с помощью таких способов.[00138] In some embodiments of any aspect, the disclosure described herein does not address a method for cloning humans, methods for modifying the genetic identity of a human germline, applications for industrial or commercial uses of human embryos, or methods for modifying the genetic identity of animals that may cause them suffering without any significant medical benefit to the person or animal, as well as animals obtained through such methods.
[00139] Определения других терминов приведены в данном документе в описании различных аспектов настоящего изобретения.[00139] Definitions of other terms are provided herein in the description of various aspects of the present invention.
[00140] Все патенты и другие публикации; включая литературные ссылки, выданные патенты, опубликованные заявки на патент и заявки на патент, находящиеся на рассмотрении одновременно с настоящей заявкой; упомянутые в настоящем описании, явным образом включены в данный документ посредством ссылки с целью описания и раскрытия, например, методологий, описанных в таких публикациях, которые могут быть использованы в связи с технологией, описанной в данном документе. Эти публикации представлены исключительно по причине их раскрытия до даты подачи настоящей заявки. Ничто в этом отношении не должно истолковываться как признание того, что авторы изобретения не обладают правами на более раннее изобретение по отношению к такому раскрытию в силу предшествующего изобретения или по любой другой причине. Все утверждения, касающиеся дат, или представления относительно содержания этих документов основаны на информации, доступной заявителям, и не являются допущением каким-либо образом признания правильности дат или содержания этих документов.[00140] All patents and other publications; including literary references, issued patents, published patent applications, and patent applications pending contemporaneously with this application; mentioned herein are expressly incorporated herein by reference for the purpose of describing and disclosing, for example, methodologies described in such publications that may be used in connection with the technology described herein. These publications are presented solely by reason of their disclosure prior to the filing date of this application. Nothing in this regard should be construed as an admission that the inventors have no rights in an earlier invention with respect to such disclosure by reason of prior invention or for any other reason. All statements regarding dates or representations regarding the contents of these documents are based on information available to the applicants and do not constitute an admission in any way as to the correctness of the dates or contents of these documents.
[00141] Описание вариантов реализации настоящего раскрытия не должно рассматриваться как исчерпывающее или ограничивающее настоящее изобретение точной раскрытой формой. Несмотря на то, что в данном документе в иллюстративных целях описаны конкретные варианты реализации и примеры раскрытия, возможны различные эквивалентные модификации в пределах объема раскрытия, как будет понятно специалистам в соответствующей области техники. Например, хотя этапы или функции способа представлены в указанном порядке, согласно альтернативным вариантам реализации функции могут выполняться в другом порядке, или функции могут выполняться по существу одновременно. Принципиальные положения настоящего раскрытия, предоставленные в данном документе, могут быть применены к другим процедурам или способам в зависимости от ситуации. Различные варианты реализации, описанные в данном документе, могут быть объединены для обеспечения дополнительных вариантов реализации. Аспекты настоящего раскрытия могут быть модифицированы, при необходимости, для применения композиций, функций и концепций вышеупомянутых ссылок и приложения для обеспечения дополнительных вариантов реализации настоящего раскрытия. Кроме того, из соображений биологической функциональной эквивалентности могут быть сделаны некоторые изменения в структуре белка, не влияющие на биологическое или химическое действие в качественном или количественном отношении. Эти и другие изменения могут быть выполнены в раскрытии в свете подробного описания. Все такие модификации предусмотрены, как включенные в объем прилагаемой формулы изобретения.[00141] The description of embodiments of the present disclosure is not to be construed as exhaustive or limiting of the present invention to the precise form disclosed. Although specific embodiments and examples of the disclosure have been described herein for illustrative purposes, various equivalent modifications are possible within the scope of the disclosure, as will be appreciated by those skilled in the relevant art. For example, although the steps or functions of a method are presented in the specified order, in alternative embodiments the functions may be performed in a different order, or the functions may be performed substantially simultaneously. The principles of this disclosure provided herein may be applied to other procedures or methods as appropriate. Various implementations described herein may be combined to provide additional implementations. Aspects of the present disclosure may be modified, as necessary, to apply the compositions, functions and concepts of the above references and applications to provide additional embodiments of the present disclosure. In addition, for reasons of biological functional equivalence, some changes in protein structure may be made without affecting the biological or chemical action in a qualitative or quantitative sense. These and other changes may be made to the disclosure in light of the detailed description. All such modifications are intended to be included within the scope of the appended claims.
[00142] Конкретные элементы любого из вышеприведенных вариантов реализации могут быть объединены или заменены элементами других вариантов реализации. Кроме того, хотя преимущества, ассоциированные с некоторыми вариантами реализации настоящего раскрытия, были описаны в контексте этих вариантов реализации, другие варианты реализации также могут демонстрировать такие преимущества, и не все варианты реализации должны обязательно демонстрировать такие преимущества, чтобы попадать в объем раскрытия.[00142] Specific elements of any of the above embodiments may be combined or replaced with elements of other embodiments. In addition, although the benefits associated with some embodiments of the present disclosure have been described in the context of those embodiments, other embodiments may also exhibit such benefits, and not all embodiments must necessarily demonstrate such benefits to fall within the scope of the disclosure.
[00143] Описанная в данном документе технология дополнительно иллюстрируется следующими примерами, которые никоим образом не следует истолковывать как дополнительные ограничения. Следует понимать, что настоящее изобретение не ограничено конкретной методологией, протоколами и реагентами, и т.д., описанными в данном документе, и поэтому допускает варианты. Терминология, используемая в данном документе, предназначена исключительно для описания конкретных вариантов реализации и не предназначена для ограничения объема настоящего изобретения, который определен исключительно формулой изобретения.[00143] The technology described herein is further illustrated by the following examples, which should in no way be construed as further limitations. It should be understood that the present invention is not limited to the specific methodology, protocols and reagents, etc. described herein and is therefore subject to variations. The terminology used herein is intended solely to describe specific embodiments and is not intended to limit the scope of the present invention, which is defined solely by the claims.
II. Экспрессия белка FVIII с зкДНК-вектораII. Expression of FVIII protein from cccDNA vector
[00144] Технология, описанная в данном документе, в целом направлена на экспрессию и/или продукцию белка FVIII в клетке с невирусного ДНК-вектора, например, зкДНК-вектора, описанного в данном документе. ЗкДНК-векторы для экспрессии белка FVIII описаны в данном документе в разделе, озаглавленном «зкДНК-векторы в целом». В частности, зкДНК-векторы для экспрессии белка FVIII содержат пару ITR (например, симметричных или асимметричных, как описано в данном документе), а между парой ITR нуклеиновую кислоту, кодирующую белок FVIII, как описано в данном документе, функционально связанную с промотором или регуляторной последовательностью. Отличительным преимуществом зкДНК-векторов для экспрессии белка FVIII по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, даже полноразмерный белок FVIII размером 6,8 тыс. п.о. может быть экспрессирован с одного зкДНК-вектора. Таким образом, зкДНК-векторы, описанные в данном документе, можно применять для экспрессии терапевтического белка FVIII у субъекта, нуждающегося в этом, например, субъекта, страдающего гемофилией А.[00144] The technology described herein is generally directed to the expression and/or production of FVIII protein in a cell from a non-viral DNA vector, such as the ccDNA vector described herein. CccDNA vectors for expression of the FVIII protein are described herein in the section entitled “ccDNA vectors in general.” In particular, cccDNA vectors for FVIII protein expression contain a pair of ITRs (e.g., symmetric or asymmetric, as described herein), and between the pair of ITRs, a nucleic acid encoding the FVIII protein, as described herein, operably linked to a promoter or regulatory sequence. A distinctive advantage of cccDNA vectors for FVIII protein expression compared to conventional AAV vectors and even lentiviral vectors is the absence of size restrictions for heterologous nucleic acid sequences encoding the target protein. Thus, even the full-length FVIII protein of 6.8 kb. can be expressed from a single cDNA vector. Thus, the cccDNA vectors described herein can be used to express a therapeutic FVIII protein in a subject in need thereof, for example, a subject suffering from hemophilia A.
[00145] Как будет понятно, технологии зкДНК-векторов, описанные в данном документе, могут быть адаптированы к любому уровню сложности или могут применяться модульно, причем экспрессия различных компонентов белка FVIII может контролироваться независимо. Например, конкретно предусмотрено, что технологии зкДНК-векторов, разработанные в данном документе, могут быть простыми, как применение одного зкДНК-вектора для экспрессии одной гетерологичной генной последовательности (например, белка FVIII), или могут быть сложными, как применение нескольких зкДНК-векторов, когда каждый вектор экспрессирует несколько белков FVIII или ассоциированных кофакторов, или вспомогательных белков, каждый из которых независимо контролируется разными промоторами. Варианты реализации ниже конкретно предусмотрены в данном документе и могут быть адаптированы специалистом в данной области техники при необходимости.[00145] As will be appreciated, the cccDNA vector technologies described herein can be adapted to any level of complexity or can be applied in a modular manner where the expression of different FVIII protein components can be controlled independently. For example, it is specifically contemplated that the cccDNA vector technologies developed herein may be as simple as using a single cccDNA vector to express a single heterologous gene sequence (e.g., FVIII protein), or may be as complex as using multiple cccDNA vectors , where each vector expresses multiple FVIII proteins or associated cofactors or accessory proteins, each independently controlled by different promoters. The embodiments below are specifically provided for herein and may be adapted by one skilled in the art as necessary.
[00146] Согласно одному варианту реализации один зкДНК-вектор можно применять для экспрессии одного компонента белка FVIII. В качестве альтернативы, один зкДНК-вектор можно применять для экспрессии нескольких компонентов (например, по меньшей мере 2) белка FVIII под контролем одного промотора (например, сильного промотора), необязательно с использованием последовательности (ей) IRES, чтобы обеспечить надлежащую экспрессию каждого из компонентов, например, кофакторов или вспомогательных белков.[00146] In one embodiment, a single cDNA vector can be used to express one FVIII protein component. Alternatively, a single cccDNA vector can be used to express multiple components (e.g., at least 2) of the FVIII protein under the control of a single promoter (e.g., a strong promoter), optionally using IRES sequence(s) to ensure proper expression of each components, such as cofactors or accessory proteins.
[00147] В данном документе также предусмотрен, в другом варианте реализации, один зкДНК-вектор, содержащий по меньшей мере две вставки (например, экспрессирующие тяжелую цепь или легкую цепь), причем экспрессия каждой вставки находится под контролем ее собственного промотора. Промоторы могут включать несколько копий одного и того же промотора, несколько разных промоторов или любую их комбинацию. Специалист в данной области техники поймет, что желательной часто является экспрессия компонентов белка FVIII на разных уровнях экспрессии, что позволяет контролировать стехиометрию отдельных экспрессируемых компонентов для обеспечения эффективного укладывания и комбинирования белка FVIII в клетке.[00147] Also provided herein, in another embodiment, is a single cDNA vector containing at least two inserts (eg, expressing a heavy chain or a light chain), the expression of each insert being under the control of its own promoter. Promoters may include multiple copies of the same promoter, multiple different promoters, or any combination thereof. One skilled in the art will appreciate that it is often desirable to express FVIII protein components at different expression levels, allowing the stoichiometry of the individual expressed components to be controlled to ensure efficient folding and combination of the FVIII protein in the cell.
[00148] Специалист в данной области техники может предусмотреть дополнительные варианты технологий зкДНК-векторов или адаптировать их из методов получения белка с использованием стандартных векторов.[00148] Additional variations of cDNA vector technologies may be contemplated by one skilled in the art or adapted from protein production methods using standard vectors.
А. Нуклеиновые кислотыA. Nucleic acids
[00149] В данном документе предложена характеристика и разработка молекул нуклеиновых кислот для потенциального терапевтического применения. В соответствии с некоторыми вариантами реализации нуклеиновые кислоты для терапевтического применения кодируют белок FVIII. Согласно некоторым вариантам реализации в соответствующих случаях описана химическая модификация олигонуклеотидов с целью изменения и улучшения свойств in vivo (доставки, стабильности, времени жизни, укладки, специфичности в отношении мишени), а также их биологической функции и механизма, которые напрямую коррелируют с терапевтическим приложением.[00149] This document proposes the characterization and development of nucleic acid molecules for potential therapeutic applications. In some embodiments, the nucleic acids for therapeutic use encode the FVIII protein. In some embodiments, where appropriate, chemical modification of oligonucleotides is described to alter and improve in vivo properties (delivery, stability, lifetime, folding, target specificity) as well as their biological function and mechanism that directly correlate with therapeutic application.
[00150] Иллюстративные терапевтические нуклеиновые кислоты согласно настоящему раскрытию, которые могут быть иммуностимулирующими и требуют применения иммуносупрессоров, раскрытых в данном документе, могут включать, но не ограничиваются перечисленными, минигены, плазмиды, миникольца, короткую интерферирующую РНК (киРНК), микроРНК (миРНК), антисмысловые олигонуклеотиды (ASO), рибозимы, двухцепочечную ДНК с замкнутыми концами (например, зкДНК, CELiD, линейную ковалентно замкнутую ДНК («с минимальной цепью»), doggybone (dbDNA™), протеломерную ДНК с замкнутыми концами или гантелеобразную линейную ДНК), дцРНК-субстрат Dicer, короткую шпилечную РНК (кшРНК), асимметричную интерферирующую РНК (аиРНК), микроРНК (миРНК), мРНК, тРНК, рРНК и вирусные ДНК-векторы, вирусный РНК-вектор; и любую их комбинацию.[00150] Exemplary therapeutic nucleic acids according to the present disclosure that may be immunostimulatory and require the use of immunosuppressive agents disclosed herein may include, but are not limited to, minigenes, plasmids, minicircles, short interfering RNA (siRNA), microRNA (miRNA) , antisense oligonucleotides (ASO), ribozymes, closed-end double-stranded DNA (e.g., cccDNA, CELiD, linear covalently closed DNA (“minimal strand”), doggybone (dbDNA™), closed-end protelomeric DNA, or dumbbell-shaped linear DNA), Dicer dsRNA substrate, short hairpin RNA (shRNA), asymmetric interfering RNA (aiRNA), microRNA (miRNA), mRNA, tRNA, rRNA and viral DNA vectors, viral RNA vector; and any combination thereof.
[00151] киРНК или миРНК, которые могут отрицательно регулировать внутриклеточные уровни конкретных белков посредством процесса, называемого РНК-интерференцией (РНКи), также предусмотрены настоящим изобретением в качестве терапевтических средств на основе нуклеиновых кислот. После введения киРНК или миРНК в цитоплазму клетки-хозяина указанные конструкции двухцепочечной РНК связываются с белком, называемым RISC. Комплекс RISC удаляет смысловую цепь киРНК или миРНК. Комплекс RISC в комбинации с комплементарной мРНК расщепляет мРНК и высвобождает разрезанные цепи. РНКи осуществляется путем индукции специфичного разрушения мРНК, что приводит к отрицательной регуляции соответствующего белка.[00151] siRNAs or miRNAs that can negatively regulate intracellular levels of specific proteins through a process called RNA interference (RNAi) are also contemplated by the present invention as nucleic acid therapeutics. Once the siRNA or miRNA is introduced into the cytoplasm of the host cell, these double-stranded RNA constructs bind to a protein called RISC. The RISC complex removes the sense strand of siRNA or siRNA. The RISC complex, in combination with complementary mRNA, cleaves the mRNA and releases the cut strands. RNAi is carried out by inducing specific destruction of mRNA, which leads to negative regulation of the corresponding protein.
[00152] Антисмысловые олигонуклеотиды (ASO) и рибозимы, которые ингибируют трансляцию мРНК в белок, могут представлять собой терапевтические средства на основе нуклеиновых кислот. В случае антисмысловых конструкций указанные одноцепочечные дезоксинуклеиновые кислоты имеют последовательность, комплементарную последовательности мРНК целевого белка, и способны связываться с мРНК посредством спаривания оснований по Уотсону-Крику. Такое связывание предотвращает трансляцию целевой мРНК и/или запускает разрушение транскрипта мРНК РНКазой Н. В результате антисмысловой олигонуклеотид имеет повышенную специфичность действия (т.е. отрицательную регуляцию специфического белка, связанного с заболеванием).[00152] Antisense oligonucleotides (ASOs) and ribozymes that inhibit translation of mRNA into protein may be nucleic acid-based therapeutics. In the case of antisense constructs, these single-stranded deoxynucleic acids have a sequence complementary to the mRNA sequence of the target protein and are capable of binding to the mRNA through Watson-Crick base pairing. This binding prevents translation of the target mRNA and/or triggers the destruction of the mRNA transcript by RNase H. As a result, the antisense oligonucleotide has increased specificity of action (ie, negative regulation of a specific protein associated with the disease).
[00153] Согласно любому из способов, предложенных в данном документе, терапевтическая нуклеиновая кислота может представлять собой терапевтическую РНК. Терапевтическая РНК может представлять собой ингибитор трансляции мРНК, агент РНК-интерференции (РНКи), каталитически активную молекулу РНК (рибозим), транспортную РНК (тРНК) или РНК, которая связывает транскрипт мРНК (ASO), белок или другой молекулярный лиганд (аптамер). Согласно любому из способов, предложенных в данном документе, агент РНКи может представлять собой двухцепочечную РНК, одноцепочечную РНК, микроРНК, короткую интерферирующую РНК, короткую шпилечную РНК или образующий триплекс олигонуклеотид.[00153] In any of the methods provided herein, the therapeutic nucleic acid may be therapeutic RNA. The therapeutic RNA may be an mRNA translation inhibitor, an RNA interference (RNAi) agent, a catalytically active RNA molecule (ribozyme), transfer RNA (tRNA), or RNA that binds an mRNA transcript (ASO), protein, or other molecular ligand (aptamer). In any of the methods provided herein, the RNAi agent may be double-stranded RNA, single-stranded RNA, microRNA, short interfering RNA, short hairpin RNA, or triplex oligonucleotide.
[00154] В соответствии с некоторыми вариантами реализации терапевтическая нуклеиновая кислота представляет собой двухцепочечную ДНК с замкнутыми концами, например, зкДНК. В соответствии с некоторыми вариантами реализации экспрессия и/или продукция терапевтического белка в клетке происходит с невирусного ДНК-вектора, например, зкДНК-вектора. Отличительным преимуществом зкДНК-векторов для экспрессии терапевтического белка по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, даже большой терапевтический белок может быть экспрессирован с одного зкДНК-вектора. Таким образом, зкДНК-векторы можно применять для экспрессии терапевтического белка у субъекта, нуждающегося в этом.[00154] In some embodiments, the therapeutic nucleic acid is double-stranded DNA with closed ends, such as cccDNA. In some embodiments, expression and/or production of the therapeutic protein in the cell occurs from a non-viral DNA vector, such as a cccDNA vector. A distinctive advantage of cccDNA vectors for therapeutic protein expression compared to conventional AAV vectors and even lentiviral vectors is the absence of size restrictions for heterologous nucleic acid sequences encoding the target protein. Thus, even a large therapeutic protein can be expressed from a single cccDNA vector. Thus, cccDNA vectors can be used to express a therapeutic protein in a subject in need thereof.
[00155] В общем случае зкДНК-вектор для экспрессии терапевтического белка, раскрытый в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ. Последовательности ITR выбирают из любых из: (i) по меньшей мере одного WT-ITR и по меньшей мере одного модифицированного инвертированного концевого повтора ААВ (mod-ITR) (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию в отношении друг друга (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT-ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию.[00155] In general, the cccDNA vector for expression of a therapeutic protein disclosed herein contains, in the 5' to 3' direction: the first inverted terminal repeat (ITR) of an adeno-associated virus (AAV), a nucleotide sequence of interest (e.g. , an expression cassette described herein), and a second AAV ITR. The ITR sequences are selected from any of: (i) at least one WT-ITR and at least one modified AAB inverted terminal repeat (mod-ITR) (eg, asymmetric modified ITRs); (ii) two modified ITRs, wherein the mod-ITR pair has a different three-dimensional spatial organization in relation to each other (e.g., asymmetric modified ITRs), or (iii) a pair of symmetric or substantially symmetric WT-WT-ITRs, each WT-ITR has the same three-dimensional spatial organization, or (iv) pairs of symmetric or substantially symmetric modified ITRs, each mod-ITR having the same three-dimensional spatial organization.
[00156] Согласно некоторым вариантам реализации трансген, кодирующий белок FVIII, также может кодировать секреторную последовательность так, что белок FVIII направляется в аппарат Гольджи и эндоплазматический ретикулум (ЭР), где будет происходить укладка белка FVIII в правильную конформацию молекулами-шаперонами при его прохождении через ЭР и высвобождении из клетки. Примерные секреторные последовательности включают, но не ограничиваются перечисленными, VH-02 (SEQ ID NO: 88) и VK-A26 (SEQ ID NO: 89) и сигнальную последовательность IgK (SEQ ID NO: 126), а также секреторный сигнал Glue, обеспечивающий секрецию меченого белка из цитозоля (SEQ ID NO: 188), секреторную последовательность TMD-ST, которая направляет меченый белок в аппарат Гольджи (SEQ ID NO: 189).[00156] In some embodiments, the transgene encoding the FVIII protein may also encode a secretory sequence such that the FVIII protein is targeted to the Golgi apparatus and endoplasmic reticulum (ER), where the FVIII protein will be folded into the correct conformation by chaperone molecules as it passes through ER and release from the cell. Exemplary secretory sequences include, but are not limited to, VH-02 (SEQ ID NO: 88) and VK-A26 (SEQ ID NO: 89) and the IgK signal sequence (SEQ ID NO: 126), as well as the Glue secretory signal providing secretion of the tagged protein from the cytosol (SEQ ID NO: 188), the secretory sequence TMD-ST, which directs the tagged protein to the Golgi apparatus (SEQ ID NO: 189).
[00157] Регуляторные переключатели также можно использовать для точной настройки экспрессии белка FVIII так, что белок FVIII экспрессируется предусмотренным образом, включая, но не ограничиваясь этим, экспрессию белка FVIII на целевом уровне экспрессии или в целевом количестве, или, в качестве альтернативы, в присутствии или в отсутствие конкретного сигнала, включая событие клеточной передачи сигнала. Например, как описано в данном документе, экспрессия белка FVIII с зкДНК-вектора может быть включена или выключена при возникновении конкретного состояния, как описано в разделе данного документа, озаглавленном «Регуляторные переключатели».[00157] Regulatory switches can also be used to fine-tune the expression of the FVIII protein so that the FVIII protein is expressed in the intended manner, including, but not limited to, expressing the FVIII protein at a target expression level or amount, or, alternatively, in the presence of or in the absence of a specific signal, including a cellular signaling event. For example, as described herein, expression of the FVIII protein from a cccDNA vector can be turned on or off when a particular condition occurs, as described in the section herein entitled “Regulatory Switches.”
[00158] Например, и только в целях иллюстрации, белки FVIII можно применять для выключения нежелательной реакции, такой как слишком высокий уровень продукции белка FVIII. Ген FVIII может содержать сигнальный пептидный маркер для доставки белка FVIII в целевую клетку. Однако в любой ситуации может быть желательно регулировать экспрессию белка FVIII. ЗкДНК-векторы легко приспосабливаются к использованию регуляторных переключателей.[00158] For example, and for purposes of illustration only, FVIII proteins can be used to turn off an undesirable response, such as too high a level of FVIII protein production. The FVIII gene may contain a signal peptide marker for delivery of the FVIII protein to the target cell. However, in any situation it may be desirable to regulate FVIII protein expression. CccDNA vectors are easily adaptable to the use of regulatory switches.
[00159] Отличительным преимуществом зкДНК-векторов по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих белок FVIII. Таким образом, даже полноразмерный FVIII, а также необязательно любые кофакторы или вспомогательные белки могут быть экспрессированы с одного зкДНК-вектора. Кроме того, в зависимости от необходимой стехиометрии можно экспрессировать несколько сегментов одного и того же белка FVIII и можно использовать один и тот же или разные промоторы, а также можно использовать регуляторные переключатели для точной настройки экспрессии каждой области. Например, как показано в Примерах, можно применять зкДНК-вектор, который содержит двойную промоторную систему, так, что для каждого домена белка FVIII используется разный промотор. Применение зкДНК-плазмиды для получения белка FVIII может включать уникальную комбинацию промоторов для экспрессии доменов белка FVIII, что приводит к правильным соотношениям каждого домена для образования функционального белка FVIII. Соответственно, в некоторых вариантах реализации, зкДНК-вектор можно применять для экспрессии различных областей белка FVIII по отдельности (например, под контролем другого промотора).[00159] A distinctive advantage of cccDNA vectors compared to conventional AAV vectors and even lentiviral vectors is that there is no size limitation for heterologous nucleic acid sequences encoding the FVIII protein. Thus, even full-length FVIII, and optionally any cofactors or accessory proteins, can be expressed from a single cccDNA vector. In addition, depending on the desired stoichiometry, multiple segments of the same FVIII protein can be expressed and the same or different promoters can be used, and regulatory switches can be used to fine-tune the expression of each region. For example, as shown in the Examples, a cccDNA vector can be used that contains a dual promoter system such that a different promoter is used for each domain of the FVIII protein. The use of a cccDNA plasmid to produce FVIII protein can include a unique combination of promoters for the expression of FVIII protein domains, resulting in the correct ratios of each domain to produce a functional FVIII protein. Accordingly, in some embodiments, the cDNA vector can be used to express different regions of the FVIII protein separately (eg, under the control of a different promoter).
[00160] Согласно другому варианту реализации белок FVIII, экспрессируемый с зкДНК-векторов, дополнительно содержит дополнительную функциональную возможность, такую как флуоресценция, ферментативная активность, сигнал секреции или активатор иммунных клеток.[00160] In another embodiment, the FVIII protein expressed from the cccDNA vectors further comprises additional functionality, such as fluorescence, enzymatic activity, a secretion signal, or an immune cell activator.
[00161] Согласно некоторым вариантам реализации зкДНК, кодирующая белок FVIII, может дополнительно содержать линкерный домен, например. В данном документе «линкерный домен» относится к олиго- или полипептидной области от примерно 2 до 100 аминокислот в длину, которая связывает любые домены/области белка FVIII, описанного в данном документе. Согласно некоторым вариантам реализации линкеры могут включать или могут состоять из гибких остатков, таких как глицин и серии, так, что смежные белковые домены могут свободно перемещаться относительно друг друга. Более длинные линкеры могут использоваться, когда желательно гарантировать, что два смежных домена не будут стерически мешать друг другу. Линкеры могут быть расщепляемыми или нерасщепляемыми. Примеры расщепляемых линкеров включают линкеры 2А (например, Т2А), 2А-подобные линкеры или их функциональные эквиваленты и их комбинации. Линкер может представлять собой линкерную область Т2А, происходящую из вируса Thosea asigna.[00161] In some embodiments, the cccDNA encoding the FVIII protein may further comprise a linker domain, for example. As used herein, “linker domain” refers to an oligo- or polypeptide region from about 2 to 100 amino acids in length that links any domains/regions of the FVIII protein described herein. In some embodiments, linkers may include or be composed of flexible residues, such as glycine and serine, such that adjacent protein domains can move freely relative to each other. Longer linkers can be used when it is desirable to ensure that two adjacent domains do not sterically interfere with each other. Linkers can be cleavable or non-cleavable. Examples of cleavable linkers include 2A linkers (eg, T2A), 2A-like linkers or functional equivalents thereof, and combinations thereof. The linker may be a T2A linker region derived from Thosea asigna virus.
[00162] Специалист в данной области техники может взять известную и/или общедоступную последовательность белка, например, FVIII и т.д., и выполнить обратное конструирование последовательности кДНК для кодирования такого белка. Затем кДНК может быть оптимизирована по кодонам, чтобы соответствовать предусмотренной клетке-хозяину, и вставлена в зкДНК-вектор, как описано в данном документе.[00162] One skilled in the art can take a known and/or publicly available protein sequence, such as FVIII, etc., and reverse engineer a cDNA sequence to encode such a protein. The cDNA can then be codon optimized to match the intended host cell and inserted into a cDNA vector as described herein.
В. зкДНК-векторы, экспрессирующие белок FVIIIB. cccDNA vectors expressing FVIII protein
[00163] ЗкДНК-вектор для экспрессии белка FVIII, имеющий одну или более последовательностей, кодирующих целевой FVIII, может содержать регуляторные последовательности, такие как промоторы, сигналы секреции, области поли(А) и энхансеры. По меньшей мере, зкДНК-вектор содержит одну или более гетерологичных последовательностей, кодирующих белок FVIII.[00163] A cDNA FVIII protein expression vector having one or more sequences encoding a target FVIII may contain regulatory sequences such as promoters, secretion signals, poly(A) regions, and enhancers. At least the cDNA vector contains one or more heterologous sequences encoding the FVIII protein.
[00164] Для достижения высокоэффективной и точной сборки белка FVIII в некоторых вариантах реализации конкретно предусмотрено, что белок FVIII содержит лидерную последовательность для эндоплазматического ретикулума (ЭР) для направления его в ЭР, где происходит укладка белка. Например, последовательность, которая направляет экспрессированный белок (белки) в ЭР для укладки.[00164] To achieve highly efficient and accurate assembly of the FVIII protein, some embodiments specifically provide that the FVIII protein contains an endoplasmic reticulum (ER) leader sequence to direct it to the ER where protein folding occurs. For example, a sequence that directs the expressed protein(s) to the ER for folding.
[00165] Согласно некоторым вариантам реализации сигнал клеточной или внеклеточной локализации (например, секреторный сигнал, сигнал ядерной локализации, сигнал митохондриальной локализации и т.д.) содержится в зкДНК-векторе, чтобы направлять секрецию или целевую субклеточную локализацию FVIII так, что белок FVIII может связываться с внутриклеточной мишенью (мишенями) (например, внутри тела) или внеклеточной мишенью (мишенями).[00165] In some embodiments, a cellular or extracellular localization signal (e.g., a secretory signal, a nuclear localization signal, a mitochondrial localization signal, etc.) is contained in a cccDNA vector to direct secretion or targeted subcellular localization of FVIII such that the FVIII protein may bind to intracellular target(s) (eg, within the body) or extracellular target(s).
[00166] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, обеспечивает сборку и экспрессию любого целевого белка FVIII модульным способом. В данном документе термин «модульный» относится к элементам в зкДНК-экспрессирующей плазмиде, которые можно легко удалить из конструкции. Например, модульные элементы в зкДНК-генерирующей плазмиде, содержат уникальные пары сайтов рестрикции, фланкирующие каждый элемент в конструкции, что обеспечивает исключительное манипулирование отдельными элементами (см., например, ФИГ. 1A-1G). Таким образом, платформа зкДНК-вектора может обеспечивать экспрессию и сборку любой целевой конфигурации белка FVIII. В данном документе в различных вариантах реализации предложены плазмидные зкДНК-векторы, которые могут уменьшить и/или минимизировать количество манипуляций, необходимых для сборки целевого зкДНК-вектора, кодирующего белок FVIII.[00166] In some embodiments, the cDNA FVIII protein expression vector described herein allows for the assembly and expression of any target FVIII protein in a modular manner. As used herein, the term “modular” refers to elements in the cDNA expression plasmid that can be easily removed from the construct. For example, modular elements in a cDNA-generating plasmid contain unique pairs of restriction sites flanking each element in the construct, allowing for exclusive manipulation of individual elements (see, for example, FIGS. 1A-1G). Thus, the cccDNA vector platform can support the expression and assembly of any desired FVIII protein configuration. Provided herein in various embodiments are plasmid cccDNA vectors that can reduce and/or minimize the number of manipulations required to assemble a target ccDNA vector encoding an FVIII protein.
С. Примерные белки FVIII, экспрессируемые зкДНК-векторамиC. Exemplary FVIII proteins expressed by cccDNA vectors
[00167] В частности, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать, например, но не ограничиваясь перечисленными, белки FVIII, а также их варианты и/или активные фрагменты для применения в лечении, профилактике и/или облегчении одного или более симптомов гемофилии А. В одном аспекте гемофилия А представляет собой гемофилию А человека.[00167] In particular, the cDNA FVIII protein expression vector disclosed herein may encode, for example, but not limited to, FVIII proteins, as well as variants and/or active fragments thereof, for use in treatment, prevention and/or alleviating one or more symptoms of hemophilia A. In one aspect, hemophilia A is human hemophilia A.
(i) Терапевтические белки FVIII и их фрагменты(i) Therapeutic FVIII proteins and fragments thereof
[00168] По существу любой вариант терапевтического белка FVIII или его фрагмента (например, функциональный фрагмент) может кодироваться и экспрессироваться с зкДНК-вектора, как описано в данном документе. Специалист в данной области техники поймет, что терапевтический белок FVIII включает все варианты сплайсинга и ортологи белка FVIII. Терапевтический белок FVIII включает интактные молекулы, а также их фрагменты (например, функциональные).[00168] Essentially any variant of a therapeutic FVIII protein or fragment thereof (eg, a functional fragment) can be encoded and expressed from a cccDNA vector as described herein. One skilled in the art will understand that a therapeutic FVIII protein includes all splice variants and orthologs of the FVIII protein. The therapeutic FVIII protein includes intact molecules as well as fragments (eg, functional ones).
[00169] Фактор VIII[00169] Factor VIII
[00170] Фактор VIII представляет собой неферментный кофактор активированного фактора свертывания крови IX (FIXa), который при протеолитической активации взаимодействует с FLXa с образованием прочного нековалентного комплекса, который связывается с фактором X (FX) и активирует его.[00170] Factor VIII is a nonenzymatic cofactor of activated coagulation factor IX (FIXa) that, upon proteolytic activation, interacts with FLXa to form a strong, noncovalent complex that binds to and activates factor X (FX).
[00171] Ген или белок фактора VIII также может называться F8, фактор коагуляции VIII, прокоагулянтный компонент, антигемофильный фактор, F8C, AHF, DXS1253E, FVIII, НЕМА или F8B. Экспрессия гена фактора VIII тканеспецифична и в основном наблюдается в клетках печени. Самый высокий уровень мРНК и белков фактора VIII детектировался в синусоидных клетках печени; значительные количества фактора VIII также присутствуют в гепатоцитах и клетках Купфера (резидентные макрофаги синусоидов печени). Умеренные уровни белка фактора VIII детектируются в сыворотке и плазме. Белок фактора VIII экспрессируется на низких и умеренных уровнях в фетальном головном мозге, сетчатке, почке и семеннике.[00171] The factor VIII gene or protein may also be referred to as F8, coagulation factor VIII, procoagulant component, antihemophilic factor, F8C, AHF, DXS1253E, FVIII, HEMA, or F8B. Expression of the factor VIII gene is tissue specific and is mainly observed in liver cells. The highest levels of factor VIII mRNA and protein were detected in liver sinusoidal cells; significant amounts of factor VIII are also present in hepatocytes and Kupffer cells (resident macrophages of the liver sinusoids). Moderate levels of factor VIII protein are detected in serum and plasma. Factor VIII protein is expressed at low to moderate levels in the fetal brain, retina, kidney, and testis.
[00172] мРНК фактора VIII экспрессируется во многих тканях организма, включая костный мозг, цельную кровь, лейкоциты, лимфатические узлы, тимус, головной мозг, кору головного мозга, мозжечок, сетчатку, спинной мозг, большеберцовый нерв, сердце, артерию, гладкую мышцу, скелетную мышцу, тонкий кишечник, толстую кишку, адипоциты, почку, печень, легкое, селезенку, желудок, пищевод, мочевой пузырь, поджелудочную железу, щитовидную железу, слюнную железу, надпочечник, гипофиз, молочную железу, кожу, яичник, матку, плаценту, простату и семенник. Ген FVIII, локализованный на длинном плече Х-хромосомы, занимает область длиной приблизительно 186 тыс. п.о. и состоит из 26 экзонов (69-3106 п.о.) и интронов (от 207 п.о. до 32,4 тыс. п.о.). Общая длина кодирующей последовательности этого гена составляет 9 тыс. п.о.[00172] Factor VIII mRNA is expressed in many tissues of the body, including bone marrow, whole blood, white blood cells, lymph nodes, thymus, brain, cerebral cortex, cerebellum, retina, spinal cord, tibial nerve, heart, artery, smooth muscle, skeletal muscle, small intestine, colon, adipocytes, kidney, liver, lung, spleen, stomach, esophagus, bladder, pancreas, thyroid gland, salivary gland, adrenal gland, pituitary gland, mammary gland, skin, ovary, uterus, placenta, prostate and testis. The FVIII gene, located on the long arm of the X chromosome, occupies a region approximately 186 thousand bp long. and consists of 26 exons (69-3106 bp) and introns (from 207 bp to 32.4 thousand bp). The total length of the coding sequence of this gene is 9 thousand bp.
[00173] Зрелый полипептид фактора VIII содержит структурные домены А1-А2-В-А3-С1-С2. Три кислых субдомена, которые обозначаются a1-a3-A1(a1)-A2(a2)-B-(a3)A3-C1-C2, локализуются на границах доменов А и играют важную роль во взаимодействии между FVIII и другими белками (в частности, с тромбином). Мутации в этих субдоменах снижают уровень активации фактора VIII тромбином.[00173] The mature factor VIII polypeptide contains the structural domains A1-A2-B-A3-C1-C2. Three acidic subdomains, designated a1-a3-A1(a1)-A2(a2)-B-(a3)A3-C1-C2, are localized at the boundaries of the A domains and play an important role in the interaction between FVIII and other proteins (in particular , with thrombin). Mutations in these subdomains reduce the level of factor VIII activation by thrombin.
[00174] Белок фактора VIII (изоформа фактора коагуляции VIII) представляет собой препробелок [Homo sapiens]; номер доступа: NP_000123.1 (2351 амк.) и имеет следующую последовательность:[00174] Factor VIII protein (an isoform of coagulation factor VIII) is a [Homo sapiens] pre-protein; accession number: NP_000123.1 (2351 amk.) and has the following sequence:
[00176] Отличительным преимуществом зкДНК-векторов по сравнению с обычными ААВ-векторами и даже лентивирусными векторами является отсутствие ограничения по размеру для гетерологичных последовательностей нуклеиновых кислот, кодирующих целевой белок. Таким образом, несколько полноразмерных терапевтических белков FVIII могут быть экспрессированы с одного зкДНК-вектора.[00176] A distinctive advantage of cccDNA vectors compared to conventional AAV vectors and even lentiviral vectors is that there is no size limitation for heterologous nucleic acid sequences encoding the target protein. Thus, multiple full-length therapeutic FVIII proteins can be expressed from a single cccDNA vector.
[00177] Экспрессия терапевтического белка FVIII или его фрагмента с зкДНК-вектора может быть достигнута как в пространстве, так и во времени с использованием одного или более индуцируемых или репрессируемых промоторов, известных в данной области техники или описанных в данном документе, включая регуляторные переключатели, описанные в данном документе.[00177] Expression of a therapeutic FVIII protein or fragment thereof from a cccDNA vector can be achieved both spatially and temporally using one or more inducible or repressible promoters known in the art or described herein, including regulatory switches, described in this document.
[00178] Согласно одному варианту реализации терапевтический белок FVIII представляет собой «вариант терапевтического белка», который относится к терапевтическому белку FVIII, имеющему измененную аминокислотную последовательность, композицию или структуру по сравнению с соответствующим нативным терапевтическим белком FVIII. Согласно одному варианту реализации FVIII представляет собой функциональный вариант (например, дикий тип). Подходящей также может быть экспрессия мутантного варианта белка FVIII, такого как точечная мутация или делеционная мутация, которая приводит к гемофилии А, например, для создания модели заболевания на животных и/или для оценки лекарственных средств для лечения гемофилии А. Доставка мутантных или модифицированных белков FVIII в модельную систему на основе клеток или на животных может быть выполнена для создания модели заболевания. Такую модель на основе клеток или на животных можно использовать для исследований и/или скрининга лекарственных средств. Терапевтический белок FVIII, экспрессируемый с зкДНК-векторов, может дополнительно содержать последовательность/фрагмент, который придает дополнительную функциональность, такую как флуоресценция, ферментативная активность или сигнал секреции. Согласно одному варианту реализации вариант терапевтического белка FVIII содержит ненативную последовательность метки для идентификации (например, иммунную метку), которая позволяет отличить его от эндогенного терапевтического белка FVIII в реципиентной клетке-хозяине.[00178] In one embodiment, a therapeutic FVIII protein is a “therapeutic protein variant,” which refers to a therapeutic FVIII protein having an altered amino acid sequence, composition, or structure compared to the corresponding native therapeutic FVIII protein. In one embodiment, FVIII is a functional variant (eg, wild type). Expression of a mutant variant of the FVIII protein, such as a point mutation or deletion mutation that results in hemophilia A, may also be suitable, for example, to establish an animal model of the disease and/or to evaluate drugs for the treatment of hemophilia A. Delivery of mutant or modified FVIII proteins into a cell-based or animal model system can be performed to create a disease model. Such a cell-based or animal model can be used for research and/or drug screening. The therapeutic FVIII protein expressed from cccDNA vectors may further contain a sequence/fragment that imparts additional functionality, such as fluorescence, enzymatic activity, or a secretion signal. In one embodiment, the FVIII therapeutic protein variant comprises a non-native identification tag sequence (eg, an immune tag) that allows it to be distinguished from the endogenous FVIII therapeutic protein in the recipient host cell.
[00179] Специалист в данной области техники может взять известную и/или общедоступную последовательность белка, например, терапевтического белка FVIII, и выполнить обратное конструирование последовательности кДНК для кодирования такого белка. Затем кДНК может быть оптимизирована по кодонам, чтобы соответствовать предусмотренной клетке-хозяину, и вставлена в зкДНК-вектор, как описано в данном документе.[00179] One skilled in the art can take a known and/or publicly available protein sequence, such as a therapeutic FVIII protein, and reverse engineer a cDNA sequence to encode such a protein. The cDNA can then be codon optimized to match the intended host cell and inserted into a cDNA vector as described herein.
[00180] Согласно одному варианту реализации последовательность, кодирующая терапевтический белок FVIII, может быть получена из существующей клетки-хозяина или линии клеток, например, путем обратной транскрипции мРНК, полученной от хозяина, и амплификации последовательности с использованием ПЦР.[00180] In one embodiment, the coding sequence for a therapeutic FVIII protein can be obtained from an existing host cell or cell line, for example, by reverse transcribing mRNA obtained from the host and amplifying the sequence using PCR.
(ii) ЗкДНК-векторы, экспрессирующие терапевтический белок FVIII(ii) cccDNA vectors expressing therapeutic FVIII protein
[00181] ЗкДНК-вектор, имеющий одну или более последовательностей, кодирующих целевой терапевтический белок FVIII, может содержать регуляторные последовательности, такие как промоторы, сигналы секреции, области поли(А) и энхансеры. По меньшей мере, зкДНК-вектор содержит одну или более гетерологичных последовательностей, кодирующих терапевтический белок FVIII или его функциональный фрагмент.Примерные кассетные вставки для получения зкДНК-векторов, кодирующих терапевтические белки FVIII, отображены на Фигурах 1A-1G. Согласно одному варианту реализации зкДНК-вектор содержит последовательность FVIII, перечисленную в Таблице 1 в данном документе.[00181] A cccDNA vector having one or more sequences encoding a target therapeutic FVIII protein may contain regulatory sequences such as promoters, secretion signals, poly(A) regions, and enhancers. At least the cccDNA vector contains one or more heterologous sequences encoding a therapeutic FVIII protein or a functional fragment thereof. Exemplary cassette inserts for producing cccDNA vectors encoding therapeutic FVIII proteins are shown in Figures 1A-1G. In one embodiment, the cccDNA vector contains the FVIII sequence listed in Table 1 herein.
(iii) Терапевтические белки FVIII и варианты их применения для лечения гемофилии А(iii) Therapeutic FVIII proteins and their applications for the treatment of hemophilia A
[00182] ЗкДНК-векторы, описанные в данном документе, можно применять для доставки терапевтических белков FVIII для лечения гемофилии А, ассоциированной с нефизиологической экспрессией белка FVIII и/или мутациями в белках FVIII.[00182] The cccDNA vectors described herein can be used to deliver therapeutic FVIII proteins for the treatment of hemophilia A associated with nonphysiological FVIII protein expression and/or mutations in FVIII proteins.
[00183] ЗкДНК-векторы, описанные в данном документе, можно применять для экспрессии любого целевого терапевтического белка FVIII. Примерные терапевтические белки FVIII включают, но не ограничиваются им, любой белок FVIII, экспрессируемый последовательностями, педставленными в Таблице 1 в данном документе.[00183] The cDNA vectors described herein can be used to express any target therapeutic FVIII protein. Exemplary therapeutic FVIII proteins include, but are not limited to, any FVIII protein expressed by the sequences set forth in Table 1 herein.
[00184] Согласно одному варианту реализации экспрессированный терапевтический белок FVIII является функциональным для лечения гемофилии А. Согласно некоторым вариантам реализации терапевтический белок FVIII не вызывает реакции иммунной системы.[00184] In one embodiment, the expressed therapeutic FVIII protein is functional for treating hemophilia A. In some embodiments, the therapeutic FVIII protein does not elicit an immune system response.
[00185] Согласно другому варианту реализации зкДНК-векторы, кодирующие терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), можно применять для получения химерного белка. Таким образом, в данном документе конкретно предусмотрено, что зкДНК-вектор, экспрессирующий химерный белок, можно вводить, например, в любую одну или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников. Согласно некоторым вариантам реализации, когда зкДНК-вектор, экспрессирующий FVIII, вводят младенцу или вводят субъекту in utero, зкДНК-вектор, экспрессирующий FVIII, можно вводить в любую одну или более тканей, выбранных из: печени, надпочечников, сердца, кишечника, легкого и желудка, или в стволовую клетку-предшественника клеток печени для лечения гемофилии A in vivo или ex vivo.[00185] In another embodiment, cccDNA vectors encoding a therapeutic FVIII protein or a fragment thereof (eg, a functional fragment) can be used to produce a chimeric protein. Thus, it is specifically provided herein that a cccDNA vector expressing the chimeric protein can be introduced, for example, into any one or more tissues selected from: liver, kidney, gallbladder, prostate, adrenal gland. In some embodiments, when a cccDNA vector expressing FVIII is administered to an infant or administered to a subject in utero, the cccDNA vector expressing FVIII can be administered to any one or more tissues selected from: liver, adrenal gland, heart, intestine, lung, and stomach, or into liver progenitor stem cells for the treatment of hemophilia A in vivo or ex vivo.
[00186] Гемофилия:[00186] Hemophilia:
[00187] Гемофилия А представляет собой генетический дефицит фактора свертывания крови VIII, который вызывает повышенное кровотечение и обычно поражает мужчин. В большинстве случаев он наследуется как Х-сцепленный рецессивный признак, хотя имеются случаи, которые возникают в результате спонтанных мутаций. В отношении симптомов гемофилии А различают эпизоды внутреннего или внешнего кровотечения. Индивидуумы с более тяжелой формой гемофилии страдают более тяжелыми и более частыми кровотечениями, в то время как другие с легкой формой гемофилии, как правило, имеют более незначительные симптомы, за исключением случаев хирургического вмешательства или серьезной травмы. Больные с гемофилией умеренной степени тяжести имеют различные симптомы, которые проявляются в диапазоне от тяжелой до легкой форм.[00187] Hemophilia A is a genetic deficiency of clotting factor VIII that causes increased bleeding and usually affects males. In most cases, it is inherited as an X-linked recessive trait, although there are cases that arise as a result of spontaneous mutations. Symptoms of hemophilia A include episodes of internal or external bleeding. Individuals with more severe hemophilia experience heavier and more frequent bleeding, while others with mild hemophilia tend to have more minor symptoms except in cases of surgery or serious injury. Patients with moderate hemophilia have a variety of symptoms that range from severe to mild.
[00188] Современные способы лечения для предотвращения кровотечений у людей, страдающих гемофилией А, включают лекарственный препарат фактора VIII. Большинство индивидуумов с тяжелой формой гемофилии нуждаются в регулярном введении внутривенного рекомбинантного фактора VIII или его плазматического концентрата. Рекомбинантный фактор свертывания крови VIII является одним из наиболее сложных белков для промышленного изготовления из-за низкой эффективности транскрипции его гена, значительной внутриклеточной потери его пробелка во время посттрансляционного процессинга и нестабильности секретируемого белка. Больные с легкой формой гемофилии могут контролировать свое состояние с помощью десмопрессина, лекарственного средства, которое высвобождает из стенок кровеносных сосудов фактор VIII, хранящийся в них.[00188] Current treatments for preventing bleeding in people with hemophilia A include a factor VIII drug. Most individuals with severe hemophilia require regular intravenous administration of recombinant factor VIII or its plasma concentrate. Recombinant coagulation factor VIII is one of the most difficult proteins to manufacture industrially due to the low efficiency of its gene transcription, significant intracellular loss of its proprotein during post-translational processing, and instability of the secreted protein. Patients with mild hemophilia can control their condition with desmopressin, a drug that releases factor VIII stored in blood vessel walls.
[00189] Существует много осложнений, связанных с лечением гемофилии А. У детей можно ввести легкодоступный внутривенный порт, чтобы свести к минимуму частую травматическую внутривенную канюляцию. Однако эти порты ассоциированы с высокой частотой инфицирования и риском образования сгустков на кончике катетера, что делает его бесполезным. Вирусные инфекции могут быть распространены у больных гемофилией из-за частых переливаний крови, которые подвергают пациентов риску заражения инфекциями, передаваемыми через кровь, такими как ВИЧ, гепатит В и гепатит С.Прионные инфекции также могут передаваться при переливаниях крови. Еще одно терапевтическое осложнение гемофилии А представляет собой выработку ингибирующих антител к фактору VIII из-за частых инфузий. Они вырабатываются, когда организм распознает введенный путем инфузий фактор VIII как чужеродный, поскольку организм не продуцирует свою собственную копию. У таких индивидуумов активированный фактор VII, предшественник фактора VIII в коагуляционном каскаде, может быть введен путем инфузий для лечения кровоизлияния у индивидуумов с гемофилией и антителами к замещающему фактору VIII.[00189] There are many complications associated with the treatment of hemophilia A. In children, an easily accessible intravenous port can be inserted to minimize frequent traumatic intravenous cannulation. However, these ports are associated with a high rate of infection and the risk of clots forming at the tip of the catheter, rendering it useless. Viral infections may be common in hemophilia patients due to frequent blood transfusions, which expose patients to blood-borne infections such as HIV, hepatitis B, and hepatitis C. Prion infections can also be transmitted through blood transfusions. Another therapeutic complication of hemophilia A is the development of inhibitory antibodies to factor VIII due to frequent infusions. They are produced when the body recognizes infused factor VIII as foreign because the body does not produce its own copy. In such individuals, activated factor VII, a precursor to factor VIII in the coagulation cascade, can be administered by infusion to treat hemorrhage in individuals with hemophilia and antibodies to replacement factor VIII.
[00190] Коагуляционный каскад[00190] Coagulation cascade
[00191] Коагуляция, также известная как свертывание, представляет собой процесс, при котором кровь превращается из жидкости в гель, образуя сгусток крови. Это потенциально приводит к гемостазу, прекращению кровопотери из поврежденного сосуда с последующим восстановлением. Механизм коагуляции включает активацию, адгезию и агрегацию тромбоцитов наряду с отложением и созреванием фибрина. Нарушения коагуляции представляют собой патологические состояния, которые могут привести к кровотечению (кровоизлиянию или синяку) или обструктивному свертыванию (тромбозу).[00191] Coagulation, also known as coagulation, is the process by which blood changes from a liquid to a gel, forming a blood clot. This potentially leads to hemostasis, the cessation of blood loss from the damaged vessel, followed by recovery. The mechanism of coagulation involves platelet activation, adhesion and aggregation along with fibrin deposition and maturation. Coagulation disorders are pathological conditions that can lead to bleeding (hemorrhage or bruising) or obstructive clotting (thrombosis).
[00192] Коагуляция начинается почти мгновенно после того, как повреждение кровеносного сосуда повредило эндотелий, выстилающий кровеносный сосуд. Воздействие крови на субэндотелиальное пространство инициирует два процесса: изменения в тромбоцитах и воздействие субэндотелиального тканевого фактора на плазматический фактор VII, что в конечном итоге приводит к образованию фибрина. Тромбоциты немедленно образуют пробку в месте повреждения; это называется первичным гемостазом. Одновременно происходит вторичный гемостаз: дополнительные факторы коагуляции или факторы свертывания, помимо фактора VII (включая фактор VIII), отвечают сложным каскадом с образованием нитей фибрина, которые укрепляют тромбоцитарную пробку.[00192] Coagulation begins almost immediately after injury to a blood vessel has damaged the endothelium lining the blood vessel. The effect of blood on the subendothelial space initiates two processes: changes in platelets and the effect of subendothelial tissue factor on plasma factor VII, which ultimately leads to the formation of fibrin. Platelets immediately form a plug at the site of injury; this is called primary hemostasis. At the same time, secondary hemostasis occurs: additional coagulation factors or clotting factors beyond factor VII (including factor VIII) respond in a complex cascade to form fibrin strands that strengthen the platelet plug.
[00193] Коагуляционный каскад вторичного гемостаза имеет два исходных пути, которые приводят к образованию фибрина. Они включают путь контактной активации (также известный как внутренний путь) и путь тканевого фактора (также известный как внешний путь), которые оба приводят к одним и тем же фундаментальным реакциям, которые продуцируют фибрин. Первичный путь инициации коагуляции крови представляет собой путь тканевого фактора (внешний). Пути представляют собой ряд реакций, в которых зимоген (неактивный предшественник фермента) сериновой протеазы и ее гликопротеиновый кофактор активируются, чтобы стать активными компонентами, которые затем катализируют следующую реакцию в каскаде, что в конечном итоге приводит к образованию перекрестно-сшитого фибрина. Факторы коагуляции обычно обозначаются римскими цифрами с добавленной строчной буквой «а», указывающей на активную форму.[00193] The coagulation cascade of secondary hemostasis has two initial pathways that lead to the formation of fibrin. These include the contact activation pathway (also known as the intrinsic pathway) and the tissue factor pathway (also known as the extrinsic pathway), which both lead to the same fundamental reactions that produce fibrin. The primary pathway for initiating blood coagulation is the tissue factor (extrinsic) pathway. The pathways are a series of reactions in which the zymogen (inactive enzyme precursor) of the serine protease and its glycoprotein cofactor are activated to become the active components, which then catalyze the next reaction in the cascade, ultimately leading to the formation of cross-linked fibrin. Coagulation factors are usually designated by Roman numerals with an added lowercase "a" to indicate the active form.
[00194] Факторы коагуляции обычно представляют собой сериновые протеазы (ферменты), которые действуют путем расщепления нисходящих белков. Исключение составляют тканевой фактор, FV, FVIII, FXIII. Тканевый фактор, FV и FVIII представляют собой гликопротеины, а фактор XIII представляет собой трансглутаминазу. Факторы коагуляции циркулируют в виде неактивных зимогенов. Таким образом, коагуляционный каскад классически делится на три пути. Путь тканевого фактора и путь контактной активации оба активируют «конечный общий путь» фактора X, тромбина и фибрина.[00194] Coagulation factors are typically serine proteases (enzymes) that act by breaking down downstream proteins. The exceptions are tissue factor, FV, FVIII, FXIII. Tissue factor, FV and FVIII are glycoproteins, and factor XIII is a transglutaminase. Coagulation factors circulate as inactive zymogens. Thus, the coagulation cascade is classically divided into three pathways. The tissue factor pathway and the contact activation pathway both activate the “final common pathway” of factor X, thrombin, and fibrin.
[00195] Основная роль пути тканевого фактора (внешнего) заключается в создании «тромбинового взрыва», процесса, с помощью которого происходит быстрое высвобождение тромбина, наиболее важного компонента коагуляционного каскада с точки зрения его функций активации обратной связи. FVIIa циркулирует в большем количестве, чем любой другой активированный фактор коагуляции. Процесс включает следующие этапы:[00195] The primary role of the tissue factor (extrinsic) pathway is to create the "thrombin burst", a process by which the rapid release of thrombin, the most important component of the coagulation cascade in terms of its feedback activation functions, occurs. FVIIa circulates in greater quantities than any other activated coagulation factor. The process includes the following steps:
[00196] Этап 1: После повреждения кровеносного сосуда FVII покидает кровоток и вступает в контакт с тканевым фактором (TF), экспрессируемым на клетках, несущих тканевой фактор (стромальные фибробласты и лейкоциты), с образованием активированного комплекса (TF-FVIIa).[00196] Step 1: Following blood vessel injury, FVII leaves the bloodstream and comes into contact with tissue factor (TF) expressed on tissue factor-bearing cells (stromal fibroblasts and leukocytes) to form an activated complex (TF-FVIIa).
[00197] Этап 2: TF-FVIIa активирует FIX и FX.[00197] Step 2: TF-FVIIa activates FIX and FX.
[00198] Этап 3: Сам FVII активируется тромбином, FXIa, FXII и FXa.[00198] Step 3: FVII itself is activated by thrombin, FXIa, FXII and FXa.
[00199] Этап 4: Активация FX (с образованием FXa) TF-FVIIa почти сразу ингибируется ингибитором пути тканевого фактора (TFPI).[00199] Step 4: FX activation (to form FXa) of TF-FVIIa is almost immediately inhibited by tissue factor pathway inhibitor (TFPI).
[00200] Этап 5: FXa и его кофактор FVa образуют протромбиназный комплекс, который активирует протромбин в тромбин.[00200] Step 5: FXa and its cofactor FVa form a prothrombinase complex that activates prothrombin to thrombin.
[00201] Этап 6: Затем тромбин активирует другие компоненты коагуляционного каскада, включая FV и FVIII (который образует комплекс с FIX), а также активирует и высвобождает FVIII из комплекса с фактором фон Виллебранда (vWF).[00201] Step 6: Thrombin then activates other components of the coagulation cascade, including FV and FVIII (which forms a complex with FIX), and activates and releases FVIII from its complex with von Willebrand factor (vWF).
[00202] Этап 7: FVIIIa представляет собой кофактор FIXa, и вместе они образуют «теназный» комплекс, который активирует FX; и таким образом цикл продолжается.[00202] Step 7: FVIIIa is a cofactor of FIXa, and together they form a “tenase” complex that activates FX; and thus the cycle continues.
[00203] Путь контактной активации (внутренний) начинается с образования первичного комплекса высокомолекулярного кининогена (HMWK), прекалликреина и FXII (фактора Хагемана) на коллагене. Прекалликреин превращается в калликреин, a FXII становится FXIIa. FXIIa превращает FXI в FXIa. Фактор Х1а активирует FIX, который со своим кофактором FVIIIa образует теназный комплекс, который активирует FX в FXa. Незначительную роль, которую играет путь контактной активации в инициировании образования сгустка, можно проиллюстрировать тем фактом, что пациенты с тяжелым дефицитом FXII, HMWK и прекалликреина не имеют нарушения гемостаза. Вместо этого система контактной активации в большей степени вовлечена в воспаление и врожденный иммунитет.[00203] The contact activation pathway (intrinsic) begins with the formation of a primary complex of high molecular weight kininogen (HMWK), prekallikrein and FXII (Hageman factor) on collagen. Prekallikrein becomes kallikrein, and FXII becomes FXIIa. FXIIa turns FXI into FXIa. Factor X1a activates FIX, which with its cofactor FVIIIa forms a tenase complex that activates FX to FXa. The minor role played by the contact activation pathway in initiating clot formation can be illustrated by the fact that patients with severe deficiencies of FXII, HMWK and prekallikrein do not have impaired hemostasis. Instead, the contact activation system is more involved in inflammation and innate immunity.
[00204] Конечный общий путь, который является общим для внутреннего и внешнего путей коагуляции, включает превращение протромбина в тромбин и фибриногена в фибрин. Тромбин выполняет множество функций, помимо превращения фибриногена в фибрин, строительный блок гемостатической пробки. Кроме того, он является наиболее важным активатором тромбоцитов, и помимо этого он активирует факторы VIII и V и их ингибитор, белок С (в присутствии тромбомодулина), а также активирует фактор XIII, который образует ковалентные связи, которые перекрестно сшивают полимеры фибрина, которые образуются из активированных мономеров.[00204] The final common pathway, which is common to the intrinsic and extrinsic coagulation pathways, involves the conversion of prothrombin to thrombin and fibrinogen to fibrin. Thrombin has many functions besides converting fibrinogen to fibrin, the building block of the hemostatic plug. In addition, it is the most important platelet activator, and in addition to this it activates factors VIII and V and their inhibitor, protein C (in the presence of thrombomodulin), and also activates factor XIII, which forms covalent bonds that cross-link the fibrin polymers that are formed from activated monomers.
[00205] После активации посредством путей контактного фактора или тканевого фактора коагуляционный каскад поддерживается в протромботическом состоянии за счет продолжающейся активации FVIII и FIX с образованием теназного комплекса, пока он не будет подавлен антикоагулянтными путями. Способы включают введение субъекту эффективного количества композиции, содержащей зкДНК-вектор, кодирующий терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), как описано в данном документе. Как будет понятно квалифицированному практикующему врачу, термин «эффективное количество» относится к количеству введенной композиции зкДНК, которое приводит к экспрессии белка в «терапевтически эффективном количестве» для лечения заболевания или нарушения.[00205] Once activated through the contact factor or tissue factor pathways, the coagulation cascade is maintained in a prothrombotic state by continued activation of FVIII and FIX to form the tenase complex until it is suppressed by the anticoagulant pathways. The methods involve administering to a subject an effective amount of a composition comprising a cccDNA vector encoding a therapeutic FVIII protein or a fragment thereof (eg, a functional fragment) as described herein. As will be understood by a skilled practitioner, the term "effective amount" refers to the amount of the administered cccDNA composition that results in expression of the protein in a "therapeutically effective amount" for treating a disease or disorder.
[00206] Диапазоны дозировок для композиции, содержащей зкДНК-вектор, кодирующий терапевтический белок FVIII или его фрагмент (например, функциональный фрагмент), зависят от эффективности (например, эффективности промотора) и включают количества, достаточно большие для получения целевого эффекта, например, экспрессии целевого терапевтического белка FVIII для лечения фенилкетонурии (гемофилии А). Дозировка не должна быть настолько большой, чтобы вызывать неприемлемые нежелательные побочные эффекты. Обычно дозировка будет варьироваться в зависимости от конкретных характеристик зкДНК-вектора, эффективности экспрессии, а также в зависимости от возраста, состояния и пола пациента. Дозировка может быть определена специалистом в данной области техники и, в отличие от обычных ААВ-векторов, также может быть скорректирована индивидуальным врачом в случае любого осложнения, поскольку зкДНК-векторы не содержат активирующие иммунную систему капсидные белки, которые препятствуют повторному дозированию.[00206] Dosage ranges for a composition containing a cccDNA vector encoding a therapeutic FVIII protein or a fragment (e.g., a functional fragment) thereof depend on effectiveness (e.g., promoter effectiveness) and include amounts large enough to produce the desired effect, e.g., expression target therapeutic protein FVIII for the treatment of phenylketonuria (hemophilia A). The dosage should not be so high as to cause unacceptable unwanted side effects. Typically, dosage will vary depending on the specific characteristics of the cccDNA vector, expression efficiency, and the age, condition, and gender of the patient. The dosage can be determined by one skilled in the art and, unlike conventional AAV vectors, can also be adjusted by the individual physician in case of any complication, since cccDNA vectors do not contain immune system-activating capsid proteins that prevent repeated dosing.
[00207] Введение композиций зкДНК, описанных в данном документе, можно повторять в течение ограниченного периода времени. Согласно некоторым вариантам реализации дозы вводят периодически или с помощью импульсного введения. Согласно предпочтительному варианту реализации указанные выше дозы вводят в течение нескольких месяцев. Продолжительность лечения зависит от клинического прогресса и ответа пациента на терапию. Также предусмотрены «бустерные» обработки с течением времени. Кроме того, уровень экспрессии можно титровать по мере роста субъекта.[00207] Administration of the cccDNA compositions described herein can be repeated over a limited period of time. In some embodiments, doses are administered intermittently or by pulsing. In a preferred embodiment, the above doses are administered over several months. The duration of treatment depends on clinical progress and the patient's response to therapy. “Booster” treatments over time are also provided. In addition, the level of expression can be titrated as the subject grows.
[00208] Терапевтический белок FVIII может быть экспрессирован у субъекта в течение по меньшей мере 1 недели, по меньшей мере 2 недель, по меньшей мере 1 месяца, по меньшей мере 2 месяцев, по меньшей мере 6 месяцев, по меньшей мере 12 месяцев/одного года, по меньшей мере 2 лет, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 15 лет, по меньшей мере 20 лет, по меньшей мере 30 лет, по меньшей мере 40 лет, по меньшей мере 50 лет или более. Долговременная экспрессия может быть достигнута путем повторного введения зкДНК-векторов, описанных в данном документе, через заранее определенные или желательные интервалы.[00208] The therapeutic FVIII protein may be expressed in the subject for at least 1 week, at least 2 weeks, at least 1 month, at least 2 months, at least 6 months, at least 12 months/one years, at least 2 years, at least 5 years, at least 10 years, at least 15 years, at least 20 years, at least 30 years, at least 40 years, at least 50 years or more. Long-term expression can be achieved by reintroducing the cccDNA vectors described herein at predetermined or desired intervals.
[00209] В данном документе термин «терапевтически эффективное количество» представляет собой количество экспрессированного терапевтического белка FVIII или его функционального фрагмента, которое достаточно для получения статистически значимого, измеримого изменения экспрессии биомаркера заболевания или уменьшения конкретного симптома заболевания (см. «Измерение эффективности» ниже). Такие эффективные количества можно откалибровать в клинических исследованиях, а также в исследованиях на животных для конкретной композиции зкДНК.[00209] As used herein, the term “therapeutically effective amount” is an amount of expressed therapeutic FVIII protein or functional fragment thereof that is sufficient to produce a statistically significant, measurable change in the expression of a disease biomarker or a reduction in a specific disease symptom (see “Measurement of Effectiveness” below) . Such effective amounts can be calibrated in clinical studies as well as in animal studies for a particular cDNA composition.
[00210] Точные количества зкДНК-вектора, необходимые для введения, зависят от суждения практикующего врача и являются индивидуальными для каждого индивидуума. Подходящие схемы введения также являются вариабельными, но типичным является начальное введение с последующими повторными дозами с одним или более интервалами с последующей инъекцией или другим введением. В качестве альтернативы, предусмотрена непрерывная внутривенная инфузия, достаточная для поддержания концентраций в крови в диапазонах, указанных для видов терапии in vivo, в частности, для лечения острых заболеваний/нарушений.[00210] The exact amounts of cccDNA vector required for administration depend on the judgment of the practitioner and are individual to each individual. Suitable dosing regimens are also variable, but typical is an initial administration followed by repeat doses at one or more intervals followed by an injection or other administration. Alternatively, a continuous intravenous infusion sufficient to maintain blood concentrations within the ranges indicated for in vivo therapies, particularly for the treatment of acute diseases/disorders, is provided.
[00211] Агенты, которые можно применять в способах и композициях, описанных в данном документе, можно вводить местно, внутривенно (с помощью болюсной или непрерывной инфузии), с помощью внутриклеточной инъекции, внутритканевой инъекции, перорально, путем ингаляции, внутрибрюшинно, внутримышечно, подкожно, внутрь полости, а также они могут быть доставлены с помощью перистальтических средств, при необходимости, или других средств, известных специалистам в данной области техники. При необходимости, агент может быть введен системно. Он также может быть введен in utero.[00211] Agents that can be used in the methods and compositions described herein can be administered topically, intravenously (by bolus or continuous infusion), by intracellular injection, interstitial injection, orally, by inhalation, intraperitoneally, intramuscularly, subcutaneously , into the cavity, and they can also be delivered by peristaltic means, if necessary, or other means known to those skilled in the art. If necessary, the agent can be administered systemically. It can also be administered in utero.
[00212] Эффективность данного лечения гемофилии А может быть определена квалифицированным врачом. Однако лечение считается «эффективным лечением», в соответствии с использованием этого термина в данном документе, если любой или все признаки или симптомы заболевания или нарушения изменяются благоприятным образом, или если другие клинически принятые симптомы или маркеры заболевания улучшаются или облегчаются, например, по меньшей мере на 10% после лечения зкДНК-вектором, кодирующим FVIII или его функциональный фрагмент. Эффективность также может быть измерена по отсутствию у индивидуума ухудшения, которое оценивается по стабилизации заболевания или по потребности в медицинских вмешательствах (т.е. прогрессирование заболевания прекращается или по меньшей мере замедляется). Способы измерения этих показателей известны специалистам в данной области техники и/или описаны в данном документе. Лечение включает любое лечение заболевания у индивидуума или животного (некоторые неограничивающие примеры включают человека или млекопитающее) и включает: (1) ингибирование заболевания, например, прекращение или замедление прогрессирования заболевания или нарушения; или (2) облегчение заболевания, например, вызывающее регресс симптомов; и (3) предотвращение или снижение вероятности развития заболевания, или предотвращение вторичных заболеваний/нарушений, ассоциированных с указанным заболеванием, таких как печеночная или почечная недостаточность. Эффективное количество для лечения заболевания означает такое количество, которое, при введении нуждающемуся в этом млекопитающему, является достаточным для обеспечения эффективного лечения, в соответствии с определением этого термина в данном документе, этого заболевания.[00212] The effectiveness of a given treatment for hemophilia A can be determined by a qualified physician. However, treatment is considered "effective treatment", as that term is used herein, if any or all of the signs or symptoms of the disease or disorder are modified in a favorable manner, or if other clinically accepted symptoms or markers of the disease are improved or alleviated, e.g. by 10% after treatment with a cccDNA vector encoding FVIII or a functional fragment thereof. Effectiveness can also be measured by the individual's lack of deterioration, which is assessed by stabilization of the disease or need for medical intervention (ie, progression of the disease stops or at least slows down). Methods for measuring these indicators are known to those skilled in the art and/or are described herein. Treatment includes any treatment of a disease in an individual or animal (some non-limiting examples include a human or mammal) and includes: (1) inhibiting the disease, such as stopping or slowing the progression of the disease or disorder; or (2) alleviation of the disease, such as causing regression of symptoms; and (3) preventing or reducing the likelihood of developing a disease, or preventing secondary diseases/disorders associated with the disease, such as liver or kidney failure. An effective amount for treating a disease means an amount that, when administered to a mammal in need thereof, is sufficient to provide effective treatment, as that term is defined herein, of that disease.
[00213] Эффективность агента может быть определена путем оценки физических показателей, которые являются специфическими для гемофилии А. Стандартные методы анализа показателей гемофилии А известны в данной области техники.[00213] The effectiveness of an agent can be determined by assessing physical indicators that are specific to hemophilia A. Standard methods for analyzing hemophilia A indicators are known in the art.
[00214] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, также может кодировать кофакторы или другие полипептиды, смысловые или антисмысловые олигонуклеотиды или РНК (кодирующие или некодирующие; например, киРНК, кшРНК, микро-РНК и их антисмысловые аналоги (например, antagoMiR)), которые можно применять в сочетании с белком FVIII, экспрессируемым с зкДНК. Кроме того, экспрессионные кассеты, содержащие последовательность, кодирующую белок FVIII, также могут включать экзогенную последовательность, которая кодирует репортерный белок, который будет использоваться в экспериментальных или диагностических целях, такой как р-лактамаза, р-галактозидаза (LacZ), щелочная фосфатаза, тимидинкиназа, зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансфераза (CAT), люцифераза и другие, хорошо известные в данной области техники.[00214] In some embodiments, the cDNA FVIII protein expression vector disclosed herein may also encode cofactors or other polypeptides, sense or antisense oligonucleotides, or RNA (coding or noncoding; e.g., siRNA, shRNA, micro-RNA, and the like antisense analogues (eg, antagoMiR)), which can be used in combination with the FVIII protein expressed from cccDNA. In addition, expression cassettes containing a sequence encoding the FVIII protein may also include an exogenous sequence that encodes a reporter protein to be used for experimental or diagnostic purposes, such as β-lactamase, β-galactosidase (LacZ), alkaline phosphatase, thymidine kinase , green fluorescent protein (GFP), chloramphenicol acetyltransferase (CAT), luciferase and others well known in the art.
[00215] Согласно одному варианту реализации зкДНК-вектор содержит последовательность нуклеиновой кислоты для экспрессии белка FVIII, который является функциональным для лечения гемофилии А. Согласно предпочтительному варианту реализации терапевтический белок FVIII не вызывает реакции иммунной системы, если этого не требуется.[00215] In one embodiment, the cccDNA vector contains a nucleic acid sequence for expression of an FVIII protein that is functional for treating hemophilia A. In a preferred embodiment, the therapeutic FVIII protein does not cause an immune system response unless required.
III. ЗкДНК-вектор в целом для применения в получении терапевтических белков FVIIIIII. General cccDNA vector for use in the production of therapeutic FVIII proteins
[00216] Варианты реализации настоящего изобретения основаны на способах и композициях, содержащих линейные дуплексные векторы с замкнутыми концами (зкДНК), которые могут экспрессировать трансген FVIII. Согласно некоторым вариантам реализации трансген представляет собой последовательность, кодирующую белок FVIII. ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, не ограничены размером, что обеспечивает, например, экспрессию всех компонентов, необходимых для экспрессии трансгена, с одного вектора. ЗкДНК-вектор для экспрессии белка FVIII предпочтительно является дуплексным, например, самокомплементарным, по меньшей мере в части молекулы, такой как экспрессионная кассета (например, зкДНК не является двухцепочечной кольцевой молекулой). ЗкДНК-вектор имеет ковалентно замкнутые концы и, таким образом, устойчив к расщеплению экзонуклеазой (например, экзонуклеазой I или экзонуклеазой III), например, более часа при 37°С.[00216] Embodiments of the present invention are based on methods and compositions containing linear closed-end duplex (ccDNA) vectors that can express an FVIII transgene. In some embodiments, the transgene is a sequence encoding an FVIII protein. The cDNA FVIII protein expression vectors described herein are not limited in size, allowing, for example, the expression of all components required for transgene expression from a single vector. The cccDNA vector for expression of the FVIII protein is preferably duplex, eg, self-complementary, in at least part of the molecule, such as an expression cassette (eg, the ccDNA is not a double-stranded circular molecule). The cDNA vector has covalently closed ends and is thus resistant to digestion by an exonuclease (eg, exonuclease I or exonuclease III), for example, for more than an hour at 37°C.
[00217] В общем случае зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ. Последовательности ITR выбирают из любых из: (i) по меньшей мере одного WT-ITR и по меньшей мере одного модифицированного инвертированного концевого повтора ААВ (mod-ITR) (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию в отношении друг друга (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT-ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию.[00217] In general, the cDNA vector for expression of the FVIII protein disclosed herein contains, in the 5' to 3' direction: the first inverted terminal repeat (ITR) of an adeno-associated virus (AAV), a nucleotide sequence of interest (e.g. , an expression cassette described herein), and a second AAV ITR. The ITR sequences are selected from any of: (i) at least one WT-ITR and at least one modified AAB inverted terminal repeat (mod-ITR) (eg, asymmetric modified ITRs); (ii) two modified ITRs, wherein the mod-ITR pair has a different three-dimensional spatial organization in relation to each other (e.g., asymmetric modified ITRs), or (iii) a pair of symmetric or substantially symmetric WT-WT-ITRs, each WT-ITR has the same three-dimensional spatial organization, or (iv) pairs of symmetric or substantially symmetric modified ITRs, each mod-ITR having the same three-dimensional spatial organization.
[00218] В данный документ включены способы и композиции, содержащие зкДНК-вектор для продукции белка FVIII, которые могут дополнительно включать систему доставки, такую как, но не ограничиваясь этим, система доставки на основе липосомных наночастиц. В данном документе раскрыты неограничивающие примерные системы на основе липосомных наночастиц, предусмотренные для применения. Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, содержащая зкДНК и ионизируемый липид. Например, состав липидных наночастиц, который получают и нагружают зкДНК-вектором, полученным указанным способом, раскрыт в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., которая полностью включена в данный документ.[00218] Included herein are methods and compositions containing a cccDNA vector for production of FVIII protein, which may further include a delivery system, such as, but not limited to, a liposomal nanoparticle delivery system. Disclosed herein are non-limiting exemplary liposome nanoparticle systems contemplated for use. In accordance with some aspects of the present disclosure, a lipid nanoparticle is provided comprising cccDNA and an ionizable lipid. For example, the composition of lipid nanoparticles that are prepared and loaded with a cccDNA vector obtained by this method is disclosed in international application PCT/US2018/050042, filed September 7, 2018, which is incorporated herein in its entirety.
[00219] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, не имеют ограничений по упаковке, налагаемых ограниченным пространством внутри вирусного капсида. ЗкДНК-векторы представляют собой жизнеспособную продуцируемую эукариотами альтернативу плазмидным ДНК-векторам, продуцируемым прокариотами, в отличие от инкапсулированных геномов ААВ. Это позволяет вставлять контрольные элементы, например, регуляторные переключатели, раскрытые в данном документе, большие трансгены, множественные трансгены и т.д.[00219] The cDNA FVIII protein expression vectors disclosed herein do not have packaging restrictions imposed by limited space within the viral capsid. CccDNA vectors provide a viable eukaryotic-produced alternative to plasmid DNA vectors produced by prokaryotes, as opposed to encapsulated AAV genomes. This allows the insertion of control elements, such as regulatory switches disclosed herein, large transgenes, multiple transgenes, etc.
[00220] ФИГ. 1А-1Е схематически показывают неограничивающие примерные зкДНК-векторы для экспрессии белка FVIII или соответствующую последовательность зкДНК-плазмид. ЗкДНК-векторы для экспрессии белка FVIII являются бескапсидными и могут быть получены из плазмиды, кодирующей в указанном порядке: первый ITR, экспрессионную кассету, содержащую трансген, и второй ITR. Экспрессионная кассета может включать одну или более регуляторных последовательностей, которые обеспечивают и/или контролируют экспрессию трансгена, например, экспрессионная кассета может содержать один или более из следующих элементов в указанном порядке: энхансер/промотор, ORF репортера (трансгена), посттранскрипционный регуляторный элемент (например, WPRE) и сигнал полиаденилирования и терминации (например, BGH поли(А)).[00220] FIG. 1A-1E schematically show non-limiting exemplary ccDNA vectors for FVIII protein expression or corresponding ccDNA plasmid sequence. CCDNA vectors for expression of the FVIII protein are capsidless and can be obtained from a plasmid encoding, in this order: a first ITR, an expression cassette containing the transgene, and a second ITR. An expression cassette may include one or more regulatory sequences that mediate and/or control expression of a transgene, for example, an expression cassette may contain one or more of the following elements in this order: enhancer/promoter, reporter (transgene) ORF, post-transcriptional regulatory element (e.g. , WPRE) and a polyadenylation and termination signal (eg, BGH poly(A)).
[00221] Экспрессионная кассета также может содержать участок внутренней посадки рибосомы (IRES) и/или элемент 2А. Цис-регуляторные элементы включают, но не ограничиваются перечисленными, промотор, рибопереключатель, инсулятор, mir-регулируемый элемент, посттранскрипционный регуляторный элемент, промотор, специфический для ткани и типа клеток, и энхансер. Согласно некоторым вариантам реализации ITR может действовать как промотор трансгена, например, белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор содержит дополнительные компоненты для регуляции экспрессии трансгена, например, регуляторный переключатель, которые описаны в данном документе в разделе, озаглавленном «Регуляторные переключатели», для контроля и регуляции экспрессии белка FVIII, и могут включать, при необходимости, регуляторный переключатель, который представляет собой «аварийный выключатель» (kill switch) для обеспечения контролируемой гибели клетки, содержащей зкДНК-вектор.[00221] The expression cassette may also contain an internal ribosome entry site (IRES) and/or a 2A element. Cis-regulatory elements include, but are not limited to, a promoter, a riboswitch, an insulator, a mir-regulated element, a post-transcriptional regulatory element, a tissue- and cell type-specific promoter, and an enhancer. In some embodiments, the ITR may act as a promoter of a transgene, such as the FVIII protein. In some embodiments, the cccDNA vector contains additional components for regulating transgene expression, such as a regulatory switch, which are described herein in the section entitled "Regulatory Switches" for controlling and regulating FVIII protein expression, and may include, if necessary, a regulatory switch. switch, which is a “kill switch” to ensure controlled death of the cell containing the cccDNA vector.
[00222] Экспрессионная кассета может содержать более 4000 нуклеотидов, 5000 нуклеотидов, 10000 нуклеотидов или 20000 нуклеотидов, или 30000 нуклеотидов, или 40000 нуклеотидов, или 50000 нуклеотидов, или любой диапазон примерно от 4000 до 10000 нуклеотидов, или 10000-50000 нуклеотидов, или более 50000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 50000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 75000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 10000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 1000 до 10000 нуклеотидов. Согласно некоторым вариантам реализации экспрессионная кассета может содержать трансген с длиной в диапазоне от 500 до 5000 нуклеотидов. Векторы зкДНК не имеют ограничений по размеру ААВ-векторов, заключенных в капсид, что позволяет доставлять экспрессионную кассету большого размера для обеспечения эффективной экспрессии трансгена. Согласно некоторым вариантам реализации зкДНК-вектор лишен специфического для прокариот метилирования.[00222] The expression cassette may contain more than 4000 nucleotides, 5000 nucleotides, 10000 nucleotides or 20000 nucleotides, or 30000 nucleotides, or 40000 nucleotides, or 50000 nucleotides, or any range from about 4000 to 10000 nucleotides, or 10000-50000 nucleotides ov, or more 50,000 nucleotides. In some embodiments, the expression cassette may contain a transgene with a length ranging from 500 to 50,000 nucleotides. In some embodiments, the expression cassette may contain a transgene with a length ranging from 500 to 75,000 nucleotides. In some embodiments, the expression cassette may contain a transgene with a length ranging from 500 to 10,000 nucleotides. In some embodiments, the expression cassette may contain a transgene with a length ranging from 1,000 to 10,000 nucleotides. In some embodiments, the expression cassette may contain a transgene with a length ranging from 500 to 5000 nucleotides. There are no restrictions on the size of cccDNA vectors enclosed in a capsid, allowing delivery of a large expression cassette to ensure efficient transgene expression. In some embodiments, the cccDNA vector lacks prokaryote-specific methylation.
[00223] ЗкДНК-экспрессионная кассета может включать, например, экспрессируемую экзогенную последовательность (например, открытую рамку считывания) или трансген, который кодирует белок, который либо отсутствует, либо не активен, либо обладает недостаточной активностью у субъекта-реципиента, или ген, который кодирует белок, имеющий целевой биологический или терапевтический эффект. Трансген может кодировать продукт гена, функция которого может заключаться в корректировке экспрессии дефектного гена или транскрипта. В принципе, экспрессионная кассета может включать любой ген, который кодирует белок, полипептид или РНК, который либо снижен, либо отсутствует из-за мутации, или который обеспечивает терапевтическую пользу при сверхэкспрессии, и рассматривается, как включенная в объем настоящего раскрытия.[00223] The cDNA expression cassette may include, for example, an exogenous expressed sequence (e.g., an open reading frame) or a transgene that encodes a protein that is either absent, inactive, or deficient in activity in the recipient subject, or a gene that encodes a protein that has a target biological or therapeutic effect. The transgene may encode a gene product, the function of which may be to correct the expression of a defective gene or transcript. In principle, an expression cassette can include any gene that encodes a protein, polypeptide or RNA that is either reduced or absent due to mutation, or that provides a therapeutic benefit when overexpressed, and is considered to be included within the scope of the present disclosure.
[00224] Экспрессионная кассета может содержать любой трансген (например, кодирующий белок FVIII), например, белок FVIII, который можно применять для лечения гемофилии А у субъекта, то есть терапевтический белок FVIII. ЗкДНК-вектор можно применять для доставки и экспрессии любого белка FVIII, представляющего интерес, у субъекта, по отдельности или в комбинации с нуклеиновыми кислотами, кодирующими полипептиды, или некодирующими нуклеиновыми кислотами (например, РНКи, miR и т.д.), а также экзогенных генов и нуклеотидных последовательностей, включая вирусные последовательности, в геноме субъектов, например, последовательности вируса ВИЧ и тому подобное. Предпочтительно зкДНК-вектор, раскрытый в данном документе, применяют для терапевтических целей (например, для медицинских, диагностических или ветеринарных целей) или для иммуногенных полипептидов. Согласно определенным вариантам реализации зкДНК-вектор можно применять для экспрессии любого гена, представляющего интерес, у субъекта, который включает один или более полипептидов, пептидов, рибозимов, пептидных нуклеиновых кислот, миРНК, РНКи, антисмысловых олигонуклеотидов, антисмысловых полинуклеотидов или РНК (кодирующих или некодирующих; например, киРНК, кшРНК, микро-РНК и их антисмысловых аналогов (например, antagoMiR)), антител, слитых белков или любую их комбинацию.[00224] The expression cassette may contain any transgene (eg, encoding an FVIII protein), for example, an FVIII protein that can be used to treat hemophilia A in a subject, that is, a therapeutic FVIII protein. The cccDNA vector can be used to deliver and express any FVIII protein of interest in a subject, alone or in combination with polypeptide-encoding nucleic acids or non-coding nucleic acids (eg, RNAi, miR, etc.), as well as exogenous genes and nucleotide sequences, including viral sequences, in the genome of subjects, for example, HIV virus sequences and the like. Preferably, the cDNA vector disclosed herein is used for therapeutic purposes (eg, medical, diagnostic or veterinary purposes) or immunogenic polypeptides. In certain embodiments, the cccDNA vector can be used to express any gene of interest in a subject, which includes one or more polypeptides, peptides, ribozymes, peptide nucleic acids, siRNA, RNAi, antisense oligonucleotides, antisense polynucleotides, or RNAs (encoding or non-coding ; e.g., siRNA, shRNA, micro-RNA and their antisense analogues (e.g., antagoMiR)), antibodies, fusion proteins, or any combination thereof.
[00225] Экспрессионная кассета также может кодировать полипептиды, смысловые или антисмысловые олигонуклеотиды или РНК (кодирующие или некодирующие; например, миРНК, кшРНК, микро-РНК и их антисмысловые аналоги (например, antagoMiR)). Экспрессионные кассеты могут включать экзогенную последовательность, которая кодирует репортерный белок, который будет использоваться в экспериментальных или диагностических целях, такой как β-лактамаза, β-галактозидаза (LacZ), щелочная фосфатаза, тимидинкиназа, зеленый флуоресцентный белок (GFP), хлорамфениколацетилтрансфераза (CAT), люцифераза и другие, хорошо известные в данной области техники.[00225] An expression cassette may also encode polypeptides, sense or antisense oligonucleotides, or RNA (coding or non-coding; e.g., miRNA, shRNA, micro-RNA, and antisense analogs thereof (e.g., antagoMiR)). Expression cassettes may include an exogenous sequence that encodes a reporter protein to be used for experimental or diagnostic purposes, such as β-lactamase, β-galactosidase (LacZ), alkaline phosphatase, thymidine kinase, green fluorescent protein (GFP), chloramphenicol acetyltransferase (CAT) , luciferase and others well known in the art.
[00226] Последовательности, обеспеченные в экспрессионной кассете, экспрессионная конструкция зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, могут быть оптимизированы по кодонам для целевой клетки-хозяина. В данном документе термин «оптимизированный по кодонам» или «оптимизация кодонов» относится к процессу модификации последовательности нуклеиновой кислоты для усиления экспрессии в клетках позвоночного, представляющего интерес, например, мыши или человека, путем замены по меньшей мере одного или более чем одного или значительного числа кодонов нативной последовательности (например, прокариотической последовательности) кодонами, которые чаще или наиболее часто используются в генах этого позвоночного. Различные виды проявляют определенное предпочтение в отношении некоторых кодонов конкретной аминокислоты. Как правило, оптимизация кодонов не изменяет аминокислотную последовательность исходного транслированного белка. Оптимизированные кодоны могут быть определены с использованием, например, платформы Gene Forge® для оптимизации кодонов и синтеза генов по заказу от Aptagen (Aptagen, Inc., 2190 Fox Mill Rd. Suite 300, Херндон, Виржиния, 20171) или другой общедоступной базы данных. Согласно некоторым вариантам реализации нуклеиновая кислота, кодирующая белок FVIII, оптимизирована для экспрессии у человека и/или представляет собой FVIII человека или его функциональный фрагмент, как известно в данной области техники.[00226] The sequences provided in the expression cassette expression construct of the cDNA vector for expression of the FVIII protein described herein can be codon optimized for the target host cell. As used herein, the term “codon optimized” or “codon optimization” refers to the process of modifying a nucleic acid sequence to enhance expression in vertebrate cells of interest, such as a mouse or human, by replacing at least one or more than one or a significant number codons of a native sequence (e.g., a prokaryotic sequence) by the codons that are most or most frequently used in the genes of that vertebrate. Different species exhibit specific preferences for certain codons of a particular amino acid. Typically, codon optimization does not change the amino acid sequence of the original translated protein. Optimized codons can be determined using, for example, the Gene Forge ® platform for codon optimization and custom gene synthesis from Aptagen (Aptagen, Inc., 2190 Fox Mill Rd. Suite 300, Herndon, VA, 20171) or other publicly available database. In some embodiments, the nucleic acid encoding the FVIII protein is optimized for expression in humans and/or is human FVIII or a functional fragment thereof, as known in the art.
[00227] Трансген, экспрессируемый зкДНК-вектором для экспрессии белка FVIII, как описано в данном документе, кодирует белок FVIII. ЗкДНК-векторы для экспрессии белка FVIII отличаются от экспрессионных векторов на основе плазмид по многим структурным признакам. ЗкДНК-векторы могут обладать одним или более из следующих признаков: отсутствие исходной (т.е. не вставленной) бактериальной ДНК, отсутствие прокариотической точки начала репликации, самодостаточность, т.е. им не требуются никакие последовательности, кроме двух ITR, включая сайт связывания Rep и сайт концевого разрешения (RBS и TRS), и экзогенную последовательность между ITR, присутствие последовательностей ITR, которые образуют шпильки, и отсутствие метилирования ДНК бактериального типа или фактически любого другого метилирования, которое считается аномальным у млекопитающего-хозяина. В целом векторы согласно настоящему изобретению предпочтительно не содержат никакой прокариотической ДНК, но предусмотрено, что некоторая прокариотическая ДНК может быть вставлена в виде экзогенной последовательности, в качестве неограничивающего примера, в промоторной или энхансерной области. Еще один важный признак, отличающий зкДНК-векторы от экспрессионных векторов на основе плазмид, заключается в том, что зкДНК-векторы представляют собой одноцепочечные линейные ДНК с замкнутыми концами, в то время как плазмиды всегда представляют собой двухцепочечные ДНК.[00227] The transgene expressed by the cDNA FVIII protein expression vector as described herein encodes the FVIII protein. CccDNA vectors for FVIII protein expression differ from plasmid-based expression vectors in many structural features. CccDNA vectors may have one or more of the following characteristics: absence of original (i.e., uninserted) bacterial DNA, absence of a prokaryotic origin of replication, self-sufficiency, i.e. they do not require any sequences other than the two ITRs, including the Rep binding site and the terminal resolution site (RBS and TRS), and exogenous sequence between the ITRs, the presence of ITR sequences that form hairpins, and the absence of bacterial-type DNA methylation or virtually any other methylation, which is considered abnormal in the mammalian host. In general, the vectors of the present invention preferably do not contain any prokaryotic DNA, but it is contemplated that some prokaryotic DNA may be inserted as an exogenous sequence, by way of non-limiting example, in a promoter or enhancer region. Another important feature that distinguishes cccDNA vectors from plasmid-based expression vectors is that cccDNA vectors are single-stranded linear DNA with closed ends, while plasmids are always double-stranded DNA.
[00228] ЗкДНК-векторы для экспрессии белка FVIII, продуцируемые с помощью способов, предложенных в данном документе, предпочтительно имеют линейную и непрерывную структуру, а не прерывистую структуру, согласно определению с помощью анализа с использованием расщепления рестрикционными ферментами (ФИГ. 4D). Как полагают, линейная и непрерывная структура более устойчива к атаке клеточными эндонуклеазами, а также с меньшей вероятностью рекомбинируется и вызывает мутагенез. Таким образом, зкДНК-вектор в виде линейной и непрерывной структуры является предпочтительным вариантом реализации. Непрерывный, линейный, одноцепочечный, с внутримолекулярным дуплексом зкДНК-вектор может иметь ковалентно связанные концевые участки без последовательностей, кодирующих белки капсида ААВ. Эти зкДНК-векторы структурно отличаются от плазмид (включая зкДНК-плазмиды, описанные в данном документе), которые представляют собой кольцевые дуплексные молекулы нуклеиновых кислот бактериального происхождения. Комплементарные цепи плазмид могут быть разделены после денатурации с получением двух молекул нуклеиновых кислот, в то время как зкДНК-векторы, которые имеют комплементарные цепи, представляют собой единую молекулу ДНК и, следовательно, остаются единой молекулой даже после денатурации. Согласно некоторым вариантам реализации зкДНК-векторы, описанные в данном документе, могут быть получены без метилирования оснований ДНК прокариотического типа, в отличие от плазмид. Таким образом, зкДНК-векторы и зкДНК-плазмиды различаются как по структуре (в частности, линейная в сопоставлении с кольцевой), так и с точки зрения методов, используемых для получения и очистки этих различных объектов (см. ниже), а также с точки зрения метилирования ДНК, которое относится к прокариотическому типу для зкДНК-плазмид и эукариотическому типу для зкДНК-вектора.[00228] CCDNA FVIII protein expression vectors produced using the methods provided herein preferably have a linear and continuous structure rather than a discontinuous structure, as determined by restriction enzyme digestion analysis (FIG. 4D). A linear and continuous structure is believed to be more resistant to attack by cellular endonucleases and is also less likely to recombine and cause mutagenesis. Thus, the cccDNA vector in the form of a linear and continuous structure is the preferred embodiment. A continuous, linear, single-stranded, intramolecular duplex cDNA vector may have covalently linked terminal regions without sequences encoding AAV capsid proteins. These cDNA vectors are structurally different from plasmids (including the cDNA plasmids described herein), which are circular duplex nucleic acid molecules of bacterial origin. The complementary strands of plasmids can be separated after denaturation to produce two nucleic acid molecules, while cccDNA vectors, which have complementary strands, constitute a single DNA molecule and therefore remain a single molecule even after denaturation. In some embodiments, the cDNA vectors described herein can be produced without methylation of prokaryotic DNA bases, unlike plasmids. Thus, cccDNA vectors and ccDNA plasmids differ both in structure (in particular, linear versus circular), and in terms of the methods used to obtain and purify these different entities (see below), as well as in terms of in terms of DNA methylation, which refers to the prokaryotic type for cDNA plasmids and the eukaryotic type for cDNA vectors.
[00229] Существует несколько преимуществ применения зкДНК-вектора для экспрессии белка FVIII, как описано в данном документе, по сравнению с экспрессионными векторами на основе плазмид, такие преимущества включают, но не ограничиваются перечисленными: 1) плазмиды содержат последовательности бактериальной ДНК и подвергаются метилированию, специфическому для прокариотов, например, метилированию 6-метиладенозина и 5-метилцитозина, в то время как последовательности бескапсидного ААВ-вектора имеют эукариотическое происхождение и не подвергаются метилированию, специфическому для прокариотов; в результате бескапсидные ААВ-векторы с меньшей вероятностью индуцируют воспалительные и иммунные ответы по сравнению с плазмидами; 2) в то время как плазмиды требуют присутствия гена устойчивости во время производственного способа, зкДНК-векторы не требуют; 3) в то время как кольцевая плазмида не доставляется в ядро при введении в клетку и требует чрезмерной нагрузки, чтобы преодолеть разрушение клеточными нуклеазами, зкДНК-векторы содержат вирусные цис-элементы, т.е. ITR, которые придают устойчивость к нуклеазам и могут быть сконструированы для нацеливания и доставки в ядро. Предполагается, что минимальными определяющими элементами, необходимыми для функции ITR, являются сайт связывания Rep (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTTGG-3' (SEQ ID NO: 64) для AAB2) плюс вариабельная палиндромная последовательность, обеспечивающая образование шпильки; и 4) зкДНК-векторы не имеют избыточной представленности динуклеотидов CpG, часто обнаруживаемых в плазмидах прокариотического происхождения, которые, как сообщается, связывают члена Toll-подобного семейства рецепторов, вызывая опосредуемый Т-клетками иммунный ответ. Напротив, трансдукция бескапсидными ААВ-векторами, описанными в данном документе, может быть эффективно нацелена на типы клеток и тканей, которые трудно трансдуцировать обычными вирионами ААВ с использованием различных реагентов для доставки. IV. Инвертированные концевые повторы (ITR)[00229] There are several advantages to using a cccDNA vector for FVIII protein expression as described herein compared to plasmid-based expression vectors, such advantages include, but are not limited to: 1) plasmids contain bacterial DNA sequences and are methylated, prokaryotic-specific, for example, methylation of 6-methyladenosine and 5-methylcytosine, while the sequences of the capsid-free AAV vector are of eukaryotic origin and do not undergo prokaryotic-specific methylation; as a result, capsidless AAV vectors are less likely to induce inflammatory and immune responses compared to plasmids; 2) while plasmids require the presence of a resistance gene during the production method, cccDNA vectors do not; 3) while a circular plasmid is not delivered to the nucleus when introduced into a cell and requires excessive loading to overcome destruction by cellular nucleases, ccDNA vectors contain viral cis elements, i.e. ITRs, which confer nuclease resistance and can be engineered to target and deliver to the nucleus. The minimum defining elements required for ITR function are proposed to be the Rep binding site (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) for AAB2) and the terminal resolution site (TRS; 5'-AGTTGG-3' (SEQ ID NO: 64) for AAB2) plus a variable palindromic hairpin sequence; and 4) cccDNA vectors do not overrepresent CpG dinucleotides often found in plasmids of prokaryotic origin, which are reported to bind a member of the Toll-like receptor family, inducing a T cell-mediated immune response. In contrast, transduction with the capsidless AAV vectors described herein can effectively target cell and tissue types that are difficult to transduce with conventional AAV virions using different delivery reagents. IV. Inverted terminal repeats (ITRs)
[00230] Как раскрыто в данном документе, зкДНК-векторы для экспрессии белка FVIII содержат трансген или гетерологичную последовательность нуклеиновой кислоты, расположенные между двумя последовательностями инвертированных концевых повторов (ITR), причем указанные последовательности ITR могут представлять собой пару асимметричных ITR или пару симметричных или по существу симметричных ITR, в соответствии с определением этих терминов в данном документе. ЗкДНК-вектор, раскрытый в данном документе, может содержать последовательности ITR, которые выбраны из любых из: (i) по меньшей мере одного WT ITR и по меньшей мере одного модифицированного инвертированного концевого повтора (mod-ITR) ААВ (например, асимметричных модифицированных ITR); (ii) двух модифицированных ITR, причем пара mod-ITR имеет различную трехмерную пространственную организацию по отношению друг к другу (например, асимметричные модифицированные ITR), или (iii) пары симметричных или по существу симметричных WT-WT ITR, причем каждый WT-ITR имеет одинаковую трехмерную пространственную организацию, или (iv) пары симметричных или по существу симметричных модифицированных ITR, причем каждый mod-ITR имеет одинаковую трехмерную пространственную организацию, при этом указанные способы согласно настоящему раскрытию могут дополнительно включать систему доставки, такую как, но не ограничиваясь этим, система доставки на основе липосомных наночастиц.[00230] As disclosed herein, cccDNA vectors for FVIII protein expression comprise a transgene or heterologous nucleic acid sequence located between two inverted terminal repeat (ITR) sequences, wherein said ITR sequences may be a pair of asymmetric ITRs or a pair of symmetric or cross-linked ITRs. essentially symmetrical ITRs, as those terms are defined herein. The cccDNA vector disclosed herein may contain ITR sequences that are selected from any of: (i) at least one WT ITR and at least one modified AAV inverted terminal repeat (mod-ITR) (e.g., asymmetric modified ITRs ); (ii) two modified ITRs, wherein the mod-ITR pair has a different three-dimensional spatial organization relative to each other (e.g., asymmetric modified ITRs), or (iii) pairs of symmetric or substantially symmetric WT-WT ITRs, each WT-ITR has the same three-dimensional spatial organization, or (iv) pairs of symmetrical or substantially symmetrical modified ITRs, each mod-ITR having the same three-dimensional spatial organization, which methods of the present disclosure may further include a delivery system such as, but not limited to , a delivery system based on liposomal nanoparticles.
[00231] Согласно некоторым вариантам реализации последовательность ITR может происходить из вирусов семейства Parvoviridae, которое включает два подсемейства: Parvovirinae, инфицирующих позвоночных животных, и Densovirinae, инфицирующих насекомых. Подсемейство Parvovirinae (называемое парвовирусами) включает род Dependovirus, члены которого, в большинстве условий, нуждаются в коинфекции вспомогательным вирусом, таким как аденовирус или вирус герпеса, для эффективной инфекции. Род Dependovirus включает аденоассоциированный вирус (ААВ), который обычно инфицирует людей (например, серотипы 2, 3А, 3В, 5 и 6) или приматов (например, серотипы 1 и 4), а также родственные вирусы, которые инфицируют других теплокровных животных (например, аденоассоциированные вирусы бычьих, собачьих, лошадиных и овечьих). Парвовирусы и другие члены семейства Parvoviridae в общих чертах описаны в Kenneth I. Berns, «Parvoviridae: The Viruses and Their Replication», Chapter 69 в FIELDS VIROLOGY (3d Ed. 1996).[00231] In some embodiments, the ITR sequence may be derived from viruses of the Parvoviridae family, which includes two subfamilies: Parvovirinae, which infect vertebrates, and Densovirinae, which infect insects. The subfamily Parvovirinae (called parvoviruses) includes the genus Dependovirus, whose members, in most conditions, require coinfection with a helper virus such as an adenovirus or herpes virus for effective infection. The genus Dependovirus includes adeno-associated virus (AAV) that commonly infects humans (e.g., serotypes 2, 3A, 3B, 5, and 6) or primates (e.g., serotypes 1 and 4), as well as related viruses that infect other warm-blooded animals (e.g. , adeno-associated viruses of bovine, canine, equine and sheep). Parvoviruses and other members of the family Parvoviridae are described generally in Kenneth I. Berns, “Parvoviridae: The Viruses and Their Replication,” Chapter 69 in FIELDS VIROLOGY (3d Ed. 1996).
[00232] Несмотря на то, что ITR, приведенные в качестве примера в описании и Примерах в данном документе, представляют собой WT-ITR ААВ2, обычный специалист в данной области техники понимает, что, как было указано выше, можно использовать ITR из любого известного парвовируса, например, депендовируса, такого как ААВ (например, из генома ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ 5, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, AABrh8, AABrh10, AAB-DJ и AAB-DJ8. Например, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261, химерные ITR или ITR из любого синтетического ААВ. Согласно некоторым вариантам реализации ААВ может инфицировать теплокровных животных, например, птичьи (ПААВ), бычьи (БААВ), собачьи, лошадиные и овечьи аденоассоциированные вирусы. Согласно некоторым вариантам реализации ITR происходит из парвовируса В19 (номер доступа в GenBank: NC 000883), мелкого мышиного вируса (MVM) (номер доступа в GenBank NC 001510); гусиного парвовируса (номер доступа в GenBank NC 001701); змеиного парвовируса 1 (номер доступа в GenBank NC 006148). Согласно некоторым вариантам реализации 5' WT-ITR может происходить из одного серотипа, а 3' WT-ITR может происходить из другого серотипа, как обсуждается в данном документе.[00232] Although the ITRs exemplified in the specification and Examples herein are WT-ITR AAB2, one of ordinary skill in the art will appreciate that, as stated above, ITRs from any known parvovirus, for example, a dependovirus such as AAV (for example, from the genome of AAV1, AAV2, AAV3, AAV4, AAV5, AAV 5, AAV7, AAV8, AAV9, AAV10, AAV11, AAB12, AABrh8, AABrh10, AAB-DJ and AAB-DJ8 For example, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261, chimeric ITRs or ITRs from any synthetic AAV. In some embodiments, AAV can infect warm-blooded animals, such as avian (PAAV), bovine (CAAV), canine, equine, and ovine adeno-associated viruses. In some embodiments, the ITR is derived from parvovirus B19 (GenBank accession no. NC 000883), small mouse virus (MVM) (GenBank accession no. NC 001510); goose parvovirus (GenBank accession no. NC 001510); GenBank accession NC 001701); snake parvovirus 1 (GenBank accession number NC 006148). In some embodiments, the 5' WT-ITR may be from one serotype and the 3' WT-ITR may be from a different serotype, as discussed herein.
[00233] Обычному специалисту известно, что последовательности ITR имеют общую структуру двухцепочечного соединения Холлидея, которое обычно представляет собой Т-образную или Y-образную шпилечную структуру (см., например, ФИГ. 2А и ФИГ. 3А), где каждый WT-ITR образован двумя палиндромными плечами или петлями (В-В' и С-С), встроенными в большее палиндромное плечо (А-А'), и одноцепочечной последовательностью D (при этом порядок этих палиндромных последовательностей определяет «флип» или «флоп» ориентацию ITR). См., например, структурный анализ и сравнение последовательностей ITR из различных серотипов ААВ (ААВ1-ААВ6), описанные в Grimm et at, J. Virology, 2006; 80(1); 426-439; Yan et at, J. Virology, 2005; 364-379; Duan et ai, Virology 1999; 261; 8-14. Обычный специалист в данной области техники может легко определить последовательности WT-ITR из любого серотипа ААВ для использования в зкДНК-векторе или зкДНК-плазмиде на основе примерных последовательностей ITR ААВ2, предложенных в данном документе. См., например, сравнение последовательностей ITR из разных серотипов ААВ (ААВ1-ААВ6, птичий ААВ (ПААВ) и бычий ААВ (БААВ)), описанное в Grimm et al., J. Virology, 2006; 80(1); 426-439; в котором показан % идентичности левого ITR ААВ2 с левым ITR из других серотипов: ААВ-1 (84%), ААВ-3 (86%), ААВ-4 (79%), ААВ-5 (58%), ААВ-6 (левый ITR) (100%) и ААВ-6 (правый ITR) (82%).[00233] One of ordinary skill in the art will recognize that ITR sequences have a general double-stranded Holliday junction structure, which is typically a T- or Y-hairpin structure (see, for example, FIG. 2A and FIG. 3A), where each WT-ITR formed by two palindromic arms or loops (B-B' and C-C) embedded in a larger palindromic arm (A-A'), and a single-stranded sequence D (with the order of these palindromic sequences determining the "flip" or "flop" orientation of the ITR ). See, for example, the structural analysis and comparison of ITR sequences from different AAV serotypes (AAV1-AAV6) described in Grimm et at, J. Virology, 2006; 80(1); 426-439; Yan et at, J. Virology, 2005; 364-379; Duan et ai, Virology 1999; 261; 8-14. One of ordinary skill in the art can readily determine WT-ITR sequences from any AAV serotype for use in a cccDNA vector or ccDNA plasmid based on the exemplary AAB2 ITR sequences provided herein. See, for example, the comparison of ITR sequences from different AAV serotypes (AAV1-AAV6, avian AAV (PAAV) and bovine AAV (BAAV)) described in Grimm et al., J. Virology, 2006; 80(1); 426-439; which shows the % identity of the left ITR of AAV2 with the left ITR from other serotypes: AAV-1 (84%), AAV-3 (86%), AAV-4 (79%), AAV-5 (58%), AAV-6 (left ITR) (100%) and AAV-6 (right ITR) (82%).
А. Пары симметричных ITRA. Pairs of symmetrical ITRs
[00234] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), представляющую интерес нуклеотидную последовательность (например, экспрессионную кассету, описанную в данном документе) и второй ITR ААВ, причем указанный первый ITR (5' ITR) и второй ITR (3' ITR) симметричны или по существу симметричны по отношению друг к другу, то есть зкДНК-вектор может содержать последовательности ITR, которые имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С и В-В' в трехмерном пространстве. В таком варианте реализации пара симметричных ITR или пара по существу симметричных ITR может представлять собой модифицированные ITR (например, mod-ITR), которые не являются ITR дикого типа. Пара mod-ITR может иметь одну и ту же последовательность, которая имеет одну или более модификаций относительно ITR дикого типа, и они обратно комплементарны друг другу (инвертированы). Согласно альтернативным вариантам реализации пара модифицированных ITR по существу симметрична, как определено в данном документе, то есть пара модифицированных ITR может иметь разные последовательности, но соответствующую или одинаковую симметричную трехмерную форму.[00234] In some embodiments, the cccDNA vector for expression of the FVIII protein described herein contains, in the 5' to 3' direction: the first inverted terminal repeat (ITR) of an adeno-associated virus (AAV), a nucleotide sequence of interest (eg , an expression cassette described herein) and a second ITR of AAB, wherein said first ITR (5' ITR) and second ITR (3' ITR) are symmetrical or substantially symmetrical with respect to each other, that is, the ccDNA vector may contain sequences ITRs that have a symmetrical three-dimensional spatial organization such that their structure has the same shape in geometric space, or have the same A, C-C and B-B' loops in three-dimensional space. In such an embodiment, the pair of symmetrical ITRs or the pair of substantially symmetrical ITRs may be modified ITRs (eg, mod-ITRs) that are not wild-type ITRs. A mod-ITR pair may have the same sequence that has one or more modifications relative to the wild-type ITR, and they are inversely complementary to each other (inverted). In alternative embodiments, a pair of modified ITRs is substantially symmetrical as defined herein, that is, a pair of modified ITRs may have different sequences but a corresponding or identical symmetrical three-dimensional shape.
(i) ITR дикого типа(i) Wild type ITR
[00235] Согласно некоторым вариантам реализации симметричные ITR или по существу симметричные ITR относятся к дикому типу (WT-ITR), как описано в данном документе. Иными словами, оба ITR имеют последовательность дикого типа, но не обязательно должны представлять собой WT-ITR из одного и того же серотипа ААВ. Иными словами, в некоторых вариантах реализации, один WT-ITR может происходить из одного серотипа ААВ, а другой WT-ITR может происходить из другого серотипа ААВ. В таком варианте реализации пара WT-ITR по существу симметрична, как определено в данном документе, то есть они могут иметь одну или более консервативных нуклеотидных модификаций, сохраняя при этом симметричную трехмерную пространственную организацию.[00235] In some embodiments, symmetric ITRs or substantially symmetric ITRs are wild type (WT-ITR), as described herein. In other words, both ITRs have wild-type sequence but do not necessarily have to be WT-ITRs from the same AAV serotype. That is, in some embodiments, one WT-ITR may be derived from one serotype of AAV, and another WT-ITR may be derived from a different serotype of AAV. In such an embodiment, the WT-ITR pair is substantially symmetrical as defined herein, that is, they can have one or more conserved nucleotide modifications while maintaining a symmetrical three-dimensional spatial organization.
[00236] Соответственно, как раскрыто в данном документе, зкДНК-векторы содержат трансген или гетер о логичную последовательность нуклеиновой кислоты, расположенные между двумя фланкирующими последовательностями инвертированных концевых повторов дикого типа (WT-ITR), которые либо обратно комплементарны (инвертированы) по отношению друг к другу, либо, альтернативно, являются по существу симметричными по отношению друг к другу, то есть пара WT-ITR имеет симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации последовательность ITR дикого типа (например, WT-ITR ААВ) содержит функциональный сайт связывания Rep (RBS; например, 5'-GCGCGCTCGCTCGCTC-3' для ААВ2, SEQ ID NO: 60) и функциональный сайт концевого разрешения (TRS; например, 5'-AGTT-3', SEQ ID NO: 62).[00236] Accordingly, as disclosed herein, cccDNA vectors contain a transgene or heterologous nucleic acid sequence located between two flanking wild-type inverted terminal repeat (WT-ITR) sequences that are either reverse complementary (inverted) to each other to each other, or, alternatively, are substantially symmetrical with respect to each other, that is, the WT-ITR pair has a symmetrical three-dimensional spatial organization. In some embodiments, the wild-type ITR sequence (e.g., WT-ITR of AAB) contains a functional Rep binding site (RBS; e.g., 5'-GCGCGCTCGCTCGCTC-3' for AAB2, SEQ ID NO: 60) and a functional terminal resolution site (TRS; e.g. 5'-AGTT-3', SEQ ID NO: 62).
[00237] Согласно одному аспекту зкДНК-векторы для экспрессии белка FVIII могут быть получены из векторного полинуклеотида, который кодирует гетер о логичную нуклеиновую кислоту, функционально расположенную между двумя последовательностями инвертированных концевых повторов WT (WT-ITR) (например, WT-ITR ААВ). Иными словами, оба ITR имеют последовательность дикого типа, но не обязательно должны представлять собой WT-ITR из одного и того же серотипа ААВ. Иными словами, в некоторых вариантах реализации, один WT-ITR может происходить из одного серотипа ААВ, а другой WT-ITR может происходить из другого серотипа ААВ. В таком варианте реализации пара WT-ITR по существу симметрична, как определено в данном документе, то есть они могут иметь одну или более консервативных нуклеотидных модификаций, сохраняя при этом симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации 5' WT-ITR происходит из одного серотипа ААВ, а 3' WT-ITR происходит из того же или другого серотипа ААВ. Согласно некоторым вариантам реализации 5' WT-ITR и 3' WT-ITR являются зеркальными отображениями друг друга, то есть они симметричны. Согласно некоторым вариантам реализации 5' WT-ITR и 3' WT-ITR происходят из одного и того же серотипа ААВ.[00237] In one aspect, cccDNA vectors for FVIII protein expression can be derived from a vector polynucleotide that encodes a heterologous nucleic acid operably located between two WT inverted terminal repeat (WT-ITR) sequences (e.g., AAB WT-ITR) . In other words, both ITRs have wild-type sequence but do not necessarily have to be WT-ITRs from the same AAV serotype. That is, in some embodiments, one WT-ITR may be derived from one serotype of AAV, and another WT-ITR may be derived from a different serotype of AAV. In such an embodiment, the WT-ITR pair is substantially symmetrical as defined herein, that is, they can have one or more conserved nucleotide modifications while maintaining a symmetrical three-dimensional spatial organization. In some embodiments, the 5' WT-ITR is derived from one AAV serotype and the 3' WT-ITR is derived from the same or a different AAV serotype. In some embodiments, the 5' WT-ITR and 3' WT-ITR are mirror images of each other, that is, they are symmetrical. In some embodiments, the 5' WT-ITR and 3' WT-ITR are from the same serotype of AAV.
[00238] WT-ITR хорошо известны. Согласно одному варианту реализации два ITR происходят из одного и того же серотипа ААВ2. Согласно некоторым вариантам реализации можно использовать WT из других серотипов. Существует ряд гомологичных серотипов, например, ААВ2, ААВ4, ААВ6, ААВ8. Согласно одному варианту реализации можно применять высокогомологичные ITR (например, ITR со сходной петлевой структурой). Согласно другому варианту реализации можно применять WT-ITR ААВ, которые различаются в большей степени, например, ААВ2 и ААВ5, и еще в одном варианте реализации можно применять ITR, который по существу представляет собой WT, то есть он имеет основную петлевую структуру WT, но некоторые консервативные нуклеотидные изменения, которые не изменяют и не влияют на свойства. При использовании WT-ITR из одного и того же вирусного серотипа можно дополнительно использовать одну или более регуляторных последовательностей. Согласно определенным вариантам реализации регуляторная последовательность представляет собой регуляторный переключатель, который позволяет модулировать активность зкДНК, например, экспрессию кодируемого белка FVIII.[00238] WT-ITRs are well known. In one embodiment, the two ITRs are from the same serotype AAB2. In some embodiments, WT from other serotypes can be used. There are a number of homologous serotypes, for example, AAV2, AAV4, AAV6, AAV8. In one embodiment, highly homologous ITRs (eg, ITRs with a similar loop structure) can be used. In another embodiment, a WT-ITR may be used for AABs that are more different, such as AAB2 and AAB5, and in yet another embodiment, an ITR may be used that is essentially a WT, that is, it has the basic loop structure of the WT, but some conservative nucleotide changes that do not change or affect properties. When using WT-ITR from the same viral serotype, one or more regulatory sequences can be additionally used. In certain embodiments, the regulatory sequence is a regulatory switch that allows modulation of the activity of the cccDNA, such as the expression of the encoded FVIII protein.
[00239] Согласно некоторым вариантам реализации один аспект технологии, описанной в данном документе, относится к зкДНК-вектору для экспрессии белка FVIII, причем указанный зкДНК-вектор содержит по меньшей мере одну гетерологичную нуклеотидную последовательность, кодирующую белок FVIII, функционально расположенную между двумя последовательностями инвертированных концевых повторов дикого типа (WT-ITR), при этом указанные WT-ITR могут происходить из одного и того же серотипа, разных серотипов или по существу симметричны по отношению друг к другу (т.е. они имеют симметричную трехмерную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве, или имеют одинаковые петли А, С-С' и B-B' в трехмерном пространстве). Согласно некоторым вариантам реализации симметричные WT-ITR содержат функциональный сайт концевого разрешения и сайт связывания Rep. Согласно некоторым вариантам реализации гетерологичная последовательность нуклеиновой кислоты кодирует трансген, и при этом вектор не находится в вирусном капсиде.[00239] In some embodiments, one aspect of the technology described herein relates to a cccDNA vector for expression of an FVIII protein, wherein the cccDNA vector comprises at least one heterologous nucleotide sequence encoding an FVIII protein operably located between two inverted sequences. wild-type terminal repeats (WT-ITRs), wherein the WT-ITRs may be from the same serotype, different serotypes, or substantially symmetrical with respect to each other (i.e., they have a symmetrical three-dimensional spatial organization such that their structure has the same shape in geometric space, or have the same loops A, C-C' and B-B' in three-dimensional space). In some embodiments, symmetrical WT-ITRs contain a functional end resolution site and a Rep binding site. In some embodiments, the heterologous nucleic acid sequence encodes a transgene, and the vector is not contained within a viral capsid.
[00240] Согласно некоторым вариантам реализации WT-ITR являются одинаковыми, но обратно комплементарными по отношению друг к другу. Например, последовательность AACG в 5' ITR может представлять собой CGTT (т.е. обратно комплементарную последовательность) в 3' ITR в соответствующем сайте. В одном примере смысловая цепь 5' WT-ITR содержит последовательность ATCGATCG, а соответствующая смысловая цепь 3' WT-ITR содержит CGATCGAT (т.е. обратно комплементарную последовательность ATCGATCG). Согласно некоторым вариантам реализации WT-ITR зкДНК дополнительно содержит сайт концевого разрешения и сайт связывания репликационного белка (RPS) (иногда называемый сайтом связывания репликативного белка), например, сайт связывания Rep.[00240] In some embodiments, the WT-ITRs are the same but inversely complementary to each other. For example, the sequence AACG in the 5' ITR may be a CGTT (ie reverse complementary sequence) in the 3' ITR at the corresponding site. In one example, the 5' sense strand of the WT-ITR contains the sequence ATCGATCG, and the corresponding 3' sense strand of the WT-ITR contains CGATCGAT (ie, the reverse complementary sequence of ATCGATCG). In some embodiments, the WT-ITR cccDNA further comprises an end resolution site and a replication protein binding site (RPS) (sometimes referred to as a replication protein binding site), such as a Rep binding site.
[00241] Примерные последовательности WT-ITR для применения в зкДНК-векторах для экспрессии белка FVIII, содержащих WT-ITR, представлены в Таблице 3 в данном документе, в которой показаны пары WT-ITR (5' WT-ITR и 3' WT-ITR).[00241] Exemplary WT-ITR sequences for use in cDNA FVIII protein expression vectors containing WT-ITR are presented in Table 3 herein, which shows WT-ITR pairs (5' WT-ITR and 3' WT-ITR ITR).
[00242] В качестве иллюстративного примера согласно настоящему раскрытию предложен зкДНК-вектор для экспрессии белка FVIII, содержащий промотор, функционально связанный с трансгеном (например, гетерологичной последовательностью нуклеиновой кислоты), с регуляторным переключателем или без него, причем указанная зкДНК лишена капсидных белков и: (а) продуцируется с зкДНК-плазмиды (например, см. ФИГ. 1F-1G), которая кодирует WT-ITR, при этом каждый WT-ITR имеет одинаковое количество внутримолекулярных дуплексных пар оснований в его шпилечной вторичной конфигурации (предпочтительно исключая делецию любой концевой петли AAA или ТТТ в этой конфигурации по сравнению с этими референсными последовательностями), и (b) идентифицирована как зкДНК с использованием анализа для идентификации зкДНК с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях в Примере 1.[00242] As an illustrative example, the present disclosure provides a cccDNA vector for expressing an FVIII protein comprising a promoter operably linked to a transgene (e.g., a heterologous nucleic acid sequence), with or without a regulatory switch, wherein the ccDNA is devoid of capsid proteins and: (a) is produced from a cccDNA plasmid (e.g., see FIGS. 1F-1G) that encodes a WT-ITR, with each WT-ITR having the same number of intramolecular duplex base pairs in its hairpin secondary configuration (preferably excluding deletion of any terminal AAA or TTT loops in this configuration compared to these reference sequences), and (b) identified as cccDNA using an assay to identify cccDNA using agarose gel electrophoresis on a native gel and under denaturing conditions in Example 1.
[00243] Согласно некоторым вариантам реализации фланкирующие WT-ITR по существу симметричны друг другу. Согласно этому варианту реализации 5' WT-ITR может происходить из одного серотипа ААВ, а 3' WT-ITR может происходить из другого серотипа ААВ так, что WT-ITR не являются идентичными обратно комплементарными последовательностями. Например, 5' WT-ITR может происходить из ААВ2, а 3' WT-ITR может происходить из другого серотипа (например, ААВ1, 3, 4, 5, 6, 7, 8, 9, 10, 11 и 12). Согласно некоторым вариантам реализации WT-ITR могут быть выбраны из двух разных парвовирусов, выбранных из любого из: ААВ1, ААВ2, ААВЗ, ААВ4, ААВ5, ААВ6, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, ААВ13, змеиного парвовируса (например, парвовируса королевского питона), бычьего парвовируса, козьего парвовируса, птичьего парвовируса, лошадиного парвовируса, парвовируса креветок, свиного парвовируса или ААВ насекомых. Согласно некоторым вариантам реализации такая комбинация WT ITR представляет собой комбинацию WT ITR из ААВ2 и ААВ6. Согласно одному варианту реализации WT-ITR являются по существу симметричными, когда один ITR инвертирован относительно другого ITR, который идентичен по меньшей мере на 90%, идентичен по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, и имеет ту же симметричную трехмерную пространственную организацию. Согласно некоторым вариантам реализации пара WT-ITR по существу симметрична, поскольку они имеют симметричную трехмерную пространственную организацию, например, имеют одинаковую трехмерную организацию плеч А, С-С', В-В' и D. Согласно одному варианту реализации пара по существу симметричных WT-ITR инвертирована по отношению друг к другу и идентична по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, по отношению друг к другу, и один WT-ITR сохраняет сайт связывания Rep (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) и сайт концевого разрешения (TRS). Согласно некоторым вариантам реализации пара по существу симметричных WT-ITR инвертирована по отношению друг к другу и идентична по меньшей мере на 95%, по меньшей мере на 96%… 97%… 98%… 99%… 99,5%, включая все промежуточные значения, по отношению друг к другу, и один WT-ITR сохраняет сайт связывания Rep (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) и сайт концевого разрешения (TRS) и в дополнение к вариабельной палиндромной последовательности, обеспечивающей образование шпилечной вторичной структуры. Гомология может быть определена с применением стандартных способов, хорошо известных в данной области техники, таких как BLAST («Basic Local Alignment Search Tool»), BLASTN при настройках по умолчанию.[00243] In some embodiments, the flanking WT-ITRs are substantially symmetrical to each other. In this embodiment, the 5' WT-ITR may be derived from one AAV serotype and the 3' WT-ITR may be derived from a different AAV serotype such that the WT-ITRs are not identical reverse complementary sequences. For example, the 5' WT-ITR may be derived from AAB2, and the 3' WT-ITR may be derived from a different serotype (eg, AAB1, 3, 4, 5, 6, 7, 8, 9, 10, 11, and 12). In some embodiments, the WT-ITR may be selected from two different parvoviruses selected from any of: AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, snake parvovirus (eg , royal python parvovirus), bovine parvovirus, goat parvovirus, avian parvovirus, equine parvovirus, shrimp parvovirus, porcine parvovirus or insect AAV. In some embodiments, such a WT ITR combination is a combination of the WT ITRs of AAB2 and AAB6. In one embodiment, WT-ITRs are substantially symmetrical when one ITR is inverted relative to another ITR that is at least 90% identical, at least 95% identical, at least 96%... 97%... 98%... 99%... 99.5%, including all intermediate values, and has the same symmetrical three-dimensional spatial organization. In some embodiments, a pair of WT-ITRs is substantially symmetrical because they have a symmetrical three-dimensional spatial organization, for example, having the same three-dimensional organization of arms A, C-C', B-B', and D. In one embodiment, a pair of substantially symmetrical WTs -ITRs are inverted with respect to each other and are at least 95% identical, at least 96%... 97%... 98%... 99%... 99.5% identical, including all intermediate values, with respect to each other, and one WT-ITR retains a Rep binding site (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) and a terminal resolution site (TRS). In some embodiments, a pair of substantially symmetrical WT-ITRs are inverted with respect to each other and are at least 95% identical, at least 96%... 97%... 98%... 99%... 99.5% identical, including everything in between values, relative to each other, and one WT-ITR retains a Rep binding site (RBS) 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) and a terminal resolution site (TRS) and in addition to a variable palindromic sequence providing formation of a hairpin secondary structure. Homology can be determined using standard methods well known in the art, such as BLAST (“Basic Local Alignment Search Tool”), BLASTN with default settings.
[00244] Согласно некоторым вариантам реализации структурный элемент ITR может представлять собой любой структурный элемент, который участвует в функциональном взаимодействии ITR с большим белком Rep (например, Rep 78 или Rep 68). Согласно определенным вариантам реализации структурный элемент обеспечивает селективность взаимодействия ITR с большим белком Rep, т.е. определяет, по меньшей мере частично, какой белок Rep функционально взаимодействует с ITR. Согласно другим вариантам реализации структурный элемент физически взаимодействует с большим белком Rep, когда белок Rep связан с ITR. Каждый структурный элемент может представлять собой, например, вторичную структуру ITR, нуклеотидную последовательность ITR, промежуток между двумя или более элементами или комбинацию любого из перечисленных выше. Согласно одному варианту реализации структурные элементы выбраны из группы, состоящей из плеча А и А', плеча В и В', плеча С и С', плеча D, сайта связывания Rep (RBE) и RBE' (т.е. комплементарная последовательность RBE) и сайта концевого разрешения (TRS).[00244] In some embodiments, the ITR structural element can be any structural element that is involved in the functional interaction of the ITR with a large Rep protein (eg, Rep 78 or Rep 68). In certain embodiments, the structural element provides selectivity for the interaction of the ITR with the large Rep protein, i.e. determines, at least in part, which Rep protein functionally interacts with the ITR. In other embodiments, the structural element physically interacts with the large Rep protein when the Rep protein is bound to the ITR. Each structural element may be, for example, an ITR secondary structure, an ITR nucleotide sequence, a gap between two or more elements, or a combination of any of the above. In one embodiment, the structural elements are selected from the group consisting of arm A and A', arm B and B', arm C and C', arm D, a Rep binding site (RBE), and RBE' (i.e., the complementary sequence of the RBE ) and terminal resolution site (TRS).
[00245] Только в качестве примера, в Таблице 2 указаны примерные комбинации WT-ITR.[00245] By way of example only, Table 2 shows exemplary WT-ITR combinations.
[00246] tgcatgc 2: Примерные комбинации WT-ITR из одного и того же серотипа или разных серотипов, или разных парвовирусов. Показанный порядок не указывает на положение ITR, например, «ААВ1, ААВ2» демонстрирует, что зкДНК может содержать WT ITR ААВ1 в 5'-положении и WT ITR ААВ2 в 3'-положении или наоборот WT ITR ААВ2 в 5'-положении, a WT ITR ААВ1 в 3'-положении. Сокращения: ААВ серотипа 1 (ААВ1), ААВ серотипа 2 (ААВ2), ААВ серотипа 3 (ААВ3), ААВ серотипа 4 (ААВ4), ААВ серотипа 5 (ААВ5), ААВ серотипа 6 (ААВ6), ААВ серотипа 7 (ААВ7), ААВ серотипа 8 (ААВ8), ААВ серотипа 9 (ААВ9), ААВ серотипа 10 (ААВ10), ААВ серотипа 11 (ААВ11) или ААВ серотипа 12 (ААВ12); геном AABrh8, AABrh10, AAB-DJ и AAB-DJ8 (например, NCBI: NC 002077; NC 001401; NC 001729; NC 001829; NC 006152; NC 006260; NC 006261), ITR из теплокровных животных (птичий ААВ (ПААВ), бычий ААВ (БААВ), собачий, лошадиный и овечий ААВ), ITR из парвовируса В19 (номер доступа в GenBank: NC 000883), мелкого мышиного вируса (MVM) (номер доступа в GenBank NC 001510); гусь: гусиного парвовируса (номер доступа в GenBank NC 001701); змея: змеиного парвовируса 1 (номер доступа в GenBank NC 006148).[00246] tgcatgc 2: Exemplary combinations of WT-ITRs from the same serotype or different serotypes or different parvoviruses. The order shown does not indicate the position of the ITR, for example, “AAB1, AAB2” demonstrates that cccDNA can contain the WT AAB1 ITR at the 5' position and the WT AAB2 ITR at the 3' position, or vice versa, the WT AAB2 ITR at the 5' position, a WT ITR of AAB1 at the 3' position. Abbreviations: AAV serotype 1 (AAV1), AAV serotype 2 (AAV2), AAV serotype 3 (AAV3), AAV serotype 4 (AAV4), AAV serotype 5 (AAV5), AAV serotype 6 (AAV6), AAV serotype 7 (AAV7) , AAV serotype 8 (AAV8), AAV serotype 9 (AAV9), AAV serotype 10 (AAV10), AAV serotype 11 (AAV11) or AAV serotype 12 (AAV12); genome AABrh8, AABrh10, AAB-DJ and AAB-DJ8 (e.g. NCBI: NC 002077; NC 001401; NC 001729; NC 001829; NC 006152; NC 006260; NC 006261), ITR from warm-blooded animals (avian AAV (PAAV), bovine AAV (BAAV), canine, equine and ovine AAV), ITR from parvovirus B19 (GenBank accession number: NC 000883), small mouse virus (MVM) (GenBank accession number NC 001510); goose: goose parvovirus (GenBank accession number NC 001701); snake: snake parvovirus 1 (GenBank accession number NC 006148).
[00247] Только в качестве примера, в Таблице 3 представлены последовательности примерных WT-ITR из некоторых различных серотипов ААВ.[00247] By way of example only, Table 3 provides sequences of exemplary WT-ITRs from several different AAV serotypes.
[00248] Согласно некоторым вариантам реализации нуклеотидная последовательность последовательности WT-ITR может быть модифицирована (например, путем модификации 1, 2, 3, 4 или 5 или более нуклеотидов или любого их диапазона), при этом указанная модификация представляет собой замену комплементарным нуклеотидом, например, G для С, и наоборот, и Т для А, и наоборот.[00248] In some embodiments, the nucleotide sequence of a WT-ITR sequence may be modified (e.g., by modifying 1, 2, 3, 4, or 5 or more nucleotides or any range thereof), wherein said modification is a substitution with a complementary nucleotide, e.g. , G for C, and vice versa, and T for A, and vice versa.
[00249] Согласно определенным вариантам реализации настоящего изобретения зкДНК-вектор для экспрессии белка FVIII не имеет WT-ITR, состоящего из нуклеотидной последовательности, выбранной из любой из: SEQ ID NO: 1, 2, 5-14. Согласно альтернативным вариантам реализации настоящего изобретения, если зкДНК-вектор имеет WT-ITR, содержащий нуклеотидную последовательность, выбранную из любой из: SEQ ID NO: 1, 2, 5-14, то фланкирующий ITR также представляет собой WT, и зкДНК-вектор содержит регуляторный переключатель, например, как раскрыто в данном документе и в международной заявке PCT/US 18/49996 (например, см. Таблицу 11 PCT/US 18/49996). Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, как раскрыто в данном документе, и выбранный WT-ITR, имеющий нуклеотидную последовательность, выбранную из любой из группы, состоящей из: SEQ ID NO: 1, 2, 5-14.[00249] In certain embodiments of the present invention, the cDNA vector for expression of the FVIII protein does not have a WT-ITR consisting of a nucleotide sequence selected from any of: SEQ ID NO: 1, 2, 5-14. According to alternative embodiments of the present invention, if the cccDNA vector has a WT-ITR containing a nucleotide sequence selected from any of: SEQ ID NO: 1, 2, 5-14, then the flanking ITR is also WT, and the cccDNA vector contains a control switch, for example, as disclosed herein and in international application PCT/US 18/49996 (for example, see Table 11 of PCT/US 18/49996). In some embodiments, the cccDNA vector for expression of the FVIII protein comprises a regulatory switch as disclosed herein and a selected WT-ITR having a nucleotide sequence selected from any of the group consisting of: SEQ ID NO: 1, 2, 5- 14.
[00250] ЗкДНК-вектор, для экспрессии белка FVIII, описанный в данном документе, может включать структуры WT-ITR, которые сохраняют функциональные части RBE, TRS и RBE'. ФИГ. 2А и ФИГ. 2В, с использованием ITR дикого типа для иллюстративных целей, показывают один возможный механизм функционирования сайта TRS внутри части структуры ITR дикого типа зкДНК-вектора. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более функциональных полинуклеотидных последовательностей WT-ITR, которые содержат Rep-связывающий сайт (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTT (SEQ ID NO: 62)). Согласно некоторым вариантам реализации по меньшей мере один WT-ITR является функциональным. Согласно альтернативным вариантам реализации, в которых зкДНК-вектор для экспрессии белка FVIII содержит два WT-ITR, которые по существу симметричны друг другу, по меньшей мере один WT-ITR является функциональным и по меньшей мере один WT-ITR является нефункциональным.[00250] The cDNA vector for expression of the FVIII protein described herein may include WT-ITR structures that retain the functional portions of RBE, TRS, and RBE'. FIG. 2A and FIG. 2B, using the wild-type ITR for illustrative purposes, shows one possible mechanism for the TRS site to function within part of the wild-type ITR structure of a ccDNA vector. In some embodiments, the cDNA vector for expressing the FVIII protein comprises one or more functional WT-ITR polynucleotide sequences that contain a Rep binding site (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) for AAB2) and a site end resolution (TRS; 5'-AGTT (SEQ ID NO: 62)). In some embodiments, the at least one WT-ITR is functional. In alternative embodiments, wherein the cccDNA vector for expressing the FVIII protein contains two WT-ITRs that are substantially symmetrical to each other, at least one WT-ITR is functional and at least one WT-ITR is non-functional.
В. Модифицированные ITR (mod-ITR) в целом для зкДНК-векторов, содержащих пары асимметричных ITR или пары симметричных ITRB. Modified ITRs (mod-ITRs) in general for cccDNA vectors containing pairs of asymmetric ITRs or pairs of symmetric ITRs
[00251] Как обсуждается в данном документе, зкДНК-вектор для экспрессии белка FVIII может содержать пару симметричных ITR или пару асимметричных ITR. В обоих случаях один или оба из ITR могут представлять собой модифицированные ITR - различие заключается в том, что в первом случае (то есть симметричные mod-ITR), mod-ITR имеют одинаковую трехмерную пространственную организацию (т.е. имеют одинаковые конфигурации плеча А-А', С-С' и В-В'), в то время как во втором случае (т.е. асимметричные mod-ITR), mod-ITR имеют разную трехмерную пространственную организацию (т.е. имеют разную конфигурацию плеч А-А', С-С' и В-В').[00251] As discussed herein, the cDNA vector for expression of the FVIII protein may contain a pair of symmetric ITRs or a pair of asymmetric ITRs. In both cases, one or both of the ITRs may be modified ITRs - the difference is that in the first case (i.e., symmetrical mod-ITRs), the mod-ITRs have the same three-dimensional spatial organization (i.e., have the same A-arm configurations -A', C-C' and B-B'), while in the second case (i.e. asymmetric mod-ITRs), mod-ITRs have different three-dimensional spatial organization (i.e. have different arm configurations A-A', C-C' and B-B').
[00252] Согласно некоторым вариантам реализации модифицированный ITR представляет собой ITR, который модифицирован путем делеции, вставки и/или замены по сравнению с последовательностью ITR дикого типа (например, ITR ААВ). Согласно некоторым вариантам реализации по меньшей мере один из ITR в зкДНК-векторе содержит функциональный сайт связывания Rep (RBS; например, 5'-GCGCGCTCGCTCGCTC-3' для ААВ2, SEQ ID NO 60) и функциональный сайт концевого разрешения (TRS; например, 5'-AGTT-3', SEQ ID NO: 62). В одном варианте реализации по меньшей мере один из ITR представляет собой нефункциональный ITR. Согласно одному варианту реализации не каждый из разных или модифицированных ITR представляет собой ITR дикого типа из разных серотипов.[00252] In some embodiments, a modified ITR is an ITR that is modified by deletion, insertion, and/or substitution from the wild-type ITR sequence (eg, the AAB ITR). In some embodiments, at least one of the ITRs in the cccDNA vector contains a functional Rep binding site (RBS; e.g., 5'-GCGCGCTCGCTCGCTC-3' for AAB2, SEQ ID NO 60) and a functional terminal resolution site (TRS; e.g., 5 '-AGTT-3', SEQ ID NO: 62). In one embodiment, at least one of the ITRs is a non-functional ITR. In one embodiment, not each of the different or modified ITRs is a wild-type ITR from different serotypes.
[00253] Конкретные изменения и мутации в ITR подробно описаны в данном документе, но в контексте ITR «измененный», «мутированный» или «модифицированный» указывает на то, что нуклеотиды были вставлены, удалены и/или заменены относительно дикого типа, референса или исходной последовательности ITR. Измененный или мутированный ITR может представлять собой модифицированный ITR. В данном документе «сконструированный» относится к аспекту манипулирования человеком. Например, полипептид считается «сконструированным», когда по меньшей мере один аспект полипептида, например, его последовательность, подвергся манипуляции человеком, чтобы отличаться от аспекта, который существует в природе.[00253] Specific changes and mutations in the ITR are described in detail herein, but in the context of an ITR, “altered,” “mutated,” or “modified” indicates that nucleotides have been inserted, deleted, and/or replaced relative to the wild type, reference, or original ITR sequence. The altered or mutated ITR may be a modified ITR. In this document, “designed” refers to the aspect of human manipulation. For example, a polypeptide is considered to be “engineered” when at least one aspect of the polypeptide, such as its sequence, has been manipulated by humans to be different from the aspect that exists in nature.
[00254] Согласно некоторым вариантам реализации mod-ITR может быть синтетическим. Согласно одному варианту реализации синтетический ITR основан на последовательностях ITR более чем из одного серотипа ААВ. Согласно другому варианту реализации синтетический ITR не включает последовательность на основе ААВ. В еще одном варианте реализации синтетический ITR сохраняет структуру ITR, описанную выше, хотя имеет только некоторую часть последовательности, полученной из ААВ, или не имеет ее. Согласно некоторым аспектам синтетический ITR преимущественно может взаимодействовать с Rep дикого типа или Rep конкретного серотипа, или в некоторых случаях не будет распознаваться Rep дикого типа и будет распознаваться только мутированным Rep.[00254] In some embodiments, mod-ITR may be synthetic. In one embodiment, the synthetic ITR is based on ITR sequences from more than one AAV serotype. In another embodiment, the synthetic ITR does not include an AAV-based sequence. In yet another embodiment, the synthetic ITR retains the ITR structure described above, although it has only some or no AAV-derived sequence. In some aspects, the synthetic ITR may preferentially interact with wild-type Rep or Rep of a particular serotype, or in some cases will not be recognized by wild-type Rep and will only be recognized by the mutated Rep.
[00255] Квалифицированный специалист может определить соответствующую последовательность в других серотипах с помощью известных средств. Например, определение того, происходит ли изменение в области А, А', В, В', С, С' или D, и определение соответствующей области в другом серотипе. Для определения соответствующей последовательности можно использовать BLAST® (Basic Local Alignment Search Tool) или другие программы гомологического выравнивания с параметрами по умолчанию. Согласно настоящему изобретению также предложены популяции и множество зкДНК-векторов, содержащих mod-ITR из комбинации различных серотипов ААВ, то есть один mod-ITR может происходить из одного серотипа ААВ, а другой mod-ITR может происходить из другого серотипа. Не ограничиваясь какой-либо теорией, согласно одному варианту реализации один ITR может происходить или основываться на последовательности ITR ААВ2, а другой ITR зкДНК-вектора может происходить или основываться на любой одной или более последовательностях ITR ААВ серотипа 1 (ААВ1), ААВ серотипа 4 (ААВ4), ААВ серотипа 5 (ААВ5), ААВ серотипа 6 (ААВ6), ААВ серотипа 7 (ААВ7), ААВ серотипа 8 (ААВ8), ААВ серотипа 9 (ААВ9), ААВ серотипа 10 (ААВ10), ААВ серотипа 11 (ААВ11) или ААВ серотипа 12 (ААВ12).[00255] One of skill in the art can determine the corresponding sequence in other serotypes using known means. For example, determining whether the change occurs in region A, A', B, B', C, C' or D, and determining the corresponding region in another serotype. BLAST® (Basic Local Alignment Search Tool) or other homology alignment programs with default parameters can be used to determine the corresponding sequence. The present invention also provides populations and multiple cccDNA vectors containing mod-ITRs from a combination of different AAV serotypes, that is, one mod-ITR may be derived from one AAV serotype and another mod-ITR may be derived from a different serotype. Without being limited to any theory, in one embodiment, one ITR may be derived from or based on an AAB2 ITR sequence, and the other cDNA vector ITR may be derived from or based on any one or more ITR sequences of AAV serotype 1 (AAV1), AAV serotype 4 ( AAV4), AAV serotype 5 (AAV5), AAV serotype 6 (AAV6), AAV serotype 7 (AAV7), AAV serotype 8 (AAV8), AAV serotype 9 (AAV9), AAV serotype 10 (AAV10), AAV serotype 11 (AAV11 ) or AAV serotype 12 (AAV12).
[00256] Любой ITR парвовируса можно применять в качестве ITR или основного ITR для модификации. Предпочтительно парвовирус представляет собой депендовирус. Более предпочтительно ААВ. Выбранный серотип может быть основан на тканевом тропизме серотипа. ААВ2 обладает широким тканевым тропизмом, ААВ1 преимущественно нацелен на нейроны и скелетные мышцы, а ААВ5 преимущественно нацелен на нейроны, пигментный эпителий сетчатки и фоторецепторы. ААВ6 преимущественно нацелен на скелетные мышцы и легкие. ААВ8 преимущественно нацелен на печень, скелетные мышцы, сердце и ткани поджелудочной железы. ААВ9 преимущественно нацелен на печень, скелетную и легочную ткань. Согласно одному варианту реализации модифицированный ITR основан на ITR ААВ2.[00256] Any parvovirus ITR can be used as an ITR or primary ITR for modification. Preferably, the parvovirus is a dependovirus. AAV is more preferable. The serotype selected may be based on the tissue tropism of the serotype. AAB2 has broad tissue tropism, AAB1 predominantly targets neurons and skeletal muscle, and AAV5 predominantly targets neurons, retinal pigment epithelium, and photoreceptors. AAV6 primarily targets skeletal muscle and lungs. AAB8 primarily targets the liver, skeletal muscle, heart, and pancreatic tissue. AAB9 predominantly targets liver, skeletal and lung tissue. In one embodiment, the modified ITR is based on the AAB2 ITR.
[00257] Более конкретно, способность структурного элемента функционально взаимодействовать с конкретным большим белком Rep может быть изменена путем модификации структурного элемента. Например, нуклеотидная последовательность структурного элемента может быть модифицирована по сравнению с последовательностью ITR дикого типа. Согласно одному варианту реализации структурный элемент (например, плечо А, плечо А', плечо В, плечо В', плечо С, плечо С', плечо D, RBE, RBE' и TRS) ITR можно удалить и заменить структурным элементом дикого типа из другого парвовируса. Например, заменяющая структура может происходить из ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ6, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, ААВ13, змеиного парвовируса (например, парвовируса королевского питона), бычьего парвовируса, козьего парвовируса, птичьего парвовируса, собачьего парвовируса, лошадиного парвовируса, парвовируса креветок, свиного парвовируса или ААВ насекомых. Например, ITR может представлять собой ITR ААВ2, а плечо А или А' или RBE могут быть заменены структурным элементом из ААВ5. В другом примере ITR может представлять собой ITR ААВ5, а плечи С или С', RBE и TRS могут быть заменены структурным элементом из ААВ2. В другом примере ITR ААВ может представлять собой ITR ААВ5, в котором плечи В и В' заменены В и В' ITR ААВ2.[00257] More specifically, the ability of a structural element to operably interact with a particular large Rep protein can be altered by modifying the structural element. For example, the nucleotide sequence of the structural element may be modified compared to the wild-type ITR sequence. In one embodiment, a structural element (e.g., arm A, arm A', arm B, arm B', arm C, arm C', arm D, RBE, RBE', and TRS) of the ITR can be removed and replaced with a wild-type structural element from another parvovirus. For example, the replacement structure may be derived from AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, AAV13, snake parvovirus (eg, royal python parvovirus), bovine parvovirus, goat parvovirus, avian parvovirus parvovirus, canine parvovirus, equine parvovirus, shrimp parvovirus, porcine parvovirus or insect AAV. For example, the ITR may be an AAB2 ITR, and arm A or A' or the RBE may be replaced by a structural element from AAB5. In another example, the ITR may be an AAB5 ITR, and the C or C' arms, RBE, and TRS may be replaced by a building block from AAB2. In another example, the AAB ITR may be an AAB5 ITR in which arms B and B' are replaced by B and B' of the AAB2 ITR.
[00258] Только в качестве примера, в Таблице 4 указаны примерные модификации по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в областях модифицированного ITR, где X указывает на модификацию по меньшей мере одной нуклеиновой кислоты (например, делецию, вставку и/или замену) в этом участке относительно соответствующего ITR дикого типа. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в любой из областей С и/или С', и/или В, и/или В' сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Например, если модификация приводит к получению любого из: одноплечевого ITR (например, одно плечо С-С' или одно плечо В-В'), или модифицированного плеча С-В' или плеча С'-В, или двухплечевого ITR по меньшей мере с одним усеченным плечом (например, усеченным плечом С-С' и/или усеченным плечом В-В'), по меньшей мере одно плечо или по меньшей мере одно из двух плеч ITR (где одно плечо может быть усечено) сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Согласно некоторым вариантам реализации усеченное плечо С-С' и/или усеченное плечо В-В' имеет три последовательных Т-нуклеотида (т.е. ТТТ) в концевой петле.[00258] By way of example only, Table 4 sets forth exemplary modifications of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in regions of the modified ITR, where X indicates modification of at least one nucleic acid (e.g., deletion , insertion and/or substitution) in this region relative to the corresponding wild-type ITR. In some embodiments, any modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in any of regions C and/or C' and/or B and/or B' preserves three consecutive nucleotides T (t ie TTT) in at least one terminal loop. For example, if the modification results in any of: a single arm ITR (e.g., one arm C-C' or one arm B-B'), or a modified arm C-B' or an arm C'-B, or a two-arm ITR of at least with one truncated arm (e.g., a C-C' truncated arm and/or a B-B' truncated arm), at least one arm or at least one of two ITR arms (where one arm may be truncated) retains three consecutive nucleotides T (ie TTT) in at least one terminal loop. In some embodiments, the C-C' truncated arm and/or the B-B' truncated arm has three consecutive T nucleotides (ie, TTT) in the terminal loop.
[00259] Таблица 4: Примерные комбинации модификаций по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в различных областях или плечах В-В' и С-С' ITR (X указывает модификацию нуклеотида, например, добавление, делецию или замену по меньшей мере одного нуклеотида в области).[00259] Table 4: Exemplary combinations of modifications to at least one nucleotide (e.g., deletion, insertion, and/or substitution) in various regions or arms B-B' and C-C' of the ITR (X indicates a nucleotide modification, e.g., addition, deletion or substitution of at least one nucleotide in the region).
[00260] Согласно некоторым вариантам реализации mod-ITR для применения в зкДНК-векторе для экспрессии белка FVIII содержит пару асимметричных ITR или пару симметричных mod-ITR, как раскрыто в данном документе, может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида в любой одной или более областях, выбранных из: между А' и С, между С и С', между С' и В, между В и В' и между В' и А. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) в областях С или С' либо В или В' по-прежнему сохраняет концевую петлю структуры стебель-петля. Согласно некоторым вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) между С и С' и/или В и В' сохраняет три последовательных нуклеотида Т (т.е. ТТТ) по меньшей мере в одной концевой петле. Согласно альтернативным вариантам реализации любая модификация по меньшей мере одного нуклеотида (например, делеция, вставка и/или замена) между С и С' и/или В и В' сохраняет три последовательных нуклеотида А (т.е. AAA) по меньшей мере в одной концевой петле. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в любой одной или более из областей, выбранных из: А', А и/или D. Например, в некоторых вариантах реализации, модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А'. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области А и/или А'. Согласно некоторым вариантам реализации модифицированный ITR для применения в настоящем изобретении может содержать любую из комбинаций модификаций, представленных в Таблице 4, а также модификацию по меньшей мере одного нуклеотида (например, делецию, вставку и/или замену) в области D.[00260] In some embodiments, a mod-ITR for use in a cccDNA protein expression vector, FVIII comprises a pair of asymmetric ITRs or a pair of symmetric mod-ITRs as disclosed herein, may contain any of the combinations of modifications presented in Table 4, and also modification of at least one nucleotide in any one or more regions selected from: between A' and C, between C and C', between C' and B, between B and B', and between B' and A. In some embodiments implementation, any modification of at least one nucleotide (eg, deletion, insertion and/or substitution) in regions C or C' or B or B' still retains the terminal loop of the stem-loop structure. In some embodiments, any modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) between C and C' and/or B and B' preserves three consecutive T nucleotides (i.e., TTT) in at least one end loop. In alternative embodiments, any modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) between C and C' and/or B and B' preserves three consecutive nucleotides A (i.e., AAA) in at least one end loop. In some embodiments, a modified ITR for use in the present invention may comprise any of the combinations of modifications presented in Table 4, as well as modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in any one or more of the regions selected from: A', A and/or D. For example, in some embodiments, a modified ITR for use in the present invention may contain any of the combinations of modifications presented in Table 4, as well as a modification of at least one nucleotide (for example, a deletion , insertion, and/or substitution) in region A. In some embodiments, a modified ITR for use in the present invention may contain any of the combinations of modifications presented in Table 4, as well as modification of at least one nucleotide (e.g., deletion, insertion, and/or or replacement) in area A'. In some embodiments, a modified ITR for use in the present invention may comprise any of the combinations of modifications presented in Table 4, as well as modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in the A and/or A' region . In some embodiments, a modified ITR for use in the present invention may contain any of the combinations of modifications presented in Table 4, as well as modification of at least one nucleotide (e.g., deletion, insertion, and/or substitution) in region D.
[00261] Согласно одному варианту реализации нуклеотидная последовательность структурного элемента может быть модифицирована (например, путем модификации 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или более нуклеотидов или любого их диапазона) для получения модифицированного структурного элемента. Согласно одному варианту реализации конкретные модификации ITR приведены в данном документе в качестве примеров (например, SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или показанные на ФИГ. 7А-7В из PCT/US 2018/064242, поданной 6 декабря 2018 г. (например, SEQ ID NO 97-98, 101-103, 105-108, 111-112, 117-134, 545-54 в PCT/US 2018/064242)). Согласно некоторым вариантам реализации ITR может быть модифицирован (например, путем модификации 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 или более нуклеотидов или любого их диапазона). Согласно другим вариантам реализации ITR может иметь по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или более идентичности последовательности с одним из модифицированных ITR, имеющих SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или RBE-содержащим участком плеча А-А' и плеч С-С' и В-В', имеющих SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187, или представленных в Таблицах 2-9 (т.е. SEQ ID NO: 110-112, 115-190, 200-468) международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.[00261] In one embodiment, the nucleotide sequence of the building block may be modified (e.g., by modifying 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 , 17, 18, 19 or 20 or more nucleotides or any range thereof) to obtain a modified structural element. In one embodiment, specific modifications to the ITR are provided herein as examples (e.g., SEQ ID NOs: 3, 4, 15-47, 101-116, or 165-187, or shown in FIGS. 7A-7B from PCT/US 2018 /064242, filed December 6, 2018 (e.g., SEQ ID NO 97-98, 101-103, 105-108, 111-112, 117-134, 545-54 in PCT/US 2018/064242)). In some embodiments, the ITR may be modified (e.g., by modifying 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 or 20 or more nucleotides or any range thereof). In other embodiments, the ITR may be at least 80%, at least 85%, at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99% or more sequence identity with one of the modified ITRs having SEQ ID NO: 3, 4, 15-47, 101-116 or 165-187, or the RBE-containing region of the A-A' arm and the C-C arms ' and B-B' having SEQ ID NO: 3, 4, 15-47, 101-116 or 165-187, or presented in Tables 2-9 (i.e. SEQ ID NO: 110-112, 115- 190, 200-468) of international application PCT/US 18/49996, which is incorporated herein by reference in its entirety.
[00262] Согласно некоторым вариантам реализации модифицированный ITR может, например, содержать удаление или делецию всего конкретного плеча, например, всего или части плеча А-А', или всего или части плеча В-В', или всего или части плеча С-С', или, альтернативно, удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований, образующих стебель петли, при условии, что конечная петля, кэпирующая стебель (например, одно плечо), все еще присутствует (например, см. ITR-21 на ФИГ. 7А из PCT/US 2018/064242, поданной 6 декабря 2018 г.). Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча В-В'. Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча С-С' (см., например, ITR-1 на ФИГ. 3В или ITR-45 на ФИГ. 7А из PCT/US 2018/064242, поданной 6 декабря 2018 г.). Согласно некоторым вариантам реализации модифицированный ITR может содержать удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча С-С' и удаление 1, 2, 3, 4, 5, 6, 7, 8, 9 или более пар оснований из плеча В-В'. Предусмотрена любая комбинация удаления пар оснований, например, могут быть удалены 6 пар оснований в плече С-С' и 2 пары оснований в плече В-В'. В качестве иллюстративного примера, ФИГ. 3В показывает примерный модифицированный ITR по меньшей мере с 7 парами оснований, удаленными из каждой из части С и части С', заменой нуклеотида в петле между областями С и С' и делецией по меньшей мере одной пары оснований из каждой из области В и областей В' так, что модифицированный ITR содержит два плеча, из которых по меньшей мере одно плечо (например, С-С') усечено. Согласно некоторым вариантам реализации модифицированный ITR также содержит делецию по меньшей мере одной пары оснований из каждой из области В и областей В' так, что плечо В-В' также усечено относительно WT ITR.[00262] In some embodiments, the modified ITR may, for example, comprise the removal or deletion of all or a portion of an arm A-A', or all or a portion of an arm B-B', or all or a portion of an arm C-C ', or alternatively, deleting 1, 2, 3, 4, 5, 6, 7, 8, 9 or more base pairs forming a stem loop, provided that the terminal loop capping the stem (e.g., one arm) is all still present (for example, see ITR-21 at FIG. 7A from PCT/US 2018/064242, filed December 6, 2018). In some embodiments, the modified ITR may comprise deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, or more base pairs from the B-B' arm. In some embodiments, the modified ITR may comprise deletion of 1, 2, 3, 4, 5, 6, 7, 8, 9, or more base pairs from the C-C' arm (see, for example, ITR-1 in FIG. 3B or ITR-45 at FIGURE 7A from PCT/US 2018/064242 filed December 6, 2018). In some embodiments, the modified ITR may comprise deleting 1, 2, 3, 4, 5, 6, 7, 8, 9, or more base pairs from the C-C' arm and deleting 1, 2, 3, 4, 5, 6, 7, 8, 9 or more base pairs from arm B-B'. Any combination of base pair deletions is possible, for example, 6 base pairs in the C-C' arm and 2 base pairs in the B-B' arm can be deleted. As an illustrative example, FIG. 3B shows an exemplary modified ITR with at least 7 base pairs removed from each of the C portion and the C' portion, a nucleotide substitution in the loop between the C and C' regions, and a deletion of at least one base pair from each of the B region and the B regions. ' such that the modified ITR contains two arms, of which at least one arm (eg, C-C') is truncated. In some embodiments, the modified ITR also contains a deletion of at least one base pair from each of the B region and the B' regions such that the B-B' arm is also truncated relative to the WT ITR.
[00263] Согласно некоторым вариантам реализации модифицированный ITR может иметь от 1 до 50 (например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 или 50) делеций нуклеотидов относительно полноразмерной последовательности ITR дикого типа. Согласно некоторым вариантам реализации модифицированный ITR может иметь от 1 до 30 делеций нуклеотидов относительно полноразмерной последовательности WT ITR. Согласно некоторым вариантам реализации модифицированный ITR имеет от 2 до 20 делеций нуклеотидов относительно полноразмерной последовательности ITR дикого типа.[00263] In some embodiments, the modified ITR may have from 1 to 50 (e.g., 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, or 50) nucleotide deletions relative to the full-length wild-type ITR sequence. In some embodiments, the modified ITR may have 1 to 30 nucleotide deletions relative to the full-length WT ITR sequence. In some embodiments, the modified ITR has 2 to 20 nucleotide deletions relative to the full-length wild-type ITR sequence.
[00264] Согласно некоторым вариантам реализации модифицированный ITR не содержит никаких делеций нуклеотидов в RBE-содержащей части областей А или А', чтобы не препятствовать репликации ДНК (например, связывание RBE белком Rep или образование одноцепочечного разрыва в сайте концевого разрешения). Согласно некоторым вариантам реализации модифицированный ITR, предусмотренный для применения в данном документе, имеет одну или более делеций в области В, В', С и/или С, как описано в данном документе.[00264] In some embodiments, the modified ITR does not contain any nucleotide deletions in the RBE-containing portion of the A or A' regions so as not to interfere with DNA replication (eg, binding of the RBE by the Rep protein or formation of a single-strand break at the end resolution site). In some embodiments, a modified ITR provided for use herein has one or more deletions in the B, B', C, and/or C region as described herein.
[00265] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, содержащий пару симметричных ITR или пару асимметричных ITR, содержит регуляторный переключатель, как раскрыто в данном документе, и по меньшей мере один выбранный модифицированный ITR, имеющий нуклеотидную последовательность, выбранную из любой из группы, состоящей из: SEQ ID NO: 3, 4, 15-47, 101-116 или 165-187.[00265] In some embodiments, a cccDNA FVIII protein expression vector comprising a pair of symmetric ITRs or a pair of asymmetric ITRs comprises a regulatory switch as disclosed herein and at least one selected modified ITR having a nucleotide sequence selected from any from the group consisting of: SEQ ID NO: 3, 4, 15-47, 101-116 or 165-187.
[00266] Согласно другому варианту реализации структура структурного элемента может быть модифицирована. Например, структурный элемент имеет изменение высоты стебля и/или количества нуклеотидов в петле. Например, высота стебля может составлять примерно 2, 3, 4, 5, 6, 7, 8 или 9 нуклеотидов или более или любое значение в пределах указанного диапазона. Согласно одному варианту реализации высота стебля может составлять от примерно 5 нуклеотидов до примерно 9 нуклеотидов и он функционально взаимодействует с Rep. Согласно другому варианту реализации высота стебля может составлять примерно 7 нуклеотидов и он функционально взаимодействует с Rep. В другом примере петля может иметь 3, 4, 5, 6, 7, 8, 9 или 10 нуклеотидов или более или любое значение в пределах указанного диапазона.[00266] According to another embodiment, the structure of the structural element may be modified. For example, a structural element has a change in stem height and/or number of nucleotides in a loop. For example, the stem height may be about 2, 3, 4, 5, 6, 7, 8 or 9 nucleotides or more, or any value within that range. In one embodiment, the stem may be from about 5 nucleotides to about 9 nucleotides in height and operably interacts with Rep. In another embodiment, the stem may be approximately 7 nucleotides in height and operably interacts with Rep. In another example, the loop may be 3, 4, 5, 6, 7, 8, 9 or 10 nucleotides or more, or any value within that range.
[00267] Согласно другому варианту реализации количество сайтов связывания GAGY или родственных GAGY сайтов связывания в RBE или продленном RBE может быть увеличено или уменьшено. В одном примере RBE или продленный RBE может содержать 1, 2, 3, 4, 5 или 6 или более сайтов связывания GAGY или любое значение в пределах указанного диапазона. Каждый сайт связывания GAGY может независимо представлять собой точную последовательность GAGY или последовательность, сходную с GAGY, при условии, что последовательность достаточна для связывания белка Rep.[00267] In another embodiment, the number of GAGY binding sites or GAGY-related binding sites in an RBE or extended RBE may be increased or decreased. In one example, an RBE or extended RBE may contain 1, 2, 3, 4, 5 or 6 or more GAGY binding sites or any value within the specified range. Each GAGY binding site may independently be the exact GAGY sequence or a sequence similar to GAGY, provided that the sequence is sufficient for binding of the Rep protein.
[00268] Согласно другому варианту реализации расстояние между двумя элементами (такими как, но не ограничиваясь перечисленными, RBE и шпилька) может быть изменено (например, увеличено или уменьшено) для изменения функционального взаимодействия с большим белком Rep. Например, расстояние может составлять примерно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или 21 нуклеотид или более или любое значение в пределах указанного диапазона.[00268] In another embodiment, the distance between two elements (such as, but not limited to, an RBE and a hairpin) can be changed (eg, increased or decreased) to change the functional interaction with the large Rep protein. For example, the distance may be about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, or 21 nucleotides or more or any value within the specified range.
[00269] ЗкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, может включать структуру ITR, которая модифицирована относительно структуры ITR дикого типа ААВ2, раскрытой в данном документе, но все еще сохраняет функциональную часть RBE, TRS и RBE'. ФИГ. 2А и ФИГ. 2В показывают один возможный механизм функционирования сайта TRS внутри части структуры ITR дикого типа зкДНК-вектора для экспрессии белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более функциональных полинуклеотидных последовательностей ITR, которые содержат сайт связывания Rep (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) для AAB2) и сайт концевого разрешения (TRS; 5'-AGTT (SEQ ID NO: 62)). Согласно некоторым вариантам реализации по меньшей мере один ITR (wt или модифицированный ITR) является функциональным. Согласно альтернативным вариантам реализации, когда зкДНК-вектор для экспрессии белка FVIII содержит два модифицированных ITR, которые отличаются или асимметричны по отношению друг к другу, по меньшей мере один модифицированный ITR является функциональным и по меньшей мере один модифицированный ITR является нефункциональным.[00269] The cDNA FVIII protein expression vector described herein may include an ITR structure that is modified from the wild-type AAB2 ITR structure disclosed herein but still retains the functional portion of RBE, TRS, and RBE'. FIG. 2A and FIG. 2B shows one possible mechanism for the TRS site to function within the wild-type ITR portion of a ccDNA vector for FVIII protein expression. In some embodiments, the cccDNA vector for expression of the FVIII protein contains one or more functional ITR polynucleotide sequences that contain a Rep binding site (RBS; 5'-GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60) for AAB2) and an end resolution site ( TRS;5'-AGTT (SEQ ID NO: 62)). In some embodiments, at least one ITR (wt or modified ITR) is functional. In alternative embodiments, when the cccDNA vector for FVIII protein expression contains two modified ITRs that are different or asymmetrical with respect to each other, at least one modified ITR is functional and at least one modified ITR is non-functional.
[00270] Согласно некоторым вариантам реализации модифицированный ITR (например, левый или правый ITR) зкДНК-вектора для экспрессии белка FVIII, как описано в данном документе, имеет модификации в плече петли, усеченном плече или спейсере. Примерные последовательности ITR, имеющие модификации в плече петли, усеченном плече или спейсере, перечислены в Таблице 2 (т.е. SEQ ID NO: 135-190, 200-233); Таблице 3 (например, SEQ ID NO: 234-263); Таблице 4 (например, SEQ ID NO: 264-293); Таблице 5 (например, SEQ ID NO: 294-318 в данном документе); Таблице 6 (например, SEQ ID NO: 319-468); и Таблице 7-9 (например, SEQ ID NO: 101-110, 111-112, 115-134) или в Таблице 10А или 10В (например, SEQ ID NO: 9, 100, 469-483, 484-499) международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.[00270] In some embodiments, the modified ITR (eg, left or right ITR) of a cccDNA vector for FVIII protein expression, as described herein, has modifications in a loop arm, truncated arm, or spacer. Exemplary ITR sequences having modifications in the loop arm, truncated arm, or spacer are listed in Table 2 (ie, SEQ ID NO: 135-190, 200-233); Table 3 (eg SEQ ID NO: 234-263); Table 4 (eg SEQ ID NO: 264-293); Table 5 (eg, SEQ ID NO: 294-318 herein); Table 6 (eg SEQ ID NO: 319-468); and Table 7-9 (for example, SEQ ID NO: 101-110, 111-112, 115-134) or in Table 10A or 10B (for example, SEQ ID NO: 9, 100, 469-483, 484-499) international application PCT/US 18/49996, which is incorporated herein by reference in its entirety.
[00271] Согласно некоторым вариантам реализации модифицированный ITR для применения в зкДНК-векторе для экспрессии белка FVIII, содержащем пару асимметричных ITR или пару симметричных mod-ITR, выбирают из любых или из комбинации ITR, приведенных в Таблицах 2, 3, 4, 5, 6, 7, 8, 9 и 10A-10В международной заявки PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.[00271] In some embodiments, the modified ITR for use in a cDNA FVIII protein expression vector containing an asymmetric ITR pair or a symmetric mod-ITR pair is selected from any or a combination of ITRs listed in Tables 2, 3, 4, 5. 6, 7, 8, 9 and 10A-10B of international application PCT/US 18/49996, which is incorporated herein by reference in its entirety.
[00272] Дополнительные примерные модифицированные ITR для применения в зкДНК-векторе для экспрессии белка FVIII, содержащем пару асимметричных ITR или пару симметричных mod-ITR в каждом из указанных выше классов, представлены в Таблицах 5А и 5В. Прогнозируемая вторичная структура правых модифицированных ITR в Таблице 5А показана на ФИГ. 7А международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., и прогнозируемая вторичная структура левых модифицированных ITR в Таблице 5В показана на ФИГ. 7В международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., которая полностью включена в данный документ посредством ссылки.[00272] Additional exemplary modified ITRs for use in a cccDNA FVIII protein expression vector containing an asymmetric ITR pair or a symmetric mod-ITR pair in each of the above classes are presented in Tables 5A and 5B. The predicted secondary structure of the right modified ITRs in Table 5A is shown in FIG. 7A of international application PCT/US 2018/064242, filed December 6, 2018, and the predicted secondary structure of the left modified ITRs in Table 5B is shown in FIG. 7B International Application PCT/US 2018/064242, filed December 6, 2018, which is incorporated herein by reference in its entirety.
[00273] В Таблице 5А и Таблице 5В представлены примерные правые и левые модифицированные ITR.[00273] Table 5A and Table 5B show exemplary right and left modified ITRs.
[00274] Таблица 5А: Примерные модифицированные правые ITR. Эти примерные модифицированные правые ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и RBE' (т.е. комплементарную последовательность RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).[00274] Table 5A: Example Modified Right ITRs. These exemplary modified right-hand ITRs may comprise the RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), the ACTGAGGC spacer (SEQ ID NO: 69), the complementary spacer sequence GCCTCAGT (SEQ ID NO: 70), and the RBE' (i.e., complementary RBE sequence) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).
[00275] ТАБЛИЦА 5В: Примерные модифицированные левые ITR. Эти примерные модифицированные левые ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и комплементарную последовательность RBE (т.е. RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).[00275] TABLE 5B: Example Modified Left ITRs. These exemplary modified left ITRs may comprise the RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), the spacer ACTGAGGC (SEQ ID NO: 69), the complementary spacer sequence GCCTCAGT (SEQ ID NO: 70), and the complementary sequence RBE (i.e. RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).
[00276] Согласно одному варианту реализации зкДНК-вектор для экспрессии белка FVIII содержит, в направлении от 5' к 3': первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, описанную в данном документе), и второй ITR ААВ, причем указанный первый ITR (5'-ITR) и второй ITR (3'-ITR) являются асимметричными по отношению друг к другу, т.е. они имеют разную трехмерную пространственную конфигурацию по отношению друг к другу. В качестве примерного варианта реализации первый ITR может представлять собой ITR дикого типа, а второй ITR может представлять собой мутированный или модифицированный ITR или наоборот первый ITR может представлять собой мутированный или модифицированный ITR, а второй ITR может представлять собой ITR дикого типа. Согласно некоторым вариантам реализации первый ITR и второй ITR оба представляют собой mod-ITR, но имеют разные последовательности или разные модификации и, таким образом, не являются одинаковыми модифицированными ITR и имеют разные трехмерные пространственные конфигурации. Другими словами, зкДНК-вектор с асимметричными ITR содержит ITR, в которых любые изменения в одном ITR относительно WT-ITR не отражаются в другом ITR; или, альтернативно, если асимметричные ITR имеют пару модифицированных асимметричных ITR, они могут иметь различную последовательность и различную трехмерную форму по отношению друг к другу. Примерные асимметричные ITR в зкДНК-векторе для экспрессии белка FVIII и для применения в получении зкДНК-плазмиды представлены в Таблицах 5А и 5В.[00276] In one embodiment, the cDNA vector for expression of the FVIII protein contains, in the 5' to 3' direction: the first inverted terminal repeat (ITR) of an adeno-associated virus (AAV), a nucleotide sequence of interest (for example, an expression cassette described herein) and a second ITR of AAB, wherein said first ITR (5'-ITR) and second ITR (3'-ITR) are asymmetric with respect to each other, i.e. they have different three-dimensional spatial configurations in relation to each other. As an exemplary embodiment, the first ITR may be a wild-type ITR and the second ITR may be a mutated or modified ITR, or conversely, the first ITR may be a mutated or modified ITR and the second ITR may be a wild-type ITR. In some embodiments, the first ITR and the second ITR are both mod-ITRs, but have different sequences or different modifications and thus are not the same modified ITRs and have different three-dimensional spatial configurations. In other words, a cccDNA vector with asymmetric ITRs contains ITRs in which any changes in one ITR relative to the WT-ITR are not reflected in the other ITR; or, alternatively, if the asymmetric ITRs have a pair of modified asymmetric ITRs, they may have a different sequence and a different three-dimensional shape in relation to each other. Exemplary asymmetric ITRs in the cDNA vector for expression of the FVIII protein and for use in the preparation of the cDNA plasmid are presented in Tables 5A and 5B.
[00277] Согласно альтернативному варианту реализации зкДНК-вектор для экспрессии белка FVIII содержит два симметричных mod-ITR, то есть оба ITR имеют одинаковую последовательность, но обратно комплементарны (инвертированы) друг другу. Согласно некоторым вариантам реализации пара симметричных mod-ITR содержит по меньшей мере одну или любую комбинацию делеции, вставки или замены относительно последовательности ITR дикого типа из того же серотипа ААВ. Добавления, делеции или замены в симметричных ITR одинаковы, но обратно комплементарны друг другу. Например, вставка 3 нуклеотидов в области С 5' ITR будет отражаться во вставке 3 обратно комплементарных нуклеотидов в соответствующем участке в области С' 3' ITR. Исключительно для целей иллюстрации, если добавление представляет собой AACG в 5' ITR, добавление представляет собой CGTT в 3' ITR в соответствующем сайте. Например, если смысловая цепь 5' ITR представляет собой ATCGATCG с добавлением AACG между G и А, это дает последовательность ATCGAACGATCG (SEQ ID NO: 51). Соответствующая смысловая цепь 3' ITR представляет собой CGATCGAT (обратно комплементарная последовательность ATCGATCG) с добавлением CGTT (т.е. обратно комплементарная последовательность AACG) между Т и С, что дает последовательность CGATCGTTCGAT (SEQ ID NO: 49) (обратно комплементарная последовательность ATCGAACGATCG) (SEQ ID NO: 51).[00277] In an alternative embodiment, the cccDNA vector for expressing the FVIII protein contains two symmetrical mod-ITRs, that is, both ITRs have the same sequence but are inversely complementary to each other. In some embodiments, a pair of symmetric mod-ITRs comprises at least one or any combination of deletions, insertions, or substitutions relative to a wild-type ITR sequence from the same AAV serotype. Additions, deletions, or substitutions in symmetrical ITRs are the same but inversely complementary to each other. For example, an insertion of 3 nucleotides in the C 5' ITR region will be reflected in the insertion of 3 reverse complementary nucleotides in the corresponding region in the C' 3' ITR region. For purposes of illustration only, if the addition is an AACG at the 5' ITR, the addition is a CGTT at the 3' ITR at the corresponding site. For example, if the sense strand of the 5' ITR is ATCGATCG with the addition of AACG between G and A, this gives the sequence ATCGAACGATCG (SEQ ID NO: 51). The corresponding sense strand of the 3' ITR is CGATCGAT (reverse complementary sequence ATCGATCG) with the addition of CGTT (i.e. reverse complementary sequence AACG) between T and C, giving the sequence CGATCGTTCGAT (SEQ ID NO: 49) (reverse complementary sequence ATCGAACGATCG) (SEQ ID NO: 51).
[00278] Согласно альтернативным вариантам реализации пара модифицированных ITR по существу симметрична, как определено в данном документе, то есть пара модифицированных ITR может иметь разную последовательность, но иметь соответствующую или одинаковую симметричную трехмерную форму. Например, один модифицированный ITR может происходить из одного серотипа, а другой модифицированный ITR может происходить из другого серотипа, но они имеют одинаковую мутацию (например, вставку, делецию или замену нуклеотидов) в одной и той же области. Другими словами, только для иллюстративных целей, 5'mod-ITR может происходить из ААВ2 и иметь делецию в области С, а 3' mod-ITR может происходить из ААВ5 и иметь соответствующую делецию в области С', и при условии, что 5'mod-ITR и 3'mod-ITR имеют одинаковую или симметричную трехмерную пространственную организацию, они предусмотрены для применения в настоящем изобретении в качестве пары модифицированных ITR.[00278] In alternative embodiments, a pair of modified ITRs is substantially symmetrical as defined herein, that is, a pair of modified ITRs may have a different sequence but have a corresponding or identical symmetrical three-dimensional shape. For example, one modified ITR may be from one serotype and another modified ITR may be from a different serotype, but they have the same mutation (eg, insertion, deletion, or nucleotide substitution) in the same region. In other words, for illustrative purposes only, a 5'mod-ITR may be derived from AAB2 and have a deletion in the C region, and a 3' mod-ITR may be derived from AAB5 and have a corresponding deletion in the C' region, and provided that 5' mod-ITR and 3'mod-ITR have the same or symmetrical three-dimensional spatial organization and are intended for use in the present invention as a pair of modified ITRs.
[00279] Согласно некоторым вариантам реализации пара по существу симметричных mod-ITR имеет одинаковые петли А, С-С' и В-В' в трехмерном пространстве, например, если модифицированный ITR в паре по существу симметричных mod-ITR имеет делецию плеча С-С', то когнатный mod-ITR имеет соответствующую делецию петли С-С', а также имеет сходную трехмерную структуру остальных петель А и В-В' одинаковой формы в геометрическом пространстве со своим когнатным mod-ITR. Только в качестве примера, по существу симметричные ITR могут иметь симметричную пространственную организацию так, что их структура имеет одинаковую форму в геометрическом пространстве. Это может происходить, например, когда пара G-C модифицирована, например, в пару C-G или наоборот, или когда пара А-Т модифицирована в пару Т-А, или наоборот. Следовательно, используя приведенный выше иллюстративный пример модифицированного 5' ITR как ATCGAACGATCG (SEQ ID NO: 51) и модифицированного 3' ITR как CGATCGTTCGAT (SEQ ID NO: 49) (т.е. обратно комплементарной последовательности для ATCGAACGATCG (SEQ ID NO: 51)), эти модифицированные ITR все равно были бы симметричными, если бы, например, 5' ITR имел последовательность ATCGAACCATCG (SEQ ID NO: 50), где G в добавлении модифицирован на С, и по существу симметричный 3'-ITR имеет последовательность CGATCGTTCGAT (SEQ ID NO: 49), без соответствующей модификации Т в дополнение к а. Согласно некоторым вариантам реализации такая пара модифицированных ITR является по существу симметричной, поскольку пара модифицированных ITR имеет симметричную стереохимию.[00279] In some embodiments, a pair of substantially symmetric mod-ITRs has the same A, C-C', and B-B' loops in three-dimensional space, for example, if a modified ITR in a pair of substantially symmetric mod-ITRs has a deletion of arm C- C', then the cognate mod-ITR has a corresponding deletion of the C-C' loop, and also has a similar three-dimensional structure of the remaining loops A and B-B' of the same shape in geometric space with its cognate mod-ITR. By way of example only, substantially symmetrical ITRs may have a symmetrical spatial organization such that their structure has the same shape in geometric space. This may occur, for example, when a GC pair is modified, for example, into a CG pair or vice versa, or when an A-T pair is modified into a T-A pair, or vice versa. Therefore, using the above illustrative example of a modified 5' ITR as ATCGAACGATCG (SEQ ID NO: 51) and a modified 3' ITR as CGATCGTTCGAT (SEQ ID NO: 49) (i.e., the reverse complementary sequence to ATCGAACGATCG (SEQ ID NO: 51) )), these modified ITRs would still be symmetric if, for example, the 5' ITR had the sequence ATCGAAC C ATCG (SEQ ID NO: 50), where the G in addition is modified to C, and the substantially symmetric 3' ITR has sequence CGATCGTTCGAT (SEQ ID NO: 49), without the corresponding T modification in addition to a. In some embodiments, such a pair of modified ITRs is substantially symmetrical because the pair of modified ITRs has symmetrical stereochemistry.
[00280] Таблица 6 показывает примерные пары симметричных модифицированных ITR (т.е. левого модифицированного ITR и симметричного правого модифицированного ITR) для применения в зкДНК-векторе для экспрессии белка FVIII. Выделенный жирным шрифтом (красным) участок последовательностей идентифицирует часть последовательностей ITR (т.е. последовательности петель А-А', С-С' и В-В'), также показанных на ФИГ. 31А-46В. Эти примерные модифицированные ITR могут содержать RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), спейсер ACTGAGGC (SEQ ID NO: 69), комплементарную последовательность спейсера GCCTCAGT (SEQ ID NO: 70) и RBE' (т.е. комплементарную последовательность RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).[00280] Table 6 shows exemplary pairs of symmetrical modified ITRs (ie, left-handed modified ITR and symmetrical right-handed modified ITR) for use in a cccDNA vector for expression of the FVIII protein. The bolded (red) sequence region identifies a portion of the ITR sequences (ie, loop sequences A-A', C-C', and B-B') also shown in FIG. 31A-46B. These exemplary modified ITRs may comprise the RBE GCGCGCTCGCTCGCTC-3' (SEQ ID NO: 60), the spacer ACTGAGGC (SEQ ID NO: 69), the complementary sequence of the spacer GCCTCAGT (SEQ ID NO: 70) and the RBE' (i.e., the complementary sequence RBE) GAGCGAGCGAGCGCGC (SEQ ID NO: 71).
[00281] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, содержащий пару асимметричных ITR, может содержать ITR с модификацией, соответствующей любой из модификаций в последовательностях ITR или неполных последовательностях ITR, представленных в любой одной или более из Таблиц 5А-5В в данном документе, или последовательностях, показанных на ФИГ. 7А-7В международной заявки PCT/US 2018/064242, поданной 6 декабря 2018 г., которая полностью включена в данный документ, или раскрытых в Таблицах 2, 3, 4, 5, 6, 7, 8, 9 или 10А-10В международной заявки PCT/US 18/49996, поданной 7 сентября 2018 г., полностью включенной в данный документ посредством ссылки.[00281] In some embodiments, a cccDNA FVIII protein expression vector containing a pair of asymmetric ITRs may contain an ITR with a modification corresponding to any of the modifications in the ITR sequences or partial ITR sequences presented in any one or more of Tables 5A-5B in this document, or the sequences shown in FIGS. 7A-7B of international application PCT/US 2018/064242, filed December 6, 2018, which is incorporated herein in its entirety, or disclosed in Tables 2, 3, 4, 5, 6, 7, 8, 9 or 10A-10B of the international Application PCT/US 18/49996, filed September 7, 2018, which is incorporated herein by reference in its entirety.
V. Примерные зкДНК-векторыV. Exemplary cDNA Vectors
[00282] Как описано выше, настоящее раскрытие относится к рекомбинантным экспрессионным зкДНК-векторам и зкДНК-векторам, которые кодируют белок FVIII, содержащим любой из: пары асимметричных ITR, пары симметричных ITR или пары по существу симметричных ITR, как описано выше. Согласно определенным вариантам реализации настоящее раскрытие относится к рекомбинантным зкДНК-векторам для экспрессии белка FVIII, имеющим фланкирующие последовательности ITR и трансген, причем указанные последовательности ITR являются асимметричными, симметричными или по существу симметричными по отношению друг к другу, как определено в данном документе, и зкДНК дополнительно содержит нуклеотидную последовательность, представляющую интерес (например, экспрессионную кассету, содержащую нуклеиновую кислоту трансгена), расположенную между фланкирующими ITR, при этом указанная молекула нуклеиновой кислоты лишена последовательностей, кодирующих вирусный капсидный белок.[00282] As described above, the present disclosure relates to recombinant cccDNA expression vectors and cccDNA vectors that encode an FVIII protein containing any of: a pair of asymmetric ITRs, a pair of symmetric ITRs, or a pair of substantially symmetric ITRs as described above. In certain embodiments, the present disclosure provides recombinant cDNA FVIII protein expression vectors having ITR and transgene flanking sequences, wherein said ITR sequences are asymmetric, symmetric, or substantially symmetrical with respect to each other as defined herein, and the cccDNA further comprising a nucleotide sequence of interest (eg, an expression cassette containing a transgene nucleic acid) located between flanking ITRs, wherein said nucleic acid molecule lacks sequences encoding a viral capsid protein.
[00283] Экспрессионный зкДНК-вектор для экспрессии белка FVIII может представлять собой любой зкДНК-вектор, который можно удобно подвергнуть методикам рекомбинантной ДНК, включая нуклеотидную последовательность (и), описанную в данном документе, при условии, что по меньшей мере один ITR изменен. ЗкДНК-векторы для экспрессии белка FVIII согласно настоящему раскрытию совместимы с клеткой-хозяином, в которую должен быть введен зкДНК-вектор. Согласно определенным вариантам реализации зкДНК-векторы могут быть линейными. Согласно определенным вариантам реализации зкДНК-векторы могут существовать как внехромосомные объекты. Согласно определенным вариантам реализации зкДНК-векторы согласно настоящему раскрытию могут содержать элемент (ы), который позволяет интегрировать донорную последовательность в геном клетки-хозяина. В данном документе «трансген» и «гетер о логичная нуклеотидная последовательность» являются синонимами и кодируют белок FVIII, как описано в данном документе.[00283] The cccDNA expression vector for expression of the FVIII protein can be any cccDNA vector that can be conveniently subjected to recombinant DNA techniques, including the nucleotide sequence(s) described herein, provided that at least one ITR is changed. The cDNA vectors for expression of the FVIII protein of the present disclosure are compatible with the host cell into which the cDNA vector is to be introduced. In certain embodiments, the cDNA vectors may be linear. In certain embodiments, cDNA vectors may exist as extrachromosomal entities. In certain embodiments, the cccDNA vectors of the present disclosure may contain element(s) that allow integration of a donor sequence into the genome of a host cell. As used herein, “transgene” and “heterogeneous nucleotide sequence” are synonymous and encode the FVIII protein as described herein.
[00284] На ФИГ. 1A-1G показаны схемы функциональных компонентов двух неограничивающих плазмид, которые можно применять для получения зкДНК-вектора для экспрессии белка FVIII. ФИГ. 1А, 1B, 1D, 1F показывают конструкцию зкДНК-векторов или соответствующих последовательностей зкДНК-плазмид для экспрессии белка FVIII. ЗкДНК-векторы не имеют капсидов и могут быть получены из плазмиды, кодирующей, в указанном порядке: первый ITR, кассету экспрессируемого трансгена и второй ITR, причем последовательности первого и второго ITR асимметричны, симметричны или по существу симметричны по отношению друг к другу, как определено в данном документе. ЗкДНК-векторы для экспрессии белка FVIII не имеют капсидов и могут быть получены из плазмиды, кодирующей, в указанном порядке: первый ITR, экспрессируемый трансген (белок или нуклеиновую кислоту) и второй ITR, причем последовательности первого и второго ITR асимметричны, симметричны или по существу симметричны по отношению друг к другу, как определено в данном документе. Согласно некоторым вариантам реализации кассета экспрессируемого трансгена включает, при необходимости: энхансер/промотор, одно или более плеч гомологии, донорную последовательность, посттранскрипционный регуляторный элемент (например, WPRE, например, SEQ ID NO: 67), а также сигнал полиаденилирования и терминации (например, BGH поли(А), например, SEQ ID NO: 68).[00284] In FIG. 1A-1G show diagrams of the functional components of two non-limiting plasmids that can be used to generate a cccDNA vector for expression of the FVIII protein. FIG. 1A, 1B, 1D, 1F show the construction of cccDNA vectors or corresponding ccDNA plasmid sequences for expression of the FVIII protein. CccDNA vectors do not have capsids and can be derived from a plasmid encoding, in this order: a first ITR, an expressed transgene cassette, and a second ITR, wherein the sequences of the first and second ITR are asymmetric, symmetrical, or substantially symmetrical to each other, as defined in this document. CccDNA vectors for FVIII protein expression do not have capsids and can be derived from a plasmid encoding, in this order: a first ITR, the transgene (protein or nucleic acid) to be expressed, and a second ITR, wherein the sequences of the first and second ITRs are asymmetric, symmetrical, or substantially symmetrical with respect to each other as defined herein. In some embodiments, the expressed transgene cassette includes, as appropriate, an enhancer/promoter, one or more homology arms, a donor sequence, a post-transcriptional regulatory element (e.g., WPRE, e.g., SEQ ID NO: 67), and a polyadenylation and termination signal (e.g. , BGH poly(A), for example, SEQ ID NO: 68).
[00285] ФИГ. 5 изображает гель, подтверждающий продуцирование зкДНК из нескольких плазмидных конструкций с использованием способа, описанного в Примерах. ЗкДНК-вектор подтверждается характерным профилем полос в геле, как обсуждается в отношении ФИГ. 4А выше и в Примерах.[00285] FIG. 5 depicts a gel confirming the production of cccDNA from several plasmid constructs using the method described in the Examples. The cctDNA vector is confirmed by the characteristic banding profile in the gel, as discussed in relation to FIG. 4A above and in the Examples.
А. Регуляторные элементыA. Regulatory elements
[00286] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, содержащие пару асимметричных ITR или пару симметричных ITR, как определено в данном документе, могут дополнительно содержать конкретную комбинацию цис-регуляторных элементов. Цис-регуляторные элементы включают, но не ограничиваются перечисленными, промотор, рибопереключатель, инсулятор, mir-регулируемый элемент, посттранскрипционный регуляторный элемент, промотор, специфический для ткани и типа клеток, и энхансер. Согласно некоторым вариантам реализации ITR может действовать как промотор трансгена, например, белка FVIII. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, содержит дополнительные компоненты для регуляции экспрессии трансгена, например, регуляторные переключатели, описанные в данном документе, для регуляции экспрессии трансгена или аварийный выключатель, который может уничтожить клетку, содержащую зкДНК-вектор, кодирующий белок FVIII. Регуляторные элементы, включая регуляторные переключатели, которые можно применять в настоящем изобретении, более подробно обсуждаются в международной заявке PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.[00286] The cDNA FVIII protein expression vectors described herein containing an asymmetric ITR pair or a symmetric ITR pair as defined herein may further contain a particular combination of cis-regulatory elements. Cis-regulatory elements include, but are not limited to, a promoter, a riboswitch, an insulator, a mir-regulated element, a post-transcriptional regulatory element, a tissue- and cell type-specific promoter, and an enhancer. In some embodiments, the ITR may act as a promoter of a transgene, such as the FVIII protein. In some embodiments, the cccDNA FVIII protein expression vector described herein includes additional components for regulating transgene expression, such as regulatory switches described herein for regulating transgene expression or a kill switch that can kill the cell containing the cccDNA -vector encoding the FVIII protein. Regulatory elements, including regulatory switches, that can be used in the present invention are discussed in more detail in international application PCT/US 18/49996, which is incorporated herein by reference in its entirety.
[00287] В вариантах реализации вторая нуклеотидная последовательность включает регуляторную последовательность и нуклеотидную последовательность, кодирующую нуклеазу. Согласно определенным вариантам реализации регуляторная последовательность гена функционально связана с нуклеотидной последовательностью, кодирующей нуклеазу. Согласно определенным вариантам реализации регуляторная последовательность пригодна для контроля экспрессии нуклеазы в клетке-хозяине. Согласно определенным вариантам реализации регуляторная последовательность включает подходящую промоторную последовательность, способную направлять транскрипцию гена, функционально связанного с промоторной последовательностью, такого как нуклеотидная последовательность, кодирующая нуклеазу (нуклеазы) согласно настоящему раскрытию. Согласно определенным вариантам реализации вторая нуклеотидная последовательность включает интронную последовательность, связанную с 5'-концом нуклеотидной последовательности, кодирующей нуклеазу. Согласно определенным вариантам реализации последовательность энхансера обеспечена в 5-направлении относительно промотора для повышения эффективности промотора. Согласно определенным вариантам реализации регуляторная последовательность включает энхансер и промотор, причем вторая нуклеотидная последовательность включает интронную последовательность в 5-направлении от нуклеотидной последовательности, кодирующей нуклеазу, при этом интрон включает один или более сайтов расщепления нуклеазой, и при этом промотор функционально связан с нуклеотидной последовательностью, кодирующей нуклеазу.[00287] In embodiments, the second nucleotide sequence includes a regulatory sequence and a nucleotide sequence encoding a nuclease. In certain embodiments, the gene regulatory sequence is operably linked to a nucleotide sequence encoding a nuclease. In certain embodiments, the regulatory sequence is useful for controlling the expression of a nuclease in a host cell. In certain embodiments, the regulatory sequence includes a suitable promoter sequence capable of directing transcription of a gene operably linked to the promoter sequence, such as a nucleotide sequence encoding a nuclease(s) of the present disclosure. In certain embodiments, the second nucleotide sequence includes an intronic sequence associated with the 5' end of the nucleotide sequence encoding the nuclease. In certain embodiments, the enhancer sequence is provided in the 5-direction relative to the promoter to improve promoter efficiency. In certain embodiments, the regulatory sequence includes an enhancer and a promoter, wherein the second nucleotide sequence includes an intronic sequence upstream of a nucleotide sequence encoding a nuclease, wherein the intron includes one or more nuclease cleavage sites, and wherein the promoter is operably linked to the nucleotide sequence, encoding a nuclease.
[00288] ЗкДНК-векторы для экспрессии белка FVIII, полученные синтетическим путем или с использованием метода продуцирования на основе клеток, как описано в данном документе в Примерах, могут дополнительно содержать конкретную комбинацию цис-регуляторных элементов, таких как посттранскрипционный регуляторный элемент WHP (WPRE) (например, SEQ ID NO: 67) и BGH поли(А) (SEQ ID NO: 68). Подходящие экспрессионные кассеты для применения в экспрессионных конструкциях не имеют налагаемого вирусным капсидом ограничения по упаковке.[00288] CCDNA vectors for FVIII protein expression, produced synthetically or using a cell-based production method as described herein in the Examples, may further contain a specific combination of cis-regulatory elements, such as a WHP post-transcriptional regulatory element (WPRE) (eg, SEQ ID NO: 67) and BGH poly(A) (SEQ ID NO: 68). Suitable expression cassettes for use in expression constructs do not have the packaging limitation imposed by the viral capsid.
(i) Промоторы:(i) Promoters:
[00289] Обычный специалист в данной области техники поймет, что промоторы, используемые в зкДНК-векторах для экспрессии белка FVIII, как описано в данном документе, должны быть адаптированы в соответствии с конкретными последовательностями, на которые они оказывают промоторное действие. В соответствии с некоторыми вариантами реализации промотор представляет собой любой промотор или промоторную последовательность, описанную в международной заявке № PCT/US 2020/021328, поданной 6 марта 2020 г., которая полностью включена в данный документ посредством ссылки.[00289] One of ordinary skill in the art will appreciate that the promoters used in cDNA vectors for expression of the FVIII protein, as described herein, must be tailored according to the particular sequences on which they exert promoter action. In some embodiments, the promoter is any promoter or promoter sequence described in International Application No. PCT/US 2020/021328, filed March 6, 2020, which is incorporated herein by reference in its entirety.
[00290] В соответствии с некоторыми вариантами реализации промотор представляет собой промотор VandenDriessche (VD). В соответствии с некоторыми вариантами реализации промотор VD содержит SEQ ID NO: 191, представленную ниже:[00290] In some embodiments, the promoter is a VandenDriessche (VD) promoter. In accordance with some embodiments, the VD promoter comprises SEQ ID NO: 191, shown below:
[00291] В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 85% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 90% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 95% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 96% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 97% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 98% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор содержит последовательность нуклеиновой кислоты, которая по меньшей мере примерно на 99% идентична SEQ ID NO: 191. В соответствии с некоторыми вариантами реализации промотор состоит из последовательности нуклеиновой кислоты SEQ ID NO: 191.[00291] In accordance with some embodiments, the promoter contains a nucleic acid sequence that is at least about 85% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter contains a nucleic acid sequence that is at least about 90% identical to SEQ ID NO: 191. is identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter contains a nucleic acid sequence that is at least about 95% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter contains a nucleic acid sequence that is at least is about 96% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter contains a nucleic acid sequence that is at least about 97% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter contains a nucleic acid sequence that which is at least about 98% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter comprises a nucleic acid sequence that is at least about 99% identical to SEQ ID NO: 191. In accordance with some embodiments, the promoter consists from the nucleic acid sequence SEQ ID NO: 191.
[00292] Экспрессионные кассеты зкДНК-вектора для экспрессии белка FVIII могут включать промотор, который может влиять на общие уровни экспрессии, а также на клеточную специфичность. В случае экспрессии трансгена, например, экспрессии белка FVIII, они могут включать высокоактивный немедленный ранний промотор вирусного происхождения. Экспрессионные кассеты могут содержать тканеспецифические эукариотические промоторы для ограничения экспрессии трансгена конкретными типами клеток и снижения токсических эффектов и иммунных ответов, обусловленных нерегулируемой эктопической экспрессией. Согласно некоторым вариантам реализации экспрессионная кассета может содержать промотор или синтетический регуляторный элемент, такой как промотор CAG (SEQ ID NO: 72). Промотор CAG содержит (i) ранний энхансерный элемент цитомегаловируса (CMV), (ii) промотор, первый экзон и первый интрон гена бета-актина курицы, и (iii) акцептор сплайсинга гена бета-глобина кролика. В качестве альтернативы, экспрессионная кассета может содержать промотор альфа-1-антитрипсина (ААТ) (SEQ ID NO: 73 или SEQ ID NO: 74), специфический для печени (LP1) промотор (SEQ ID NO: 75 или SEQ ID NO: 76) или промотор фактора удлинения-1-альфа (EF1a) человека (например, SEQ ID NO: 77 или SEQ ID NO: 78). Согласно некоторым вариантам реализации экспрессионная кассета включает один или более конститутивных промоторов, например, ретровирусный LTR-промотор вируса саркомы Рауса (RSV) (необязательно с энхансером RSV) или немедленный ранний промотор цитомегаловируса (CMV) (необязательно с энхансером CMV, например, SEQ ID NO: 79). В качестве альтернативы, можно применять индуцируемый промотор, нативный для трансгена промотор, тканеспецифический промотор или различные промоторы, известные в данной области техники.[00292] The cDNA vector expression cassettes for FVIII protein expression may include a promoter that can influence overall expression levels as well as cell specificity. In the case of transgene expression, for example FVIII protein expression, they may include a highly active immediate early promoter of viral origin. Expression cassettes may contain tissue-specific eukaryotic promoters to restrict transgene expression to specific cell types and reduce toxic effects and immune responses caused by unregulated ectopic expression. In some embodiments, the expression cassette may comprise a promoter or a synthetic regulatory element, such as a CAG promoter (SEQ ID NO: 72). The CAG promoter contains (i) the cytomegalovirus (CMV) early enhancer element, (ii) the promoter, first exon, and first intron of the chicken beta-actin gene, and (iii) the splice acceptor of the rabbit beta-globin gene. Alternatively, the expression cassette may comprise an alpha-1 antitrypsin (AAT) promoter (SEQ ID NO: 73 or SEQ ID NO: 74), a liver-specific (LP1) promoter (SEQ ID NO: 75 or SEQ ID NO: 76 ) or human elongation factor-1-alpha (EF1a) promoter (e.g., SEQ ID NO: 77 or SEQ ID NO: 78). In some embodiments, the expression cassette includes one or more constitutive promoters, e.g., a Rous sarcoma virus (RSV) retroviral LTR promoter (optionally with an RSV enhancer) or a cytomegalovirus (CMV) immediate early promoter (optionally with a CMV enhancer, e.g., SEQ ID NO : 79). Alternatively, an inducible promoter, a transgene-native promoter, a tissue-specific promoter, or various promoters known in the art may be used.
[00293] Подходящие промоторы, включая те, которые описаны в данном документе, могут происходить из вирусов и, соответственно, могут называться вирусными промоторами, или они могут происходить из любого организма, в том числе прокариотических или эукариотических организмов. Для управления экспрессией с помощью любой РНК-полимеразы (например, pol I, pol II, pol III) могут применяться подходящие промоторы. Примерные промоторы включают, но не ограничиваются перечисленными, ранний промотор SV40, промотор длинного концевого повтора (LTR) вируса опухоли молочной железы мыши; большой поздний промотор аденовируса (Ad MLP); промотор вируса простого герпеса (HSV), промотор цитомегаловируса (CMV), такой как область немедленного раннего промотора CMV (CMVIE), промотор вируса саркомы Рауса (RSV), промотор U6 малой ядерной РНК человека (U6, например, SEQ ID NO: 80) (Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)), улучшенный промотор U6 (e.g., Xia et al., Nucleic Acids Res. 2003 Sep. 1; 31(17)), промотор H1 человека (H1) (например, SEQ ID NO: 81 или SEQ ID NO: 155), промотор CAG, промотор альфа-1-антитрипсина человека (НААТ) (например, SEQ ID NO: 82) и т.п. Согласно определенным вариантам реализации указанные промоторы изменяют на их содержащем интрон 3'-конце так, чтобы они включали один или более сайтов расщепления нуклеазами. Согласно определенным вариантам реализации ДНК, содержащая сайт(ы) расщепления нуклеазой, является чужеродной для ДНК промотора.[00293] Suitable promoters, including those described herein, may be derived from viruses and may thus be referred to as viral promoters, or they may be derived from any organism, including prokaryotic or eukaryotic organisms. Suitable promoters can be used to drive expression by any RNA polymerase (eg, pol I, pol II, pol III). Exemplary promoters include, but are not limited to, the SV40 early promoter, the mouse mammary tumor virus long terminal repeat (LTR) promoter; adenovirus large late promoter (Ad MLP); herpes simplex virus (HSV) promoter, cytomegalovirus (CMV) promoter such as the CMV immediate early (CMVIE) promoter region, Rous sarcoma virus (RSV) promoter, human small nuclear RNA U6 promoter (U6, e.g., SEQ ID NO: 80) (Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)), improved U6 promoter (e.g., Xia et al., Nucleic Acids Res. 2003 Sep. 1; 31(17)), human H1 promoter (H1) (eg, SEQ ID NO: 81 or SEQ ID NO: 155), CAG promoter, human alpha-1 antitrypsin (HAAT) promoter (eg, SEQ ID NO: 82), etc. In certain embodiments, said promoters are modified at their intron-containing 3' end to include one or more nuclease cleavage sites. In certain embodiments, the DNA containing the nuclease cleavage site(s) is foreign to the promoter DNA.
[00294] Согласно одному варианту реализации используемый промотор представляет собой нативный промотор гена, кодирующего терапевтический белок. Промоторы и другие регуляторные последовательности соответствующих генов, кодирующих терапевтические белки, известны и были охарактеризованы. Используемая промоторная область может дополнительно включать одну или более дополнительных регуляторных последовательностей (например, нативных), например, энхансеров (например, SEQ ID NO: 79 и SEQ ID NO: 83), включая энхансер SV40 (SEQ ID NO: 126).[00294] In one embodiment, the promoter used is the native promoter of a gene encoding a therapeutic protein. The promoters and other regulatory sequences of the corresponding genes encoding therapeutic proteins are known and have been characterized. The promoter region used may further include one or more additional regulatory sequences (eg, native), such as enhancers (eg, SEQ ID NO: 79 and SEQ ID NO: 83), including the SV40 enhancer (SEQ ID NO: 126).
[00295] Согласно некоторым вариантам реализации промотор также может представлять собой промотор из гена человека, такого как убиквитин С человека (hUbC), актин человека, миозин человека, гемоглобин человека, мышечный креатин человека или металлотионеин человека. Промотор также может представлять собой тканеспецифический промотор, такой как специфический для печени промотор, например, альфа-1-антитрипсина человека (НААТ), природный или синтетический. Согласно одному варианту реализации доставку в печень можно обеспечить с использованием специфичного нацеливания на эндогенный АроЕ композиции, содержащей зкДНК-вектор, которую направляют в гепатоциты за счет рецептора липопротеина низкой плотности (ЛНП), присутствующего на поверхности гепатоцита.[00295] In some embodiments, the promoter may also be a promoter from a human gene, such as human ubiquitin C (hUbC), human actin, human myosin, human hemoglobin, human muscle creatine, or human metallothionein. The promoter may also be a tissue-specific promoter, such as a liver-specific promoter, for example human alpha-1 antitrypsin (HAAT), natural or synthetic. In one embodiment, delivery to the liver can be achieved using specific targeting of endogenous ApoE by a cccDNA vector-containing composition that is directed to hepatocytes by a low-density lipoprotein (LDL) receptor present on the surface of the hepatocyte.
[00296] Неограничивающие примеры промоторов, подходящих для применения в соответствии с настоящим изобретением, включают любой из промоторов, описанных в данном документе, или любой из следующих: промотор CAG, например, (SEQ ID NO: 72), промотор НААТ (SEQ ID NO: 82), промотор EF1-α человека (SEQ ID NO: 77) или фрагмент промотора EF1a (SEQ ID NO: 78), промотор IE2 (например, SEQ ID NO: 84) и промотор EF1-α крысы (SEQ ID NO: 85), промотор mEF1 (SEQ ID NO: 59) или фрагмент промотора 1E1 (SEQ ID NO: 125).[00296] Non-limiting examples of promoters suitable for use in accordance with the present invention include any of the promoters described herein or any of the following: CAG promoter, for example, (SEQ ID NO: 72), HAAT promoter (SEQ ID NO : 82), the human EF1-α promoter (SEQ ID NO: 77) or a fragment of the EF1a promoter (SEQ ID NO: 78), the IE2 promoter (e.g., SEQ ID NO: 84) and the rat EF1-α promoter (SEQ ID NO: 85), the mEF1 promoter (SEQ ID NO: 59) or a fragment of the 1E1 promoter (SEQ ID NO: 125).
(ii) Энхансеры(ii) Enhancers
[00297] Согласно некоторым вариантам реализации зкДНК, экспрессирующая FVIII, содержит один или более энхансеров. Согласно некоторым вариантам реализации последовательность энхансера расположена в 5'-направлении относительно последовательности промотора. Согласно некоторым вариантам реализации последовательность энхансера расположена в 3'-направлении относительно последовательности промотора. В соответствии с некоторыми вариантами реализации энхансер представляет собой любой энхансер или энхансерную последовательность, описанную в международной заявке № PCT/US 2020/021328, поданной 6 марта 2020 г., которая полностью включена в данный документ посредством ссылки.[00297] In some embodiments, the cccDNA expressing FVIII contains one or more enhancers. In some embodiments, the enhancer sequence is located 5' to the promoter sequence. In some embodiments, the enhancer sequence is located 3' to the promoter sequence. In some embodiments, an enhancer is any enhancer or enhancer sequence described in International Application No. PCT/US 2020/021328, filed March 6, 2020, which is incorporated herein by reference in its entirety.
(iii) Последовательности 5'-UTR и интронные последовательности(iii) 5'UTR sequences and intronic sequences
[00298] Согласно некоторым вариантам реализации зкДНК-вектор содержит последовательность 5'-UTR и/или интронную последовательность, которая расположена в 3'-направлении относительно последовательности 5'-ITR. Согласно некоторым вариантам реализации 5'-UTR расположена в 5-направлении от трансгена, например, последовательности, кодирующей белок FVIII. Примерные последовательности 5'-UTR перечислены в международной заявке № PCT/US 2020/021328, например, в Таблице 9А, которая полностью включена в данный документ посредством ссылки.[00298] In some embodiments, the cccDNA vector contains a 5′-UTR sequence and/or an intronic sequence that is located in the 3′ direction of the 5′-ITR sequence. In some embodiments, the 5'UTR is located upstream of the transgene, for example, the FVIII protein coding sequence. Exemplary 5'UTR sequences are listed in International Application No. PCT/US 2020/021328, for example in Table 9A, which is incorporated herein by reference in its entirety.
(iv) Последовательности 3'-UTR(iv) 3'-UTR sequences
[00299] Согласно некоторым вариантам реализации зкДНК-вектор содержит последовательность 3'-UTR, которая расположена в 5'-направлении относительно последовательности 3'-ITR. Согласно некоторым вариантам реализации 3'-UTR расположена в 3'-направлении от трансгена, например, последовательности, кодирующей белок FVIII. Примерные последовательности 3'-UTR перечислены в международной заявке № PCT/US 2020/021328, например, в Таблице 9В, которая полностью включена в данный документ посредством ссылки.[00299] In some embodiments, the cccDNA vector contains a 3'-UTR sequence that is located in the 5' direction relative to the 3'-ITR sequence. In some embodiments, the 3'UTR is located upstream of a transgene, for example, a sequence encoding an FVIII protein. Exemplary 3'UTR sequences are listed in International Application No. PCT/US 2020/021328, for example in Table 9B, which is incorporated herein by reference in its entirety.
Последовательности полиаденилирования:Polyadenylation sequences:
[00300] Последовательность, кодирующая последовательность полиаденилирования, может быть включена в зкДНК-вектор для экспрессии белка FVIII для стабилизации мРНК, экспрессируемой с указанного зкДНК-вектора, и для содействия ядерному экспорту и трансляции. Согласно одному варианту реализации зкДНК-вектор не включает последовательность полиаденилирования. Согласно другим вариантам реализации зкДНК-вектор для экспрессии белка FVIII включает по меньшей мере 1, по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 10, по меньшей мере 15, по меньшей мере 20, по меньшей мере 25, по меньшей мере 30, по меньшей мере 40, по меньшей мере 45, по меньшей мере 50 или более адениновых динуклеотидов. Согласно некоторым вариантам реализации последовательность полиаденилирования содержит примерно 43 нуклеотида, примерно 40-50 нуклеотидов, примерно 40-55 нуклеотидов, примерно 45-50 нуклеотидов, примерно 35-50 нуклеотидов или любой диапазон между указанными значениями.[00300] A sequence encoding a polyadenylation sequence may be included in a cccDNA vector for expression of the FVIII protein to stabilize the mRNA expressed from the ccDNA vector and to promote nuclear export and translation. In one embodiment, the cDNA vector does not include a polyadenylation sequence. In other embodiments, the cccDNA vector for expression of the FVIII protein includes at least 1, at least 2, at least 3, at least 4, at least 5, at least 10, at least 15, at least 20, at least 25, at least 30, at least 40, at least 45, at least 50 or more adenine dinucleotides. In some embodiments, the polyadenylation sequence is about 43 nucleotides, about 40-50 nucleotides, about 40-55 nucleotides, about 45-50 nucleotides, about 35-50 nucleotides, or any range therebetween.
[00301] Экспрессионные кассеты могут включать любую последовательность полиаденилирования, известную в данной области техники, или ее вариант. Согласно некоторым вариантам реализации последовательность полиаденилирования (поли(А)) выбрана из любой из последовательностей, перечисленных в международной заявке № PCT/US 2020/021328, например, в Таблице 10, которая полностью включена в данный документ посредством ссылки. Также можно использовать другие последовательности поли(А), широко известные в данной области техники, например, включая, но не ограничиваясь перечисленными, природную последовательность, выделенную из бычьего BGHpA (например, SEQ ID NO: 68) или SV40pA вируса (например, SEQ ID NO: 86) или синтетическую последовательность (SEQ ID NO: 87). Некоторые экспрессионные кассеты также могут включать последовательность 5'-энхансера позднего поли(А)-сигнала (USE) SV40. Согласно некоторым вариантам реализации последовательность USE можно применять в комбинации с SV40pA или гетерологичным сигналом поли(А). Последовательности поли(А) расположены в 3-направлении относительно трансгена, кодирующего белок FVIII.[00301] Expression cassettes may include any polyadenylation sequence known in the art, or a variant thereof. In some embodiments, the polyadenylation sequence (poly(A)) is selected from any of the sequences listed in International Application No. PCT/US 2020/021328, for example, Table 10, which is incorporated herein by reference in its entirety. Other poly(A) sequences commonly known in the art may also be used, such as, but not limited to, natural sequence isolated from bovine BGHpA (e.g., SEQ ID NO: 68) or SV40pA virus (e.g., SEQ ID NO: 68) NO: 86) or a synthetic sequence (SEQ ID NO: 87). Some expression cassettes may also include an SV40 5' late poly(A) signal enhancer (USE) sequence. In some embodiments, the USE sequence can be used in combination with SV40pA or a heterologous poly(A) signal. The poly(A) sequences are located in the 3-direction relative to the transgene encoding the FVIII protein.
Экспрессионные кассеты также могут включать посттранскрипционный элемент для повышения экспрессии трансгена. Согласно некоторым вариантам реализации для повышения экспрессии трансгена применяют посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WHP) (WPRE) (например, SEQ ID NO: 67). Можно применять другие элементы посттранскрипционного процессинга, такие как посттранскрипционный элемент из гена тимидинкиназы вируса простого герпеса или вируса гепатита В (HBV). С трансгенами могут быть связаны секреторные последовательности, например, последовательности VH-02 и VK-A26, например, SEQ ID NO: 88 и SEQ ID NO: 89.Expression cassettes may also include a post-transcriptional element to enhance transgene expression. In some embodiments, a woodchuck hepatitis virus post-transcriptional regulatory element (WHP) (WPRE) (eg, SEQ ID NO: 67) is used to enhance transgene expression. Other post-transcriptional processing elements may be used, such as a post-transcriptional element from the herpes simplex virus or hepatitis B virus (HBV) thymidine kinase gene. Secretory sequences, such as VH-02 and VK-A26 sequences, such as SEQ ID NO: 88 and SEQ ID NO: 89, may be associated with the transgenes.
(vi) Последовательности ядерной локализации(vi) Nuclear localization sequences
[00302] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит одну или более последовательностей ядерной локализации (NLS), например, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более NLS. Согласно некоторым вариантам реализации одна или более NLS расположены на амино-конце или рядом с ним, на карбокси-конце или рядом с ним, или в их комбинации (например, одна или более NLS на амино-конце и/или одна или более NLS на карбокси-конце). В случае присутствия более чем одной NLS, каждая из них может быть выбрана независимо от других так, что одна NLS будет присутствовать более чем в одной копии и/или в комбинации с одной или более другими NLS, присутствующими в одной или более копиях. Неограничивающие примеры NLS приведены в Таблице 7.[00302] In some embodiments, the cccDNA vector for expressing the FVIII protein contains one or more nuclear localization sequences (NLS), such as 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLS. In some embodiments, one or more NLSs are located at or near the amino terminus, at or near the carboxy terminus, or a combination thereof (e.g., one or more NLSs at the amino terminus and/or one or more NLSs at the carboxy-terminal). If more than one NLS is present, each may be selected independently of the others such that one NLS will be present in more than one copy and/or in combination with one or more other NLSs present in one or more copies. Non-limiting examples of NLS are given in Table 7.
В. Дополнительные компоненты зкДНК-векторовB. Additional components of cDNA vectors
[00303] ЗкДНК-векторы для экспрессии белка FVIII согласно настоящему раскрытию могут содержать нуклеотиды, которые кодируют другие компоненты для экспрессии гена. Например, для выбора событий нацеливания на конкретные гены защитная кшРНК может быть встроена в микроРНК и вставлена в рекомбинантный зкДНК-вектор, предназначенный для сайт-специфической интеграции в высокоактивный локус, такой как локус альбумина. Такие варианты реализации могут обеспечивать систему для отбора и размножения генетически модифицированных гепатоцитов in vivo в любом генетическом окружении, например, описанном в Nygaard et al., A universal system to select gene-modified hepatocytes in vivo, Gene Therapy, June 8, 2016. ЗкДНК-векторы согласно настоящему раскрытию могут содержать один или более селективных маркеров, которые позволяют проводить селекцию трансформированных, трансфицированных, трансдуцированных или подобных клеток. Селективный маркер представляет собой ген, продукт которого обеспечивает биоцидную или вирусную устойчивость, устойчивость к тяжелым металлам, прототрофию ауксотрофам, NeoR и т.п. Согласно определенным вариантам реализации в донорные последовательности включены маркеры для положительной селекции, такие как NeoR. Маркеры для отрицательной селекции могут быть включены после донорных последовательностей, например, последовательность нуклеиновой кислоты HSV-tk, кодирующая маркер для отрицательной селекции, может быть включена в конструкцию нуклеиновой кислоты после донорной последовательности.[00303] CCDNA vectors for FVIII protein expression according to the present disclosure may contain nucleotides that encode other components for gene expression. For example, to select targeting events for specific genes, a protective shRNA can be engineered into a microRNA and inserted into a recombinant cccDNA vector designed for site-specific integration at a highly active locus, such as the albumin locus. Such embodiments may provide a system for selecting and propagating genetically modified hepatocytes in vivo in any genetic environment, for example, as described in Nygaard et al., A universal system to select gene-modified hepatocytes in vivo, Gene Therapy, June 8, 2016. cctDNA -vectors according to the present disclosure may contain one or more selectable markers that allow selection of transformed, transfected, transduced or the like cells. A selectable marker is a gene whose product provides biocidal or viral resistance, resistance to heavy metals, prototrophy to auxotrophs, NeoR, etc. In certain embodiments, positive selection markers, such as NeoR, are included in the donor sequences. Negative selection markers may be included after the donor sequences, for example, an HSV-tk nucleic acid sequence encoding a negative selection marker may be included in the nucleic acid construct after the donor sequence.
С. Регуляторные переключателиC. Regulatory switches
[00304] Молекулярный регуляторный переключатель представляет собой переключатель, который генерирует измеряемое изменение состояния в ответ на сигнал. Такие регуляторные переключатели можно подходящим образом комбинировать с зкДНК-векторами для экспрессии белка FVIII, описанными в данном документе, чтобы контролировать выход экспрессии белка FVIII с зкДНК-вектора. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, который служит для тонкой настройки экспрессии белка FVIII. Например, он может выполнять функцию биосдерживания зкДНК-вектора. Согласно некоторым вариантам реализации переключатель представляет собой двухпозиционный («ON/OFF») переключатель, который предназначен для запуска или остановки (т.е. прекращения) экспрессии белка FVIII в зкДНК-векторе контролируемым и регулируемым образом. Согласно некоторым вариантам реализации указанный переключатель может включать «аварийный выключатель», который может давать клетке, содержащей указанный зкДНК-вектор, команду для запуска механизма запрограммированной клеточной смерти после активации переключателя. Примерные регуляторные переключатели, предусмотренные для применения в зкДНК-векторе для экспрессии белка FVIII, могут применяться для регуляции экспрессии трансгена и более подробно обсуждаются в международной заявке PCT/US 18/49996, которая полностью включена в данный документ посредством ссылки.[00304] A molecular regulatory switch is a switch that generates a measurable change of state in response to a signal. Such regulatory switches can be suitably combined with the cccDNA FVIII protein expression vectors described herein to control the output of FVIII protein expression from the cccDNA vector. In some embodiments, the cccDNA vector for expression of the FVIII protein contains a regulatory switch that serves to fine-tune the expression of the FVIII protein. For example, it may serve as a biocontainment function for the cDNA vector. In some embodiments, the switch is a two-position (“ON/OFF”) switch that is configured to start or stop (ie, stop) expression of the FVIII protein in the cccDNA vector in a controlled and regulated manner. In some embodiments, the switch may include a "kill switch" that may instruct a cell containing the cccDNA vector to initiate programmed cell death upon activation of the switch. Exemplary regulatory switches provided for use in a cccDNA vector for expression of the FVIII protein can be used to regulate transgene expression and are discussed in more detail in international application PCT/US 18/49996, which is incorporated herein by reference in its entirety.
(i) Бинарные регуляторные переключатели(i) Binary control switches
[00305] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII содержит регуляторный переключатель, который может служить для контролируемой модуляции экспрессии белка FVIII. Например, экспрессионная кассета, расположенная между ITR зкДНК-вектора, может дополнительно содержать регуляторную область, например, промотор, цис-элемент, репрессор, энхансер и т.д., которая функционально связана с последовательностью нуклеиновой кислоты, кодирующей белок FVIII, причем указанная регуляторная область регулируется одним или более кофакторами или экзогенными агентами. В качестве неограничивающего примера, регуляторные области могут модулироваться низкомолекулярными переключателями или индуцируемыми или репрессируемыми промоторами. Неограничивающие примеры индуцируемых промоторов представляют собой индуцируемые гормонами или индуцируемые металлами промоторы. Другие примерные индуцируемые промоторные/энхансерные элементы включают, но не ограничиваются перечисленными, индуцируемый RU486 промотор, индуцируемый экдизоном промотор, индуцируемый рапамицином промотор и промотор металлотионеина.[00305] In some embodiments, the cccDNA vector for expression of the FVIII protein contains a regulatory switch that can serve to controllably modulate the expression of the FVIII protein. For example, an expression cassette located between the ITR of a cccDNA vector may further comprise a regulatory region, for example, a promoter, a cis element, a repressor, an enhancer, etc., which is operably linked to a nucleic acid sequence encoding the FVIII protein, wherein said regulatory region the region is regulated by one or more cofactors or exogenous agents. As a non-limiting example, regulatory regions can be modulated by small molecule switches or inducible or repressible promoters. Non-limiting examples of inducible promoters are hormone inducible or metal inducible promoters. Other exemplary inducible promoter/enhancer elements include, but are not limited to, the RU486 inducible promoter, the ecdysone inducible promoter, the rapamycin inducible promoter, and the metallothionein promoter.
(ii) Низкомолекулярные регуляторные переключатели(ii) Small molecule regulatory switches
[00306] Различные известные из уровня техники регуляторные переключатели на основе малых молекул известны в данной области техники и могут быть скомбинированы с зкДНК-векторами для экспрессии белка FVIII, раскрытыми в данном документе, с получением контролируемого регуляторный переключателем зкДНК-вектора. Согласно некоторым вариантам реализации регуляторный переключатель может быть выбран из чего-либо одного или комбинации следующего: пара ортогональный лиганд/ядерный рецептор, например, вариант ретиноидного рецептора/LG335 и GRQCIMFI, вместе с искусственным промотором, контролирующим экспрессию функционально связанного трансгена, как раскрыто в Taylor et al. ВМС Biotechnology 10 (2010): 15; сконструированные рецепторы стероидов, например, модифицированный рецептор прогестерона с усеченным С-концом, который не может связывать прогестерон, но связывает RU486 (мифепристон) (патент США №5364791); рецептор экдизона дрозофилы (Drosophila) и его экдистероидные лиганды (Saez, et al., PNAS, 97(26)(2000), 14512-14517); или переключатель, контролируемый антибиотиком триметопримом (ТМР), как описано в Sando R 3rd; Nat Methods. 2013, 10(11): 1085-8. Согласно некоторым вариантам реализации регуляторный переключатель для контроля трансгена или экспрессируемый зкДНК-вектором представляет собой переключатель для активации пролекарств, такой как раскрытый в патентах США 8771679 и 6339070.[00306] Various small molecule regulatory switches known in the art are known in the art and can be combined with the cccDNA FVIII protein expression vectors disclosed herein to produce a regulatory switch-controlled cccDNA vector. In some embodiments, the regulatory switch may be selected from any one or combination of the following: an orthogonal ligand/nuclear receptor pair, such as a retinoid receptor variant/LG335 and GRQCIMFI, together with an artificial promoter controlling expression of an operably linked transgene, as disclosed in Taylor et al. BMC Biotechnology 10 (2010): 15; engineered steroid receptors, such as a modified C-terminal truncated progesterone receptor that cannot bind progesterone but binds RU486 (mifepristone) (US Pat. No. 5,364,791); the Drosophila ecdysone receptor and its ecdysteroid ligands (Saez, et al., PNAS, 97(26)(2000), 14512-14517); or a switch controlled by the antibiotic trimethoprim (TMP) as described in Sando R 3 rd ; Nat Methods. 2013, 10(11): 1085-8. In some embodiments, the regulatory switch for controlling the transgene or expressed by the cccDNA vector is a prodrug activation switch, such as disclosed in US Pat. Nos. 8,771,679 and 6,339,070.
(iii) Регуляторные переключатели «с кодом доступа»(iii) Control switches “with access code”
[00307] Согласно некоторым вариантам реализации регуляторный переключатель может представлять собой «переключатель с кодом доступа» или «контур с кодом доступа». Переключатели с кодом доступа позволяют точно настроить контроль экспрессии трансгена с зкДНК-вектора при возникновении конкретных условий, т.е. для осуществления экспрессии и/или репрессии трансгена должна иметься комбинация условий. Например, для осуществления экспрессии трансгена должны возникнуть по меньшей мере условия А и В. Регуляторный переключатель с кодом доступа может представлять собой любое число условий, например, по меньшей мере 2 или по меньшей мере 3, или по меньшей мере 4, или по меньшей мере 5, или по меньшей мере 6, или по меньшей мере 7 или более условий, наличие которых необходимо для осуществления экспрессии трансгена. Согласно некоторым вариантам реализации должны возникнуть по меньшей мере 2 условия (например, условия А, В), а в некоторых вариантах реализации должны возникнуть по меньшей мере 3 условия (например, А, В и С или А, В и D). Только в качестве примера, для осуществления экспрессии гена с зкДНК, содержащей регуляторный переключатель с кодом доступа «АВС», требуется наличие условий А, В и С. Условия А, В и С могут быть следующими; условие А представляет собой наличие состояния или заболевания, условие В представляет собой гормональный ответ, и условие С представляет собой ответ на экспрессию трансгена. Например, если трансген редактирует дефектный ген ЕРО, то условием А является наличие хронической болезни почек (ХБП), условие В осуществляется при наличии гипоксических условий в почках субъекта, условие С заключается в нарушении привлечения эритропоэтин-продуцирующих клеток (ЭПК) в почках; или, альтернативно, в нарушении активации HIF-2. При повышении уровней кислорода или достижении целевого уровня ЕРО трансген снова отключается до момента возникновения 3 условий, которые его опять включат.[00307] In some embodiments, the control switch may be a "passcode switch" or a "passcode circuit." Switches with an access code allow you to fine-tune the control of transgene expression from a cccDNA vector when specific conditions arise, i.e. For expression and/or repression of a transgene to occur, a combination of conditions must be present. For example, at least conditions A and B must occur for transgene expression to occur. The access code regulatory switch may be any number of conditions, such as at least 2 or at least 3 or at least 4 or at least 5, or at least 6, or at least 7 or more conditions, the presence of which is necessary for the expression of the transgene. In some embodiments, at least 2 conditions must occur (eg, conditions A, B), and in some embodiments, at least 3 conditions must occur (eg, A, B, and C or A, B, and D). By way of example only, the expression of a gene with cccDNA containing a regulatory switch with access code "ABC" requires the presence of conditions A, B and C. Conditions A, B and C may be as follows; condition A represents the presence of a condition or disease, condition B represents a hormonal response, and condition C represents a response to transgene expression. For example, if a transgene edits a defective EPO gene, then condition A is the presence of chronic kidney disease (CKD), condition B is the presence of hypoxic conditions in the subject's kidneys, condition C is the presence of impaired recruitment of erythropoietin-producing cells (EPC) to the kidneys; or, alternatively, impaired HIF-2 activation. When oxygen levels rise or a target EPO level is reached, the transgene turns off again until 3 conditions occur that turn it back on.
[00308] Согласно некоторым вариантам реализации регуляторный переключатель с кодом доступа или «контур с кодом доступа», предусмотренный для применения в зкДНК-векторе, содержит гибридные транскрипционные факторы (TF) для расширения диапазона и уровня сложности сигналов окружающей среды, используемых для определения условий биосдерживания. В отличие от блокирующего (deadman) выключателя, который запускает гибель клетки при наличии заранее определенного условия, «контур с кодом доступа» позволяет обеспечить выживание клеток или экспрессию трансгена при наличии конкретного «кода доступа», и может быть легко перепрограммирован, что позволяет обеспечить экспрессию трансгена и/или выживание клеток только при наличии заранее заданного условия окружающей среды или кода доступа.[00308] In some embodiments, a passcode regulatory switch or "passcode circuit" provided for use in a cccDNA vector comprises hybrid transcription factors (TFs) to expand the range and level of complexity of environmental signals used to determine biocontainment conditions . Unlike a deadman switch, which triggers cell death when a predetermined condition is met, a passcode circuit allows for cell survival or transgene expression given a specific passcode, and can be easily reprogrammed to allow expression transgene and/or cell survival only in the presence of a predetermined environmental condition or access code.
[00309] Любые и все комбинации регуляторных переключателей, раскрытых в данном документе, например, низкомолекулярные переключатели, переключатели на основе нуклеиновых кислот, гибридные переключатели на основе малых молекул и нуклеиновых кислот, посттранскрипционные регуляторные переключатели трансгенов, посттрансляционная регуляция, контролируемые излучением переключатели, опосредуемые гипоксией переключатели и другие регуляторные переключатели, известные специалистам в данной области техники, раскрытые в данном документе, могут применяться в регуляторном переключателе с кодом доступа, как раскрыто в данном документе. Регуляторные переключатели, предусмотренные для применения, также обсуждаются в обзорной статье Kis et al., JR Soc Interface. 12: 20141000 (2015) и обобщены в Таблице 1 статьи Kis. Согласно некоторым вариантам реализации регуляторный переключатель для применения в системе с кодом доступа может быть выбран из любых переключателей или их комбинации, раскрытых в Таблице 11 международной заявки на патент PCT/US18/49996, которая полностью включена в данный документ посредством ссылки.[00309] Any and all combinations of regulatory switches disclosed herein, e.g., small molecule switches, nucleic acid-based switches, small molecule-nucleic acid hybrid switches, post-transcriptional transgene regulatory switches, post-translational regulation, radiation-controlled switches, hypoxia-mediated switches switches and other control switches known to those skilled in the art disclosed herein may be used in a passcode control switch as disclosed herein. Regulatory switches provided for the application are also discussed in the review article by Kis et al., JR Soc Interface. 12: 20141000 (2015) and summarized in Table 1 of the Kis paper. In some embodiments, the control switch for use in the passcode system may be selected from any of the switches or combination thereof disclosed in Table 11 of International Patent Application PCT/US18/49996, which is incorporated herein by reference in its entirety.
(iv) Регуляторные переключатели на основе нуклеиновых кислот для контроля экспрессии трансгена(iv) Nucleic acid-based regulatory switches to control transgene expression
[00310] Согласно некоторым вариантам реализации регуляторный переключатель для контроля экспрессии белка FVIII зкДНК основан на механизме контроля на основе нуклеиновых кислот. Примерные механизмы контроля на основе нуклеиновых кислот известны в данной области техники и предусмотрены для применения. Например, такие механизмы включают рибопереключатели, такие как раскрытые, например, в US 2009/0305253, US2008/0269258, US2017/0204477, WO2018026762A1, патенте США 9222093 и заявке на европейский патент ЕР288071, и раскрытые в обзорной статье Villa JK et al. Microbiol Spectr. 2018 May; 6(3). Также включены чувствительные к метаболитам транскрипционные биосенсоры, такие как раскрытые в WO2018/075486 и WO2017/147585. Другие известные в данной области техники механизмы, предусмотренные для применения, включают подавление трансгена с применением киРНК или молекулы РНКи (например, miR, кшРНК). Например, зкДНК-вектор может содержать регуляторный переключатель, кодирующий молекулу РНКи, которая комплементарна двум частям трансгена, экспрессируемого зкДНК-вектором. При экспрессии такой РНКи, даже если трансген (например, белок FVIII) экспрессируется зкДНК-вектором, будет происходить его подавление под действием комплементарной молекулы РНКи, а если РНКи не экспрессируется, при экспрессии трансгена (например, белка FVIII) зкДНК-вектором, подавление трансгена под действием РНКи не происходит.[00310] In some embodiments, the regulatory switch for controlling expression of the cccDNA FVIII protein is based on a nucleic acid-based control mechanism. Exemplary nucleic acid-based control mechanisms are known in the art and are contemplated for use. For example, such mechanisms include riboswitches such as those disclosed, for example, in US2009/0305253, US2008/0269258, US2017/0204477, WO2018026762A1, US patent 9222093 and European patent application EP288071, and disclosed in the review article by Villa JK et al. Microbiol Spectr. May 2018; 6(3). Also included are metabolite-sensitive transcriptional biosensors such as those disclosed in WO2018/075486 and WO2017/147585. Other mechanisms known in the art for use include transgene silencing using siRNA or RNAi molecules (eg, miR, shRNA). For example, the cccDNA vector may contain a regulatory switch encoding an RNAi molecule that is complementary to two parts of the transgene expressed by the cccDNA vector. When such RNAi is expressed, even if a transgene (for example, FVIII protein) is expressed by a cccDNA vector, it will be suppressed by a complementary RNAi molecule, and if RNAi is not expressed, when a transgene (for example, FVIII protein) is expressed by a cccDNA vector, the transgene will be suppressed does not occur under the influence of RNAi.
[00311] Согласно некоторым вариантам реализации регуляторный переключатель представляет собой тканеспецифический самоинактивирующийся регуляторный переключатель, например, раскрытый в US2002/0022018, благодаря чему регуляторный переключатель преднамеренно выключает трансген (например, белок FVIII) в сайте, где в противном случае экспрессия трансгена могла бы быть неблагоприятной. Согласно некоторым вариантам реализации регуляторный переключатель представляет собой обратимую с помощью рекомбиназы систему экспрессии гена, например, раскрытую в US2014/0127162 и патенте США 8324436.[00311] In some embodiments, the regulatory switch is a tissue-specific self-inactivating regulatory switch, such as disclosed in US2002/0022018, whereby the regulatory switch intentionally turns off a transgene (e.g., FVIII protein) at a site where expression of the transgene would otherwise be detrimental . In some embodiments, the regulatory switch is a recombinase-reversible gene expression system, such as those disclosed in US2014/0127162 and US Pat. No. 8,324,436.
(v) Посттранскрипционные и посттрансляционные регуляторные переключатели.(v) Post-transcriptional and post-translational regulatory switches.
[00312] Согласно некоторым вариантам реализации регуляторный переключатель для контроля экспрессии белка FVIII зкДНК-вектором представляет собой систему посттранскрипционной модификации. Например, такой регуляторный переключатель может представлять собой рибопереключатель-аптазим, чувствительный к тетрациклину или теофиллину, раскрытый в US2018/0119156, GB201107768, WO2001/064956A3, патенте ЕР 2707487 и Beilstein et al., ACS Synth. Biol., 2015, 4 (5), pp 526-534; Zhong et at., Elife. 2016 Nov 2;5. pii: e18858. Согласно некоторым вариантам реализации предусмотрено, что обычный специалист в данной области техники может закодировать как трансген, так и ингибиторную киРНК, которая содержит чувствительный к лиганду аптамер (отрицательный переключатель), в результате чего будет получен положительный переключатель, чувствительный к лиганду.[00312] In some embodiments, the regulatory switch for controlling expression of the FVIII protein by the cDNA vector is a post-transcriptional modification system. For example, such a regulatory switch may be a tetracycline- or theophylline-sensitive aptazyme riboswitch disclosed in US2018/0119156, GB201107768, WO2001/064956A3, EP 2707487 and Beilstein et al., ACS Synth. Biol., 2015, 4 (5), pp 526-534; Zhong et at., Elife. 2016 Nov 2;5. pii: e18858. In some embodiments, one of ordinary skill in the art can encode both the transgene and an inhibitory siRNA that contains a ligand-sensitive aptamer (negative switch), resulting in a positive ligand-sensitive switch.
(vi) Другие примерные регуляторные переключатели(vi) Other exemplary control switches
[00313] Любой известный регуляторный переключатель может быть использован в зкДНК-векторе для контроля экспрессии белка FVIII зкДНК-вектором, включая переключатели, запускаемые изменениями окружающей среды. Дополнительные примеры включают, но не ограничиваются перечисленными; метод ВОС согласно Suzuki et al., Scientific Reports 8; 10051 (2018); расширение генетического кода и нефизиологическую аминокислоту; контролируемые излучением или контролируемые ультразвуком положительные/отрицательные (on/off) переключатели (см., например, Scott S. et at, Gene Ther. 2000 Jul; 7(13): 1121-5; патенты США 5612318; 5571797; 5770581; 5817636; и WO 1999/025385 Al. Согласно некоторым вариантам реализации регуляторный переключатель контролируется имплантируемой системой, например, раскрытой в патенте США 7840263; US2007/0190028А1, в которой экспрессия гена контролируется одной или более формами энергии, включая электромагнитную энергию, что активирует промоторы, функционально связанные с трансгеном в зкДНК-векторе.[00313] Any known regulatory switch can be used in a cccDNA vector to control expression of the FVIII protein by the cccDNA vector, including switches triggered by environmental changes. Additional examples include, but are not limited to those listed; BOC method according to Suzuki et al., Scientific Reports 8; 10051 (2018); genetic code expansion and non-physiological amino acid; radiation controlled or ultrasonic controlled positive/negative (on/off) switches (see, for example, Scott S. et at, Gene Ther. 2000 Jul; 7(13): 1121-5; US patents 5612318; 5571797; 5770581; 5817636 ; and WO 1999/025385 Al. In some embodiments, the regulatory switch is controlled by an implantable system, for example, disclosed in US Pat. No. 7,840,263; US2007/0190028A1, in which gene expression is controlled by one or more forms of energy, including electromagnetic energy, that activates promoters that functionally associated with the transgene in the cDNA vector.
[00314] Согласно некоторым вариантам реализации регуляторный переключатель, предусмотренный для применения в зкДНК-векторе, представляет собой опосредуемый гипоксией или активируемый стрессом переключатель, например, такой как те, которые раскрыты в WO1999060142A2, патентах США 5834306; 6218179; 6709858; US2015/0322410; Greco et al., (2004) Targeted Cancer Therapies 9, S368, а также элементы FROG, TOAD и NRSE и условно индуцируемые подавляющие элементы, включая элементы ответа на гипоксию (HRE), элементы ответа на воспаление (IRE) и активируемые сдвиговым напряжением элементы (SSAE), например, как раскрыто в патенте США 9394526. Такой вариант реализации можно применять для «включения» экспрессии трансгена с зкДНК-вектора после ишемии или в ишемических тканях и/или в опухолях.[00314] In some embodiments, the regulatory switch provided for use in the cccDNA vector is a hypoxia-mediated or stress-activated switch, such as those disclosed in WO1999060142A2, US Pat. No. 5,834,306; 6218179; 6709858; US2015/0322410; Greco et al., (2004) Targeted Cancer Therapies 9, S368, as well as FROG, TOAD, and NRSE elements and conditionally inducible suppressive elements, including hypoxia response elements (HRE), inflammatory response elements (IRE), and shear stress-activated elements (SSAE), for example, as disclosed in US Pat. No. 9,394,526. Such an embodiment can be used to “turn on” expression of a transgene from a cccDNA vector after ischemia or in ischemic tissues and/or tumors.
(vii) «Аварийные выключатели»(vii) "Emergency switches"
[00315] Другие варианты реализации, описанные в данном документе, относятся к зкДНК-вектору для экспрессии белка FVIII, описанному в данном документе, содержащему аварийный выключатель. «Аварийный выключатель», раскрытый в данном документе, позволяет уничтожить клетку, содержащую указанный зкДНК-вектор, или подвергнуть ее программируемой клеточной гибели в качестве способа окончательного удаления введенного зкДНК-вектора из системы субъекта. Обычный специалист в данной области техники поймет, что применение «аварийных выключателей» в зкДНК-векторах для экспрессии белка FVIII, как правило, будет сопряжено с нацеливанием зкДНК-вектора на ограниченное число клеток, потеря которого является приемлемой для субъекта, или на тип клеток, апоптоз которых желателен (например, на раковые клетки). Во всех аспектах «аварийный выключатель», раскрытый в данном документе, разработан таким образом, чтобы обеспечить быстрое и надежное уничтожение клетки, содержащей зкДНК-вектор, в отсутствие входного сигнала выживания или другого заданного условия. Другими словами, «аварийный выключатель», кодируемый зкДНК-вектором для экспрессии белка FVIII, описанным в данном документе, может ограничивать выживание клетки, содержащей зкДНК-вектор, окружающей средой, задаваемой специфическими входными сигналами. Такие «аварийные выключатели» служат для обеспечения функции биологического сдерживания, если потребуется удалить зкДНК-вектор для экспрессии белка FVIII у субъекта или обеспечить отсутствие экспрессии с него кодируемого белка FVIII.[00315] Other embodiments described herein relate to the cDNA FVIII protein expression vector described herein comprising a kill switch. The "kill switch" disclosed herein allows the cell containing the specified cccDNA vector to be destroyed or subjected to programmed cell death as a method of permanently removing the introduced cccDNA vector from the subject's system. One of ordinary skill in the art will appreciate that the use of "kill switches" in cccDNA vectors for FVIII protein expression will typically involve targeting the cccDNA vector to a limited number of cells that the subject can tolerate losing, or to a cell type apoptosis of which is desired (for example, on cancer cells). In all aspects, the “kill switch” disclosed herein is designed to provide rapid and reliable killing of a cell containing the cccDNA vector in the absence of a survival input or other specified condition. In other words, the “safety switch” encoded by the cccDNA vector for expression of the FVIII protein described herein may limit the survival of the cell containing the ccDNA vector to an environment defined by specific input signals. Such “kill switches” serve to provide a biological containment function should the cDNA vector for FVIII protein expression be removed from a subject or ensure that it does not express the encoded FVIII protein.
[00316] Другие «аварийные выключатели», известные обычному специалисту в данной области техники, предусмотрены для применения в зкДНК-векторе для экспрессии белка FVIII, раскрытом в данном документе, например, как раскрыто в US2010/0175141; US2013/0009799; US2011/0172826; US2013/0109568, а также «аварийные выключатели», раскрытые в Jusiak et al., Reviews in Cell Biology and Molecular Medicine; 2014; 1-56; Kobayashi et al., PNAS, 2004; 101; 8419-9; Marchisio et al., Int. Journal of Biochem and Cell Biol., 2011; 43; 310-319; и в Reinshagen et al, Science Translational Medicine, 2018, 11.[00316] Other “kill switches” known to one of ordinary skill in the art are provided for use in the cDNA FVIII protein expression vector disclosed herein, for example, as disclosed in US2010/0175141; US2013/0009799; US2011/0172826; US2013/0109568, as well as the “kill switches” disclosed in Jusiak et al., Reviews in Cell Biology and Molecular Medicine; 2014; 1-56; Kobayashi et al., PNAS, 2004; 101; 8419-9; Marchisio et al., Int. Journal of Biochem and Cell Biol., 2011; 43; 310-319; and in Reinshagen et al, Science Translational Medicine, 2018, 11.
[00317] Соответственно, согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII может содержать конструкцию нуклеиновой кислоты «аварийного выключателя», которая содержит нуклеиновую кислоту, кодирующую эффекторный токсин или репортерный белок, причем экспрессия эффекторного токсина (например, белка смерти) или репортерного белка контролируется с помощью заранее заданного условия. Например, предварительно заданным условием может быть наличие агента окружающей среды, такого как, например, экзогенный агент, без которого клетка по умолчанию будет экспрессировать эффекторный токсин (например, белок смерти) и будет уничтожена. Согласно альтернативным вариантам реализации предварительно заданным условием является наличие двух или более агентов окружающей среды, например, клетка будет выживать только при подаче двух или более необходимых экзогенных агентов, и без какого-либо из них клетка, содержащая зкДНК-вектор, уничтожается.[00317] Accordingly, in some embodiments, the cccDNA vector for expression of the FVIII protein may comprise a "kill switch" nucleic acid construct that contains a nucleic acid encoding an effector toxin or reporter protein, wherein expression of the effector toxin (e.g., death protein) or reporter The protein is controlled using a predefined condition. For example, a predetermined condition may be the presence of an environmental agent, such as, for example, an exogenous agent, without which the cell will by default express an effector toxin (eg, a death protein) and be killed. In alternative embodiments, the predetermined condition is the presence of two or more environmental agents, for example, the cell will survive only when supplied with two or more required exogenous agents, and without any of them, the cell containing the cccDNA vector is destroyed.
[00318] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII модифицируют для включения «аварийного выключателя» для разрушения клеток, содержащих указанный зкДНК-вектор, для эффективной остановки экспрессии in vivo трансгена, экспрессируемого указанным зкДНК-вектором (например, экспрессии белка FVIII). В частности, зкДНК-вектор дополнительно генетически сконструирован для экспрессии белка-переключателя, который не функционирует в клетках млекопитающих в нормальных физиологических условиях. Клетки, экспрессирующие белок-переключатель, будут разрушены только после введения лекарственного средства или воздействия условия окружающей среды, специфически нацеленных на указанный белок-переключатель, что остановит экспрессию терапевтического белка или пептида. Например, сообщалось, что клетки, экспрессирующие тимидинкиназу HSV, могут быть уничтожены при введении таких лекарственных средств как ганцикловир и цитозиндезаминаза. См., например, Dey and Evans, Suicide Gene Therapy by Herpes Simplex Virus-1 Thymidine Kinase (HSV-TK), в Targets in Gene Therapy, под редакцией You (2011); и Beltinger et al., Proc. Natl. Acad. Sci. USA 96(15):8699-8704 (1999). Согласно некоторым вариантам реализации зкДНК-вектор может содержать «аварийный выключатель» на основе киРНК, называемый DISE (гибель, индуцируемая устранением гена выживания, «Death Induced by Survival gene Elimination») (Murmann et al., Oncotarget. 2017; 8:84643-84658. Induction of DISE in ovarian cancer cells in vivo).[00318] In some embodiments, the cccDNA FVIII protein expression vector is modified to include a "safety switch" to destroy cells containing the cccDNA vector to effectively stop in vivo expression of a transgene expressed by the cccDNA vector (e.g., FVIII protein expression ). Specifically, the cccDNA vector is further genetically engineered to express a switch protein that does not function in mammalian cells under normal physiological conditions. Cells expressing a switch protein will only be destroyed upon administration of a drug or exposure to an environmental condition that specifically targets said switch protein, stopping expression of the therapeutic protein or peptide. For example, it has been reported that cells expressing HSV thymidine kinase can be killed by administration of drugs such as ganciclovir and cytosine deaminase. See, for example, Dey and Evans, Suicide Gene Therapy by Herpes Simplex Virus-1 Thymidine Kinase (HSV-TK), in Targets in Gene Therapy, edited by You (2011); and Beltinger et al., Proc. Natl. Acad. Sci. USA 96(15):8699–8704 (1999). In some embodiments, the cccDNA vector may contain a siRNA-based “kill switch” called DISE (Death Induced by Survival Gene Elimination) (Murmann et al., Oncotarget. 2017;8:84643- 84658. Induction of DISE in ovarian cancer cells in vivo).
VI. Подробное описание способа получения зкДНК-вектораVI. Detailed description of the method for obtaining the cDNA vector
А. Получение в целомA. Receipt in general
[00319] Некоторые способы получения зкДНК-вектора для экспрессии белка FVIII, содержащего пару асимметричных ITR или пару симметричных ITR, как определено в данном документе, описаны в разделе IV международной заявки PCT/US18/49996, поданной 7 сентября 2018 г., которая полностью включена в данный документ посредством ссылки. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен с использованием клеток насекомых, как описано в данном документе. Согласно альтернативным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть получен синтетическим способом и, в некоторых вариантах реализации, бесклеточным способом, как раскрыто в международной заявке PCT/US19/14122, поданной 18 января 2019 г., которая полностью включена в данный документ посредством ссылки.[00319] Certain methods for producing a cccDNA vector for expressing an FVIII protein containing an asymmetric ITR pair or a symmetric ITR pair as defined herein are described in section IV of international application PCT/US18/49996, filed September 7, 2018, which is fully incorporated herein by reference. In some embodiments, the cDNA FVIII protein expression vector disclosed herein can be produced using insect cells as described herein. In alternative embodiments, the cDNA FVIII protein expression vector disclosed herein can be produced synthetically and, in some embodiments, cell-free, as disclosed in international application PCT/US19/14122, filed January 18, 2019. which is incorporated herein by reference in its entirety.
[00320] Как описано в данном документе, согласно одному варианту реализации, зкДНК-вектор для экспрессии белка FVIII может быть получен, например, с помощью способа, включающего этапы: а) инкубации популяции клеток-хозяев (например, клеток насекомых), несущих полинуклеотидную матрицу экспрессионной конструкции (например, зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус), лишенную последовательностей, кодирующих вирусный капсид, в присутствии белка Rep в условиях, эффективных для индукции продуцирования указанного зкДНК-вектора в atca agcacaacat и в течение периода времени, достаточного для этого, при этом указанные клетки-хозяева не содержат последовательностей, кодирующих вирусный капсид; и b) сбора и выделения зкДНК-вектора из клеток-хозяев. Присутствие белка Rep индуцирует репликацию векторного полинуклеотида с модифицированным ITR для продуцирования зкДНК-вектора в клетке-хозяине. Однако вирусные частицы (например, вирионы ААВ) не экспрессируются. Таким образом, отсутствует ограничение по размеру, такое как присутствующее в естественных условиях в ААВ-векторах или других вирусных векторах.[00320] As described herein, in one embodiment, a cccDNA vector for expression of the FVIII protein can be produced, for example, by a method comprising the steps of: a) incubating a population of host cells (e.g., insect cells) carrying the polynucleotide an expression construct template (e.g., cccDNA plasmid, ccDNA bacmid, and/or ccDNA baculovirus) lacking viral capsid coding sequences in the presence of Rep protein under conditions effective to induce production of said ccDNA vector in atca agcacaacat and for a period time sufficient for this, while said host cells do not contain sequences encoding the viral capsid; and b) collecting and isolating the cDNA vector from the host cells. The presence of the Rep protein induces replication of the ITR-modified vector polynucleotide to produce a cccDNA vector in the host cell. However, viral particles (eg, AAV virions) are not expressed. Thus, there is no size limitation such as is present naturally in AAV vectors or other viral vectors.
[00321] Присутствие зкДНК-вектора, выделенного из клеток-хозяев, может быть подтверждено путем расщепления ДНК, выделенной из клетки-хозяина, рестрикционным ферментом, имеющим один сайт распознавания на зкДНК-векторе, и анализа расщепленного ДНК-материала на неденатурирующем геле для подтверждения присутствия характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК.[00321] The presence of a cDNA vector isolated from host cells can be confirmed by digesting DNA isolated from a host cell with a restriction enzyme having a single recognition site on the cDNA vector and analyzing the digested DNA material on a non-denaturing gel for confirmation the presence of characteristic bands of linear and continuous DNA compared to linear and discontinuous DNA.
[00322] Согласно еще одному аспекту настоящего изобретения предложено применение линий клеток-хозяев, имеющих стабильно интегрированную в собственный геном полинуклеотидную матрицу для экспрессии ДНК-вектора (зкДНК-матрицу), в получении невирусного ДНК-вектора, например, как описано в Lee, L. et al. (2013) Plos One 8(8): e69879. Предпочтительно Rep добавляют к клеткам-хозяевам при MOI равной примерно 3. Когда линия клеток-хозяев представляет собой линию клеток млекопитающего, например, клетки НЕК293, линии клеток могут иметь стабильно интегрированную полинуклеотидную матрицу вектора, и второй вектор, такой как вирус герпеса, может использоваться для введения в клетки белка Rep, что позволяет вырезать и амплифицировать зкДНК в присутствии Rep и вспомогательного вируса.[00322] According to another aspect of the present invention, the use of host cell lines having a polynucleotide template for expression of a DNA vector (ccDNA template) stably integrated into its genome in the production of a non-viral DNA vector, for example, as described in Lee, L et al. (2013) Plos One 8(8): e69879. Preferably, Rep is added to host cells at an MOI of about 3. When the host cell line is a mammalian cell line, such as HEK293 cells, the cell lines may have a stably integrated vector polynucleotide array, and a second vector, such as a herpes virus, may be used to introduce Rep protein into cells, allowing cctDNA to be excised and amplified in the presence of Rep and a helper virus.
[00323] Согласно одному варианту реализации клетки-хозяева, используемые для получения зкДНК-векторов для экспрессии белка FVIII, описанных в данном документе, представляют собой клетки насекомых, и для доставки как полинуклеотида, который кодирует белок Rep, так и полинуклеотидной матрицы экспрессионной конструкции невирусного ДНК-вектора для зкДНК используют бакуловирус, например, согласно описанию на ФИГ. 4А-4С и в Примере 1. Согласно некоторым вариантам реализации клетку-хозяина конструируют так, чтобы она экспрессировала белок Rep.[00323] In one embodiment, the host cells used to produce the cccDNA FVIII protein expression vectors described herein are insect cells, and to deliver both the polynucleotide that encodes the Rep protein and the polynucleotide template of the nonviral expression construct The DNA vector for cccDNA uses a baculovirus, for example, as described in FIG. 4A-4C and Example 1. In some embodiments, the host cell is engineered to express the Rep protein.
[00324] Затем зкДНК-вектор собирают и выделяют из клеток-хозяев. Время сбора и извлечения зкДНК-векторов, описанных в данном документе, из клеток может быть выбрано и оптимизировано так, чтобы достичь продуцирования указанных зкДНК-векторов с высоким выходом. Например, время сбора может быть выбрано с учетом жизнеспособности клеток, морфологии клеток, размножения клеток и т.д. Согласно одному варианту реализации клетки культивируют в достаточных условиях и собирают через достаточное время после инфекции бакуловирусом, чтобы получить зкДНК-векторы, но до начала гибели большинства клеток из-за токсичности бакуловируса. ДНК-векторы могут быть выделены с применением наборов для очистки плазмид, таких как не содержащие эндотоксинов наборы для выделения плазмид (Endo-Free Plasmid Kits) от Qiagen. Другие способы, разработанные для выделения плазмид, также могут быть адаптированы для ДНК-векторов. Обычно могут быть использованы любые способы очистки нуклеиновых кислот.[00324] The cccDNA vector is then collected and isolated from the host cells. The timing of collection and recovery of the cccDNA vectors described herein from cells can be selected and optimized to achieve high yield production of said cccDNA vectors. For example, the collection time may be selected based on cell viability, cell morphology, cell proliferation, etc. In one embodiment, the cells are cultured under sufficient conditions and harvested sufficiently after infection with the baculovirus to produce cccDNA vectors, but before the majority of cells begin to die due to toxicity of the baculovirus. DNA vectors can be isolated using plasmid purification kits, such as endotoxin-free Plasmid Kits from Qiagen. Other methods developed for isolating plasmids can also be adapted for DNA vectors. Generally, any method for purifying nucleic acids can be used.
[00325] ДНК-векторы могут быть очищены с помощью любых способов очистки ДНК, известных специалистам в данной области техники. Согласно одному варианту реализации зкДНК-векторы очищают в виде молекул ДНК. Согласно другому варианту реализации зкДНК-векторы очищают в виде экзосом или микрочастиц.[00325] DNA vectors can be purified using any DNA purification methods known to those skilled in the art. In one embodiment, the cDNA vectors are purified as DNA molecules. In another embodiment, cccDNA vectors are purified as exosomes or microparticles.
[00326] Наличие зкДНК-вектора для экспрессии белка FVIII может быть подтверждено путем расщепления векторной ДНК, выделенной из клеток, рестрикционным ферментом, имеющим один сайт распознавания на ДНК-векторе, и анализа как расщепленного, так и нерасщепленного ДНК-материала с использованием гель-электрофореза, чтобы подтвердить наличие характерных полос линейной и непрерывной ДНК по сравнению с линейной и прерывистой ДНК. ФИГ. 4С и ФИГ. 4D иллюстрируют один вариант реализации для идентификации наличия зкДНК-векторов с замкнутыми концами, продуцируемых с помощью способов, описанных в данном документе.[00326] The presence of a cccDNA vector for FVIII protein expression can be confirmed by digesting vector DNA isolated from cells with a restriction enzyme having a single recognition site on the DNA vector and analyzing both digested and undigested DNA material using a gel. electrophoresis to confirm the presence of characteristic bands of linear and continuous DNA compared to linear and discontinuous DNA. FIG. 4C and FIG. 4D illustrates one embodiment for identifying the presence of closed-end cccDNA vectors produced using the methods described herein.
В. зкДНК-плазмидаB. cDNA plasmid
[00327] ЗкДНК-плазмида представляет собой плазмиду, используемую для последующего получения зкДНК-вектора для экспрессии белка FVIII. Согласно некоторым вариантам реализации зкДНК-плазмида может быть сконструирована с использованием известных методик, чтобы обеспечить по меньшей мере элементы, перечисленные далее, в виде функционально связанных компонентов в направлении транскрипции: (1) модифицированную последовательность 5'-ITR; (2) экспрессионную кассету, содержащую цис-регуляторный элемент, например, промотор, индуцируемый промотор, регуляторный переключатель, энхансеры и т.п.; и (3) модифицированную последовательность 3'-ITR, причем указанная последовательность 3'-ITR симметрична относительно последовательности 5'-ITR. Согласно некоторым вариантам реализации экспрессионная кассета, фланкированная ITR, содержит сайт клонирования для введения экзогенной последовательности. Экспрессионная кассета заменяет области, кодирующие rep и cap, геномов ААВ.[00327] A cccDNA plasmid is a plasmid used to subsequently obtain a ccDNA vector for expression of the FVIII protein. In some embodiments, the cccDNA plasmid can be constructed using known techniques to provide at least the following elements as operably linked components in the direction of transcription: (1) a modified 5'-ITR sequence; (2) an expression cassette containing a cis-regulatory element, for example, a promoter, an inducible promoter, a regulatory switch, enhancers, and the like; and (3) a modified 3'-ITR sequence, wherein said 3'-ITR sequence is symmetrical with respect to the 5'-ITR sequence. In some embodiments, the ITR-flanked expression cassette contains a cloning site for introducing an exogenous sequence. The expression cassette replaces the rep and cap coding regions of the AAV genomes.
[00328] Согласно одному аспекту зкДНК-вектор для экспрессии белка FVIII получают из плазмиды, называемой в данном документе «зкДНК-плазмидой», кодирующей, в указанном порядке: первый инвертированный концевой повтор (ITR) аденоассоциированного вируса (ААВ), экспрессионную кассету, содержащую трансген, и мутированный или модифицированный ITR ААВ, причем указанная зкДНК-плазмида лишена последовательностей, кодирующих капсидный белок ААВ. Согласно альтернативным вариантам реализации зкДНК-плазмида кодирует, в указанном порядке: первый (или 5) модифицированный или мутированный ITR ААВ, экспрессионную кассету, содержащую трансген, и второй (или 3') модифицированный ITR ААВ, причем указанная зкДНК-плазмида лишена последовательностей, кодирующих капсидный белок ААВ, и при этом указанные 5'- и 3'-ITR являются симметричными по отношению друг к другу. Согласно альтернативным вариантам реализации зкДНК-плазмид а кодирует, в указанном порядке: первый (или 5') модифицированный или мутированный ITR ААВ, экспрессионную кассету, содержащую трансген, и второй (или 3') мутированный или модифицированный ITR ААВ, причем указанная зкДНК-плазмид а лишена последовательностей, кодирующих капсидный белок ААВ, и при этом указанные модифицированные 5'- и 3'-ITR имеют одинаковые модификации (т.е. они являются обратно комплементарными или симметричными по отношению друг к другу).[00328] In one aspect, a cccDNA vector for expression of the FVIII protein is derived from a plasmid, referred to herein as a "ccDNA plasmid", encoding, in this order: the first inverted terminal repeat (ITR) of an adeno-associated virus (AAV), an expression cassette containing a transgene, and a mutated or modified AAV ITR, wherein said cDNA plasmid lacks sequences encoding the AAV capsid protein. In alternative embodiments, the cccDNA plasmid encodes, in that order: a first (or 5') modified or mutated AAV ITR, an expression cassette containing the transgene, and a second (or 3') modified AAV ITR, wherein said ccDNA plasmid lacks sequences encoding AAV capsid protein, and wherein said 5'- and 3'-ITRs are symmetrical with respect to each other. In alternative embodiments, ccDNA plasmid a encodes, in this order: a first (or 5') modified or mutated AAV ITR, an expression cassette containing a transgene, and a second (or 3') mutated or modified AAV ITR, wherein said ccDNA plasmid a is devoid of sequences encoding the AAV capsid protein, and wherein said modified 5' and 3' ITRs have the same modifications (ie, they are reverse complementary or symmetrical to each other).
[00329] Согласно дополнительному варианту реализации система зкДНК-плазмиды лишена последовательностей, кодирующих вирусный капсидный белок (т.е. лишена генов капсида ААВ, а также генов капсидов других вирусов). Кроме того, согласно конкретному варианту реализации зкДНК-плазмида также лишена последовательностей, кодирующих белок Rep ААВ. Соответственно, в предпочтительном варианте реализации зкДНК-плазмида лишена функциональных генов cap ААВ и rep ААВ, GG-3' для ААВ2, а также вариабельной палиндромной последовательности, обеспечивающей образование шпильки.[00329] In a further embodiment, the cDNA plasmid system is devoid of viral capsid protein coding sequences (i.e., devoid of AAV capsid genes as well as capsid genes of other viruses). In addition, in a particular embodiment, the cccDNA plasmid also lacks sequences encoding the AAV Rep protein. Accordingly, in a preferred embodiment, the ccDNA plasmid lacks the functional AAB cap and AAV rep genes, GG-3' for AAV2, and the variable palindromic sequence that provides hairpin formation.
[00330] ЗкДНК-плазмида согласно настоящему изобретению может быть получена с использованием природных нуклеотидных последовательностей из геномов любых серотипов ААВ, хорошо известных в данной области техники. Согласно одному варианту реализации остов зкДНК-плазмиды происходит из генома ААВ1, ААВ2, ААВ3, ААВ4, ААВ5, ААВ5, ААВ7, ААВ8, ААВ9, ААВ10, ААВ11, ААВ12, AABrh8, AABrh10, AAB-DJ и AAB-DJ8. Например, NCBI: NC 002077; NC 001401; NC001729; NC001829; NC006152; NC 006260; NC 006261; из указателя вирусов Kotin and Smith («The Springer Index of Viruses»), доступного по ссылке, поддерживаемой Springer (веб-адрес: oesys.springer.de/viruses/database/mkchapter.asp?virID=42.04.) (примечание: ссылки на указатель URL или базу данных подразумевают содержание доступного по ссылке ресурса URL или базы данных на фактическую дату подачи данной заявки). В конкретном варианте реализации остов зкДНК-плазмиды происходит из генома ААВ2. В другом конкретном варианте реализации остов зкДНК-плазмиды представляет собой синтетический остов, генетически сконструированный для включения на его 5'- и 3-концах ITR, происходящих из одного из указанных геномов ААВ.[00330] The cDNA plasmid of the present invention can be obtained using natural nucleotide sequences from the genomes of any AAV serotypes well known in the art. In one embodiment, the cccDNA plasmid backbone is derived from the genome of AAB1, AAB2, AAB3, AAB4, AAB5, AAB5, AAB7, AAB8, AAB9, AAB10, AAB11, AAB12, AABrh8, AABrh10, AAB-DJ, and AAB-DJ8. For example, NCBI: NC 002077; NC001401; NC001729; NC001829; NC006152; NC 006260; NC 006261; from the Kotin and Smith virus index ("The Springer Index of Viruses"), available at a link maintained by Springer (web address: oesys.springer.de/viruses/database/mkchapter.asp?virID=42.04.) (note: links URL or database refers to the contents of the URL or database available from the link as of the actual filing date of this application). In a specific embodiment, the cDNA plasmid backbone is derived from the AAB2 genome. In another specific embodiment, the cDNA plasmid backbone is a synthetic backbone genetically engineered to include at its 5' and 3 ends ITRs derived from one of the AAV genomes.
[00331] ЗкДНК-плазмида необязательно может включать селектируемый или селективный маркер для использования при создании линии клеток, продуцирующей зкДНК-вектор. Согласно одному варианту реализации селективный маркер может быть вставлен после (т.е. в 3'-направлении) последовательности 3'-ITR. Согласно другому варианту реализации селективный маркер может быть вставлен перед (т.е. в 5'-направлении) последовательностью 5'-ITR. Подходящие селективные маркеры включают, например, маркеры, придающие устойчивость к лекарственному средству. Селективные маркеры могут представлять собой, например, гены устойчивости к бластицидину S, канамицину, генетицину и т.п. Согласно предпочтительному варианту реализации селективный маркер для отбора по чувствительности к лекарственному средству представляет собой ген устойчивости к бластицидину S.[00331] The cccDNA plasmid may optionally include a selectable or selectable marker for use in creating a cell line that produces the ccDNA vector. In one embodiment, the selectable marker may be inserted after (ie, in the 3' direction) the 3' ITR sequence. In another embodiment, the selectable marker may be inserted upstream (ie, in the 5' direction) of the 5' ITR sequence. Suitable selectable markers include, for example, markers that confer drug resistance. Selectable markers may be, for example, resistance genes to blasticidin S, kanamycin, geneticin, and the like. In a preferred embodiment, the selectable marker for selecting for drug sensitivity is a blasticidin S resistance gene.
[00332] Примерный зкДНК-вектор (например, рААВО) для экспрессии белка FVIII получают из плазмиды рААВ. Способ получения рААВ-вектора может включать: (а) доставку в клетку-хозяина плазмиды рААВ, как описано выше, при этом как клетка-хозяин, так и плазмида лишены генов, кодирующих капсидный белок, (b) культивирование клетки-хозяина в условиях, обеспечивающих продуцирование генома зкДНК; и (с) сбор клеток и выделение генома ААВ, продуцированного из указанных клеток.[00332] An exemplary cccDNA vector (eg, pAABO) for expression of the FVIII protein is derived from the pAAB plasmid. A method for producing a rAAV vector may include: (a) delivering the rAAV plasmid to a host cell as described above, wherein both the host cell and the plasmid are deprived of genes encoding the capsid protein, (b) culturing the host cell under conditions ensuring the production of the cDNA genome; and (c) collecting cells and isolating the AAV genome produced from said cells.
C. Примерный способ получения зкДНК-векторов из зкДНК-плазмидC. Exemplary Method for Producing cccDNA Vectors from ccDNA Plasmids
[00333] В данном документе также предложены способы получения бескапсидных зкДНК-векторов для экспрессии белка FVIII, в частности, способ с достаточно высоким выходом для обеспечения достаточного количества вектора для экспериментов in vivo.[00333] This document also provides methods for producing capsidless cccDNA vectors for expression of the FVIII protein, in particular a method with sufficiently high yield to provide sufficient quantities of vector for in vivo experiments.
[00334] Согласно некоторым вариантам реализации способ получения зкДНК-вектора для экспрессии белка FVIII включает следующие этапы: (1) введение конструкции нуклеиновой кислоты, содержащей экспрессионную кассету и последовательности двух симметричных ITR, в клетку-хозяина (например, клетки Sf9), (2) необязательно создание клональной линии клеток, например, с применением селективного маркера, присутствующего на плазмиде, (3) введение кодирующего Rep гена (либо путем трансфекции, либо инфекции бакуловирусом, несущим указанный ген) в указанную клетку насекомого; и (4) сбор клеток и очистку зкДНК-вектора. Конструкция нуклеиновой кислоты, содержащая экспрессионную кассету и последовательности двух ITR, описанная выше для получения зкДНК-вектора, может иметь форму зкДНК-плазмиды или бакмиды, или бакуловируса, полученных с использованием зкДНК-плазмиды, как описано ниже. Конструкция нуклеиновой кислоты может быть введена в клетку-хозяина путем трансфекции, вирусной трансдукции, стабильной интеграции или других способов, известных в данной области техники.[00334] In some embodiments, a method for producing a cccDNA vector for expressing an FVIII protein includes the following steps: (1) introducing a nucleic acid construct containing an expression cassette and two symmetrical ITR sequences into a host cell (e.g., Sf9 cells), (2 ) optionally creating a clonal cell line, for example, using a selectable marker present on a plasmid, (3) introducing a gene encoding Rep (either by transfection or infection with a baculovirus carrying said gene) into said insect cell; and (4) cell collection and cDNA vector purification. The nucleic acid construct containing the expression cassette and two ITR sequences described above to produce the cccDNA vector may be in the form of a ccDNA plasmid or bacmid or baculovirus produced using a ccDNA plasmid as described below. The nucleic acid construct can be introduced into a host cell by transfection, viral transduction, stable integration, or other methods known in the art.
D. Линии клетокD. Cell lines
[00335] Линии клеток-хозяев, используемые в получении зкДНК-вектора для экспрессии белка FVIII, могут включать линии клеток насекомых, происходящие из Spodoptera frugiperda, такие как клетки Sf9, Sf21, или клетки Trichoplusia ni, или линии клеток других беспозвоночных животных, позвоночных животных или других эукариотов, включая клетки млекопитающих. Также могут быть использованы другие линии клеток, известные обычному специалисту в данной области техники, такие как HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1 180, моноциты, а также зрелые и незрелые дендритные клетки. Линии клеток-хозяев могут быть трансфицированы для стабильной экспрессии зкДНК-плазмиды для получения зкДНК-вектора с высоким выходом.[00335] The host cell lines used in the production of the cccDNA vector for expression of the FVIII protein may include insect cell lines derived from Spodoptera frugiperda, such as Sf9, Sf21 cells, or Trichoplusia ni cells, or cell lines of other invertebrate animals, vertebrates animals or other eukaryotes, including mammalian cells. Other cell lines known to one of ordinary skill in the art may also be used, such as HEK293, Huh-7, HeLa, HepG2, HeplA, 911, CHO, COS, MeWo, NIH3T3, A549, HT1 180, monocytes, as well as mature and immature dendritic cells. Host cell lines can be transfected to stably express the cccDNA plasmid to obtain a cccDNA vector with high yield.
[00336] ЗкДНК-плазмиды могут быть введены в клетки Sf9 путем кратковременной трансфекции с использованием реагентов (например, липосомальных, фосфата кальция) или физических средств (например, электропорации), известных в данной области техники. В качестве альтернативы, могут быть созданы стабильные линии клеток Sf9 с зкДНК-плазмидой, стабильно интегрированной в их геномы. Такие стабильные линии клеток могут быть созданы путем включения селективного маркера в зкДНК-плазмиду согласно описанию выше. Если зкДНК-плазмида, используемая для трансфекции линии клеток, включает селективный маркер, например, для антибиотика, клетки, которые были трансфицированы зкДНК-плазмидой и интегрировали ДНК зкДНК-плазмиды в их геном, могут быть отобраны путем добавления антибиотика в среды для культивирования клеток. Затем устойчивые клоны клеток могут быть выделены с помощью методик разведения до получения отдельных клеток или переноса колоний и размножены.[00336] CCDNA plasmids can be introduced into Sf9 cells by transient transfection using reagents (eg, liposomal, calcium phosphate) or physical means (eg, electroporation) known in the art. Alternatively, stable Sf9 cell lines can be generated with the cccDNA plasmid stably integrated into their genomes. Such stable cell lines can be created by incorporating a selectable marker into a cccDNA plasmid as described above. If the cccDNA plasmid used to transfect a cell line includes a selectable marker, for example, for an antibiotic, cells that have been transfected with the ccDNA plasmid and have integrated the ccDNA plasmid DNA into their genome can be selected by adding the antibiotic to the cell culture media. Stable cell clones can then be isolated using single cell dilution or colony transfer techniques and expanded.
Е. Выделение и очистка зкДНК-векторов:E. Isolation and purification of cDNA vectors:
[00337] Примеры способа получения и выделения зкДНК-векторов описаны на ФИГ. 4А-4Е и в конкретных примерах ниже. ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, могут быть получены из клеток-продуцентов, экспрессирующих белок (белки) Rep ААВ, дополнительно трансформированных зкДНК-плазмидой, зкДНК-бакмидой или зкДНК-бакуло вирусом. Плазмиды, которые можно применять для получения зкДНК-векторов, включают плазмиды, которые кодируют белок FVIII, или плазмиды, кодирующие один или более белков REP.[00337] Examples of the method for preparing and isolating cccDNA vectors are described in FIG. 4A-4E and in specific examples below. The cDNA FVIII protein expression vectors disclosed herein can be derived from producer cells expressing the AAV Rep protein(s) further transformed with a ccDNA plasmid, a ccDNA bacmid, or a ccDNA baculovirus. Plasmids that can be used to generate cccDNA vectors include plasmids that encode the FVIII protein or plasmids that encode one or more REP proteins.
[00338] Согласно одному аспекту полинуклеотид кодирует белок Rep ААВ (Rep 78 или 68), доставляемый в клетку-продуцент в плазмиде (Rep-плазмиде), бакмиде (Rep-бакмиде) или бакуловирусе (Rep-бакуловирусе). Rep-плазмида, Rep-бакмида и Rep-бакуловирус могут быть получены с помощью способов, описанных выше.[00338] In one aspect, the polynucleotide encodes an AAV Rep protein (Rep 78 or 68) delivered to the producing cell on a plasmid (Rep-plasmid), bacmid (Rep-bacmid), or baculovirus (Rep-baculovirus). Rep plasmid, Rep bacmid and Rep baculovirus can be produced using the methods described above.
[00339] В данном документе описаны способы получения зкДНК-вектора для экспрессии белка FVIII. Экспрессионные конструкции, используемые для получения зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, могут представлять собой плазмиду (например, зкДНК-плазмиды), бакмиду (например, зкДНК-бакмиду) и/или бакуловирус (например, зкДНК-бакуловирус). В качестве неограничивающего примера, зкДНК-вектор может быть получен из клеток, коинфицированных зкДНК-бакуловирусом и Rep-бакуловирусом. Белки Rep продуцированные с Rep-бакуловируса, могут реплицировать зкДНК-бакуловирус с получением зкДНК-векторов. В качестве варианта, зкДНК-векторы для экспрессии белка FVIII могут быть получены из клеток, стабильно трансфицированных конструкцией, содержащей последовательность, кодирующую белок Rep ААВ (Rep78/52), доставленной в Rep-плазмидах, Rep-бакмидах или Rep-бакуловирусе. зкДНК-бакуловирус может быть кратковременно трансфицирован в клетки, реплицирован с помощью белка Rep и может продуцировать зкДНК-векторы.[00339] Described herein are methods for producing a cDNA vector for the expression of FVIII protein. The expression constructs used to produce the cccDNA vector for expression of the FVIII protein described herein may be a plasmid (e.g., ccDNA plasmids), bacmid (e.g., ccDNA-baculovirus), and/or a baculovirus (e.g., ccDNA-baculovirus). . As a non-limiting example, a cccDNA vector can be obtained from cells coinfected with a cccDNA baculovirus and a Rep baculovirus. Rep proteins produced from Rep baculovirus can replicate cccDNA baculovirus to produce cccDNA vectors. Alternatively, cccDNA vectors for expression of the FVIII protein can be obtained from cells stably transfected with a construct containing the AAV Rep protein coding sequence (Rep78/52) delivered in Rep plasmids, Rep bacmids or Rep baculovirus. The cccDNA baculovirus can be transiently transfected into cells, replicated using the Rep protein, and can produce cccDNA vectors.
[00340] Бакмида (например, зкДНК-бакмида) может быть трансфицирована в пермиссивные клетки насекомых, такие как клетка Sf9, Sf21, Tni (Trichoplusia ni), клетка High Five, и генерировать зкДНК-бакуловирус, который представляет собой рекомбинантный бакуловирус, включающий последовательности, содержащие симметричные ITR и экспрессионную кассету. Клетки насекомых могут быть снова инфицированы зкДНК-бакуловирусом для получения следующего поколения рекомбинантного бакуловируса. Необязательно этап может быть повторен один или более раз для получения большего количества рекомбинантного бакуловируса.[00340] A bacmid (e.g., cccDNA bacmid) can be transfected into permissive insect cells such as Sf9, Sf21, Tni (Trichoplusia ni), High Five cell, and generate a cccDNA baculovirus, which is a recombinant baculovirus including the sequences , containing symmetrical ITRs and an expression cassette. Insect cells can be reinfected with cDNA baculovirus to produce the next generation of recombinant baculovirus. Optionally, the step can be repeated one or more times to obtain more recombinant baculovirus.
[00341] Время сбора и извлечения зкДНК-векторов для экспрессии белка FVIII, описанных в данном документе, из клеток может быть выбрано и оптимизировано так, чтобы достичь продуцирования указанных зкДНК-векторов с высоким выходом. Например, время сбора может быть выбрано с учетом жизнеспособности клеток, морфологии клеток, размножения клеток и т.д. Обычно клетки могут быть собраны через период времени после инфекции бакуловирусом, достаточный для получения зкДНК-векторов (например, зкДНК-векторов), но до начала гибели большинства клеток из-за вирусной токсичности. ЗкДНК-векторы могут быть выделены из клеток Sf9 с использованием наборов для очистки плазмид, таких как наборы Qiagen ENDO-FREE PLASMID®. Другие способы, разработанные для выделения плазмид, также могут быть адаптированы для зкДНК-векторов. Обычно можно использовать любые известные в данной области техники способы очистки нуклеиновых кислот, а также коммерчески доступные наборы для экстракции ДНК.[00341] The timing of collection and recovery of the cDNA FVIII protein expression vectors described herein from cells can be selected and optimized to achieve high yield production of said ccDNA vectors. For example, the collection time may be selected based on cell viability, cell morphology, cell proliferation, etc. Typically, cells can be collected a period of time after baculovirus infection sufficient to obtain cDNA vectors (e.g., cDNA vectors) but before most cells begin to die due to viral toxicity. CctDNA vectors can be isolated from Sf9 cells using plasmid purification kits such as the Qiagen ENDO-FREE PLASMID ® kits. Other methods developed for plasmid isolation can also be adapted for cDNA vectors. Typically, any nucleic acid purification methods known in the art, as well as commercially available DNA extraction kits, can be used.
[00342] В качестве альтернативы, очистку можно осуществлять путем щелочного лизиса клеточного осадка, центрифугирования полученного лизата и выполнения хроматографического разделения. В качестве одного неограничивающего примера, указанный способ можно выполнять путем загрузки супернатанта на ионообменную колонку (например, SARTOBIND Q®), которая удерживает нуклеиновые кислоты, с последующим элюированием (например, 1,2 М раствором NaCl) и выполнением дальнейшей хроматографической очистки на колонке для гель-фильтрации (например, на 6 Fast Flow GE). Бескапсидный ААВ-вектор затем выделяют, например, путем осаждения.[00342] Alternatively, purification can be accomplished by alkaline lysis of the cell pellet, centrifuging the resulting lysate, and performing chromatographic separation. As one non-limiting example, this method can be performed by loading the supernatant onto an ion exchange column (eg, SARTOBIND Q® ) that retains nucleic acids, followed by elution (eg, 1.2 M NaCl solution) and further chromatographic purification on a column to gel filtration (for example, on 6 Fast Flow GE). The capsidless AAV vector is then isolated, for example, by precipitation.
[00343] Согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII также могут быть очищены в форме экзосом или микрочастиц. В данной области техники известно, что многие типы клеток высвобождают не только растворимые белки, но и сложные грузы белок/нуклеиновая кислота путем отделения мембранных микровезикул (Cocucci et al, 2009; ЕР 10306226.1). Такие везикулы включают микровезикулы (также называемые микрочастицами) и экзосомы (также называемые нановезикулами), и первые, и вторые содержат в качестве груза белки и РНК. Микровезикулы образуются в результате прямого отпочковывания плазматической мембраны, а экзосомы высвобождаются во внеклеточную среду при слиянии мультивезикулярных эндосом с плазматической мембраной. Соответственно, содержащие зкДНК-вектор микровезикулы и/или экзосомы могут быть выделены из клеток, трансдуцированных зкДНК-плазмидой или бакмидой, или бакуловирусом, полученным с использованием зкДНК-плазмиды.[00343] In some embodiments, cccDNA vectors for FVIII protein expression may also be purified in the form of exosomes or microparticles. It is known in the art that many cell types release not only soluble proteins, but also complex protein/nucleic acid cargos by shedding membrane microvesicles (Cocucci et al, 2009; EP 10306226.1). Such vesicles include microvesicles (also called microparticles) and exosomes (also called nanovesicles), both of which contain proteins and RNA as cargo. Microvesicles are formed by direct budding of the plasma membrane, and exosomes are released into the extracellular environment upon fusion of multivesicular endosomes with the plasma membrane. Accordingly, cccDNA vector-containing microvesicles and/or exosomes can be isolated from cells transduced with a ccDNA plasmid or bacmid, or with a baculovirus produced using a ccDNA plasmid.
[00344] Микровезикулы могут быть выделены путем фильтрации или ультрацентрифугирования культуральной среды при 20000×g, а экзосомы при 100000×g. Оптимальная продолжительность ультрацентрифугирования может быть определена экспериментально и зависит от конкретного типа клеток, из которых выделяют везикулы. Предпочтительно культуральную среду сначала очищают с помощью низкоскоростного центрифугирования (например, при 2000×g в течение 5-20 минут) и подвергают центробежному концентрированию с использованием, например, центрифужной колонки AMICON® (Millipore, Уотфорд, Великобритания). Микровезикулы и экзосомы могут быть дополнительно очищены с помощью FACS или MACS с использованием специфичных антител, распознающих конкретные поверхностные антигены, присутствующие на микровезикулах и экзосомах. Другие способы очистки микровезикул и экзосом включают, но не ограничиваются перечисленными, иммунопреципитацию, аффинную хроматографию, фильтрацию и магнитные гранулы, покрытые специфичными антителами или аптамерами. После очистки везикулы промывают, например, фосфатно-солевым буфером (ФСБ). Одним из преимуществ использования микровезикул или экзосом для доставки содержащих зкДНК везикул является то, что такие везикулы могут быть нацелены на клетки различных типов путем включения в их мембрану белков, распознаваемых специфическими рецепторами на соответствующих типах клеток. (см. также ЕР 10306226)[00344] Microvesicles can be isolated by filtration or ultracentrifugation of the culture medium at 20,000×g, and exosomes at 100,000×g. The optimal duration of ultracentrifugation can be determined experimentally and depends on the specific cell type from which the vesicles are isolated. Preferably, the culture medium is first clarified by low-speed centrifugation (eg at 2000×g for 5-20 minutes) and subjected to centrifugal concentration using, for example, an AMICON® spin column (Millipore, Watford, UK). Microvesicles and exosomes can be further purified by FACS or MACS using specific antibodies that recognize specific surface antigens present on microvesicles and exosomes. Other methods for purifying microvesicles and exosomes include, but are not limited to, immunoprecipitation, affinity chromatography, filtration, and magnetic beads coated with specific antibodies or aptamers. After purification, the vesicles are washed, for example, with phosphate-buffered saline (PBS). One advantage of using microvesicles or exosomes to deliver cccDNA-containing vesicles is that such vesicles can be targeted to different cell types by incorporating proteins into their membrane that are recognized by specific receptors on the relevant cell types. (see also EP 10306226)
[00345] Другой аспект настоящего изобретения относится к способам очистки зкДНК-векторов из линий клеток-хозяев, которые стабильно интегрировали конструкцию зкДНК в их собственный геном. Согласно одному варианту реализации зкДНК-векторы очищают в виде молекул ДНК. Согласно другому варианту реализации зкДНК-векторы очищают в виде экзосом или микрочастиц.[00345] Another aspect of the present invention relates to methods for purifying cccDNA vectors from host cell lines that have stably integrated the cccDNA construct into their own genome. In one embodiment, the cDNA vectors are purified as DNA molecules. In another embodiment, cccDNA vectors are purified as exosomes or microparticles.
[00346] ФИГ. 5 международной заявки PCT/US18/49996 показывает гель, подтверждающий продуцирование зкДНК из нескольких конструкций зкДНК-плазмид с использованием способа, описанного в Примерах. ЗкДНК-вектор подтверждается характерным профилем полос в геле, как обсуждается в отношении ФИГ. 4D в Примерах.[00346] FIG. 5 of international application PCT/US18/49996 shows a gel confirming the production of cccDNA from several ccDNA plasmid constructs using the method described in the Examples. The cctDNA vector is confirmed by the characteristic banding profile in the gel, as discussed in relation to FIG. 4D in Examples.
VII. Фармацевтические композицииVII. Pharmaceutical compositions
[00347] Согласно другому аспекту предложены фармацевтические композиции. Фармацевтическая композиция содержит зкДНК-вектор для экспрессии белка FVIII, описанный в данном документе, и фармацевтически приемлемый носитель или разбавитель.[00347] In another aspect, pharmaceutical compositions are provided. The pharmaceutical composition contains a cccDNA vector for expression of the FVIII protein described herein and a pharmaceutically acceptable carrier or diluent.
[00348] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, могут быть включены в фармацевтические композиции, пригодные для введения субъекту для in vivo доставки в клетки, ткани или органы субъекта. Как правило, фармацевтическая композиция содержит зкДНК-вектор, раскрытый в данном документе, и фармацевтически приемлемый носитель. Например, зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, могут быть включены в фармацевтическую композицию, подходящую для целевого пути терапевтического введения (например, парентерального введения). Также предусмотрена пассивная трансдукция ткани путем внутривенной или внутриартериальной инфузии под высоким давлением, а также внутриклеточной инъекции, такой как внутриядерная микроинъекция или внутрицитоплазматическая инъекция. Фармацевтические композиции для терапевтических целей могут быть изготовлены в виде раствора, микроэмульсии, дисперсии, липосом или другой упорядоченной структуры, подходящей для высокой концентрации зкДНК-вектора. Стерильные растворы для инъекций могут быть приготовлены путем включения соединения зкДНК-вектора в необходимом количестве в соответствующем буфере с одним или комбинацией ингредиентов, перечисленных выше, при необходимости, с последующей стерилизацией путем фильтрации, включая зкДНК-вектор, который может быть изготовлен для доставки трансгена в нуклеиновой кислоте в клетки реципиента, что приводит к терапевтической экспрессии в них трансгена или донорной последовательности. Композиция также может включать фармацевтически приемлемый носитель.[00348] The cDNA FVIII protein expression vectors described herein can be included in pharmaceutical compositions suitable for administration to a subject for in vivo delivery to cells, tissues or organs of the subject. Typically, the pharmaceutical composition contains a cccDNA vector disclosed herein and a pharmaceutically acceptable carrier. For example, the cccDNA vectors for expression of the FVIII protein described herein can be included in a pharmaceutical composition suitable for the intended route of therapeutic administration (eg, parenteral administration). Passive tissue transduction by intravenous or intra-arterial high-pressure infusion, as well as intracellular injection such as intranuclear microinjection or intracytoplasmic injection, is also contemplated. Pharmaceutical compositions for therapeutic purposes can be formulated as a solution, microemulsion, dispersion, liposomes or other ordered structure suitable for high concentration of cccDNA vector. Sterile injection solutions can be prepared by incorporating the cccDNA vector compound in the required amount in an appropriate buffer with one or a combination of the ingredients listed above, if necessary, followed by sterilization by filtration, including the ccDNA vector that can be prepared to deliver the transgene to nucleic acid into recipient cells, which leads to therapeutic expression of a transgene or donor sequence in them. The composition may also include a pharmaceutically acceptable carrier.
[00349] Фармацевтически активные композиции, содержащие зкДНК-вектор для экспрессии белка FVIII, могут быть изготовлены для доставки трансгена для различных целей в клетку, например, в клетки субъекта.[00349] Pharmaceutically active compositions containing a cccDNA vector for expression of the FVIII protein can be formulated to deliver the transgene for various purposes into a cell, for example, into the cells of a subject.
[00350] Фармацевтические композиции для терапевтических целей, как правило, должны быть стерильными и стабильными в условиях изготовления и хранения. Композиция может быть изготовлена в виде раствора, микроэмульсии, дисперсии, липосом или другой упорядоченной структуры, подходящей для высокой концентрации зкДНК-вектора. Стерильные растворы для инъекций могут быть приготовлены путем включения соединения зкДНК-вектора в необходимом количестве в соответствующем буфере с одним или комбинацией ингредиентов, перечисленных выше, при необходимости, с последующей стерилизацией путем фильтрации.[00350] Pharmaceutical compositions for therapeutic purposes generally must be sterile and stable under the conditions of manufacture and storage. The composition can be formulated as a solution, microemulsion, dispersion, liposome, or other ordered structure suitable for high concentration of cccDNA vector. Sterile injection solutions can be prepared by incorporating the cDNA vector compound in the required amount in an appropriate buffer with one or a combination of the ingredients listed above, if necessary, followed by sterilization by filtration.
[00351] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть включен в фармацевтическую композицию, пригодную для местного, системного, внутриамниотического, интратекального, внутричерепного, внутриартериального, внутривенного, внутрилимфатического, внутрибрюшинного, подкожного, трахеального, внутритканевого (например, внутримышечного, внутрисердечного, внутрипеченочного, внутрипочечного, интрацеребрального), интратекального, интравезикального, конъюнктивального (например, экстраорбитального, интраорбитального, ретроорбитального, интраретинального, субретинального, хориоидального, субхориоидального, интрастромального, интракамерального и интравитреального), интракохлеарного и мукозального (например, перорального, ректального, назального) введения. Также предусмотрена пассивная трансдукция ткани путем внутривенной или внутриартериальной инфузии под высоким давлением, а также внутриклеточной инъекции, такой как внутриядерная микроинъекция или внутрицитоплазматическая инъекция.[00351] The cDNA FVIII protein expression vector disclosed herein may be included in a pharmaceutical composition suitable for topical, systemic, intra-amniotic, intrathecal, intracranial, intra-arterial, intravenous, intralymphatic, intraperitoneal, subcutaneous, tracheal, interstitial (e.g. , intramuscular, intracardiac, intrahepatic, intrarenal, intracerebral), intrathecal, intravesical, conjunctival (eg, extraorbital, intraorbital, retroorbital, intraretinal, subretinal, choroidal, subchoroidal, intrastromal, intracameral and intravitreal), intracochlear and mucosal (eg, oral, rectal , nasal) administration. Passive tissue transduction by intravenous or intra-arterial high-pressure infusion, as well as intracellular injection such as intranuclear microinjection or intracytoplasmic injection, is also contemplated.
[00352] В некоторых аспектах способы, предложенные в данном документе, включают доставку одного или более зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, в клетку-хозяина. В данном документе также предложены клетки, полученные с помощью таких способов, и организмы (такие как животные, растения или грибы), содержащие или полученные из таких клеток. Способы доставки нуклеиновых кислот могут включать липофекцию, нуклеофекцию, микроинъекцию, биолистику, липосомы, иммунолипосомы, конъюгаты поликатион или липид:нуклеиновая кислота, «незащищенную» ДНК и усиленное агентом поглощение ДНК. Липофекция описана, например, в патентах США №№5049386, 4946787 и 4897355, и реагенты для липофекции продаются коммерчески (например, трансфектам (Transfectam™) и липофектин (Lipofectin™)). Доставка может осуществляться в клетки (например, введение in vitro или ex vivo) или в ткани-мишени (например, введение in vivo).[00352] In some aspects, the methods provided herein include delivering one or more cDNA FVIII protein expression vectors disclosed herein into a host cell. Also provided herein are cells produced by such methods and organisms (such as animals, plants or fungi) containing or derived from such cells. Methods for delivering nucleic acids may include lipofection, nucleofection, microinjection, biolistics, liposomes, immunoliposomes, polycation or lipid:nucleic acid conjugates, bare DNA, and agent-enhanced DNA uptake. Lipofection is described, for example, in US Pat. Nos. 5,049,386, 4,946,787 and 4,897,355, and lipofection reagents are sold commercially (eg, Transfectam™ and Lipofectin™). Delivery may be to cells (eg, in vitro or ex vivo administration) or to target tissues (eg, in vivo administration).
[00353] В данной области техники известны различные методики и способы доставки нуклеиновых кислот в клетки. Например, нуклеиновые кислоты, такие как зкДНК для экспрессии белка FVIII, могут быть изготовлены в виде состава липидных наночастиц (ЛНЧ), липидоидов, липосом, липидных наночастиц, липоплексов или наночастиц типа ядро-оболочка. Как правило, ЛНЧ состоят из молекул нуклеиновой кислоты (например, зкДНК), одного или более ионизируемых или катионных липидов (или их солей), одного или более неионных или нейтральных липидов (например, фосфолипида), молекулы, которая предотвращает агрегацию (например, ПЭГ или конъюгата ПЭГ-липид), и необязательно стерина (например, холестерина).[00353] Various techniques and methods for delivering nucleic acids into cells are known in the art. For example, nucleic acids, such as cccDNA for FVIII protein expression, can be formulated as lipid nanoparticles (LNPs), lipidoids, liposomes, lipid nanoparticles, lipoplexes, or core-shell nanoparticles. Typically, LNPs are composed of a nucleic acid molecule (e.g., cccDNA), one or more ionizable or cationic lipids (or salts thereof), one or more nonionic or neutral lipids (e.g., a phospholipid), a molecule that prevents aggregation (e.g., PEG or a PEG-lipid conjugate), and optionally a sterol (eg cholesterol).
[00354] Другой способ доставки нуклеиновых кислот, таких как зкДНК для экспрессии белка FVIII, в клетку заключается в конъюгации нуклеиновой кислоты с лигандом, который интернализуется клеткой. Например, лиганд может связывать рецептор на поверхности клетки и интернализоваться за счет эндоцитоза. Лиганд может быть ковалентно связан с нуклеотидом в нуклеиновой кислоте. Примерные конъюгаты для доставки нуклеиновых кислот в клетку описаны, например, в WO2015/006740, WO2014/025805, WO2012/037254, WO2009/082606, WO2009/073809, WO2009/018332, WO2006/112872, WO2004/090108, WO2004/091515 и WO2017/177326.[00354] Another method of delivering nucleic acids, such as cccDNA for FVIII protein expression, into a cell is by conjugating the nucleic acid to a ligand that is internalized by the cell. For example, a ligand can bind to a cell surface receptor and be internalized through endocytosis. A ligand may be covalently linked to a nucleotide in a nucleic acid. Exemplary conjugates for delivering nucleic acids into a cell are described, for example, in WO2015/006740, WO2014/025805, WO2012/037254, WO2009/082606, WO2009/073809, WO2009/018332, WO2006/112872, WO 2004/090108, WO2004/091515 and WO2017 /177326.
[00355] Нуклеиновые кислоты, такие как зкДНК-векторы для экспрессии белка FVIII, также могут быть доставлены в клетку путем трансфекции. Подходящие способы трансфекции включают, но не ограничиваются перечисленными, опосредуемую липидами трансфекцию, опосредуемую катионным полимером трансфекцию или осаждение фосфатом кальция. Реагенты для трансфекции хорошо известны в данной области техники и включают, но не ограничиваются перечисленными, реагент для трансфекции TurboFect (Thermo Fisher Scientific), реагент Pro-Ject (Thermo Fisher Scientific), реагент для трансфекции белков TRANSPASS™ Р (New England Biolabs), реагент для доставки белков CHARIOT™ (Active Motif), реагент для трансфекции белков PROTEOJUICE™ (EMD Millipore), 293fectin, LIPOFECTAMINE™ 2000, LIPOFECTAMINE™ 3000 (Thermo Fisher Scientific), LIPOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTIN™ (Thermo Fisher Scientific), DMRIE-C, CELLFECTIN™ (Thermo Fisher Scientific), OLIGOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTACE™, FUGENE™ (Roche, Базель, Швейцария), FUGENE™ HD (Roche), TRANSFECTAM™ (трансфектам, Promega, Мэдисон, Висконсин), TFX-10™ (Promega), TFX-20™ (Promega), TFX-50™ (Promega), TRANSFECTIN™ (BioRad, Геркулес, Калифорния), SILENTFECT™ (Bio-Rad), EfFectene™ (Qiagen, Валенсия, Калифорния), DC-chol (Avanti Polar Lipids), GENEPORTER™ (Gene Therapy Systems, Сан-Диего, Калифорния), DHARMAFECT 1™ (Dharmacon, Лафайет, Колорадо), DHARMAFECT 2™ (Dharmacon), DHARMAFECT 3™ (Dharmacon), DHARMAFECT 4™ (Dharmacon), ESCORT™ III (Sigma, Сент-Луис, Миссури) и ESCORT™ IV (Sigma Chemical Co.). Нуклеиновые кислоты, такие как зкДНК, также могут быть доставлены в клетку с помощью микроструйных способов, известных специалистам в данной области техники.[00355] Nucleic acids, such as cDNA vectors for FVIII protein expression, can also be delivered into cells by transfection. Suitable transfection methods include, but are not limited to, lipid-mediated transfection, cationic polymer-mediated transfection, or calcium phosphate precipitation. Transfection reagents are well known in the art and include, but are not limited to, TurboFect Transfection Reagent (Thermo Fisher Scientific), Pro-Ject Reagent (Thermo Fisher Scientific), TRANSPASS™ P Protein Transfection Reagent (New England Biolabs), CHARIOT™ Protein Delivery Reagent (Active Motif), PROTEOJUICE™ Protein Transfection Reagent (EMD Millipore), 293fectin, LIPOFECTAMINE™ 2000, LIPOFECTAMINE™ 3000 (Thermo Fisher Scientific), LIPOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTIN™ (Thermo Fisher Scientific) Scientific), DMRIE-C, CELLFECTIN™ (Thermo Fisher Scientific), OLIGOFECTAMINE™ (Thermo Fisher Scientific), LIPOFECTACE™, FUGENE™ (Roche, Basel, Switzerland), FUGENE™ HD (Roche), TRANSFECTAM™ (transfectam, Promega, Madison, WI), TFX-10™ (Promega), TFX-20™ (Promega), TFX-50™ (Promega), TRANSFECTIN™ (BioRad, Hercules, CA), SILENTFECT™ (Bio-Rad), EfFectene™ ( Qiagen, Valencia, CA), DC-chol (Avanti Polar Lipids), GENEPORTER™ (Gene Therapy Systems, San Diego, CA), DHARMAFECT 1™ (Dharmacon, Lafayette, CO), DHARMAFECT 2™ (Dharmacon), DHARMAFECT 3 ™ (Dharmacon), DHARMAFECT 4™ (Dharmacon), ESCORT™ III (Sigma, St. Louis, MO), and ESCORT™ IV (Sigma Chemical Co.). Nucleic acids such as cctDNA can also be delivered into cells using microfluidic techniques known to those skilled in the art.
[00356] ЗкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, также можно вводить непосредственно в организм для трансдукции клеток in vivo. Введение осуществляют любым из путей, обычно используемых для приведения молекулы в максимальный контакт с клетками крови или тканей, включая, но не ограничиваясь перечисленными, инъекцию, инфузию, местное нанесение и электропорацию. Подходящие способы введения таких нуклеиновых кислот доступны и хорошо известны специалистам в данной области техники, и хотя для введения конкретной композиции можно использовать более одного пути, конкретный путь часто может обеспечить более быструю и более эффективную реакцию по сравнению с другим путем введения.[00356] The cDNA FVIII protein expression vectors described herein can also be administered directly into the body to transduce cells in vivo. Administration is accomplished by any of the routes commonly used to bring the molecule into maximum contact with blood or tissue cells, including, but not limited to, injection, infusion, topical application, and electroporation. Suitable routes for administering such nucleic acids are available and well known to those skilled in the art, and although more than one route may be used to administer a particular composition, a particular route can often provide a faster and more efficient response than another route of administration.
[00357] Способы введения векторной нуклеиновой кислоты, такой как зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, могут включать доставку в гемопоэтические стволовые клетки, например, с помощью способов, описанных, например, в патенте США №5928638.[00357] Methods of administering a vector nucleic acid, such as the cDNA FVIII protein expression vector disclosed herein, may include delivery to hematopoietic stem cells, for example, using methods described, for example, in US Pat. No. 5,928,638.
[00358] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку или орган-мишень у субъекта. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды. Примерные липосомы и липосомные составы, включая, но не ограничиваясь перечисленными, соединения, содержащие функциональные группы полиэтиленгликоля (ПЭГ), раскрыты в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., и в международной заявке PCT/US2018/064242, поданной 6 декабря 2018 г., например, см. раздел, озаглавленный «Фармацевтические составы».[00358] CCDNA vectors for expression of the FVIII protein in accordance with the present invention can be added to liposomes for delivery to a cell or target organ in a subject. Liposomes are vesicles that have at least one lipid bilayer. Liposomes are typically used as carriers for drug/therapeutic delivery in the context of pharmaceutical development. They work by fusing with the cell membrane and rearranging its lipid structure to deliver a drug or active pharmaceutical ingredient (API). Liposomal compositions for such delivery consist of phospholipids, in particular compounds containing a phosphatidylcholine group, however, these compositions may also include other lipids. Exemplary liposomes and liposome formulations, including, but not limited to, compounds containing polyethylene glycol (PEG) functional groups, are disclosed in International Application PCT/US2018/050042, filed September 7, 2018, and International Application PCT/US2018/064242. filed December 6, 2018, for example, see the section entitled “Pharmaceutical Formulations.”
[00359] Различные способы доставки, известные в данной области техники, или их модификации, могут быть использованы для доставки зкДНК-векторов in vitro или in vivo. Например, согласно некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII доставляют, образуя кратковременное отверстие в клеточной мембране с использованием механической, электрической, ультразвуковой, гидродинамической или лазерной энергии так, чтобы облегчить вход ДНК в целевые клетки. Например, зкДНК-вектор может быть доставлен путем кратковременного разрыва клеточной мембраны путем продавливания клетки через канал ограниченного размера или другими способами, известными в данной области техники. В некоторых случаях зкДНК-вектор по отдельности напрямую вводят в виде незащищенной ДНК путем инъекции в любую из: любой одной или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников, сердца, кишечника, легкого и желудка, кожи, тимуса, сердечной мышцы или скелетной мышцы. В некоторых случаях зкДНК-вектор доставляют с помощью генной пушки. Сферические частицы золота или вольфрама (диаметром 1-3 мкм), покрытые бескапсидными ААВ-векторами, могут быть разогнаны до высокой скорости с помощью сжатого газа для проникновения в клетки целевой ткани.[00359] Various delivery methods known in the art, or modifications thereof, can be used to deliver cccDNA vectors in vitro or in vivo. For example, in some embodiments, cccDNA vectors for FVIII protein expression are delivered by creating a transient hole in the cell membrane using mechanical, electrical, ultrasonic, hydrodynamic, or laser energy so as to facilitate entry of DNA into target cells. For example, the cccDNA vector can be delivered by transiently rupturing the cell membrane by forcing the cell through a channel of limited size or other methods known in the art. In some cases, the cccDNA vector individually is directly administered as unprotected DNA by injection into any of: any one or more tissues selected from: liver, kidney, gallbladder, prostate, adrenal gland, heart, intestine, lung and stomach, skin, thymus, cardiac muscle or skeletal muscle. In some cases, the cccDNA vector is delivered using a gene gun. Spherical gold or tungsten particles (1-3 μm in diameter) coated with capsidless AAV vectors can be accelerated to high speed using compressed gas to penetrate the cells of the target tissue.
[00360] Композиции, содержащие зкДНК-вектор для экспрессии белка FVIII и фармацевтически приемлемый носитель, конкретно предусмотрены в данном документе. Согласно некоторым вариантам реализации зкДНК-вектор изготовлен с липидной системой доставки, например, липосомами, как описано в данном документе. Согласно некоторым вариантам реализации такие композиции вводят любым путем, желательным для квалифицированного специалиста. Композиции могут быть введены субъекту различными путями, включая пероральный, парентеральный, сублингвальный, трансдермальный, ректальный, трансмукозальный, местный, путем ингаляции, путем буккального введения, внутриплевральный, внутривенный, внутриартериальный, внутрибрюшинный, подкожный, внутримышечный, интраназальный, интратекальный и внутрисуставной или их комбинации. Для ветеринарного применения композиция может быть введена в виде достаточно приемлемого состава в соответствии с обычной ветеринарной практикой. Ветеринарный врач может легко определить схему дозирования и путь введения, которые наиболее подходят для конкретного животного. Композиции могут быть ведены с помощью обычных шприцев, безыгольных инъекционных устройств, «генных пушек с бомбардировкой микрочастицами» или других физических методов, таких как электропорация («ЭП»), гидродинамические методы или применение ультразвука.[00360] Compositions comprising a cccDNA vector for expression of the FVIII protein and a pharmaceutically acceptable carrier are specifically provided herein. In some embodiments, the cccDNA vector is formulated with a lipid delivery system, such as liposomes, as described herein. In some embodiments, such compositions are administered by any route desired by a skilled practitioner. The compositions may be administered to a subject by various routes, including oral, parenteral, sublingual, transdermal, rectal, transmucosal, topical, inhalation, buccal, intrapleural, intravenous, intraarterial, intraperitoneal, subcutaneous, intramuscular, intranasal, intrathecal and intraarticular, or combinations thereof. . For veterinary use, the composition may be administered in a reasonably acceptable formulation in accordance with normal veterinary practice. The veterinarian can easily determine the dosage schedule and route of administration that is most appropriate for a particular animal. The compositions can be administered using conventional syringes, needleless injection devices, "microparticle bombardment gene guns" or other physical methods such as electroporation ("EP"), hydrodynamic methods or the use of ultrasound.
[00361] В некоторых случаях зкДНК-вектор для экспрессии белка FVIII доставляют путем гидродинамической инъекции, которая представляет собой простой и высокоэффективный способ прямой внутриклеточной доставки любых водорастворимых соединений и частиц во внутренние органы и скелетные мышцы во всей конечности.[00361] In some cases, the cccDNA vector for FVIII protein expression is delivered by hydrodynamic injection, which provides a simple and highly effective method for direct intracellular delivery of any water-soluble compounds and particles to internal organs and skeletal muscle throughout the limb.
[00362] В некоторых случаях зкДНК-векторы для экспрессии белка FVIII доставляют с помощью ультразвука, создавая наноскопические поры в мембране для облегчения внутриклеточной доставки частиц ДНК в клетки внутренних органов или опухолей, поэтому размер и концентрация плазмидной ДНК имеют большое значение для эффективности системы. В некоторых случаях зкДНК-векторы доставляют путем магнитофекции с использованием магнитных полей для концентрирования частиц, содержащих нуклеиновую кислоту, в клетках-мишенях.[00362] In some cases, cccDNA vectors for FVIII protein expression are delivered by ultrasound, creating nanoscopic pores in the membrane to facilitate intracellular delivery of DNA particles to internal organ or tumor cells, so the size and concentration of plasmid DNA is of great importance to the efficiency of the system. In some cases, cccDNA vectors are delivered by magnetofection, using magnetic fields to concentrate particles containing the nucleic acid into target cells.
[00363] В некоторых случаях могут быть использованы химические системы доставки, например, с использованием наномерных комплексов, которые включают уплотнение отрицательно заряженной нуклеиновой кислоты поликатионными наномерными частицами, в составе катионной липосомы/мицеллы или катионных полимеров. Катионные липиды, используемые в указанном способе доставки, включают, но не ограничиваются перечисленными, моновалентные катионные липиды, поливалентные катионные липиды, гуанидин-содержащие соединения, соединения производных холестерина, катионные полимеры (например, полиэтиленимин, поли-L-лизин, протамин, другие катионные полимеры) и гибриды липид-полимер.[00363] In some cases, chemical delivery systems can be used, for example, using nanometer complexes that involve the compaction of negatively charged nucleic acid with polycationic nanometer particles, in the composition of a cationic liposome/micelle or cationic polymers. Cationic lipids used in this delivery method include, but are not limited to, monovalent cationic lipids, polyvalent cationic lipids, guanidine-containing compounds, cholesterol derivative compounds, cationic polymers (e.g., polyethylenimine, poly-L-lysine, protamine, other cationic polymers) and lipid-polymer hybrids.
А. ЭкзосомыA. Exosomes
[00364] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют упакованным в экзосоме. Экзосомы представляют собой небольшие мембранные везикулы эндоцитарного происхождения, которые высвобождаются во внеклеточную среду после слияния мультивезикулярных телец с плазматической мембраной. Их поверхность состоит из липидного бислоя клеточной мембраны донорной клетки, они содержат цитозоль из клетки, которая продуцировала экзосому, и экспонируют на поверхности мембранные белки родительской клетки. Экзосомы продуцируются различными типами клеток, в том числе эпителиальными клетками, В- и Т-лимфоцитами, тучными клетками (МС), а также дендритными клетками (DC). Согласно некоторым вариантам реализации для применения предусмотрены экзосомы с диаметром от 10 нм до 1 мкм, от 20 нм до 500 нм, от 30 нм до 250 нм, от 50 до 100 нм. Экзосомы могут быть выделены для доставки в целевые клетки либо с использованием их донорных клеток, либо путем введения в них конкретных нуклеиновых кислот. Для получения экзосом, содержащих бескапсидные ААВ-векторы согласно настоящему изобретению, могут быть использованы различные подходы, известные в данной области техники.[00364] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is delivered packaged in an exosome. Exosomes are small membrane vesicles of endocytic origin that are released into the extracellular environment after the fusion of multivesicular bodies with the plasma membrane. Their surface consists of the lipid bilayer of the cell membrane of the donor cell, they contain cytosol from the cell that produced the exosome, and they expose membrane proteins of the parent cell on the surface. Exosomes are produced by various cell types, including epithelial cells, B and T lymphocytes, mast cells (MCs), and dendritic cells (DCs). In some embodiments, exosomes with a diameter of 10 nm to 1 μm, 20 nm to 500 nm, 30 nm to 250 nm, or 50 to 100 nm are provided for use. Exosomes can be isolated for delivery to target cells either by using their donor cells or by introducing specific nucleic acids into them. To obtain exosomes containing capsidless AAV vectors according to the present invention, various approaches known in the art can be used.
В. Микрочастица/наночастицыB. Microparticle/nanoparticles
[00365] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют с помощью липидной наночастицы. Обычно липидные наночастицы содержат ионизируемый аминолипид (например, гептатриаконта-6,9,28,31-тетраен-19-ил-4-(диметиламино)бутаноат, DLin-MC3-DMA, фосфатидилхолин(1,2-дистеароил-sn-глицеро-3-фосфохолин, DSPC), холестерин и липид оболочки (полиэтиленгликоль-димиристоилглицерин, ПЭГ-ДМГ), например, как раскрыто Tam et al. (2013). Advances in Lipid Nanoparticles for siRNA delivery. Pharmaceuticals 5(3): 498-507.[00365] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is delivered via a lipid nanoparticle. Typically, lipid nanoparticles contain an ionizable aminolipid (e.g., heptatriakonta-6,9,28,31-tetraen-19-yl-4-(dimethylamino)butanoate, DLin-MC3-DMA, phosphatidylcholine (1,2-distearoyl-sn-glycero- 3-phosphocholine, DSPC), cholesterol and envelope lipid (polyethylene glycol dimyristoylglycerol, PEG-DMG), for example, as disclosed by Tam et al (2013). Advances in Lipid Nanoparticles for siRNA delivery. Pharmaceuticals 5(3): 498-507 .
[00366] Согласно некоторым вариантам реализации липидная наночастица имеет средний диаметр от примерно 10 до примерно 1000 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр менее 300 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр от примерно 10 до примерно 300 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр менее 200 нм. Согласно некоторым вариантам реализации липидная наночастица имеет диаметр от примерно 25 до примерно 200 нм. Согласно некоторым вариантам реализации препарат липидных наночастиц (например, композиция, содержащая множество липидных наночастиц) имеет распределение по размерам, при котором средний размер (например, диаметр) составляет от примерно 70 нм до примерно 200 нм, и более типично средний размер составляет примерно 100 нм или менее.[00366] In some embodiments, the lipid nanoparticle has an average diameter of from about 10 nm to about 1000 nm. In some embodiments, the lipid nanoparticle has a diameter of less than 300 nm. In some embodiments, the lipid nanoparticle has a diameter of from about 10 nm to about 300 nm. In some embodiments, the lipid nanoparticle has a diameter of less than 200 nm. In some embodiments, the lipid nanoparticle has a diameter of from about 25 nm to about 200 nm. In some embodiments, the lipid nanoparticle formulation (e.g., a composition containing a plurality of lipid nanoparticles) has a size distribution such that the average size (e.g., diameter) is from about 70 nm to about 200 nm, and more typically the average size is about 100 nm or less.
[00367] Для доставки ДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, могут быть использованы различные липидные наночастицы, известные в данной области техники. Например, различные способы доставки с применением липидных наночастиц описаны в патентах США №№9404127, 9006417 и 9518272.[00367] Various lipid nanoparticles known in the art can be used to deliver the FVIII protein expression DNA vector disclosed herein. For example, various delivery methods using lipid nanoparticles are described in US Patent Nos. 9404127, 9006417 and 9518272.
[00368] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляют с помощью наночастицы золота. Обычно нуклеиновая кислота может быть ковалентно связана с наночастицей золота или нековалентно связана с наночастицей золота (например, связана заряд-зарядным взаимодействием), например, согласно описанию Ding et al. (2014). Gold Nanoparticles for Nucleic Acid Delivery. Mol. Ther. 22(6); 1075-1083. Согласно некоторым вариантам реализации конъюгаты наночастицы золота с нуклеиновой кислотой получают с использованием способов, описанных, например, в патенте США №6812334.[00368] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is delivered using a gold nanoparticle. Typically, the nucleic acid may be covalently associated with the gold nanoparticle or non-covalently associated with the gold nanoparticle (eg, associated by charge-charge interaction), for example, as described by Ding et al. (2014). Gold Nanoparticles for Nucleic Acid Delivery. Mol. Ther. 22(6); 1075-1083. In some embodiments, gold nanoparticle-nucleic acid conjugates are prepared using methods described, for example, in US Pat. No. 6,812,334.
C. КонъюгатыC. Conjugates
[00369] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован (например, ковалентно связан) с агентом, который увеличивает клеточное поглощение. «Агент, который увеличивает клеточное поглощение» представляет собой молекулу, которая облегчает транспорт нуклеиновой кислоты через липидную мембрану. Например, нуклеиновая кислота может быть конъюгирована с липофильным соединением (например, холестерином, токоферолом и т.д.), проникающим в клетки пептидом (СРР) (например, пенетратином, TAT, Syn1B и т.д.) и полиаминами (например, спермином). Дополнительные примеры агентов, которые увеличивают поглощение клетками, раскрыты, например, в Winkler (2013). Oligonucleotide conjugates for therapeutic applications. Ther. Deliv. 4(7); 791-809.[00369] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is conjugated (eg, covalently linked) to an agent that enhances cellular uptake. A "cellular uptake enhancing agent" is a molecule that facilitates the transport of nucleic acid across a lipid membrane. For example, the nucleic acid may be conjugated to a lipophilic compound (e.g., cholesterol, tocopherol, etc.), cell penetrating peptide (CPP) (e.g., penetratin, TAT, Syn1B, etc.), and polyamines (e.g., spermine ). Additional examples of agents that increase cellular uptake are disclosed, for example, in Winkler (2013). Oligonucleotide conjugates for therapeutic applications. Ther. Deliv. 4(7); 791-809.
[00370] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с полимером (например, полимерной молекулой) или молекулой фолата (например, молекулой фолиевой кислоты). В целом, доставка нуклеиновых кислот, конъюгированных с полимерами, известна в данной области техники, например, описана в WO2000/34343 и WO2008/022309. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с полиамидным полимером, например, согласно описанию в патенте США №8987377. Согласно некоторым вариантам реализации нуклеиновая кислота, описанная в настоящем раскрытии, конъюгирована с молекулой фолиевой кислоты согласно описанию в патенте США №8507455.[00370] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is conjugated to a polymer (eg, a polymer molecule) or a folate molecule (eg, a folic acid molecule). In general, delivery of nucleic acids conjugated to polymers is known in the art, for example, described in WO2000/34343 and WO2008/022309. In some embodiments, the cDNA FVIII protein expression vector disclosed herein is conjugated to a polyamide polymer, for example, as described in US Pat. No. 8,987,377. In some embodiments, the nucleic acid described in the present disclosure is conjugated to a folic acid molecule as described in US Pat. No. 8,507,455.
[00371] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, конъюгирован с углеводом, например, как описано в патенте США №8450467.[00371] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is conjugated to a carbohydrate, for example, as described in US Pat. No. 8,450,467.
D. НанокапсулаD. Nanocapsule
[00372] В качестве альтернативы, могут применяться нанокапсульные составы зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе. Обычно нанокапсулы могут захватывать вещества стабильным и воспроизводимым образом. Чтобы избежать побочных эффектов, обусловленных внутриклеточной перегрузкой полимерами, такие ультрадисперсные частицы (размером около 0,1 мкм) необходимо конструировать с использованием полимеров, способных разлагаться in vivo. Предусмотрено применение биоразлагаемых полиалкил-цианоакрилатных наночастиц, которые удовлетворяют таким требованиям.[00372] Alternatively, nanocapsule formulations of the cDNA vector for expression of the FVIII protein disclosed herein may be used. Generally, nanocapsules can entrap substances in a stable and reproducible manner. To avoid side effects caused by intracellular polymer overload, such ultrafine particles (about 0.1 μm in size) must be constructed using polymers that can degrade in vivo. The use of biodegradable polyalkyl cyanoacrylate nanoparticles that meet such requirements is envisaged.
E. ЛипосомыE. Liposomes
[00373] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку или орган-мишень у субъекта. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды.[00373] CCDNA vectors for expression of FVIII protein in accordance with the present invention can be added to liposomes for delivery to a cell or target organ in a subject. Liposomes are vesicles that have at least one lipid bilayer. Liposomes are typically used as carriers for drug/therapeutic delivery in the context of pharmaceutical development. They work by fusing with the cell membrane and rearranging its lipid structure to deliver a drug or active pharmaceutical ingredient (API). Liposomal compositions for such delivery consist of phospholipids, in particular compounds containing a phosphatidylcholine group, however, these compositions may also include other lipids.
[00374] Изготовление и применение липосом в целом известно специалистам в данной области техники. Были разработаны липосомы с улучшенной стабильностью в сыворотке и временем полужизни в кровотоке (патент США №5741516). Кроме того, были описаны различные способы получения липосом и липосомоподобных препаратов в качестве потенциальных носителей лекарственных средств (патенты США №№5567434; 5552157; 5565213; 5738868 и 5795587).[00374] The preparation and use of liposomes is generally known to those skilled in the art. Liposomes with improved serum stability and circulation half-life have been developed (US Patent No. 5,741,516). In addition, various methods for preparing liposomes and liposome-like preparations as potential drug carriers have been described (US Patent Nos. 5,567,434; 5,552,157; 5,565,213; 5,738,868 and 5,795,587).
F. Примерные композиции липосом и липидных наночастиц (ЛНЧ)F. Exemplary Compositions of Liposomes and Lipid Nanoparticles (LNPs)
[00375] ЗкДНК-векторы для экспрессии белка FVIII в соответствии с настоящим изобретением могут быть добавлены к липосомам для доставки в клетку, например, в клетку, нуждающуюся в экспрессии трансгена. Липосомы представляют собой везикулы, которые имеют по меньшей мере один липидный бислой. Липосомы, как правило, используются в качестве носителей для доставки лекарственных/терапевтических средств в контексте фармацевтической разработки. Они работают за счет слияния с клеточной мембраной и перегруппировки ее липидной структуры для доставки лекарственного средства или активного фармацевтического ингредиента (АФИ). Липосомальные композиции для такой доставки состоят из фосфолипидов, в частности, соединений, содержащих фосфатидилхолиновую группу, однако указанные композиции также могут включать другие липиды.[00375] CCDNA vectors for expression of the FVIII protein in accordance with the present invention can be added to liposomes for delivery into a cell, for example, into a cell in need of transgene expression. Liposomes are vesicles that have at least one lipid bilayer. Liposomes are typically used as carriers for drug/therapeutic delivery in the context of pharmaceutical development. They work by fusing with the cell membrane and rearranging its lipid structure to deliver a drug or active pharmaceutical ingredient (API). Liposomal compositions for such delivery consist of phospholipids, in particular compounds containing a phosphatidylcholine group, however, these compositions may also include other lipids.
[00376] Липидные наночастицы (ЛНЧ), содержащие зкДНК-векторы, раскрыты в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., и международной заявке PCT/US2018/064242, поданной 6 декабря 2018 г., которые полностью включены в данный документ, и предусмотрены для применения в способах и композициях зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе.[00376] Lipid nanoparticles (LNPs) containing cccDNA vectors are disclosed in International Application PCT/US2018/050042, filed September 7, 2018, and International Application PCT/US2018/064242, filed December 6, 2018, which are fully included herein, and are provided for use in the methods and compositions of cDNA vectors for expression of FVIII protein disclosed herein.
[00377] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который включает одно или более соединений с функциональной группой полиэтиленгликоля (ПЭГ) (так называемых «пегилированных соединений»), которые могут снижать иммуногенность/антигенность, обеспечивать гидрофильность и гидрофобность, а также уменьшать частоту дозирования соединения (соединений). В других случаях, липосомальный состав просто включает полимер полиэтиленгликоль (ПЭГ) в качестве дополнительного компонента. В таких аспектах молекулярная масса ПЭГ или функциональной группы ПЭГ может составлять от 62 Да до примерно 5000 Да.[00377] According to some aspects of the present disclosure, there is provided a liposomal formulation that includes one or more polyethylene glycol (PEG) functional compounds (so-called "PEGylated compounds") that can reduce immunogenicity/antigenicity, provide hydrophilicity and hydrophobicity, and reduce the incidence of dosing the compound(s). In other cases, the liposomal formulation simply includes the polymer polyethylene glycol (PEG) as an additional component. In such aspects, the molecular weight of the PEG or PEG functionality may range from 62 Da to about 5000 Da.
[00378] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который доставит АФИ с профилем пролонгированного или контролируемого высвобождения на протяжении периода времени от нескольких часов до недель. Согласно некоторым родственным аспектам липосомальный состав может содержать водные камеры, которые ограничены липидными бислоями. Согласно другим родственным аспектам липосомальный состав инкапсулирует АФИ с компонентами, которые претерпевают физический переход при повышенной температуре, который высвобождает АФИ в течение периода от нескольких часов до недель.[00378] According to some aspects of the present disclosure, a liposomal formulation is provided that will deliver an API with a sustained or controlled release profile over a period of time ranging from several hours to weeks. In some related aspects, the liposomal formulation may contain aqueous chambers that are limited by lipid bilayers. In other related aspects, the liposomal formulation encapsulates the API with components that undergo a physical transition at elevated temperature that releases the API over a period of hours to weeks.
[00379] Согласно некоторым аспектам липосомальный состав содержит сфингомиелин и один или более липидов, раскрытых в данном документе. Согласно некоторым аспектам липосомальный состав содержит оптисомы.[00379] In some aspects, the liposomal composition contains sphingomyelin and one or more lipids disclosed herein. In some aspects, the liposomal composition contains optisomes.
[00380] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который содержит один или более липидов, выбранных из: натриевой соли N-(карбонилметоксиполиэтиленгликоль 2000)-1,2-дистеароил-sn-глицеро-3-фосфоэтаноламина, (дистеароил-sn-глицерофосфоэтаноламина), MPEG (метоксиполиэтиленгликоль)-конъюгированного липида, HSPC (гидрогенизированного соевого фосфатидилхолина); ПЭГ (полиэтиленгликоля); DSPE (дистеароил-sn-глицерофосфоэтаноламина); DSPC (дистеароилфосфатидилхолина); DOPC (диолеоилфосфатидилхолина); DPPG (дипальмитоилфосфатидилглицерина); ЕРС (яичного фосфатидилхолина); DOPS (диолеоилфосфатидилсерина); РОРС (пальмитоилолеоилфосфатидилхолина); SM (сфингомиелина); MPEG (метоксиполиэтиленгликоля); DMPC (димиристоилфосфатидилхолина); DMPG (димиристоилфосфатидилглицерина); DSPG (дистеароилфосфатидилглицерина); DEPC (диэрукоилфосфатидилхолина); DOPE (диолеоил-sn-глицерофосфоэтаноламина); сульфата холестерина (CS); дипальмитоилфосфатидилглицерина (DPPG); DOPC (диолеоил-sn-глицерофосфатидилхолина) или любой их комбинации.[00380] According to some aspects of the present disclosure, there is provided a liposomal formulation that contains one or more lipids selected from: N-(carbonylmethoxypolyethylene glycol 2000)-1,2-distearoyl-sn-glycero-3-phosphoethanolamine sodium salt, (distearoyl-sn- glycerophosphoethanolamine), MPEG (methoxypolyethylene glycol)-conjugated lipid, HSPC (hydrogenated soy phosphatidylcholine); PEG (polyethylene glycol); DSPE (distearoyl-sn-glycerophosphoethanolamine); DSPC (distearoylphosphatidylcholine); DOPC (dioleoylphosphatidylcholine); DPPG (dipalmitoylphosphatidylglycerol); EPC (egg phosphatidylcholine); DOPS (dioleoylphosphatidylserine); POPC (palmitoyloleoylphosphatidylcholine); SM (sphingomyelin); MPEG (methoxy polyethylene glycol); DMPC (dimyristoylphosphatidylcholine); DMPG (dimyristoylphosphatidylglycerol); DSPG (distearoylphosphatidylglycerol); DEPC (dierucoylphosphatidylcholine); DOPE (dioleoyl-sn-glycerophosphoethanolamine); cholesterol sulfate (CS); dipalmitoylphosphatidylglycerol (DPPG); DOPC (dioleoyl-sn-glycerophosphatidylcholine) or any combination thereof.
[00381] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий фосфолипид, холестерин и пегилированный липид в молярном соотношении 56:38:5. Согласно некоторым аспектам общее содержание липидов в липосомальном составе составляет 2-16 мг/мл. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, липид, содержащий этаноламиновую функциональную группу, и пегилированный липид. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, липид, содержащий этаноламиновую функциональную группу, и пегилированный липид, в молярном соотношении 3:0,015:2, соответственно. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, холестерин и пегилированный липид. Согласно некоторым аспектам настоящего изобретения предложен липосомальный состав, содержащий липид, содержащий фосфатидилхолиновую функциональную группу, и холестерин. Согласно некоторым аспектам пегилированный липид представляет собой ПЭГ-2000-DSPE. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий DPPG, соевый ФХ, липидный конъюгат MPEG-DSPE и холестерин.[00381] According to some aspects of the present disclosure, there is provided a liposomal formulation comprising a phospholipid, cholesterol, and a PEGylated lipid in a molar ratio of 56:38:5. In some aspects, the total lipid content of the liposomal formulation is 2-16 mg/ml. According to some aspects of the present disclosure, there is provided a liposomal composition comprising a phosphatidylcholine-functional lipid, an ethanolamine-functional lipid, and a PEGylated lipid. According to some aspects of the present invention, there is provided a liposomal composition comprising a phosphatidylcholine-functional lipid, an ethanolamine-functional lipid, and a PEGylated lipid in a molar ratio of 3:0.015:2, respectively. According to some aspects of the present invention, there is provided a liposomal composition comprising a lipid containing a phosphatidylcholine functionality, cholesterol and a pegylated lipid. According to some aspects of the present invention, there is provided a liposomal composition comprising a phosphatidylcholine functional group-containing lipid and cholesterol. In some aspects, the PEGylated lipid is PEG-2000-DSPE. According to some aspects of the present disclosure, a liposomal formulation is provided comprising DPPG, soy PC, MPEG-DSPE lipid conjugate and cholesterol.
[00382] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий один или более липидов, содержащих фосфатидилхолиновую функциональную группу, и один или более липидов, содержащих этаноламиновую функциональную группу. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, содержащий один или более из: липидов, содержащих фосфатидилхолиновую функциональную группу, липидов, содержащих этаноламиновую функциональную группу, и стеринов, например, холестерина. Согласно некоторым аспектам липосомальный состав содержит DOPC/DEPC; и DOPE.[00382] According to some aspects of the present disclosure, there is provided a liposomal formulation comprising one or more phosphatidylcholine functional group-containing lipids and one or more ethanolamine functional group-containing lipids. According to some aspects of the present disclosure, there is provided a liposomal composition comprising one or more of: phosphatidylcholine-functional lipids, ethanolamine-functional lipids, and sterols, such as cholesterol. In some aspects, the liposomal composition contains DOPC/DEPC; and DOPE.
[00383] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, дополнительно содержащий одно или более фармацевтических вспомогательных веществ, например, сахарозу и/или глицин.[00383] According to some aspects of the present disclosure, a liposomal formulation is provided, further comprising one or more pharmaceutical excipients, for example, sucrose and/or glycine.
[00384] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав с униламеллярной или мультиламеллярной структурой. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который содержит мультивезикулярные частицы и/или частицы на основе пены. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, относительный размер которого больше, чем у обычных наночастиц, и составляет примерно от 150 до 250 нм. Согласно некоторым аспектам липосомальный состав представляет собой лиофилизированный порошок.[00384] According to some aspects of the present disclosure, a liposomal formulation with a unilamellar or multilamellar structure is provided. In accordance with some aspects of the present disclosure, a liposomal formulation is provided that contains multivesicular particles and/or foam-based particles. In some aspects of the present disclosure, a liposomal formulation is provided that has a relative size greater than that of conventional nanoparticles, ranging from about 150 to 250 nm. In some aspects, the liposomal formulation is a lyophilized powder.
[00385] Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, который получают и нагружают зкДНК-векторами, раскрытыми или описанными в данном документе, путем добавления слабого основания к смеси, содержащей выделенную зкДНК вне липосомы. Такое добавление повышает значение рН вне липосом до приблизительно 7,3 и стимулирует вход АФИ в липосому. Согласно некоторым аспектам настоящего раскрытия предложен липосомальный состав, имеющий кислый рН внутри липосомы. В таких случаях значение рН внутри липосом может составлять 4-6,9 и более предпочтительно рН 6,5. Согласно другим аспектам настоящего раскрытия предложен липосомальный состав, полученный с применением технологии внутрилипосомальной стабилизации лекарственных средств. В таких случаях используют полимерные или неполимерные высокозаряженные анионы и внутрилипосомальные захватывающие агенты, например, полифосфат или октасульфат сахарозы.[00385] According to some aspects of the present disclosure, a liposomal formulation is provided that is prepared and loaded with cccDNA vectors disclosed or described herein by adding a weak base to a mixture containing isolated cccDNA outside a liposome. This addition increases the pH outside the liposomes to approximately 7.3 and stimulates the entry of the API into the liposome. In accordance with some aspects of the present disclosure, a liposomal formulation is provided having an acidic pH within the liposome. In such cases, the pH value within the liposomes may be 4-6.9, and more preferably pH 6.5. According to other aspects of the present disclosure, a liposomal formulation is provided using intraliposomal drug stabilization technology. In such cases, polymeric or non-polymeric highly charged anions and intraliposomal entrapment agents, such as polyphosphate or sucrose octasulfate, are used.
[00386] Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, содержащая зкДНК и ионизируемый липид. Например, состав липидных наночастиц, который получают и нагружают зкДНК, полученной с помощью способа, раскрытого в международной заявке PCT/US2018/050042, поданной 7 сентября 2018 г., которая включена в данный документ.Это можно осуществлять путем интенсивного смешивания этанольных растворов липидов с водным раствором зкДНК при низком рН, при котором происходит протонирование ионизируемого липида и обеспечиваются благоприятные энергетические характеристики для ассоциации зкДНК/липида и нуклеации частиц. Частицы могут быть дополнительно стабилизированы путем разбавления водой и удаления органического растворителя. Частицы могут быть сконцентрированы до целевого уровня.[00386] In accordance with some aspects of the present disclosure, a lipid nanoparticle is provided comprising cccDNA and an ionizable lipid. For example, a lipid nanoparticle formulation that is prepared and loaded with cccDNA obtained using the method disclosed in international application PCT/US2018/050042, filed September 7, 2018, which is incorporated herein. This can be done by intensively mixing ethanol solutions of lipids with an aqueous solution of ccDNA at a low pH, at which protonation of the ionizable lipid occurs and provides favorable energetic characteristics for ccDNA/lipid association and particle nucleation. The particles can be further stabilized by diluting with water and removing the organic solvent. Particles can be concentrated to a target level.
[00387] Обычно липидные частицы получают при соотношении общего количества липида и зкДНК (массовом или весовом) от примерно 10:1 до 30:1. Согласно некоторым вариантам реализации соотношение липида и зкДНК (массовое соотношение; отношение масс/масс.) может находиться в диапазоне значений от примерно 1:1 до примерно 25:1, от примерно 10:1 до примерно 14:1, от примерно 3:1 до примерно 15:1, от примерно 4:1 до примерно 10:1, от примерно 5:1 до примерно 9:1 или от примерно 6:1 до примерно 9:1. Количества липидов и зкДНК могут быть скорректированы, чтобы обеспечить целевое соотношение N/P, например, соотношение N/P, равное 3, 4, 5, 6, 7, 8, 9, 10 или выше. Обычно общее содержание липидов в составе липидных частиц может быть в диапазоне от примерно 5 мг/мл до примерно 30 мг/мл.[00387] Typically, lipid particles are prepared at a ratio of total lipid to cccDNA (w/w) of about 10:1 to 30:1. In some embodiments, the lipid to cccDNA ratio (mass ratio; w/w ratio) may range from about 1:1 to about 25:1, from about 10:1 to about 14:1, from about 3:1 to about 15:1, from about 4:1 to about 10:1, from about 5:1 to about 9:1, or from about 6:1 to about 9:1. The amounts of lipids and cccDNA can be adjusted to provide a target N/P ratio, for example, an N/P ratio of 3, 4, 5, 6, 7, 8, 9, 10 or higher. Typically, the total lipid content of the lipid particles may range from about 5 mg/ml to about 30 mg/ml.
[00388] Ионизируемый липид, как правило, применяется для конденсации груза нуклеиновой кислоты, например, зкДНК, при низком рН, и для стимуляции ассоциации мембран и их фузогенности. Обычно ионизируемые липиды представляют собой липиды, содержащие по меньшей мере одну аминогруппу, которая положительно заряжена или становится протонированной в кислых условиях, например, при рН 6,5 или ниже. В данном документе ионизируемые липиды также называют катионными липидами.[00388] An ionizable lipid is typically used to condense a nucleic acid cargo, such as cccDNA, at low pH and to promote membrane association and fusogenicity. Typically, ionizable lipids are lipids containing at least one amino group that is positively charged or becomes protonated under acidic conditions, such as pH 6.5 or lower. In this document, ionizable lipids are also referred to as cationic lipids.
[00389] Примерные ионизируемые липиды описаны в международных РСТ публикациях патентов WO 2015/095340, WO 2015/199952, WO 2018/011633, WO 2017/049245, WO 2015/061467, WO 2012/040184, WO 2012/000104, WO 2015/074085, WO 2016/081029, WO 2017/004143, WO 2017/075531, WO 2017/117528, WO 2011/022460, WO 2013/148541, WO 2013/116126, WO 2011/153120, WO 2012/044638, WO 2012/054365, WO 2011/090965, WO 2013/016058, WO 2012/162210, WO 2008/042973, WO 2010/129709, WO 2010/144740, WO 2012/099755, WO 2013/049328, WO 2013/086322, WO 2013/086373, WO 2011/071860, WO 2009/132131, WO 2010/048536, WO 2010/088537, WO 2010/054401, WO 2010/054406, WO 2010/054405, WO 2010/054384, WO 2012/016184, WO 2009/086558, WO 2010/042877, WO 2011/000106, WO 2011/000107, WO 2005/120152, WO 2011/141705, WO 2013/126803, WO 2006/007712, WO 2011/038160, WO 2005/121348, WO 2011/066651, WO 2009/127060, WO 2011/141704, WO 2006/069782, WO 2012/031043, WO 2013/006825, WO 2013/033563, WO 2013/089151, WO 2017/099823, WO 2015/095346 и WO 2013/086354, и публикациях патентов США US 2016/0311759, US 2015/0376115, US 2016/0151284, US 2017/0210697, US 2015/0140070, US 2013/0178541, US 2013/0303587, US 2015/0141678, US 2015/0239926, US 2016/0376224, US 2017/0119904, US 2012/0149894, US 2015/0057373, US 2013/0090372, US 2013/0274523, US 2013/0274504, US 2013/0274504, US 2009/0023673, US 2012/0128760, US 2010/0324120, US 2014/0200257, US 2015/0203446, US 2018/0005363, US 2014/0308304, US 2013/0338210, US 2012/0101148, US 2012/0027796, US 2012/0058144, US 2013/0323269, US 2011/0117125, US 2011/0256175, US 2012/0202871, US 2011/0076335, US 2006/0083780, US 2013/0123338, US 2015/0064242, US 2006/0051405, US 2013/0065939, US 2006/0008910, US 2003/0022649, US 2010/0130588, US 2013/0116307, US 2010/0062967, US 2013/0202684, US 2014/0141070, US 2014/0255472, US 2014/0039032, US 2018/0028664, US 2016/0317458 и US 2013/0195920, содержание которых полностью включено в данный документ посредством ссылки.[00389] Exemplary ionizable lipids are described in international PCT patent publications WO 2015/095340, WO 2015/199952, WO 2018/011633, WO 2017/049245, WO 2015/061467, WO 2012/040184, WO 2012/ 000104, WO 2015/ 074085, WO 2016/081029, WO 2017/004143, WO 2017/075531, WO 2017/117528, WO 2011/022460, WO 2013/148541, WO 2013/116126, WO 2011/153 120, WO 2012/044638, WO 2012/ 054365, WO 2011/090965, WO 2013/016058, WO 2012/162210, WO 2008/042973, WO 2010/129709, WO 2010/144740, WO 2012/099755, WO 2013/049 328, WO 2013/086322, WO 2013/ 086373, WO 2011/071860, WO 2009/132131, WO 2010/048536, WO 2010/088537, WO 2010/054401, WO 2010/054406, WO 2010/054405, WO 2010/054 384, WO 2012/016184, WO 2009/ 086558, WO 2010/042877, WO 2011/000106, WO 2011/000107, WO 2005/120152, WO 2011/141705, WO 2013/126803, WO 2006/007712, WO 2011/038 160, WO 2005/121348, WO 2011/ 066651, WO 2009/127060, WO 2011/141704, WO 2006/069782, WO 2012/031043, WO 2013/006825, WO 2013/033563, WO 2013/089151, WO 2017/099 823, WO 2015/095346 and WO 2013/ 086354, and US patent publications US 2016/0311759, US 2015/0376115, US 2016/0151284, US 2017/0210697, US 2015/0140070, US 2013/0178541, US 2013/0303587, US 201 5/0141678, US 2015/0239926 , US 2016/0376224, US 2017/0119904, US 2012/0149894, US 2015/0057373, US 2013/0090372, US 2013/0274523, US 2013/0274504, US 2013/0274504, US 2009/0023673, US 2012/0128760 , US 2010/0324120, US 2014/0200257, US 2015/0203446, US 2018/0005363, US 2014/0308304, US 2013/0338210, US 2012/0101148, US 2012/0027796, US 2012/0058144, US 2013/0323269 , US 2011/0117125, US 2011/0256175, US 2012/0202871, US 2011/0076335, US 2006/0083780, US 2013/0123338, US 2015/0064242, US 2006/0051405, US 2013/0065939, US 2006/0008910 , US 2003/0022649, US 2010/0130588, US 2013/0116307, US 2010/0062967, US 2013/0202684, US 2014/0141070, US 2014/0255472, US 2014/0039032, US 2018/0028664, US 2016/0317458 and US 2013/0195920, the contents of which are incorporated herein by reference in their entirety.
[00390] Согласно некоторым вариантам реализации ионизируемый липид представляет собой МС3 (6Z,9Z,28Z,31Z)-гептатриаконта-6,9,28,31-тетраен-19-ил-4-(диметиламино)бутаноат (DLin-MC3-DMA или МСЗ), имеющий следующую структуру:[00390] In some embodiments, the ionizable lipid is MC3 (6Z,9Z,28Z,31Z)-heptatriaconta-6,9,28,31-tetraen-19-yl-4-(dimethylamino)butanoate (DLin-MC3-DMA or MRZ), having the following structure:
[00391] Липид DLin-MC3-DMA описан в Jayaraman et al., Angew. Chem. Int. Ed Engl. (2012), 51(34): 8529-8533, содержание которой полностью включено в данный документ посредством ссылки.[00391] The DLin-MC3-DMA lipid is described in Jayaraman et al., Angew. Chem. Int. Ed Engl. (2012), 51(34): 8529-8533, the contents of which are incorporated herein by reference in their entirety.
[00392] Согласно некоторым вариантам реализации ионизируемый липид представляет собой липид АТХ-002, описанный в WO 2015/074085, содержание которого полностью включено в данный документ посредством ссылки.[00392] In some embodiments, the ionizable lipid is lipid ATX-002, described in WO 2015/074085, the contents of which are incorporated herein by reference in their entirety.
[00393] Согласно некоторым вариантам реализации ионизируемый липид представляет собой (13Z,16Z)-N,N-диметил-3-нонилдокоза-13,16-диен-1-амин (Соединение 32), описанный в WO 2012/040184, содержание которого полностью включено в данный документ посредством ссылки.[00393] In some embodiments, the ionizable lipid is (13Z,16Z)-N,N-dimethyl-3-nonyldocose-13,16-dien-1-amine (Compound 32), described in WO 2012/040184, the content of which is incorporated herein by reference in its entirety.
[00394] Согласно некоторым вариантам реализации ионизируемый липид представляет собой Соединение 6 или Соединение 22, описанные в WO 2015/199952, содержание которого полностью включено в данный документ посредством ссылки.[00394] In some embodiments, the ionizable lipid is Compound 6 or Compound 22, described in WO 2015/199952, the contents of which are incorporated herein by reference in their entirety.
[00395] Без ограничений, ионизируемый липид может составлять 20-90% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Например, молярное содержание ионизируемого липида может составлять 20-70% (мол.), 30-60% (мол.) или 40-50% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно некоторым вариантам реализации ионизируемый липид составляет от примерно 50 мол. % до примерно 90 мол. % от общего количества липидов, присутствующих в липидной наночастице.[00395] Without limitation, the ionizable lipid may comprise 20-90 mol% of the total lipids present in the lipid nanoparticle. For example, the molar content of the ionizable lipid may be 20-70 mol%, 30-60 mol%, or 40-50 mol% of the total lipids present in the lipid nanoparticle. In some embodiments, the ionizable lipid is from about 50 mol. % to about 90 mol. % of the total amount of lipids present in the lipid nanoparticle.
[00396] Согласно некоторым аспектам липидная наночастица может дополнительно содержать некатионный липид. Неионогенные липиды включают амфипатические липиды, нейтральные липиды и анионные липиды. Соответственно, некатионный липид может представлять собой нейтральный незаряженный, цвиттерионный или анионный липид. Некатионные липиды, как правило, применяют для усиления фузогенности.[00396] In some aspects, the lipid nanoparticle may further comprise a non-cationic lipid. Nonionic lipids include amphipathic lipids, neutral lipids and anionic lipids. Accordingly, the non-cationic lipid may be a neutral, uncharged, zwitterionic or anionic lipid. Non-cationic lipids are usually used to enhance fusogenicity.
[00397] Примерные некатионные липиды, предусмотренные для применения в способах и композициях, раскрытых в данном документе, описаны в международной заявке PCT7US 2018/050042, поданной 7 сентября 2018 г., и PCT/US 2018/064242, поданной 6 декабря 2018 г., которые полностью включены в данный документ. Примерные некатионные липиды описаны в публикации международной заявки WO 2017/099823 и публикации патента США US 2018/0028664, содержание которых полностью включено в данный документ посредством ссылки.[00397] Exemplary non-cationic lipids contemplated for use in the methods and compositions disclosed herein are described in international application PCT7US 2018/050042, filed September 7, 2018, and PCT/US 2018/064242, filed December 6, 2018. , which are included in this document in their entirety. Exemplary non-cationic lipids are described in International Application Publication WO 2017/099823 and US Patent Publication US 2018/0028664, the contents of which are incorporated herein by reference in their entirety.
[00398] Некатионный липид может составлять 0-30% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Например, содержание некатионного липида составляет 5-20% (мол.) или 10-15% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно различным вариантам реализации молярное соотношение ионизируемого липида и нейтрального липида колеблется от примерно 2:1 до примерно 8:1.[00398] The non-cationic lipid may comprise 0-30 mol% of the total lipids present in the lipid nanoparticle. For example, the content of non-cationic lipid is 5-20% (mol.) or 10-15% (mol.) of the total amount of lipids present in the lipid nanoparticle. In various embodiments, the molar ratio of ionizable lipid to neutral lipid ranges from about 2:1 to about 8:1.
[00399] Согласно некоторым вариантам реализации липидные наночастицы не содержат каких-либо фосфолипидов. Согласно некоторым аспектам липидная наночастица может дополнительно содержать компонент, такой как стерин, для обеспечения целостности мембраны.[00399] In some embodiments, the lipid nanoparticles do not contain any phospholipids. In some aspects, the lipid nanoparticle may further comprise a component, such as a sterol, to provide membrane integrity.
[00400] Один примерный стерин, который подходит для применения в липидной наночастице, представляет собой холестерин и его производные. Примерные производные холестерина описаны в международной заявке WO 2009/127060 и публикации патента США US 2010/0130588, содержание которых полностью включено в данный документ посредством ссылки.[00400] One exemplary sterol that is suitable for use in a lipid nanoparticle is cholesterol and its derivatives. Exemplary cholesterol derivatives are described in international application WO 2009/127060 and US patent publication US 2010/0130588, the contents of which are incorporated herein by reference in their entirety.
[00401] Компонент, обеспечивающий целостность мембраны, такой как стерин, может составлять 0-50% (мол.) от общего количества липидов, присутствующих в липидной наночастице. Согласно некоторым вариантам реализации такой компонент составляет 20-50% (мол.) 30-40% (мол.) от общего содержания липидов липидной наночастицы.[00401] The membrane integrity component, such as sterol, may comprise 0-50 mol% of the total lipids present in the lipid nanoparticle. In some embodiments, such a component constitutes 20-50 mol% and 30-40 mol% of the total lipid content of the lipid nanoparticle.
[00402] 1200[00402] 1200
содержать полиэтиленгликоль (ПЭГ) или молекулу конъюгированного липида. Обычно их используют для ингибирования агрегации липидных наночастиц и/или для обеспечения стерической стабилизации. Примерные конъюгированные липиды включают, но не ограничиваются перечисленными, конъюгаты ПЭГ-липид, конъюгаты полиоксазолин (Р07)-липид, конъюгаты полиамид-липид (такие как конъюгаты АТТА-липид), конъюгаты катионная группа-полимер-липид (CPL); и их смеси. Согласно некоторым вариантам реализации молекула конъюгированного липида представляет собой конъюгат ПЭГ-липид, например, метоксиполиэтиленгликоль-конъюгированный липид. Примерные конъюгаты ПЭГ-липид включают, но не ограничиваются перечисленными, ПЭГ-диацилглицерин (ДАТ) (такой как 1-(монометоксиполиэтиленгликоль)-2,3-димиристоилглицерин (ПЭГ-ДМГ)), ПЭГ-диалкилоксипропил (ДАА), ПЭГ-фосфолипид, ПЭГ-церамид (Cer), пегилированный фосфатидилэтаноламин (ПЭГ-ФЭ), ПЭГ-сукцинатдиацилглицерин (PEGS-DAG) (такой как 4-O-(2',3'-ди(тетрадеканоилокси)пропил-1-O)-(w-метокси(полиэтокси)этил)бутандиоат (PEG-S-DMG)), ПЭГ-диалкоксипропилкарбам, натриевая соль N-(карбонилметоксиполиэтиленгликоль 2000)-1,2-дистеароил-sn-глицеро-3-фосфоэтаноламина или их смесь. Дополнительные примерные конъюгаты ПЭГ-липид описаны, например, в US5885613, US6287591, US 2003/0077829, US 2003/0077829, US 2005/0175682, US 2008/0020058, US 2011/0117125, US 2010/0130588, US 2016/0376224 и US 2017/0119904, содержание которых полностью включено в данный документ посредством ссылки.contain polyethylene glycol (PEG) or a conjugated lipid molecule. They are typically used to inhibit the aggregation of lipid nanoparticles and/or to provide steric stabilization. Exemplary conjugated lipids include, but are not limited to, PEG-lipid conjugates, polyoxazoline (PO7)-lipid conjugates, polyamide-lipid conjugates (such as ATTA-lipid conjugates), cationic polymer-lipid (CPL) conjugates; and mixtures thereof. In some embodiments, the conjugated lipid molecule is a PEG-lipid conjugate, such as a methoxy polyethylene glycol conjugated lipid. Exemplary PEG-lipid conjugates include, but are not limited to, PEG-diacylglycerol (DAT) (such as 1-(monomethoxypolyethylene glycol)-2,3-dimyristoylglycerol (PEG-DMG)), PEG-dialkyloxypropyl (DAA), PEG-phospholipid, PEG-ceramide (Cer), PEGylated phosphatidylethanolamine (PEG-PE), PEG-succinate diacylglycerol (PEGS-DAG) (such as 4-O-(2',3'-di(tetradecanoyloxy)propyl-1-O)-(w -methoxy(polyethoxy)ethyl)butanedioate (PEG-S-DMG)), PEG-dialkoxypropylcarbam, sodium salt of N-(carbonylmethoxypolyethylene glycol 2000)-1,2-distearoyl-sn-glycero-3-phosphoethanolamine or a mixture thereof. Additional exemplary PEG-lipid conjugates are described, for example, in US5885613, US6287591, US2003/0077829, US2003/0077829, US2005/0175682, US2008/0020058, US2011/0117125, US2010/01305 88, US 2016/0376224 and US 2017/0119904, the contents of which are incorporated herein by reference in their entirety.
[00403] Согласно некоторым вариантам реализации ПЭГ-липид представляет собой соединение, раскрытое в US 2018/0028664, содержание которого включено в данный документ посредством ссылки в полном объеме. Согласно некоторым вариантам реализации ПЭГ-липид раскрыт в US 20150376115 или в US 2016/0376224, содержание которых полностью включено в данный документ посредством ссылки.[00403] In some embodiments, the PEG lipid is a compound disclosed in US 2018/0028664, the contents of which are incorporated herein by reference in their entirety. In some embodiments, a PEG lipid is disclosed in US 20150376115 or US 2016/0376224, the contents of which are incorporated herein by reference in their entirety.
[00404] Конъюгат ПЭГ-ДАА может представлять собой, например, ПЭГ-дилаурилоксипропил, ПЭГ-димиристилоксипропил, ПЭГ-дипальмитилоксипропил или ПЭГ-дистеарилоксипропил. ПЭГ-липид может представлять собой одно или более из ПЭГ-ДМГ, ПЭГ-дилаурилглицерина, ПЭГ-дипальмитоилглицерина, ПЭГ-дистерилглицерина, ПЭГ-дилаурилгликамида, ПЭГ-димиристилгликамида, ПЭГ-дипальмитоилгликамида, ПЭГ-дистерилгликамида, ПЭГ-холестерина (1-[8'-(холест-5-ен-3β-окси)карбоксамидо-3',6'-диоксаоктанил]карбамоил-[омега]-метилполиэтиленгликоль), ПЭГ-DMB (простой эфир 3,4-дитетрадекоксилбензил-[омега]-метилполиэтиленгликоля) и 1,2-димиристоил-sn-глицеро-3-фосфоэтаноламин-К-[метоксиполиэтиленгликоля-2000]. В некоторых примерах ПЭГ-липид может быть выбран из группы, состоящей из ПЭГ-ДМГ, 1,2-димиристоил-sn-глицеро-3-фосфоэтаноламин-N-[метоксиполиэтиленгликоля-2000].[00404] The PEG-DAA conjugate may be, for example, PEG-dilauryloxypropyl, PEG-dimyristyloxypropyl, PEG-dipalmityloxypropyl, or PEG-distearyloxypropyl. The PEG lipid may be one or more of PEG-DMG, PEG-dilaurylglycerol, PEG-dipalmitoylglycerol, PEG-disterylglycerol, PEG-dilaurylglycamide, PEG-dimyristylglycamide, PEG-dipalmitoylglycamide, PEG-disterylglycamide, PEG-cholesterol (1-[8 '-(cholest-5-en-3β-oxy)carboxamido-3',6'-dioxaoctanyl]carbamoyl-[omega]-methylpolyethylene glycol), PEG-DMB (3,4-ditetradecoxybenzyl-[omega]-methylpolyethylene glycol ether) and 1,2-dimyristoyl-sn-glycero-3-phosphoethanolamine-K-[methoxypolyethylene glycol-2000]. In some examples, the PEG lipid may be selected from the group consisting of PEG-DMG, 1,2-dimyristoyl-sn-glycero-3-phosphoethanolamine-N-[methoxypolyethylene glycol-2000].
[00405] Липиды, конъюгированные с молекулой, отличной от ПЭГ, также могут быть использованы вместо ПЭГ-липида. Например, конъюгаты полиоксазолин (POZ)-липид, конъюгаты полиамид-липид (такие как конъюгаты АТТА-липид) и конъюгаты катионная группа-полимер-липид (CPL) могут применяться вместо или вместе с ПЭГ-липидом. Примерные конъюгированные липиды, т.е. ПЭГ-липиды, конъюгаты (POZ)-липид, конъюгаты АТТА-липид и катионный полимер-липиды, описаны в публикациях международных заявок на патент WO1996/010392, WO1998/051278, WO 2002/087541, WO 2005/026372, WO 2008/147438, WO 2009/086558, WO 2012/000104, WO 2017/117528, WO 2017/099823, WO 2015/199952, WO 2017/004143, WO 2015/095346, WO 2012/000104, WO 2012/000104 и WO 2010/006282, публикациях заявок на патент США US 2003/0077829, US 2005/0175682, US 2008/0020058, US 2011/0117125, US 2013/0303587, US 2018/0028664, US 2015/0376115, US 2016/0376224, US 2016/0317458, US 2013/0303587, US 2013/0303587 и US 20110123453, и патентах США US 5885613, US 6287591, US 6320017 и US 6586559, содержание которых полностью включено в данный документ посредством ссылки.[00405] Lipids conjugated to a molecule other than PEG can also be used in place of PEG lipid. For example, polyoxazoline (POZ)-lipid conjugates, polyamide-lipid conjugates (such as ATTA-lipid conjugates), and cationic polymer-lipid (CPL) conjugates can be used instead of or in conjunction with PEG lipid. Exemplary conjugated lipids, i.e. PEG-lipids, (POZ)-lipid conjugates, ATTA-lipid conjugates and cationic polymer-lipids are described in international patent application publications WO1996/010392, WO1998/051278, WO 2002/087541, WO 2005/026372, WO 2008/147438 , WO 2009/086558, WO 2012/000104, WO 2017/117528, WO 2017/099823, WO 2015/199952, WO 2017/004143, WO 2015/095346, WO 2012/000104, WO 2012/000104 and WO 2010/006282 , publications of US patent applications US 2003/0077829, US 2005/0175682, US 2008/0020058, US 2011/0117125, US 2013/0303587, US 2018/0028664, US 2015/0376115, US 2016/0376 224, US 2016/0317458 , US 2013/0303587, US 2013/0303587 and US 20110123453, and US patents US 5885613, US 6287591, US 6320017 and US 6586559, the contents of which are incorporated herein by reference in their entirety.
[00406] Согласно некоторым вариантам реализации одно или более дополнительных соединений могут представлять собой терапевтический агент. Терапевтический агент может быть выбран из любого класса, подходящего для применения в терапевтических целях. Другими словами, терапевтический агент может быть выбран из любого класса, подходящего для применения в терапевтических целях. Другими словами, терапевтический агент может быть выбран в соответствии с терапевтической целью и целевым биологическим действием. Например, если зкДНК в ЛНЧ можно применять для лечения гемофилии А, дополнительное соединение может представлять собой агент, направленный против гемофилии А (например, химиотерапевтический агент или другую терапию гемофилии А (включая, но не ограничиваясь перечисленными, малую молекулу или антитело). Согласно другому примеру, если ЛНЧ, содержащую зкДНК, можно применять для лечения инфекции, дополнительное соединение может представлять собой антимикробный агент (например, антибиотик или противовирусное соединение). Согласно еще одному примеру, если ЛНЧ, содержащую зкДНК, можно применять для лечения иммунного заболевания или нарушения, дополнительное соединение может представлять собой соединение, которое модулирует иммунный ответ (например, иммуносупрессор, иммуностимулирующее соединение или соединение, модулирующее один или более конкретных иммунных путей). Согласно некоторым вариантам реализации в композициях и способах согласно настоящему изобретению могут применяться другие смеси различных липидных наночастиц, содержащих другие соединения, такие как зкДНК, кодирующая другой белок или другое соединение, такое как терапевтическое средство.[00406] In some embodiments, one or more additional compounds may be a therapeutic agent. The therapeutic agent may be selected from any class suitable for use for therapeutic purposes. In other words, the therapeutic agent may be selected from any class suitable for use for therapeutic purposes. In other words, the therapeutic agent may be selected according to the therapeutic purpose and the target biological effect. For example, if the cccDNA in the LNP can be used to treat hemophilia A, the additional compound may be an agent directed against hemophilia A (for example, a chemotherapeutic agent or other therapy for hemophilia A (including, but not limited to, a small molecule or antibody). According to another For example, if the LNP containing cccDNA can be used to treat an infection, the additional compound may be an antimicrobial agent (for example, an antibiotic or an antiviral compound).In yet another example, if the LNP containing cccDNA can be used to treat an immune disease or disorder, the additional compound may be a compound that modulates the immune response (e.g., an immunosuppressive compound, an immunostimulatory compound, or a compound that modulates one or more specific immune pathways).In some embodiments, other mixtures of various lipid nanoparticles containing other compounds, such as cDNA, encoding another protein or another compound, such as a therapeutic agent.
[00407] Согласно некоторым вариантам реализации дополнительное соединение представляет собой иммуномодулирующий агент. Например, дополнительное соединение представляет собой иммуносупрессор. Согласно некоторым вариантам реализации дополнительное соединение представляет собой иммуностимулирующий агент. В данном документе также предложена фармацевтическая композиция, содержащая инкапсулированный в липидную наночастицу продуцируемый клеткой насекомого или синтетически продуцируемый зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, и фармацевтически приемлемый носитель или вспомогательное вещество.[00407] In some embodiments, the additional compound is an immunomodulatory agent. For example, the additional compound is an immunosuppressant. In some embodiments, the additional compound is an immunostimulating agent. Also provided herein is a pharmaceutical composition comprising a lipid nanoparticle-encapsulated insect cell-derived or synthetically produced cDNA FVIII protein expression vector disclosed herein and a pharmaceutically acceptable carrier or excipient.
[00408] Согласно некоторым аспектам настоящего раскрытия предложен состав липидных наночастиц, дополнительно содержащий одно или более фармацевтических вспомогательных веществ. Согласно некоторым вариантам реализации состав липидных наночастиц дополнительно содержит сахарозу, tris, трегалозу и/или глицин.[00408] According to some aspects of the present disclosure, a lipid nanoparticle formulation is provided, further comprising one or more pharmaceutical excipients. In some embodiments, the lipid nanoparticle formulation further comprises sucrose, tris, trehalose, and/or glycine.
[00409] ЗкДНК-вектор может образовывать комплексы с липидной частью (portion) частицы или может быть инкапсулирован в липидной части (position) липидной наночастицы. Согласно некоторым вариантам реализации зкДНК может быть полностью инкапсулирована в липидной части липидной наночастицы, что защищает ее от разрушения нуклеазой, например, в водном растворе. Согласно некоторым вариантам реализации зкДНК в липидной наночастице не разрушается в значительной степени после воздействия на липидную наночастицу нуклеазы при 37°С в течение по меньшей мере примерно 20, 30, 45 или 60 минут. Согласно некоторым вариантам реализации зкДНК в липидной наночастице не разрушается в значительной степени после инкубации частицы в сыворотке при 37°С в течение по меньшей мере примерно 30, 45 или 60 минут, или по меньшей мере примерно 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 или 36 часов.[00409] The cDNA vector can form complexes with the lipid portion (portion) of the particle or can be encapsulated in the lipid portion (position) of the lipid nanoparticle. In some embodiments, the cccDNA may be completely encapsulated in the lipid portion of the lipid nanoparticle, thereby protecting it from degradation by a nuclease, for example, in an aqueous solution. In some embodiments, the cccDNA in the lipid nanoparticle is not significantly degraded after exposing the lipid nanoparticle to a nuclease at 37° C. for at least about 20, 30, 45, or 60 minutes. In some embodiments, the cccDNA in a lipid nanoparticle is not significantly degraded after the particle is incubated in serum at 37°C for at least about 30, 45, or 60 minutes, or at least about 2, 3, 4, 5, 6. 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 or 36 hours.
[00410] Согласно определенным вариантам реализации липидные наночастицы по существу нетоксичны для субъекта, например, млекопитающего, такого как человек. Согласно некоторым аспектам состав липидных наночастиц представляет собой лиофилизированный порошок.[00410] In certain embodiments, the lipid nanoparticles are substantially non-toxic to a subject, such as a mammal such as a human. In some aspects, the lipid nanoparticle formulation is a lyophilized powder.
[00411] Согласно некоторым вариантам реализации липидные наночастицы представляют собой частицы с твердой сердцевиной, которые имеют по меньшей мере один липидный бислой. Согласно другим вариантам реализации липидные наночастицы имеют небислойную структуру, т.е. имеют неламеллярную (т.е. небислойную) морфологию. Без ограничений, небислойная морфология может включать, например, трехмерные трубки, стержни, частицы кубической симметрии и т.д. Например, морфологию липидных наночастиц (ламеллярных в сравнении с неламеллярными) можно легко оценить и охарактеризовать с использованием, например, анализа методом «крио-ТЭМ» (криотрансмиссионная электронная микроскопия), как описано в US 2010/0130588, содержание которого полностью включено в данный документ посредством ссылки.[00411] In some embodiments, lipid nanoparticles are solid core particles that have at least one lipid bilayer. In other embodiments, the lipid nanoparticles have a non-bilayer structure, i.e. have a non-lamellar (i.e. non-bilayer) morphology. Without limitation, non-bilayer morphologies may include, for example, three-dimensional tubes, rods, cubic particles, etc. For example, the morphology of lipid nanoparticles (lamellar versus non-lamellar) can be easily assessed and characterized using, for example, cryo-TEM (cryotransmission electron microscopy) analysis as described in US 2010/0130588, the contents of which are incorporated herein in their entirety via link.
[00412] Согласно некоторым другим вариантам реализации липидные наночастицы, имеющие неламеллярную морфологию, являются электронно-плотными. Согласно некоторым аспектам настоящего раскрытия предложена липидная наночастица, которая является либо однослойной, либо многослойной по структуре. Согласно некоторым аспектам настоящего раскрытия предложен состав липидных наночастиц, который содержит мультивезикулярные частицы и/или частицы на основе пены.[00412] In some other embodiments, lipid nanoparticles having a non-lamellar morphology are electron dense. In accordance with certain aspects of the present disclosure, a lipid nanoparticle is provided that is either single-layered or multilayered in structure. According to some aspects of the present disclosure, a lipid nanoparticle composition is provided that contains multivesicular particles and/or foam-based particles.
[00413] Контролируя композицию и содержание липидных компонентов, можно контролировать скорость, с которой липидный конъюгат высвобождается из липидной частицы, и, в свою очередь, скорость, с которой липидная наночастица становится фузогенной. Кроме того, другие переменные, включая, например, рН, температуру или ионную силу, могут применяться для изменения и/или контроля скорости, с которой липидная наночастица становится фузогенной. Другие способы, которые могут применяться для контроля скорости, с которой указанная липидная наночастица становится фузогенной, будут понятны обычным специалистам в данной области техники после ознакомления с указанным описанием. Также будет понятно, что размер липидных частиц можно контролировать путем контроля композиции и концентрации липидного конъюгата.[00413] By controlling the composition and content of lipid components, it is possible to control the rate at which the lipid conjugate is released from the lipid particle and, in turn, the rate at which the lipid nanoparticle becomes fusogenic. In addition, other variables, including, for example, pH, temperature, or ionic strength, can be used to alter and/or control the rate at which the lipid nanoparticle becomes fusogenic. Other methods that can be used to control the rate at which a specified lipid nanoparticle becomes fusogenic will be apparent to those of ordinary skill in the art upon review of the disclosure. It will also be understood that the size of the lipid particles can be controlled by controlling the composition and concentration of the lipid conjugate.
[00414] pKa катионных липидов в составах может быть сопоставлена с эффективностью ЛНЧ для доставки нуклеиновых кислот (см. Jayaraman et al., Angewandte Chemie, International Edition (2012), 51(34), 8529-8533; Semple et al, Nature Biotechnology 28, 172-176 (2010), обе работы полностью включены в данный документ посредством ссылки). Предпочтительный диапазон pKa составляет от ~5 до ~7. pKa катионного липида в липидных наночастицах может быть определена с использованием анализа, основанного на флуоресценции 2-(п-толуидино)-6-нафталинсульфоновой кислоты (TNS). VIII. Способы применения[00414] The pKa of cationic lipids in formulations can be compared with the efficiency of LNPs for delivering nucleic acids (see Jayaraman et al., Angewandte Chemie, International Edition (2012), 51(34), 8529-8533; Semple et al., Nature Biotechnology 28, 172-176 (2010), both works are incorporated herein by reference in their entirety). The preferred pKa range is from ~5 to ~7. The pKa of a cationic lipid in lipid nanoparticles can be determined using an assay based on 2-(p-toluidino)-6-naphthalenesulfonic acid (TNS) fluorescence. VIII. Methods of application
[00415] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, также можно применять в способе доставки представляющей интерес нуклеотидной последовательности (например, кодирующей белок FVIII) в клетку-мишень (например, клетку-хозяина). Способ может представлять собой, в частности, способ доставки белка FVIII к клетке субъекта, нуждающегося в этом, и лечения гемофилии А. Настоящее изобретение обеспечивает экспрессию in vivo белка FVIII, закодированного в зкДНК-векторе, в клетке у субъекта так, чтобы возник терапевтический эффект экспрессии белка FVIII. Указанные результаты наблюдаются как в in vivo, так и в in vitro режимах доставки зкДНК-вектора.[00415] The cDNA FVIII protein expression vector disclosed herein can also be used in a method of delivering a nucleotide sequence of interest (eg, encoding an FVIII protein) to a target cell (eg, a host cell). The method may be, in particular, a method of delivering FVIII protein to a cell of a subject in need thereof and treating hemophilia A. The present invention provides for in vivo expression of FVIII protein encoded in a cccDNA vector in a cell of a subject so that a therapeutic effect occurs FVIII protein expression. These results are observed both in vivo and in vitro delivery modes of the cDNA vector.
[00416] Кроме того, согласно настоящему изобретению предложен способ доставки белка FVIII в клетку субъекта, нуждающегося в этом, включающий многократные введения зкДНК-вектора согласно настоящему изобретению, кодирующего указанный белок FVIII. Поскольку зкДНК-вектор согласно настоящему изобретению не индуцирует иммунный ответ, подобный тому, который обычно наблюдается против инкапсидированных вирусных векторов, такая стратегия многократного введения, вероятно, будет иметь больший успех в системе на основе зкДНК. ЗкДНК-вектор вводят в количествах, достаточных для трансфекции клеток целевой ткани и обеспечения достаточных уровней переноса генов и экспрессии белка FVIII без неоправданных нежелательных эффектов. Обычные и фармацевтически приемлемые пути введения включают, но не ограничиваются перечисленными, введение в сетчатку (например, субретинальную инъекцию, супрахориоидальную инъекцию или интравитреальную инъекцию), внутривенное введение (например, в липосомальном составе), прямую доставку в выбранный орган (например, в любую одну или более тканей, выбранных из: печени, почек, желчного пузыря, простаты, надпочечников, сердца, кишечника, легкого и желудка), внутримышечный и другие парентеральные пути введения. Пути введения могут быть скомбинированы, если требуется.[00416] In addition, the present invention provides a method of delivering FVIII protein to a cell of a subject in need thereof, comprising repeated administrations of a cccDNA vector of the present invention encoding said FVIII protein. Since the cccDNA vector of the present invention does not induce an immune response similar to that typically observed against encapsidated viral vectors, such a multiple administration strategy is likely to be more successful in a cccDNA-based system. The cccDNA vector is administered in quantities sufficient to transfect cells of the target tissue and provide sufficient levels of gene transfer and FVIII protein expression without undue unwanted effects. Common and pharmaceutically acceptable routes of administration include, but are not limited to, intraretinal injection (eg, subretinal injection, suprachoroidal injection, or intravitreal injection), intravenous administration (eg, in a liposomal formulation), direct delivery to an organ of choice (eg, any one or more tissues selected from: liver, kidney, gallbladder, prostate, adrenal gland, heart, intestine, lung and stomach), intramuscular and other parenteral routes of administration. Routes of administration can be combined if required.
[00417] Доставка зкДНК-вектора для экспрессии белка FVIII, описанного в данном документе, не ограничивается доставкой экспрессируемого белка FVIII. Например, зкДНК-векторы, полученные с помощью обычного способа (например, с использованием способа продуцирования на основе клеток (например, способов продуцирования в клетках насекомых)) или синтетического способа, как описано в данном документе, можно применять вместе с другими предложенными системами доставки, чтобы обеспечить часть генной терапии. Один неограничивающий пример системы, которую можно комбинировать с зкДНК-векторами в соответствии с настоящим раскрытием, включает системы, которые доставляют по отдельности один или более кофакторов или иммунных супрессоров для эффективной генной экспрессии зкДНК-вектора, экспрессирующего белок FVIII.[00417] Delivery of the cccDNA vector for FVIII protein expression described herein is not limited to delivery of the FVIII protein to be expressed. For example, cccDNA vectors produced by a conventional method (e.g., using a cell-based production method (e.g., insect cell production methods)) or a synthetic method, as described herein, can be used in conjunction with other proposed delivery systems, to provide part of the gene therapy. One non-limiting example of a system that can be combined with cccDNA vectors in accordance with the present disclosure includes systems that separately deliver one or more cofactors or immune suppressors for efficient gene expression of a cccDNA vector expressing FVIII protein.
[00418] Согласно настоящему изобретению также предложен способ лечения гемофилии А у субъекта, включающий введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Выбранный зкДНК-вектор содержит нуклеотидную последовательность, кодирующую белок FVIII, который можно применять для лечения гемофилии А. В частности, зкДНК-вектор может содержать целевую последовательность белка FVIII, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого белка FVIII, кодируемого экзогенной последовательностью ДНК, при введении субъекту. ЗкДНК-вектор может быть введен любым подходящим путем, предложенным выше и в других разделах данного документа.[00418] The present invention also provides a method of treating hemophilia A in a subject, comprising administering to a target cell in need thereof (particularly a muscle cell or tissue) of said subject a therapeutically effective amount of a cccDNA vector, optionally with a pharmaceutically acceptable carrier. Although the cDNA vector can be introduced in the presence of a carrier, such a carrier is not necessary. The selected cccDNA vector contains a nucleotide sequence encoding an FVIII protein that can be used to treat hemophilia A. In particular, the cccDNA vector may contain a target FVIII protein sequence operably linked to control elements capable of directing the transcription of the target FVIII protein encoded by the exogenous DNA sequence , when administered to a subject. The cccDNA vector can be introduced by any suitable route suggested above and elsewhere in this document.
[00419] Композиции и векторы, предложенные в данном документе, можно применять для доставки белка FVIII с различными целями. Согласно некоторым вариантам реализации трансген кодирует белок FVIII, который предназначен для применения в исследовательских целях, например, для создания соматической трансгенной модели на животных, несущей трансген, например, для исследования функции продукта белка FVIII. В другом примере трансген кодирует белок FVIII, который предназначен для применения с целью создания модели гемофилии А на животных. Согласно некоторым вариантам реализации кодируемый белок FVIII можно применять для лечения или предотвращения состояний гемофилии А у млекопитающего-субъекта. Белок FVIII может быть перенесен в организм пациента (например, экспрессирован у пациента) в количестве, достаточном для лечения гемофилии А, ассоциированной с пониженной экспрессией, отсутствием экспрессии или дисфункцией указанного гена.[00419] The compositions and vectors provided herein can be used to deliver FVIII protein for a variety of purposes. In some embodiments, the transgene encodes an FVIII protein that is intended to be used for research purposes, for example, to create a somatic transgenic animal model carrying the transgene, for example, to study the function of the FVIII protein product. In another example, the transgene encodes the FVIII protein, which is intended for use in creating an animal model of hemophilia A. In some embodiments, the encoded FVIII protein can be used to treat or prevent hemophilia A conditions in a mammalian subject. The FVIII protein may be transferred into a patient (eg, expressed in the patient) in an amount sufficient to treat hemophilia A associated with decreased expression, absence of expression, or dysfunction of the gene.
[00420] В принципе, экспрессионная кассета может включать нуклеиновую кислоту или любой трансген, который кодирует белок FVIII, который либо снижен, либо отсутствует из-за мутации, либо который обеспечивает терапевтическую пользу при сверхэкспрессии, и рассматривается, как включенная в объем настоящего изобретения. Предпочтительно не вставленная бактериальная ДНК не присутствует и предпочтительно бактериальная ДНК не присутствует в композициях зкДНК, предложенных в данном документе.[00420] In principle, an expression cassette may include a nucleic acid or any transgene that encodes an FVIII protein that is either reduced or absent due to mutation, or that provides a therapeutic benefit when overexpressed, and is considered to be included within the scope of the present invention. Preferably, uninserted bacterial DNA is not present, and preferably, bacterial DNA is not present in the cccDNA compositions provided herein.
[00421] ЗкДНК-вектор не ограничивается одной молекулой зкДНК-вектора. Таким образом, в другом аспекте несколько зкДНК-векторов, экспрессирующих разные белки или один и тот же белок FVIII, но функционально связанный с различными промоторами или цис-регуляторными элементами, могут быть доставлены одновременно или последовательно в целевую клетку, ткань, орган или в организм субъекта. Таким образом, эта стратегия может обеспечить одновременную генную терапию несколькими белками или доставку их генов. Также можно разместить разные части белка FVIII в отдельных зкДНК-векторах (например, разные домены и/или кофакторы, необходимые для функциональности белка FVIII), например, которые могут быть введены одновременно или в разные моменты времени, и которые можно регулировать по отдельности, добавляя посредством этого дополнительный уровень контроля экспрессии белка FVIII. Доставку также можно выполнять несколько раз и, что важно для генной терапии в клинических условиях, с последующим увеличением или снижением доз, учитывая отсутствие иммунного ответа хозяина против капсида вследствие отсутствия вирусного капсида. Ожидается, что ответ против капсида не возникнет из-за отсутствия капсида.[00421] The cccDNA vector is not limited to one ccDNA vector molecule. Thus, in another aspect, multiple cccDNA vectors expressing different proteins or the same FVIII protein but operably linked to different promoters or cis-regulatory elements can be delivered simultaneously or sequentially to a target cell, tissue, organ or organism subject. Thus, this strategy could enable simultaneous gene therapy or gene delivery of multiple proteins. It is also possible to place different parts of the FVIII protein in separate cccDNA vectors (e.g., different domains and/or cofactors required for the functionality of the FVIII protein), for example, which can be introduced simultaneously or at different times, and which can be adjusted separately by adding thereby providing an additional level of control over FVIII protein expression. Delivery can also be performed multiple times and, importantly for gene therapy in a clinical setting, followed by increasing or decreasing doses based on the lack of host immune response against the capsid due to the absence of the viral capsid. An anti-capsid response is not expected to occur due to the absence of a capsid.
[00422] Согласно настоящему изобретению также предложен способ лечения у субъекта гемофилии А, включающий введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, раскрытого в данном документе, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Реализованный зкДНК-вектор содержит нуклеотидную последовательность, представляющую интерес, которую можно применять для лечения гемофилии А. В частности, зкДНК-вектор может содержать целевую экзогенную последовательность ДНК, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого полипептида, белка или олигонуклеотида, кодируемого указанной экзогенной последовательностью ДНК, при введении субъекту. ЗкДНК-вектор может быть введен любым подходящим путем, предложенным выше и в других разделах данного документа.[00422] The present invention also provides a method of treating a subject with hemophilia A, comprising administering to a target cell in need thereof (particularly a muscle cell or tissue) of said subject a therapeutically effective amount of a cccDNA vector disclosed herein, optionally with a pharmaceutical acceptable medium. Although the cDNA vector can be introduced in the presence of a carrier, such a carrier is not necessary. The implemented cDNA vector contains a nucleotide sequence of interest that can be used for the treatment of hemophilia A. In particular, the cDNA vector may contain a target exogenous DNA sequence operably linked to control elements capable of directing the transcription of the target polypeptide, protein or oligonucleotide encoded by the specified exogenous DNA sequence when administered to a subject. The cccDNA vector can be introduced by any suitable route suggested above and elsewhere in this document.
Способы доставки зкДНК-векторов для продукции белка FVIIIMethods for delivering cccDNA vectors for FVIII protein production
[00423] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII может быть доставлен в клетку-мишень in vitro или in vivo различными подходящими способами. ЗкДНК-векторы могут быть применены или инъецированы по отдельности. ДНК-векторы могут быть доставлены в клетку без помощи реагента для трансфекции или других физических средств. В качестве альтернативы, зкДНК-векторы для экспрессии белка FVIII могут быть доставлены с использованием любого известного в данной области техники реагента для трансфекции или других известных в данной области техники физических средств, которые облегчают проникновение ДНК в клетку, например, липосом, спиртов, соединений, богатых полилизином, соединений, богатых аргинином, фосфата кальция, микровезикул, микроинъекции, электропорации и т.п.[00423] In some embodiments, the cDNA vector for expression of the FVIII protein can be delivered to the target cell in vitro or in vivo by various suitable methods. CctDNA vectors can be used or injected individually. DNA vectors can be delivered into a cell without the aid of a transfection reagent or other physical means. Alternatively, cDNA FVIII protein expression vectors can be delivered using any transfection reagent known in the art or other physical means known in the art that facilitate entry of DNA into the cell, such as liposomes, alcohols, compounds, polylysine-rich compounds, arginine-rich compounds, calcium phosphate, microvesicles, microinjection, electroporation, etc.
[00424] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, могут быть эффективно нацелены на типы клеток и тканей, которые обычно трудно трансдуцировать обычными вирионами ААВ с использованием различных реагентов для доставки.[00424] The cDNA FVIII protein expression vectors disclosed herein can be effectively targeted to cell and tissue types that are typically difficult to transduce with conventional AAV virions using various delivery reagents.
[00425] Один аспект технологии, описанной в данном документе, относится к способу доставки белка FVIII в клетку. Как правило, для способов in vivo и in vitro зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введен в клетку с использованием способов, раскрытых в данном документе, а также других способов, известных в данной области техники. ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, предпочтительно вводят в клетку в биологически эффективном количестве. Если зкДНК-вектор вводят в клетку in vivo (например, субъекту), биологически эффективное количество зкДНК-вектора представляет собой количество, достаточное для трансдукции и экспрессии белка FVIII в клетке-мишени.[00425] One aspect of the technology described herein relates to a method for delivering FVIII protein into a cell. In general, for in vivo and in vitro methods, the cDNA FVIII protein expression vector disclosed herein can be introduced into a cell using the methods disclosed herein as well as other methods known in the art. The cDNA FVIII protein expression vector disclosed herein is preferably introduced into the cell in a biologically effective amount. If a cccDNA vector is introduced into a cell in vivo (eg, a subject), a biologically effective amount of cccDNA vector is an amount sufficient to transduce and express FVIII protein in the target cell.
[00426] Примерные способы введения зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, включают пероральный, ректальный, трансмукозальный, интраназальный, ингаляционный (например, с помощью аэрозоля), буккальный (например, сублингвальный), вагинальный, интратекальный, внутриглазной, трансдермальный, внутриэндотелиальный, in utero (или in ovo), парентеральный (например, внутривенный, подкожный, внутрикожный, внутричерепной, внутримышечный [включая введение в скелетную, диафрагмальную и/или сердечную мышцу], внутриплевральный, внутримозговой и внутрисуставной). Введение может представлять собой системную или прямую доставку в печень или куда-либо еще (например, в любые почки, желчный пузырь, простату, надпочечники, сердце, кишечник, легкое и желудок).[00426] Exemplary methods of administering the cccDNA vector for expression of the FVIII protein disclosed herein include oral, rectal, transmucosal, intranasal, inhalation (e.g., aerosol), buccal (e.g., sublingual), vaginal, intrathecal, intraocular, transdermal, intraendothelial, in utero (or in ovo), parenteral (eg, intravenous, subcutaneous, intradermal, intracranial, intramuscular [including injection into skeletal, diaphragmatic and/or cardiac muscle], intrapleural, intracerebral, and intraarticular). Administration may be systemic or direct delivery to the liver or elsewhere (eg, any kidney, gall bladder, prostate, adrenal gland, heart, intestine, lung, and stomach).
[00427] Введение может быть местным (например, на поверхность кожи и слизистых оболочек, включая поверхности дыхательных путей и трансдермальное введение), внутрилимфатическим и т.п., а также путем прямой инъекции в ткань или орган (например, но не ограничиваясь этим, в печень, а также в глаз, мышцы, включая скелетную мышцу, сердечную мышцу, диафрагмальную мышцу, или головной мозг).[00427] Administration may be local (for example, to the surface of the skin and mucous membranes, including surfaces of the respiratory tract and transdermal administration), intralymphatic, etc., or by direct injection into a tissue or organ (for example, but not limited to, into the liver, as well as into the eye, muscles including skeletal muscle, cardiac muscle, diaphragmatic muscle, or brain).
[00428] ЗкДНК-вектор может быть введен в любое место у субъекта, включая, без ограничения, место, выбранное из группы, состоящей из печени и/или также глаз, головного мозга, скелетной мышцы, гладкой мышцы, сердца, диафрагмы, эпителия дыхательных путей, почки, селезенки, поджелудочной железы, кожи.[00428] The cccDNA vector can be introduced into any site in a subject, including, without limitation, a site selected from the group consisting of liver and/or also eyes, brain, skeletal muscle, smooth muscle, heart, diaphragm, respiratory epithelium tract, kidney, spleen, pancreas, skin.
[00429] Наиболее подходящий путь в любом конкретном случае будет зависеть от характера и тяжести состояния, подлежащего лечению, облегчению и/или предотвращению, а также от характера конкретного используемого зкДНК-вектора. Кроме того, зкДНК позволяет вводить более одного белка FVIII в одном векторе или в нескольких зкДНК-векторах (например, смесь зкДНК).[00429] The most appropriate route in any given case will depend on the nature and severity of the condition being treated, ameliorated and/or prevented, as well as the nature of the particular cccDNA vector used. In addition, cccDNA allows the introduction of more than one FVIII protein in one vector or in multiple cccDNA vectors (eg, a mixture of cccDNA).
А. Внутримышечное введение зкДНК-вектораA. Intramuscular injection of cDNA vector
[00430] Согласно некоторым вариантам реализации способ лечения заболевания у субъекта включает введение в нуждающуюся в этом целевую клетку (в частности, в мышечную клетку или ткань) указанного субъекта терапевтически эффективного количества зкДНК-вектора, кодирующего белок FVIII, необязательно с фармацевтически приемлемым носителем. Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII вводят в мышечную ткань субъекта.[00430] In some embodiments, a method of treating a disease in a subject comprises administering to a target cell in need thereof (such as a muscle cell or tissue) of the subject a therapeutically effective amount of a cccDNA vector encoding an FVIII protein, optionally with a pharmaceutically acceptable carrier. In some embodiments, the cDNA vector for expressing the FVIII protein is introduced into muscle tissue of a subject.
[00431] Согласно некоторым вариантам реализации зкДНК-вектор может быть введен в любое место у субъекта, включая, без ограничения, место, выбранное из группы, состоящей из скелетной мышцы, гладкой мышцы, сердца, диафрагмы или мышц глаза.[00431] In some embodiments, the cccDNA vector can be administered to any site in a subject, including, without limitation, a site selected from the group consisting of skeletal muscle, smooth muscle, heart, diaphragm, or ocular muscle.
[00432] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в скелетную мышцу в соответствии с настоящим изобретением включает, но не ограничивается этим, введение в скелетную мышцу в конечностях (например, верхнюю часть плеча, нижнюю часть плеча, верхнюю части ноги и/или нижнюю часть ноги), спине, шее, голове (например, язык), грудной клетке, животе, тазу/промежности и/или пальцах. ЗкДНК-вектор, раскрытый в данном документе, может быть доставлен в скелетную мышцу путем внутривенного введения, внутриартериального введения, внутрибрюшинного введения, перфузии конечности (необязательно изолированной перфузии конечности для ноги и/или руки; см., например, Arruda et al., (2005) Blood 105: 3458-3464), и/или путем прямой внутримышечной инъекции. Согласно конкретным вариантам реализации зкДНК-вектор, раскрытый в данном документе, вводят в печень, глаз, конечность (руку и/или ногу) субъекта (например, субъекта с мышечной дистрофией, такой как МДД) путем перфузии конечности, необязательно изолированной перфузии конечности (например, путем внутривенного или внутрисуставного введения). В вариантах реализации зкДНК-вектор, раскрытый в данном документе, можно вводить без применения «гидродинамических» методик.[00432] Administration of the cccDNA vector for expression of the FVIII protein disclosed herein into skeletal muscle in accordance with the present invention includes, but is not limited to, administration into skeletal muscle in the extremities (e.g., upper arm, lower arm, upper parts of the leg and/or lower leg), back, neck, head (eg tongue), chest, abdomen, pelvis/perineum and/or fingers. The cctDNA vector disclosed herein can be delivered to skeletal muscle by intravenous administration, intra-arterial administration, intraperitoneal administration, limb perfusion (optionally isolated limb perfusion for the leg and/or arm; see, for example, Arruda et al., ( 2005) Blood 105: 3458-3464), and/or by direct intramuscular injection. In specific embodiments, the cccDNA vector disclosed herein is administered to the liver, eye, limb (arm and/or leg) of a subject (e.g., a subject with a muscular dystrophy such as DMD) by perfusion of the limb, optionally isolated perfusion of the limb (e.g. , by intravenous or intra-articular administration). In embodiments, the cDNA vector disclosed herein can be administered without the use of “hydrodynamic” techniques.
[00433] Например, доставка в ткань (например, сетчатку) обычных вирусных векторов часто усиливается гидродинамическими методиками (например, внутривенным/внутривенным введением в большом объеме), которые увеличивают давление в сосудистой сети и облегчают способность вирусного вектора пересекать барьер из эндотелиальных клеток. Согласно конкретным вариантам реализации зкДНК-векторы, описанные в данном документе, можно вводить без гидродинамических методик, таких как инфузии большого объема и/или повышенное внутрисосудистое давление (например, выше нормального систолического давления, например, повышение внутрисосудистого давления на величину менее или равную 5%, 10%, 15%, 20%, 25% от нормального систолического давления). Такие методы могут уменьшить или позволяют избежать побочных эффектов, ассоциированных с гидродинамическими методиками, таких как отек, повреждение нервов и/или синдром сдавливания.[00433] For example, tissue (eg, retinal) delivery of conventional viral vectors is often enhanced by hydrodynamic techniques (eg, high-volume intravenous/intravenous administration) that increase vasculature pressure and facilitate the ability of the viral vector to cross the endothelial cell barrier. In specific embodiments, the cccDNA vectors described herein can be administered without hydrodynamic techniques such as large volume infusions and/or increased intravascular pressure (e.g., greater than normal systolic pressure, e.g., an increase in intravascular pressure of less than or equal to 5% , 10%, 15%, 20%, 25% of normal systolic pressure). Such techniques may reduce or avoid side effects associated with hydrodynamic techniques, such as edema, nerve damage, and/or compartment syndrome.
[00434] Кроме того, композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, которую вводят в скелетную мышцу, может быть введена в скелетную мышцу в конечностях (например, в верхнюю часть плеча, нижнюю часть плеча, верхнюю части ноги и/или нижнюю часть ноги), спине, шее, голове (например, язык), грудной клетке, животе, тазу/промежности и/или пальцах. Подходящие скелетные мышцы включают, без ограничений, отводящую мышцу мизинца (в кисти), отводящую мышцу мизинца (в стопе), отводящую мышцу большого пальца, отводящую мышцу пятой плюсневой кости, короткую мышцу, отводящую большой палец кисти, длинную мышцу, отводящую большой палец кисти, короткую приводящую мышцу, мышцу, приводящую большой палец стопы, длинную приводящую мышцу, большую приводящую мышцу, мышцу, приводящую большой палец кисти, локтевую мышцу, переднюю лестничную мышцу, суставную мышцу колена, двуглавую мышцу плеча, двуглавую мышцу бедра, плечевую мышцу, плечелучевую мышцу, щечную мышцу, клювовидно-плечевую мышцу, мышцу, сморщивающую бровь, дельтовидную мышцу, мышцу, опускающую угол рта, мышцу, опускающую нижнюю губу, двубрюшную мышцу, тыльные межкостные мышцы (кисти), тыльные межкостные мышцы (стопы), короткий лучевой разгибатель запястья, длинный лучевой разгибатель запястья, локтевой разгибатель запястья, разгибатель мизинца, разгибатель пальцев кисти, короткий разгибатель пальцев кисти, длинный разгибатель пальцев кисти, короткий разгибатель большого пальца стопы, длинный разгибатель большого пальца стопы, разгибатель указательного пальца, короткий разгибатель большого пальца, длинный разгибатель большого пальца, лучевой сгибатель запястья, локтевой сгибатель запястья, короткий сгибатель мизинца (кисти), короткий сгибатель мизинца (стопы), короткий сгибатель пальцев стопы, длинный сгибатель пальцев стопы, глубокий сгибатель пальцев кисти, поверхностный сгибатель пальцев кисти, короткий сгибатель большого пальца стопы, длинный сгибатель большого пальца стопы, короткий сгибатель большого пальца кисти, длинный сгибатель большого пальца кисти, лобную мышцу, икроножную мышцу, подбородочно-подъязычную мышцу, большую ягодичную мышцу, среднюю ягодичную мышцу, малую ягодичную мышцу, тонкую мышцу, подвздошно-реберную мышцу шеи, подвздошно-реберную мышцу поясницы, подвздошно-реберную мышцу груди, подвздошную мышцу, нижнюю близнецовую мышцу, нижнюю косую мышцу, нижнюю прямую мышцу, подостную мышцу, межостистые мышцы, межпоперечные мышцы, латеральную крыловидную мышцу, латеральную прямую мышцу, широчайшую мышцу спины, мышцу, поднимающую угол рта, мышцу, поднимающую верхнюю губу, мышцу, поднимающую верхнюю губу и крыло носа, мышцу, поднимающую верхнее веко, мышцу, поднимающую лопатку, длинные мышцы-вращатели, длиннейшую мышцу головы, длиннейшую мышцу шеи, длиннейшую мышцу груди, длинную мышцу головы, длинную мышцу шеи, червеобразные мышцы (кисти), червеобразные мышцы (стопы), жевательную мышцу, медиальную крыловидную мышцу, медиальную прямую мышцу, среднюю лестничную мышцу, многораздельные мышцы, челюстно-подъязычную мышцу, нижнюю косую мышцу головы, верхнюю косую мышцу головы, наружную запирательную мышцу, внутреннюю запирательную мышцу, затылочную мышцу, лопаточно-подъязычную мышцу, мышцу, противопоставляющую мизинец, мышцу, противопоставляющую большой палец кисти, круговую мышцу глаза, круговую мышцу рта, ладонную межкостную мышцу, короткую ладонную мышцу, длинную ладонную мышцу, гребенчатую мышцу, большую грудную мышцу, малую грудную мышцу, короткую малоберцовую мышцу, длинную малоберцовую мышцу, третью малоберцовую мышцу, грушевидную мышцу, подошвенные межкостные мышцы, подошвенную мышцу, подкожную мышцу шеи, подколенную мышцу, заднюю лестничную мышцу, квадратный пронатор, круглый пронатор, большую поясничную мышцу, квадратную мышцу бедра, квадратную мышцу подошвы, переднюю прямую мышцу головы, латеральную прямую мышцу головы, большую заднюю прямую мышцу головы, малую заднюю прямую мышцу головы, прямую мышцу бедра, большую ромбовидную мышцу, малую ромбовидную мышцу, мышцы смеха, портняжную мышцу, наименьшую лестничную мышцу, полуперепончатую мышцу, полуостистую мышцу головы, полуостистую мышцу шеи, полуостистую мышцу груди, полусухожильную мышцу, переднюю зубчатую мышцу, короткие мышцы-вращатели, камбаловидную мышцу, остистую мышцу головы, остистую мышцу шеи, остистую мышцу груди, ременную мышцу головы, ременную мышцу шеи, грудино-ключично-сосцевидную мышцу, грудино-подъязычную мышцу, грудино-щитовидную мышцу, шило-подъязычную мышцу, подключичную мышцу, подлопаточную мышцу, верхнюю близнецовую мышцу, верхнюю косую мышцу, верхнюю прямую мышцу, супинатор, надостную мышцу, височную мышцу, мышцу, напрягающую широкую фасцию, большую круглую мышцу, малую круглую мышцу, мышцы груди, щито-подъязычную мышцу, переднюю болыпеберцовую мышцу, заднюю болынеберцовую мышцу, трапециевидную мышцу, трехглавую мышцу плеча, промежуточную широкую мышцу бедра, латеральную широкую мышцу бедра, медиальную широкую мышцу бедра, большую скуловую мышцу и малую скуловую мышцу, и любые другие подходящие скелетные мышцы, известные в данной области.[00434] In addition, a composition containing the cDNA FVIII protein expression vector disclosed herein that is administered to skeletal muscle may be administered to skeletal muscle in the extremities (e.g., upper arm, lower arm, upper arm). legs and/or lower leg), back, neck, head (e.g. tongue), chest, abdomen, pelvis/perineum and/or fingers. Suitable skeletal muscles include, but are not limited to, abductor digiti minimi (hand), abductor pollicis (foot), abductor pollicis, abductor pollicis 5, abductor pollicis brevis, abductor pollicis longus , adductor brevis, adductor hallucis, adductor longus, adductor magnus, adductor pollicis, anconeus, anterior scalene, articular knee, biceps brachii, biceps femoris, brachialis, brachioradialis muscle, buccal muscle, coracobrachialis muscle, corrugator brow muscle, deltoid muscle, depressor anguli oris muscle, depressor labii inferioris muscle, digastric muscle, dorsal interosseous muscles (hands), dorsal interosseous muscles (feet), extensor radialis brevis wrist, extensor carpi radialis longus, extensor carpi ulnaris, extensor of the little finger, extensor digitorum, extensor digitorum brevis, extensor digitorum longus, extensor hallucis brevis, extensor hallucis longus, extensor index finger, extensor pollicis brevis, long extensor pollicis, flexor carpi radialis, flexor carpi ulnaris, flexor digitorum brevis, flexor digitorum brevis, flexor digitorum brevis, flexor digitorum longus, flexor digitorum profundus, flexor digitorum superficialis, flexor hallucis brevis foot, flexor hallucis longus, flexor hallucis brevis, flexor hallucis longus, frontalis, gastrocnemius, geniohyoid, gluteus maximus, gluteus medius, gluteus minimus, gracilis, iliocostalis neck, iliocostalis lumborum, iliocostalis pectoralis, iliacus, inferior gemellus, inferior oblique, inferior rectus, infraspinatus, interspinous muscles, intertransverse muscles, lateral pterygoid, lateral rectus, latissimus dorsi, levator anguli oris, levator labii superioris, levator labii superioris and alae nasi, levator superior pallidum, levator scapulae, long rotator cuff, longissimus capitis, longissimus colli, longissimus thoracis, longus capitis muscle, longus colli muscle, lumbrical muscles (hands), lumbrical muscles (feet), masseter muscle, medial pterygoid muscle, medial rectus muscle, middle scalenus muscle, multifidus muscles, mylohyoid muscle, inferior oblique muscle capitis, superior oblique muscle capitis, obturator externus, obturator internus, occipital muscle, omohyoid muscle, opponus little finger muscle, opponus pollicis muscle, orbicularis oculi muscle, orbicularis oris muscle, palmar interosseous muscle, palmaris brevis, palmaris longus muscle, pectineus muscle, pectoralis major muscle, pectoralis minor muscle, peroneus brevis, peroneus longus muscle, peroneus 3 muscle, piriformis muscle, plantar interosseous muscles, plantaris muscle, subcutaneous neck muscle, popliteus muscle, posterior scalenus muscle, pronator quadratus muscle, pronator teres muscle muscle, psoas major, quadratus femoris, quadratus plantaris, rectus capitis anterior, rectus capitis lateralis, rectus capitis posterior major, rectus capitis posterior minor, rectus femoris, rhomboid major, rhomboid minor, laughter muscles, sartorius muscle, scalenus minor, semimembranosus, semispinalis capitis, semispinalis cervicis, semispinalis pectoralis, semitendinosus, serratus anterior, rotator brevis, soleus, spinalis capitis, spinalis cervicis, spinalis pectoralis, splenius muscle head, splenius neck muscle, sternocleidomastoid muscle, sternohyoid muscle, sternothyroid muscle, stylohyoid muscle, subclavian muscle, subscapularis muscle, superior gemellus muscle, superior oblique muscle, superior rectus muscle, supinator muscle, supraspinatus muscle , temporalis, tensor fasciae lata, teres major, teres minor, chest muscles, thyrohyoid, tibialis anterior, tibialis posterior, trapezius, triceps brachii, vastus intermedius, vastus lateralis , vastus medialis, zygomaticus major and zygomaticus minor, and any other suitable skeletal muscles known in the art.
[00435] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в диафрагмальную мышцу можно осуществлять любым подходящим способом, включая внутривенное введение, внутриартериальное введение и/или внутрибрюшинное введение. Согласно некоторым вариантам реализации доставка экспрессированного с зкДНК-вектора трансгена в ткань-мишень также может быть достигнута путем доставки синтетического депо, содержащего зкДНК-вектор, причем депо, содержащее зкДНК-вектор, имплантируют в скелетную, гладкомышечную, сердечную и/или диафрагмальную мышечную ткань или мышечная ткань может быть приведена в контакт с пленкой или другим матриксом, содержащим зкДНК-вектор, как описано в данном документе. Такие имплантируемые матриксы или субстраты описаны в патенте США №7201898.[00435] Administration of the cccDNA vector for expression of the FVIII protein disclosed herein into the diaphragm muscle can be accomplished by any suitable route, including intravenous administration, intra-arterial administration, and/or intraperitoneal administration. In some embodiments, delivery of a transgene expressed from a cccDNA vector to a target tissue can also be achieved by delivering a synthetic depot containing the cccDNA vector, wherein the depot containing the cccDNA vector is implanted into skeletal, smooth muscle, cardiac, and/or diaphragmatic muscle tissue or the muscle tissue may be contacted with a film or other matrix containing the cDNA vector, as described herein. Such implantable matrices or substrates are described in US Pat. No. 7,201,898.
[00436] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в сердечную мышцу включает введение в левое предсердие, правое предсердие, левый желудочек, правый желудочек и/или перегородку. ЗкДНК-вектор, описанный в данном документе, может быть доставлен в сердечную мышцу путем внутривенного введения, внутриартериального введения, такого как внутриаортальное введение, прямой сердечной инъекции (например, в левое предсердие, правое предсердие, левый желудочек, правый желудочек), и/или перфузии коронарной артерии.[00436] Administration of the cccDNA vector for expression of the FVIII protein disclosed herein into cardiac muscle includes administration into the left atrium, right atrium, left ventricle, right ventricle, and/or septum. The cccDNA vector described herein can be delivered to cardiac muscle by intravenous injection, intra-arterial injection such as intra-aortic injection, direct cardiac injection (eg, left atrium, right atrium, left ventricle, right ventricle), and/or coronary artery perfusion.
[00437] Введение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в гладкую мышцу можно осуществлять любым подходящим способом, включая внутривенное введение, внутриартериальное введение и/или внутрибрюшинное введение. Согласно одному варианту реализации введение можно осуществлять в эндотелиальные клетки, присутствующие в гладких мышцах, рядом с ними и/или на них. Неограничивающие примеры гладких мышц включают радужную оболочку глаза, бронхиолы легкого, мышцы гортани (голосовые связки), мышечные слои желудка, пищевода, тонкого и толстого кишечника желудочно-кишечного тракта, мочеточника, детрузора мочевого пузыря, миометрия матки, полового члена или простаты.[00437] Administration of the cccDNA vector for expression of the FVIII protein disclosed herein into smooth muscle can be accomplished by any suitable route, including intravenous administration, intra-arterial administration, and/or intraperitoneal administration. In one embodiment, administration can be performed into, adjacent to, and/or on endothelial cells present in smooth muscle. Non-limiting examples of smooth muscle include the iris, bronchioles of the lung, muscles of the larynx (vocal cords), muscle layers of the stomach, esophagus, small and large intestines of the gastrointestinal tract, ureter, detrusor bladder, myometrium of the uterus, penis or prostate.
[00438] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят в скелетную мышцу, диафрагмальную мышцу и/или сердечную мышцу. В типичных вариантах реализации зкДНК-вектор в соответствии с настоящим изобретением применяют для лечения и/или предотвращения нарушений скелетной, сердечной и/или диафрагмальной мышцы.[00438] In some embodiments, the cDNA FVIII protein expression vector disclosed herein is introduced into skeletal muscle, diaphragmatic muscle, and/or cardiac muscle. In exemplary embodiments, the cccDNA vector of the present invention is used to treat and/or prevent skeletal, cardiac, and/or diaphragmatic muscle disorders.
[00439] В частности, предусмотрено, что композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть доставлена в одну или более мышц глаза (например, боковую прямую мышцу, медиальную прямую мышцу, верхнюю прямую мышцу, нижнюю прямую мышцу, верхнюю косую мышцу, нижнюю косую мышцу), мимические мышцы (такие как затылочно-лобная мышца, височно-теменная мышца, мышца гордецов, носовая мышца, мышца, опускающая перегородку носа, круговая мышца глаза, мышца, сморщивающая бровь, мышца, опускающая бровь, ушные мышцы, круговая мышца рта, опускающая угол рта мышца, мышца смеха, большая скуловая мышца, малая скуловая мышца, поднимающая верхнюю губу мышца, поднимающая верхнюю губу и крыло носа мышца, опускающая нижнюю губу мышца, поднимающая угол рта мышца, щечная мышца, подбородочная мышца) или мышцы языка (например, подбородочно-язычную мышцу, подъязычно-язычную мышцу, хрящеязычную мышцу, шилоязычную мышцу, небно-язычную мышцу, верхнюю продольную мышцу, нижнюю продольную мышцу, вертикальную мышцу и поперечную мышцу).[00439] In particular, it is contemplated that a composition comprising the cDNA FVIII protein expression vector disclosed herein can be delivered to one or more muscles of the eye (e.g., lateral rectus, medial rectus, superior rectus, inferior rectus muscle, superior oblique muscle, inferior oblique muscle), facial muscles (such as the occipitofrontal muscle, temporo-parietal muscle, prouder muscle, nasal muscle, depressor septum nasal muscle, orbicularis oculi muscle, corrugator muscle, muscle, depressor brow, auricular muscles, orbicularis oris muscle, depressor anguli oris muscle, laughter muscle, zygomatic major muscle, zygomatic minor muscle, levator labii superioris muscle, levator superior lip and ala nasi muscle, depressor inferior lip muscle, levator anguli oris muscle, buccal muscle, mentalis muscle) or muscles of the tongue (eg, genioglossus muscle, hyoglossus muscle, cartilaginous muscle, styloglossus muscle, palatoglossus muscle, superior longitudinal muscle, inferior longitudinal muscle, vertical muscle and transverse muscle).
(i) Внутримышечная инъекция: Согласно некоторым вариантам реализации композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введена путем инъекции в одно или более мест конкретной мышцы, например, скелетной мышцы (например, дельтовидной, латеральной широкой мышцы бедра, вентро-ягодичной мышцы тыльной ягодичной мышцы или переднебоковой мышцы бедра для младенцев), у субъекта с помощью иглы. Композиция, содержащая зкДНК, может быть введена в другие подтипы мышечных клеток. Неограничивающие примеры подтипов мышечных клеток включают клетки скелетных мышц, клетки сердечной мышцы, клетки гладких мышц и/или клетки диафрагмальной мышцы.(i) Intramuscular injection: In some embodiments, a composition comprising the cDNA FVIII protein expression vector disclosed herein can be administered by injection into one or more sites of a specific muscle, e.g., skeletal muscle (e.g., deltoid, vastus lateralis thigh muscle, ventrogluteal muscle, dorsal gluteus muscle, or anterolateral thigh muscle for infants), in the subject using a needle. The composition containing cccDNA can be introduced into other muscle cell subtypes. Non-limiting examples of muscle cell subtypes include skeletal muscle cells, cardiac muscle cells, smooth muscle cells and/or diaphragmatic muscle cells.
[00440] Способы внутримышечной инъекции известны специалистам в данной области техники и поэтому в данном документе подробно не описываются. Однако при выполнении внутримышечной инъекции соответствующий размер иглы следует определять на основании возраста и комплекции пациента, вязкости композиции, а также места инъекции. В Таблице 8 приведены рекомендации по примерным местам инъекции и соответствующему размеру иглы:[00440] Methods for intramuscular injection are known to those skilled in the art and therefore are not described in detail herein. However, when performing an intramuscular injection, the appropriate needle size should be determined based on the age and size of the patient, the viscosity of the composition, and the injection site. Table 8 provides guidelines for approximate injection sites and appropriate needle size:
[00441] Согласно определенным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготавливают в небольшом объеме, например, примерном объеме, представленном в Таблице 8, для конкретного субъекта. Согласно некоторым вариантам реализации перед инъекцией субъекту может быть введен общий или местный анестетик, при необходимости. Это особенно желательно, если требуется несколько инъекций или если инъекцию вводят в более глубокую мышцу, а не в обычные места инъекций, указанные выше.[00441] In certain embodiments, the cDNA FVIII protein expression vector disclosed herein is manufactured in a small volume, such as the approximate volume shown in Table 8, for a particular subject. In some embodiments, a general or local anesthetic may be administered to the subject prior to injection, as appropriate. This is especially desirable if multiple injections are required or if the injection is being given into a deeper muscle rather than the usual injection sites listed above.
[00442] Согласно некоторым вариантам реализации внутримышечную инъекцию можно комбинировать с электропорацией, давлением доставки или использованием реагентов для трансфекции для усиления клеточного поглощения зкДНК-вектора.[00442] In some embodiments, intramuscular injection can be combined with electroporation, pressure delivery, or the use of transfection reagents to enhance cellular uptake of the cccDNA vector.
(ii) Реагенты для трансфекции: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготавливают в виде композиций, содержащих один или более реагентов для трансфекции, чтобы облегчить поглощение векторов в мышечные трубочки или мышечную ткань. Таким образом, в одном варианте реализации, нуклеиновые кислоты, описанные в данном документе, вводят в мышечную клетку, мышечную трубочку или мышечную ткань путем трансфекции с использованием способов, описанных в другом месте в данном документе.(ii) Transfection Reagents: In some embodiments, the cDNA FVIII protein expression vector disclosed herein is formulated into compositions containing one or more transfection reagents to facilitate uptake of the vectors into myotubes or muscle tissue. Thus, in one embodiment, the nucleic acids described herein are introduced into a muscle cell, myotube, or muscle tissue by transfection using methods described elsewhere herein.
(iii) Электропорация: Согласно определенным вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят без носителя для облегчения проникновения зкДНК в клетки или в физиологически инертном фармацевтически приемлемом носителе (т.е. в любом носителе, который не улучшает или не усиливает поглощение бескапсидных невирусных векторов в мышечные трубочки). Согласно таким вариантам реализации поглощение бескапсидного невирусного вектора может быть облегчено путем электропорации клетки или ткани.(iii) Electroporation: In certain embodiments, the cDNA FVIII protein expression vector disclosed herein is administered without a vehicle to facilitate entry of the ccDNA into cells or in a physiologically inert pharmaceutically acceptable vehicle (i.e., any vehicle that does not enhance or does not enhance the uptake of capsid-free nonviral vectors into myotubes). In such embodiments, uptake of the capsidless nonviral vector can be facilitated by electroporation of the cell or tissue.
[00443] Клеточные мембраны естественным образом устойчивы к проникновению внеклеточных объектов в цитоплазму клетки. Одним из методов временного уменьшения этой устойчивости является «электропорация», когда электрические поля используют для создания пор в клетках, не вызывая необратимого повреждения клеток. Эти поры достаточно велики, чтобы позволить ДНК-векторам, фармацевтическим препаратам, ДНК и другим полярным соединениям проникать внутрь клетки. Со временем поры в клеточной мембране закрываются, и клетка снова становится непроницаемой.[00443] Cell membranes are naturally resistant to the penetration of extracellular objects into the cell cytoplasm. One method of temporarily reducing this resistance is “electroporation,” where electric fields are used to create pores in cells without causing permanent cell damage. These pores are large enough to allow DNA vectors, pharmaceuticals, DNA and other polar compounds to enter the cell. Over time, the pores in the cell membrane close and the cell becomes impenetrable again.
[00444] Электропорацию можно использовать в приложениях как in vitro, так и in vivo для введения, например, экзогенной ДНК в живые клетки. Для приложений in vitro, как правило, смешивают образец живых клеток с композицией, содержащей, например, ДНК. Затем клетки помещают между электродами, такими как параллельные пластины, и к смеси клетка/композиция прикладывают электрическое поле.[00444] Electroporation can be used in both in vitro and in vivo applications to introduce, for example, exogenous DNA into living cells. For in vitro applications, a sample of living cells is typically mixed with a composition containing, for example, DNA. The cells are then placed between electrodes, such as parallel plates, and an electric field is applied to the cell/composition mixture.
[00445] Существует ряд методов электропорации in vivo; электроды могут быть обеспечены в различных конфигурациях, таких как, например, штангенциркуль, который захватывает эпидермис, лежащий над областью клеток, подлежащих обработке. В качестве альтернативы, в ткань могут быть введены игольчатые электроды для доступа к клеткам, расположенным глубже. В любом случае, после инъекционного введения композиции, содержащей, например, нуклеиновые кислоты, в область обработки,[00445] There are a number of in vivo electroporation methods; the electrodes may be provided in various configurations, such as, for example, a caliper that engages the epidermis overlying the area of cells to be treated. Alternatively, needle electrodes can be inserted into the tissue to access cells located deeper. In any case, after injecting a composition containing, for example, nucleic acids into the treatment area,
электроды прикладывают к области электрическое поле. В некоторых приложениях электропорации электрическое поле представляет собой одиночный прямоугольный импульс порядка 100-500 В/см с длительностью от 10 до 60 мс. Такой импульс может генерироваться, например, в известных приложениях Electro Square Porator Т820, производимых ВТХ Division Genetronics, Inc.The electrodes apply an electric field to the area. In some electroporation applications, the electric field is a single rectangular pulse of the order of 100-500 V/cm with a duration of 10 to 60 ms. Such a pulse can be generated, for example, in the well-known Electro Square Porator T820 applications manufactured by BTX Division Genetronics, Inc.
[00446] Как правило, успешное поглощение, например, нуклеиновых кислот происходит только в том случае, если мышцу электрически стимулировать сразу или вскоре после введения композиции, например, путем инъекции в мышцу.[00446] Typically, successful uptake of, for example, nucleic acids occurs only if the muscle is electrically stimulated immediately or shortly after administration of the composition, for example, by injection into the muscle.
[00447] Согласно определенным вариантам реализации электропорация достигается с использованием импульсов электрических полей или с использованием схем обработки с низким напряжением/длинными импульсами (например, с использованием системы электропорации с прямоугольными импульсами). Примерные генераторы импульсов, способные генерировать импульсное электрическое поле, включают, например, ЕСМ600, который может генерировать экспоненциальную форму волны, и ElectroSquarePorator (Т820), который может генерировать прямоугольную форму волны, оба из которых доступны от ВТХ, подразделения Genetronics, Inc. (Сан-Диего, Калифорния). Системы электропорации с прямоугольной волной доставляют контролируемые электрические импульсы, которые быстро повышаются до заданного напряжения, остаются на этом уровне в течение заданного периода времени (длительность импульса), а затем быстро падают до нуля.[00447] In certain embodiments, electroporation is achieved using pulsed electric fields or using low voltage/long pulse processing schemes (eg, using a square pulse electroporation system). Exemplary pulse generators capable of generating a pulsed electric field include, for example, the ECM600, which can generate an exponential waveform, and the ElectroSquarePorator (T820), which can generate a square waveform, both of which are available from BTX, a division of Genetronics, Inc. (San Diego, California). Square wave electroporation systems deliver controlled electrical pulses that rise rapidly to a set voltage, remain at that level for a set period of time (pulse duration), and then quickly fall to zero.
[00448] Согласно некоторым вариантам реализации местный анестетик вводят, например, путем инъекции в место обработки, чтобы уменьшить боль, которая может быть ассоциирована с электропорацией ткани в присутствии композиции, содержащей бескапсидный невирусный вектор, как описано в данном документе. Кроме того, специалист в данной области техники поймет, что следует выбирать дозу композиции, которая сводит к минимуму и/или предотвращает чрезмерное повреждение ткани, приводящее к фиброзу, некрозу или воспалению мышцы.[00448] In some embodiments, a local anesthetic is administered, for example, by injection into a treatment site to reduce pain that may be associated with electroporation of tissue in the presence of a composition comprising a capsidless non-viral vector, as described herein. In addition, one skilled in the art will appreciate that a dose of the composition should be selected that minimizes and/or prevents excessive tissue damage leading to fibrosis, necrosis, or inflammation of the muscle.
(iv) Давление доставки: Согласно некоторым вариантам реализации доставку зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в мышечную ткань облегчают с помощью давления доставки, при котором используется комбинация больших объемов и быстрой инъекции в артерию, снабжающую конечность (например, подвздошную артерию). Этот способ введения может быть достигнут с помощью множества способов, которые включают вливание в сосудистую сеть конечности композиции, содержащей зкДНК-вектор, как правило, при изоляции мышцы от большого круга кровообращения с помощью жгута сосудистого зажима. В одном методе композиция циркулирует через сосудистую сеть конечности, чтобы обеспечить возможность экстравазации в клетки. В другом методе внугрисосудистое гидродинамическое давление увеличивается для расширения сосудистых лож и увеличения поглощения зкДНК-вектора в мышечные клетки или ткань. Согласно одному варианту реализации композицию зкДНК вводят в артерию.(iv) Delivery Pressure: In some embodiments, delivery of the cDNA FVIII protein expression vector disclosed herein to muscle tissue is facilitated by delivery pressure that uses a combination of high volumes and rapid injection into an artery supplying a limb (e.g., iliac artery). This route of administration can be achieved by a variety of methods that involve infusing the vasculature of the limb with a composition containing the cccDNA vector, typically while isolating the muscle from the systemic circulation using a vascular clamp tourniquet. In one method, the composition is circulated through the vasculature of the limb to allow extravasation into cells. In another method, intravascular hydrodynamic pressure is increased to dilate vascular beds and increase uptake of the cccDNA vector into muscle cells or tissue. In one embodiment, the cccDNA composition is administered into an artery.
(v) Композиции липидпых напочастиц: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, для внутримышечной доставки изготавливают в виде композиции, содержащей липосому, как описано в другом месте в данном документе(v) Lipid Particulate Compositions: In some embodiments, the cDNA FVIII protein expression vector disclosed herein for intramuscular delivery is formulated as a composition containing a liposome, as described elsewhere herein.
(vi) Системное введение зкДНК-вектора, нацеленного на мышечную ткань: Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, изготовлен для нацеливания на мышцу за счет введения путем непрямой доставки, при котором зкДНК транспортируется в мышцу, а не в печень. Соответственно, технология, описанная в данном документе, включает непрямое введение композиций, содержащих зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, в мышечную ткань, например, путем системного введения. Такие композиции можно вводить местно, внутривенно (с помощью болюсной или непрерывной инфузии), с помощью внутриклеточной инъекции, внутритканевой инъекции, перорально, путем ингаляции, внутрибрюшинно, подкожно, внутрь полости, и их можно доставлять с помощью перистальтических средств, при необходимости, или с помощью других средств, известных специалистам в данной области техники. При необходимости, агент может быть введен системно, например, путем внутривенной инфузии.(vi) Systemic administration of a cccDNA vector targeting muscle tissue: In some embodiments, the cccDNA vector for FVIII protein expression disclosed herein is formulated to target muscle through administration by indirect delivery, in which the cccDNA is transported into the muscle, and not to the liver. Accordingly, the technology described herein involves indirectly introducing compositions containing the cDNA FVIII protein expression vector disclosed herein into muscle tissue, for example, by systemic administration. Such compositions can be administered topically, intravenously (by bolus or continuous infusion), by intracellular injection, interstitial injection, orally, by inhalation, intraperitoneally, subcutaneously, intracavity, and they can be delivered by peristaltic means, if necessary, or with by other means known to those skilled in the art. If necessary, the agent can be administered systemically, for example, by intravenous infusion.
[00449] Согласно некоторым вариантам реализации поглощение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в мышечные клетки/ткань увеличивается за счет использования нацеливающего агента или фрагмента, который преимущественно направляет вектор в мышечную ткань. Таким образом, в некоторых вариантах реализации бескапсидный зкДНК-вектор может быть сконцентрирован в мышечной ткани по сравнению с количеством бескапсидных зкДНК-векторов, присутствующих в других клетках или тканях организма.[00449] In some embodiments, uptake of a cccDNA FVIII protein expression vector disclosed herein into muscle cells/tissue is increased by the use of a targeting agent or moiety that preferentially targets the vector into muscle tissue. Thus, in some embodiments, the capsidless cccDNA vector may be concentrated in muscle tissue relative to the amount of capsidless cccDNA vectors present in other cells or tissues of the body.
[00450] Согласно некоторым вариантам реализации композиция, содержащая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, дополнительно содержит фрагмент, нацеливающий на мышечные клетки. Согласно другим вариантам реализации экспрессированный генный продукт содержит нацеливающий фрагмент, специфический для ткани, в котором его действие является желательным. Нацеливающий фрагмент может включать любую молекулу или комплекс молекул, которые способны нацеливаться, взаимодействовать, соединяться и/или связываться с внутриклеточным, поверхностным или внеклеточным биомаркером клетки или ткани. Биомаркер может включать, например, клеточную протеазу, киназу, белок, рецептор клеточной поверхности, липид и/или алифатическую кислоту. Другие примеры биомаркеров, на которые могут быть нацелены, с которыми могут взаимодействовать, соединяться и/или связываться нацеливающие фрагменты, включают молекулы, ассоциированные с конкретным заболеванием. Например, биомаркеры могут включать рецепторы клеточной поверхности, участвующие в развитии рака, такие как рецептор эпидермального фактора роста и рецептор трансферрина. Нацеливающие фрагменты могут включать, но не ограничиваются перечисленными, синтетические соединения, природные соединения или продукты, макромолекулярные объекты, биосконструированные молекулы (например, полипептиды, липиды, полинуклеотиды, антитела, фрагменты антител) и малые объекты (например, малые молекулы, нейротрансмиттеры, субстраты, лиганды, гормоны и соединения элементов), которые связываются с молекулами, экспрессируемыми в целевой мышечной ткани.[00450] In some embodiments, a composition comprising a cDNA FVIII protein expression vector disclosed herein further comprises a muscle cell targeting moiety. In other embodiments, the expressed gene product contains a targeting moiety specific to the tissue in which its action is desired. A targeting moiety may include any molecule or complex of molecules that is capable of targeting, interacting, connecting and/or binding to an intracellular, surface or extracellular biomarker of a cell or tissue. The biomarker may include, for example, a cellular protease, kinase, protein, cell surface receptor, lipid and/or aliphatic acid. Other examples of biomarkers that can be targeted, interacted with, coupled to and/or bind to targeting moieties include molecules associated with a particular disease. For example, biomarkers may include cell surface receptors involved in cancer development, such as epidermal growth factor receptor and transferrin receptor. Targeting moieties may include, but are not limited to, synthetic compounds, natural compounds or products, macromolecular entities, bioengineered molecules (e.g., polypeptides, lipids, polynucleotides, antibodies, antibody fragments), and small entities (e.g., small molecules, neurotransmitters, substrates, ligands, hormones and elemental compounds) that bind to molecules expressed in the target muscle tissue.
[00451] Согласно определенным вариантам реализации нацеливающий фрагмент может дополнительно содержать рецепторную молекулу, включая, например, рецепторы, которые естественным образом распознают конкретную целевую молекулу клетки-мишени. Такие рецепторные молекулы включают рецепторы, которые были модифицированы для повышения их специфичности взаимодействия с молекулой-мишенью, рецепторы, которые были модифицированы для взаимодействия с целевой молекулой-мишенью, не распознаваемой рецептором в естественных условиях, и фрагменты таких рецепторов (см., например, Skerra, 2000, J. Molecular Recognition, 13:167-187). Предпочтительный рецептор представляет собой рецептор хемокина. Примерные рецепторы хемокинов описаны, например, в Lapidot et al, 2002, Exp Hematol, 30:973-81 и Onuffer et al., 2002, Trends Pharmacol Sci, 23:459-67.[00451] In certain embodiments, the targeting moiety may further comprise a receptor molecule, including, for example, receptors that naturally recognize a particular target cell molecule. Such receptor molecules include receptors that have been modified to increase their specificity of interaction with a target molecule, receptors that have been modified to interact with a target molecule not recognized by the receptor in vivo, and fragments of such receptors (see, for example, Skerra , 2000, J. Molecular Recognition, 13:167-187). A preferred receptor is a chemokine receptor. Exemplary chemokine receptors are described, for example, in Lapidot et al, 2002, Exp Hematol, 30:973-81 and Onuffer et al., 2002, Trends Pharmacol Sci, 23:459-67.
[00452] Согласно другим вариантам реализации дополнительный нацеливающий фрагмент может содержать молекулу лиганда, включая, например, лиганды, которые естественным образом распознают конкретный целевой рецептор клетки-мишени, такой как лиганд трансферрина (Tf). Такие молекулы лигандов включают лиганды, которые были модифицированы для повышения их специфичности взаимодействия с рецептором-мишенью, лиганды, которые были модифицированы для взаимодействия с целевым рецептором, который не распознается лигандом в естественных условиях, и фрагменты таких лигандов.[00452] In other embodiments, the additional targeting moiety may comprise a ligand molecule, including, for example, ligands that naturally recognize a particular target cell receptor, such as a transferrin (Tf) ligand. Such ligand molecules include ligands that have been modified to increase their specificity for interaction with a target receptor, ligands that have been modified to interact with a target receptor that is not recognized by the ligand in natural conditions, and fragments of such ligands.
[00453] Согласно другим вариантам реализации нацеливающий фрагмент может содержать аптамер. Аптамеры представляют собой олигонуклеотиды, выбранные для специфичного связывания с целевой молекулярной структурой клетки-мишени. Аптамеры, как правило, представляют собой продукты способа селекции по аффинности, сходного с селекцией по аффинности при фаговом дисплее (также известной как молекулярная эволюция in vitro). Способ включает выполнение нескольких тандемных итераций разделения по аффинности, например, с использованием твердой подложки, с которой связан патологический иммуноген, с последующей полимеразной цепной реакцией (ПЦР) для амплификации нуклеиновых кислот, которые связались с иммуногенами. Таким образом, каждый раунд аффинного разделения обогащает популяцию нуклеиновых кислот молекулами, которые успешно связывают целевой иммуноген. Таким путем случайный пул нуклеиновых кислот может быть «обучен» с получением аптамеров, которые специфично связывают молекулы-мишени. Аптамеры, как правило, представляют собой РНК, но могут представлять собой ДНК или ее аналоги или производные, такие как, без ограничения, пептидные нуклеиновые кислоты (ПНК) и фосфотиоатные нуклеиновые кислоты.[00453] In other embodiments, the targeting moiety may comprise an aptamer. Aptamers are oligonucleotides selected to specifically bind to the target molecular structure of the target cell. Aptamers are typically the products of an affinity selection process similar to affinity selection in phage display (also known as in vitro molecular evolution). The method involves performing multiple tandem iterations of affinity separation, for example using a solid support to which the pathological immunogen is bound, followed by polymerase chain reaction (PCR) to amplify nucleic acids that have bound to the immunogens. Thus, each round of affinity separation enriches the nucleic acid population with molecules that successfully bind the target immunogen. In this way, a random pool of nucleic acids can be “trained” to produce aptamers that specifically bind target molecules. Aptamers are typically RNA, but may be DNA or analogs or derivatives thereof, such as, but not limited to, peptide nucleic acids (PNAs) and phosphorothioate nucleic acids.
[00454] Согласно некоторым вариантам реализации нацеливающий фрагмент может содержать фоторазлагаемый лиганд (т.е. «запертый» лиганд), который высвобождается, например, под действием сфокусированного луча света так, что бескапсидные невирусные векторы или генный продукт нацеливаются на конкретную ткань.[00454] In some embodiments, the targeting moiety may comprise a photodegradable ligand (i.e., a “locked” ligand) that is released, for example, by exposure to a focused beam of light such that the capsidless nonviral vectors or gene product are targeted to a specific tissue.
[00455] В данном документе также предусмотрено, что композиции доставляют в несколько мест в одной или более мышцах субъекта. Таким образом, инъекции могут быть сделаны в по меньшей мере 2, по меньшей мере 3, по меньшей мере 4, по меньшей мере 5, по меньшей мере 6, по меньшей мере 7, по меньшей мере 8, по меньшей мере 9, по меньшей мере 10, по меньшей мере 15, по меньшей мере 20, по меньшей мере 25, по меньшей мере 30, по меньшей мере 35, по меньшей мере 40, по меньшей мере 45, по меньшей мере 50, по меньшей мере 55, по меньшей мере 60, по меньшей мере 65, по меньшей мере 70, по меньшей мере 75, по меньшей мере 80, по меньшей мере 85, по меньшей мере 90, по меньшей мере 95, по меньшей мере 100 местах инъекций. Такие места могут быть распределены по площади одной мышцы или могут быть распределены между несколькими мышцами.[00455] It is also provided herein that the compositions are delivered to multiple sites in one or more muscles of a subject. Thus, injections can be made in at least 2, at least 3, at least 4, at least 5, at least 6, at least 7, at least 8, at least 9, at least at least 10, at least 15, at least 20, at least 25, at least 30, at least 35, at least 40, at least 45, at least 50, at least 55, at least at least 60, at least 65, at least 70, at least 75, at least 80, at least 85, at least 90, at least 95, at least 100 injection sites. Such sites may be distributed over the area of one muscle or may be distributed among several muscles.
В. Введение зкДНК-вектора для экспрессии белка FVIII в немышечные местаB. Introduction of cccDNA vector for expression of FVIII protein in non-muscle sites
[00456] Согласно другому варианту реализации зкДНК-вектор для экспрессии белка FVIII вводят в печень. ЗкДНК-вектор также можно вводить в различные области глаза, такие как роговица и/или зрительный нерв. ЗкДНК-вектор также можно вводить в спинной мозг, ствол мозга (продолговатый мозг, мост), средний мозг (гипоталамус, таламус, эпиталамус, гипофиз, черную субстанцию, эпифиз), мозжечок, конечный мозг (полосатое тело, полушария головного мозга, включая затылочную, височную, теменную и лобную доли, кору, базальные ганглии, гиппокамп и амигдалу), лимбическую систему, неокортекс, полосатое тело, полушария головного мозга и нижний холмик четверохолмия. ЗкДНК-вектор может быть доставлен в спинномозговую жидкость (например, с помощью люмбальной пункции). ЗкДНК-вектор для экспрессии белка FVIII можно дополнительно Glu G1 внутрисосудисто в ЦНС в ситуациях, когда нарушен гематоэнцефалический барьер (например, опухоль головного мозга или церебральный инфаркт).[00456] In another embodiment, a cccDNA vector for expressing FVIII protein is administered to the liver. The cDNA vector can also be injected into various areas of the eye, such as the cornea and/or optic nerve. The cDNA vector can also be injected into the spinal cord, brainstem (medulla oblongata, pons), midbrain (hypothalamus, thalamus, epithalamus, pituitary gland, substantia nigra, pineal gland), cerebellum, telencephalon (striatum, cerebral hemispheres, including the occipital , temporal, parietal and frontal lobes, cortex, basal ganglia, hippocampus and amygdala), limbic system, neocortex, striatum, cerebral hemispheres and inferior colliculus. The cctDNA vector can be delivered into the cerebrospinal fluid (eg, via lumbar puncture). A cccDNA vector for FVIII protein expression can be additionally Glu G1 intravascularly into the CNS in situations where the blood-brain barrier is disrupted (eg, brain tumor or cerebral infarction).
[00457] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII можно вводить в целевую область (области) глаза любым путем, известным в данной области техники, включая, но не ограничиваясь перечисленными, интратекальную, внутриглазную, интрацеребральную, в нутриже луд очковую, внутривенную (например, в присутствии сахара, такого как маннит), интраназальную, внутриушную, внутриглазную (например, интравитреальную, субретинальную, в переднюю камеру) и периокулярную (например, в субтенонову область) доставку, а также внутримышечную доставку с ретроградной доставкой к двигательным нейронам.[00457] In some embodiments, the cDNA vector for expressing the FVIII protein can be administered to the target area(s) of the eye by any route known in the art, including, but not limited to, intrathecal, intraocular, intracerebral, intraocular, ophthalmic, intravenous (eg, in the presence of a sugar such as mannitol), intranasal, intraaural, intraocular (eg, intravitreal, subretinal, anterior chamber) and periocular (eg, sub-Tenon's region) delivery, and intramuscular delivery with retrograde delivery to motor neurons .
[00458] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII вводят в жидком составе путем прямой инъекции (например, стереотаксической инъекции) в целевую область или компартмент в ЦНС. Согласно другим вариантам реализации зкДНК-вектор может быть обеспечен путем местного нанесения на целевую область или путем интраназального введения аэрозольного состава. Введение в глаз можно осуществлять путем местного нанесения жидких капель. В качестве дополнительной альтернативы зкДНК-вектор можно вводить в виде твердого состава с медленным высвобождением (см., например, патент США №7201898). Согласно другим дополнительным вариантам реализации зкДНК-вектор можно применять для ретроградного транспорта для лечения, облегчения и/или предотвращения заболеваний и нарушений, затрагивающих двигательные нейроны (например, бокового амиотрофического склероза (БАС); спинальной мышечной атрофии (СМА) и т.д.). Например, зкДНК-вектор может быть доставлен в мышечную ткань, из которой он может мигрировать в нейроны.[00458] In some embodiments, the cccDNA vector for expression of the FVIII protein is administered in a liquid formulation by direct injection (eg, stereotactic injection) into a target area or compartment in the CNS. In other embodiments, the cccDNA vector may be provided by topical application to the target area or by intranasal administration of an aerosol formulation. Administration to the eye can be accomplished by topical application of liquid drops. As a further alternative, the cDNA vector can be administered as a slow release solid formulation (see, for example, US Pat. No. 7,201,898). In other additional embodiments, the cccDNA vector can be used for retrograde transport to treat, alleviate, and/or prevent diseases and disorders affecting motor neurons (e.g., amyotrophic lateral sclerosis (ALS); spinal muscular atrophy (SMA), etc.) . For example, the cccDNA vector can be delivered to muscle tissue, from which it can migrate into neurons.
С. Лечение ex vivoC. Ex vivo treatment
[00459] Согласно некоторым вариантам реализации клетки извлекают из организма субъекта, вводят в них зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, и затем клетки возвращают в организм субъекта. Способы извлечения клеток из организма субъекта для лечения ex vivo с последующим введением обратно в организм субъекта известны в данной области техники (см., например, патент США №5399346; содержание которого полностью включено в данный документ). В качестве альтернативы, зкДНК-вектор вводят в клетки, полученные от другого субъекта, в культивируемые клетки или в клетки из любого другого подходящего источника, и указанные клетки вводят нуждающемуся в этом субъекту.[00459] In some embodiments, the cells are removed from the subject, the cDNA FVIII protein expression vector disclosed herein is introduced into the cells, and the cells are then returned to the subject. Methods for extracting cells from a subject for treatment ex vivo and then reintroducing them back into the subject are known in the art (see, for example, US Pat. No. 5,399,346; the contents of which are incorporated herein in their entirety). Alternatively, the cccDNA vector is introduced into cells obtained from another subject, into cultured cells, or into cells from any other suitable source, and the cells are administered to a subject in need thereof.
[00460] Клетки, трансдуцированные зкДНК-вектором для экспрессии белка FVIII, раскрытым в данном документе, предпочтительно вводят субъекту в «терапевтически эффективном количестве» в комбинации с фармацевтическим носителем. Специалисты в данной области техники поймут, что терапевтические эффекты не обязательно должны быть полными или обеспечивать исцеление, при условии, что для субъекта они в какой-то мере благоприятны.[00460] Cells transduced with the cDNA FVIII protein expression vector disclosed herein are preferably administered to a subject in a "therapeutically effective amount" in combination with a pharmaceutical carrier. Those skilled in the art will appreciate that therapeutic effects need not be complete or provide a cure, as long as they are beneficial to the subject in some way.
[00461] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать белок FVIII, описанный в данном документе (иногда называемый трансгеном или гетерологичной нуклеотидной последовательностью), который должен продуцироваться в клетке in vitro, ex vivo или in vivo. Например, в отличие от применения зкДНК-векторов, описанных в данном документе, в способе лечения, который обсуждается в данном документе, в некоторых вариантах реализации зкДНК-вектор для экспрессии белка FVIII может быть введен в культивируемые клетки, и экспрессированный белок FVIII может быть выделен из клеток, например, для получения антител и слитых белков. Согласно некоторым вариантам реализации культивируемые клетки, содержащие зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для коммерческого получения антител или слитых белков, например, в качестве источника клеток для мелкомасштабного или крупномасштабного биоизготовления антител или слитых белков. В альтернативных вариантах реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, вводят в клетки у субъекта-хозяина, не являющегося человеком, для продуцирования антител или слитых белков in vivo, включая мелкомасштабное получение, а также коммерческое крупномасштабное получение белка FVIII.[00461] In some embodiments, the cccDNA FVIII protein expression vector disclosed herein may encode the FVIII protein described herein (sometimes referred to as a transgene or heterologous nucleotide sequence) that is to be produced in a cell in vitro, ex vivo, or in vivo. For example, in contrast to the use of cccDNA vectors described herein in a method of treatment discussed herein, in some embodiments, a cccDNA vector for expression of FVIII protein can be introduced into cultured cells and the expressed FVIII protein can be isolated from cells, for example to produce antibodies and fusion proteins. In some embodiments, cultured cells containing the cDNA FVIII protein expression vector disclosed herein can be used to commercially produce antibodies or fusion proteins, for example, as a source of cells for small-scale or large-scale biomanufacturing of antibodies or fusion proteins. In alternative embodiments, the cDNA FVIII protein expression vector disclosed herein is introduced into cells in a non-human host for the production of antibodies or fusion proteins in vivo, including small-scale production as well as commercial large-scale production of FVIII protein.
[00462] ЗкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, можно применять как в ветеринарных, так и в медицинских приложениях. Подходящие субъекты для способов доставки генов ex vivo, описанных выше, включают как птиц (например, кур, уток, гусей, перепелов, индеек и фазанов), так и млекопитающих (например, человека, бычьих, овечьих, козьих, лошадиных, кошачьих, собачьих и зайцеобразных), при этом предпочтительными являются млекопитающие. Субъекты-люди являются наиболее предпочтительными. Субъекты-люди включают новорожденных, младенцев, детей и подростков, и взрослых людей.[00462] The cDNA FVIII protein expression vectors disclosed herein can be used in both veterinary and medical applications. Suitable subjects for the ex vivo gene delivery methods described above include both birds (e.g., chickens, ducks, geese, quail, turkeys, and pheasants) and mammals (e.g., human, bovine, ovine, goat, equine, feline, canine) and lagomorphs), with mammals being preferred. Human subjects are most preferred. Human subjects include newborns, infants, children and adolescents, and adults.
D. Диапазоны дозD. Dose Ranges
[00463] В данном документе предложены способы лечения, включающие введение субъекту эффективного количества композиции, содержащей зкДНК-вектор, кодирующий белок FVIII, как описано в данном документе. Как будет понятно квалифицированному практикующему врачу, термин «эффективное количество» относится к введенному количеству композиции зкДНК, которое приводит к экспрессии белка FVIII в «терапевтически эффективном количестве» для лечения гемофилии А.[00463] Provided herein are methods of treatment comprising administering to a subject an effective amount of a composition comprising a cccDNA vector encoding an FVIII protein as described herein. As will be appreciated by a skilled practitioner, the term "effective amount" refers to an administered amount of a cccDNA composition that results in the expression of FVIII protein in a "therapeutically effective amount" for the treatment of hemophilia A.
[00464] Анализы in vivo и/или in vitro необязательно можно использовать, чтобы облегчить определение оптимальных диапазонов дозировок для применения. Точная доза, которая должна быть использована в составе, также будет зависеть от пути введения и серьезности состояния и должна определяться в соответствии с суждением обычного специалиста в данной области техники и обстоятельствами каждого субъекта. Эффективные дозы можно экстраполировать из кривых доза-ответ, полученных из тест-систем in vitro или в моделях на животных.[00464] In vivo and/or in vitro assays may optionally be used to facilitate the determination of optimal dosage ranges for use. The exact dosage to be used in the formulation will also depend on the route of administration and the severity of the condition and should be determined in accordance with the judgment of one of ordinary skill in the art and the circumstances of each subject. Effective doses can be extrapolated from dose-response curves obtained from in vitro test systems or animal models.
[00465] для экс пр есс ии белка FVIII, раскрытые в данном документе, вводят в количествах, достаточных для трансфекции клеток целевой ткани и обеспечения достаточных уровней переноса и экспрессии генов без неоправданных нежелательных эффектов. Обычные и фармацевтически приемлемые пути введения включают, но не ограничиваются ими, те, которые описаны выше в разделе «Введение», такие как прямая доставка в выбранный орган (например, внутрипортальная доставка в печень), пероральный, ингаляционный (включая интраназальную и внутритрахеальную доставку), 1035 внутриопухолевый и другие исходные пути введения. Пути введения могут быть скомбинированы, если требуется.[00465] for protein expression, the FVIIIs disclosed herein are administered in quantities sufficient to transfect cells of the target tissue and ensure sufficient levels of gene transfer and expression without undue adverse effects. Conventional and pharmaceutically acceptable routes of administration include, but are not limited to, those described above in the Introduction section, such as direct delivery to the target organ (eg, intraportal delivery to the liver), oral, inhalation (including intranasal and intratracheal delivery) , 1035 intratumoral and other initial routes of administration. Routes of administration can be combined if required.
[00466] Доза количества зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, необходимая для достижения определенного «терапевтического эффекта», будет варьироваться в зависимости от нескольких факторов, включая, но не ограничиваясь перечисленными: путь введения нуклеиновой кислоты, уровень экспрессии гена или РНК, необходимый для достижения терапевтического эффекта, конкретное заболевание или нарушение, которое лечат, и стабильность гена (ов), продукта (ов) РНК или полученного экспрессированного белка (ов). Специалист в данной области техники может легко определить диапазон доз зкДНК-вектора для лечения пациента, страдающего конкретным заболеванием или нарушением, на основании вышеупомянутых факторов, а также других факторов, которые хорошо известны в данной области техники.[00466] The amount of cccDNA FVIII protein expression vectors disclosed herein required to achieve a given “therapeutic effect” will vary depending on several factors, including, but not limited to: route of nucleic acid administration, level of gene expression or RNA required to achieve a therapeutic effect, the particular disease or disorder being treated, and the stability of the gene(s), RNA product(s), or resulting expressed protein(s). One skilled in the art can readily determine a dosage range of a cccDNA vector for treating a patient suffering from a particular disease or disorder based on the above factors as well as other factors that are well known in the art.
[00467] Схему дозирования можно корректировать для обеспечения оптимального терапевтического ответа. Например, олигонуклеотид может быть введен повторно, например, несколько доз могут быть введены ежедневно или дозу можно пропорционально уменьшать в соответствии с требованиями терапевтической ситуации. Обычный специалист в данной области техники легко сможет определить подходящие дозы и схемы введения рассматриваемых олигонуклеотидов, независимо от того, должны быть введены олигонуклеотиды в клетки или субъектам.[00467] The dosage schedule can be adjusted to ensure optimal therapeutic response. For example, the oligonucleotide can be administered repeatedly, for example, several doses can be administered daily or the dose can be proportionally reduced according to the requirements of the therapeutic situation. One of ordinary skill in the art will readily be able to determine appropriate dosages and administration schedules for the oligonucleotides in question, regardless of whether the oligonucleotides are to be administered to cells or subjects.
[00468] «Терапевтически эффективная доза» будет находиться в относительно широком диапазоне, который может быть определен посредством клинических исследований, и будет зависеть от конкретного применения (нервным клеткам потребуются очень небольшие количества, в то время как системная инъекция потребует больших количеств). Например, для прямой инъекции in vivo в скелетную или сердечную мышцу субъекта-человека терапевтически эффективная доза будет порядка от примерно 1 мкг до 100 г зкДНК-вектора. Если для доставки зкДНК-вектора используются экзосомы или микрочастицы, то терапевтически эффективная доза может быть определена экспериментально, но ожидается, что она доставит от 1 мкг до примерно 100 г вектора. Более того, терапевтически эффективная доза представляет собой количество зкДНК-вектора, которое экспрессирует достаточное количество трансгена, чтобы оказывать влияние на субъекта, которое приводит к уменьшению одного или более симптомов заболевания, но не приводит к значительным нецелевым эффектам или значительным нежелательным побочным эффектам. Согласно одному варианту реализации «терапевтически эффективное количество» представляет собой количество экспрессированного белка FVIII, которое достаточно для получения статистически значимого, измеримого изменения экспрессии биомаркера гемофилии А или уменьшения симптома конкретного заболевания. Такие эффективные количества можно откалибровать в клинических исследованиях, а также в исследованиях на животных для конкретной композиции зкДНК-вектора.[00468] A "therapeutically effective dose" will be within a relatively wide range, which can be determined through clinical studies, and will depend on the specific application (nerve cells will require very small amounts, while systemic injection will require large amounts). For example, for direct in vivo injection into skeletal or cardiac muscle of a human subject, a therapeutically effective dose would be on the order of about 1 μg to 100 g of cccDNA vector. If exosomes or microparticles are used to deliver the cccDNA vector, the therapeutically effective dose can be determined experimentally but is expected to deliver between 1 μg and approximately 100 g of vector. Moreover, a therapeutically effective dose is an amount of cccDNA vector that expresses a sufficient amount of the transgene to produce an effect in a subject that results in a reduction in one or more symptoms of the disease, but does not result in significant off-target effects or significant unwanted side effects. In one embodiment, a “therapeutically effective amount” is an amount of expressed FVIII protein that is sufficient to produce a statistically significant, measurable change in the expression of a hemophilia A biomarker or reduction in a symptom of a particular disease. Such effective amounts can be calibrated in clinical studies as well as in animal studies for a particular cDNA vector composition.
[00469] Изготовление растворов фармацевтически приемлемых вспомогательных веществ и носителей хорошо известно специалистам в данной области техники, как и разработка подходящих схем дозирования и лечения для использования конкретных композиций, описанных в данном документе, в различных схемах лечения.[00469] The preparation of solutions of pharmaceutically acceptable excipients and carriers is well known to those skilled in the art, as is the development of suitable dosage and treatment regimens for use of the specific compositions described herein in various treatment regimens.
[00470] Для трансфекции in vitro эффективное количество зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе, для доставки в клетки (1×106 клеток) будет порядка от 0,1 до 100 мкг зкДНК-вектора, предпочтительно от 1 до 20 мкг и более предпочтительно от 1 до 15 мкг или от 8 до 10 мкг. Для более крупных зкДНК-векторов потребуются более высокие дозы. При использовании экзосом или микрочастиц, эффективная доза in vitro может быть определена экспериментально, но она будет предназначена для доставки в целом того же количества зкДНК-вектора.[00470] For in vitro transfection, an effective amount of cccDNA FVIII protein expression vectors disclosed herein for delivery into cells (1×10 6 cells) will be on the order of 0.1 to 100 μg of ccDNA vector, preferably 1 to 20 µg and more preferably 1 to 15 µg or 8 to 10 µg. Larger cccDNA vectors will require higher doses. When using exosomes or microparticles, the effective in vitro dose can be determined experimentally, but will be designed to deliver essentially the same amount of cccDNA vector.
[00471] Для лечения гемофилии А подходящая дозировка зкДНК-вектора, который экспрессирует белок FVIII, раскрытого в данном документе, будет зависеть от конкретного типа заболевания, подлежащего лечению, типа белка FVIII, степени тяжести и течения заболевания гемофилией А, предыдущей терапии, истории болезни пациента и реакции на антитело, а также от решения лечащего врача. ЗкДНК-вектор, кодирующий белок FVIII, подходящим образом вводят пациенту за один раз или в течение ряда обработок. В данном документе предусмотрены различные схемы дозирования, включая, но не ограничиваясь перечисленными, однократное или многократное введение в различные моменты времени, болюсное введение и импульсную инфузию.[00471] For the treatment of hemophilia A, the appropriate dosage of a cccDNA vector that expresses the FVIII protein disclosed herein will depend on the specific type of disease being treated, the type of FVIII protein, the severity and course of the hemophilia A disease, previous therapy, medical history patient and response to the antibody, as well as the decision of the attending physician. The cDNA vector encoding the FVIII protein is suitably administered to the patient at one time or over a series of treatments. Various dosing regimens are provided herein, including, but not limited to, single or multiple dosing at different times, bolus dosing, and pulse infusion.
[00472] В зависимости от типа и степени тяжести заболевания зкДНК-вектор вводят в количестве, при котором кодируемый белок FVIII экспрессируется в диапазоне от примерно 0,3 мг/кг до 100 мг/кг (например, от 15 мг/кг до 100 мг/кг или любой дозировке в пределах этого диапазона), с помощью одного или более отдельных введений или непрерывной инфузии. Одной типичной суточной дозы зкДНК-вектора достаточно, чтобы привести к экспрессии кодируемого белка FVIII в диапазоне от примерно 15 мг/кг до 100 мг/кг или более, в зависимости от факторов, упомянутых выше. Одна примерная доза зкДНК-вектора представляет собой количество, достаточное для того чтобы привести к экспрессии кодируемого белка FVIII, как раскрыто в данном документе, в диапазоне от примерно 10 мг/кг до примерно 50 мг/кг. Таким образом, пациенту может быть введена одна или более доз зкДНК-вектора в количестве, достаточном для того чтобы привести к экспрессии кодируемого белка FVIII при примерно 0,5 мг/кг, 1 мг/кг, 1,5 мг/кг, 2,0 мг/кг, 3 мг/кг, 4,0 мг/кг, 5 мг/кг, 10 мг/кг, 15 мг/кг, 20 мг/кг, 25 мг/кг, 30 мг/кг, 35 мг/кг, 40 мг/кг, 50 мг/кг, 60 мг/кг, 70 мг/кг, 80 мг/кг, 90 мг/кг или 100 мг/кг (или любой их комбинации). Согласно некоторым вариантам реализации зкДНК-вектор представляет собой количество, достаточное для того чтобы привести к экспрессии кодируемого белка FVIII для общей дозы в диапазоне от 50 мг до 2500 мг. Примерная доза зкДНК-вектора представляет собой количество, достаточное для того чтобы привести к общей экспрессии кодируемого белка FVIII примерно 50 мг, примерно 100 мг, 200 мг, 300 мг, 400 мг, примерно 500 мг, примерно 600 мг, примерно 700 мг, примерно 720 мг, примерно 1000 мг, примерно 1050 мг, примерно 1100 мг, примерно 1200 мг, примерно 1300 мг, примерно 1400 мг, примерно 1500 мг, примерно 1600 мг, примерно 1700 мг, примерно 1800 мг, примерно 1900 мг, примерно 2000 мг, примерно 2050 мг, примерно 2100 мг, примерно 2200 мг, примерно 2300 мг, примерно 2400 мг или примерно 2500 мг (или любой их комбинации). Поскольку экспрессию белка FVIII с зкДНК-вектора можно тщательно контролировать с помощью регуляторных переключателей в данном документе или, альтернативно, многократной дозы зкДНК-вектора, вводимой субъекту, экспрессию белка FVIII с зкДНК-вектора можно контролировать так, что дозы экспрессированного белка FVIII можно вводить с перерывами, например, каждую неделю, каждые две недели, каждые три недели, каждые четыре недели, каждый месяц, каждые два месяца, каждые три месяца или каждые шесть месяцев с зкДНК-вектора. Ход этой терапии можно контролировать с помощью обычных методик и анализов.[00472] Depending on the type and severity of the disease, the cccDNA vector is administered in an amount such that the encoded FVIII protein is expressed in the range of about 0.3 mg/kg to 100 mg/kg (e.g., 15 mg/kg to 100 mg /kg or any dosage within this range), by one or more separate administrations or continuous infusion. One typical daily dose of cccDNA vector is sufficient to result in expression of the encoded FVIII protein ranging from about 15 mg/kg to 100 mg/kg or more, depending on the factors mentioned above. One exemplary dose of cccDNA vector is an amount sufficient to result in expression of the encoded FVIII protein as disclosed herein, ranging from about 10 mg/kg to about 50 mg/kg. Thus, the patient may be administered one or more doses of the cccDNA vector in an amount sufficient to result in expression of the encoded FVIII protein at about 0.5 mg/kg, 1 mg/kg, 1.5 mg/kg, 2. 0 mg/kg, 3 mg/kg, 4.0 mg/kg, 5 mg/kg, 10 mg/kg, 15 mg/kg, 20 mg/kg, 25 mg/kg, 30 mg/kg, 35 mg/ kg, 40 mg/kg, 50 mg/kg, 60 mg/kg, 70 mg/kg, 80 mg/kg, 90 mg/kg or 100 mg/kg (or any combination thereof). In some embodiments, the cccDNA vector is in an amount sufficient to result in expression of the encoded FVIII protein for a total dose ranging from 50 mg to 2500 mg. An exemplary cDNA vector dose is an amount sufficient to result in total expression of the encoded FVIII protein of about 50 mg, about 100 mg, 200 mg, 300 mg, 400 mg, about 500 mg, about 600 mg, about 700 mg, about 720 mg, approximately 1000 mg, approximately 1050 mg, approximately 1100 mg, approximately 1200 mg, approximately 1300 mg, approximately 1400 mg, approximately 1500 mg, approximately 1600 mg, approximately 1700 mg, approximately 1800 mg, approximately 1900 mg, approximately 2000 mg , about 2050 mg, about 2100 mg, about 2200 mg, about 2300 mg, about 2400 mg, or about 2500 mg (or any combination thereof). Since the expression of the FVIII protein from the cccDNA vector can be carefully controlled using regulatory switches herein or, alternatively, multiple doses of the cccDNA vector administered to the subject, the expression of the FVIII protein from the cccDNA vector can be controlled such that doses of the expressed FVIII protein can be administered with intermittently, for example every week, every two weeks, every three weeks, every four weeks, every month, every two months, every three months or every six months with the cccDNA vector. The progress of this therapy can be monitored using routine techniques and tests.
[00473] Согласно определенным вариантам реализации зкДНК-вектор вводят в количестве, достаточном для того чтобы привести к экспрессии кодируемого белка FVIII в дозе 15 мг/кг, 30 мг/кг, 40 мг/кг, 45 мг/кг, 50 мг/кг, 60 мг/кг или в фиксированной дозе, например, 300 мг, 500 мг, 700 мг, 800 мг или выше. Согласно некоторым вариантам реализации экспрессию белка FVIII с зкДНК-вектора контролируют так, что белок FVIII экспрессируется каждый день, через день, каждую неделю, каждые 2 недели или каждые 4 недели в течение некоторого периода времени. Согласно некоторым вариантам реализации экспрессию белка FVIII с зкДНК-вектора контролируют так, что белок FVIII экспрессируется каждые 2 недели или каждые 4 недели в течение некоторого периода времени. Согласно определенным вариантам реализации период времени составляет 6 месяцев, один год, восемнадцать месяцев, два года, пять лет, десять лет, 15 лет, 20 лет или продолжительность жизни пациента.[00473] In certain embodiments, the cccDNA vector is administered in an amount sufficient to result in expression of the encoded FVIII protein at a dose of 15 mg/kg, 30 mg/kg, 40 mg/kg, 45 mg/kg, 50 mg/kg , 60 mg/kg or at a fixed dose, for example, 300 mg, 500 mg, 700 mg, 800 mg or higher. In some embodiments, expression of the FVIII protein from the cccDNA vector is controlled such that the FVIII protein is expressed every day, every other day, every week, every 2 weeks, or every 4 weeks for a period of time. In some embodiments, the expression of the FVIII protein from the cccDNA vector is controlled such that the FVIII protein is expressed every 2 weeks or every 4 weeks for a period of time. In certain embodiments, the time period is 6 months, one year, eighteen months, two years, five years, ten years, 15 years, 20 years, or the lifespan of the patient.
[00474] Лечение может включать введение однократной дозы или многократных доз. Согласно некоторым вариантам реализации субъекту можно вводить более одной дозы; фактически, при необходимости можно вводить многократные дозы, поскольку зкДНК-вектор не вызывает иммунного ответа хозяина против капсида ввиду отсутствия вирусного капсида. Таким образом, специалист в данной области техники может легко определить подходящее количество доз. Количество вводимых доз может составлять, например, порядка 1-100, предпочтительно 2-20 доз.[00474] Treatment may include administration of a single dose or multiple doses. In some embodiments, more than one dose may be administered to a subject; in fact, multiple doses can be administered if necessary, since the cDNA vector does not induce a host immune response against the capsid due to the absence of a viral capsid. Thus, a person skilled in the art can easily determine the appropriate number of doses. The number of doses administered may be, for example, on the order of 1-100, preferably 2-20 doses.
[00475] Не ограничиваясь какой-либо конкретной теорией, отсутствие типичного противовирусного иммунного ответа, вызванного введением зкДНК-вектора, как описано в настоящем раскрытии (т.е. отсутствие компонентов капсида), позволяет вводить хозяину зкДНК-вектор для экспрессии белка FVIII несколько раз. Согласно некоторым вариантам реализации количество раз доставки гетерологичной нуклеиновой кислоты субъекту находится в диапазоне от 2 до 10 раз (например, 2, 3, 4, 5, 6, 7, 8, 9 или 10 раз). Согласно некоторым вариантам реализации зкДНК-вектор доставляют субъекту более 10 раз.[00475] Without being limited to any particular theory, the absence of the typical antiviral immune response caused by the administration of a cccDNA vector as described in the present disclosure (i.e., the absence of capsid components) allows the ccDNA vector to be administered to the host to express the FVIII protein multiple times. . In some embodiments, the number of times the heterologous nucleic acid is delivered to a subject ranges from 2 to 10 times (eg, 2, 3, 4, 5, 6, 7, 8, 9, or 10 times). In some embodiments, the cDNA vector is delivered to a subject more than 10 times.
[00476] Согласно некоторым вариантам реализации дозу зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, вводят субъекту не чаще одного раза в календарный день (например, в течение 24-часового периода). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в 2, 3, 4, 5, 6 или 7 календарных дней. Согласно некоторым вариантам реализации дозу зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, вводят субъекту не чаще одного раза в календарную неделю (например, 7 календарных дней). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще, чем один раз в две недели (например, один раз в период в две календарные недели). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в календарный месяц (например, один раз в 30 календарных дней). Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в шесть календарных месяцев. Согласно некоторым вариантам реализации дозу зкДНК-вектора вводят субъекту не чаще одного раза в календарный год (например, 365 дней или 366 дней в високосный год).[00476] In some embodiments, a dose of the cDNA FVIII protein expression vector disclosed herein is administered to a subject no more than once per calendar day (eg, over a 24-hour period). In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once every 2, 3, 4, 5, 6, or 7 calendar days. In some embodiments, a dose of the cDNA FVIII protein expression vector disclosed herein is administered to a subject no more than once per calendar week (eg, 7 calendar days). In some embodiments, a dose of the cccDNA vector is administered to a subject no more frequently than once every two weeks (eg, once every two calendar weeks). In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once per calendar month (eg, once every 30 calendar days). In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once every six calendar months. In some embodiments, a dose of the cccDNA vector is administered to a subject no more than once per calendar year (eg, 365 days or 366 days in a leap year).
[00477] В конкретных вариантах реализации для достижения целевого уровня экспрессии гена на протяжении различных периодов времени, например, ежедневно, еженедельно, ежемесячно, ежегодно и т.д., можно использовать более одного введения (например, два, три, четыре или более введений) зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе.[00477] In particular embodiments, more than one administration (e.g., two, three, four or more administrations) may be used to achieve a target level of gene expression over various periods of time, e.g., daily, weekly, monthly, annually, etc. ) cDNA vector for expression of the FVIII protein disclosed herein.
[00478] Согласно некоторым вариантам реализации терапевтический белок FVIII, кодируемый зкДНК-вектором, раскрытым в данном документе, можно регулировать с помощью регуляторного переключателя, индуцируемого или репрессируемого промотора так, что он экспрессируется у субъекта в течение по меньшей мере 1 часа, по меньшей мере 2 часов, по меньшей мере 5 часов, по меньшей мере 10 часов, по меньшей мере 12 часов, по меньшей мере 18 часов, по меньшей мере 24 часов, по меньшей мере 36 часов, по меньшей мере 48 часов, по меньшей мере 72 часов, по меньшей мере 1 недели, по меньшей мере 2 недель, по меньшей мере 1 месяца, по меньшей мере 2 месяцев, по меньшей мере 6 месяцев, по меньшей мере 12 месяцев/одного года, по меньшей мере 2 лет, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 15 лет, по меньшей мере 20 лет, по меньшей мере 30 лет, по меньшей мере 40 лет, по меньшей мере 50 лет или более. Согласно одному варианту реализации экспрессия может быть достигнута путем повторного введения зкДНК-векторов, описанных в данном документе, через заранее определенные или желательные интервалы. В качестве альтернативы, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может дополнительно содержать компоненты системы редактирования генов (например, CRISPR/Cas, TALEN, эндонуклеазы цинковых пальцев и т.д.), что позволяет вставлять одну или более последовательностей нуклеиновых кислот, кодирующих белок FVIII, для по существу постоянного лечения или «излечения» заболевания. Такие зкДНК-векторы, содержащие компоненты редактирования генов, раскрыты в международной заявке PCT/US18/64242 и могут включать 5' и 3' плечи гомологии (например, SEQ ID NO: 151-154, или последовательности, имеющие по меньшей мере 40%, 50%, 60%, 70% или 80% гомологии с ними) для вставки нуклеиновой кислоты, кодирующей белок FVIII, в области «безопасной гавани», такие как, но не включая их, ген альбумина или ген CCR5. В качестве примера, зкДНК-вектор, экспрессирующий белок FVIII, может содержать по меньшей мере одно плечо гомологии, специфичное в отношении геномной «безопасной гавани» (GSH), для встраивания трансгена FVIII в геномную «безопасную гавань», как раскрыто в международной заявке на патент PCT/US2019/020225, поданной 1 марта 2019 г., которая полностью включена в данный документ посредством ссылки.[00478] In some embodiments, a therapeutic FVIII protein encoded by a cccDNA vector disclosed herein can be regulated by a regulatory switch, an inducible or a repressible promoter such that it is expressed in a subject for at least 1 hour, for at least 1 hour 2 hours, at least 5 hours, at least 10 hours, at least 12 hours, at least 18 hours, at least 24 hours, at least 36 hours, at least 48 hours, at least 72 hours , at least 1 week, at least 2 weeks, at least 1 month, at least 2 months, at least 6 months, at least 12 months/one year, at least 2 years, at least 5 years, at least 10 years, at least 15 years, at least 20 years, at least 30 years, at least 40 years, at least 50 years or more. In one embodiment, expression can be achieved by reintroducing the cccDNA vectors described herein at predetermined or desired intervals. Alternatively, the cDNA FVIII protein expression vector disclosed herein may further contain gene editing system components (e.g., CRISPR/Cas, TALEN, zinc finger endonucleases, etc.) that allow the insertion of one or more sequences nucleic acids encoding the FVIII protein for a substantially permanent treatment or “cure” of a disease. Such cccDNA vectors containing gene editing components are disclosed in international application PCT/US18/64242 and may include 5' and 3' homology arms (for example, SEQ ID NO: 151-154, or sequences having at least 40% 50%, 60%, 70%, or 80% homology thereto) to insert a nucleic acid encoding the FVIII protein into a safe harbor region such as, but not including, the albumin gene or the CCR5 gene. As an example, a cccDNA vector expressing an FVIII protein may contain at least one genomic safe harbor (GSH)-specific homology arm for inserting an FVIII transgene into a genomic safe harbor, as disclosed in the international application patent PCT/US2019/020225, filed March 1, 2019, which is incorporated herein by reference in its entirety.
[00479] Продолжительность лечения зависит от клинического прогресса и ответа пациента на терапию. Предусмотрено непрерывное введение относительно низких поддерживающих доз после начальной более высокой терапевтической дозы.[00479] The duration of treatment depends on clinical progress and the patient's response to therapy. Continuous administration of relatively low maintenance doses after an initial higher therapeutic dose is provided.
Е. Единичные лекарственные формыE. Unit dosage forms
[00480] Согласно некоторым вариантам реализации фармацевтические композиции, содержащие зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, могут быть удобно представлены в виде единичной лекарственной формы. Единичная лекарственная форма, как правило, адаптирована для одного или более конкретных путей введения фармацевтической композиции. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для капель, которые будут введены непосредственно в глаз. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения путем ингаляции. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью испарителя. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью небулайзера. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для введения с помощью генератора аэрозоля. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для перорального введения, для буккального введения или для сублингвального введения. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для внутривенного, внутримышечного или подкожного введения. Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для субретинальной инъекции, супрахориоидальной инъекции или интравитреальной инъекции.[00480] In some embodiments, pharmaceutical compositions containing the cDNA FVIII protein expression vector disclosed herein may be conveniently presented in a unit dosage form. The unit dosage form is typically adapted for one or more specific routes of administration of the pharmaceutical composition. In some embodiments, the unit dosage form is adapted for drops that will be administered directly into the eye. In some embodiments, the unit dosage form is adapted for administration by inhalation. In some embodiments, the unit dosage form is adapted for administration via a vaporizer. In some embodiments, the unit dosage form is adapted for administration via a nebulizer. In some embodiments, the unit dosage form is adapted for administration using an aerosol generator. In some embodiments, the unit dosage form is adapted for oral administration, for buccal administration, or for sublingual administration. In some embodiments, the unit dosage form is adapted for intravenous, intramuscular, or subcutaneous administration. In some embodiments, the unit dosage form is adapted for subretinal injection, suprachoroidal injection, or intravitreal injection.
[00481] Согласно некоторым вариантам реализации единичная лекарственная форма адаптирована для интратекального или интрацеребровентрикулярного введения. Согласно некоторым вариантам реализации фармацевтическая композиция изготовлена для местного введения. Количество активного ингредиента, которое можно комбинировать с материалом носителя для получения единичной лекарственной формы, обычно будет представлять собой количество соединения, которое вызывает терапевтический эффект.[00481] In some embodiments, the unit dosage form is adapted for intrathecal or intracerebroventricular administration. In some embodiments, the pharmaceutical composition is formulated for topical administration. The amount of active ingredient that can be combined with the carrier material to form a unit dosage form will generally be the amount of compound that produces a therapeutic effect.
X. Способы леченияX. Treatment methods
[00482] Технология, описанная в данном документе, также демонстрирует способы получения, а также способы применения раскрытых зкДНК-векторов для экспрессии белка FVIII различными путями, включая, например, ex vivo, ex situ, in vitro и in vivo приложения, методологии, диагностические процедуры и/или схемы генной терапии.[00482] The technology described herein also demonstrates methods for preparing, as well as methods for using, the disclosed cccDNA vectors for expression of FVIII protein in various ways, including, for example, ex vivo, ex situ, in vitro and in vivo applications, methodologies, diagnostic gene therapy procedures and/or regimens.
[00483] Согласно одному варианту реализации экспрессированный терапевтический белок FVIII, экспрессируемый с зкДНК-вектора, раскрытого в данном документе, является функциональным для лечения заболевания. Согласно предпочтительному варианту реализации терапевтический белок FVIII не вызывает реакции иммунной системы, если этого не требуется.[00483] In one embodiment, the expressed therapeutic FVIII protein expressed from a cccDNA vector disclosed herein is functional for treating a disease. In a preferred embodiment, the FVIII therapeutic protein does not cause an immune system response unless required.
[00484] В данном документе предложен способ лечения гемофилии А у субъекта, включающий введение в клетку-мишень, которая нуждается в этом (например, мышечную клетку или ткань, или другой тип пораженных клеток), указанного субъекта терапевтически эффективного количества зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, необязательно с фармацевтически приемлемым носителем. Несмотря на то, что зкДНК-вектор может быть введен в присутствии носителя, такой носитель не является необходимым. Реализованный зкДНК-вектор содержит нуклеотидную последовательность, кодирующую белок FVIII, как описано в данном документе, которую можно применять для лечения заболевания. В частности, зкДНК-вектор для экспрессии белка FVIII может содержать целевую последовательность ДНК белка FVIII, функционально связанную с контрольными элементами, способными управлять транскрипцией целевого белка FVIII, кодируемого экзогенной последовательностью ДНК, при введении в организм субъекта. ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть введен любым подходящим путем, как описано выше и в других разделах настоящего документа.[00484] Provided herein is a method of treating hemophilia A in a subject, comprising administering to a target cell in need thereof (e.g., a muscle cell or tissue, or other type of affected cell) a therapeutically effective amount of a cccDNA expression vector of the subject. the FVIII protein disclosed herein, optionally with a pharmaceutically acceptable carrier. Although the cDNA vector can be introduced in the presence of a carrier, such a carrier is not necessary. The implemented cccDNA vector contains a nucleotide sequence encoding the FVIII protein as described herein, which can be used to treat a disease. In particular, a cccDNA vector for FVIII protein expression may comprise a target FVIII protein DNA sequence operably linked to control elements capable of directing transcription of the target FVIII protein encoded by the exogenous DNA sequence when introduced into a subject. The cDNA FVIII protein expression vector disclosed herein can be administered by any suitable route as described above and elsewhere herein.
[00485] В данном документе раскрыты композиции и составы зкДНК-векторов для экспрессии белка FVIII, как раскрыто в данном документе, которые включают один или более зкДНК-векторов согласно настоящему изобретению вместе с одним или более фармацевтически приемлемыми буферами, разбавителями или вспомогательными веществами. Такие композиции могут быть включены в один или более диагностических или терапевтических наборов для диагностики, предотвращения, лечения или облегчения одного или более симптомов гемофилии А. В одном аспекте заболевание, поражение, нарушение, травма или дисфункция представляет собой заболевание, поражение, нарушение, травму или дисфункцию человека.[00485] Disclosed herein are compositions and formulations of cccDNA vectors for expression of FVIII protein as disclosed herein, which include one or more ccDNA vectors of the present invention along with one or more pharmaceutically acceptable buffers, diluents or excipients. Such compositions may be included in one or more diagnostic or therapeutic kits for diagnosing, preventing, treating, or alleviating one or more symptoms of hemophilia A. In one aspect, the disease, lesion, disorder, injury, or dysfunction is a disease, lesion, disorder, injury, or human dysfunction.
[00486] Другой аспект технологии, описанной в данном документе, обеспечивает способ обеспечения субъекту, нуждающемуся в этом, диагностически или терапевтически эффективного количества зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, причем указанный способ включает обеспечение в клетке, ткани или органе субъекта, нуждающегося в этом, количества зкДНК-вектора, раскрытого в данном документе; и в течение времени, эффективного для обеспечения экспрессии белка FVIII с зкДНК-вектора, что обеспечивает субъекту диагностически или терапевтически эффективное количество белка FVIII, экспрессируемого зкДНК-вектором. Согласно дополнительному аспекту субъект представляет собой человека.[00486] Another aspect of the technology described herein provides a method of providing to a subject in need thereof a diagnostically or therapeutically effective amount of a cDNA vector for expressing the FVIII protein disclosed herein, the method comprising providing in a cell, tissue or organ the subject in need thereof, the amount of cccDNA vector disclosed herein; and for a time effective to cause FVIII protein to be expressed from the cccDNA vector, thereby providing the subject with a diagnostically or therapeutically effective amount of FVIII protein expressed by the cccDNA vector. According to a further aspect, the subject is a human being.
[00487] Другой аспект технологии, описанной в данном документе, обеспечивает способ диагностики, предотвращения, лечения или облегчения по меньшей мере одного или более симптомов гемофилии А, нарушения, дисфункции, поражения, аномального состояния или травмы у субъекта. В целом и в общем смысле, способ включает по меньшей мере этап введения субъекту, нуждающемуся в этом, одного или более из раскрытых зкДНК-векторов для продукции белка FVIII в количестве и в течение времени, достаточных для диагностики, предотвращения, лечения или облегчения одного или более симптомов заболевания, нарушения, дисфункции, поражения, аномального состояния или травмы у субъекта. В таком варианте реализации у субъекта может быть оценена эффективность белка FVIII или, альтернативно, проведено детектирование белка FVIII или тканевого расположения белка FVIII (включая клеточное и субклеточное расположение) у субъекта. Таким образом, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять в качестве диагностического инструмента in vivo, например, для детектирования рака или других показаний. Согласно дополнительному аспекту субъект представляет собой человека.[00487] Another aspect of the technology described herein provides a method for diagnosing, preventing, treating, or alleviating at least one or more hemophilia A symptoms, disorder, dysfunction, lesion, abnormal condition, or injury in a subject. Generally and generally, the method includes at least the step of administering to a subject in need thereof one or more of the disclosed cccDNA vectors for producing FVIII protein in an amount and for a time sufficient to diagnose, prevent, treat, or alleviate one or more more symptoms of disease, disorder, dysfunction, lesion, abnormal condition, or injury in the subject. In such an embodiment, the potency of the FVIII protein may be assessed in the subject, or alternatively, the FVIII protein or tissue location of the FVIII protein (including cellular and subcellular location) in the subject may be detected. Thus, the cDNA FVIII protein expression vector disclosed herein can be used as an in vivo diagnostic tool, for example, for detecting cancer or other indications. According to a further aspect, the subject is a human being.
[00488] Другим аспектом является применение зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, в качестве инструмента для лечения или уменьшения одного или более симптомов гемофилии А или патологических состояний. Существует ряд наследственных заболеваний, при которых известны дефектные гены, и, как правило, они делятся на два класса: дефицитные состояния, обычно ферментов, которые обычно наследуются рецессивным образом, и несбалансированные состояния, которые могут включать регуляторные или структурные белки и которые, как правило, но не всегда, наследуются доминантным образом. Для несбалансированных патологических состояний зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для создания состояния гемофилии А в модельной системе, которую затем можно использовать в мероприятиях по противодействию патологическому состоянию. Таким образом, зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, позволяет лечить генетические заболевания. В данном документе состояние гемофилии А лечат путем частичного или полного излечения дефицита или дисбаланса, который вызывает заболевание или делает его более тяжелым.[00488] Another aspect is the use of a cccDNA vector for expressing the FVIII protein disclosed herein as a tool for treating or reducing one or more hemophilia A symptoms or conditions. There are a number of inherited diseases in which defective genes are known, and they generally fall into two classes: deficiency conditions, usually of enzymes, which are usually inherited in a recessive manner, and imbalanced conditions, which may involve regulatory or structural proteins and which are typically , but not always, are inherited in a dominant manner. For unbalanced disease conditions, the cDNA FVIII protein expression vector disclosed herein can be used to create the hemophilia A condition in a model system, which can then be used in interventions to counteract the disease condition. Thus, the cccDNA vector for expression of FVIII protein disclosed herein allows the treatment of genetic diseases. Herein, the condition of hemophilia A is treated by partially or completely correcting the deficiency or imbalance that causes the disease or makes it more severe.
А. Клетки-хозяеваA. Host cells
[00489] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, доставляет трансген белка FVIII в рассматриваемую клетку-хозяина. Согласно некоторым вариантам реализации клетки представляют собой фоторецепторные клетки. Согласно некоторым вариантам реализации клетки представляют собой клетки RPE. Согласно некоторым вариантам реализации рассматриваемая клетка-хозяин представляет собой клетку-хозяина человека, включая, например, клетки крови, стволовые клетки, гемопоэтические клетки, CD34+ клетки, клетки печени, раковые клетки, сосудистые клетки, мышечные клетки, клетки поджелудочной железы, нервные клетки, клетки глаза или клетки сетчатки, эпителиальные или эндотелиальные клетки, дендритные клетки, фибробласты или любые другие клетки, происходящие от млекопитающего, включая, без ограничения, клетки печени (т.е. печеночные), клетки легких, сердечные клетки, клетки поджелудочной железы, клетки кишечника, диафрагмальные клетки, почечные клетки (т.е. почки), нервные клетки, клетки крови, клетки костного мозга или любой одной или более выбранных тканей субъекта, для которых предусмотрена генная терапия. В одном аспекте рассматриваемая клетка-хозяин представляет собой клетку-хозяина человека.[00489] In some embodiments, the cDNA FVIII protein expression vector disclosed herein delivers a FVIII protein transgene into a host cell of interest. In some embodiments, the cells are photoreceptor cells. In some embodiments, the cells are RPE cells. In some embodiments, the host cell in question is a human host cell, including, for example, blood cells, stem cells, hematopoietic cells, CD34 + cells, liver cells, cancer cells, vascular cells, muscle cells, pancreatic cells, nerve cells , eye cells or retinal cells, epithelial or endothelial cells, dendritic cells, fibroblasts or any other cells derived from a mammal, including, without limitation, liver cells (i.e. liver cells), lung cells, cardiac cells, pancreatic cells, intestinal cells, diaphragmatic cells, renal cells (ie, kidneys), nerve cells, blood cells, bone marrow cells, or any one or more selected tissues of the subject for which gene therapy is provided. In one aspect, the host cell in question is a human host cell.
[00490] Настоящее раскрытие также относится к рекомбинантным клеткам-хозяевам, как упомянуто выше, включая зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе. Таким образом, можно использовать несколько клеток-хозяев в зависимости от цели, что очевидно для квалифицированного специалиста. Конструкцию или зкДНК-вектор для экспрессии белка FVIII, раскрытые в данном документе, включая донорную последовательность, вводят в клетку-хозяина так, что донорная последовательность поддерживается в интегрированном в хромосому виде, как описано ранее. Термин «клетка-хозяин» включает любое потомство родительской клетки, которое не идентично родительской клетке из-за мутаций, происходящих во время репликации. Выбор клетки-хозяина будет в значительной степени зависеть от донорной последовательности и ее источника.[00490] The present disclosure also relates to recombinant host cells as mentioned above, including the cDNA FVIII protein expression vector disclosed herein. Thus, multiple host cells can be used depending on the purpose, as will be apparent to those skilled in the art. The FVIII protein expression construct or cDNA vector disclosed herein, including the donor sequence, is introduced into a host cell such that the donor sequence is maintained integrated into the chromosome as previously described. The term "host cell" includes any progeny of a parent cell that is not identical to the parent cell due to mutations occurring during replication. The choice of host cell will largely depend on the donor sequence and its source.
[00491] Клетка-хозяин также может представлять собой эукариота, например, клетку млекопитающего, насекомого, растения или гриба. Согласно одному варианту реализации клетка-хозяин представляет собой клетку человека (например, первичную клетку, стволовую клетку или иммортализо ванную линию клеток). Согласно некоторым вариантам реализации в клетку-хозяина можно вводить зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, ex vivo, а затем доставлять субъекту после события генной терапии. Клетка-хозяин может представлять собой любой тип клеток, например, соматическую клетку или стволовую клетку, индуцированную плюрипотентную стволовую клетку или клетку крови, например, Т-клетку или В-клетку, или клетку костного мозга. Согласно определенным вариантам реализации клетка-хозяин представляет собой аллогенную клетку. Например, конструирование Т-клеточного генома можно применять для разных видов иммунотерапии рака, модуляции заболевания, такой как терапия ВИЧ (например, нокаут рецептора, такого как CXCR4 и CCR5), и разных видов терапии иммунодефицита. Мишенями для иммунотерапии могут быть рецепторы ГКГС на В-клетках. Согласно некоторым вариантам реализации клетки-хозяева с модифицированным геномом, например, стволовые клетки костного мозга, например, CD34+ клетки, или индуцированные плюрипотентные стволовые клетки могут быть трансплантированы обратно пациенту для экспрессии терапевтического белка. В. Дополнительные заболевания для генной терапии:[00491] The host cell may also be a eukaryote, such as a mammalian, insect, plant or fungal cell. In one embodiment, the host cell is a human cell (eg, a primary cell, stem cell, or immortalized cell line). In some embodiments, a cDNA FVIII protein expression vector disclosed herein can be introduced into a host cell ex vivo and then delivered to the subject following a gene therapy event. The host cell may be any type of cell, such as a somatic cell or stem cell, an induced pluripotent stem cell, or a blood cell, such as a T cell or B cell, or a bone marrow cell. In certain embodiments, the host cell is an allogeneic cell. For example, T cell genome engineering can be used for various cancer immunotherapies, disease modulation such as HIV therapy (eg, receptor knockout such as CXCR4 and CCR5), and various immunodeficiency therapies. MHC receptors on B cells may be targets for immunotherapy. In some embodiments, genome-edited host cells, such as bone marrow stem cells, such as CD34 + cells, or induced pluripotent stem cells, can be transplanted back into the patient to express the therapeutic protein. B. Additional diseases for gene therapy:
[00492] В целом зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для доставки любого белка FVIII в соответствии с приведенным выше описанием для лечения, предотвращения или облегчения симптомов, ассоциированных с гемофилией А, связанной с нарушенной экспрессией белка или экспрессией гена у субъекта.[00492] In general, the cDNA FVIII protein expression vector disclosed herein can be used to deliver any FVIII protein as described above to treat, prevent, or alleviate symptoms associated with hemophilia A associated with impaired protein expression or gene expression in the subject.
[00493] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно применять для доставки белка FVIII в скелетную, сердечную или диафрагмальную мышцу, для продукции белка FVIII для секреции и циркуляции в крови или для системной доставки в другие ткани для лечения, облегчения и/или предотвращения гемофилии А.[00493] In some embodiments, the cDNA FVIII protein expression vector disclosed herein can be used to deliver FVIII protein to skeletal, cardiac, or diaphragmatic muscle, to produce FVIII protein for secretion and circulation in the blood, or for systemic delivery to other tissues for the treatment, relief and/or prevention of hemophilia A.
[00494] ЗкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно вводить в легкие субъекта с помощью любых подходящих средств, необязательно путем введения аэрозольной суспензии пригодных для вдыхания частиц, содержащих зкДНК-векторы, которые субъект вдыхает. Пригодные для вдыхания частицы могут быть жидкими или твердыми. Аэрозоли жидких частиц, содержащих зкДНК-векторы, могут быть получены с помощью любых подходящих средств, таких как аэрозольный небулайзер под давлением или ультразвуковой небулайзер, как известно специалистам в данной области техники. См., например, патент США №4501729. Аэрозоли твердых частиц, содержащих зкДНК-векторы, могут быть получены сходным образом с помощью любого генератора аэрозолей лекарственного средства в виде твердых частиц с помощью методик, известных в фармацевтике.[00494] The cDNA FVIII protein expression vector disclosed herein can be administered to the lungs of a subject by any suitable means, optionally by administering an aerosol suspension of respirable particles containing the cDNA vectors, which the subject inhales. Respirable particles can be liquid or solid. Aerosols of liquid particles containing cccDNA vectors can be produced using any suitable means, such as a pressurized aerosol nebulizer or an ultrasonic nebulizer, as known to those skilled in the art. See, for example, US Pat. No. 4,501,729. Particulate aerosols containing cccDNA vectors can be similarly generated using any particulate drug aerosol generator using techniques known in the pharmaceutical art.
[00495] Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, можно вводить в ткани ЦНС (например, головной мозг, глаз).[00495] In some embodiments, the cDNA FVIII protein expression vector disclosed herein can be administered to CNS tissues (eg, brain, eye).
[00496] Глазные нарушения, которые можно лечить, облегчать или предотвращать с помощью зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе, включают офтальмологические расстройства, затрагивающие сетчатку, задний тракт и зрительный нерв (например, пигментный ретинит, диабетическую ретинопатию и другие дегенеративные заболевания сетчатки, увеит, возрастную дегенерацию макулы, глаукому). Многие офтальмологические заболевания и нарушения ассоциированы с одним или более из трех типов показаний: (1) ангиогенезом, (2) воспалением и (3) дегенерацией. Согласно некоторым вариантам реализации зкДНК-вектор, раскрытый в данном документе, можно применять для доставки антиангиогенных факторов; противовоспалительных факторов; факторов, которые замедляют дегенерацию клеток, способствуют сохранению клеток или способствуют росту клеток, и комбинаций перечисленных выше. Например, диабетическая ретинопатия характеризуется ангиогенезом. Диабетическую ретинопатию можно лечить путем доставки одного или более антиангиогенных антител или слитых белков интраокулярно (например, в стекловидное тело) или периокулярно (например, в субтеноновую область). Дополнительные глазные заболевания, которые можно лечить, облегчать или предотвращать с помощью зкДНК-векторов согласно настоящему изобретению, включают географическую атрофию, сосудистую или «влажную» дегенерацию макулы, ФКУ, врожденный амавроз Лебера (LCA), синдром Ушера, эластическую псевдоксантому (РХЕ), х-связанный пигментный ретинит (XLRP), х-связанное расслоение сетчатки (XLRS), хороидеремию, наследственную оптическую нейропатию Лебера (LHON), архоматопсию, палочко-колбочковую дистрофию, эндотелиальную дистрофию роговицы Фукса, диабетический макулярный отек и глазной рак или опухоли.[00496] Ocular disorders that may be treated, ameliorated, or prevented by the cccDNA FVIII protein expression vector disclosed herein include ophthalmic disorders affecting the retina, posterior tract, and optic nerve (e.g., retinitis pigmentosa, diabetic retinopathy, and others degenerative retinal diseases, uveitis, age-related macular degeneration, glaucoma). Many ophthalmic diseases and disorders are associated with one or more of three types of indications: (1) angiogenesis, (2) inflammation, and (3) degeneration. In some embodiments, the cccDNA vector disclosed herein can be used to deliver antiangiogenic factors; anti-inflammatory factors; factors that slow cell degeneration, promote cell preservation or promote cell growth, and combinations of the above. For example, diabetic retinopathy is characterized by angiogenesis. Diabetic retinopathy can be treated by delivering one or more antiangiogenic antibodies or fusion proteins intraocularly (eg, into the vitreous) or periocularly (eg, into the sub-Tenon's region). Additional ocular diseases that may be treated, ameliorated, or prevented by the cccDNA vectors of the present invention include geographic atrophy, vascular or wet macular degeneration, PKU, Leber congenital amaurosis (LCA), Usher syndrome, pseudoxanthoma elasticum (PXE), X-linked retinitis pigmentosa (XLRP), X-linked retinal separation (XLRS), choroideremia, Leber hereditary optic neuropathy (LHON), archomatopsia, rod-cone dystrophy, Fuchs' corneal endothelial dystrophy, diabetic macular edema, and ocular cancers or tumors.
[00497] Согласно некоторым вариантам реализации воспалительные глазные заболевания или нарушения (например, увеит) можно лечить, облегчать или предупреждать с помощью зкДНК-вектора для экспрессии белка FVIII, раскрытого в данном документе. Одно или более противовоспалительных антител или слитых белков могут быть экспрессированы путем внутриглазного (например, стекловидное тело или передняя камера) введения зкДНК-вектора, раскрытого в данном документе.[00497] In some embodiments, inflammatory ocular diseases or disorders (eg, uveitis) can be treated, ameliorated, or prevented using a cccDNA FVIII protein expression vector disclosed herein. One or more anti-inflammatory antibodies or fusion proteins can be expressed by intraocular (eg, vitreous or anterior chamber) administration of a cccDNA vector disclosed herein.
Согласно некоторым вариантам реализации зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может кодировать белок FVIII, который ассоциирован с трансгеном, кодирующим репортерный полипептид (например, фермент, такой как зеленый флуоресцентный белок или щелочная фосфатаза). Согласно некоторым вариантам реализации трансген, который кодирует репортерный белок, подходящий для экспериментальных или диагностических целей, выбирают из любого из: р-лактамазы, р-галактозидазы (LacZ), щелочной фосфатазы, тимидинкиназы, зеленого флуоресцентного белка (GFP), хлорамфениколацетилтрансферазы (CAT), люциферазы и других, хорошо известных в данной области техники. В некоторых аспектах зкДНК-векторы, экспрессирующие белок FVIII, связанный с репортерный полипептидом, можно применять для диагностических целей, а также для определения эффективности или в качестве маркеров активности зкДНК-вектора у субъекта, которому их вводят.In some embodiments, the cDNA FVIII protein expression vector disclosed herein may encode an FVIII protein that is associated with a transgene encoding a reporter polypeptide (e.g., an enzyme such as green fluorescent protein or alkaline phosphatase). In some embodiments, the transgene that encodes a reporter protein suitable for experimental or diagnostic purposes is selected from any of: p-lactamase, p-galactosidase (LacZ), alkaline phosphatase, thymidine kinase, green fluorescent protein (GFP), chloramphenicol acetyltransferase (CAT) , luciferase and others well known in the art. In some aspects, cccDNA vectors expressing FVIII protein coupled to a reporter polypeptide can be used for diagnostic purposes, as well as to determine the efficacy of, or as markers of, the activity of the cccDNA vector in the subject to which they are administered.
С. Тестирование успешной экспрессии гена с использованием зкДНК-вектораC. Testing for successful gene expression using a cccDNA vector
[00498] Для тестирования эффективности доставки гена белка FVIII с помощью зкДНК-вектора можно использовать анализы, хорошо известные в данной области техники, которые можно выполнять как на моделях in vitro, так и на моделях in vivo. Уровни экспрессии белка FVIII с помощью зкДНК могут быть оценены специалистом в данной области техники путем измерения уровней мРНК и белка FVIII (например, ГЩР с обратной транскрипцией, анализ методом Вестерн-блоттинга и иммуноферментный анализ (ИФА)). Согласно одному варианту реализации зкДНК содержит репортерный белок, который можно использовать для оценки экспрессии белка FVIII, например, путем исследования экспрессии репортерного белка с помощью флуоресцентной микроскопии или устройства для считывания люминесценции планшетов. В случае приложений in vivo для тестирования функциональности данного белка FVIII можно использовать анализы функции белков, чтобы определить успешность экспрессии гена. Специалист сможет определить лучший тест для измерения функциональности белка FVIII, экспрессируемого вектором зкДНК, in vitro или in vivo.[00498] To test the efficiency of delivery of the FVIII protein gene using a cccDNA vector, assays well known in the art can be used, which can be performed in both in vitro and in vivo models. Levels of FVIII protein expression by cccDNA can be assessed by one skilled in the art by measuring FVIII mRNA and protein levels (eg, reverse transcription HAZM, Western blot analysis, and enzyme-linked immunosorbent assay (ELISA)). In one embodiment, the cccDNA contains a reporter protein that can be used to assess FVIII protein expression, for example, by examining reporter protein expression using fluorescence microscopy or a luminescence plate reader. For in vivo applications, protein function assays can be used to test the functionality of a given FVIII protein to determine the success of gene expression. One skilled in the art will be able to determine the best test to measure the functionality of the FVIII protein expressed by the cccDNA vector, in vitro or in vivo.
[00499] В данном документе предусмотрено, что эффекты экспрессии гена белка FVIII с зкДНК-вектора в клетке или у субъекта могут длиться по меньшей мере 1 месяц, по меньшей мере 2 месяца, по меньшей мере 3 месяца, по меньшей мере четыре месяца, по меньшей мере 5 месяцев, по меньшей мере шесть месяцев, по меньшей мере 10 месяцев, по меньшей мере 12 месяцев, по меньшей мере 18 месяцев, по меньшей мере 2 года, по меньшей мере 5 лет, по меньшей мере 10 лет, по меньшей мере 20 лет или они могут быть постоянными.[00499] It is provided herein that the effects of expression of the FVIII protein gene from a cccDNA vector in a cell or subject may last for at least 1 month, at least 2 months, at least 3 months, at least four months, at least 5 months, at least six months, at least 10 months, at least 12 months, at least 18 months, at least 2 years, at least 5 years, at least 10 years, at least 20 years or they can be permanent.
[00500] Согласно некоторым вариантам реализации белок FVIII в экспрессионной кассете, экспрессионной конструкции или зкДНК-векторе, описанных в данном документе, может быть оптимизирован по кодонам для клетки-хозяина. В данном документе термин «оптимизированный по кодонам» или «оптимизация кодонов» относится к процессу модификации последовательности нуклеиновой кислоты для усиления экспрессии в клетках позвоночного, представляющего интерес, например, мыши или человека (например, гуманизация), путем замены по меньшей мере одного или более чем одного или значительного числа кодонов нативной последовательности (например, прокариотической последовательности) кодонами, которые чаще или наиболее часто используются в генах этого позвоночного. Различные виды проявляют определенное предпочтение в отношении некоторых кодонов конкретной аминокислоты. Как правило, оптимизация кодонов не изменяет аминокислотную последовательность исходного транслированного белка. Оптимизированные кодоны могут быть определены с использованием, например, платформы Gene Forge® для оптимизации кодонов и синтеза генов по заказу от Aptagen (Aptagen, Inc.) или другой общедоступной базы данных.[00500] In some embodiments, the FVIII protein in an expression cassette, expression construct, or cccDNA vector described herein can be codon optimized for a host cell. As used herein, the term “codon optimized” or “codon optimization” refers to the process of modifying a nucleic acid sequence to enhance expression in vertebrate cells of interest, such as mouse or human (eg, humanization), by replacing at least one or more than one or a significant number of codons of a native sequence (eg, a prokaryotic sequence) by codons that are more frequently or most frequently used in the genes of that vertebrate. Different species exhibit specific preferences for certain codons of a particular amino acid. Typically, codon optimization does not change the amino acid sequence of the original translated protein. Optimized codons can be determined using, for example, the Gene Forge® platform for codon optimization and custom gene synthesis from Aptagen (Aptagen, Inc.) or other publicly available database.
D. Определение эффективности путем оценки экспрессии белка FVIII с зкДНК-вектораD. Determination of Efficacy by Assessing FVIII Protein Expression from a cccDNA Vector
[00501] По существу любой метод, известный в данной области техники для определения экспрессии белка, может быть использован для анализа экспрессии белка FVIII с зкДНК-вектора. Неограничивающие примеры таких методов/анализов включают иммуноферментный анализ (ИФА), аффинный ИФА, ELISPOT, последовательное разведение, проточную цитометрию, анализ методом поверхностного плазмонного резонанса, анализ кинетического исключения, масс-спектрометрию, Вестерн-блоттинг, иммунопреципитацию и ПЦР.[00501] Essentially any method known in the art for determining protein expression can be used to analyze FVIII protein expression from a cccDNA vector. Non-limiting examples of such methods/assays include enzyme-linked immunosorbent assay (ELISA), affinity ELISA, ELISPOT, serial dilution, flow cytometry, surface plasmon resonance assay, kinetic exclusion assay, mass spectrometry, Western blotting, immunoprecipitation and PCR.
[00502] Для оценки экспрессии белка FVIII in vivo биологический образец может быть получен от субъекта для анализа. Примеры биологических образцов включают образец биожидкости, образец физиологической жидкости, кровь (включая цельную кровь), сыворотку, плазму, мочу, слюну, биопсию и/или образец ткани и т.д. Биологический образец или образец ткани также может относиться к образцу ткани или жидкости, выделенному у индивидуума, включая, но не ограничиваясь перечисленными, биопсию опухоли, стул, спинномозговую жидкость, плевральную жидкость, аспираты сосков, лимфатическую жидкость, внешние срезы кожи, дыхательного, кишечного и мочеполового путей, слезы, слюну, грудное молоко, клетки (включая, но не ограничиваясь перечисленными, клетки крови), опухоли, органы, а также образцы компонентов культуры клеток in vitro. Термин также включает смесь упомянутых выше образцов. Термин «образец» также включает необработанные или предварительно обработанные (или подвергнутые предварительному процессингу) биологические образцы. Согласно некоторым вариантам реализации образец, используемый для анализов и способов, описанных в данном документе, включает образец сыворотки, собранный у субъекта, подлежащего тестированию.[00502] To assess FVIII protein expression in vivo, a biological sample may be obtained from a subject for analysis. Examples of biological samples include a biofluid sample, a physiological fluid sample, blood (including whole blood), serum, plasma, urine, saliva, biopsy and/or tissue sample, etc. A biological or tissue sample may also refer to a sample of tissue or fluid isolated from an individual, including, but not limited to, tumor biopsy, stool, cerebrospinal fluid, pleural fluid, nipple aspirates, lymph fluid, external sections of skin, respiratory, intestinal and genitourinary tract, tears, saliva, breast milk, cells (including, but not limited to, blood cells), tumors, organs, and samples of in vitro cell culture components. The term also includes a mixture of the samples mentioned above. The term "sample" also includes unprocessed or preprocessed (or preprocessed) biological samples. In some embodiments, the sample used for the assays and methods described herein includes a serum sample collected from the subject to be tested.
Е. Определение эффективности экспрессированного белка FVIII по клиническим параметрамE. Determination of the effectiveness of expressed FVIII protein by clinical parameters
[00503] Эффективность данного белка FVIII, экспрессированного зкДНК-вектором, для лечения гемофилии А (т.е. функциональная экспрессия) может быть определена квалифицированным клиницистом. Однако лечение считается «эффективным лечением», в соответствии с использованием этого термина в данном документе, если любой или все признаки или симптомы гемофилии А изменяются благоприятным образом, или если другие клинически принятые симптомы или маркеры заболевания улучшаются или облегчаются, например, по меньшей мере на 10% после лечения зкДНК-вектором, кодирующим терапевтический белок FVIII, как описано в данном документе. Эффективность также может быть измерена по отсутствию у индивидуума ухудшения, которое оценивается по стабилизации гемофилии А или по потребности в медицинских вмешательствах (т.е. прогрессирование заболевания прекращается или по меньшей мере замедляется). Способы измерения этих показателей известны специалистам в данной области техники и/или описаны в данном документе. Лечение включает любое лечение заболевания у индивидуума или животного (некоторые неограничивающие примеры включают человека или млекопитающее) и включает: (1) ингибирование гемофилии А, например, прекращение или замедление прогрессирования гемофилии А; или (2) облегчение гемофилии А, например, вызывающее регресс симптома гемофилии А; и (3) предотвращение или снижение вероятности развития заболевания гемофилией А, или предотвращение вторичных заболеваний/нарушений, ассоциированных с гемофилией А.[00503] The effectiveness of a given FVIII protein expressed by a cccDNA vector for the treatment of hemophilia A (ie, functional expression) can be determined by a qualified clinician. However, treatment is considered “effective treatment,” as that term is used herein, if any or all of the signs or symptoms of hemophilia A are modified in a favorable manner, or if other clinically accepted symptoms or markers of the disease are improved or alleviated, for example by at least 10% after treatment with a cccDNA vector encoding the therapeutic FVIII protein as described herein. Effectiveness can also be measured by the individual's lack of deterioration, as measured by stabilization of hemophilia A or the need for medical intervention (ie, progression of the disease stops or at least slows). Methods for measuring these indicators are known to those skilled in the art and/or are described herein. Treatment includes any treatment of a disease in an individual or animal (some non-limiting examples include a human or mammal) and includes: (1) inhibiting hemophilia A, eg, stopping or slowing the progression of hemophilia A; or (2) alleviation of hemophilia A, such as causing regression of hemophilia A symptoms; and (3) preventing or reducing the likelihood of developing hemophilia A disease, or preventing secondary diseases/disorders associated with hemophilia A.
Эффективное количество для лечения заболевания означает такое количество, которое при введении млекопитающему, нуждающемуся в этом, является достаточным, чтобы привести к эффективному лечению этого заболевания, в соответствии с определением этого термина в данном документе. Эффективность агента может быть определена путем оценки физических показателей, которые являются специфическими для заболевания гемофилией А. Врач может оценить любой один или более клинических симптомов гемофилии А, которые включают: необъяснимое и чрезмерное кровотечение из порезов или повреждений, или после хирургического или стоматологического вмешательства; много больших или глубоких синяков; необычное кровотечение после вакцинаций; боль, отек или стеснение в суставах; кровь в моче или стуле; кровотечение из носа без известной причины; у младенцев - необъяснимую раздражительность.An effective amount for treating a disease means an amount that, when administered to a mammal in need thereof, is sufficient to result in effective treatment of that disease, as that term is defined herein. The effectiveness of an agent can be determined by assessing physical indicators that are specific to the disease hemophilia A. A physician may evaluate any one or more clinical symptoms of hemophilia A, which include: unexplained and excessive bleeding from cuts or injuries, or after surgery or dental procedures; many large or deep bruises; unusual bleeding after vaccinations; pain, swelling, or tightness in the joints; blood in urine or stool; nosebleeds without a known cause; in infants - inexplicable irritability.
XI. Различные приложения зкДНК-векторов, экспрессирующих антитела или слитые белкиXI. Various applications of cccDNA vectors expressing antibodies or fusion proteins
[00504] Как раскрыто в данном документе, композиции и зкДНК-векторы для экспрессии белка FVIII, описанные в данном документе, можно применять для экспрессии белка FVIII для ряда целей. Согласно одному варианту реализации зкДНК-вектор, экспрессирующий белок FVIII, можно применять для создания соматической трансгенной модели на животных, несущей трансген, например, для исследования функции или прогрессирования заболевания гемофилией А. Согласно некоторым вариантам реализации зкДНК-вектор, экспрессирующий белок FVIII, можно применять для лечения, предотвращения или облегчения состояний гемофилии А или нарушений у субъекта-млекопитающего.[00504] As disclosed herein, the FVIII protein expression compositions and cDNA vectors described herein can be used to express FVIII protein for a variety of purposes. In one embodiment, the cDNA vector expressing the FVIII protein can be used to create a somatic transgenic animal model carrying the transgene, for example, to study the function or progression of hemophilia A. In some embodiments, the cDNA vector expressing the FVIII protein can be used for the treatment, prevention or amelioration of hemophilia A conditions or disorders in a mammalian subject.
[00505] Согласно некоторым вариантам реализации белок FVIII может быть экспрессирован с зкДНК-вектора у субъекта в количестве, достаточном для лечения заболевания, ассоциированного с повышенной экспрессией, повышенной активностью продукта гена или нефизиологической положительной регуляцией гена.[00505] In some embodiments, the FVIII protein can be expressed from a cccDNA vector in a subject in an amount sufficient to treat a disease associated with increased expression, increased activity of the gene product, or nonphysiological upregulation of the gene.
[00506] Согласно некоторым вариантам реализации белок FVIII может быть экспрессирован с зкДНК-вектора у субъекта в количестве, достаточном для лечения гемофилии А со сниженной экспрессией, отсутствием экспрессии или дисфункцией белка.[00506] In some embodiments, the FVIII protein can be expressed from a cccDNA vector in a subject in an amount sufficient to treat hemophilia A with reduced expression, no expression, or dysfunction of the protein.
[00507] Обычный специалист в данной области техники поймет, что трансген может не представлять собой открытую рамку считывания гена, который сам транскрибируется; вместо этого он может представлять собой промоторную область или репрессорную область гена-мишени, и зкДНК-вектор может модифицировать такую область, что в результате модулирует экспрессию гена FVIII.[00507] One of ordinary skill in the art will understand that the transgene may not be the open reading frame of the gene that is itself transcribed; instead, it may be a promoter region or a repressor region of a target gene, and the cDNA vector may modify such a region, thereby modulating FVIII gene expression.
[00508] Композиции и зкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, можно применять для доставки белка FVIII для различных целей, как описано выше.[00508] The FVIII protein expression compositions and cccDNA vectors disclosed herein can be used to deliver FVIII protein for various purposes, as described above.
[00509] Согласно некоторым вариантам реализации трансген кодирует один или более белков FVIII, которые можно применять для лечения, облегчения или предотвращения состояний гемофилии А у субъекта-млекопитающего. Белок FVIII, экспрессируемый зкДНК-вектором, вводят пациенту в количестве, достаточном для лечения гемофилии А, ассоциированной с аномальной последовательностью гена, что может привести к любому одному или более из следующего: повышенной экспрессии белка, сверхактивности белка, сниженной экспрессии, отсутствию экспрессии или дисфункции целевого гена или белка.[00509] In some embodiments, the transgene encodes one or more FVIII proteins that can be used to treat, alleviate, or prevent hemophilia A conditions in a mammalian subject. The FVIII protein expressed by the cccDNA vector is administered to a patient in an amount sufficient to treat hemophilia A associated with an abnormal gene sequence that can result in any one or more of the following: increased protein expression, overactive protein, decreased expression, no expression or dysfunction target gene or protein.
[00510] 1010 некоторым вариантам реализации зкДНК-векторы для экспрессии белка FVIII, раскрытые в данном документе, предназначены для применения в методах диагностики и скрининга, посредством которых белок FVIII временно или стабильно экспрессируется в системе на основе культуры клеток или, альтернативно, в модели на трансгенном животном.[00510] 1010 In some embodiments, the cDNA FVIII protein expression vectors disclosed herein are intended for use in diagnostic and screening methods whereby FVIII protein is transiently or stably expressed in a cell culture-based system or, alternatively, in a cell culture model. transgenic animal.
[00511] Другой аспект технологии, описанной в данном документе, обеспечивает способ трансдукции популяции клеток млекопитающего зкДНК-вектором для экспрессии белка FVIII, раскрытым в данном документе. В целом и в общем смысле, способ включает по меньшей мере этап введения в одну или более клеток популяции композиции, которая содержит эффективное количество одного или более из зкДНК-векторов для экспрессии белка FVIII, раскрытых в данном документе.[00511] Another aspect of the technology described herein provides a method for transducing a population of mammalian cells with the cDNA FVIII protein expression vector disclosed herein. Generally and generally, the method includes at least the step of introducing into one or more cells of a population a composition that contains an effective amount of one or more of the cDNA FVIII protein expression vectors disclosed herein.
[00512] Кроме того, согласно настоящему изобретению предложены композиции, а также терапевтические и/или диагностические наборы, которые включают один или более из раскрытых зкДНК-векторов для экспрессии белка FVIII, как раскрыто в данном документе, или композиций зкДНК, изготовленных с одним или более дополнительными ингредиентами или приготовленных в соответствии с одной или более инструкциями по их применению.[00512] In addition, the present invention provides compositions, as well as therapeutic and/or diagnostic kits, that include one or more of the disclosed cccDNA vectors for expression of the FVIII protein as disclosed herein, or cccDNA compositions made with one or more additional ingredients or prepared in accordance with one or more instructions for use.
[00513] Клетка, в которую должен быть введен зкДНК-вектор для экспрессии белка FVIII, раскрытый в данном документе, может быть любого типа, включая, но не ограничиваясь перечисленными, нервные клетки (включая клетки периферической и центральной нервной системы, в частности, клетки головного мозга), клетки легких, клетки сетчатки, эпителиальные клетки (например, кишечные и респираторные эпителиальные клетки), мышечные клетки, дендритные клетки, клетки поджелудочной железы (включая островковые клетки), печеночные клетки, клетки миокарда, костные клетки (например, стволовые клетки костного мозга), гемопоэтические стволовые клетки, клетки селезенки, кератиноциты, фибробласты, эндотелиальные клетки, клетки простаты, половые клетки и т.п. В качестве альтернативы, клетка может представлять собой любую клетку-предшественника. В качестве дополнительной альтернативы, клетка может представлять собой стволовую клетку (например, нервную стволовую клетку, стволовую клетку печени). В качестве еще одной альтернативы, клетка может представлять собой раковую или опухолевую клетку. Более того, клетки могут быть любого видового происхождения, как указано выше.[00513] The cell into which the cccDNA vector for expression of the FVIII protein disclosed herein is to be introduced can be of any type, including, but not limited to, nerve cells (including cells of the peripheral and central nervous system, in particular cells brain), lung cells, retinal cells, epithelial cells (eg, intestinal and respiratory epithelial cells), muscle cells, dendritic cells, pancreatic cells (including islet cells), liver cells, myocardial cells, bone cells (eg, stem cells bone marrow), hematopoietic stem cells, spleen cells, keratinocytes, fibroblasts, endothelial cells, prostate cells, germ cells, etc. Alternatively, the cell may be any progenitor cell. As a further alternative, the cell may be a stem cell (eg, neural stem cell, liver stem cell). As yet another alternative, the cell may be a cancer or tumor cell. Moreover, the cells can be of any species origin, as indicated above.
А. Получение и очистка зкДНК-векторов, экспрессирующих FVIIIA. Preparation and purification of cDNA vectors expressing FVIII
[00514] ЗкДНК-векторы, раскрытые в данном документе, должны применяться для получения белка FVIII как in vitro, так и in vivo. Белки FVIII, полученные таким образом, могут быть выделены, протестированы в отношении целевой функции и очищены для дальнейшего использования в исследованиях или в качестве терапевтического лечения. Каждая система получения белка имеет свои преимущества/недостатки. В то время как белки, полученные in vitro, можно легко очистить и получить белки за короткое время, белки, полученные in vivo, могут иметь посттрансляционные модификации, такие как гликозилирование.[00514] The cccDNA vectors disclosed herein should be used to produce FVIII protein both in vitro and in vivo. FVIII proteins produced in this manner can be isolated, tested for target function, and purified for further use in research or as therapeutic treatments. Each protein production system has its own advantages/disadvantages. While proteins produced in vitro can be easily purified and proteins produced in a short time, proteins produced in vivo may have post-translational modifications such as glycosylation.
[00515] Терапевтический белок FVIII, полученный с использованием зкДНК-векторов, может быть очищен с помощью любого метода, известного специалистам в данной области техники, например, ионообменной хроматографии, аффинной хроматографии, осаждения или электрофореза.[00515] Therapeutic FVIII protein produced using cDNA vectors can be purified using any method known to those skilled in the art, such as ion exchange chromatography, affinity chromatography, precipitation, or electrophoresis.
[00516] Терапевтический белок FVIII, полученный с помощью способов и композиций, описанных в данном документе, может быть протестирован для оценки связывания с целевым белком-мишенью.[00516] Therapeutic FVIII protein produced using the methods and compositions described herein can be tested to assess binding to the target protein.
ПРИМЕРЫEXAMPLES
[00517] Примеры ниже представлены в качестве иллюстрации, а не ограничения. Обычные специалисты в данной области техники поймут, что зкДНК-векторы могут быть сконструированы из любых ITR дикого типа или модифицированных ITR, описанных в данном документе, и что примерные методы ниже могут быть использованы для конструирования и оценки активности таких зкДНК-векторов. Несмотря на то, что способы приведены в качестве примера для определенных зкДНК-векторов, они применимы к любому зкДНК-вектору в соответствии с описанием.[00517] The examples below are provided by way of illustration and not limitation. Those of ordinary skill in the art will appreciate that cccDNA vectors can be constructed from any of the wild-type ITRs or modified ITRs described herein, and that the exemplary methods below can be used to construct and evaluate the activity of such cccDNA vectors. Although the methods are exemplary for certain cDNA vectors, they are applicable to any cDNA vector as described.
ПРИМЕР 1: Конструирование зкДНК-векторов с использованием метода на основе клеток насекомыхEXAMPLE 1: Construction of cDNA vectors using an insect cell-based method
[00518] Получение зкДНК-векторов с использованием полинуклеотидной матрицы конструкции описано в Примере 1 заявки PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Например, полинуклеотидная матрица конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус.Не ограничиваясь какой-либо теорией, в пермиссивной клетке-хозяине в присутствии, например, Rep, полинуклеотидная матрица конструкции, содержащая два симметричных ITR и экспрессионную конструкцию, где по меньшей мере один из ITR модифицирован относительно последовательности ITR дикого типа, реплицируется с получением зкДНК-векторов. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.п.) с помощью белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора.[00518] The preparation of cccDNA vectors using a polynucleotide template construct is described in Example 1 of PCT/US18/49996, which is incorporated herein by reference in its entirety. For example, the polynucleotide template construct used to produce the ccDNA vectors of the present invention may be a ccDNA plasmid, a ccDNA bacmid, and/or a ccDNA baculovirus. Without being limited to any theory, in a permissive host cell in the presence of, for example, Rep, a polynucleotide template construct containing two symmetrical ITRs and an expression construct where at least one of the ITRs is modified relative to the wild-type ITR sequence, is replicated to produce cccDNA vectors. Obtaining a cDNA vector takes place in two stages: first, cutting (“extracting”) the template from the template backbone (for example, the genome of a cDNA plasmid, ccDNA bacmid, ccDNA baculovirus, etc.) using Rep proteins, and , secondly, Rep-mediated replication of the excised cccDNA vector.
[00519] Примерный способ получения зкДНК-векторов представляет собой получение из зкДНК-плазмиды, как описано в данном документе. На ФИГ. 1А и 1В полинуклеотидная матрица конструкции каждой из зкДНК-плазмид включает как левый модифицированный ITR, так и правый модифицированный ITR, с расположенными между указанными ITR следующими элементами: (i) энхансер/промотор; (ii) сайт клонирования для трансгена; (iii) посттранскрипционный элемент ответа (например, посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WPRE)); и (iv) сигнал полиаденилирования (например, из гена бычьего гормона роста (BGHpA)). Уникальные сайты распознавания рестрикционной эндонуклеазой (R1-R6) (показанные на ФИГ. 1А и ФИГ. 1В) также были введены между каждым компонентом для облегчения введения новых генетических компонентов в конкретные сайты в конструкции. Сайты ферментов R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) и R4 (PacI) ТТААТТАА (SEQ ID NO: 124) конструировали в сайте клонирования для введения открытой рамки считывания трансгена. Эти последовательности клонировали в плазмиду pFastBac НТ В, полученную от ThermoFisher Scientific.[00519] An exemplary method for producing cDNA vectors is from a cDNA plasmid, as described herein. In FIG. 1A and 1B, the polynucleotide template of each cDNA plasmid construct includes both a left modified ITR and a right modified ITR, with the following elements located between said ITRs: (i) an enhancer/promoter; (ii) cloning site for the transgene; (iii) a post-transcriptional response element (eg, woodchuck hepatitis virus post-transcriptional regulatory element (WPRE)); and (iv) a polyadenylation signal (eg, from the bovine growth hormone gene (BGHpA)). Unique restriction endonuclease recognition sites (R1-R6) (shown in FIG. 1A and FIG. 1B) were also introduced between each component to facilitate the introduction of new genetic components at specific sites in the constructs. R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) and R4 (PacI) TTAATTAA (SEQ ID NO: 124) enzyme sites were engineered into the cloning site to introduce the open reading frame of the transgene. These sequences were cloned into the pFastBac HT B plasmid obtained from ThermoFisher Scientific.
[00520] Получение зкДНК-бакмид:[00520] Preparation of cccDNA-bacmid:
[00521] Компетентные клетки DHlOBac (компетентные клетки MAX EFFICIENCY® DH10Bac™, Thermo Fisher) трансформировали либо тестируемой, либо контрольной плазмидами, следуя протоколу в соответствии с инструкциями производителя. Чтобы получить рекомбинантные зкДНК-бакмиды, в клетках DHlOBac индуцировали рекомбинацию между плазмидой и бакуловирусным челночным вектором. Рекомбинантные бакмиды отбирали путем положительного скринингового отбора на основании скрининга по сине-белому окрашиванию Е. coli (маркер Ф80dlacZΔM15 обеспечивает α-комплементацию гена β-галактозидазы из бакмидного вектора) на чашке с бактериальным агаром, содержащим X-gal и IPTG с антибиотиками для отбора трансформантов и поддержания бакмиды и плазмид на основе транспозаз. Белые колонии, образующиеся в результате транспозиции, которая разрушает индикаторный ген β-галактозидазы, собирали и культивировали в 10 мл сред.[00521] DHlOBac competent cells (MAX EFFICIENCY® DH10Bac™ competent cells, Thermo Fisher) were transformed with either test or control plasmids following the protocol according to the manufacturer's instructions. To obtain recombinant cccDNA bacmids, recombination between the plasmid and the baculovirus shuttle vector was induced in DHlOBac cells. Recombinant bacmids were selected by positive screening based on screening for blue-white staining of E. coli (marker Ф80dlacZΔM15 provides α-complementation of the β-galactosidase gene from the bacmid vector) on a bacterial agar plate containing X-gal and IPTG with antibiotics for selection of transformants and maintenance of bacmids and transposase-based plasmids. White colonies resulting from transposition that disrupts the β-galactosidase indicator gene were collected and cultured in 10 ml media.
[00522] Рекомбинантные зкДНК-бакмиды выделяли из E.coli и трансфицировали ими клетки насекомых Sf9 или Sf21 с использованием FugeneHD для получения инфекционного бакуловируса. Адгезивные клетки насекомых Sf9 или Sf21 культивировали в 50 мл сред в колбах Т25 при 25°С. Через 4 дня культуральную среду (содержащую вирус Р0) отделяли от клеток, фильтровали через фильтр с размером пор 0,45 мкм, отделяя инфекционные бакуловирусные частицы от клеток или клеточного дебриса.[00522] Recombinant cccDNA bacmids were isolated from E. coli and transfected into Sf9 or Sf21 insect cells using FugeneHD to produce infectious baculovirus. Adherent Sf9 or Sf21 insect cells were cultured in 50 ml of media in T25 flasks at 25°C. After 4 days, the culture medium (containing P0 virus) was separated from the cells and filtered through a 0.45-μm filter to separate infectious baculovirus particles from cells or cellular debris.
[00523] Необязательно первое поколение бакуловируса (Р0) амплифицировали путем инфицирования наивных клеток насекомых Sf9 или Sf21 в 50-500 мл сред. Клетки поддерживали в суспензионных культурах в инкубаторе с орбитальным шейкером при 130 об./мин при 25°С, отслеживая диаметр и жизнеспособность клеток до тех пор, пока клетки не достигнут диаметра 18-19 нм (от диаметра наивных клеток, равного 14-15 нм) и плотности ~4,0×106 клеток/мл. Через 3-8 дней после инфицирования бакуловирусные частицы Р1 в среде собирали после центрифугирования для удаления клеток и дебриса с последующей фильтрацией через фильтр с размером пор 0,45 мкм.[00523] Optionally, the first generation of baculovirus (P0) was amplified by infecting naïve Sf9 or Sf21 insect cells in 50-500 ml media. Cells were maintained in suspension cultures in an orbital shaker incubator at 130 rpm at 25°C, monitoring cell diameter and cell viability until cells reached a diameter of 18-19 nm (from a naïve cell diameter of 14-15 nm ) and density ~4.0×10 6 cells/ml. At 3 to 8 days postinfection, baculovirus P1 particles in the medium were collected after centrifugation to remove cells and debris, followed by filtration through a 0.45-μm pore size filter.
[00524] ЗкДНК-бакуловирус, содержащий тестируемые конструкции, собирали и определяли инфекционную активность или титр бакуловируса. В частности, четыре х20 мл культур клеток Sf9 при 2,5×106 клеток/мл обрабатывали бакуловирусом Р1 в следующих разведениях: 1/1000, 1/10000, 1/50000, 1/100000 и инкубировали при 25-27°С. Инфективность определяли ежедневно на протяжении 4-5 дней по показателю увеличения диаметра клеток и остановке клеточного цикла, а также изменению жизнеспособности клеток.[00524] The cDNA baculovirus containing the test constructs was collected and the infectivity or titer of the baculovirus was determined. In particular, four x20 ml cultures of Sf9 cells at 2.5 x 10 6 cells/ml were treated with baculovirus P1 in the following dilutions: 1/1000, 1/10000, 1/50000, 1/100000 and incubated at 25-27°C. Infectivity was determined daily for 4-5 days by the increase in cell diameter and cell cycle arrest, as well as changes in cell viability.
[00525] «Rep-плазмиду», раскрытую на ФИГ. 8А из PCT/US18/49996, которая полностью включена в данный документ посредством ссылки, получали в экспрессионном векторе pFASTBAC™-Dual (ThermoFisher), содержащем как Rep78 (SEQ ID NO: 131 или 133), так и Rep52 (SEQ ID NO: 132) или Rep68 (SEQ ID NO: 130) и Rep40 (SEQ ID NO: 129). Rep-плазмиду трансформировали в компетентные клетки DH10Bac (компетентные клетки MAX EFFICIENCY® DH10Bac™ (Thermo Fisher)), следуя предоставленному производителем протоколу. Для получения рекомбинантных бакмид («Rep-бакмид») в клетках DH10Bac индуцировали рекомбинацию между Rep-плазмидой и бакуловирусным челночным вектором. Рекомбинантные бакмиды отбирали путем положительного отбора, который включал скрининг по сине-белому окрашиванию Е. coli (маркер Ф80dlacZΔM15 обеспечивает α-комплементацию гена β-галактозидазы из бакмидного вектора) на чашке с бактериальным агаром, содержащим X-gal и IPTG. Одиночные белые колонии собирали и инокулировали в 10 мл селективных сред (канамицин, гентамицин, тетрациклин в бульоне LB). Рекомбинантные бакмиды (Rep-бакмиды) выделяли из E.coli, и трансфицировали клетки насекомых Sf9 или Sf21 указанными Rep-бакмидами, чтобы получить инфекционный бакуловирус.[00525] The "Rep plasmid" disclosed in FIG. 8A from PCT/US18/49996, which is incorporated herein by reference in its entirety, was produced in the expression vector pFASTBAC™-Dual (ThermoFisher) containing both Rep78 (SEQ ID NO: 131 or 133) and Rep52 (SEQ ID NO: 132) or Rep68 (SEQ ID NO: 130) and Rep40 (SEQ ID NO: 129). The Rep plasmid was transformed into DH10Bac competent cells (MAX EFFICIENCY® DH10Bac™ competent cells (Thermo Fisher)) following the protocol provided by the manufacturer. To produce recombinant bacmids (“Rep bacmid”), recombination between the Rep plasmid and the baculovirus shuttle vector was induced in DH10Bac cells. Recombinant bacmids were selected by positive selection, which included screening for blue-white staining of E. coli (marker Ф80dlacZΔM15 provides α-complementation of the β-galactosidase gene from the bacmid vector) on a bacterial agar plate containing X-gal and IPTG. Single white colonies were collected and inoculated into 10 ml of selective media (kanamycin, gentamicin, tetracycline in LB broth). Recombinant bacmids (Rep bacmids) were isolated from E. coli, and Sf9 or Sf21 insect cells were transfected with the indicated Rep bacmids to produce infectious baculovirus.
[00526] Клетки насекомых Sf9 или Sf21 культивировали в 50 мл сред в течение 4 дней и выделяли из культуры инфекционный рекомбинантный бакуловирус («Rep-бакуловирус»). Необязательно Rep-бакуловирус первого поколения (Р0) амплифицировали путем инфицирования наивных клеток насекомых Sf9 или Sf21 и культивировали в 50-500 мл сред. Через 3-8 дней после инфицирования бакуловирусные частицы Р1 в среде собирали, отделяя клетки путем центрифугирования или фильтрации, или используя другой способ фракционирования. Собирали Rep-бакуловирус и определяли инфекционную активность бакуловируса. В частности, четыре x20 мл культур клеток Sf9 при 2,5×106 клеток/мл обрабатывали бакуловирусом Р1 в следующих разведениях, 1/1000, 1/10000, 1/50000, 1/100000, и инкубировали. Инфективность определяли ежедневно на протяжении 4-5 дней по показателю увеличения диаметра клеток и остановке клеточного цикла, а также изменению жизнеспособности клеток.[00526] Sf9 or Sf21 insect cells were cultured in 50 ml media for 4 days and infectious recombinant baculovirus (“Rep-baculovirus”) was isolated from the culture. Optionally, the first generation Rep baculovirus (P0) was amplified by infecting naïve insect cells with Sf9 or Sf21 and cultured in 50-500 ml media. 3-8 days after infection, baculovirus P1 particles in the medium were collected by separating the cells by centrifugation or filtration, or using another fractionation method. Rep-baculovirus was collected and the infectivity of the baculovirus was determined. Specifically, four x20 ml cultures of Sf9 cells at 2.5 x 10 6 cells/ml were treated with baculovirus P1 at the following dilutions, 1/1000, 1/10000, 1/50000, 1/100000, and incubated. Infectivity was determined daily for 4-5 days by the increase in cell diameter and cell cycle arrest, as well as changes in cell viability.
[00527] Получение и характеристика зкДНК-вектора[00527] Preparation and characterization of cccDNA vector
[00528] На ФИГ. 4В среду для культивирования клеток насекомых Sf9, содержащую (1) образец, содержащий зкДНК-бакмиду или зкДНК-бакуловирус, и (2) Rep-бакуловирус, описанный выше, затем добавляли к свежей культуре клеток Sf9 (2,5×106 клеток/мл, 20 мл) при соотношении 1:1000 и 1:10000, соответственно. Затем клетки культивировали при 130 об./мин при 25°С. Через 4-5 дней после ко инфицирования детектировали диаметр и жизнеспособность клеток. Когда диаметр клеток достигал 18-20 нм при жизнеспособности -70-80%, клеточные культуры центрифугировали, среду удаляли и собирали клеточные осадки. Клеточные осадки сначала ресуспендировали в достаточном объеме водной среды, либо воды, либо буфера. ЗкДНК-вектор выделяли и очищали из клеток с использованием протокола очистки Qiagen MIDI PLUS™ (Qiagen, 0,2 мг массы осадка клеток, обработанной на колонку).[00528] In FIG. 4The Sf9 insect cell culture medium containing (1) a sample containing cccDNA bacmid or cccDNA baculovirus and (2) Rep baculovirus described above was then added to a fresh Sf9 cell culture (2.5 x 10 6 cells/ ml, 20 ml) at a ratio of 1:1000 and 1:10000, respectively. Cells were then cultured at 130 rpm at 25°C. Cell diameter and viability were detected 4-5 days after co-infection. When the cell diameter reached 18-20 nm with a viability of -70-80%, cell cultures were centrifuged, the medium was removed and cell pellets were collected. Cell pellets were first resuspended in a sufficient volume of aqueous medium, either water or buffer. The cccDNA vector was isolated and purified from cells using the Qiagen MIDI PLUS™ purification protocol (Qiagen, 0.2 mg cell pellet processed per column).
[00529] Значения выхода зкДНК-векторов, полученных и очищенных из клеток насекомых Sf9, первоначально определяли на основании поглощения в УФ-диапазоне при 260 нм.[00529] Yields of cccDNA vectors derived and purified from Sf9 insect cells were initially determined based on UV absorbance at 260 nm.
[00530] ДНК-векторы можно идентифицировать с помощью электрофореза в агарозном геле в нативных или денатурирующих условиях, как проиллюстрировано на ФИГ. 4D, где (а) наличие характерных полос, мигрирующих при двукратно большем размере на денатурирующих гелях, по сравнению с нативными гелями, после расщепления рестрикционной эндонуклеазой и анализа методом гель-электрофореза, и (b) наличие полос мономера и димера (2х) на денатурирующих гелях для нерасщепленного материала характеризует наличие зкДНК-вектора.[00530] DNA vectors can be identified by agarose gel electrophoresis under native or denaturing conditions, as illustrated in FIG. 4D, where (a) the presence of characteristic bands migrating at twice the size on denaturing gels compared to native gels after restriction endonuclease digestion and analysis by gel electrophoresis, and (b) the presence of monomer and dimer bands (2x) on denaturing gels for undigested material is characterized by the presence of a cDNA vector.
[00531] Структуры выделенных зкДНК-векторов анализировали далее путем расщепления ДНК, полученной из коинфицированных клеток Sf9 (как описано в данном документе), рестрикционными эндонуклеазами, выбранными на основании а) присутствия только одного сайта разрезания в зкДНК-векторах, и b) получения фрагментов достаточно большого размера, чтобы они были отчетливо видны при фракционировании на 0,8% денатурирующем агарозном геле (>800 п. о.). Как проиллюстрировано на ФИГ. 4D и 4Е, линейные ДНК-векторы с прерывистой структурой и зкДНК-вектор с линейной и непрерывной структурой можно различить по размеру их продуктов реакции - например, ожидается, что ДНК-вектор с прерывистой структурой даст фрагменты размером 1 тыс.п.о. и 2 тыс.п.о., в то время как бескапсидный вектор с непрерывной структурой, как ожидается, даст фрагменты размером 2 тыс.п.о. и 4 тыс.п.о.[00531] The structures of the isolated cccDNA vectors were further analyzed by digesting DNA obtained from coinfected Sf9 cells (as described herein) with restriction endonucleases selected based on a) the presence of only one cut site in the ccDNA vectors, and b) obtaining fragments large enough to be clearly visible when fractionated on a 0.8% denaturing agarose gel (>800 bp). As illustrated in FIG. 4D and 4E, linear discontinuous DNA vectors and linear and continuous cccDNA vectors can be distinguished by the size of their reaction products—for example, a discontinuous DNA vector is expected to produce 1 kb fragments. and 2 kb, while a capsidless vector with a continuous structure is expected to produce fragments of 2 kb. and 4 thousand bp.
[00532] Таким образом, чтобы качественно продемонстрировать, что выделенные зкДНК-векторы имеют ковалентно замкнутые концы, как требует их определение, образцы расщепляли рестрикционной эндонуклеазой, идентифицированной на основании конкретной последовательности ДНК-вектора как эндонуклеаза с одним сайтом рестрикции, что предпочтительно приводит к получению двух продуктов расщепления неравного размера (например, 1000 п. о. и 2000 п. о.). После расщепления и электрофореза на денатурирующем геле (который разделяет две комплементарные цепи ДНК) линейная, не замкнутая ковалентно ДНК будет разделяться на фрагменты размером 1000 п. о. и 2000 п. о., в то время как ковалентно замкнутая ДНК (т.е. зкДНК-вектор) будет разделяться на фрагменты в 2 раза большего размера (2000 п. о. и 4000 п. о.), так как две цепи ДНК связаны, уже развернуты и имеют вдвое большую длину (но одноцепочечные). Кроме того, при расщеплении мономерных, димерных и n-мерных форм ДНК-векторов все они будут разделяться на фрагменты одинаковых размеров из-за связанных между собой концов мультимерных ДНК-векторов (см. ФИГ. 4D).[00532] Thus, to qualitatively demonstrate that the isolated cccDNA vectors have covalently closed ends as required by their definition, samples were digested with a restriction endonuclease identified based on the specific sequence of the DNA vector as a single site restriction endonuclease, preferably resulting in two cleavage products of unequal size (for example, 1000 bp and 2000 bp). After digestion and electrophoresis on a denaturing gel (which separates two complementary DNA strands), linear, non-covalently closed DNA will be separated into 1000 bp fragments. and 2000 bp, while covalently closed DNA (i.e. cDNA vector) will be divided into fragments 2 times larger (2000 bp and 4000 bp), since two chains The DNA is linked, already unfolded, and twice as long (but single-stranded). In addition, when the monomeric, dimeric, and n-mer forms of DNA vectors are digested, they will all separate into fragments of equal sizes due to the interconnected ends of the multimeric DNA vectors (see FIG. 4D).
[00533] В данном документе выражение «анализ для идентификации ДНК-векторов с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях» относится к анализу для оценки наличия замкнутых концов зкДНК путем выполнения расщепления рестрикционной эндонуклеазой с последующей электрофоретической оценкой продуктов расщепления. Ниже приведен один такой примерный анализ, хотя обычный специалист в данной области техники поймет, что возможны многие известные в данной области техники вариации этого примера. Рестрикционную эндонуклеазу выбирают таким образом, чтобы это был фермент, выполняющий единственный разрез представляющего интерес зкДНК-вектора с образованием продуктов, длина которых составляет приблизительно 1/3× и 2/3× от длины ДНК-вектора. Это обеспечивает разделение полос как на нативном, так и на денатурирующем гелях. Перед денатурацией важно удалить буфер из образца. Набор для очистки продуктов ПЦР от Qiagen или «центрифужные колонки» для обессоливания, например, колонки GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25, представляют собой некоторые из известных в данной области техники средств для расщепления эндонуклеазами. Анализ включает, например, i) расщепление ДНК соответствующей рестрикционной эндонуклеазой (ами), 2) внесение, например, в набор для очистки продуктов ПЦР от Qiagen, элюирование дистиллированной водой, iii) добавление 10-кратного денатурирующего раствора (10х=0,5 М NaOH, 10 мМ ЭДТА), добавление 10-кратного красителя, не забуференного, и проведение анализа с использованием маркеров молекулярной массы ДНК, приготовленных путем добавления 10-кратного денатурирующего раствора к 4-кратному, на 0,8-1,0% геле, предварительно инкубированном с 1 мМ ЭДТА и 200 мМ NaOH, чтобы обеспечить одинаковую концентрацию NaOH в геле и в боксе для геля, и анализ геля в присутствии 1х денатурирующего раствора (50 мМ NaOH, 1 мМ ЭДТА). Обычный специалист в данной области техники поймет, какое напряжение использовать для проведения электрофореза на основании размера и желаемого времени получения результатов. После электрофореза гели дренируют, нейтрализуют в 1х ТВЕ или ТАЕ и переносят в дистиллированную воду или 1х ТВЕ/ТАЕ с 1x SYBR Gold. Затем полосы могут быть визуализированы, например, с использованием красителя SYBR® Gold Nucleic Acid Gel Stain от Thermo Fisher (10000-кратный концентрат в ДМСО) и эпифлуоресцентного света (синего) или УФ (312 нм).[00533] As used herein, the expression “assay for identifying DNA vectors by agarose gel electrophoresis on a native gel and under denaturing conditions” refers to an assay for assessing the presence of closed ends of cccDNA by performing restriction endonuclease digestion followed by electrophoretic assessment of the digestion products. The following is one such exemplary analysis, although one of ordinary skill in the art will appreciate that many variations of this example known in the art are possible. The restriction endonuclease is selected to be the enzyme that makes a single cut of the cDNA vector of interest to produce products that are approximately 1/3× and 2/3× the length of the DNA vector. This ensures band separation on both native and denaturing gels. It is important to remove the buffer from the sample before denaturation. Qiagen's PCR Product Purification Kit or desalting "spun columns", such as the GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25 columns, are some of the endonuclease digestion tools known in the art. The analysis involves, for example, i) digestion of DNA with appropriate restriction endonuclease(s), 2) addition, for example, to a Qiagen PCR purification kit, eluting with distilled water, iii) addition of a 10x denaturing solution (10x=0.5 M NaOH, 10 mM EDTA), adding 10x unbuffered dye, and performing analysis using DNA molecular weight markers prepared by adding a 10x denaturing solution to a 4x, 0.8-1.0% gel, preincubated with 1 mM EDTA and 200 mM NaOH to ensure the same concentration of NaOH in the gel and in the gel box, and analyze the gel in the presence of 1x denaturing solution (50 mM NaOH, 1 mM EDTA). One of ordinary skill in the art will understand what voltage to use for electrophoresis based on size and desired time to obtain results. After electrophoresis, the gels are drained, neutralized in 1x TBE or TAE and transferred to distilled water or 1x TBE/TAE with 1x SYBR Gold. The bands can then be visualized, for example, using Thermo Fisher's SYBR® Gold Nucleic Acid Gel Stain (10,000x concentrate in DMSO) and epifluorescent light (blue) or UV (312 nm).
[00534] Чистоту полученного зкДНК-вектора можно оценить с помощью любого метода, известного в данной области техники. В качестве одного примерного и неограничивающего метода, вклад зкДНК-плазмиды в общее УФ-поглощение образца можно оценить путем сравнения интенсивности флуоресценции зкДНК-вектора со стандартом. Например, если на основании поглощения УФ определено, что на гель загружено 4 мкг зкДНК-вектора, а интенсивность флуоресценции зкДНК-вектора эквивалентна полосе 2 тыс.п.о. при известной массе 1 мкг, значит, масса зкДНК-вектора равна 1 мкг, и зкДНК-вектор составляет 25% от общего количества поглощающего УФ материала. Затем строят график зависимости интенсивности полосы на геле от вычисленного введенного количества, которому соответствует полоса например, если общее количество зкДНК-вектора соответствует 8 тыс.п.о., а вырезанная сравнительная полоса соответствует 2 тыс.п.о., то интенсивность указанной полосы на графике будет соответствовать 25% от общего введенного количества, что в данном случае составит 0,25 мкг при введении 1,0 мкг. Используя титрование плазмиды зкДНК-вектора для построения стандартной кривой, затем рассчитывают количество для полосы зкДНК-вектора, используя уравнение линии регрессии, которое затем можно использовать для определения процента от общего введенного количества, представленного зкДНК-вектором, или процента чистоты.[00534] The purity of the resulting cccDNA vector can be assessed using any method known in the art. As one exemplary and non-limiting method, the contribution of the cDNA plasmid to the total UV absorbance of the sample can be assessed by comparing the fluorescence intensity of the cDNA vector with a standard. For example, if based on UV absorbance it is determined that 4 μg of ccDNA vector is loaded on the gel, and the fluorescence intensity of the ccDNA vector is equivalent to a 2 kb band. with a known mass of 1 μg, then the mass of the ccDNA vector is 1 μg, and the ccDNA vector constitutes 25% of the total amount of UV absorbing material. Then plot the intensity of the band on the gel as a function of the calculated input amount to which the band corresponds. For example, if the total quantity of the cDNA vector corresponds to 8 kb, and the excised comparative band corresponds to 2 kb, then the intensity of the indicated band on the graph will correspond to 25% of the total amount administered, which in this case will be 0.25 mcg when 1.0 mcg is administered. Using titration of the cccDNA vector plasmid to construct a standard curve, the quantity for the cccDNA vector band is then calculated using the regression line equation, which can then be used to determine the percentage of the total input amount represented by the cccDNA vector, or the percentage purity.
[00535] Для сравнительных целей в Примере 1 описано получение зкДНК-векторов с использованием метода на основе клеток насекомых и полинуклеотидной матрицы конструкции, а также описано в Примере 1 из PCT/US18/49996, которая полностью включена в данный документ посредством ссылки. Например, полинуклеотидная матрица конструкции, используемая для получения зкДНК-векторов согласно настоящему изобретению в соответствии с Примером 1, может представлять собой зкДНК-плазмиду, зкДНК-бакмиду и/или зкДНК-бакуловирус.Не ограничиваясь какой-либо теорией, в пермиссивной клетке-хозяине в присутствии, например, Rep, полинуклеотидная матрица конструкции, содержащая два симметричных ITR и экспрессионную конструкцию, где по меньшей мере один из ITR модифицирован относительно последовательности ITR дикого типа, реплицируется с получением зкДНК-векторов. Получение зкДНК-вектора проходит в два этапа: во-первых, вырезание («извлечение») матрицы из остова матрицы (например, генома зкДНК-плазмиды, зкДНК-бакмиды, зкДНК-бакуловируса и т.п.) с помощью белков Rep, и, во-вторых, Rep-опосредуемая репликация вырезанного зкДНК-вектора.[00535] For comparative purposes, Example 1 describes the preparation of cccDNA vectors using an insect cell-based method and polynucleotide template construct, and is also described in Example 1 of PCT/US18/49996, which is incorporated herein by reference in its entirety. For example, the polynucleotide template construct used to produce the ccDNA vectors of the present invention in accordance with Example 1 may be a ccDNA plasmid, a ccDNA bacmid, and/or a ccDNA baculovirus. Without being limited to any theory, in a permissive host cell in the presence of, for example, Rep, a polynucleotide template construct containing two symmetrical ITRs and an expression construct where at least one of the ITRs is modified relative to the wild-type ITR sequence is replicated to produce cccDNA vectors. Obtaining a cDNA vector takes place in two stages: first, cutting (“extracting”) the template from the template backbone (for example, the genome of a cDNA plasmid, ccDNA bacmid, ccDNA baculovirus, etc.) using Rep proteins, and , secondly, Rep-mediated replication of the excised cccDNA vector.
[00536] Примерный способ получения зкДНК-векторов в способе с использованием клетки насекомого представляет собой получение из зкДНК-плазмиды, как описано в данном документе. На ФИГ. 1А и 1В полинуклеотидная матрица конструкции каждой из зкДНК-плазмид включает как левый модифицированный ITR, так и правый модифицированный ITR, с расположенными между указанными ITR следующими элементами: (i) энхансер/промотор; (ii) сайт клонирования для трансгена; (iii) посттранскрипционный элемент ответа (например, посттранскрипционный регуляторный элемент вируса гепатита североамериканского сурка (WPRE)); и (iv) сигнал полиаденилирования (например, из гена бычьего гормона роста (BGHpA)). Уникальные сайты распознавания рестрикционной эндонуклеазой (R1-R6) (показанные на ФИГ. 1А и ФИГ. 1В) также были введены между каждым компонентом для облегчения введения новых генетических компонентов в конкретные сайты в конструкции. Сайты ферментов R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) и R4 (PacI) ТТААТТАА (SEQ ID NO: 124) конструировали в сайте клонирования для введения открытой рамки считывания трансгена. Эти последовательности клонировали в плазмиду pFastBac НТ В, полученную от Thermo Fisher Scientific.[00536] An exemplary method for producing cccDNA vectors in an insect cell method is preparation from a cccDNA plasmid as described herein. In FIG. 1A and 1B, the polynucleotide template construct of each cccDNA plasmid includes both a left modified ITR and a right modified ITR, with the following elements located between said ITRs: (i) an enhancer/promoter; (ii) cloning site for the transgene; (iii) a post-transcriptional response element (eg, woodchuck hepatitis virus post-transcriptional regulatory element (WPRE)); and (iv) a polyadenylation signal (eg, from the bovine growth hormone gene (BGHpA)). Unique restriction endonuclease recognition sites (R1-R6) (shown in FIG. 1A and FIG. 1B) were also introduced between each component to facilitate the introduction of new genetic components at specific sites in the constructs. R3 (PmeI) GTTTAAAC (SEQ ID NO: 123) and R4 (PacI) TTAATTAA (SEQ ID NO: 124) enzyme sites were engineered into the cloning site to introduce the open reading frame of the transgene. These sequences were cloned into the pFastBac HT B plasmid obtained from Thermo Fisher Scientific.
ПРИМЕР 2: Синтетическое получение зкДНК путем вырезания из двухцепочечной молекулы ДНКEXAMPLE 2: Synthetic production of cDNA by excision from a double-stranded DNA molecule
[00537] Синтетическое получение зкДНК-векторов описано в Примерах 2-6 международной заявки PCT/US19/14122, поданной 18 января 2019 г., которая полностью включена в данный документ посредством ссылки. Один примерный способ получения зкДНК-вектора с применением синтетического способа включает вырезание двухцепочечной молекулы ДНК. В общих чертах, зкДНК-вектор может быть получен с применением конструкции двухцепочечной ДНК, например, см. ФИГ. 7А-8Е из PCT/US19/14122. Согласно некоторым вариантам реализации конструкция двухцепочечной ДНК представляет собой зкДНК-плазмиду, например, см. ФИГ. 6 в международной заявке на патент PCT/US2018/064242, поданной 6 декабря 2018 г.[00537] The synthetic production of cccDNA vectors is described in Examples 2-6 of International Application PCT/US19/14122, filed January 18, 2019, which is incorporated herein by reference in its entirety. One exemplary method of producing a cDNA vector using a synthetic method involves cutting out a double-stranded DNA molecule. In general, a cccDNA vector can be produced using a double-stranded DNA construct, for example, see FIG. 7A-8E from PCT/US19/14122. In some embodiments, the dsDNA construct is a cDNA plasmid, for example, see FIG. 6 in international patent application PCT/US2018/064242, filed December 6, 2018.
[00538] Согласно некоторым вариантам реализации конструкция для получения зкДНК-вектора содержит регуляторный переключатель, описанный в данном документе.[00538] In some embodiments, the design for producing a cccDNA vector includes a regulatory switch described herein.
[00539] В иллюстративных целях в Примере 2 описано получение зкДНК-векторов в качестве примерных ДНК-векторов с замкнутыми концами, полученных с использованием этого метода. Однако, хотя в этом Примере зкДНК-векторы приведены в качестве примеров для иллюстрации синтетических способов получения in vitro для получения ДНК-вектора с замкнутыми концами путем вырезания двухцепочечного полинуклеотида, содержащего ITR и экспрессионную кассету (например, гетерологичную последовательность нуклеиновой кислоты), с последующим лигированием свободных 3' и 5' концов, как описано в данном документе, обычному специалисту в данной области техники известно, что, как проиллюстрировано выше, полинуклеотидную молекулу двухцепочечной ДНК можно модифицировать так, чтобы получить любой целевой ДНК-вектор с замкнутыми концами, включая, но не ограничиваясь этим, doggybone ДНК, гантелеобразную ДНК и т.п. Примерные зкДНК-векторы для получения антител или слитых белков, которые могут быть получены с помощью синтетического метода получения, описанного в Примере 2, обсуждаются в разделах, озаглавленных «III зкДНК-векторы в целом». Примерные антитела и слитые белки, экспрессируемые зкДНК векторами, описаны в разделе, озаглавленном «ПС Примерные антитела и слитые белки, экспрессируемые зкДНК-векторами».[00539] For illustrative purposes, Example 2 describes the preparation of cccDNA vectors as exemplary closed-end DNA vectors prepared using this method. However, although in this Example, cccDNA vectors are exemplified to illustrate synthetic in vitro production methods for producing a closed-end DNA vector by excision of a double-stranded polynucleotide containing an ITR and an expression cassette (e.g., a heterologous nucleic acid sequence), followed by ligation free 3' and 5' ends as described herein, one of ordinary skill in the art will know that, as illustrated above, a double-stranded DNA polynucleotide molecule can be modified to produce any target DNA vector with closed ends, including but not limited to but not limited to, doggybone DNA, dumbbell DNA, etc. Exemplary cccDNA vectors for the production of antibodies or fusion proteins that can be produced using the synthetic production method described in Example 2 are discussed in the sections entitled “III ccDNA Vectors in General.” Exemplary antibodies and fusion proteins expressed by cccDNA vectors are described in the section entitled “Exemplary Antibodies and Fusion Proteins Expressed by cccDNA Vectors.”
[00540] Способ включает (i) вырезание последовательности, кодирующей экспрессионную кассету, из конструкции двухцепочечной ДНК, и (ii) образование шпилечных структур на одном или более ITR, и (iii) соединение свободных 5'- и 3'-концов путем лигирования, например, с помощью ДНК-лигазы Т4.[00540] The method includes (i) excision of a sequence encoding an expression cassette from a double-stranded DNA construct, and (ii) formation of hairpin structures at one or more ITRs, and (iii) joining the free 5' and 3' ends by ligation, for example, using T4 DNA ligase.
[00541] Конструкция двухцепочечной ДНК содержит, в порядке от 5' к 3': первый сайт рестрикционной эндонуклеазы; левый ITR; экспрессионную кассету; правый ITR; и второй сайт рестрикционной эндонуклеазы. Конструкцию двухцепочечной ДНК затем приводят в контакт с одной или более рестрикционными эндонуклеазами для образования двухцепочечных разрывов в обоих сайтах рестрикционных эндонуклеаз. Одна эндонуклеаза может нацелено действовать на оба сайта, или каждый сайт может быть мишенью разной эндонуклеазы, при условии, что сайты рестрикции не присутствуют в матрице зкДНК-вектора. Это позволяет вырезать последовательность между сайтами рестрикционной эндонуклеазы из остальной части конструкции двухцепочечной ДНК (см. Фиг. 9 PCT/US19/14122). После лигирования образуется ДНК-вектор с замкнутыми концами.[00541] The double-stranded DNA construct contains, in order from 5' to 3': a first restriction endonuclease site; left ITR; expression cassette; right ITR; and a second restriction endonuclease site. The double-stranded DNA construct is then contacted with one or more restriction endonucleases to create double-strand breaks at both restriction endonuclease sites. A single endonuclease may target both sites, or each site may be targeted by a different endonuclease, provided that restriction sites are not present in the cccDNA vector template. This allows the sequence between the restriction endonuclease sites to be excised from the rest of the double-stranded DNA construct (see FIG. 9 PCT/US19/14122). After ligation, a DNA vector with closed ends is formed.
[00542] Один или оба ITR, используемые в способе, могут представлять собой ITR дикого типа. Также могут быть использованы модифицированные ITR, причем указанная модификация может включать делецию, вставку или замену одного или более нуклеотидов из ITR дикого типа в последовательностях, образующих плечо В и В' и/или плечо С и С' (см., например, Фиг. 6-8 и 10, ФИГ. 11В из PCT/US19/14122), и может иметь две или более шпилечных петель (см., например, ФИГ. 6-8, ФИГ. 11В из PCT/US 19/14122) или одну шпилечную петлю (см., например, ФИГ. 10А-10В, ФИГ. 11В из PCT/US19/14122). ITR, модифицированный шпилечной петлей, может быть получен путем генетической модификации существующего олиго или путем биологического и/или химического синтеза de novo.[00542] One or both ITRs used in the method may be wild-type ITRs. Modified ITRs may also be used, which modification may include the deletion, insertion or substitution of one or more nucleotides from the wild-type ITR in the sequences forming arms B and B' and/or arms C and C' (see, for example, FIG. 6-8 and 10, FIG. 11B from PCT/US19/14122), and may have two or more hairpin loops (see, for example, FIG. 6-8, FIG. 11B from PCT/US 19/14122) or one hairpin loop (see, for example, FIGS. 10A-10B, FIG. 11B from PCT/US19/14122). A hairpin loop-modified ITR can be generated by genetic modification of an existing oligo or by biological and/or chemical de novo synthesis.
[00543] В неограничивающем примере ITR-6 слева и справа (SEQ ID NO: 111 и 112) включают 40 делеций нуклеотидов в плечах В-В' и С-С' из ITR дикого типа ААВ2. Прогнозируется, что нуклеотиды, оставшиеся в модифицированном ITR, образуют одну шпилечную структуру. Свободная энергия Гиббса разворачивания структуры составляет примерно -54,4 ккал/моль. В ITR также могут быть внесены другие модификации, включая необязательную делецию функционального сайта связывания Rep или сайта TRS. ПРИМЕР 3: получение зкДНК за счет конструирования олигонуклеотидов[00543] In a non-limiting example, ITR-6 left and right (SEQ ID NOs: 111 and 112) include 40 nucleotide deletions in arms B-B' and C-C' from the wild-type AAB2 ITR. The nucleotides remaining in the modified ITR are predicted to form a single hairpin structure. The Gibbs free energy of unfolding of the structure is approximately -54.4 kcal/mol. Other modifications may also be made to the ITR, including optional deletion of a functional Rep binding site or TRS site. EXAMPLE 3: obtaining cccDNA by designing oligonucleotides
[00544] Другой примерный способ получения зкДНК-вектора с использованием синтетического способа, который включает сборку различных олигонуклеотидов, представлен в Примере 3 из PCT/US19/14122, в котором зкДНК-вектор получают путем синтеза 5'-олигонуклеотида и 3'-олигонуклеотида ITR и лигирования указанных олигонуклеотидов ITR в двухцепочечный полинуклеотид, содержащий экспрессионную кассету. На ФИГ. 11В из PCT/US19/14122 представлен примерный способ лигирования 3'-олигонуклеотида ITR и 3'-олигонуклеотида ITR в двухцепочечный полинуклеотид, содержащий экспрессионную кассету.[00544] Another exemplary method of producing a cccDNA vector using a synthetic method that involves the assembly of various oligonucleotides is presented in Example 3 of PCT/US19/14122, in which a ccDNA vector is prepared by synthesizing a 5' oligonucleotide and a 3' ITR oligonucleotide and ligating said ITR oligonucleotides into a double-stranded polynucleotide containing an expression cassette. In FIG. 11B of PCT/US19/14122 shows an exemplary method for ligating a 3' ITR oligonucleotide and a 3' ITR oligonucleotide into a double-stranded polynucleotide containing an expression cassette.
[00545] Как раскрыто в данном документе, олигонуклеотиды ITR могут содержать WT-ITR (например, см. ФИГ. 3А, ФИГ. 3С) или модифицированные ITR (например, см. ФИГ. 3В и ФИГ. 3D). (См. также, например, ФИГ. 6А, 6В, 7А и 7В из PCT/US 19/14122, которая полностью включена в данный документ). Примерные олигонуклеотиды ITR включают, но не ограничиваются перечисленными, SEQ ID NO: 134-145 (например, см. Таблицу 7 в PCT/US19/14122). Модифицированные ITR могут включать делецию, вставку или замену одного или более нуклеотидов из ITR дикого типа в последовательностях, образующих плечо В и В' и/или плечо С и С'. Олигонуклеотиды ITR, содержащие WT-ITR или mod-ITR, описанные в данном документе, для использования в бесклеточном синтезе могут быть получены путем генетической модификации или биологического и/или химического синтеза. Как обсуждается в данном документе, олигонуклеотиды ITR в Примерах 2 и 3 могут содержать WT-ITR или модифицированные ITR (mod-ITR) в симметричных или асимметричных конфигурациях, как обсуждается в данном документе. ПРИМЕР 4: получение зкДНК за счет одноцепочечной молекулы ДНК[00545] As disclosed herein, ITR oligonucleotides may comprise WT-ITR (eg, see FIG. 3A, FIG. 3C) or modified ITRs (eg, see FIG. 3B and FIG. 3D). (See also, for example, FIGS. 6A, 6B, 7A and 7B from PCT/US 19/14122, which is incorporated herein in its entirety). Exemplary ITR oligonucleotides include, but are not limited to, SEQ ID NO: 134-145 (eg, see Table 7 in PCT/US19/14122). Modified ITRs may include the deletion, insertion, or substitution of one or more nucleotides from the wild-type ITR in the sequences forming arms B and B' and/or arms C and C'. ITR oligonucleotides containing WT-ITR or mod-ITR described herein for use in cell-free synthesis can be obtained by genetic modification or biological and/or chemical synthesis. As discussed herein, the ITR oligonucleotides in Examples 2 and 3 may contain WT-ITRs or modified ITRs (mod-ITRs) in symmetric or asymmetric configurations, as discussed herein. EXAMPLE 4: obtaining cccDNA from a single-stranded DNA molecule
[00546] В другом примерном способе получения зкДНК-вектора с использованием синтетического способа, представленном в Примере 4 из PCT/US19/14122, используют одноцепочечную линейную ДНК, содержащую два смысловых ITR, которые фланкируют смысловую последовательность экспрессионной кассеты и ковалентно присоединены к двум антисмысловым ITR, которые фланкируют антисмысловую последовательность экспрессионной кассеты, а концы указанной одноцепочечной линейной ДНК затем лигируют с образованием одноцепочечной молекулы с замкнутыми концами. Один неограничивающий пример включает синтез и/или продуцирование молекулы одноцепочечной ДНК, ренатурацию частей указанной молекулы с образованием одной линейной молекулы ДНК, которая содержит одну или более областей вторичной структуры со спаренными основаниями, с последующим лигированием свободных 5'- и 3'-концов между собой с образованием замкнутой одноцепочечной молекулы.[00546] Another exemplary method for producing a cccDNA vector using a synthetic method, presented in Example 4 of PCT/US19/14122, uses single-stranded linear DNA containing two sense ITRs that flank the sense sequence of the expression cassette and are covalently attached to two antisense ITRs , which flank the antisense sequence of the expression cassette, and the ends of the specified single-stranded linear DNA are then ligated to form a single-stranded molecule with closed ends. One non-limiting example involves synthesizing and/or producing a single-stranded DNA molecule, renaturing portions of said molecule to form a single linear DNA molecule that contains one or more base-paired secondary structure regions, then ligating the free 5' and 3' ends together with the formation of a closed single-chain molecule.
[00547] Примерная одноцепочечная молекула ДНК для получения зкДНК-вектора содержит, от 5' к 3': смысловой первый ITR; смысловую последовательность экспрессионной кассеты; смысловой второй ITR; антисмысловой второй ITR; антисмысловую последовательность экспрессионной кассеты; и антисмысловой первый ITR.[00547] An exemplary single-stranded DNA molecule for producing a cccDNA vector contains, from 5' to 3': a sense first ITR; semantic sequence of the expression cassette; semantic second ITR; antisense second ITR; antisense sequence of the expression cassette; and antisense first ITR.
[00548] Молекула одноцепочечной ДНК для использования в примерном способе Примера 4 может быть образована с помощью любой методологии синтеза ДНК, описанной в данном документе, например, путем синтеза ДНК in vitro, или обеспечена путем расщепления конструкции ДНК (например, плазмиды) нуклеазами и плавления полученных фрагментов дцДНК для получения фрагментов оцДНК.[00548] The single-stranded DNA molecule for use in the exemplary method of Example 4 can be formed using any DNA synthesis methodology described herein, for example, by in vitro DNA synthesis, or provided by digestion of a DNA construct (e.g., plasmid) with nucleases and melting obtained dsDNA fragments to obtain ssDNA fragments.
[00549] Ренатурацию можно осуществлять путем понижения температуры ниже расчетных температур плавления пар смысловой и антисмысловой последовательностей. Температура плавления зависит от содержания конкретных нуклеотидных оснований и характеристик используемого раствора, например, от концентрации соли. Температуры плавления для любой конкретной последовательности и комбинации растворов легко рассчитываются обычным специалистом в данной области техники.[00549] Renaturation can be accomplished by lowering the temperature below the calculated melting temperatures of sense and antisense sequence pairs. The melting point depends on the content of the specific nucleotide bases and the characteristics of the solution used, for example, on the salt concentration. Melting points for any particular sequence and combination of solutions are readily calculated by one of ordinary skill in the art.
[00550] Свободные 5' и 3' концы ренатурированной молекулы могут быть лигированы друг с другом или лигированы со шпилечной молекулой с образованием зкДНК-вектора. Подходящие примерные методологии лигирования и шпилечные молекулы описаны в Примерах 2 и 3.[00550] The free 5' and 3' ends of the renatured molecule can be ligated to each other or ligated to a hairpin molecule to form a cccDNA vector. Suitable exemplary ligation methodologies and hairpin molecules are described in Examples 2 and 3.
ПРИМЕР 5: Очистка и/или подтверждение получения зкДНКEXAMPLE 5: Purification and/or confirmation of ccDNA acquisition
[00551] Любой из продуктов ДНК-вектора, полученных с помощью способов, описанных в данном документе, например, включая способы получения на основе клеток насекомых, описанные в Примере 1, или синтетические способы получения, описанные в Примерах 2-4, может быть очищен, например, для удаления примесей, неиспользованных компонентов или побочных продуктов с использованием методов, обычно известных квалифицированному специалисту; и/или может быть проанализирован для подтверждения того, что полученный ДНК-вектор (в данном случае зкДНК-вектор) представляет собой целевую молекулу. Примерным методом очистки ДНК-вектора, например, зкДНК, является использование протокола очистки Qiagen Midi Plus (Qiagen) и/или очистки на геле.[00551] Any of the DNA vector products produced by the methods described herein, for example, including the insect cell-based production methods described in Example 1 or the synthetic production methods described in Examples 2-4, can be purified , for example, to remove impurities, unused components or by-products using methods generally known to a qualified specialist; and/or can be analyzed to confirm that the resulting DNA vector (in this case the cDNA vector) is the target molecule. An exemplary method for purifying a DNA vector, such as cccDNA, is to use the Qiagen Midi Plus purification protocol (Qiagen) and/or gel purification.
[00552] Ниже приведен примерный метод подтверждения идентичности зкДНК-векторов.[00552] The following is an exemplary method for confirming the identity of cccDNA vectors.
[00553] ДНК-векторы можно идентифицировать с помощью электрофореза в агарозном геле в нативных или денатурирующих условиях, как проиллюстрировано на ФИГ. 4D, где (а) наличие характерных полос, мигрирующих при двукратно большем размере на денатурирующих гелях, по сравнению с нативными гелями, после расщепления рестрикционной эндонуклеазой и анализа методом гель-электрофореза, и (b) наличие полос мономера и димера (2х) на денатурирующих гелях для нерасщепленного материала характеризует наличие зкДНК-вектора.[00553] DNA vectors can be identified by agarose gel electrophoresis under native or denaturing conditions, as illustrated in FIG. 4D, where (a) the presence of characteristic bands migrating at twice the size on denaturing gels compared to native gels after restriction endonuclease digestion and analysis by gel electrophoresis, and (b) the presence of monomer and dimer bands (2x) on denaturing gels for undigested material is characterized by the presence of a cDNA vector.
[00554] Структуры выделенных зкДНК-векторов были дополнительно проанализированы путем расщепления очищенной ДНК рестрикциоиными эндонуклеазами, выбранными на основании а) присутствия только одного сайта разрезания в зкДНК-векторах, и b) получения фрагментов достаточно большого размера, чтобы они были отчетливо видны при фракционировании на 0,8% денатурирующем агарозном геле (>800 п. о.). Как проиллюстрировано на ФИГ. 4С и 4D, линейные ДНК-векторы с прерывистой структурой и зкДНК-вектор с линейной и непрерывной структурой можно различить по размеру их продуктов реакции - например, ожидается, что ДНК-вектор с прерывистой структурой даст фрагменты размером 1 тыс.п.о. и 2 тыс.п.о., в то время как зкДНК-вектор с непрерывной структурой, как ожидается, даст фрагменты размером 2 тыс.п.о. и 4 тыс. п. о.[00554] The structures of the isolated cccDNA vectors were further analyzed by digesting the purified DNA with restriction endonucleases selected based on a) the presence of only one cutting site in the ccDNA vectors, and b) obtaining fragments large enough to be clearly visible when fractionated into 0.8% denaturing agarose gel (>800 bp). As illustrated in FIG. 4C and 4D, linear discontinuous DNA vectors and linear and continuous cccDNA vectors can be distinguished by the size of their reaction products—for example, a discontinuous DNA vector is expected to produce 1 kb fragments. and 2 kb, while a continuous cccDNA vector is expected to produce 2 kb fragments. and 4 thousand p.o.
[00555] Таким образом, чтобы качественно продемонстрировать, что выделенные зкДНК-векторы имеют ковалентно замкнутые концы, как требует их определение, образцы расщепляли рестрикционной эндонуклеазой, идентифицированной на основании конкретной последовательности ДНК-вектора как эндонуклеаза с одним сайтом рестрикции, что предпочтительно приводит к получению двух продуктов расщепления неравного размера (например, 1000 п. о. и 2000 п. о.). После расщепления и электрофореза на денатурирующем геле (который разделяет две комплементарные цепи ДНК) линейная, не замкнутая ковалентно ДНК будет разделяться на фрагменты размером 1000 п. о. и 2000 п. о., в то время как ковалентно замкнутая ДНК (т.е. зкДНК-вектор) будет разделяться на фрагменты в 2 раза большего размера (2000 п. о. и 4000 п. о.), так как две цепи ДНК связаны, уже развернуты и имеют вдвое большую длину (но одноцепочечные). Кроме того, при расщеплении мономерных, димерных и n-мерных форм ДНК-векторов все они будут разделяться на фрагменты одинаковых размеров из-за связанных между собой концов мультимерных ДНК-векторов (см. ФИГ. 4Е).[00555] Thus, to qualitatively demonstrate that the isolated cccDNA vectors have covalently closed ends as required by their definition, samples were digested with a restriction endonuclease identified based on the specific sequence of the DNA vector as a single site restriction endonuclease, preferably resulting in two cleavage products of unequal size (for example, 1000 bp and 2000 bp). After digestion and electrophoresis on a denaturing gel (which separates two complementary DNA strands), linear, non-covalently closed DNA will be separated into 1000 bp fragments. and 2000 bp, while covalently closed DNA (i.e. cDNA vector) will be divided into fragments 2 times larger (2000 bp and 4000 bp), since two chains The DNA is linked, already unfolded, and twice as long (but single-stranded). In addition, when the monomeric, dimeric and n-mer forms of DNA vectors are digested, they will all be separated into fragments of the same size due to the interconnected ends of the multimeric DNA vectors (see FIG. 4E).
[00556] В данном документе выражение «анализ для идентификации ДНК-векторов с помощью электрофореза на агарозном геле на нативном геле и в денатурирующих условиях» относится к анализу для оценки наличия замкнутых концов зкДНК путем выполнения расщепления рестрикционной эндонуклеазой с последующей электрофоретической оценкой продуктов расщепления. Ниже приведен один такой примерный анализ, хотя обычный специалист в данной области техники поймет, что возможны многие известные в данной области техники вариации этого примера. Рестрикционную эндонуклеазу выбирают таким образом, чтобы это был фермент, выполняющий единственный разрез представляющего интерес зкДНК-вектора с образованием продуктов, длина которых составляет приблизительно 1/3× и 2/3× от длины ДНК-вектора. Это обеспечивает разделение полос как на нативном, так и на денатурирующем гелях. Перед денатурацией важно удалить буфер из образца. Набор для очистки продуктов ПЦР от Qiagen или «центрифужные колонки» для обессоливания, например, колонки GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25, представляют собой некоторые из известных в данной области техники средств для расщепления эндонуклеазами. Анализ включает, например, i) расщепление ДНК соответствующей рестрикционной эндонуклеазой (ами), 2) внесение, например, в набор для очистки продуктов ПЦР от Qiagen, элюирование дистиллированной водой, iii) добавление 10-кратного денатурирующего раствора (10х=0,5 М NaOH, 10 мМ ЭДТА), добавление 10-кратного красителя, не забуференного, и проведение анализа с использованием маркеров молекулярной массы ДНК, приготовленных путем добавления 10-кратного денатурирующего раствора к 4-кратному, на 0,8-1,0% геле, предварительно инкубированном с 1 мМ ЭДТА и 200 мМ NaOH, чтобы обеспечить одинаковую концентрацию NaOH в геле и в боксе для геля, и анализ геля в присутствии 1х денатурирующего раствора (50 мМ NaOH, 1 мМ ЭДТА). Обычный специалист в данной области техники поймет, какое напряжение использовать для проведения электрофореза на основании размера и желаемого времени получения результатов. После электрофореза гели дренируют, нейтрализуют в 1х ТВЕ или ТАЕ и переносят в дистиллированную воду или 1х ТВЕ/ТАЕ с lx SYBR Gold. Затем полосы могут быть визуализированы, например, с использованием красителя SYBR® Gold Nucleic Acid Gel Stain от Thermo Fisher (10000-кратный концентрат в ДМСО) и эпифлуоресцентного света (синего) или УФ (312 нм). Вышеупомянутый метод на основе геля может быть адаптирован для целей очистки путем выделения зкДНК-вектора из полосы геля и обеспечения его ренатурации.[00556] As used herein, the expression “assay for identifying DNA vectors by agarose gel electrophoresis on a native gel and under denaturing conditions” refers to an assay for assessing the presence of closed ends of cccDNA by performing restriction endonuclease digestion followed by electrophoretic assessment of the digestion products. The following is one such exemplary analysis, although one of ordinary skill in the art will appreciate that many variations of this example known in the art are possible. The restriction endonuclease is selected to be the enzyme that makes a single cut of the cDNA vector of interest to produce products that are approximately 1/3× and 2/3× the length of the DNA vector. This ensures band separation on both native and denaturing gels. It is important to remove the buffer from the sample before denaturation. Qiagen's PCR Product Purification Kit or desalting "spun columns", such as the GE HEALTHCARE ILUSTRA™ MICROSPIN™ G-25 columns, are some of the endonuclease digestion tools known in the art. The analysis involves, for example, i) digestion of DNA with appropriate restriction endonuclease(s), 2) addition, for example, to a Qiagen PCR purification kit, eluting with distilled water, iii) addition of a 10x denaturing solution (10x=0.5 M NaOH, 10 mM EDTA), adding 10x unbuffered dye, and performing analysis using DNA molecular weight markers prepared by adding a 10x denaturing solution to a 4x, 0.8-1.0% gel, preincubated with 1 mM EDTA and 200 mM NaOH to ensure the same concentration of NaOH in the gel and in the gel box, and analyze the gel in the presence of 1x denaturing solution (50 mM NaOH, 1 mM EDTA). One of ordinary skill in the art will understand what voltage to use for electrophoresis based on size and desired time to obtain results. After electrophoresis, the gels are drained, neutralized in 1x TBE or TAE and transferred to distilled water or 1x TBE/TAE with lx SYBR Gold. The bands can then be visualized, for example, using Thermo Fisher's SYBR® Gold Nucleic Acid Gel Stain (10,000x concentrate in DMSO) and epifluorescent light (blue) or UV (312 nm). The above gel-based method can be adapted for purification purposes by isolating the cDNA vector from the gel band and allowing it to renature.
[00557] Чистоту полученного зкДНК-вектора можно оценить с помощью любого метода, известного в данной области техники. В качестве одного примерного и неограничивающего метода, вклад зкДНК-плазмиды в общее УФ-поглощение образца можно оценить путем сравнения интенсивности флуоресценции зкДНК-вектора со стандартом. Например, если на основании поглощения УФ определено, что на гель загружено 4 мкг зкДНК-вектора, а интенсивность флуоресценции зкДНК-вектора эквивалентна полосе 2 тыс.п.о. при известной массе 1 мкг, значит, масса зкДНК-вектора равна 1 мкг, и зкДНК-вектор составляет 25% от общего количества поглощающего УФ материала. Затем строят график зависимости интенсивности полосы на геле от вычисленного введенного количества, которому соответствует полоса - например, если общее количество зкДНК-вектора соответствует 8 тыс.п.о., а вырезанная сравнительная полоса соответствует 2 тыс.п.о., то интенсивность указанной полосы на графике будет соответствовать 25% от общего введенного количества, что в данном случае составит 0,25 мкг при введении 1,0 мкг. Используя титрование плазмиды зкДНК-вектора для построения стандартной кривой, затем рассчитывают количество для полосы зкДНК-вектора, используя уравнение линии регрессии, которое затем можно использовать для определения процента от общего введенного количества, представленного зкДНК-вектором, или процента чистоты.[00557] The purity of the resulting cccDNA vector can be assessed using any method known in the art. As one exemplary and non-limiting method, the contribution of the cDNA plasmid to the total UV absorbance of the sample can be assessed by comparing the fluorescence intensity of the cDNA vector with a standard. For example, if based on UV absorbance it is determined that 4 μg of ccDNA vector is loaded on the gel, and the fluorescence intensity of the ccDNA vector is equivalent to a 2 kb band. with a known mass of 1 μg, then the mass of the ccDNA vector is 1 μg, and the ccDNA vector constitutes 25% of the total amount of UV absorbing material. The intensity of the band on the gel is then plotted against the calculated input amount to which the band corresponds - for example, if the total amount of cDNA vector corresponds to 8 kb, and the excised comparative band corresponds to 2 kb, then the intensity of the indicated the bars on the graph will correspond to 25% of the total amount administered, which in this case would be 0.25 mcg when 1.0 mcg was administered. Using titration of the cccDNA vector plasmid to construct a standard curve, the quantity for the cccDNA vector band is then calculated using the regression line equation, which can then be used to determine the percentage of the total input amount represented by the cccDNA vector, or the percentage purity.
ПРИМЕР 6: Контролируемая экспрессия трансгена с зкДНК: экспрессия трансгена с зкДНК-вектора in vivo может поддерживаться и/или повышаться путем повторного введения дозы.EXAMPLE 6: Controlled expression of a cccDNA transgene: Expression of a cccDNA vector transgene in vivo can be maintained and/or increased by repeated dosing.
[00558] ЗкДНК-вектор получали в соответствии со способами, описанными в Примере 1 выше, с использованием зкДНК-плазмиды, содержащей промотор CAG (SEQ ID NO: 72) и трансген люциферазы (SEQ ID NO: 56), в качестве примерного FVIII, фланкированный асимметричными ITR (например, 5'-WT-ITR (SEQ ID NO: 2) и 3' mod-ITR (SEQ ID NO: 3)), и оценивали в различных программах лечения in vivo. Этот зкДНК-вектор использовали во всех последующих экспериментах, описанных в Примерах 6-10. В Примере 6 зкДНК-вектор очищали, изготавливали в виде состава с липидной наночастицей (ЛНЧ-зкДНК) и вводили путем инъекции в хвостовую вену каждой мыши CD-I® IGS. Липосомы изготавливали с использованием подходящей смеси липидов, содержащей четыре компонента для образования липосом на основе липидных наночастиц (ЛНЧ), включая катионные липиды, вспомогательные липиды, холестерин и ПЭГ-липиды.[00558] The cccDNA vector was prepared in accordance with the methods described in Example 1 above, using a ccDNA plasmid containing the CAG promoter (SEQ ID NO: 72) and a luciferase transgene (SEQ ID NO: 56), as an example FVIII, flanked by asymmetric ITRs (eg, 5'-WT-ITR (SEQ ID NO: 2) and 3' mod-ITR (SEQ ID NO: 3)), and were evaluated in various in vivo treatment programs. This cDNA vector was used in all subsequent experiments described in Examples 6-10. In Example 6, the cccDNA vector was purified, formulated as a lipid nanoparticle (LNP-ccDNA) and administered by tail vein injection into each CD-I® IGS mouse. Liposomes were prepared using a suitable lipid mixture containing four components to form lipid nanoparticle (LNP) liposomes, including cationic lipids, auxiliary lipids, cholesterol, and PEG lipids.
[00559] Для оценки устойчивой экспрессии трансгена in vivo с зкДНК-вектора на протяжении длительного периода времени ЛНЧ-зкДНК вводили в стерильном ФСБ путем внутривенной инъекции в хвостовую вену мышам CD-I® IGS в возрасте приблизительно 5-7 недель. Была проведена оценка трех групп с разными дозировками: 0,1 мг/кг, 0,5 мг/кг и 1,0 мг/кг, по десять мышей на группу (за исключением группы 1,0 мг/кг, в которой было 15 мышей на группу). Инъекции вводили в день 0. Пять мышей из каждой группы получали инъекцию дополнительной идентичной дозы в день 28. Экспрессию люциферазы измеряли путем визуализации IVIS после внутривенного введения мышам CD-I® IGS (Charles River Laboratories; мыши дикого типа (WT)). Экспрессию люциферазы оценивали с помощью визуализации IVIS после введения путем внутрибрюшинной инъекции 150 мг/кг субстрата люциферина в дни 3, 4, 7, 14, 21, 28, 31, 35 и 42 и регулярно (например, еженедельно, два раза в неделю или через каждые 10 суток, или через каждые 2 недели) в период между днями 42-110. Экспрессия трансгена люциферазы, в качестве примерного FVIII, измеренная с помощью визуализации IVIS в течение по меньшей мере 132 дней после 3 разных протоколов введения (данные не показаны).[00559] To evaluate sustained in vivo transgene expression from a cccDNA vector over an extended period of time, LNP-ccDNA was administered in sterile PBS by intravenous tail vein injection into CD-I® IGS mice at approximately 5-7 weeks of age. Three groups were evaluated at different dosages: 0.1 mg/kg, 0.5 mg/kg and 1.0 mg/kg, ten mice per group (except for the 1.0 mg/kg group, which had 15 mice per group). Injections were administered on day 0. Five mice from each group received an injection of an additional identical dose on day 28. Luciferase expression was measured by IVIS imaging following intravenous administration of CD-I® IGS mice (Charles River Laboratories; wild-type (WT) mice). Luciferase expression was assessed by IVIS imaging after administration by intraperitoneal injection of 150 mg/kg luciferin substrate on days 3, 4, 7, 14, 21, 28, 31, 35, and 42 and regularly (eg, weekly, twice weekly, or every other every 10 days, or every 2 weeks) between days 42-110. Luciferase transgene expression, exemplified by FVIII, measured by IVIS imaging for at least 132 days after 3 different administration protocols (data not shown).
[00560] Расширенное исследование выполняли для изучения эффекта повторной дозы, например, повторного введения ЛНЧ-зкДНК, экспрессирующей люциферазу, субъектам, получавшим ЛНЧ-зкДНК. В частности, оценивали возможность повышения уровней экспрессии путем одного или более дополнительных введений зкДНК-вектора.[00560] An extension study was performed to examine the effect of repeated dosing, eg, repeated administration of LNP-ccDNA expressing luciferase to subjects receiving LNP-ccDNA. In particular, the possibility of increasing expression levels by one or more additional injections of the cccDNA vector was assessed.
[00561] В этом исследовании биораспределение экспрессии люциферазы с зкДНК-вектора оценивали с помощью IVIS у мышей CD-1® IGS после первоначального внутривенного введения 1,0 мг/кг (т.е. праймирующей дозы) в дни 0 и 28 (Группа А). Второе введение зкДНК-вектора осуществляли путем инъекции в хвостовую вену 3 мг/кг (Группа В) или 10 мг/кг (Группа С) в 1,2 мл в хвостовую вену в день 84. В этом исследовании использовали по пять (5) мышей CD-1® в каждой из Групп А, В и С. Визуализацию IVIS экспрессии люциферазы у мышей выполняли перед введением дополнительных доз в дни 49, 56, 63 и 70, как описано выше, а также после введения повторных доз в день 84 и в дни 91, 98, 105, 112 и 132. Экспрессию люциферазы оценивали и детектировали во всех трех Группах А, В и С по меньшей мере до дня 110 (самый продолжительный оцененный период).[00561] In this study, the biodistribution of cccDNA vector luciferase expression was assessed by IVIS in CD-1® IGS mice after an initial intravenous administration of 1.0 mg/kg (i.e., priming dose) on days 0 and 28 (Group A ). The second administration of cccDNA vector was by tail vein injection of 3 mg/kg (Group B) or 10 mg/kg (Group C) in 1.2 ml tail vein injection on day 84. Five (5) mice were used in this study. CD-1® in each of Groups A, B and C. IVIS imaging of luciferase expression in mice was performed before additional doses on days 49, 56, 63 and 70 as described above, and after repeated doses on day 84 and days 91, 98, 105, 112 and 132. Luciferase expression was assessed and detected in all three Groups A, B and C until at least day 110 (the longest period assessed).
[00562] Было показано, что уровень экспрессии люциферазы повышается с помощью повторной дозы (т.е. повторного введения композиции зкДНК) ЛНЧ-зкДНК-Luc, согласно определению путем оценки активности люциферазы в присутствии люциферина. Экспрессия трансгена люциферазы, в качестве примерного FVIII, измеренная с помощью визуализации IVIS в течение по меньшей мере 110 дней после 3 разных протоколов введения (Группы А, В и С). У мышей, не получавших никакой дополнительной повторной дозы (праймирующая доза 1 мг/кг (т.е. Группа А)), наблюдали стабильную экспрессию люциферазы на протяжении всего исследования. Мыши в группе В, которым вводили повторную дозу 3 мг/кг зкДНК-вектора, демонстрировали приблизительно семикратное увеличение наблюдаемой светимости по сравнению с мышами в Группе С. Неожиданно, мыши, получившие повторную дозу 10 мг/кг зкДНК-вектора, продемонстрировали 17-кратное увеличение наблюдаемой светимости люциферазы по сравнению с мышами, не получавшими никакой повторной дозы (Группа А).[00562] The level of luciferase expression has been shown to be increased by repeated dosing (ie, repeated administration of a cccDNA composition) of LNP-ccDNA-Luc, as determined by assessing luciferase activity in the presence of luciferin. Luciferase transgene expression, as an example of FVIII, measured by IVIS imaging for at least 110 days after 3 different administration protocols (Groups A, B and C). Mice that did not receive any additional boost dose (priming dose of 1 mg/kg (i.e., Group A)) exhibited stable luciferase expression throughout the study. Mice in Group B that received a repeat dose of 3 mg/kg cccDNA vector showed approximately a sevenfold increase in observed luminosity compared to mice in Group C. Surprisingly, mice that received a repeat dose of 10 mg/kg cccDNA vector showed a 17-fold increase in observed luminosity. increase in observed luciferase luminosity compared to mice that did not receive any repeat dose (Group A).
[00563] Группа А мышей CD-1® IGS демонстрирует экспрессию люциферазы после внутривенного введения 1 мг/кг зкДНК-вектора в хвостовую вену в дни 0 и 28. Группы В и С мышей CD-1® IGS демонстрируют экспрессию люциферазы после введения 1 мг/кг зкДНК-вектора в первый момент времени (день 0) и введения повторной дозы зкДНК-вектора во второй момент времени в день 84. Второе введение (т.е. повторная доза) зкДНК-вектора повысило экспрессию по меньшей мере в 7 раз, и даже до 17 раз.[00563] Group A CD-1® IGS mice demonstrate luciferase expression following intravenous tail vein administration of 1 mg/kg cccDNA vector on days 0 and 28. Groups B and C CD-1® IGS mice demonstrate luciferase expression following 1 mg administration /kg of cccDNA vector at the first time point (day 0) and a repeat dose of ccDNA vector at the second time point on day 84. A second dose (i.e., boost) of ccDNA vector increased expression by at least 7-fold, and even up to 17 times.
[00564] 3-кратное увеличение дозы (т.е. количества) зкДНК-вектора при повторном введении дозы в Группе В (т.е. при повторном введении дозы 3 мг/кг) привело к 7-кратному увеличению экспрессии люциферазы. Также неожиданно 10-кратное увеличение количества зкДНК-вектора при повторном введении дозы (т.е. при повторном введении дозы 10 мг/кг) в Группе С привело к 17-кратному увеличению экспрессии люциферазы. Таким образом, второе введение (т.е. повторная доза) зкДНК повысило экспрессию по меньшей мере в 7 раз, и даже до 17 раз. Это показывает, что повышение экспрессии трансгена в результате повторной дозы больше, чем ожидалось, и зависит от дозы или количества зкДНК-вектора при введении повторной дозы и, по-видимому, является синергическим по отношению к начальной экспрессии трансгена после первоначального праймирующего введения в день 0. Таким образом, дозозависимое повышение экспрессии трансгена не является аддитивным, скорее, уровень экспрессии трансгена является дозозависимым и сверхпропорционален суммарному количеству зкДНК-вектора, введенному в каждый момент времени.[00564] A 3-fold increase in dose (i.e., amount) of cccDNA vector upon repeated dosing in Group B (i.e., upon repeated dosing of 3 mg/kg) resulted in a 7-fold increase in luciferase expression. Also unexpectedly, a 10-fold increase in the amount of cccDNA vector upon repeated dosing (i.e., a repeat dose of 10 mg/kg) in Group C resulted in a 17-fold increase in luciferase expression. Thus, a second administration (i.e., repeat dose) of cccDNA increased expression by at least 7-fold, and even up to 17-fold. This shows that the increase in transgene expression resulting from repeat dosing is greater than expected and dependent on the dose or amount of cccDNA vector at repeat dosing and appears to be synergistic with the initial transgene expression after the initial priming on day 0 Thus, the dose-dependent increase in transgene expression is not additive, rather, the level of transgene expression is dose-dependent and super-proportional to the total amount of cccDNA vector introduced at each time point.
[00565] Обе группы В и С показали значительное дозозависимое повышение экспрессии люциферазы по сравнению с контрольными мышами (Группа А), которые не получали повторной дозы зкДНК-вектора во второй момент времени. В совокупности эти данные показывают, что экспрессия трансгена с зкДНК-вектора может быть повышена дозозависимым образом с помощью повторной дозы (т.е. повторного введения) зкДНК-вектора по меньшей мере во второй момент времени.[00565] Both Groups B and C showed a significant dose-dependent increase in luciferase expression compared to control mice (Group A) that did not receive a repeat dose of the cccDNA vector at the second time point. Taken together, these data indicate that expression of a cccDNA vector transgene can be increased in a dose-dependent manner by re-dosing (ie, reintroducing) the cccDNA vector at at least a second time point.
[00566] В совокупности эти данные демонстрируют, что уровень экспрессии трансгена, например, FVIII, с зкДНК-векторов может поддерживаться на устойчивом уровне на протяжении по меньшей мере 84 дней и может быть повышен in vivo после повторной дозы зкДНК-вектора, введенной по меньшей мере во второй момент времени. ПРИМЕР 7: Устойчивая экспрессия трансгена in vivo зкДНК-векторами, изготовленными в виде составов с ЛНЧ[00566] Taken together, these data demonstrate that the level of transgene expression, such as FVIII, from cccDNA vectors can be maintained at a steady state for at least 84 days and can be increased in vivo after a repeated dose of cccDNA vector administered at least at least at the second point in time. EXAMPLE 7: Stable expression of a transgene in vivo with cDNA vectors prepared as formulations with LNPs
[00567] Воспроизводимость результатов, полученных в Примере 6, с другой липидной наночастицей оценивали in vivo на мышах. В день 0 мышам вводили дозу либо зкДНК-вектора, содержащего трансген люциферазы, управляемый промотором CAG, который был инкапсулирован в ЛНЧ, отличную от использованной в Примере 6, либо тех же ЛНЧ, содержащих поли(С), но без зкДНК или гена люциферазы. В частности, самцам мышей CD-1® в возрасте приблизительно 4 недель вводили однократную инъекцию 0,5 мг/кг ЛНЧ-зкДНК-люциферазы или контрольных ЛНЧ-поли(С), вводимых внутривенно через латеральную хвостовую вену в день 0. В день 14 животным вводили системно люциферин в дозе 150 мг/кг путем внутрибрюшинной инъекции при 2,5 мл/кг. Приблизительно через 15 минут после введения люциферина каждое животное визуализировали с использованием системы визуализации in vivo («IVIS»).[00567] The reproducibility of the results obtained in Example 6 with another lipid nanoparticle was assessed in vivo in mice. On day 0, mice were dosed with either a cccDNA vector containing a luciferase transgene driven by the CAG promoter that was encapsulated in an LNP different from that used in Example 6, or the same LNP containing poly(C) but without the ccDNA or luciferase gene. Specifically, male CD-1® mice, approximately 4 weeks old, were given a single injection of 0.5 mg/kg LNP-ccDNA-luciferase or control LNP-poly(C) administered intravenously via the lateral tail vein on day 0. On day 14 The animals were administered systemic luciferin at a dose of 150 mg/kg by intraperitoneal injection at 2.5 ml/kg. Approximately 15 minutes after luciferin administration, each animal was imaged using an in vivo imaging system (“IVIS”).
[00568] Как показано на ФИГ. 7, значительная флуоресценция в печени наблюдалась у всех четырех мышей, получивших зкДНК, при этом за исключением места инъекции у животных наблюдалась очень незначительная флуоресценция, это указывает на то, что ЛНЧ опосредовали специфичную для печени доставку конструкции зкДНК, и что доставленный зкДНК-вектор был способен к контролируемой устойчивой экспрессии своего трансгена в течение по меньшей мере двух недель после введения. ПРИМЕР 8: Устойчивая экспрессия трансгена в печени in vivo после введения зкД НК-вектора[00568] As shown in FIG. 7, significant fluorescence in the liver was observed in all four mice receiving cccDNA, with very little fluorescence observed in the animals except at the injection site, indicating that LNPs mediated liver-specific delivery of the cccDNA construct and that the delivered cccDNA vector was capable of controlled, sustained expression of its transgene for at least two weeks after administration. EXAMPLE 8: Sustained expression of a transgene in the liver in vivo after administration of a hCD NK vector
[00569] В отдельном эксперименте оценивали локализацию зкДНК, доставленной с помощью ЛНЧ, в печени экспериментальных животных. ЗкДНК-вектор, содержащий представляющий интерес функциональный трансген, инкапсулировали в те же ЛНЧ, что и использованные в Примере 7, и вводили мышам in vivo при уровне дозы 0,5 мг/кг путем внутривенной инъекции. Через 6 часов мышей умерщвляли и отбирали образцы печени, фиксировали формалином и заливали парафином с использованием стандартных протоколов. Анализы методом гибридизации in situ RNAscope® выполняли для визуализации зкДНК-векторов в ткани с использованием зонда, специфичного для трансгена зкДНК, и детектирования с использованием хромогенной реакции и окрашивания гематоксилином (Advanced Cell Diagnostics). ФИГ. 8 показывает результаты, которые указывают на наличие зкДНК в гепатоцитах. ПРИМЕР 9: Устойчивая экспрессия трансгена зкДНК в глазах in vivo[00569] In a separate experiment, the localization of cccDNA delivered by LNP in the liver of experimental animals was assessed. The gccDNA vector containing the functional transgene of interest was encapsulated in the same LNPs as used in Example 7 and administered to mice in vivo at a dose level of 0.5 mg/kg by intravenous injection. After 6 hours, mice were sacrificed and liver samples were collected, formalin fixed, and paraffin embedded using standard protocols. RNAscope® in situ hybridization assays were performed to visualize cccDNA vectors in tissue using a probe specific for the ccDNA transgene and detection using a chromogenic reaction and hematoxylin staining (Advanced Cell Diagnostics). FIG. 8 shows results that indicate the presence of cccDNA in hepatocytes. EXAMPLE 9: Sustained expression of a cDNA transgene in the eye in vivo
[00570] Устойчивость экспрессии трансгена зкДНК-вектора в тканях, отличных от печени, оценивали для определения переносимости и экспрессии зкДНК-вектора после введения в глаза in vivo. Несмотря на то, что люциферазу использовали в качестве примерного трансгена в Примере 9, обычный специалист может легко заменить трансген люциферазы последовательностью FVIII из любой из последовательностей, перечисленных в Таблице 1.[00570] The persistence of cccDNA vector transgene expression in tissues other than the liver was assessed to determine the tolerability and expression of the ccDNA vector following ocular administration in vivo. Although luciferase was used as an exemplary transgene in Example 9, one of ordinary skill in the art can readily replace the luciferase transgene with an FVIII sequence from any of the sequences listed in Table 1.
[00571] В день 0 самцам крыс Sprague Dawley в возрасте приблизительно 9 недель вводили путем субретинальной инъекции 5 мкл либо зкДНК-вектора, содержащего трансген люциферазы, в виде состава с реагентом для трансфекции jetPEI® (Polyplus), либо плазмидной ДНК, кодирующей люциферазу, в виде состава с jetPEI®, в обоих случаях в концентрации 0,25 мкг/мкл. В каждой группе тестировали по четыре крысы. Животным давали седативное средство и вводили исследуемый препарат в правый глаз путем субретинальной инъекции с помощью иглы калибра 33. Левый глаз каждого животного оставляли интактным. Сразу после инъекции глаза проверяли методом оптической когерентной томографии или визуализации глазного дна, чтобы подтвердить наличие субретинального пузырька. Крысы получали бупренорфин и местную мазь с антибиотиком в соответствии со стандартными процедурами.[00571] On day 0, male Sprague Dawley rats approximately 9 weeks old were treated by subretinal injection with 5 μl of either a cDNA vector containing a luciferase transgene formulated with jetPEI® transfection reagent (Polyplus) or plasmid DNA encoding luciferase, as a formulation with jetPEI®, in both cases at a concentration of 0.25 μg/μl. Four rats were tested in each group. Animals were sedated and study drug was administered to the right eye by subretinal injection using a 33-gauge needle. The left eye of each animal was left intact. Immediately after injection, eyes were examined by optical coherence tomography or fundus imaging to confirm the presence of a subretinal bleb. Rats received buprenorphine and topical antibiotic ointment according to standard procedures.
[00572] В дни 7, 14, 21, 28 и 35 животным в обеих группах вводили системно свежеприготовленный люциферин в дозе 150 мг/кг путем внутрибрюшинной инъекции при 2,5 мл/кг.Через 5-15 минут после введения люциферина всех животных визуализировали с использованием IVIS под анестезией изофлураном. Полный поток [фотон/с] и средний поток (фотон/с/ср/см2) в представляющей интерес области, включающей глаз, получали при экспозиции 5 минут. Результаты представлены графически в виде средней светимости в обработанном глазу («инъецированный») для каждой группы лечения относительно средней светимости в необработанном глазу («неинъецированный») для каждой группы лечения (ФИГ. 9В). Значительная флуоресценция легко детектировалась в глазах, в которые был введен зкДНК-вектор, но была намного слабее в глазах, в которые была введена плазмида (ФИГ. 9А). Через 35 дней крыс, которым инъецировали плазмиду, умерщвляли, продолжая исследование для крыс, получивших зкДНК, с инъекцией люциферина и визуализацией IVIS в дни 42, 49, 56, 63, 70 и 99. Результаты демонстрируют, что зкДНК-вектор, введенный в глаз крысы путем однократной инъекции, опосредует экспрессию трансгена in vivo и что такая экспрессия поддерживалась на высоком уровне на протяжении по меньшей мере 99 дней после инъекции.[00572] On days 7, 14, 21, 28 and 35, animals in both groups were systemically administered freshly prepared luciferin at a dose of 150 mg/kg by intraperitoneal injection at 2.5 ml/kg. 5-15 minutes after luciferin administration, all animals were imaged using IVIS under isoflurane anesthesia. Total flux [photon/s] and average flux (photon/s/sr/cm 2 ) in the region of interest, including the eye, were obtained with an exposure of 5 minutes. The results are presented graphically as the average luminosity in the treated eye (“injected”) for each treatment group relative to the average luminosity in the untreated eye (“uninjected”) for each treatment group (FIG. 9B). Significant fluorescence was readily detected in eyes injected with the cDNA vector, but was much weaker in eyes injected with the plasmid (FIG. 9A). After 35 days, plasmid-injected rats were sacrificed, continuing the study for cccDNA-injected rats with luciferin injection and IVIS imaging on days 42, 49, 56, 63, 70, and 99. The results demonstrate that the cccDNA vector injected into the eye rats by a single injection, mediates transgene expression in vivo and that such expression was maintained at a high level for at least 99 days after injection.
ПРИМЕР 10: Длительное введение доз и введение повторных доз зкДНК-вектора у мышей Rag2.EXAMPLE 10: Chronic dosing and repeated dosing of cccDNA vector in Rag2 mice.
[00573] В ситуациях, когда один или более трансгенов, кодируемых в экспрессионной генной кассете зкДНК-вектора, экспрессируются в среде хозяина (например, в клетке или в организме субъекта), где экспрессированный белок распознается как чужеродный, существует вероятность того, что у хозяина выработается адаптивный иммунный ответ, который может привести к нежелательному истощению продукта экспрессии, которое может быть ошибочно принято за отсутствие экспрессии. В некоторых случаях это может происходить с репортерной молекулой, которая является гетерологичной для нормальной среды хозяина. Соответственно, экспрессию трансгена зкДНК-вектора оценивали in vivo в модели на мышах Rag2, в которой отсутствуют В- и Т-клетки и, следовательно, не вырабатывается адаптивный иммунный ответ на ненативные для мышей белки, такие как люцифераза. В общих чертах, в день 0 мышам линий c57b1/6 и Rag2 с подавленными генами вводили путем внутривенной инъекции в хвостовую вену 0,5 мг/кг инкапсулированного в ЛНЧ зкДНК-вектора, экспрессирующего люциферазу, или контроля поли(С), а в день 21 некоторым мышам вводили повторную дозу того же самого ЛНЧ-инкапсулированного зкДНК-вектора при том же уровне дозы. Все тестируемые группы состояли из 4 мышей в каждой. Визуализацию IVIS выполняли после инъекции люциферина, как описано в Примере 9, с недельными интервалами.[00573] In situations where one or more transgenes encoded in a cDNA vector gene expression cassette are expressed in a host environment (e.g., a cell or a subject) where the expressed protein is recognized as foreign, there is a possibility that the host an adaptive immune response will be generated that may lead to unwanted depletion of the expression product, which may be mistaken for lack of expression. In some cases, this may occur with a reporter molecule that is heterologous to the normal host environment. Accordingly, cccDNA vector transgene expression was assessed in vivo in the Rag2 mouse model, which lacks B and T cells and therefore does not mount an adaptive immune response to non-mouse-native proteins such as luciferase. In general, on day 0, gene-silenced c57b1/6 and Rag2 mice were treated by intravenous tail vein injection with 0.5 mg/kg LNP-encapsulated ccDNA vector expressing luciferase or poly(C) control, and on day 21 Some mice were given a repeat dose of the same LNP-encapsulated cccDNA vector at the same dose level. All tested groups consisted of 4 mice each. IVIS imaging was performed after luciferin injection as described in Example 9 at weekly intervals.
[00574] При сравнении полного потока, наблюдаемого в анализах IVIS, флуоресценция, наблюдаемая у мышей дикого типа (косвенная мера присутствия экспрессированной люциферазы), которым вводили ЛНЧ-зкДНК-вектор-Luc, постепенно снижалась после дня 21, в то время как мыши Rag2, которым вводили тот же самый препарат, проявили относительно постоянную устойчивую экспрессию люциферазы на протяжении 42 дней эксперимента (ФИГ. 10А). Временная точка приблизительно в день 21, в которой у мышей наблюдали снижение, соответствует временному интервалу, в котором можно ожидать появления адаптивного иммунного ответа. Повторное введение ЛНЧ с зкДНК-вектором мышам Rag2 приводило к заметному увеличению экспрессии, которая была устойчивой в течение по меньшей мере 21 дня, на протяжении которых проводили наблюдения в этом исследовании (ФИГ. 10В). Результаты позволяют предположить, что адаптивный иммунитет может играть определенную роль при экспрессии ненативного белка с зкДНК-вектора у хозяина, и что наблюдаемое снижение экспрессии в период времени 20+ дней с момента первоначального введения может указывать на мешающий адаптивный иммунный ответ на экспрессируемую молекулу, а не на снижение экспрессии (или в дополнение к ней). Следует отметить, что этот ответ, как ожидается, будет низким в случае экспрессии у хозяина нативных белков, когда, предположительно, хозяин будет правильно распознавать экспрессированные молекулы как собственные и не будет вырабатывать такой иммунный ответ.[00574] When comparing the total flux observed in IVIS assays, the fluorescence observed in wild-type mice (an indirect measure of the presence of expressed luciferase) injected with LNP-ccDNA-vector-Luc gradually decreased after day 21, while Rag2 mice , which were administered the same drug, exhibited relatively constant, robust luciferase expression throughout the 42 days of the experiment (FIG. 10A). The time point at approximately day 21 at which the mice showed a decline corresponds to the time window at which an adaptive immune response can be expected to emerge. Repeated administration of cccDNA vectored LNP to Rag2 mice resulted in a marked increase in expression that was sustained for at least the 21 days observed in this study (FIG. 10B). The results suggest that adaptive immunity may play a role in the expression of a non-native protein from a cccDNA vector in the host, and that the observed decrease in expression at a time period of 20+ days from initial administration may indicate an interfering adaptive immune response to the expressed molecule rather than to decrease expression (or in addition to it). It should be noted that this response is expected to be low when native proteins are expressed in the host, where presumably the host will correctly recognize the expressed molecules as self and will not mount such an immune response.
ПРИМЕР 11: Влияние специфической для печени экспрессии и модуляции CpG на устойчивую экспрессиюEXAMPLE 11: Effect of liver-specific expression and CpG modulation on sustained expression
[00575] Как описано в Примере 10, нежелательный иммунный ответ хозяина в некоторых случаях может искусственно ослаблять то, что иначе могло бы быть устойчивой экспрессией одного или более целевых трансгенов с введенного зкДНК-вектора. Использовали два подхода, чтобы оценить влияние избегания и/или ослабления потенциального иммунного ответа хозяина на устойчивую экспрессию с зкДНК-вектора.[00575] As described in Example 10, an undesirable host immune response in some cases can artificially dampen what would otherwise be robust expression of one or more targeted transgenes from the introduced cccDNA vector. Two approaches were used to evaluate the effect of avoidance and/or attenuation of potential host immune responses on sustained expression from a cccDNA vector.
Во-первых, поскольку вектор зкДНК-Luc, использованный в предшествующих примерах, находился под контролем конститутивного промотора CAG, была получена сходная конструкция с использованием специфического для печени промотора (hAAT) или другого конститутивного промотора (hEF-1), чтобы определить, будет ли избегание длительного воздействия миелоидных клеток или тканей, не относящихся к печени, снижать любые наблюдаемые иммунные эффекты. Во-вторых, некоторые конструкции зкДНК-люцифераза конструировали так, чтобы иметь пониженное содержание CpG, известного триггера иммунной реакции хозяина. Измеряли экспрессию гена люциферазы, кодируемой зкДНК, при введении мышам таких модифицированных зкДНК-векторов с замененным промотором.First, since the cDNA-Luc vector used in the previous examples was under the control of the constitutive CAG promoter, a similar construct was generated using the liver-specific promoter (hAAT) or another constitutive promoter (hEF-1) to determine whether Avoidance of prolonged exposure to myeloid cells or non-liver tissues will reduce any observed immune effects. Second, some cDNA-luciferase constructs have been engineered to have reduced CpG content, a known trigger of the host immune response. The expression of the luciferase gene encoded by cccDNA was measured when such modified cccDNA vectors with a replaced promoter were administered to mice.
[00576] Использовали три разных зкДНК-вектора, каждый из которых кодировал люциферазу в качестве трансгена. Первый зкДНК-вектор имел большое количество неметилированного CpG (~350) и содержал конститутивный промотор С AG («зкДНК CAG»); второй имел умеренное количество неметилированного CpG (~60) и содержал специфический для печени промотор hAAT («зкДНК hAAT с низким содержанием CpG»); и третий представлял собой метилированную форму второго, не содержащую неметилированного CpG, и также содержал промотор hAAT («зкДНК hAAT без CpG»). В остальном зкДНК-векторы были идентичны. Векторы готовили, как описано выше.[00576] Three different cDNA vectors were used, each encoding a luciferase transgene. The first ccDNA vector had a large number of unmethylated CpGs (~350) and contained a constitutive C AG promoter (“ccDNA CAG”); the second had a moderate amount of unmethylated CpG (~60) and contained the liver-specific hAAT promoter (“low-CpG hAAT ccDNA”); and the third was a methylated form of the second, lacking the unmethylated CpG, and also containing the hAAT promoter (“hAAT ccDNA without CpG”). Otherwise, the cccDNA vectors were identical. Vectors were prepared as described above.
[00577] Четыре группы по четыре самца мышей CD-1®, в возрасте приблизительно 4 недель, получали один из зкДНК-векторов, инкапсулированных в ЛНЧ, или контроль поли(С). В день 0 каждой мыши вводили путем однократной внутривенной инъекции в хвостовую вену 0,5 мг/кг зкДНК-вектора в объеме 5 мл/кг. Значения массы тела регистрировали в дни -1, -, 1, 2, 3, 7 и еженедельно после этого, до умерщвления мышей. Образцы цельной крови и сыворотки брали в дни 0, 1 и 35. Прижизненную визуализацию проводили в дни 7, 14, 21, 28 и 35, и затем еженедельно с использованием системы визуализации in vivo (IVIS). Для визуализации каждой мыши вводили люциферин при 150 мг/кг путем внугрибрюшинной инъекции при 2,5 мл/кг. Через 15 минут каждую мышь анестезировали и визуализировали. Мышей умерщвляли в день 93 и собирали терминальные ткани, включая печень и селезенку. Измерения цитокинов проводили через 6 часов после введения дозы в день 0.[00577] Four groups of four male CD-1® mice, approximately 4 weeks old, received one of the LNP-encapsulated cccDNA vectors or a poly(C) control. On day 0, each mouse was given a single intravenous tail vein injection of 0.5 mg/kg cccDNA vector in a volume of 5 ml/kg. Body weight values were recorded on days -1, -, 1, 2, 3, 7 and weekly thereafter until the mice were sacrificed. Whole blood and serum samples were collected on days 0, 1, and 35. Intravital imaging was performed on days 7, 14, 21, 28, and 35, and weekly thereafter using an in vivo imaging system (IVIS). For imaging, each mouse was administered luciferin at 150 mg/kg by intraperitoneal injection at 2.5 ml/kg. After 15 minutes, each mouse was anesthetized and imaged. Mice were sacrificed on day 93 and terminal tissues, including liver and spleen, were collected. Cytokine measurements were performed 6 hours post-dose on day 0.
[00578] Несмотря на то, что у всех получивших зкДНК мышей наблюдали значительную флуоресценцию в дни 7 и 14, у мышей, получивших зкДНК CAG, флуоресценция быстро снижалась после дня 14 и более постепенно уменьшалась на протяжении оставшейся части исследования. Напротив, у мышей, получивших зкДНК hAAT с низким содержанием CpG и без CpG, полный поток оставался на стабильно высоком уровне (Фиг. 11). Это позволяет предположить, что направление доставки зкДНК-вектора специфически в печень приводило к устойчивой и длительной экспрессии трансгена с вектора в течение по меньшей мере 77 дней после однократной инъекции. Конструкции с минимизированным содержанием CpG или с полным отсутствием CpG имели сходные профили длительной устойчивой экспрессии, в то время как конструкция с конститутивным промотором и высоким содержанием CpG проявила снижение экспрессии с течением времени, это позволяет предположить, что иммунная активация хозяина при введении зкДНК-вектора может играть определенную роль в любом снижении экспрессии, наблюдаемом при введении такого вектора субъекту. Эти результаты обеспечивают альтернативные методы адаптации продолжительности ответа к желаемому уровню путем выбора ограниченного конкретной тканью промотора и/или изменения содержания CpG в зкДНК-векторе в том случае, если наблюдается иммунный ответ хозяина потенциально, специфичный в отношении трансгена ответ.[00578] Although all cccDNA-treated mice showed significant fluorescence on days 7 and 14, in CAG cctDNA-treated mice, fluorescence decreased rapidly after day 14 and more gradually decreased throughout the remainder of the study. In contrast, in mice receiving low-CpG and no-CpG hAAT cccDNA, total flux remained at a consistently high level (Figure 11). This suggests that targeting the cccDNA vector specifically to the liver resulted in sustained and long-lasting transgene expression from the vector for at least 77 days after a single injection. Constructs with minimal or no CpG content had similar long-term sustained expression profiles, while the construct with a constitutive promoter and high CpG content showed decreased expression over time, suggesting that host immune activation upon introduction of the cccDNA vector may play a role in any decrease in expression observed when such a vector is administered to a subject. These results provide alternative methods for tailoring the duration of the response to the desired level by selecting a tissue-restricted promoter and/or changing the CpG content of the cccDNA vector when a potentially transgene-specific host immune response is observed.
ПРИМЕР 12: Гидродинамическая доставка зкДНК, экспрессирующей FVIIIEXAMPLE 12: Hydrodynamic delivery of cccDNA expressing FVIII
[00579] Гидродинамическая инъекция в хвостовую вену является хорошо известным методом введения нуклеиновой кислоты в печень у грызунов. В этой системе инъекция под давлением большого объема неинкапсулированной нуклеиновой кислоты приводит к кратковременному увеличению проницаемости клеток и доставке непосредственно в ткани и клетки. Это обеспечивает экспериментальный механизм обхода многих иммунных систем хозяина, таких как привлечение макрофагов, что обеспечивает возможность наблюдать доставку и экспрессию в отсутствие такой активности.[00579] Hydrodynamic tail vein injection is a well-known method for introducing nucleic acid into the liver in rodents. In this system, pressurized injection of a large volume of unencapsulated nucleic acid results in a transient increase in cell permeability and delivery directly into tissues and cells. This provides an experimental mechanism to bypass many host immune systems, such as macrophage recruitment, allowing delivery and expression to be observed in the absence of such activity.
[00580] Три разных зкДНК-вектора, каждый с левым ITR дикого типа и усеченным мутантным правым ITR и имеющие трансгенную область, кодирующую FVIII, получали и очищали, как описано выше в Примерах 1 и 5. ЗкДНК FVIII-векторы под контролем специфического для печени промотора или только ФСБ вводили самцам мышей C57bl/6J в возрасте приблизительно 6 недель. Незащищенные зкДНК-векторы вводили в дозе 0,005 мг на животное (4 животных на группу) путем гидродинамической внутривенной инъекции через латеральную хвостовую вену в объеме 1,2 мл, введенной в течение 5 секунд, или в дозе 100 мл/кг, введенной в течение 5-8 секунд. Массу тела измеряли в дни 0, 1, 2, 3 и 7, а затем еженедельно. Образцы крови собирали у каждого обработанного животного в дни 3, 7, 14, 21, а также в последний день 28. Наличие экспрессированного FVIII в образцах плазмы измеряли с помощью набора для ИФА общего фактора VIII человека (ELISA Human Total Factor VIII (Innovative Research)).[00580] Three different cccDNA vectors, each with a wild-type left ITR and a truncated mutant right ITR and having a transgenic FVIII coding region, were prepared and purified as described above in Examples 1 and 5. Liver-specific ccDNA FVIII vectors promoter or PBS alone were injected into male C57bl/6J mice at approximately 6 weeks of age. Unprotected cccDNA vectors were administered at a dose of 0.005 mg per animal (4 animals per group) by hydrodynamic intravenous injection through the lateral tail vein in a volume of 1.2 ml administered over 5 seconds, or at a dose of 100 ml/kg administered over 5 -8 seconds. Body weight was measured on days 0, 1, 2, 3 and 7 and then weekly thereafter. Blood samples were collected from each treated animal on days 3, 7, 14, 21, and the final day 28. The presence of expressed FVIII in plasma samples was measured using a Human Total Factor VIII ELISA kit (Innovative Research) ).
[00581] Как показано на ФИГ. 11А, FVIII легко детектировался в образцах плазмы, взятой в день 3 и 7 у мышей, обработанных двумя из трех зкДНК FVIII-векторов, но не наблюдался у мышей, получавших ФСБ. ФИГ. 11В показывает, что экспрессия FVIII зависела от объема дозы в случае двух векторов, для которых наблюдали экспрессию FVIII, и оставалась относительно постоянной на протяжении 28-дневного исследования, за исключением вектора 3, экспрессия которого быстро снижалась после дня 7. Этот эксперимент продемонстрировал, что зкДНК-векторы были способны экспрессировать FVIII из печени после гидродинамической инъекции и что FVIII быстро и легко детектировался в сыворотке после введения зкДНК.[00581] As shown in FIG. 11A, FVIII was readily detected in plasma samples collected on days 3 and 7 from mice treated with two of the three cDNA FVIII vectors, but was not observed in mice treated with PBS. FIG. 11B shows that FVIII expression was dose volume dependent for the two vectors for which FVIII expression was observed and remained relatively constant throughout the 28-day study, with the exception of vector 3, which rapidly declined in expression after day 7. This experiment demonstrated that cccDNA vectors were able to express FVIII from the liver after hydrodynamic injection and that FVIII was rapidly and readily detected in serum after cccDNA injection.
[00582] ПРИМЕР 13: Гидродинамическая доставка зкДНК, экспрессирующей FVIII-тестирование различных зкДНК-векторов, экспрессирующих FVIII[00582] EXAMPLE 13: Hydrodynamic delivery of FVIII-expressing cccDNA testing of various FVIII-expressing cccDNA vectors
[00583] Систему гидродинамической доставки, описанную в Примере 12, использовали для тестирования эффекта различных зкДНК-векторов, экспрессирующих FVIII, на уровни FVIII в сыворотке, при этом детектирование FVIII в сыворотке показало, что зкДНК-вектор способен экспрессировать FVIII после инъекции.[00583] The hydrodynamic delivery system described in Example 12 was used to test the effect of various cccDNA vectors expressing FVIII on serum FVIII levels, and detection of FVIII in serum indicated that the cccDNA vector was capable of expressing FVIII after injection.
[00584] зкДНК-векторы получали, как описано в Примере 12. Каждый из зкДНКFVIII-векторов (по отдельности, без какой-либо инкапсуляции в ЛНЧ) и контроль вводили путем гидродинамической внутривенной (в/в) инъекции мышам C57BL/6. ЗкДНК-векторы вводили в дозе 5 мкг на животное (4 животных на группу) путем гидродинамической внутривенной инъекции через латеральную хвостовую вену в объеме 90-100 мг/мл. Конечной временной точкой был день 7. В качестве контроля использовали носитель по отдельности.[00584] The cccDNA vectors were prepared as described in Example 12. The cccDNA FVIII vectors (separately, without any encapsulation in LNP) and the control were each administered by hydrodynamic intravenous (IV) injection into C57BL/6 mice. CccDNA vectors were administered at a dose of 5 μg per animal (4 animals per group) by hydrodynamic intravenous injection through the lateral tail vein in a volume of 90-100 mg/ml. The end point was day 7. Vehicle alone was used as a control.
[00585] Следующие зкДНК-векторы тестировали в трех отдельных экспериментах. Последовательности зкДНК-векторов ниже представлены в Таблице 9. В Таблице 9 открытая рамка считывания показана подчеркиванием. Промотор показан жирным шрифтом.[00585] The following cDNA vectors were tested in three separate experiments. The sequences of the cccDNA vectors below are presented in Table 9. In Table 9, the open reading frame is indicated by underlining. The promoter is shown in bold.
(1) зкДНКFVIII-вектор 4, зкДНКFVIII-вектор 6, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 14, зкДНКFVIII-вектор 16, зкДНКFVIII-вектор 18, зкДНКFVIII-вектор 19, зкДНКFVIII-вектор 21, зкДНКFVIII-вектор 22;(1) ccDNAFVIII-vector 4, ccDNAFVIII-vector 6, ccDNAFVIII-vector 12, ccDNAFVIII-vector 14, ccDNAFVIII-vector 16, ccDNAFVIII-vector 18, ccDNAFVIII-vector 19, ccDNAFVIII-vector 21, cc DNAFVIII vector 22;
(2) зкДНКFVIII-вектор 1, зкДНКFVIII-вектор 2, зкДНКFVIII-вектор 3, зкДНКFVIII-вектор 5, зкДНКFVIII-вектор 7, зкДНКFVIII-вектор 8, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 13, зкДНКFVIII-вектор 15;(2) ccDNAFVIII-vector 1, ccDNAFVIII-vector 2, ccDNAFVIII-vector 3, ccDNAFVIII-vector 5, ccDNAFVIII-vector 7, ccDNAFVIII-vector 8, ccDNAFVIII-vector 12, ccDNAFVIII-vector 13, ccDNAFV III-vector 15;
(3) зкДНКFVIII-вектор 9, зкДНКFVIII-вектор 10, зкДНКFVIII-вектор 11, зкДНКFVIII-вектор 12, зкДНКFVIII-вектор 17, зкДНКFVIII-вектор 20, зкДНКFVIII-вектор 24, зкДНКFVIII-вектор 25, зкДНКFVIII-вектор 26.(3) ccDNAFVIII-vector 9, ccDNAFVIII-vector 10, ccDNAFVIII-vector 11, ccDNAFVIII-vector 12, ccDNAFVIII-vector 17, ccDNAFVIII-vector 20, ccDNAFVIII-vector 24, ccDNAFVIII-vector 25, h cDNAFVIII-vector 26.
[00586] Исследуемые препараты поставлялись в виде концентрированного исходного раствора и хранились при номинальной температуре 4°С. Составы не перемешивали на вортексе и не центрифугировали. Группы размещали в прозрачных поликарбонатных клетках с контактной подстилкой на вентилируемой стойке в процедурной комнате. Корм и фильтрованную водопроводную воду, подкисленную 1 н. HCl до целевого рН 2,5-3,0, предоставляли животным ad libitum. Кровь собирали в промежуточных и конечных временных точках, как показано ниже:[00586] Study drugs were supplied as a concentrated stock solution and stored at a nominal temperature of 4°C. The compositions were not vortex mixed or centrifuged. The groups were housed in transparent polycarbonate cages with contact bedding on a ventilated rack in the treatment room. Feed and filtered tap water, acidified with 1 N. HCl to a target pH of 2.5-3.0 was provided to the animals ad libitum. Blood was collected at intermediate and final time points as shown below:
[00587] Сбор образцов крови выполняли следующим образом:[00587] Blood sample collection was performed as follows:
[00588] Детали исследования описаны далее:[00588] Details of the study are described below:
[00589] Вид (количество, пол, возраст): Мыши C57BL/6 (JAX 000664) (Ν=40 и 4 запасные, самцы, в возрасте 6 недель на момент прибытия) из Jackson Laboratories.[00589] Species (number, sex, age): C57BL/6 mice (JAX 000664) (N=40 and 4 spare, male, 6 weeks old on arrival) from Jackson Laboratories.
[00590] Класс соединения: зкДНК.[00590] Compound class: ccDNA.
[00591] Наблюдения за клеткой: Наблюдения за клеткой выполняли ежедневно.[00591] Cell Observations: Cell observations were performed daily.
[00592] Клинические наблюдения: Клинические наблюдения выполняли через 1, 5-6 и 24 часа после введения дозы в День 0.[00592] Clinical Observations: Clinical observations were performed at 1, 5-6, and 24 hours post-dose on Day 0.
[00593] Масса тела: Массу тела всех животных регистрировали в Дни 0, 3 и 7, в том числе до умерщвления.[00593] Body weight: Body weight of all animals was recorded on Days 0, 3 and 7, including before sacrifice.
[00594] Лекарственная форма: Исследуемые препараты поставлялись в виде концентрированного исходного раствора. Исходный раствор разбавляли ФСБ непосредственно перед использованием. Приготовленные материалы хранили при ~4°С (или на влажном льду), если дозирование не выполнялось немедленно.[00594] Dosage form: Study drugs were supplied as a concentrated stock solution. The stock solution was diluted with PBS immediately before use. Prepared materials were stored at ~4°C (or on wet ice) unless dispensing was performed immediately.
[00595] Введение дозы: Исследуемые материалы вводили в День 0 путем гидродинамического в/в введения в установленном объеме на животное, 90-100 мл/кг (в зависимости от самого легкого животного в группе) через латеральную хвостовую вену (введение дозы в течение 5 секунд).[00595] Dosing: Test materials were administered on Day 0 by hydrodynamic IV injection at a prescribed volume per animal, 90-100 ml/kg (depending on the lightest animal in the group) via the lateral tail vein (dosing over 5 seconds).
[00596] Сбор крови: У животных собирали промежуточный образец крови в День 3 в соответствии с таблицей выше. После каждого сбора животным подкожно вводили 0,5-1,0 мл раствора Рингера с лактатом. У животных собирали кровь в соответствии с приведенными выше таблицами сбора крови. Для сборов плазмы цельную кровь собирали в пробирки типа Eppendorf без покрытия. Немедленно отбирали 120 мкл и помещали в пробирки, содержащие 13,33 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и поддерживали при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы. Готовили одну (1) аликвоту и отмечали любое свертывание в образце цельной крови или гемолиз в плазме. Все образцы хранили при номинальной температуре -70°С. Все образцы хранили при номинальной температуре -70°С до отправки.[00596] Blood Collection: An interim blood sample was collected from the animals on Day 3 according to the table above. After each collection, the animals were subcutaneously injected with 0.5-1.0 ml of lactated Ringer's solution. Blood was collected from animals according to the blood collection tables above. For plasma collections, whole blood was collected into uncoated Eppendorf tubes. 120 μl was immediately withdrawn and placed in tubes containing 13.33 μl of 3.2% sodium citrate. The blood was gently mixed and maintained at ambient temperature until processed. Whole blood samples were centrifuged at 2000 g for 15 minutes under ambient conditions (20-25°C). Plasma samples were collected avoiding cell mass. One (1) aliquot was prepared and any clotting in the whole blood sample or hemolysis in the plasma was noted. All samples were stored at a nominal temperature of -70°C. All samples were stored at a nominal temperature of -70°C until shipment.
[00597] Восстановление после анестезии: За животными непрерывно наблюдали, пока они находились под анестезией, во время восстановления и до восстановления подвижности.[00597] Recovery from anesthesia: Animals were monitored continuously while they were under anesthesia, during recovery, and until mobility was restored.
[00598] Умерщвление и терминальный сбор крови: В День 7 животных умерщвляли путем асфиксии в СО2 с последующей торакотомией и обескровливанием. Максимальный доступный объем крови собирали с помощью сердечной пункции и обрабатывали для получения сыворотки в соответствии с СОП учреждения и хранили в двух (2) аликвотах. Для сборов плазмы цельную кровь собирали с помощью шприца, и 600 мкл немедленно помещали в пробирки, содержащие 66,66 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и поддерживали при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы, и делали четыре (4) аликвоты. Отмечали любое свертывание в образце цельной крови или гемолиз в плазме.[00598] Killing and Terminal Blood Collection: On Day 7, animals were sacrificed by CO 2 asphyxia followed by thoracotomy and exsanguination. The maximum available volume of blood was collected by cardiac puncture and processed for serum according to institutional SOPs and stored in two (2) aliquots. For plasma collections, whole blood was collected using a syringe, and 600 μL was immediately placed into tubes containing 66.66 μL of 3.2% sodium citrate. The blood was gently mixed and maintained at ambient temperature until processed. Whole blood samples were centrifuged at 2000 g for 15 minutes under ambient conditions (20-25°C). Plasma samples were collected, avoiding cell mass, and four (4) aliquots were made. Any clotting in the whole blood sample or hemolysis in the plasma was noted.
[00599] Результаты: Результаты, показанные на ФИГ. 12-15, показывают эффект различных зкДНК-векторов, экспрессирующих FVIII, на уровни FVIII в сыворотке, при этом детектирование FVIII в сыворотке показало, что зкДНК-вектор был способен экспрессировать FVIII после инъекции. ФИГ. 12 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 4, зкДНКFVIII-вектора 6, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 14, зкДНКFVIII-вектора 16, зкДНКFVIII-вектора 18, зкДНКFVIII-вектора 19, зкДНКFVIII-вектора 21, зкДНКFVIII-вектора 22). ЗкДНКFVIII-вектор 16, зкДНКFVIII-вектор 19 и зкДНКFVIII-вектор 21 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 13 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 1, зкДНКFVIII-вектора 2, зкДНКFVIII-вектора 3, зкДНКFVIII-вектора 5, зкДНКFVIII-вектора 7, зкДНКFVIII-вектора 8, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 13, зкДНКFVIII-вектора 15). ЗкДНКFVIII-вектор 8 показал самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 14 представляет собой график, на котором отображена концентрация FVIII в плазме (МЕ/мл) через 3 дня после гидродинамической доставки различных зкДНК-векторов, экспрессирующих FVIII (зкДНКFVIII-вектора 9, зкДНКFVIII-вектора 10, зкДНКFVIII-вектора 11, зкДНКFVIII-вектора 12, зкДНКFVIII-вектора 17, зкДНКFVIII-вектора 20, зкДНКFVIII-вектора 24, зкДНКFVIII-вектора 25, зкДНКFVIII-вектора 26). ЗкДНКFVIII-вектор 17 и зкДНКFVIII-вектор 20 показали самую высокую концентрацию фактора VIII в плазме через 3 дня. В качестве контроля использовали только носитель. ФИГ. 15 представляет собой график, который отображает концентрацию FVIII в плазме (МЕ/мл) через 1 день после гидродинамической доставки повышающихся доз зкДНКFVIII-вектора 23 (0,005-50 мкг). Как показано на ФИГ. 15, FVIII в плазме повышался дозозависимым образом с повышением дозировки зкДНКFVIII-вектора 23. В качестве контроля использовали только носитель.[00599] Results: The results shown in FIG. 12-15 show the effect of various cccDNA vectors expressing FVIII on serum FVIII levels, whereby detection of FVIII in serum indicated that the cccDNA vector was capable of expressing FVIII after injection. FIG. 12 is a graph depicting plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cccDNA vectors expressing FVIII (ccDNA FVIII vector 4, ccDNA FVIII vector 6, ccDNA FVIII vector 12, ccDNA FVIII vector 14 , cDNAFVIII-vector 16, ccDNAFVIII-vector 18, ccDNAFVIII-vector 19, ccDNAFVIII-vector 21, ccDNAFVIII-vector 22). CccDNAFVIII-vector 16, ccDNAFVIII-vector 19, and ccDNAFVIII-vector 21 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control. FIG. 13 is a graph showing plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cDNA FVIII-expressing vectors (ccDNA FVIII-vector 1, ccDNA FVIII-vector 2, ccDNA FVIII-vector 3, ccDNA FVIII-vector 5 , cDNAFVIII-vector 7, ccDNAFVIII-vector 8, ccDNAFVIII-vector 12, ccDNAFVIII-vector 13, ccDNAFVIII-vector 15). CctDNAFVIII vector 8 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control. FIG. 14 is a graph depicting plasma FVIII concentration (IU/mL) 3 days after hydrodynamic delivery of various cDNA FVIII-expressing vectors (ccDNA FVIII vector 9, ccDNA FVIII vector 10, ccDNA FVIII vector 11, ccDNA FVIII vector 12 , cDNAFVIII-vector 17, ccDNAFVIII-vector 20, ccDNAFVIII-vector 24, ccDNAFVIII-vector 25, ccDNAFVIII-vector 26). CccDNAFVIII-vector 17 and ccDNAFVIII-vector 20 showed the highest concentration of factor VIII in plasma after 3 days. Vehicle alone was used as a control. FIG. 15 is a graph that depicts plasma FVIII concentration (IU/ml) 1 day after hydrodynamic delivery of increasing doses of cccDNAFVIII vector 23 (0.005-50 μg). As shown in FIG. 15, FVIII in plasma increased in a dose-dependent manner with increasing dosage of cDNAFVIII vector 23. Vehicle alone was used as a control.
ПРИМЕР 14: Экспрессия FVIII после доставки ЛНЧ:зкДНК в комбинации с ингибитором киназы у самцов мышей CD-1EXAMPLE 14: FVIII Expression Following Delivery of LNP:ccDNA in Combination with a Kinase Inhibitor in Male CD-1 Mice
[00600] ЛНЧ:зкДНК-векторы получали, как описано в Примере 6. Эффект составов зкДНК:липид тестировали на самцах мышей CD-1. Носитель для дозирования и приготовления ингибитора представлял собой 0,5% метилцеллюлозу.[00600] LNP:ccDNA vectors were prepared as described in Example 6. The effect of cccDNA:lipid formulations was tested in male CD-1 mice. The carrier for dosing and preparing the inhibitor was 0.5% methylcellulose.
[00601] Исследуемый материал ЛНЧ:зкДНК («зкДНКFVIII-вектор 23») вводили следующим образом:[00601] The LNP:ccDNA test material (“ccDNAFVIII-vector 23”) was introduced as follows:
[00602] Образцы крови (промежуточные и конечные) отбирали, как указано ниже:[00602] Blood samples (interim and final) were collected as follows:
[00603] Образцы тканей собирали, как указано ниже:[00603] Tissue samples were collected as follows:
[00604] Детали исследования описаны далее:[00604] Details of the study are described below:
[00605] Вид (количество, пол, возраст): Мыши CD-1 (Ν=10+2 запасные, самцы, в возрасте 4 недель на момент прибытия) из Charles River Laboratories.[00605] Species (number, sex, age): CD-1 mice (Ν=10+2 spare, male, 4 weeks old on arrival) from Charles River Laboratories.
[00606] Наблюдения за клеткой: Наблюдения за клеткой выполняли ежедневно.[00606] Cell Observations: Cell observations were performed daily.
[00607] Клинические наблюдения: Клинические наблюдения выполняли примерно через 1, 5-6 и 24 часа после введения дозы исследуемого материала в День 0.[00607] Clinical Observations: Clinical observations were performed approximately 1, 5-6, and 24 hours after dosing of study material on Day 0.
[00608] Масса тела: Массу тела всех животных регистрировали в Дни 0, 1, 2, 3 и 7, в том числе до умерщвления.[00608] Body weight: Body weight of all animals was recorded on Days 0, 1, 2, 3 and 7, including before sacrifice.
[00609] Лекарственная форма исследуемого материала: Исследуемые препараты поставлялись в виде концентрированного исходного раствора. Исходный раствор разбавляли ФСБ непосредственно перед использованием. Приготовленные материалы хранили при ~4°С (или на влажном льду), если дозирование не выполнялось немедленно.[00609] Dosage form of the study material: The study drugs were supplied in the form of a concentrated stock solution. The stock solution was diluted with PBS immediately before use. Prepared materials were stored at ~4°C (or on wet ice) unless dispensing was performed immediately.
[00610] Введение дозы: Исследуемые препараты вводили в дозе 5 мл/кг в День 0 для Групп 1-2 путем внутривенного введения через латеральную хвостовую вену.[00610] Dosing: Study drugs were administered at a dose of 5 ml/kg on Day 0 for Groups 1-2 by intravenous administration through the lateral tail vein.
[00611] Сбор крови: У всех животных в Группах 1-2 собирали промежуточные образцы крови в День 3 в соответствии с таблицей сбора крови, приведенной выше. После каждого сбора животным подкожно вводили 0,5-1,0 мл раствора Рингера с лактатом. Для сборов плазмы цельную кровь собирали в пробирки типа Eppendorf без покрытия с помощью пункции орбитального синуса под анестезией в соответствии с СОП учреждения. Немедленно отбирали 120 мкл и помещали в пробирки, содержащие 13,33 пл 3,2% цитрата натрия. Кровь осторожно перемешивали и хранили при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы. Была сделана одна (1) аликвота, и будет отмечаться любое свертывание в образце цельной крови или гемолиз в плазме.[00611] Blood Collection: Interim blood samples were collected from all animals in Groups 1-2 on Day 3 according to the blood collection chart above. After each collection, the animals were subcutaneously injected with 0.5-1.0 ml of lactated Ringer's solution. For plasma collections, whole blood was collected into uncoated Eppendorf tubes by orbital sinus puncture under anesthesia according to institutional SOPs. 120 µl was immediately withdrawn and placed in tubes containing 13.33 pL of 3.2% sodium citrate. The blood was mixed gently and stored at ambient temperature until processed. Whole blood samples were centrifuged at 2000 g for 15 minutes under ambient conditions (20-25°C). Plasma samples were collected avoiding cell mass. One (1) aliquot was made and any clotting in the whole blood sample or hemolysis in the plasma will be noted.
[00612] Восстановление после анестезии: За животными непрерывно наблюдали, пока они находились под анестезией, во время восстановления и до восстановления подвижности.[00612] Recovery from anesthesia: Animals were monitored continuously while they were under anesthesia, during recovery, and until mobility was restored.
[00613] Терминальный сбор крови: В День 7 животных умерщвляли путем асфиксии в СО2 с последующей торакотомией и обескровливанием. Максимальный доступный объем крови собирали с помощью сердечной пункции и обрабатывали для получения плазмы. Для сборов плазмы цельную кровь собирали с помощью шприца и сразу помещали 600 мкл в пробирки, содержащие 66,66 мкл 3,2% цитрата натрия. Кровь осторожно перемешивали и хранили при температуре окружающей среды до обработки. Образцы цельной крови центрифугировали при 2000 g в течение 15 минут в условиях окружающей среды (20-25°С). Образцы плазмы отбирали, избегая клеточной массы, и делали две (2) аликвоты. Отмечали любое свертывание в образце цельной крови или гемолиз в плазме.[00613] Terminal Blood Collection: On Day 7, animals were sacrificed by CO 2 asphyxia followed by thoracotomy and exsanguination. The maximum available volume of blood was collected by cardiac puncture and processed to obtain plasma. For plasma collections, whole blood was collected using a syringe and 600 μL was immediately placed into tubes containing 66.66 μL of 3.2% sodium citrate. The blood was mixed gently and stored at ambient temperature until processed. Whole blood samples were centrifuged at 2000 g for 15 minutes under ambient conditions (20-25°C). Plasma samples were collected, avoiding cell mass, and two (2) aliquots were made. Any clotting in the whole blood sample or hemolysis in the plasma was noted.
[00614] Перфузия: После обескровливания всех животных подвергали перфузии сердца физиологическим раствором. В общих чертах, внутрисердечную перфузию всего тела выполняли путем введения иглы калибра 23/21, прикрепленной к 10 мл шприцу, содержащему физиологический раствор, в просвет левого желудочка для перфузии. Правое предсердие было рассечено, чтобы обеспечить дренажный выход для перфузата. После того, как игла была помещена в сердце, к поршню прикладывали легкое и постоянное давление для перфузии животного. Соответствующий поток промывочного раствора обеспечивали до тех пор, пока выходящий перфузат не станет прозрачным (без видимой крови), это указывает на то, что промывочный раствор насытил тело и процедура завершена.[00614] Perfusion: After exsanguination, all animals were subjected to cardiac perfusion with saline. In general terms, whole body intracardiac perfusion was performed by inserting a 23/21 gauge needle attached to a 10 mL syringe containing saline into the left ventricular lumen for perfusion. The right atrium was incised to provide drainage for the perfusate. Once the needle was placed into the heart, light and constant pressure was applied to the plunger to perfuse the animal. An adequate flow of rinsing solution was maintained until the exiting perfusate became clear (no visible blood), indicating that the rinsing solution had saturated the body and the procedure was complete.
[00615] Сбор ткани: Терминальные ткани собирали у агонирующих животных, которых умерщвляли до запланированной временной точки. При наличии возможности, собирали и сохраняли ткани животных, которые были найдены мертвыми.[00615] Tissue Collection: Terminal tissues were collected from agonizing animals that were sacrificed before the planned time point. Whenever possible, tissues from animals that were found dead were collected and preserved.
[00616] После умерщвления и перфузии забирали печень. Из печени собирали и взвешивали четыре (4) среза по 25-50 мг. Срезы мгновенно замораживали по отдельности и хранили при номинальной температуре -70°С до отправки.[00616] After sacrifice and perfusion, the liver was harvested. Four (4) 25-50 mg sections were collected and weighed from the liver. Sections were flash frozen individually and stored at a nominal temperature of −70°C until shipment.
[00617] Результаты: ФИГ. 16 показывает концентрацию FVIII в плазме (МЕ/мл) через 7 дней после введения исследуемого препарата ЛНЧ:зкДНКFVIII-вектор 23. Как показано на ФИГ. 16, FVIII легко детектировался в образцах плазмы мышей, получавших исследуемый препарат ЛНЧ:зкДНКFVIII-вектор 23, но не наблюдался у мышей, получавших только носитель.[00617] Results: FIG. 16 shows plasma FVIII concentration (IU/ml) 7 days after administration of the study drug LNP:ccDNAFVIII-vector 23. As shown in FIG. 16, FVIII was readily detected in plasma samples from mice treated with the test drug LNP:ccDNAFVIII vector 23 but was not observed in mice treated with vehicle alone.
ССЫЛКИLINKS
[00618] Все публикации и ссылки, включая, но не ограничиваясь перечисленными, патенты и заявки на патенты, указанные в данном описании и в Примерах в данном документе, полностью включены посредством ссылки, как если бы каждая отдельная публикация или ссылка была конкретно и по отдельности указана для включения в данный документ посредством ссылки во всей полноте. Любая заявка на патент, согласно которой настоящая заявка испрашивает приоритет, также включена в данный документ посредством ссылки способом, описанным выше для публикаций и ссылок.[00618] All publications and references, including, but not limited to, patents and patent applications set forth in this specification and in the Examples herein, are incorporated by reference in their entirety as if each individual publication or reference were specifically and separately incorporated herein by reference in its entirety. Any patent application to which this application claims priority is also incorporated herein by reference in the manner described above for publications and references.
--->--->
Перечень последовательностей List of sequences
<110> ДЖЕНЕРЕЙШЕН БИО КО.<110> GENERATION BIO CO.
<120> НЕВИРУСНЫЕ ДНК-ВЕКТОРЫ И ВАРИАНТЫ ИХ ПРИМЕНЕНИЯ ДЛЯ ЭКСПРЕССИИ <120> NON-VIRAL DNA VECTORS AND OPTIONS FOR THEIR APPLICATION FOR EXPRESSION
ТЕРАПЕВТИЧЕСКОГО СРЕДСТВА НА ОСНОВЕ ФАКТОРА VIII (FVIII)THERAPEUTIC DRUG BASED ON FACTOR VIII (FVIII)
<130> 131698-06020<130> 131698-06020
<140> PCT/US2020/022738<140> PCT/US2020/022738
<141> 2020-03-13<141> 2020-03-13
<150> 62/856,432<150> 62/856,432
<151> 2019-06-03<151> 2019-06-03
<150> 62/817,904<150> 62/817,904
<151> 2019-03-13<151> 2019-03-13
<160> 398<160> 398
<170> PatentIn version 3.5<170> Patent In version 3.5
<210> 1<210> 1
<211> 141<211> 141
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 1<400> 1
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc
120 120
gagcgcgcag ctgcctgcag g gagcgcgcag ctgcctgcag g
141 141
<210> 2<210> 2
<211> 141<211> 141
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 2<400> 2
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca
120 120
actccatcac taggggttcc t actccatcac taggggttcc t
141 141
<210> 3<210> 3
<211> 130<211> 130
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 3<400> 3
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc
120 120
tgcctgcagg tgcctgcagg
130 130
<210> 4<210> 4
<211> 130<211> 130
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 4<400> 4
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt
60 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact
120 120
aggggttcct aggggttcct
130 130
<210> 5<210> 5
<211> 143<211> 143
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 5<400> 5
ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc ttgcccactc cctctctgcg cgctcgctcg ctcggtgggg cctgcggacc aaaggtccgc
60 60
agacggcaga ggtctcctct gccggcccca ccgagcgagc gacgcgcgca gagagggagt agacggcaga ggtctcctct gccggcccca ccgagcgagc gacgcgcgca gagagggagt
120 120
gggcaactcc atcactaggg taa gggcaactcc atcactaggg taa
143 143
<210> 6<210> 6
<211> 144<211> 144
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 6<400> 6
ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc ttggccactc cctctatgcg cactcgctcg ctcggtgggg cctggcgacc aaaggtcgcc
60 60
agacggacgt gggtttccac gtccggcccc accgagcgag cgagtgcgca tagagggagt agacggacgt gggtttccac gtccggcccc accgagcgag cgagtgcgca tagagggagt
120 120
ggccaactcc atcactagag gtat ggccaactcc atcactagag gtat
144 144
<210> 7<210> 7
<211> 127<211> 127
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 7<400> 7
ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc ttggccactc cctctatgcg cgctcgctca ctcactcggc cctggagacc aaaggtctcc
60 60
agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg agactgccgg cctctggccg gcagggccga gtgagtgagc gagcgcgcat agagggagtg
120 120
gccaact gccaact
127 127
<210> 8<210> 8
<211> 166<211> 166
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 8<400> 8
tcccccctgt cgcgttcgct cgctcgctgg ctcgtttggg ggggcgacgg ccagagggcc tcccccctgt cgcgttcgct cgctcgctgg ctcgtttggg ggggcgacgg ccagaggggcc
60 60
gtcgtctggc agctctttga gctgccaccc ccccaaacga gccagcgagc gagcgaacgc gtcgtctggc agctctttga gctgccaccc ccccaaacga gccagcgagc gagcgaacgc
120 120
gacagggggg agagtgccac actctcaagc aagggggttt tgtaag gacagggggg agagtgccac actctcaagc aagggggttt tgtaag
166 166
<210> 9<210> 9
<211> 144<211> 144
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 9<400> 9
ttgcccactc cctctaatgc gcgctcgctc gctcggtggg gcctgcggac caaaggtccg ttgcccactc cctctaatgc gcgctcgctc gctcggtggg gcctgcggac caaaggtccg
60 60
cagacggcag aggtctcctc tgccggcccc accgagcgag cgagcgcgca tagagggagt cagacggcag aggtctcctc tgccggcccc accgagcgag cgagcgcgca tagagggagt
120 120
gggcaactcc atcactaggg gtat gggcaactcc atcactaggg gtat
144 144
<210> 10<210> 10
<211> 143<211> 143
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 10<400> 10
ttaccctagt gatggagttg cccactccct ctctgcgcgc gtcgctcgct cggtggggcc ttaccctagt gatggagttg cccactccct ctctgcgcgc gtcgctcgct cggtggggcc
60 60
ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga
120 120
gcgcgcagag agggagtggg caa gcgcgcagag agggagtggg caa
143 143
<210> 11<210> 11
<211> 144<211> 144
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 11<400> 11
atacctctag tgatggagtt ggccactccc tctatgcgca ctcgctcgct cggtggggcc atacctctag tgatggagtt ggccactccc tctatgcgca ctcgctcgct cggtggggcc
60 60
ggacgtggaa acccacgtcc gtctggcgac ctttggtcgc caggccccac cgagcgagcg ggacgtggaa acccacgtcc gtctggcgac ctttggtcgc caggccccac cgagcgagcg
120 120
agtgcgcata gagggagtgg ccaa agtgcgcata gagggagtgg ccaa
144 144
<210> 12<210> 12
<211> 127<211> 127
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 12<400> 12
agttggccac attagctatg cgcgctcgct cactcactcg gccctggaga ccaaaggtct agttggccac attagctatg cgcgctcgct cactcactcg gccctggaga ccaaaggtct
60 60
ccagactgcc ggcctctggc cggcagggcc gagtgagtga gcgagcgcgc atagagggag ccagactgcc ggcctctggc cggcagggcc gagtgagtga gcgagcgcgc atagagggag
120 120
tggccaa tggccaa
127 127
<210> 13<210> 13
<211> 166<211> 166
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 13<400> 13
cttacaaaac ccccttgctt gagagtgtgg cactctcccc cctgtcgcgt tcgctcgctc cttacaaaac ccccttgctt gagagtgtgg cactctcccc cctgtcgcgt tcgctcgctc
60 60
gctggctcgt ttgggggggt ggcagctcaa agagctgcca gacgacggcc ctctggccgt gctggctcgt ttgggggggt ggcagctcaa agagctgcca gacgacggcc ctctggccgt
120 120
cgccccccca aacgagccag cgagcgagcg aacgcgacag ggggga cgccccccca aacgagccag cgagcgagcg aacgcgacag ggggga
166 166
<210> 14<210> 14
<211> 144<211> 144
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 14<400> 14
atacccctag tgatggagtt gcccactccc tctatgcgcg ctcgctcgct cggtggggcc atacccctag tgatggagtt gcccactccc tctatgcgcg ctcgctcgct cggtggggcc
60 60
ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga ggcagaggag acctctgccg tctgcggacc tttggtccgc aggccccacc gagcgagcga
120 120
gcgcgcatta gagggagtgg gcaa gcgcgcatta gagggagtgg gcaa
144 144
<210> 15<210> 15
<211> 120<211> 120
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 15<400> 15
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
cgcacgcccg ggtttcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg cgcacgcccg ggtttcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg
120 120
<210> 16<210> 16
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 16<400> 16
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca
120 120
gg gg
122 122
<210> 17<210> 17
<211> 129<211> 129
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 17<400> 17
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacgcccgg gcgcctcagt gagcgagcga gcgcgcagct ccgggcgacc aaaggtcgcc cgacgcccgg gcgcctcagt gagcgagcga gcgcgcagct
120 120
gcctgcagg gcctgcagg
129 129
<210> 18<210> 18
<211> 101<211> 101
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 18<400> 18
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ctttgcctca gtgagcgagc gagcgcgcag ctgcctgcag g ctttgcctca gtgagcgagc gagcgcgcag ctgcctgcag g
101 101
<210> 19<210> 19
<211> 139<211> 139
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 19<400> 19
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgaca aagtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga ccgggcgaca aagtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga
120 120
gcgcgcagct gcctgcagg gcgcgcagct gcctgcagg
139 139
<210> 20<210> 20
<211> 137<211> 137
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 20<400> 20
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgaaa atcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc ccgggcgaaa atcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc
120 120
gcgcagctgc ctgcagg gcgcagctgc ctgcagg
137 137
<210> 21<210> 21
<211> 135<211> 135
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 21<400> 21
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgaaa cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc ccgggcgaaa cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc
120 120
gcagctgcct gcagg gcagctgcct gcagg
135 135
<210> 22<210> 22
<211> 133<211> 133
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 22<400> 22
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcaaag cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc ccgggcaaag cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc
120 120
agctgcctgc agg aggctgcctgc agg
133 133
<210> 23<210> 23
<211> 139<211> 139
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 23<400> 23
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacgcccgg gtttcccggg cggcctcagt gagcgagcga ccgggcgacc aaaggtcgcc cgacgcccgg gtttcccggg cggcctcagt gagcgagcga
120 120
gcgcgcagct gcctgcagg gcgcgcagct gcctgcagg
139 139
<210> 24<210> 24
<211> 137<211> 137
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 24<400> 24
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacgcccgg tttccgggcg gcctcagtga gcgagcgagc ccgggcgacc aaaggtcgcc cgacgcccgg tttccgggcg gcctcagtga gcgagcgagc
120 120
gcgcagctgc ctgcagg gcgcagctgc ctgcagg
137 137
<210> 25<210> 25
<211> 135<211> 135
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 25<400> 25
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacgcccgt ttcgggcggc ctcagtgagc gagcgagcgc ccgggcgacc aaaggtcgcc cgacgcccgt ttcgggcggc ctcagtgagc gagcgagcgc
120 120
gcagctgcct gcagg gcagctgcct gcagg
135 135
<210> 26<210> 26
<211> 133<211> 133
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 26<400> 26
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacgccctt tgggcggcct cagtgagcga gcgagcgcgc ccgggcgacc aaaggtcgcc cgacgccctt tgggcggcct cagtgagcga gcgagcgcgc
120 120
agctgcctgc agg aggctgcctgc agg
133 133
<210> 27<210> 27
<211> 131<211> 131
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 27<400> 27
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacgccttt ggcggcctca gtgagcgagc gagcgcgcag ccgggcgacc aaaggtcgcc cgacgccttt ggcggcctca gtgagcgagc gagcgcgcag
120 120
ctgcctgcag g ctgcctgcag g
131 131
<210> 28<210> 28
<211> 129<211> 129
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 28<400> 28
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacgctttg cggcctcagt gagcgagcga gcgcgcagct ccgggcgacc aaaggtcgcc cgacgctttg cggcctcagt gagcgagcga gcgcgcagct
120 120
gcctgcagg gcctgcagg
129 129
<210> 29<210> 29
<211> 127<211> 127
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 29<400> 29
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacgtttcg gcctcagtga gcgagcgagc gcgcagctgc ccgggcgacc aaaggtcgcc cgacgtttcg gcctcagtga gcgagcgagc gcgcagctgc
120 120
ctgcagg ctgcagg
127 127
<210> 30<210> 30
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 30<400> 30
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca
120 120
gg gg
122 122
<210> 31<210> 31
<211> 130<211> 130
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 31<400> 31
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc
120 120
tgcctgcagg tgcctgcagg
130 130
<210> 32<210> 32
<211> 120<211> 120
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 32<400> 32
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcg cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtgcg
60 60
cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct
120 120
<210> 33<210> 33
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 33<400> 33
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgt cgggcgacct ttggtcgccc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgt cgggcgacct ttggtcgccc
60 60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc
120 120
ct ct
122 122
<210> 34<210> 34
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 34<400> 34
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60 60
ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca ctaggggttc
120 120
ct ct
122 122
<210> 35<210> 35
<211> 129<211> 129
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 35<400> 35
cctgcaggca gctgcgcgct cgctcgctca ctgaggcgcc cgggcgtcgg gcgacctttg cctgcaggca gctgcgcgct cgctcgctca ctgaggcgcc cgggcgtcgg gcgacctttg
60 60
gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta
120 120
ggggttcct ggggttcct
129 129
<210> 36<210> 36
<211> 101<211> 101
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 36<400> 36
cctgcaggca gctgcgcgct cgctcgctca ctgaggcaaa gcctcagtga gcgagcgagc cctgcaggca gctgcgcgct cgctcgctca ctgaggcaaa gcctcagtga gcgagcgagc
60 60
gcgcagagag ggagtggcca actccatcac taggggttcc t gcgcagagag ggagtggcca actccatcac taggggttcc t
101 101
<210> 37<210> 37
<211> 139<211> 139
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 37<400> 37
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60 60
gggcgacttt gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac gggcgacttt gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac
120 120
tccatcacta ggggttcct tccatcacta ggggttcct
139 139
<210> 38<210> 38
<211> 137<211> 137
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 38<400> 38
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60 60
gggcgatttt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc gggcgatttt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc
120 120
catcactagg ggttcct catcactagg ggttcct
137 137
<210> 39<210> 39
<211> 135<211> 135
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 39<400> 39
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60 60
gggcgtttcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca gggcgtttcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca
120 120
tcactagggg ttcct tcactagggg ttcct
135 135
<210> 40<210> 40
<211> 133<211> 133
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 40<400> 40
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc
60 60
gggctttgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc gggctttgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc
120 120
actaggggtt cct actaggggtt cct
133 133
<210> 41<210> 41
<211> 139<211> 139
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 41<400> 41
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtcgg cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggaaacc cgggcgtcgg
60 60
gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac
120 120
tccatcacta ggggttcct tccatcacta ggggttcct
139 139
<210> 42<210> 42
<211> 137<211> 137
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 42<400> 42
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccggaaaccg ggcgtcgggc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccggaaaccg ggcgtcgggc
60 60
gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc gacctttggt cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc
120 120
catcactagg ggttcct catcactagg ggttcct
137 137
<210> 43<210> 43
<211> 135<211> 135
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 43<400> 43
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgaaacggg cgtcgggcga cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgaaacggg cgtcgggcga
60 60
cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg gccaactcca
120 120
tcactagggg ttcct tcactagggg ttcct
135 135
<210> 44<210> 44
<211> 133<211> 133
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 44<400> 44
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccaaagggcg tcgggcgacc cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccaaagggcg tcgggcgacc
60 60
tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag agggagtggc caactccatc
120 120
actaggggtt cct actaggggtt cct
133 133
<210> 45<210> 45
<211> 131<211> 131
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 45<400> 45
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc caaaggcgtc gggcgacctt cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc caaaggcgtc gggcgacctt
60 60
tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca actccatcac
120 120
taggggttcc t tagggggttcct
131 131
<210> 46<210> 46
<211> 129<211> 129
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 46<400> 46
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc aaagcgtcgg gcgacctttg cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc aaagcgtcgg gcgacctttg
60 60
gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg agtggccaac tccatcacta
120 120
ggggttcct ggggttcct
129 129
<210> 47<210> 47
<211> 127<211> 127
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 47<400> 47
cctgcaggca gctgcgcgct cgctcgctca ctgaggccga aacgtcgggc gacctttggt cctgcaggca gctgcgcgct cgctcgctca ctgaggccga aacgtcgggc gacctttggt
60 60
cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg cgcccggcct cagtgagcga gcgagcgcgc agagagggag tggccaactc catcactagg
120 120
ggttcct ggttcct
127 127
<210> 48<210> 48
<211> 122<211> 122
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 48<400> 48
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca ccgggcgacc aaaggtcgcc cgacggcctc agtgagcgag cgagcgcgca gctgcctgca
120 120
gg gg
122 122
<210> 49<210> 49
<211> 12<211> 12
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 49<400> 49
cgatcgttcg at cgatcgttcg at
12 12
<210> 50<210> 50
<211> 12<211> 12
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 50<400> 50
atcgaaccat cg atcgaaccat cg
12 12
<210> 51<210> 51
<211> 12<211> 12
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 51<400> 51
atcgaacgat cg atcgaacgat cg
12 12
<210> 52<210> 52
<211> 165<211> 165
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 52<400> 52
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg
60 60
ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc ccgcccgggc aaagcccggg cgtcgggcga cctttggtcg cccggcctca gtgagcgagc
120 120
gagcgcgcag agagggagtg gccaactcca tcactagggg ttcct gagcgcgcag agagggagtg gccaactcca tcactagggg ttcct
165 165
<210> 53<210> 53
<211> 140<211> 140
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 53<400> 53
cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccgcc
60 60
cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg cggggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag cgagcgagcg
120 120
cgcagagaga tcactagggg cgcagagaga tcactagggg
140 140
<210> 54<210> 54
<211> 91<211> 91
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 54<400> 54
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg
60 60
tcgcccggcc tcagtgagcg agcgagcgcg c tcgcccggcc tcagtgagcg agcgagcgcg c
91 91
<210> 55<210> 55
<211> 91<211> 91
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 55<400> 55
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc
60 60
ccgggcggcc tcagtgagcg agcgagcgcg c ccgggcggcc tcagtgagcg agcgagcgcg c
91 91
<210> 56<210> 56
<211> 1662<211> 1662
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 56<400> 56
gccgccacca tggaagacgc caaaaacata aagaaaggcc cggcgccatt ctatccgctg gccgccacca tggaagacgc caaaaacata aagaaaggcc cggcgccatt ctatccgctg
60 60
gaagatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc cctggttcct gaagatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc cctggttcct
120 120
ggaacaattg cttttacaga tgcacatatc gaggtggaca tcacttacgc tgagtacttc ggaacaattg cttttacaga tgcacatatc gaggtggaca tcacttacgc tgagtacttc
180 180
gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac aaatcacaga gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac aaatcacaga
240 240
atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg cgcgttattt atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg cgcgttattt
300 300
atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt gctcaacagt atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt gctcaacagt
360 360
atgggcattt cgcagcctac cgtggtgttc gtttccaaaa aggggttgca aaaaattttg atgggcattt cgcagcctac cgtggtgttc gtttccaaaa aggggttgca aaaaattttg
420 420
aacgtgcaaa aaaagctccc aatcatccaa aaaattatta tcatggattc taaaacggat aacgtgcaaa aaaagctccc aatcatccaa aaaattatta tcatggattc taaaacggat
480 480
taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc cggttttaat taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc cggttttaat
540 540
gaatacgatt ttgtgccaga gtccttcgat agggacaaga caattgcact gatcatgaac gaatacgatt ttgtgccaga gtccttcgat agggacaaga caattgcact gatcatgaac
600 600
tcctctggat ctactggtct gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg tcctctggat ctactggtct gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg
660 660
agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt
720 720
ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata
780 780
tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt
840 840
caggattaca agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa caggattaca agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa
900 900
agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct
960 960
cccctctcta aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg cccctctcta aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg
10201020
caaggatatg ggctcactga gactacatca gctattctga ttacacccga gggggatgat caaggatatg ggctcactga gactacatca gctattctga ttacacccga gggggatgat
10801080
aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat
11401140
accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt
12001200
atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg
12601260
ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc
13201320
ctgaagtctc tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc ctgaagtctc tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc
13801380
ttgctccaac accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc ttgctccaac accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc
14401440
ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag
15001500
atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg
15601560
tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag
16201620
atcctcataa aggccaagaa gggcggaaag atcgccgtgt aa atcctcataa aggccaagaa gggcggaaag atcgccgtgt aa
16621662
<210> 57<210> 57
<211> 453<211> 453
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полипептидpolypeptide
<220><220>
<221> MOD_RES<221> MOD_RES
<222> (1)..(1)<222> (1)..(1)
<223> Любая аминокислота<223> Any amino acid
<400> 57<400> 57
Xaa Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly ArgXaa Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln Pro Gly Arg
1 5 10 151 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Phe Ser Ser TyrSer Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Ala Phe Ser Ser Tyr
20 25 30 20 25 30
Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp ValGly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45 35 40 45
Ala Val Ile Trp Phe Asp Gly Thr Lys Lys Tyr Tyr Thr Asp Ser ValAla Val Ile Trp Phe Asp Gly Thr Lys Lys Tyr Tyr Thr Asp Ser Val
50 55 60 50 55 60
Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu TyrLys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr
65 70 75 8065 70 75 80
Leu Gln Met Asn Thr Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr CysLeu Gln Met Asn Thr Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95 85 90 95
Ala Arg Asp Arg Gly Ile Gly Ala Arg Arg Gly Pro Tyr Tyr Met AspAla Arg Asp Arg Gly Ile Gly Ala Arg Arg Gly Pro Tyr Tyr Met Asp
100 105 110 100 105 110
Val Trp Gly Lys Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr LysVal Trp Gly Lys Gly Thr Thr Val Thr Val Ser Ser Ala Ser Thr Lys
115 120 125 115 120 125
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser GlyGly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
130 135 140 130 135 140
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu ProGly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
145 150 155 160145 150 155 160
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His ThrVal Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
165 170 175 165 170 175
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser ValPhe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
180 185 190 180 185 190
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys AsnVal Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
195 200 205 195 200 205
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu ProVal Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Arg Val Glu Pro
210 215 220 210 215 220
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro GluLys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
225 230 235 240225 230 235 240
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys AspLeu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
245 250 255 245 250 255
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val AspThr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
260 265 270 260 265 270
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp GlyVal Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
275 280 285 275 280 285
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr AsnVal Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
290 295 300 290 295 300
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp TrpSer Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
305 310 315 320305 310 315 320
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu ProLeu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
325 330 335 325 330 335
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg GluAla Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
340 345 350 340 345 350
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys AsnPro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
355 360 365 355 360 365
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp IleGln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
370 375 380 370 375 380
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys ThrAla Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
385 390 395 400385 390 395 400
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser LysThr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
405 410 415 405 410 415
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser CysLeu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
420 425 430 420 425 430
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser LeuSer Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
435 440 445 435 440 445
Ser Leu Ser Pro GlySer Leu Ser Pro Gly
450 450
<210> 58<210> 58
<211> 214<211> 214
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полипептидpolypeptide
<400> 58<400> 58
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val GlyAsp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 151 5 10 15
Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Ser Ser TyrAsp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Ser Ile Ser Ser Tyr
20 25 30 20 25 30
Leu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu IleLeu Asn Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile
35 40 45 35 40 45
Tyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser GlyTyr Ala Ala Ser Ser Leu Gln Ser Gly Val Pro Ser Arg Phe Ser Gly
50 55 60 50 55 60
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln ProSer Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro
65 70 75 8065 70 75 80
Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Tyr Ser Thr Pro LeuGlu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Ser Tyr Ser Thr Pro Leu
85 90 95 85 90 95
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala AlaThr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
100 105 110 100 105 110
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser GlyPro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
115 120 125 115 120 125
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu AlaThr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
130 135 140 130 135 140
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser GlnLys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
145 150 155 160145 150 155 160
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu SerGlu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
165 170 175 165 170 175
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val TyrSer Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
180 185 190 180 185 190
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys SerAla Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
195 200 205 195 200 205
Phe Asn Arg Gly Glu CysPhe Asn Arg Gly Glu Cys
210 210
<210> 59<210> 59
<211> 1310<211> 1310
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 59<400> 59
ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga
60 60
ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc
120 120
atgcgctcag ggctgagcgc ggggagagca gagcacacaa gctcatagac cctggtcgtg atgcgctcag ggctgagcgc ggggagagca gagcacacaa gctcatagac cctggtcgtg
180 180
ggggggagga ccggggagct ggcgcggggc aaactgggaa agcggtgtcg tgtgctggct ggggggagga ccggggagct ggcgcggggc aaactgggaa agcggtgtcg tgtgctggct
240 240
ccgccctctt cccgagggtg ggggagaacg gtatataagt gcggcagtcg ccttggacgt ccgccctctt cccgagggtg ggggagaacg gtatataagt gcggcagtcg ccttggacgt
300 300
tctttttcgc aacgggtttg ccgtcagaac gcaggtgagg ggcgggtgtg gcttccgcgg tctttttcgc aacgggtttg ccgtcagaac gcaggtgagg ggcgggtgtg gcttccgcgg
360 360
gccgccgagc tggaggtcct gctccgagcg ggccgggccc cgctgtcgtc ggcggggatt gccgccgagc tggaggtcct gctccgagcg ggccggggccc cgctgtcgtc ggcggggatt
420 420
agctgcgagc attcccgctt cgagttgcgg gcggcgcggg aggcagagtg cgaggcctag agctgcgagc attcccgctt cgagttgcgg gcggcgcggg aggcagagtg cgaggcctag
480 480
cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc tagcgtggtg tccgcgccgc cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc tagcgtggtg tccgcgccgc
540 540
cgccgcgtgc tactccggcc gcactctggt cttttttttt tttgttgttg ttgccctgct cgccgcgtgc tactccggcc gcactctggt cttttttttt tttgttgttg ttgccctgct
600 600
gccttcgatt gccgttcagc aataggggct aacaaaggga gggtgcgggg cttgctcgcc gccttcgatt gccgttcagc aataggggct aacaaaggga gggtgcgggg cttgctcgcc
660 660
cggagcccgg agaggtcatg gttggggagg aatggaggga caggagtggc ggctggggcc cggagcccgg agaggtcatg gttggggagg aatggaggga caggagtggc ggctggggcc
720 720
cgcccgcctt cggagcacat gtccgacgcc acctggatgg ggcgaggcct ggggtttttc cgcccgcctt cggagcacat gtccgacgcc acctggatgg ggcgaggcct ggggtttttc
780 780
ccgaagcaac caggctgggg ttagcgtgcc gaggccatgt ggccccagca cccggcacga ccgaagcaac caggctgggg ttagcgtgcc gaggccatgt ggccccagca cccggcacga
840 840
tctggcttgg cggcgccgcg ttgccctgcc tccctaacta gggtgaggcc atcccgtccg tctggcttgg cggcgccgcg ttgccctgcc tccctaacta gggtgaggcc atcccgtccg
900 900
gcaccagttg cgtgcgtgga aagatggccg ctcccgggcc ctgttgcaag gagctcaaaa gcaccagttg cgtgcgtgga aagatggccg ctcccggggcc ctgttgcaag gagctcaaaa
960 960
tggaggacgc ggcagcccgg tggagcgggc gggtgagtca cccacacaaa ggaagagggc tggaggacgc ggcagcccgg tggagcgggc gggtgagtca cccacacaaa ggaagagggc
10201020
ctggtccctc accggctgct gcttcctgtg accccgtggt cctatcggcc gcaatagtca ctggtccctc accggctgct gcttcctgtg accccgtggt cctatcggcc gcaatagtca
10801080
cctcgggctt ttgagcacgg ctagtcgcgg cggggggagg ggatgtaatg gcgttggagt cctcgggctt ttgagcacgg ctagtcgcgg cggggggagg ggatgtaatg gcgttggagt
11401140
ttgttcacat ttggtgggtg gagactagtc aggccagcct ggcgctggaa gtcatttttg ttgttcacat ttggtgggtg gagactagtc aggccagcct ggcgctggaa gtcatttttg
12001200
gaatttgtcc ccttgagttt tgagcggagc taattctcgg gcttcttagc ggttcaaagg gaatttgtcc ccttgagttt tgagcggagc taattctcgg gcttcttagc ggttcaaagg
12601260
tatcttttaa accctttttt aggtgttgtg aaaaccaccg ctaattcaaa tatcttttaa accctttttt aggtgttgtg aaaaccaccg ctaattcaaa
13101310
<210> 60<210> 60
<211> 16<211> 16
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 60<400> 60
gcgcgctcgc tcgctc gcgcgctcgc tcgctc
16 16
<210> 61<210> 61
<211> 6<211> 6
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 61<400> 61
ggttga ggttga
6 6
<210> 62<210> 62
<211> 4<211> 4
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 62<400> 62
agtt agtt
4 4
<210> 63<210> 63
<211> 6<211> 6
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 63<400> 63
ggttgg ggttgg
6 6
<210> 64<210> 64
<211> 6<211> 6
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 64<400> 64
agttgg agttgg
6 6
<210> 65<210> 65
<211> 6<211> 6
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 65<400> 65
agttga agttga
6 6
<210> 66<210> 66
<211> 6<211> 6
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 66<400> 66
rrttrr rrttrr
6 6
<210> 67<210> 67
<211> 581<211> 581
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 67<400> 67
gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat
60 60
ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt
120 120
actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc
180 180
tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt
240 240
aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct
300 300
attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt
360 360
ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac
420 420
gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct
480 480
ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca
540 540
ggggctaggt tgctgggcac tgataattcc gtggtgttgt c ggggctaggt tgctgggcac tgataattcc gtggtgttgt c
581 581
<210> 68<210> 68
<211> 225<211> 225
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 68<400> 68
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct
60 60
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct
120 120
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg
180 180
ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc
225 225
<210> 69<210> 69
<211> 8<211> 8
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 69<400> 69
actgaggc actgaggc
8 8
<210> 70<210> 70
<211> 8<211> 8
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 70<400> 70
gcctcagt gcctcagt
8 8
<210> 71<210> 71
<211> 16<211> 16
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 71<400> 71
gagcgagcga gcgcgc gagcgagcga gcgcgc
16 16
<210> 72<210> 72
<211> 1923<211> 1923
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 72<400> 72
tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta
60 60
ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc
120 120
aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg
180 180
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc
240 240
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat
300 300
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc
360 360
ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga
420 420
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg
480 480
gcagtacatc tacgtattag tcatcgctat taccatggtc gaggtgagcc ccacgttctg gcagtacatc tacgtattag tcatcgctat taccatggtc gaggtgagcc ccacgttctg
540 540
cttcactctc cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta cttcactctc cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta
600 600
attattttgt gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg attattttgt gcagcgatgg gggcgggggg gggggggggg cgcgcgccag gcggggcggg
660 660
gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg gcggcagcca atcagagcgg
720 720
cgcgctccga aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg cgcgctccga aagtttcctt ttatggcgag gcggcggcgg cggcggccct ataaaaagcg
780 780
aagcgcgcgg cgggcgggag tcgctgcgac gctgccttcg ccccgtgccc cgctccgccg aagcgcgcgg cgggcgggag tcgctgcgac gctgccttcg ccccgtgccc cgctccgccg
840 840
ccgcctcgcg ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc ccgcctcgcg ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc
900 900
gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt gggacggccc ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt
960 960
ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc gggggggagc ttctgtggct gcgtgaaagc cttgaggggc tccgggaggg ccctttgtgc gggggggagc
10201020
ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ggctcggggg gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc
10801080
ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg
11401140
aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag
12001200
gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg gcggtcgggc gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg gcggtcgggc
12601260
tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg
13201320
gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg
13801380
ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc
14401440
ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg
15001500
taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct
15601560
gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg
16201620
aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc
16801680
cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg
17401740
ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tttagccttc ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tttagccttc
18001800
ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca tcatttgtcg ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca tcatttgtcg
18601860
acagaattcc tcgaagatcc gaaggggttc aagcttggca ttccggtact gttggtaaag acagaattcc tcgaagatcc gaaggggttc aagcttggca ttccggtact gttggtaaag
19201920
cca cca
19231923
<210> 73<210> 73
<211> 1272<211> 1272
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 73<400> 73
aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc aggctcagag gcacacagga gtttctgggc tcaccctgcc cccttccaac ccctcagttc
60 60
ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc ccatcctcca gcagctgttt gtgtgctgcc tctgaagtcc acactgaaca aacttcagcc
120 120
tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc tactcatgtc cctaaaatgg gcaaacattg caagcagcaa acagcaaaca cacagccctc
180 180
cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc cctgcctgct gaccttggag ctggggcaga ggtcagagac ctctctgggc ccatgccacc
240 240
tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt tccaacatcc actcgacccc ttggaatttc ggtggagagg agcagaggtt gtcctggcgt
300 300
ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag ggtttaggta gtgtgagagg gtccgggttc aaaaccactt gctgggtggg gagtcgtcag
360 360
taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa taagtggcta tgccccgacc ccgaagcctg tttccccatc tgtacaatgg aaatgataaa
420 420
gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg gacgcccatc tgatagggtt tttgtggcaa ataaacattt ggtttttttg ttttgttttg
480 480
ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc ttttgttttt tgagatggag gtttgctctg tcgcccaggc tggagtgcag tgacacaatc
540 540
tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt tcatctcacc acaaccttcc cctgcctcag cctcccaagt agctgggatt acaagcatgt
600 600
gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag gccaccacac ctggctaatt ttctattttt agtagagacg ggtttctcca tgttggtcag
660 660
cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt cctcagcctc ccaagtaact gggattacag gcctgtgcca ccacacccgg ctaatttttt
720 720
ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtaccggat ctatttttga cagggacggg gtttcaccat gttggtcagg ctggtctaga ggtaccggat
780 780
cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt cttgctacca gtggaacagc cactaaggat tctgcagtga gagcagaggg ccagctaagt
840 840
ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct ggtactctcc cagagactgt ctgactcacg ccaccccctc caccttggac acaggacgct
900 900
gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg gtggtttctg agccaggtac aatgactcct ttcggtaagt gcagtggaag ctgtacactg
960 960
cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag cccaggcaaa gcgtccgggc agcgtaggcg ggcgactcag atcccagcca gtggacttag
10201020
cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc
10801080
ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag
11401140
cttcaggcac caccactgac ctgggacagt gaatccggac tctaaggtaa atataaaatt cttcaggcac caccactgac ctgggacagt gaatccggac tctaaggtaa atataaaatt
12001200
tttaagtgta taatgtgtta aactactgat tctaattgtt tctctctttt agattccaac tttaagtgta taatgtgtta aactactgat tctaattgtt tctctctttt agattccaac
12601260
ctttggaact ga ctttggaact ga
12721272
<210> 74<210> 74
<211> 1177<211> 1177
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 74<400> 74
ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc
60 60
tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac
120 120
ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac
180 180
agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca
240 240
tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc
300 300
ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag
360 360
tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa
420 420
tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt
480 480
tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga
540 540
cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca
600 600
agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt
660 660
tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta
720 720
attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt
780 780
accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagaggcca
840 840
gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca
900 900
ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg
960 960
tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg
10201020
gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca
10801080
gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc
11401140
tcctcagctt caggcaccac cactgacctg ggacagt tcctcagctt caggcaccac cactgacctg ggacagt
11771177
<210> 75<210> 75
<211> 547<211> 547
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 75<400> 75
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc
60 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc
120 120
cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag
180 180
gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag
240 240
gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct
300 300
gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt
360 360
gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca
420 420
ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa
480 480
gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg
540 540
gaactga gaactga
547 547
<210> 76<210> 76
<211> 556<211> 556
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 76<400> 76
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc
60 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc
120 120
cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt
180 180
agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc
240 240
aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt
300 300
ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc
360 360
ccctctggat ccactgctta aatacggacg aggacactcg agggccctgt ctcctcagct ccctctggat ccactgctta aatacggacg aggacactcg agggccctgt ctcctcagct
420 420
tcaggcacca ccactgacct gggacagtga atccggacat cgattctaag gtaaatataa tcaggcacca ccactgacct gggacagtga atccggacat cgattctaag gtaaatataa
480 480
aatttttaag tgtataattt gttaaactac tgattctaat tgtttctctc ttttagattc aatttttaag tgtataattt gttaaactac tgattctaat tgtttctctc ttttagattc
540 540
caacctttgg aactga caacctttgg aactga
556 556
<210> 77<210> 77
<211> 1179<211> 1179
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 77<400> 77
ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg
60 60
ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt
120 120
gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca
180 180
gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc
240 240
gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt
300 300
acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg
360 360
gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg
420 420
cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct
480 480
ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg
540 540
caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc
600 600
gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga
660 660
gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct gcgcggccac cgagaatcgg acggggggtag tctcaagctg gccggcctgc tctggtgcct
720 720
ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca
780 780
gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg
840 840
acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg
900 900
tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat
960 960
tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg
10201020
gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa
10801080
ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca
11401140
gtggttcaaa gtttttttct tccatttcag gtgtcgtga gtggttcaaa gtttttttct tccatttcag gtgtcgtga
11791179
<210> 78<210> 78
<211> 141<211> 141
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 78<400> 78
aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt
60 60
cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc
120 120
tgcggcgcgc gcagcacctt t tgcggcgcgc gcagcacctt t
141 141
<210> 79<210> 79
<211> 317<211> 317
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 79<400> 79
ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt
60 60
agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca
120 120
tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa
180 180
ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag
240 240
aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag
300 300
gcctaggctt ttgcaaa gcctaggctt ttgcaaa
317 317
<210> 80<210> 80
<211> 241<211> 241
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 80<400> 80
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag
60 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga
120 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat
180 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga
240 240
c c
241 241
<210> 81<210> 81
<211> 215<211> 215
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 81<400> 81
gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa
60 60
cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc
120 120
tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg
180 180
gatttgggaa tcgtataaga actgtatgag accac gatttgggaa tcgtataaga actgtatgag accac
215 215
<210> 82<210> 82
<211> 546<211> 546
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 82<400> 82
ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc
60 60
tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc
120 120
cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag cactcgaccc cttggaattt ttcggtggag aggagcagag gttgtcctgg cgtggtttag
180 180
gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag gtagtgtgag aggggaatga ctcctttcgg taagtgcagt ggaagctgta cactgcccag
240 240
gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct gcaaagcgtc cgggcagcgt aggcgggcga ctcagatccc agccagtgga cttagcccct
300 300
gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt gtttgctcct ccgataactg gggtgacctt ggttaatatt caccagcagc ctcccccgtt
360 360
gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca gcccctctgg atccactgct taaatacgga cgaggacagg gccctgtctc ctcagcttca
420 420
ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa ggcaccacca ctgacctggg acagtgaatc cggactctaa ggtaaatata aaatttttaa
480 480
gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg gtgtataatg tgttaaacta ctgattctaa ttgtttctct cttttagatt ccaacctttg
540 540
gaactg gaactg
546 546
<210> 83<210> 83
<211> 576<211> 576
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 83<400> 83
tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg cgttacataa
60 60
cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata
120 120
atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag
180 180
tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc
240 240
cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta
300 300
tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg
360 360
cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt
420 420
ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca
480 480
aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt acggtgggag aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt acggtgggag
540 540
gtctatataa gcagagctgg tttagtgaac cgtcag gtctatataa gcagagctgg tttagtgaac cgtcag
576 576
<210> 84<210> 84
<211> 150<211> 150
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 84<400> 84
ataaacgata acgccgttgg tggcgtgagg catgtaaaag gttacatcat tatcttgttc ataaacgata acgccgttgg tggcgtgagg catgtaaaag gttacatcat tatcttgttc
60 60
gccatccggt tggtataaat agacgttcat gttggttttt gtttcagttg caagttggct gccatccggt tggtataaat agacgttcat gttggttttt gtttcagttg caagttggct
120 120
gcggcgcgcg cagcaccttt gcggccatct gcggcgcgcg cagcaccttt gcggccatct
150 150
<210> 85<210> 85
<211> 1313<211> 1313
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 85<400> 85
ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga ggagccgaga gtaattcata caaaaggagg gatcgccttc gcaaggggag agcccaggga
60 60
ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc ccgtccctaa attctcacag acccaaatcc ctgtagccgc cccacgacag cgcgaggagc
120 120
atgcgcccag ggctgagcgc gggtagatca gagcacacaa gctcacagtc cccggcggtg atgcgcccag ggctgagcgc gggtagatca gagcacacaa gctcacagtc cccggcggtg
180 180
gggggagggg cgcgctgagc gggggccagg gagctggcgc ggggcaaact gggaaagtgg gggggagggg cgcgctgagc gggggccagg gagctggcgc ggggcaaact gggaaagtgg
240 240
tgtcgtgtgc tggctccgcc ctcttcccga gggtggggga gaacggtata taagtgcggt tgtcgtgtgc tggctccgcc ctcttcccga gggtggggga gaacggtata taagtgcggt
300 300
agtcgccttg gacgttcttt ttcgcaacgg gtttgccgtc agaacgcagg tgagtggcgg agtcgccttg gacgttcttt ttcgcaacgg gtttgccgtc agaacgcagg tgagtggcgg
360 360
gtgtggcttc cgcgggcccc ggagctggag ccctgctctg agcgggccgg gctgatatgc gtgtggcttc cgcgggcccc ggagctggag ccctgctctg agcgggccgg gctgatatgc
420 420
gagtgtcgtc cgcagggttt agctgtgagc attcccactt cgagtggcgg gcggtgcggg gagtgtcgtc cgcagggttt agctgtgagc attcccactt cgagtggcgg gcggtgcggg
480 480
ggtgagagtg cgaggcctag cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc ggtgagagtg cgaggcctag cggcaacccc gtagcctcgc ctcgtgtccg gcttgaggcc
540 540
tagcgtggtg tccgccgccg cgtgccactc cggccgcact atgcgttttt tgtccttgct tagcgtggtg tccgccgccg cgtgccactc cggccgcact atgcgttttt tgtccttgct
600 600
gccctcgatt gccttccagc agcatgggct aacaaaggga gggtgtgggg ctcactctta gccctcgatt gccttccagc agcatgggct aacaaaggga gggtgtgggg ctcactctta
660 660
aggagcccat gaagcttacg ttggatagga atggaagggc aggaggggcg actggggccc aggagcccat gaagcttacg ttggatagga atggaagggc aggaggggcg actggggccc
720 720
gcccgccttc ggagcacatg tccgacgcca cctggatggg gcgaggcctg tggctttccg gcccgccttc ggagcacatg tccgacgcca cctggatggg gcgaggcctg tggctttccg
780 780
aagcaatcgg gcgtgagttt agcctacctg ggccatgtgg ccctagcact gggcacggtc aagcaatcgg gcgtgagttt agcctacctg ggccatgtgg ccctagcact gggcacggtc
840 840
tggcctggcg gtgccgcgtt cccttgcctc ccaacaaggg tgaggccgtc ccgcccggca tggcctggcg gtgccgcgtt cccttgcctc ccaacaaggg tgaggccgtc ccgcccggca
900 900
ccagttgctt gcgcggaaag atggccgctc ccggggccct gttgcaagga gctcaaaatg ccagttgctt gcgcggaaag atggccgctc ccggggccct gttgcaagga gctcaaaatg
960 960
gaggacgcgg cagcccggtg gagcgggcgg gtgagtcacc cacacaaagg aagagggcct gaggacgcgg cagcccggtg gagcgggcgg gtgagtcacc cacacaaagg aagagggcct
10201020
tgcccctcgc cggccgctgc ttcctgtgac cccgtggtct atcggccgca tagtcacctc tgcccctcgc cggccgctgc ttcctgtgac cccgtggtct atcggccgca tagtcacctc
10801080
gggcttctct tgagcaccgc tcgtcgcggc ggggggaggg gatctaatgg cgttggagtt gggcttctct tgagcaccgc tcgtcgcggc ggggggaggg gatctaatgg cgttggagtt
11401140
tgttcacatt tggtgggtgg agactagtca ggccagcctg gcgctggaag tcattcttgg tgttcacatt tggtgggtgg agactagtca ggccagcctg gcgctggaag tcattcttgg
12001200
aatttgcccc tttgagtttg gagcgaggct aattctcaag cctcttagcg gttcaaaggt aatttgcccc tttgagtttg gagcgaggct aattctcaag cctcttagcg gttcaaaggt
12601260
attttctaaa cccgtttcca ggtgttgtga aagccaccgc taattcaaag caa attttctaaa cccgtttcca ggtgttgtga aagccaccgc taattcaaag caa
13131313
<210> 86<210> 86
<211> 213<211> 213
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 86<400> 86
taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta
60 60
tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag
120 120
ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt
180 180
tttaaagcaa gtaaaacctc tacaaatgtg gta tttaaagcaa gtaaaacctc tacaaatgtg gta
213 213
<210> 87<210> 87
<211> 7<211> 7
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический пептид<223> Description of artificial sequence: synthetic peptide
<400> 87<400> 87
Pro Lys Lys Lys Arg Lys ValPro Lys Lys Lys Arg Lys Val
1 515
<210> 88<210> 88
<211> 19<211> 19
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический пептид<223> Description of artificial sequence: synthetic peptide
<400> 88<400> 88
Met Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr GlyMet Asp Trp Thr Trp Arg Ile Leu Phe Leu Val Ala Ala Ala Thr Gly
1 5 10 151 5 10 15
Ala His SerAla His Ser
<210> 89<210> 89
<211> 19<211> 19
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический пептид<223> Description of artificial sequence: synthetic peptide
<400> 89<400> 89
Met Leu Pro Ser Gln Leu Ile Gly Phe Leu Leu Leu Trp Val Pro AlaMet Leu Pro Ser Gln Leu Ile Gly Phe Leu Leu Leu Trp Val Pro Ala
1 5 10 151 5 10 15
Ser Arg GlySer Arg Gly
<210> 90<210> 90
<211> 7<211> 7
<212> БЕЛОК<212> PROTEIN
<213> Обезьяний вирус 40<213> Monkey virus 40
<400> 90<400> 90
Pro Lys Lys Lys Arg Lys ValPro Lys Lys Lys Arg Lys Val
1 515
<210> 91<210> 91
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Обезьяний вирус 40<213> Monkey virus 40
<400> 91<400> 91
cccaagaaga agaggaaggt g cccaagaaga agaggaaggt g
21 21
<210> 92<210> 92
<211> 16<211> 16
<212> БЕЛОК<212> PROTEIN
<213> Неизвестное<213> Unknown
<220><220>
<223> Описание неизвестного: двухкомпонентная последовательность NLS <223> Description of unknown: two-component NLS sequence
нуклеоплазминаnucleoplasmin
<400> 92<400> 92
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys LysLys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 151 5 10 15
<210> 93<210> 93
<211> 9<211> 9
<212> БЕЛОК<212> PROTEIN
<213> Неизвестное<213> Unknown
<220><220>
<223> Описание неизвестного: последовательность NLS C-myc<223> Description of the unknown: NLS sequence C-myc
<400> 93<400> 93
Pro Ala Ala Lys Arg Val Lys Leu AspPro Ala Ala Lys Arg Val Lys Leu Asp
1 515
<210> 94<210> 94
<211> 11<211> 11
<212> БЕЛОК<212> PROTEIN
<213> Неизвестное<213> Unknown
<220><220>
<223> Описание неизвестного: последовательность NLS C-myc<223> Description of the unknown: NLS sequence C-myc
<400> 94<400> 94
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser ProArg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 101 5 10
<210> 95<210> 95
<211> 38<211> 38
<212> БЕЛОК<212> PROTEIN
<213> Homo sapiens<213> Homo sapiens
<400> 95<400> 95
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly GlyAsn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 151 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys ProArg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30 20 25 30
Arg Asn Gln Gly Gly TyrArg Asn Gln Gly Gly Tyr
35 35
<210> 96<210> 96
<211> 42<211> 42
<212> БЕЛОК<212> PROTEIN
<213> Неизвестное<213> Unknown
<220><220>
<223> Описание неизвестного: домен IBB из последовательности <223> Description of unknown: IBB domain from sequence
импортина-альфаimportin-alpha
<400> 96<400> 96
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu LeuArg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 151 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys LysArg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30 20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn ValAsp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40 35 40
<210> 97<210> 97
<211> 8<211> 8
<212> БЕЛОК<212> PROTEIN
<213> Неизвестное<213> Unknown
<220><220>
<223> Описание неизвестного: последовательность белка Т миомы<223> Description of the unknown: fibroid T protein sequence
<400> 97<400> 97
Val Ser Arg Lys Arg Pro Arg ProVal Ser Arg Lys Arg Pro Arg Pro
1 515
<210> 98<210> 98
<211> 8<211> 8
<212> БЕЛОК<212> PROTEIN
<213> Неизвестное<213> Unknown
<220><220>
<223> Описание неизвестного: последовательность белка Т миомы<223> Description of the unknown: fibroid T protein sequence
<400> 98<400> 98
Pro Pro Lys Lys Ala Arg Glu AspPro Pro Lys Lys Ala Arg Glu Asp
1 515
<210> 99<210> 99
<211> 8<211> 8
<212> БЕЛОК<212> PROTEIN
<213> Homo sapiens<213> Homo sapiens
<400> 99<400> 99
Pro Gln Pro Lys Lys Lys Pro LeuPro Gln Pro Lys Lys Lys Pro Leu
1 515
<210> 100<210> 100
<211> 12<211> 12
<212> БЕЛОК<212> PROTEIN
<213> Mus musculus<213> Mus musculus
<400> 100<400> 100
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala ProSer Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 101 5 10
<210> 101<210> 101
<211> 70<211> 70
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 101<400> 101
gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtgcgcct cagtgagcga gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtgcgcct cagtgagcga
60 60
gcgagcgcgc gcgagcgcgc
70 70
<210> 102<210> 102
<211> 70<211> 70
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 102<400> 102
gcgcgctcgc tcgctcactg aggcgcacgc ccgggtttcc cgggcggcct cagtgagcga gcgcgctcgc tcgctcactg aggcgcacgc ccgggtttcc cgggcggcct cagtgagcga
60 60
gcgagcgcgc gcgagcgcgc
70 70
<210> 103<210> 103
<211> 72<211> 72
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 103<400> 103
gcgcgctcgc tcgctcactg aggccgtcgg gcgacctttg gtcgcccggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgtcgg gcgacctttg gtcgcccggc ctcagtgagc
60 60
gagcgagcgc gc gagcgagcgc gc
72 72
<210> 104<210> 104
<211> 72<211> 72
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 104<400> 104
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc
60 60
gagcgagcgc gc gagcgagcgc gc
72 72
<210> 105<210> 105
<211> 72<211> 72
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 105<400> 105
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggc ctcagtgagc
60 60
gagcgagcgc gc gagcgagcgc gc
72 72
<210> 106<210> 106
<211> 72<211> 72
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 106<400> 106
gcgcgctcgc tcgctcactg aggccgacgc ccgggctttg cccgggcggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgacgc ccgggctttg cccgggcggc ctcagtgagc
60 60
gagcgagcgc gc gagcgagcgc gc
72 72
<210> 107<210> 107
<211> 83<211> 83
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 107<400> 107
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg ctttgcccgg gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg ctttgcccgg
60 60
cctcagtgag cgagcgagcg cgc cctcagtgag cgagcgagcg cgc
83 83
<210> 108<210> 108
<211> 83<211> 83
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 108<400> 108
gcgcgctcgc tcgctcactg aggccgggca aagcccgacg cccgggcttt gcccgggcgg gcgcgctcgc tcgctcactg aggccgggca aagcccgacg cccgggcttt gcccgggcgg
60 60
cctcagtgag cgagcgagcg cgc cctcagtgag cgagcgagcg cgc
83 83
<210> 109<210> 109
<211> 77<211> 77
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 109<400> 109
gcgcgctcgc tcgctcactg aggccgaaac gtcgggcgac ctttggtcgc ccggcctcag gcgcgctcgc tcgctcactg aggccgaaac gtcgggcgac ctttggtcgc ccggcctcag
60 60
tgagcgagcg agcgcgc tgagcgagcg agcgcgc
77 77
<210> 110<210> 110
<211> 77<211> 77
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 110<400> 110
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgtt tcggcctcag gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgtt tcggcctcag
60 60
tgagcgagcg agcgcgc tgagcgagcg agcgcgc
77 77
<210> 111<210> 111
<211> 51<211> 51
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 111<400> 111
gcgcgctcgc tcgctcactg aggcaaagcc tcagtgagcg agcgagcgcg c gcgcgctcgc tcgctcactg aggcaaagcc tcagtgagcg agcgagcgcg c
51 51
<210> 112<210> 112
<211> 51<211> 51
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 112<400> 112
gcgcgctcgc tcgctcactg aggctttgcc tcagtgagcg agcgagcgcg c gcgcgctcgc tcgctcactg aggctttgcc tcagtgagcg agcgagcgcg c
51 51
<210> 113<210> 113
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 113<400> 113
gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct gcgcgctcgc tcgctcactg aggccgcccg ggcgtcgggc gacctttggt cgcccggcct
60 60
cagtgagcga gcgagcgcgc cagtgagcga gcgagcgcgc
80 80
<210> 114<210> 114
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 114<400> 114
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct
60 60
cagtgagcga gcgagcgcgc cagtgagcga gcgagcgcgc
80 80
<210> 115<210> 115
<211> 79<211> 79
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 115<400> 115
gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc
60 60
agtgagcgag cgagcgcgc agtgagcgag cgagcgcgc
79 79
<210> 116<210> 116
<211> 79<211> 79
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 116<400> 116
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcgcctc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcgcctc
60 60
agtgagcgag cgagcgcgc agtgagcgag cgagcgcgc
79 79
<210> 117<210> 117
<211> 5<211> 5
<212> БЕЛОК<212> PROTEIN
<213> Вирус гриппа<213> Influenza virus
<400> 117<400> 117
Asp Arg Leu Arg ArgAsp Arg Leu Arg Arg
1 515
<210> 118<210> 118
<211> 7<211> 7
<212> БЕЛОК<212> PROTEIN
<213> Вирус гриппа<213> Influenza virus
<400> 118<400> 118
Pro Lys Gln Lys Lys Arg LysPro Lys Gln Lys Lys Arg Lys
1 515
<210> 119<210> 119
<211> 10<211> 10
<212> БЕЛОК<212> PROTEIN
<213> Вирус гепатита дельта<213> Hepatitis delta virus
<400> 119<400> 119
Arg Lys Leu Lys Lys Lys Ile Lys Lys LeuArg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 101 5 10
<210> 120<210> 120
<211> 10<211> 10
<212> БЕЛОК<212> PROTEIN
<213> Mus musculus<213> Mus musculus
<400> 120<400> 120
Arg Glu Lys Lys Lys Phe Leu Lys Arg ArgArg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 101 5 10
<210> 121<210> 121
<211> 20<211> 20
<212> БЕЛОК<212> PROTEIN
<213> Homo sapiens<213> Homo sapiens
<400> 121<400> 121
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys LysLys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 151 5 10 15
Lys Ser Lys LysLys Ser Lys Lys
20 20
<210> 122<210> 122
<211> 17<211> 17
<212> БЕЛОК<212> PROTEIN
<213> Homo sapiens<213> Homo sapiens
<400> 122<400> 122
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr LysArg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 151 5 10 15
LysLys
<210> 123<210> 123
<211> 8<211> 8
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 123<400> 123
gtttaaac gtttaaac
8 8
<210> 124<210> 124
<211> 8<211> 8
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 124<400> 124
ttaattaa ttaattaa
8 8
<210> 125<210> 125
<211> 141<211> 141
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 125<400> 125
aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt aataaacgat aacgccgttg gtggcgtgag gcatgtaaaa ggttacatca ttatcttgtt
60 60
cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc cgccatccgg ttggtataaa tagacgttca tgttggtttt tgtttcagtt gcaagttggc
120 120
tgcggcgcgc gcagcacctt t tgcggcgcgc gcagcacctt t
141 141
<210> 126<210> 126
<211> 317<211> 317
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 126<400> 126
ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt
60 60
agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca
120 120
tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa
180 180
ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag
240 240
aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag
300 300
gcctaggctt ttgcaaa gcctaggctt ttgcaaa
317 317
<210> 127<210> 127
<211> 72<211> 72
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 127<400> 127
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc
60 60
gagcgagcgc gc gagcgagcgc gc
72 72
<210> 128<210> 128
<211> 60<211> 60
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 128<400> 128
gagacagaca cactcctgct atgggtactg ctgctctggg ttccaggttc cactggtgac gagacagaca cactcctgct atgggtactg ctgctctggg ttccaggttc cactggtgac
60 60
<210> 129<210> 129
<211> 1260<211> 1260
<212> ДНК<212> DNA
<213> Аденоассоциированный вирус - 2<213> Adeno-associated virus - 2
<400> 129<400> 129
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag
60 60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag
120 120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg
180 180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta
240 240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc
300 300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg
360 360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt
420 420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc
480 480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa
540 540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg
600 600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg
660 660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag
720 720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc
780 780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag
840 840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc
900 900
aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg aactacgcag acaggtacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg
960 960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga
10201020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa
10801080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc
11401140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataaatgatt actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataaatgatt
12001200
taaatcaggt atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga taaatcaggt atggctgccg atggttatct tccagattgg ctcgaggaca ctctctctga
12601260
<210> 130<210> 130
<211> 1932<211> 1932
<212> ДНК<212> DNA
<213> Аденоассоциированный вирус - 2<213> Adeno-associated virus - 2
<400> 130<400> 130
atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc
60 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat
120 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag
180 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg
240 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg
300 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt
360 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc
420 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa
480 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg
540 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag
600 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact
660 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag
720 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg
780 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc
840 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa cccgactacc tggtgggcca gcagcccgtg gaggacatt ccagcaatcg gatttataaa
900 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc
960 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag
10201020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc
10801080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg
11401140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc
12001200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc
12601260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg
13201320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag
13801380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg
14401440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca
15001500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg
15601560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg
16201620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc
16801680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt
17401740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg
18001800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa cgacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa
18601860
caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt ggctcgagga
19201920
cactctctct ga cactctctct ga
19321932
<210> 131<210> 131
<211> 1876<211> 1876
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 131<400> 131
cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg
60 60
gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt
120 120
gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga
180 180
gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct
240 240
tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac
300 300
caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat
360 360
tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac
420 420
cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt
480 480
gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag
540 540
cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc
600 600
gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag
660 660
atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac
720 720
ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc
780 780
caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac
840 840
taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacatt ccagcaatcg
900 900
gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct
960 960
gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac
10201020
taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt
10801080
aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg
11401140
ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag
12001200
caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat
12601260
cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca
13201320
ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga
13801380
ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt
14401440
ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc
15001500
cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac
15601560
gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca
16201620
cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc
16801680
aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc
17401740
tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat
18001800
gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg gggaaaggtg cgacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg
18601860
catctttgaa caataa catctttgaa caataa
18761876
<210> 132<210> 132
<211> 1194<211> 1194
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 132<400> 132
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag
60 60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag
120 120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg
180 180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta
240 240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc
300 300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg
360 360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt
420 420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc
480 480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa
540 540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg
600 600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg
660 660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag
720 720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc
780 780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag
840 840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc
900 900
aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg
960 960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga
10201020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa
10801080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc
11401140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa
11941194
<210> 133<210> 133
<211> 1876<211> 1876
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 133<400> 133
cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg cgcagccacc atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacgg
60 60
gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt
120 120
gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga
180 180
gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct
240 240
tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac
300 300
caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat
360 360
tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac
420 420
cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt
480 480
gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag
540 540
cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc
600 600
gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag
660 660
atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac
720 720
ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc
780 780
caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac
840 840
taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacatt ccagcaatcg
900 900
gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct
960 960
gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac
10201020
taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt
10801080
aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg
11401140
ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag
12001200
caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat
12601260
cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca
13201320
ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga
13801380
ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt
14401440
ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc
15001500
cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac
15601560
gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca
16201620
cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc
16801680
aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc
17401740
tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat
18001800
gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg gggaaaggtg cgacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg
18601860
catctttgaa caataa catctttgaa caataa
18761876
<210> 134<210> 134
<211> 51<211> 51
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 134<400> 134
ctaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg c ctaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg c
51 51
<210> 135<210> 135
<211> 65<211> 65
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 135<400> 135
ctaggactga ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct ctaggactga ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct
60 60
cagtc cagtc
65 65
<210> 136<210> 136
<211> 67<211> 67
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 136<400> 136
ggactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag ggactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag
60 60
tcctgca tcctgca
67 67
<210> 137<210> 137
<211> 41<211> 41
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 137<400> 137
gtgcgggcga ccaaaggtcg cccgacgccc gggcgcactc a gtgcgggcga ccaaaggtcg cccgacgccc gggcgcactc a
41 41
<210> 138<210> 138
<211> 56<211> 56
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 138<400> 138
ggactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt cctgca ggactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt cctgca
56 56
<210> 139<210> 139
<211> 54<211> 54
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 139<400> 139
ctaggactga ggccgcccgg gcgtcgggcg acctttggtc gcccggcctc agtc ctaggactga ggccgcccgg gcgtcgggcg acctttggtc gcccggcctc agtc
54 54
<210> 140<210> 140
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 140<400> 140
ggactgaggc cgggcgacca aaggtcgccc gacggcctca gtcctgca ggactgaggc cgggcgacca aaggtcgccc gacggcctca gtcctgca
48 48
<210> 141<210> 141
<211> 46<211> 46
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 141<400> 141
ctaggactga ggccgtcggg cgacctttgg tcgcccggcc tcagtc ctaggactga ggccgtcggg cgacctttgg tcgcccggcc tcagtc
46 46
<210> 142<210> 142
<211> 67<211> 67
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 142<400> 142
ggactgaggc ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcgcctcag ggactgaggc ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcgcctcag
60 60
tcctgca tcctgca
67 67
<210> 143<210> 143
<211> 47<211> 47
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 143<400> 143
atacctaggc acgcgtgtta ctagttatta atagtaatca attacgg atacctaggc acgcgtgtta ctagttatta atagtaatca attacgg
47 47
<210> 144<210> 144
<211> 29<211> 29
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 144<400> 144
atacctaggg gccgcacgcg tgttactag atacctaggg gccgcacgcg tgttactag
29 29
<210> 145<210> 145
<211> 42<211> 42
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 145<400> 145
atacactcag tgcctgcagg cacgtggtcc ggagatccag ac atacactcag tgcctgcagg cacgtggtcc ggagatccag ac
42 42
<210> 146<210> 146
<211> 3754<211> 3754
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 146<400> 146
cctaggtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct cctaggtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct
60 60
tgtagttaat gattaacccg ccatgctact tatcgcggcc gctcaatatt ggccattagc tgtagttaat gattaacccg ccatgctact tatcgcggcc gctcaatatt ggccattagc
120 120
catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt catattattc attggttata tagcataaat caatattggc tattggccat tgcatacgtt
180 180
gtatctatat cataatatgt acatttatat tggctcatgt ccaatatgac cgccatgttg gtatctatat cataatatgt acatttatat tggctcatgt ccaatatgac cgccatgttg
240 240
gcattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc gcattgatta ttgactagtt attaatagta atcaattacg gggtcattag ttcatagccc
300 300
atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa atatatggag ttccgcgtta cataacttac ggtaaatggc ccgcctggct gaccgcccaa
360 360
cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc caatagggac
420 420
tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca tttccattga cgtcaatggg tggagtattt acggtaaact gcccacttgg cagtacatca
480 480
agtgtatcat atgccaagtc cgccccctat tgacgtcaat gacggtaaat ggcccgcctg agtgtatcat atgccaagtc cgccccctat tgacgtcaat gacggtaaat ggcccgcctg
540 540
gcattatgcc cagtacatga ccttacggga ctttcctact tggcagtaca tctacgtatt gcattatgcc cagtacatga ccttacggga ctttcctact tggcagtaca tctacgtatt
600 600
agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc agtcatcgct attaccatgg tcgaggtgag ccccacgttc tgcttcactc tccccatctc
660 660
ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat ccccccctcc ccacccccaa ttttgtattt atttattttt taattatttt gtgcagcgat
720 720
gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg gggggcgggg gggggggggg ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg
780 780
cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc cggggcgagg cggagaggtg cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc
840 840
ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg ttttatggcg aggcggcggc ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg
900 900
agtcgctgcg acgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc agtcgctgcg acgctgcctt cgccccgtgc cccgctccgc cgccgcctcg cgccgcccgc
960 960
cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc ccttctcctc
10201020
cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa cgggctgtaa ttagcgcttg gtttaatgac ggcttgtttc ttttctgtgg ctgcgtgaaa
10801080
gccttgaggg gctccgggag ggccctttgt gcggggggga gcggctcggg gggtgcgtgc gccttgaggg gctccgggag ggccctttgt gcggggggga gcggctcggg gggtgcgtgc
11401140
gtgtgtgtgt gcgtggggag cgccgcgtgc ggcccgcgct gcccggcggc tgtgagcgct gtgtgtgtgt gcgtggggag cgccgcgtgc ggcccgcgct gcccggcggc tgtgagcgct
12001200
gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg gcgggcgcgg cgcggggctt tgtgcgctcc gcagtgtgcg cgaggggagc gcggccgggg
12601260
gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt gcggtgcccc gcggtgcggg gggggctgcg aggggaacaa aggctgcgtg cggggtgtgt
13201320
gcgtgggggg gtgagcaggg ggtgtgggcg cggcggtcgg gctgtaaccc ccccctgcac gcgtgggggg gtgagcaggg ggtgtgggcg cggcggtcgg gctgtaaccc ccccctgcac
13801380
ccccctcccc gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt ccccctcccc gagttgctga gcacggcccg gcttcgggtg cggggctccg tacggggcgt
14401440
ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg ggcgcggggc tcgccgtgcc gggcgggggg tggcggcagg tgggggtgcc gggcggggcg
15001500
gggccgcctc gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc gggccgcctc gggccgggga gggctcgggg gaggggcgcg gcggcccccg gagcgccggc
15601560
ggctgtcgag gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagagggcg ggctgtcgag gcgcggcgag ccgcagccat tgccttttat ggtaatcgtg cgagaggcg
16201620
cagggacttc ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc cagggacttc ctttgtccca aatctgtgcg gagccgaaat ctgggaggcg ccgccgcacc
16801680
ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag ccctctagcg ggcgcggggc gaagcggtgc ggcgccggca ggaaggaaat gggcggggag
17401740
ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg ggccttcgtg cgtcgccgcg ccgccgtccc cttctccctc tccagcctcg gggctgtccg
18001800
cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg cggggggacg gctgccttcg ggggggacgg ggcagggcgg ggttcggctt ctggcgtgtg
18601860
accggcggct ctagagcctc tgctaaccat gttttagcct tcttcttttt cctacagctc accggcggct ctagagcctc tgctaaccat gttttagcct tcttcttttt cctacagctc
19201920
ctgggcaacg tgctggttat tgtgctgtct catcatttgt cgacagaatt cctcgaagat ctgggcaacg tgctggttat tgtgctgtct catcatttgt cgacagaatt cctcgaagat
19801980
ccgaaggggt tcaagcttgg cattccggta ctgttggtaa agccagttta aacgccgcca ccgaaggggt tcaagcttgg cattccggta ctgttggtaa agccagttta aacgccgcca
20402040
ccatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg ccatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg
21002100
acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct
21602160
acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca
22202220
ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga
22802280
agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct
23402340
tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc
24002400
tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc
24602460
acaagctgga gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga acaagctgga gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga
25202520
acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg
25802580
ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc
26402640
actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg
27002700
tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt
27602760
aattaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt ttcttgattt aattaattaa gagcatctta ccgccatta ttcccatatt tgttctgttt ttcttgattt
28202820
gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac atttttaggg
28802880
atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga aactttcccg
29402940
ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac
30003000
tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt tatagcctct
30603060
gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt
31203120
gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt
31803180
gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg
32403240
gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg
33003300
ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt ctgtgccttc ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt ctgtgccttc
33603360
tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc
34203420
cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg
34803480
tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa
35403540
tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct acgtagataa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct acgtagataa
36003600
gtagcatggc gggttaatca ttaactacac ctgcagcagg aacccctagt gatggagttg gtagcatggc gggttaatca ttaactacac ctgcagcagg aacccctagt gatggagttg
36603660
gccactccct ctctgcgcgc tcgctcgctc cctgcaggac tgaggccggg cgaccaaagg gccactccct ctctgcgcgc tcgctcgctc cctgcaggac tgaggccggg cgaccaaagg
37203720
tcgcccgacg cccgggcggc ctcagtcctg cagg tcgcccgacg cccgggcggc ctcagtcctg cagg
37543754
<210> 147<210> 147
<211> 8418<211> 8418
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 147<400> 147
ggcagctgcg cgctcgctcg ctcacctagg ccgcccgggc aaagcccggg cgtcgggcga ggcagctgcg cgctcgctcg ctcacctagg ccgcccgggc aaagcccggg cgtcgggcga
60 60
cctttggtcg cccggcctag gtgagcgagc gagcgcgcag agagggagtg gccaactcca cctttggtcg cccggcctag gtgagcgagc gagcgcgcag agagggagtg gccaactcca
120 120
tcactagggg ttccttgtag ttaatgatta acccgccatg ctacttatcg cggccgctca tcactagggg ttccttgtag ttaatgatta acccgccatg ctacttatcg cggccgctca
180 180
atattggcca ttagccatat tattcattgg ttatatagca taaatcaata ttggctattg atattggcca ttagccatat tattcattgg ttatatagca taaatcaata ttggctattg
240 240
gccattgcat acgttgtatc tatatcataa tatgtacatt tatattggct catgtccaat gccattgcat acgttgtatc tatatcataa tatgtacatt tatattggct catgtccaat
300 300
atgaccgcca tgttggcatt gattattgac tagttattaa tagtaatcaa ttacggggtc atgaccgcca tgttggcatt gattattgac tagttattaa tagtaatcaa ttacggggtc
360 360
attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc attagttcat agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc
420 420
tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt
480 480
aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt aaactgccca
540 540
cttggcagta catcaagtgt atcatatgcc aagtccgccc cctattgacg tcaatgacgg cttggcagta catcaagtgt atcatatgcc aagtccgccc cctattgacg tcaatgacgg
600 600
taaatggccc gcctggcatt atgcccagta catgacctta cgggactttc ctacttggca taaatggccc gcctggcatt atgcccagta catgacctta cgggactttc ctacttggca
660 660
gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt gtacatctac gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt
720 720
cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt cactctcccc atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt
780 780
attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg attttgtgca gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg
840 840
gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc gggcgagggg cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc
900 900
gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag
960 960
cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc cgtgccccgc tccgccgccg cgcgcggcgg gcgggagtcg ctgcgacgct gccttcgccc cgtgccccgc tccgccgccg
10201020
cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg cctcgcgccg cccgccccgg ctctgactga ccgcgttact cccacaggtg agcgggcggg
10801080
acggcccttc tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc acggcccttc tcctccgggc tgtaattagc gcttggttta atgacggctt gtttcttttc
11401140
tgtggctgcg tgaaagcctt gaggggctcc gggagggccc tttgtgcggg ggggagcggc tgtggctgcg tgaaagcctt gaggggctcc gggagggccc tttgtgcggg ggggagcggc
12001200
tcggggggtg cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggccc gcgctgcccg tcggggggtg cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggccc gcgctgcccg
12601260
gcggctgtga gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg gcggctgtga gcgctgcggg cgcggcgcgg ggctttgtgc gctccgcagt gtgcgcgagg
13201320
ggagcgcggc cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct ggagcgcggc cgggggcggt gccccgcggt gcgggggggg ctgcgagggg aacaaaggct
13801380
gcgtgcgggg tgtgtgcgtg ggggggtgag cagggggtgt gggcgcggcg gtcgggctgt gcgtgcgggg tgtgtgcgtg ggggggtgag cagggggtgt gggcgcggcg gtcgggctgt
14401440
aacccccccc tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg aacccccccc tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg
15001500
ctccgtacgg ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg ctccgtacgg ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg
15601560
gtgccgggcg gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc gtgccgggcg gggcggggcc gcctcggggcc ggggagggct cgggggaggg gcgcggcggc
16201620
ccccggagcg ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa ccccggagcg ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa
16801680
tcgtgcgaga gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg tcgtgcgaga gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg
17401740
aggcgccgcc gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag aggcgccgcc gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag
18001800
gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag
18601860
cctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc cctcggggct gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc
19201920
ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgtttt agccttcttc ggcttctggc gtgtgaccgg cggctctaga gcctctgcta accatgtttt agccttcttc
19801980
tttttcctac agctcctggg caacgtgctg gttattgtgc tgtctcatca tttgtcgaca tttttcctac agctcctggg caacgtgctg gttattgtgc tgtctcatca tttgtcgaca
20402040
gaattcctcg aagatccgaa ggggttcaag cttggcattc cggtactgtt ggtaaagcca gaattcctcg aagatccgaa ggggttcaag cttggcattc cggtactgtt ggtaaagcca
21002100
gtttaaacgc cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca gtttaaacgc cgccaccatg gtgagcaagg gcgaggagct gttcaccggg gtggtgccca
21602160
tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgaggcg
22202220
agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc
22802280
ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct
23402340
accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc
24002400
aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt
24602460
tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg
25202520
gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg
25802580
ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg
26402640
gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc
27002700
tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga
27602760
agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg
28202820
acgagctgta caagtaatta attaagagca tcttaccgcc atttattccc atatttgttc acgagctgta caagtaatta attaagagca tcttaccgcc atttattccc atatttgttc
28802880
tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca tgtttttctt gatttgggta tacatttaaa tgttaataaa acaaaatggt ggggcaatca
29402940
tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt tttacatttt tagggatatg taattactag ttcaggtgta ttgccacaag acaaacatgt
30003000
taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat taagaaactt tcccgttatt tacgctctgt tcctgttaat caacctctgg attacaaaat
30603060
ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc ttgtgaaaga ttgactgata ttcttaacta tgttgctcct tttacgctgt gtggatatgc
31203120
tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt tgctttatag cctctgtatc tagctattgc ttcccgtacg gctttcgttt tctcctcctt
31803180
gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg gtataaatcc tggttgctgt ctcttttaga ggagttgtgg cccgttgtcc gtcaacgtgg
32403240
cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg cgtggtgtgc tctgtgtttg ctgacgcaac ccccactggc tggggcattg ccaccacctg
33003300
tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc tcaactcctt tctgggactt tcgctttccc cctcccgatc gccacggcag aactcatcgc
33603360
cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt cgcctgcctt gcccgctgct ggacaggggc taggttgctg ggcactgata attccgtggt
34203420
gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gttgtctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt
34803480
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca
35403540
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga
36003600
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ctctagagca
36603660
tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca gcaggaaccc tggctacgta gataagtagc atggcgggtt aatcattaac tacacctgca gcaggaaccc
37203720
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctccctgc aggactgagg ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctccctgc aggactgagg
37803780
ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tcctgcaggg agcgagcgag ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag tcctgcaggg agcgagcgag
38403840
cgcgcagctg cctgcacggg cgcgccggta ccgggagatg ggggaggcta actgaaacac cgcgcagctg cctgcacggg cgcgccggta ccgggagatg ggggaggcta actgaaacac
39003900
ggaaggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa ggaagggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa
39603960
cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct
40204020
gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca
40804080
ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc
41404140
cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg
42004200
cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca
42604260
gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat
43204320
ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg
43804380
agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc
44404440
ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat
45004500
aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca
45604560
gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg
46204620
actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg
46804680
gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag
47404740
cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt
48004800
aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag
48604860
ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg
49204920
ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct
49804980
ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat
50405040
ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc
51005100
aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac
51605160
gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat
52205220
atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg
52805280
gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac
53405340
gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca
54005400
taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat
54605460
tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt
55205520
tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt
55805580
ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa
56405640
taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg
57005700
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg
57605760
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag
58205820
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga
58805880
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct
59405940
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc
60006000
tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg
60606060
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc
61206120
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca
61806180
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag
62406240
ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct
63006300
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc
63606360
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga
64206420
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca
64806480
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat
65406540
taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac
66006600
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt
66606660
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt
67206720
gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag
67806780
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct
68406840
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt
69006900
gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc
69606960
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt
70207020
agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg
70807080
gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg
71407140
actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct
72007200
tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc
72607260
attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt
73207320
tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt
73807380
tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg
74407440
aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat
75007500
tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg
75607560
cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc
76207620
gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc
76807680
ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag
77407740
agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc
78007800
gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa
78607860
gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg
79207920
aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt
79807980
gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacaggc
80408040
gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt
81008100
aataacgaag agatgacaga aaaattttca ttctgtgaca gagaaaaagt agccgaagat aataacgaag agatgacaga aaaattttca ttctgtgaca gagaaaaagt agccgaagat
81608160
gacggtttgt cacatggagt tggcaggatg tttgattaaa aacataacag gaagaaaaat gacggtttgt cacatggagt tggcaggatg tttgattaaa aacataacag gaagaaaaat
82208220
gccccgctgt gggcggacaa aatagttggg aactgggagg ggtggaaatg gagtttttaa gccccgctgt gggcggacaa aatagttggg aactgggagg ggtggaaatg gagtttttaa
82808280
ggattattta gggaagagtg acaaaataga tgggaactgg gtgtagcgtc gtaagctaat ggattattta gggaagagtg acaaaataga tgggaactgg gtgtagcgtc gtaagctaat
83408340
acgaaaatta aaaatgacaa aatagtttgg aactagattt cacttatctg gttcggatct acgaaaatta aaaatgacaa aatagtttgg aactagatt cacttatctg gttcggatct
84008400
cctagtgagc tccctgca cctagtgagc tccctgca
84188418
<210> 148<210> 148
<211> 225<211> 225
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 148<400> 148
tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct tgtgccttct agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct
60 60
ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct ggaaggtgcc actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct
120 120
gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg gagtaggtgt cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg
180 180
ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc ggaagacaat agcaggcatg ctggggatgc ggtgggctct atggc
225 225
<210> 149<210> 149
<211> 1177<211> 1177
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 149<400> 149
ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc ggctcagagg ctcagaggca cacaggagtt tctgggctca ccctgccccc ttccaacccc
60 60
tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac tcagttccca tcctccagca gctgtttgtg tgctgcctct gaagtccaca ctgaacaaac
120 120
ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac ttcagcctac tcatgtccct aaaatgggca aacattgcaa gcagcaaaca gcaaacacac
180 180
agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca agccctccct gcctgctgac cttggagctg gggcagaggt cagagacctc tctgggccca
240 240
tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc tgccacctcc aacatccact cgaccccttg gaatttcggt ggagaggagc agaggttgtc
300 300
ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag ctggcgtggt ttaggtagtg tgagagggtc cgggttcaaa accacttgct gggtggggag
360 360
tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa tcgtcagtaa gtggctatgc cccgaccccg aagcctgttt ccccatctgt acaatggaaa
420 420
tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt tgataaagac gcccatctga tagggttttt gtggcaaata aacatttggt ttttttgttt
480 480
tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga tgttttgttt tgttttttga gatggaggtt tgctctgtcg cccaggctgg agtgcagtga
540 540
cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca cacaatctca tctcaccaca accttcccct gcctcagcct cccaagtagc tgggattaca
600 600
agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt agcatgtgcc accacacctg gctaattttc tatttttagt agagacgggt ttctccatgt
660 660
tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta tggtcagcct cagcctccca agtaactggg attacaggcc tgtgccacca cacccggcta
720 720
attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt attttttcta tttttgacag ggacggggtt tcaccatgtt ggtcaggctg gtctagaggt
780 780
accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagagggcca accggatctt gctaccagtg gaacagccac taaggattct gcagtgagag cagaggcca
840 840
gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca gctaagtggt actctcccag agactgtctg actcacgcca ccccctccac cttggacaca
900 900
ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg
960 960
tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg
10201020
gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca
10801080
gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc
11401140
tcctcagctt caggcaccac cactgacctg ggacagt tcctcagctt caggcaccac cactgacctg ggacagt
11771177
<210> 150<210> 150
<211> 1326<211> 1326
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 150<400> 150
ctgcagggcc cactagtgga gccgagagta attcatacaa aaggagggat cgccttcgca ctgcagggcc cactagtgga gccgagagta attcatacaa aaggagggat cgccttcgca
60 60
aggggagagc ccagggaccg tccctaaatt ctcacagacc caaatccctg tagccgcccc aggggagagc cccaggaccg tccctaaatt ctcacagacc caaatccctg tagccgcccc
120 120
acgacagcgc gaggagcatg cgcccagggc tgagcgcggg tagatcagag cacacaagct acgacagcgc gaggagcatg cgcccagggc tgagcgcggg tagatcagag cacacaagct
180 180
cacagtcccc ggcggtgggg ggaggggcgc gctgagcggg ggccagggag ctggcgcggg cacagtcccc ggcggtgggg ggaggggcgc gctgagcggg ggccagggag ctggcgcggg
240 240
gcaaactggg aaagtggtgt cgtgtgctgg ctccgccctc ttcccgaggg tgggggagaa gcaaactggg aaagtggtgt cgtgtgctgg ctccgccctc ttcccgaggg tggggggagaa
300 300
cggtatataa gtgcggtagt cgccttggac gttctttttc gcaacgggtt tgccgtcaga cggtatataa gtgcggtagt cgccttggac gttctttttc gcaacgggtt tgccgtcaga
360 360
acgcaggtga gtggcgggtg tggcttccgc gggccccgga gctggagccc tgctctgagc acgcaggtga gtggcgggtg tggcttccgc gggccccgga gctggagccc tgctctgagc
420 420
gggccgggct gatatgcgag tgtcgtccgc agggtttagc tgtgagcatt cccacttcga gggccgggct gatatgcgag tgtcgtccgc agggtttagc tgtgagcatt cccacttcga
480 480
gtggcgggcg gtgcgggggt gagagtgcga ggcctagcgg caaccccgta gcctcgcctc gtggcgggcg gtgcgggggt gagagtgcga ggcctagcgg caaccccgta gcctcgcctc
540 540
gtgtccggct tgaggcctag cgtggtgtcc gccgccgcgt gccactccgg ccgcactatg gtgtccggct tgaggcctag cgtggtgtcc gccgccgcgt gccactccgg ccgcactatg
600 600
cgttttttgt ccttgctgcc ctcgattgcc ttccagcagc atgggctaac aaagggaggg cgttttttgt ccttgctgcc ctcgattgcc ttccagcagc atgggctaac aaagggaggg
660 660
tgtggggctc actcttaagg agcccatgaa gcttacgttg gataggaatg gaagggcagg tgtggggctc actcttaagg agcccatgaa gcttacgttg gataggaatg gaagggcagg
720 720
aggggcgact ggggcccgcc cgccttcgga gcacatgtcc gacgccacct ggatggggcg aggggcgact ggggcccgcc cgccttcgga gcacatgtcc gacgccacct ggatggggcg
780 780
aggcctgtgg ctttccgaag caatcgggcg tgagtttagc ctacctgggc catgtggccc aggcctgtgg ctttccgaag caatcgggcg tgagtttagc ctacctgggc catgtggccc
840 840
tagcactggg cacggtctgg cctggcggtg ccgcgttccc ttgcctccca acaagggtga tagcactggg cacggtctgg cctggcggtg ccgcgttccc ttgcctccca acaagggtga
900 900
ggccgtcccg cccggcacca gttgcttgcg cggaaagatg gccgctcccg gggccctgtt ggccgtcccg cccggcacca gttgcttgcg cggaaagatg gccgctcccg gggccctgtt
960 960
gcaaggagct caaaatggag gacgcggcag cccggtggag cgggcgggtg agtcacccac gcaaggagct caaaatggag gacgcggcag cccggtggag cgggcgggtg agtcaccac
10201020
acaaaggaag agggccttgc ccctcgccgg ccgctgcttc ctgtgacccc gtggtctatc acaaaggaag agggccttgc ccctcgccgg ccgctgcttc ctgtgacccc gtggtctatc
10801080
ggccgcatag tcacctcggg cttctcttga gcaccgctcg tcgcggcggg gggaggggat ggccgcatag tcacctcggg cttctcttga gcaccgctcg tcgcggcggg gggaggggat
11401140
ctaatggcgt tggagtttgt tcacatttgg tgggtggaga ctagtcaggc cagcctggcg ctaatggcgt tggagtttgt tcacatttgg tgggtggaga ctagtcaggc cagcctggcg
12001200
ctggaagtca ttcttggaat ttgccccttt gagtttggag cgaggctaat tctcaagcct ctggaagtca ttcttggaat ttgccccttt gagtttggag cgaggctaat tctcaagcct
12601260
cttagcggtt caaaggtatt ttctaaaccc gtttccaggt gttgtgaaag ccaccgctaa cttagcggtt caaaggtatt ttctaaaccc gtttccaggt gttgtgaaag ccaccgctaa
13201320
ttcaaa ttcaaa
13261326
<210> 151<210> 151
<211> 573<211> 573
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 151<400> 151
gtaagagttt tatgtttttt catctctgct tgtatttttc tagtaatgga agcctggtat gtaagagttt tatgtttttt catctctgct tgtatttttc tagtaatgga agcctggtat
60 60
tttaaaatag ttaaattttc ctttagtgct gatttctaga ttattattac tgttgttgtt tttaaaatag ttaaattttc ctttagtgct gatttctaga ttattattac tgttgttgtt
120 120
gttattattg tcattatttg catctgagaa cccttaggtg gttatattat tgatatattt gttattattg tcattatttg catctgagaa cccttaggtg gttatattat tgatatattt
180 180
ttggtatctt tgatgacaat aatgggggat tttgaaagct tagctttaaa tttcttttaa ttggtatctt tgatgacaat aatgggggat tttgaaagct tagctttaaa tttcttttaa
240 240
ttaaaaaaaa atgctaggca gaatgactca aattacgttg gatacagttg aatttattac ttaaaaaaaa atgctaggca gaatgactca aattacgttg gatacagttg aatttattac
300 300
ggtctcatag ggcctgcctg ctcgaccatg ctatactaaa aattaaaagt gtgtgttact ggtctcatag ggcctgcctg ctcgaccatg ctatactaaa aattaaaagt gtgtgttact
360 360
aattttataa atggagtttc catttatatt tacctttatt tcttatttac cattgtctta aattttataa atggagtttc catttatatt tacctttatt tcttatttac cattgtctta
420 420
gtagatattt acaaacatga cagaaacact aaatcttgag tttgaatgca cagatataaa gtagatattt acaaacatga cagaaacact aaatcttgag tttgaatgca cagatataaa
480 480
cacttaacgg gttttaaaaa taataatgtt ggtgaaaaaa tataactttg agtgtagcag cacttaacgg gttttaaaaa taataatgtt ggtgaaaaaa tataactttg agtgtagcag
540 540
agaggaacca ttgccacctt cagattttcc tgt agaggaacca ttgccacctt cagattttcc tgt
573 573
<210> 152<210> 152
<211> 1993<211> 1993
<212> ДНК<212> DNA
<213> Mus musculus<213> Mus musculus
<400> 152<400> 152
acgatcggga actggcatct tcagggagta gcttaggtca gtgaagagaa gaacaaaaag acgatcggga actggcatct tcagggagta gcttaggtca gtgaagagaa gaacaaaaag
60 60
cagcatatta cagttagttg tcttcatcaa tctttaaata tgttgtgtgg tttttctctc cagcatatta cagttagttg tcttcatcaa tctttaaata tgttgtgtgg tttttctctc
120 120
cctgtttcca cagacaagag tgagatcgcc catcggtata atgatttggg agaacaacat cctgtttcca cagacaagag tgagatcgcc catcggtata atgatttggg agaacaacat
180 180
ttcaaaggcc tgtaagttat aatgctgaaa gcccacttaa tatttctggt agtattagtt ttcaaaggcc tgtaagttat aatgctgaaa gcccacttaa tatttctggt agtattagtt
240 240
aaagttttaa aacacctttt tccaccttga gtgtgagaat tgtagagcag tgctgtccag aaagttttaa aacacctttt tccaccttga gtgtgagaat tgtagagcag tgctgtccag
300 300
tagaaatgtg tgcattgaca gaaagactgt ggatctgtgc tgagcaatgt ggcagccaga tagaaatgtg tgcattgaca gaaagactgt ggatctgtgc tgagcaatgt ggcagccaga
360 360
gatcacaagg ctatcaagca ctttgcacat ggcaagtgta actgagaagc acacattcaa gatcacaagg ctatcaagca ctttgcacat ggcaagtgta actgagaagc acacattcaa
420 420
ataatagtta attttaattg aatgtatcta gccatgtgtg gctagtagct cctttcctgg ataatagtta attttaattg aatgtatcta gccatgtgtg gctagtagct cctttcctgg
480 480
agagagaatc tggagcccac atctaacttg ttaagtctgg aatcttattt tttatttctg agagagaatc tggagcccac atctaacttg ttaagtctgg aatcttattt tttatttctg
540 540
gaaaggtcta tgaactatag ttttgggggc agctcactta ctaactttta atgcaataag gaaaggtcta tgaactatag ttttgggggc agctcactta ctaactttta atgcaataag
600 600
atctcatggt atcttgagaa cattattttg tctctttgta gtactgaaac cttatacatg atctcatggt atcttgagaa cattattttg tctctttgta gtactgaaac cttatacatg
660 660
tgaagtaagg ggtctatact taagtcacat ctccaacctt agtaatgttt taatgtagta tgaagtaagg ggtctatact taagtcacat ctccaacctt agtaatgttt taatgtagta
720 720
aaaaaatgag taattaattt atttttagaa ggtcaatagt atcatgtatt ccaaataaca aaaaaatgag taattaattt atttttagaa ggtcaatagt atcatgtatt ccaaataaca
780 780
gaggtatatg gttagaaaag aaacaattca aaggacttat ataatatcta gccttgacaa gaggtatatg gttagaaaag aaacaattca aaggacttat ataatatcta gccttgacaa
840 840
tgaataaatt tagagagtag tttgcctgtt tgcctcatgt tcataaatct attgacacat tgaataaatt tagagagtag tttgcctgtt tgcctcatgt tcataaatct attgacacat
900 900
atgtgcatct gcacttcagc atggtagaag tccatattcc tttgcttgga aaggcaggtg atgtgcatct gcacttcagc atggtagaag tccatattcc tttgcttgga aaggcaggtg
960 960
ttcccattac gcctcagaga atagctgacg ggaagaggct ttctagatag ttgtatgaaa ttcccattac gcctcagaga atagctgacg ggaagaggct ttctagatag ttgtatgaaa
10201020
gatatacaaa atctcgcagg tatacacagg catgatttgc tggttgggag agccacttgc gatatacaaa atctcgcagg tatacacagg catgatttgc tggttgggag agccacttgc
10801080
ctcatactga ggtttttgtg tctgcttttc agagtcctga ttgccttttc ccagtatctc ctcatactga ggtttttgtg tctgcttttc agagtcctga ttgccttttc ccagtatctc
11401140
cagaaatgct catacgatga gcatgccaaa ttagtgcagg aagtaacaga ctttgcaaag cagaaatgct catacgatga gcatgccaaa ttagtgcagg aagtaacaga ctttgcaaag
12001200
acgtgtgttg ccgatgagtc tgccgccaac tgtgacaaat cccttgtgag taccttctga acgtgtgttg ccgatgagtc tgccgccaac tgtgacaaat cccttgtgag taccttctga
12601260
ttttgtggat ctactttcct gctttctgga actctgtttc aaagccaatc atgactccat ttttgtggat ctactttcct gctttctgga actctgtttc aaagccaatc atgactccat
13201320
cacttaaggc cccgggaaca ctgtggcaga gggcagcaga gagattgata aagccagggt cacttaaggc cccgggaaca ctgtggcaga gggcagcaga gagattgata aagccaggt
13801380
gatgggaatt ttctgtggga ctccatttca tagtaattgc agaagctaca atacactcaa gatgggaatt ttctgtggga ctccatttca tagtaattgc agaagctaca atacactcaa
14401440
aaagtctcac cacatgactg cccaaatggg agcttgacag tgacagtgac agtagatatg aaagtctcac cacatgactg cccaaatggg agcttgacag tgacagtgac agtagatatg
15001500
ccaaagtgga tgagggaaag accacaagag ctaaaccctg taaaaagaac tgtaggcaac ccaaagtgga tgagggaaag accacaagag ctaaaccctg taaaaagaac tgtaggcaac
15601560
taaggaatgc agagagaaga agttgccttg gaagagcata ccaactgcct ctccaatacc taaggaatgc agagagaaga agttgccttg gaagagcata ccaactgcct ctccaatacc
16201620
aatggtcatc cctaaaacat acgtatgaat aacatgcaga ctaagcaggc tacatttagg aatggtcatc cctaaaacat acgtatgaat aacatgcaga ctaagcaggc tacatttagg
16801680
aatatacatg tatttacata aatgtatatg catgtaacaa caatgaatga aaactgaggt aatatacatg tatttacata aatgtatatg catgtaacaa caatgaatga aaactgaggt
17401740
catggatctg aaagagagca agggggctta catgagaggg tttggaggga ggggttggag catggatctg aaagagagca agggggctta catgagagg tttggaggga ggggttggag
18001800
ggagggaggt attattcttt agttttacag ggaacgtagt aaaaacatag gcttctccca ggagggaggt attattcttt agttttacag ggaacgtagt aaaaacatag gcttctccca
18601860
aaggagcaga gcccatgagg agctgtgcaa ggttccccag cttgatttta cctgctcctc aaggagcaga gcccatgagg agctgtgcaa ggttccccag cttgatttta cctgctcctc
19201920
aaattccctt gatttgtttt tattataatg actttactcc tagcttttag tgtcagatag aaattccctt gatttgtttt tattataatg actttactcc tagcttttag tgtcagatag
19801980
aaaacatgga agg aaaacatgga agg
19931993
<210> 153<210> 153
<211> 1350<211> 1350
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 153<400> 153
taggaggctg aggcaggagg atcgcttgag cccaggagtt cgagaccagc ctgggcaaca taggaggctg aggcaggagg atcgcttgag cccaggagtt cgagaccagc ctgggcaaca
60 60
tagtgtgatc ttgtatctat aaaaataaac aaaattagct tggtgtggtg gcgcctgtag tagtgtgatc ttgtatctat aaaaataaac aaaattagct tggtgtggtg gcgcctgtag
120 120
tccccagcca cttggagggg tgaggtgaga ggattgcttg agcccgggat ggtccaggct tccccagcca cttggagggg tgaggtgaga ggattgcttg agcccgggat ggtccaggct
180 180
gcagtgagcc atgatcgtgc cactgcactc cagcctgggc gacagagtga gaccctgtct gcagtgagcc atgatcgtgc cactgcactc cagcctgggc gacagagtga gaccctgtct
240 240
cacaacaaca acaacaacaa caaaaaggct gagctgcacc atgcttgacc cagtttctta cacaacaaca acaacaacaa caaaaaggct gagctgcacc atgcttgacc cagtttctta
300 300
aaattgttgt caaagcttca ttcactccat ggtgctatag agcacaagat tttatttggt aaattgttgt caaagcttca ttcactccat ggtgctatag agcacaagat tttatttggt
360 360
gagatggtgc tttcatgaat tcccccaaca gagccaagct ctccatctag tggacaggga gagatggtgc tttcatgaat tcccccaaca gagccaagct ctccatctag tggacaggga
420 420
agctagcagc aaaccttccc ttcactacaa aacttcattg cttggccaaa aagagagtta agctagcagc aaaccttccc ttcactacaa aacttcattg cttggccaaa aagagagtta
480 480
attcaatgta gacatctatg taggcaatta aaaacctatt gatgtataaa acagtttgca attcaatgta gacatctatg taggcaatta aaaacctatt gatgtataaa acagtttgca
540 540
ttcatggagg gcaactaaat acattctagg actttataaa agatcacttt ttatttatgc ttcatggagg gcaactaaat acattctagg actttataaa agatcacttt ttatttatgc
600 600
acagggtgga acaagatgga ttatcaagtg tcaagtccaa tctatgacat caattattat acagggtgga acaagatgga ttatcaagtg tcaagtccaa tctatgacat caattattat
660 660
acatcggagc cctgccaaaa aatcaatgtg aagcaaatcg cagcccgcct cctgcctccg acatcggagc cctgccaaaa aatcaatgtg aagcaaatcg cagcccgcct cctgcctccg
720 720
ctctactcac tggtgttcat ctttggtttt gtgggcaaca tgctggtcat cctcatcctg ctctactcac tggtgttcat ctttggtttt gtgggcaaca tgctggtcat cctcatcctg
780 780
ataaactgca aaaggctgaa gagcatgact gacatctacc tgctcaacct ggccatctct ataaactgca aaaggctgaa gagcatgact gacatctacc tgctcaacct ggccatctct
840 840
gacctgtttt tccttcttac tgtccccttc tgggctcact atgctgccgc ccagtgggac gacctgtttt tccttcttac tgtccccttc tgggctcact atgctgccgc ccagtgggac
900 900
tttggaaata caatgtgtca actcttgaca gggctctatt ttataggctt cttctctgga tttggaaata caatgtgtca actcttgaca gggctctatt ttataggctt cttctctgga
960 960
atcttcttca tcatcctcct gacaatcgat aggtacctgg ctgtcgtcca tgctgtgttt atcttcttca tcatcctcct gacaatcgat aggtacctgg ctgtcgtcca tgctgtgttt
10201020
gctttaaaag ccaggacggt cacctttggg gtggtgacaa gtgtgatcac ttgggtggtg gctttaaaag ccaggacggt cacctttggg gtggtgacaa gtgtgatcac ttgggtggtg
10801080
gctgtgtttg cgtctctccc aggaatcatc tttaccagat ctcaaaaaga aggtcttcat gctgtgtttg cgtctctccc aggaatcatc tttaccagat ctcaaaaaga aggtcttcat
11401140
tacacctgca gctctcattt tccatacagt cagtatcaat tctggaagaa tttccagaca tacacctgca gctctcattt tccatacagt cagtatcaat tctggaagaa tttccagaca
12001200
ttaaagatag tcatcttggg gctggtcctg ccgctgcttg tcatggtcat ctgctactcg ttaaagatag tcatcttggg gctggtcctg ccgctgcttg tcatggtcat ctgctactcg
12601260
ggaatcctaa aaactctgct tcggtgtcga aatgagaaga agaggcacag ggctgtgagg ggaatcctaa aaactctgct tcggtgtcga aatgagaaga agaggcacag ggctgtgagg
13201320
cttatcttca ccatcatgat tgtttatttt cttatcttca ccatcatgat tgtttatttt
13501350
<210> 154<210> 154
<211> 1223<211> 1223
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 154<400> 154
tgacagagac tcttgggatg acgcactgct gcatcaaccc catcatctat gcctttgtcg tgacagagac tcttgggatg acgcactgct gcatcaaccc catcatctat gcctttgtcg
60 60
gggagaagtt cagaaactac ctcttagtct tcttccaaaa gcacattgcc aaacgcttct gggagaagtt cagaaactac ctcttagtct tcttccaaaa gcacattgcc aaacgcttct
120 120
gcaaatgctg ttctattttc cagcaagagg ctcccgagcg agcaagctca gtttacaccc gcaaatgctg ttctattttc cagcaagagg ctcccgagcg agcaagctca gtttacaccc
180 180
gatccactgg ggagcaggaa atatctgtgg gcttgtgaca cggactcaag tgggctggtg gatccactgg ggagcaggaa atatctgtgg gcttgtgaca cggactcaag tgggctggtg
240 240
acccagtcag agttgtgcac atggcttagt tttcatacac agcctgggct gggggtgggg acccagtcag agttgtgcac atggcttagt tttcatacac agcctgggct gggggtgggg
300 300
tgggagaggt cttttttaaa aggaagttac tgttatagag ggtctaagat tcatccattt tggggagaggt cttttttaaa aggaagttac tgttatagag ggtctaagat tcatccatt
360 360
atttggcatc tgtttaaagt agattagatc ttttaagccc atcaattata gaaagccaaa atttggcatc tgtttaaagt agattagatc ttttaagccc atcaattata gaaagccaaa
420 420
tcaaaatatg ttgatgaaaa atagcaacct ttttatctcc ccttcacatg catcaagtta tcaaaatatg ttgatgaaaa atagcaacct ttttatctcc ccttcacatg catcaagtta
480 480
ttgacaaact ctcccttcac tccgaaagtt ccttatgtat atttaaaaga aagcctcaga ttgacaaact ctcccttcac tccgaaagtt ccttatgtat atttaaaaga aagcctcaga
540 540
gaattgctga ttcttgagtt tagtgatctg aacagaaata ccaaaattat ttcagaaatg gaattgctga ttcttgagtt tagtgatctg aacagaaata ccaaaattat ttcagaaatg
600 600
tacaactttt tacctagtac aaggcaacat ataggttgta aatgtgttta aaacaggtct tacaactttt tacctagtac aaggcaacat ataggttgta aatgtgttta aaacaggtct
660 660
ttgtcttgct atggggagaa aagacatgaa tatgattagt aaagaaatga cacttttcat ttgtcttgct atggggagaa aagacatgaa tatgattagt aaagaaatga cacttttcat
720 720
gtgtgatttc ccctccaagg tatggttaat aagtttcact gacttagaac caggcgagag gtgtgatttc ccctccaagg tatggttaat aagtttcact gacttagaac caggcgagag
780 780
acttgtggcc tgggagagct ggggaagctt cttaaatgag aaggaatttg agttggatca acttgtggcc tgggagagct ggggaagctt cttaaatgag aaggaatttg agttggatca
840 840
tctattgctg gcaaagacag aagcctcact gcaagcactg catgggcaag cttggctgta tctattgctg gcaaagacag aagcctcact gcaagcactg catgggcaag cttggctgta
900 900
gaaggagaca gagctggttg ggaagacatg gggaggaagg acaaggctag atcatgaaga gaaggagaca gagctggttg ggaagacatg gggaggaagg acaaggctag atcatgaaga
960 960
accttgacgg cattgctccg tctaagtcat gagctgagca gggagatcct ggttggtgtt accttgacgg cattgctccg tctaagtcat gagctgagca ggggagatcct ggttggtgtt
10201020
gcagaaggtt tactctgtgg ccaaaggagg gtcaggaagg atgagcattt agggcaagga gcagaaggtt tactctgtgg ccaaaggagg gtcaggaagg atgagcattt agggcaagga
10801080
gaccaccaac agccctcagg tcagggtgag gatggcctct gctaagctca aggcgtgagg gaccaccaac agccctcagg tcagggtgag gatggcctct gctaagctca aggcgtgagg
11401140
atgggaagga gggaggtatt cgtaaggatg ggaaggaggg aggtattcgt gcagcatatg atgggaagga gggaggtatt cgtaaggatg ggaaggaggg aggtattcgt gcagcatatg
12001200
aggatgcaga gtcagcagaa ctg aggatgcaga gtcagcagaa ctg
12231223
<210> 155<210> 155
<211> 215<211> 215
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 155<400> 155
gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa gaacgctgac gtcatcaacc cgctccaagg aatcgcgggc ccagtgtcac taggcgggaa
60 60
cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc cacccagcgc gcgtgcgccc tggcaggaag atggctgtga gggacagggg agtggcgccc
120 120
tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg tgcaatattt gcatgtcgct atgtgttctg ggaaatcacc ataaacgtga aatgtctttg
180 180
gatttgggaa tcttataagt tctgtatgag accac gatttgggaa tcttataagt tctgtatgag accac
215 215
<210> 156<210> 156
<211> 141<211> 141
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 156<400> 156
cctgcaggca gctgcgcgct cgctcgctca cctaggccgc ccgggcaaag cccgggcgtc cctgcaggca gctgcgcgct cgctcgctca cctaggccgc ccgggcaaag cccgggcgtc
60 60
gggcgacctt tggtcgcccg gcctaggtga gcgagcgagc gcgcagagag ggagtggcca gggcgacctt tggtcgcccg gcctaggtga gcgagcgagc gcgcagagag ggagtggcca
120 120
actccatcac taggggttcc t actccatcac taggggttcc t
141 141
<210> 157<210> 157
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 157<400> 157
gcgcgctcgc tcgctcacc gcgcgctcgc tcgctcacc
19 19
<210> 158<210> 158
<211> 22<211> 22
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 158<400> 158
ctaggtgagc gagcgagcgc gc ctaggtgagc gagcgagcgc gc
22 22
<210> 159<210> 159
<211> 75<211> 75
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 159<400> 159
cctgcaggac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctgcaggac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg
60 60
cctcagtcct gcagg cctcagtcct gcagg
75 75
<210> 160<210> 160
<211> 130<211> 130
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 160<400> 160
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagt aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagt
60 60
gcgggcgacc aaaggtcgcc cgacgcccgg gcgcactcag tgagcgagcg agcgcgcagc gcgggcgacc aaaggtcgcc cgacgcccgg gcgcactcag tgagcgagcg agcgcgcagc
120 120
tgcctgcagg tgcctgcagg
130 130
<210> 161<210> 161
<211> 142<211> 142
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 161<400> 161
cctgcaggca gctgcgcgct cgctcgctcc ctaggactga ggccgcccgg gcgtcgggcg cctgcaggca gctgcgcgct cgctcgctcc ctaggactga ggccgcccgg gcgtcgggcg
60 60
acctttggtc gcccggcctc agtcctaggg agcgagcgag cgcgcagaga gggagtggcc acctttggtc gcccggcctc agtcctaggg agcgagcgag cgcgcagaga gggagtggcc
120 120
aactccatca ctaggggttc ct aactccatca ctaggggttc ct
142 142
<210> 162<210> 162
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 162<400> 162
gcgcgctcgc tcgctcactg agtgcgggcg accaaaggtc gcccgacgcc cgggcgcact gcgcgctcgc tcgctcactg agtgcgggcg accaaaggtc gcccgacgcc cgggcgcact
60 60
cagtgagcga gcgagcgcgc cagtgagcga gcgagcgcgc
80 80
<210> 163<210> 163
<211> 21<211> 21
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 163<400> 163
gcgcgctcgc tcgctcactg a gcgcgctcgc tcgctcactg a
21 21
<210> 164<210> 164
<211> 18<211> 18
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 164<400> 164
gtgagcgagc gagcgcgc gtgagcgagc gagcgcgc
18 18
<210> 165<210> 165
<211> 89<211> 89
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 165<400> 165
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgactttgtc gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgactttgtc
60 60
gcccggcctc agtgagcgag cgagcgcgc gcccggcctc agtgagcgag cgagcgcgc
89 89
<210> 166<210> 166
<211> 89<211> 89
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 166<400> 166
gcgcgctcgc tcgctcactg aggccgggcg acaaagtcgc ccgacgcccg ggctttgccc gcgcgctcgc tcgctcactg aggccgggcg acaaagtcgc ccgacgcccg ggctttgccc
60 60
gggcggcctc agtgagcgag cgagcgcgc gggcggcctc agtgagcgag cgagcgcgc
89 89
<210> 167<210> 167
<211> 87<211> 87
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 167<400> 167
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgattttcgc gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgattttcgc
60 60
ccggcctcag tgagcgagcg agcgcgc ccggcctcag tgagcgagcg agcgcgc
87 87
<210> 168<210> 168
<211> 87<211> 87
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 168<400> 168
gcgcgctcgc tcgctcactg aggccgggcg aaaatcgccc gacgcccggg ctttgcccgg gcgcgctcgc tcgctcactg aggccgggcg aaaatcgccc gacgcccggg ctttgcccgg
60 60
gcggcctcag tgagcgagcg agcgcgc gcggcctcag tgagcgagcg agcgcgc
87 87
<210> 169<210> 169
<211> 85<211> 85
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 169<400> 169
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgtttcgccc gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgtttcgccc
60 60
ggcctcagtg agcgagcgag cgcgc ggcctcagtg agcgagcgag cgcgc
85 85
<210> 170<210> 170
<211> 85<211> 85
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 170<400> 170
gcgcgctcgc tcgctcactg aggccgggcg aaacgcccga cgcccgggct ttgcccgggc gcgcgctcgc tcgctcactg aggccgggcg aaacgcccga cgcccgggct ttgcccgggc
60 60
ggcctcagtg agcgagcgag cgcgc ggcctcagtg agcgagcgag cgcgc
85 85
<210> 171<210> 171
<211> 89<211> 89
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 171<400> 171
gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtcgggcg acctttggtc gcgcgctcgc tcgctcactg aggccgcccg ggaaacccgg gcgtcgggcg acctttggtc
60 60
gcccggcctc agtgagcgag cgagcgcgc gcccggcctc agtgagcgag cgagcgcgc
89 89
<210> 172<210> 172
<211> 89<211> 89
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 172<400> 172
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggtttccc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggtttccc
60 60
gggcggcctc agtgagcgag cgagcgcgc gggcggcctc agtgagcgag cgagcgcgc
89 89
<210> 173<210> 173
<211> 87<211> 87
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 173<400> 173
gcgcgctcgc tcgctcactg aggccgcccg gaaaccgggc gtcgggcgac ctttggtcgc gcgcgctcgc tcgctcactg aggccgcccg gaaaccgggc gtcgggcgac ctttggtcgc
60 60
ccggcctcag tgagcgagcg agcgcgc ccggcctcag tgagcgagcg agcgcgc
87 87
<210> 174<210> 174
<211> 87<211> 87
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 174<400> 174
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cggtttccgg gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cggtttccgg
60 60
gcggcctcag tgagcgagcg agcgcgc gcggcctcag tgagcgagcg agcgcgc
87 87
<210> 175<210> 175
<211> 85<211> 85
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 175<400> 175
gcgcgctcgc tcgctcactg aggccgcccg aaacgggcgt cgggcgacct ttggtcgccc gcgcgctcgc tcgctcactg aggccgcccg aaacgggcgt cgggcgacct ttggtcgccc
60 60
ggcctcagtg agcgagcgag cgcgc ggcctcagtg agcgagcgag cgcgc
85 85
<210> 176<210> 176
<211> 85<211> 85
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 176<400> 176
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgtttcgggc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgtttcgggc
60 60
ggcctcagtg agcgagcgag cgcgc ggcctcagtg agcgagcgag cgcgc
85 85
<210> 177<210> 177
<211> 83<211> 83
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 177<400> 177
gcgcgctcgc tcgctcactg aggccgccca aagggcgtcg ggcgaccttt ggtcgcccgg gcgcgctcgc tcgctcactg aggccgccca aagggcgtcg ggcgaccttt ggtcgcccgg
60 60
cctcagtgag cgagcgagcg cgc cctcagtgag cgagcgagcg cgc
83 83
<210> 178<210> 178
<211> 83<211> 83
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 178<400> 178
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc ctttgggcgg gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc ctttgggcgg
60 60
cctcagtgag cgagcgagcg cgc cctcagtgag cgagcgagcg cgc
83 83
<210> 179<210> 179
<211> 81<211> 81
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 179<400> 179
gcgcgctcgc tcgctcactg aggccgccaa aggcgtcggg cgacctttgg tcgcccggcc gcgcgctcgc tcgctcactg aggccgccaa aggcgtcggg cgacctttgg tcgcccggcc
60 60
tcagtgagcg agcgagcgcg c tcagtgagcg agcgagcgcg c
81 81
<210> 180<210> 180
<211> 81<211> 81
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 180<400> 180
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc tttggcggcc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc tttggcggcc
60 60
tcagtgagcg agcgagcgcg c tcagtgagcg agcgagcgcg c
81 81
<210> 181<210> 181
<211> 79<211> 79
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 181<400> 181
gcgcgctcgc tcgctcactg aggccgcaaa gcgtcgggcg acctttggtc gcccggcctc gcgcgctcgc tcgctcactg aggccgcaaa gcgtcgggcg acctttggtc gcccggcctc
60 60
agtgagcgag cgagcgcgc agtgagcgag cgagcgcgc
79 79
<210> 182<210> 182
<211> 79<211> 79
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 182<400> 182
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgct ttgcggcctc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgct ttgcggcctc
60 60
agtgagcgag cgagcgcgc agtgagcgag cgagcgcgc
79 79
<210> 183<210> 183
<211> 81<211> 81
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 183<400> 183
ctgcgcgctc gctcgctcac tgaggccgaa acgtcgggcg acctttggtc gcccggcctc ctgcgcgctc gctcgctcac tgaggccgaa acgtcgggcg acctttggtc gcccggcctc
60 60
agtgagcgag cgagcgcgca g agtgagcgag cgagcgcgca g
81 81
<210> 184<210> 184
<211> 81<211> 81
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 184<400> 184
ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg tttcggcctc ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg tttcggcctc
60 60
agtgagcgag cgagcgcgca g agtgagcgag cgagcgcgca g
81 81
<210> 185<210> 185
<211> 72<211> 72
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 185<400> 185
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacggc ctcagtgagc
60 60
gagcgagcgc gc gagcgagcgc gc
72 72
<210> 186<210> 186
<211> 80<211> 80
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 186<400> 186
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct
60 60
cagtgagcga gcgagcgcgc cagtgagcga gcgagcgcgc
80 80
<210> 187<210> 187
<211> 79<211> 79
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 187<400> 187
gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc gcgcgctcgc tcgctcactg aggcgcccgg gcgtcgggcg acctttggtc gcccggcctc
60 60
agtgagcgag cgagcgcgc agtgagcgag cgagcgcgc
79 79
<210> 188<210> 188
<211> 48<211> 48
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 188<400> 188
ggagtcaaag ttctgtttgc cctgatctgc atcgctgtgg ccgaggcc ggagtcaaag ttctgtttgc cctgatctgc atcgctgtgg ccgaggcc
48 48
<210> 189<210> 189
<211> 99<211> 99
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
олигонуклеотидoligonucleotide
<400> 189<400> 189
attcatacca acttgaagaa aaagttcagc ctcttcatcc tggtctttct cctgttcgca attcatacca acttgaagaa aaagttcagc ctcttcatcc tggtctttct cctgttcgca
60 60
gtcatctgtg tttggaagaa agggagcgac tatgaggcc gtcatctgtg tttggaagaa agggagcgac tatgaggcc
99 99
<210> 190<210> 190
<211> 588<211> 588
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 190<400> 190
gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt
60 60
gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc
120 120
ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag
180 180
gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac
240 240
aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc
300 300
tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc
360 360
acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca
420 420
aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt
480 480
gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg
540 540
gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaacc gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaacc
588 588
<210> 191<210> 191
<211> 399<211> 399
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 191<400> 191
cgggggaggc tgctggtgaa tattaaccaa ggtcacccca gttatcggag gagcaaacag cgggggaggc tgctggtgaa tattaaccaa ggtcacccca gttatcggag gagcaaacag
60 60
gggctaagtc cacacgcgtg gtaccgtctg tctgcacatt tcgtagagcg agtgttccga gggctaagtc cacacgcgtg gtaccgtctg tctgcacatt tcgtagagcg agtgttccga
120 120
tactctaatc tccctaggca aggttcatat ttgtgtaggt tacttattct ccttttgttg tactctaatc tccctaggca aggttcatat ttgtgtaggt tacttattct ccttttgttg
180 180
actaagtcaa taatcagaat cagcaggttt ggagtcagct tggcagggat cagcagcctg actaagtcaa taatcagaat cagcaggttt ggagtcagct tggcagggat cagcagcctg
240 240
ggttggaagg agggggtata aaagcccctt caccaggaga agccgtcaca cagatccaca ggttggaagg agggggtata aaagcccctt caccaggaga agccgtcaca cagatccaca
300 300
agctcctgaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt agctcctgaa gaggtaaggg tttaagggat ggttggttgg tggggtatta atgtttaatt
360 360
acctggagca cctgcctgaa atcacttttt ttcaggttg acctggagca cctgcctgaa atcacttttt ttcaggttg
399 399
<210> 192<210> 192
<211> 14359<211> 14359
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 192<400> 192
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60 60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120 120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt
180 180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240 240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300 300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360 360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420 420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480 480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540 540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600 600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660 660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720 720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780 780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840 840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900 900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960 960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
10201020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
10801080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
11401140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
12001200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
12601260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
13201320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
13801380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
14401440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
15001500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
15601560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
16201620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
16801680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
17401740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
18001800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
18601860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
19201920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
19801980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
20402040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
21002100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
21602160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
22202220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
22802280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
23402340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
24002400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
24602460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
25202520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
25802580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
26402640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
27002700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
27602760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
28202820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
28802880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
29402940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
30003000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
30603060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
31203120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
31803180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
32403240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
33003300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
33603360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
34203420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
34803480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
35403540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
36003600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
36603660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
37203720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
37803780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
38403840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
39003900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
39603960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
40204020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
40804080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
41404140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
42004200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
42604260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
43204320
tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct
43804380
gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag
44404440
tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag
45004500
caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga
45604560
gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag
46204620
aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca
46804680
cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc
47404740
atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca
48004800
tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca
48604860
ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca
49204920
agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag
49804980
acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg
50405040
ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc
51005100
aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag
51605160
tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc
52205220
ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta
52805280
agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact
53405340
cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg
54005400
ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg
54605460
aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg
55205520
gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt
55805580
gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga
56405640
tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa
57005700
gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctgggagagc gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctggggagagc
57605760
tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg
58205820
tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc
58805880
ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg
59405940
tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt
60006000
cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag
60606060
aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa
61206120
acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc
61806180
tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc
62406240
tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg
63006300
agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct
63606360
ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg
64206420
gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac
64806480
ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg
65406540
ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg
66006600
gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg
66606660
tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg
67206720
aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata
67806780
acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc
68406840
actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg
69006900
acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata
69606960
agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc
70207020
acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca
70807080
tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc
71407140
ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc
72007200
tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga
72607260
gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg
73207320
ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca
73807380
accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt
74407440
cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg
75007500
aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca
75607560
gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg
76207620
cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt
76807680
acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa
77407740
accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag
78007800
ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg
78607860
aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcccaga agcttcagcc aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcccaga agcttcagcc
79207920
agaatagcag acacccctcc accagacaga agcagttcaa cgccacaaca atccccgaga agaatagcag acacccctcc acgacaga agcagttcaa cgccacaaca atccccgaga
79807980
acgacatcga gaaaaccgat ccttggtttg cccacagaac ccctatgcct aagatccaga acgacatcga gaaaaccgat ccttggtttg cccacagaac ccctatgcct aagatccaga
80408040
acgtgtcctc cagcgatctg ctgatgctcc tgagacagag ccctacacct cacggactga acgtgtcctc cagcgatctg ctgatgctcc tgagacagag ccctacacct cacggactga
81008100
gcctgtccga tctgcaagag gccaaatacg aaaccttcag cgacgaccct tctcctggcg gcctgtccga tctgcaagag gccaaatacg aaaccttcag cgacgaccct tctcctggcg
81608160
ccatcgacag caacaatagc ctgagcgaga tgacccactt cagaccacag ctgcaccaca ccatcgacag caacaatagc ctgagcgaga tgacccactt cagaccacag ctgcaccaca
82208220
gcggcgacat ggtgtttaca cctgagagcg gcctccagct gagactgaat gagaagctgg gcggcgacat ggtgtttaca cctgagagcg gcctccagct gagactgaat gagaagctgg
82808280
gaaccaccgc cgccaccgag ctgaagaaac tggacttcaa ggtgtcctct accagcaaca gaaccaccgc cgccaccgag ctgaagaaac tggacttcaa ggtgtcctct accagcaaca
83408340
acctgatcag cacaatcccc tccgacaacc tggctgccgg caccgacaac acatcttctc acctgatcag cacaatcccc tccgacaacc tggctgccgg caccgacaac acatcttctc
84008400
tgggcccacc tagcatgccc gtgcactacg atagccagct ggataccaca ctgttcggca tgggcccacc tagcatgccc gtgcactacg atagccagct ggataccaca ctgttcggca
84608460
agaagtctag ccctctgaca gagtctggcg gccctctgtc tctgagcgag gaaaacaacg agaagtctag ccctctgaca gagtctggcg gccctctgtc tctgagcgag gaaaacaacg
85208520
acagcaagct gctggaatcc ggcctgatga acagccaaga gtcctcctgg ggcaagaatg acagcaagct gctggaatcc ggcctgatga acagccaaga gtcctcctgg ggcaagaatg
85808580
tgtccagcac cgagtccggc agactgttca agggaaagag agcccacgga cctgctctgc tgtccagcac cgagtccggc agactgttca agggaaagag agcccacgga cctgctctgc
86408640
tgaccaagga taacgccctg ttcaaagtgt ccatcagcct gctcaagacc aacaagacct tgaccaagga taacgccctg ttcaaagtgt ccatcagcct gctcaagacc aacaagacct
87008700
ccaacaactc cgccaccaac agaaagaccc acatcgacgg ccctagcctg ctgatcgaga ccaacaactc cgccaccaac agaaagaccc acatcgacgg ccctagcctg ctgatcgaga
87608760
atagccctag cgtctggcag aatatcctgg aaagcgacac cgagttcaag aaagtgaccc atagccctag cgtctggcag aatatcctgg aaagcgacac cgagttcaag aaagtgaccc
88208820
ctctgatcca cgaccggatg ctcatggaca agaacgccac cgctctgcgg ctgaaccaca ctctgatcca cgaccggatg ctcatggaca agaacgccac cgctctgcgg ctgaaccaca
88808880
tgagcaacaa gacaaccagc agcaagaata tggaaatggt gcagcagaag aaagagggcc tgagcaacaa gacaaccagc agcaagaata tggaaatggt gcagcagaag aaagaggggcc
89408940
ccattcctcc agacgctcag aaccccgata tgagcttctt caagatgctc tttctgcccg ccattcctcc agacgctcag aaccccgata tgagcttctt caagatgctc tttctgcccg
90009000
agagcgcccg gtggattcag agaacacacg gcaagaactc cctgaactcc ggccagggac agagcgcccg gtggattcag agaacacacg gcaagaactc cctgaactcc ggccagggac
90609060
cttctccaaa gcagctggtt tccctgggac ctgagaagtc cgtggaagga cagaacttcc cttctccaaa gcagctggtt tccctgggac ctgagaagtc cgtggaagga cagaacttcc
91209120
tgagcgaaaa gaacaaagtg gtcgtcggca agggcgagtt caccaaggat gtgggcctga tgagcgaaaa gaacaaagtg gtcgtcggca agggcgagtt caccaaggat gtgggcctga
91809180
aagagatggt ctttcccagc agccggaacc tgttcctgac caacctggac aacctgcacg aagagatggt ctttcccagc agccggaacc tgttcctgac caacctggac aacctgcacg
92409240
agaacaacac ccacaatcaa gagaagaaga tccaagagga aatcgaaaag aaagagacac agaacaacac ccacaatcaa gagaagaaga tccaagagga aatcgaaaag aaagagacac
93009300
tcatccaaga gaacgtggtg ctgcctcaga tccacacagt gaccggcacc aagaacttta tcatccaaga gaacgtggtg ctgcctcaga tccacacagt gaccggcacc aagaacttta
93609360
tgaagaatct gttcctgctg agtacccggc agaacgtgga aggcagctac gatggcgctt tgaagaatct gttcctgctg agtacccggc agaacgtgga aggcagctac gatggcgctt
94209420
atgcccctgt gctgcaggac ttcagatccc tgaacgactc caccaatcgg acaaagaagc atgcccctgt gctgcaggac ttcagatccc tgaacgactc caccaatcgg acaaagaagc
94809480
acacagccca cttctccaag aagggcgaag aagagaacct ggaaggactg ggcaatcaga acacagccca cttctccaag aagggcgaag aagagaacct ggaaggactg ggcaatcaga
95409540
ccaagcagat cgtcgagaag tacgcctgca ccaccagaat cagccccaac acaagccagc ccaagcagat cgtcgagaag tacgcctgca ccaccagaat cagccccaac acaagccagc
96009600
agaacttcgt gacccagcgg agcaaaagag ccctgaagca gtttcggctg cccctggaag agaacttcgt gacccagcgg agcaaaagag ccctgaagca gtttcggctg cccctggaag
96609660
aaaccgagct ggaaaagcgg atcatcgtgg acgacaccag cacacagtgg tccaagaaca aaaccgagct ggaaaagcgg atcatcgtgg acgacaccag cacacagtgg tccaagaaca
97209720
tgaagcactt gacccctagc acactgaccc agatcgacta caacgagaaa gagaagggcg tgaagcactt gacccctagc acactgaccc agatcgacta caacgagaaa gagaagggcg
97809780
ctatcacaca gagcccactg agcgactgtc tgaccagaag ccacagcatc cctcaggcca ctatcacaca gagcccactg agcgactgtc tgaccagaag ccacagcatc cctcaggcca
98409840
acagatcccc tctgccaatc gccaaagtgt ctagcttccc cagcatcaga cccatctacc acagatcccc tctgccaatc gccaaagtgt ctagcttccc cagcatcaga cccatctacc
99009900
tgaccagagt gctgttccag gacaacagca gccatctgcc agccgccagc taccggaaga tgaccagagt gctgttccag gacaacagca gccatctgcc agccgccagc taccggaaga
99609960
aagattctgg cgtgcaagag agcagccact ttctgcaggg cgctaagaag aacaatctga aagattctgg cgtgcaagag agcagccact ttctgcaggg cgctaagaag aacaatctga
1002010020
gcctggctat tctgaccctg gaaatgaccg gcgatcagag agaagtcggc tctctgggca gcctggctat tctgaccctg gaaatgaccg gcgatcagag agaagtcggc tctctgggca
1008010080
ccagcgccac aaatagcgtg acctacaaaa aggtggaaaa caccgtgctg cctaagcctg ccagcgccac aaatagcgtg acctacaaaa aggtggaaaa caccgtgctg cctaagcctg
1014010140
acctgccaaa gacaagcggc aaggtggaac tgctgccaaa ggtgcacatc taccagaagg acctgccaaa gacaagcggc aaggtggaac tgctgccaaa ggtgcacatc taccagaagg
1020010200
acctgtttcc taccgagaca agcaacggct ctcccggcca tctggatctg gtggaaggat acctgtttcc taccgagaca agcaacggct ctcccggcca tctggatctg gtggaaggat
1026010260
ctctgctgca gggaaccgag ggcgccatca agtggaacga ggccaataga cctggcaagg ctctgctgca gggaaccgag ggcgccatca agtggaacga ggccaataga cctggcaagg
1032010320
tgcccttcct gagagtggcc acagagtcca gcgccaagac accctctaaa ctgctggacc tgcccttcct gagagtggcc acagagtcca gcgccaagac accctctaaa ctgctggacc
1038010380
ctctggcctg ggacaaccac tatggcactc agatccccaa agaggaatgg aagtcccaag ctctggcctg ggacaaccac tatggcactc agatccccaa agaggaatgg aagtcccaag
1044010440
agaagtcccc tgaaaagacc gccttcaaga agaaggacac cattctgtcc ctgaatgcct agaagtcccc tgaaaagacc gccttcaaga agaaggacac cattctgtcc ctgaatgcct
1050010500
gcgagagcaa ccacgccatt gccgccatca atgagggcca gaacaagccc gagatcgaag gcgagagcaa ccacgccatt gccgccatca atgagggcca gaacaagccc gagatcgaag
1056010560
tgacctgggc caagcaggga agaaccgaga gactgtgtag ccagaatcct cctgtgctga tgacctgggc caagcaggga agaaccgaga gactgtgtag ccagaatcct cctgtgctga
1062010620
agcggcacca gagagaaatc acccggacca cactgcagag cgaccaagaa gagatcgatt agcggcacca gagagaaatc acccggacca cactgcagag cgaccaagaa gagatcgatt
1068010680
acgacgatac catcagcgtc gagatgaaga aagaagattt cgacatctac gacgaggacg acgacgatac catcagcgtc gagatgaaga aagaagattt cgacatctac gacgaggacg
1074010740
agaatcagag ccctcggagc ttccagaaga aaaccaggca ctactttatt gccgccgtcg agaatcagag ccctcggagc ttccagaaga aaaccaggca ctactttatt gccgccgtcg
1080010800
agcggctgtg ggactacgga atgtctagct ctcctcacgt gctgcggaat agagcccagt agcggctgtg ggactacgga atgtctagct ctcctcacgt gctgcggaat agagcccagt
1086010860
ctggtagcgt gccccagttc aaaaaggtcg tgttccaaga gttcaccgac ggcagcttca ctggtagcgt gccccagttc aaaaaggtcg tgttccaaga gttcaccgac ggcagcttca
1092010920
cccagccact gtatagaggc gagctgaacg agcatctggg cctgctgggc ccttatatca cccagccact gtatagaggc gagctgaacg agcatctggg cctgctgggc ccttatatca
1098010980
gagccgaagt ggaagataac atcatggtca ccttccggaa tcaggctagc cggccttaca gagccgaagt ggaagataac atcatggtca ccttccggaa tcaggctagc cggccttaca
1104011040
gcttctacag ctccctgatc tcctacgaag aggaccagag acagggcgca gagccccgga gcttctacag ctccctgatc tcctacgaag aggaccagag acagggcgca gagccccgga
1110011100
agaatttcgt gaagcccaac gagactaaga cctacttttg gaaggtgcag caccatatgg agaatttcgt gaagcccaac gagactaaga cctacttttg gaaggtgcag caccatatgg
1116011160
cccctacaaa ggacgagttc gactgcaaag cctgggccta cttctccgat gtggacctcg cccctacaaa ggacgagttc gactgcaaag cctgggccta cttctccgat gtggacctcg
1122011220
aaaaggacgt gcacagcgga ctcatcggcc cactgcttgt gtgccacacc aacacactga aaaaggacgt gcacagcgga ctcatcggcc cactgcttgt gtgccacacc aacacactga
1128011280
accccgctca cggcagacaa gtgacagtgc aagagttcgc cctgtttttc accatcttcg accccgctca cggcagacaa gtgacagtgc aagagttcgc cctgtttttc accatcttcg
1134011340
acgaaacgaa gtcctggtac ttcaccgaaa acatggaaag aaactgcagg gccccttgca acgaaacgaa gtcctggtac ttcaccgaaa acatggaaag aaactgcagg gccccttgca
1140011400
acattcagat ggaagatccc accttcaaag agaactaccg gttccacgcc atcaacggct acattcagat ggaagatccc accttcaaag agaactaccg gttccacgcc atcaacggct
1146011460
acatcatgga cacactgccc ggcctggtta tggcccagga tcagagaatc cggtggtatc acatcatgga cacactgccc ggcctggtta tggcccagga tcagagaatc cggtggtatc
1152011520
tgctgtccat gggctccaac gagaatatcc actccatcca cttcagcggc cacgtgttca tgctgtccat gggctccaac gagaatatcc actccatcca cttcagcggc cacgtgttca
1158011580
ccgtgcggaa aaaagaagag tacaaaatgg ccctgtacaa tctgtaccct ggggtgttcg ccgtgcggaa aaaagaagag tacaaaatgg ccctgtacaa tctgtaccct ggggtgttcg
1164011640
aaaccgttga gatgctgcct agcaaggccg gaatttggag agtggaatgt ctgattggag aaaccgttga gatgctgcct agcaaggccg gaatttggag agtggaatgt ctgattggag
1170011700
agcacctcca cgccgggatg agcaccctgt ttctggtgta ctccaacaag tgtcagaccc agcacctcca cgccgggatg agcaccctgt ttctggtgta ctccaacaag tgtcagaccc
1176011760
ctctcggcat ggcctctggc cacattagag acttccagat caccgccagc ggacagtatg ctctcggcat ggcctctggc cacattagag acttccagat caccgccagc ggacagtatg
1182011820
gacagtgggc ccctaaactg gccagactgc actactccgg cagcatcaat gcctggtcca gacagtgggc ccctaaactg gccagactgc actactccgg cagcatcaat gcctggtcca
1188011880
ccaaagagcc tttcagctgg atcaaagtgg acctgctggc tcccatgatc atccacggaa ccaaagagcc tttcagctgg atcaaagtgg acctgctggc tcccatgatc atccacggaa
1194011940
tcaagaccca gggcgccaga caaaagttca gcagcctgta catcagccag ttcatcatca tcaagaccca gggcgccaga caaaagttca gcagcctgta catcagccag ttcatcatca
1200012000
tgtacagcct ggacggaaag aagtggcaga cctaccgggg caatagcacc ggcacactga tgtacagcct ggacggaaag aagtggcaga cctaccgggg caatagcacc ggcacactga
1206012060
tggtgttctt cggcaacgtg gactccagcg gcattaagca caacatcttc aaccctccaa tggtgttctt cggcaacgtg gactccagcg gcattaagca caacatcttc aaccctccaa
1212012120
tcattgcccg gtacatccgg ctgcacccca cacactacag catcaggtct accctgagaa tcattgcccg gtacatccgg ctgcacccca cacactacag catcaggtct accctgagaa
1218012180
tggaactgat gggctgcgac ctgaacagct gctctatgcc cctcggaatg gaaagcaagg tggaactgat gggctgcgac ctgaacagct gctctatgcc cctcggaatg gaaagcaagg
1224012240
ccatcagcga cgcccagatc acagcctcta gctacttcac caacatgttc gccacttgga ccatcagcga cgcccagatc acagcctcta gctacttcac caacatgttc gccacttgga
1230012300
gcccctctaa ggcccggctt catctgcaag gcagaagcaa cgcttggagg ccccaagtga gcccctctaa ggcccggctt catctgcaag gcagaagcaa cgcttggagg ccccaagtga
1236012360
acaaccccaa agaatggctc caggtggact ttcagaaaac catgaaagtg acaggcgtga acaaccccaa agaatggctc caggtggact ttcagaaaac catgaaagtg acaggcgtga
1242012420
ccacacaggg cgtcaagtcc ctgctgacct ctatgtacgt gaaagagttt ctgatcagct ccacacaggg cgtcaagtcc ctgctgacct ctatgtacgt gaaagagttt ctgatcagct
1248012480
ccagccagga cggccaccag tggaccctgt tcttccagaa cggcaaagtg aaagtgttcc ccagccagga cggccaccag tggaccctgt tcttccagaa cggcaaagtg aaagtgttcc
1254012540
agggaaatca ggacagcttc acacccgtgg tcaatagtct ggacccacca ctgctgaccc agggaaatca ggacagcttc acacccgtgg tcaatagtct ggacccacca ctgctgaccc
1260012600
gctacctgcg aattcaccct cagtcttggg tgcaccagat tgccctgcgg atggaagtgc gctacctgcg aattcaccct cagtcttggg tgcaccagat tgccctgcgg atggaagtgc
1266012660
tgggctgtga agctcaggac ctctactagt taattaagag catcttaccg ccatttattc tgggctgtga agctcaggac ctctactagt taattaagag catcttaccg ccatttattc
1272012720
ccatatttgt tctgtttttc ttgatttggg tatacattta aatgttaata aaacaaaatg ccatatttgt tctgtttttc ttgatttggg tatacattta aatgttaata aaacaaaatg
1278012780
gtggggcaat catttacatt tttagggata tgtaattact agttcaggtg tattgccaca gtggggcaat catttacatt tttagggata tgtaattact agttcaggtg tattgccaca
1284012840
agacaaacat gttaagaaac tttcccgtta tttacgctct gttcctgtta atcaacctct agacaaacat gttaagaaac tttcccgtta tttacgctct gttcctgtta atcaacctct
1290012900
ggattacaaa atttgtgaaa gattgactga tattcttaac tatgttgctc cttttacgct ggattacaaa atttgtgaaa gattgactga tattcttaac tatgttgctc cttttacgct
1296012960
gtgtggatat gctgctttat agcctctgta tctagctatt gcttcccgta cggctttcgt gtgtggatat gctgctttat agcctctgta tctagctatt gcttcccgta cggctttcgt
1302013020
tttctcctcc ttgtataaat cctggttgct gtctctttta gaggagttgt ggcccgttgt tttctcctcc ttgtataaat cctggttgct gtctctttta gaggagttgt ggcccgttgt
1308013080
ccgtcaacgt ggcgtggtgt gctctgtgtt tgctgacgca acccccactg gctggggcat ccgtcaacgt ggcgtggtgt gctctgtgtt tgctgacgca acccccactg gctggggcat
1314013140
tgccaccacc tgtcaactcc tttctgggac tttcgctttc cccctcccga tcgccacggc tgccaccacc tgtcaactcc tttctgggac tttcgctttc cccctcccga tcgccacggc
1320013200
agaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctaggttgc tgggcactga agaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctaggttgc tgggcactga
1326013260
taattccgtg gtgttgtctg tgccttctag ttgccagcca tctgttgttt gcccctcccc taattccgtg gtgttgtctg tgccttctag ttgccagcca tctgttgttt gcccctcccc
1332013320
cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga
1338013380
aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga
1344013440
cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat cagcaagggg gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat
1350013500
ggctctagag catggctacg tagataagta gcatggcggg ttaatcatta actacacctg ggctctagag catggctacg tagataagta gcatggcggg ttaatcatta actacacctg
1356013560
caggaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact caggaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact
1362013620
gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg gaggccgggc gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg
1368013680
cagctgcctg caggggcgcg cctcgaggca tgcggtacca agcttgtcga gaagtactag cagctgcctg caggggcgcg cctcgaggca tgcggtacca agcttgtcga gaagtactag
1374013740
aggatcataa tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca aggatcataa tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca
1380013800
cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt cacctccccc tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt
1386013860
gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt
1392013920
ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg
1398013980
atctgatcac tgatatcgcc taggagatcc gaaccagata agtgaaatct agttccaaac atctgatcac tgatatcgcc taggagatcc gaaccagata agtgaaatct agttccaaac
1404014040
tattttgtca tttttaattt tcgtattagc ttacgacgct acacccagtt cccatctatt tattttgtca tttttaattt tcgtattagc ttacgacgct acacccagtt cccatctatt
1410014100
ttgtcactct tccctaaata atccttaaaa actccatttc cacccctccc agttcccaac ttgtcactct tccctaaata atccttaaaa actccatttc cacccctccc agttcccaac
1416014160
tattttgtcc gcccacagcg gggcattttt cttcctgtta tgtttttaat caaacatcct tattttgtcc gccccacagcg gggcattttt cttcctgtta tgtttttaat caaacatcct
1422014220
gccaactcca tgtgacaaac cgtcatcttc ggctactttt tctctgtcac agaatgaaaa gccaactcca tgtgacaaac cgtcatcttc ggctactttt tctctgtcac agaatgaaaa
1428014280
tttttctgtc atctcttcgt tattaatgtt tgtaattgac tgaatatcaa cgcttatttg tttttctgtc atctcttcgt tattaatgtt tgtaattgac tgaatatcaa cgcttatttg
1434014340
cagcctgaat ggcgaatgg cagcctgaat ggcgaatgg
1435914359
<210> 193<210> 193
<211> 11677<211> 11677
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 193<400> 193
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60 60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120 120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt
180 180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240 240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300 300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360 360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420 420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480 480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540 540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600 600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660 660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720 720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780 780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840 840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900 900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960 960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
10201020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
10801080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
11401140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
12001200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
12601260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
13201320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
13801380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
14401440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
15001500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
15601560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
16201620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
16801680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
17401740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
18001800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
18601860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
19201920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
19801980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
20402040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
21002100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
21602160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
22202220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
22802280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
23402340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
24002400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
24602460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
25202520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
25802580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
26402640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
27002700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
27602760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
28202820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
28802880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
29402940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
30003000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
30603060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
31203120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
31803180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
32403240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
33003300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
33603360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
34203420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
34803480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
35403540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
36003600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
36603660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
37203720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
37803780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
38403840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
39003900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
39603960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
40204020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
40804080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
41404140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
42004200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
42604260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
43204320
tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct tagccatgct ctagagcggc cgcaggctca gaggcacaca ggagtttctg ggctcaccct
43804380
gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag gcccccttcc aacccctcag ttcccatcct ccagcagctg tttgtgtgct gcctctgaag
44404440
tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag tccacactga acaaacttca gcctactcat gtccctaaaa tgggcaaaca ttgcaagcag
45004500
caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga caaacagcaa acacacagcc ctccctgcct gctgaccttg gagctggggc agaggtcaga
45604560
gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag gacctctctg ggcccatgcc acctccaaca tccactcgac cccttggaat ttcggtggag
46204620
aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca aggagcagag gttgtcctgg cgtggtttag gtagtgtgag agggtccggg ttcaaaacca
46804680
cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc cttgctgggt ggggagtcgt cagtaagtgg ctatgccccg accccgaagc ctgtttcccc
47404740
atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca atctgtacaa tggaaatgat aaagacgccc atctgatagg gtttttgtgg caaataaaca
48004800
tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca tttggttttt ttgttttgtt ttgttttgtt ttttgagatg gaggtttgct ctgtcgccca
48604860
ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca ggctggagtg cagtgacaca atctcatctc accacaacct tcccctgcct cagcctccca
49204920
agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag agtagctggg attacaagca tgtgccacca cacctggcta attttctatt tttagtagag
49804980
acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg acgggtttct ccatgttggt cagcctcagc ctcccaagta actgggatta caggcctgtg
50405040
ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc ccaccacacc cggctaattt tttctatttt tgacagggac ggggtttcac catgttggtc
51005100
aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag aggctggtct agaggtaccg gatcttgcta ccagtggaac agccactaag gattctgcag
51605160
tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc tgagagcaga gggccagcta agtggtactc tcccagagac tgtctgactc acgccacccc
52205220
ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta ctccaccttg gacacaggac gctgtggttt ctgagccagg tacaatgact cctttcggta
52805280
agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact agtgcagtgg aagctgtaca ctgcccaggc aaagcgtccg ggcagcgtag gcgggcgact
53405340
cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg cagatcccag ccagtggact tagcccctgt ttgctcctcc gataactggg gtgaccttgg
54005400
ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg ttaatattca ccagcagcct cccccgttgc ccctctggat ccactgctta aatacggacg
54605460
aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg aggacagggc cctgtctcct cagcttcagg caccaccact gacctgggac agtgaatccg
55205520
gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt gactctaagg taaatataaa atttttaagt gtataatgtg ttaaactact gattctaatt
55805580
gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga gtttctctct tttagattcc aacctttgga actgagttta aaccgcagcc accatgcaga
56405640
tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa tcgagctgtc tacctgcttc ttcctgtgcc tgctgcggtt ctgcttcagc gccaccagaa
57005700
gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctgggagagc gatattacct gggcgccgtg gaactgagct gggactacat gcagtctgac ctggggagagc
57605760
tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg tgcccgtgga cgctagattt cctccaagag tgcccaagag cttccccttc aacacctccg
58205820
tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat atcgccaagc
58805880
ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg ctcggcctcc ttggatggga ctgctgggac ctacaattca ggccgaggtg tacgacaccg
59405940
tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt tggtcatcac cctgaagaac atggccagcc atcctgtgtc tctgcacgcc gtgggagtgt
60006000
cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag cttattggaa ggcttctgag ggcgccgagt acgacgatca gacaagccag agagagaaag
60606060
aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa aggacgacaa ggttttccct ggcggcagcc acacctatgt ctggcaggtc ctgaaagaaa
61206120
acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc acggccctat ggcctccgat cctctgtgcc tgacatacag ctacctgagc cacgtggacc
61806180
tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc tggtcaagga cctgaattct ggcctgatcg gagccctgct cgtgtgtaga gaaggcagcc
62406240
tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg tggccaaaga gaaaacccag acactgcaca agttcatcct gctgttcgcc gtgttcgacg
63006300
agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct agggcaagag ctggcacagc gagacaaaga acagcctgat gcaggacagg gatgccgcct
63606360
ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg ctgctagagc ttggcctaag atgcacaccg tgaacggcta cgtgaacaga agcctgcctg
64206420
gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac gactgatcgg ctgccacaga aagtccgtgt actggcacgt gatcggcatg ggcacaacac
64806480
ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg ctgaggtgca cagcatcttt ctggaaggcc acaccttcct cgtgcggaac cacagacagg
65406540
ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg ccagcctgga aatcagccct atcaccttcc tgaccgctca gaccctgctg atggatctgg
66006600
gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg gccagtttct gctgttctgc cacatcagct cccaccagca cgatggcatg gaagcctacg
66606660
tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg tgaaggtgga cagctgcccc gaagaacccc agctgcggat gaagaacaac gaggaagccg
67206720
aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata aggactacga cgacgacctg accgactctg agatggacgt cgtcagattc gacgacgata
67806780
acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc acagccccag cttcatccag atcagaagcg tggccaagaa gcaccccaag acctgggtgc
68406840
actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg actatatcgc cgccgaggaa gaggactggg attacgctcc tctggtgctg gcccctgacg
69006900
acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata acagaagcta caagagccag tacctgaaca acggccctca gcggatcggc cggaagtata
69606960
agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag gccatccagc
70207020
acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca acgagagcgg aattctgggc cctctgctgt atggcgaagt gggcgataca ctgctgatca
70807080
tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc tcttcaagaa ccaggccagc agaccctaca acatctaccc tcacggcatc accgatgtgc
71407140
ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc ggcccctgta ttctagaagg ctgcccaagg gcgtgaagca cctgaaggac ttccctatcc
72007200
tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga tgcctggcga gattttcaag tacaagtgga ccgtgaccgt ggaagatggc cccaccaaga
72607260
gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg gcgaccctag atgtctgaca cggtactaca gcagcttcgt gaacatggaa cgcgacctgg
73207320
ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca ccagcggcct gattggacct ctgctgatct gctacaaaga aagcgtggac cagcggggca
73807380
accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt accagatcat gagcgacaag cggaacgtga tcctgtttag cgtgttcgat gagaaccggt
74407440
cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg cctggtatct gaccgagaac atccagcggt ttctgcccaa tcctgccggg gtgcaactgg
75007500
aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca aagatcctga gttccaggca agcaacatca tgcactccat caatggctat gtgttcgaca
75607560
gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg gcctgcagct gagcgtgtgc ctgcacgaag tggcctactg gtacatcctg agcattggcg
76207620
cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt cccagaccga cttcctgtcc gtgttcttta gcggctacac cttcaagcac aagatggtgt
76807680
acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa acgaggatac cctgacactg ttcccattca gcggcgagac agtgttcatg agcatggaaa
77407740
accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag accccggcct gtggattctg ggctgtcaca acagcgactt ccggaacaga ggcatgacag
78007800
ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg ccctgctgaa ggtgtccagc tgcgacaaga acaccggcga ctactacgag gacagctatg
78607860
aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcctcgg agcttcagcc aggacatcag cgcctacctg ctgagcaaga acaatgccat cgagcctcgg agcttcagcc
79207920
agaatcctcc tgtgctgaag cggcaccagc gcgagatcac cagaacaacc ctgcagagcg agaatcctcc tgtgctgaag cggcaccagc gcgagatcac cagaacaacc ctgcagagcg
79807980
accaagagga aatcgattac gacgacacca tcagcgtcga gatgaagaaa gaagatttcg accaagagga aatcgattac gacgacacca tcagcgtcga gatgaagaaa gaagatttcg
80408040
acatctacga cgaggacgag aatcagagcc ccagaagctt tcagaaaaag acccggcact acatctacga cgaggacgag aatcagagcc ccagaagctt tcagaaaaag acccggcact
81008100
acttcattgc cgccgtcgag agactgtggg actacggcat gtctagcagc cctcacgtgc acttcattgc cgccgtcgag agactgtggg actacggcat gtctagcagc cctcacgtgc
81608160
tgagaaatag agcccagagc ggcagcgtgc cccagttcaa gaaagtggtg ttccaagagt tgagaaatag agcccagagc ggcagcgtgc cccagttcaa gaaagtggtg ttccaagagt
82208220
tcaccgacgg cagcttcacc cagccactgt atagaggcga gctgaacgag catctgggcc tcaccgacgg cagcttcacc cagccactgt atagaggcga gctgaacgag catctgggcc
82808280
tgctgggccc ttatatcaga gccgaagtgg aagataacat catggtcacc ttccggaatc tgctgggccc ttatatcaga gccgaagtgg aagataacat catggtcacc ttccggaatc
83408340
aggctagccg gccttacagc ttctacagct ccctgatcag ctacgaagag gaccagagac aggctagccg gccttacagc ttctacagct ccctgatcag ctacgaagag gaccagagac
84008400
agggcgctga gcccagaaag aacttcgtga agcccaacga gactaagacc tacttttgga agggcgctga gcccagaaag aacttcgtga agcccaacga gactaagacc tacttttgga
84608460
aggtgcagca ccacatggcc cctacaaagg acgagttcga ctgcaaagcc tgggcctact aggtgcagca ccacatggcc cctacaaagg acgagttcga ctgcaaagcc tgggcctact
85208520
tctccgatgt ggatctggaa aaggacgtgc acagcgggct catcggacca ctgcttgtgt tctccgatgt ggatctggaa aaggacgtgc acagcgggct catcggacca ctgcttgtgt
85808580
gccacaccaa cacactgaac cccgctcacg gcagacaagt gacagtgcaa gagttcgccc gccacaccaa cacactgaac cccgctcacg gcagacaagt gacagtgcaa gagttcgccc
86408640
tgttcttcac catcttcgac gaaacaaaga gctggtactt caccgagaat atggaacgga tgttcttcac catcttcgac gaaacaaaga gctggtactt caccgagaat atggaacgga
87008700
actgcagagc cccttgcaac atccagatgg aagatcccac cttcaaagag aactaccggt actgcagagc cccttgcaac atccagatgg aagatcccac cttcaaagag aactaccggt
87608760
tccacgccat caacggctac atcatggaca cactgcccgg cctggttatg gcccaggatc tccacgccat caacggctac atcatggaca cactgcccgg cctggttatg gcccaggatc
88208820
agagaatccg gtggtatctg ctgtccatgg gctccaacga gaatatccac agcatccact agagaatccg gtggtatctg ctgtccatgg gctccaacga gaatatccac agcatccact
88808880
tcagcggcca cgtgttcacc gtgcggaaaa aagaagagta caaaatggcc ctgtacaatc tcagcggcca cgtgttcacc gtgcggaaaa aagaagagta caaaatggcc ctgtacaatc
89408940
tgtaccctgg ggtgttcgaa accgtggaaa tgctgccttc caaggccggc atttggagag tgtaccctgg ggtgttcgaa accgtggaaa tgctgccttc caaggccggc atttggagag
90009000
tggaatgtct gattggagag cacctccacg ccggaatgag caccctgttt ctggtgtaca tggaatgtct gattggagag cacctccacg ccggaatgag caccctgttt ctggtgtaca
90609060
gcaacaagtg tcagacccct ctcggcatgg cctctggaca catcagagac ttccagatca gcaacaagtg tcagacccct ctcggcatgg cctctggaca catcagagac ttccagatca
91209120
ccgcctctgg ccagtacgga cagtgggctc ctaaactggc tcggctgcac tacagcggca ccgcctctgg ccagtacgga cagtgggctc ctaaactggc tcggctgcac tacagcggca
91809180
gcatcaatgc ctggtccacc aaagagccct tcagctggat caaggtggac ctgctggctc gcatcaatgc ctggtccacc aaagagccct tcagctggat caaggtggac ctgctggctc
92409240
ccatgatcat ccacggaatc aagacccagg gcgccagaca gaagttcagc agcctgtaca ccatgatcat ccacggaatc aagacccagg gcgccagaca gaagttcagc agcctgtaca
93009300
tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc tacagaggca tcagccagtt catcatcatg tacagcctgg acggcaagaa gtggcagacc tacagaggca
93609360
acagcaccgg cacactcatg gtgttcttcg gcaacgtgga ctccagcggc attaagcaca acagcaccgg cacactcatg gtgttcttcg gcaacgtgga ctccagcggc attaagcaca
94209420
acatcttcaa ccctccaatc attgcccggt acatccggct gcaccccaca cactacagca acatcttcaa ccctccaatc attgcccggt acatccggct gcaccccaca cactacagca
94809480
tccggtctac cctgagaatg gaactgatgg gctgcgacct gaacagctgc tctatgcccc tccggtctac cctgagaatg gaactgatgg gctgcgacct gaacagctgc tctatgcccc
95409540
tcggaatgga aagcaaggcc atcagcgacg cccagatcac agccagcagc tacttcacca tcggaatgga aagcaaggcc atcagcgacg cccagatcac agccagcagc tacttcacca
96009600
acatgttcgc cacttggagc ccctccaagg ctagactgca tctgcagggc agaagcaacg acatgttcgc cacttggagc ccctccaagg ctagactgca tctgcagggc agaagcaacg
96609660
cttggaggcc ccaagtgaac aaccccaaag agtggctgca ggttgacttt caaaagacca cttggaggcc ccaagtgaac aaccccaaag agtggctgca ggttgacttt caaaagacca
97209720
tgaaagtgac cggcgtgacc acacagggcg tcaagtctct gctgacctct atgtacgtga tgaaagtgac cggcgtgacc acacagggcg tcaagtctct gctgacctct atgtacgtga
97809780
aagagttcct gatctccagc agccaggacg gccatcagtg gaccctgttt ttccagaacg aagagttcct gatctccagc agccaggacg gccatcagtg gaccctgttt ttccagaacg
98409840
gcaaagtgaa agtgttccag ggcaatcagg acagcttcac acccgtggtc aattctctgg gcaaagtgaa agtgttccag ggcaatcagg acagcttcac acccgtggtc aattctctgg
99009900
accctccact gctgaccaga tacctgcgga ttcaccctca gtcttgggtg caccagatcg accctccact gctgaccaga tacctgcgga ttcaccctca gtcttgggtg caccagatcg
99609960
ctctgcggat ggaagtgctg ggctgtgaag ctcaggacct ctactagtta attaagagca ctctgcggat ggaagtgctg ggctgtgaag ctcaggacct ctactagtta attaagagca
1002010020
tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta tacatttaaa tcttaccgcc atttattccc atatttgttc tgtttttctt gatttgggta tacatttaaa
1008010080
tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg taattactag tgttaataaa acaaaatggt ggggcaatca tttacatttt tagggatatg taattactag
1014010140
ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt tacgctctgt ttcaggtgta ttgccacaag acaaacatgt taagaaactt tcccgttatt tacgctctgt
1020010200
tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata ttcttaacta tcctgttaat caacctctgg attacaaaat ttgtgaaaga ttgactgata ttcttaacta
1026010260
tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc tagctattgc tgttgctcct tttacgctgt gtggatatgc tgctttatag cctctgtatc tagctattgc
1032010320
ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt ctcttttaga ttcccgtacg gctttcgttt tctcctcctt gtataaatcc tggttgctgt ctcttttaga
1038010380
ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac ggagttgtgg cccgttgtcc gtcaacgtgg cgtggtgtgc tctgtgtttg ctgacgcaac
1044010440
ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt tcgctttccc ccccactggc tggggcattg ccaccacctg tcaactcctt tctgggactt tcgctttccc
1050010500
cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct ggacaggggc cctcccgatc gccacggcag aactcatcgc cgcctgcctt gcccgctgct ggacaggggc
1056010560
taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt gccagccatc taggttgctg ggcactgata attccgtggt gttgtctgtg ccttctagtt gccagccatc
1062010620
tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct tgttgtttgc ccctcccccg tgccttcctt gaccctggaa ggtgccactc ccactgtcct
1068010680
ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg ttcctaataa aatgaggaaa ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg
1074010740
gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg gggtggggtg gggcaggaca gcaaggggga ggattgggaa gacaatagca ggcatgctgg
1080010800
ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc atggcgggtt ggatgcggtg ggctctatgg ctctagagca tggctacgta gataagtagc atggcgggtt
1086010860
aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac tccctctctg aatcattaac tacacctgca ggaggaaccc ctagtgatgg agttggccac tccctctctg
1092010920
cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggcggcctc cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg cccgacgccc gggcggcctc
1098010980
agtgagcgag cgagcgcgca gctgcctgca ggggcgcgcc tcgaggcatg cggtaccaag agtgagcgag cgagcgcgca gctgcctgca ggggcgcgcc tcgaggcatg cggtaccaag
1104011040
cttgtcgaga agtactagag gatcataatc agccatacca catttgtaga ggttttactt cttgtcgaga agtactagag gatcataatc agccatacca catttgtaga ggttttactt
1110011100
gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt
1116011160
gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat
1122011220
ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat
1128011280
gtatcttatc atgtctggat ctgatcactg atatcgccta ggagatccga accagataag gtatcttatc atgtctggat ctgatcactg atatcgccta ggagatccga accagataag
1134011340
tgaaatctag ttccaaacta ttttgtcatt tttaattttc gtattagctt acgacgctac tgaaatctag ttccaaacta ttttgtcatt tttaattttc gtattagctt acgacgctac
1140011400
acccagttcc catctatttt gtcactcttc cctaaataat ccttaaaaac tccatttcca acccagttcc catctatttt gtcactcttc cctaaataat ccttaaaaac tccatttcca
1146011460
cccctcccag ttcccaacta ttttgtccgc ccacagcggg gcatttttct tcctgttatg cccctcccag ttcccaacta ttttgtccgc ccacagcggg gcatttttct tcctgttatg
1152011520
tttttaatca aacatcctgc caactccatg tgacaaaccg tcatcttcgg ctactttttc tttttaatca aacatcctgc caactccatg tgacaaaccg tcatcttcgg ctactttttc
1158011580
tctgtcacag aatgaaaatt tttctgtcat ctcttcgtta ttaatgtttg taattgactg tctgtcacag aatgaaaatt tttctgtcat ctcttcgtta ttaatgtttg taattgactg
1164011640
aatatcaacg cttatttgca gcctgaatgg cgaatgg aatatcaacg cttatttgca gcctgaatgg cgaatgg
1167711677
<210> 194<210> 194
<211> 13634<211> 13634
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 194<400> 194
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60 60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120 120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt
180 180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240 240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300 300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360 360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420 420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480 480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540 540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600 600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660 660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720 720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780 780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840 840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900 900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960 960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
10201020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
10801080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
11401140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
12001200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
12601260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
13201320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
13801380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
14401440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
15001500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
15601560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
16201620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
16801680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
17401740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
18001800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
18601860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
19201920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
19801980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
20402040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
21002100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
21602160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
22202220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
22802280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
23402340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
24002400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
24602460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
25202520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
25802580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
26402640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
27002700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
27602760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
28202820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
28802880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
29402940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
30003000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
30603060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
31203120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
31803180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
32403240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
33003300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
33603360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
34203420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
34803480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
35403540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
36003600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
36603660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
37203720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
37803780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
38403840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
39003900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
39603960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
40204020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
40804080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
41404140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
42004200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
42604260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
43204320
tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca
43804380
aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct
44404440
gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca
45004500
gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc
45604560
agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat agtggaagct gtacactgcc caggcaaagc gtccggggcag cgtaggcggg cgactcagat
46204620
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat
46804680
attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac
47404740
agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc
48004800
taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc
48604860
tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag
49204920
ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat
49804980
tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc
50405040
gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg
51005100
tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg
51605160
cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc
52205220
atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat
52805280
tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac
53405340
gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc
54005400
cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc
54605460
aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc
55205520
aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc
55805580
aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct
56405640
agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg
57005700
atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag
57605760
gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc
58205820
ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag
58805880
tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag
59405940
gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac
60006000
tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc
60606060
cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat
61206120
atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga
61806180
agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa
62406240
gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag
63006300
agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc
63606360
aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc
64206420
ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct
64806480
ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac
65406540
cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc
66006600
ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag
66606660
atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg
67206720
tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat
67806780
cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg
68406840
cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag
69006900
accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag
69606960
gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc
70207020
ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg
70807080
ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac
71407140
atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat
72007200
agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac
72607260
atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg
73207320
tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg
73807380
tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc
74407440
gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc
75007500
gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc
75607560
accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg
76207620
atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc
76807680
ccacctagca tgcccgtgca ctacgatagc cagctggata ccacactgtt cggcaagaag ccacctagca tgcccgtgca ctacgatagc cagctggata cccacactgtt cggcaagaag
77407740
tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc
78007800
aagctgctgg aatccggcct gatgaacagc caagagtcct cctggggcaa gaatgtgtcc aagctgctgg aatccggcct gatgaacagc caagagtcct cctggggcaa gaatgtgtcc
78607860
agcaccgagt ccggcagact gttcaaggga aagagagccc acggacctgc tctgctgacc agcaccgagt ccggcagact gttcaaggga aagagagccc acggacctgc tctgctgacc
79207920
aaggataacg ccctgttcaa agtgtccatc agcctgctca agaccaacaa gacctccaac aaggataacg ccctgttcaa agtgtccatc agcctgctca agaccaacaa gacctccaac
79807980
aactccgcca ccaacagaaa gacccacatc gacggcccta gcctgctgat cgagaatagc aactccgcca ccaacagaaa gacccacatc gacggcccta gcctgctgat cgagaatagc
80408040
cctagcgtct ggcagaatat cctggaaagc gacaccgagt tcaagaaagt gacccctctg cctagcgtct ggcagaatat cctggaaagc gacaccgagt tcaagaaagt gacccctctg
81008100
atccacgacc ggatgctcat ggacaagaac gccaccgctc tgcggctgaa ccacatgagc atccacgacc ggatgctcat ggacaagaac gccaccgctc tgcggctgaa ccacatgagc
81608160
aacaagacaa ccagcagcaa gaatatggaa atggtgcagc agaagaaaga gggccccatt aacaagacaa ccagcagcaa gaatatggaa atggtgcagc agaagaaaga gggccccatt
82208220
cctccagacg ctcagaaccc cgatatgagc ttcttcaaga tgctctttct gcccgagagc cctccagacg ctcagaaccc cgatatgagc ttcttcaaga tgctctttct gcccgagagc
82808280
gcccggtgga ttcagagaac acacggcaag aactccctga actccggcca gggaccttct gcccggtgga ttcagagaac acacggcaag aactccctga actccggcca gggaccttct
83408340
ccaaagcagc tggtttccct gggacctgag aagtccgtgg aaggacagaa cttcctgagc ccaaagcagc tggtttccct gggacctgag aagtccgtgg aaggacagaa cttcctgagc
84008400
gaaaagaaca aagtggtcgt cggcaagggc gagttcacca aggatgtggg cctgaaagag gaaaagaaca aagtggtcgt cggcaagggc gagttcacca aggatgtggg cctgaaagag
84608460
atggtctttc ccagcagccg gaacctgttc ctgaccaacc tggacaacct gcacgagaac atggtctttc ccagcagccg gaacctgttc ctgaccaacc tggacaacct gcacgagaac
85208520
aacacccaca atcaagagaa gaagatccaa gaggaaatcg aaaagaaaga gacactcatc aacacccaca atcaagagaa gaagatccaa gaggaaatcg aaaagaaaga gacactcatc
85808580
caagagaacg tggtgctgcc tcagatccac acagtgaccg gcaccaagaa ctttatgaag caagagaacg tggtgctgcc tcagatccac acagtgaccg gcaccaagaa ctttatgaag
86408640
aatctgttcc tgctgagtac ccggcagaac gtggaaggca gctacgatgg cgcttatgcc aatctgttcc tgctgagtac ccggcagaac gtggaaggca gctacgatgg cgcttatgcc
87008700
cctgtgctgc aggacttcag atccctgaac gactccacca atcggacaaa gaagcacaca cctgtgctgc aggacttcag atccctgaac gactccacca atcggacaaa gaagcacaca
87608760
gcccacttct ccaagaaggg cgaagaagag aacctggaag gactgggcaa tcagaccaag gcccacttct ccaagaaggg cgaagaagag aacctggaag gactgggcaa tcagaccaag
88208820
cagatcgtcg agaagtacgc ctgcaccacc agaatcagcc ccaacacaag ccagcagaac cagatcgtcg agaagtacgc ctgcaccacc agaatcagcc ccaacacaag ccagcagaac
88808880
ttcgtgaccc agcggagcaa aagagccctg aagcagtttc ggctgcccct ggaagaaacc ttcgtgaccc agcggagcaa aagagccctg aagcagtttc ggctgcccct ggaagaaacc
89408940
gagctggaaa agcggatcat cgtggacgac accagcacac agtggtccaa gaacatgaag gagctggaaa agcggatcat cgtggacgac accagcacac agtggtccaa gaacatgaag
90009000
cacttgaccc ctagcacact gacccagatc gactacaacg agaaagagaa gggcgctatc cacttgaccc ctagcacact gacccagatc gactacaacg agaaagagaa gggcgctatc
90609060
acacagagcc cactgagcga ctgtctgacc agaagccaca gcatccctca ggccaacaga acacagagcc cactgagcga ctgtctgacc agaagccaca gcatccctca ggccaacaga
91209120
tcccctctgc caatcgccaa agtgtctagc ttccccagca tcagacccat ctacctgacc tcccctctgc caatcgccaa agtgtctagc ttccccagca tcagacccat ctacctgacc
91809180
agagtgctgt tccaggacaa cagcagccat ctgccagccg ccagctaccg gaagaaagat agagtgctgt tccaggacaa cagcagccat ctgccagccg ccagctaccg gaagaaagat
92409240
tctggcgtgc aagagagcag ccactttctg cagggcgcta agaagaacaa tctgagcctg tctggcgtgc aagagagcag ccactttctg cagggcgcta agaagaacaa tctgagcctg
93009300
gctattctga ccctggaaat gaccggcgat cagagagaag tcggctctct gggcaccagc gctattctga ccctggaaat gaccggcgat cagagagaag tcggctctct gggcaccagc
93609360
gccacaaata gcgtgaccta caaaaaggtg gaaaacaccg tgctgcctaa gcctgacctg gccacaaata gcgtgaccta caaaaaggtg gaaaacaccg tgctgcctaa gcctgacctg
94209420
ccaaagacaa gcggcaaggt ggaactgctg ccaaaggtgc acatctacca gaaggacctg ccaaagacaa gcggcaaggt ggaactgctg ccaaaggtgc acatctacca gaaggacctg
94809480
tttcctaccg agacaagcaa cggctctccc ggccatctgg atctggtgga aggatctctg tttcctaccg agacaagcaa cggctctccc ggccatctgg atctggtgga aggatctctg
95409540
ctgcagggaa ccgagggcgc catcaagtgg aacgaggcca atagacctgg caaggtgccc ctgcagggaa ccgagggcgc catcaagtgg aacgaggcca atagacctgg caaggtgccc
96009600
ttcctgagag tggccacaga gtccagcgcc aagacaccct ctaaactgct ggaccctctg ttcctgagag tggccacaga gtccagcgcc aagacaccct ctaaactgct ggaccctctg
96609660
gcctgggaca accactatgg cactcagatc cccaaagagg aatggaagtc ccaagagaag gcctgggaca accactatgg cactcagatc cccaaagagg aatggaagtc ccaagagaag
97209720
tcccctgaaa agaccgcctt caagaagaag gacaccattc tgtccctgaa tgcctgcgag tcccctgaaa agaccgcctt caagaagaag gacaccattc tgtccctgaa tgcctgcgag
97809780
agcaaccacg ccattgccgc catcaatgag ggccagaaca agcccgagat cgaagtgacc agcaaccacg ccattgccgc catcaatgag ggccagaaca agcccgagat cgaagtgacc
98409840
tgggccaagc agggaagaac cgagagactg tgtagccaga atcctcctgt gctgaagcgg tgggccaagc agggaagaac cgagagactg tgtagccaga atcctcctgt gctgaagcgg
99009900
caccagagag aaatcacccg gaccacactg cagagcgacc aagaagagat cgattacgac caccagagag aaatcacccg gaccacactg cagagcgacc aagaagagat cgattacgac
99609960
gataccatca gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat gataccatca gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat
1002010020
cagagccctc ggagcttcca gaagaaaacc aggcactact ttattgccgc cgtcgagcgg cagagccctc ggagcttcca gaagaaaacc aggcactact ttattgccgc cgtcgagcgg
1008010080
ctgtgggact acggaatgtc tagctctcct cacgtgctgc ggaatagagc ccagtctggt ctgtgggact acggaatgtc tagctctcct cacgtgctgc ggaatagagc ccagtctggt
1014010140
agcgtgcccc agttcaaaaa ggtcgtgttc caagagttca ccgacggcag cttcacccag agcgtgcccc agttcaaaaa ggtcgtgttc caagagttca ccgacggcag cttcacccag
1020010200
ccactgtata gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc ccactgtata gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc
1026010260
gaagtggaag ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc gaagtggaag ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc
1032010320
tacagctccc tgatctccta cgaagaggac cagagacagg gcgcagagcc ccggaagaat tacagctccc tgatctccta cgaagaggac cagagacagg gcgcagagcc ccggaagaat
1038010380
ttcgtgaagc ccaacgagac taagacctac ttttggaagg tgcagcacca tatggcccct ttcgtgaagc ccaacgagac taagacctac ttttggaagg tgcagcacca tatggcccct
1044010440
acaaaggacg agttcgactg caaagcctgg gcctacttct ccgatgtgga cctcgaaaag acaaaggacg agttcgactg caaagcctgg gcctacttct ccgatgtgga cctcgaaaag
1050010500
gacgtgcaca gcggactcat cggcccactg cttgtgtgcc acaccaacac actgaacccc gacgtgcaca gcggactcat cggcccactg cttgtgtgcc acaccaacac actgaacccc
1056010560
gctcacggca gacaagtgac agtgcaagag ttcgccctgt ttttcaccat cttcgacgaa gctcacggca gacaagtgac agtgcaagag ttcgccctgt ttttcaccat cttcgacgaa
1062010620
acgaagtcct ggtacttcac cgaaaacatg gaaagaaact gcagggcccc ttgcaacatt acgaagtcct ggtacttcac cgaaaacatg gaaagaaact gcagggcccc ttgcaacatt
1068010680
cagatggaag atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc cagatggaag atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc
1074010740
atggacacac tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg atggacacac tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg
1080010800
tccatgggct ccaacgagaa tatccactcc atccacttca gcggccacgt gttcaccgtg tccatgggct ccaacgagaa tatccactcc atccacttca gcggccacgt gttcaccgtg
1086010860
cggaaaaaag aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc cggaaaaaag aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc
1092010920
gttgagatgc tgcctagcaa ggccggaatt tggagagtgg aatgtctgat tggagagcac gttgagatgc tgcctagcaa ggccggaatt tggagagtgg aatgtctgat tggagagcac
1098010980
ctccacgccg ggatgagcac cctgtttctg gtgtactcca acaagtgtca gacccctctc ctccacgccg ggatgagcac cctgtttctg gtgtactcca acaagtgtca gacccctctc
1104011040
ggcatggcct ctggccacat tagagacttc cagatcaccg ccagcggaca gtatggacag ggcatggcct ctggccacat tagagacttc cagatcaccg ccagcggaca gtatggacag
1110011100
tgggccccta aactggccag actgcactac tccggcagca tcaatgcctg gtccaccaaa tgggccccta aactggccag actgcactac tccggcagca tcaatgcctg gtccaccaaa
1116011160
gagcctttca gctggatcaa agtggacctg ctggctccca tgatcatcca cggaatcaag gagcctttca gctggatcaa agtggacctg ctggctccca tgatcatcca cggaatcaag
1122011220
acccagggcg ccagacaaaa gttcagcagc ctgtacatca gccagttcat catcatgtac acccagggcg ccagacaaaa gttcagcagc ctgtacatca gccagttcat catcatgtac
1128011280
agcctggacg gaaagaagtg gcagacctac cggggcaata gcaccggcac actgatggtg agcctggacg gaaagaagtg gcagacctac cggggcaata gcaccggcac actgatggtg
1134011340
ttcttcggca acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt ttcttcggca acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt
1140011400
gcccggtaca tccggctgca ccccacacac tacagcatca ggtctaccct gagaatggaa gcccggtaca tccggctgca ccccacacac tacagcatca ggtctaccct gagaatggaa
1146011460
ctgatgggct gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc ctgatgggct gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc
1152011520
agcgacgccc agatcacagc ctctagctac ttcaccaaca tgttcgccac ttggagcccc agcgacgccc agatcacagc ctctagctac ttcaccaaca tgttcgccac ttggagcccc
1158011580
tctaaggccc ggcttcatct gcaaggcaga agcaacgctt ggaggcccca agtgaacaac tctaaggccc ggcttcatct gcaaggcaga agcaacgctt ggaggcccca agtgaacaac
1164011640
cccaaagaat ggctccaggt ggactttcag aaaaccatga aagtgacagg cgtgaccaca cccaaagaat ggctccaggt ggactttcag aaaaccatga aagtgacagg cgtgaccaca
1170011700
cagggcgtca agtccctgct gacctctatg tacgtgaaag agtttctgat cagctccagc cagggcgtca agtccctgct gacctctatg tacgtgaaag agtttctgat cagctccagc
1176011760
caggacggcc accagtggac cctgttcttc cagaacggca aagtgaaagt gttccaggga caggacggcc accagtggac cctgttcttc cagaacggca aagtgaaagt gttccaggga
1182011820
aatcaggaca gcttcacacc cgtggtcaat agtctggacc caccactgct gacccgctac aatcaggaca gcttcacacc cgtggtcaat agtctggacc caccactgct gacccgctac
1188011880
ctgcgaattc accctcagtc ttgggtgcac cagattgccc tgcggatgga agtgctgggc ctgcgaattc accctcagtc ttgggtgcac cagattgccc tgcggatgga agtgctgggc
1194011940
tgtgaagctc aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata tgtgaagctc aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata
1200012000
tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg tttgttctgt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg
1206012060
gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca gcaatcattt acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca
1212012120
aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt aacatgttaa gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt
1218012180
acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg acaaaatttg tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg
1224012240
gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct gatatgctgc tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct
1230012300
cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc cctccttgta taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc
1236012360
aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca
1242012420
ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac ccacctgtca actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac
1248012480
tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt tcatcgccgc ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt
1254012540
ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc ccgtggtgtt gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc
1260012600
cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg cttccttgac cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg
1266012660
catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca catcgcattg tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca
1272012720
agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc agggggagga ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc
1278012780
tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga tagagcatgg ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga
1284012840
ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc
1290012900
cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct
1296012960
gcctgcaggg gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat gcctgcaggg gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat
1302013020
cataatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct cataatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct
1308013080
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc
1314013140
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc
1320013200
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg
1326013260
atcactgata tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt atcactgata tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt
1332013320
tgtcattttt aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc tgtcattttt aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc
1338013380
actcttccct aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt actcttccct aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt
1344013440
tgtccgccca cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa tgtccgccca cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa
1350013500
ctccatgtga caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt ctccatgtga caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt
1356013560
ctgtcatctc ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc ctgtcatctc ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc
1362013620
tgaatggcga atgg tgaatggcga atgg
1363413634
<210> 195<210> 195
<211> 10952<211> 10952
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 195<400> 195
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60 60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120 120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt
180 180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240 240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300 300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360 360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420 420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480 480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540 540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600 600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660 660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720 720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780 780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840 840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900 900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960 960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
10201020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
10801080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
11401140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
12001200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
12601260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
13201320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
13801380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
14401440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
15001500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
15601560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
16201620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
16801680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
17401740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
18001800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
18601860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
19201920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
19801980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
20402040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
21002100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
21602160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
22202220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
22802280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
23402340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
24002400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
24602460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
25202520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
25802580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
26402640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
27002700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
27602760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
28202820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
28802880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
29402940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
30003000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
30603060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
31203120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
31803180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
32403240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
33003300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
33603360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
34203420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
34803480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
35403540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
36003600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
36603660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
37203720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
37803780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
38403840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
39003900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
39603960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
40204020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
40804080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
41404140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
42004200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
42604260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
43204320
tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca
43804380
aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct
44404440
gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca
45004500
gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc
45604560
agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat agtggaagct gtacactgcc caggcaaagc gtccggggcag cgtaggcggg cgactcagat
46204620
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat
46804680
attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac
47404740
agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc
48004800
taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc
48604860
tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag
49204920
ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat
49804980
tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc
50405040
gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg
51005100
tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg
51605160
cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc
52205220
atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat
52805280
tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac
53405340
gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc
54005400
cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc
54605460
aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc
55205520
aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc
55805580
aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct
56405640
agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg
57005700
atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag
57605760
gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc
58205820
ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag
58805880
tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag
59405940
gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac
60006000
tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc
60606060
cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat
61206120
atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga
61806180
agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa
62406240
gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag
63006300
agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc
63606360
aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc
64206420
ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct
64806480
ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac
65406540
cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc
66006600
ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag
66606660
atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg
67206720
tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat
67806780
cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg
68406840
cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag
69006900
accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag
69606960
gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc
70207020
ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg
70807080
ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac
71407140
atcagcgcct acctgctgag caagaacaat gccatcgagc ctcggagctt cagccagaat atcagcgcct acctgctgag caagaacaat gccatcgagc ctcggagctt cagccagaat
72007200
cctcctgtgc tgaagcggca ccagcgcgag atcaccagaa caaccctgca gagcgaccaa cctcctgtgc tgaagcggca ccagcgcgag atcaccagaa caaccctgca gagcgaccaa
72607260
gaggaaatcg attacgacga caccatcagc gtcgagatga agaaagaaga tttcgacatc gaggaaatcg attacgacga caccatcagc gtcgagatga agaaagaaga tttcgacatc
73207320
tacgacgagg acgagaatca gagccccaga agctttcaga aaaagacccg gcactacttc tacgacgagg acgagaatca gagccccaga agctttcaga aaaagacccg gcactacttc
73807380
attgccgccg tcgagagact gtgggactac ggcatgtcta gcagccctca cgtgctgaga attgccgccg tcgagagact gtgggactac ggcatgtcta gcagccctca cgtgctgaga
74407440
aatagagccc agagcggcag cgtgccccag ttcaagaaag tggtgttcca agagttcacc aatagagccc agagcggcag cgtgccccag ttcaagaaag tggtgttcca agagttcacc
75007500
gacggcagct tcacccagcc actgtataga ggcgagctga acgagcatct gggcctgctg gacggcagct tcacccagcc actgtataga ggcgagctga acgagcatct gggcctgctg
75607560
ggcccttata tcagagccga agtggaagat aacatcatgg tcaccttccg gaatcaggct ggcccttata tcagagccga agtggaagat aacatcatgg tcaccttccg gaatcaggct
76207620
agccggcctt acagcttcta cagctccctg atcagctacg aagaggacca gagacagggc agccggcctt acagcttcta cagctccctg atcagctacg aagaggacca gagacagggc
76807680
gctgagccca gaaagaactt cgtgaagccc aacgagacta agacctactt ttggaaggtg gctgagccca gaaagaactt cgtgaagccc aacgagacta agacctactt ttggaaggtg
77407740
cagcaccaca tggcccctac aaaggacgag ttcgactgca aagcctgggc ctacttctcc cagcaccaca tggcccctac aaaggacgag ttcgactgca aagcctgggc ctacttctcc
78007800
gatgtggatc tggaaaagga cgtgcacagc gggctcatcg gaccactgct tgtgtgccac gatgtggatc tggaaaagga cgtgcacagc gggctcatcg gaccactgct tgtgtgccac
78607860
accaacacac tgaaccccgc tcacggcaga caagtgacag tgcaagagtt cgccctgttc accaacacac tgaaccccgc tcacggcaga caagtgacag tgcaagagtt cgccctgttc
79207920
ttcaccatct tcgacgaaac aaagagctgg tacttcaccg agaatatgga acggaactgc ttcaccatct tcgacgaaac aaagagctgg tacttcaccg agaatatgga acggaactgc
79807980
agagcccctt gcaacatcca gatggaagat cccaccttca aagagaacta ccggttccac agagcccctt gcaacatcca gatggaagat cccaccttca aagagaacta ccggttccac
80408040
gccatcaacg gctacatcat ggacacactg cccggcctgg ttatggccca ggatcagaga gccatcaacg gctacatcat ggacacactg cccggcctgg ttatggccca ggatcagaga
81008100
atccggtggt atctgctgtc catgggctcc aacgagaata tccacagcat ccacttcagc atccggtggt atctgctgtc catgggctcc aacgagaata tccacagcat ccacttcagc
81608160
ggccacgtgt tcaccgtgcg gaaaaaagaa gagtacaaaa tggccctgta caatctgtac ggccacgtgt tcaccgtgcg gaaaaaagaa gagtacaaaa tggccctgta caatctgtac
82208220
cctggggtgt tcgaaaccgt ggaaatgctg ccttccaagg ccggcatttg gagagtggaa cctggggtgt tcgaaaccgt ggaaatgctg ccttccaagg ccggcatttg gagagtggaa
82808280
tgtctgattg gagagcacct ccacgccgga atgagcaccc tgtttctggt gtacagcaac tgtctgattg gagagcacct ccacgccgga atgagcaccc tgtttctggt gtacagcaac
83408340
aagtgtcaga cccctctcgg catggcctct ggacacatca gagacttcca gatcaccgcc aagtgtcaga cccctctcgg catggcctct ggacacatca gagacttcca gatcaccgcc
84008400
tctggccagt acggacagtg ggctcctaaa ctggctcggc tgcactacag cggcagcatc tctggccagt acggacagtg ggctcctaaa ctggctcggc tgcactacag cggcagcatc
84608460
aatgcctggt ccaccaaaga gcccttcagc tggatcaagg tggacctgct ggctcccatg aatgcctggt ccaccaaaga gcccttcagc tggatcaagg tggacctgct ggctcccatg
85208520
atcatccacg gaatcaagac ccagggcgcc agacagaagt tcagcagcct gtacatcagc atcatccacg gaatcaagac ccagggcgcc agacagaagt tcagcagcct gtacatcagc
85808580
cagttcatca tcatgtacag cctggacggc aagaagtggc agacctacag aggcaacagc cagttcatca tcatgtacag cctggacggc aagaagtggc agacctacag aggcaacagc
86408640
accggcacac tcatggtgtt cttcggcaac gtggactcca gcggcattaa gcacaacatc accggcacac tcatggtgtt cttcggcaac gtggactcca gcggcattaa gcacaacatc
87008700
ttcaaccctc caatcattgc ccggtacatc cggctgcacc ccacacacta cagcatccgg ttcaaccctc caatcattgc ccggtacatc cggctgcacc ccacacacta cagcatccgg
87608760
tctaccctga gaatggaact gatgggctgc gacctgaaca gctgctctat gcccctcgga tctaccctga gaatggaact gatgggctgc gacctgaaca gctgctctat gcccctcgga
88208820
atggaaagca aggccatcag cgacgcccag atcacagcca gcagctactt caccaacatg atggaaagca aggccatcag cgacgcccag atcacagcca gcagctactt caccaacatg
88808880
ttcgccactt ggagcccctc caaggctaga ctgcatctgc agggcagaag caacgcttgg ttcgccactt ggagcccctc caaggctaga ctgcatctgc agggcagaag caacgcttgg
89408940
aggccccaag tgaacaaccc caaagagtgg ctgcaggttg actttcaaaa gaccatgaaa aggccccaag tgaacaaccc caaagagtgg ctgcaggttg actttcaaaa gaccatgaaa
90009000
gtgaccggcg tgaccacaca gggcgtcaag tctctgctga cctctatgta cgtgaaagag gtgaccggcg tgaccacaca gggcgtcaag tctctgctga cctctatgta cgtgaaagag
90609060
ttcctgatct ccagcagcca ggacggccat cagtggaccc tgtttttcca gaacggcaaa ttcctgatct ccagcagcca ggacggccat cagtggaccc tgtttttcca gaacggcaaa
91209120
gtgaaagtgt tccagggcaa tcaggacagc ttcacacccg tggtcaattc tctggaccct gtgaaagtgt tccagggcaa tcaggacagc ttcacacccg tggtcaattc tctggaccct
91809180
ccactgctga ccagatacct gcggattcac cctcagtctt gggtgcacca gatcgctctg ccactgctga ccagatacct gcggattcac cctcagtctt gggtgcacca gatcgctctg
92409240
cggatggaag tgctgggctg tgaagctcag gacctctact agttaattaa gagcatctta cggatggaag tgctgggctg tgaagctcag gacctctact agttaattaa gagcatctta
93009300
ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta ccgccattta ttcccatatt tgttctgttt ttcttgattt gggtatacat ttaaatgtta
93609360
ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag ataaaacaaa atggtggggc aatcatttac atttttaggg atatgtaatt actagttcag
94209420
gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg gtgtattgcc acaagacaaa catgttaaga aactttcccg ttatttacgc tctgttcctg
94809480
ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt aactatgttg
95409540
ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc ctccttttac gctgtgtgga tatgctgctt tatagcctct gtatctagct attgcttccc
96009600
gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt ttagaggagt
96609660
tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac gcaaccccca
97209720
ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct ttccccctcc
97809780
cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca ggggctaggt
98409840
tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg tgctgggcac tgataattcc gtggtgttgt ctgtgccttc tagttgccag ccatctgttg
99009900
tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc cactcccact gtcctttcct
99609960
aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg aataaaatga ggaaattgca tcgcattgtc tgagtaggtg tcattctatt ctggggggtg
1002010020
gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg gggtggggca ggacagcaag ggggaggatt gggaagacaa tagcaggcat gctggggatg
1008010080
cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca cggtgggctc tatggctcta gagcatggct acgtagataa gtagcatggc gggttaatca
1014010140
ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc ttaactacac ctgcaggagg aacccctagt gatggagttg gccactccct ctctgcgcgc
1020010200
tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggcg gcctcagtga
1026010260
gcgagcgagc gcgcagctgc ctgcaggggc gcgcctcgag gcatgcggta ccaagcttgt gcgagcgagc gcgcagctgc ctgcaggggc gcgcctcgag gcatgcggta ccaagcttgt
1032010320
cgagaagtac tagaggatca taatcagcca taccacattt gtagaggttt tacttgcttt cgagaagtac tagaggatca taatcagcca taccacattt gtagaggttt tacttgcttt
1038010380
aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa ttgttgttgt
1044010440
taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca caaatttcac
1050010500
aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca tcaatgtatc
1056010560
ttatcatgtc tggatctgat cactgatatc gcctaggaga tccgaaccag ataagtgaaa ttatcatgtc tggatctgat cactgatatc gcctaggaga tccgaaccag ataagtgaaa
1062010620
tctagttcca aactattttg tcatttttaa ttttcgtatt agcttacgac gctacaccca tctagttcca aactattttg tcatttttaa ttttcgtatt agcttacgac gctacaccca
1068010680
gttcccatct attttgtcac tcttccctaa ataatcctta aaaactccat ttccacccct gttcccatct attttgtcac tcttccctaa ataatcctta aaaactccat ttccacccct
1074010740
cccagttccc aactattttg tccgcccaca gcggggcatt tttcttcctg ttatgttttt cccagttccc aactattttg tccgcccaca gcggggcatt tttcttcctg ttatgttttt
1080010800
aatcaaacat cctgccaact ccatgtgaca aaccgtcatc ttcggctact ttttctctgt aatcaaacat cctgccaact ccatgtgaca aaccgtcatc ttcggctact ttttctctgt
1086010860
cacagaatga aaatttttct gtcatctctt cgttattaat gtttgtaatt gactgaatat cacagaatga aaatttttct gtcatctctt cgttattaat gtttgtaatt gactgaatat
1092010920
caacgcttat ttgcagcctg aatggcgaat gg caacgcttat ttgcagcctg aatggcgaat gg
1095210952
<210> 196<210> 196
<211> 14266<211> 14266
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 196<400> 196
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60 60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120 120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt
180 180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240 240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300 300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360 360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420 420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480 480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540 540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600 600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660 660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720 720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780 780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840 840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900 900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960 960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
10201020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
10801080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
11401140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
12001200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
12601260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
13201320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
13801380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
14401440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
15001500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
15601560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
16201620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
16801680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
17401740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
18001800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
18601860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
19201920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
19801980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
20402040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
21002100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
21602160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
22202220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
22802280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
23402340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
24002400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
24602460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
25202520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
25802580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
26402640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
27002700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
27602760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
28202820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
28802880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
29402940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
30003000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
30603060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
31203120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
31803180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
32403240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
33003300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
33603360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
34203420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
34803480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
35403540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
36003600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
36603660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
37203720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
37803780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
38403840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
39003900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
39603960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
40204020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
40804080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
41404140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
42004200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
42604260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
43204320
tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc
43804380
ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt
44404440
ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgaggtg
45004500
ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg
45604560
ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt
46204620
atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg
46804680
agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc
47404740
ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc
48004800
accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac
48604860
ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca
49204920
ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat
49804980
gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag
50405040
ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg
51005100
caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg
51605160
ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca
52205220
cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc
52805280
gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt
53405340
ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta
54005400
ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt
54605460
ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt ggttcattct caagcctcag acagtggttc aaagtttttt tcttccatt caggtgtcgt
55205520
gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc
55805580
tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg
56405640
actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc
57005700
ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca
57605760
ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta
58205820
caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc
58805880
ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg
59405940
acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca
60006000
cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga
60606060
catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag
61206120
ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt
61806180
tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca
62406240
gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga
63006300
acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact acggctacgt gaacagaagc ctgcctggac tgatcggctg cccagaaag tccgtgtact
63606360
ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca
64206420
ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga
64806480
ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc
65406540
accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc
66006600
tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga
66606660
tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg
67206720
ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt
67806780
acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg
68406840
gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga
69006900
cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg
69606960
gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca
70207020
tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg
70807080
tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg
71407140
tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca
72007200
gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct
72607260
acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc
73207320
tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc
73807380
tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc
74407440
actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg
75007500
cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg
75607560
gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg
76207620
gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca
76807680
gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca
77407740
ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca
78007800
atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc
78607860
agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc
79207920
acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga
79807980
gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa
80408040
ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga
81008100
cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc
81608160
tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg
82208220
acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg
82808280
ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata
83408340
gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc
84008400
ctctgtctct gagcgaggaa aacaacgaca gcaagctgct ggaatccggc ctgatgaaca ctctgtctct gagcgaggaa aacaacgaca gcaagctgct ggaatccggc ctgatgaaca
84608460
gccaagagtc ctcctggggc aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg gccaagagtc ctcctggggc aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg
85208520
gaaagagagc ccacggacct gctctgctga ccaaggataa cgccctgttc aaagtgtcca gaaagagagc ccacggacct gctctgctga ccaaggataa cgccctgttc aaagtgtcca
85808580
tcagcctgct caagaccaac aagacctcca acaactccgc caccaacaga aagacccaca tcagcctgct caagaccaac aagacctcca acaactccgc caccaacaga aagacccaca
86408640
tcgacggccc tagcctgctg atcgagaata gccctagcgt ctggcagaat atcctggaaa tcgacggccc tagcctgctg atcgagaata gccctagcgt ctggcagaat atcctggaaa
87008700
gcgacaccga gttcaagaaa gtgacccctc tgatccacga ccggatgctc atggacaaga gcgacaccga gttcaagaaa gtgacccctc tgatccacga ccggatgctc atggacaaga
87608760
acgccaccgc tctgcggctg aaccacatga gcaacaagac aaccagcagc aagaatatgg acgccaccgc tctgcggctg aaccacatga gcaacaagac aaccagcagc aagaatatgg
88208820
aaatggtgca gcagaagaaa gagggcccca ttcctccaga cgctcagaac cccgatatga aaatggtgca gcagaagaaa gagggcccca ttcctccaga cgctcagaac cccgatatga
88808880
gcttcttcaa gatgctcttt ctgcccgaga gcgcccggtg gattcagaga acacacggca gcttcttcaa gatgctcttt ctgcccgaga gcgcccggtg gattcagaga acacacggca
89408940
agaactccct gaactccggc cagggacctt ctccaaagca gctggtttcc ctgggacctg agaactccct gaactccggc cagggacctt ctccaaagca gctggtttcc ctgggacctg
90009000
agaagtccgt ggaaggacag aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg agaagtccgt ggaaggacag aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg
90609060
gcgagttcac caaggatgtg ggcctgaaag agatggtctt tcccagcagc cggaacctgt gcgagttcac caaggatgtg ggcctgaaag agatggtctt tcccagcagc cggaacctgt
91209120
tcctgaccaa cctggacaac ctgcacgaga acaacaccca caatcaagag aagaagatcc tcctgaccaa cctggacaac ctgcacgaga acaacaccca caatcaagag aagaagatcc
91809180
aagaggaaat cgaaaagaaa gagacactca tccaagagaa cgtggtgctg cctcagatcc aagaggaaat cgaaaagaaa gagacactca tccaagagaa cgtggtgctg cctcagatcc
92409240
acacagtgac cggcaccaag aactttatga agaatctgtt cctgctgagt acccggcaga acacagtgac cggcaccaag aactttatga agaatctgtt cctgctgagt acccggcaga
93009300
acgtggaagg cagctacgat ggcgcttatg cccctgtgct gcaggacttc agatccctga acgtggaagg cagctacgat ggcgcttatg cccctgtgct gcaggacttc agatccctga
93609360
acgactccac caatcggaca aagaagcaca cagcccactt ctccaagaag ggcgaagaag acgactccac caatcggaca aagaagcaca cagcccactt ctccaagaag ggcgaagaag
94209420
agaacctgga aggactgggc aatcagacca agcagatcgt cgagaagtac gcctgcacca agaacctgga aggactgggc aatcagacca agcagatcgt cgagaagtac gcctgcacca
94809480
ccagaatcag ccccaacaca agccagcaga acttcgtgac ccagcggagc aaaagagccc ccagaatcag ccccaacaca agccagcaga acttcgtgac ccagcggagc aaaagagccc
95409540
tgaagcagtt tcggctgccc ctggaagaaa ccgagctgga aaagcggatc atcgtggacg tgaagcagtt tcggctgccc ctggaagaaa ccgagctgga aaagcggatc atcgtggacg
96009600
acaccagcac acagtggtcc aagaacatga agcacttgac ccctagcaca ctgacccaga acaccagcac acagtggtcc aagaacatga agcacttgac ccctagcaca ctgacccaga
96609660
tcgactacaa cgagaaagag aagggcgcta tcacacagag cccactgagc gactgtctga tcgactacaa cgagaaagag aagggcgcta tcacacagag cccactgagc gactgtctga
97209720
ccagaagcca cagcatccct caggccaaca gatcccctct gccaatcgcc aaagtgtcta ccagaagcca cagcatccct caggccaaca gatcccctct gccaatcgcc aaagtgtcta
97809780
gcttccccag catcagaccc atctacctga ccagagtgct gttccaggac aacagcagcc gcttccccag catcagaccc atctacctga cgagtgct gttccaggac aacagcagcc
98409840
atctgccagc cgccagctac cggaagaaag attctggcgt gcaagagagc agccactttc atctgccagc cgccagctac cggaagaaag attctggcgt gcaagagagc agccactttc
99009900
tgcagggcgc taagaagaac aatctgagcc tggctattct gaccctggaa atgaccggcg tgcagggcgc taagaagaac aatctgagcc tggctattct gaccctggaa atgaccggcg
99609960
atcagagaga agtcggctct ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg atcagagaga agtcggctct ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg
1002010020
tggaaaacac cgtgctgcct aagcctgacc tgccaaagac aagcggcaag gtggaactgc tggaaaacac cgtgctgcct aagcctgacc tgccaaagac aagcggcaag gtggaactgc
1008010080
tgccaaaggt gcacatctac cagaaggacc tgtttcctac cgagacaagc aacggctctc tgccaaaggt gcacatctac cagaaggacc tgtttcctac cgagacaagc aacggctctc
1014010140
ccggccatct ggatctggtg gaaggatctc tgctgcaggg aaccgagggc gccatcaagt ccggccatct ggatctggtg gaaggatctc tgctgcaggg aaccgagggc gccatcaagt
1020010200
ggaacgaggc caatagacct ggcaaggtgc ccttcctgag agtggccaca gagtccagcg ggaacgaggc caatagacct ggcaaggtgc ccttcctgag agtggccaca gagtccagcg
1026010260
ccaagacacc ctctaaactg ctggaccctc tggcctggga caaccactat ggcactcaga ccaagacacc ctctaaactg ctggaccctc tggcctggga caaccactat ggcactcaga
1032010320
tccccaaaga ggaatggaag tcccaagaga agtcccctga aaagaccgcc ttcaagaaga tccccaaaga ggaatggaag tcccaagaga agtcccctga aaagaccgcc ttcaagaaga
1038010380
aggacaccat tctgtccctg aatgcctgcg agagcaacca cgccattgcc gccatcaatg aggacaccat tctgtccctg aatgcctgcg agagcaacca cgccattgcc gccatcaatg
1044010440
agggccagaa caagcccgag atcgaagtga cctgggccaa gcagggaaga accgagagac agggccagaa caagcccgag atcgaagtga cctgggccaa gcagggaaga accgagagac
1050010500
tgtgtagcca gaatcctcct gtgctgaagc ggcaccagag agaaatcacc cggaccacac tgtgtagcca gaatcctcct gtgctgaagc ggcaccagag agaaatcacc cggaccacac
1056010560
tgcagagcga ccaagaagag atcgattacg acgataccat cagcgtcgag atgaagaaag tgcagagcga ccaagaagag atcgattacg acgataccat cagcgtcgag atgaagaaag
1062010620
aagatttcga catctacgac gaggacgaga atcagagccc tcggagcttc cagaagaaaa aagatttcga catctacgac gaggacgaga atcagagccc tcggagcttc cagaagaaaa
1068010680
ccaggcacta ctttattgcc gccgtcgagc ggctgtggga ctacggaatg tctagctctc ccaggcacta ctttattgcc gccgtcgagc ggctgtggga ctacggaatg tctagctctc
1074010740
ctcacgtgct gcggaataga gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt ctcacgtgct gcggaataga gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt
1080010800
tccaagagtt caccgacggc agcttcaccc agccactgta tagaggcgag ctgaacgagc tccaagagtt caccgacggc agcttcaccc agccactgta tagaggcgag ctgaacgagc
1086010860
atctgggcct gctgggccct tatatcagag ccgaagtgga agataacatc atggtcacct atctgggcct gctgggccct tatatcagag ccgaagtgga agataacatc atggtcacct
1092010920
tccggaatca ggctagccgg ccttacagct tctacagctc cctgatctcc tacgaagagg tccggaatca ggctagccgg ccttacagct tctacagctc cctgatctcc tacgaagagg
1098010980
accagagaca gggcgcagag ccccggaaga atttcgtgaa gcccaacgag actaagacct accagagaca gggcgcagag ccccggaaga atttcgtgaa gcccaacgag actaagacct
1104011040
acttttggaa ggtgcagcac catatggccc ctacaaagga cgagttcgac tgcaaagcct acttttggaa ggtgcagcac catatggccc ctacaaagga cgagttcgac tgcaaagcct
1110011100
gggcctactt ctccgatgtg gacctcgaaa aggacgtgca cagcggactc atcggcccac gggcctactt ctccgatgtg gacctcgaaa aggacgtgca cagcggactc atcggcccac
1116011160
tgcttgtgtg ccacaccaac acactgaacc ccgctcacgg cagacaagtg acagtgcaag tgcttgtgtg ccacaccaac acactgaacc ccgctcacgg cagacaagtg acagtgcaag
1122011220
agttcgccct gtttttcacc atcttcgacg aaacgaagtc ctggtacttc accgaaaaca agttcgccct gtttttcacc atcttcgacg aaacgaagtc ctggtacttc accgaaaaca
1128011280
tggaaagaaa ctgcagggcc ccttgcaaca ttcagatgga agatcccacc ttcaaagaga tggaaagaaa ctgcagggcc ccttgcaaca ttcagatgga agatcccacc ttcaaagaga
1134011340
actaccggtt ccacgccatc aacggctaca tcatggacac actgcccggc ctggttatgg actaccggtt ccacgccatc aacggctaca tcatggacac actgcccggc ctggttatgg
1140011400
cccaggatca gagaatccgg tggtatctgc tgtccatggg ctccaacgag aatatccact cccaggatca gagaatccgg tggtatctgc tgtccatggg ctccaacgag aatatccact
1146011460
ccatccactt cagcggccac gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc ccatccactt cagcggccac gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc
1152011520
tgtacaatct gtaccctggg gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa tgtacaatct gtaccctggg gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa
1158011580
tttggagagt ggaatgtctg attggagagc acctccacgc cgggatgagc accctgtttc tttggagagt ggaatgtctg attggagagc acctccacgc cgggatgagc accctgtttc
1164011640
tggtgtactc caacaagtgt cagacccctc tcggcatggc ctctggccac attagagact tggtgtactc caacaagtgt cagacccctc tcggcatggc ctctggccac attagagact
1170011700
tccagatcac cgccagcgga cagtatggac agtgggcccc taaactggcc agactgcact tccagatcac cgccagcgga cagtatggac agtgggcccc taaactggcc agactgcact
1176011760
actccggcag catcaatgcc tggtccacca aagagccttt cagctggatc aaagtggacc actccggcag catcaatgcc tggtccacca aagagccttt cagctggatc aaagtggacc
1182011820
tgctggctcc catgatcatc cacggaatca agacccaggg cgccagacaa aagttcagca tgctggctcc catgatcatc cacggaatca agacccaggg cgccagacaa aagttcagca
1188011880
gcctgtacat cagccagttc atcatcatgt acagcctgga cggaaagaag tggcagacct gcctgtacat cagccagttc atcatcatgt acagcctgga cggaaagaag tggcagacct
1194011940
accggggcaa tagcaccggc acactgatgg tgttcttcgg caacgtggac tccagcggca accggggcaa tagcaccggc acactgatgg tgttcttcgg caacgtggac tccagcggca
1200012000
ttaagcacaa catcttcaac cctccaatca ttgcccggta catccggctg caccccacac ttaagcacaa catcttcaac cctccaatca ttgcccggta catccggctg caccccacac
1206012060
actacagcat caggtctacc ctgagaatgg aactgatggg ctgcgacctg aacagctgct actacagcat caggtctacc ctgagaatgg aactgatggg ctgcgacctg aacagctgct
1212012120
ctatgcccct cggaatggaa agcaaggcca tcagcgacgc ccagatcaca gcctctagct ctatgcccct cggaatggaa agcaaggcca tcagcgacgc ccagatcaca gcctctagct
1218012180
acttcaccaa catgttcgcc acttggagcc cctctaaggc ccggcttcat ctgcaaggca acttcaccaa catgttcgcc acttggagcc cctctaaggc ccggcttcat ctgcaaggca
1224012240
gaagcaacgc ttggaggccc caagtgaaca accccaaaga atggctccag gtggactttc gaagcaacgc ttggaggccc caagtgaaca accccaaaga atggctccag gtggactttc
1230012300
agaaaaccat gaaagtgaca ggcgtgacca cacagggcgt caagtccctg ctgacctcta agaaaaccat gaaagtgaca ggcgtgacca cacagggcgt caagtccctg ctgacctcta
1236012360
tgtacgtgaa agagtttctg atcagctcca gccaggacgg ccaccagtgg accctgttct tgtacgtgaa agagtttctg atcagctcca gccaggacgg ccaccagtgg accctgttct
1242012420
tccagaacgg caaagtgaaa gtgttccagg gaaatcagga cagcttcaca cccgtggtca tccagaacgg caaagtgaaa gtgttccagg gaaatcagga cagcttcaca cccgtggtca
1248012480
atagtctgga cccaccactg ctgacccgct acctgcgaat tcaccctcag tcttgggtgc atagtctgga cccaccactg ctgacccgct acctgcgaat tcaccctcag tcttgggtgc
1254012540
accagattgc cctgcggatg gaagtgctgg gctgtgaagc tcaggacctc tactagttaa accagattgc cctgcggatg gaagtgctgg gctgtgaagc tcaggacctc tactagttaa
1260012600
ttaagagcat cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat ttaagagcat cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat
1266012660
acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt
1272012720
aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt
1278012780
acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat
1284012840
tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttatagc ctctgtatct
1290012900
agctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc agctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc
1296012960
tcttttagag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tcttttagag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc
1302013020
tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt
1308013080
cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg
1314013140
gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtctgtgc cttctagttg
1320013200
ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc
1326013260
cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc
1332013320
tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag
1338013380
gcatgctggg gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca gcatgctggg gatgcggtgg gctctatggc tctagagcat ggctacgtag ataagtagca
1344013440
tggcgggtta atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact tggcgggtta atcattaact acacctgcag gaggaacccc tagtgatgga gttggccact
1350013500
ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg
1356013560
ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc
1362013620
ggtaccaagc ttgtcgagaa gtactagagg atcataatca gccataccac atttgtagag ggtaccaagc ttgtcgagaa gtactagagg atcataatca gccataccac atttgtagag
1368013680
gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat
1374013740
gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc
1380013800
atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa
1386013860
ctcatcaatg tatcttatca tgtctggatc tgatcactga tatcgcctag gagatccgaa ctcatcaatg tatcttatca tgtctggatc tgatcactga tatcgcctag gagatccgaa
1392013920
ccagataagt gaaatctagt tccaaactat tttgtcattt ttaattttcg tattagctta cgataagt gaaatctagt tccaaactat tttgtcattt ttaattttcg tattagctta
1398013980
cgacgctaca cccagttccc atctattttg tcactcttcc ctaaataatc cttaaaaact cgacgctaca cccagttccc atctattttg tcactcttcc ctaaataatc cttaaaaact
1404014040
ccatttccac ccctcccagt tcccaactat tttgtccgcc cacagcgggg catttttctt ccatttccac ccctcccagt tcccaactat tttgtccgcc cacagcgggg catttttctt
1410014100
cctgttatgt ttttaatcaa acatcctgcc aactccatgt gacaaaccgt catcttcggc cctgttatgt ttttaatcaa acatcctgcc aactccatgt gacaaaccgt catcttcggc
1416014160
tactttttct ctgtcacaga atgaaaattt ttctgtcatc tcttcgttat taatgtttgt tactttttct ctgtcacaga atgaaaattt ttctgtcatc tcttcgttat taatgtttgt
1422014220
aattgactga atatcaacgc ttatttgcag cctgaatggc gaatgg aattgactga atatcaacgc ttatttgcag cctgaatggc gaatgg
1426614266
<210> 197<210> 197
<211> 11584<211> 11584
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 197<400> 197
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60 60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120 120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt
180 180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240 240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300 300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360 360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420 420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480 480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540 540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600 600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660 660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720 720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780 780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840 840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900 900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960 960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
10201020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
10801080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
11401140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
12001200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
12601260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
13201320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
13801380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
14401440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
15001500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
15601560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
16201620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
16801680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
17401740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
18001800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
18601860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
19201920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
19801980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
20402040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
21002100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
21602160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
22202220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
22802280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
23402340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
24002400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
24602460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
25202520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
25802580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
26402640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
27002700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
27602760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
28202820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
28802880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
29402940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
30003000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
30603060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
31203120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
31803180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
32403240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
33003300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
33603360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
34203420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
34803480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
35403540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
36003600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
36603660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
37203720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
37803780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
38403840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
39003900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
39603960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
40204020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
40804080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
41404140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
42004200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
42604260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
43204320
tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc
43804380
ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt
44404440
ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgaggtg
45004500
ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg
45604560
ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt
46204620
atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg
46804680
agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc
47404740
ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc
48004800
accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac
48604860
ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca
49204920
ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat
49804980
gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag
50405040
ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg
51005100
caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg
51605160
ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca
52205220
cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc
52805280
gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt
53405340
ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta
54005400
ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt
54605460
ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt ggttcattct caagcctcag acagtggttc aaagtttttt tcttccatt caggtgtcgt
55205520
gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc
55805580
tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg
56405640
actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc
57005700
ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca
57605760
ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta
58205820
caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc
58805880
ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg
59405940
acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca
60006000
cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga
60606060
catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag
61206120
ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt
61806180
tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca
62406240
gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga
63006300
acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact acggctacgt gaacagaagc ctgcctggac tgatcggctg cccagaaag tccgtgtact
63606360
ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca
64206420
ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga
64806480
ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc
65406540
accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc
66006600
tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga
66606660
tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg
67206720
ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt
67806780
acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg
68406840
gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga
69006900
cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg
69606960
gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca
70207020
tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg
70807080
tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg
71407140
tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca
72007200
gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct
72607260
acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc
73207320
tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc
73807380
tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc
74407440
actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg
75007500
cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg
75607560
gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg
76207620
gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca
76807680
gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca
77407740
ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca
78007800
atgccatcga gcctcggagc ttcagccaga atcctcctgt gctgaagcgg caccagcgcg atgccatcga gcctcggagc ttcagccaga atcctcctgt gctgaagcgg caccagcgcg
78607860
agatcaccag aacaaccctg cagagcgacc aagaggaaat cgattacgac gacaccatca agatcaccag aacaaccctg cagagcgacc aagaggaaat cgattacgac gacaccatca
79207920
gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat cagagcccca gcgtcgagat gaagaaagaa gatttcgaca tctacgacga ggacgagaat cagagcccca
79807980
gaagctttca gaaaaagacc cggcactact tcattgccgc cgtcgagaga ctgtgggact gaagctttca gaaaaagacc cggcactact tcattgccgc cgtcgagaga ctgtgggact
80408040
acggcatgtc tagcagccct cacgtgctga gaaatagagc ccagagcggc agcgtgcccc acggcatgtc tagcagccct cacgtgctga gaaatagagc ccagagcggc agcgtgcccc
81008100
agttcaagaa agtggtgttc caagagttca ccgacggcag cttcacccag ccactgtata agttcaagaa agtggtgttc caagagttca ccgacggcag cttcacccag ccactgtata
81608160
gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc gaagtggaag gaggcgagct gaacgagcat ctgggcctgc tgggccctta tatcagagcc gaagtggaag
82208220
ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc tacagctccc ataacatcat ggtcaccttc cggaatcagg ctagccggcc ttacagcttc tacagctccc
82808280
tgatcagcta cgaagaggac cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc tgatcagcta cgaagaggac cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc
83408340
ccaacgagac taagacctac ttttggaagg tgcagcacca catggcccct acaaaggacg ccaacgagac taagacctac ttttggaagg tgcagcacca catggcccct acaaaggacg
84008400
agttcgactg caaagcctgg gcctacttct ccgatgtgga tctggaaaag gacgtgcaca agttcgactg caaagcctgg gcctacttct ccgatgtgga tctggaaaag gacgtgcaca
84608460
gcgggctcat cggaccactg cttgtgtgcc acaccaacac actgaacccc gctcacggca gcgggctcat cggaccactg cttgtgtgcc acaccaacac actgaacccc gctcacggca
85208520
gacaagtgac agtgcaagag ttcgccctgt tcttcaccat cttcgacgaa acaaagagct gacaagtgac agtgcaagag ttcgccctgt tcttcaccat cttcgacgaa acaaagagct
85808580
ggtacttcac cgagaatatg gaacggaact gcagagcccc ttgcaacatc cagatggaag ggtacttcac cgagaatatg gaacggaact gcagagcccc ttgcaacatc cagatggaag
86408640
atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc atggacacac atcccacctt caaagagaac taccggttcc acgccatcaa cggctacatc atggacacac
87008700
tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg tccatgggct tgcccggcct ggttatggcc caggatcaga gaatccggtg gtatctgctg tccatgggct
87608760
ccaacgagaa tatccacagc atccacttca gcggccacgt gttcaccgtg cggaaaaaag ccaacgagaa tatccacagc atccacttca gcggccacgt gttcaccgtg cggaaaaaag
88208820
aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc gtggaaatgc aagagtacaa aatggccctg tacaatctgt accctggggt gttcgaaacc gtggaaatgc
88808880
tgccttccaa ggccggcatt tggagagtgg aatgtctgat tggagagcac ctccacgccg tgccttccaa ggccggcatt tggagagtgg aatgtctgat tggagagcac ctccacgccg
89408940
gaatgagcac cctgtttctg gtgtacagca acaagtgtca gacccctctc ggcatggcct gaatgagcac cctgtttctg gtgtacagca acaagtgtca gacccctctc ggcatggcct
90009000
ctggacacat cagagacttc cagatcaccg cctctggcca gtacggacag tgggctccta ctggacacat cagagacttc cagatcaccg cctctggcca gtacggacag tgggctccta
90609060
aactggctcg gctgcactac agcggcagca tcaatgcctg gtccaccaaa gagcccttca aactggctcg gctgcactac agcggcagca tcaatgcctg gtccaccaaa gagcccttca
91209120
gctggatcaa ggtggacctg ctggctccca tgatcatcca cggaatcaag acccagggcg gctggatcaa ggtggacctg ctggctccca tgatcatcca cggaatcaag acccaggcg
91809180
ccagacagaa gttcagcagc ctgtacatca gccagttcat catcatgtac agcctggacg cgacagaa gttcagcagc ctgtacatca gccagttcat catcatgtac agcctggacg
92409240
gcaagaagtg gcagacctac agaggcaaca gcaccggcac actcatggtg ttcttcggca gcaagaagtg gcagacctac agaggcaaca gcaccggcac actcatggtg ttcttcggca
93009300
acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt gcccggtaca acgtggactc cagcggcatt aagcacaaca tcttcaaccc tccaatcatt gcccggtaca
93609360
tccggctgca ccccacacac tacagcatcc ggtctaccct gagaatggaa ctgatgggct tccggctgca ccccacacac tacagcatcc ggtctaccct gagaatggaa ctgatgggct
94209420
gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc agcgacgccc gcgacctgaa cagctgctct atgcccctcg gaatggaaag caaggccatc agcgacgccc
94809480
agatcacagc cagcagctac ttcaccaaca tgttcgccac ttggagcccc tccaaggcta agatcacagc cagcagctac ttcaccaaca tgttcgccac ttggagcccc tccaaggcta
95409540
gactgcatct gcagggcaga agcaacgctt ggaggcccca agtgaacaac cccaaagagt gactgcatct gcagggcaga agcaacgctt ggaggcccca agtgaacaac cccaaagagt
96009600
ggctgcaggt tgactttcaa aagaccatga aagtgaccgg cgtgaccaca cagggcgtca ggctgcaggt tgactttcaa aagaccatga aagtgaccgg cgtgaccaca cagggcgtca
96609660
agtctctgct gacctctatg tacgtgaaag agttcctgat ctccagcagc caggacggcc agtctctgct gacctctatg tacgtgaaag agttcctgat ctccagcagc caggacggcc
97209720
atcagtggac cctgtttttc cagaacggca aagtgaaagt gttccagggc aatcaggaca atcagtggac cctgtttttc cagaacggca aagtgaaagt gttccagggc aatcaggaca
97809780
gcttcacacc cgtggtcaat tctctggacc ctccactgct gaccagatac ctgcggattc gcttcacacc cgtggtcaat tctctggacc ctccactgct gaccagatac ctgcggattc
98409840
accctcagtc ttgggtgcac cagatcgctc tgcggatgga agtgctgggc tgtgaagctc accctcagtc ttgggtgcac cagatcgctc tgcggatgga agtgctgggc tgtgaagctc
99009900
aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata tttgttctgt aggacctcta ctagttaatt aagagcatct taccgccatt tattcccata tttgttctgt
99609960
ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg gcaatcattt ttttcttgat ttgggtatac atttaaatgt taataaaaca aaatggtggg gcaatcattt
1002010020
acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca aacatgttaa acatttttag ggatatgtaa ttactagttc aggtgtattg ccacaagaca aacatgttaa
1008010080
gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt acaaaatttg gaaactttcc cgttatttac gctctgttcc tgttaatcaa cctctggatt acaaaatttg
1014010140
tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tgaaagattg actgatattc ttaactatgt tgctcctttt acgctgtgtg gatatgctgc
1020010200
tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct cctccttgta tttatagcct ctgtatctag ctattgcttc ccgtacggct ttcgttttct cctccttgta
1026010260
taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc aacgtggcgt taaatcctgg ttgctgtctc ttttagagga gttgtggccc gttgtccgtc aacgtggcgt
1032010320
ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca ccacctgtca ggtgtgctct gtgtttgctg acgcaacccc cactggctgg ggcattgcca ccacctgtca
1038010380
actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac tcatcgccgc actcctttct gggactttcg ctttccccct cccgatcgcc acggcagaac tcatcgccgc
1044010440
ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt ccgtggtgtt ctgccttgcc cgctgctgga caggggctag gttgctgggc actgataatt ccgtggtgtt
1050010500
gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac gtctgtgcct tctagttgcc agccatctgt tgtttgcccc tcccccgtgc cttccttgac
1056010560
cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg cctggaaggt gccactccca ctgtcctttc ctaataaaat gaggaaattg catcgcattg
1062010620
tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga tctgagtagg tgtcattcta ttctgggggg tggggtgggg caggacagca agggggagga
1068010680
ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc tagagcatgg ttgggaagac aatagcaggc atgctgggga tgcggtgggc tctatggctc tagagcatgg
1074010740
ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga ggaaccccta ctacgtagat aagtagcatg gcgggttaat cattaactac acctgcagga ggaaccccta
1080010800
gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca gtgatggagt tggccactcc ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca
1086010860
aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg aaggtcgccc gacgcccggg cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg
1092010920
gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat cataatcagc gcgcgcctcg aggcatgcgg taccaagctt gtcgagaagt actagaggat cataatcagc
1098010980
cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac cataccacat ttgtagaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac
1104011040
ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt
1110011100
tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct
1116011160
agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg atcactgata agttgtggtt tgtccaaact catcaatgta tcttatcatg tctggatctg atcactgata
1122011220
tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt tgtcattttt tcgcctagga gatccgaacc agataagtga aatctagttc caaactattt tgtcattttt
1128011280
aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc actcttccct aattttcgta ttagcttacg acgctacacc cagttcccat ctattttgtc actcttccct
1134011340
aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt tgtccgccca aaataatcct taaaaactcc atttccaccc ctcccagttc ccaactattt tgtccgccca
1140011400
cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa ctccatgtga cagcggggca tttttcttcc tgttatgttt ttaatcaaac atcctgccaa ctccatgtga
1146011460
caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt ctgtcatctc caaaccgtca tcttcggcta ctttttctct gtcacagaat gaaaattttt ctgtcatctc
1152011520
ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc tgaatggcga ttcgttatta atgtttgtaa ttgactgaat atcaacgctt atttgcagcc tgaatggcga
1158011580
atgg atgg
1158411584
<210> 198<210> 198
<211> 11558<211> 11558
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 198<400> 198
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60 60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120 120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt
180 180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240 240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300 300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360 360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420 420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480 480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540 540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600 600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660 660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720 720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780 780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840 840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900 900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960 960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
10201020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
10801080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
11401140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
12001200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
12601260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
13201320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
13801380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
14401440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
15001500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
15601560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
16201620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
16801680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
17401740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
18001800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
18601860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
19201920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
19801980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
20402040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
21002100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
21602160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
22202220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
22802280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
23402340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
24002400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
24602460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
25202520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
25802580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
26402640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
27002700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
27602760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
28202820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
28802880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
29402940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
30003000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
30603060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
31203120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
31803180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
32403240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
33003300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
33603360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
34203420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
34803480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
35403540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
36003600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
36603660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
37203720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
37803780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
38403840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
39003900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
39603960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
40204020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
40804080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
41404140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
42004200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
42604260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
43204320
tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca tagccatgct ctagagcggc cgcccctaaa atgggcaaac attgcaagca gcaaacagca
43804380
aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag agacctctct
44404440
gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca gggcccatgc cacctccaac atccactcga ccccttggaa tttttcggtg gagaggagca
45004500
gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc gaggttgtcc tggcgtggtt taggtagtgt gagaggggaa tgactccttt cggtaagtgc
45604560
agtggaagct gtacactgcc caggcaaagc gtccgggcag cgtaggcggg cgactcagat agtggaagct gtacactgcc caggcaaagc gtccggggcag cgtaggcggg cgactcagat
46204620
cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat cccagccagt ggacttagcc cctgtttgct cctccgataa ctggggtgac cttggttaat
46804680
attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac attcaccagc agcctccccc gttgcccctc tggatccact gcttaaatac ggacgaggac
47404740
agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc agggccctgt ctcctcagct tcaggcacca ccactgacct gggacagtga atccggactc
48004800
taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc taaggtaaat ataaaatttt taagtgtata atgtgttaaa ctactgattc taattgtttc
48604860
tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag tctcttttag attccaacct ttggaactga gtttaaaccg cagccaccat gcagatcgag
49204920
ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat ctgtctacct gcttcttcct gtgcctgctg cggttctgct tcagcgccac cagaagatat
49804980
tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc tacctgggcg ccgtggaact gagctgggac tacatgcagt ctgacctggg agagctgccc
50405040
gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg gtggacgcta gatttcctcc aagagtgccc aagagcttcc ccttcaacac ctccgtggtg
51005100
tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg tacaagaaaa ccctgttcgt ggaattcacc gaccacctgt tcaatatcgc caagcctcgg
51605160
cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc cctccttgga tgggactgct gggacctaca attcaggccg aggtgtacga caccgtggtc
52205220
atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat atcaccctga agaacatggc cagccatcct gtgtctctgc acgccgtggg agtgtcttat
52805280
tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac tggaaggctt ctgagggcgc cgagtacgac gatcagacaa gccagagaga gaaagaggac
53405340
gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc gacaaggttt tccctggcgg cagccacacc tatgtctggc aggtcctgaa agaaaacggc
54005400
cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc cctatggcct ccgatcctct gtgcctgaca tacagctacc tgagccacgt ggacctggtc
54605460
aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc aaggacctga attctggcct gatcggagcc ctgctcgtgt gtagagaagg cagcctggcc
55205520
aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc aaagagaaaa cccagacact gcacaagttc atcctgctgt tcgccgtgtt cgacgagggc
55805580
aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct aagagctggc acagcgagac aaagaacagc ctgatgcagg acagggatgc cgcctctgct
56405640
agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg agagcttggc ctaagatgca caccgtgaac ggctacgtga acagaagcct gcctggactg
57005700
atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag atcggctgcc acagaaagtc cgtgtactgg cacgtgatcg gcatgggcac aacacctgag
57605760
gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc gtgcacagca tctttctgga aggccacacc ttcctcgtgc ggaaccacag acaggccagc
58205820
ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag ctggaaatca gccctatcac cttcctgacc gctcagaccc tgctgatgga tctgggccag
58805880
tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag tttctgctgt tctgccacat cagctcccac cagcacgatg gcatggaagc ctacgtgaag
59405940
gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac gtggacagct gccccgaaga accccagctg cggatgaaga acaacgagga agccgaggac
60006000
tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc tacgacgacg acctgaccga ctctgagatg gacgtcgtca gattcgacga cgataacagc
60606060
cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat cccagcttca tccagatcag aagcgtggcc aagaagcacc ccaagacctg ggtgcactat
61206120
atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga atcgccgccg aggaagagga ctgggattac gctcctctgg tgctggcccc tgacgacaga
61806180
agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa agctacaaga gccagtacct gaacaacggc cctcagcgga tcggccggaa gtataagaaa
62406240
gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag gtgcggttca tggcctacac cgacgagaca ttcaagacca gagaggccat ccagcacgag
63006300
agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc agcggaattc tgggccctct gctgtatggc gaagtgggcg atacactgct gatcatcttc
63606360
aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc aagaaccagg ccagcagacc ctacaacatc taccctcacg gcatcaccga tgtgcggccc
64206420
ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct ctgtattcta gaaggctgcc caagggcgtg aagcacctga aggacttccc tatcctgcct
64806480
ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac ggcgagattt tcaagtacaa gtggaccgtg accgtggaag atggccccac caagagcgac
65406540
cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc cctagatgtc tgacacggta ctacagcagc ttcgtgaaca tggaacgcga cctggccagc
66006600
ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag ggcctgattg gacctctgct gatctgctac aaagaaagcg tggaccagcg gggcaaccag
66606660
atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg atcatgagcg acaagcggaa cgtgatcctg tttagcgtgt tcgatgagaa ccggtcctgg
67206720
tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat tatctgaccg agaacatcca gcggtttctg cccaatcctg ccggggtgca actggaagat
67806780
cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg cctgagttcc aggcaagcaa catcatgcac tccatcaatg gctatgtgtt cgacagcctg
68406840
cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag cagctgagcg tgtgcctgca cgaagtggcc tactggtaca tcctgagcat tggcgcccag
69006900
accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag accgacttcc tgtccgtgtt ctttagcggc tacaccttca agcacaagat ggtgtacgag
69606960
gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc gataccctga cactgttccc attcagcggc gagacagtgt tcatgagcat ggaaaacccc
70207020
ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg ggcctgtgga ttctgggctg tcacaacagc gacttccgga acagaggcat gacagccctg
70807080
ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac ctgaaggtgt ccagctgcga caagaacacc ggcgactact acgaggacag ctatgaggac
71407140
atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat atcagcgcct acctgctgag caagaacaat gccatcgagc ccagaagctt cagccagaat
72007200
agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac agcagacacc cctccaccag acagaagcag ttcaacgcca caacaatccc cgagaacgac
72607260
atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg atcgagaaaa ccgatccttg gtttgcccac agaaccccta tgcctaagat ccagaacgtg
73207320
tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg tcctccagcg atctgctgat gctcctgaga cagagcccta cacctcacgg actgagcctg
73807380
tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc tccgatctgc aagaggccaa atacgaaacc ttcagcgacg acccttctcc tggcgccatc
74407440
gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc gacagcaaca atagcctgag cgagatgacc cacttcagac cacagctgca ccacagcggc
75007500
gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc gacatggtgt ttacacctga gagcggcctc cagctgagac tgaatgagaa gctgggaacc
75607560
accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg accgccgcca ccgagctgaa gaaactggac ttcaaggtgt cctctaccag caacaacctg
76207620
atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc atcagcacaa tcccctccga caacctggct gccggcaccg acaacacatc ttctctgggc
76807680
ccacctagca tgcccgtgca ctacgatagc cagctggata ccacactgtt cggcaagaag ccacctagca tgcccgtgca ctacgatagc cagctggata cccacactgtt cggcaagaag
77407740
tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc tctagccctc tgacagagtc tggcggccct ctgtctctga gcgaggaaaa caacgacagc
78007800
aagctgcctc ctgtgctgaa gcggcaccag cgggaaatca ccagaaccac actgcagagc aagctgcctc ctgtgctgaa gcggcaccag cgggaaatca ccagaaccac actgcagagc
78607860
gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc
79207920
gacatctacg acgaggacga gaatcagagc cccagatcct ttcagaaaaa gacccggcac gacatctacg acgaggacga gaatcagagc cccagatcct ttcagaaaaa gacccggcac
79807980
tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg
80408040
ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag
81008100
ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc
81608160
ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat
82208220
caggctagcc ggccttacag cttctacagc tccctgatct cctacgaaga ggaccagaga caggctagcc ggccttacag cttctacagc tccctgatct cctacgaaga ggaccagaga
82808280
cagggcgctg agccccggaa gaatttcgtg aagcccaacg agactaagac ctacttttgg cagggcgctg agccccggaa gaatttcgtg aagcccaacg agactaagac ctacttttgg
83408340
aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac
84008400
ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg
84608460
tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc
85208520
ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg
85808580
aactgcaggg ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg aactgcaggg ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg
86408640
ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat
87008700
cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac
87608760
ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat
88208820
ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga
88808880
gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac
89408940
tccaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc tccaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc
90009000
accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctactccggc accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctactccggc
90609060
agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct
91209120
cccatgatca tccacggaat caagacccag ggcgcaagac agaagttcag cagcctgtac cccatgatca tccacggaat caagacccag ggcgcaagac agaagttcag cagcctgtac
91809180
atcagccagt tcatcatcat gtacagcctg gacggaaaga agtggcagac ctaccggggc atcagccagt tcatcatcat gtacagcctg gacggaaaga agtggcagac ctaccggggc
92409240
aatagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac aatagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac
93009300
aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc
93609360
atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc
94209420
ctcggaatgg aaagcaaggc catcagcgac gcccagatca cagccagcag ctacttcacc ctcggaatgg aaagcaaggc catcagcgac gccgatca cagccagcag ctacttcacc
94809480
aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac
95409540
gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc
96009600
atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg
96609660
aaagagttcc tgattagcag cagccaggac ggccaccagt ggaccctgtt tttccagaac aaagagttcc tgattagcag cagccaggac ggccaccagt ggaccctgtt tttccagaac
97209720
ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg
97809780
gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc
98409840
gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc
99009900
atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa
99609960
atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta
1002010020
gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg
1008010080
ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact
1014010140
atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg
1020010200
cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag
1026010260
aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa
1032010320
cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc
1038010380
ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacaggg
1044010440
ctaggttgct gggcactgat aattccgtgg tgttgtctgt gccttctagt tgccagccat ctaggttgct gggcactgat aattccgtgg tgttgtctgt gccttctagt tgccagccat
1050010500
ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc ctgttgtttg cccctccccc gtgccttcct tgaccctgga aggtgccact cccactgtcc
1056010560
tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg tttcctaata aaatgaggaa attgcatcgc attgtctgag taggtgtcat tctattctgg
1062010620
ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg ggggtggggt ggggcaggac agcaaggggg aggattggga agacaatagc aggcatgctg
1068010680
gggatgcggt gggctctatg gctctagagc atggctacgt agataagtag catggcgggt gggatgcggt gggctctatg gctctagagc atggctacgt agataagtag catggcgggt
1074010740
taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct
1080010800
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct
1086010860
cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa
1092010920
gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact
1098010980
tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt
1104011040
tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa
1110011100
tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa
1116011160
tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa
1122011220
gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta
1128011280
cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccatttcc cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccattcc
1134011340
acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat
1140011400
gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt
1146011460
ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact
1152011520
gaatatcaac gcttatttgc agcctgaatg gcgaatgg gaatatcaac gcttatttgc agcctgaatg gcgaatgg
1155811558
<210> 199<210> 199
<211> 12190<211> 12190
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 199<400> 199
gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc
60 60
gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc
120 120
acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt acgttcgccg gctttccccg tcaagctcta aatcggggggc tccctttagg gttccgattt
180 180
agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg
240 240
ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt
300 300
ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta
360 360
taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt
420 420
aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat
480 480
gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg
540 540
agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa
600 600
catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac
660 660
ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac
720 720
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt
780 780
ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc
840 840
gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca
900 900
ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc
960 960
ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag
10201020
gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa
10801080
ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg
11401140
gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa
12001200
ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg
12601260
gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt
13201320
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt
13801380
caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag
14401440
cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat
15001500
ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct
15601560
taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct
16201620
tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca
16801680
gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc
17401740
agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc
18001800
aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct
18601860
gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag
19201920
gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc
19801980
tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg
20402040
agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag
21002100
cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt
21602160
gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac
22202220
gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg
22802280
ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc
23402340
cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg
24002400
cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct
24602460
ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga
25202520
caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag
25802580
acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt
26402640
tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga
27002700
ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac
27602760
aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg
28202820
tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg
28802880
ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca
29402940
tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact
30003000
gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc
30603060
gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta
31203120
cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct
31803180
ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg
32403240
agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg
33003300
ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca
33603360
tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa
34203420
acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa
34803480
ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca
35403540
ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac
36003600
cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc
36603660
ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg
37203720
cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt
37803780
ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt
38403840
gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa
39003900
tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt
39603960
ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca
40204020
ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg
40804080
attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga tccggccggc
41404140
ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt ccctgcaggc agctgcgcgc tcgctcgctc actgaggccg cccgggcaaa gcccgggcgt
42004200
cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc
42604260
aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg aactccatca ctaggggttc cttgtagtta atgattaacc cgccatgcta cttatctacg
43204320
tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc tagccatgct ctagagcggc cgcggctccg gtgcccgtca gtgggcagag cgcacatcgc
43804380
ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt ccacagtccc cgagaagttg gggggagggg tcggcaattg aaccggtgcc tagagaaggt
44404440
ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgagggtg ggcgcggggt aaactgggaa agtgatgtcg tgtactggct ccgccttttt cccgaggtg
45004500
ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg ggggagaacc gtatataagt gcagtagtcg ccgtgaacgt tctttttcgc aacgggtttg
45604560
ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt ccgccagaac acaggtaagt gccgtgtgtg gttcccgcgg gcctggcctc tttacgggtt
46204620
atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg atggcccttg cgtgccttga attacttcca cctggctgca gtacgtgatt cttgatcccg
46804680
agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc
47404740
ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc
48004800
accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac
48604860
ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca
49204920
ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat
49804980
gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag
50405040
ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg ctggccggcc tgctctggtg cctggtctcg cgccgccgtg tatcgccccg ccctgggcgg
51005100
caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg
51605160
ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca
52205220
cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc
52805280
gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt
53405340
ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta
54005400
ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt
54605460
ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt ggttcattct caagcctcag acagtggttc aaagtttttt tcttccatt caggtgtcgt
55205520
gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc gagtttaaac cgcagccacc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc
55805580
tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg tgcggttctg cttcagcgcc accagaagat attacctggg cgccgtggaa ctgagctggg
56405640
actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc actacatgca gtctgacctg ggagagctgc ccgtggacgc tagatttcct ccaagagtgc
57005700
ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccaagagctt ccccttcaac acctccgtgg tgtacaagaa aaccctgttc gtggaattca
57605760
ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta ccgaccacct gttcaatatc gccaagcctc ggcctccttg gatgggactg ctgggaccta
58205820
caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc caattcaggc cgaggtgtac gacaccgtgg tcatcaccct gaagaacatg gccagccatc
58805880
ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg ctgtgtctct gcacgccgtg ggagtgtctt attggaaggc ttctgagggc gccgagtacg
59405940
acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca acgatcagac aagccagaga gagaaagagg acgacaaggt tttccctggc ggcagccaca
60006000
cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga cctatgtctg gcaggtcctg aaagaaaacg gccctatggc ctccgatcct ctgtgcctga
60606060
catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag catacagcta cctgagccac gtggacctgg tcaaggacct gaattctggc ctgatcggag
61206120
ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt ccctgctcgt gtgtagagaa ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt
61806180
tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca tcatcctgct gttcgccgtg ttcgacgagg gcaagagctg gcacagcgag acaaagaaca
62406240
gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga gcctgatgca ggacagggat gccgcctctg ctagagcttg gcctaagatg cacaccgtga
63006300
acggctacgt gaacagaagc ctgcctggac tgatcggctg ccacagaaag tccgtgtact acggctacgt gaacagaagc ctgcctggac tgatcggctg cccagaaag tccgtgtact
63606360
ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca ggcacgtgat cggcatgggc acaacacctg aggtgcacag catctttctg gaaggccaca
64206420
ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga ccttcctcgt gcggaaccac agacaggcca gcctggaaat cagccctatc accttcctga
64806480
ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc ccgctcagac cctgctgatg gatctgggcc agtttctgct gttctgccac atcagctccc
65406540
accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc accagcacga tggcatggaa gcctacgtga aggtggacag ctgccccgaa gaaccccagc
66006600
tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga tgcggatgaa gaacaacgag gaagccgagg actacgacga cgacctgacc gactctgaga
66606660
tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg tggacgtcgt cagattcgac gacgataaca gccccagctt catccagatc agaagcgtgg
67206720
ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt ccaagaagca ccccaagacc tgggtgcact atatcgccgc cgaggaagag gactgggatt
67806780
acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg acgctcctct ggtgctggcc cctgacgaca gaagctacaa gagccagtac ctgaacaacg
68406840
gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga gccctcagcg gatcggccgg aagtataaga aagtgcggtt catggcctac accgacgaga
69006900
cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg cattcaagac cagagaggcc atccagcacg agagcggaat tctgggccct ctgctgtatg
69606960
gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca gcgaagtggg cgatacactg ctgatcatct tcaagaacca ggccagcaga ccctacaaca
70207020
tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tctaccctca cggcatcacc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg
70807080
tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaagcacct gaaggacttc cctatcctgc ctggcgagat tttcaagtac aagtggaccg
71407140
tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca tgaccgtgga agatggcccc accaagagcg accctagatg tctgacacgg tactacagca
72007200
gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct gcttcgtgaa catggaacgc gacctggcca gcggcctgat tggacctctg ctgatctgct
72607260
acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc acaaagaaag cgtggaccag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc
73207320
tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgtttagcgt gttcgatgag aaccggtcct ggtatctgac cgagaacatc cagcggtttc
73807380
tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc tgcccaatcc tgccggggtg caactggaag atcctgagtt ccaggcaagc aacatcatgc
74407440
actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg actccatcaa tggctatgtg ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg
75007500
cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg cctactggta catcctgagc attggcgccc agaccgactt cctgtccgtg ttctttagcg
75607560
gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg gctacacctt caagcacaag atggtgtacg aggataccct gacactgttc ccattcagcg
76207620
gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgagacagt gttcatgagc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca
76807680
gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca gcgacttccg gaacagaggc atgacagccc tgctgaaggt gtccagctgc gacaagaaca
77407740
ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca ccggcgacta ctacgaggac agctatgagg acatcagcgc ctacctgctg agcaagaaca
78007800
atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc atgccatcga gcccagaagc ttcagccaga atagcagaca cccctccacc agacagaagc
78607860
agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc agttcaacgc cacaacaatc cccgagaacg acatcgagaa aaccgatcct tggtttgccc
79207920
acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga acagaacccc tatgcctaag atccagaacg tgtcctccag cgatctgctg atgctcctga
79807980
gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa gacagagccc tacacctcac ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa
80408040
ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga ccttcagcga cgacccttct cctggcgcca tcgacagcaa caatagcctg agcgagatga
81008100
cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc cccacttcag accacagctg caccacagcg gcgacatggt gtttacacct gagagcggcc
81608160
tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg tccagctgag actgaatgag aagctgggaa ccaccgccgc caccgagctg aagaaactgg
82208220
acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg acttcaaggt gtcctctacc agcaacaacc tgatcagcac aatcccctcc gacaacctgg
82808280
ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata ctgccggcac cgacaacaca tcttctctgg gcccacctag catgcccgtg cactacgata
83408340
gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc gccagctgga taccacactg ttcggcaaga agtctagccc tctgacagag tctggcggcc
84008400
ctctgtctct gagcgaggaa aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc ctctgtctct gagcgaggaa aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc
84608460
agcgggaaat caccagaacc acactgcaga gcgaccaaga ggaaatcgat tacgacgaca agcgggaaat caccagaacc acactgcaga gcgaccaaga ggaaatcgat tacgacgaca
85208520
ccatcagcgt cgagatgaag aaagaagatt tcgacatcta cgacgaggac gagaatcaga ccatcagcgt cgagatgaag aaagaagatt tcgacatcta cgacgaggac gagaatcaga
85808580
gccccagatc ctttcagaaa aagacccggc actacttcat tgccgccgtc gagagactgt gccccagatc ctttcagaaa aagacccggc actacttcat tgccgccgtc gagagactgt
86408640
gggactacgg catgtctagc agccctcacg tgctgagaaa tagagcccag agcggcagcg gggactacgg catgtctagc agccctcacg tgctgagaaa tagagcccag agcggcagcg
87008700
tgccccagtt caagaaagtg gtgttccaag agttcaccga cggcagcttc acccagccac tgccccagtt caagaaagtg gtgttccaag agttcaccga cggcagcttc acccagccac
87608760
tgtatagagg cgagctgaac gagcatctgg gcctgctggg cccttatatc agagccgaag tgtatagagg cgagctgaac gagcatctgg gcctgctggg cccttatatc agagccgaag
88208820
tggaagataa catcatggtc accttccgga atcaggctag ccggccttac agcttctaca tggaagataa catcatggtc accttccgga atcaggctag ccggccttac agcttctaca
88808880
gctccctgat ctcctacgaa gaggaccaga gacagggcgc tgagccccgg aagaatttcg gctccctgat ctcctacgaa gaggaccaga gacagggcgc tgagccccgg aagaatttcg
89408940
tgaagcccaa cgagactaag acctactttt ggaaggtgca gcaccacatg gcccctacaa tgaagcccaa cgagactaag acctactttt ggaaggtgca gcaccacatg gcccctacaa
90009000
aggacgagtt cgactgcaaa gcctgggcct acttctccga tgtggatctg gaaaaggacg aggacgagtt cgactgcaaa gcctgggcct acttctccga tgtggatctg gaaaaggacg
90609060
tgcacagcgg gctcatcgga ccactgcttg tgtgccacac caacacactg aaccccgctc tgcacagcgg gctcatcgga ccactgcttg tgtgccacac caacacactg aaccccgctc
91209120
acggcagaca agtgacagtg caagagttcg ccctgttctt caccatcttc gacgaaacaa acggcagaca agtgacagtg caagagttcg ccctgttctt caccatcttc gacgaaacaa
91809180
agagctggta cttcaccgag aatatggaac ggaactgcag ggccccttgc aacatccaga agagctggta cttcaccgag aatatggaac ggaactgcag ggccccttgc aacatccaga
92409240
tggaagatcc caccttcaaa gagaactacc ggttccacgc catcaacggc tacatcatgg tggaagatcc caccttcaaa gagaactacc ggttccacgc catcaacggc tacatcatgg
93009300
acacactgcc cggcctggtt atggcccagg atcagagaat ccggtggtat ctgctgtcca acacactgcc cggcctggtt atggcccagg atcagagaat ccggtggtat ctgctgtcca
93609360
tgggctccaa cgagaatatc cacagcatcc acttcagcgg ccacgtgttc accgtgcgga tgggctccaa cgagaatatc cacagcatcc acttcagcgg ccacgtgttc accgtgcgga
94209420
aaaaagaaga gtacaaaatg gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg aaaaagaaga gtacaaaatg gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg
94809480
aaatgctgcc ttccaaggcc ggcatttgga gagtggaatg tctgattgga gagcacctcc aaatgctgcc ttccaaggcc ggcatttgga gagtggaatg tctgattgga gagcacctcc
95409540
acgccggaat gagcaccctg tttctggtgt actccaacaa gtgtcagacc cctctcggca acgccggaat gagcaccctg tttctggtgt actccaacaa gtgtcagacc cctctcggca
96009600
tggcctctgg acacatcaga gacttccaga tcaccgcctc tggccagtac ggacagtggg tggcctctgg acacatcaga gacttccaga tcaccgcctc tggccagtac ggacagtggg
96609660
ctcctaaact ggctcggctg cactactccg gcagcatcaa tgcctggtcc accaaagagc ctcctaaact ggctcggctg cactactccg gcagcatcaa tgcctggtcc accaaagagc
97209720
ccttcagctg gatcaaggtg gacctgctgg ctcccatgat catccacgga atcaagaccc ccttcagctg gatcaaggtg gacctgctgg ctcccatgat catccacgga atcaagaccc
97809780
agggcgcaag acagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc agggcgcaag acagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc
98409840
tggacggaaa gaagtggcag acctaccggg gcaatagcac cggcacactc atggtgttct tggacggaaa gaagtggcag acctaccggg gcaatagcac cggcacactc atggtgttct
99009900
tcggcaacgt ggactccagc ggcattaagc acaacatctt caaccctcca atcattgccc tcggcaacgt ggactccagc ggcattaagc acaacatctt caaccctcca atcattgccc
99609960
ggtacatccg gctgcacccc acacactaca gcatccggtc taccctgaga atggaactga ggtacatccg gctgcacccc acaactaca gcatccggtc taccctgaga atggaactga
1002010020
tgggctgcga cctgaacagc tgctctatgc ccctcggaat ggaaagcaag gccatcagcg tgggctgcga cctgaacagc tgctctatgc ccctcggaat ggaaagcaag gccatcagcg
1008010080
acgcccagat cacagccagc agctacttca ccaacatgtt cgccacttgg agcccctcca acgcccagat cacagccagc agctacttca ccaacatgtt cgccacttgg agcccctcca
1014010140
aggctagact gcatctgcag ggcagaagca acgcttggag gccccaagtg aacaacccca aggctagact gcatctgcag ggcagaagca acgcttggag gccccaagtg aacaacccca
1020010200
aagagtggct gcaggttgac tttcaaaaga ccatgaaagt gaccggcgtg accacacagg aagagtggct gcaggttgac tttcaaaaga ccatgaaagt gaccggcgtg accacacagg
1026010260
gcgtcaagtc tctgctgacc tctatgtacg tgaaagagtt cctgattagc agcagccagg gcgtcaagtc tctgctgacc tctatgtacg tgaaagagtt cctgattagc agcagccagg
1032010320
acggccacca gtggaccctg tttttccaga acggcaaagt gaaagtgttc cagggcaatc acggccacca gtggaccctg tttttccaga acggcaaagt gaaagtgttc cagggcaatc
1038010380
aggacagctt cacacccgtg gtcaattctc tggaccctcc actgctgacc agatacctgc aggacagctt cacacccgtg gtcaattctc tggaccctcc actgctgacc agatacctgc
1044010440
ggattcaccc tcagtcttgg gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg ggattcaccc tcagtcttgg gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg
1050010500
aagctcagga cctctactag ttaattaaga gcatcttacc gccatttatt cccatatttg aagctcagga cctctactag ttaattaaga gcatcttacc gccatttatt cccatatttg
1056010560
ttctgttttt cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa ttctgttttt cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa
1062010620
tcatttacat ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca tcatttacat ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca
1068010680
tgttaagaaa ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa tgttaagaaa ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa
1074010740
aatttgtgaa agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata aatttgtgaa agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata
1080010800
tgctgcttta tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc tgctgcttta tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc
1086010860
cttgtataaa tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg cttgtataaa tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg
1092010920
tggcgtggtg tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac tggcgtggtg tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac
1098010980
ctgtcaactc ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat ctgtcaactc ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat
1104011040
cgccgcctgc cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt cgccgcctgc cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt
1110011100
ggtgttgtct gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc ggtgttgtct gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc
1116011160
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc
1122011220
gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg
1128011280
ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga
1134011340
gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa
1140011400
cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg
1146011460
cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct
1152011520
gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata
1158011580
atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc
1164011640
ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat
1170011700
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg
1176011760
cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca
1182011820
ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc
1188011880
atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc
1194011940
ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc
1200012000
cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc
1206012060
atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt
1212012120
catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa
1218012180
tggcgaatgg tggcgaatgg
1219012190
<210> 200<210> 200
<211> 12165<211> 12165
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 200<400> 200
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat
60 60
aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg
120 120
aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta
180 180
gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt
240 240
atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg
300 300
cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag
360 360
cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc
420 420
cgccatgcta cttatcgcgg ccgctcaata ttggccatta gccatattat tcattggtta cgccatgcta cttatcgcgg ccgctcaata ttggccatta gccatattat tcattggtta
480 480
tatagcataa atcaatattg gctattggcc attgcatacg ttgtatctat atcataatat tatagcataa atcaatattg gctattggcc attgcatacg ttgtatctat atcataatat
540 540
gtacatttat attggctcat gtccaatatg accgccatgt tggcattgat tattgactag gtacatttat attggctcat gtccaatatg accgccatgt tggcattgat tattgactag
600 600
ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt
660 660
tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac
720 720
gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg
780 780
ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag
840 840
tccgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat tccgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat
900 900
gaccttacgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat gaccttacgg gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat
960 960
ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct ccccaccccc ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct ccccaccccc
10201020
aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg gggggggggg aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg gggggggggg
10801080
ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg
11401140
tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg
12001200
gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg cgacgctgcc gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg ggagtcgctg cgacgctgcc
12601260
ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc tgactgaccg ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc tgactgaccg
13201320
cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt aattagcgct cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt aattagcgct
13801380
tggtttaatg acggcttgtt tcttttctgt ggctgcgtga aagccttgag gggctccggg tggtttaatg acggcttgtt tcttttctgt ggctgcgtga aagccttgag gggctccggg
14401440
agggcccttt gtgcgggggg gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg agggcccttt gtgcgggggg gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg
15001500
agcgccgcgt gcggcccgcg ctgcccggcg gctgtgagcg ctgcgggcgc ggcgcggggc agcgccgcgt gcggcccgcg ctgcccggcg gctgtgagcg ctgcgggcgc ggcgcggggc
15601560
tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg gggcggtgcc ccgcggtgcg tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg gggcggtgcc ccgcggtgcg
16201620
gggggggctg cgaggggaac aaaggctgcg tgcggggtgt gtgcgtgggg gggtgagcag gggggggctg cgaggggaac aaaggctgcg tgcggggtgt gtgcgtgggg gggtgagcag
16801680
ggggtgtggg cgcggcggtc gggctgtaac ccccccctgc acccccctcc ccgagttgct ggggtgtggg cgcggcggtc gggctgtaac ccccccctgc acccccctcc ccgagttgct
17401740
gagcacggcc cggcttcggg tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg gagcacggcc cggcttcggg tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg
18001800
ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg ccgggcgggg ggtggcggca ggtggggggtg ccgggcgggg cggggccgcc tcgggccggg
18601860
gagggctcgg gggaggggcg cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg gagggctcgg gggaggggcg cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg
19201920
agccgcagcc attgcctttt atggtaatcg tgcgagaggg cgcagggact tcctttgtcc agccgcagcc attgcctttt atggtaatcg tgcgagaggg cgcagggact tcctttgtcc
19801980
caaatctgtg cggagccgaa atctgggagg cgccgccgca ccccctctag cgggcgcggg caaatctgtg cggagccgaa atctgggagg cgccgccgca ccccctctag cgggcgcggg
20402040
gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg agggccttcg tgcgtcgccg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg agggccttcg tgcgtcgccg
21002100
cgccgccgtc cccttctccc tctccagcct cggggctgtc cgcgggggga cggctgcctt cgccgccgtc cccttctccc tctccagcct cggggctgtc cgcgggggga cggctgcctt
21602160
tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg gctctagagc tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg gctctagagc
22202220
ctctgctaac catgttttag cctttcttct ttttcctaca gctcctgggc aacgtgctgg ctctgctaac catgttttag cctttcttct ttttcctaca gctcctgggc aacgtgctgg
22802280
ttattgtgct gtctcatcat ttgtcgacag aattcctcga agatccgaag gggttcaagc ttattgtgct gtctcatcat ttgtcgacag aattcctcga agatccgaag gggttcaagc
23402340
ttggcattcc ggtactgttg gtaaagccag tttaaaccgc agccaccatg cagatcgagc ttggcattcc ggtactgttg gtaaagccag tttaaaccgc agccaccatg cagatcgagc
24002400
tgtctacctg cttcttcctg tgcctgctgc ggttctgctt cagcgccacc agaagatatt tgtctacctg cttcttcctg tgcctgctgc ggttctgctt cagcgccacc agaagatatt
24602460
acctgggcgc cgtggaactg agctgggact acatgcagtc tgacctggga gagctgcccg acctgggcgc cgtggaactg agctgggact acatgcagtc tgacctggga gagctgcccg
25202520
tggacgctag atttcctcca agagtgccca agagcttccc cttcaacacc tccgtggtgt tggacgctag atttcctcca agagtgccca agagcttccc cttcaacacc tccgtggtgt
25802580
acaagaaaac cctgttcgtg gaattcaccg accacctgtt caatatcgcc aagcctcggc acaagaaaac cctgttcgtg gaattcaccg accacctgtt caatatcgcc aagcctcggc
26402640
ctccttggat gggactgctg ggacctacaa ttcaggccga ggtgtacgac accgtggtca ctccttggat gggactgctg ggacctacaa ttcaggccga ggtgtacgac accgtggtca
27002700
tcaccctgaa gaacatggcc agccatcctg tgtctctgca cgccgtggga gtgtcttatt tcaccctgaa gaacatggcc agccatcctg tgtctctgca cgccgtggga gtgtcttatt
27602760
ggaaggcttc tgagggcgcc gagtacgacg atcagacaag ccagagagag aaagaggacg ggaaggcttc tgagggcgcc gagtacgacg atcagacaag cccagagag aaagaggacg
28202820
acaaggtttt ccctggcggc agccacacct atgtctggca ggtcctgaaa gaaaacggcc acaaggtttt ccctggcggc agccacacct atgtctggca ggtcctgaaa gaaaacggcc
28802880
ctatggcctc cgatcctctg tgcctgacat acagctacct gagccacgtg gacctggtca ctatggcctc cgatcctctg tgcctgacat acagctacct gagccacgtg gacctggtca
29402940
aggacctgaa ttctggcctg atcggagccc tgctcgtgtg tagagaaggc agcctggcca aggacctgaa ttctggcctg atcggagccc tgctcgtgtg tagagaaggc agcctggcca
30003000
aagagaaaac ccagacactg cacaagttca tcctgctgtt cgccgtgttc gacgagggca aagagaaaac cgagacactg cacaagttca tcctgctgtt cgccgtgttc gacgagggca
30603060
agagctggca cagcgagaca aagaacagcc tgatgcagga cagggatgcc gcctctgcta agagctggca cagcgagaca aagaacagcc tgatgcagga cagggatgcc gcctctgcta
31203120
gagcttggcc taagatgcac accgtgaacg gctacgtgaa cagaagcctg cctggactga gagcttggcc taagatgcac accgtgaacg gctacgtgaa cagaagcctg cctggactga
31803180
tcggctgcca cagaaagtcc gtgtactggc acgtgatcgg catgggcaca acacctgagg tcggctgcca cagaaagtcc gtgtactggc acgtgatcgg catgggcaca acacctgagg
32403240
tgcacagcat ctttctggaa ggccacacct tcctcgtgcg gaaccacaga caggccagcc tgcacagcat ctttctggaa ggccacacct tcctcgtgcg gaaccacaga caggccagcc
33003300
tggaaatcag ccctatcacc ttcctgaccg ctcagaccct gctgatggat ctgggccagt tggaaatcag ccctatcacc ttcctgaccg ctcagaccct gctgatggat ctgggccagt
33603360
ttctgctgtt ctgccacatc agctcccacc agcacgatgg catggaagcc tacgtgaagg ttctgctgtt ctgccacatc agctcccacc agcacgatgg catggaagcc tacgtgaagg
34203420
tggacagctg ccccgaagaa ccccagctgc ggatgaagaa caacgaggaa gccgaggact tggacagctg ccccgaagaa ccccagctgc ggatgaagaa caacgaggaa gccgaggact
34803480
acgacgacga cctgaccgac tctgagatgg acgtcgtcag attcgacgac gataacagcc acgacgacga cctgaccgac tctgagatgg acgtcgtcag attcgacgac gataacagcc
35403540
ccagcttcat ccagatcaga agcgtggcca agaagcaccc caagacctgg gtgcactata ccagcttcat ccagatcaga agcgtggcca agaagcaccc caagacctgg gtgcactata
36003600
tcgccgccga ggaagaggac tgggattacg ctcctctggt gctggcccct gacgacagaa tcgccgccga ggaagaggac tgggattacg ctcctctggt gctggcccct gacgacagaa
36603660
gctacaagag ccagtacctg aacaacggcc ctcagcggat cggccggaag tataagaaag gctacaagag ccagtacctg aacaacggcc ctcagcggat cggccggaag tataagaaag
37203720
tgcggttcat ggcctacacc gacgagacat tcaagaccag agaggccatc cagcacgaga tgcggttcat ggcctacacc gacgagacat tcaagaccag agaggccatc cagcacgaga
37803780
gcggaattct gggccctctg ctgtatggcg aagtgggcga tacactgctg atcatcttca gcggaattct gggccctctg ctgtatggcg aagtgggcga tacactgctg atcatcttca
38403840
agaaccaggc cagcagaccc tacaacatct accctcacgg catcaccgat gtgcggcccc agaaccaggc cagcagaccc tacaacatct accctcacgg catcaccgat gtgcggcccc
39003900
tgtattctag aaggctgccc aagggcgtga agcacctgaa ggacttccct atcctgcctg tgtattctag aaggctgccc aagggcgtga agcacctgaa ggacttccct atcctgcctg
39603960
gcgagatttt caagtacaag tggaccgtga ccgtggaaga tggccccacc aagagcgacc gcgagatttt caagtacaag tggaccgtga ccgtggaaga tggccccacc aagagcgacc
40204020
ctagatgtct gacacggtac tacagcagct tcgtgaacat ggaacgcgac ctggccagcg ctagatgtct gacacggtac tacagcagct tcgtgaacat ggaacgcgac ctggccagcg
40804080
gcctgattgg acctctgctg atctgctaca aagaaagcgt ggaccagcgg ggcaaccaga gcctgattgg acctctgctg atctgctaca aagaaagcgt ggaccagcgg ggcaaccaga
41404140
tcatgagcga caagcggaac gtgatcctgt ttagcgtgtt cgatgagaac cggtcctggt tcatgagcga caagcggaac gtgatcctgt ttagcgtgtt cgatgagaac cggtcctggt
42004200
atctgaccga gaacatccag cggtttctgc ccaatcctgc cggggtgcaa ctggaagatc atctgaccga gaacatccag cggtttctgc ccaatcctgc cggggtgcaa ctggaagatc
42604260
ctgagttcca ggcaagcaac atcatgcact ccatcaatgg ctatgtgttc gacagcctgc ctgagttcca ggcaagcaac atcatgcact ccatcaatgg ctatgtgttc gacagcctgc
43204320
agctgagcgt gtgcctgcac gaagtggcct actggtacat cctgagcatt ggcgcccaga agctgagcgt gtgcctgcac gaagtggcct actggtacat cctgagcatt ggcgcccaga
43804380
ccgacttcct gtccgtgttc tttagcggct acaccttcaa gcacaagatg gtgtacgagg ccgacttcct gtccgtgttc tttagcggct acaccttcaa gcacaagatg gtgtacgagg
44404440
ataccctgac actgttccca ttcagcggcg agacagtgtt catgagcatg gaaaaccccg ataccctgac actgttccca ttcagcggcg agacagtgtt catgagcatg gaaaaccccg
45004500
gcctgtggat tctgggctgt cacaacagcg acttccggaa cagaggcatg acagccctgc gcctgtggat tctgggctgt cacaacagcg acttccggaa cagaggcatg acagccctgc
45604560
tgaaggtgtc cagctgcgac aagaacaccg gcgactacta cgaggacagc tatgaggaca tgaaggtgtc cagctgcgac aagaacaccg gcgactacta cgaggacagc tatgaggaca
46204620
tcagcgccta cctgctgagc aagaacaatg ccatcgagcc tcggagcttc agccagaatc tcagcgccta cctgctgagc aagaacaatg ccatcgagcc tcggagcttc agccagaatc
46804680
ctcctgtgct gaagcggcac cagcgcgaga tcaccagaac aaccctgcag agcgaccaag ctcctgtgct gaagcggcac cagcgcgaga tcaccagaac aaccctgcag agcgaccaag
47404740
aggaaatcga ttacgacgac accatcagcg tcgagatgaa gaaagaagat ttcgacatct aggaaatcga ttacgacgac accatcagcg tcgagatgaa gaaagaagat ttcgacatct
48004800
acgacgagga cgagaatcag agccccagaa gctttcagaa aaagacccgg cactacttca acgacgagga cgagaatcag agccccagaa gctttcagaa aaagacccgg cactacttca
48604860
ttgccgccgt cgagagactg tgggactacg gcatgtctag cagccctcac gtgctgagaa ttgccgccgt cgagagactg tgggactacg gcatgtctag cagccctcac gtgctgagaa
49204920
atagagccca gagcggcagc gtgccccagt tcaagaaagt ggtgttccaa gagttcaccg atagagccca gagcggcagc gtgccccagt tcaagaaagt ggtgttccaa gagttcaccg
49804980
acggcagctt cacccagcca ctgtatagag gcgagctgaa cgagcatctg ggcctgctgg acggcagctt cacccagcca ctgtatagag gcgagctgaa cgagcatctg ggcctgctgg
50405040
gcccttatat cagagccgaa gtggaagata acatcatggt caccttccgg aatcaggcta gcccttatat cagagccgaa gtggaagata acatcatggt caccttccgg aatcaggcta
51005100
gccggcctta cagcttctac agctccctga tcagctacga agaggaccag agacagggcg gccggcctta cagcttctac agctccctga tcagctacga agaggaccag agacaggcg
51605160
ctgagcccag aaagaacttc gtgaagccca acgagactaa gacctacttt tggaaggtgc ctgagcccag aaagaacttc gtgaagccca acgagactaa gacctacttt tggaaggtgc
52205220
agcaccacat ggcccctaca aaggacgagt tcgactgcaa agcctgggcc tacttctccg agcaccacat ggcccctaca aaggacgagt tcgactgcaa agcctgggcc tacttctccg
52805280
atgtggatct ggaaaaggac gtgcacagcg ggctcatcgg accactgctt gtgtgccaca atgtggatct ggaaaaggac gtgcacagcg ggctcatcgg accactgctt gtgtgccaca
53405340
ccaacacact gaaccccgct cacggcagac aagtgacagt gcaagagttc gccctgttct ccaacacact gaaccccgct cacggcagac aagtgacagt gcaagagttc gccctgttct
54005400
tcaccatctt cgacgaaaca aagagctggt acttcaccga gaatatggaa cggaactgca tcaccatctt cgacgaaaca aagagctggt acttcaccga gaatatggaa cggaactgca
54605460
gagccccttg caacatccag atggaagatc ccaccttcaa agagaactac cggttccacg gagccccttg caacatccag atggaagatc ccaccttcaa agagaactac cggttccacg
55205520
ccatcaacgg ctacatcatg gacacactgc ccggcctggt tatggcccag gatcagagaa ccatcaacgg ctacatcatg gacacactgc ccggcctggt tatggcccag gatcagagaa
55805580
tccggtggta tctgctgtcc atgggctcca acgagaatat ccacagcatc cacttcagcg tccggtggta tctgctgtcc atgggctcca acgagaatat ccacagcatc cacttcagcg
56405640
gccacgtgtt caccgtgcgg aaaaaagaag agtacaaaat ggccctgtac aatctgtacc gccacgtgtt caccgtgcgg aaaaaagaag agtacaaaat ggccctgtac aatctgtacc
57005700
ctggggtgtt cgaaaccgtg gaaatgctgc cttccaaggc cggcatttgg agagtggaat ctggggtgtt cgaaaccgtg gaaatgctgc cttccaaggc cggcatttgg agagtggaat
57605760
gtctgattgg agagcacctc cacgccggaa tgagcaccct gtttctggtg tacagcaaca gtctgattgg agagcacctc cacgccggaa tgagcaccct gtttctggtg tacagcaaca
58205820
agtgtcagac ccctctcggc atggcctctg gacacatcag agacttccag atcaccgcct agtgtcagac ccctctcggc atggcctctg gacacatcag agacttccag atcaccgcct
58805880
ctggccagta cggacagtgg gctcctaaac tggctcggct gcactacagc ggcagcatca ctggccagta cggacagtgg gctcctaaac tggctcggct gcactacagc ggcagcatca
59405940
atgcctggtc caccaaagag cccttcagct ggatcaaggt ggacctgctg gctcccatga atgcctggtc caccaaagag cccttcagct ggatcaaggt ggacctgctg gctcccatga
60006000
tcatccacgg aatcaagacc cagggcgcca gacagaagtt cagcagcctg tacatcagcc tcatccacgg aatcaagacc cagggcgcca gacagaagtt cagcagcctg tacatcagcc
60606060
agttcatcat catgtacagc ctggacggca agaagtggca gacctacaga ggcaacagca agttcatcat catgtacagc ctggacggca agaagtggca gacctacaga ggcaacagca
61206120
ccggcacact catggtgttc ttcggcaacg tggactccag cggcattaag cacaacatct ccggcacact catggtgttc ttcggcaacg tggactccag cggcattaag cacaacatct
61806180
tcaaccctcc aatcattgcc cggtacatcc ggctgcaccc cacacactac agcatccggt tcaaccctcc aatcattgcc cggtacatcc ggctgcaccc cacacactac agcatccggt
62406240
ctaccctgag aatggaactg atgggctgcg acctgaacag ctgctctatg cccctcggaa ctaccctgag aatggaactg atgggctgcg acctgaacag ctgctctatg cccctcggaa
63006300
tggaaagcaa ggccatcagc gacgcccaga tcacagccag cagctacttc accaacatgt tggaaagcaa ggccatcagc gacgcccaga tcacagccag cagctacttc accaacatgt
63606360
tcgccacttg gagcccctcc aaggctagac tgcatctgca gggcagaagc aacgcttgga tcgccacttg gagcccctcc aaggctagac tgcatctgca gggcagaagc aacgcttgga
64206420
ggccccaagt gaacaacccc aaagagtggc tgcaggttga ctttcaaaag accatgaaag ggccccaagt gaacaacccc aaagagtggc tgcaggttga ctttcaaaag accatgaaag
64806480
tgaccggcgt gaccacacag ggcgtcaagt ctctgctgac ctctatgtac gtgaaagagt tgaccggcgt gaccacacag ggcgtcaagt ctctgctgac ctctatgtac gtgaaagagt
65406540
tcctgatctc cagcagccag gacggccatc agtggaccct gtttttccag aacggcaaag tcctgatctc cagcagccag gacggccatc agtggaccct gtttttccag aacggcaaag
66006600
tgaaagtgtt ccagggcaat caggacagct tcacacccgt ggtcaattct ctggaccctc tgaaagtgtt cccaggcaat caggacagct tcacacccgt ggtcaattct ctggaccctc
66606660
cactgctgac cagatacctg cggattcacc ctcagtcttg ggtgcaccag atcgctctgc cactgctgac cagatacctg cggattcacc ctcagtcttg ggtgcaccag atcgctctgc
67206720
ggatggaagt gctgggctgt gaagctcagg acctctacta gttaattaag agcatcttac ggatggaagt gctgggctgt gaagctcagg acctctacta gttaattaag agcatcttac
67806780
cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt taaatgttaa
68406840
taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta ctagttcagg
69006900
tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct ctgttcctgt
69606960
taatcaacct ctggattaca aaatttgtga aagattgact gatattctta actatgttgc taatcaacct ctggattaca aaatttgtga aagattgact gatattctta actatgttgc
70207020
tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta ttgcttcccg
70807080
tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt tagaggagtt
71407140
gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg caacccccac
72007200
tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt tccccctccc
72607260
gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag gggctaggtt
73207320
gctgggcact gataattccg tggtgttgtc atcgattcca taaagtagga aacactacac gctgggcact gataattccg tggtgttgtc atcgattcca taaagtagga aacactacac
73807380
gattccataa agtaggaaac actacatcac tccataaagt aggaaacact acagttaact gattccataa agtaggaaac actacatcac tccataaagt aggaaacact acagttaact
74407440
gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc cttgaccctg
75007500
gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc gcattgtctg
75607560
agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg ggaggattgg
76207620
gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggcggcgcg ccgcatggct gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggcggcgcg ccgcatggct
76807680
acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt
77407740
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa
78007800
ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggtcg ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggtcg
78607860
acgctagcag ctgatgcata gcatgcggta ccgggagatg ggggaggcta actgaaacac acgctagcag ctgatgcata gcatgcggta ccgggagatg ggggaggcta actgaaacac
79207920
ggaaggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa ggaagggagac aataccggaa ggaacccgcg ctatgacggc aataaaaaga cagaataaaa
79807980
cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct cgcacgggtg ttgggtcgtt tgttcataaa cgcggggttc ggtcccaggg ctggcactct
80408040
gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca gtcgataccc caccgagacc ccattgggac caatacgccc gcgtttcttc cttttcccca
81008100
ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc ccccaacccc caagttcggg tgaaggccca gggctcgcag ccaacgtcgg ggcggcaagc
81608160
cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg cctgccatag ccactacggg tacgtaggcc aaccactaga actatagcta gagtcctggg
82208220
cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca cgaacaaacg atgctcgcct tccagaaaac cgaggatgcg aaccacttca tccggggtca
82808280
gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat gcaccaccgg caagcgccgc gacggccgag gtctaccgat ctcctgaagc cagggcagat
83408340
ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg ccgtgcacag caccttgccg tagaagaaca gcaaggccgc caatgcctga cgatgcgtgg
84008400
agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc agaccgaaac cttgcgctcg ttcgccagcc aggacagaaa tgcctcgact tcgctgctgc
84608460
ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat ccaaggttgc cgggtgacgc acaccgtgga aacggatgaa ggcacgaacc cagttgacat
85208520
aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca aagcctgttc ggttcgtaaa ctgtaatgca agtagcgtat gcgctcacgc aactggtcca
85808580
gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg gaaccttgac cgaacgcagc ggtggtaacg gcgcagtggc ggttttcatg gcttgttatg
86408640
actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg actgtttttt tgtacagtct atgcctcggg catccaagca gcaagcgcgt tacgccgtgg
87008700
gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag gtcgatgttt gatgttatgg agcagcaacg atgttacgca gcagcaacga tgttacgcag
87608760
cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt cagggcagtc gccctaaaac aaagttaggt ggctcaagta tgggcatcat tcgcacatgt
88208820
aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag aggctcggcc ctgaccaagt caaatccatg cgggctgctc ttgatctttt cggtcgtgag
88808880
ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg ttcggagacg tagccaccta ctcccaacat cagccggact ccgattacct cgggaacttg
89408940
ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct ctccgtagta agacattcat cgcgcttgct gccttcgacc aagaagcggt tgttggcgct
90009000
ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat ctcgcggctt acgttctgcc caggtttgag cagccgcgta gtgagatcta tatctatgat
90609060
ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc ctcgcagtct ccggcgagca ccggaggcag ggcattgcca ccgcgctcat caatctcctc
91209120
aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac aagcatgagg ccaacgcgct tggtgcttat gtgatctacg tgcaagcaga ttacggtgac
91809180
gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat gatcccgcag tggctctcta tacaaagttg ggcatacggg aagaagtgat gcactttgat
92409240
atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg atcgacccaa gtaccgccac ctaacaattc gttcaagccg agatcggctt cccggccgcg
93009300
gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac gagttgttcg gtaaattgtc acaacgccgc gaatatagtc tttaccatgc ccttggccac
93609360
gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca gcccctcttt aatacgacgg gcaatttgca cttcagaaaa tgaagagttt gctttagcca
94209420
taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat taacaaaagt ccagtatgct ttttcacagc ataactggac tgatttcagt ttacaactat
94809480
tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt tctgtctagt ttaagacttt attgtcatag tttagatcta ttttgttcag tttaagactt
95409540
tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt tattgtccgc ccacacccgc ttacgcaggg catccattta ttactcaacc gtaaccgatt
96009600
ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa ttgccaggtt acgcggctgg tctgcggtgt gaaataccgc acagatgcgt aaggagaaaa
96609660
taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg
97209720
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg
97809780
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag
98409840
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga
99009900
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct
99609960
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc
1002010020
tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta tctcagttcg
1008010080
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc
1014010140
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca
1020010200
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag
1026010260
ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct
1032010320
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc
1038010380
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga
1044010440
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca
1050010500
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat
1056010560
taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac
1062010620
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt
1068010680
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt
1074010740
gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag
1080010800
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct
1086010860
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt
1092010920
gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc
1098010980
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt
1104011040
agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg
1110011100
gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg
1116011160
actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct
1122011220
tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc
1128011280
attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt
1134011340
tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt
1140011400
tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg
1146011460
aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat
1152011520
tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg
1158011580
cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc cgcacatttc cccgaaaagt gccacctgaa attgtaaacg ttaatatttt gttaaaattc
1164011640
gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc
1170011700
ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag
1176011760
agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc
1182011820
gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa
1188011880
gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg
1194011940
aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt
1200012000
gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacaggc
1206012060
gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt gcgtcccatt cgccattcag gctgcaaata agcgttgata ttcagtcaat tacaaacatt
1212012120
aataacgaag agatgacaga aaaattttca ttctgtgaca gagaa aataacgaag agatgacaga aaaattttca ttctgtgaca gagaa
1216512165
<210> 201<210> 201
<211> 11512<211> 11512
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 201<400> 201
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat
60 60
aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg
120 120
aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta
180 180
gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt
240 240
atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg
300 300
cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag
360 360
cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc
420 420
cgccatgcta cttatcgcgg ccgcaggctc agaggcacac aggagtttct gggctcaccc cgccatgcta cttatcgcgg ccgcaggctc agaggcacac aggagtttct gggctcaccc
480 480
tgcccccttc caacccctca gttcccatcc tccagcagct gtttgtgtgc tgcctctgaa tgcccccttc caacccctca gttcccatcc tccagcagct gtttgtgtgc tgcctctgaa
540 540
gtccacactg aacaaacttc agcctactca tgtccctaaa atgggcaaac attgcaagca gtccacactg aacaaacttc agcctactca tgtccctaaa atgggcaaac attgcaagca
600 600
gcaaacagca aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag gcaaacagca aacacacagc cctccctgcc tgctgacctt ggagctgggg cagaggtcag
660 660
agacctctct gggcccatgc cacctccaac atccactcga ccccttggaa tttcggtgga agacctctct gggcccatgc cacctccaac atccactcga ccccttggaa tttcggtgga
720 720
gaggagcaga ggttgtcctg gcgtggttta ggtagtgtga gagggtccgg gttcaaaacc gaggagcaga ggttgtcctg gcgtggttta ggtagtgtga gagggtccgg gttcaaaacc
780 780
acttgctggg tggggagtcg tcagtaagtg gctatgcccc gaccccgaag cctgtttccc acttgctggg tggggagtcg tcagtaagtg gctatgcccc gaccccgaag cctgtttccc
840 840
catctgtaca atggaaatga taaagacgcc catctgatag ggtttttgtg gcaaataaac catctgtaca atggaaatga taaagacgcc catctgatag ggtttttgtg gcaaataaac
900 900
atttggtttt tttgttttgt tttgttttgt tttttgagat ggaggtttgc tctgtcgccc atttggtttt tttgttttgt tttgttttgt tttttgagat ggaggtttgc tctgtcgccc
960 960
aggctggagt gcagtgacac aatctcatct caccacaacc ttcccctgcc tcagcctccc aggctggagt gcagtgacac aatctcatct caccacaacc ttcccctgcc tcagcctccc
10201020
aagtagctgg gattacaagc atgtgccacc acacctggct aattttctat ttttagtaga aagtagctgg gattacaagc atgtgccacc acacctggct aattttctat ttttagtaga
10801080
gacgggtttc tccatgttgg tcagcctcag cctcccaagt aactgggatt acaggcctgt gacgggtttc tccatgttgg tcagcctcag cctcccaagt aactgggatt acaggcctgt
11401140
gccaccacac ccggctaatt ttttctattt ttgacaggga cggggtttca ccatgttggt gccaccacac ccggctaatt ttttctattt ttgacaggga cggggtttca ccatgttggt
12001200
caggctggtc tagaggtacc ggatcttgct accagtggaa cagccactaa ggattctgca caggctggtc tagaggtacc ggatcttgct accagtggaa cagccactaa ggattctgca
12601260
gtgagagcag agggccagct aagtggtact ctcccagaga ctgtctgact cacgccaccc gtgagagcag agggccagct aagtggtact ctcccagaga ctgtctgact cacgccaccc
13201320
cctccacctt ggacacagga cgctgtggtt tctgagccag gtacaatgac tcctttcggt cctccacctt ggacacagga cgctgtggtt tctgagccag gtacaatgac tcctttcggt
13801380
aagtgcagtg gaagctgtac actgcccagg caaagcgtcc gggcagcgta ggcgggcgac aagtgcagtg gaagctgtac actgcccagg caaagcgtcc gggcagcgta ggcgggcgac
14401440
tcagatccca gccagtggac ttagcccctg tttgctcctc cgataactgg ggtgaccttg tcagatccca gccagtggac ttagcccctg tttgctcctc cgataactgg ggtgaccttg
15001500
gttaatattc accagcagcc tcccccgttg cccctctgga tccactgctt aaatacggac gttaatattc accagcagcc tcccccgttg cccctctgga tccactgctt aaatacggac
15601560
gaggacaggg ccctgtctcc tcagcttcag gcaccaccac tgacctggga cagtgaatcc gaggacaggg ccctgtctcc tcagcttcag gcaccaccac tgacctggga cagtgaatcc
16201620
ggactctaag gtaaatataa aatttttaag tgtataatgt gttaaactac tgattctaat ggactctaag gtaaatataa aatttttaag tgtataatgt gttaaactac tgattctaat
16801680
tgtttctctc ttttagattc caacctttgg aactgagttt aaaccgcagc caccatgcag tgtttctctc ttttagattc caacctttgg aactgagttt aaaccgcagc caccatgcag
17401740
atcgagctgt ctacctgctt cttcctgtgc ctgctgcggt tctgcttcag cgccaccaga atcgagctgt ctacctgctt cttcctgtgc ctgctgcggt tctgcttcag cgccaccaga
18001800
agatattacc tgggcgccgt ggaactgagc tgggactaca tgcagtctga cctgggagag agatattacc tgggcgccgt ggaactgagc tgggactaca tgcagtctga cctggggagag
18601860
ctgcccgtgg acgctagatt tcctccaaga gtgcccaaga gcttcccctt caacacctcc ctgcccgtgg acgctagatt tcctccaaga gtgcccaaga gcttcccctt caacacctcc
19201920
gtggtgtaca agaaaaccct gttcgtggaa ttcaccgacc acctgttcaa tatcgccaag gtggtgtaca agaaaaccct gttcgtggaa ttcaccgacc acctgttcaa tatcgccaag
19801980
cctcggcctc cttggatggg actgctggga cctacaattc aggccgaggt gtacgacacc cctcggcctc cttggatggg actgctggga cctacaattc aggccgaggt gtacgacacc
20402040
gtggtcatca ccctgaagaa catggccagc catcctgtgt ctctgcacgc cgtgggagtg gtggtcatca ccctgaagaa catggccagc catcctgtgt ctctgcacgc cgtgggagtg
21002100
tcttattgga aggcttctga gggcgccgag tacgacgatc agacaagcca gagagagaaa tcttattgga aggcttctga gggcgccgag tacgacgatc agacaagcca gagagagaaa
21602160
gaggacgaca aggttttccc tggcggcagc cacacctatg tctggcaggt cctgaaagaa gaggacgaca aggttttccc tggcggcagc cacacctatg tctggcaggt cctgaaagaa
22202220
aacggcccta tggcctccga tcctctgtgc ctgacataca gctacctgag ccacgtggac aacggcccta tggcctccga tcctctgtgc ctgacataca gctacctgag ccacgtggac
22802280
ctggtcaagg acctgaattc tggcctgatc ggagccctgc tcgtgtgtag agaaggcagc ctggtcaagg acctgaattc tggcctgatc ggagccctgc tcgtgtgtag agaaggcagc
23402340
ctggccaaag agaaaaccca gacactgcac aagttcatcc tgctgttcgc cgtgttcgac ctggccaaag agaaaaccca gacactgcac aagttcatcc tgctgttcgc cgtgttcgac
24002400
gagggcaaga gctggcacag cgagacaaag aacagcctga tgcaggacag ggatgccgcc gagggcaaga gctggcacag cgagacaaag aacagcctga tgcaggacag ggatgccgcc
24602460
tctgctagag cttggcctaa gatgcacacc gtgaacggct acgtgaacag aagcctgcct tctgctagag cttggcctaa gatgcacacc gtgaacggct acgtgaacag aagcctgcct
25202520
ggactgatcg gctgccacag aaagtccgtg tactggcacg tgatcggcat gggcacaaca ggactgatcg gctgccacag aaagtccgtg tactggcacg tgatcggcat gggcacaaca
25802580
cctgaggtgc acagcatctt tctggaaggc cacaccttcc tcgtgcggaa ccacagacag cctgaggtgc acagcatctt tctggaaggc cacaccttcc tcgtgcggaa ccacagacag
26402640
gccagcctgg aaatcagccc tatcaccttc ctgaccgctc agaccctgct gatggatctg gccagcctgg aaatcagccc tatcaccttc ctgaccgctc agaccctgct gatggatctg
27002700
ggccagtttc tgctgttctg ccacatcagc tcccaccagc acgatggcat ggaagcctac ggccagtttc tgctgttctg ccacatcagc tcccaccagc acgatggcat ggaagcctac
27602760
gtgaaggtgg acagctgccc cgaagaaccc cagctgcgga tgaagaacaa cgaggaagcc gtgaaggtgg acagctgccc cgaagaaccc cagctgcgga tgaagaacaa cgaggaagcc
28202820
gaggactacg acgacgacct gaccgactct gagatggacg tcgtcagatt cgacgacgat gaggactacg acgacgacct gaccgactct gagatggacg tcgtcagatt cgacgacgat
28802880
aacagcccca gcttcatcca gatcagaagc gtggccaaga agcaccccaa gacctgggtg aacagcccca gcttcatcca gatcagaagc gtggccaaga agcaccccaa gacctgggtg
29402940
cactatatcg ccgccgagga agaggactgg gattacgctc ctctggtgct ggcccctgac cactatatcg ccgccgagga agaggactgg gattacgctc ctctggtgct ggcccctgac
30003000
gacagaagct acaagagcca gtacctgaac aacggccctc agcggatcgg ccggaagtat gacagaagct acaagagcca gtacctgaac aacggccctc agcggatcgg ccggaagtat
30603060
aagaaagtgc ggttcatggc ctacaccgac gagacattca agaccagaga ggccatccag aagaaagtgc ggttcatggc ctacaccgac gagacattca agaccagaga ggccatccag
31203120
cacgagagcg gaattctggg ccctctgctg tatggcgaag tgggcgatac actgctgatc cacgagagcg gaattctggg ccctctgctg tatggcgaag tgggcgatac actgctgatc
31803180
atcttcaaga accaggccag cagaccctac aacatctacc ctcacggcat caccgatgtg atcttcaaga accaggccag cagaccctac aacatctacc ctcacggcat caccgatgtg
32403240
cggcccctgt attctagaag gctgcccaag ggcgtgaagc acctgaagga cttccctatc cggcccctgt attctagaag gctgcccaag ggcgtgaagc acctgaagga cttccctatc
33003300
ctgcctggcg agattttcaa gtacaagtgg accgtgaccg tggaagatgg ccccaccaag ctgcctggcg agattttcaa gtacaagtgg accgtgaccg tggaagatgg ccccaccaag
33603360
agcgacccta gatgtctgac acggtactac agcagcttcg tgaacatgga acgcgacctg agcgacccta gatgtctgac acggtactac agcagcttcg tgaacatgga acgcgacctg
34203420
gccagcggcc tgattggacc tctgctgatc tgctacaaag aaagcgtgga ccagcggggc gccagcggcc tgattggacc tctgctgatc tgctacaaag aaagcgtgga ccagcggggc
34803480
aaccagatca tgagcgacaa gcggaacgtg atcctgttta gcgtgttcga tgagaaccgg aaccagatca tgagcgacaa gcggaacgtg atcctgttta gcgtgttcga tgagaaccgg
35403540
tcctggtatc tgaccgagaa catccagcgg tttctgccca atcctgccgg ggtgcaactg tcctggtatc tgaccgagaa catccagcgg tttctgccca atcctgccgg ggtgcaactg
36003600
gaagatcctg agttccaggc aagcaacatc atgcactcca tcaatggcta tgtgttcgac gaagatcctg agttccaggc aagcaacatc atgcactcca tcaatggcta tgtgttcgac
36603660
agcctgcagc tgagcgtgtg cctgcacgaa gtggcctact ggtacatcct gagcattggc agcctgcagc tgagcgtgtg cctgcacgaa gtggcctact ggtacatcct gagcattggc
37203720
gcccagaccg acttcctgtc cgtgttcttt agcggctaca ccttcaagca caagatggtg gcccagaccg acttcctgtc cgtgttcttt agcggctaca ccttcaagca caagatggtg
37803780
tacgaggata ccctgacact gttcccattc agcggcgaga cagtgttcat gagcatggaa tacgaggata ccctgacact gttcccattc agcggcgaga cagtgttcat gagcatggaa
38403840
aaccccggcc tgtggattct gggctgtcac aacagcgact tccggaacag aggcatgaca aaccccggcc tgtggattct gggctgtcac aacagcgact tccggaacag aggcatgaca
39003900
gccctgctga aggtgtccag ctgcgacaag aacaccggcg actactacga ggacagctat gccctgctga aggtgtccag ctgcgacaag aacaccggcg actactacga ggacagctat
39603960
gaggacatca gcgcctacct gctgagcaag aacaatgcca tcgagcctcg gagcttcagc gaggacatca gcgcctacct gctgagcaag aacaatgcca tcgagcctcg gagcttcagc
40204020
cagaatcctc ctgtgctgaa gcggcaccag cgcgagatca ccagaacaac cctgcagagc cagaatcctc ctgtgctgaa gcggcaccag cgcgagatca ccagaacaac cctgcagagc
40804080
gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc gaccaagagg aaatcgatta cgacgacacc atcagcgtcg agatgaagaa agaagatttc
41404140
gacatctacg acgaggacga gaatcagagc cccagaagct ttcagaaaaa gacccggcac gacatctacg acgaggacga gaatcagagc cccagaagct ttcagaaaaa gacccggcac
42004200
tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg tacttcattg ccgccgtcga gagactgtgg gactacggca tgtctagcag ccctcacgtg
42604260
ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag ctgagaaata gagcccagag cggcagcgtg ccccagttca agaaagtggt gttccaagag
43204320
ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc ttcaccgacg gcagcttcac ccagccactg tatagaggcg agctgaacga gcatctgggc
43804380
ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat ctgctgggcc cttatatcag agccgaagtg gaagataaca tcatggtcac cttccggaat
44404440
caggctagcc ggccttacag cttctacagc tccctgatca gctacgaaga ggaccagaga caggctagcc ggccttacag cttctacagc tccctgatca gctacgaaga ggaccagaga
45004500
cagggcgctg agcccagaaa gaacttcgtg aagcccaacg agactaagac ctacttttgg cagggcgctg agcccagaaa gaacttcgtg aagcccaacg agactaagac ctacttttgg
45604560
aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac aaggtgcagc accacatggc ccctacaaag gacgagttcg actgcaaagc ctgggcctac
46204620
ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg ttctccgatg tggatctgga aaaggacgtg cacagcgggc tcatcggacc actgcttgtg
46804680
tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc tgccacacca acacactgaa ccccgctcac ggcagacaag tgacagtgca agagttcgcc
47404740
ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg ctgttcttca ccatcttcga cgaaacaaag agctggtact tcaccgagaa tatggaacgg
48004800
aactgcagag ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg aactgcagag ccccttgcaa catccagatg gaagatccca ccttcaaaga gaactaccgg
48604860
ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat ttccacgcca tcaacggcta catcatggac acactgcccg gcctggttat ggcccaggat
49204920
cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac cagagaatcc ggtggtatct gctgtccatg ggctccaacg agaatatcca cagcatccac
49804980
ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat ttcagcggcc acgtgttcac cgtgcggaaa aaagaagagt acaaaatggc cctgtacaat
50405040
ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga ctgtaccctg gggtgttcga aaccgtggaa atgctgcctt ccaaggccgg catttggaga
51005100
gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac gtggaatgtc tgattggaga gcacctccac gccggaatga gcaccctgtt tctggtgtac
51605160
agcaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc agcaacaagt gtcagacccc tctcggcatg gcctctggac acatcagaga cttccagatc
52205220
accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctacagcggc accgcctctg gccagtacgg acagtgggct cctaaactgg ctcggctgca ctacagcggc
52805280
agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct agcatcaatg cctggtccac caaagagccc ttcagctgga tcaaggtgga cctgctggct
53405340
cccatgatca tccacggaat caagacccag ggcgccagac agaagttcag cagcctgtac cccatgatca tccacggaat caagacccag ggcgccagac agaagttcag cagcctgtac
54005400
atcagccagt tcatcatcat gtacagcctg gacggcaaga agtggcagac ctacagaggc atcagccagt tcatcatcat gtacagcctg gacggcaaga agtggcagac ctacagaggc
54605460
aacagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac aacagcaccg gcacactcat ggtgttcttc ggcaacgtgg actccagcgg cattaagcac
55205520
aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc aacatcttca accctccaat cattgcccgg tacatccggc tgcaccccac acactacagc
55805580
atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc atccggtcta ccctgagaat ggaactgatg ggctgcgacc tgaacagctg ctctatgccc
56405640
ctcggaatgg aaagcaaggc catcagcgac gcccagatca cagccagcag ctacttcacc ctcggaatgg aaagcaaggc catcagcgac gccgatca cagccagcag ctacttcacc
57005700
aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac aacatgttcg ccacttggag cccctccaag gctagactgc atctgcaggg cagaagcaac
57605760
gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc gcttggaggc cccaagtgaa caaccccaaa gagtggctgc aggttgactt tcaaaagacc
58205820
atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg atgaaagtga ccggcgtgac cacacagggc gtcaagtctc tgctgacctc tatgtacgtg
58805880
aaagagttcc tgatctccag cagccaggac ggccatcagt ggaccctgtt tttccagaac aaagagttcc tgatctccag cagccaggac ggccatcagt ggaccctgtt tttccagaac
59405940
ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg ggcaaagtga aagtgttcca gggcaatcag gacagcttca cacccgtggt caattctctg
60006000
gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc gaccctccac tgctgaccag atacctgcgg attcaccctc agtcttgggt gcaccagatc
60606060
gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc gctctgcgga tggaagtgct gggctgtgaa gctcaggacc tctactagtt aattaagagc
61206120
atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa atcttaccgc catttattcc catatttgtt ctgtttttct tgatttgggt atacatttaa
61806180
atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta atgttaataa aacaaaatgg tggggcaatc atttacattt ttagggatat gtaattacta
62406240
gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg gttcaggtgt attgccacaa gacaaacatg ttaagaaact ttcccgttat ttacgctctg
63006300
ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactgat attcttaact
63606360
atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg atgttgctcc ttttacgctg tgtggatatg ctgctttata gcctctgtat ctagctattg
64206420
cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag cttcccgtac ggctttcgtt ttctcctcct tgtataaatc ctggttgctg tctcttttag
64806480
aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa aggagttgtg gcccgttgtc cgtcaacgtg gcgtggtgtg ctctgtgttt gctgacgcaa
65406540
cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc cccccactgg ctggggcatt gccaccacct gtcaactcct ttctgggact ttcgctttcc
66006600
ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ccctcccgat cgccacggca gaactcatcg ccgcctgcct tgcccgctgc tggacaggg
66606660
ctaggttgct gggcactgat aattccgtgg tgttgtcatc gattccataa agtaggaaac ctaggttgct gggcactgat aattccgtgg tgttgtcatc gattccataa agtaggaaac
67206720
actacacgat tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca actacacgat tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca
67806780
gttaactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt gttaactgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt
68406840
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca
69006900
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga
69606960
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cggcgcgccg ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg cggcgcgccg
70207020
catggctacg tagataagta gcatggcggg ttaatcatta actacacctg caggaggaac catggctacg tagataagta gcatggcggg ttaatcatta actacacctg caggaggaac
70807080
ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact gaggccgggc
71407140
gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg gaccaaaggt cgcccgacgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg
72007200
caggtcgacg ctagcagctg atgcatagca tgcggtaccg ggagatgggg gaggctaact caggtcgacg ctagcagctg atgcatagca tgcggtaccg ggagatgggg gaggctaact
72607260
gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat aaaaagacag gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat aaaaagacag
73207320
aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg
73807380
gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg tttcttcctt gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg tttcttcctt
74407440
ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc
75007500
ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact atagctagag ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact atagctagag
75607560
tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac cacttcatcc tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac cacttcatcc
76207620
ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc ctgaagccag ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc ctgaagccag
76807680
ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa tgcctgacga ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa tgcctgacga
77407740
tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc ctcgacttcg tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc ctcgacttcg
78007800
ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc acgaacccag ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc acgaacccag
78607860
ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg ctcacgcaac ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg ctcacgcaac
79207920
tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt tttcatggct tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt tttcatggct
79807980
tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca agcgcgttac tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca agcgcgttac
80408040
gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca gcaacgatgt gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca gcaacgatgt
81008100
tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg gcatcattcg tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg gcatcattcg
81608160
cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg atcttttcgg cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg atcttttcgg
82208220
tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg attacctcgg tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg attacctcgg
82808280
gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag aagcggttgt gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag aagcggttgt
83408340
tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg agatctatat tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg agatctatat
84008400
ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg cgctcatcaa ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg cgctcatcaa
84608460
tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc aagcagatta tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc aagcagatta
85208520
cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag aagtgatgca cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag aagtgatgca
85808580
ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga tcggcttccc ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga tcggcttccc
86408640
ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt accatgccct ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt accatgccct
87008700
tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga agagtttgct tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga agagtttgct
87608760
ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga tttcagttta ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga tttcagttta
88208820
caactattct gtctagttta agactttatt gtcatagttt agatctattt tgttcagttt caactattct gtctagttta agactttatt gtcatagttt agatctattt tgttcagttt
88808880
aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta ctcaaccgta aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta ctcaaccgta
89408940
accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca gatgcgtaag accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca gatgcgtaag
90009000
gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt
90609060
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga
91209120
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg cccaggaaccg
91809180
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa
92409240
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt
93009300
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct
93609360
gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct
94209420
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc
94809480
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt
95409540
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc
96009600
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat
96609660
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa
97209720
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa
97809780
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga
98409840
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct
99009900
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga
99609960
cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc
1002010020
catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg
1008010080
ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat
1014010140
aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat
1020010200
ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg
1026010260
caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc
1032010320
attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa
1038010380
agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc
1044010440
actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt
1050010500
ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag
1056010560
ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt
1062010620
gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag
1068010680
atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac
1074010740
cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc
1080010800
gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca
1086010860
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg
1092010920
ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta atattttgtt ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta atattttgtt
1098010980
aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg
1104011040
caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ttccagtttg
1110011100
gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta
1116011160
tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg ggtcgaggtg
1122011220
ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa
1128011280
gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct
1134011340
ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta atgcgccgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta atgcgccgct
1140011400
acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc agtcaattac acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc agtcaattac
1146011460
aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag aa aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag aa
1151211512
<210> 202<210> 202
<211> 10563<211> 10563
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 202<400> 202
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat
60 60
aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg
120 120
aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta
180 180
gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt
240 240
atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg atctggttcg gatctcctag gcctgcaggc agctgcgcgc tcgctcgctc actgaggccg
300 300
cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag cccgggcaaa gcccgggcgt cgggcgacct ttggtcgccc ggcctcagtg agcgagcgag
360 360
cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc cgcgcagaga gggagtggcc aactccatca ctaggggttc cttgtagtta atgattaacc
420 420
cgccatgcta cttatcgcgg ccgccggggg aggctgctgg tgaatattaa ccaaggtcac cgccatgcta cttatcgcgg ccgccggggg aggctgctgg tgaatattaa ccaaggtcac
480 480
cccagttatc ggaggagcaa acaggggcta agtccacacg cgtggtaccg tctgtctgca cccagttatc ggaggagcaa acaggggcta agtccacacg cgtggtaccg tctgtctgca
540 540
catttcgtag agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt catttcgtag agcgagtgtt ccgatactct aatctcccta ggcaaggttc atatttgtgt
600 600
aggttactta ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc aggttactta ttctcctttt gttgactaag tcaataatca gaatcagcag gtttggagtc
660 660
agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag agcttggcag ggatcagcag cctgggttgg aaggagggg tataaaagcc ccttcaccag
720 720
gagaagccgt cacacagatc cacaagctcc tgaagaggta agggtttaag ggatggttgg gagaagccgt cacacagatc cacaagctcc tgaagaggta agggtttaag ggatggttgg
780 780
ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact ttttttcagg ttggtggggt attaatgttt aattacctgg agcacctgcc tgaaatcact ttttttcagg
840 840
ttggtttaaa ccgcagccac catgcagatc gagctgtcta cctgcttctt cctgtgcctg ttggtttaaa ccgcagccac catgcagatc gagctgtcta cctgcttctt cctgtgcctg
900 900
ctgcggttct gcttcagcgc caccagaaga tattacctgg gcgccgtgga actgagctgg ctgcggttct gcttcagcgc caccagaaga tattacctgg gcgccgtgga actgagctgg
960 960
gactacatgc agtctgacct gggagagctg cccgtggacg ctagatttcc tccaagagtg gactacatgc agtctgacct gggagagctg cccgtggacg ctagatttcc tccaagagtg
10201020
cccaagagct tccccttcaa cacctccgtg gtgtacaaga aaaccctgtt cgtggaattc cccaagagct tccccttcaa cacctccgtg gtgtacaaga aaaccctgtt cgtggaattc
10801080
accgaccacc tgttcaatat cgccaagcct cggcctcctt ggatgggact gctgggacct accgaccacc tgttcaatat cgccaagcct cggcctcctt ggatgggact gctgggacct
11401140
acaattcagg ccgaggtgta cgacaccgtg gtcatcaccc tgaagaacat ggccagccat acaattcagg ccgaggtgta cgacaccgtg gtcatcaccc tgaagaacat ggccagccat
12001200
cctgtgtctc tgcacgccgt gggagtgtct tattggaagg cttctgaggg cgccgagtac cctgtgtctc tgcacgccgt gggagtgtct tattggaagg cttctgaggg cgccgagtac
12601260
gacgatcaga caagccagag agagaaagag gacgacaagg ttttccctgg cggcagccac gacgatcaga caagccagag agagaaagag gacgacaagg ttttccctgg cggcagccac
13201320
acctatgtct ggcaggtcct gaaagaaaac ggccctatgg cctccgatcc tctgtgcctg acctatgtct ggcaggtcct gaaagaaaac ggccctatgg cctccgatcc tctgtgcctg
13801380
acatacagct acctgagcca cgtggacctg gtcaaggacc tgaattctgg cctgatcgga acatacagct acctgagcca cgtggacctg gtcaaggacc tgaattctgg cctgatcgga
14401440
gccctgctcg tgtgtagaga aggcagcctg gccaaagaga aaacccagac actgcacaag gccctgctcg tgtgtagaga aggcagcctg gccaaagaga aaacccagac actgcacaag
15001500
ttcatcctgc tgttcgccgt gttcgacgag ggcaagagct ggcacagcga gacaaagaac ttcatcctgc tgttcgccgt gttcgacgag ggcaagagct ggcacagcga gacaaagaac
15601560
agcctgatgc aggacaggga tgccgcctct gctagagctt ggcctaagat gcacaccgtg agcctgatgc aggacagga tgccgcctct gctagagctt ggcctaagat gcacaccgtg
16201620
aacggctacg tgaacagaag cctgcctgga ctgatcggct gccacagaaa gtccgtgtac aacggctacg tgaacagaag cctgcctgga ctgatcggct gccacagaaa gtccgtgtac
16801680
tggcacgtga tcggcatggg cacaacacct gaggtgcaca gcatctttct ggaaggccac tggcacgtga tcggcatggg cacaacacct gaggtgcaca gcatctttct ggaaggccac
17401740
accttcctcg tgcggaacca cagacaggcc agcctggaaa tcagccctat caccttcctg accttcctcg tgcggaacca cagacaggcc agcctggaaa tcagccctat caccttcctg
18001800
accgctcaga ccctgctgat ggatctgggc cagtttctgc tgttctgcca catcagctcc accgctcaga ccctgctgat ggatctgggc cagtttctgc tgttctgcca catcagctcc
18601860
caccagcacg atggcatgga agcctacgtg aaggtggaca gctgccccga agaaccccag caccagcacg atggcatgga agcctacgtg aaggtggaca gctgccccga agaaccccag
19201920
ctgcggatga agaacaacga ggaagccgag gactacgacg acgacctgac cgactctgag ctgcggatga agaacaacga ggaagccgag gactacgacg acgacctgac cgactctgag
19801980
atggacgtcg tcagattcga cgacgataac agccccagct tcatccagat cagaagcgtg atggacgtcg tcagattcga cgacgataac agccccagct tcatccagat cagaagcgtg
20402040
gccaagaagc accccaagac ctgggtgcac tatatcgccg ccgaggaaga ggactgggat gccaagaagc accccaagac ctgggtgcac tatatcgccg ccgaggaaga ggactgggat
21002100
tacgctcctc tggtgctggc ccctgacgac agaagctaca agagccagta cctgaacaac tacgctcctc tggtgctggc ccctgacgac agaagctaca agagccagta cctgaacaac
21602160
ggccctcagc ggatcggccg gaagtataag aaagtgcggt tcatggccta caccgacgag ggccctcagc ggatcggccg gaagtataag aaagtgcggt tcatggccta caccgacgag
22202220
acattcaaga ccagagaggc catccagcac gagagcggaa ttctgggccc tctgctgtat acattcaaga ccagagaggc catccagcac gagagcggaa ttctgggccc tctgctgtat
22802280
ggcgaagtgg gcgatacact gctgatcatc ttcaagaacc aggccagcag accctacaac ggcgaagtgg gcgatacact gctgatcatc ttcaagaacc aggccagcag accctacaac
23402340
atctaccctc acggcatcac cgatgtgcgg cccctgtatt ctagaaggct gcccaagggc atctaccctc acggcatcac cgatgtgcgg cccctgtatt ctagaaggct gcccaagggc
24002400
gtgaagcacc tgaaggactt ccctatcctg cctggcgaga ttttcaagta caagtggacc gtgaagcacc tgaaggactt ccctatcctg cctggcgaga ttttcaagta caagtggacc
24602460
gtgaccgtgg aagatggccc caccaagagc gaccctagat gtctgacacg gtactacagc gtgaccgtgg aagatggccc caccaagagc gaccctagat gtctgacacg gtactacagc
25202520
agcttcgtga acatggaacg cgacctggcc agcggcctga ttggacctct gctgatctgc agcttcgtga acatggaacg cgacctggcc agcggcctga ttggacctct gctgatctgc
25802580
tacaaagaaa gcgtggacca gcggggcaac cagatcatga gcgacaagcg gaacgtgatc tacaaagaaa gcgtggacca gcggggcaac cagatcatga gcgacaagcg gaacgtgatc
26402640
ctgtttagcg tgttcgatga gaaccggtcc tggtatctga ccgagaacat ccagcggttt ctgtttagcg tgttcgatga gaaccggtcc tggtatctga ccgagaacat ccagcggttt
27002700
ctgcccaatc ctgccggggt gcaactggaa gatcctgagt tccaggcaag caacatcatg ctgcccaatc ctgccggggt gcaactggaa gatcctgagt tccaggcaag caacatcatg
27602760
cactccatca atggctatgt gttcgacagc ctgcagctga gcgtgtgcct gcacgaagtg cactccatca atggctatgt gttcgacagc ctgcagctga gcgtgtgcct gcacgaagtg
28202820
gcctactggt acatcctgag cattggcgcc cagaccgact tcctgtccgt gttctttagc gcctactggt acatcctgag cattggcgcc cagaccgact tcctgtccgt gttctttagc
28802880
ggctacacct tcaagcacaa gatggtgtac gaggataccc tgacactgtt cccattcagc ggctacacct tcaagcacaa gatggtgtac gaggataccc tgacactgtt cccattcagc
29402940
ggcgagacag tgttcatgag catggaaaac cccggcctgt ggattctggg ctgtcacaac ggcgagacag tgttcatgag catggaaaac cccggcctgt ggattctggg ctgtcacaac
30003000
agcgacttcc ggaacagagg catgacagcc ctgctgaagg tgtccagctg cgacaagaac agcgacttcc ggaacagagg catgacagcc ctgctgaagg tgtccagctg cgacaagaac
30603060
accggcgact actacgagga cagctatgag gacatcagcg cctacctgct gagcaagaac accggcgact actacgagga cagctatgag gacatcagcg cctacctgct gagcaagaac
31203120
aatgccatcg agcctcggag cttcagccag aatcctcctg tgctgaagcg gcaccagcgc aatgccatcg agcctcggag cttcagccag aatcctcctg tgctgaagcg gcaccagcgc
31803180
gagatcacca gaacaaccct gcagagcgac caagaggaaa tcgattacga cgacaccatc gagatcacca gaacaaccct gcagagcgac caagaggaaa tcgattacga cgacaccatc
32403240
agcgtcgaga tgaagaaaga agatttcgac atctacgacg aggacgagaa tcagagcccc agcgtcgaga tgaagaaaga agatttcgac atctacgacg aggacgagaa tcagagcccc
33003300
agaagctttc agaaaaagac ccggcactac ttcattgccg ccgtcgagag actgtgggac agaagctttc agaaaaagac ccggcactac ttcattgccg ccgtcgagag actgtgggac
33603360
tacggcatgt ctagcagccc tcacgtgctg agaaatagag cccagagcgg cagcgtgccc tacggcatgt ctagcagccc tcacgtgctg agaaatagag cccagagcgg cagcgtgccc
34203420
cagttcaaga aagtggtgtt ccaagagttc accgacggca gcttcaccca gccactgtat cagttcaaga aagtggtgtt ccaagagttc accgacggca gcttcaccca gccactgtat
34803480
agaggcgagc tgaacgagca tctgggcctg ctgggccctt atatcagagc cgaagtggaa agaggcgagc tgaacgagca tctgggcctg ctgggccctt atatcagagc cgaagtggaa
35403540
gataacatca tggtcacctt ccggaatcag gctagccggc cttacagctt ctacagctcc gataacatca tggtcacctt ccggaatcag gctagccggc cttacagctt ctacagctcc
36003600
ctgatcagct acgaagagga ccagagacag ggcgctgagc ccagaaagaa cttcgtgaag ctgatcagct acgaagagga ccagagacag ggcgctgagc ccagaaagaa cttcgtgaag
36603660
cccaacgaga ctaagaccta cttttggaag gtgcagcacc acatggcccc tacaaaggac cccaacgaga ctaagaccta cttttggaag gtgcagcacc acatggcccc tacaaaggac
37203720
gagttcgact gcaaagcctg ggcctacttc tccgatgtgg atctggaaaa ggacgtgcac gagttcgact gcaaagcctg ggcctacttc tccgatgtgg atctggaaaa ggacgtgcac
37803780
agcgggctca tcggaccact gcttgtgtgc cacaccaaca cactgaaccc cgctcacggc agcgggctca tcggaccact gcttgtgtgc cacaccaaca cactgaaccc cgctcacggc
38403840
agacaagtga cagtgcaaga gttcgccctg ttcttcacca tcttcgacga aacaaagagc agacaagtga cagtgcaaga gttcgccctg ttcttcacca tcttcgacga aacaaagagc
39003900
tggtacttca ccgagaatat ggaacggaac tgcagagccc cttgcaacat ccagatggaa tggtacttca ccgagaatat ggaacggaac tgcagagccc cttgcaacat ccagatggaa
39603960
gatcccacct tcaaagagaa ctaccggttc cacgccatca acggctacat catggacaca gatcccacct tcaaagagaa ctaccggttc cacgccatca acggctacat catggacaca
40204020
ctgcccggcc tggttatggc ccaggatcag agaatccggt ggtatctgct gtccatgggc ctgcccggcc tggttatggc ccaggatcag agaatccggt ggtatctgct gtccatgggc
40804080
tccaacgaga atatccacag catccacttc agcggccacg tgttcaccgt gcggaaaaaa tccaacgaga atatccacag catccacttc agcggccacg tgttcaccgt gcggaaaaaa
41404140
gaagagtaca aaatggccct gtacaatctg taccctgggg tgttcgaaac cgtggaaatg gaagagtaca aaatggccct gtacaatctg taccctgggg tgttcgaaac cgtggaaatg
42004200
ctgccttcca aggccggcat ttggagagtg gaatgtctga ttggagagca cctccacgcc ctgccttcca aggccggcat ttggagagtg gaatgtctga ttggagagca cctccacgcc
42604260
ggaatgagca ccctgtttct ggtgtacagc aacaagtgtc agacccctct cggcatggcc ggaatgagca ccctgtttct ggtgtacagc aacaagtgtc agacccctct cggcatggcc
43204320
tctggacaca tcagagactt ccagatcacc gcctctggcc agtacggaca gtgggctcct tctggacaca tcagagactt cgagatcacc gcctctggcc agtacggaca gtgggctcct
43804380
aaactggctc ggctgcacta cagcggcagc atcaatgcct ggtccaccaa agagcccttc aaactggctc ggctgcacta cagcggcagc atcaatgcct ggtccaccaa agagcccttc
44404440
agctggatca aggtggacct gctggctccc atgatcatcc acggaatcaa gacccagggc agctggatca aggtggacct gctggctccc atgatcatcc acggaatcaa gacccagggc
45004500
gccagacaga agttcagcag cctgtacatc agccagttca tcatcatgta cagcctggac gccagacaga agttcagcag cctgtacatc agccagttca tcatcatgta cagcctggac
45604560
ggcaagaagt ggcagaccta cagaggcaac agcaccggca cactcatggt gttcttcggc ggcaagaagt ggcagaccta cagaggcaac agcaccggca cactcatggt gttcttcggc
46204620
aacgtggact ccagcggcat taagcacaac atcttcaacc ctccaatcat tgcccggtac aacgtggact ccagcggcat taagcacaac atcttcaacc ctccaatcat tgcccggtac
46804680
atccggctgc accccacaca ctacagcatc cggtctaccc tgagaatgga actgatgggc atccggctgc accccacaca ctacagcatc cggtctaccc tgagaatgga actgatgggc
47404740
tgcgacctga acagctgctc tatgcccctc ggaatggaaa gcaaggccat cagcgacgcc tgcgacctga acagctgctc tatgcccctc ggaatggaaa gcaaggccat cagcgacgcc
48004800
cagatcacag ccagcagcta cttcaccaac atgttcgcca cttggagccc ctccaaggct cagatcacag ccagcagcta cttcaccaac atgttcgcca cttggagccc ctccaaggct
48604860
agactgcatc tgcagggcag aagcaacgct tggaggcccc aagtgaacaa ccccaaagag agactgcatc tgcagggcag aagcaacgct tggaggcccc aagtgaacaa ccccaaagag
49204920
tggctgcagg ttgactttca aaagaccatg aaagtgaccg gcgtgaccac acagggcgtc tggctgcagg ttgactttca aaagaccatg aaagtgaccg gcgtgaccac acagggcgtc
49804980
aagtctctgc tgacctctat gtacgtgaaa gagttcctga tctccagcag ccaggacggc aagtctctgc tgacctctat gtacgtgaaa gagttcctga tctccagcag ccaggacggc
50405040
catcagtgga ccctgttttt ccagaacggc aaagtgaaag tgttccaggg caatcaggac catcagtgga ccctgttttt ccagaacggc aaagtgaaag tgttccaggg caatcaggac
51005100
agcttcacac ccgtggtcaa ttctctggac cctccactgc tgaccagata cctgcggatt agcttcacac ccgtggtcaa ttctctggac cctccactgc tgaccagata cctgcggatt
51605160
caccctcagt cttgggtgca ccagatcgct ctgcggatgg aagtgctggg ctgtgaagct caccctcagt cttgggtgca ccagatcgct ctgcggatgg aagtgctggg ctgtgaagct
52205220
caggacctct actagttaat taagagcatc ttaccgccat ttattcccat atttgttctg caggacctct actagttaat taagagcatc ttaccgccat ttattcccat atttgttctg
52805280
tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt tttttcttga tttgggtata catttaaatg ttaataaaac aaaatggtgg ggcaatcatt
53405340
tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta tacattttta gggatatgta attactagtt caggtgtatt gccacaagac aaacatgtta
54005400
agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt agaaactttc ccgttattta cgctctgttc ctgttaatca acctctggat tacaaaattt
54605460
gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg gtgaaagatt gactgatatt cttaactatg ttgctccttt tacgctgtgt ggatatgctg
55205520
ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt ctttatagcc tctgtatcta gctattgctt cccgtacggc tttcgttttc tcctccttgt
55805580
ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg ataaatcctg gttgctgtct cttttagagg agttgtggcc cgttgtccgt caacgtggcg
56405640
tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc tggtgtgctc tgtgtttgct gacgcaaccc ccactggctg gggcattgcc accacctgtc
57005700
aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg aactcctttc tgggactttc gctttccccc tcccgatcgc cacggcagaa ctcatcgccg
57605760
cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt cctgccttgc ccgctgctgg acaggggcta ggttgctggg cactgataat tccgtggtgt
58205820
tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga tgtctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg ccttccttga
58805880
ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt gcatcgcatt ccctggaagg tgccactccc actngtccttt cctaataaaa tgaggaaatt gcatcgcatt
59405940
gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc aagggggagg
60006000
attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggct ctagagcatg
60606060
gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct gctacgtaga taagtagcat ggcgggttaa tcattaacta cacctgcagg aggaacccct
61206120
agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc
61806180
aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg aaaggtcgcc cgacgcccgg gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg
62406240
ggcgcgcctc gagccatggt gctagcagct gatgcatagc atgcggtacc gggagatggg ggcgcgcctc gagccatggt gctagcagct gatgcatagc atgcggtacc gggagatggg
63006300
ggaggctaac tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa ggaggctaac tgaaacacgg aaggagacaa taccggaagg aacccgcgct atgacggcaa
63606360
taaaaagaca gaataaaacg cacgggtgtt gggtcgtttg ttcataaacg cggggttcgg taaaaagaca gaataaaacg cacgggtgtt gggtcgtttg ttcataaacg cggggttcgg
64206420
tcccagggct ggcactctgt cgatacccca ccgagacccc attgggacca atacgcccgc tcccagggct ggcactctgt cgatacccca ccgagacccc attgggacca atacgcccgc
64806480
gtttcttcct tttccccacc ccaaccccca agttcgggtg aaggcccagg gctcgcagcc gtttcttcct tttccccacc ccaaccccca agttcgggtg aaggcccagg gctcgcagcc
65406540
aacgtcgggg cggcaagccc tgccatagcc actacgggta cgtaggccaa ccactagaac aacgtcgggg cggcaagccc tgccatagcc actacgggta cgtaggccaa ccactagaac
66006600
tatagctaga gtcctgggcg aacaaacgat gctcgccttc cagaaaaccg aggatgcgaa tatagctaga gtcctgggcg aacaaacgat gctcgccttc cagaaaaccg aggatgcgaa
66606660
ccacttcatc cggggtcagc accaccggca agcgccgcga cggccgaggt ctaccgatct ccacttcatc cggggtcagc accaccggca agcgccgcga cggccgaggt ctaccgatct
67206720
cctgaagcca gggcagatcc gtgcacagca ccttgccgta gaagaacagc aaggccgcca cctgaagcca gggcagatcc gtgcacagca ccttgccgta gaagaacagc aaggccgcca
67806780
atgcctgacg atgcgtggag accgaaacct tgcgctcgtt cgccagccag gacagaaatg atgcctgacg atgcgtggag accgaaacct tgcgctcgtt cgccagccag gacagaaatg
68406840
cctcgacttc gctgctgccc aaggttgccg ggtgacgcac accgtggaaa cggatgaagg cctcgacttc gctgctgccc aaggttgccg ggtgacgcac accgtggaaa cggatgaagg
69006900
cacgaaccca gttgacataa gcctgttcgg ttcgtaaact gtaatgcaag tagcgtatgc cacgaaccca gttgacataa gcctgttcgg ttcgtaaact gtaatgcaag tagcgtatgc
69606960
gctcacgcaa ctggtccaga accttgaccg aacgcagcgg tggtaacggc gcagtggcgg gctcacgcaa ctggtccaga accttgaccg aacgcagcgg tggtaacggc gcagtggcgg
70207020
ttttcatggc ttgttatgac tgtttttttg tacagtctat gcctcgggca tccaagcagc ttttcatggc ttgttatgac tgtttttttg tacagtctat gcctcgggca tccaagcagc
70807080
aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat gttacgcagc aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat gttacgcagc
71407140
agcaacgatg ttacgcagca gggcagtcgc cctaaaacaa agttaggtgg ctcaagtatg agcaacgatg ttacgcagca gggcagtcgc cctaaaacaa agttaggtgg ctcaagtatg
72007200
ggcatcattc gcacatgtag gctcggccct gaccaagtca aatccatgcg ggctgctctt ggcatcattc gcacatgtag gctcggccct gaccaagtca aatccatgcg ggctgctctt
72607260
gatcttttcg gtcgtgagtt cggagacgta gccacctact cccaacatca gccggactcc gatcttttcg gtcgtgagtt cggagacgta gccacctact cccaacatca gccggactcc
73207320
gattacctcg ggaacttgct ccgtagtaag acattcatcg cgcttgctgc cttcgaccaa gattacctcg ggaacttgct ccgtagtaag acattcatcg cgcttgctgc cttcgaccaa
73807380
gaagcggttg ttggcgctct cgcggcttac gttctgccca ggtttgagca gccgcgtagt gaagcggttg ttggcgctct cgcggcttac gttctgccca ggtttgagca gccgcgtagt
74407440
gagatctata tctatgatct cgcagtctcc ggcgagcacc ggaggcaggg cattgccacc gagatctata tctatgatct cgcagtctcc ggcgagcacc ggaggcaggg cattgccacc
75007500
gcgctcatca atctcctcaa gcatgaggcc aacgcgcttg gtgcttatgt gatctacgtg gcgctcatca atctcctcaa gcatgaggcc aacgcgcttg gtgcttatgt gatctacgtg
75607560
caagcagatt acggtgacga tcccgcagtg gctctctata caaagttggg catacgggaa caagcagatt acggtgacga tcccgcagtg gctctctata caaagttggg catacgggaa
76207620
gaagtgatgc actttgatat cgacccaagt accgccacct aacaattcgt tcaagccgag gaagtgatgc actttgatat cgacccaagt accgccacct aacaattcgt tcaagccgag
76807680
atcggcttcc cggccgcgga gttgttcggt aaattgtcac aacgccgcga atatagtctt atcggcttcc cggccgcgga gttgttcggt aaattgtcac aacgccgcga atatagtctt
77407740
taccatgccc ttggccacgc ccctctttaa tacgacgggc aatttgcact tcagaaaatg taccatgccc ttggccacgc ccctctttaa tacgacgggc aatttgcact tcagaaaatg
78007800
aagagtttgc tttagccata acaaaagtcc agtatgcttt ttcacagcat aactggactg aagagtttgc tttagccata acaaaagtcc agtatgcttt ttcacagcat aactggactg
78607860
atttcagttt acaactattc tgtctagttt aagactttat tgtcatagtt tagatctatt atttcagttt acaactattc tgtctagttt aagactttat tgtcatagtt tagatctatt
79207920
ttgttcagtt taagacttta ttgtccgccc acacccgctt acgcagggca tccatttatt ttgttcagtt taagacttta ttgtccgccc acacccgctt acgcagggca tccatttatt
79807980
actcaaccgt aaccgatttt gccaggttac gcggctggtc tgcggtgtga aataccgcac actcaaccgt aaccgatttt gccaggttac gcggctggtc tgcggtgtga aataccgcac
80408040
agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg
81008100
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg
81608160
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag
82208220
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac
82808280
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga
83408340
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt
84008400
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc
84608460
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc
85208520
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta
85808580
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat
86408640
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca
87008700
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct
87608760
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt
88208820
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct
88808880
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc
89408940
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa
90009000
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta
90609060
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc
91209120
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat
91809180
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta
92409240
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt
93009300
aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt
93609360
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg
94209420
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc
94809480
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc
95409540
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg
96009600
cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga
96609660
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta
97209720
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct
97809780
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag
98409840
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga
99009900
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat
99609960
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgaaat tgtaaacgtt aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgaaat tgtaaacgtt
1002010020
aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag
1008010080
gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtgtt
1014010140
gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga gttccagttt ggaacaagag tccactatta aagaacgtgg actccaacgt caaagggcga
1020010200
aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg aaaaccgtct atcagggcga tggcccacta cgtgaaccat caccctaatc aagttttttg
1026010260
gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct gggtcgaggt gccgtaaagc actaaatcgg aaccctaaag ggagcccccg atttagagct
1032010320
tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc tgacggggaa agccggcgaa cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc
1038010380
gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt gctagggcgc tggcaagtgt agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt
1044010440
aatgcgccgc tacagggcgc gtcccattcg ccattcaggc tgcaaataag cgttgatatt aatgcgccgc tacagggcgc gtcccattcg ccattcaggc tgcaaataag cgttgatatt
1050010500
cagtcaatta caaacattaa taacgaagag atgacagaaa aattttcatt ctgtgacaga cagtcaatta caaacattaa taacgaagag atgacagaaa aattttcatt ctgtgacaga
1056010560
gaa gaa
1056310563
<210> 203<210> 203
<211> 9871<211> 9871
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 203<400> 203
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gagtttgctg cttgcaatgt ttgcccattt tagggtggac atctacgtag ccatgctcta gagtttgctg cttgcaatgt ttgcccattt tagggtggac
240 240
acaggacgct gtggtttctg agccaggggg cgactcagat cccagccagt ggacttagcc acaggacgct gtggtttctg agccagggg cgactcagat cccagccagt ggacttagcc
300 300
cctgtttgct cctccgataa ctggggtgac cttggttaat attcaccagc agcctccccc cctgtttgct cctccgataa ctggggtgac cttggttaat attcaccagc agcctccccc
360 360
gttgcccctc tggatccact gcttaaatac ggacgaggac agggccctgt ctcctcagct gttgcccctc tggatccact gcttaaatac ggacgaggac agggccctgt ctcctcagct
420 420
tcaggcacca ccactgacct gggacagtga atcgccacca tgcagattga gctgagcacc tcaggcacca ccactgacct gggacagtga atcgccacca tgcagattga gctgagcacc
480 480
tgcttcttcc tgtgcctgct gaggttctgc ttctctgcca ccaggagata ctacctgggg tgcttcttcc tgtgcctgct gaggttctgc ttctctgcca ccaggagata ctacctgggg
540 540
gctgtggagc tgagctggga ctacatgcag tctgacctgg gggagctgcc tgtggatgcc gctgtggagc tgagctggga ctacatgcag tctgacctgg gggagctgcc tgtggatgcc
600 600
aggttccccc ccagagtgcc caagagcttc cccttcaaca cctctgtggt gtacaagaag aggttccccc ccagagtgcc caagagcttc cccttcaaca cctctgtggt gtacaagaag
660 660
accctgtttg tggagttcac tgaccacctg ttcaacattg ccaagcccag gcccccctgg accctgtttg tggagttcac tgaccacctg ttcaacattg ccaagcccag gcccccctgg
720 720
atgggcctgc tgggccccac catccaggct gaggtgtatg acactgtggt gatcaccctg atgggcctgc tgggccccac catccaggct gaggtgtatg acactgtggt gatcaccctg
780 780
aagaacatgg ccagccaccc tgtgagcctg catgctgtgg gggtgagcta ctggaaggcc aagaacatgg ccagccaccc tgtgagcctg catgctgtgg gggtgagcta ctggaaggcc
840 840
tctgaggggg ctgagtatga tgaccagacc agccagaggg agaaggagga tgacaaggtg tctgaggggg ctgagtatga tgaccagacc agccagaggg agaaggagga tgacaaggtg
900 900
ttccctgggg gcagccacac ctatgtgtgg caggtgctga aggagaatgg ccccatggcc ttccctgggg gcagccacac ctatgtgtgg caggtgctga aggagaatgg ccccatggcc
960 960
tctgaccccc tgtgcctgac ctacagctac ctgagccatg tggacctggt gaaggacctg tctgaccccc tgtgcctgac ctacagctac ctgagccatg tggacctggt gaaggacctg
10201020
aactctggcc tgattggggc cctgctggtg tgcagggagg gcagcctggc caaggagaag aactctggcc tgattggggc cctgctggtg tgcagggagg gcagcctggc caaggagaag
10801080
acccagaccc tgcacaagtt catcctgctg tttgctgtgt ttgatgaggg caagagctgg acccagaccc tgcacaagtt catcctgctg tttgctgtgt ttgatgaggg caagagctgg
11401140
cactctgaaa ccaagaacag cctgatgcag gacagggatg ctgcctctgc cagggcctgg cactctgaaa ccaagaacag cctgatgcag gacagggatg ctgcctctgc cagggcctgg
12001200
cccaagatgc acactgtgaa tggctatgtg aacaggagcc tgcctggcct gattggctgc cccaagatgc acactgtgaa tggctatgtg aacaggagcc tgcctggcct gattggctgc
12601260
cacaggaagt ctgtgtactg gcatgtgatt ggcatgggca ccacccctga ggtgcacagc cacaggaagt ctgtgtactg gcatgtgatt ggcatgggca ccacccctga ggtgcacagc
13201320
atcttcctgg agggccacac cttcctggtc aggaaccaca ggcaggccag cctggagatc atcttcctgg agggccacac cttcctggtc aggaaccaca ggcaggccag cctggagatc
13801380
agccccatca ccttcctgac tgcccagacc ctgctgatgg acctgggcca gttcctgctg agccccatca ccttcctgac tgcccagacc ctgctgatgg acctgggcca gttcctgctg
14401440
ttctgccaca tcagcagcca ccagcatgat ggcatggagg cctatgtgaa ggtggacagc ttctgccaca tcagcagcca ccagcatgat ggcatggagg cctatgtgaa ggtggacagc
15001500
tgccctgagg agccccagct gaggatgaag aacaatgagg aggctgagga ctatgatgat tgccctgagg agccccagct gaggatgaag aacaatgagg aggctgagga ctatgatgat
15601560
gacctgactg actctgagat ggatgtggtg aggtttgatg atgacaacag ccccagcttc gacctgactg actctgagat ggatgtggtg aggtttgatg atgacaacag ccccagcttc
16201620
atccagatca ggtctgtggc caagaagcac cccaagacct gggtgcacta cattgctgct atccagatca ggtctgtggc caagaagcac cccaagacct gggtgcacta cattgctgct
16801680
gaggaggagg actgggacta tgcccccctg gtgctggccc ctgatgacag gagctacaag gaggaggagg actgggacta tgcccccctg gtgctggccc ctgatgacag gagctacaag
17401740
agccagtacc tgaacaatgg cccccagagg attggcagga agtacaagaa ggtcaggttc agccagtacc tgaacaatgg cccccagagg attggcagga agtacaagaa ggtcaggttc
18001800
atggcctaca ctgatgaaac cttcaagacc agggaggcca tccagcatga gtctggcatc atggcctaca ctgatgaaac cttcaagacc agggaggcca tccagcatga gtctggcatc
18601860
ctgggccccc tgctgtatgg ggaggtgggg gacaccctgc tgatcatctt caagaaccag ctgggccccc tgctgtatgg ggaggtgggg gacaccctgc tgatcatctt caagaaccag
19201920
gccagcaggc cctacaacat ctacccccat ggcatcactg atgtgaggcc cctgtacagc gccagcaggc cctacaacat ctacccccat ggcatcactg atgtgaggcc cctgtacagc
19801980
aggaggctgc ccaagggggt gaagcacctg aaggacttcc ccatcctgcc tggggagatc aggaggctgc ccaagggggt gaagcacctg aaggacttcc ccatcctgcc tggggagatc
20402040
ttcaagtaca agtggactgt gactgtggag gatggcccca ccaagtctga ccccaggtgc ttcaagtaca agtggactgt gactgtggag gatggcccca ccaagtctga ccccaggtgc
21002100
ctgaccagat actacagcag ctttgtgaac atggagaggg acctggcctc tggcctgatt ctgaccagat actacagcag ctttgtgaac atggagaggg acctggcctc tggcctgatt
21602160
ggccccctgc tgatctgcta caaggagtct gtggaccaga ggggcaacca gatcatgtct ggccccctgc tgatctgcta caaggagtct gtggaccaga ggggcaacca gatcatgtct
22202220
gacaagagga atgtgatcct gttctctgtg tttgatgaga acaggagctg gtacctgact gacaagagga atgtgatcct gttctctgtg tttgatgaga acaggagctg gtacctgact
22802280
gagaacatcc agaggttcct gcccaaccct gctggggtgc agctggagga ccctgagttc gagaacatcc agaggttcct gcccaaccct gctggggtgc agctggagga ccctgagttc
23402340
caggccagca acatcatgca cagcatcaat ggctatgtgt ttgacagcct gcagctgtct caggccagca acatcatgca cagcatcaat ggctatgtgt ttgacagcct gcagctgtct
24002400
gtgtgcctgc atgaggtggc ctactggtac atcctgagca ttggggccca gactgacttc gtgtgcctgc atgaggtggc ctactggtac atcctgagca ttggggccca gactgacttc
24602460
ctgtctgtgt tcttctctgg ctacaccttc aagcacaaga tggtgtatga ggacaccctg ctgtctgtgt tcttctctgg ctacaccttc aagcacaaga tggtgtatga ggacaccctg
25202520
accctgttcc ccttctctgg ggagactgtg ttcatgagca tggagaaccc tggcctgtgg accctgttcc ccttctctgg ggagactgtg ttcatgagca tggagaaccc tggcctgtgg
25802580
attctgggct gccacaactc tgacttcagg aacaggggca tgactgccct gctgaaagtc attctgggct gccacaactc tgacttcagg aacaggggca tgactgccct gctgaaagtc
26402640
tccagctgtg acaagaacac tggggactac tatgaggaca gctatgagga catctctgcc tccagctgtg acaagaacac tggggactac tatgaggaca gctatgagga catctctgcc
27002700
tacctgctga gcaagaacaa tgccattgag cccaggagct tcagccagaa ccccccagtg tacctgctga gcaagaacaa tgccattgag cccaggagct tcagccagaa ccccccagtg
27602760
ctgaagaggc accagaggga gatcaccagg accaccctgc agtctgacca ggaggagatt ctgaagaggc accagaggga gatcaccagg accaccctgc agtctgacca ggaggagatt
28202820
gactatgatg acaccatctc tgtggagatg aagaaggagg actttgacat ctacgacgag gactatgatg acaccatctc tgtggagatg aagaaggagg actttgacat ctacgacgag
28802880
gacgagaacc agagccccag gagcttccag aagaagacca ggcactactt cattgctgct gacgagaacc agagccccag gagcttccag aagaagacca ggcactactt cattgctgct
29402940
gtggagaggc tgtgggacta tggcatgagc agcagccccc atgtgctgag gaacagggcc gtggagaggc tgtgggacta tggcatgagc agcagccccc atgtgctgag gaacagggcc
30003000
cagtctggct ctgtgcccca gttcaagaag gtggtgttcc aggagttcac tgatggcagc cagtctggct ctgtgcccca gttcaagaag gtggtgttcc aggagttcac tgatggcagc
30603060
ttcacccagc ccctgtacag aggggagctg aatgagcacc tgggcctgct gggcccctac ttcacccagc ccctgtacag aggggagctg aatgagcacc tgggcctgct gggcccctac
31203120
atcagggctg aggtggagga caacatcatg gtgaccttca ggaaccaggc cagcaggccc atcagggctg aggtggagga caacatcatg gtgaccttca ggaaccaggc cagcaggccc
31803180
tacagcttct acagcagcct gatcagctat gaggaggacc agaggcaggg ggctgagccc tacagcttct acagcagcct gatcagctat gaggaggacc agaggcaggg ggctgagccc
32403240
aggaagaact ttgtgaagcc caatgaaacc aagacctact tctggaaggt gcagcaccac aggaagaact ttgtgaagcc caatgaaacc aagacctact tctggaaggt gcagcaccac
33003300
atggccccca ccaaggatga gtttgactgc aaggcctggg cctacttctc tgatgtggac atggccccca ccaaggatga gtttgactgc aaggcctggg cctacttctc tgatgtggac
33603360
ctggagaagg atgtgcactc tggcctgatt ggccccctgc tggtgtgcca caccaacacc ctggagaagg atgtgcactc tggcctgatt ggccccctgc tggtgtgcca caccaacacc
34203420
ctgaaccctg cccatggcag gcaggtgact gtgcaggagt ttgccctgtt cttcaccatc ctgaaccctg cccatggcag gcaggtgact gtgcaggagt ttgccctgtt cttcaccatc
34803480
tttgatgaaa ccaagagctg gtacttcact gagaacatgg agaggaactg cagggccccc tttgatgaaa ccaagagctg gtacttcact gagaacatgg agaggaactg cagggccccc
35403540
tgcaacatcc agatggagga ccccaccttc aaggagaact acaggttcca tgccatcaat tgcaacatcc agatggagga ccccaccttc aaggagaact acaggttcca tgccatcaat
36003600
ggctacatca tggacaccct gcctggcctg gtgatggccc aggaccagag gatcaggtgg ggctacatca tggacaccct gcctggcctg gtgatggccc aggaccagag gatcaggtgg
36603660
tacctgctga gcatgggcag caatgagaac atccacagca tccacttctc tggccatgtg tacctgctga gcatgggcag caatgagaac atccacagca tccacttctc tggccatgtg
37203720
ttcactgtga ggaagaagga ggagtacaag atggccctgt acaacctgta ccctggggtg ttcactgtga ggaagaagga ggagtacaag atggccctgt acaacctgta ccctggggtg
37803780
tttgagactg tggagatgct gcccagcaag gctggcatct ggagggtgga gtgcctgatt tttgagactg tggagatgct gcccagcaag gctggcatct ggagggtgga gtgcctgatt
38403840
ggggagcacc tgcatgctgg catgagcacc ctgttcctgg tgtacagcaa caagtgccag ggggagcacc tgcatgctgg catgagcacc ctgttcctgg tgtacagcaa caagtgccag
39003900
acccccctgg gcatggcctc tggccacatc agggacttcc agatcactgc ctctggccag acccccctgg gcatggcctc tggccacatc agggacttcc agatcactgc ctctggccag
39603960
tatggccagt gggcccccaa gctggccagg ctgcactact ctggcagcat caatgcctgg tatggccagt gggcccccaa gctggccagg ctgcactact ctggcagcat caatgcctgg
40204020
agcaccaagg agcccttcag ctggatcaag gtggacctgc tggcccccat gatcatccat agcaccaagg agcccttcag ctggatcaag gtggacctgc tggcccccat gatcatccat
40804080
ggcatcaaga cccagggggc caggcagaag ttcagcagcc tgtacatcag ccagttcatc ggcatcaaga cccagggggc caggcagaag ttcagcagcc tgtacatcag ccagttcatc
41404140
atcatgtaca gcctggatgg caagaagtgg cagacctaca ggggcaacag cactggcacc atcatgtaca gcctggatgg caagaagtgg cagacctaca ggggcaacag cactggcacc
42004200
ctgatggtgt tctttggcaa tgtggacagc tctggcatca agcacaacat cttcaacccc ctgatggtgt tctttggcaa tgtggacagc tctggcatca agcacaacat cttcaacccc
42604260
cccatcattg ccagatacat caggctgcac cccacccact acagcatcag gagcaccctg cccatcattg ccagatacat caggctgcac cccacccact acagcatcag gagcaccctg
43204320
aggatggagc tgatgggctg tgacctgaac agctgcagca tgcccctggg catggagagc aggatggagc tgatgggctg tgacctgaac agctgcagca tgcccctggg catggagagc
43804380
aaggccatct ctgatgccca gatcactgcc agcagctact tcaccaacat gtttgccacc aaggccatct ctgatgccca gatcactgcc agcagctact tcaccaacat gtttgccacc
44404440
tggagcccca gcaaggccag gctgcacctg cagggcagga gcaatgcctg gaggccccag tggagcccca gcaaggccag gctgcacctg cagggcagga gcaatgcctg gaggccccag
45004500
gtcaacaacc ccaaggagtg gctgcaggtg gacttccaga agaccatgaa ggtgactggg gtcaacaacc ccaaggagtg gctgcaggtg gacttccaga agaccatgaa ggtgactggg
45604560
gtgaccaccc agggggtgaa gagcctgctg accagcatgt atgtgaagga gttcctgatc gtgaccaccc aggggtgaa gagcctgctg accagcatgt atgtgaagga gttcctgatc
46204620
agcagcagcc aggatggcca ccagtggacc ctgttcttcc agaatggcaa ggtgaaggtg agcagcagcc aggatggcca ccagtggacc ctgttcttcc agaatggcaa ggtgaaggtg
46804680
ttccagggca accaggacag cttcacccct gtggtgaaca gcctggaccc ccccctgctg ttccagggca accaggacag cttcacccct gtggtgaaca gcctggaccc ccccctgctg
47404740
accagatacc tgaggattca cccccagagc tgggtgcacc agattgccct gaggatggag accagatacc tgaggattca cccccagagc tgggtgcacc agattgccct gaggatggag
48004800
gtgctgggct gtgaggccca ggacctgtac tgaaataaaa gatctttatt ttcattagat gtgctgggct gtgaggccca ggacctgtac tgaaataaaa gatctttatt ttcattagat
48604860
ctgtgtgttg gttttttgtg tgtctagagc atggctacgt agataagtag catggcgggt ctgtgtgttg gttttttgtg tgtctagagc atggctacgt agataagtag catggcgggt
49204920
taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct taatcattaa ctacacctgc aggaggaacc cctagtgatg gagttggcca ctccctctct
49804980
gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggcggcct
50405040
cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa cagtgagcga gcgagcgcgc agctgcctgc aggggcgcgc ctcgaggcat gcggtaccaa
51005100
gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact gcttgtcgag aagtactaga ggatcataat cagccatacc acatttgtag aggttttact
51605160
tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt tgctttaaaa aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt
52205220
tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tgttgttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa
52805280
tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa
53405340
tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa tgtatcttat catgtctgga tctgatcact gatatcgcct aggagatccg aaccagataa
54005400
gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta gtgaaatcta gttccaaact attttgtcat ttttaatttt cgtattagct tacgacgcta
54605460
cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccatttcc cacccagttc ccatctattt tgtcactctt ccctaaataa tccttaaaaa ctccattcc
55205520
acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat acccctccca gttcccaact attttgtccg cccacagcgg ggcatttttc ttcctgttat
55805580
gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt gtttttaatc aaacatcctg ccaactccat gtgacaaacc gtcatcttcg gctacttttt
56405640
ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact ctctgtcaca gaatgaaaat ttttctgtca tctcttcgtt attaatgttt gtaattgact
57005700
gaatatcaac gcttatttgc agcctgaatg gcgaatggga cgcgccctgt agcggcgcat gaatatcaac gcttatttgc agcctgaatg gcgaatggga cgcgccctgt agcggcgcat
57605760
taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag
58205820
cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc
58805880
aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc aagctctaaa tcggggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc
59405940
ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt
60006000
ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa
60606060
caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg
61206120
cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat
61806180
taacgtttac aatttcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt taacgtttac aatttcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt
62406240
tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc
63006300
ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc
63606360
ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa
64206420
aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg
64806480
gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag
65406540
ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc
66006600
gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta
66606660
cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg
67206720
cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca
67806780
acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac
68406840
caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat
69006900
taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg
69606960
ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata
70207020
aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta
70807080
agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa
71407140
atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag
72007200
tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg
72607260
tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact
73207320
gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg
73807380
taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc
74407440
aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata
75007500
ctgtccttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta ctgtccttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta
75607560
catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc
76207620
ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg
76807680
ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac
77407740
agcgtgagca ttgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg agcgtgagca ttgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg
78007800
taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt
78607860
atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct
79207920
cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg
79807980
ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata
80408040
accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca
81008100
gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc
81608160
tgtgcggtat ttcacaccgc agaccagccg cgtaacctgg caaaatcggt tacggttgag tgtgcggtat ttcacaccgc agaccagccg cgtaacctgg caaaatcggt tacggttgag
82208220
taataaatgg atgccctgcg taagcgggtg tgggcggaca ataaagtctt aaactgaaca taataaatgg atgccctgcg taagcgggtg tgggcggaca ataaagtctt aaactgaaca
82808280
aaatagatct aaactatgac aataaagtct taaactagac agaatagttg taaactgaaa aaatagatct aaactatgac aataaagtct taaactagac agaatagttg taaactgaaa
83408340
tcagtccagt tatgctgtga aaaagcatac tggacttttg ttatggctaa agcaaactct tcagtccagt tatgctgtga aaaagcatac tggacttttg ttatggctaa agcaaactct
84008400
tcattttctg aagtgcaaat tgcccgtcgt attaaagagg ggcgtggcca agggcatggt tcattttctg aagtgcaaat tgcccgtcgt attaaagagg ggcgtggcca agggcatggt
84608460
aaagactata ttcgcggcgt tgtgacaatt taccgaacaa ctccgcggcc gggaagccga aaagactata ttcgcggcgt tgtgacaatt taccgaacaa ctccgcggcc gggaagccga
85208520
tctcggcttg aacgaattgt taggtggcgg tacttgggtc gatatcaaag tgcatcactt tctcggcttg aacgaattgt taggtggcgg tacttgggtc gatatcaaag tgcatcactt
85808580
cttcccgtat gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt cttcccgtat gcccaacttt gtatagagag ccactgcggg atcgtcaccg taatctgctt
86408640
gcacgtagat cacataagca ccaagcgcgt tggcctcatg cttgaggaga ttgatgagcg gcacgtagat cacataagca ccaagcgcgt tggcctcatg cttgaggaga ttgatgagcg
87008700
cggtggcaat gccctgcctc cggtgctcgc cggagactgc gagatcatag atatagatct cggtggcaat gccctgcctc cggtgctcgc cggagactgc gagatcatag atatagatct
87608760
cactacgcgg ctgctcaaac ctgggcagaa cgtaagccgc gagagcgcca acaaccgctt cactacgcgg ctgctcaaac ctgggcagaa cgtaagccgc gagagcgcca acaaccgctt
88208820
cttggtcgaa ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat cttggtcgaa ggcagcaagc gcgatgaatg tcttactacg gagcaagttc ccgaggtaat
88808880
cggagtccgg ctgatgttgg gagtaggtgg ctacgtctcc gaactcacga ccgaaaagat cggagtccgg ctgatgttgg gagtaggtgg ctacgtctcc gaactcacga ccgaaaagat
89408940
caagagcagc ccgcatggat ttgacttggt cagggccgag cctacatgtg cgaatgatgc caagagcagc ccgcatggat ttgacttggt cagggccgag cctacatgtg cgaatgatgc
90009000
ccatacttga gccacctaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc ccatacttga gccacctaac tttgttttag ggcgactgcc ctgctgcgta acatcgttgc
90609060
tgctgcgtaa catcgttgct gctccataac atcaaacatc gacccacggc gtaacgcgct tgctgcgtaa catcgttgct gctccataac atcaaacatc gacccacggc gtaacgcgct
91209120
tgctgcttgg atgcccgagg catagactgt acaaaaaaac agtcataaca agccatgaaa tgctgcttgg atgcccgagg catagactgt acaaaaaaac agtcataaca agccatgaaa
91809180
accgccactg cgccgttacc accgctgcgt tcggtcaagg ttctggacca gttgcgtgag accgccactg cgccgttacc accgctgcgt tcggtcaagg ttctggacca gttgcgtgag
92409240
cgcatacgct acttgcatta cagtttacga accgaacagg cttatgtcaa ctgggttcgt cgcatacgct acttgcatta cagtttacga accgaacagg cttatgtcaa ctgggttcgt
93009300
gccttcatcc gtttccacgg tgtgcgtcac ccggcaacct tgggcagcag cgaagtcgag gccttcatcc gtttccacgg tgtgcgtcac ccggcaacct tgggcagcag cgaagtcgag
93609360
gcatttctgt cctggctggc gaacgagcgc aaggtttcgg tctccacgca tcgtcaggca gcatttctgt cctggctggc gaacgagcgc aaggtttcgg tctccacgca tcgtcaggca
94209420
ttggcggcct tgctgttctt ctacggcaag gtgctgtgca cggatctgcc ctggcttcag ttggcggcct tgctgttctt ctacggcaag gtgctgtgca cggatctgcc ctggcttcag
94809480
gagatcggaa gacctcggcc gtcgcggcgc ttgccggtgg tgctgacccc ggatgaagtg gagatcggaa gacctcggcc gtcgcggcgc ttgccggtgg tgctgacccc ggatgaagtg
95409540
gttcgcatcc tcggttttct ggaaggcgag catcgtttgt tcgcccagga ctctagctat gttcgcatcc tcggttttct ggaaggcgag catcgtttgt tcgcccagga ctctagctat
96009600
agttctagtg gttggctacg tatactccgg aatattaata gatcatggag ataattaaaa agttctagtg gttggctacg tatactccgg aatattaata gatcatggag ataattaaaa
96609660
tgataaccat ctcgcaaata aataagtatt ttactgtttt cgtaacagtt ttgtaataaa tgataaccat ctcgcaaata aataagtatt ttactgtttt cgtaacagtt ttgtaataaa
97209720
aaaacctata aatattccgg attattcata ccgtcccacc atcgggcgcg gatctcggtc aaaacctata aatattccgg attattcata ccgtcccacc atcgggcgcg gatctcggtc
97809780
cgaaaccatg tcgtactacc atcaccatca ccatcacgat tacgatatcc caacgaccga cgaaaccatg tcgtactacc atcaccatca ccatcacgat tacgatatcc caacgaccga
98409840
aaacctgtat tttcagggcg ccatgggatc c aaacctgtat tttcagggcg ccatgggatc c
98719871
<210> 204<210> 204
<211> 9969<211> 9969
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 204<400> 204
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gagtctgtct gcacatttcg tagagcgagt gttccgatac atctacgtag ccatgctcta gagtctgtct gcacatttcg tagagcgagt gttccgatac
240 240
tctaatctcc ctaggcaagg ttcatattga cttaggttac ttattctcct tttgttgact tctaatctcc ctaggcaagg ttcatattga cttaggttac ttattctcct tttgttgact
300 300
aagtcaataa tcagaatcag caggtttgga gtcagcttgg cagggatcag cagcctgggt aagtcaataa tcagaatcag caggtttgga gtcagcttgg cagggatcag cagcctgggt
360 360
tggaaggagg gggtataaaa gccccttcac caggagaagc cgtcacacag atccacaagc tggaaggagg gggtataaaa gccccttcac caggagaagc cgtcacacag atccacaagc
420 420
tcctgctagc aggtaagtgc cgtgtgtggt tcccgcgggc ctggcctctt tacgggttat tcctgctagc aggtaagtgc cgtgtgtggt tcccgcgggc ctggcctctt tacgggttat
480 480
ggcccttgcg tgccttgaat tactgacact gacatccact ttttcttttt ctccacaggt ggcccttgcg tgccttgaat tactgacact gacatccact ttttcttttt ctccacaggt
540 540
ttaaacgcca ccatgcagat tgagctgagc acctgcttct tcctgtgtct gctgaggttc ttaaacgcca ccatgcagat tgagctgagc acctgcttct tcctgtgtct gctgaggttc
600 600
tgcttctctg ccaccaggag gtattacctg ggggctgtgg agctgagctg ggactatatg tgcttctctg ccaccaggag gtattacctg ggggctgtgg agctgagctg ggactatatg
660 660
cagtctgacc tgggggagct gcctgtggat gctaggttcc cccccagggt gcccaagagc cagtctgacc tgggggagct gcctgtggat gctaggttcc cccccagggt gcccaagagc
720 720
ttccccttta acacttctgt ggtgtacaag aagaccctgt ttgtggagtt cactgaccac ttccccttta acacttctgt ggtgtacaag aagaccctgt ttgtggagtt cactgaccac
780 780
ctgttcaaca ttgccaagcc caggcccccc tggatggggc tgctggggcc caccatccag ctgttcaaca ttgccaagcc caggcccccc tggatggggc tgctggggcc caccatccag
840 840
gctgaggtgt atgacactgt ggtgatcacc ctgaagaaca tggccagcca ccctgtgagc gctgaggtgt atgacactgt ggtgatcacc ctgaagaaca tggccagcca ccctgtgagc
900 900
ctgcatgctg tgggggtgag ctactggaag gcttctgagg gggctgagta tgatgaccag ctgcatgctg tgggggtgag ctactggaag gcttctgagg gggctgagta tgatgaccag
960 960
actagccaga gggagaagga ggatgacaag gtgtttcctg ggggcagcca tacctatgtg actagccaga gggagaagga ggatgacaag gtgtttcctg ggggcagcca tacctatgtg
10201020
tggcaggtgc tgaaggagaa tggccccatg gcctctgacc ccctgtgcct gacctacagc tggcaggtgc tgaaggagaa tggccccatg gcctctgacc ccctgtgcct gacctacagc
10801080
tacctgtctc atgtggacct ggtgaaggac ctgaactctg gcctgattgg ggctctgctg tacctgtctc atgtggacct ggtgaaggac ctgaactctg gcctgattgg ggctctgctg
11401140
gtgtgtaggg agggcagcct ggctaaggaa aagacccaga ccctgcataa gtttatcctg gtgtgtaggg agggcagcct ggctaaggaa aagacccaga ccctgcataa gtttatcctg
12001200
ctgtttgctg tgtttgatga gggcaagagc tggcactctg agaccaagaa cagcctgatg ctgtttgctg tgtttgatga gggcaagagc tggcactctg agaccaagaa cagcctgatg
12601260
caggataggg atgctgcctc tgccagggct tggcctaaga tgcacactgt gaatgggtat caggataggg atgctgcctc tgccagggct tggcctaaga tgcacactgt gaatgggtat
13201320
gtgaatagga gcctgcctgg cctgattggc tgccacagga agtctgtgta ctggcatgtg gtgaatagga gcctgcctgg cctgattggc tgccacagga agtctgtgta ctggcatgtg
13801380
attgggatgg gcaccacccc tgaggtccat agcatcttcc tggagggcca cactttcctg attgggatgg gcaccacccc tgaggtccat agcatcttcc tggagggcca cactttcctg
14401440
gtgaggaacc acagacaggc ctctctggag atctctccca tcaccttcct gactgctcag gtgaggaacc acagacaggc ctctctggag atctctccca tcaccttcct gactgctcag
15001500
actctgctga tggacctggg ccagttcctg ctgttttgcc atattagcag ccaccagcat actctgctga tggacctggg ccagttcctg ctgttttgcc atattagcag ccaccagcat
15601560
gatgggatgg aggcctatgt gaaggtggat agctgccctg aggagcctca gctgaggatg gatgggatgg aggcctatgt gaaggtggat agctgccctg aggagcctca gctgaggatg
16201620
aagaacaatg aggaggctga agactatgat gatgacctga ctgattctga gatggatgtg aagaacaatg aggaggctga agactatgat gatgacctga ctgattctga gatggatgtg
16801680
gtgaggtttg atgatgacaa tagccccagc ttcattcaga tcaggtctgt ggccaagaaa gtgaggtttg atgatgacaa tagccccagc ttcattcaga tcaggtctgt ggccaagaaa
17401740
caccccaaga cctgggtgca ctacattgct gctgaggaag aggactggga ctatgctccc caccccaaga cctgggtgca ctacattgct gctgaggaag aggactggga ctatgctccc
18001800
ctggtgctgg cccctgatga taggtcttat aagagccagt acctgaacaa tgggccccag ctggtgctgg cccctgatga taggtcttat aagagccagt acctgaacaa tgggccccag
18601860
aggattggca ggaagtacaa gaaggtgagg ttcatggcct acactgatga aaccttcaaa aggattggca ggaagtacaa gaaggtgagg ttcatggcct acactgatga aaccttcaaa
19201920
accagggagg ccattcagca tgagtctggc atcctgggcc ctctgctgta tggggaggtg accagggagg ccattcagca tgagtctggc atcctgggcc ctctgctgta tggggaggtg
19801980
ggggacaccc tgctgatcat cttcaagaac caggccagca ggccctacaa catctatcct ggggacaccc tgctgatcat cttcaagaac caggccagca ggccctacaa catctatcct
20402040
catggcatca ctgatgtgag gcccctgtac agcaggaggc tgcccaaggg ggtgaagcac catggcatca ctgatgtgag gcccctgtac agcaggaggc tgcccaaggg ggtgaagcac
21002100
ctgaaagact tccccatcct gcctggggag atctttaagt ataagtggac tgtgactgtg ctgaaagact tccccatcct gcctggggag atctttaagt ataagtggac tgtgactgtg
21602160
gaggatggcc ctaccaagtc tgaccccagg tgtctgacca ggtactattc tagctttgtg gaggatggcc ctaccaagtc tgaccccagg tgtctgacca ggtactattc tagctttgtg
22202220
aacatggaga gggacctggc ctctggcctg attgggcccc tgctgatctg ctacaaggag aacatggaga gggacctggc ctctggcctg attgggcccc tgctgatctg ctacaaggag
22802280
tctgtggacc agaggggcaa ccagatcatg tctgacaaga ggaatgtgat cctgttttct tctgtggacc agaggggcaa ccagatcatg tctgacaaga ggaatgtgat cctgttttct
23402340
gtgtttgatg agaataggag ctggtacctg actgagaaca tccagaggtt tctgcccaat gtgtttgatg agaataggag ctggtacctg actgagaaca tccagaggtt tctgcccaat
24002400
cctgctgggg tgcagctgga ggatcctgag ttccaggcca gcaatatcat gcatagcatc cctgctgggg tgcagctgga ggatcctgag ttccaggcca gcaatatcat gcatagcatc
24602460
aatggctatg tgtttgacag cctgcagctg tctgtgtgcc tgcatgaggt ggcctactgg aatggctatg tgtttgacag cctgcagctg tctgtgtgcc tgcatgaggt ggcctactgg
25202520
tacatcctga gcattggggc ccagactgac tttctgtctg tgttcttttc tggctatacc tacatcctga gcattggggc ccagactgac tttctgtctg tgttcttttc tggctatacc
25802580
ttcaagcaca agatggtgta tgaggatacc ctgaccctgt tccccttctc tggggagact ttcaagcaca agatggtgta tgaggatacc ctgaccctgt tccccttctc tggggagact
26402640
gtgttcatga gcatggagaa tcctgggctg tggatcctgg ggtgccacaa ctctgatttt gtgttcatga gcatggagaa tcctgggctg tggatcctgg ggtgccacaa ctctgatttt
27002700
aggaacaggg ggatgactgc cctgctgaag gtgtctagct gtgataagaa cactggggac aggaacaggg ggatgactgc cctgctgaag gtgtctagct gtgataagaa cactggggac
27602760
tactatgagg acagctatga ggacatttct gcttatctgc tgtctaagaa taatgccatt tactatgagg acagctatga ggacatttct gcttatctgc tgtctaagaa taatgccatt
28202820
gagcccagaa gcttcagcca gaatccccct gtgctgaaga gacatcagag ggagatcacc gagcccagaa gcttcagcca gaatccccct gtgctgaaga gacatcagag ggagatcacc
28802880
agaactaccc tgcagtctga tcaggaggag attgactatg atgacactat ctctgtggag agaactaccc tgcagtctga tcaggaggag attgactatg atgacactat ctctgtggag
29402940
atgaagaagg aggactttga catctatgat gaggatgaga atcagtctcc caggagcttt atgaagaagg aggactttga catctatgat gaggatgaga atcagtctcc caggagcttt
30003000
cagaagaaga ccagacatta cttcattgct gctgtggaga ggctgtggga ctatggcatg cagaagaaga ccagacatta cttcattgct gctgtggaga ggctgtggga ctatggcatg
30603060
agctctagcc ctcatgtgct gaggaacagg gcccagtctg gctctgtgcc ccagttcaag agctctagcc ctcatgtgct gaggaacagg gcccagtctg gctctgtgcc ccagttcaag
31203120
aaggtggtgt tccaggaatt cactgatggc agcttcaccc agcccctgta caggggggag aaggtggtgt tccaggaatt cactgatggc agcttcaccc agcccctgta caggggggag
31803180
ctgaatgagc acctgggcct gctggggcct tatatcaggg ctgaggtgga ggataatatt ctgaatgagc acctggggcct gctggggcct tatatcaggg ctgaggtgga ggataatatt
32403240
atggtgactt tcaggaacca ggccagcagg ccctactctt tctatagcag cctgatctct atggtgactt tcaggaacca ggccagcagg ccctactctt tctatagcag cctgatctct
33003300
tatgaggagg atcagaggca gggggctgag cctaggaaga actttgtgaa gcccaatgag tatgaggagg atcagaggca gggggctgag cctaggaaga actttgtgaa gcccaatgag
33603360
actaagacct acttctggaa ggtccagcac cacatggccc ctaccaagga tgagtttgac actaagacct acttctggaa ggtccagcac cacatggccc ctaccaagga tgagtttgac
34203420
tgcaaggcct gggcctattt ctctgatgtg gatctggaga aggatgtcca ttctgggctg tgcaaggcct gggcctattt ctctgatgtg gatctggaga aggatgtcca ttctgggctg
34803480
attggccccc tgctggtgtg ccacactaac actctgaatc ctgcccatgg caggcaggtg attggccccc tgctggtgtg ccacactaac actctgaatc ctgcccatgg caggcaggtg
35403540
actgtccagg agtttgccct gttcttcact atctttgatg agaccaagag ctggtacttt actgtccagg agtttgccct gttcttcact atctttgatg agaccaagag ctggtacttt
36003600
actgagaaca tggagaggaa ctgcagagct ccttgcaata ttcagatgga ggaccccacc actgagaaca tggagaggaa ctgcagagct ccttgcaata ttcagatgga ggaccccacc
36603660
ttcaaggaga attacaggtt ccatgccatt aatgggtaca tcatggacac cctgcctggc ttcaaggaga attacaggtt ccatgccatt aatgggtaca tcatggacac cctgcctggc
37203720
ctggtgatgg ctcaggacca gaggatcagg tggtacctgc tgagcatggg ctctaatgag ctggtgatgg ctcaggacca gaggatcagg tggtacctgc tgagcatggg ctctaatgag
37803780
aatatccaca gcatccactt ctctgggcat gtgttcactg tgaggaagaa ggaggagtac aatatccaca gcatccactt ctctgggcat gtgttcactg tgaggaagaa ggagggagtac
38403840
aagatggctc tgtataatct gtaccctggg gtgtttgaaa ctgtggagat gctgccctct aagatggctc tgtataatct gtaccctggg gtgtttgaaa ctgtggagat gctgccctct
39003900
aaggctggca tctggagggt ggagtgcctg attggggagc acctgcatgc tggcatgagc aaggctggca tctggagggt ggagtgcctg attggggagc acctgcatgc tggcatgagc
39603960
accctgttcc tggtgtacag caacaagtgc cagacccccc tgggcatggc ctctggccac accctgttcc tggtgtacag caacaagtgc cagacccccc tgggcatggc ctctggccac
40204020
atcagggact tccagatcac tgcctctggc cagtatggcc agtgggcccc caagctggcc atcagggact tccagatcac tgcctctggc cagtatggcc agtgggcccc caagctggcc
40804080
aggctgcact attctggcag catcaatgcc tggagcacca aggagccctt cagctggatc aggctgcact attctggcag catcaatgcc tggagcacca aggagccctt cagctggatc
41404140
aaggtggacc tgctggcccc catgatcatt catggcatca agacccaggg ggccaggcag aaggtggacc tgctggcccc catgatcatt catggcatca agacccaggg ggccaggcag
42004200
aagttcagct ctctgtacat ctctcagttc atcatcatgt actctctgga tgggaagaag aagttcagct ctctgtacat ctctcagttc atcatcatgt actctctgga tgggaagaag
42604260
tggcagacct acaggggcaa cagcactggc accctgatgg tgttctttgg gaatgtggac tggcagacct acaggggcaa cagcactggc accctgatgg tgttctttgg gaatgtggac
43204320
tcttctggca tcaagcacaa catcttcaat ccccccatca ttgctaggta tattaggctg tcttctggca tcaagcacaa catcttcaat ccccccatca ttgctaggta tattaggctg
43804380
catcccaccc actacagcat caggtctacc ctgaggatgg agctgatggg ctgtgacctg catcccaccc actacagcat caggtctacc ctgaggatgg agctgatggg ctgtgacctg
44404440
aactcttgca gcatgcccct gggcatggag tctaaggcca tctctgatgc ccagattact aactcttgca gcatgcccct gggcatggag tctaaggcca tctctgatgc ccagattact
45004500
gccagcagct acttcaccaa catgtttgcc acctggagcc cctctaaggc caggctgcat gccagcagct acttcaccaa catgtttgcc acctggagcc cctctaaggc caggctgcat
45604560
ctgcagggga ggagcaatgc ctggaggcct caggtgaaca accccaagga gtggctgcag ctgcagggga ggagcaatgc ctggaggcct caggtgaaca accccaagga gtggctgcag
46204620
gtggatttcc agaagaccat gaaggtgact ggggtgacca cccagggggt caagagcctg gtggatttcc agaagaccat gaaggtgact ggggtgacca cccagggggt caagagcctg
46804680
ctgaccagca tgtatgtgaa ggagttcctg atcagcagca gccaggatgg ccaccagtgg ctgaccagca tgtatgtgaa ggagttcctg atcagcagca gccaggatgg ccaccagtgg
47404740
actctgttct ttcagaatgg gaaggtgaag gtgtttcagg gcaatcagga ctctttcacc actctgttct ttcagaatgg gaaggtgaag gtgtttcagg gcaatcagga ctctttcacc
48004800
cctgtggtga acagcctgga cccccccctg ctgaccagat acctgaggat ccacccccag cctgtggtga acagcctgga cccccccctg ctgaccagat acctgaggat ccacccccag
48604860
tcttgggtgc atcagattgc cctgaggatg gaggtgctgg gctgtgaggc tcaggatctg tcttgggtgc atcagattgc cctgaggatg gaggtgctgg gctgtgaggc tcaggatctg
49204920
tactgagcgg ccgcaataaa agatcagagc tctagagatc tgtgtgttgg ttttttgtgt tactgagcgg ccgcaataaa agatcagagc tctagagatc tgtgtgttgg ttttttgtgt
49804980
tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag
50405040
gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag
51005100
gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag
51605160
ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa gtactagagg ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa gtactagagg
52205220
atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac
52805280
ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca
53405340
gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt
54005400
tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc
54605460
tgatcactga tatcgcctag gagatccgaa ccagataagt gaaatctagt tccaaactat tgatcactga tatcgcctag gagatccgaa ccagataagt gaaatctagt tccaaactat
55205520
tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc atctattttg tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc atctattttg
55805580
tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt tcccaactat tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt tcccaactat
56405640
tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa acatcctgcc tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa acatcctgcc
57005700
aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga atgaaaattt aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga atgaaaattt
57605760
ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc ttatttgcag ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc ttatttgcag
58205820
cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt
58805880
tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt
59405940
cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc
60006000
tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga
60606060
tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc
61206120
cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt
61806180
ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct
62406240
gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa tttcaggtgg gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa tttcaggtgg
63006300
cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa
63606360
tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa
64206420
gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct
64806480
tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg
65406540
tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg
66006600
ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt
66606660
atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga
67206720
cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga
67806780
attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac
68406840
gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg
69006900
ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac
69606960
gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct
70207020
agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct
70807080
gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg
71407140
gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat
72007200
ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg
72607260
tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat
73207320
tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct
73807380
catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa
74407440
gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa
75007500
aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc
75607560
gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta
76207620
gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct
76807680
gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg
77407740
atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag
78007800
cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt gagaaagcgc
78607860
cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg
79207920
agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt
79807980
tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg
80408040
gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca
81008100
catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg
81608160
agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc
82208220
ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcag ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcag
82808280
accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat gccctgcgta accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat gccctgcgta
83408340
agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa actatgacaa agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa actatgacaa
84008400
taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta tgctgtgaaa taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta tgctgtgaaa
84608460
aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa gtgcaaattg aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa gtgcaaattg
85208520
cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt cgcggcgttg cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt cgcggcgttg
85808580
tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa cgaattgtta tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa cgaattgtta
86408640
ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc ccaactttgt ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc ccaactttgt
87008700
atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca cataagcacc atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca cataagcacc
87608760
aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc cctgcctccg aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc cctgcctccg
88208820
gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct gctcaaacct gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct gctcaaacct
88808880
gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg cagcaagcgc gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg cagcaagcgc
89408940
gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct gatgttggga gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct gatgttggga
90009000
gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc gcatggattt gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc gcatggattt
90609060
gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc cacctaactt gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc cacctaactt
91209120
tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca tcgttgctgc tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca tcgttgctgc
91809180
tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat gcccgaggca tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat gcccgaggca
92409240
tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg ccgttaccac tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg ccgttaccac
93009300
cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac ttgcattaca cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac ttgcattaca
93609360
gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt ttccacggtg gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt ttccacggtg
94209420
tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc tggctggcga tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc tggctggcga
94809480
acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg ctgttcttct acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg ctgttcttct
95409540
acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga cctcggccgt acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga cctcggccgt
96009600
cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc ggttttctgg cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc ggttttctgg
96609660
aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt tggctacgta aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt tggctacgta
97209720
tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct cgcaaataaa tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct cgcaaataaa
97809780
taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa tattccggat taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa tattccggat
98409840
tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc gtactaccat tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc gtactaccat
99009900
caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt tcagggcgcc caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt tcagggcgcc
99609960
atgggatcc atgggatcc
99699969
<210> 205<210> 205
<211> 10063<211> 10063
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 205<400> 205
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gaggaaccat tgccaccttc agggggaggc tgctggtgaa atctacgtag ccatgctcta gaggaaccat tgccaccttc agggggaggc tgctggtgaa
240 240
tattaaccaa gatcacccca gttaccggag gagcaaacag ggactaagtt cacacgcgtg tattaaccaa gatcacccca gttaccggag gagcaaacag ggactaagtt cacacgcgtg
300 300
gtaccgtctg tctgcacatt tcgtagagcg agtgttccga tactctaatc tccctaggca gtaccgtctg tctgcacatt tcgtagagcg agtgttccga tactctaatc tccctaggca
360 360
aggttcatat ttgtgtaggt tacttattct ccttttgttg actaagtcaa taatcagaat aggttcatat ttgtgtaggt tacttattct ccttttgttg actaagtcaa taatcagaat
420 420
cagcaggttt ggagtcagct tggcagggat cagcagcctg ggttggaagg agggggtata cagcaggttt ggagtcagct tggcagggat cagcagcctg ggttggaagg aggggtata
480 480
aaagcccctt caccaggaga agccgtcaca cagatccaca agctcctgaa gaggtaaggg aaagcccctt caccaggaga agccgtcaca cagatccaca agctcctgaa gaggtaaggg
540 540
tttaagttat cgttagttcg tgcaccatta atgtttaatt acctggagca cctgcctgaa tttaagttat cgttagttcg tgcaccatta atgtttaatt acctggagca cctgcctgaa
600 600
atcatttttt tttcaggttg gctagtatgc agatcgagct ctccacctgc ttctttctgt atcatttttt tttcaggttg gctagtatgc agatcgagct ctccacctgc ttctttctgt
660 660
gcctgttgag attctgcttc agcgccacca ggagatacta cctgggggct gtggagctga gcctgttgag attctgcttc agcgccacca ggagatacta cctggggggct gtggagctga
720 720
gctgggacta catgcagtct gacctggggg agctgcctgt ggatgccagg ttccccccca gctgggacta catgcagtct gacctggggg agctgcctgt ggatgccagg ttccccccca
780 780
gagtgcccaa gagcttcccc ttcaacacct ctgtggtgta caagaagacc ctgtttgtgg gagtgcccaa gagcttcccc ttcaacacct ctgtggtgta caagaagacc ctgtttgtgg
840 840
agttcactga ccacctgttc aacattgcca agcccaggcc cccctggatg ggcctgctgg agttcactga ccacctgttc aacattgcca agcccaggcc cccctggatg ggcctgctgg
900 900
gccccaccat ccaggctgag gtgtatgaca ctgtggtgat caccctgaag aacatggcca gccccaccat ccaggctgag gtgtatgaca ctgtggtgat caccctgaag aacatggcca
960 960
gccaccctgt gagcctgcat gctgtggggg tgagctactg gaaggcctct gagggggctg gccaccctgt gagcctgcat gctgtggggg tgagctactg gaaggcctct gagggggctg
10201020
agtatgatga ccagaccagc cagagggaga aggaggatga caaggtgttc cctgggggca agtatgatga ccagaccagc cagagggaga aggaggatga caaggtgttc cctgggggca
10801080
gccacaccta tgtgtggcag gtgctgaagg agaatggccc catggcctct gaccccctgt gccacaccta tgtgtggcag gtgctgaagg agaatggccc catggcctct gaccccctgt
11401140
gcctgaccta cagctacctg agccatgtgg acctggtgaa ggacctgaac tctggcctga gcctgaccta cagctacctg agccatgtgg acctggtgaa ggacctgaac tctggcctga
12001200
ttggggccct gctggtgtgc agggagggca gcctggccaa ggagaagacc cagaccctgc ttggggccct gctggtgtgc agggagggca gcctggccaa ggagaagacc cagaccctgc
12601260
acaagttcat cctgctgttt gctgtgtttg atgagggcaa gagctggcac tctgaaacca acaagttcat cctgctgttt gctgtgtttg atgagggcaa gagctggcac tctgaaacca
13201320
agaacagcct gatgcaggac agggatgctg cctctgccag ggcctggccc aagatgcaca agaacagcct gatgcaggac agggatgctg cctctgccag ggcctggccc aagatgcaca
13801380
ctgtgaatgg ctatgtgaac aggagcctgc ctggcctgat tggctgccac aggaagtctg ctgtgaatgg ctatgtgaac aggagcctgc ctggcctgat tggctgccac aggaagtctg
14401440
tgtactggca tgtgattggc atgggcacca cccctgaggt gcacagcatc ttcctggagg tgtactggca tgtgattggc atgggcacca cccctgaggt gcacagcatc ttcctggagg
15001500
gccacacctt cctggtcagg aaccacaggc aggccagcct ggagatcagc cccatcacct gccacacctt cctggtcagg aaccacaggc aggccagcct ggagatcagc cccatcacct
15601560
tcctgactgc ccagaccctg ctgatggacc tgggccagtt cctgctgttc tgccacatca tcctgactgc ccagaccctg ctgatggacc tgggccagtt cctgctgttc tgccacatca
16201620
gcagccacca gcatgatggc atggaggcct atgtgaaggt ggacagctgc cctgaggagc gcagccacca gcatgatggc atggaggcct atgtgaaggt ggacagctgc cctgaggagc
16801680
cccagctgag gatgaagaac aatgaggagg ctgaggacta tgatgatgac ctgactgact cccagctgag gatgaagaac aatgaggagg ctgaggacta tgatgatgac ctgactgact
17401740
ctgagatgga tgtggtgagg tttgatgatg acaacagccc cagcttcatc cagatcaggt ctgagatgga tgtggtgagg tttgatgatg acaacagccc cagcttcatc cagatcaggt
18001800
ctgtggccaa gaagcacccc aagacctggg tgcactacat tgctgctgag gaggaggact ctgtggccaa gaagcacccc aagacctggg tgcactacat tgctgctgag gaggaggact
18601860
gggactatgc ccccctggtg ctggcccctg atgacaggag ctacaagagc cagtacctga gggactatgc ccccctggtg ctggcccctg atgacaggag ctacaagagc cagtacctga
19201920
acaatggccc ccagaggatt ggcaggaagt acaagaaggt caggttcatg gcctacactg acaatggccc ccagaggatt ggcaggaagt acaagaaggt caggttcatg gcctacactg
19801980
atgaaacctt caagaccagg gaggccatcc agcatgagtc tggcatcctg ggccccctgc atgaaacctt caagaccagg gaggccatcc agcatgagtc tggcatcctg ggccccctgc
20402040
tgtatgggga ggtgggggac accctgctga tcatcttcaa gaaccaggcc agcaggccct tgtatgggga ggtgggggac accctgctga tcatcttcaa gaaccaggcc agcaggccct
21002100
acaacatcta cccccatggc atcactgatg tgaggcccct gtacagcagg aggctgccca acaacatcta cccccatggc atcactgatg tgaggcccct gtacagcagg aggctgccca
21602160
agggggtgaa gcacctgaag gacttcccca tcctgcctgg ggagatcttc aagtacaagt aggggggtgaa gcacctgaag gacttcccca tcctgcctgg ggagatcttc aagtacaagt
22202220
ggactgtgac tgtggaggat ggccccacca agtctgaccc caggtgcctg accagatact ggactgtgac tgtggaggat ggccccacca agtctgaccc caggtgcctg accagatact
22802280
acagcagctt tgtgaacatg gagagggacc tggcctctgg cctgattggc cccctgctga acagcagctt tgtgaacatg gagagggacc tggcctctgg cctgattggc cccctgctga
23402340
tctgctacaa ggagtctgtg gaccagaggg gcaaccagat catgtctgac aagaggaatg tctgctacaa ggagtctgtg gaccagagg gcaaccagat catgtctgac aagaggaatg
24002400
tgatcctgtt ctctgtgttt gatgagaaca ggagctggta cctgactgag aacatccaga tgatcctgtt ctctgtgttt gatgagaaca ggagctggta cctgactgag aacatccaga
24602460
ggttcctgcc caaccctgct ggggtgcagc tggaggaccc tgagttccag gccagcaaca ggttcctgcc caaccctgct ggggtgcagc tggaggaccc tgagttccag gccagcaaca
25202520
tcatgcacag catcaatggc tatgtgtttg acagcctgca gctgtctgtg tgcctgcatg tcatgcacag catcaatggc tatgtgtttg acagcctgca gctgtctgtg tgcctgcatg
25802580
aggtggccta ctggtacatc ctgagcattg gggcccagac tgacttcctg tctgtgttct aggtggccta ctggtacatc ctgagcattg gggcccagac tgacttcctg tctgtgttct
26402640
tctctggcta caccttcaag cacaagatgg tgtatgagga caccctgacc ctgttcccct tctctggcta caccttcaag cacaagatgg tgtatgagga caccctgacc ctgttcccct
27002700
tctctgggga gactgtgttc atgagcatgg agaaccctgg cctgtggatt ctgggctgcc tctctgggga gactgtgttc atgagcatgg agaaccctgg cctgtggatt ctgggctgcc
27602760
acaactctga cttcaggaac aggggcatga ctgccctgct gaaagtctcc agctgtgaca acaactctga cttcaggaac aggggcatga ctgccctgct gaaagtctcc agctgtgaca
28202820
agaacactgg ggactactat gaggacagct atgaggacat ctctgcctac ctgctgagca agaacactgg ggactactat gaggacagct atgaggacat ctctgcctac ctgctgagca
28802880
agaacaatgc cattgagccc aggagcttca gccagaatcc acccgtcctt aagcgccatc agaacaatgc cattgagccc aggagcttca gccagaatcc acccgtcctt aagcgccatc
29402940
agcgcgagat caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca agcgcgagat caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca
30003000
ccatctctgt ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga ccatctctgt ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga
30603060
gccccaggag cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt gccccaggag cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt
31203120
gggactatgg catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg gggactatgg catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg
31803180
tgccccagtt caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc tgccccagtt caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc
32403240
tgtacagagg ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg tgtacagagg ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg
33003300
tggaggacaa catcatggtg accttcagga accaggccag caggccctac agcttctaca tggaggacaa catcatggtg accttcagga accaggccag caggccctac agcttctaca
33603360
gcagcctgat cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg gcagcctgat cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg
34203420
tgaagcccaa tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca tgaagcccaa tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca
34803480
aggatgagtt tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg aggatgagtt tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg
35403540
tgcactctgg cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc tgcactctgg cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc
36003600
atggcaggca ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca atggcaggca ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca
36603660
agagctggta cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga agagctggta cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga
37203720
tggaggaccc caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg tggaggaccc caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg
37803780
acaccctgcc tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca acaccctgcc tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca
38403840
tgggcagcaa tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga tgggcagcaa tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga
39003900
agaaggagga gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg agaaggagga gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg
39603960
agatgctgcc cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc agatgctgcc cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc
40204020
atgctggcat gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca atgctggcat gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca
40804080
tggcctctgg ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg tggcctctgg ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg
41404140
cccccaagct ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc cccccaagct ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc
42004200
ccttcagctg gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc ccttcagctg gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc
42604260
agggggccag gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc aggggggccag gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc
43204320
tggatggcaa gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct tggatggcaa gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct
43804380
ttggcaatgt ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca ttggcaatgt ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca
44404440
gatacatcag gctgcacccc acccactaca gcatcaggag caccctgagg atggagctga gatacatcag gctgcacccc acccactaca gcatcaggag caccctgagg atggagctga
45004500
tgggctgtga cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg tgggctgtga cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg
45604560
atgcccagat cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca atgccgat cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca
46204620
aggccaggct gcatctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca aggccaggct gcatctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca
46804680
aggagtggct gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg aggagtggct gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg
47404740
gggtgaagag cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg gggtgaagag cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg
48004800
atggccacca gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc atggccacca gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc
48604860
aggacagctt cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga aggacagctt cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga
49204920
ggattcaccc ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg ggattcaccc ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg
49804980
aggcccagga cctgtactga ggatccaata aaatatcttt attttcatta catctgtgtg aggcccagga cctgtactga ggatccaata aaatatcttt attttcatta catctgtgtg
50405040
ttggtttttt gtgtgttttc ctgtaacgat cgggtctaga gcatggctac gtagataagt ttggtttttt gtgtgttttc ctgtaacgat cgggtctaga gcatggctac gtagataagt
51005100
agcatggcgg gttaatcatt aactacacct gcaggaggaa cccctagtga tggagttggc agcatggcgg gttaatcatt aactacacct gcaggaggaa cccctagtga tggagttggc
51605160
cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cactccctct ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg
52205220
cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct gcaggggcgc gcctcgaggc cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct gcaggggcgc gcctcgaggc
52805280
atgcggtacc aagcttgtcg agaagtacta gaggatcata atcagccata ccacatttgt atgcggtacc aagcttgtcg agaagtacta gaggatcata atcagccata ccacatttgt
53405340
agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat
54005400
gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa
54605460
tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc
55205520
caaactcatc aatgtatctt atcatgtctg gatctgatca ctgatatcgc ctaggagatc caaactcatc aatgtatctt atcatgtctg gatctgatca ctgatatcgc ctaggagatc
55805580
cgaaccagat aagtgaaatc tagttccaaa ctattttgtc atttttaatt ttcgtattag cgaaccagat aagtgaaatc tagttccaaa ctattttgtc atttttaatt ttcgtattag
56405640
cttacgacgc tacacccagt tcccatctat tttgtcactc ttccctaaat aatccttaaa cttacgacgc tacacccagt tcccatctat tttgtcactc ttccctaaat aatccttaaa
57005700
aactccattt ccacccctcc cagttcccaa ctattttgtc cgcccacagc ggggcatttt aactccattt ccacccctcc cagttcccaa ctattttgtc cgcccacagc ggggcatttt
57605760
tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc atgtgacaaa ccgtcatctt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc atgtgacaaa ccgtcatctt
58205820
cggctacttt ttctctgtca cagaatgaaa atttttctgt catctcttcg ttattaatgt cggctacttt ttctctgtca cagaatgaaa atttttctgt catctcttcg ttattaatgt
58805880
ttgtaattga ctgaatatca acgcttattt gcagcctgaa tggcgaatgg gacgcgccct ttgtaattga ctgaatatca acgcttattt gcagcctgaa tggcgaatgg gacgcgccct
59405940
gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg
60006000
ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg
60606060
gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac
61206120
ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct
61806180
gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt
62406240
tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt
63006300
tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt
63606360
ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat gtgcgcggaa ttaacaaaat attaacgttt acaatttcag gtggcacttt tcggggaaat gtgcgcggaa
64206420
cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac
64806480
cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg
65406540
tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc
66006600
tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg
66606660
atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga
67206720
gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc
67806780
aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag
68406840
aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga
69006900
gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg
69606960
cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga
70207020
atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt
70807080
tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact
71407140
ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt
72007200
ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg
72607260
ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta
73207320
tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac
73807380
tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat ttttaattta
74407440
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt
75007500
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt
75607560
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt
76207620
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc
76807680
agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg
77407740
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg
78007800
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt
78607860
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac
79207920
tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg agaaaggcgg tgagatacct acagcgtgag cattgagaaa gcgccacgct tcccgaaggg agaaaggcgg
79807980
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg
80408040
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat
81008100
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt
81608160
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg
82208220
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa
82808280
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc
83408340
tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct ggcaaaatcg tccttacgca tctgtgcggt atttcacacc gcagaccagc cgcgtaacct ggcaaaatcg
84008400
gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga caataaagtc gttacggttg agtaataaat ggatgccctg cgtaagcggg tgtgggcgga caataaagtc
84608460
ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag acagaatagt ttaaactgaa caaaatagat ctaaactatg acaataaagt cttaaactag acagaatagt
85208520
tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt tgttatggct tgtaaactga aatcagtcca gttatgctgt gaaaaagcat actggacttt tgttatggct
85808580
aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga ggggcgtggc aaagcaaact cttcattttc tgaagtgcaa attgcccgtc gtattaaaga ggggcgtggc
86408640
caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac aactccgcgg caagggcatg gtaaagacta tattcgcggc gttgtgacaa tttaccgaac aactccgcgg
87008700
ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg tcgatatcaa ccgggaagcc gatctcggct tgaacgaatt gttaggtggc ggtacttggg tcgatatcaa
87608760
agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg ggatcgtcac agtgcatcac ttcttcccgt atgcccaact ttgtatagag agccactgcg ggatcgtcac
88208820
cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca tgcttgagga cgtaatctgc ttgcacgtag atcacataag caccaagcgc gttggcctca tgcttgagga
88808880
gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact gcgagatcat gattgatgag cgcggtggca atgccctgcc tccggtgctc gccggagact gcgagatcat
89408940
agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagagcgc agatatagat ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagagcgc
90009000
caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta cggagcaagt caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta cggagcaagt
90609060
tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct ccgaactcac tcccgaggta atcggagtcc ggctgatgtt gggagtaggt ggctacgtct ccgaactcac
91209120
gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg agcctacatg gaccgaaaag atcaagagca gcccgcatgg atttgacttg gtcagggccg agcctacatg
91809180
tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg ccctgctgcg tgcgaatgat gcccatactt gagccaccta actttgtttt agggcgactg ccctgctgcg
92409240
taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca tcgacccacg taacatcgtt gctgctgcgt aacatcgttg ctgctccata acatcaaaca tcgacccacg
93009300
gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa acagtcataa gcgtaacgcg cttgctgctt ggatgcccga ggcatagact gtacaaaaaa acagtcataa
93609360
caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa ggttctggac caagccatga aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa ggttctggac
94209420
cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggcttatgtc cagttgcgtg agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggcttatgtc
94809480
aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac cttgggcagc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac cttgggcagc
95409540
agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc ggtctccacg agcgaagtcg aggcatttct gtcctggctg gcgaacgagc gcaaggtttc ggtctccacg
96009600
catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg cacggatctg catcgtcagg cattggcggc cttgctgttc ttctacggca aggtgctgtg cacggatctg
96609660
ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt ggtgctgacc ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc gcttgccggt ggtgctgacc
97209720
ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt gttcgcccag ccggatgaag tggttcgcat cctcggtttt ctggaaggcg agcatcgttt gttcgcccag
97809780
gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa tagatcatgg gactctagct atagttctag tggttggcta cgtatactcc ggaatattaa tagatcatgg
98409840
agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt ttcgtaacag agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt ttcgtaacag
99009900
ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ccatcgggcg ttttgtaata aaaaaaccta taaatattcc ggattattca taccgtccca ccatcgggcg
99609960
cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg attacgatat cggatctcgg tccgaaacca tgtcgtacta ccatcaccat caccatcacg attacgatat
1002010020
cccaacgacc gaaaacctgt attttcaggg cgccatggga tcc cccaacgacc gaaaacctgt attttcaggg cgccatggga tcc
1006310063
<210> 206<210> 206
<211> 11668<211> 11668
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 206<400> 206
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg
240 240
cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt
300 300
ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc cccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc
360 360
aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag
420 420
acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga
480 480
ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac
540 540
ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca
600 600
tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat
660 660
ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag
720 720
gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa
780 780
gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga
840 840
cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc
900 900
caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca
960 960
ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt
10201020
gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc
10801080
tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa
11401140
gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc
12001200
agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt
12601260
taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga
13201320
ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg
13801380
actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg
14401440
tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatc tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatc
15001500
gagctgtcta cctgcttctt cctgtgcctg ctgcggttct gcttcagcgc caccagaaga gagctgtcta cctgcttctt cctgtgcctg ctgcggttct gcttcagcgc caccagaaga
15601560
tattacctgg gcgccgtgga actgagctgg gactacatgc agtctgacct gggagagctg tattacctgg gcgccgtgga actgagctgg gactacatgc agtctgacct gggagagctg
16201620
cccgtggacg ctagatttcc tccaagagtg cccaagagct tccccttcaa cacctccgtg cccgtggacg ctagatttcc tccaagagtg cccaagagct tccccttcaa cacctccgtg
16801680
gtgtacaaga aaaccctgtt cgtggaattc accgaccacc tgttcaatat cgccaagcct gtgtacaaga aaaccctgtt cgtggaattc accgaccacc tgttcaatat cgccaagcct
17401740
cggcctcctt ggatgggact gctgggacct acaattcagg ccgaggtgta cgacaccgtg cggcctcctt ggatgggact gctgggacct acaattcagg ccgaggtgta cgacaccgtg
18001800
gtcatcaccc tgaagaacat ggccagccat cctgtgtctc tgcacgccgt gggagtgtct gtcatcaccc tgaagaacat ggccagccat cctgtgtctc tgcacgccgt gggagtgtct
18601860
tattggaagg cttctgaggg cgccgagtac gacgatcaga caagccagag agagaaagag tattggaagg cttctgaggg cgccgagtac gacgatcaga caagccagag agagaaagag
19201920
gacgacaagg ttttccctgg cggcagccac acctatgtct ggcaggtcct gaaagaaaac gacgacaagg ttttccctgg cggcagccac acctatgtct ggcaggtcct gaaagaaaac
19801980
ggccctatgg cctccgatcc tctgtgcctg acatacagct acctgagcca cgtggacctg ggccctatgg cctccgatcc tctgtgcctg acatacagct acctgagcca cgtggacctg
20402040
gtcaaggacc tgaattctgg cctgatcgga gccctgctcg tgtgtagaga aggcagcctg gtcaaggacc tgaattctgg cctgatcgga gccctgctcg tgtgtagaga aggcagcctg
21002100
gccaaagaga aaacccagac actgcacaag ttcatcctgc tgttcgccgt gttcgacgag gccaaagaga aaacccagac actgcacaag ttcatcctgc tgttcgccgt gttcgacgag
21602160
ggcaagagct ggcacagcga gacaaagaac agcctgatgc aggacaggga tgccgcctct ggcaagagct ggcacagcga gacaaagaac agcctgatgc aggacagga tgccgcctct
22202220
gctagagctt ggcctaagat gcacaccgtg aacggctacg tgaacagaag cctgcctgga gctagagctt ggcctaagat gcacaccgtg aacggctacg tgaacagaag cctgcctgga
22802280
ctgatcggct gccacagaaa gtccgtgtac tggcacgtga tcggcatggg cacaacacct ctgatcggct gccacagaaa gtccgtgtac tggcacgtga tcggcatggg cacaacacct
23402340
gaggtgcaca gcatctttct ggaaggccac accttcctcg tgcggaacca cagacaggcc gaggtgcaca gcatctttct ggaaggccac accttcctcg tgcggaacca cagacaggcc
24002400
agcctggaaa tcagccctat caccttcctg accgctcaga ccctgctgat ggatctgggc agcctggaaa tcagccctat caccttcctg accgctcaga ccctgctgat ggatctgggc
24602460
cagtttctgc tgttctgcca catcagctcc caccagcacg atggcatgga agcctacgtg cagtttctgc tgttctgcca catcagctcc caccagcacg atggcatgga agcctacgtg
25202520
aaggtggaca gctgccccga agaaccccag ctgcggatga agaacaacga ggaagccgag aaggtggaca gctgccccga agaaccccag ctgcggatga agaacaacga ggaagccgag
25802580
gactacgacg acgacctgac cgactctgag atggacgtcg tcagattcga cgacgataac gactacgacg acgacctgac cgactctgag atggacgtcg tcagattcga cgacgataac
26402640
agccccagct tcatccagat cagaagcgtg gccaagaagc accccaagac ctgggtgcac agccccagct tcatccagat cagaagcgtg gccaagaagc accccaagac ctgggtgcac
27002700
tatatcgccg ccgaggaaga ggactgggat tacgctcctc tggtgctggc ccctgacgac tatatcgccg ccgaggaaga ggactgggat tacgctcctc tggtgctggc ccctgacgac
27602760
agaagctaca agagccagta cctgaacaac ggccctcagc ggatcggccg gaagtataag agaagctaca agagccagta cctgaacaac ggccctcagc ggatcggccg gaagtataag
28202820
aaagtgcggt tcatggccta caccgacgag acattcaaga ccagagaggc catccagcac aaagtgcggt tcatggccta caccgacgag acattcaaga ccagagaggc catccagcac
28802880
gagagcggaa ttctgggccc tctgctgtat ggcgaagtgg gcgatacact gctgatcatc gagagcggaa ttctgggccc tctgctgtat ggcgaagtgg gcgatacact gctgatcatc
29402940
ttcaagaacc aggccagcag accctacaac atctaccctc acggcatcac cgatgtgcgg ttcaagaacc aggccagcag accctacaac atctaccctc acggcatcac cgatgtgcgg
30003000
cccctgtatt ctagaaggct gcccaagggc gtgaagcacc tgaaggactt ccctatcctg cccctgtatt ctagaaggct gcccaagggc gtgaagcacc tgaaggactt ccctatcctg
30603060
cctggcgaga ttttcaagta caagtggacc gtgaccgtgg aagatggccc caccaagagc cctggcgaga ttttcaagta caagtggacc gtgaccgtgg aagatggccc caccaagagc
31203120
gaccctagat gtctgacacg gtactacagc agcttcgtga acatggaacg cgacctggcc gaccctagat gtctgacacg gtactacagc agcttcgtga acatggaacg cgacctggcc
31803180
agcggcctga ttggacctct gctgatctgc tacaaagaaa gcgtggacca gcggggcaac agcggcctga ttggacctct gctgatctgc tacaaagaaa gcgtggacca gcggggcaac
32403240
cagatcatga gcgacaagcg gaacgtgatc ctgtttagcg tgttcgatga gaaccggtcc cagatcatga gcgacaagcg gaacgtgatc ctgtttagcg tgttcgatga gaaccggtcc
33003300
tggtatctga ccgagaacat ccagcggttt ctgcccaatc ctgccggggt gcaactggaa tggtatctga ccgagaacat ccagcggttt ctgcccaatc ctgccggggt gcaactggaa
33603360
gatcctgagt tccaggcaag caacatcatg cactccatca atggctatgt gttcgacagc gatcctgagt tccaggcaag caacatcatg cactccatca atggctatgt gttcgacagc
34203420
ctgcagctga gcgtgtgcct gcacgaagtg gcctactggt acatcctgag cattggcgcc ctgcagctga gcgtgtgcct gcacgaagtg gcctactggt acatcctgag cattggcgcc
34803480
cagaccgact tcctgtccgt gttctttagc ggctacacct tcaagcacaa gatggtgtac cagaccgact tcctgtccgt gttctttagc ggctacacct tcaagcacaa gatggtgtac
35403540
gaggataccc tgacactgtt cccattcagc ggcgagacag tgttcatgag catggaaaac gaggataccc tgacactgtt cccattcagc ggcgagacag tgttcatgag catggaaaac
36003600
cccggcctgt ggattctggg ctgtcacaac agcgacttcc ggaacagagg catgacagcc cccggcctgt ggattctggg ctgtcacaac agcgacttcc ggaacagagg catgacagcc
36603660
ctgctgaagg tgtccagctg cgacaagaac accggcgact actacgagga cagctatgag ctgctgaagg tgtccagctg cgacaagaac accggcgact actacgagga cagctatgag
37203720
gacatcagcg cctacctgct gagcaagaac aatgccatcg agcctcggag cttcagccag gacatcagcg cctacctgct gagcaagaac aatgccatcg agcctcggag cttcagccag
37803780
aatcctcctg tgctgaagcg gcaccagcgc gagatcacca gaacaaccct gcagagcgac aatcctcctg tgctgaagcg gcaccagcgc gagatcacca gaacaaccct gcagagcgac
38403840
caagaggaaa tcgattacga cgacaccatc agcgtcgaga tgaagaaaga agatttcgac caagaggaaa tcgattacga cgacaccatc agcgtcgaga tgaagaaaga agatttcgac
39003900
atctacgacg aggacgagaa tcagagcccc agaagctttc agaaaaagac ccggcactac atctacgacg aggacgagaa tcagagcccc agaagctttc agaaaaagac ccggcactac
39603960
ttcattgccg ccgtcgagag actgtgggac tacggcatgt ctagcagccc tcacgtgctg ttcattgccg ccgtcgagag actgtgggac tacggcatgt ctagcagccc tcacgtgctg
40204020
agaaatagag cccagagcgg cagcgtgccc cagttcaaga aagtggtgtt ccaagagttc agaaatagag cccagagcgg cagcgtgccc cagttcaaga aagtggtgtt ccaagagttc
40804080
accgacggca gcttcaccca gccactgtat agaggcgagc tgaacgagca tctgggcctg accgacggca gcttcaccca gccactgtat agaggcgagc tgaacgagca tctgggcctg
41404140
ctgggccctt atatcagagc cgaagtggaa gataacatca tggtcacctt ccggaatcag ctgggccctt atatcagagc cgaagtggaa gataacatca tggtcacctt ccggaatcag
42004200
gctagccggc cttacagctt ctacagctcc ctgatcagct acgaagagga ccagagacag gctagccggc cttacagctt ctacagctcc ctgatcagct acgaagagga ccagagacag
42604260
ggcgctgagc ccagaaagaa cttcgtgaag cccaacgaga ctaagaccta cttttggaag ggcgctgagc ccagaaagaa cttcgtgaag cccaacgaga ctaagaccta cttttggaag
43204320
gtgcagcacc acatggcccc tacaaaggac gagttcgact gcaaagcctg ggcctacttc gtgcagcacc acatggcccc tacaaaggac gagttcgact gcaaagcctg ggcctacttc
43804380
tccgatgtgg atctggaaaa ggacgtgcac agcgggctca tcggaccact gcttgtgtgc tccgatgtgg atctggaaaa ggacgtgcac agcgggctca tcggaccact gcttgtgtgc
44404440
cacaccaaca cactgaaccc cgctcacggc agacaagtga cagtgcaaga gttcgccctg cacaccaaca cactgaaccc cgctcacggc agacaagtga cagtgcaaga gttcgccctg
45004500
ttcttcacca tcttcgacga aacaaagagc tggtacttca ccgagaatat ggaacggaac ttcttcacca tcttcgacga aacaaagagc tggtacttca ccgagaatat ggaacggaac
45604560
tgcagagccc cttgcaacat ccagatggaa gatcccacct tcaaagagaa ctaccggttc tgcagagccc cttgcaacat ccagatggaa gatcccacct tcaaagagaa ctaccggttc
46204620
cacgccatca acggctacat catggacaca ctgcccggcc tggttatggc ccaggatcag cacgccatca acggctacat catggacaca ctgcccggcc tggttatggc ccaggatcag
46804680
agaatccggt ggtatctgct gtccatgggc tccaacgaga atatccacag catccacttc agaatccggt ggtatctgct gtccatgggc tccaacgaga atatccacag catccacttc
47404740
agcggccacg tgttcaccgt gcggaaaaaa gaagagtaca aaatggccct gtacaatctg agcggccacg tgttcaccgt gcggaaaaaa gaagagtaca aaatggccct gtacaatctg
48004800
taccctgggg tgttcgaaac cgtggaaatg ctgccttcca aggccggcat ttggagagtg taccctgggg tgttcgaaac cgtggaaatg ctgccttcca aggccggcat ttggagagtg
48604860
gaatgtctga ttggagagca cctccacgcc ggaatgagca ccctgtttct ggtgtacagc gaatgtctga ttggagagca cctccacgcc ggaatgagca ccctgtttct ggtgtacagc
49204920
aacaagtgtc agacccctct cggcatggcc tctggacaca tcagagactt ccagatcacc aacaagtgtc agacccctct cggcatggcc tctggacaca tcagagactt cgagatcacc
49804980
gcctctggcc agtacggaca gtgggctcct aaactggctc ggctgcacta cagcggcagc gcctctggcc agtacggaca gtgggctcct aaactggctc ggctgcacta cagcggcagc
50405040
atcaatgcct ggtccaccaa agagcccttc agctggatca aggtggacct gctggctccc atcaatgcct ggtccaccaa agagcccttc agctggatca aggtggacct gctggctccc
51005100
atgatcatcc acggaatcaa gacccagggc gccagacaga agttcagcag cctgtacatc atgatcatcc acggaatcaa gacccagggc gccagacaga agttcagcag cctgtacatc
51605160
agccagttca tcatcatgta cagcctggac ggcaagaagt ggcagaccta cagaggcaac agccagttca tcatcatgta cagcctggac ggcaagaagt ggcagaccta cagaggcaac
52205220
agcaccggca cactcatggt gttcttcggc aacgtggact ccagcggcat taagcacaac agcaccggca cactcatggt gttcttcggc aacgtggact ccagcggcat taagcacaac
52805280
atcttcaacc ctccaatcat tgcccggtac atccggctgc accccacaca ctacagcatc atcttcaacc ctccaatcat tgcccggtac atccggctgc accccacaca ctacagcatc
53405340
cggtctaccc tgagaatgga actgatgggc tgcgacctga acagctgctc tatgcccctc cggtctaccc tgagaatgga actgatgggc tgcgacctga acagctgctc tatgcccctc
54005400
ggaatggaaa gcaaggccat cagcgacgcc cagatcacag ccagcagcta cttcaccaac ggaatggaaa gcaaggccat cagcgacgcc cagatcacag ccagcagcta cttcaccaac
54605460
atgttcgcca cttggagccc ctccaaggct agactgcatc tgcagggcag aagcaacgct atgttcgcca cttggagccc ctccaaggct agactgcatc tgcagggcag aagcaacgct
55205520
tggaggcccc aagtgaacaa ccccaaagag tggctgcagg ttgactttca aaagaccatg tggaggcccc aagtgaacaa ccccaaagag tggctgcagg ttgactttca aaagaccatg
55805580
aaagtgaccg gcgtgaccac acagggcgtc aagtctctgc tgacctctat gtacgtgaaa aaagtgaccg gcgtgaccac acagggcgtc aagtctctgc tgacctctat gtacgtgaaa
56405640
gagttcctga tctccagcag ccaggacggc catcagtgga ccctgttttt ccagaacggc gagttcctga tctccagcag ccaggacggc catcagtgga ccctgttttt ccagaacggc
57005700
aaagtgaaag tgttccaggg caatcaggac agcttcacac ccgtggtcaa ttctctggac aaagtgaaag tgttccaggg caatcaggac agcttcacac ccgtggtcaa ttctctggac
57605760
cctccactgc tgaccagata cctgcggatt caccctcagt cttgggtgca ccagatcgct cctccactgc tgaccagata cctgcggatt caccctcagt cttgggtgca ccagatcgct
58205820
ctgcggatgg aagtgctggg ctgtgaagct caggacctct actagttaat taagagcatc ctgcggatgg aagtgctggg ctgtgaagct caggacctct actagttaat taagagcatc
58805880
ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg ttaccgccat ttattcccat atttgttctg tttttcttga tttgggtata catttaaatg
59405940
ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt ttaataaaac aaaatggtgg ggcaatcatt tacattttta gggatatgta attactagtt
60006000
caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc caggtgtatt gccacaagac aaacatgtta agaaactttc ccgttattta cgctctgttc
60606060
ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg ctgttaatca acctctggat tacaaaattt gtgaaagatt gactgatatt cttaactatg
61206120
ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt ttgctccttt tacgctgtgt ggatatgctg ctttatagcc tctgtatcta gctattgctt
61806180
cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg cccgtacggc tttcgttttc tcctccttgt ataaatcctg gttgctgtct cttttagagg
62406240
agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc agttgtggcc cgttgtccgt caacgtggcg tggtgtgctc tgtgtttgct gacgcaaccc
63006300
ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc ccactggctg gggcattgcc accacctgtc aactcctttc tgggactttc gctttccccc
63606360
tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta tcccgatcgc cacggcagaa ctcatcgccg cctgccttgc ccgctgctgg acaggggcta
64206420
ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg ggttgctggg cactgataat tccgtggtgt tgtctgtgcc ttctagttgc cagccatctg
64806480
ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt
65406540
cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg
66006600
gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg
66606660
atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat ggcgggttaa atgcggtggg ctctatggct ctagagcatg gctacgtaga taagtagcat ggcgggttaa
67206720
tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg tcattaacta cacctgcagg aggaacccct agtgatggag ttggccactc cctctctgcg
67806780
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gcggcctcag
68406840
tgagcgagcg agcgcgcagc tgcctgcagg ggcgcgcctc gaggcatgcg gtaccaagct tgagcgagcg agcgcgcagc tgcctgcagg ggcgcgcctc gaggcatgcg gtaccaagct
69006900
tgtcgagaag tactagagga tcataatcag ccataccaca tttgtagagg ttttacttgc tgtcgagaag tactagagga tcataatcag ccataccaca tttgtagagg ttttacttgc
69606960
tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt
70207020
tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt
70807080
cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt
71407140
atcttatcat gtctggatct gatcactgat atcgcctagg agatccgaac cagataagtg atcttatcat gtctggatct gatcactgat atcgcctagg agatccgaac cagataagtg
72007200
aaatctagtt ccaaactatt ttgtcatttt taattttcgt attagcttac gacgctacac aaatctagtt ccaaactatt ttgtcatttt taattttcgt attagcttac gacgctacac
72607260
ccagttccca tctattttgt cactcttccc taaataatcc ttaaaaactc catttccacc ccagttccca tctattttgt cactcttccc taaataatcc ttaaaaactc catttccacc
73207320
cctcccagtt cccaactatt ttgtccgccc acagcggggc atttttcttc ctgttatgtt cctcccagtt cccaactatt ttgtccgccc acagcggggc atttttcttc ctgttatgtt
73807380
tttaatcaaa catcctgcca actccatgtg acaaaccgtc atcttcggct actttttctc tttaatcaaa catcctgcca actccatgtg acaaaccgtc atcttcggct actttttctc
74407440
tgtcacagaa tgaaaatttt tctgtcatct cttcgttatt aatgtttgta attgactgaa tgtcacagaa tgaaaatttt tctgtcatct cttcgttatt aatgtttgta attgactgaa
75007500
tatcaacgct tatttgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa tatcaacgct tatttgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa
75607560
gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc
76207620
ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag
76807680
ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca
77407740
aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc
78007800
gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa
78607860
cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct
79207920
attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa
79807980
cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat
80408040
ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc
81008100
aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct
81608160
tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag
82208220
atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta
82808280
agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc
83408340
tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc ggtcgccgca
84008400
tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg
84608460
atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg
85208520
ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca
85808580
tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa
86408640
acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa acgacgagcg tgacaccacg atgcctgtag caatggcaac aacgttgcgc aaactattaa
87008700
ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg gaggcggata
87608760
aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat
88208820
ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc
88808880
cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata
89408940
gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt
90009000
actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga
90609060
agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag
91209120
cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa
91809180
tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag
92409240
agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg
93009300
tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat
93609360
acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta
94209420
ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg
94809480
gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc
95409540
gtgagcattg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gtgagcattg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa
96009600
gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc
96609660
tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt
97209720
caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct
97809780
tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc
98409840
gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg
99009900
agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt acgcatctgt agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt acgcatctgt
99609960
gcggtatttc acaccgcaga ccagccgcgt aacctggcaa aatcggttac ggttgagtaa gcggtatttc acaccgcaga ccagccgcgt aacctggcaa aatcggttac ggttgagtaa
1002010020
taaatggatg ccctgcgtaa gcgggtgtgg gcggacaata aagtcttaaa ctgaacaaaa taaatggatg ccctgcgtaa gcgggtgtgg gcggacaata aagtcttaaa ctgaacaaaa
1008010080
tagatctaaa ctatgacaat aaagtcttaa actagacaga atagttgtaa actgaaatca tagatctaaa ctatgacaat aaagtcttaa actagacaga atagttgtaa actgaaatca
1014010140
gtccagttat gctgtgaaaa agcatactgg acttttgtta tggctaaagc aaactcttca gtccagttat gctgtgaaaa agcatactgg acttttgtta tggctaaagc aaactcttca
1020010200
ttttctgaag tgcaaattgc ccgtcgtatt aaagaggggc gtggccaagg gcatggtaaa ttttctgaag tgcaaattgc ccgtcgtatt aaagaggggc gtggccaagg gcatggtaaa
1026010260
gactatattc gcggcgttgt gacaatttac cgaacaactc cgcggccggg aagccgatct gactatattc gcggcgttgt gacaatttac cgaacaactc cgcggccggg aagccgatct
1032010320
cggcttgaac gaattgttag gtggcggtac ttgggtcgat atcaaagtgc atcacttctt cggcttgaac gaattgttag gtggcggtac ttgggtcgat atcaaagtgc atcacttctt
1038010380
cccgtatgcc caactttgta tagagagcca ctgcgggatc gtcaccgtaa tctgcttgca cccgtatgcc caactttgta tagagagcca ctgcgggatc gtcaccgtaa tctgcttgca
1044010440
cgtagatcac ataagcacca agcgcgttgg cctcatgctt gaggagattg atgagcgcgg cgtagatcac ataagcacca agcgcgttgg cctcatgctt gaggagattg atgagcgcgg
1050010500
tggcaatgcc ctgcctccgg tgctcgccgg agactgcgag atcatagata tagatctcac tggcaatgcc ctgcctccgg tgctcgccgg agactgcgag atcatagata tagatctcac
1056010560
tacgcggctg ctcaaacctg ggcagaacgt aagccgcgag agcgccaaca accgcttctt tacgcggctg ctcaaacctg ggcagaacgt aagccgcgag agcgccaaca accgcttctt
1062010620
ggtcgaaggc agcaagcgcg atgaatgtct tactacggag caagttcccg aggtaatcgg ggtcgaaggc agcaagcgcg atgaatgtct tactacggag caagttcccg aggtaatcgg
1068010680
agtccggctg atgttgggag taggtggcta cgtctccgaa ctcacgaccg aaaagatcaa agtccggctg atgttgggag taggtggcta cgtctccgaa ctcacgaccg aaaagatcaa
1074010740
gagcagcccg catggatttg acttggtcag ggccgagcct acatgtgcga atgatgccca gagcagcccg catggatttg acttggtcag ggccgagcct acatgtgcga atgatgccca
1080010800
tacttgagcc acctaacttt gttttagggc gactgccctg ctgcgtaaca tcgttgctgc tacttgagcc acctaacttt gttttagggc gactgccctg ctgcgtaaca tcgttgctgc
1086010860
tgcgtaacat cgttgctgct ccataacatc aaacatcgac ccacggcgta acgcgcttgc tgcgtaacat cgttgctgct ccataacatc aaacatcgac ccacggcgta acgcgcttgc
1092010920
tgcttggatg cccgaggcat agactgtaca aaaaaacagt cataacaagc catgaaaacc tgcttggatg cccgaggcat agactgtaca aaaaaacagt cataacaagc catgaaaacc
1098010980
gccactgcgc cgttaccacc gctgcgttcg gtcaaggttc tggaccagtt gcgtgagcgc gccactgcgc cgttaccacc gctgcgttcg gtcaaggttc tggaccagtt gcgtgagcgc
1104011040
atacgctact tgcattacag tttacgaacc gaacaggctt atgtcaactg ggttcgtgcc atacgctact tgcattacag tttacgaacc gaacaggctt atgtcaactg ggttcgtgcc
1110011100
ttcatccgtt tccacggtgt gcgtcacccg gcaaccttgg gcagcagcga agtcgaggca ttcatccgtt tccacggtgt gcgtcacccg gcaaccttgg gcagcagcga agtcgaggca
1116011160
tttctgtcct ggctggcgaa cgagcgcaag gtttcggtct ccacgcatcg tcaggcattg tttctgtcct ggctggcgaa cgagcgcaag gtttcggtct ccacgcatcg tcaggcattg
1122011220
gcggccttgc tgttcttcta cggcaaggtg ctgtgcacgg atctgccctg gcttcaggag gcggccttgc tgttcttcta cggcaaggtg ctgtgcacgg atctgccctg gcttcaggag
1128011280
atcggaagac ctcggccgtc gcggcgcttg ccggtggtgc tgaccccgga tgaagtggtt atcggaagac ctcggccgtc gcggcgcttg ccggtggtgc tgaccccgga tgaagtggtt
1134011340
cgcatcctcg gttttctgga aggcgagcat cgtttgttcg cccaggactc tagctatagt cgcatcctcg gttttctgga aggcgagcat cgtttgttcg cccaggactc tagctatagt
1140011400
tctagtggtt ggctacgtat actccggaat attaatagat catggagata attaaaatga tctagtggtt ggctacgtat actccggaat attaatagat catggagata attaaaatga
1146011460
taaccatctc gcaaataaat aagtatttta ctgttttcgt aacagttttg taataaaaaa taaccatctc gcaaataaat aagtatttta ctgttttcgt aacagttttg taataaaaaa
1152011520
acctataaat attccggatt attcataccg tcccaccatc gggcgcggat ctcggtccga acctataaat attccggatt attcataccg tcccaccatc gggcgcggat ctcggtccga
1158011580
aaccatgtcg tactaccatc accatcacca tcacgattac gatatcccaa cgaccgaaaa aaccatgtcg tactaccatc accatcacca tcacgattac gatatcccaa cgaccgaaaa
1164011640
cctgtatttt cagggcgcca tgggatcc cctgtatttt cagggcgcca tgggatcc
1166811668
<210> 207<210> 207
<211> 11719<211> 11719
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 207<400> 207
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg
240 240
cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt
300 300
ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc cccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc
360 360
aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag
420 420
acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga
480 480
ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac
540 540
ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca
600 600
tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat
660 660
ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag
720 720
gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa
780 780
gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga
840 840
cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc
900 900
caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca
960 960
ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt
10201020
gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc
10801080
tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa
11401140
gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc
12001200
agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt
12601260
taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga
13201320
ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg
13801380
actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg
14401440
tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt
15001500
gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga
15601560
tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg
16201620
cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg
16801680
gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc
17401740
aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg
18001800
gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc
18601860
tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag
19201920
gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat
19801980
ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg
20402040
gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg
21002100
gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag
21602160
ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacaggga tgctgcctct ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacagga tgctgcctct
22202220
gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc
22802280
ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct
23402340
gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc
24002400
agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc
24602460
cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg
25202520
aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag
25802580
gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac
26402640
agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac
27002700
tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac
27602760
aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag
28202820
aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat
28802880
gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc
29402940
ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg
30003000
cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg
30603060
cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct
31203120
gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc
31803180
tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac
32403240
cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc
33003300
tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag
33603360
gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc
34203420
ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc
34803480
cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat
35403540
gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac
36003600
cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc
36603660
ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag
37203720
gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag
37803780
aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca
38403840
gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga ccaggaggag gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga cccaggagg
39003900
attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac
39603960
gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct
40204020
gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg
40804080
gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc
41404140
agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc
42004200
tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg
42604260
ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag
43204320
cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac
43804380
cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg
44404440
gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac
45004500
accctgaacc ctgcccatgg caggcaggtg actgtgcagg agtttgccct gttcttcacc accctgaacc ctgcccatgg caggcaggtg actngtgcagg agtttgccct gttcttcacc
45604560
atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc
46204620
ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc
46804680
aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg
47404740
tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat
48004800
gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg
48604860
gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg
49204920
attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc
49804980
cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc
50405040
cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc
51005100
tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc
51605160
catggcatca agacccaggg ggccaggcag aagttcagca gcctgtacat cagccagttc catggcatca agacccagg ggccaggcag aagttcagca gcctgtacat cagccagttc
52205220
atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc
52805280
accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac
53405340
ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc
54005400
ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag
54605460
agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc
55205520
acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc
55805580
caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact
56405640
ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg
57005700
atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag
57605760
gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg
58205820
ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg
58805880
gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca
59405940
tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa
60006000
caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat
60606060
tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc
61206120
aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt
61806180
ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg
62406240
ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc
63006300
ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct
63606360
ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg
64206420
ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg
64806480
gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct gttgtttgcc gcactgataa ttccgtggtg ttgtctgtgc cttctagttg ccagccatct gttgtttgcc
65406540
cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt tcctaataaa
66006600
atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg ggtggggtgg
66606660
ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg gatgcggtgg
67206720
gctctatggc tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact gctctatggc tctagagcat ggctacgtag ataagtagca tggcgggtta atcattaact
67806780
acacctgcag gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc acacctgcag gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc
68406840
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc
69006900
gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa gagcgcgcag ctgcctgcag gggcgcgcct cgaggcatgc ggtaccaagc ttgtcgagaa
69606960
gtactagagg atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa gtactagagg atcataatca gccataccac atttgtagag gttttacttg ctttaaaaaa
70207020
cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt
70807080
gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa
71407140
agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca
72007200
tgtctggatc tgatcactga tatcgcctag gagatccgaa ccagataagt gaaatctagt tgtctggatc tgatcactga tatcgcctag gagatccgaa cgataagt gaaatctagt
72607260
tccaaactat tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc tccaaactat tttgtcattt ttaattttcg tattagctta cgacgctaca cccagttccc
73207320
atctattttg tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt atctattttg tcactcttcc ctaaataatc cttaaaaact ccatttccac ccctcccagt
73807380
tcccaactat tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa tcccaactat tttgtccgcc cacagcgggg catttttctt cctgttatgt ttttaatcaa
74407440
acatcctgcc aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga acatcctgcc aactccatgt gacaaaccgt catcttcggc tactttttct ctgtcacaga
75007500
atgaaaattt ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc atgaaaattt ttctgtcatc tcttcgttat taatgtttgt aattgactga atatcaacgc
75607560
ttatttgcag cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg ttatttgcag cctgaatggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg
76207620
gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt
76807680
tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc
77407740
gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg
78007800
attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga attagggtga tggttcacgt agtggggccat cgccctgata gacggttttt cgccctttga
78607860
cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc
79207920
ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa
79807980
aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa
80408040
tttcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tttcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa
81008100
tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt tacattcaaa tatgtatccg ctcatgagac aataaccctg ataaatgctt caataatatt
81608160
gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc ccttattccc ttttttgcgg
82208220
cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag cattttgcct tcctgttttt gctcacccag aaacgctggt gaaagtaaaa gatgctgaag
82808280
atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg atcagttggg tgcacgagtg ggttacatcg aactggatct caacagcggt aagatccttg
83408340
agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg agagttttcg ccccgaagaa cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg
84008400
gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt gcgcggtatt atcccgtatt gacgccgggc aagagcaact cggtcgccgc atacactatt
84608460
ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga ctcagaatga cttggttgag tactcaccag tcacagaaaa gcatcttacg gatggcatga
85208520
cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac cagtaagaga attatgcagt gctgccataa ccatgagtga taacactgcg gccaacttac
85808580
ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc ttctgacaac gatcggagga ccgaaggagc taaccgcttt tttgcacaac atgggggatc
86408640
atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga agccatacca aacgacgagc
87008700
gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac gtgacaccac gatgcctgta gcaatggcaa caacgttgcg caaactatta actggcgaac
87608760
tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag tacttactct agcttcccgg caacaattaa tagactggat ggaggcggat aaagttgcag
88208820
gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg gaccacttct gcgctcggcc cttccggctg gctggtttat tgctgataaa tctggagccg
88808880
gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta gtgagcgtgg gtctcgcggt atcattgcag cactggggcc agatggtaag ccctcccgta
89408940
tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg tcgtagttat ctacacgacg gggagtcagg caactatgga tgaacgaaat agacagatcg
90009000
ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata ctgagatagg tgcctcactg attaagcatt ggtaactgtc agaccaagtt tactcatata
90609060
tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt tactttagat tgatttaaaa cttcattttt aatttaaaag gatctaggtg aagatccttt
91209120
ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc ttgataatct catgaccaaa atcccttaac gtgagttttc gttccactga gcgtcagacc
91809180
ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct ccgtagaaaa gatcaaagga tcttcttgag atcctttttt tctgcgcgta atctgctgct
92409240
tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt gccggatcaa gagctaccaa
93009300
ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag ctctttttcc gaaggtaact ggcttcagca gagcgcagat accaaatact gtccttctag
93609360
tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc tgtagccgta gttaggccac cacttcaaga actctgtagc accgcctaca tacctcgctc
94209420
tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg tgctaatcct gttaccagtg gctgctgcca gtggcgataa gtcgtgtctt accgggttgg
94809480
actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca actcaagacg atagttaccg gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca
95409540
cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt cacagcccag cttggagcga acgacctaca ccgaactgag atacctacag cgtgagcatt
96009600
gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg gagaaagcgc cacgcttccc gaagggagaa aggcggacag gtatccggta agcggcaggg
96609660
tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc tcggaacagg agagcgcacg agggagcttc cagggggaaa cgcctggtat ctttatagtc
97209720
ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt gtgatgctcg tcaggggggc
97809780
ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg gttcctggcc ttttgctggc
98409840
cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg cttttgctca catgttcttt cctgcgttat cccctgattc tgtggataac cgtattaccg
99009900
cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga cctttgagtg agctgatacc gctcgccgca gccgaacgac cgagcgcagc gagtcagtga
99609960
gcgaggaagc ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt gcgaggaagc ggaagagcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt
1002010020
cacaccgcag accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat cacaccgcag accagccgcg taacctggca aaatcggtta cggttgagta ataaatggat
1008010080
gccctgcgta agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa gccctgcgta agcgggtgtg ggcggacaat aaagtcttaa actgaacaaa atagatctaa
1014010140
actatgacaa taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta actatgacaa taaagtctta aactagacag aatagttgta aactgaaatc agtccagtta
1020010200
tgctgtgaaa aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa tgctgtgaaa aagcatactg gacttttgtt atggctaaag caaactcttc attttctgaa
1026010260
gtgcaaattg cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt gtgcaaattg cccgtcgtat taaagagggg cgtggccaag ggcatggtaa agactatatt
1032010320
cgcggcgttg tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa cgcggcgttg tgacaattta ccgaacaact ccgcggccgg gaagccgatc tcggcttgaa
1038010380
cgaattgtta ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc cgaattgtta ggtggcggta cttgggtcga tatcaaagtg catcacttct tcccgtatgc
1044010440
ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca ccaactttgt atagagagcc actgcgggat cgtcaccgta atctgcttgc acgtagatca
1050010500
cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc cataagcacc aagcgcgttg gcctcatgct tgaggagatt gatgagcgcg gtggcaatgc
1056010560
cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct cctgcctccg gtgctcgccg gagactgcga gatcatagat atagatctca ctacgcggct
1062010620
gctcaaacct gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg gctcaaacct gggcagaacg taagccgcga gagcgccaac aaccgcttct tggtcgaagg
1068010680
cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct cagcaagcgc gatgaatgtc ttactacgga gcaagttccc gaggtaatcg gagtccggct
1074010740
gatgttggga gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc gatgttggga gtaggtggct acgtctccga actcacgacc gaaaagatca agagcagccc
1080010800
gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc gcatggattt gacttggtca gggccgagcc tacatgtgcg aatgatgccc atacttgagc
1086010860
cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca cacctaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctgcgtaaca
1092010920
tcgttgctgc tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat tcgttgctgc tccataacat caaacatcga cccacggcgt aacgcgcttg ctgcttggat
1098010980
gcccgaggca tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg gcccgaggca tagactgtac aaaaaaacag tcataacaag ccatgaaaac cgccactgcg
1104011040
ccgttaccac cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac ccgttaccac cgctgcgttc ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac
1110011100
ttgcattaca gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt ttgcattaca gtttacgaac cgaacaggct tatgtcaact gggttcgtgc cttcatccgt
1116011160
ttccacggtg tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc ttccacggtg tgcgtcaccc ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc
1122011220
tggctggcga acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg tggctggcga acgagcgcaa ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg
1128011280
ctgttcttct acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga ctgttcttct acggcaaggt gctgtgcacg gatctgccct ggcttcagga gatcggaaga
1134011340
cctcggccgt cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc cctcggccgt cgcggcgctt gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc
1140011400
ggttttctgg aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt ggttttctgg aaggcgagca tcgtttgttc gcccaggact ctagctatag ttctagtggt
1146011460
tggctacgta tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct tggctacgta tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct
1152011520
cgcaaataaa taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa cgcaaataaa taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa
1158011580
tattccggat tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc tattccggat tattcatacc gtcccaccat cgggcgcgga tctcggtccg aaaccatgtc
1164011640
gtactaccat caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt gtactaccat caccatcacc atcacgatta cgatatccca acgaccgaaa acctgtattt
1170011700
tcagggcgcc atgggatcc tcagggcgcc atgggatcc
1171911719
<210> 208<210> 208
<211> 11796<211> 11796
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 208<400> 208
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg atctacgtag ccatgctcta gaaggctcag aggcacacag gagtttctgg gctcaccctg
240 240
cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt cccccttcca acccctcagt tcccatcctc cagcagctgt ttgtgtgctg cctctgaagt
300 300
ccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc cccacactgaa caaacttcag cctactcatg tccctaaaat gggcaaacat tgcaagcagc
360 360
aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag aaacagcaaa cacacagccc tccctgcctg ctgaccttgg agctggggca gaggtcagag
420 420
acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga acctctctgg gcccatgcca cctccaacat ccactcgacc ccttggaatt tcggtggaga
480 480
ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac ggagcagagg ttgtcctggc gtggtttagg tagtgtgaga gggtccgggt tcaaaaccac
540 540
ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca ttgctgggtg gggagtcgtc agtaagtggc tatgccccga ccccgaagcc tgtttcccca
600 600
tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat tctgtacaat ggaaatgata aagacgccca tctgataggg tttttgtggc aaataaacat
660 660
ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag ttggtttttt tgttttgttt tgttttgttt tttgagatgg aggtttgctc tgtcgcccag
720 720
gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa gctggagtgc agtgacacaa tctcatctca ccacaacctt cccctgcctc agcctcccaa
780 780
gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga gtagctggga ttacaagcat gtgccaccac acctggctaa ttttctattt ttagtagaga
840 840
cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc cgggtttctc catgttggtc agcctcagcc tcccaagtaa ctgggattac aggcctgtgc
900 900
caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca caccacaccc ggctaatttt ttctattttt gacagggacg gggtttcacc atgttggtca
960 960
ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt ggctggtcta gaggtaccgg atcttgctac cagtggaaca gccactaagg attctgcagt
10201020
gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc gagagcagag ggccagctaa gtggtactct cccagagact gtctgactca cgccaccccc
10801080
tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa tccaccttgg acacaggacg ctgtggtttc tgagccaggt acaatgactc ctttcggtaa
11401140
gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc gtgcagtgga agctgtacac tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc
12001200
agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt agatcccagc cagtggactt agcccctgtt tgctcctccg ataactgggg tgaccttggt
12601260
taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga taatattcac cagcagcctc ccccgttgcc cctctggatc cactgcttaa atacggacga
13201320
ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg ggacagggcc ctgtctcctc agcttcaggc accaccactg acctgggaca gtgaatccgg
13801380
actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg actctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg
14401440
tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt tttctctctt ttagattcca acctttggaa ctgagtttaa acgccgccac catgcagatt
15001500
gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga gagctgagca cctgcttctt cctgtgcctg ctgaggttct gcttctctgc caccaggaga
15601560
tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg tactacctgg gggctgtgga gctgagctgg gactacatgc agtctgacct gggggagctg
16201620
cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg cctgtggatg ccaggttccc ccccagagtg cccaagagct tccccttcaa cacctctgtg
16801680
gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc gtgtacaaga agaccctgtt tgtggagttc actgaccacc tgttcaacat tgccaagccc
17401740
aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg aggcccccct ggatgggcct gctgggcccc accatccagg ctgaggtgta tgacactgtg
18001800
gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc gtgatcaccc tgaagaacat ggccagccac cctgtgagcc tgcatgctgt gggggtgagc
18601860
tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag tactggaagg cctctgaggg ggctgagtat gatgaccaga ccagccagag ggagaaggag
19201920
gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat gatgacaagg tgttccctgg gggcagccac acctatgtgt ggcaggtgct gaaggagaat
19801980
ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg ggccccatgg cctctgaccc cctgtgcctg acctacagct acctgagcca tgtggacctg
20402040
gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg gtgaaggacc tgaactctgg cctgattggg gccctgctgg tgtgcaggga gggcagcctg
21002100
gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag gccaaggaga agacccagac cctgcacaag ttcatcctgc tgtttgctgt gtttgatgag
21602160
ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacaggga tgctgcctct ggcaagagct ggcactctga aaccaagaac agcctgatgc aggacagga tgctgcctct
22202220
gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc gccagggcct ggcccaagat gcacactgtg aatggctatg tgaacaggag cctgcctggc
22802280
ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct ctgattggct gccacaggaa gtctgtgtac tggcatgtga ttggcatggg caccacccct
23402340
gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc gaggtgcaca gcatcttcct ggagggccac accttcctgg tcaggaacca caggcaggcc
24002400
agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc agcctggaga tcagccccat caccttcctg actgcccaga ccctgctgat ggacctgggc
24602460
cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg cagttcctgc tgttctgcca catcagcagc caccagcatg atggcatgga ggcctatgtg
25202520
aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag aaggtggaca gctgccctga ggagccccag ctgaggatga agaacaatga ggaggctgag
25802580
gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac gactatgatg atgacctgac tgactctgag atggatgtgg tgaggtttga tgatgacaac
26402640
agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac agccccagct tcatccagat caggtctgtg gccaagaagc accccaagac ctgggtgcac
27002700
tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac tacattgctg ctgaggagga ggactgggac tatgcccccc tggtgctggc ccctgatgac
27602760
aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag aggagctaca agagccagta cctgaacaat ggcccccaga ggattggcag gaagtacaag
28202820
aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat aaggtcaggt tcatggccta cactgatgaa accttcaaga ccagggaggc catccagcat
28802880
gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc gagtctggca tcctgggccc cctgctgtat ggggaggtgg gggacaccct gctgatcatc
29402940
ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg ttcaagaacc aggccagcag gccctacaac atctaccccc atggcatcac tgatgtgagg
30003000
cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg cccctgtaca gcaggaggct gcccaagggg gtgaagcacc tgaaggactt ccccatcctg
30603060
cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct cctggggaga tcttcaagta caagtggact gtgactgtgg aggatggccc caccaagtct
31203120
gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc gaccccaggt gcctgaccag atactacagc agctttgtga acatggagag ggacctggcc
31803180
tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac tctggcctga ttggccccct gctgatctgc tacaaggagt ctgtggacca gaggggcaac
32403240
cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc cagatcatgt ctgacaagag gaatgtgatc ctgttctctg tgtttgatga gaacaggagc
33003300
tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag tggtacctga ctgagaacat ccagaggttc ctgcccaacc ctgctggggt gcagctggag
33603360
gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc gaccctgagt tccaggccag caacatcatg cacagcatca atggctatgt gtttgacagc
34203420
ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc ctgcagctgt ctgtgtgcct gcatgaggtg gcctactggt acatcctgag cattggggcc
34803480
cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat cagactgact tcctgtctgt gttcttctct ggctacacct tcaagcacaa gatggtgtat
35403540
gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac gaggacaccc tgaccctgtt ccccttctct ggggagactg tgttcatgag catggagaac
36003600
cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc cctggcctgt ggattctggg ctgccacaac tctgacttca ggaacagggg catgactgcc
36603660
ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag ctgctgaaag tctccagctg tgacaagaac actggggact actatgagga cagctatgag
37203720
gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag gacatctctg cctacctgct gagcaagaac aatgccattg agcccaggag cttcagccag
37803780
aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca aatgccacta atgtgtctaa caacagcaac accagcaatg acagcaatgt gtctccccca
38403840
gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga ccaggaggag gtgctgaaga ggcaccagag ggagatcacc aggaccaccc tgcagtctga cccaggagg
39003900
attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac attgactatg atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac
39603960
gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct gaggacgaga accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct
40204020
gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg gctgtggaga ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg
40804080
gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc gcccagtctg gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc
41404140
agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc agcttcaccc agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc
42004200
tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg tacatcaggg ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg
42604260
ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag ccctacagct tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag
43204320
cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac cccaggaaga actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac
43804380
cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg cacatggccc ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg
44404440
gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac gacctggaga aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac
45004500
accctgaacc ctgcccatgg caggcaggtg actgtgcagg agtttgccct gttcttcacc accctgaacc ctgcccatgg caggcaggtg actngtgcagg agtttgccct gttcttcacc
45604560
atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc atctttgatg aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc
46204620
ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc
46804680
aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg aatggctaca tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg
47404740
tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat tggtacctgc tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat
48004800
gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg gtgttcactg tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg
48604860
gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg gtgtttgaga ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg
49204920
attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc attggggagc acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc
49804980
cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc cagacccccc tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc
50405040
cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc cagtatggcc agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc
51005100
tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc
51605160
catggcatca agacccaggg ggccaggcag aagttcagca gcctgtacat cagccagttc catggcatca agacccagg ggccaggcag aagttcagca gcctgtacat cagccagttc
52205220
atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc atcatcatgt acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc
52805280
accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac accctgatgg tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac
53405340
ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc ccccccatca ttgccagata catcaggctg caccccaccc actacagcat caggagcacc
54005400
ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag ctgaggatgg agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag
54605460
agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc agcaaggcca tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc
55205520
acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc acctggagcc ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc
55805580
caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact caggtcaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact
56405640
ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg ggggtgacca cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg
57005700
atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag atcagcagca gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag
57605760
gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg gtgttccagg gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg
58205820
ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg ctgaccagat acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg
58805880
gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca gaggtgctgg gctgtgaggc ccaggacctg tactgattaa ttaagagcat cttaccgcca
59405940
tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa tttattccca tatttgttct gtttttcttg atttgggtat acatttaaat gttaataaaa
60006000
caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat caaaatggtg gggcaatcat ttacattttt agggatatgt aattactagt tcaggtgtat
60606060
tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc tgccacaaga caaacatgtt aagaaacttt cccgttattt acgctctgtt cctgttaatc
61206120
aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt aacctctgga ttacaaaatt tgtgaaagat tgactgatat tcttaactat gttgctcctt
61806180
ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg ttacgctgtg tggatatgct gctttatagc ctctgtatct agctattgct tcccgtacgg
62406240
ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc ctttcgtttt ctcctccttg tataaatcct ggttgctgtc tcttttagag gagttgtggc
63006300
ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc tgacgcaacc cccactggct
63606360
ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg ggggcattgc caccacctgt caactccttt ctgggacttt cgctttcccc ctcccgatcg
64206420
ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg ccacggcaga actcatcgcc gcctgccttg cccgctgctg gacaggggct aggttgctgg
64806480
gcactgataa ttccgtggtg ttgtctccat aaagtaggaa acactacacg attccataaa gcactgataa ttccgtggtg ttgtctccat aaagtaggaa acactacacg attccataaa
65406540
gtaggaaaca ctacatcact ccataaagta ggaaacacta catgtgcctt ctagttgcca gtaggaaaca ctacatcact ccataaagta ggaaacacta catgtgcctt ctagttgcca
66006600
gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac
66606660
tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt gtcattctat
67206720
tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca atagcaggca
67806780
tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata agtagcatgg tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata agtagcatgg
68406840
cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt ggccactccc cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt ggccactccc
69006900
tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc
69606960
ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt
70207020
accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt tgtagaggtt accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt tgtagaggtt
70807080
ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa aatgaatgca ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa aatgaatgca
71407140
attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc
72007200
acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc
72607260
atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag atccgaacca atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag atccgaacca
73207320
gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat tagcttacga gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat tagcttacga
73807380
cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt aaaaactcca cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt aaaaactcca
74407440
tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat ttttcttcct tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat ttttcttcct
75007500
gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat cttcggctac gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat cttcggctac
75607560
tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa tgtttgtaat tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa tgtttgtaat
76207620
tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg
76807680
cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac ttgccagcgc
77407740
cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ccggctttcc
78007800
ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt tacggcacct
78607860
cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc cctgatagac
79207920
ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct tgttccaaac
79807980
tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga ttttgccgat
80408040
ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga attttaacaa
81008100
aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg gaacccctat aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg gaacccctat
81608160
ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat aaccctgata
82208220
aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct
82808280
tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa
83408340
agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa
84008400
cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt
84608460
taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag agcaactcgg
85208520
tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca
85808580
tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa
86408640
cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt
87008700
gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc
87608760
cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa cgttgcgcaa
88208820
actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga
88808880
ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc
89408940
tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga
90009000
tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga
90609060
acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga
91209120
ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat
91809180
ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt
92409240
ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct
93009300
gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc
93609360
ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc
94209420
aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc
94809480
gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc
95409540
gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg
96009600
aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata
96609660
cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta
97209720
tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc
97809780
ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg
98409840
atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt
99009900
cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt
99609960
ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga
1002010020
gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt ttctccttac gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt ttctccttac
1008010080
gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa tcggttacgg gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa tcggttacgg
1014010140
ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact
1020010200
gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat agttgtaaac gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat agttgtaaac
1026010260
tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg gctaaagcaa tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg gctaaagcaa
1032010320
actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt ggccaagggc actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt ggccaagggc
1038010380
atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg cggccgggaa atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg cggccgggaa
1044010440
gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat caaagtgcat gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat caaagtgcat
1050010500
cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt caccgtaatc cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt caccgtaatc
1056010560
tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga ggagattgat tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga ggagattgat
1062010620
gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat catagatata gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat catagatata
1068010680
gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag cgccaacaac gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag cgccaacaac
1074010740
cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca agttcccgag cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca agttcccgag
1080010800
gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact cacgaccgaa gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact cacgaccgaa
1086010860
aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac atgtgcgaat aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac atgtgcgaat
1092010920
gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct gcgtaacatc gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct gcgtaacatc
1098010980
gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc acggcgtaac
1104011040
gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca taacaagcca
1110011100
tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc
1116011160
gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat gtcaactggg gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat gtcaactggg
1122011220
ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc agcagcgaag ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc agcagcgaag
1128011280
tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc
1134011340
aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat ctgccctggc aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat ctgccctggc
1140011400
ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg
1146011460
aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc caggactcta aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc caggactcta
1152011520
gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca tggagataat gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca tggagataat
1158011580
taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa cagttttgta taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa cagttttgta
1164011640
ataaaaaaac ctataaatat tccggattat tcataccgtc ccaccatcgg gcgcggatct ataaaaaaac ctataaatat tccggattat tcataccgtc cccacatcgg gcgcggatct
1170011700
cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga tatcccaacg cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga tatcccaacg
1176011760
accgaaaacc tgtattttca gggcgccatg ggatcc accgaaaacc tgtattttca gggcgccatg ggatcc
1179611796
<210> 209<210> 209
<211> 10795<211> 10795
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 209<400> 209
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc
240 240
cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca
300 300
tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag
360 360
gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag
420 420
cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga
480 480
gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt
540 540
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt
600 600
ggtttaaacg ccgccaccat gcagatcgag ctgtctacct gcttcttcct gtgcctgctg ggtttaaacg ccgccaccat gcagatcgag ctgtctacct gcttcttcct gtgcctgctg
660 660
cggttctgct tcagcgccac cagaagatat tacctgggcg ccgtggaact gagctgggac cggttctgct tcagcgccac cagaagatat tacctgggcg ccgtggaact gagctgggac
720 720
tacatgcagt ctgacctggg agagctgccc gtggacgcta gatttcctcc aagagtgccc tacatgcagt ctgacctggg agagctgccc gtggacgcta gatttcctcc aagagtgccc
780 780
aagagcttcc ccttcaacac ctccgtggtg tacaagaaaa ccctgttcgt ggaattcacc aagagcttcc ccttcaacac ctccgtggtg tacaagaaaa ccctgttcgt ggaattcacc
840 840
gaccacctgt tcaatatcgc caagcctcgg cctccttgga tgggactgct gggacctaca gaccacctgt tcaatatcgc caagcctcgg cctccttgga tgggactgct gggacctaca
900 900
attcaggccg aggtgtacga caccgtggtc atcaccctga agaacatggc cagccatcct attcaggccg aggtgtacga caccgtggtc atcaccctga agaacatggc cagccatcct
960 960
gtgtctctgc acgccgtggg agtgtcttat tggaaggctt ctgagggcgc cgagtacgac gtgtctctgc acgccgtggg agtgtcttat tggaaggctt ctgagggcgc cgagtacgac
10201020
gatcagacaa gccagagaga gaaagaggac gacaaggttt tccctggcgg cagccacacc gatcagacaa gccagagaga gaaagaggac gacaaggttt tccctggcgg cagccacacc
10801080
tatgtctggc aggtcctgaa agaaaacggc cctatggcct ccgatcctct gtgcctgaca tatgtctggc aggtcctgaa agaaaacggc cctatggcct ccgatcctct gtgcctgaca
11401140
tacagctacc tgagccacgt ggacctggtc aaggacctga attctggcct gatcggagcc tacagctacc tgagccacgt ggacctggtc aaggacctga attctggcct gatcggagcc
12001200
ctgctcgtgt gtagagaagg cagcctggcc aaagagaaaa cccagacact gcacaagttc ctgctcgtgt gtagagaagg cagcctggcc aaagagaaaa cccagacact gcacaagttc
12601260
atcctgctgt tcgccgtgtt cgacgagggc aagagctggc acagcgagac aaagaacagc atcctgctgt tcgccgtgtt cgacgagggc aagagctggc acagcgagac aaagaacagc
13201320
ctgatgcagg acagggatgc cgcctctgct agagcttggc ctaagatgca caccgtgaac ctgatgcagg acagggatgc cgcctctgct agagcttggc ctaagatgca caccgtgaac
13801380
ggctacgtga acagaagcct gcctggactg atcggctgcc acagaaagtc cgtgtactgg ggctacgtga acagaagcct gcctggactg atcggctgcc acagaaagtc cgtgtactgg
14401440
cacgtgatcg gcatgggcac aacacctgag gtgcacagca tctttctgga aggccacacc cacgtgatcg gcatgggcac aacacctgag gtgcacagca tctttctgga aggccacacc
15001500
ttcctcgtgc ggaaccacag acaggccagc ctggaaatca gccctatcac cttcctgacc ttcctcgtgc ggaaccacag acaggccagc ctggaaatca gccctatcac cttcctgacc
15601560
gctcagaccc tgctgatgga tctgggccag tttctgctgt tctgccacat cagctcccac gctcagaccc tgctgatgga tctgggccag tttctgctgt tctgccacat cagctcccac
16201620
cagcacgatg gcatggaagc ctacgtgaag gtggacagct gccccgaaga accccagctg cagcacgatg gcatggaagc ctacgtgaag gtggacagct gccccgaaga accccagctg
16801680
cggatgaaga acaacgagga agccgaggac tacgacgacg acctgaccga ctctgagatg cggatgaaga acaacgagga agccgaggac tacgacgacg acctgaccga ctctgagatg
17401740
gacgtcgtca gattcgacga cgataacagc cccagcttca tccagatcag aagcgtggcc gacgtcgtca gattcgacga cgataacagc cccagcttca tccagatcag aagcgtggcc
18001800
aagaagcacc ccaagacctg ggtgcactat atcgccgccg aggaagagga ctgggattac aagaagcacc ccaagacctg ggtgcactat atcgccgccg aggaagagga ctgggattac
18601860
gctcctctgg tgctggcccc tgacgacaga agctacaaga gccagtacct gaacaacggc gctcctctgg tgctggcccc tgacgacaga agctacaaga gccagtacct gaacaacggc
19201920
cctcagcgga tcggccggaa gtataagaaa gtgcggttca tggcctacac cgacgagaca cctcagcgga tcggccggaa gtataagaaa gtgcggttca tggcctacac cgacgagaca
19801980
ttcaagacca gagaggccat ccagcacgag agcggaattc tgggccctct gctgtatggc ttcaagacca gagaggccat ccagcacgag agcggaattc tgggccctct gctgtatggc
20402040
gaagtgggcg atacactgct gatcatcttc aagaaccagg ccagcagacc ctacaacatc gaagtgggcg atacactgct gatcatcttc aagaaccagg ccagcagacc ctacaacatc
21002100
taccctcacg gcatcaccga tgtgcggccc ctgtattcta gaaggctgcc caagggcgtg taccctcacg gcatcaccga tgtgcggccc ctgtattcta gaaggctgcc caagggcgtg
21602160
aagcacctga aggacttccc tatcctgcct ggcgagattt tcaagtacaa gtggaccgtg aagcacctga aggacttccc tatcctgcct ggcgagattt tcaagtacaa gtggaccgtg
22202220
accgtggaag atggccccac caagagcgac cctagatgtc tgacacggta ctacagcagc accgtggaag atggccccac caagagcgac cctagatgtc tgacacggta ctacagcagc
22802280
ttcgtgaaca tggaacgcga cctggccagc ggcctgattg gacctctgct gatctgctac ttcgtgaaca tggaacgcga cctggccagc ggcctgattg gacctctgct gatctgctac
23402340
aaagaaagcg tggaccagcg gggcaaccag atcatgagcg acaagcggaa cgtgatcctg aaagaaagcg tggaccagcg gggcaaccag atcatgagcg acaagcggaa cgtgatcctg
24002400
tttagcgtgt tcgatgagaa ccggtcctgg tatctgaccg agaacatcca gcggtttctg tttagcgtgt tcgatgagaa ccggtcctgg tatctgaccg agaacatcca gcggtttctg
24602460
cccaatcctg ccggggtgca actggaagat cctgagttcc aggcaagcaa catcatgcac cccaatcctg ccggggtgca actggaagat cctgagttcc aggcaagcaa catcatgcac
25202520
tccatcaatg gctatgtgtt cgacagcctg cagctgagcg tgtgcctgca cgaagtggcc tccatcaatg gctatgtgtt cgacagcctg cagctgagcg tgtgcctgca cgaagtggcc
25802580
tactggtaca tcctgagcat tggcgcccag accgacttcc tgtccgtgtt ctttagcggc tactggtaca tcctgagcat tggcgcccag accgacttcc tgtccgtgtt ctttagcggc
26402640
tacaccttca agcacaagat ggtgtacgag gataccctga cactgttccc attcagcggc tacaccttca agcacaagat ggtgtacgag gataccctga cactgttccc attcagcggc
27002700
gagacagtgt tcatgagcat ggaaaacccc ggcctgtgga ttctgggctg tcacaacagc gagacagtgt tcatgagcat ggaaaacccc ggcctgtgga ttctgggctg tcacaacagc
27602760
gacttccgga acagaggcat gacagccctg ctgaaggtgt ccagctgcga caagaacacc gacttccgga acagaggcat gacagccctg ctgaaggtgt ccagctgcga caagaacacc
28202820
ggcgactact acgaggacag ctatgaggac atcagcgcct acctgctgag caagaacaat ggcgactact acgaggacag ctatgaggac atcagcgcct acctgctgag caagaacaat
28802880
gccatcgagc ctcggagctt cagccagaat cctcctgtgc tgaagcggca ccagcgcgag gccatcgagc ctcggagctt cagccagaat cctcctgtgc tgaagcggca ccagcgcgag
29402940
atcaccagaa caaccctgca gagcgaccaa gaggaaatcg attacgacga caccatcagc atcaccagaa caaccctgca gagcgaccaa gaggaaatcg attacgacga caccatcagc
30003000
gtcgagatga agaaagaaga tttcgacatc tacgacgagg acgagaatca gagccccaga gtcgagatga agaaagaaga tttcgacatc tacgacgagg acgagaatca gagccccaga
30603060
agctttcaga aaaagacccg gcactacttc attgccgccg tcgagagact gtgggactac agctttcaga aaaagacccg gcactacttc attgccgccg tcgagagact gtgggactac
31203120
ggcatgtcta gcagccctca cgtgctgaga aatagagccc agagcggcag cgtgccccag ggcatgtcta gcagccctca cgtgctgaga aatagagccc agagcggcag cgtgccccag
31803180
ttcaagaaag tggtgttcca agagttcacc gacggcagct tcacccagcc actgtataga ttcaagaaag tggtgttcca agagttcacc gacggcagct tcacccagcc actgtataga
32403240
ggcgagctga acgagcatct gggcctgctg ggcccttata tcagagccga agtggaagat ggcgagctga acgagcatct gggcctgctg ggcccttata tcagagccga agtggaagat
33003300
aacatcatgg tcaccttccg gaatcaggct agccggcctt acagcttcta cagctccctg aacatcatgg tcaccttccg gaatcaggct agccggcctt acagcttcta cagctccctg
33603360
atcagctacg aagaggacca gagacagggc gctgagccca gaaagaactt cgtgaagccc atcagctacg aagaggacca gagacagggc gctgagccca gaaagaactt cgtgaagccc
34203420
aacgagacta agacctactt ttggaaggtg cagcaccaca tggcccctac aaaggacgag aacgagacta agacctactt ttggaaggtg cagcaccaca tggcccctac aaaggacgag
34803480
ttcgactgca aagcctgggc ctacttctcc gatgtggatc tggaaaagga cgtgcacagc ttcgactgca aagcctgggc ctacttctcc gatgtggatc tggaaaagga cgtgcacagc
35403540
gggctcatcg gaccactgct tgtgtgccac accaacacac tgaaccccgc tcacggcaga gggctcatcg gaccactgct tgtgtgccac accaacacac tgaaccccgc tcacggcaga
36003600
caagtgacag tgcaagagtt cgccctgttc ttcaccatct tcgacgaaac aaagagctgg caagtgacag tgcaagagtt cgccctgttc ttcaccatct tcgacgaaac aaagagctgg
36603660
tacttcaccg agaatatgga acggaactgc agagcccctt gcaacatcca gatggaagat tacttcaccg agaatatgga acggaactgc agagcccctt gcaacatcca gatggaagat
37203720
cccaccttca aagagaacta ccggttccac gccatcaacg gctacatcat ggacacactg cccaccttca aagagaacta ccggttccac gccatcaacg gctacatcat ggacacactg
37803780
cccggcctgg ttatggccca ggatcagaga atccggtggt atctgctgtc catgggctcc cccggcctgg ttatggccca ggatcagaga atccggtggt atctgctgtc catgggctcc
38403840
aacgagaata tccacagcat ccacttcagc ggccacgtgt tcaccgtgcg gaaaaaagaa aacgagaata tccacagcat ccacttcagc ggccacgtgt tcaccgtgcg gaaaaaagaa
39003900
gagtacaaaa tggccctgta caatctgtac cctggggtgt tcgaaaccgt ggaaatgctg gagtacaaaa tggccctgta caatctgtac cctggggtgt tcgaaaccgt ggaaatgctg
39603960
ccttccaagg ccggcatttg gagagtggaa tgtctgattg gagagcacct ccacgccgga ccttccaagg ccggcatttg gagagtggaa tgtctgattg gagagcacct ccacgccgga
40204020
atgagcaccc tgtttctggt gtacagcaac aagtgtcaga cccctctcgg catggcctct atgagcaccc tgtttctggt gtacagcaac aagtgtcaga cccctctcgg catggcctct
40804080
ggacacatca gagacttcca gatcaccgcc tctggccagt acggacagtg ggctcctaaa ggacacatca gagacttcca gatcaccgcc tctggccagt acggacagtg ggctcctaaa
41404140
ctggctcggc tgcactacag cggcagcatc aatgcctggt ccaccaaaga gcccttcagc ctggctcggc tgcactacag cggcagcatc aatgcctggt ccaccaaaga gcccttcagc
42004200
tggatcaagg tggacctgct ggctcccatg atcatccacg gaatcaagac ccagggcgcc tggatcaagg tggacctgct ggctccatg atcatccacg gaatcaagac ccagggcgcc
42604260
agacagaagt tcagcagcct gtacatcagc cagttcatca tcatgtacag cctggacggc agacagaagt tcagcagcct gtacatcagc cagttcatca tcatgtacag cctggacggc
43204320
aagaagtggc agacctacag aggcaacagc accggcacac tcatggtgtt cttcggcaac aagaagtggc agacctacag aggcaacagc accggcacac tcatggtgtt cttcggcaac
43804380
gtggactcca gcggcattaa gcacaacatc ttcaaccctc caatcattgc ccggtacatc gtggactcca gcggcattaa gcacaacatc ttcaaccctc caatcattgc ccggtacatc
44404440
cggctgcacc ccacacacta cagcatccgg tctaccctga gaatggaact gatgggctgc cggctgcacc ccacacacta cagcatccgg tctaccctga gaatggaact gatgggctgc
45004500
gacctgaaca gctgctctat gcccctcgga atggaaagca aggccatcag cgacgcccag gacctgaaca gctgctctat gcccctcgga atggaaagca aggccatcag cgacgcccag
45604560
atcacagcca gcagctactt caccaacatg ttcgccactt ggagcccctc caaggctaga atcacagcca gcagctactt caccaacatg ttcgccactt ggagcccctc caaggctaga
46204620
ctgcatctgc agggcagaag caacgcttgg aggccccaag tgaacaaccc caaagagtgg ctgcatctgc agggcagaag caacgcttgg aggccccaag tgaacaaccc caaagagtgg
46804680
ctgcaggttg actttcaaaa gaccatgaaa gtgaccggcg tgaccacaca gggcgtcaag ctgcaggttg actttcaaaa gaccatgaaa gtgaccggcg tgaccacaca gggcgtcaag
47404740
tctctgctga cctctatgta cgtgaaagag ttcctgatct ccagcagcca ggacggccat tctctgctga cctctatgta cgtgaaagag ttcctgatct ccagcagcca ggacggccat
48004800
cagtggaccc tgtttttcca gaacggcaaa gtgaaagtgt tccagggcaa tcaggacagc cagtggaccc tgtttttcca gaacggcaaa gtgaaagtgt tccagggcaa tcaggacagc
48604860
ttcacacccg tggtcaattc tctggaccct ccactgctga ccagatacct gcggattcac ttcacacccg tggtcaattc tctggaccct ccactgctga cgagatacct gcggattcac
49204920
cctcagtctt gggtgcacca gatcgctctg cggatggaag tgctgggctg tgaagctcag cctcagtctt gggtgcacca gatcgctctg cggatggaag tgctgggctg tgaagctcag
49804980
gacctctact agttaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt gacctctact agttaattaa gagcatctta ccgccattta ttcccatatt tgttctgttt
50405040
ttcttgattt gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac ttcttgattt gggtatacat ttaaatgtta ataaaacaaa atggtggggc aatcatttac
51005100
atttttaggg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga atttttaggg atatgtaatt actagttcag gtgtattgcc acaagacaaa catgttaaga
51605160
aactttcccg ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg aactttcccg ttatttacgc tctgttcctg ttaatcaacc tctggattac aaaatttgtg
52205220
aaagattgac tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt aaagattgac tgatattctt aactatgttg ctccttttac gctgtgtgga tatgctgctt
52805280
tatagcctct gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata tatagcctct gtatctagct attgcttccc gtacggcttt cgttttctcc tccttgtata
53405340
aatcctggtt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg aatcctggtt gctgtctctt ttagaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg
54005400
tgtgctctgt gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac tgtgctctgt gtttgctgac gcaaccccca ctggctgggg cattgccacc acctgtcaac
54605460
tcctttctgg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct tcctttctgg gactttcgct ttccccctcc cgatcgccac ggcagaactc atcgccgcct
55205520
gccttgcccg ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt gccttgcccg ctgctggaca ggggctaggt tgctgggcac tgataattcc gtggtgttgt
55805580
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc
56405640
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc
57005700
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt
57605760
gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct gggaagacaa tagcaggcat gctggggatg cggtgggctc tatggctcta gagcatggct
58205820
acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt acgtagataa gtagcatggc gggttaatca ttaactacac ctgcaggagg aacccctagt
58805880
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa
59405940
ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggggc ggtcgcccga cgcccgggcg gcctcagtga gcgagcgagc gcgcagctgc ctgcaggggc
60006000
gcgcctcgag gcatgcggta ccaagcttgt cgagaagtac tagaggatca taatcagcca gcgcctcgag gcatgcggta ccaagcttgt cgagaagtac tagaggatca taatcagcca
60606060
taccacattt gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct taccacattt gtagaggttt tacttgcttt aaaaaacctc ccacacctcc ccctgaacct
61206120
gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta gaaacataaa atgaatgcaa ttgttgttgt taacttgttt attgcagctt ataatggtta
61806180
caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag caaataaagc aatagcatca caaatttcac aaataaagca tttttttcac tgcattctag
62406240
ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatctgat cactgatatc ttgtggtttg tccaaactca tcaatgtatc ttatcatgtc tggatctgat cactgatatc
63006300
gcctaggaga tccgaaccag ataagtgaaa tctagttcca aactattttg tcatttttaa gcctaggaga tccgaaccag ataagtgaaa tctagttcca aactattttg tcatttttaa
63606360
ttttcgtatt agcttacgac gctacaccca gttcccatct attttgtcac tcttccctaa ttttcgtatt agcttacgac gctacaccca gttcccatct attttgtcac tcttccctaa
64206420
ataatcctta aaaactccat ttccacccct cccagttccc aactattttg tccgcccaca ataatcctta aaaactccat ttccacccct cccagttccc aactattttg tccgcccaca
64806480
gcggggcatt tttcttcctg ttatgttttt aatcaaacat cctgccaact ccatgtgaca gcggggcatt tttcttcctg ttatgttttt aatcaaacat cctgccaact ccatgtgaca
65406540
aaccgtcatc ttcggctact ttttctctgt cacagaatga aaatttttct gtcatctctt aaccgtcatc ttcggctact ttttctctgt cacagaatga aaatttttct gtcatctctt
66006600
cgttattaat gtttgtaatt gactgaatat caacgcttat ttgcagcctg aatggcgaat cgttattaat gtttgtaatt gactgaatat caacgcttat ttgcagcctg aatggcgaat
66606660
gggacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga gggacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga
67206720
ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg
67806780
ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat
68406840
ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg
69006900
ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata
69606960
gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt
70207020
tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat
70807080
ttaacgcgaa ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa ttaacgcgaa ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa
71407140
atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca
72007200
tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc
72607260
aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc
73207320
acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt
73807380
acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt
74407440
ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg
75007500
ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact
75607560
caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg
76207620
ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga
76807680
aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg
77407740
aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa
78007800
tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac
78607860
aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc
79207920
cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca
79807980
ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga
80408040
gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta
81008100
agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc
81608160
atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc
82208220
cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt
82808280
cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac
83408340
cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct
84008400
tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact
84608460
tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg
85208520
ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata
85808580
aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga
86408640
cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg cttcccgaag cctacaccga actgagatac ctacagcgtg agcattgaga aagcgccacg cttcccgaag
87008700
ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggag cgcacgaggg
87608760
agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac
88208820
ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca
88808880
acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg
89408940
cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc
90009000
gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga
90609060
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcagacca gccgcgtaac tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcagacca gccgcgtaac
91209120
ctggcaaaat cggttacggt tgagtaataa atggatgccc tgcgtaagcg ggtgtgggcg ctggcaaaat cggttacggt tgagtaataa atggatgccc tgcgtaagcg ggtgtgggcg
91809180
gacaataaag tcttaaactg aacaaaatag atctaaacta tgacaataaa gtcttaaact gacaataaag tcttaaactg aacaaaatag atctaaacta tgacaataaa gtcttaaact
92409240
agacagaata gttgtaaact gaaatcagtc cagttatgct gtgaaaaagc atactggact agacagaata gttgtaaact gaaatcagtc cagttatgct gtgaaaaagc atactggact
93009300
tttgttatgg ctaaagcaaa ctcttcattt tctgaagtgc aaattgcccg tcgtattaaa tttgttatgg ctaaagcaaa ctcttcattt tctgaagtgc aaattgcccg tcgtattaaa
93609360
gaggggcgtg gccaagggca tggtaaagac tatattcgcg gcgttgtgac aatttaccga gaggggcgtg gccaagggca tggtaaagac tatattcgcg gcgttgtgac aatttaccga
94209420
acaactccgc ggccgggaag ccgatctcgg cttgaacgaa ttgttaggtg gcggtacttg acaactccgc ggccgggaag ccgatctcgg cttgaacgaa ttgttaggtg gcggtacttg
94809480
ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg ggtcgatatc aaagtgcatc acttcttccc gtatgcccaa ctttgtatag agagccactg
95409540
cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct cgggatcgtc accgtaatct gcttgcacgt agatcacata agcaccaagc gcgttggcct
96009600
catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga catgcttgag gagattgatg agcgcggtgg caatgccctg cctccggtgc tcgccggaga
96609660
ctgcgagatc atagatatag atctcactac gcggctgctc aaacctgggc agaacgtaag ctgcgagatc atagatatag atctcactac gcggctgctc aaacctgggc agaacgtaag
97209720
ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac ccgcgagagc gccaacaacc gcttcttggt cgaaggcagc aagcgcgatg aatgtcttac
97809780
tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt tacggagcaa gttcccgagg taatcggagt ccggctgatg ttgggagtag gtggctacgt
98409840
ctccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc ctccgaactc acgaccgaaa agatcaagag cagcccgcat ggatttgact tggtcagggc
99009900
cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac cgagcctaca tgtgcgaatg atgcccatac ttgagccacc taactttgtt ttagggcgac
99609960
tgccctgctg cgtaacatcg ttgctgctgc gtaacatcgt tgctgctcca taacatcaaa tgccctgctg cgtaacatcg ttgctgctgc gtaacatcgt tgctgctcca taacatcaaa
1002010020
catcgaccca cggcgtaacg cgcttgctgc ttggatgccc gaggcataga ctgtacaaaa catcgaccca cggcgtaacg cgcttgctgc ttggatgccc gaggcataga ctgtacaaaa
1008010080
aaacagtcat aacaagccat gaaaaccgcc actgcgccgt taccaccgct gcgttcggtc aaacagtcat aacaagccat gaaaaccgcc actgcgccgt taccaccgct gcgttcggtc
1014010140
aaggttctgg accagttgcg tgagcgcata cgctacttgc attacagttt acgaaccgaa aaggttctgg accagttgcg tgagcgcata cgctacttgc attacagttt acgaaccgaa
1020010200
caggcttatg tcaactgggt tcgtgccttc atccgtttcc acggtgtgcg tcacccggca caggcttatg tcaactgggt tcgtgccttc atccgtttcc acggtgtgcg tcacccggca
1026010260
accttgggca gcagcgaagt cgaggcattt ctgtcctggc tggcgaacga gcgcaaggtt accttgggca gcagcgaagt cgaggcattt ctgtcctggc tggcgaacga gcgcaaggtt
1032010320
tcggtctcca cgcatcgtca ggcattggcg gccttgctgt tcttctacgg caaggtgctg tcggtctcca cgcatcgtca ggcattggcg gccttgctgt tcttctacgg caaggtgctg
1038010380
tgcacggatc tgccctggct tcaggagatc ggaagacctc ggccgtcgcg gcgcttgccg tgcacggatc tgccctggct tcaggagatc ggaagacctc ggccgtcgcg gcgcttgccg
1044010440
gtggtgctga ccccggatga agtggttcgc atcctcggtt ttctggaagg cgagcatcgt gtggtgctga ccccggatga agtggttcgc atcctcggtt ttctggaagg cgagcatcgt
1050010500
ttgttcgccc aggactctag ctatagttct agtggttggc tacgtatact ccggaatatt ttgttcgccc aggactctag ctatagttct agtggttggc tacgtatact ccggaatatt
1056010560
aatagatcat ggagataatt aaaatgataa ccatctcgca aataaataag tattttactg aatagatcat ggagataatt aaaatgataa ccatctcgca aataaataag tattttactg
1062010620
ttttcgtaac agttttgtaa taaaaaaacc tataaatatt ccggattatt cataccgtcc ttttcgtaac agttttgtaa taaaaaaacc tataaatatt ccggattatt cataccgtcc
1068010680
caccatcggg cgcggatctc ggtccgaaac catgtcgtac taccatcacc atcaccatca caccatcggg cgcggatctc ggtccgaaac catgtcgtac taccatcacc atcaccatca
1074010740
cgattacgat atcccaacga ccgaaaacct gtattttcag ggcgccatgg gatcc cgattacgat atcccaacga ccgaaaacct gtattttcag ggcgccatgg gatcc
1079510795
<210> 210<210> 210
<211> 10846<211> 10846
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 210<400> 210
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc
240 240
cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca
300 300
tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag
360 360
gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag
420 420
cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga
480 480
gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt
540 540
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt
600 600
ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg
660 660
aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac
720 720
tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc
780 780
aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact
840 840
gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc
900 900
atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct
960 960
gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat
10201020
gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc
10801080
tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc
11401140
tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc
12001200
ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc
12601260
atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc
13201320
ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat
13801380
ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg
14401440
catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc
15001500
ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact
15601560
gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac
16201620
cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg
16801680
aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg
17401740
gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc
18001800
aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat
18601860
gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc
19201920
ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc
19801980
ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg
20402040
gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc
21002100
tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg
21602160
aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg
22202220
actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc
22802280
tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac
23402340
aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg
24002400
ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg
24602460
cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac
25202520
agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc
25802580
tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc
26402640
tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg
27002700
gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct
27602760
gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact
28202820
ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat
28802880
gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc
29402940
agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg
30003000
accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg
30603060
aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag
31203120
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc
31803180
agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag
32403240
gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg
33003300
aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg
33603360
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat
34203420
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc
34803480
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc
35403540
aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt
36003600
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact
36603660
gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact
37203720
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc
37803780
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg
38403840
gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac
39003900
atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag
39603960
atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag
40204020
gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc
40804080
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc
41404140
agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg
42004200
ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag
42604260
gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag
43204320
ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg
43804380
cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc
44404440
tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac
45004500
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac
45604560
agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc
46204620
agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg
46804680
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg
47404740
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg
48004800
accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc
48604860
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct
49204920
gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc
49804980
tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac
50405040
tgattaatta agagcatctt accgccattt attcccatat ttgttctgtt tttcttgatt tgattaatta agagcatctt accgccatt attcccatat ttgttctgtt tttcttgatt
51005100
tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg
51605160
gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc
52205220
gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga
52805280
ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc
53405340
tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt
54005400
tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg
54605460
tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg
55205520
ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc
55805580
gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctgtgcctt gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctgtgcctt
56405640
ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg
57005700
ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt
57605760
gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca
58205820
atagcaggca tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata atagcaggca tgctggggat gcggtgggct ctatggctct agagcatggc tacgtagata
58805880
agtagcatgg cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt agtagcatgg cgggttaatc attaactaca cctgcaggag gaacccctag tgatggagtt
59405940
ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg
60006000
acgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga acgcccgggc ggcctcagtg agcgagcgag cgcgcagctg cctgcagggg cgcgcctcga
60606060
ggcatgcggt accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt ggcatgcggt accaagcttg tcgagaagta ctagaggatc ataatcagcc ataccacatt
61206120
tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa
61806180
aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag
62406240
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt
63006300
gtccaaactc atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag gtccaaactc atcaatgtat cttatcatgt ctggatctga tcactgatat cgcctaggag
63606360
atccgaacca gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat atccgaacca gataagtgaa atctagttcc aaactatttt gtcattttta attttcgtat
64206420
tagcttacga cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt tagcttacga cgctacaccc agttcccatc tattttgtca ctcttcccta aataatcctt
64806480
aaaaactcca tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat aaaaactcca tttccacccc tcccagttcc caactatttt gtccgcccac agcggggcat
65406540
ttttcttcct gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat ttttcttcct gttatgtttt taatcaaaca tcctgccaac tccatgtgac aaaccgtcat
66006600
cttcggctac tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa cttcggctac tttttctctg tcacagaatg aaaatttttc tgtcatctct tcgttattaa
66606660
tgtttgtaat tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc tgtttgtaat tgactgaata tcaacgctta tttgcagcct gaatggcgaa tgggacgcgc
67206720
cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac
67806780
ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg
68406840
ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt
69006900
tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc
69606960
cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct
70207020
tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga
70807080
ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga
71407140
attttaacaa aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg attttaacaa aatattaacg tttacaattt caggtggcac ttttcgggga aatgtgcgcg
72007200
gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat
72607260
aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc
73207320
gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa
73807380
cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac
74407440
tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga
75007500
tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag
75607560
agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca
76207620
cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca
76807680
tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa
77407740
ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc
78007800
tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa
78607860
cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag
79207920
actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct
79807980
ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac
80408040
tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa
81008100
ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt
81608160
aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat
82208220
ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg
82808280
agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc
83408340
ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg
84008400
tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag
84608460
cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact cgcagatacc aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact
85208520
ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg
85808580
gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc
86408640
ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg
87008700
aactgagata cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg aactgagata cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg
87608760
cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag
88208820
ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc
88808880
gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct
89408940
ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc
90009000
ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc
90609060
gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgcctg atgcggtatt
91209120
ttctccttac gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa ttctccttac gcatctgtgc ggtatttcac accgcagacc agccgcgtaa cctggcaaaa
91809180
tcggttacgg ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa tcggttacgg ttgagtaata aatggatgcc ctgcgtaagc gggtgtgggc ggacaataaa
92409240
gtcttaaact gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat gtcttaaact gaacaaaata gatctaaact atgacaataa agtcttaaac tagacagaat
93009300
agttgtaaac tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg agttgtaaac tgaaatcagt ccagttatgc tgtgaaaaag catactggac ttttgttatg
93609360
gctaaagcaa actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt gctaaagcaa actcttcatt ttctgaagtg caaattgccc gtcgtattaa agaggggcgt
94209420
ggccaagggc atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg ggccaagggc atggtaaaga ctatattcgc ggcgttgtga caatttaccg aacaactccg
94809480
cggccgggaa gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat cggccgggaa gccgatctcg gcttgaacga attgttaggt ggcggtactt gggtcgatat
95409540
caaagtgcat cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt caaagtgcat cacttcttcc cgtatgccca actttgtata gagagccact gcgggatcgt
96009600
caccgtaatc tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga caccgtaatc tgcttgcacg tagatcacat aagcaccaag cgcgttggcc tcatgcttga
96609660
ggagattgat gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat ggagattgat gagcgcggtg gcaatgccct gcctccggtg ctcgccggag actgcgagat
97209720
catagatata gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag catagatata gatctcacta cgcggctgct caaacctggg cagaacgtaa gccgcgagag
97809780
cgccaacaac cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca cgccaacaac cgcttcttgg tcgaaggcag caagcgcgat gaatgtctta ctacggagca
98409840
agttcccgag gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact agttcccgag gtaatcggag tccggctgat gttgggagta ggtggctacg tctccgaact
99009900
cacgaccgaa aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac cacgaccgaa aagatcaaga gcagcccgca tggatttgac ttggtcaggg ccgagcctac
99609960
atgtgcgaat gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct atgtgcgaat gatgcccata cttgagccac ctaactttgt tttagggcga ctgccctgct
1002010020
gcgtaacatc gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc gcgtaacatc gttgctgctg cgtaacatcg ttgctgctcc ataacatcaa acatcgaccc
1008010080
acggcgtaac gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca acggcgtaac gcgcttgctg cttggatgcc cgaggcatag actgtacaaa aaaacagtca
1014010140
taacaagcca tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg taacaagcca tgaaaaccgc cactgcgccg ttaccaccgc tgcgttcggt caaggttctg
1020010200
gaccagttgc gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat gaccagttgc gtgagcgcat acgctacttg cattacagtt tacgaaccga acaggcttat
1026010260
gtcaactggg ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc gtcaactggg ttcgtgcctt catccgtttc cacggtgtgc gtcacccggc aaccttgggc
1032010320
agcagcgaag tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc agcagcgaag tcgaggcatt tctgtcctgg ctggcgaacg agcgcaaggt ttcggtctcc
1038010380
acgcatcgtc aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat acgcatcgtc aggcattggc ggccttgctg ttcttctacg gcaaggtgct gtgcacggat
1044010440
ctgccctggc ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg ctgccctggc ttcaggagat cggaagacct cggccgtcgc ggcgcttgcc ggtggtgctg
1050010500
accccggatg aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc accccggatg aagtggttcg catcctcggt tttctggaag gcgagcatcg tttgttcgcc
1056010560
caggactcta gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca caggactcta gctatagttc tagtggttgg ctacgtatac tccggaatat taatagatca
1062010620
tggagataat taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa tggagataat taaaatgata accatctcgc aaataaataa gtattttact gttttcgtaa
1068010680
cagttttgta ataaaaaaac ctataaatat tccggattat tcataccgtc ccaccatcgg cagttttgta ataaaaaaac ctataaatat tccggattat tcataccgtc caccatcgg
1074010740
gcgcggatct cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga gcgcggatct cggtccgaaa ccatgtcgta ctaccatcac catcaccatc acgattacga
1080010800
tatcccaacg accgaaaacc tgtattttca gggcgccatg ggatcc tatcccaacg accgaaaacc tgtattttca gggcgccatg ggatcc
1084610846
<210> 211<210> 211
<211> 10923<211> 10923
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 211<400> 211
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc
240 240
cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca
300 300
tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag
360 360
gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag
420 420
cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga
480 480
gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt
540 540
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt
600 600
ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg ggtttaaacg ccgccaccat gcagattgag ctgagcacct gcttcttcct gtgcctgctg
660 660
aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac aggttctgct tctctgccac caggagatac tacctggggg ctgtggagct gagctgggac
720 720
tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc tacatgcagt ctgacctggg ggagctgcct gtggatgcca ggttcccccc cagagtgccc
780 780
aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact aagagcttcc ccttcaacac ctctgtggtg tacaagaaga ccctgtttgt ggagttcact
840 840
gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc gaccacctgt tcaacattgc caagcccagg cccccctgga tgggcctgct gggccccacc
900 900
atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct atccaggctg aggtgtatga cactgtggtg atcaccctga agaacatggc cagccaccct
960 960
gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat gtgagcctgc atgctgtggg ggtgagctac tggaaggcct ctgagggggc tgagtatgat
10201020
gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc gaccagacca gccagaggga gaaggaggat gacaaggtgt tccctggggg cagccacacc
10801080
tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc tatgtgtggc aggtgctgaa ggagaatggc cccatggcct ctgaccccct gtgcctgacc
11401140
tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc tacagctacc tgagccatgt ggacctggtg aaggacctga actctggcct gattggggcc
12001200
ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc ctgctggtgt gcagggaggg cagcctggcc aaggagaaga cccagaccct gcacaagttc
12601260
atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc atcctgctgt ttgctgtgtt tgatgagggc aagagctggc actctgaaac caagaacagc
13201320
ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat ctgatgcagg acagggatgc tgcctctgcc agggcctggc ccaagatgca cactgtgaat
13801380
ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg ggctatgtga acaggagcct gcctggcctg attggctgcc acaggaagtc tgtgtactgg
14401440
catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc catgtgattg gcatgggcac cacccctgag gtgcacagca tcttcctgga gggccacacc
15001500
ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact ttcctggtca ggaaccacag gcaggccagc ctggagatca gccccatcac cttcctgact
15601560
gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac gcccagaccc tgctgatgga cctgggccag ttcctgctgt tctgccacat cagcagccac
16201620
cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg cagcatgatg gcatggaggc ctatgtgaag gtggacagct gccctgagga gccccagctg
16801680
aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg aggatgaaga acaatgagga ggctgaggac tatgatgatg acctgactga ctctgagatg
17401740
gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc gatgtggtga ggtttgatga tgacaacagc cccagcttca tccagatcag gtctgtggcc
18001800
aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat aagaagcacc ccaagacctg ggtgcactac attgctgctg aggaggagga ctgggactat
18601860
gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc gcccccctgg tgctggcccc tgatgacagg agctacaaga gccagtacct gaacaatggc
19201920
ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc ccccagagga ttggcaggaa gtacaagaag gtcaggttca tggcctacac tgatgaaacc
19801980
ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg ttcaagacca gggaggccat ccagcatgag tctggcatcc tgggccccct gctgtatggg
20402040
gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc gaggtggggg acaccctgct gatcatcttc aagaaccagg ccagcaggcc ctacaacatc
21002100
tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg tacccccatg gcatcactga tgtgaggccc ctgtacagca ggaggctgcc caagggggtg
21602160
aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg aagcacctga aggacttccc catcctgcct ggggagatct tcaagtacaa gtggactgtg
22202220
actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc actgtggagg atggccccac caagtctgac cccaggtgcc tgaccagata ctacagcagc
22802280
tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac tttgtgaaca tggagaggga cctggcctct ggcctgattg gccccctgct gatctgctac
23402340
aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg aaggagtctg tggaccagag gggcaaccag atcatgtctg acaagaggaa tgtgatcctg
24002400
ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg ttctctgtgt ttgatgagaa caggagctgg tacctgactg agaacatcca gaggttcctg
24602460
cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac cccaaccctg ctggggtgca gctggaggac cctgagttcc aggccagcaa catcatgcac
25202520
agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc agcatcaatg gctatgtgtt tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc
25802580
tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc tactggtaca tcctgagcat tggggcccag actgacttcc tgtctgtgtt cttctctggc
26402640
tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg tacaccttca agcacaagat ggtgtatgag gacaccctga ccctgttccc cttctctggg
27002700
gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct gagactgtgt tcatgagcat ggagaaccct ggcctgtgga ttctgggctg ccacaactct
27602760
gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact gacttcagga acaggggcat gactgccctg ctgaaagtct ccagctgtga caagaacact
28202820
ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat ggggactact atgaggacag ctatgaggac atctctgcct acctgctgag caagaacaat
28802880
gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc gccattgagc ccaggagctt cagccagaat gccactaatg tgtctaacaa cagcaacacc
29402940
agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg agcaatgaca gcaatgtgtc tcccccagtg ctgaagaggc accagaggga gatcaccagg
30003000
accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg accaccctgc agtctgacca ggaggagatt gactatgatg acaccatctc tgtggagatg
30603060
aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag aagaaggagg actttgacat ctacgacgag gacgagaacc agagccccag gagcttccag
31203120
aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc aagaagacca ggcactactt cattgctgct gtggagaggc tgtgggacta tggcatgagc
31803180
agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag agcagccccc atgtgctgag gaacagggcc cagtctggct ctgtgcccca gttcaagaag
32403240
gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg gtggtgttcc aggagttcac tgatggcagc ttcacccagc ccctgtacag aggggagctg
33003300
aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg aatgagcacc tgggcctgct gggcccctac atcagggctg aggtggagga caacatcatg
33603360
gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat gtgaccttca ggaaccaggc cagcaggccc tacagcttct acagcagcct gatcagctat
34203420
gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc gaggaggacc agaggcaggg ggctgagccc aggaagaact ttgtgaagcc caatgaaacc
34803480
aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc aagacctact tctggaaggt gcagcaccac atggccccca ccaaggatga gtttgactgc
35403540
aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt aaggcctggg cctacttctc tgatgtggac ctggagaagg atgtgcactc tggcctgatt
36003600
ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact ggccccctgc tggtgtgcca caccaacacc ctgaaccctg cccatggcag gcaggtgact
36603660
gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa ccaagagctg gtacttcact
37203720
gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc gagaacatgg agaggaactg cagggccccc tgcaacatcc agatggagga ccccaccttc
37803780
aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg aaggagaact acaggttcca tgccatcaat ggctacatca tggacaccct gcctggcctg
38403840
gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac gtgatggccc aggaccagag gatcaggtgg tacctgctga gcatgggcag caatgagaac
39003900
atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag atccacagca tccacttctc tggccatgtg ttcactgtga ggaagaagga ggagtacaag
39603960
atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag atggccctgt acaacctgta ccctggggtg tttgagactg tggagatgct gcccagcaag
40204020
gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc gctggcatct ggagggtgga gtgcctgatt ggggagcacc tgcatgctgg catgagcacc
40804080
ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc ctgttcctgg tgtacagcaa caagtgccag acccccctgg gcatggcctc tggccacatc
41404140
agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg agggacttcc agatcactgc ctctggccag tatggccagt gggcccccaa gctggccagg
42004200
ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag ctgcactact ctggcagcat caatgcctgg agcaccaagg agcccttcag ctggatcaag
42604260
gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag gtggacctgc tggcccccat gatcatccat ggcatcaaga cccagggggc caggcagaag
43204320
ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg ttcagcagcc tgtacatcag ccagttcatc atcatgtaca gcctggatgg caagaagtgg
43804380
cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc cagacctaca ggggcaacag cactggcacc ctgatggtgt tctttggcaa tgtggacagc
44404440
tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac tctggcatca agcacaacat cttcaacccc cccatcattg ccagatacat caggctgcac
45004500
cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac cccacccact acagcatcag gagcaccctg aggatggagc tgatgggctg tgacctgaac
45604560
agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc agctgcagca tgcccctggg catggagagc aaggccatct ctgatgccca gatcactgcc
46204620
agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg agcagctact tcaccaacat gtttgccacc tggagcccca gcaaggccag gctgcacctg
46804680
cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg cagggcagga gcaatgcctg gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg
47404740
gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg gacttccaga agaccatgaa ggtgactggg gtgaccaccc agggggtgaa gagcctgctg
48004800
accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc accagcatgt atgtgaagga gttcctgatc agcagcagcc aggatggcca ccagtggacc
48604860
ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca accaggacag cttcacccct
49204920
gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc gtggtgaaca gcctggaccc ccccctgctg accagatacc tgaggattca cccccagagc
49804980
tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac tgggtgcacc agattgccct gaggatggag gtgctgggct gtgaggccca ggacctgtac
50405040
tgattaatta agagcatctt accgccattt attcccatat ttgttctgtt tttcttgatt tgattaatta agagcatctt accgccatt attcccatat ttgttctgtt tttcttgatt
51005100
tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg tgggtataca tttaaatgtt aataaaacaa aatggtgggg caatcattta catttttagg
51605160
gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc gatatgtaat tactagttca ggtgtattgc cacaagacaa acatgttaag aaactttccc
52205220
gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga gttatttacg ctctgttcct gttaatcaac ctctggatta caaaatttgt gaaagattga
52805280
ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc ctgatattct taactatgtt gctcctttta cgctgtgtgg atatgctgct ttatagcctc
53405340
tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt tgtatctagc tattgcttcc cgtacggctt tcgttttctc ctccttgtat aaatcctggt
54005400
tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg tgctgtctct tttagaggag ttgtggcccg ttgtccgtca acgtggcgtg gtgtgctctg
54605460
tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg tgtttgctga cgcaaccccc actggctggg gcattgccac cacctgtcaa ctcctttctg
55205520
ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc ggactttcgc tttccccctc ccgatcgcca cggcagaact catcgccgcc tgccttgccc
55805580
gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctccataaa gctgctggac aggggctagg ttgctgggca ctgataattc cgtggtgttg tctccataaa
56405640
gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca taaagtagga gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca taaagtagga
57005700
aacactacat gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc aacactacat gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc
57605760
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc
58205820
gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg
58805880
ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga ggaggattgg gaagacaata gcaggcatgc tggggatgcg gtgggctcta tggctctaga
59405940
gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa gcatggctac gtagataagt agcatggcgg gttaatcatt aactacacct gcaggaggaa
60006000
cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg cccctagtga tggagttggc cactccctct ctgcgcgctc gctcgctcac tgaggccggg
60606060
cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct cgaccaaagg tcgcccgacg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct
61206120
gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata gcaggggcgc gcctcgaggc atgcggtacc aagcttgtcg agaagtacta gaggatcata
61806180
atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc
62406240
ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat
63006300
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg
63606360
cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca
64206420
ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc ctgatatcgc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc
64806480
atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc
65406540
ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc
66006600
cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc
66606660
atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt atgtgacaaa ccgtcatctt cggctacttt ttctctgtca cagaatgaaa atttttctgt
67206720
catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa catctcttcg ttattaatgt ttgtaattga ctgaatatca acgcttattt gcagcctgaa
67806780
tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg
68406840
cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc
69006900
ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg
69606960
gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc
70207020
acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt
70807080
ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc
71407140
ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta
72007200
acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt acaaaaattt aacgcgaatt ttaacaaaat attaacgttt acaatttcag gtggcacttt
72607260
tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta
73207320
tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat
73807380
gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt
74407440
ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg
75007500
agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga
75607560
agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg
76207620
tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt
76807680
tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg
77407740
cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg
78007800
aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga
78607860
tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc
79207920
tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc
79807980
ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc
80408040
ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg
81008100
cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac
81608160
gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc
82208220
actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt actgattaag cattggtaac tgtcagacca agtttactca tatatacttt agattgattt
82808280
aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac
83408340
caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa
84008400
aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc
84608460
accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt
85208520
aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg
85808580
ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc
86408640
agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt
87008700
accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga
87608760
gcgaacgacc tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct gcgaacgacc tacaccgaac tgagatacct acagcgtgag cattgagaaa gcgccacgct
88208820
tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg
88808880
cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca
89408940
cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa
90009000
cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt
90609060
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga
91209120
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga
91809180
gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcagaccagc
92409240
cgcgtaacct ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg cgcgtaacct ggcaaaatcg gttacggttg agtaataaat ggatgccctg cgtaagcggg
93009300
tgtgggcgga caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt tgtgggcgga caataaagtc ttaaactgaa caaaatagat ctaaactatg acaataaagt
93609360
cttaaactag acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat cttaaactag acagaatagt tgtaaactga aatcagtcca gttatgctgt gaaaaagcat
94209420
actggacttt tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc actggacttt tgttatggct aaagcaaact cttcattttc tgaagtgcaa attgcccgtc
94809480
gtattaaaga ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa gtattaaaga ggggcgtggc caagggcatg gtaaagacta tattcgcggc gttgtgacaa
95409540
tttaccgaac aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc tttaccgaac aactccgcgg ccgggaagcc gatctcggct tgaacgaatt gttaggtggc
96009600
ggtacttggg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag ggtacttggg tcgatatcaa agtgcatcac ttcttcccgt atgcccaact ttgtatagag
96609660
agccactgcg ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc agccactgcg ggatcgtcac cgtaatctgc ttgcacgtag atcacataag caccaagcgc
97209720
gttggcctca tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc gttggcctca tgcttgagga gattgatgag cgcggtggca atgccctgcc tccggtgctc
97809780
gccggagact gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag gccggagact gcgagatcat agatatagat ctcactacgc ggctgctcaa acctgggcag
98409840
aacgtaagcc gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa aacgtaagcc gcgagagcgc caacaaccgc ttcttggtcg aaggcagcaa gcgcgatgaa
99009900
tgtcttacta cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt tgtcttacta cggagcaagt tcccgaggta atcggagtcc ggctgatgtt gggagtaggt
99609960
ggctacgtct ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg ggctacgtct ccgaactcac gaccgaaaag atcaagagca gcccgcatgg atttgacttg
1002010020
gtcagggccg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt gtcagggccg agcctacatg tgcgaatgat gcccatactt gagccaccta actttgtttt
1008010080
agggcgactg ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata agggcgactg ccctgctgcg taacatcgtt gctgctgcgt aacatcgttg ctgctccata
1014010140
acatcaaaca tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact acatcaaaca tcgacccacg gcgtaacgcg cttgctgctt ggatgcccga ggcatagact
1020010200
gtacaaaaaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc gtacaaaaaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc
1026010260
gttcggtcaa ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac gttcggtcaa ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagtttac
1032010320
gaaccgaaca ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc gaaccgaaca ggcttatgtc aactgggttc gtgccttcat ccgtttccac ggtgtgcgtc
1038010380
acccggcaac cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc acccggcaac cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc
1044010440
gcaaggtttc ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca gcaaggtttc ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca
1050010500
aggtgctgtg cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc aggtgctgtg cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc
1056010560
gcttgccggt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg gcttgccggt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg
1062010620
agcatcgttt gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc agcatcgttt gttcgcccag gactctagct atagttctag tggttggcta cgtatactcc
1068010680
ggaatattaa tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ggaatattaa tagatcatgg agataattaa aatgataacc atctcgcaaa taaataagta
1074010740
ttttactgtt ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca ttttactgtt ttcgtaacag ttttgtaata aaaaaaccta taaatattcc ggattattca
1080010800
taccgtccca ccatcgggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat taccgtccca ccatcggggcg cggatctcgg tccgaaacca tgtcgtacta ccatcaccat
1086010860
caccatcacg attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga caccatcacg attacgatat cccaacgacc gaaaacctgt attttcaggg cgccatggga
1092010920
tcc tcc
1092310923
<210> 212<210> 212
<211> 12404<211> 12404
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 212<400> 212
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gagcggccgc tcaatattgg ccattagcca tattattcat atctacgtag ccatgctcta gagcggccgc tcaatattgg ccattagcca tattattcat
240 240
tggttatata gcataaatca atattggcta ttggccattg catacgttgt atctatatca tggttatata gcataaatca atattggcta ttggccattg catacgttgt atctatatca
300 300
taatatgtac atttatattg gctcatgtcc aatatgaccg ccatgttggc attgattatt taatatgtac atttatattg gctcatgtcc aatatgaccg ccatgttggc attgattatt
360 360
gactagttat taatagtaat caattacggg gtcattagtt catagcccat atatggagtt gactagttat taatagtaat caattacggg gtcattagtt catagcccat atatggagtt
420 420
ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg acccccgccc ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg acccccgccc
480 480
attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt tccattgacg attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt tccattgacg
540 540
tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag tgtatcatat
600 600
gccaagtccg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attatgccca gccaagtccg ccccctattg acgtcaatga cggtaaatgg cccgcctggc attatgccca
660 660
gtacatgacc ttacgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat gtacatgacc ttacgggact ttcctacttg gcagtacatc tacgtattag tcatcgctat
720 720
taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc taccatggtc gaggtgagcc ccacgttctg cttcactctc cccatctccc ccccctcccc
780 780
acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg acccccaatt ttgtatttat ttatttttta attattttgt gcagcgatgg gggcgggggg
840 840
gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg gggggggggg cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg
900 900
gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag gagaggtgcg gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag
960 960
gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac gcggcggcgg cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgac
10201020
gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac
10801080
tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt
11401140
agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc
12001200
tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt gtgtgtgtgc
12601260
gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg
13201320
cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc
13801380
ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtggggggggt
14401440
gagcaggggg tgtgggcgcg gcggtcgggc tgtaaccccc ccctgcaccc ccctccccga gagcagggg tgtgggcgcg gcggtcgggc tgtaaccccc ccctgcaccc ccctccccga
15001500
gttgctgagc acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gttgctgagc acggcccggc ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc
15601560
gccgtgccgg gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccgtgccgg gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg
16201620
gccggggagg gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gccggggagg gctcggggga ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc
16801680
gcggcgagcc gcagccattg ccttttatgg taatcgtgcg agagggcgca gggacttcct gcggcgagcc gcagccattg ccttttatgg taatcgtgcg agaggcgca gggacttcct
17401740
ttgtcccaaa tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg ttgtcccaaa tctgtgcgga gccgaaatct gggaggcgcc gccgcacccc ctctagcggg
18001800
cgcggggcga agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg cgcggggcga agcggtgcgg cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg
18601860
tcgccgcgcc gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc tcgccgcgcc gccgtcccct tctccctctc cagcctcggg gctgtccgcg gggggacggc
19201920
tgccttcggg ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcggctct tgccttcggg ggggacgggg cagggcgggg ttcggcttct ggcgtgtgac cggcggctct
19801980
agagcctctg ctaaccatgt tttagccttc ttctttttcc tacagctcct gggcaacgtg agagcctctg ctaaccatgt tttagccttc ttctttttcc tacagctcct gggcaacgtg
20402040
ctggttattg tgctgtctca tcatttgtcg acagaattcc tcgaagatcc gaaggggttc ctggttattg tgctgtctca tcatttgtcg acagaattcc tcgaagatcc gaaggggttc
21002100
aagcttggca ttccggtact gttggtaaag ccagtttaaa cgccgccacc atgcagatcg aagcttggca ttccggtact gttggtaaag ccagtttaaa cgccgccacc atgcagatcg
21602160
agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc accagaagat agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc accagagat
22202220
attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg ggagagctgc attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg ggagagctgc
22802280
ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac acctccgtgg ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac acctccgtgg
23402340
tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc gccaagcctc tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc gccaagcctc
24002400
ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gacaccgtgg ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gacaccgtgg
24602460
tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg ggagtgtctt tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg ggagtgtctt
25202520
attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga gagaaagagg attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga gagaaagagg
25802580
acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg aaagaaaacg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg aaagaaaacg
26402640
gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac gtggacctgg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac gtggacctgg
27002700
tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa ggcagcctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa ggcagcctgg
27602760
ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ttcgacgagg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ttcgacgagg
28202820
gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat gccgcctctg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat gccgcctctg
28802880
ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc ctgcctggac ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc ctgcctggac
29402940
tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc acaacacctg tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc acaacacctg
30003000
aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac agacaggcca aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac agacaggcca
30603060
gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg gatctgggcc gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg gatctgggcc
31203120
agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gcctacgtga agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gcctacgtga
31803180
aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gaagccgagg aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gaagccgagg
32403240
actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gacgataaca actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gacgataaca
33003300
gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc tgggtgcact gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc tgggtgcact
33603360
atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc cctgacgaca atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc cctgacgaca
34203420
gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg aagtataaga gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg aagtataaga
34803480
aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc atccagcacg aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc atccagcacg
35403540
agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg ctgatcatct agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg ctgatcatct
36003600
tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc gatgtgcggc tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc gatgtgcggc
36603660
ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc cctatcctgc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc cctatcctgc
37203720
ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc accaagagcg ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc accaagagcg
37803780
accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc gacctggcca accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc gacctggcca
38403840
gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag cggggcaacc gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag cggggcaacc
39003900
agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag aaccggtcct agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag aaccggtcct
39603960
ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg caactggaag ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg caactggaag
40204020
atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg ttcgacagcc atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg ttcgacagcc
40804080
tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc attggcgccc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc attggcgccc
41404140
agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag atggtgtacg agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag atggtgtacg
42004200
aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggaaaacc aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggaaaacc
42604260
ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atgacagccc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atgacagccc
43204320
tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac agctatgagg tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac agctatgagg
43804380
acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc ttcagccaga acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc ttcagccaga
44404440
atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg cagagcgacc atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg cagagcgacc
45004500
aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa gatttcgaca aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa gatttcgaca
45604560
tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc cggcactact tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc cggcactact
46204620
tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct cacgtgctga tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct cacgtgctga
46804680
gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc caagagttca gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc caagagttca
47404740
ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat ctgggcctgc ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat ctgggcctgc
48004800
tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc cggaatcagg tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc cggaatcagg
48604860
ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac cagagacagg ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac cagagacagg
49204920
gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac ttttggaagg gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac ttttggaagg
49804980
tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg gcctacttct tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg gcctacttct
50405040
ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg cttgtgtgcc ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg cttgtgtgcc
51005100
acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag ttcgccctgt acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag ttcgccctgt
51605160
tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg gaacggaact tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg gaacggaact
52205220
gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac taccggttcc gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac taccggttcc
52805280
acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc caggatcaga acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc caggatcaga
53405340
gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc atccacttca gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc atccacttca
54005400
gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg tacaatctgt gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg tacaatctgt
54605460
accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt tggagagtgg accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt tggagagtgg
55205520
aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg gtgtacagca aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg gtgtacagca
55805580
acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc cagatcaccg acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc cagatcaccg
56405640
cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac agcggcagca cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac agcggcagca
57005700
tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg ctggctccca tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg ctggctccca
57605760
tgatcatcca cggaatcaag acccagggcg ccagacagaa gttcagcagc ctgtacatca tgatcatcca cggaatcaag acccagggcg cgacagaa gttcagcagc ctgtacatca
58205820
gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac agaggcaaca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac agaggcaaca
58805880
gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt aagcacaaca gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt aagcacaaca
59405940
tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac tacagcatcc tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac tacagcatcc
60006000
ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct atgcccctcg ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct atgcccctcg
60606060
gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac ttcaccaaca gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac ttcaccaaca
61206120
tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga agcaacgctt tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga agcaacgctt
61806180
ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa aagaccatga ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa aagaccatga
62406240
aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg tacgtgaaag aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg tacgtgaaag
63006300
agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc cagaacggca agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc cagaacggca
63606360
aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat tctctggacc aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat tctctggacc
64206420
ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac cagatcgctc ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac cagatcgctc
64806480
tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctagttaatt aagagcatct tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctagttaatt aagagcatct
65406540
taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac atttaaatgt taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac atttaaatgt
66006600
taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa ttactagttc taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa ttactagttc
66606660
aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac gctctgttcc aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac gctctgttcc
67206720
tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc ttaactatgt tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc ttaactatgt
67806780
tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag ctattgcttc tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag ctattgcttc
68406840
ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc ttttagagga ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc ttttagagga
69006900
gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg acgcaacccc
69606960
cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg ctttccccct cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg ctttccccct
70207020
cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga caggggctag cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga caggggctag
70807080
gttgctgggc actgataatt ccgtggtgtt gtctccataa agtaggaaac actacacgat gttgctgggc actgataatt ccgtggtgtt gtctccataa agtaggaaac actacacgat
71407140
tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca tgtgccttct tccataaagt aggaaacact acatcactcc ataaagtagg aaacactaca tgtgccttct
72007200
agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc agttgccagc catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc
72607260
actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt actcccactg tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt
73207320
cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat cattctattc tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat
73807380
agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag agcaggcatg ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag
74407440
tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg tagcatggcg ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg
75007500
ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac ccactccctc tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac
75607560
gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg
76207620
catgcggtac caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg catgcggtac caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg
76807680
tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa
77407740
tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca
78007800
atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt
78607860
ccaaactcat caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat ccaaactcat caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat
79207920
ccgaaccaga taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta ccgaaccaga taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta
79807980
gcttacgacg ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa gcttacgacg ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa
80408040
aaactccatt tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt aaactccatt tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt
81008100
ttcttcctgt tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct ttcttcctgt tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct
81608160
tcggctactt tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg tcggctactt tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg
82208220
tttgtaattg actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc tttgtaattg actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc
82808280
tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt
83408340
gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc
84008400
ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta
84608460
cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc
85208520
tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg
85808580
ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt
86408640
ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat
87008700
tttaacaaaa tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga tttaacaaaa tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga
87608760
acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa
88208820
ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt
88808880
gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg
89408940
ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg
90009000
gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg
90609060
agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag
91209120
caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca
91809180
gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg
92409240
agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc
93009300
gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg
93609360
aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg
94209420
ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca attaatagac
94809480
tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg
95409540
tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg
96009600
gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact
96609660
atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa
97209720
ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca tttttaattt
97809780
aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag
98409840
ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct
99009900
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt
99609960
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg
1002010020
cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct
1008010080
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc
1014010140
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg
1020010200
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa
1026010260
ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg
1032010320
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccagga
1038010380
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga
1044010440
tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt
1050010500
ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct
1056010560
gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga
1062010620
acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt
1068010680
ctccttacgc atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc ctccttacgc atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc
1074010740
ggttacggtt gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt ggttacggtt gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt
1080010800
cttaaactga acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag cttaaactga acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag
1086010860
ttgtaaactg aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc ttgtaaactg aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc
1092010920
taaagcaaac tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg taaagcaaac tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg
1098010980
ccaagggcat ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg ccaagggcat ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg
1104011040
gccgggaagc cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca gccgggaagc cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca
1110011100
aagtgcatca cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca aagtgcatca cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca
1116011160
ccgtaatctg cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg ccgtaatctg cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg
1122011220
agattgatga gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca agattgatga gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca
1128011280
tagatataga tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg tagatataga tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg
1134011340
ccaacaaccg cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag ccaacaaccg cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag
1140011400
ttcccgaggt aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca ttcccgaggt aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca
1146011460
cgaccgaaaa gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat cgaccgaaaa gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat
1152011520
gtgcgaatga tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc gtgcgaatga tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc
1158011580
gtaacatcgt tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac gtaacatcgt tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac
1164011640
ggcgtaacgc gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata ggcgtaacgc gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata
1170011700
acaagccatg aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga acaagccatg aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga
1176011760
ccagttgcgt gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt ccagttgcgt gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt
1182011820
caactgggtt cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag caactgggtt cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag
1188011880
cagcgaagtc gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac cagcgaagtc gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac
1194011940
gcatcgtcag gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct gcatcgtcag gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct
1200012000
gccctggctt caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac gccctggctt caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac
1206012060
cccggatgaa gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca cccggatgaa gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca
1212012120
ggactctagc tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg ggactctagc tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg
1218012180
gagataatta aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca gagataatta aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca
1224012240
gttttgtaat aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc gttttgtaat aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc
1230012300
gcggatctcg gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata gcggatctcg gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata
1236012360
tcccaacgac cgaaaacctg tattttcagg gcgccatggg atcc tcccaacgac cgaaaacctg tattttcagg gcgccatggg atcc
1240412404
<210> 213<210> 213
<211> 11356<211> 11356
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 213<400> 213
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gagagtcaat gggaaaaacc cattggagcc aagtacactg atctacgtag ccatgctcta gagagtcaat gggaaaaacc cattggagcc aagtacactg
240 240
actcaatagg gactttccat tgggttttgc ccagtacata aggtcaatag ggggtgagtc actcaatagg gactttccat tgggttttgc ccagtacata aggtcaatag ggggtgagtc
300 300
aacaggaaag tcccattgga gccaagtaca ttgagtcaat agggactttc caatgggttt aacaggaaag tcccattgga gccaagtaca ttgagtcaat agggactttc caatgggttt
360 360
tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt ttttcccatt actgacatgt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt ttttcccatt actgacatgt
420 420
atactgagtc attagggact ttccaatggg ttttgcccag tacataaggt caataggggt atactgagtc attagggact ttccaatggg ttttgcccag tacataaggt caataggggt
480 480
gaatcaacag gaaagtccca ttggagccaa gtacactgag tcaataggga ctttccattg gaatcaacag gaaagtccca ttggagccaa gtacactgag tcaataggga ctttccatg
540 540
ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tgggtttttc ccattattgg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tgggtttttc ccattattgg
600 600
cacatacata aggtcaatag gggtgactag tggagaagag catgcttgag ggctgagtgc cacatacata aggtcaatag gggtgactag tggagaagag catgcttgag ggctgagtgc
660 660
ccctcagtgg gcagagagca catggcccac agtccctgag aagttggggg gaggggtggg ccctcagtgg gcagagagca catggcccac agtccctgag aagttggggg gaggggtggg
720 720
caattgaact ggtgcctaga gaaggtgggg cttgggtaaa ctgggaaagt gatgtggtgt caattgaact ggtgcctaga gaaggtgggg cttgggtaaa ctgggaaagt gatgtggtgt
780 780
actggctcca cctttttccc cagggtgggg gagaaccata tataagtgca gtagtctctg actggctcca cctttttccc cagggtgggg gagaaccata tataagtgca gtagtctctg
840 840
tgaacattca agcttctgcc ttctccctcc tgtgagtttg gtaagtcact gactgtctat tgaacattca agcttctgcc ttctccctcc tgtgagtttg gtaagtcact gactgtctat
900 900
gcctgggaaa gggtgggcag gagatggggc agtgcaggaa aagtggcact atgaaccctg gcctgggaaa gggtggggcag gagatggggc agtgcaggaa aagtggcact atgaaccctg
960 960
cagccctaga caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacag cagccctaga caattgtact aaccttcttc tctttcctct cctgacaggt tggtgtacag
10201020
tagcttccgt ttaaacgccg ccaccatgca gattgagctg agcacctgct tcttcctgtg tagcttccgt ttaaacgccg ccaccatgca gattgagctg agcacctgct tcttcctgtg
10801080
cctgctgagg ttctgcttct ctgccaccag gagatactac ctgggggctg tggagctgag cctgctgagg ttctgcttct ctgccaccag gagatactac ctggggggctg tggagctgag
11401140
ctgggactac atgcagtctg acctggggga gctgcctgtg gatgccaggt tcccccccag ctgggactac atgcagtctg acctggggga gctgcctgtg gatgccaggt tcccccccag
12001200
agtgcccaag agcttcccct tcaacacctc tgtggtgtac aagaagaccc tgtttgtgga agtgcccaag agcttcccct tcaacacctc tgtggtgtac aagaagaccc tgtttgtgga
12601260
gttcactgac cacctgttca acattgccaa gcccaggccc ccctggatgg gcctgctggg gttcactgac cacctgttca acattgccaa gcccaggccc ccctggatgg gcctgctggg
13201320
ccccaccatc caggctgagg tgtatgacac tgtggtgatc accctgaaga acatggccag ccccaccatc caggctgagg tgtatgacac tgtggtgatc accctgaaga acatggccag
13801380
ccaccctgtg agcctgcatg ctgtgggggt gagctactgg aaggcctctg agggggctga ccaccctgtg agcctgcatg ctgtgggggt gagctactgg aaggcctctg aggggctga
14401440
gtatgatgac cagaccagcc agagggagaa ggaggatgac aaggtgttcc ctgggggcag gtatgatgac cagaccagcc agagggagaa ggaggatgac aaggtgttcc ctggggggcag
15001500
ccacacctat gtgtggcagg tgctgaagga gaatggcccc atggcctctg accccctgtg cccacacctat gtgtggcagg tgctgaagga gaatggcccc atggcctctg accccctgtg
15601560
cctgacctac agctacctga gccatgtgga cctggtgaag gacctgaact ctggcctgat cctgacctac agctacctga gccatgtgga cctggtgaag gacctgaact ctggcctgat
16201620
tggggccctg ctggtgtgca gggagggcag cctggccaag gagaagaccc agaccctgca tggggccctg ctggtgtgca gggagggcag cctggccaag gagaagaccc agaccctgca
16801680
caagttcatc ctgctgtttg ctgtgtttga tgagggcaag agctggcact ctgaaaccaa caagttcatc ctgctgtttg ctgtgtttga tgagggcaag agctggcact ctgaaaccaa
17401740
gaacagcctg atgcaggaca gggatgctgc ctctgccagg gcctggccca agatgcacac gaacagcctg atgcaggaca gggatgctgc ctctgccagg gcctggccca agatgcacac
18001800
tgtgaatggc tatgtgaaca ggagcctgcc tggcctgatt ggctgccaca ggaagtctgt tgtgaatggc tatgtgaaca ggagcctgcc tggcctgatt ggctgccaca ggaagtctgt
18601860
gtactggcat gtgattggca tgggcaccac ccctgaggtg cacagcatct tcctggaggg gtactggcat gtgattggca tgggcaccac ccctgaggtg cacagcatct tcctggaggg
19201920
ccacaccttc ctggtcagga accacaggca ggccagcctg gagatcagcc ccatcacctt cccacaccttc ctggtcagga accacaggca ggccagcctg gagatcagcc ccatcacctt
19801980
cctgactgcc cagaccctgc tgatggacct gggccagttc ctgctgttct gccacatcag cctgactgcc cagaccctgc tgatggacct gggccagttc ctgctgttct gccacatcag
20402040
cagccaccag catgatggca tggaggccta tgtgaaggtg gacagctgcc ctgaggagcc cagccaccag catgatggca tggaggccta tgtgaaggtg gacagctgcc ctgaggagcc
21002100
ccagctgagg atgaagaaca atgaggaggc tgaggactat gatgatgacc tgactgactc ccagctgagg atgaagaaca atgaggaggc tgaggactat gatgatgacc tgactgactc
21602160
tgagatggat gtggtgaggt ttgatgatga caacagcccc agcttcatcc agatcaggtc tgagatggat gtggtgaggt ttgatgatga caacagcccc agcttcatcc agatcaggtc
22202220
tgtggccaag aagcacccca agacctgggt gcactacatt gctgctgagg aggaggactg tgtggccaag aagcacccca agacctgggt gcactacatt gctgctgagg aggaggactg
22802280
ggactatgcc cccctggtgc tggcccctga tgacaggagc tacaagagcc agtacctgaa ggactatgcc cccctggtgc tggcccctga tgacaggagc tacaagagcc agtacctgaa
23402340
caatggcccc cagaggattg gcaggaagta caagaaggtc aggttcatgg cctacactga caatggcccc cagaggattg gcaggaagta caagaaggtc aggttcatgg cctacactga
24002400
tgaaaccttc aagaccaggg aggccatcca gcatgagtct ggcatcctgg gccccctgct tgaaaccttc aagaccaggg aggccatcca gcatgagtct ggcatcctgg gccccctgct
24602460
gtatggggag gtgggggaca ccctgctgat catcttcaag aaccaggcca gcaggcccta gtatggggag gtgggggaca ccctgctgat catcttcaag aaccaggcca gcaggcccta
25202520
caacatctac ccccatggca tcactgatgt gaggcccctg tacagcagga ggctgcccaa caacatctac ccccatggca tcactgatgt gaggcccctg tacagcagga ggctgcccaa
25802580
gggggtgaag cacctgaagg acttccccat cctgcctggg gagatcttca agtacaagtg gggggtgaag cacctgaagg acttccccat cctgcctggg gagatcttca agtacaagtg
26402640
gactgtgact gtggaggatg gccccaccaa gtctgacccc aggtgcctga ccagatacta gactgtgact gtggaggatg gccccaccaa gtctgacccc aggtgcctga ccagatacta
27002700
cagcagcttt gtgaacatgg agagggacct ggcctctggc ctgattggcc ccctgctgat cagcagcttt gtgaacatgg agagggacct ggcctctggc ctgattggcc ccctgctgat
27602760
ctgctacaag gagtctgtgg accagagggg caaccagatc atgtctgaca agaggaatgt ctgctacaag gagtctgtgg accagagggg caaccagatc atgtctgaca agaggaatgt
28202820
gatcctgttc tctgtgtttg atgagaacag gagctggtac ctgactgaga acatccagag gatcctgttc tctgtgtttg atgagaacag gagctggtac ctgactgaga acatccagag
28802880
gttcctgccc aaccctgctg gggtgcagct ggaggaccct gagttccagg ccagcaacat gttcctgccc aaccctgctg gggtgcagct ggaggaccct gagttccagg ccagcaacat
29402940
catgcacagc atcaatggct atgtgtttga cagcctgcag ctgtctgtgt gcctgcatga catgcacagc atcaatggct atgtgtttga cagcctgcag ctgtctgtgt gcctgcatga
30003000
ggtggcctac tggtacatcc tgagcattgg ggcccagact gacttcctgt ctgtgttctt ggtggcctac tggtacatcc tgagcattgg ggcccagact gacttcctgt ctgtgttctt
30603060
ctctggctac accttcaagc acaagatggt gtatgaggac accctgaccc tgttcccctt ctctggctac accttcaagc acaagatggt gtatgaggac accctgaccc tgttcccctt
31203120
ctctggggag actgtgttca tgagcatgga gaaccctggc ctgtggattc tgggctgcca ctctggggag actgtgttca tgagcatgga gaaccctggc ctgtggattc tgggctgcca
31803180
caactctgac ttcaggaaca ggggcatgac tgccctgctg aaagtctcca gctgtgacaa caactctgac ttcaggaaca ggggcatgac tgccctgctg aaagtctcca gctgtgacaa
32403240
gaacactggg gactactatg aggacagcta tgaggacatc tctgcctacc tgctgagcaa gaacactggg gactactatg aggacagcta tgaggacatc tctgcctacc tgctgagcaa
33003300
gaacaatgcc attgagccca ggagcttcag ccagaatgcc actaatgtgt ctaacaacag gaacaatgcc attgagccca ggagcttcag ccagaatgcc actaatgtgt ctaacaacag
33603360
caacaccagc aatgacagca atgtgtctcc cccagtgctg aagaggcacc agagggagat caacaccagc aatgacagca atgtgtctcc cccagtgctg aagaggcacc agagggat
34203420
caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca ccatctctgt caccaggacc accctgcagt ctgaccagga ggagattgac tatgatgaca ccatctctgt
34803480
ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga gccccaggag ggagatgaag aaggaggact ttgacatcta cgacgaggac gagaaccaga gccccaggag
35403540
cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt gggactatgg cttccagaag aagaccaggc actacttcat tgctgctgtg gagaggctgt gggactatgg
36003600
catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg tgccccagtt catgagcagc agcccccatg tgctgaggaa cagggcccag tctggctctg tgccccagtt
36603660
caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc tgtacagagg caagaaggtg gtgttccagg agttcactga tggcagcttc acccagcccc tgtacagagg
37203720
ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg tggaggacaa ggagctgaat gagcacctgg gcctgctggg cccctacatc agggctgagg tggaggacaa
37803780
catcatggtg accttcagga accaggccag caggccctac agcttctaca gcagcctgat catcatggtg accttcagga accaggccag caggccctac agcttctaca gcagcctgat
38403840
cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg tgaagcccaa cagctatgag gaggaccaga ggcagggggc tgagcccagg aagaactttg tgaagcccaa
39003900
tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca aggatgagtt tgaaaccaag acctacttct ggaaggtgca gcaccacatg gcccccacca aggatgagtt
39603960
tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg tgcactctgg tgactgcaag gcctgggcct acttctctga tgtggacctg gagaaggatg tgcactctgg
40204020
cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc atggcaggca cctgattggc cccctgctgg tgtgccacac caacaccctg aaccctgccc atggcaggca
40804080
ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca agagctggta ggtgactgtg caggagtttg ccctgttctt caccatcttt gatgaaacca agagctggta
41404140
cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga tggaggaccc cttcactgag aacatggaga ggaactgcag ggccccctgc aacatccaga tggaggaccc
42004200
caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg acaccctgcc caccttcaag gagaactaca ggttccatgc catcaatggc tacatcatgg acaccctgcc
42604260
tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca tgggcagcaa tggcctggtg atggcccagg accagaggat caggtggtac ctgctgagca tgggcagcaa
43204320
tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga agaaggagga tgagaacatc cacagcatcc acttctctgg ccatgtgttc actgtgagga agaaggagga
43804380
gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg agatgctgcc gtacaagatg gccctgtaca acctgtaccc tggggtgttt gagactgtgg agatgctgcc
44404440
cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc atgctggcat cagcaaggct ggcatctgga gggtggagtg cctgattggg gagcacctgc atgctggcat
45004500
gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggcctctgg gagcaccctg ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggcctctgg
45604560
ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg cccccaagct ccacatcagg gacttccaga tcactgcctc tggccagtat ggccagtggg cccccaagct
46204620
ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc ccttcagctg ggccaggctg cactactctg gcagcatcaa tgcctggagc accaaggagc ccttcagctg
46804680
gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc agggggccag gatcaaggtg gacctgctgg cccccatgat catccatggc atcaagaccc aggggggccag
47404740
gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc tggatggcaa gcagaagttc agcagcctgt acatcagcca gttcatcatc atgtacagcc tggatggcaa
48004800
gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct ttggcaatgt gaagtggcag acctacaggg gcaacagcac tggcaccctg atggtgttct ttggcaatgt
48604860
ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca gatacatcag ggacagctct ggcatcaagc acaacatctt caaccccccc atcattgcca gatacatcag
49204920
gctgcacccc acccactaca gcatcaggag caccctgagg atggagctga tgggctgtga gctgcacccc accactaca gcatcaggag caccctgagg atggagctga tgggctgtga
49804980
cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg atgcccagat cctgaacagc tgcagcatgc ccctgggcat ggagagcaag gccatctctg atgcccagat
50405040
cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca aggccaggct cactgccagc agctacttca ccaacatgtt tgccacctgg agccccagca aggccaggct
51005100
gcacctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca aggagtggct gcacctgcag ggcaggagca atgcctggag gccccaggtc aacaacccca aggagtggct
51605160
gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg gggtgaagag gcaggtggac ttccagaaga ccatgaaggt gactggggtg accacccagg gggtgaagag
52205220
cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg atggccacca cctgctgacc agcatgtatg tgaaggagtt cctgatcagc agcagccagg atggccacca
52805280
gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc aggacagctt gtggaccctg ttcttccaga atggcaaggt gaaggtgttc cagggcaacc aggacagctt
53405340
cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga ggattcaccc cacccctgtg gtgaacagcc tggacccccc cctgctgacc agatacctga ggattcaccc
54005400
ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg aggcccagga ccagagctgg gtgcaccaga ttgccctgag gatggaggtg ctgggctgtg aggcccagga
54605460
cctgtactga ttaattaaga gcatcttacc gccatttatt cccatatttg ttctgttttt cctgtactga ttaattaaga gcatcttacc gccatttatt cccatatttg ttctgttttt
55205520
cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa tcatttacat cttgatttgg gtatacattt aaatgttaat aaaacaaaat ggtggggcaa tcatttacat
55805580
ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca tgttaagaaa ttttagggat atgtaattac tagttcaggt gtattgccac aagacaaaca tgttaagaaa
56405640
ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa aatttgtgaa ctttcccgtt atttacgctc tgttcctgtt aatcaacctc tggattacaa aatttgtgaa
57005700
agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata tgctgcttta agattgactg atattcttaa ctatgttgct ccttttacgc tgtgtggata tgctgcttta
57605760
tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc cttgtataaa tagcctctgt atctagctat tgcttcccgt acggctttcg ttttctcctc cttgtataaa
58205820
tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg tggcgtggtg tcctggttgc tgtctctttt agaggagttg tggcccgttg tccgtcaacg tggcgtggtg
58805880
tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac ctgtcaactc tgctctgtgt ttgctgacgc aacccccact ggctggggca ttgccaccac ctgtcaactc
59405940
ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat cgccgcctgc ctttctggga ctttcgcttt ccccctcccg atcgccacgg cagaactcat cgccgcctgc
60006000
cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt ggtgttgtct cttgcccgct gctggacagg ggctaggttg ctgggcactg ataattccgt ggtgttgtct
60606060
ccataaagta ggaaacacta cacgattcca taaagtagga aacactacat cactccataa ccataaagta ggaaacacta cacgattcca taaagtagga aacactacat cactccataa
61206120
agtaggaaac actacatgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg agtaggaaac actacatgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg
61806180
tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa tgccttcctt gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa
62406240
ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca ttgcatcgca ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca
63006300
gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg gcaaggggga ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg
63606360
ctctagatct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca ctctagatct agagcatggc tacgtagata agtagcatgg cgggttaatc attaactaca
64206420
cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cctgcaggag gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct
64806480
cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc ggcctcagtg agcgagcgag
65406540
cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt accaagcttg tcgagaagta cgcgcagctg cctgcagggg cgcgcctcga ggcatgcggt accaagcttg tcgagaagta
66006600
ctagaggatc ataatcagcc ataccacatt tgtagaggtt ttacttgctt taaaaaacct ctagaggatc ataatcagcc ataccacatt tgtagaggtt ttacttgctt taaaaaacct
66606660
cccacacctc cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt cccacacctc cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt
67206720
tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc
67806780
atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt
68406840
ctggatctga tcactgatat cgcctaggag atccgaacca gataagtgaa atctagttcc ctggatctga tcactgatat cgcctaggag atccgaacca gataagtgaa atctagttcc
69006900
aaactatttt gtcattttta attttcgtat tagcttacga cgctacaccc agttcccatc aaactatttt gtcattttta attttcgtat tagcttacga cgctacaccc agttcccatc
69606960
tattttgtca ctcttcccta aataatcctt aaaaactcca tttccacccc tcccagttcc tattttgtca ctcttcccta aataatcctt aaaaactcca tttccacccc tcccagttcc
70207020
caactatttt gtccgcccac agcggggcat ttttcttcct gttatgtttt taatcaaaca caactatttt gtccgcccac agcggggcat ttttcttcct gttatgtttt taatcaaaca
70807080
tcctgccaac tccatgtgac aaaccgtcat cttcggctac tttttctctg tcacagaatg tcctgccaac tccatgtgac aaaccgtcat cttcggctac tttttctctg tcacagaatg
71407140
aaaatttttc tgtcatctct tcgttattaa tgtttgtaat tgactgaata tcaacgctta aaaatttttc tgtcatctct tcgttattaa tgtttgtaat tgactgaata tcaacgctta
72007200
tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg tttgcagcct gaatggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg
72607260
tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg tggtggttac gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg
73207320
ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ctttcttccc ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg
73807380
ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt ggctcccttt agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt
74407440
agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt agggtgatgg ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt
75007500
tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tggagtccac gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta
75607560
tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa
76207620
atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg tttacaattt
76807680
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac
77407740
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa
78007800
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat
78607860
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc
79207920
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga
79807980
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg
80408040
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc
81008100
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag
81608160
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc
82208220
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg
82808280
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg
83408340
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac
84008400
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac
84608460
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg
85208520
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg
85808580
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg
86408640
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac
87008700
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg
87608760
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg
88208820
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc
88808880
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc
89408940
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt
90009000
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc
90609060
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact
91209120
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac
91809180
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagcattgag agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagcattgag
92409240
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg
93009300
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg
93609360
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga
94209420
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt
94809480
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct
95409540
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg
96009600
aggaagcgga agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac aggaagcgga agagcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac
96609660
accgcagacc agccgcgtaa cctggcaaaa tcggttacgg ttgagtaata aatggatgcc accgcagacc agccgcgtaa cctggcaaaa tcggttacgg ttgagtaata aatggatgcc
97209720
ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact gaacaaaata gatctaaact ctgcgtaagc gggtgtgggc ggacaataaa gtcttaaact gaacaaaata gatctaaact
97809780
atgacaataa agtcttaaac tagacagaat agttgtaaac tgaaatcagt ccagttatgc atgacaataa agtcttaaac tagacagaat agttgtaaac tgaaatcagt ccagttatgc
98409840
tgtgaaaaag catactggac ttttgttatg gctaaagcaa actcttcatt ttctgaagtg tgtgaaaaag catactggac ttttgttatg gctaaagcaa actcttcatt ttctgaagtg
99009900
caaattgccc gtcgtattaa agaggggcgt ggccaagggc atggtaaaga ctatattcgc caaattgccc gtcgtattaa agaggggcgt ggccaagggc atggtaaaga ctatattcgc
99609960
ggcgttgtga caatttaccg aacaactccg cggccgggaa gccgatctcg gcttgaacga ggcgttgtga caatttaccg aacaactccg cggccgggaa gccgatctcg gcttgaacga
1002010020
attgttaggt ggcggtactt gggtcgatat caaagtgcat cacttcttcc cgtatgccca attgttaggt ggcggtactt gggtcgatat caaagtgcat cacttcttcc cgtatgccca
1008010080
actttgtata gagagccact gcgggatcgt caccgtaatc tgcttgcacg tagatcacat actttgtata gagagccact gcgggatcgt caccgtaatc tgcttgcacg tagatcacat
1014010140
aagcaccaag cgcgttggcc tcatgcttga ggagattgat gagcgcggtg gcaatgccct aagcaccaag cgcgttggcc tcatgcttga ggagattgat gagcgcggtg gcaatgccct
1020010200
gcctccggtg ctcgccggag actgcgagat catagatata gatctcacta cgcggctgct gcctccggtg ctcgccggag actgcgagat catagatata gatctcacta cgcggctgct
1026010260
caaacctggg cagaacgtaa gccgcgagag cgccaacaac cgcttcttgg tcgaaggcag caaacctggg cagaacgtaa gccgcgagag cgccaacaac cgcttcttgg tcgaaggcag
1032010320
caagcgcgat gaatgtctta ctacggagca agttcccgag gtaatcggag tccggctgat caagcgcgat gaatgtctta ctacggagca agttcccgag gtaatcggag tccggctgat
1038010380
gttgggagta ggtggctacg tctccgaact cacgaccgaa aagatcaaga gcagcccgca gttgggagta ggtggctacg tctccgaact cacgaccgaa aagatcaaga gcagcccgca
1044010440
tggatttgac ttggtcaggg ccgagcctac atgtgcgaat gatgcccata cttgagccac tggatttgac ttggtcaggg ccgagcctac atgtgcgaat gatgcccata cttgagccac
1050010500
ctaactttgt tttagggcga ctgccctgct gcgtaacatc gttgctgctg cgtaacatcg ctaactttgt tttagggcga ctgccctgct gcgtaacatc gttgctgctg cgtaacatcg
1056010560
ttgctgctcc ataacatcaa acatcgaccc acggcgtaac gcgcttgctg cttggatgcc ttgctgctcc ataacatcaa acatcgaccc acggcgtaac gcgcttgctg cttggatgcc
1062010620
cgaggcatag actgtacaaa aaaacagtca taacaagcca tgaaaaccgc cactgcgccg cgaggcatag actgtacaaa aaaacagtca taacaagcca tgaaaaccgc cactgcgccg
1068010680
ttaccaccgc tgcgttcggt caaggttctg gaccagttgc gtgagcgcat acgctacttg ttaccaccgc tgcgttcggt caaggttctg gaccagttgc gtgagcgcat acgctacttg
1074010740
cattacagtt tacgaaccga acaggcttat gtcaactggg ttcgtgcctt catccgtttc cattacagtt tacgaaccga acaggcttat gtcaactggg ttcgtgcctt catccgtttc
1080010800
cacggtgtgc gtcacccggc aaccttgggc agcagcgaag tcgaggcatt tctgtcctgg cacggtgtgc gtcacccggc aaccttgggc agcagcgaag tcgaggcatt tctgtcctgg
1086010860
ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc aggcattggc ggccttgctg ctggcgaacg agcgcaaggt ttcggtctcc acgcatcgtc aggcattggc ggccttgctg
1092010920
ttcttctacg gcaaggtgct gtgcacggat ctgccctggc ttcaggagat cggaagacct ttcttctacg gcaaggtgct gtgcacggat ctgccctggc ttcaggagat cggaagacct
1098010980
cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg aagtggttcg catcctcggt cggccgtcgc ggcgcttgcc ggtggtgctg accccggatg aagtggttcg catcctcggt
1104011040
tttctggaag gcgagcatcg tttgttcgcc caggactcta gctatagttc tagtggttgg tttctggaag gcgagcatcg tttgttcgcc caggactcta gctatagttc tagtggttgg
1110011100
ctacgtatac tccggaatat taatagatca tggagataat taaaatgata accatctcgc ctacgtatac tccggaatat taatagatca tggagataat taaaatgata accatctcgc
1116011160
aaataaataa gtattttact gttttcgtaa cagttttgta ataaaaaaac ctataaatat aaataaataa gtattttact gttttcgtaa cagttttgta ataaaaaaac ctataaatat
1122011220
tccggattat tcataccgtc ccaccatcgg gcgcggatct cggtccgaaa ccatgtcgta tccggattat tcataccgtc cccacatcgg gcgcggatct cggtccgaaa ccatgtcgta
1128011280
ctaccatcac catcaccatc acgattacga tatcccaacg accgaaaacc tgtattttca ctaccatcac catcaccatc acgattacga tatcccaacg accgaaaacc tgtattttca
1134011340
gggcgccatg ggatcc gggcgccatg ggatcc
1135611356
<210> 214<210> 214
<211> 11434<211> 11434
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 214<400> 214
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc
240 240
cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca
300 300
tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag
360 360
gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag
420 420
cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga
480 480
gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt
540 540
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt
600 600
ggtttaaacg ccgccaccat gcaaattgag ttaagtacct gttttttcct gtgcctgttg ggtttaaacg ccgccaccat gcaaattgag ttaagtacct gttttttcct gtgcctgttg
660 660
agattttgct tctctgctac cagaaggtat tacctgggag ctgtggagct gtcatgggac agattttgct tctctgctac cagaaggtat tacctgggag ctgtggagct gtcatgggac
720 720
tacatgcagt ctgacctggg agagctccct gttgatgcta ggtttccccc tagggtgcca tacatgcagt ctgacctggg agagctccct gttgatgcta ggtttccccc tagggtgcca
780 780
aagtcctttc cttttaacac ctcagtggtg tacaagaaga cactgtttgt ggagtttact aagtcctttc cttttaacac ctcagtggtg tacaagaaga cactgtttgt ggagtttact
840 840
gaccacctct tcaatattgc taagccaaga cccccttgga tgggtctctt gggccctacc gaccacctct tcaatattgc taagccaaga cccccttgga tgggtctctt gggccctacc
900 900
atccaggctg aggtttatga tacagtggtg attaccctca agaatatggc ttctcatcct atccaggctg aggtttatga tacagtggtg attaccctca agaatatggc ttctcatcct
960 960
gttagtctgc atgcagtagg ggtcagctat tggaaggcca gtgaaggagc tgagtatgat gttagtctgc atgcagtagg ggtcagctat tggaaggcca gtgaaggagc tgagtatgat
10201020
gaccagacca gccagagaga gaaagaggat gacaaggtgt tccctggggg atcacacacc gaccagacca gccagagaga gaaagaggat gacaaggtgt tccctggggg atcacacacc
10801080
tatgtgtggc aggtgttgaa ggaaaatgga cccatggcct ctgacccact ctgcctgact tatgtgtggc aggtgttgaa ggaaaatgga cccatggcct ctgacccact ctgcctgact
11401140
tactcctacc tgtctcatgt ggacctggtc aaagatctga actctggcct gattggggca tactcctacc tgtctcatgt ggacctggtc aaagatctga actctggcct gattggggca
12001200
ctgttggtgt gcagagaagg gtctcttgcc aaggagaaga ctcagaccct gcacaagttc ctgttggtgt gcagagaagg gtctcttgcc aaggagaaga ctcagaccct gcacaagttc
12601260
atcctgctgt ttgctgtgtt tgatgaaggc aagtcttggc attctgagac taagaacagc atcctgctgt ttgctgtgtt tgatgaaggc aagtcttggc attctgagac taagaacagc
13201320
ctgatgcaag atagagatgc tgcatctgcc agggcctggc ctaagatgca cactgtgaat ctgatgcaag atagagatgc tgcatctgcc agggcctggc ctaagatgca cactgtgaat
13801380
ggatatgtga ataggtcctt gcctggcctg attggatgcc ataggaagtc tgtgtactgg ggatatgtga ataggtcctt gcctggcctg attggatgcc ataggaagtc tgtgtactgg
14401440
catgtgattg gcatgggcac cacccctgag gttcactcta tttttctgga gggccatact catgtgattg gcatgggcac cacccctgag gttcactcta tttttctgga gggccatact
15001500
ttccttgtga ggaatcatag acaggcctct ctggagatta gccctattac atttctgact ttccttgtga ggaatcatag acaggcctct ctggagatta gccctattac atttctgact
15601560
gctcagaccc tcctcatgga cttggggcag tttctgttaa gctgccacat cagcagccat gctcagaccc tcctcatgga cttggggcag tttctgttaa gctgccacat cagcagccat
16201620
caacatgatg gtatggaagc ctatgtcaaa gtggatagct gccctgaaga accacagctt caacatgatg gtatggaagc ctatgtcaaa gtggatagct gccctgaaga accacagctt
16801680
aggatgaaga acaatgagga ggcagaggac tatgatgatg atctgactga ttctgaaatg aggatgaaga acaatgagga ggcagaggac tatgatgatg atctgactga ttctgaaatg
17401740
gatgtggtga gatttgatga tgataatagc ccttccttta tccagatcag gtcagtggcc gatgtggtga gatttgatga tgataatagc ccttccttta tccagatcag gtcagtggcc
18001800
aagaagcacc caaagacctg ggtgcattat attgctgctg aggaggagga ctgggactat aagaagcacc caaagacctg ggtgcattat attgctgctg aggagggagga ctgggactat
18601860
gcccctctgg tgctggcccc tgatgataga agctataagt ctcaatactt gaataatggc gcccctctgg tgctggcccc tgatgataga agctataagt ctcaatactt gaataatggc
19201920
ccacagagga ttgggagaaa gtacaaaaag gtgagattta tggcctacac tgatgagact ccacagagga ttgggagaaa gtacaaaaag gtgagattta tggcctacac tgatgagact
19801980
ttcaagacca gagaggccat ccagcatgaa tcaggcattt tgggtcccct gctgtatgga ttcaagacca gagaggccat ccagcatgaa tcaggcattt tgggtcccct gctgtatgga
20402040
gaggtggggg ataccctgct gatcatcttt aagaaccagg ccagcagacc ttacaacatt gaggtggggg ataccctgct gatcatcttt aagaaccagg ccagcagacc ttacaacatt
21002100
taccctcatg ggatcacaga tgtgaggcca ctctactcta ggagattgcc caagggagtc taccctcatg ggatcacaga tgtgaggcca ctctactcta ggagattgcc caagggagtc
21602160
aagcatctta aggactttcc aatcctgcct ggggagatct tcaagtacaa atggacagtg aagcatctta aggactttcc aatcctgcct ggggagatct tcaagtacaa atggacagtg
22202220
acagttgagg atggacctac taagagtgac cccaggtgtc tgaccagata ttactctagc acagttgagg atggacctac taagagtgac cccaggtgtc tgaccagata ttactctagc
22802280
tttgtcaata tggaaagaga cctggcttca ggcttgatag gccctcttct catctgctac tttgtcaata tggaaagaga cctggcttca ggcttgatag gccctcttct catctgctac
23402340
aaagagtctg tggaccagag aggaaatcag attatgtctg acaagagaaa tgttattctg aaagagtctg tggaccagag aggaaatcag attatgtctg acaagagaaa tgttattctg
24002400
ttttcagtct ttgatgagaa cagaagttgg tacttgacag agaacattca gagatttctg ttttcagtct ttgatgagaa cagaagttgg tacttgacag agaacattca gagatttctg
24602460
cctaaccctg caggagtgca gcttgaggac cctgagtttc aggcttccaa tatcatgcat cctaaccctg caggagtgca gcttgaggac cctgagtttc aggcttccaa tatcatgcat
25202520
tctatcaatg gctatgtgtt tgatagcctg cagctgtctg tgtgcctgca tgaggttgcc tctatcaatg gctatgtgtt tgatagcctg cagctgtctg tgtgcctgca tgaggttgcc
25802580
tattggtaca tcctgtctat tggggcccaa actgatttct tgtctgtgtt tttcagtgga tattggtaca tcctgtctat tggggcccaa actgatttct tgtctgtgtt tttcagtgga
26402640
tataccttta agcataagat ggtgtatgaa gataccttga cacttttccc tttctcagga tataccttta agcataagat ggtgtatgaa gataccttga cacttttccc tttctcagga
27002700
gagactgtct tcatgtctat ggagaaccct ggactgtgga tcctgggatg ccacaactca gagactgtct tcatgtctat ggagaaccct ggactgtgga tcctgggatg ccacaactca
27602760
gacttcagaa acaggggtat gacagctctg cttaaggtct cctcatgtga caaaaataca gacttcagaa acaggggtat gacagctctg cttaaggtct cctcatgtga caaaaataca
28202820
ggagactact atgaagattc ctatgaggac atctctgctt acctgctcag caaaaacaat ggagactact atgaagattc ctatgaggac atctctgctt acctgctcag caaaaacaat
28802880
gccattgagc ccagaagctt cagccagaat tccagacatc ccagtactag gcagaagcag gccattgagc ccagaagctt cagccagaat tccagacatc ccagtactag gcagaagcag
29402940
tttaatgcca ccaccatccc agaaaatgac attgagaaga cagacccttg gtttgcccat tttaatgcca caccatccc agaaaatgac attgagaaga cagacccttg gtttgcccat
30003000
agaaccccaa tgcccaagat tcagaatgtg agcagctcag acttgctgat gctgctgagg agaaccccaa tgcccaagat tcagaatgtg agcagctcag acttgctgat gctgctgagg
30603060
cagtctccta ctccccatgg cctgtccctc tcagatctgc aggaagccaa gtatgagaca cagtctccta ctccccatgg cctgtccctc tcagatctgc aggaagccaa gtatgagaca
31203120
ttttctgatg acccctcccc aggggctatt gacagtaaca acagcctgtc tgaaatgacc ttttctgatg acccctcccc aggggctatt gacagtaaca acagcctgtc tgaaatgacc
31803180
cacttcagac ctcagctcca ccacagtggg gatatggtgt ttaccccaga gtcaggcctg cacttcagac ctcagctcca ccacagtggg gatatggtgt ttaccccaga gtcaggcctg
32403240
cagctgagac tgaatgagaa gctgggaacc acagctgcca cagaactgaa gaagctggat cagctgagac tgaatgagaa gctgggaacc acagctgcca cagaactgaa gaagctggat
33003300
ttcaaggtga gctctacttc aaataatctg atttccacta tcccatctga caatttggca ttcaaggtga gctctacttc aaataatctg atttccacta tcccatctga caatttggca
33603360
gctggcactg acaatacaag ctctctgggc ccacctagca tgccagtgca ttatgacagc gctggcactg acaatacaag ctctctgggc ccacctagca tgccagtgca ttatgacagc
34203420
cagttggaca ccactctttt tggaaagaaa tccagtcccc tgacagagtc aggaggaccc cagttggaca ccactctttt tggaaagaaa tccagtcccc tgacagagtc aggaggaccc
34803480
ctttctctgt ctgaggagaa caatgatagt aagcttctgg agtcaggctt gatgaactcc ctttctctgt ctgaggagaa caatgatagt aagcttctgg agtcaggctt gatgaactcc
35403540
caggagagtt cttggggcaa gaatgtgagc tctagggaga tcaccagaac cactctgcag caggagagtt cttggggcaa gaatgtgagc tctagggaga tcaccagaac cactctgcag
36003600
tctgaccaag aagagattga ttatgatgac actatctctg ttgagatgaa gaaggaggac tctgaccaag aagagattga ttatgatgac actatctctg ttgagatgaa gaaggaggac
36603660
tttgatatct atgatgagga tgagaaccag tctccaagaa gtttccagaa gaagaccagg tttgatatct atgatgagga tgagaaccag tctccaagaa gtttccagaa gaagaccagg
37203720
cactacttta ttgctgctgt ggagagactg tgggactatg gaatgtcctc ctcccctcat cactacttta ttgctgctgt ggagagactg tgggactatg gaatgtcctc ctcccctcat
37803780
gtcctgagaa atagagctca gtcaggatca gtgccccagt tcaagaaggt ggtgttccag gtcctgagaa atagagctca gtcaggatca gtgccccagt tcaagaaggt ggtgttccag
38403840
gaattcacag atggaagttt tacccagcca ctgtatagag gtgaactgaa tgaacatctg gaattcacag atggaagttt tacccagcca ctgtatagag gtgaactgaa tgaacatctg
39003900
ggtctgctgg ggccctatat cagggctgag gtggaggaca atattatggt gacctttaga ggtctgctgg ggccctatat cagggctgag gtggaggaca atattatggt gacctttaga
39603960
aaccaggcct caaggcccta cagcttctac tcttccctca tttcatatga ggaagaccag aaccaggcct caaggcccta cagcttctac tcttccctca tttcatatga ggaagaccag
40204020
agacagggag cagagcctag aaagaacttt gtcaagccca atgaaaccaa aacctatttc agacagggag cagagcctag aaagaacttt gtcaagccca atgaaaccaa aacctatttc
40804080
tggaaggtgc agcaccacat ggcacccacc aaagatgagt ttgactgcaa agcctgggcc tggaaggtgc agcaccacat ggcacccacc aaagatgagt ttgactgcaa agcctgggcc
41404140
tatttctcag atgtggatct ggagaaggat gtccattcag gtctgattgg accactcctg tatttctcag atgtggatct ggagaaggat gtccattcag gtctgattgg accactcctg
42004200
gtgtgccaca ccaacacact gaatccagct catggcagac aggtgacagt ccaggagttt gtgtgccaca ccaacacact gaatccagct catggcagac aggtgacagt ccaggagttt
42604260
gccctgtttt tcactatttt tgatgagacc aagagctggt attttacaga gaatatggaa gccctgtttt tcactatttt tgatgagacc aagagctggt attttacaga gaatatggaa
43204320
agaaactgca gagccccttg taatatccag atggaggacc caacctttaa ggagaactac agaaactgca gagccccttg taatatccag atggaggacc caacctttaa ggagaactac
43804380
aggttccatg ccatcaatgg ctacattatg gataccctgc ctggcctggt tatggcccag aggttccatg ccatcaatgg ctacattatg gataccctgc ctggcctggt tatggcccag
44404440
gatcagagga tcaggtggta tctgctgtca atgggctcca atgagaacat tcatagtatt gatcagagga tcaggtggta tctgctgtca atgggctcca atgagaacat tcatagtatt
45004500
cacttttcag gacatgtgtt cacagtgaga aagaaggagg agtataagat ggccctctat cacttttcag gacatgtgtt cacagtgaga aagaaggagg agtataagat ggccctctat
45604560
aatctctacc caggggtgtt tgagacagtt gagatgctgc catctaaggc aggcatctgg aatctctacc caggggtgtt tgagacagtt gagatgctgc catctaaggc aggcatctgg
46204620
agagtggaat gcctcattgg agagcacctg catgctggca tgtccaccct gtttctggtg agagtggaat gcctcattgg agagcacctg catgctggca tgtccaccct gtttctggtg
46804680
tactccaaca aatgtcagac ccctcttggt atggcctctg gccacattag ggatttccag tactccaaca aatgtcagac ccctcttggt atggcctctg gccacattag ggatttccag
47404740
attactgcca gtggtcagta tgggcagtgg gcccctaagc tggccagact gcactattct attactgcca gtggtcagta tgggcagtgg gcccctaagc tggccagact gcactattct
48004800
gggagcatca atgcctggtc caccaaggaa cctttttctt ggattaaagt ggatctgctg gggagcatca atgcctggtc caccaaggaa cctttttctt ggattaaagt ggatctgctg
48604860
gccccaatga tcatccatgg gatcaagacc cagggagcta ggcagaagtt cagcagcctg gccccaatga tcatccatgg gatcaagacc cagggagcta ggcagaagtt cagcagcctg
49204920
tacattagtc agttcatcat tatgtacagt ctggatggca aaaagtggca gacatacagg tacattagtc agttcatcat tatgtacagt ctggatggca aaaagtggca gacatacagg
49804980
ggcaattcca ctggaaccct gatggtgttc tttggaaatg tggatagcag tggtatcaag ggcaattcca ctggaaccct gatggtgttc tttggaaatg tggatagcag tggtatcaag
50405040
cacaacattt tcaaccctcc catcattgcc aggtacatca gactgcatcc aacccactac cacaacattt tcaaccctcc catcattgcc aggtacatca gactgcatcc aacccactac
51005100
agcattagga gcacccttag gatggagctc atggggtgtg acctgaactc ttgctctatg agcattagga gcacccttag gatggagctc atggggtgtg acctgaactc ttgctctatg
51605160
ccacttggaa tggagagcaa ggccatctct gatgcccaga ttactgctag ttcctacttc ccacttggaa tggagagcaa ggccatctct gatgcccaga ttactgctag ttcctacttc
52205220
accaatatgt ttgccacctg gtcacccagc aaggccaggc tgcacctgca gggaaggtcc accaatatgt ttgccacctg gtcacccagc aaggccaggc tgcacctgca gggaaggtcc
52805280
aatgcttgga ggcctcaggt gaacaatcca aaggagtggc tgcaggtgga cttccagaag aatgcttgga ggcctcaggt gaacaatcca aaggagtggc tgcaggtgga cttccagaag
53405340
actatgaagg tgacaggagt gaccactcag ggagtgaaga gcctgctgac ctccatgtat actatgaagg tgacaggagt gaccactcag ggagtgaaga gcctgctgac ctccatgtat
54005400
gtgaaggagt ttctgatctc cagctcccag gatggccacc agtggaccct gttctttcag gtgaaggagt ttctgatctc cagctcccag gatggccacc agtggaccct gttctttcag
54605460
aatggcaagg tgaaggtgtt tcaggggaat caggactcct tcaccccagt ggtgaattcc aatggcaagg tgaaggtgtt tcaggggaat caggactcct tcaccccagt ggtgaattcc
55205520
ctggatcccc ctctgctgac cagatacctg agaatccacc cccagtcttg ggtgcaccag ctggatcccc ctctgctgac cagatacctg agaatccacc cccagtcttg ggtgcaccag
55805580
attgccctta ggatggaggt gctgggctgt gaggcccagg acctgtactg attaattaag attgccctta ggatggaggt gctgggctgt gaggcccagg acctgtactg attaattaag
56405640
agcatcttac cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt agcatcttac cgccatttat tcccatattt gttctgtttt tcttgatttg ggtatacatt
57005700
taaatgttaa taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta taaatgttaa taaaacaaaa tggtggggca atcatttaca tttttaggga tatgtaatta
57605760
ctagttcagg tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct ctagttcagg tgtattgcca caagacaaac atgttaagaa actttcccgt tatttacgct
58205820
ctgttcctgt taatcaacct ctggattaca aaatttgtga aagattgact gatattctta ctgttcctgt taatcaacct ctggattaca aaatttgtga aagattgact gatattctta
58805880
actatgttgc tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta actatgttgc tccttttacg ctgtgtggat atgctgcttt atagcctctg tatctagcta
59405940
ttgcttcccg tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt ttgcttcccg tacggctttc gttttctcct ccttgtataa atcctggttg ctgtctcttt
60006000
tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg tagaggagtt gtggcccgtt gtccgtcaac gtggcgtggt gtgctctgtg tttgctgacg
60606060
caacccccac tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt caacccccac tggctggggc attgccacca cctgtcaact cctttctggg actttcgctt
61206120
tccccctccc gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag tccccctccc gatcgccacg gcagaactca tcgccgcctg ccttgcccgc tgctggacag
61806180
gggctaggtt gctgggcact gataattccg tggtgttgtc tgtgccttct agttgccagc gggctaggtt gctgggcact gataattccg tggtgttgtc tgtgccttct agttgccagc
62406240
catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg
63006300
tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc
63606360
tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg
64206420
ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag tagcatggcg ctggggatgc ggtgggctct atggctctag agcatggcta cgtagataag tagcatggcg
64806480
ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg ccactccctc ggttaatcat taactacacc tgcaggagga acccctagtg atggagttgg ccactccctc
65406540
tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggcgg
66006600
cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg catgcggtac cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cgcctcgagg catgcggtac
66606660
caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg tagaggtttt caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg tagaggtttt
67206720
acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat
67806780
tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac
68406840
aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat
69006900
caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat ccgaaccaga caatgtatct tatcatgtct ggatctgatc actgatatcg cctaggagat ccgaaccaga
69606960
taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta gcttacgacg taagtgaaat ctagttccaa actattttgt catttttaat tttcgtatta gcttacgacg
70207020
ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa aaactccatt ctacacccag ttcccatcta ttttgtcact cttccctaaa taatccttaa aaactccatt
70807080
tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt ttcttcctgt tccacccctc ccagttccca actattttgt ccgcccacag cggggcattt ttcttcctgt
71407140
tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct tcggctactt tatgttttta atcaaacatc ctgccaactc catgtgacaa accgtcatct tcggctactt
72007200
tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg tttgtaattg tttctctgtc acagaatgaa aatttttctg tcatctcttc gttattaatg tttgtaattg
72607260
actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc tgtagcggcg actgaatatc aacgcttatt tgcagcctga atggcgaatg ggacgcgccc tgtagcggcg
73207320
cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt gccagcgccc
73807380
tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc ggctttcccc
74407440
gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta cggcacctcg
75007500
accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg
75607560
tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg ttccaaactg tttttcgccc tttgacgttg gagtccaacgt tctttaatag tggactcttg ttccaaactg
76207620
gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt ttgccgattt
76807680
cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat tttaacaaaa
77407740
tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga acccctattt tattaacgtt tacaatttca ggtggcactt ttcggggaaa tgtgcgcgga acccctattt
78007800
gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa
78607860
tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta
79207920
ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag
79807980
taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca
80408040
gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta
81008100
aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag caactcggtc aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag caactcggtc
81608160
gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc
82208220
ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca
82808280
ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc
83408340
acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca
84008400
taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac
84608460
tattaactgg cgaactactt actctagctt cccggcaaca attaatagac tggatggagg tattaactgg cgaactactt actctagctt cccggcaaca attaatagac tggatggagg
85208520
cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg
85808580
ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg
86408640
gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac
87008700
gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc
87608760
aagtttactc atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct aagtttactc atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct
88208820
aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc
88808880
actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc
89408940
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg
90009000
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa
90609060
atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc
91209120
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt
91809180
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa
92409240
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc
93009300
tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc
93609360
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct
94209420
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat
94809480
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc
95409540
tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg
96009600
ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc
96609660
gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt ctccttacgc
97209720
atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc ggttacggtt atctgtgcgg tatttcacac cgcagaccag ccgcgtaacc tggcaaaatc ggttacggtt
97809780
gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt cttaaactga gagtaataaa tggatgccct gcgtaagcgg gtgtgggcgg acaataaagt cttaaactga
98409840
acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag ttgtaaactg acaaaataga tctaaactat gacaataaag tcttaaacta gacagaatag ttgtaaactg
99009900
aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc taaagcaaac aaatcagtcc agttatgctg tgaaaaagca tactggactt ttgttatggc taaagcaaac
99609960
tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg ccaagggcat tcttcatttt ctgaagtgca aattgcccgt cgtattaaag aggggcgtgg ccaagggcat
1002010020
ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg gccgggaagc ggtaaagact atattcgcgg cgttgtgaca atttaccgaa caactccgcg gccgggaagc
1008010080
cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca aagtgcatca cgatctcggc ttgaacgaat tgttaggtgg cggtacttgg gtcgatatca aagtgcatca
1014010140
cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca ccgtaatctg cttcttcccg tatgcccaac tttgtataga gagccactgc gggatcgtca ccgtaatctg
1020010200
cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg agattgatga cttgcacgta gatcacataa gcaccaagcg cgttggcctc atgcttgagg agattgatga
1026010260
gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca tagatataga gcgcggtggc aatgccctgc ctccggtgct cgccggagac tgcgagatca tagatataga
1032010320
tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg ccaacaaccg tctcactacg cggctgctca aacctgggca gaacgtaagc cgcgagagcg ccaacaaccg
1038010380
cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag ttcccgaggt cttcttggtc gaaggcagca agcgcgatga atgtcttact acggagcaag ttcccgaggt
1044010440
aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca cgaccgaaaa aatcggagtc cggctgatgt tgggagtagg tggctacgtc tccgaactca cgaccgaaaa
1050010500
gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat gtgcgaatga gatcaagagc agcccgcatg gatttgactt ggtcagggcc gagcctacat gtgcgaatga
1056010560
tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc gtaacatcgt tgcccatact tgagccacct aactttgttt tagggcgact gccctgctgc gtaacatcgt
1062010620
tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac ggcgtaacgc tgctgctgcg taacatcgtt gctgctccat aacatcaaac atcgacccac ggcgtaacgc
1068010680
gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata acaagccatg gcttgctgct tggatgcccg aggcatagac tgtacaaaaa aacagtcata acaagccatg
1074010740
aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga ccagttgcgt aaaaccgcca ctgcgccgtt accaccgctg cgttcggtca aggttctgga ccagttgcgt
1080010800
gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt caactgggtt gagcgcatac gctacttgca ttacagttta cgaaccgaac aggcttatgt caactgggtt
1086010860
cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc cgtgccttca tccgtttcca cggtgtgcgt cacccggcaa ccttgggcag cagcgaagtc
1092010920
gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac gcatcgtcag gaggcatttc tgtcctggct ggcgaacgag cgcaaggttt cggtctccac gcatcgtcag
1098010980
gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct gccctggctt gcattggcgg ccttgctgtt cttctacggc aaggtgctgt gcacggatct gccctggctt
1104011040
caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac cccggatgaa caggagatcg gaagacctcg gccgtcgcgg cgcttgccgg tggtgctgac cccggatgaa
1110011100
gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca ggactctagc gtggttcgca tcctcggttt tctggaaggc gagcatcgtt tgttcgccca ggactctagc
1116011160
tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg gagataatta tatagttcta gtggttggct acgtatactc cggaatatta atagatcatg gagataatta
1122011220
aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca gttttgtaat aaatgataac catctcgcaa ataaataagt attttactgt tttcgtaaca gttttgtaat
1128011280
aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc gcggatctcg aaaaaaacct ataaatattc cggattattc ataccgtccc accatcgggc gcggatctcg
1134011340
gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata tcccaacgac gtccgaaacc atgtcgtact accatcacca tcaccatcac gattacgata tcccaacgac
1140011400
cgaaaacctg tattttcagg gcgccatggg atcc cgaaaacctg tattttcagg gcgccatggg atcc
1143411434
<210> 215<210> 215
<211> 13477<211> 13477
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 215<400> 215
ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc ggccggcccc tgcaggcagc tgcgcgctcg ctcgctcact gaggccgccc gggcaaagcc
60 60
cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc gagcgagcgc gcagagaggg
120 120
agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt agtggccaac tccatcacta ggggttcctt gtagttaatg attaacccgc catgctactt
180 180
atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc atctacgtag ccatgctcta gacgggggag gctgctggtg aatattaacc aaggtcaccc
240 240
cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca cagttatcgg aggagcaaac aggggctaag tccacacgcg tggtaccgtc tgtctgcaca
300 300
tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag tttcgtagag cgagtgttcc gatactctaa tctccctagg caaggttcat atttgtgtag
360 360
gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag gttacttatt ctccttttgt tgactaagtc aataatcaga atcagcaggt ttggagtcag
420 420
cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga cttggcaggg atcagcagcc tgggttggaa ggagggggta taaaagcccc ttcaccagga
480 480
gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt gaagccgtca cacagatcca caagctcctg aagaggtaag ggtttaaggg atggttggtt
540 540
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt
600 600
ggtttaaacg ccgccaccat gcaaatagag ctctccacct gcttctttct gtgccttttg ggtttaaacg ccgccaccat gcaaatatagg ctctccacct gcttctttct gtgccttttg
660 660
cgattctgct ttagtgccac cagaagatac tacctgggtg cagtggaact gtcatgggac cgattctgct ttagtgccac cagaagatac tacctgggtg cagtggaact gtcatgggac
720 720
tatatgcaaa gtgatctcgg tgagctgcct gtggacgcaa gatttcctcc tagagtgcca tatatgcaaa gtgatctcgg tgagctgcct gtggacgcaa gatttcctcc tagagtgcca
780 780
aaatcttttc cattcaacac ctcagtcgtg tacaaaaaga ctctgtttgt agaattcacg aaatcttttc cattcaacac ctcagtcgtg tacaaaaaga ctctgtttgt agaattcacg
840 840
gatcaccttt tcaacatcgc taagccaagg ccaccctgga tgggtctgct aggtcctacc gatcaccttt tcaacatcgc taagccaagg ccaccctgga tgggtctgct aggtcctacc
900 900
atccaggctg aggtttatga tacagtggtc attacactta agaacatggc ttcccatcct atccaggctg aggtttatga tacagtggtc attacactta agaacatggc ttcccatcct
960 960
gtcagtcttc atgctgttgg tgtatcctac tggaaagctt ctgagggagc tgaatatgat gtcagtcttc atgctgttgg tgtatcctac tggaaagctt ctgagggagc tgaatatgat
10201020
gatcagacca gtcaaaggga gaaagaagat gataaagtct tccctggtgg aagccataca gatcagacca gtcaaaggga gaaagaagat gataaagtct tccctggtgg aagccataca
10801080
tatgtctggc aggtcctgaa agagaatggt ccaatggcct ctgacccact gtgccttacc tatgtctggc aggtcctgaa agagaatggt ccaatggcct ctgacccact gtgccttacc
11401140
tactcatatc tttctcatgt ggacctggta aaagacttga attcaggcct cattggagcc tactcatatc tttctcatgt ggacctggta aaagacttga attcaggcct cattggagcc
12001200
ctactagtat gtagagaagg gagtctggcc aaggaaaaga cacagacctt gcacaaattt ctactagtat gtagagaagg gagtctggcc aaggaaaaga cacagacctt gcacaaattt
12601260
atactacttt ttgctgtatt tgatgaaggg aaaagttggc actcagaaac aaagaactcc atactacttt ttgctgtatt tgatgaaggg aaaagttggc actcagaaac aaagaactcc
13201320
ttgatgcagg atagggatgc tgcatctgct cgggcctggc ctaaaatgca cacagtcaat ttgatgcagg atagggatgc tgcatctgct cgggcctggc ctaaaatgca cacagtcaat
13801380
ggttatgtaa acaggtctct gccaggtctg attggatgcc acaggaaatc agtctattgg ggttatgtaa acaggtctct gccaggtctg attggatgcc acaggaaatc agtctattgg
14401440
catgtgattg gaatgggcac cactcctgaa gtgcactcaa tattcctcga aggtcacaca catgtgattg gaatgggcac cactcctgaa gtgcactcaa tattcctcga aggtcacaca
15001500
tttcttgtga ggaaccatcg ccaggcgtcc ttggaaatct cgccaataac tttccttact tttcttgtga ggaaccatcg ccaggcgtcc ttggaaatct cgccaataac tttccttact
15601560
gctcaaacac tcttgatgga ccttggacag tttctactgt tttgtcatat ctcttcccac gctcaaacac tcttgatgga ccttggacag tttctactgt tttgtcatat ctcttcccac
16201620
caacatgatg gcatggaagc ttatgtcaaa gtagacagct gtccagagga accccaacta caacatgatg gcatggaagc ttatgtcaaa gtagacagct gtccagagga accccaacta
16801680
cgaatgaaaa ataatgaaga agcggaagac tatgatgatg atcttactga ttctgaaatg cgaatgaaaa ataatgaaga agcggaagac tatgatgatg atcttactga ttctgaaatg
17401740
gatgtggtca ggtttgatga tgacaactct ccttccttta tccaaattcg ctcagttgcc gatgtggtca ggtttgatga tgacaactct ccttccttta tccaaattcg ctcagttgcc
18001800
aagaagcatc ctaaaacttg ggtacattac attgctgctg aagaggagga ctgggactat aagaagcatc ctaaaacttg ggtacattac attgctgctg aagaggagga ctgggactat
18601860
gctcccttag tcctcgcccc cgatgacaga agttataaaa gtcaatattt gaacaatggc gctcccttag tcctcgcccc cgatgacaga agttataaaa gtcaatattt gaacaatggc
19201920
cctcagcgga ttggtaggaa gtacaaaaaa gtccgattta tggcatacac agatgaaacc cctcagcgga ttggtaggaa gtacaaaaaa gtccgattta tggcatacac agatgaaacc
19801980
tttaagactc gtgaagctat tcagcatgaa tcaggaatct tgggaccttt actttatggg tttaagactc gtgaagctat tcagcatgaa tcaggaatct tgggaccttt actttatggg
20402040
gaagttggag acacactgtt gattatattt aagaatcaag caagcagacc atataacatc gaagttggag acacactgtt gattatattt aagaatcaag caagcagacc atataacatc
21002100
taccctcacg gaatcactga tgtccgtcct ttgtattcaa ggagattacc aaaaggtgta taccctcacg gaatcactga tgtccgtcct ttgtattcaa ggagattacc aaaaggtgta
21602160
aaacatttga aggattttcc aattctgcca ggagaaatat tcaaatataa atggacagtg aaacatttga aggattttcc aattctgcca ggagaaatat tcaaatataa atggacagtg
22202220
actgtagaag atgggccaac taaatcagat cctcggtgcc tgacccgcta ttactctagt actgtagaag atgggccaac taaatcagat cctcggtgcc tgacccgcta ttactctagt
22802280
ttcgttaata tggagagaga tctagcttca ggactcattg gccctctcct catctgctac ttcgttaata tggagagaga tctagcttca ggactcattg gccctctcct catctgctac
23402340
aaagaatctg tagatcaaag aggaaaccag ataatgtcag acaagaggaa tgtcatcctg aaagaatctg tagatcaaag aggaaaccag ataatgtcag acaagaggaa tgtcatcctg
24002400
ttttctgtat ttgatgagaa ccgaagctgg tacctcacag agaatataca acgctttctc ttttctgtat ttgatgagaa ccgaagctgg tacctcacag agaatataca acgctttctc
24602460
cccaatccag ctggagtgca gcttgaggat ccagagttcc aagcctccaa catcatgcac cccaatccag ctggagtgca gcttgaggat cccagttcc aagcctccaa catcatgcac
25202520
agcatcaatg gctatgtttt tgatagtttg cagttgtcag tttgtttgca tgaggtggca agcatcaatg gctatgtttt tgatagtttg cagttgtcag tttgtttgca tgaggtggca
25802580
tactggtaca ttctaagcat tggagcacag actgacttcc tttctgtctt cttctctgga tactggtaca ttctaagcat tggagcacag actgacttcc tttctgtctt cttctctgga
26402640
tataccttca aacacaaaat ggtctatgaa gacacactca ccctattccc attctcagga tataccttca aacacaaaat ggtctatgaa gacacactca ccctattccc attctcagga
27002700
gaaactgtct tcatgtcgat ggaaaaccca ggtctatgga ttctggggtg ccacaactca gaaactgtct tcatgtcgat ggaaaaccca ggtctatgga ttctggggtg ccacaactca
27602760
gactttcgga acagaggcat gaccgcctta ctgaaggttt ctagttgtga caagaacact gactttcgga acagaggcat gaccgcctta ctgaaggttt ctagttgtga caagaacact
28202820
ggtgattatt acgaggacag ttatgaagat atttcagcat acttgctgag taaaaacaat ggtgattatt acgaggacag ttatgaagat atttcagcat acttgctgag taaaaacaat
28802880
gccattgaac caagaagctt ctcccagaat tcaagacacc ctagcactag gcaaaagcaa gccattgaac caagaagctt ctcccagaat tcaagacacc ctagcactag gcaaaagcaa
29402940
tttaatgcca ccacaattcc agaaaatgac atagagaaga ctgacccttg gtttgcacac tttaatgcca ccacaattcc agaaaatgac atagagaaga ctgacccttg gtttgcacac
30003000
agaacaccta tgcctaaaat acaaaatgtc tcctctagtg atttgttgat gctcttgcga agaacaccta tgcctaaaat acaaaatgtc tcctctagtg atttgttgat gctcttgcga
30603060
cagagtccta ctccacatgg gctatcctta tctgatctcc aagaagccaa atatgagact cagagtccta ctccacatgg gctatcctta tctgatctcc aagaagccaa atatgagact
31203120
ttttctgatg atccatcacc tggagcaata gacagtaata acagcctgtc tgaaatgaca ttttctgatg atccatcacc tggagcaata gacagtaata acagcctgtc tgaaatgaca
31803180
cacttcaggc cacagctcca tcacagtggg gacatggtat ttacccctga gtcaggcctc cacttcaggc cacagctcca tcacagtggg gacatggtat ttacccctga gtcaggcctc
32403240
caattaagat taaatgagaa actggggaca actgcagcaa cagagttgaa gaaacttgat caattaagat taaatgagaa actggggaca actgcagcaa cagagttgaa gaaacttgat
33003300
ttcaaagttt ctagtacatc aaataatctg atttcaacaa ttccatcaga caatttggca ttcaaagttt ctagtacatc aaataatctg atttcaacaa ttccatcaga caatttggca
33603360
gcaggtactg ataatacaag ttccttagga cccccaagta tgccagttca ttatgatagt gcaggtactg aatacaag ttccttagga cccccaagta tgccagttca ttatgatagt
34203420
caattagata ccactctatt tggcaaaaag tcatctcccc ttactgagtc tggtggacct caattagata ccactctatt tggcaaaaag tcatctcccc ttactgagtc tggtggacct
34803480
ctgagcttga gtgaagaaaa taatgattca aagttgttag aatcaggttt aatgaatagc ctgagcttga gtgaagaaaa taatgattca aagttgttag aatcaggttt aatgaatagc
35403540
caagaaagtt catggggaaa aaatgtatcg tcaacagaga gtggtaggtt atttaaaggg caagaaagtt catggggaaa aaatgtatcg tcaacagaga gtggtaggtt atttaaaggg
36003600
aaaagagctc atggacctgc tttgttgact aaagataatg ccttattcaa agttagcatc aaaagagctc atggacctgc tttgttgact aaagataatg ccttattcaa agttagcatc
36603660
tctttgttaa agacaaacaa aacttccaat aattcagcaa ctaatagaaa gactcacatt tctttgttaa agacaaacaa aacttccaat aattcagcaa ctaatagaaa gactcacatt
37203720
gatggcccat cattattaat tgagaatagt ccatcagtct ggcaaaatat attagaaagt gatggcccat cattattaat tgagaatagt ccatcagtct ggcaaaatat attagaaagt
37803780
gacactgagt ttaaaaaagt gacacctttg attcatgaca gaatgcttat ggacaaaaat gacactgagt ttaaaaaagt gacacctttg attcatgaca gaatgcttat ggacaaaaat
38403840
gctacagctt tgaggctaaa tcatatgtca aataaaacta cttcatcaaa aaacatggaa gctacagctt tgaggctaaa tcatatgtca aataaaacta cttcatcaaa aaacatggaa
39003900
atggtccaac agaaaaaaga gggccccatt ccaccagatg cacaaaatcc agatatgtcg atggtccaac agaaaaaaga gggccccatt ccaccagatg cacaaaatcc agatatgtcg
39603960
ttctttaaga tgctattctt gccagaatca gcaaggtgga tacaaaggac tcatggaaag ttctttaaga tgctattctt gccagaatca gcaaggtgga tacaaaggac tcatggaaag
40204020
aactctctga actctgggca aggccccagt ccaaagcaat tagtatcctt aggaccagaa aactctctga actctgggca aggccccagt ccaaagcaat tagtatcctt aggaccagaa
40804080
aaatctgtgg aaggtcagaa tttcttgtct gagaaaaaca aagtggtagt aggaaagggt aaatctgtgg aaggtcagaa tttcttgtct gagaaaaaca aagtggtagt aggaaagggt
41404140
gaatttacaa aggacgtagg actcaaagag atggtttttc caagcagcag aaacctattt gaatttacaa aggacgtagg actcaaagag atggtttttc caagcagcag aaacctattt
42004200
cttactaact tggataattt acatgaaaat aatacacaca atcaagaaaa aaaaattcag cttactaact tggataattt acatgaaaat aatacacaca atcaagaaaa aaaaattcag
42604260
gaagaaatag aaaagaagga aacattaatc caagagaatg tagttttgcc tcagatacat gaagaaatag aaaagaagga aacattaatc caagagaatg tagttttgcc tcagatacat
43204320
acagtgactg gcactaagaa tttcatgaag aaccttttct tactgagcac taggcaaaat acagtgactg gcactaagaa tttcatgaag aaccttttct tactgagcac taggcaaaat
43804380
gtagaaggtt catatgacgg ggcatatgct ccagtacttc aagattttag gtcattaaat gtagaaggtt catatgacgg ggcatatgct ccagtacttc aagattttag gtcattaaat
44404440
gattcaacaa atagaacaaa gaaacacaca gctcatttct caaaaaaagg ggaggaagaa gattcaacaa atagaacaaa gaaacacaca gctcatttct caaaaaaagg ggaggaagaa
45004500
aacttggaag gcttgggaaa tcaaaccaag caaattgtag agaaatatgc atgcaccaca aacttggaag gcttgggaaa tcaaaccaag caaattgtag agaaatatgc atgcaccaca
45604560
aggatatctc ctaatacaag ccagcagaat tttgtcacgc aacgtagtaa gagagctttg aggatatctc ctaatacaag ccagcagaat tttgtcacgc aacgtagtaa gagagctttg
46204620
aaacaattca gactcccact agaagaaaca gaacttgaaa aaaggataat tgtggatgac aaacaattca gactcccact agaagaaaca gaacttgaaa aaaggataat tgtggatgac
46804680
acctcaaccc agtggtccaa aaacatgaaa catttgaccc cgagcaccct cacacagata acctcaaccc agtggtccaa aaacatgaaa catttgaccc cgagcaccct cacacagata
47404740
gactacaatg agaaggagaa aggggccatt actcagtctc ccttatcaga ttgccttacg gactacaatg agaaggagaa aggggccatt actcagtctc ccttatcaga ttgccttacg
48004800
aggagtcata gcatccctca agcaaataga tctccattac ccattgcaaa ggtatcatca aggagtcata gcatccctca agcaaataga tctccattac ccattgcaaa ggtatcatca
48604860
tttccatcta ttagacctat atatctgacc agggtcctat tccaagacaa ctcttctcat tttccatcta ttagacctat atatctgacc agggtcctat tccaagacaa ctcttctcat
49204920
cttccagcag catcttatag aaagaaagat tctggggtcc aagaaagcag tcatttctta cttccagcag catcttatag aaagaaagat tctggggtcc aagaaagcag tcatttctta
49804980
caaggagcca aaaaaaataa cctttcttta gccattctaa ccttggagat gactggtgat caaggagcca aaaaaaataa cctttcttta gccattctaa ccttggagat gactggtgat
50405040
caaagagagg ttggctccct ggggacaagt gccacaaatt cagtcacata caagaaagtt caaagagagg ttggctccct ggggacaagt gccacaaatt cagtcacata caagaaagtt
51005100
gagaacactg ttctcccgaa accagacttg cccaaaacat ctggcaaagt tgaattgctt gagaacactg ttctcccgaa accagacttg cccaaaacat ctggcaaagt tgaattgctt
51605160
ccaaaagttc acatttatca gaaggaccta ttccctacgg aaactagcaa tgggtctcct ccaaaagttc acatttatca gaaggaccta ttccctacgg aaactagcaa tgggtctcct
52205220
ggccatctgg atctcgtgga agggagcctt cttcagggaa cagagggagc gattaagtgg ggccatctgg atctcgtgga agggagcctt cttcagggaa cagagggagc gattaagtgg
52805280
aatgaagcaa acagacctgg aaaagttccc tttctgagag tagcaacaga aagctctgca aatgaagcaa acagacctgg aaaagttccc tttctgagag tagcaacaga aagctctgca
53405340
aagactccct ccaagctatt ggatcctctt gcttgggata accactatgg tactcagata aagactccct ccaagctatt ggatcctctt gcttgggata accactatgg tactcagata
54005400
ccaaaagaag agtggaaatc ccaagagaag tcaccagaaa aaacagcttt taagaaaaag ccaaaagaag agtggaaatc ccaagagaag tcaccagaaa aaacagcttt taagaaaaag
54605460
gataccattt tgtccctgaa cgcttgtgaa agcaatcatg caatagcagc aataaatgag gataccattt tgtccctgaa cgcttgtgaa agcaatcatg caatagcagc aataaatgag
55205520
ggacaaaata agcccgaaat agaagtcacc tgggcaaagc aaggtaggac tgaaaggctg ggacaaaata agcccgaaat agaagtcacc tgggcaaagc aaggtaggac tgaaaggctg
55805580
tgctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt tgctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt
56405640
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa
57005700
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca
57605760
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca
58205820
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc
58805880
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat
59405940
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc
60006000
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat
60606060
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac
61206120
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg
61806180
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt
62406240
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa
63006300
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg
63606360
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat
64206420
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct
64806480
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct
65406540
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg
66006600
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt
66606660
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg
67206720
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt
67806780
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat
68406840
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg
69006900
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc
69606960
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat
70207020
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata
70807080
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat
71407140
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc
72007200
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac
72607260
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg
73207320
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag agtaatgcct ggagaacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag
73807380
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg
74407440
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt
75007500
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac
75607560
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac
76207620
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta ctgattaatt cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta ctgattaatt
76807680
aagagcatct taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac aagagcatct taccgccatt tattcccata tttgttctgt ttttcttgat ttgggtatac
77407740
atttaaatgt taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa atttaaatgt taataaaaca aaatggtggg gcaatcattt acatttttag ggatatgtaa
78007800
ttactagttc aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac ttactagttc aggtgtattg ccacaagaca aacatgttaa gaaactttcc cgttatttac
78607860
gctctgttcc tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc gctctgttcc tgttaatcaa cctctggatt acaaaatttg tgaaagattg actgatattc
79207920
ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag ttaactatgt tgctcctttt acgctgtgtg gatatgctgc tttatagcct ctgtatctag
79807980
ctattgcttc ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc ctattgcttc ccgtacggct ttcgttttct cctccttgta taaatcctgg ttgctgtctc
80408040
ttttagagga gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg ttttagagga gttgtggccc gttgtccgtc aacgtggcgt ggtgtgctct gtgtttgctg
81008100
acgcaacccc cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg acgcaacccc cactggctgg ggcattgcca ccacctgtca actcctttct gggactttcg
81608160
ctttccccct cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga ctttccccct cccgatcgcc acggcagaac tcatcgccgc ctgccttgcc cgctgctgga
82208220
caggggctag gttgctgggc actgataatt ccgtggtgtt gtctgtgcct tctagttgcc caggggctag gttgctgggc actgataatt ccgtggtgtt gtctgtgcct tctagttgcc
82808280
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca
83408340
ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta
84008400
ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc
84608460
atgctgggga tgcggtgggc tctatggctc tagagcatgg ctacgtagat aagtagcatg atgctgggga tgcggtgggc tctatggctc tagagcatgg ctacgtagat aagtagcatg
85208520
gcgggttaat cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc gcgggttaat cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc
85808580
ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctctctgcgc gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg
86408640
cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg gcgcgcctcg aggcatgcgg cggcctcagt gagcgagcga gcgcgcagct gcctgcaggg gcgcgcctcg aggcatgcgg
87008700
taccaagctt gtcgagaagt actagaggat cataatcagc cataccacat ttgtagaggt taccaagctt gtcgagaagt actagaggat cataatcagc cataccacat ttgtagaggt
87608760
tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc
88208820
aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat
88808880
cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact
89408940
catcaatgta tcttatcatg tctggatctg atcactgata tcgcctagga gatccgaacc catcaatgta tcttatcatg tctggatctg atcactgata tcgcctagga gatccgaacc
90009000
agataagtga aatctagttc caaactattt tgtcattttt aattttcgta ttagcttacg agataagtga aatctagttc caaactattt tgtcattttt aattttcgta ttagcttacg
90609060
acgctacacc cagttcccat ctattttgtc actcttccct aaataatcct taaaaactcc acgctacacc cagttcccat ctattttgtc actcttccct aaataatcct taaaaactcc
91209120
atttccaccc ctcccagttc ccaactattt tgtccgccca cagcggggca tttttcttcc atttccaccc ctcccagttc ccaactattt tgtccgccca cagcggggca tttttcttcc
91809180
tgttatgttt ttaatcaaac atcctgccaa ctccatgtga caaaccgtca tcttcggcta tgttatgttt ttaatcaaac atcctgccaa ctccatgtga caaaccgtca tcttcggcta
92409240
ctttttctct gtcacagaat gaaaattttt ctgtcatctc ttcgttatta atgtttgtaa ctttttctct gtcacagaat gaaaattttt ctgtcatctc ttcgttatta atgtttgtaa
93009300
ttgactgaat atcaacgctt atttgcagcc tgaatggcga atgggacgcg ccctgtagcg ttgactgaat atcaacgctt atttgcagcc tgaatggcga atgggacgcg ccctgtagcg
93609360
gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg
94209420
ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc
94809480
cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc
95409540
tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga
96009600
cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa
96609660
ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga
97209720
tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca
97809780
aaatattaac gtttacaatt tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta aaatattaac gtttacaatt tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta
98409840
tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat
99009900
aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc
99609960
ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga
1002010020
aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca
1008010080
acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt
1014010140
ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg
1020010200
gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc
1026010260
atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata
1032010320
acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt acactgcggc caacttactt ctgacaacga tcggaggacc gaagggagcta accgcttttt
1038010380
tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag
1044010440
ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca
1050010500
aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg
1056010560
aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg
1062010620
ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag
1068010680
atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg
1074010740
aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag
1080010800
accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga
1086010860
tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt
1092010920
tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc
1098010980
tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc
1104011040
cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac
1110011100
caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac
1116011160
cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt
1122011220
cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct
1128011280
gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat
1134011340
acctacagcg tgagcattga gaaagcgcca cgcttcccga agggagaaag gcggacaggt acctacagcg tgagcattga gaaagcgcca cgcttcccga agggaaaag gcggacaggt
1140011400
atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg
1146011460
cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt
1152011520
gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt
1158011580
tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg
1164011640
tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg
1170011700
agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat tttctcctta agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat tttctcctta
1176011760
cgcatctgtg cggtatttca caccgcagac cagccgcgta acctggcaaa atcggttacg cgcatctgtg cggtatttca caccgcagac cagccgcgta acctggcaaa atcggttacg
1182011820
gttgagtaat aaatggatgc cctgcgtaag cgggtgtggg cggacaataa agtcttaaac gttgagtaat aaatggatgc cctgcgtaag cgggtgtggg cggacaataa agtcttaaac
1188011880
tgaacaaaat agatctaaac tatgacaata aagtcttaaa ctagacagaa tagttgtaaa tgaacaaaat agatctaaac tatgacaata aagtcttaaa ctagacagaa tagttgtaaa
1194011940
ctgaaatcag tccagttatg ctgtgaaaaa gcatactgga cttttgttat ggctaaagca ctgaaatcag tccagttatg ctgtgaaaaa gcatactgga cttttgttat ggctaaagca
1200012000
aactcttcat tttctgaagt gcaaattgcc cgtcgtatta aagaggggcg tggccaaggg aactcttcat tttctgaagt gcaaattgcc cgtcgtatta aagaggggcg tggccaaggg
1206012060
catggtaaag actatattcg cggcgttgtg acaatttacc gaacaactcc gcggccggga catggtaaag actatattcg cggcgttgtg acaatttacc gaacaactcc gcggccggga
1212012120
agccgatctc ggcttgaacg aattgttagg tggcggtact tgggtcgata tcaaagtgca agccgatctc ggcttgaacg aattgttagg tggcggtact tgggtcgata tcaaagtgca
1218012180
tcacttcttc ccgtatgccc aactttgtat agagagccac tgcgggatcg tcaccgtaat tcacttcttc ccgtatgccc aactttgtat agagagccac tgcgggatcg tcaccgtaat
1224012240
ctgcttgcac gtagatcaca taagcaccaa gcgcgttggc ctcatgcttg aggagattga ctgcttgcac gtagatcaca taagcaccaa gcgcgttggc ctcatgcttg aggagattga
1230012300
tgagcgcggt ggcaatgccc tgcctccggt gctcgccgga gactgcgaga tcatagatat tgagcgcggt ggcaatgccc tgcctccggt gctcgccgga gactgcgaga tcatagatat
1236012360
agatctcact acgcggctgc tcaaacctgg gcagaacgta agccgcgaga gcgccaacaa agatctcact acgcggctgc tcaaacctgg gcagaacgta agccgcgaga gcgccaacaa
1242012420
ccgcttcttg gtcgaaggca gcaagcgcga tgaatgtctt actacggagc aagttcccga ccgcttcttg gtcgaaggca gcaagcgcga tgaatgtctt actacggagc aagttcccga
1248012480
ggtaatcgga gtccggctga tgttgggagt aggtggctac gtctccgaac tcacgaccga ggtaatcgga gtccggctga tgttgggagt aggtggctac gtctccgaac tcacgaccga
1254012540
aaagatcaag agcagcccgc atggatttga cttggtcagg gccgagccta catgtgcgaa aaagatcaag agcagcccgc atggatttga cttggtcagg gccgagccta catgtgcgaa
1260012600
tgatgcccat acttgagcca cctaactttg ttttagggcg actgccctgc tgcgtaacat tgatgcccat acttgagcca cctaactttg ttttagggcg actgccctgc tgcgtaacat
1266012660
cgttgctgct gcgtaacatc gttgctgctc cataacatca aacatcgacc cacggcgtaa cgttgctgct gcgtaacatc gttgctgctc cataacatca aacatcgacc cacggcgtaa
1272012720
cgcgcttgct gcttggatgc ccgaggcata gactgtacaa aaaaacagtc ataacaagcc cgcgcttgct gcttggatgc ccgaggcata gactgtacaa aaaaacagtc ataacaagcc
1278012780
atgaaaaccg ccactgcgcc gttaccaccg ctgcgttcgg tcaaggttct ggaccagttg atgaaaaccg ccactgcgcc gttaccaccg ctgcgttcgg tcaaggttct ggaccagttg
1284012840
cgtgagcgca tacgctactt gcattacagt ttacgaaccg aacaggctta tgtcaactgg cgtgagcgca tacgctactt gcattacagt ttacgaaccg aacaggctta tgtcaactgg
1290012900
gttcgtgcct tcatccgttt ccacggtgtg cgtcacccgg caaccttggg cagcagcgaa gttcgtgcct tcatccgttt ccacggtgtg cgtcacccgg caaccttggg cagcagcgaa
1296012960
gtcgaggcat ttctgtcctg gctggcgaac gagcgcaagg tttcggtctc cacgcatcgt gtcgaggcat ttctgtcctg gctggcgaac gagcgcaagg tttcggtctc cacgcatcgt
1302013020
caggcattgg cggccttgct gttcttctac ggcaaggtgc tgtgcacgga tctgccctgg caggcattgg cggccttgct gttcttctac ggcaaggtgc tgtgcacgga tctgccctgg
1308013080
cttcaggaga tcggaagacc tcggccgtcg cggcgcttgc cggtggtgct gaccccggat cttcaggaga tcggaagacc tcggccgtcg cggcgcttgc cggtggtgct gaccccggat
1314013140
gaagtggttc gcatcctcgg ttttctggaa ggcgagcatc gtttgttcgc ccaggactct gaagtggttc gcatcctcgg ttttctggaa ggcgagcatc gtttgttcgc ccaggactct
1320013200
agctatagtt ctagtggttg gctacgtata ctccggaata ttaatagatc atggagataa agctatagtt ctagtggttg gctacgtata ctccggaata ttaatagatc atggagataa
1326013260
ttaaaatgat aaccatctcg caaataaata agtattttac tgttttcgta acagttttgt ttaaaatgat aaccatctcg caaataaata agtattttac tgttttcgta acagttttgt
1332013320
aataaaaaaa cctataaata ttccggatta ttcataccgt cccaccatcg ggcgcggatc aataaaaaaa cctataaata ttccggatta ttcataccgt cccaccatcg ggcgcggatc
1338013380
tcggtccgaa accatgtcgt actaccatca ccatcaccat cacgattacg atatcccaac tcggtccgaa accatgtcgt actaccatca ccatcaccat cacgattacg atatcccaac
1344013440
gaccgaaaac ctgtattttc agggcgccat gggatcc gaccgaaaac ctgtattttc agggcgccat gggatcc
1347713477
<210> 216<210> 216
<211> 11180<211> 11180
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 216<400> 216
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat
60 60
aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg
120 120
aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta
180 180
gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt
240 240
atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt
300 300
gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt
360 360
tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac
420 420
aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag
480 480
taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt
540 540
gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac
600 600
tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag
660 660
cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat
720 720
gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc
780 780
cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata
840 840
aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat
900 900
agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt
960 960
ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag
10201020
tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag
10801080
tcaataggga ctttccattg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tcaataggga ctttccatg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa
11401140
tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag
12001200
catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag
12601260
aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa
13201320
ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata
13801380
tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg
14401440
gtaagtcact gactgtctat gcctgggaaa gggtgggcag gagatggggc agtgcaggaa gtaagtcact gactgtctat gcctgggaaa gggtggggcag gagatggggc agtgcaggaa
15001500
aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct
15601560
cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaga tagaattatc cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaga tagaattatc
16201620
tacttgtttt tttctttgtc tgctcaggtt ctgcttctct gctacaagga ggtattactt tacttgtttt tttctttgtc tgctcaggtt ctgcttctct gctacaagga ggtattactt
16801680
aggtgctgta gagttatctt gggactacat gcagtctgat cttggggagc tccctgtgga aggtgctgta gagttatctt gggactacat gcagtctgat cttggggagc tccctgtgga
17401740
tgcaagattt ccccctagag tacctaaaag tttccctttc aacacaagtg tggtgtataa tgcaagattt ccccctagag tacctaaaag tttccctttc aacacaagtg tggtgtataa
18001800
gaagactctg tttgttgagt tcacagatca ccttttcaat attgccaagc ccagaccccc gaagactctg tttgttgagt tcacagatca ccttttcaat attgccaagc ccagaccccc
18601860
ctggatgggt ctactggggc caacaattca agcagaggta tatgatacag tggtgatcac ctggatgggt ctactggggc caacaattca agcagaggta tatgatacag tggtgatcac
19201920
attaaagaac atggcatccc accctgtaag cctgcatgct gttggtgtgt cctattggaa attaaagaac atggcatccc accctgtaag cctgcatgct gttggtgtgt cctattggaa
19801980
agcaagtgaa ggtgctgaat atgatgatca aacatcccaa agagagaagg aagatgacaa agcaagtgaa ggtgctgaat atgatgatca aacatcccaa agagagaagg aagatgacaa
20402040
agtcttccca ggtggctctc acacctatgt gtggcaagtg ctcaaggaaa atgggcctat agtcttccca ggtggctctc acacctatgt gtggcaagtg ctcaaggaaa atgggcctat
21002100
ggctagtgat ccattgtgcc tcacatatag ctacctgtcc catgtggact tagttaaaga ggctagtgat ccattgtgcc tcacatatag ctacctgtcc catgtggact tagttaaaga
21602160
tctgaactca ggtctgattg gtgccctgct ggtctgtagg gaaggatcac tagctaaaga tctgaactca ggtctgattg gtgccctgct ggtctgtagg gaaggatcac tagctaaaga
22202220
aaaaacccag actttacaca agttcatctt attatttgct gtttttgatg agggaaagag aaaaacccag actttacaca agttcatctt attatttgct gtttttgatg agggaaagag
22802280
ctggcactca gagactaaga attcactcat gcaggataga gatgcagctt ctgctagagc ctggcactca gagactaaga attcactcat gcaggataga gatgcagctt ctgctagagc
23402340
atggccaaaa atgcatactg tgaatgggta tgttaacagg agtctgcctg gcctcatagg atggccaaaa atgcatactg tgaatgggta tgttaacagg agtctgcctg gcctcatagg
24002400
ctgccataga aaatcagtgt actggcatgt cataggtatg ggcactactc ctgaggtgca ctgccataga aaatcagtgt actggcatgt cataggtatg ggcactactc ctgaggtgca
24602460
ttccattttt ttggaggggc atactttcct tgtaagaaac cacaggcagg cttcattgga ttccatttt ttggaggggc atactttcct tgtaagaaac cacaggcagg cttcattgga
25202520
aattagtcca ataacctttc tcacagccca gactctgcta atggacttgg ggcagttttt aattagtcca ataacctttc tcacagccca gactctgcta atggacttgg ggcagttttt
25802580
attattttgt cacattagct ctcatcagca tgatggaatg gaagcctatg ttaaggttga attattttgt cacattagct ctcatcagca tgatggaatg gaagcctatg ttaaggttga
26402640
ttcctgccca gaagagcccc agttgagaat gaagaacaat gaggaagcag aagactatga ttcctgccca gaagagcccc agttgagaat gaagaacaat gaggaagcag aagactatga
27002700
tgatgatcta acagactcag aaatggatgt tgtgagattt gatgatgata actccccaag tgatgatcta acagactcag aaatggatgt tgtgagattt gatgatgata actccccaag
27602760
ttttattcag atcaggtcag tggccaagaa acatccaaaa acatgggttc attatattgc ttttattcag atcaggtcag tggccaagaa acatccaaaa acatgggttc attatattgc
28202820
agcagaagaa gaagactggg attatgcacc cttggtatta gcccctgatg acagaagcta agcagaagaa gaagactggg attatgcacc cttggtatta gcccctgatg acagaagcta
28802880
taagtcacaa tatctcaaca atggacccca gagaattggc agaaagtaca aaaaagtcag taagtcacaa tatctcaaca atggacccca gagaattggc agaaagtaca aaaaagtcag
29402940
gtttatggct tatactgatg agactttcaa aactagagag gctattcaac atgaatctgg gtttatggct tatactgatg agactttcaa aactagagag gctattcaac atgaatctgg
30003000
catcctaggt cctttgttat atggggaagt aggggacacc ttattaatta tatttaaaaa catcctaggt cctttgttat atggggaagt aggggacacc ttattaatta tatttaaaaa
30603060
ccaggccagt aggccttaca acatttaccc ccacggtata acagatgtca gaccactgta ccaggccagt aggccttaca acatttaccc ccacggtata acagatgtca gaccactgta
31203120
ctcaaggagg ctaccaaaag gggtgaagca cctaaaagac ttccccatcc tacctggtga ctcaaggagg ctaccaaaag gggtgaagca cctaaaagac ttccccatcc tacctggtga
31803180
gattttcaag tataagtgga cagtgactgt agaagatggt ccaaccaaat cagatcccag gattttcaag tataagtgga cagtgactgt agaagatggt ccaaccaaat cagatcccag
32403240
atgcctgaca aggtactaca gtagctttgt aaatatggag agagacctgg cctcagggtt atgcctgaca aggtactaca gtagctttgt aaatatggag agagacctgg cctcagggtt
33003300
aatagggccc ctactgatct gctacaagga gagtgtagac caaagaggca accaaattat aatagggccc ctactgatct gctacaagga gagtgtagac caaagaggca accaaattat
33603360
gtcagacaag agaaatgtca tcctctttag tgtttttgat gagaataggt cctggtacct gtcagacaag agaaatgtca tcctctttag tgtttttgat gagaataggt cctggtacct
34203420
gacagaaaat atccaaagat tccttccaaa tccagcaggg gtacaactgg aggaccctga gacagaaaat atccaaagat tccttccaaa tccagcaggg gtacaactgg aggaccctga
34803480
gttccaggcc tccaatatca tgcacagcat caatggttat gtgtttgaca gtttgcaact gttccaggcc tccaatatca tgcacagcat caatggttat gtgtttgaca gtttgcaact
35403540
ttcagtgtgc cttcatgagg ttgcatactg gtatatactt tctatagggg cccagacaga ttcagtgtgc cttcatgagg ttgcatactg gtatatactt tctatagggg cccagacaga
36003600
cttcttgtca gttttctttt caggctatac tttcaagcat aagatggtat atgaagatac cttcttgtca gttttctttt caggctatac tttcaagcat aagatggtat atgaagatac
36603660
cctgactctt tttcccttta gtggtgagac agttttcatg tcaatggaaa acccagggct cctgactctt tttcccttta gtggtgagac agttttcatg tcaatggaaa acccagggct
37203720
ttggatcttg ggatgccaca actctgactt tagaaacaga ggcatgactg cccttttaaa ttggatcttg ggatgccaca actctgactt tagaaacaga ggcatgactg cccttttaaa
37803780
ggtgtcctct tgtgataaga atactggaga ctactatgag gacagctatg aggacatttc ggtgtcctct tgtgataaga atactggaga ctactatgag gacagctatg aggacatttc
38403840
agcctatctg ctgtcaaaaa ataatgctat agagccaagg tcattttctc aaaatcctcc agcctatctg ctgtcaaaaa ataatgctat agagccaagg tcattttctc aaaatcctcc
39003900
tgtcctgaag aggcaccaaa gagagataac caggactacc ttacagtctg accaggagga tgtcctgaag aggcaccaaa gagagataac caggactacc ttacagtctg accaggagga
39603960
aattgattat gatgacacaa taagtgtgga gatgaaaaag gaggattttg atatttatga aattgattat gatgacacaa taagtgtgga gatgaaaaag gaggattttg atatttatga
40204020
tgaggatgaa aaccaatctc caagatcttt ccagaagaag actagacact atttcattgc tgaggatgaa aaccaatctc caagatcttt ccagaagaag actagacact atttcattgc
40804080
tgcagtggaa agactgtggg actatggaat gtcctccagc cctcatgttc tcaggaatag tgcagtggaa agactgtggg actatggaat gtcctccagc cctcatgttc tcaggaatag
41404140
ggctcaaagt ggttctgtgc cacagttcaa gaaggtggtg tttcaggaat tcacagatgg ggctcaaagt ggttctgtgc cacagttcaa gaaggtggtg tttcaggaat tcacagatgg
42004200
gtcctttact caaccactgt ataggggaga actcaatgaa catctaggat tactaggtcc gtcctttact caaccactgt ataggggaga actcaatgaa catctaggat tactaggtcc
42604260
ctacattaga gctgaggtgg aggacaatat catggtcact ttcaggaacc aggcatctag ctacattaga gctgaggtgg aggacaatat catggtcact ttcaggaacc aggcatctag
43204320
accatactct ttttacagct ccttgatatc ttatgaagag gaccagagac agggtgcaga accatactct ttttacagct ccttgatatc ttatgaagag gaccagagac agggtgcaga
43804380
acccaggaag aactttgtga aacccaatga gaccaaaaca tacttctgga aggtccagca acccaggaag aactttgtga aacccaatga gaccaaaaca tacttctgga aggtccagca
44404440
tcatatggct cctaccaagg atgaatttga ctgcaaagcc tgggcttact tctcagatgt tcatatggct cctaccaagg atgaatttga ctgcaaagcc tgggcttact tctcagatgt
45004500
ggatttggag aaagatgtgc acagtggctt gattgggcct cttttggtat gtcataccaa ggatttggag aaagatgtgc acagtggctt gattgggcct cttttggtat gtcataccaa
45604560
caccttaaac cctgctcatg gaagacaagt aacagtgcaa gagtttgccc tctttttcac caccttaaac cctgctcatg gaagacaagt aacagtgcaa gagtttgccc tctttttcac
46204620
tatatttgat gagacaaaaa gttggtactt tactgagaat atggagagga actgcagggc tatatttgat gagacaaaaa gttggtactt tactgagaat atggagagga actgcagggc
46804680
tccctgcaat atacagatgg aggatcctac tttcaaggaa aactataggt ttcatgccat tccctgcaat atacagatgg aggatcctac tttcaaggaa aactataggt ttcatgccat
47404740
taatggctat atcatggata cattgcctgg cttagttatg gcccaggatc agagaatcag taatggctat atcatggata cattgcctgg cttagttatg gcccaggatc agagaatcag
48004800
atggtacctc cttagtatgg gaagcaatga aaacatacat tctattcact tcagtggaca atggtacctc cttagtatgg gaagcaatga aaacatacat tctattcact tcagtggaca
48604860
tgtctttact gtgagaaaaa aggaagagta caagatggca ctgtacaatc tgtaccctgg tgtctttact gtgagaaaaa aggaagagta caagatggca ctgtacaatc tgtaccctgg
49204920
agtgtttgag acagttgaga tgctgcccag caaggctggg atctggaggg tagaatgcct agtgtttgag acagttgaga tgctgcccag caaggctggg atctggaggg tagaatgcct
49804980
gattggagaa cacttacatg caggtatgtc cactctattc ttggtctatt ccaacaagtg gattggagaa cacttacatg caggtatgtc cactctattc ttggtctatt ccaacaagtg
50405040
tcagaccccc ctaggcatgg catctggcca tattagagat ttccagataa ctgcttctgg tcagaccccc ctaggcatgg catctggcca tattagagat ttccagataa ctgcttctgg
51005100
tcagtatggc cagtgggccc ccaagcttgc tagacttcac tacagtggtt caataaatgc tcagtatggc cagtgggccc ccaagcttgc tagacttcac tacagtggtt caataaatgc
51605160
ctggtccacc aaggagccct tcagctggat taaagtggac ttgctagccc ccatgatcat ctggtccacc aaggagccct tcagctggat taaagtggac ttgctagccc ccatgatcat
52205220
tcatgggata aaaacacagg gtgccagaca gaaattttca tctctgtaca tcagccagtt tcatgggata aaaacacagg gtgccagaca gaaattttca tctctgtaca tcagccagtt
52805280
tatcatcatg tacagtctgg atggcaaaaa atggcagacc tacagaggta actctacagg tatcatcatg tacagtctgg atggcaaaaa atggcagacc tacagaggta actctacagg
53405340
tacactaatg gtattttttg gcaatgtaga ttcatcaggt atcaagcata atatctttaa tacactaatg gtattttttg gcaatgtaga ttcatcaggt atcaagcata atatctttaa
54005400
tcctcccatt attgccagat acatcaggtt gcacccaact cattacagta taagatccac tcctcccatt attgccagat acatcaggtt gcacccaact cattacagta taagatccac
54605460
tttaaggatg gagcttatgg ggtgtgacct taatagctgc agtatgccct tgggaatgga tttaaggatg gagcttatgg ggtgtgacct taatagctgc agtatgccct tgggaatgga
55205520
aagtaaggcc atatcagatg cccagattac tgcaagcagc tactttacaa acatgtttgc aagtaaggcc atatcagatg cccagattac tgcaagcagc tactttacaa acatgtttgc
55805580
aacctggtct cctagtaaag ccaggctgca cttgcagggt aggagcaatg catggagacc aacctggtct cctagtaaag ccaggctgca cttgcagggt aggagcaatg catggagacc
56405640
ccaggtcaat aacccaaaag agtggcttca agttgacttt caaaagacaa tgaaggtaac ccaggtcaat aacccaaaag agtggcttca agttgacttt caaaagacaa tgaaggtaac
57005700
aggggtaacc acccaagggg taaagagtct gctgacatct atgtatgtaa aagaattcct aggggtaacc acccaagggg taaagagtct gctgacatct atgtatgtaa aagaattcct
57605760
catctcaagt agtcaagatg ggcaccagtg gacactgttc ttccagaatg gaaaagttaa catctcaagt agtcaagatg ggcaccagtg gacactgttc ttccagaatg gaaaagttaa
58205820
ggtgttccaa ggtaatcaag acagcttcac tccagtggtg aacagtctgg atccaccact ggtgttccaa ggtaatcaag acagcttcac tccagtggtg aacagtctgg atccaccact
58805880
cctaaccagg tacctgagga tccaccctca gtcctgggtc caccagatag ctctgagaat cctaaccagg tacctgagga tccaccctca gtcctgggtc caccagatag ctctgagaat
59405940
ggaagtgctg ggctgtgaag ctcaggacct atactgatta attaataaaa tacagcatag ggaagtgctg ggctgtgaag ctcaggacct atactgatta attaataaaa tacagcatag
60006000
caaaacttta acctccaaat caagcctcta cttgaatcct tttctgaggg atgaataagg caaaacttta acctccaaat caagcctcta cttgaatcct tttctgaggg atgaataagg
60606060
cataggcatc aggggctgtt gccaatgtgc attagctgtt tgcagcctca ccttctttca cataggcatc aggggctgtt gccaatgtgc attagctgtt tgcagcctca ccttctttca
61206120
tggagtttaa gatatagtgt attttcccaa ggtttgaact agctcttcat ttctttatgt tggagtttaa gatatagtgt attttcccaa ggtttgaact agctcttcat ttctttatgt
61806180
tttaaatgca ctgacctccc acattccctt tttagtaaaa tattcagaaa taatttaaat tttaaatgca ctgacctccc acattccctt tttagtaaaa tattcagaaa taatttaaat
62406240
acatcattgc aatgaaaata aatgtttttt attaggcaga atccagatgc tcaaggccct acatcattgc aatgaaaata aatgtttttt attaggcaga atccagatgc tcaaggccct
63006300
tcataatatc ccccagttta gtagttggac ttagggaaca aaggaacctt taatagaaat tcataatatc ccccagttta gtagttggac ttagggaaca aaggaacctt taatagaaat
63606360
tggacagcaa gaaagcgagc tccataaagt aggaaacact acacgattcc ataaagtagg tggacagcaa gaaagcgagc tccataaagt aggaaacact acacgattcc ataaagtagg
64206420
aaacactaca tcactccata aagtaggaaa cactacacag acatgataag atacattgat aaacactaca tcactccata aagtaggaaa cactacacag acatgataag atacattgat
64806480
gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt gagtttggac aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt
65406540
gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat gatgctattg ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat
66006600
tgcattcatt ttatgtttca ggttcagggg gagatgtggg aggtttttta aagcaagtaa tgcattcatt ttatgtttca ggttcagggg gagatgtggg aggtttttta aagcaagtaa
66606660
aacctctaca aatgtggtac ttaagcatgg ctacgtagat aagtagcatg gcgggttaat aacctctaca aatgtggtac ttaagcatgg ctacgtagat aagtagcatg gcgggttaat
67206720
cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc ctctctgcgc cattaactac acctgcagga ggaaccccta gtgatggagt tggccactcc ctctctgcgc
67806780
gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg cggcctcagt
68406840
gagcgagcga gcgcgcagct gcctgcaggg gcgcgccgct agcagctgat gcatagcatg gagcgagcga gcgcgcagct gcctgcaggg gcgcgccgct agcagctgat gcatagcatg
69006900
cggtaccggg agatggggga ggctaactga aacacggaag gagacaatac cggaaggaac cggtaccggg agatggggga ggctaactga aacacggaag gagacaatac cggaaggaac
69606960
ccgcgctatg acggcaataa aaagacagaa taaaacgcac gggtgttggg tcgtttgttc ccgcgctatg acggcaataa aaagacagaa taaaacgcac gggtgttggg tcgtttgttc
70207020
ataaacgcgg ggttcggtcc cagggctggc actctgtcga taccccaccg agaccccatt ataaacgcgg ggttcggtcc cagggctggc actctgtcga taccccaccg agaccccatt
70807080
gggaccaata cgcccgcgtt tcttcctttt ccccacccca acccccaagt tcgggtgaag gggaccaata cgcccgcgtt tcttcctttt ccccacccca acccccaagt tcgggtgaag
71407140
gcccagggct cgcagccaac gtcggggcgg caagccctgc catagccact acgggtacgt gcccagggct cgcagccaac gtcggggcgg caagccctgc catagccact acgggtacgt
72007200
aggccaacca ctagaactat agctagagtc ctgggcgaac aaacgatgct cgccttccag aggccaacca ctagaactat agctagagtc ctgggcgaac aaacgatgct cgccttccag
72607260
aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc gccgcgacgg aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc gccgcgacgg
73207320
ccgaggtcta ccgatctcct gaagccaggg cagatccgtg cacagcacct tgccgtagaa ccgaggtcta ccgatctcct gaagccaggg cagatccgtg cacagcacct tgccgtagaa
73807380
gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc gctcgttcgc gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc gctcgttcgc
74407440
cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt gacgcacacc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt gacgcacacc
75007500
gtggaaacgg atgaaggcac gaacccagtt gacataagcc tgttcggttc gtaaactgta gtggaaacgg atgaaggcac gaacccagtt gacataagcc tgttcggttc gtaaactgta
75607560
atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac gcagcggtgg atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac gcagcggtgg
76207620
taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgtac agtctatgcc taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgtac agtctatgcc
76807680
tcgggcatcc aagcagcaag cgcgttacgc cgtgggtcga tgtttgatgt tatggagcag tcgggcatcc aagcagcaag cgcgttacgc cgtgggtcga tgtttgatgt tatggagcag
77407740
caacgatgtt acgcagcagc aacgatgtta cgcagcaggg cagtcgccct aaaacaaagt caacgatgtt acgcagcagc aacgatgtta cgcagcaggg cagtcgccct aaaacaaagt
78007800
taggtggctc aagtatgggc atcattcgca catgtaggct cggccctgac caagtcaaat taggtggctc aagtatgggc atcattcgca catgtaggct cggccctgac caagtcaaat
78607860
ccatgcgggc tgctcttgat cttttcggtc gtgagttcgg agacgtagcc acctactccc ccatgcgggc tgctcttgat cttttcggtc gtgagttcgg agacgtagcc acctactccc
79207920
aacatcagcc ggactccgat tacctcggga acttgctccg tagtaagaca ttcatcgcgc aacatcagcc ggactccgat tacctcggga acttgctccg tagtaagaca ttcatcgcgc
79807980
ttgctgcctt cgaccaagaa gcggttgttg gcgctctcgc ggcttacgtt ctgcccaggt ttgctgcctt cgaccaagaa gcggttgttg gcgctctcgc ggcttacgtt ctgcccaggt
80408040
ttgagcagcc gcgtagtgag atctatatct atgatctcgc agtctccggc gagcaccgga ttgagcagcc gcgtagtgag atctatatct atgatctcgc agtctccggc gagcaccgga
81008100
ggcagggcat tgccaccgcg ctcatcaatc tcctcaagca tgaggccaac gcgcttggtg ggcagggcat tgccaccgcg ctcatcaatc tcctcaagca tgaggccaac gcgcttggtg
81608160
cttatgtgat ctacgtgcaa gcagattacg gtgacgatcc cgcagtggct ctctatacaa cttatgtgat ctacgtgcaa gcagattacg gtgacgatcc cgcagtggct ctctatacaa
82208220
agttgggcat acgggaagaa gtgatgcact ttgatatcga cccaagtacc gccacctaac agttgggcat acgggaagaa gtgatgcact ttgatatcga cccaagtacc gccacctaac
82808280
aattcgttca agccgagatc ggcttcccgg ccgcggagtt gttcggtaaa ttgtcacaac aattcgttca agccgagatc ggcttcccgg ccgcggagtt gttcggtaaa ttgtcacaac
83408340
gccgcgaata tagtctttac catgcccttg gccacgcccc tctttaatac gacgggcaat gccgcgaata tagtctttac catgcccttg gccacgcccc tctttaatac gacgggcaat
84008400
ttgcacttca gaaaatgaag agtttgcttt agccataaca aaagtccagt atgctttttc ttgcacttca gaaaatgaag agtttgcttt agccataaca aaagtccagt atgctttttc
84608460
acagcataac tggactgatt tcagtttaca actattctgt ctagtttaag actttattgt acagcataac tggactgatt tcagtttaca actattctgt ctagtttaag actttattgt
85208520
catagtttag atctattttg ttcagtttaa gactttattg tccgcccaca cccgcttacg catagtttag atctattttg ttcagtttaa gactttattg tccgcccaca cccgcttacg
85808580
cagggcatcc atttattact caaccgtaac cgattttgcc aggttacgcg gctggtctgc cagggcatcc atttattact caaccgtaac cgattttgcc aggttacgcg gctggtctgc
86408640
ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt
87008700
cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact
87608760
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag
88208820
caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata
88808880
ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc
89408940
cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg
90009000
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc
90609060
tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg
91209120
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc
91809180
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga
92409240
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg
93009300
gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa
93609360
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg
94209420
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt
94809480
ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat
95409540
tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct
96009600
aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta
96609660
tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa
97209720
ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac
97809780
gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa
98409840
gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag
99009900
taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg
99609960
tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag
1002010020
ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg
1008010080
tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc tcagaagtaa gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc
1014010140
ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat ttactgtcat gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat
1020010200
tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata
1026010260
ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa
1032010320
aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca aactctcaag gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca
1038010380
actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc actgatcttc agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc
1044010440
aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc
1050010500
tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg tttttcaata ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg
1056010560
aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac
1062010620
ctgaaattgt aaacgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct ctgaaattgt aaacgttaat attttgttaa aattcgcgtt aaatttttgt taaatcagct
1068010680
cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa gaatagaccg
1074010740
agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag aacgtggact
1080010800
ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt gaaccatcac
1086010860
cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac cctaaaggga
1092010920
gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag gaagggaaga
1098010980
aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg cgcgtaacca
1104011040
ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc ccattcgcca ttcaggctgc ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc ccattcgcca ttcaggctgc
1110011100
aaataagcgt tgatattcag tcaattacaa acattaataa cgaagagatg acagaaaaat aaataagcgt tgatattcag tcaattacaa acattaataa cgaagagatg acagaaaaat
1116011160
tttcattctg tgacagagaa tttcattctg tgacagagaa
1118011180
<210> 217<210> 217
<211> 13862<211> 13862
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 217<400> 217
aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat aaagtagccg aagatgacgg tttgtcacat ggagttggca ggatgtttga ttaaaaacat
60 60
aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg aacaggaaga aaaatgcccc gctgtgggcg gacaaaatag ttgggaactg ggaggggtgg
120 120
aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta aaatggagtt tttaaggatt atttagggaa gagtgacaaa atagatggga actgggtgta
180 180
gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt gcgtcgtaag ctaatacgaa aattaaaaat gacaaaatag tttggaacta gatttcactt
240 240
atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt atctggttcg gatctcctag gctcaagcag tgatcagatc cagacatgat aagatacatt
300 300
gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt
360 360
tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac
420 420
aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag
480 480
taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt taaaacctct acaaatgtgg tatggctgat tatgatcctc tagtacttct cgacaagctt
540 540
gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac gtcgagactg caggctctag aggccggccc ctgcaggcag ctgcgcgctc gctcgctcac
600 600
tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt ggtcgcccgg cctcagtgag
660 660
cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat cgagcgagcg cgcagagagg gagtggccaa ctccatcact aggggttcct tgtagttaat
720 720
gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc gattaacccg ccatgctact tatctacgta gccatgcata tggagtcaat gggaaaaacc
780 780
cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata cattggagcc aagtacactg actcaatagg gactttccat tgggttttgc ccagtacata
840 840
aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat aggtcaatag ggggtgagtc aacaggaaag tcccattgga gccaagtaca ttgagtcaat
900 900
agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt agggactttc caatgggttt tgcccagtac ataaggtcaa tgggaggtaa gccaatgggt
960 960
ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag ttttcccatt actgacatgt atactgagtc attagggact ttccaatggg ttttgcccag
10201020
tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag tacataaggt caataggggt gaatcaacag gaaagtccca ttggagccaa gtacactgag
10801080
tcaataggga ctttccattg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa tcaataggga ctttccatg ggttttgccc agtacaaaag gtcaataggg ggtgagtcaa
11401140
tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag tgggtttttc ccattattgg cacatacata aggtcaatag gggtgactag tggagaagag
12001200
catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag catgcttgag ggctgagtgc ccctcagtgg gcagagagca catggcccac agtccctgag
12601260
aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa aagttggggg gaggggtggg caattgaact ggtgcctaga gaaggtgggg cttgggtaaa
13201320
ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata ctgggaaagt gatgtggtgt actggctcca cctttttccc cagggtgggg gagaaccata
13801380
tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg tataagtgca gtagtctctg tgaacattca agcttctgcc ttctccctcc tgtgagtttg
14401440
gtaagtcact gactgtctat gcctgggaaa gggtgggcag gagatggggc agtgcaggaa gtaagtcact gactgtctat gcctgggaaa gggtggggcag gagatggggc agtgcaggaa
15001500
aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct aagtggcact atgaaccctg cagccctaga caattgtact aaccttcttc tctttcctct
15601560
cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaaa tagagctctc cctgacaggt tggtgtacag tagcttccgt ttaaacagcc accatgcaaa tagagctctc
16201620
cacctgcttc tttctgtgcc ttttgcgatt ctgctttagt gccaccagaa gatactacct cacctgcttc tttctgtgcc ttttgcgatt ctgctttagt gccaccagaa gatactacct
16801680
gggtgcagtg gaactgtcat gggactatat gcaaagtgat ctcggtgagc tgcctgtgga gggtgcagtg gaactgtcat gggactatat gcaaagtgat ctcggtgagc tgcctgtgga
17401740
cgcaagattt cctcctagag tgccaaaatc ttttccattc aacacctcag tcgtgtacaa cgcaagattt cctcctagag tgccaaaatc ttttccattc aacacctcag tcgtgtacaa
18001800
aaagactctg tttgtagaat tcacggatca ccttttcaac atcgctaagc caaggccacc aaagactctg tttgtagaat tcacggatca ccttttcaac atcgctaagc caaggccacc
18601860
ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt tatgatacag tggtcattac ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt tatgatacag tggtcattac
19201920
acttaagaac atggcttccc atcctgtcag tcttcatgct gttggtgtat cctactggaa acttaagaac atggcttccc atcctgtcag tcttcatgct gttggtgtat cctactggaa
19801980
agcttctgag ggagctgaat atgatgatca gaccagtcaa agggagaaag aagatgataa agcttctgag ggagctgaat atgatgatca gaccagtcaa agggagaaag aagatgataa
20402040
agtcttccct ggtggaagcc atacatatgt ctggcaggtc ctgaaagaga atggtccaat agtcttccct ggtggaagcc atacatatgt ctggcaggtc ctgaaagaga atggtccaat
21002100
ggcctctgac ccactgtgcc ttacctactc atatctttct catgtggacc tggtaaaaga ggcctctgac ccactgtgcc ttacctactc atatctttct catgtggacc tggtaaaaga
21602160
cttgaattca ggcctcattg gagccctact agtatgtaga gaagggagtc tggccaagga cttgaattca ggcctcattg gagccctact agtatgtaga gaagggagtc tggccaagga
22202220
aaagacacag accttgcaca aatttatact actttttgct gtatttgatg aagggaaaag aaagacacag accttgcaca aatttatact actttttgct gtatttgatg aagggaaaag
22802280
ttggcactca gaaacaaaga actccttgat gcaggatagg gatgctgcat ctgctcgggc ttggcactca gaaacaaaga actccttgat gcaggatagg gatgctgcat ctgctcgggc
23402340
ctggcctaaa atgcacacag tcaatggtta tgtaaacagg tctctgccag gtctgattgg ctggcctaaa atgcacacag tcaatggtta tgtaaacagg tctctgccag gtctgattgg
24002400
atgccacagg aaatcagtct attggcatgt gattggaatg ggcaccactc ctgaagtgca atgccacagg aaatcagtct attggcatgt gattggaatg ggcaccactc ctgaagtgca
24602460
ctcaatattc ctcgaaggtc acacatttct tgtgaggaac catcgccagg cgtccttgga ctcaatattc ctcgaaggtc acacatttct tgtgaggaac catcgccagg cgtccttgga
25202520
aatctcgcca ataactttcc ttactgctca aacactcttg atggaccttg gacagtttct aatctcgcca ataactttcc ttactgctca aacactcttg atggaccttg gacagtttct
25802580
actgttttgt catatctctt cccaccaaca tgatggcatg gaagcttatg tcaaagtaga actgttttgt catatctctt cccaccaaca tgatggcatg gaagcttatg tcaaagtaga
26402640
cagctgtcca gaggaacccc aactacgaat gaaaaataat gaagaagcgg aagactatga cagctgtcca gaggaacccc aactacgaat gaaaaataat gaagaagcgg aagactatga
27002700
tgatgatctt actgattctg aaatggatgt ggtcaggttt gatgatgaca actctccttc tgatgatctt actgattctg aaatggatgt ggtcaggttt gatgatgaca actctccttc
27602760
ctttatccaa attcgctcag ttgccaagaa gcatcctaaa acttgggtac attacattgc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa acttgggtac attacattgc
28202820
tgctgaagag gaggactggg actatgctcc cttagtcctc gcccccgatg acagaagtta tgctgaagag gaggactggg actatgctcc cttagtcctc gcccccgatg acagaagtta
28802880
taaaagtcaa tatttgaaca atggccctca gcggattggt aggaagtaca aaaaagtccg taaaagtcaa tatttgaaca atggccctca gcggattggt aggaagtaca aaaaagtccg
29402940
atttatggca tacacagatg aaacctttaa gactcgtgaa gctattcagc atgaatcagg atttatggca tacacagatg aaacctttaa gactcgtgaa gctattcagc atgaatcagg
30003000
aatcttggga cctttacttt atggggaagt tggagacaca ctgttgatta tatttaagaa aatcttggga cctttacttt atggggaagt tggagacaca ctgttgatta tatttaagaa
30603060
tcaagcaagc agaccatata acatctaccc tcacggaatc actgatgtcc gtcctttgta tcaagcaagc agaccatata acatctaccc tcacggaatc actgatgtcc gtcctttgta
31203120
ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat tttccaattc tgccaggaga ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat tttccaattc tgccaggaga
31803180
aatattcaaa tataaatgga cagtgactgt agaagatggg ccaactaaat cagatcctcg aatattcaaa tataaatgga cagtgactgt agaagatggg ccaactaaat cagatcctcg
32403240
gtgcctgacc cgctattact ctagtttcgt taatatggag agagatctag cttcaggact gtgcctgacc cgctattact ctagtttcgt taatatggag agagatctag cttcaggact
33003300
cattggccct ctcctcatct gctacaaaga atctgtagat caaagaggaa accagataat cattggccct ctcctcatct gctacaaaga atctgtagat caaagaggaa accagataat
33603360
gtcagacaag aggaatgtca tcctgttttc tgtatttgat gagaaccgaa gctggtacct gtcagacaag aggaatgtca tcctgttttc tgtatttgat gagaaccgaa gctggtacct
34203420
cacagagaat atacaacgct ttctccccaa tccagctgga gtgcagcttg aggatccaga cacagagaat atacaacgct ttctccccaa tccagctgga gtgcagcttg aggatccaga
34803480
gttccaagcc tccaacatca tgcacagcat caatggctat gtttttgata gtttgcagtt gttccaagcc tccaacatca tgcacagcat caatggctat gtttttgata gtttgcagtt
35403540
gtcagtttgt ttgcatgagg tggcatactg gtacattcta agcattggag cacagactga gtcagtttgt ttgcatgagg tggcatactg gtacattcta agcattggag cacagactga
36003600
cttcctttct gtcttcttct ctggatatac cttcaaacac aaaatggtct atgaagacac cttcctttct gtcttcttct ctggatatac cttcaaacac aaaatggtct atgaagacac
36603660
actcacccta ttcccattct caggagaaac tgtcttcatg tcgatggaaa acccaggtct actcacccta ttcccattct caggagaaac tgtcttcatg tcgatggaaa acccaggtct
37203720
atggattctg gggtgccaca actcagactt tcggaacaga ggcatgaccg ccttactgaa atggattctg gggtgccaca actcagactt tcggaacaga ggcatgaccg ccttactgaa
37803780
ggtttctagt tgtgacaaga acactggtga ttattacgag gacagttatg aagatatttc ggtttctagt tgtgacaaga acactggtga ttattacgag gacagttatg aagatatttc
38403840
agcatacttg ctgagtaaaa acaatgccat tgaaccaaga agcttctccc agaattcaag agcatacttg ctgagtaaaa acaatgccat tgaaccaaga agcttctccc agaattcaag
39003900
acaccctagc actaggcaaa agcaatttaa tgccaccaca attccagaaa atgacataga acaccctagc actaggcaaa agcaatttaa tgccaccaca attccagaaa atgacataga
39603960
gaagactgac ccttggtttg cacacagaac acctatgcct aaaatacaaa atgtctcctc gaagactgac ccttggtttg cacacagaac acctatgcct aaaatacaaa atgtctcctc
40204020
tagtgatttg ttgatgctct tgcgacagag tcctactcca catgggctat ccttatctga tagtgatttg ttgatgctct tgcgacagag tcctactcca catgggctat ccttatctga
40804080
tctccaagaa gccaaatatg agactttttc tgatgatcca tcacctggag caatagacag tctccaagaa gccaaatatg agactttttc tgatgatcca tcacctggag caatagacag
41404140
taataacagc ctgtctgaaa tgacacactt caggccacag ctccatcaca gtggggacat taataacagc ctgtctgaaa tgacacactt caggccacag ctccatcaca gtggggacat
42004200
ggtatttacc cctgagtcag gcctccaatt aagattaaat gagaaactgg ggacaactgc ggtatttacc cctgagtcag gcctccaatt aagattaaat gagaaactgg ggacaactgc
42604260
agcaacagag ttgaagaaac ttgatttcaa agtttctagt acatcaaata atctgatttc agcaacagag ttgaagaaac ttgatttcaa agtttctagt acatcaaata atctgatttc
43204320
aacaattcca tcagacaatt tggcagcagg tactgataat acaagttcct taggaccccc aacaattcca tcagacaatt tggcagcagg tactgataat acaagttcct taggaccccc
43804380
aagtatgcca gttcattatg atagtcaatt agataccact ctatttggca aaaagtcatc aagtatgcca gttcattatg atagtcaatt agataccact ctatttggca aaaagtcatc
44404440
tccccttact gagtctggtg gacctctgag cttgagtgaa gaaaataatg attcaaagtt tccccttact gagtctggtg gacctctgag cttgagtgaa gaaaataatg attcaaagtt
45004500
gttagaatca ggtttaatga atagccaaga aagttcatgg ggaaaaaatg tatcgtcaac gttagaatca ggtttaatga atagccaaga aagttcatgg ggaaaaaatg tatcgtcaac
45604560
agagagtggt aggttattta aagggaaaag agctcatgga cctgctttgt tgactaaaga agagagtggt aggttattta aagggaaaag agctcatgga cctgctttgt tgactaaaga
46204620
taatgcctta ttcaaagtta gcatctcttt gttaaagaca aacaaaactt ccaataattc taatgcctta ttcaaagtta gcatctcttt gttaaagaca aacaaaactt ccaataattc
46804680
agcaactaat agaaagactc acattgatgg cccatcatta ttaattgaga atagtccatc agcaactaat agaaagactc acattgatgg cccatcatta ttaattgaga atagtccatc
47404740
agtctggcaa aatatattag aaagtgacac tgagtttaaa aaagtgacac ctttgattca agtctggcaa aatatattag aaagtgacac tgagtttaaa aaagtgacac ctttgattca
48004800
tgacagaatg cttatggaca aaaatgctac agctttgagg ctaaatcata tgtcaaataa tgacagaatg cttatggaca aaaatgctac agctttgagg ctaaatcata tgtcaaataa
48604860
aactacttca tcaaaaaaca tggaaatggt ccaacagaaa aaagagggcc ccattccacc aactacttca tcaaaaaaca tggaaatggt ccaacagaaa aaagaggggcc ccattccacc
49204920
agatgcacaa aatccagata tgtcgttctt taagatgcta ttcttgccag aatcagcaag agatgcacaa aatccagata tgtcgttctt taagatgcta ttcttgccag aatcagcaag
49804980
gtggatacaa aggactcatg gaaagaactc tctgaactct gggcaaggcc ccagtccaaa gtggatacaa aggactcatg gaaagaactc tctgaactct gggcaaggcc ccagtccaaa
50405040
gcaattagta tccttaggac cagaaaaatc tgtggaaggt cagaatttct tgtctgagaa gcaattagta tccttaggac cagaaaaatc tgtggaaggt cagaatttct tgtctgagaa
51005100
aaacaaagtg gtagtaggaa agggtgaatt tacaaaggac gtaggactca aagagatggt aaacaaagtg gtagtaggaa agggtgaatt tacaaaggac gtaggactca aagagatggt
51605160
ttttccaagc agcagaaacc tatttcttac taacttggat aatttacatg aaaataatac ttttccaagc agcagaaacc tatttcttac taacttggat aatttacatg aaaataatac
52205220
acacaatcaa gaaaaaaaaa ttcaggaaga aatagaaaag aaggaaacat taatccaaga acacaatcaa gaaaaaaaaa ttcaggaaga aatagaaaag aaggaaacat taatccaaga
52805280
gaatgtagtt ttgcctcaga tacatacagt gactggcact aagaatttca tgaagaacct gaatgtagtt ttgcctcaga tacatacagt gactggcact aagaatttca tgaagaacct
53405340
tttcttactg agcactaggc aaaatgtaga aggttcatat gacggggcat atgctccagt tttcttactg agcactaggc aaaatgtaga aggttcatat gacggggcat atgctccagt
54005400
acttcaagat tttaggtcat taaatgattc aacaaataga acaaagaaac acacagctca acttcaagat tttaggtcat taaatgattc aacaaataga acaaagaaac acacagctca
54605460
tttctcaaaa aaaggggagg aagaaaactt ggaaggcttg ggaaatcaaa ccaagcaaat tttctcaaaa aaaggggagg aagaaaactt ggaaggcttg ggaaatcaaa ccaagcaaat
55205520
tgtagagaaa tatgcatgca ccacaaggat atctcctaat acaagccagc agaattttgt tgtagagaaa tatgcatgca ccacaaggat atctcctaat acaagccagc agaattttgt
55805580
cacgcaacgt agtaagagag ctttgaaaca attcagactc ccactagaag aaacagaact cacgcaacgt agtaagagag ctttgaaaca attcagactc ccactagaag aaacagaact
56405640
tgaaaaaagg ataattgtgg atgacacctc aacccagtgg tccaaaaaca tgaaacattt tgaaaaaagg ataattgtgg atgacacctc aacccagtgg tccaaaaaca tgaaacattt
57005700
gaccccgagc accctcacac agatagacta caatgagaag gagaaagggg ccattactca gaccccgagc accctcacac agatagacta caatgagaag gagaaagggg ccattactca
57605760
gtctccctta tcagattgcc ttacgaggag tcatagcatc cctcaagcaa atagatctcc gtctccctta tcagattgcc ttacgaggag tcatagcatc cctcaagcaa atagatctcc
58205820
attacccatt gcaaaggtat catcatttcc atctattaga cctatatatc tgaccagggt attacccatt gcaaaggtat catcatttcc atctattaga cctatatatc tgaccagggt
58805880
cctattccaa gacaactctt ctcatcttcc agcagcatct tatagaaaga aagattctgg cctattccaa gacaactctt ctcatcttcc agcagcatct tatagaaaga aagattctgg
59405940
ggtccaagaa agcagtcatt tcttacaagg agccaaaaaa aataaccttt ctttagccat ggtccaagaa agcagtcatt tcttacaagg agccaaaaaa aataaccttt ctttagccat
60006000
tctaaccttg gagatgactg gtgatcaaag agaggttggc tccctgggga caagtgccac tctaaccttg gagatgactg gtgatcaaag agaggttggc tccctgggga caagtgccac
60606060
aaattcagtc acatacaaga aagttgagaa cactgttctc ccgaaaccag acttgcccaa aaattcagtc acatacaaga aagttgagaa cactgttctc ccgaaaccag acttgcccaa
61206120
aacatctggc aaagttgaat tgcttccaaa agttcacatt tatcagaagg acctattccc aacatctggc aaagttgaat tgcttccaaa agttcacatt tatcagaagg acctattccc
61806180
tacggaaact agcaatgggt ctcctggcca tctggatctc gtggaaggga gccttcttca tacggaaact agcaatgggt ctcctggcca tctggatctc gtggaaggga gccttcttca
62406240
gggaacagag ggagcgatta agtggaatga agcaaacaga cctggaaaag ttccctttct gggaacagag ggagcgatta agtggaatga agcaaacaga cctggaaaag ttccctttct
63006300
gagagtagca acagaaagct ctgcaaagac tccctccaag ctattggatc ctcttgcttg gagagtagca acagaaagct ctgcaaagac tccctccaag ctattggatc ctcttgcttg
63606360
ggataaccac tatggtactc agataccaaa agaagagtgg aaatcccaag agaagtcacc ggataaccac tatggtactc agataccaaa agaagagtgg aaatcccaag agaagtcacc
64206420
agaaaaaaca gcttttaaga aaaaggatac cattttgtcc ctgaacgctt gtgaaagcaa agaaaaaaca gcttttaaga aaaaggatac cattttgtcc ctgaacgctt gtgaaagcaa
64806480
tcatgcaata gcagcaataa atgagggaca aaataagccc gaaatagaag tcacctgggc tcatgcaata gcagcaataa atgagggaca aaataagccc gaaatagaag tcacctgggc
65406540
aaagcaaggt aggactgaaa ggctgtgctc tcaaaaccca ccagtcttga aacgccatca aaagcaaggt aggactgaaa ggctgtgctc tcaaaaccca ccagtcttga aacgccatca
66006600
acgggaaata actcgtacta ctcttcagtc agatcaagag gaaattgact atgatgatac acgggaaata actcgtacta ctcttcagtc agatcaagag gaaattgact atgatgatac
66606660
catatcagtt gaaatgaaga aggaagattt tgacatttat gatgaggatg aaaatcagag catatcagtt gaaatgaaga aggaagattt tgacatttat gatgaggatg aaaatcagag
67206720
cccccgcagc tttcaaaaga aaacacgaca ctattttatt gctgcagtgg agaggctctg cccccgcagc tttcaaaaga aaacacgaca ctattttatt gctgcagtgg agaggctctg
67806780
ggattatggg atgagtagct ccccacatgt tctaagaaac agggctcaga gtggcagtgt ggattatggg atgagtagct ccccacatgt tctaagaaac agggctcaga gtggcagtgt
68406840
ccctcagttc aagaaagttg ttttccagga atttactgat ggctccttta ctcagccctt ccctcagttc aagaaagttg ttttccagga atttactgat ggctccttta ctcagccctt
69006900
ataccgtgga gaactaaatg aacatttggg actcctgggg ccatatataa gagcagaagt ataccgtgga gaactaaatg aacatttggg actcctgggg ccatatataa gagcagaagt
69606960
tgaagataat atcatggtaa ctttcagaaa tcaggcctct cgtccctatt ccttctattc tgaagataat atcatggtaa ctttcagaaa tcaggcctct cgtccctatt ccttctattc
70207020
tagccttatt tcttatgagg aagatcagag gcaaggagca gaacctagaa aaaactttgt tagccttatt tcttatgagg aagatcagag gcaaggagca gaacctagaa aaaactttgt
70807080
caagcctaat gaaaccaaaa cttacttttg gaaagtgcaa catcatatgg cacccactaa caagcctaat gaaaccaaaa cttacttttg gaaagtgcaa catcatatgg cacccactaa
71407140
agatgagttt gactgcaaag cctgggctta tttctctgat gttgacctgg aaaaagatgt agatgagttt gactgcaaag cctgggctta tttctctgat gttgacctgg aaaaagatgt
72007200
gcactcaggc ctgattggac cccttctggt ctgccacact aacacactga accctgctca gcactcaggc ctgattggac cccttctggt ctgccacact aacacactga accctgctca
72607260
tgggagacaa gtgacagtac aggaatttgc tctgtttttc accatctttg atgagaccaa tggggagacaa gtgacagtac aggaatttgc tctgtttttc accatctttg atgagaccaa
73207320
aagctggtac ttcactgaaa atatggaaag aaactgcagg gctccctgca atatccagat aagctggtac ttcactgaaa atatggaaag aaactgcagg gctccctgca atatccagat
73807380
ggaagatccc acttttaaag agaattatcg cttccatgca atcaatggct acataatgga ggaagatccc acttttaaag agaattatcg cttccatgca atcaatggct acataatgga
74407440
tacactacct ggcttagtaa tggctcagga tcaaaggatt cgatggtatc tgctcagcat tacactacct ggcttagtaa tggctcagga tcaaaggatt cgatggtatc tgctcagcat
75007500
gggcagcaat gaaaacatcc attctattca tttcagtgga catgtgttca ctgtacgaaa gggcagcaat gaaaacatcc attctattca tttcagtgga catgtgttca ctgtacgaaa
75607560
aaaagaggag tataaaatgg cactgtacaa tctctatcca ggtgtttttg agacagtgga aaaagaggag tataaaatgg cactgtacaa tctctatcca ggtgtttttg agacagtgga
76207620
aatgttacca tccaaagctg gaatttggcg ggtggaatgc cttattggcg agcatctaca aatgttacca tccaaagctg gaatttggcg ggtggaatgc cttattggcg agcatctaca
76807680
tgctgggatg agcacacttt ttctggtgta cagcaataag tgtcagactc ccctgggaat tgctgggatg agcacacttt ttctggtgta cagcaataag tgtcagactc ccctgggaat
77407740
ggcttctgga cacattagag attttcagat tacagcttca ggacaatatg gacagtgggc ggcttctgga cacattagag attttcagat tacagcttca ggacaatatg gacagtgggc
78007800
cccaaagctg gccagacttc attattccgg atcaatcaat gcctggagca ccaaggagcc cccaaagctg gccagacttc attattccgg atcaatcaat gcctggagca ccaaggagcc
78607860
cttttcttgg atcaaggtgg atctgttggc accaatgatt attcacggca tcaagaccca cttttcttgg atcaaggtgg atctgttggc accaatgatt attcacggca tcaagacca
79207920
gggtgcccgt cagaagttct ccagcctcta catctctcag tttatcatca tgtatagtct gggtgcccgt cagaagttct ccagcctcta catctctcag tttatcatca tgtatagtct
79807980
tgatgggaag aagtggcaga cttatcgagg aaattccact ggaaccttaa tggtcttctt tgatgggaag aagtggcaga cttatcgagg aaattccact ggaaccttaa tggtcttctt
80408040
tggcaatgtg gattcatctg ggataaaaca caatattttt aaccctccaa ttattgctcg tggcaatgtg gattcatctg ggataaaaca caatattttt aaccctccaa ttattgctcg
81008100
atacatccgt ttgcacccaa ctcattatag cattcgcagc actcttcgca tggagttgat atacatccgt ttgcacccaa ctcattatag cattcgcagc actcttcgca tggagttgat
81608160
gggctgtgat ttaaatagtt gcagcatgcc attgggaatg gagagtaaag caatatcaga gggctgtgat ttaaatagtt gcagcatgcc attgggaatg gagagtaaag caatatcaga
82208220
tgcacagatt actgcttcat cctactttac caatatgttt gccacctggt ctccttcaaa tgcacagatt actgcttcat cctactttac caatatgttt gccacctggt ctccttcaaa
82808280
agctcgactt cacctccaag ggaggagtaa tgcctggaga cctcaggtga ataatccaaa agctcgactt cacctccaag ggaggagtaa tgcctggaga cctcaggtga ataatccaaa
83408340
agagtggctg caagtggact tccagaagac aatgaaagtc acaggagtaa ctactcaggg agagtggctg caagtggact tccagaagac aatgaaagtc acaggagtaa ctactcaggg
84008400
agtaaaatct ctgcttacca gcatgtatgt gaaggagttc ctcatctcca gcagtcaaga agtaaaatct ctgcttacca gcatgtatgt gaaggagttc ctcatctcca gcagtcaaga
84608460
tggccatcag tggactctct tttttcagaa tggcaaagta aaggtttttc agggaaatca tggccatcag tggactctct tttttcagaa tggcaaagta aaggtttttc agggaaatca
85208520
agactccttc acacctgtgg tgaactctct agacccaccg ttactgactc gctaccttcg agactccttc acacctgtgg tgaactctct agacccaccg ttactgactc gctaccttcg
85808580
aattcacccc cagagttggg tgcaccagat tgccctgagg atggaggttc tgggctgcga aattcacccc cagagttggg tgcaccagat tgccctgagg atggaggttc tgggctgcga
86408640
ggcacaggac ctctactgat taattaataa aatacagcat agcaaaactt taacctccaa ggcacaggac ctctactgat taattaataa aatacagcat agcaaaactt taacctccaa
87008700
atcaagcctc tacttgaatc cttttctgag ggatgaataa ggcataggca tcaggggctg atcaagcctc tacttgaatc cttttctgag ggatgaataa ggcataggca tcaggggctg
87608760
ttgccaatgt gcattagctg tttgcagcct caccttcttt catggagttt aagatatagt ttgccaatgt gcattagctg tttgcagcct caccttcttt catggagttt aagatatagt
88208820
gtattttccc aaggtttgaa ctagctcttc atttctttat gttttaaatg cactgacctc gtattttccc aaggtttgaa ctagctcttc atttctttat gttttaaatg cactgacctc
88808880
ccacattccc tttttagtaa aatattcaga aataatttaa atacatcatt gcaatgaaaa ccacattccc tttttagtaa aatattcaga aataatttaa atacatcatt gcaatgaaaa
89408940
taaatgtttt ttattaggca gaatccagat gctcaaggcc cttcataata tcccccagtt taaatgtttt ttattaggca gaatccagat gctcaaggcc cttcataata tcccccagtt
90009000
tagtagttgg acttagggaa caaaggaacc tttaatagaa attggacagc aagaaagcga tagtagttgg acttagggaa caaaggaacc tttaatagaa attggacagc aagaaagcga
90609060
gctccataaa gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca gctccataaa gtaggaaaca ctacacgatt ccataaagta ggaaacacta catcactcca
91209120
taaagtagga aacactacac agacatgata agatacattg atgagtttgg acaaaccaca taaagtagga aacactacac agacatgata agatacattg atgagtttgg acaaaccaca
91809180
actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt
92409240
gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt gtaaccatta taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt
93009300
caggttcagg gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt caggttcagg gggagatgtg ggaggttttt taaagcaagt aaaacctcta caaatgtggt
93609360
acttaagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag acttaagcat ggctacgtag ataagtagca tggcgggtta atcattaact acacctgcag
94209420
gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gaggaacccc tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag
94809480
gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag gccgggcgac caaaggtcgc ccgacgcccg ggcggcctca gtgagcgagc gagcgcgcag
95409540
ctgcctgcag gggcgcgccg ctagcagctg atgcatagca tgcggtaccg ggagatgggg ctgcctgcag gggcgcgccg ctagcagctg atgcatagca tgcggtaccg ggagatgggg
96009600
gaggctaact gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat gaggctaact gaaacacgga aggagacaat accggaagga acccgcgcta tgacggcaat
96609660
aaaaagacag aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt aaaaagacag aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt
97209720
cccagggctg gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg cccagggctg gcactctgtc gataccccac cgagacccca ttgggaccaa tacgcccgcg
97809780
tttcttcctt ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca tttcttcctt ttccccaccc caacccccaa gttcgggtga aggcccaggg ctcgcagcca
98409840
acgtcggggc ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact acgtcggggc ggcaagccct gccatagcca ctacgggtac gtaggccaac cactagaact
99009900
atagctagag tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac atagctagag tcctgggcga acaaacgatg ctcgccttcc agaaaaccga ggatgcgaac
99609960
cacttcatcc ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc cacttcatcc ggggtcagca ccaccggcaa gcgccgcgac ggccgaggtc taccgatctc
1002010020
ctgaagccag ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa ctgaagccag ggcagatccg tgcacagcac cttgccgtag aagaacagca aggccgccaa
1008010080
tgcctgacga tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc tgcctgacga tgcgtggaga ccgaaacctt gcgctcgttc gccagccagg acagaaatgc
1014010140
ctcgacttcg ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc ctcgacttcg ctgctgccca aggttgccgg gtgacgcaca ccgtggaaac ggatgaaggc
1020010200
acgaacccag ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg acgaacccag ttgacataag cctgttcggt tcgtaaactg taatgcaagt agcgtatgcg
1026010260
ctcacgcaac tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt ctcacgcaac tggtccagaa ccttgaccga acgcagcggt ggtaacggcg cagtggcggt
1032010320
tttcatggct tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca tttcatggct tgttatgact gtttttttgt acagtctatg cctcgggcat ccaagcagca
1038010380
agcgcgttac gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca agcgcgttac gccgtgggtc gatgtttgat gttatggagc agcaacgatg ttacgcagca
1044010440
gcaacgatgt tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg gcaacgatgt tacgcagcag ggcagtcgcc ctaaaacaaa gttaggtggc tcaagtatgg
1050010500
gcatcattcg cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg gcatcattcg cacatgtagg ctcggccctg accaagtcaa atccatgcgg gctgctcttg
1056010560
atcttttcgg tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg atcttttcgg tcgtgagttc ggagacgtag ccacctactc ccaacatcag ccggactccg
1062010620
attacctcgg gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag attacctcgg gaacttgctc cgtagtaaga cattcatcgc gcttgctgcc ttcgaccaag
1068010680
aagcggttgt tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg aagcggttgt tggcgctctc gcggcttacg ttctgcccag gtttgagcag ccgcgtagtg
1074010740
agatctatat ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg agatctatat ctatgatctc gcagtctccg gcgagcaccg gaggcagggc attgccaccg
1080010800
cgctcatcaa tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc cgctcatcaa tctcctcaag catgaggcca acgcgcttgg tgcttatgtg atctacgtgc
1086010860
aagcagatta cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag aagcagatta cggtgacgat cccgcagtgg ctctctatac aaagttgggc atacgggaag
1092010920
aagtgatgca ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga aagtgatgca ctttgatatc gacccaagta ccgccaccta acaattcgtt caagccgaga
1098010980
tcggcttccc ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt tcggcttccc ggccgcggag ttgttcggta aattgtcaca acgccgcgaa tatagtcttt
1104011040
accatgccct tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga accatgccct tggccacgcc cctctttaat acgacgggca atttgcactt cagaaaatga
1110011100
agagtttgct ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga agagtttgct ttagccataa caaaagtcca gtatgctttt tcacagcata actggactga
1116011160
tttcagttta caactattct gtctagttta agactttatt gtcatagttt agatctattt tttcagttta caactattct gtctagttta agactttatt gtcatagttt agatctattt
1122011220
tgttcagttt aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta tgttcagttt aagactttat tgtccgccca cacccgctta cgcagggcat ccatttatta
1128011280
ctcaaccgta accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca ctcaaccgta accgattttg ccaggttacg cggctggtct gcggtgtgaa ataccgcaca
1134011340
gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc actgactcgc
1140011400
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt
1146011460
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg
1152011520
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg caccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg
1158011580
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat
1164011640
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta
1170011700
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct
1176011760
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc
1182011820
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa
1188011880
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg
1194011940
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag
1200012000
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt
1206012060
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta
1212012120
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc
1218012180
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca
1224012240
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa
1230012300
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat
1236012360
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggaggggct
1242012420
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt
1248012480
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat
1254012540
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta
1260012600
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg
1266012660
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt
1272012720
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg
1278012780
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg
1284012840
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc
1290012900
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa
1296012960
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac
1302013020
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt
1308013080
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg
1314013140
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa
1320013200
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata
1326013260
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgaaatt gtaaacgtta
1332013320
atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg atattttgtt aaaattcgcg ttaaattttt gttaaatcag ctcatttttt aaccaatagg
1338013380
ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg ccgaaatcgg caaaatccct tataaatcaa aagaatagac cgagataggg ttgagtgttg
1344013440
ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa ttccagtttg gaacaagagt ccactattaa agaacgtgga ctccaacgtc aaagggcgaa
1350013500
aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg aaaccgtcta tcagggcgat ggcccactac gtgaaccatc accctaatca agttttttgg
1356013560
ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt
1362013620
gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg gacggggaaa gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg
1368013680
ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta
1374013740
atgcgccgct acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc atgcgccgct acagggcgcg tcccattcgc cattcaggct gcaaataagc gttgatattc
1380013800
agtcaattac aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag agtcaattac aaacattaat aacgaagaga tgacagaaaa attttcattc tgtgacagag
1386013860
aa aa
1386213862
<210> 218<210> 218
<211> 2351<211> 2351
<212> БЕЛОК<212> PROTEIN
<213> Homo sapiens<213> Homo sapiens
<400> 218<400> 218
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg PheMet Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 151 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu SerCys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30 20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala ArgTrp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45 35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val ValPhe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60 50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn IleTyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 8065 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile GlnAla Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95 85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala SerAla Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110 100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala SerHis Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125 115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu AspGlu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140 130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val LeuAsp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr SerLys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175 165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu IleTyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190 180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys ThrGly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205 195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu GlyGln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220 210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg AspLys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly TyrAla Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255 245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser ValVal Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270 260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser IleTyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285 275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala SerPhe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300 290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu MetLeu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln HisAsp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335 325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu ProAsp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350 340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp AspGln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365 355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn SerLeu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380 370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys ThrPro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala ProTrp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415 405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu AsnLeu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430 420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe MetAsn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445 435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His GluAla Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460 450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr LeuSer Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr ProLeu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495 485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro LysHis Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510 500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile PheGly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525 515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser AspLys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540 530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu ArgPro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys GluAsp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575 565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn ValSer Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590 580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr GluIle Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605 595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu AspAsn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620 610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr ValPro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr TrpPhe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655 645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe PheTyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670 660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu ThrSer Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685 675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn ProLeu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700 690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg GlyGly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly AspMet Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735 725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser LysTyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750 740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His ProAsn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro
755 760 765 755 760 765
Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn AspSer Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp
770 775 780 770 775 780
Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro LysIle Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys
785 790 795 800785 790 795 800
Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln SerIle Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser
805 810 815 805 810 815
Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys TyrPro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr
820 825 830 820 825 830
Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn AsnGlu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn
835 840 845 835 840 845
Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser GlySer Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly
850 855 860 850 855 860
Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn GluAsp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu
865 870 875 880865 870 875 880
Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe LysLys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys
885 890 895 885 890 895
Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp AsnVal Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn
900 905 910 900 905 910
Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser MetLeu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met
915 920 925 915 920 925
Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys LysPro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys
930 935 940 930 935 940
Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu GluSer Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu
945 950 955 960945 950 955 960
Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln GluAsn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu
965 970 975 965 970 975
Ser Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu PheSer Ser Trp Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe
980 985 990 980 985 990
Lys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn AlaLys Gly Lys Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala
995 1000 1005 995 1000 1005
Leu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr SerLeu Phe Lys Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser
1010 1015 1020 1010 1015 1020
Asn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro SerAsn Asn Ser Ala Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser
1025 1030 1035 1025 1030 1035
Leu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu GluLeu Leu Ile Glu Asn Ser Pro Ser Val Trp Gln Asn Ile Leu Glu
1040 1045 1050 1040 1045 1050
Ser Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp ArgSer Asp Thr Glu Phe Lys Lys Val Thr Pro Leu Ile His Asp Arg
1055 1060 1065 1055 1060 1065
Met Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His MetMet Leu Met Asp Lys Asn Ala Thr Ala Leu Arg Leu Asn His Met
1070 1075 1080 1070 1075 1080
Ser Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln GlnSer Asn Lys Thr Thr Ser Ser Lys Asn Met Glu Met Val Gln Gln
1085 1090 1095 1085 1090 1095
Lys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp MetLys Lys Glu Gly Pro Ile Pro Pro Asp Ala Gln Asn Pro Asp Met
1100 1105 1110 1100 1105 1110
Ser Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp IleSer Phe Phe Lys Met Leu Phe Leu Pro Glu Ser Ala Arg Trp Ile
1115 1120 1125 1115 1120 1125
Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly ProGln Arg Thr His Gly Lys Asn Ser Leu Asn Ser Gly Gln Gly Pro
1130 1135 1140 1130 1135 1140
Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val GluSer Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys Ser Val Glu
1145 1150 1155 1145 1150 1155
Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly LysGly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val Gly Lys
1160 1165 1170 1160 1165 1170
Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe ProGly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe Pro
1175 1180 1185 1175 1180 1185
Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His GluSer Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu
1190 1195 1200 1190 1195 1200
Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile GluAsn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu
1205 1210 1215 1205 1210 1215
Lys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln IleLys Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile
1220 1225 1230 1220 1225 1230
His Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe LeuHis Thr Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu
1235 1240 1245 1235 1240 1245
Leu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala TyrLeu Ser Thr Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr
1250 1255 1260 1250 1255 1260
Ala Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr AsnAla Pro Val Leu Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn
1265 1270 1275 1265 1270 1275
Arg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu GluArg Thr Lys Lys His Thr Ala His Phe Ser Lys Lys Gly Glu Glu
1280 1285 1290 1280 1285 1290
Glu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val GluGlu Asn Leu Glu Gly Leu Gly Asn Gln Thr Lys Gln Ile Val Glu
1295 1300 1305 1295 1300 1305
Lys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln GlnLys Tyr Ala Cys Thr Thr Arg Ile Ser Pro Asn Thr Ser Gln Gln
1310 1315 1320 1310 1315 1320
Asn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe ArgAsn Phe Val Thr Gln Arg Ser Lys Arg Ala Leu Lys Gln Phe Arg
1325 1330 1335 1325 1330 1335
Leu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val AspLeu Pro Leu Glu Glu Thr Glu Leu Glu Lys Arg Ile Ile Val Asp
1340 1345 1350 1340 1345 1350
Asp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr ProAsp Thr Ser Thr Gln Trp Ser Lys Asn Met Lys His Leu Thr Pro
1355 1360 1365 1355 1360 1365
Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly AlaSer Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys Glu Lys Gly Ala
1370 1375 1380 1370 1375 1380
Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His SerIle Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg Ser His Ser
1385 1390 1395 1385 1390 1395
Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val SerIle Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys Val Ser
1400 1405 1410 1400 1405 1410
Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu PheSer Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu Phe
1415 1420 1425 1415 1420 1425
Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys LysGln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys
1430 1435 1440 1430 1435 1440
Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala LysAsp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys
1445 1450 1455 1445 1450 1455
Lys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr GlyLys Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly
1460 1465 1470 1460 1465 1470
Asp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn SerAsp Gln Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser
1475 1480 1485 1475 1480 1485
Val Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro AspVal Thr Tyr Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp
1490 1495 1500 1490 1495 1500
Leu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val HisLeu Pro Lys Thr Ser Gly Lys Val Glu Leu Leu Pro Lys Val His
1505 1510 1515 1505 1510 1515
Ile Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly SerIle Tyr Gln Lys Asp Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser
1520 1525 1530 1520 1525 1530
Pro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly ThrPro Gly His Leu Asp Leu Val Glu Gly Ser Leu Leu Gln Gly Thr
1535 1540 1545 1535 1540 1545
Glu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys ValGlu Gly Ala Ile Lys Trp Asn Glu Ala Asn Arg Pro Gly Lys Val
1550 1555 1560 1550 1555 1560
Pro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro SerPro Phe Leu Arg Val Ala Thr Glu Ser Ser Ala Lys Thr Pro Ser
1565 1570 1575 1565 1570 1575
Lys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr GlnLys Leu Leu Asp Pro Leu Ala Trp Asp Asn His Tyr Gly Thr Gln
1580 1585 1590 1580 1585 1590
Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu LysIle Pro Lys Glu Glu Trp Lys Ser Gln Glu Lys Ser Pro Glu Lys
1595 1600 1605 1595 1600 1605
Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala CysThr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser Leu Asn Ala Cys
1610 1615 1620 1610 1615 1620
Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn LysGlu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly Gln Asn Lys
1625 1630 1635 1625 1630 1635
Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu ArgPro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr Glu Arg
1640 1645 1650 1640 1645 1650
Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg GluLeu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg Glu
1655 1660 1665 1655 1660 1665
Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp TyrIle Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr
1670 1675 1680 1670 1675 1680
Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp IleAsp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile
1685 1690 1695 1685 1690 1695
Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys LysTyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys
1700 1705 1710 1700 1705 1710
Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp TyrThr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr
1715 1720 1725 1715 1720 1725
Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln SerGly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser
1730 1735 1740 1730 1735 1740
Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe ThrGly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr
1745 1750 1755 1745 1750 1755
Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn GluAsp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
1760 1765 1770 1760 1765 1770
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu AspHis Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp
1775 1780 1785 1775 1780 1785
Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr SerAsn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser
1790 1795 1800 1790 1795 1800
Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln GlyPhe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly
1805 1810 1815 1805 1810 1815
Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys ThrAla Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr
1820 1825 1830 1820 1825 1830
Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp GluTyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu
1835 1840 1845 1835 1840 1845
Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu GluPhe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu
1850 1855 1860 1850 1855 1860
Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys HisLys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His
1865 1870 1875 1865 1870 1875
Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val GlnThr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln
1880 1885 1890 1880 1885 1890
Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser TrpGlu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp
1895 1900 1905 1895 1900 1905
Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys AsnTyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn
1910 1915 1920 1910 1915 1920
Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe HisIle Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His
1925 1930 1935 1925 1930 1935
Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val MetAla Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met
1940 1945 1950 1940 1945 1950
Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly SerAla Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser
1955 1960 1965 1955 1960 1965
Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe ThrAsn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr
1970 1975 1980 1970 1975 1980
Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu TyrVal Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr
1985 1990 1995 1985 1990 1995
Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala GlyPro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly
2000 2005 2010 2000 2005 2010
Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala GlyIle Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly
2015 2020 2025 2015 2020 2025
Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr ProMet Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro
2030 2035 2040 2030 2035 2040
Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr AlaLeu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala
2045 2050 2055 2045 2050 2055
Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu HisSer Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His
2060 2065 2070 2060 2065 2070
Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe SerTyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser
2075 2080 2085 2075 2080 2085
Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly IleTrp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile
2090 2095 2100 2090 2095 2100
Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile SerLys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser
2105 2110 2115 2105 2110 2115
Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln ThrGln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr
2120 2125 2130 2120 2125 2130
Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly AsnTyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn
2135 2140 2145 2135 2140 2145
Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro IleVal Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile
2150 2155 2160 2150 2155 2160
Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile ArgIle Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg
2165 2170 2175 2165 2170 2175
Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser CysSer Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys
2180 2185 2190 2180 2185 2190
Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala GlnSer Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln
2195 2200 2205 2195 2200 2205
Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp SerIle Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser
2210 2215 2220 2210 2215 2220
Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala TrpPro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp
2225 2230 2235 2225 2230 2235
Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp PheArg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe
2240 2245 2250 2240 2245 2250
Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val LysGln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys
2255 2260 2265 2255 2260 2265
Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser SerSer Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser
2270 2275 2280 2270 2275 2280
Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly LysSer Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys
2285 2290 2295 2285 2290 2295
Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val ValVal Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val
2300 2305 2310 2300 2305 2310
Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile HisAsn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His
2315 2320 2325 2315 2320 2325
Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val LeuPro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu
2330 2335 2340 2330 2335 2340
Gly Cys Glu Ala Gln Asp Leu TyrGly Cys Glu Ala Gln Asp Leu Tyr
2345 2350 2345 2350
<210> 219<210> 219
<400> 219<400> 219
000000
<210> 220<210> 220
<400> 220<400> 220
000000
<210> 221<210> 221
<400> 221<400> 221
000000
<210> 222<210> 222
<400> 222<400> 222
000000
<210> 223<210> 223
<400> 223<400> 223
000000
<210> 224<210> 224
<400> 224<400> 224
000000
<210> 225<210> 225
<400> 225<400> 225
000000
<210> 226<210> 226
<400> 226<400> 226
000000
<210> 227<210> 227
<400> 227<400> 227
000000
<210> 228<210> 228
<400> 228<400> 228
000000
<210> 229<210> 229
<400> 229<400> 229
000000
<210> 230<210> 230
<400> 230<400> 230
000000
<210> 231<210> 231
<400> 231<400> 231
000000
<210> 232<210> 232
<400> 232<400> 232
000000
<210> 233<210> 233
<400> 233<400> 233
000000
<210> 234<210> 234
<400> 234<400> 234
000000
<210> 235<210> 235
<400> 235<400> 235
000000
<210> 236<210> 236
<400> 236<400> 236
000000
<210> 237<210> 237
<400> 237<400> 237
000000
<210> 238<210> 238
<400> 238<400> 238
000000
<210> 239<210> 239
<400> 239<400> 239
000000
<210> 240<210> 240
<400> 240<400> 240
000000
<210> 241<210> 241
<400> 241<400> 241
000000
<210> 242<210> 242
<400> 242<400> 242
000000
<210> 243<210> 243
<400> 243<400> 243
000000
<210> 244<210> 244
<400> 244<400> 244
000000
<210> 245<210> 245
<400> 245<400> 245
000000
<210> 246<210> 246
<400> 246<400> 246
000000
<210> 247<210> 247
<400> 247<400> 247
000000
<210> 248<210> 248
<400> 248<400> 248
000000
<210> 249<210> 249
<400> 249<400> 249
000000
<210> 250<210> 250
<400> 250<400> 250
000000
<210> 251<210> 251
<400> 251<400> 251
000000
<210> 252<210> 252
<400> 252<400> 252
000000
<210> 253<210> 253
<400> 253<400> 253
000000
<210> 254<210> 254
<400> 254<400> 254
000000
<210> 255<210> 255
<400> 255<400> 255
000000
<210> 256<210> 256
<400> 256<400> 256
000000
<210> 257<210> 257
<400> 257<400> 257
000000
<210> 258<210> 258
<400> 258<400> 258
000000
<210> 259<210> 259
<400> 259<400> 259
000000
<210> 260<210> 260
<400> 260<400> 260
000000
<210> 261<210> 261
<400> 261<400> 261
000000
<210> 262<210> 262
<400> 262<400> 262
000000
<210> 263<210> 263
<400> 263<400> 263
000000
<210> 264<210> 264
<400> 264<400> 264
000000
<210> 265<210> 265
<400> 265<400> 265
000000
<210> 266<210> 266
<400> 266<400> 266
000000
<210> 267<210> 267
<400> 267<400> 267
000000
<210> 268<210> 268
<400> 268<400> 268
000000
<210> 269<210> 269
<400> 269<400> 269
000000
<210> 270<210> 270
<400> 270<400> 270
000000
<210> 271<210> 271
<400> 271<400> 271
000000
<210> 272<210> 272
<400> 272<400> 272
000000
<210> 273<210> 273
<400> 273<400> 273
000000
<210> 274<210> 274
<400> 274<400> 274
000000
<210> 275<210> 275
<400> 275<400> 275
000000
<210> 276<210> 276
<400> 276<400> 276
000000
<210> 277<210> 277
<400> 277<400> 277
000000
<210> 278<210> 278
<400> 278<400> 278
000000
<210> 279<210> 279
<400> 279<400> 279
000000
<210> 280<210> 280
<400> 280<400> 280
000000
<210> 281<210> 281
<400> 281<400> 281
000000
<210> 282<210> 282
<400> 282<400> 282
000000
<210> 283<210> 283
<400> 283<400> 283
000000
<210> 284<210> 284
<400> 284<400> 284
000000
<210> 285<210> 285
<400> 285<400> 285
000000
<210> 286<210> 286
<400> 286<400> 286
000000
<210> 287<210> 287
<400> 287<400> 287
000000
<210> 288<210> 288
<400> 288<400> 288
000000
<210> 289<210> 289
<400> 289<400> 289
000000
<210> 290<210> 290
<400> 290<400> 290
000000
<210> 291<210> 291
<400> 291<400> 291
000000
<210> 292<210> 292
<400> 292<400> 292
000000
<210> 293<210> 293
<400> 293<400> 293
000000
<210> 294<210> 294
<400> 294<400> 294
000000
<210> 295<210> 295
<400> 295<400> 295
000000
<210> 296<210> 296
<400> 296<400> 296
000000
<210> 297<210> 297
<400> 297<400> 297
000000
<210> 298<210> 298
<400> 298<400> 298
000000
<210> 299<210> 299
<400> 299<400> 299
000000
<210> 300<210> 300
<400> 300<400> 300
000000
<210> 301<210> 301
<400> 301<400> 301
000000
<210> 302<210> 302
<400> 302<400> 302
000000
<210> 303<210> 303
<400> 303<400> 303
000000
<210> 304<210> 304
<400> 304<400> 304
000000
<210> 305<210> 305
<400> 305<400> 305
000000
<210> 306<210> 306
<400> 306<400> 306
000000
<210> 307<210> 307
<400> 307<400> 307
000000
<210> 308<210> 308
<400> 308<400> 308
000000
<210> 309<210> 309
<400> 309<400> 309
000000
<210> 310<210> 310
<400> 310<400> 310
000000
<210> 311<210> 311
<400> 311<400> 311
000000
<210> 312<210> 312
<400> 312<400> 312
000000
<210> 313<210> 313
<400> 313<400> 313
000000
<210> 314<210> 314
<400> 314<400> 314
000000
<210> 315<210> 315
<400> 315<400> 315
000000
<210> 316<210> 316
<400> 316<400> 316
000000
<210> 317<210> 317
<400> 317<400> 317
000000
<210> 318<210> 318
<400> 318<400> 318
000000
<210> 319<210> 319
<400> 319<400> 319
000000
<210> 320<210> 320
<400> 320<400> 320
000000
<210> 321<210> 321
<400> 321<400> 321
000000
<210> 322<210> 322
<400> 322<400> 322
000000
<210> 323<210> 323
<400> 323<400> 323
000000
<210> 324<210> 324
<400> 324<400> 324
000000
<210> 325<210> 325
<400> 325<400> 325
000000
<210> 326<210> 326
<400> 326<400> 326
000000
<210> 327<210> 327
<400> 327<400> 327
000000
<210> 328<210> 328
<400> 328<400> 328
000000
<210> 329<210> 329
<400> 329<400> 329
000000
<210> 330<210> 330
<400> 330<400> 330
000000
<210> 331<210> 331
<400> 331<400> 331
000000
<210> 332<210> 332
<400> 332<400> 332
000000
<210> 333<210> 333
<400> 333<400> 333
000000
<210> 334<210> 334
<400> 334<400> 334
000000
<210> 335<210> 335
<400> 335<400> 335
000000
<210> 336<210> 336
<400> 336<400> 336
000000
<210> 337<210> 337
<400> 337<400> 337
000000
<210> 338<210> 338
<400> 338<400> 338
000000
<210> 339<210> 339
<400> 339<400> 339
000000
<210> 340<210> 340
<400> 340<400> 340
000000
<210> 341<210> 341
<400> 341<400> 341
000000
<210> 342<210> 342
<400> 342<400> 342
000000
<210> 343<210> 343
<400> 343<400> 343
000000
<210> 344<210> 344
<400> 344<400> 344
000000
<210> 345<210> 345
<400> 345<400> 345
000000
<210> 346<210> 346
<400> 346<400> 346
000000
<210> 347<210> 347
<400> 347<400> 347
000000
<210> 348<210> 348
<400> 348<400> 348
000000
<210> 349<210> 349
<400> 349<400> 349
000000
<210> 350<210> 350
<400> 350<400> 350
000000
<210> 351<210> 351
<400> 351<400> 351
000000
<210> 352<210> 352
<400> 352<400> 352
000000
<210> 353<210> 353
<400> 353<400> 353
000000
<210> 354<210> 354
<400> 354<400> 354
000000
<210> 355<210> 355
<400> 355<400> 355
000000
<210> 356<210> 356
<400> 356<400> 356
000000
<210> 357<210> 357
<400> 357<400> 357
000000
<210> 358<210> 358
<400> 358<400> 358
000000
<210> 359<210> 359
<400> 359<400> 359
000000
<210> 360<210> 360
<400> 360<400> 360
000000
<210> 361<210> 361
<400> 361<400> 361
000000
<210> 362<210> 362
<400> 362<400> 362
000000
<210> 363<210> 363
<400> 363<400> 363
000000
<210> 364<210> 364
<400> 364<400> 364
000000
<210> 365<210> 365
<400> 365<400> 365
000000
<210> 366<210> 366
<400> 366<400> 366
000000
<210> 367<210> 367
<400> 367<400> 367
000000
<210> 368<210> 368
<400> 368<400> 368
000000
<210> 369<210> 369
<400> 369<400> 369
000000
<210> 370<210> 370
<400> 370<400> 370
000000
<210> 371<210> 371
<400> 371<400> 371
000000
<210> 372<210> 372
<400> 372<400> 372
000000
<210> 373<210> 373
<400> 373<400> 373
000000
<210> 374<210> 374
<400> 374<400> 374
000000
<210> 375<210> 375
<400> 375<400> 375
000000
<210> 376<210> 376
<400> 376<400> 376
000000
<210> 377<210> 377
<400> 377<400> 377
000000
<210> 378<210> 378
<400> 378<400> 378
000000
<210> 379<210> 379
<400> 379<400> 379
000000
<210> 380<210> 380
<211> 4374<211> 4374
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 380<400> 380
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc
60 60
accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg
120 120
ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac
180 180
acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt
240 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat
300 300
gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg
360 360
ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg
420 420
gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg
480 480
aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat
540 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag
600 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg
660 660
tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat
720 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc
780 780
ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc
840 840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac
900 900
aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg
960 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag
10201020
gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag
10801080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat
11401140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc
12001200
tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc
12601260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg
13201320
aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc
13801380
atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg
14401440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact
15001500
gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc
15601560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc
16201620
accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg
16801680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag
17401740
aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag
18001800
aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg
18601860
cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg
19201920
tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc
19801980
attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag
20402040
atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc
21002100
atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc
21602160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac
22202220
agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc
22802280
ttcagccaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg ttcagccaga accccccagt gctgaagagg caccagaggg agatcaccag gaccaccctg
23402340
cagtctgacc aggaggagat tgactatgat gacaccatct ctgtggagat gaagaaggag cagtctgacc aggagagat tgactatgat gacaccatct ctgtggagat gaagaaggag
24002400
gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc
24602460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc
25202520
catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc
25802580
caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac
26402640
ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc
27002700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac
27602760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac
28202820
ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg
28802880
gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg
29402940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag
30003000
tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg
30603060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac
31203120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc
31803180
caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc
32403240
atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg
33003300
tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc
33603360
tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg
34203420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat caggacttc
34803480
cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac
35403540
tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg
36003600
ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttcagcagc ctggccccca tgatcatcca tggcatcaag acccagggg ccaggcagaa gttcagcagc
36603660
ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac
37203720
aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc
37803780
aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac
38403840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc
39003900
atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac
39603960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcacct gcagggcagg
40204020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag
40804080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg
41404140
tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc
42004200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac
42604260
agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac
43204320
cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga
43744374
<210> 381<210> 381
<211> 4374<211> 4374
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 381<400> 381
atgcagattg agctgagcac ctgcttcttc ctgtgtctgc tgaggttctg cttctctgcc atgcagattg agctgagcac ctgcttcttc ctgtgtctgc tgaggttctg cttctctgcc
60 60
accaggaggt attacctggg ggctgtggag ctgagctggg actatatgca gtctgacctg accaggaggt attacctggg ggctgtggag ctgagctggg actatatgca gtctgacctg
120 120
ggggagctgc ctgtggatgc taggttcccc cccagggtgc ccaagagctt cccctttaac ggggagctgc ctgtggatgc taggttcccc cccagggtgc ccaagagctt cccctttaac
180 180
acttctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt acttctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt
240 240
gccaagccca ggcccccctg gatggggctg ctggggccca ccatccaggc tgaggtgtat gccaagccca ggcccccctg gatggggctg ctggggccca ccatccaggc tgaggtgtat
300 300
gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg
360 360
ggggtgagct actggaaggc ttctgagggg gctgagtatg atgaccagac tagccagagg ggggtgagct actggaaggc ttctgagggg gctgagtatg atgaccagac tagccagagg
420 420
gagaaggagg atgacaaggt gtttcctggg ggcagccata cctatgtgtg gcaggtgctg gagaaggagg atgacaaggt gtttcctggg ggcagccata cctatgtgtg gcaggtgctg
480 480
aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgtctcat aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgtctcat
540 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ctctgctggt gtgtagggag gtggacctgg tgaaggacct gaactctggc ctgattgggg ctctgctggt gtgtagggag
600 600
ggcagcctgg ctaaggaaaa gacccagacc ctgcataagt ttatcctgct gtttgctgtg ggcagcctgg ctaaggaaaa gacccagacc ctgcataagt ttatcctgct gtttgctgtg
660 660
tttgatgagg gcaagagctg gcactctgag accaagaaca gcctgatgca ggatagggat tttgatgagg gcaagagctg gcactctgag accaagaaca gcctgatgca ggatagggat
720 720
gctgcctctg ccagggcttg gcctaagatg cacactgtga atgggtatgt gaataggagc gctgcctctg ccagggcttg gcctaagatg cacactgtga atgggtatgt gaataggagc
780 780
ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tgggatgggc ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tgggatgggc
840 840
accacccctg aggtccatag catcttcctg gagggccaca ctttcctggt gaggaaccac accacccctg aggtccatag catcttcctg gagggccaca ctttcctggt gaggaaccac
900 900
agacaggcct ctctggagat ctctcccatc accttcctga ctgctcagac tctgctgatg agacaggcct ctctggagat ctctcccatc accttcctga ctgctcagac tctgctgatg
960 960
gacctgggcc agttcctgct gttttgccat attagcagcc accagcatga tgggatggag gacctgggcc agttcctgct gttttgccat attagcagcc accagcatga tgggatggag
10201020
gcctatgtga aggtggatag ctgccctgag gagcctcagc tgaggatgaa gaacaatgag gcctatgtga aggtggatag ctgccctgag gagcctcagc tgaggatgaa gaacaatgag
10801080
gaggctgaag actatgatga tgacctgact gattctgaga tggatgtggt gaggtttgat gaggctgaag actatgatga tgacctgact gattctgaga tggatgtggt gaggtttgat
11401140
gatgacaata gccccagctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc gatgacaata gccccagctt cattcagatc aggtctgtgg ccaagaaaca ccccaagacc
12001200
tgggtgcact acattgctgc tgaggaagag gactgggact atgctcccct ggtgctggcc tgggtgcact acattgctgc tgaggaagag gactgggact atgctcccct ggtgctggcc
12601260
cctgatgata ggtcttataa gagccagtac ctgaacaatg ggccccagag gattggcagg cctgatgata ggtcttataa gagccagtac ctgaacaatg ggccccagag gattggcagg
13201320
aagtacaaga aggtgaggtt catggcctac actgatgaaa ccttcaaaac cagggaggcc aagtacaaga aggtgaggtt catggcctac actgatgaaa ccttcaaaac cagggaggcc
13801380
attcagcatg agtctggcat cctgggccct ctgctgtatg gggaggtggg ggacaccctg attcagcatg agtctggcat cctgggccct ctgctgtatg gggaggtggg ggacaccctg
14401440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctatcctca tggcatcact ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctatcctca tggcatcact
15001500
gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaagacttc gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaagacttc
15601560
cccatcctgc ctggggagat ctttaagtat aagtggactg tgactgtgga ggatggccct cccatcctgc ctggggagat ctttaagtat aagtggactg tgactgtgga ggatggccct
16201620
accaagtctg accccaggtg tctgaccagg tactattcta gctttgtgaa catggagagg accaagtctg accccaggtg tctgaccagg tactattcta gctttgtgaa catggagagg
16801680
gacctggcct ctggcctgat tgggcccctg ctgatctgct acaaggagtc tgtggaccag gacctggcct ctggcctgat tgggcccctg ctgatctgct acaaggagtc tgtggaccag
17401740
aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttttctgt gtttgatgag aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttttctgt gtttgatgag
18001800
aataggagct ggtacctgac tgagaacatc cagaggtttc tgcccaatcc tgctggggtg aataggagct ggtacctgac tgagaacatc cagaggtttc tgcccaatcc tgctggggtg
18601860
cagctggagg atcctgagtt ccaggccagc aatatcatgc atagcatcaa tggctatgtg cagctggagg atcctgagtt ccaggccagc aatatcatgc atagcatcaa tggctatgtg
19201920
tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc
19801980
attggggccc agactgactt tctgtctgtg ttcttttctg gctatacctt caagcacaag attggggccc agactgactt tctgtctgtg ttcttttctg gctatacctt caagcacaag
20402040
atggtgtatg aggataccct gaccctgttc cccttctctg gggagactgt gttcatgagc atggtgtatg aggataccct gaccctgttc cccttctctg gggagactgt gttcatgagc
21002100
atggagaatc ctgggctgtg gatcctgggg tgccacaact ctgattttag gaacaggggg atggagaatc ctgggctgtg gatcctgggg tgccacaact ctgattttag gaacaggggg
21602160
atgactgccc tgctgaaggt gtctagctgt gataagaaca ctggggacta ctatgaggac atgactgccc tgctgaaggt gtctagctgt gataagaaca ctggggacta ctatgaggac
22202220
agctatgagg acatttctgc ttatctgctg tctaagaata atgccattga gcccagaagc agctatgagg acatttctgc ttatctgctg tctaagaata atgccattga gcccagaagc
22802280
ttcagccaga atccccctgt gctgaagaga catcagaggg agatcaccag aactaccctg ttcagccaga atccccctgt gctgaagaga catcagaggg agatcaccag aactaccctg
23402340
cagtctgatc aggaggagat tgactatgat gacactatct ctgtggagat gaagaaggag cagtctgatc aggaggat tgactatgat gacactatct ctgtggagat gaagaaggag
24002400
gactttgaca tctatgatga ggatgagaat cagtctccca ggagctttca gaagaagacc gactttgaca tctatgatga ggatgagaat cagtctccca ggagctttca gaagaagacc
24602460
agacattact tcattgctgc tgtggagagg ctgtgggact atggcatgag ctctagccct agacattact tcattgctgc tgtggagagg ctgtgggact atggcatgag ctctagccct
25202520
catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc
25802580
caggaattca ctgatggcag cttcacccag cccctgtaca ggggggagct gaatgagcac caggaattca ctgatggcag cttcacccag cccctgtaca ggggggagct gaatgagcac
26402640
ctgggcctgc tggggcctta tatcagggct gaggtggagg ataatattat ggtgactttc ctgggcctgc tggggcctta tatcagggct gaggtggagg ataatattat ggtgactttc
27002700
aggaaccagg ccagcaggcc ctactctttc tatagcagcc tgatctctta tgaggaggat aggaaccagg ccagcaggcc ctactctttc tatagcagcc tgatctctta tgaggaggat
27602760
cagaggcagg gggctgagcc taggaagaac tttgtgaagc ccaatgagac taagacctac cagaggcagg gggctgagcc taggaagaac tttgtgaagc ccaatgagac taagacctac
28202820
ttctggaagg tccagcacca catggcccct accaaggatg agtttgactg caaggcctgg ttctggaagg tccagcacca catggcccct accaaggatg agtttgactg caaggcctgg
28802880
gcctatttct ctgatgtgga tctggagaag gatgtccatt ctgggctgat tggccccctg gcctatttct ctgatgtgga tctggagaag gatgtccatt ctgggctgat tggccccctg
29402940
ctggtgtgcc acactaacac tctgaatcct gcccatggca ggcaggtgac tgtccaggag ctggtgtgcc acactaacac tctgaatcct gcccatggca ggcaggtgac tgtccaggag
30003000
tttgccctgt tcttcactat ctttgatgag accaagagct ggtactttac tgagaacatg tttgccctgt tcttcactat ctttgatgag accaagagct ggtactttac tgagaacatg
30603060
gagaggaact gcagagctcc ttgcaatatt cagatggagg accccacctt caaggagaat gagaggaact gcagagctcc ttgcaatatt cagatggagg accccacctt caaggagaat
31203120
tacaggttcc atgccattaa tgggtacatc atggacaccc tgcctggcct ggtgatggct tacaggttcc atgccattaa tgggtacatc atggacaccc tgcctggcct ggtgatggct
31803180
caggaccaga ggatcaggtg gtacctgctg agcatgggct ctaatgagaa tatccacagc caggaccaga ggatcaggtg gtacctgctg agcatgggct ctaatgagaa tatccacagc
32403240
atccacttct ctgggcatgt gttcactgtg aggaagaagg aggagtacaa gatggctctg atccacttct ctgggcatgt gttcactgtg aggaagaagg aggagtacaa gatggctctg
33003300
tataatctgt accctggggt gtttgaaact gtggagatgc tgccctctaa ggctggcatc tataatctgt accctggggt gtttgaaact gtggagatgc tgccctctaa ggctggcatc
33603360
tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg
34203420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat caggacttc
34803480
cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactat cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactat
35403540
tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg
36003600
ctggccccca tgatcattca tggcatcaag acccaggggg ccaggcagaa gttcagctct ctggccccca tgatcattca tggcatcaag acccagggg ccaggcagaa gttcagctct
36603660
ctgtacatct ctcagttcat catcatgtac tctctggatg ggaagaagtg gcagacctac ctgtacatct ctcagttcat catcatgtac tctctggatg ggaagaagtg gcagacctac
37203720
aggggcaaca gcactggcac cctgatggtg ttctttggga atgtggactc ttctggcatc aggggcaaca gcactggcac cctgatggtg ttctttggga atgtggactc ttctggcatc
37803780
aagcacaaca tcttcaatcc ccccatcatt gctaggtata ttaggctgca tcccacccac aagcacaaca tcttcaatcc ccccatcatt gctaggtata ttaggctgca tcccacccac
38403840
tacagcatca ggtctaccct gaggatggag ctgatgggct gtgacctgaa ctcttgcagc tacagcatca ggtctaccct gaggatggag ctgatgggct gtgacctgaa ctcttgcagc
39003900
atgcccctgg gcatggagtc taaggccatc tctgatgccc agattactgc cagcagctac atgcccctgg gcatggagtc taaggccatc tctgatgccc agattactgc cagcagctac
39603960
ttcaccaaca tgtttgccac ctggagcccc tctaaggcca ggctgcatct gcaggggagg ttcaccaaca tgtttgccac ctggagcccc tctaaggcca ggctgcatct gcaggggagg
40204020
agcaatgcct ggaggcctca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag agcaatgcct ggaggcctca ggtgaacaac cccaaggagt ggctgcaggt ggatttccag
40804080
aagaccatga aggtgactgg ggtgaccacc cagggggtca agagcctgct gaccagcatg aagaccatga aggtgactgg ggtgaccacc cagggggtca agagcctgct gaccagcatg
41404140
tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac tctgttcttt tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac tctgttcttt
42004200
cagaatggga aggtgaaggt gtttcagggc aatcaggact ctttcacccc tgtggtgaac cagaatggga aggtgaaggt gtttcagggc aatcaggact ctttcacccc tgtggtgaac
42604260
agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagtc ttgggtgcat agcctggacc cccccctgct gaccagatac ctgaggatcc acccccagtc ttgggtgcat
43204320
cagattgccc tgaggatgga ggtgctgggc tgtgaggctc aggatctgta ctga cagattgccc tgaggatgga ggtgctgggc tgtgaggctc aggatctgta ctga
43744374
<210> 382<210> 382
<211> 4374<211> 4374
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 382<400> 382
atgcagatcg agctctccac ctgcttcttt ctgtgcctgt tgagattctg cttcagcgcc atgcagatcg agctctccac ctgcttcttt ctgtgcctgt tgagattctg cttcagcgcc
60 60
accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg
120 120
ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac
180 180
acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt
240 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat
300 300
gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg
360 360
ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg
420 420
gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg
480 480
aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat
540 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag
600 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg
660 660
tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat
720 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc
780 780
ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc
840 840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac
900 900
aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg
960 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag
10201020
gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag
10801080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat
11401140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc
12001200
tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc
12601260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg
13201320
aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc
13801380
atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg
14401440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact
15001500
gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc
15601560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc
16201620
accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg
16801680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag
17401740
aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag
18001800
aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg
18601860
cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg
19201920
tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc
19801980
attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag
20402040
atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc
21002100
atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc
21602160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac
22202220
agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc
22802280
ttcagccaga atccacccgt ccttaagcgc catcagcgcg agatcaccag gaccaccctg ttcagccaga atccacccgt ccttaagcgc catcagcgcg agatcaccag gaccaccctg
23402340
cagtctgacc aggaggagat tgactatgat gacaccatct ctgtggagat gaagaaggag cagtctgacc aggagagat tgactatgat gacaccatct ctgtggagat gaagaaggag
24002400
gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc gactttgaca tctacgacga ggacgagaac cagagcccca ggagcttcca gaagaagacc
24602460
aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc aggcactact tcattgctgc tgtggagagg ctgtgggact atggcatgag cagcagcccc
25202520
catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc catgtgctga ggaacagggc ccagtctggc tctgtgcccc agttcaagaa ggtggtgttc
25802580
caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac caggagttca ctgatggcag cttcacccag cccctgtaca gaggggagct gaatgagcac
26402640
ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc ctgggcctgc tgggccccta catcagggct gaggtggagg acaacatcat ggtgaccttc
27002700
aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac aggaaccagg ccagcaggcc ctacagcttc tacagcagcc tgatcagcta tgaggaggac
27602760
cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac cagaggcagg gggctgagcc caggaagaac tttgtgaagc ccaatgaaac caagacctac
28202820
ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg ttctggaagg tgcagcacca catggccccc accaaggatg agtttgactg caaggcctgg
28802880
gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg gcctacttct ctgatgtgga cctggagaag gatgtgcact ctggcctgat tggccccctg
29402940
ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag ctggtgtgcc acaccaacac cctgaaccct gcccatggca ggcaggtgac tgtgcaggag
30003000
tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg tttgccctgt tcttcaccat ctttgatgaa accaagagct ggtacttcac tgagaacatg
30603060
gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac gagaggaact gcagggcccc ctgcaacatc cagatggagg accccacctt caaggagaac
31203120
tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc tacaggttcc atgccatcaa tggctacatc atggacaccc tgcctggcct ggtgatggcc
31803180
caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc caggaccaga ggatcaggtg gtacctgctg agcatgggca gcaatgagaa catccacagc
32403240
atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg atccacttct ctggccatgt gttcactgtg aggaagaagg aggagtacaa gatggccctg
33003300
tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc tacaacctgt accctggggt gtttgagact gtggagatgc tgcccagcaa ggctggcatc
33603360
tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg tggagggtgg agtgcctgat tggggagcac ctgcatgctg gcatgagcac cctgttcctg
34203420
gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat cagggacttc gtgtacagca acaagtgcca gacccccctg ggcatggcct ctggccacat caggacttc
34803480
cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac cagatcactg cctctggcca gtatggccag tgggccccca agctggccag gctgcactac
35403540
tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg tctggcagca tcaatgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg
36003600
ctggccccca tgatcatcca tggcatcaag acccaggggg ccaggcagaa gttcagcagc ctggccccca tgatcatcca tggcatcaag acccagggg ccaggcagaa gttcagcagc
36603660
ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac ctgtacatca gccagttcat catcatgtac agcctggatg gcaagaagtg gcagacctac
37203720
aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc aggggcaaca gcactggcac cctgatggtg ttctttggca atgtggacag ctctggcatc
37803780
aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac aagcacaaca tcttcaaccc ccccatcatt gccagataca tcaggctgca ccccacccac
38403840
tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc tacagcatca ggagcaccct gaggatggag ctgatgggct gtgacctgaa cagctgcagc
39003900
atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac atgcccctgg gcatggagag caaggccatc tctgatgccc agatcactgc cagcagctac
39603960
ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcatct gcagggcagg ttcaccaaca tgtttgccac ctggagcccc agcaaggcca ggctgcatct gcagggcagg
40204020
agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag agcaatgcct ggaggcccca ggtcaacaac cccaaggagt ggctgcaggt ggacttccag
40804080
aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg aagaccatga aggtgactgg ggtgaccacc cagggggtga agagcctgct gaccagcatg
41404140
tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc tatgtgaagg agttcctgat cagcagcagc caggatggcc accagtggac cctgttcttc
42004200
cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac cagaatggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc tgtggtgaac
42604260
agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac agcctggacc cccccctgct gaccagatac ctgaggattc acccccagag ctgggtgcac
43204320
cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga cagattgccc tgaggatgga ggtgctgggc tgtgaggccc aggacctgta ctga
43744374
<210> 383<210> 383
<211> 7056<211> 7056
<212> ДНК<212> DNA
<213> Homo sapiens<213> Homo sapiens
<400> 383<400> 383
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc
60 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc
120 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac
180 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc
240 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat
300 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt
360 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg
420 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg
480 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat
540 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa
600 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta
660 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat
720 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct gctgcatctg ctcggggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct
780 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc
840 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat
900 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg
960 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa
10201020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa
10801080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat
11401140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact
12001200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc
12601260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg
13201320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct
13801380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg
14401440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact
15001500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt gatgtccgtc ctttgtattc aaggatta ccaaaaggtg taaaacattt gaaggatttt
15601560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca
16201620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga
16801680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa
17401740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag
18001800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg
18601860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt
19201920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc
19801980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa
20402040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg
21002100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc
21602160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac
22202220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc
22802280
ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt ttctcccaga attcaagaca ccctagcact aggcaaaagc aatttaatgc caccacaatt
23402340
ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa ccagaaaatg acatagagaa gactgaccct tggtttgcac acagaacacc tatgcctaaa
24002400
atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat atacaaaatg tctcctctag tgatttgttg atgctcttgc gacagagtcc tactccacat
24602460
gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca gggctatcct tatctgatct ccaagaagcc aaatatgaga ctttttctga tgatccatca
25202520
cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc cctggagcaa tagacagtaa taacagcctg tctgaaatga cacacttcag gccacagctc
25802580
catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag catcacagtg gggacatggt atttacccct gagtcaggcc tccaattaag attaaatgag
26402640
aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca aaactgggga caactgcagc aacagagttg aagaaacttg atttcaaagt ttctagtaca
27002700
tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca tcaaataatc tgatttcaac aattccatca gacaatttgg cagcaggtac tgataataca
27602760
agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta agttccttag gacccccaag tatgccagtt cattatgata gtcaattaga taccactcta
28202820
tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa tttggcaaaa agtcatctcc ccttactgag tctggtggac ctctgagctt gagtgaagaa
28802880
aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga aataatgatt caaagttgtt agaatcaggt ttaatgaata gccaagaaag ttcatgggga
29402940
aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct aaaaatgtat cgtcaacaga gagtggtagg ttatttaaag ggaaaagagc tcatggacct
30003000
gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac gctttgttga ctaaagataa tgccttattc aaagttagca tctctttgtt aaagacaaac
30603060
aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta aaaacttcca ataattcagc aactaataga aagactcaca ttgatggccc atcattatta
31203120
attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa attgagaata gtccatcagt ctggcaaaat atattagaaa gtgacactga gtttaaaaaa
31803180
gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta gtgacacctt tgattcatga cagaatgctt atggacaaaa atgctacagc tttgaggcta
32403240
aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa aatcatatgt caaataaaac tacttcatca aaaaacatgg aaatggtcca acagaaaaaa
33003300
gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc gagggcccca ttccaccaga tgcacaaaat ccagatatgt cgttctttaa gatgctattc
33603360
ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg ttgccagaat cagcaaggtg gatacaaagg actcatggaa agaactctct gaactctggg
34203420
caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag caaggcccca gtccaaagca attagtatcc ttaggaccag aaaaatctgt ggaaggtcag
34803480
aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta aatttcttgt ctgagaaaaa caaagtggta gtaggaaagg gtgaatttac aaaggacgta
35403540
ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat ggactcaaag agatggtttt tccaagcagc agaaacctat ttcttactaa cttggataat
36003600
ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag ttacatgaaa ataatacaca caatcaagaa aaaaaaattc aggaagaaat agaaaagaag
36603660
gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag gaaacattaa tccaagagaa tgtagttttg cctcagatac atacagtgac tggcactaag
37203720
aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac aatttcatga agaacctttt cttactgagc actaggcaaa atgtagaagg ttcatatgac
37803780
ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca ggggcatatg ctccagtact tcaagatttt aggtcattaa atgattcaac aaatagaaca
38403840
aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga aagaaacaca cagctcattt ctcaaaaaaa ggggaggaag aaaacttgga aggcttggga
39003900
aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca aatcaaacca agcaaattgt agagaaatat gcatgcacca caaggatatc tcctaataca
39603960
agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca agccagcaga attttgtcac gcaacgtagt aagagagctt tgaaacaatt cagactccca
40204020
ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc ctagaagaaa cagaacttga aaaaaggata attgtggatg acacctcaac ccagtggtcc
40804080
aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag aaaaacatga aacatttgac cccgagcacc ctcacacaga tagactacaa tgagaaggag
41404140
aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct aaaggggcca ttactcagtc tcccttatca gattgcctta cgaggagtca tagcatccct
42004200
caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct caagcaaata gatctccatt acccattgca aaggtatcat catttccatc tattagacct
42604260
atatatctga ccagggtcct attccaagac aactcttctc atcttccagc agcatcttat atatatctga cccaggtcct attccaagac aactcttctc atcttccagc agcatcttat
43204320
agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat agaaagaaag attctggggt ccaagaaagc agtcatttct tacaaggagc caaaaaaaat
43804380
aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc aacctttctt tagccattct aaccttggag atgactggtg atcaaagaga ggttggctcc
44404440
ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg ctggggacaa gtgccacaaa ttcagtcaca tacaagaaag ttgagaacac tgttctcccg
45004500
aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat aaaccagact tgcccaaaac atctggcaaa gttgaattgc ttccaaaagt tcacatttat
45604560
cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg cagaaggacc tattccctac ggaaactagc aatgggtctc ctggccatct ggatctcgtg
46204620
gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct gaagggagcc ttcttcaggg aacagaggga gcgattaagt ggaatgaagc aaacagacct
46804680
ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta ggaaaagttc cctttctgag agtagcaaca gaaagctctg caaagactcc ctccaagcta
47404740
ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa ttggatcctc ttgcttggga taaccactat ggtactcaga taccaaaaga agagtggaaa
48004800
tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg tcccaagaga agtcaccaga aaaaacagct tttaagaaaa aggataccat tttgtccctg
48604860
aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa aacgcttgtg aaagcaatca tgcaatagca gcaataaatg agggacaaaa taagcccgaa
49204920
atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca atagaagtca cctgggcaaa gcaaggtagg actgaaaggc tgtgctctca aaacccacca
49804980
gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa gtcttgaaac gccatcaacg ggaaataact cgtactactc ttcagtcaga tcaagaggaa
50405040
attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat
51005100
gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct
51605160
gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg
52205220
gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc
52805280
tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca
53405340
tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt
54005400
ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa
54605460
cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat
55205520
catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt catatggcac cccataaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt
55805580
gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg cccacactaac
56405640
acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc
57005700
atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct
57605760
ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc
58205820
aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga
58805880
tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat
59405940
gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt
60006000
gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt
60606060
attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt
61206120
cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga
61806180
caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc
62406240
tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt
63006300
cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt cacggcatca agacccagg tgcccgtcag aagttctcca gcctctacat ctctcagttt
63606360
atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga
64206420
accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac
64806480
cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact
65406540
cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag
66006600
agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc
66606660
acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct
67206720
caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca
67806780
ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc
68406840
atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag
69006900
gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta
69606960
ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg
70207020
gaggttctgg gctgcgaggc acaggacctc tactga gaggttctgg gctgcgaggc acaggacctc tactga
70567056
<210> 384<210> 384
<211> 4425<211> 4425
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 384<400> 384
atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc atgcagattg agctgagcac ctgcttcttc ctgtgcctgc tgaggttctg cttctctgcc
60 60
accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg accaggagat actacctggg ggctgtggag ctgagctggg actacatgca gtctgacctg
120 120
ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac ggggagctgc ctgtggatgc caggttcccc cccagagtgc ccaagagctt ccccttcaac
180 180
acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt acctctgtgg tgtacaagaa gaccctgttt gtggagttca ctgaccacct gttcaacatt
240 240
gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat gccaagccca ggcccccctg gatgggcctg ctgggcccca ccatccaggc tgaggtgtat
300 300
gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg gacactgtgg tgatcaccct gaagaacatg gccagccacc ctgtgagcct gcatgctgtg
360 360
ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg ggggtgagct actggaaggc ctctgagggg gctgagtatg atgaccagac cagccagagg
420 420
gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg gagaaggagg atgacaaggt gttccctggg ggcagccaca cctatgtgtg gcaggtgctg
480 480
aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat aaggagaatg gccccatggc ctctgacccc ctgtgcctga cctacagcta cctgagccat
540 540
gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag gtggacctgg tgaaggacct gaactctggc ctgattgggg ccctgctggt gtgcagggag
600 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gtttgctgtg
660 660
tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat tttgatgagg gcaagagctg gcactctgaa accaagaaca gcctgatgca ggacagggat
720 720
gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc gctgcctctg ccagggcctg gcccaagatg cacactgtga atggctatgt gaacaggagc
780 780
ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc ctgcctggcc tgattggctg ccacaggaag tctgtgtact ggcatgtgat tggcatgggc
840 840
accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac accacccctg aggtgcacag catcttcctg gagggccaca ccttcctggt caggaaccac
900 900
aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg aggcaggcca gcctggagat cagccccatc accttcctga ctgcccagac cctgctgatg
960 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcatga tggcatggag
10201020
gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag gcctatgtga aggtggacag ctgccctgag gagccccagc tgaggatgaa gaacaatgag
10801080
gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat gaggctgagg actatgatga tgacctgact gactctgaga tggatgtggt gaggtttgat
11401140
gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc gatgacaaca gccccagctt catccagatc aggtctgtgg ccaagaagca ccccaagacc
12001200
tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc tgggtgcact acattgctgc tgaggaggag gactgggact atgcccccct ggtgctggcc
12601260
cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg cctgatgaca ggagctacaa gagccagtac ctgaacaatg gcccccagag gattggcagg
13201320
aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc aagtacaaga aggtcaggtt catggcctac actgatgaaa ccttcaagac cagggaggcc
13801380
atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg atccagcatg agtctggcat cctgggcccc ctgctgtatg gggaggtggg ggacaccctg
14401440
ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact ctgatcatct tcaagaacca ggccagcagg ccctacaaca tctaccccca tggcatcact
15001500
gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc gatgtgaggc ccctgtacag caggaggctg cccaaggggg tgaagcacct gaaggacttc
15601560
cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc cccatcctgc ctggggagat cttcaagtac aagtggactg tgactgtgga ggatggcccc
16201620
accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg accaagtctg accccaggtg cctgaccaga tactacagca gctttgtgaa catggagagg
16801680
gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag gacctggcct ctggcctgat tggccccctg ctgatctgct acaaggagtc tgtggaccag
17401740
aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag aggggcaacc agatcatgtc tgacaagagg aatgtgatcc tgttctctgt gtttgatgag
18001800
aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg aacaggagct ggtacctgac tgagaacatc cagaggttcc tgcccaaccc tgctggggtg
18601860
cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg cagctggagg accctgagtt ccaggccagc aacatcatgc acagcatcaa tggctatgtg
19201920
tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc tttgacagcc tgcagctgtc tgtgtgcctg catgaggtgg cctactggta catcctgagc
19801980
attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag attggggccc agactgactt cctgtctgtg ttcttctctg gctacacctt caagcacaag
20402040
atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc atggtgtatg aggacaccct gaccctgttc cccttctctg gggagactgt gttcatgagc
21002100
atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc atggagaacc ctggcctgtg gattctgggc tgccacaact ctgacttcag gaacaggggc
21602160
atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac atgactgccc tgctgaaagt ctccagctgt gacaagaaca ctggggacta ctatgaggac
22202220
agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc agctatgagg acatctctgc ctacctgctg agcaagaaca atgccattga gcccaggagc
22802280
ttcagccaga atgccactaa tgtgtctaac aacagcaaca ccagcaatga cagcaatgtg ttcagccaga atgccactaa tgtgtctaac aacagcaaca ccagcaatga cagcaatgtg
23402340
tctcccccag tgctgaagag gcaccagagg gagatcacca ggaccaccct gcagtctgac tctcccccag tgctgaagag gcaccagagg gagatcacca ggaccaccct gcagtctgac
24002400
caggaggaga ttgactatga tgacaccatc tctgtggaga tgaagaagga ggactttgac caggaggaga ttgactatga tgacaccatc tctgtggaga tgaagaagga ggactttgac
24602460
atctacgacg aggacgagaa ccagagcccc aggagcttcc agaagaagac caggcactac atctacgacg aggacgagaa cccagcccc aggagcttcc agaagaagac caggcactac
25202520
ttcattgctg ctgtggagag gctgtgggac tatggcatga gcagcagccc ccatgtgctg ttcattgctg ctgtggagag gctgtgggac tatggcatga gcagcagccc ccatgtgctg
25802580
aggaacaggg cccagtctgg ctctgtgccc cagttcaaga aggtggtgtt ccaggagttc aggaacaggg cccagtctgg ctctgtgccc cagttcaaga aggtggtgtt ccaggagttc
26402640
actgatggca gcttcaccca gcccctgtac agaggggagc tgaatgagca cctgggcctg actgatggca gcttcaccca gcccctgtac agaggggagc tgaatgagca cctgggcctg
27002700
ctgggcccct acatcagggc tgaggtggag gacaacatca tggtgacctt caggaaccag ctgggcccct acatcagggc tgaggtggag gacaacatca tggtgacctt caggaaccag
27602760
gccagcaggc cctacagctt ctacagcagc ctgatcagct atgaggagga ccagaggcag gccagcaggc cctacagctt ctacagcagc ctgatcagct atgaggagga ccagaggcag
28202820
ggggctgagc ccaggaagaa ctttgtgaag cccaatgaaa ccaagaccta cttctggaag ggggctgagc ccaggaagaa ctttgtgaag cccaatgaaa ccaagaccta cttctggaag
28802880
gtgcagcacc acatggcccc caccaaggat gagtttgact gcaaggcctg ggcctacttc gtgcagcacc acatggcccc caccaaggat gagtttgact gcaaggcctg ggcctacttc
29402940
tctgatgtgg acctggagaa ggatgtgcac tctggcctga ttggccccct gctggtgtgc tctgatgtgg acctggagaa ggatgtgcac tctggcctga ttggccccct gctggtgtgc
30003000
cacaccaaca ccctgaaccc tgcccatggc aggcaggtga ctgtgcagga gtttgccctg cacaccaaca ccctgaaccc tgcccatggc aggcaggtga ctgtgcagga gtttgccctg
30603060
ttcttcacca tctttgatga aaccaagagc tggtacttca ctgagaacat ggagaggaac ttcttcacca tctttgatga aaccaagagc tggtacttca ctgagaacat ggagaggaac
31203120
tgcagggccc cctgcaacat ccagatggag gaccccacct tcaaggagaa ctacaggttc tgcagggccc cctgcaacat ccagatggag gaccccacct tcaaggagaa ctacaggttc
31803180
catgccatca atggctacat catggacacc ctgcctggcc tggtgatggc ccaggaccag catgccatca atggctacat catggacacc ctgcctggcc tggtgatggc ccaggaccag
32403240
aggatcaggt ggtacctgct gagcatgggc agcaatgaga acatccacag catccacttc aggatcaggt ggtacctgct gagcatgggc agcaatgaga acatccacag catccacttc
33003300
tctggccatg tgttcactgt gaggaagaag gaggagtaca agatggccct gtacaacctg tctggccatg tgttcactgt gaggaagaag gaggagtaca agatggccct gtacaacctg
33603360
taccctgggg tgtttgagac tgtggagatg ctgcccagca aggctggcat ctggagggtg taccctgggg tgtttgagac tgtggagatg ctgcccagca aggctggcat ctggagggtg
34203420
gagtgcctga ttggggagca cctgcatgct ggcatgagca ccctgttcct ggtgtacagc gagtgcctga ttggggagca cctgcatgct ggcatgagca ccctgttcct ggtgtacagc
34803480
aacaagtgcc agacccccct gggcatggcc tctggccaca tcagggactt ccagatcact aacaagtgcc agacccccct gggcatggcc tctggccaca tcagggactt ccagatcact
35403540
gcctctggcc agtatggcca gtgggccccc aagctggcca ggctgcacta ctctggcagc gcctctggcc agtatggcca gtgggccccc aagctggcca ggctgcacta ctctggcagc
36003600
atcaatgcct ggagcaccaa ggagcccttc agctggatca aggtggacct gctggccccc atcaatgcct ggagcaccaa ggagcccttc agctggatca aggtggacct gctggccccc
36603660
atgatcatcc atggcatcaa gacccagggg gccaggcaga agttcagcag cctgtacatc atgatcatcc atggcatcaa gacccagggg gccaggcaga agttcagcag cctgtacatc
37203720
agccagttca tcatcatgta cagcctggat ggcaagaagt ggcagaccta caggggcaac agccagttca tcatcatgta cagcctggat ggcaagaagt ggcagaccta caggggcaac
37803780
agcactggca ccctgatggt gttctttggc aatgtggaca gctctggcat caagcacaac agcactggca ccctgatggt gttctttggc aatgtggaca gctctggcat caagcacaac
38403840
atcttcaacc cccccatcat tgccagatac atcaggctgc accccaccca ctacagcatc atcttcaacc cccccatcat tgccagatac atcaggctgc accccaccca ctacagcatc
39003900
aggagcaccc tgaggatgga gctgatgggc tgtgacctga acagctgcag catgcccctg aggagcaccc tgaggatgga gctgatgggc tgtgacctga acagctgcag catgcccctg
39603960
ggcatggaga gcaaggccat ctctgatgcc cagatcactg ccagcagcta cttcaccaac ggcatggaga gcaaggccat ctctgatgcc cagatcactg ccagcagcta cttcaccaac
40204020
atgtttgcca cctggagccc cagcaaggcc aggctgcacc tgcagggcag gagcaatgcc atgtttgcca cctggagccc cagcaaggcc aggctgcacc tgcagggcag gagcaatgcc
40804080
tggaggcccc aggtcaacaa ccccaaggag tggctgcagg tggacttcca gaagaccatg tggaggcccc aggtcaacaa ccccaaggag tggctgcagg tggacttcca gaagaccatg
41404140
aaggtgactg gggtgaccac ccagggggtg aagagcctgc tgaccagcat gtatgtgaag aaggtgactg gggtgaccac ccagggggtg aagagcctgc tgaccagcat gtatgtgaag
42004200
gagttcctga tcagcagcag ccaggatggc caccagtgga ccctgttctt ccagaatggc gagttcctga tcagcagcag ccaggatggc caccagtgga ccctgttctt ccagaatggc
42604260
aaggtgaagg tgttccaggg caaccaggac agcttcaccc ctgtggtgaa cagcctggac aaggtgaagg tgttccaggg caaccaggac agcttcaccc ctgtggtgaa cagcctggac
43204320
ccccccctgc tgaccagata cctgaggatt cacccccaga gctgggtgca ccagattgcc ccccccctgc tgaccagata cctgaggatt cacccccaga gctgggtgca ccagattgcc
43804380
ctgaggatgg aggtgctggg ctgtgaggcc caggacctgt actga ctgaggatgg aggtgctggg ctgtgaggcc caggacctgt actga
44254425
<210> 385<210> 385
<211> 1474<211> 1474
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полипептидpolypeptide
<400> 385<400> 385
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg PheMet Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 151 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu SerCys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30 20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala ArgTrp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45 35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val ValPhe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60 50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn IleTyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 8065 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile GlnAla Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95 85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala SerAla Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110 100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala SerHis Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125 115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu AspGlu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140 130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val LeuAsp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr SerLys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175 165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu IleTyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190 180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys ThrGly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205 195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu GlyGln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220 210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg AspLys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly TyrAla Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255 245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser ValVal Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270 260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser IleTyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285 275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala SerPhe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300 290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu MetLeu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln HisAsp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His
325 330 335 325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu ProAsp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350 340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp AspGln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365 355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn SerLeu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380 370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys ThrPro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala ProTrp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415 405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu AsnLeu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430 420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe MetAsn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445 435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His GluAla Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460 450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr LeuSer Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr ProLeu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495 485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro LysHis Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510 500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile PheGly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525 515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser AspLys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540 530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu ArgPro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys GluAsp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575 565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn ValSer Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590 580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr GluIle Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605 595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu AspAsn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620 610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr ValPro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr TrpPhe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655 645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe PheTyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670 660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu ThrSer Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685 675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn ProLeu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700 690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg GlyGly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly AspMet Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735 725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser LysTyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750 740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ala Thr Asn ValAsn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ala Thr Asn Val
755 760 765 755 760 765
Ser Asn Asn Ser Asn Thr Ser Asn Asp Ser Asn Val Ser Pro Pro ValSer Asn Asn Ser Asn Thr Ser Asn Asp Ser Asn Val Ser Pro Pro Val
770 775 780 770 775 780
Leu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser AspLeu Lys Arg His Gln Arg Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp
785 790 795 800785 790 795 800
Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys LysGln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys
805 810 815 805 810 815
Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg SerGlu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser
820 825 830 820 825 830
Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg LeuPhe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu
835 840 845 835 840 845
Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg AlaTrp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala
850 855 860 850 855 860
Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu PheGln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe
865 870 875 880865 870 875 880
Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn GluThr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu
885 890 895 885 890 895
His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp AsnHis Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn
900 905 910 900 905 910
Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe TyrIle Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr
915 920 925 915 920 925
Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu ProSer Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro
930 935 940 930 935 940
Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp LysArg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys
945 950 955 960945 950 955 960
Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys AlaVal Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala
965 970 975 965 970 975
Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser GlyTrp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
980 985 990 980 985 990
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro AlaLeu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala
995 1000 1005 995 1000 1005
His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe ThrHis Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr
1010 1015 1020 1010 1015 1020
Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met GluIle Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu
1025 1030 1035 1025 1030 1035
Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro ThrArg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr
1040 1045 1050 1040 1045 1050
Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile MetPhe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met
1055 1060 1065 1055 1060 1065
Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile ArgAsp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg
1070 1075 1080 1070 1075 1080
Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser IleTrp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile
1085 1090 1095 1085 1090 1095
His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu TyrHis Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr
1100 1105 1110 1100 1105 1110
Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr ValLys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val
1115 1120 1125 1115 1120 1125
Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys LeuGlu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu
1130 1135 1140 1130 1135 1140
Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu ValIle Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val
1145 1150 1155 1145 1150 1155
Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly HisTyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His
1160 1165 1170 1160 1165 1170
Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln TrpIle Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp
1175 1180 1185 1175 1180 1185
Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn AlaAla Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala
1190 1195 1200 1190 1195 1200
Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu LeuTrp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu
1205 1210 1215 1205 1210 1215
Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg GlnAla Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln
1220 1225 1230 1220 1225 1230
Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr SerLys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser
1235 1240 1245 1235 1240 1245
Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr GlyLeu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly
1250 1255 1260 1250 1255 1260
Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile LysThr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys
1265 1270 1275 1265 1270 1275
His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg LeuHis Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu
1280 1285 1290 1280 1285 1290
His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu LeuHis Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu
1295 1300 1305 1295 1300 1305
Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met GluMet Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu
1310 1315 1320 1310 1315 1320
Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr PheSer Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe
1325 1330 1335 1325 1330 1335
Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu HisThr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His
1340 1345 1350 1340 1345 1350
Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn ProLeu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro
1355 1360 1365 1355 1360 1365
Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val ThrLys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr
1370 1375 1380 1370 1375 1380
Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met TyrGly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr
1385 1390 1395 1385 1390 1395
Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln TrpVal Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp
1400 1405 1410 1400 1405 1410
Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly AsnThr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn
1415 1420 1425 1415 1420 1425
Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro LeuGln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu
1430 1435 1440 1430 1435 1440
Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His GlnLeu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln
1445 1450 1455 1445 1450 1455
Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp LeuIle Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu
1460 1465 1470 1460 1465 1470
TyrTyr
<210> 386<210> 386
<211> 5052<211> 5052
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 386<400> 386
atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc atgcaaatag agctctccac ctgcttcttt ctgtgccttt tgcgattctg ctttagtgcc
60 60
accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc accagaagat actacctggg tgcagtggaa ctgtcatggg actatatgca aagtgatctc
120 120
ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac ggtgagctgc ctgtggacgc aagatttcct cctagagtgc caaaatcttt tccattcaac
180 180
acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc acctcagtcg tgtacaaaaa gactctgttt gtagaattca cggatcacct tttcaacatc
240 240
gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat gctaagccaa ggccaccctg gatgggtctg ctaggtccta ccatccaggc tgaggtttat
300 300
gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt gatacagtgg tcattacact taagaacatg gcttcccatc ctgtcagtct tcatgctgtt
360 360
ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg ggtgtatcct actggaaagc ttctgaggga gctgaatatg atgatcagac cagtcaaagg
420 420
gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg gagaaagaag atgataaagt cttccctggt ggaagccata catatgtctg gcaggtcctg
480 480
aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat aaagagaatg gtccaatggc ctctgaccca ctgtgcctta cctactcata tctttctcat
540 540
gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa gtggacctgg taaaagactt gaattcaggc ctcattggag ccctactagt atgtagagaa
600 600
gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta gggagtctgg ccaaggaaaa gacacagacc ttgcacaaat ttatactact ttttgctgta
660 660
tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat tttgatgaag ggaaaagttg gcactcagaa acaaagaact ccttgatgca ggatagggat
720 720
gctgcatctg ctcgggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct gctgcatctg ctcggggcctg gcctaaaatg cacacagtca atggttatgt aaacaggtct
780 780
ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc ctgccaggtc tgattggatg ccacaggaaa tcagtctatt ggcatgtgat tggaatgggc
840 840
accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat accactcctg aagtgcactc aatattcctc gaaggtcaca catttcttgt gaggaaccat
900 900
cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg cgccaggcgt ccttggaaat ctcgccaata actttcctta ctgctcaaac actcttgatg
960 960
gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa gaccttggac agtttctact gttttgtcat atctcttccc accaacatga tggcatggaa
10201020
gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa gcttatgtca aagtagacag ctgtccagag gaaccccaac tacgaatgaa aaataatgaa
10801080
gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat gaagcggaag actatgatga tgatcttact gattctgaaa tggatgtggt caggtttgat
11401140
gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact gatgacaact ctccttcctt tatccaaatt cgctcagttg ccaagaagca tcctaaaact
12001200
tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc tgggtacatt acattgctgc tgaagaggag gactgggact atgctccctt agtcctcgcc
12601260
cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg cccgatgaca gaagttataa aagtcaatat ttgaacaatg gccctcagcg gattggtagg
13201320
aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct aagtacaaaa aagtccgatt tatggcatac acagatgaaa cctttaagac tcgtgaagct
13801380
attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg attcagcatg aatcaggaat cttgggacct ttactttatg gggaagttgg agacacactg
14401440
ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact ttgattatat ttaagaatca agcaagcaga ccatataaca tctaccctca cggaatcact
15001500
gatgtccgtc ctttgtattc aaggagatta ccaaaaggtg taaaacattt gaaggatttt gatgtccgtc ctttgtattc aaggatta ccaaaaggtg taaaacattt gaaggatttt
15601560
ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca ccaattctgc caggagaaat attcaaatat aaatggacag tgactgtaga agatgggcca
16201620
actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga actaaatcag atcctcggtg cctgacccgc tattactcta gtttcgttaa tatggagaga
16801680
gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa gatctagctt caggactcat tggccctctc ctcatctgct acaaagaatc tgtagatcaa
17401740
agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag agaggaaacc agataatgtc agacaagagg aatgtcatcc tgttttctgt atttgatgag
18001800
aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg aaccgaagct ggtacctcac agagaatata caacgctttc tccccaatcc agctggagtg
18601860
cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt cagcttgagg atccagagtt ccaagcctcc aacatcatgc acagcatcaa tggctatgtt
19201920
tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc tttgatagtt tgcagttgtc agtttgtttg catgaggtgg catactggta cattctaagc
19801980
attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa attggagcac agactgactt cctttctgtc ttcttctctg gatatacctt caaacacaaa
20402040
atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg atggtctatg aagacacact caccctattc ccattctcag gagaaactgt cttcatgtcg
21002100
atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc atggaaaacc caggtctatg gattctgggg tgccacaact cagactttcg gaacagaggc
21602160
atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac atgaccgcct tactgaaggt ttctagttgt gacaagaaca ctggtgatta ttacgaggac
22202220
agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc agttatgaag atatttcagc atacttgctg agtaaaaaca atgccattga accaagaagc
22802280
ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt ttctctcaaa acccaccagt cttgaaacgc catcaacggg aaataactcg tactactctt
23402340
cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa cagtcagatc aagaggaaat tgactatgat gataccatat cagttgaaat gaagaaggaa
24002400
gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca gattttgaca tttatgatga ggatgaaaat cagagccccc gcagctttca aaagaaaaca
24602460
cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca cgacactatt ttattgctgc agtggagagg ctctgggatt atgggatgag tagctcccca
25202520
catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc catgttctaa gaaacagggc tcagagtggc agtgtccctc agttcaagaa agttgttttc
25802580
caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat caggaattta ctgatggctc ctttactcag cccttatacc gtggagaact aaatgaacat
26402640
ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc ttgggactcc tggggccata tataagagca gaagttgaag ataatatcat ggtaactttc
27002700
agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat agaaatcagg cctctcgtcc ctattccttc tattctagcc ttatttctta tgaggaagat
27602760
cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac cagaggcaag gagcagaacc tagaaaaaac tttgtcaagc ctaatgaaac caaaacttac
28202820
ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg ttttggaaag tgcaacatca tatggcaccc actaaagatg agtttgactg caaagcctgg
28802880
gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt gcttatttct ctgatgttga cctggaaaaa gatgtgcact caggcctgat tggacccctt
29402940
ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa ctggtctgcc acactaacac actgaaccct gctcatggga gacaagtgac agtacaggaa
30003000
tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg tttgctctgt ttttcaccat ctttgatgag accaaaagct ggtacttcac tgaaaatatg
30603060
gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat gaaagaaact gcagggctcc ctgcaatatc cagatggaag atcccacttt taaagagaat
31203120
tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct tatcgcttcc atgcaatcaa tggctacata atggatacac tacctggctt agtaatggct
31803180
caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct caggatcaaa ggattcgatg gtatctgctc agcatgggca gcaatgaaaa catccattct
32403240
attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg attcatttca gtggacatgt gttcactgta cgaaaaaaag aggagtataa aatggcactg
33003300
tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt tacaatctct atccaggtgt ttttgagaca gtggaaatgt taccatccaa agctggaatt
33603360
tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg tggcgggtgg aatgccttat tggcgagcat ctacatgctg ggatgagcac actttttctg
34203420
gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt gtgtacagca ataagtgtca gactcccctg ggaatggctt ctggacacat tagagatttt
34803480
cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat cagattacag cttcaggaca atatggacag tgggccccaa agctggccag acttcattat
35403540
tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg tccggatcaa tcaatgcctg gagcaccaag gagccctttt cttggatcaa ggtggatctg
36003600
ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc ttggcaccaa tgattattca cggcatcaag acccagggtg cccgtcagaa gttctccagc
36603660
ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat ctctacatct ctcagtttat catcatgtat agtcttgatg ggaagaagtg gcagacttat
37203720
cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata cgaggaaatt ccactggaac cttaatggtc ttctttggca atgtggattc atctgggata
37803780
aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat aaacacaata tttttaaccc tccaattatt gctcgataca tccgtttgca cccaactcat
38403840
tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc tatagcattc gcagcactct tcgcatggag ttgatgggct gtgatttaaa tagttgcagc
39003900
atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac atgccattgg gaatggagag taaagcaata tcagatgcac agattactgc ttcatcctac
39603960
tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg tttaccaata tgtttgccac ctggtctcct tcaaaagctc gacttcacct ccaagggagg
40204020
agtaatgcct ggagacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag agtaatgcct ggagaacctca ggtgaataat ccaaaagagt ggctgcaagt ggacttccag
40804080
aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg aagacaatga aagtcacagg agtaactact cagggagtaa aatctctgct taccagcatg
41404140
tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt tatgtgaagg agttcctcat ctccagcagt caagatggcc atcagtggac tctctttttt
42004200
cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac cagaatggca aagtaaaggt ttttcaggga aatcaagact ccttcacacc tgtggtgaac
42604260
tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac tctctagacc caccgttact gactcgctac cttcgaattc acccccagag ttgggtgcac
43204320
cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta cgacaaaact cagattgccc tgaggatgga ggttctgggc tgcgaggcac aggacctcta cgacaaaact
43804380
cacacatgcc caccgtgccc agctccagaa ctcctgggcg gaccgtcagt cttcctcttc cacacatgcc caccgtgccc agctccagaa ctcctgggcg gaccgtcagt cttcctcttc
44404440
cccccaaaac ccaaggacac cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg cccccaaaac ccaaggacac cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg
45004500
gtggacgtga gccacgaaga ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtggacgtga gccacgaaga ccctgaggtc aagttcaact ggtacgtgga cggcgtggag
45604560
gtgcataatg ccaagacaaa gccgcgggag gagcagtaca acagcacgta ccgtgtggtc gtgcataatg ccaagacaaa gccgcgggag gagcagtaca acagcacgta ccgtgtggtc
46204620
agcgtcctca ccgtcctgca ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc agcgtcctca ccgtcctgca ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc
46804680
tccaacaaag ccctcccagc ccccatcgag aaaaccatct ccaaagccaa agggcagccc tccaacaaag ccctcccagc ccccatcgag aaaaccatct ccaaagccaa agggcagccc
47404740
cgagaaccac aggtgtacac cctgccccca tcccgggatg agctgaccaa gaaccaggtc cgagaaccac aggtgtacac cctgccccca tcccgggatg agctgaccaa gaaccaggtc
48004800
agcctgacct gcctggtcaa aggcttctat cccagcgaca tcgccgtgga gtgggagagc agcctgacct gcctggtcaa aggcttctat cccagcgaca tcgccgtgga gtggggagagc
48604860
aatgggcagc cggagaacaa ctacaagacc acgcctcccg tgttggactc cgacggctcc aatgggcagc cggagaacaa ctacaagacc acgcctcccg tgttggactc cgacggctcc
49204920
ttcttcctct acagcaagct caccgtggac aagagcaggt ggcagcaggg gaacgtcttc ttcttcctct acagcaagct caccgtggac aagagcaggt ggcagcaggg gaacgtcttc
49804980
tcatgctccg tgatgcatga ggctctgcac aaccactaca cgcagaagag cctctccctg tcatgctccg tgatgcatga ggctctgcac aaccactaca cgcagaagag cctctccctg
50405040
tctccgggta aa tctccgggta aa
50525052
<210> 387<210> 387
<211> 4374<211> 4374
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 387<400> 387
atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc
60 60
accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg
120 120
ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac
180 180
acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc
240 240
gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac
300 300
gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg
360 360
ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga
420 420
gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg
480 480
aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac
540 540
gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa
600 600
ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg
660 660
ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat
720 720
gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc
780 780
ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc
840 840
acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac
900 900
agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg
960 960
gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa
10201020
gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag
10801080
gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac
11401140
gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc
12001200
tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc
12601260
cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg
13201320
aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc
13801380
atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg
14401440
ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc
15001500
gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc
15601560
cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc
16201620
accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc
16801680
gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag
17401740
cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag
18001800
aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg
18601860
caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg
19201920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc
19801980
attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag
20402040
atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc
21002100
atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc
21602160
atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac
22202220
agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcctcggagc
22802280
ttcagccaga atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg ttcagccaga atcctcctgt gctgaagcgg caccagcgcg agatcaccag aacaaccctg
23402340
cagagcgacc aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa cagagcgacc aagaggaaat cgattacgac gacaccatca gcgtcgagat gaagaaagaa
24002400
gatttcgaca tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc gatttcgaca tctacgacga ggacgagaat cagagcccca gaagctttca gaaaaagacc
24602460
cggcactact tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct cggcactact tcattgccgc cgtcgagaga ctgtgggact acggcatgtc tagcagccct
25202520
cacgtgctga gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc cacgtgctga gaaatagagc ccagagcggc agcgtgcccc agttcaagaa agtggtgttc
25802580
caagagttca ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat caagagttca ccgacggcag cttcacccag ccactgtata gaggcgagct gaacgagcat
26402640
ctgggcctgc tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc ctgggcctgc tgggccctta tatcagagcc gaagtggaag ataacatcat ggtcaccttc
27002700
cggaatcagg ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac cggaatcagg ctagccggcc ttacagcttc tacagctccc tgatcagcta cgaagaggac
27602760
cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac cagagacagg gcgctgagcc cagaaagaac ttcgtgaagc ccaacgagac taagacctac
28202820
ttttggaagg tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg ttttggaagg tgcagcacca catggcccct acaaaggacg agttcgactg caaagcctgg
28802880
gcctacttct ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg gcctacttct ccgatgtgga tctggaaaag gacgtgcaca gcgggctcat cggaccactg
29402940
cttgtgtgcc acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag cttgtgtgcc acaccaacac actgaacccc gctcacggca gacaagtgac agtgcaagag
30003000
ttcgccctgt tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg ttcgccctgt tcttcaccat cttcgacgaa acaaagagct ggtacttcac cgagaatatg
30603060
gaacggaact gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac gaacggaact gcagagcccc ttgcaacatc cagatggaag atcccacctt caaagagaac
31203120
taccggttcc acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc taccggttcc acgccatcaa cggctacatc atggacacac tgcccggcct ggttatggcc
31803180
caggatcaga gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc caggatcaga gaatccggtg gtatctgctg tccatgggct ccaacgagaa tatccacagc
32403240
atccacttca gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg atccacttca gcggccacgt gttcaccgtg cggaaaaaag aagagtacaa aatggccctg
33003300
tacaatctgt accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt tacaatctgt accctggggt gttcgaaacc gtggaaatgc tgccttccaa ggccggcatt
33603360
tggagagtgg aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg tggagagtgg aatgtctgat tggagagcac ctccacgccg gaatgagcac cctgtttctg
34203420
gtgtacagca acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc gtgtacagca acaagtgtca gacccctctc ggcatggcct ctggacacat cagagacttc
34803480
cagatcaccg cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac cagatcaccg cctctggcca gtacggacag tgggctccta aactggctcg gctgcactac
35403540
agcggcagca tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg agcggcagca tcaatgcctg gtccaccaaa gagcccttca gctggatcaa ggtggacctg
36003600
ctggctccca tgatcatcca cggaatcaag acccagggcg ccagacagaa gttcagcagc ctggctccca tgatcatcca cggaatcaag acccagggcg cgacagaa gttcagcagc
36603660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac
37203720
agaggcaaca gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt agaggcaaca gcaccggcac actcatggtg ttcttcggca acgtggactc cagcggcatt
37803780
aagcacaaca tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac aagcacaaca tcttcaaccc tccaatcatt gcccggtaca tccggctgca ccccacacac
38403840
tacagcatcc ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct tacagcatcc ggtctaccct gagaatggaa ctgatgggct gcgacctgaa cagctgctct
39003900
atgcccctcg gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac atgcccctcg gaatggaaag caaggccatc agcgacgccc agatcacagc cagcagctac
39603960
ttcaccaaca tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga ttcaccaaca tgttcgccac ttggagcccc tccaaggcta gactgcatct gcagggcaga
40204020
agcaacgctt ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa agcaacgctt ggaggcccca agtgaacaac cccaaagagt ggctgcaggt tgactttcaa
40804080
aagaccatga aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg aagaccatga aagtgaccgg cgtgaccaca cagggcgtca agtctctgct gacctctatg
41404140
tacgtgaaag agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc tacgtgaaag agttcctgat ctccagcagc caggacggcc atcagtggac cctgtttttc
42004200
cagaacggca aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat cagaacggca aagtgaaagt gttccagggc aatcaggaca gcttcacacc cgtggtcaat
42604260
tctctggacc ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac tctctggacc ctccactgct gaccagatac ctgcggattc accctcagtc ttgggtgcac
43204320
cagatcgctc tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctag cagatcgctc tgcggatgga agtgctgggc tgtgaagctc aggacctcta ctag
43744374
<210> 388<210> 388
<211> 4980<211> 4980
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 388<400> 388
atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc
60 60
acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg
120 120
ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac
180 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc
240 240
gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac
300 300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg
360 360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc
420 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg
480 480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac
540 540
gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag
600 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg
660 660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac
720 720
gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc
780 780
ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc
840 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac
900 900
cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg
960 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag
10201020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag
10801080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac
11401140
gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc
12001200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc
12601260
cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc
13201320
aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc
13801380
atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg
14401440
ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc
15001500
gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc
15601560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc
16201620
accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc
16801680
gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag gacctggcca gcggcctgat cggccccctg ctgatctgct acaagggagag cgtggaccag
17401740
cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag
18001800
aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg
18601860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg
19201920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc
19801980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag
20402040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc
21002100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc
21602160
atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac
22202220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc
22802280
ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc
23402340
cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag
24002400
atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac
24602460
ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc
25202520
cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg
25802580
caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag
26402640
aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc
27002700
agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc
27602760
agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg
28202820
ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag
28802880
aacaacgaca gcaagctgcc ccccgtgctg aagcgccacc agcgcgagat cacccgcacc aacaacgaca gcaagctgcc ccccgtgctg aagcgccacc agcgcgagat cacccgcacc
29402940
accctgcaga gcgaccagga ggagatcgac tacgacgaca ccatcagcgt ggagatgaag accctgcaga gcgaccagga ggagatcgac tacgacgaca ccatcagcgt ggagatgaag
30003000
aaggaggact tcgacatcta cgacgaggac gagaaccaga gcccccgcag cttccagaag aaggaggact tcgacatcta cgacgaggac gagaaccaga gcccccgcag cttccagaag
30603060
aagacccgcc actacttcat cgccgccgtg gagcgcctgt gggactacgg catgagcagc aagacccgcc actacttcat cgccgccgtg gagcgcctgt gggactacgg catgagcagc
31203120
agcccccacg tgctgcgcaa ccgcgcccag agcggcagcg tgccccagtt caagaaggtg agcccccacg tgctgcgcaa ccgcgcccag agcggcagcg tgccccagtt caagaaggtg
31803180
gtgttccagg agttcaccga cggcagcttc acccagcccc tgtaccgcgg cgagctgaac gtgttccagg agttcaccga cggcagcttc acccagcccc tgtaccgcgg cgagctgaac
32403240
gagcacctgg gcctgctggg cccctacatc cgcgccgagg tggaggacaa catcatggtg gagcacctgg gcctgctggg cccctacatc cgcgccgagg tggaggacaa catcatggtg
33003300
accttccgca accaggccag ccgcccctac agcttctaca gcagcctgat cagctacgag accttccgca accaggccag ccgcccctac agcttctaca gcagcctgat cagctacgag
33603360
gaggaccagc gccagggcgc cgagccccgc aagaacttcg tgaagcccaa cgagaccaag gaggaccagc gccagggcgc cgagccccgc aagaacttcg tgaagcccaa cgagaccaag
34203420
acctacttct ggaaggtgca gcaccacatg gcccccacca aggacgagtt cgactgcaag acctacttct ggaaggtgca gcaccacatg gcccccacca aggacgagtt cgactgcaag
34803480
gcctgggcct acttcagcga cgtggacctg gagaaggacg tgcacagcgg cctgatcggc gcctgggcct acttcagcga cgtggacctg gagaaggacg tgcacagcgg cctgatcggc
35403540
cccctgctgg tgtgccacac caacaccctg aaccccgccc acggccgcca ggtgaccgtg cccctgctgg tgtgccacac caacaccctg aaccccgccc acggccgcca ggtgaccgtg
36003600
caggagttcg ccctgttctt caccatcttc gacgagacca agagctggta cttcaccgag caggagttcg ccctgttctt caccatcttc gacgagacca agagctggta cttcaccgag
36603660
aacatggagc gcaactgccg cgccccctgc aacatccaga tggaggaccc caccttcaag aacatggagc gcaactgccg cgccccctgc aacatccaga tggaggaccc caccttcaag
37203720
gagaactacc gcttccacgc catcaacggc tacatcatgg acaccctgcc cggcctggtg gagaactacc gcttccacgc catcaacggc tacatcatgg acaccctgcc cggcctggtg
37803780
atggcccagg accagcgcat ccgctggtac ctgctgagca tgggcagcaa cgagaacatc atggcccagg accagcgcat ccgctggtac ctgctgagca tgggcagcaa cgagaacatc
38403840
cacagcatcc acttcagcgg ccacgtgttc accgtgcgca agaaggagga gtacaagatg cacagcatcc acttcagcgg ccacgtgttc accgtgcgca agaagggagga gtacaagatg
39003900
gccctgtaca acctgtaccc cggcgtgttc gagaccgtgg agatgctgcc cagcaaggcc gccctgtaca acctgtaccc cggcgtgttc gagaccgtgg agatgctgcc cagcaaggcc
39603960
ggcatctggc gcgtggagtg cctgatcggc gagcacctgc acgccggcat gagcaccctg ggcatctggc gcgtggagtg cctgatcggc gagcacctgc acgccggcat gagcaccctg
40204020
ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggccagcgg ccacatccgc ttcctggtgt acagcaacaa gtgccagacc cccctgggca tggccagcgg ccacatccgc
40804080
gacttccaga tcaccgccag cggccagtac ggccagtggg cccccaagct ggcccgcctg gacttccaga tcaccgccag cggccagtac ggccagtggg cccccaagct ggcccgcctg
41404140
cactacagcg gcagcatcaa cgcctggagc accaaggagc ccttcagctg gatcaaggtg cactacagcg gcagcatcaa cgcctggagc accaaggagc ccttcagctg gatcaaggtg
42004200
gacctgctgg cccccatgat catccacggc atcaagaccc agggcgcccg ccagaagttc gacctgctgg cccccatgat catccacggc atcaagaccc agggcgcccg ccagaagttc
42604260
agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggcaa gaagtggcag agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggcaa gaagtggcag
43204320
acctaccgcg gcaacagcac cggcaccctg atggtgttct tcggcaacgt ggacagcagc acctaccgcg gcaacagcac cggcaccctg atggtgttct tcggcaacgt ggacagcagc
43804380
ggcatcaagc acaacatctt caaccccccc atcatcgccc gctacatccg cctgcacccc ggcatcaagc acaacatctt caaccccccc atcatcgccc gctacatccg cctgcacccc
44404440
acccactaca gcatccgcag caccctgcgc atggagctga tgggctgcga cctgaacagc acccactaca gcatccgcag caccctgcgc atggagctga tgggctgcga cctgaacagc
45004500
tgcagcatgc ccctgggcat ggagagcaag gccatcagcg acgcccagat caccgccagc tgcagcatgc ccctgggcat ggagagcaag gccatcagcg acgcccagat caccgccagc
45604560
agctacttca ccaacatgtt cgccacctgg agccccagca aggcccgcct gcacctgcaa agctacttca ccaacatgtt cgccacctgg agccccagca aggcccgcct gcacctgcaa
46204620
ggccgcagca acgcctggcg cccccaggtg aacaacccca aggagtggct gcaggtggac ggccgcagca acgcctggcg cccccaggtg aacaacccca aggagtggct gcaggtggac
46804680
ttccagaaga ccatgaaggt gaccggcgtg accacccagg gcgtgaagag cctgctgacc ttccagaaga ccatgaaggt gaccggcgtg accacccagg gcgtgaagag cctgctgacc
47404740
agcatgtacg tgaaggagtt cctgatcagc agcagccagg acggccacca gtggaccctg agcatgtacg tgaaggagtt cctgatcagc agcagccagg acggccacca gtggaccctg
48004800
ttcttccaga acggcaaggt gaaggtgttc cagggcaacc aggacagctt cacccccgtg ttcttccaga acggcaaggt gaaggtgttc cagggcaacc aggacagctt cacccccgtg
48604860
gtgaacagcc tggacccccc cctgctgacc cgctacctgc gcatccaccc ccagagctgg gtgaacagcc tggacccccc cctgctgacc cgctacctgc gcatccaccc ccagagctgg
49204920
gtgcaccaga tcgccctgcg catggaggtg ctgggctgcg aggcccagga cctgtactaa gtgcaccaga tcgccctgcg catggaggtg ctgggctgcg aggcccagga cctgtactaa
49804980
<210> 389<210> 389
<211> 7056<211> 7056
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 389<400> 389
atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc
60 60
acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg
120 120
ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac
180 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc
240 240
gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac
300 300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg
360 360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc
420 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg
480 480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac
540 540
gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag
600 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg
660 660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac
720 720
gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc
780 780
ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc
840 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac
900 900
cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg
960 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag
10201020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag
10801080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac
11401140
gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc
12001200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc
12601260
cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc
13201320
aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc
13801380
atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg
14401440
ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc
15001500
gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc
15601560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc
16201620
accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc
16801680
gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag gacctggcca gcggcctgat cggccccctg ctgatctgct acaagggagag cgtggaccag
17401740
cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag
18001800
aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg
18601860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg
19201920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc
19801980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag
20402040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc
21002100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc
21602160
atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac
22202220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc
22802280
ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc ttcagccaga acagccgcca ccccagcacc cgccagaagc agttcaacgc caccaccatc
23402340
cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag cccgagaacg acatcgagaa gaccgacccc tggttcgccc accgcacccc catgcccaag
24002400
atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac atccagaacg tgagcagcag cgacctgctg atgctgctgc gccagagccc caccccccac
24602460
ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc ggcctgagcc tgagcgacct gcaagaggcc aagtacgaga ccttcagcga cgaccccagc
25202520
cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg cccggcgcca tcgacagcaa caacagcctg agcgagatga cccacttccg cccccagctg
25802580
caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag caccacagcg gcgacatggt gttcaccccc gagagcggcc tgcagctgcg cctgaacgag
26402640
aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc aagctgggca ccaccgccgc caccgagctg aagaagctgg acttcaaggt gagcagcacc
27002700
agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc agcaacaacc tgatcagcac catccccagc gacaacctgg ccgccggcac cgacaacacc
27602760
agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg agcagcctgg gcccccccag catgcccgtg cactacgaca gccagctgga caccaccctg
28202820
ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag ttcggcaaga agagcagccc cctgaccgag agcggcggcc ccctgagcct gagcgaggag
28802880
aacaacgaca gcaagctgct ggagagcggc ctgatgaaca gccaggagag cagctggggc aacaacgaca gcaagctgct ggagagcggc ctgatgaaca gccaggagag cagctggggc
29402940
aagaacgtga gcagcaccga gagcggcagg ctgttcaagg gcaagcgcgc ccacggcccc aagaacgtga gcagcaccga gagcggcagg ctgttcaagg gcaagcgcgc ccacggcccc
30003000
gccctgctga ccaaggacaa cgccctgttc aaggtgagca tcagcctgct gaagaccaac gccctgctga ccaaggacaa cgccctgttc aaggtgagca tcagcctgct gaagaccaac
30603060
aagaccagca acaacagcgc caccaaccgc aagacccaca tcgacggccc cagcctgctg aagaccagca acaacagcgc caccaaccgc aagacccaca tcgacggccc cagcctgctg
31203120
atcgagaaca gccccagcgt gtggcagaac atcctggaga gcgacaccga gttcaagaag atcgagaaca gccccagcgt gtggcagaac atcctggaga gcgacaccga gttcaagaag
31803180
gtgacccccc tgatccacga ccgcatgctg atggacaaga acgccaccgc cctgcgcctg gtgacccccc tgatccacga ccgcatgctg atggacaaga acgccaccgc cctgcgcctg
32403240
aaccacatga gcaacaagac caccagcagc aagaacatgg agatggtgca gcagaagaag aaccacatga gcaacaagac caccagcagc aagaacatgg agatggtgca gcagaagaag
33003300
gagggcccca tcccccccga cgcccagaac cccgacatga gcttcttcaa gatgctgttc gagggcccca tcccccccga cgcccagaac cccgacatga gcttcttcaa gatgctgttc
33603360
ctgcccgaga gcgcccgctg gatccagcgc acccacggca agaacagcct gaacagcggc ctgcccgaga gcgcccgctg gatccagcgc acccacggca agaacagcct gaacagcggc
34203420
cagggcccca gccccaagca gctggtgagc ctgggccccg agaagagcgt ggagggccag cagggcccca gccccaagca gctggtgagc ctgggccccg agaagagcgt ggagggccag
34803480
aacttcctga gcgagaagaa caaggtggtg gtgggcaagg gcgagttcac caaggacgtg aacttcctga gcgagaagaa caaggtggtg gtgggcaagg gcgagttcac caaggacgtg
35403540
ggcctgaagg agatggtgtt ccccagcagc cgcaacctgt tcctgaccaa cctggacaac ggcctgaagg agatggtgtt ccccagcagc cgcaacctgt tcctgaccaa cctggacaac
36003600
ctgcacgaga acaacaccca caaccaggag aagaagatcc aggaggagat cgagaagaag ctgcacgaga acaacaccca caaccaggag aagaagatcc aggaggat cgagaagaag
36603660
gagaccctga tccaggagaa cgtggtgctg ccccagatcc acaccgtgac cggcaccaag gagaccctga tccaggagaa cgtggtgctg ccccagatcc acaccgtgac cggcaccaag
37203720
aacttcatga agaacctgtt cctgctgagc acccgccaga acgtggaggg cagctacgac aacttcatga agaacctgtt cctgctgagc acccgccaga acgtggaggg cagctacgac
37803780
ggcgcctacg cccccgtgct gcaggacttc cgcagcctga acgacagcac caaccgcacc ggcgcctacg cccccgtgct gcaggacttc cgcagcctga acgacagcac caaccgcacc
38403840
aagaagcaca ccgcccactt cagcaagaag ggcgaggagg agaacctgga gggcctgggc aagaagcaca ccgcccactt cagcaagaag ggcgaggagg agaacctgga gggcctgggc
39003900
aaccagacca agcagatcgt ggagaagtac gcctgcacca cccgcatcag ccccaacacc aaccagacca agcagatcgt ggagaagtac gcctgcacca cccgcatcag ccccaacacc
39603960
agccagcaga acttcgtgac ccagcgcagc aagcgcgccc tgaagcagtt ccgcctgccc agccagcaga acttcgtgac ccagcgcagc aagcgcgccc tgaagcagtt ccgcctgccc
40204020
ctggaggaga ccgagctgga gaagcgcatc atcgtggacg acaccagcac ccagtggagc ctggaggaga ccgagctgga gaagcgcatc atcgtggacg acaccagcac ccagtggagc
40804080
aagaacatga agcacctgac ccccagcacc ctgacccaga tcgactacaa cgagaaggag aagaacatga agcacctgac ccccagcacc ctgacccaga tcgactacaa cgagaaggag
41404140
aagggcgcca tcacccagag ccccctgagc gactgcctga cccgcagcca cagcatcccc aagggcgcca tcacccagag ccccctgagc gactgcctga cccgcagcca cagcatcccc
42004200
caggccaacc gcagccccct gcccatcgcc aaggtgagca gcttccccag catccgcccc caggccaacc gcagccccct gcccatcgcc aaggtgagca gcttccccag catccgcccc
42604260
atctacctga cccgcgtgct gttccaggac aacagcagcc acctgcccgc cgccagctac atctacctga cccgcgtgct gttccaggac aacagcagcc acctgcccgc cgccagctac
43204320
cgcaagaagg acagcggcgt gcaggagagc agccacttcc tgcaaggcgc caagaagaac cgcaagaagg acagcggcgt gcaggagagc agccacttcc tgcaaggcgc caagaagaac
43804380
aacctgagcc tggccatcct gaccctggag atgaccggcg accagcgcga ggtgggcagc aacctgagcc tggccatcct gaccctggag atgaccggcg accagcgcga ggtgggcagc
44404440
ctgggcacca gcgccaccaa cagcgtgacc tacaagaagg tggagaacac cgtgctgccc ctgggcacca gcgccaccaa cagcgtgacc tacaagaagg tggagaacac cgtgctgccc
45004500
aagcccgacc tgcccaagac cagcggcaag gtggagctgc tgcccaaggt gcacatctac aagcccgacc tgcccaagac cagcggcaag gtggagctgc tgcccaaggt gcacatctac
45604560
cagaaggacc tgttccccac cgagaccagc aacggcagcc ccggccacct ggacctggtg cagaaggacc tgttccccac cgagaccagc aacggcagcc ccggccacct ggacctggtg
46204620
gagggcagcc tgctgcaggg caccgagggc gccatcaagt ggaacgaggc caaccgcccc gagggcagcc tgctgcaggg caccgagggc gccatcaagt ggaacgaggc caaccgcccc
46804680
ggcaaggtgc ccttcctgcg cgtggccacc gagagcagcg ccaagacccc cagcaagctg ggcaaggtgc ccttcctgcg cgtggccacc gagagcagcg ccaagacccc cagcaagctg
47404740
ctggaccccc tggcctggga caaccactac ggcacccaga tccccaagga ggagtggaag ctggaccccc tggcctggga caaccactac ggcacccaga tccccaagga ggagtggaag
48004800
agccaggaga agagccccga gaagaccgcc ttcaagaaga aggacaccat cctgagcctg agccaggaga agagccccga gaagaccgcc ttcaagaaga aggacaccat cctgagcctg
48604860
aacgcctgcg agagcaacca cgccatcgcc gccatcaacg agggccagaa caagcccgag aacgcctgcg agagcaacca cgccatcgcc gccatcaacg agggccagaa caagcccgag
49204920
atcgaggtga cctgggccaa gcagggccgc accgagcgcc tgtgcagcca gaaccccccc atcgaggtga cctggggccaa gcagggccgc accgagcgcc tgtgcagcca gaaccccccc
49804980
gtgctgaagc gccaccagcg cgagatcacc cgcaccaccc tgcagagcga ccaggaggag gtgctgaagc gccaccagcg cgagatcacc cgcaccaccc tgcagagcga cccaggagg
50405040
atcgactacg acgacaccat cagcgtggag atgaagaagg aggacttcga catctacgac atcgactacg acgacaccat cagcgtggag atgaagaagg aggacttcga catctacgac
51005100
gaggacgaga accagagccc ccgcagcttc cagaagaaga cccgccacta cttcatcgcc gaggacgaga accagagccc ccgcagcttc cagaagaaga cccgccacta cttcatcgcc
51605160
gccgtggagc gcctgtggga ctacggcatg agcagcagcc cccacgtgct gcgcaaccgc gccgtggagc gcctgtggga ctacggcatg agcagcagcc cccacgtgct gcgcaaccgc
52205220
gcccagagcg gcagcgtgcc ccagttcaag aaggtggtgt tccaggagtt caccgacggc gccgagcg gcagcgtgcc ccagttcaag aaggtggtgt tccaggagtt caccgacggc
52805280
agcttcaccc agcccctgta ccgcggcgag ctgaacgagc acctgggcct gctgggcccc agcttcaccc agcccctgta ccgcggcgag ctgaacgagc acctgggcct gctgggcccc
53405340
tacatccgcg ccgaggtgga ggacaacatc atggtgacct tccgcaacca ggccagccgc tacatccgcg ccgaggtgga ggacaacatc atggtgacct tccgcaacca ggccagccgc
54005400
ccctacagct tctacagcag cctgatcagc tacgaggagg accagcgcca gggcgccgag ccctacagct tctacagcag cctgatcagc tacgaggagg accagcgcca gggcgccgag
54605460
ccccgcaaga acttcgtgaa gcccaacgag accaagacct acttctggaa ggtgcagcac ccccgcaaga acttcgtgaa gcccaacgag accaagacct acttctggaa ggtgcagcac
55205520
cacatggccc ccaccaagga cgagttcgac tgcaaggcct gggcctactt cagcgacgtg cacatggccc ccaccaagga cgagttcgac tgcaaggcct gggcctactt cagcgacgtg
55805580
gacctggaga aggacgtgca cagcggcctg atcggccccc tgctggtgtg ccacaccaac gacctggaga aggacgtgca cagcggcctg atcggccccc tgctggtgtg ccacaccaac
56405640
accctgaacc ccgcccacgg ccgccaggtg accgtgcagg agttcgccct gttcttcacc accctgaacc ccgcccacgg ccgccaggtg accgtgcagg agttcgccct gttcttcacc
57005700
atcttcgacg agaccaagag ctggtacttc accgagaaca tggagcgcaa ctgccgcgcc atcttcgacg agaccaagag ctggtacttc accgagaaca tggagcgcaa ctgccgcgcc
57605760
ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actaccgctt ccacgccatc ccctgcaaca tccagatgga ggaccccacc ttcaaggaga actaccgctt ccacgccatc
58205820
aacggctaca tcatggacac cctgcccggc ctggtgatgg cccaggacca gcgcatccgc aacggctaca tcatggacac cctgcccggc ctggtgatgg cccaggacca gcgcatccgc
58805880
tggtacctgc tgagcatggg cagcaacgag aacatccaca gcatccactt cagcggccac tggtacctgc tgagcatggg cagcaacgag aacatccaca gcatccactt cagcggccac
59405940
gtgttcaccg tgcgcaagaa ggaggagtac aagatggccc tgtacaacct gtaccccggc gtgttcaccg tgcgcaagaa ggagagtac aagatggccc tgtacaacct gtaccccggc
60006000
gtgttcgaga ccgtggagat gctgcccagc aaggccggca tctggcgcgt ggagtgcctg gtgttcgaga ccgtggagat gctgcccagc aaggccggca tctggcgcgt ggagtgcctg
60606060
atcggcgagc acctgcacgc cggcatgagc accctgttcc tggtgtacag caacaagtgc atcggcgagc acctgcacgc cggcatgagc accctgttcc tggtgtacag caacaagtgc
61206120
cagacccccc tgggcatggc cagcggccac atccgcgact tccagatcac cgccagcggc cagacccccc tgggcatggc cagcggccac atccgcgact tccagatcac cgccagcggc
61806180
cagtacggcc agtgggcccc caagctggcc cgcctgcact acagcggcag catcaacgcc cagtacggcc agtgggcccc caagctggcc cgcctgcact acagcggcag catcaacgcc
62406240
tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc tggagcacca aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc
63006300
cacggcatca agacccaggg cgcccgccag aagttcagca gcctgtacat cagccagttc cacggcatca agacccagg cgcccgccag aagttcagca gcctgtacat cagccagttc
63606360
atcatcatgt acagcctgga cggcaagaag tggcagacct accgcggcaa cagcaccggc atcatcatgt acagcctgga cggcaagaag tggcagacct accgcggcaa cagcaccggc
64206420
accctgatgg tgttcttcgg caacgtggac agcagcggca tcaagcacaa catcttcaac accctgatgg tgttcttcgg caacgtggac agcagcggca tcaagcacaa catcttcaac
64806480
ccccccatca tcgcccgcta catccgcctg caccccaccc actacagcat ccgcagcacc ccccccatca tcgcccgcta catccgcctg caccccaccc actacagcat ccgcagcacc
65406540
ctgcgcatgg agctgatggg ctgcgacctg aacagctgca gcatgcccct gggcatggag ctgcgcatgg agctgatggg ctgcgacctg aacagctgca gcatgcccct gggcatggag
66006600
agcaaggcca tcagcgacgc ccagatcacc gccagcagct acttcaccaa catgttcgcc agcaaggcca tcagcgacgc cgatcacc gccagcagct acttcaccaa catgttcgcc
66606660
acctggagcc ccagcaaggc ccgcctgcac ctgcaaggcc gcagcaacgc ctggcgcccc acctggagcc ccagcaaggc ccgcctgcac ctgcaaggcc gcagcaacgc ctggcgcccc
67206720
caggtgaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgacc caggtgaaca accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgacc
67806780
ggcgtgacca cccagggcgt gaagagcctg ctgaccagca tgtacgtgaa ggagttcctg ggcgtgacca cccagggcgt gaagagcctg ctgaccagca tgtacgtgaa ggagttcctg
68406840
atcagcagca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaggtgaag atcagcagca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaggtgaag
69006900
gtgttccagg gcaaccagga cagcttcacc cccgtggtga acagcctgga cccccccctg gtgttccagg gcaaccagga cagcttcacc cccgtggtga acagcctgga cccccccctg
69606960
ctgacccgct acctgcgcat ccacccccag agctgggtgc accagatcgc cctgcgcatg ctgacccgct acctgcgcat ccacccccag agctgggtgc accagatcgc cctgcgcatg
70207020
gaggtgctgg gctgcgaggc ccaggacctg tactaa gaggtgctgg gctgcgaggc ccaggacctg tactaa
70567056
<210> 390<210> 390
<211> 4374<211> 4374
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 390<400> 390
atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc atgcagatcg agctgagcac ctgcttcttc ctgtgcctgc tgcgcttctg cttcagcgcc
60 60
acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg acccgccgct actacctggg cgccgtggag ctgagctggg actacatgca gagcgacctg
120 120
ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac ggcgagctgc ccgtggacgc ccgcttcccc ccccgcgtgc ccaagagctt ccccttcaac
180 180
accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc accagcgtgg tgtacaagaa gaccctgttc gtggagttca ccgaccacct gttcaacatc
240 240
gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac gccaagcccc gccccccctg gatgggcctg ctgggcccca ccatccaggc cgaggtgtac
300 300
gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg gacaccgtgg tgatcaccct gaagaacatg gccagccacc ccgtgagcct gcacgccgtg
360 360
ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc ggcgtgagct actggaaggc cagcgagggc gccgagtacg acgaccagac cagccagcgc
420 420
gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg gagaaggagg acgacaaggt gttccccggc ggcagccaca cctacgtgtg gcaggtgctg
480 480
aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac aaggagaacg gccccatggc cagcgacccc ctgtgcctga cctacagcta cctgagccac
540 540
gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag gtggacctgg tgaaggacct gaacagcggc ctgatcggcg ccctgctggt gtgccgcgag
600 600
ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaggagaa gacccagacc ctgcacaagt tcatcctgct gttcgccgtg
660 660
ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac ttcgacgagg gcaagagctg gcacagcgag accaagaaca gcctgatgca ggaccgcgac
720 720
gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc gccgccagcg cccgcgcctg gcccaagatg cacaccgtga acggctacgt gaaccgcagc
780 780
ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc ctgcccggcc tgatcggctg ccaccgcaag agcgtgtact ggcacgtgat cggcatgggc
840 840
accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac accacccccg aggtgcacag catcttcctg gagggccaca ccttcctggt gcgcaaccac
900 900
cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg cgccaggcca gcctggagat cagccccatc accttcctga ccgcccagac cctgctgatg
960 960
gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag gacctgggcc agttcctgct gttctgccac atcagcagcc accagcacga cggcatggag
10201020
gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgag gagccccagc tgcgcatgaa gaacaacgag
10801080
gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac gaggccgagg actacgacga cgacctgacc gacagcgaga tggacgtggt gcgcttcgac
11401140
gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc gacgacaaca gccccagctt catccagatc cgcagcgtgg ccaagaagca ccccaagacc
12001200
tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc tgggtgcact acatcgccgc cgaggaggag gactgggact acgcccccct ggtgctggcc
12601260
cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc cccgacgacc gcagctacaa gagccagtac ctgaacaacg gcccccagcg catcggccgc
13201320
aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc aagtacaaga aggtgcgctt catggcctac accgacgaga ccttcaagac ccgcgaggcc
13801380
atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg atccagcacg agagcggcat cctgggcccc ctgctgtacg gcgaggtggg cgacaccctg
14401440
ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc ctgatcatct tcaagaacca ggccagccgc ccctacaaca tctaccccca cggcatcacc
15001500
gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc gacgtgcgcc ccctgtacag ccgccgcctg cccaagggcg tgaagcacct gaaggacttc
15601560
cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc cccatcctgc ccggcgagat cttcaagtac aagtggaccg tgaccgtgga ggacggcccc
16201620
accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc accaagagcg acccccgctg cctgacccgc tactacagca gcttcgtgaa catggagcgc
16801680
gacctggcca gcggcctgat cggccccctg ctgatctgct acaaggagag cgtggaccag gacctggcca gcggcctgat cggccccctg ctgatctgct acaagggagag cgtggaccag
17401740
cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag cgcggcaacc agatcatgag cgacaagcgc aacgtgatcc tgttcagcgt gttcgacgag
18001800
aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg aaccgcagct ggtacctgac cgagaacatc cagcgcttcc tgcccaaccc cgccggcgtg
18601860
cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg cagctggagg accccgagtt ccaggccagc aacatcatgc acagcatcaa cggctacgtg
19201920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaggtgg cctactggta catcctgagc
19801980
atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag atcggcgccc agaccgactt cctgagcgtg ttcttcagcg gctacacctt caagcacaag
20402040
atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc atggtgtacg aggacaccct gaccctgttc cccttcagcg gcgagaccgt gttcatgagc
21002100
atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc atggagaacc ccggcctgtg gatcctgggc tgccacaaca gcgacttccg caaccgcggc
21602160
atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac atgaccgccc tgctgaaggt gagcagctgc gacaagaaca ccggcgacta ctacgaggac
22202220
agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc agctacgagg acatcagcgc ctacctgctg agcaagaaca acgccatcga gccccgcagc
22802280
ttcagccaga acccccccgt gctgaagcgc caccagcgcg agatcacccg caccaccctg ttcagccaga acccccccgt gctgaagcgc caccagcgcg agatcacccg caccaccctg
23402340
cagagcgacc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag cagagcgacc aggaggagat cgactacgac gacaccatca gcgtggagat gaagaaggag
24002400
gacttcgaca tctacgacga ggacgagaac cagagccccc gcagcttcca gaagaagacc gacttcgaca tctacgacga ggacgagaac cagagccccc gcagcttcca gaagaagacc
24602460
cgccactact tcatcgccgc cgtggagcgc ctgtgggact acggcatgag cagcagcccc cgccactact tcatcgccgc cgtggagcgc ctgtgggact acggcatgag cagcagcccc
25202520
cacgtgctgc gcaaccgcgc ccagagcggc agcgtgcccc agttcaagaa ggtggtgttc cacgtgctgc gcaaccgcgc cccagcggc agcgtgcccc agttcaagaa ggtggtgttc
25802580
caggagttca ccgacggcag cttcacccag cccctgtacc gcggcgagct gaacgagcac caggagttca ccgacggcag cttcacccag cccctgtacc gcggcgagct gaacgagcac
26402640
ctgggcctgc tgggccccta catccgcgcc gaggtggagg acaacatcat ggtgaccttc ctgggcctgc tgggccccta catccgcgcc gaggtggagg acaacatcat ggtgaccttc
27002700
cgcaaccagg ccagccgccc ctacagcttc tacagcagcc tgatcagcta cgaggaggac cgcaaccagg ccagccgccc ctacagcttc tacagcagcc tgatcagcta cgaggaggac
27602760
cagcgccagg gcgccgagcc ccgcaagaac ttcgtgaagc ccaacgagac caagacctac cagcgccagg gcgccgagcc ccgcaagaac ttcgtgaagc ccaacgagac caagacctac
28202820
ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg ttctggaagg tgcagcacca catggccccc accaaggacg agttcgactg caaggcctgg
28802880
gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg gcctacttca gcgacgtgga cctggagaag gacgtgcaca gcggcctgat cggccccctg
29402940
ctggtgtgcc acaccaacac cctgaacccc gcccacggcc gccaggtgac cgtgcaggag ctggtgtgcc acaccaacac cctgaacccc gcccacggcc gccaggtgac cgtgcaggag
30003000
ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg ttcgccctgt tcttcaccat cttcgacgag accaagagct ggtacttcac cgagaacatg
30603060
gagcgcaact gccgcgcccc ctgcaacatc cagatggagg accccacctt caaggagaac gagcgcaact gccgcgcccc ctgcaacatc cagatggagg accccacctt caaggagaac
31203120
taccgcttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc taccgcttcc acgccatcaa cggctacatc atggacaccc tgcccggcct ggtgatggcc
31803180
caggaccagc gcatccgctg gtacctgctg agcatgggca gcaacgagaa catccacagc caggaccagc gcatccgctg gtacctgctg agcatgggca gcaacgagaa catccacagc
32403240
atccacttca gcggccacgt gttcaccgtg cgcaagaagg aggagtacaa gatggccctg atccacttca gcggccacgt gttcaccgtg cgcaagaagg aggagtacaa gatggccctg
33003300
tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc tacaacctgt accccggcgt gttcgagacc gtggagatgc tgcccagcaa ggccggcatc
33603360
tggcgcgtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg tggcgcgtgg agtgcctgat cggcgagcac ctgcacgccg gcatgagcac cctgttcctg
34203420
gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat ccgcgacttc gtgtacagca acaagtgcca gacccccctg ggcatggcca gcggccacat ccgcgacttc
34803480
cagatcaccg ccagcggcca gtacggccag tgggccccca agctggcccg cctgcactac cagatcaccg ccagcggcca gtacggccag tgggccccca agctggcccg cctgcactac
35403540
agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg agcggcagca tcaacgcctg gagcaccaag gagcccttca gctggatcaa ggtggacctg
36003600
ctggccccca tgatcatcca cggcatcaag acccagggcg cccgccagaa gttcagcagc ctggccccca tgatcatcca cggcatcaag acccagggcg cccgccagaa gttcagcagc
36603660
ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac ctgtacatca gccagttcat catcatgtac agcctggacg gcaagaagtg gcagacctac
37203720
cgcggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc cgcggcaaca gcaccggcac cctgatggtg ttcttcggca acgtggacag cagcggcatc
37803780
aagcacaaca tcttcaaccc ccccatcatc gcccgctaca tccgcctgca ccccacccac aagcacaaca tcttcaaccc ccccatcatc gcccgctaca tccgcctgca cccccaccac
38403840
tacagcatcc gcagcaccct gcgcatggag ctgatgggct gcgacctgaa cagctgcagc tacagcatcc gcagcaccct gcgcatggag ctgatgggct gcgacctgaa cagctgcagc
39003900
atgcccctgg gcatggagag caaggccatc agcgacgccc agatcaccgc cagcagctac atgcccctgg gcatggagag caaggccatc agcgacgccc agatcaccgc cagcagctac
39603960
ttcaccaaca tgttcgccac ctggagcccc agcaaggccc gcctgcacct gcaaggccgc ttcaccaaca tgttcgccac ctggagcccc agcaaggccc gcctgcacct gcaaggccgc
40204020
agcaacgcct ggcgccccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag agcaacgcct ggcgccccca ggtgaacaac cccaaggagt ggctgcaggt ggacttccag
40804080
aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg aagaccatga aggtgaccgg cgtgaccacc cagggcgtga agagcctgct gaccagcatg
41404140
tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc tacgtgaagg agttcctgat cagcagcagc caggacggcc accagtggac cctgttcttc
42004200
cagaacggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac cagaacggca aggtgaaggt gttccagggc aaccaggaca gcttcacccc cgtggtgaac
42604260
agcctggacc cccccctgct gacccgctac ctgcgcatcc acccccagag ctgggtgcac agcctggacc cccccctgct gacccgctac ctgcgcatcc acccccagag ctgggtgcac
43204320
cagatcgccc tgcgcatgga ggtgctgggc tgcgaggccc aggacctgta ctaa cagatcgccc tgcgcatgga ggtgctgggc tgcgaggccc aggacctgta ctaa
43744374
<210> 391<210> 391
<211> 7056<211> 7056
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 391<400> 391
atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc
60 60
accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg
120 120
ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac
180 180
acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc
240 240
gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac
300 300
gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg
360 360
ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga
420 420
gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg
480 480
aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac
540 540
gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa
600 600
ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg
660 660
ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat
720 720
gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc
780 780
ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc
840 840
acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac
900 900
agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg
960 960
gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa
10201020
gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag
10801080
gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac
11401140
gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc
12001200
tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc
12601260
cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg
13201320
aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc
13801380
atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg
14401440
ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc
15001500
gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc
15601560
cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc
16201620
accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc
16801680
gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag
17401740
cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag
18001800
aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg
18601860
caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg
19201920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc
19801980
attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag
20402040
atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc
21002100
atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc
21602160
atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac
22202220
agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc
22802280
ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc
23402340
cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag
24002400
atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac
24602460
ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct
25202520
cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accacagctg cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accaccagctg
25802580
caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag
26402640
aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc
27002700
agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca
27602760
tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg
28202820
ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa
28802880
aacaacgaca gcaagctgct ggaatccggc ctgatgaaca gccaagagtc ctcctggggc aacaacgaca gcaagctgct ggaatccggc ctgatgaaca gccaagagtc ctcctggggc
29402940
aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg gaaagagagc ccacggacct aagaatgtgt ccagcaccga gtccggcaga ctgttcaagg gaaagagagc ccacggacct
30003000
gctctgctga ccaaggataa cgccctgttc aaagtgtcca tcagcctgct caagaccaac gctctgctga ccaaggataa cgccctgttc aaagtgtcca tcagcctgct caagaccaac
30603060
aagacctcca acaactccgc caccaacaga aagacccaca tcgacggccc tagcctgctg aagacctcca acaactccgc caccaacaga aagacccaca tcgacggccc tagcctgctg
31203120
atcgagaata gccctagcgt ctggcagaat atcctggaaa gcgacaccga gttcaagaaa atcgagaata gccctagcgt ctggcagaat atcctggaaa gcgacaccga gttcaagaaa
31803180
gtgacccctc tgatccacga ccggatgctc atggacaaga acgccaccgc tctgcggctg gtgacccctc tgatccacga ccggatgctc atggacaaga acgccaccgc tctgcggctg
32403240
aaccacatga gcaacaagac aaccagcagc aagaatatgg aaatggtgca gcagaagaaa aaccacatga gcaacaagac aaccagcagc aagaatatgg aaatggtgca gcagaagaaa
33003300
gagggcccca ttcctccaga cgctcagaac cccgatatga gcttcttcaa gatgctcttt gagggcccca ttcctccaga cgctcagaac cccgatatga gcttcttcaa gatgctcttt
33603360
ctgcccgaga gcgcccggtg gattcagaga acacacggca agaactccct gaactccggc ctgcccgaga gcgcccggtg gattcagaga acacacggca agaactccct gaactccggc
34203420
cagggacctt ctccaaagca gctggtttcc ctgggacctg agaagtccgt ggaaggacag cagggacctt ctccaaagca gctggtttcc ctgggacctg agaagtccgt ggaaggacag
34803480
aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg gcgagttcac caaggatgtg aacttcctga gcgaaaagaa caaagtggtc gtcggcaagg gcgagttcac caaggatgtg
35403540
ggcctgaaag agatggtctt tcccagcagc cggaacctgt tcctgaccaa cctggacaac ggcctgaaag agatggtctt tcccagcagc cggaacctgt tcctgaccaa cctggacaac
36003600
ctgcacgaga acaacaccca caatcaagag aagaagatcc aagaggaaat cgaaaagaaa ctgcacgaga acaacaccca caatcaagag aagaagatcc aagaggaaat cgaaaagaaa
36603660
gagacactca tccaagagaa cgtggtgctg cctcagatcc acacagtgac cggcaccaag gagacactca tccaagagaa cgtggtgctg cctcagatcc acacagtgac cggcaccaag
37203720
aactttatga agaatctgtt cctgctgagt acccggcaga acgtggaagg cagctacgat aactttatga agaatctgtt cctgctgagt acccggcaga acgtggaagg cagctacgat
37803780
ggcgcttatg cccctgtgct gcaggacttc agatccctga acgactccac caatcggaca ggcgcttatg cccctgtgct gcaggacttc agatccctga acgactccac caatcggaca
38403840
aagaagcaca cagcccactt ctccaagaag ggcgaagaag agaacctgga aggactgggc aagaagcaca cagcccactt ctccaagaag ggcgaagaag agaacctgga aggactgggc
39003900
aatcagacca agcagatcgt cgagaagtac gcctgcacca ccagaatcag ccccaacaca aatcagacca agcagatcgt cgagaagtac gcctgcacca ccagaatcag ccccaacaca
39603960
agccagcaga acttcgtgac ccagcggagc aaaagagccc tgaagcagtt tcggctgccc agccagcaga acttcgtgac ccagcggagc aaaagagccc tgaagcagtt tcggctgccc
40204020
ctggaagaaa ccgagctgga aaagcggatc atcgtggacg acaccagcac acagtggtcc ctggaagaaa ccgagctgga aaagcggatc atcgtggacg acaccagcac acagtggtcc
40804080
aagaacatga agcacttgac ccctagcaca ctgacccaga tcgactacaa cgagaaagag aagaacatga agcacttgac ccctagcaca ctgacccaga tcgactacaa cgagaaagag
41404140
aagggcgcta tcacacagag cccactgagc gactgtctga ccagaagcca cagcatccct aagggcgcta tcacacagag cccactgagc gactgtctga ccagaagcca cagcatccct
42004200
caggccaaca gatcccctct gccaatcgcc aaagtgtcta gcttccccag catcagaccc caggccaaca gatcccctct gccaatcgcc aaagtgtcta gcttccccag catcagaccc
42604260
atctacctga ccagagtgct gttccaggac aacagcagcc atctgccagc cgccagctac atctacctga ccagagtgct gttccaggac aacagcagcc atctgccagc cgccagctac
43204320
cggaagaaag attctggcgt gcaagagagc agccactttc tgcagggcgc taagaagaac cggaagaaag attctggcgt gcaagagagc agccactttc tgcagggcgc taagaagaac
43804380
aatctgagcc tggctattct gaccctggaa atgaccggcg atcagagaga agtcggctct aatctgagcc tggctattct gaccctggaa atgaccggcg atcagagaga agtcggctct
44404440
ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg tggaaaacac cgtgctgcct ctgggcacca gcgccacaaa tagcgtgacc tacaaaaagg tggaaaacac cgtgctgcct
45004500
aagcctgacc tgccaaagac aagcggcaag gtggaactgc tgccaaaggt gcacatctac aagcctgacc tgccaaagac aagcggcaag gtggaactgc tgccaaaggt gcacatctac
45604560
cagaaggacc tgtttcctac cgagacaagc aacggctctc ccggccatct ggatctggtg cagaaggacc tgtttcctac cgagacaagc aacggctctc ccggccatct ggatctggtg
46204620
gaaggatctc tgctgcaggg aaccgagggc gccatcaagt ggaacgaggc caatagacct gaaggatctc tgctgcaggg aaccgagggc gccatcaagt ggaacgaggc caatagacct
46804680
ggcaaggtgc ccttcctgag agtggccaca gagtccagcg ccaagacacc ctctaaactg ggcaaggtgc ccttcctgag agtggccaca gagtccagcg ccaagacacc ctctaaactg
47404740
ctggaccctc tggcctggga caaccactat ggcactcaga tccccaaaga ggaatggaag ctggaccctc tggcctggga caaccactat ggcactcaga tccccaaaga ggaatggaag
48004800
tcccaagaga agtcccctga aaagaccgcc ttcaagaaga aggacaccat tctgtccctg tcccaagaga agtcccctga aaagaccgcc ttcaagaaga aggacaccat tctgtccctg
48604860
aatgcctgcg agagcaacca cgccattgcc gccatcaatg agggccagaa caagcccgag aatgcctgcg agagcaacca cgccattgcc gccatcaatg agggccagaa caagcccgag
49204920
atcgaagtga cctgggccaa gcagggaaga accgagagac tgtgtagcca gaatcctcct atcgaagtga cctggggccaa gcagggaaga accgagagac tgtgtagcca gaatcctcct
49804980
gtgctgaagc ggcaccagag agaaatcacc cggaccacac tgcagagcga ccaagaagag gtgctgaagc ggcaccagag agaaatcacc cggaccacac tgcagagcga ccaagaagag
50405040
atcgattacg acgataccat cagcgtcgag atgaagaaag aagatttcga catctacgac atcgattacg acgataccat cagcgtcgag atgaagaaag aagatttcga catctacgac
51005100
gaggacgaga atcagagccc tcggagcttc cagaagaaaa ccaggcacta ctttattgcc gaggacgaga atcagagccc tcggagcttc cagaagaaaa ccaggcacta ctttattgcc
51605160
gccgtcgagc ggctgtggga ctacggaatg tctagctctc ctcacgtgct gcggaataga gccgtcgagc ggctgtggga ctacggaatg tctagctctc ctcacgtgct gcggaataga
52205220
gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt tccaagagtt caccgacggc gcccagtctg gtagcgtgcc ccagttcaaa aaggtcgtgt tccaagagtt caccgacggc
52805280
agcttcaccc agccactgta tagaggcgag ctgaacgagc atctgggcct gctgggccct agcttcaccc agccactgta tagaggcgag ctgaacgagc atctgggcct gctgggccct
53405340
tatatcagag ccgaagtgga agataacatc atggtcacct tccggaatca ggctagccgg tatatcagag ccgaagtgga agataacatc atggtcacct tccggaatca ggctagccgg
54005400
ccttacagct tctacagctc cctgatctcc tacgaagagg accagagaca gggcgcagag ccttacagct tctacagctc cctgatctcc tacgaagagg accagagaca gggcgcagag
54605460
ccccggaaga atttcgtgaa gcccaacgag actaagacct acttttggaa ggtgcagcac ccccggaaga atttcgtgaa gcccaacgag actaagacct acttttggaa ggtgcagcac
55205520
catatggccc ctacaaagga cgagttcgac tgcaaagcct gggcctactt ctccgatgtg catatggccc ctacaaagga cgagttcgac tgcaaagcct gggcctactt ctccgatgtg
55805580
gacctcgaaa aggacgtgca cagcggactc atcggcccac tgcttgtgtg ccacaccaac gacctcgaaa aggacgtgca cagcggactc atcggcccac tgcttgtgtg ccacaccaac
56405640
acactgaacc ccgctcacgg cagacaagtg acagtgcaag agttcgccct gtttttcacc acactgaacc ccgctcacgg cagacaagtg acagtgcaag agttcgccct gtttttcacc
57005700
atcttcgacg aaacgaagtc ctggtacttc accgaaaaca tggaaagaaa ctgcagggcc atcttcgacg aaacgaagtc ctggtacttc accgaaaaca tggaaagaaa ctgcagggcc
57605760
ccttgcaaca ttcagatgga agatcccacc ttcaaagaga actaccggtt ccacgccatc ccttgcaaca ttcagatgga agatcccacc ttcaaagaga actaccggtt ccacgccatc
58205820
aacggctaca tcatggacac actgcccggc ctggttatgg cccaggatca gagaatccgg aacggctaca tcatggacac actgcccggc ctggttatgg cccaggatca gagaatccgg
58805880
tggtatctgc tgtccatggg ctccaacgag aatatccact ccatccactt cagcggccac tggtatctgc tgtccatggg ctccaacgag aatatccact ccatccactt cagcggccac
59405940
gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc tgtacaatct gtaccctggg gtgttcaccg tgcggaaaaa agaagagtac aaaatggccc tgtacaatct gtaccctggg
60006000
gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa tttggagagt ggaatgtctg gtgttcgaaa ccgttgagat gctgcctagc aaggccggaa tttggagagt ggaatgtctg
60606060
attggagagc acctccacgc cgggatgagc accctgtttc tggtgtactc caacaagtgt attggagagc acctccacgc cgggatgagc accctgtttc tggtgtactc caacaagtgt
61206120
cagacccctc tcggcatggc ctctggccac attagagact tccagatcac cgccagcgga cagacccctc tcggcatggc ctctggccac attagagact tccagatcac cgccagcgga
61806180
cagtatggac agtgggcccc taaactggcc agactgcact actccggcag catcaatgcc cagtatggac agtgggcccc taaactggcc agactgcact actccggcag catcaatgcc
62406240
tggtccacca aagagccttt cagctggatc aaagtggacc tgctggctcc catgatcatc tggtccacca aagagccttt cagctggatc aaagtggacc tgctggctcc catgatcatc
63006300
cacggaatca agacccaggg cgccagacaa aagttcagca gcctgtacat cagccagttc cacggaatca agacccagg cgccagacaa aagttcagca gcctgtacat cagccagttc
63606360
atcatcatgt acagcctgga cggaaagaag tggcagacct accggggcaa tagcaccggc atcatcatgt acagcctgga cggaaagaag tggcagacct accggggcaa tagcaccggc
64206420
acactgatgg tgttcttcgg caacgtggac tccagcggca ttaagcacaa catcttcaac acactgatgg tgttcttcgg caacgtggac tccagcggca ttaagcacaa catcttcaac
64806480
cctccaatca ttgcccggta catccggctg caccccacac actacagcat caggtctacc cctccaatca ttgcccggta catccggctg caccccacac actacagcat caggtctacc
65406540
ctgagaatgg aactgatggg ctgcgacctg aacagctgct ctatgcccct cggaatggaa ctgagaatgg aactgatggg ctgcgacctg aacagctgct ctatgcccct cggaatggaa
66006600
agcaaggcca tcagcgacgc ccagatcaca gcctctagct acttcaccaa catgttcgcc agcaaggcca tcagcgacgc ccagatcaca gcctctagct acttcaccaa catgttcgcc
66606660
acttggagcc cctctaaggc ccggcttcat ctgcaaggca gaagcaacgc ttggaggccc acttggagcc cctctaaggc ccggcttcat ctgcaaggca gaagcaacgc ttggaggccc
67206720
caagtgaaca accccaaaga atggctccag gtggactttc agaaaaccat gaaagtgaca caagtgaaca accccaaaga atggctccag gtggactttc agaaaaccat gaaagtgaca
67806780
ggcgtgacca cacagggcgt caagtccctg ctgacctcta tgtacgtgaa agagtttctg ggcgtgacca cacagggcgt caagtccctg ctgacctcta tgtacgtgaa agagtttctg
68406840
atcagctcca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaagtgaaa atcagctcca gccaggacgg ccaccagtgg accctgttct tccagaacgg caaagtgaaa
69006900
gtgttccagg gaaatcagga cagcttcaca cccgtggtca atagtctgga cccaccactg gtgttccagg gaaatcagga cagcttcaca cccgtggtca atagtctgga cccaccactg
69606960
ctgacccgct acctgcgaat tcaccctcag tcttgggtgc accagattgc cctgcggatg ctgacccgct acctgcgaat tcaccctcag tcttgggtgc accagattgc cctgcggatg
70207020
gaagtgctgg gctgtgaagc tcaggacctc tactag gaagtgctgg gctgtgaagc tcaggacctc tactag
70567056
<210> 392<210> 392
<211> 4980<211> 4980
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 392<400> 392
atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc atgcagatcg agctgtctac ctgcttcttc ctgtgcctgc tgcggttctg cttcagcgcc
60 60
accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg accagaagat attacctggg cgccgtggaa ctgagctggg actacatgca gtctgacctg
120 120
ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac ggagagctgc ccgtggacgc tagatttcct ccaagagtgc ccaagagctt ccccttcaac
180 180
acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc acctccgtgg tgtacaagaa aaccctgttc gtggaattca ccgaccacct gttcaatatc
240 240
gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac gccaagcctc ggcctccttg gatgggactg ctgggaccta caattcaggc cgaggtgtac
300 300
gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg gacaccgtgg tcatcaccct gaagaacatg gccagccatc ctgtgtctct gcacgccgtg
360 360
ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga ggagtgtctt attggaaggc ttctgagggc gccgagtacg acgatcagac aagccagaga
420 420
gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg gagaaagagg acgacaaggt tttccctggc ggcagccaca cctatgtctg gcaggtcctg
480 480
aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac aaagaaaacg gccctatggc ctccgatcct ctgtgcctga catacagcta cctgagccac
540 540
gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa gtggacctgg tcaaggacct gaattctggc ctgatcggag ccctgctcgt gtgtagagaa
600 600
ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg ggcagcctgg ccaaagagaa aacccagaca ctgcacaagt tcatcctgct gttcgccgtg
660 660
ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat ttcgacgagg gcaagagctg gcacagcgag acaaagaaca gcctgatgca ggacagggat
720 720
gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc gccgcctctg ctagagcttg gcctaagatg cacaccgtga acggctacgt gaacagaagc
780 780
ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc ctgcctggac tgatcggctg ccacagaaag tccgtgtact ggcacgtgat cggcatgggc
840 840
acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac acaacacctg aggtgcacag catctttctg gaaggccaca ccttcctcgt gcggaaccac
900 900
agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg agacaggcca gcctggaaat cagccctatc accttcctga ccgctcagac cctgctgatg
960 960
gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa gatctgggcc agtttctgct gttctgccac atcagctccc accagcacga tggcatggaa
10201020
gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag gcctacgtga aggtggacag ctgccccgaa gaaccccagc tgcggatgaa gaacaacgag
10801080
gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac gaagccgagg actacgacga cgacctgacc gactctgaga tggacgtcgt cagattcgac
11401140
gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc gacgataaca gccccagctt catccagatc agaagcgtgg ccaagaagca ccccaagacc
12001200
tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc tgggtgcact atatcgccgc cgaggaagag gactgggatt acgctcctct ggtgctggcc
12601260
cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg cctgacgaca gaagctacaa gagccagtac ctgaacaacg gccctcagcg gatcggccgg
13201320
aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc aagtataaga aagtgcggtt catggcctac accgacgaga cattcaagac cagagaggcc
13801380
atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg atccagcacg agagcggaat tctgggccct ctgctgtatg gcgaagtggg cgatacactg
14401440
ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc ctgatcatct tcaagaacca ggccagcaga ccctacaaca tctaccctca cggcatcacc
15001500
gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc gatgtgcggc ccctgtattc tagaaggctg cccaagggcg tgaagcacct gaaggacttc
15601560
cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc cctatcctgc ctggcgagat tttcaagtac aagtggaccg tgaccgtgga agatggcccc
16201620
accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc accaagagcg accctagatg tctgacacgg tactacagca gcttcgtgaa catggaacgc
16801680
gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag gacctggcca gcggcctgat tggacctctg ctgatctgct acaaagaaag cgtggaccag
17401740
cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag cggggcaacc agatcatgag cgacaagcgg aacgtgatcc tgtttagcgt gttcgatgag
18001800
aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg aaccggtcct ggtatctgac cgagaacatc cagcggtttc tgcccaatcc tgccggggtg
18601860
caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg caactggaag atcctgagtt ccaggcaagc aacatcatgc actccatcaa tggctatgtg
19201920
ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc ttcgacagcc tgcagctgag cgtgtgcctg cacgaagtgg cctactggta catcctgagc
19801980
attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag attggcgccc agaccgactt cctgtccgtg ttctttagcg gctacacctt caagcacaag
20402040
atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc atggtgtacg aggataccct gacactgttc ccattcagcg gcgagacagt gttcatgagc
21002100
atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc atggaaaacc ccggcctgtg gattctgggc tgtcacaaca gcgacttccg gaacagaggc
21602160
atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac atgacagccc tgctgaaggt gtccagctgc gacaagaaca ccggcgacta ctacgaggac
22202220
agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc agctatgagg acatcagcgc ctacctgctg agcaagaaca atgccatcga gcccagaagc
22802280
ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc ttcagccaga atagcagaca cccctccacc agacagaagc agttcaacgc cacaacaatc
23402340
cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag cccgagaacg acatcgagaa aaccgatcct tggtttgccc acagaacccc tatgcctaag
24002400
atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac atccagaacg tgtcctccag cgatctgctg atgctcctga gacagagccc tacacctcac
24602460
ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct ggactgagcc tgtccgatct gcaagaggcc aaatacgaaa ccttcagcga cgacccttct
25202520
cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accacagctg cctggcgcca tcgacagcaa caatagcctg agcgagatga cccacttcag accaccagctg
25802580
caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag caccacagcg gcgacatggt gtttacacct gagagcggcc tccagctgag actgaatgag
26402640
aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc aagctgggaa ccaccgccgc caccgagctg aagaaactgg acttcaaggt gtcctctacc
27002700
agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca agcaacaacc tgatcagcac aatcccctcc gacaacctgg ctgccggcac cgacaacaca
27602760
tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg tcttctctgg gcccacctag catgcccgtg cactacgata gccagctgga taccacactg
28202820
ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa ttcggcaaga agtctagccc tctgacagag tctggcggcc ctctgtctct gagcgaggaa
28802880
aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc agcgggaaat caccagaacc aacaacgaca gcaagctgcc tcctgtgctg aagcggcacc agcgggaaat caccagaacc
29402940
acactgcaga gcgaccaaga ggaaatcgat tacgacgaca ccatcagcgt cgagatgaag acactgcaga gcgaccaaga ggaaatcgat tacgacgaca ccatcagcgt cgagatgaag
30003000
aaagaagatt tcgacatcta cgacgaggac gagaatcaga gccccagatc ctttcagaaa aaagaagatt tcgacatcta cgacgaggac gagaatcaga gccccagatc ctttcagaaa
30603060
aagacccggc actacttcat tgccgccgtc gagagactgt gggactacgg catgtctagc aagacccggc actacttcat tgccgccgtc gagagactgt gggactacgg catgtctagc
31203120
agccctcacg tgctgagaaa tagagcccag agcggcagcg tgccccagtt caagaaagtg agccctcacg tgctgagaaa tagagcccag agcggcagcg tgccccagtt caagaaagtg
31803180
gtgttccaag agttcaccga cggcagcttc acccagccac tgtatagagg cgagctgaac gtgttccaag agttcaccga cggcagcttc acccagccac tgtatagagg cgagctgaac
32403240
gagcatctgg gcctgctggg cccttatatc agagccgaag tggaagataa catcatggtc gagcatctgg gcctgctggg cccttatatc agagccgaag tggaagataa catcatggtc
33003300
accttccgga atcaggctag ccggccttac agcttctaca gctccctgat ctcctacgaa accttccgga atcaggctag ccggccttac agcttctaca gctccctgat ctcctacgaa
33603360
gaggaccaga gacagggcgc tgagccccgg aagaatttcg tgaagcccaa cgagactaag gaggaccaga gacagggcgc tgagccccgg aagaatttcg tgaagcccaa cgagactaag
34203420
acctactttt ggaaggtgca gcaccacatg gcccctacaa aggacgagtt cgactgcaaa acctactttt ggaaggtgca gcaccacatg gcccctacaa aggacgagtt cgactgcaaa
34803480
gcctgggcct acttctccga tgtggatctg gaaaaggacg tgcacagcgg gctcatcgga gcctgggcct acttctccga tgtggatctg gaaaaggacg tgcacagcgg gctcatcgga
35403540
ccactgcttg tgtgccacac caacacactg aaccccgctc acggcagaca agtgacagtg ccactgcttg tgtgccacac caacacactg aaccccgctc acggcagaca agtgacagtg
36003600
caagagttcg ccctgttctt caccatcttc gacgaaacaa agagctggta cttcaccgag caagagttcg ccctgttctt caccatcttc gacgaaacaa agagctggta cttcaccgag
36603660
aatatggaac ggaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa aatatggaac ggaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa
37203720
gagaactacc ggttccacgc catcaacggc tacatcatgg acacactgcc cggcctggtt gagaactacc ggttccacgc catcaacggc tacatcatgg acacactgcc cggcctggtt
37803780
atggcccagg atcagagaat ccggtggtat ctgctgtcca tgggctccaa cgagaatatc atggcccagg atcagagaat ccggtggtat ctgctgtcca tgggctccaa cgagaatatc
38403840
cacagcatcc acttcagcgg ccacgtgttc accgtgcgga aaaaagaaga gtacaaaatg cacagcatcc acttcagcgg ccacgtgttc accgtgcgga aaaaagaaga gtacaaaatg
39003900
gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg aaatgctgcc ttccaaggcc gccctgtaca atctgtaccc tggggtgttc gaaaccgtgg aaatgctgcc ttccaaggcc
39603960
ggcatttgga gagtggaatg tctgattgga gagcacctcc acgccggaat gagcaccctg ggcatttgga gagtggaatg tctgattgga gagcacctcc acgccggaat gagcaccctg
40204020
tttctggtgt actccaacaa gtgtcagacc cctctcggca tggcctctgg acacatcaga tttctggtgt actccaacaa gtgtcagacc cctctcggca tggcctctgg acacatcaga
40804080
gacttccaga tcaccgcctc tggccagtac ggacagtggg ctcctaaact ggctcggctg gacttccaga tcaccgcctc tggccagtac ggacagtggg ctcctaaact ggctcggctg
41404140
cactactccg gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg cactactccg gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg
42004200
gacctgctgg ctcccatgat catccacgga atcaagaccc agggcgcaag acagaagttc gacctgctgg ctcccatgat catccacgga atcaagaccc agggcgcaag acagaagttc
42604260
agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggaaa gaagtggcag agcagcctgt acatcagcca gttcatcatc atgtacagcc tggacggaaa gaagtggcag
43204320
acctaccggg gcaatagcac cggcacactc atggtgttct tcggcaacgt ggactccagc acctaccggg gcaatagcac cggcacactc atggtgttct tcggcaacgt ggactccagc
43804380
ggcattaagc acaacatctt caaccctcca atcattgccc ggtacatccg gctgcacccc ggcattaagc acaacatctt caaccctcca atcattgccc ggtacatccg gctgcacccc
44404440
acacactaca gcatccggtc taccctgaga atggaactga tgggctgcga cctgaacagc acacactaca gcatccggtc taccctgaga atggaactga tgggctgcga cctgaacagc
45004500
tgctctatgc ccctcggaat ggaaagcaag gccatcagcg acgcccagat cacagccagc tgctctatgc ccctcggaat ggaaagcaag gccatcagcg acgcccagat cacagccagc
45604560
agctacttca ccaacatgtt cgccacttgg agcccctcca aggctagact gcatctgcag agctacttca ccaacatgtt cgccacttgg agcccctcca aggctagact gcatctgcag
46204620
ggcagaagca acgcttggag gccccaagtg aacaacccca aagagtggct gcaggttgac ggcagaagca acgcttggag gccccaagtg aacaacccca aagagtggct gcaggttgac
46804680
tttcaaaaga ccatgaaagt gaccggcgtg accacacagg gcgtcaagtc tctgctgacc tttcaaaaga ccatgaaagt gaccggcgtg accacacagg gcgtcaagtc tctgctgacc
47404740
tctatgtacg tgaaagagtt cctgattagc agcagccagg acggccacca gtggaccctg tctatgtacg tgaaagagtt cctgattagc agcagccagg acggccacca gtggaccctg
48004800
tttttccaga acggcaaagt gaaagtgttc cagggcaatc aggacagctt cacacccgtg tttttccaga acggcaaagt gaaagtgttc cagggcaatc aggacagctt cacacccgtg
48604860
gtcaattctc tggaccctcc actgctgacc agatacctgc ggattcaccc tcagtcttgg gtcaattctc tggaccctcc actgctgacc agatacctgc ggattcaccc tcagtcttgg
49204920
gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg aagctcagga cctctactag gtgcaccaga tcgctctgcg gatggaagtg ctgggctgtg aagctcagga cctctactag
49804980
<210> 393<210> 393
<211> 4374<211> 4374
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 393<400> 393
atgcagatag aattatctac ttgttttttt ctttgtctgc tcaggttctg cttctctgct atgcagatag aattatctac ttgttttttt ctttgtctgc tcaggttctg cttctctgct
60 60
acaaggaggt attacttagg tgctgtagag ttatcttggg actacatgca gtctgatctt acaaggaggt attacttagg tgctgtagag ttatcttggg actacatgca gtctgatctt
120 120
ggggagctcc ctgtggatgc aagatttccc cctagagtac ctaaaagttt ccctttcaac ggggagctcc ctgtggatgc aagatttccc cctagagtac ctaaaagttt ccctttcaac
180 180
acaagtgtgg tgtataagaa gactctgttt gttgagttca cagatcacct tttcaatatt acaagtgtgg tgtataagaa gactctgttt gttgagttca cagatcacct tttcaatatt
240 240
gccaagccca gacccccctg gatgggtcta ctggggccaa caattcaagc agaggtatat gccaagccca gacccccctg gatgggtcta ctggggccaa caattcaagc agaggtatat
300 300
gatacagtgg tgatcacatt aaagaacatg gcatcccacc ctgtaagcct gcatgctgtt gatacagtgg tgatcacatt aaagaacatg gcatcccacc ctgtaagcct gcatgctgtt
360 360
ggtgtgtcct attggaaagc aagtgaaggt gctgaatatg atgatcaaac atcccaaaga ggtgtgtcct attggaaagc aagtgaaggt gctgaatatg atgatcaaac atcccaaaga
420 420
gagaaggaag atgacaaagt cttcccaggt ggctctcaca cctatgtgtg gcaagtgctc gagaaggaag atgacaaagt cttcccaggt ggctctcaca cctatgtgtg gcaagtgctc
480 480
aaggaaaatg ggcctatggc tagtgatcca ttgtgcctca catatagcta cctgtcccat aaggaaaatg ggcctatggc tagtgatcca ttgtgcctca catatagcta cctgtcccat
540 540
gtggacttag ttaaagatct gaactcaggt ctgattggtg ccctgctggt ctgtagggaa gtggacttag ttaaagatct gaactcaggt ctgattggtg ccctgctggt ctgtagggaa
600 600
ggatcactag ctaaagaaaa aacccagact ttacacaagt tcatcttatt atttgctgtt ggatcactag ctaaagaaaa aacccagact ttacacaagt tcatcttatt atttgctgtt
660 660
tttgatgagg gaaagagctg gcactcagag actaagaatt cactcatgca ggatagagat tttgatgagg gaaagagctg gcactcagag actaagaatt cactcatgca ggatagat
720 720
gcagcttctg ctagagcatg gccaaaaatg catactgtga atgggtatgt taacaggagt gcagcttctg ctagagcatg gccaaaaatg catactgtga atgggtatgt taacaggagt
780 780
ctgcctggcc tcataggctg ccatagaaaa tcagtgtact ggcatgtcat aggtatgggc ctgcctggcc tcataggctg ccatagaaaa tcagtgtact ggcatgtcat aggtatgggc
840 840
actactcctg aggtgcattc catttttttg gaggggcata ctttccttgt aagaaaccac actactcctg aggtgcattc catttttttg gaggggcata ctttccttgt aagaaaccac
900 900
aggcaggctt cattggaaat tagtccaata acctttctca cagcccagac tctgctaatg aggcaggctt cattggaaat tagtccaata acctttctca cagcccagac tctgctaatg
960 960
gacttggggc agtttttatt attttgtcac attagctctc atcagcatga tggaatggaa gacttggggc agtttttatt attttgtcac attagctctc atcagcatga tggaatggaa
10201020
gcctatgtta aggttgattc ctgcccagaa gagccccagt tgagaatgaa gaacaatgag gcctatgtta aggttgattc ctgcccagaa gagccccagt tgagaatgaa gaacaatgag
10801080
gaagcagaag actatgatga tgatctaaca gactcagaaa tggatgttgt gagatttgat gaagcagaag actatgatga tgatctaaca gactcagaaa tggatgttgt gagatttgat
11401140
gatgataact ccccaagttt tattcagatc aggtcagtgg ccaagaaaca tccaaaaaca gatgataact ccccaagttt tattcagatc aggtcagtgg ccaagaaaca tccaaaaaca
12001200
tgggttcatt atattgcagc agaagaagaa gactgggatt atgcaccctt ggtattagcc tgggttcatt atattgcagc agaagaagaa gactgggatt atgcaccctt ggtattagcc
12601260
cctgatgaca gaagctataa gtcacaatat ctcaacaatg gaccccagag aattggcaga cctgatgaca gaagctataa gtcacaatat ctcaacaatg gaccccagag aattggcaga
13201320
aagtacaaaa aagtcaggtt tatggcttat actgatgaga ctttcaaaac tagagaggct aagtacaaaa aagtcaggtt tatggcttat actgatgaga ctttcaaaac tagagaggct
13801380
attcaacatg aatctggcat cctaggtcct ttgttatatg gggaagtagg ggacacctta attcaacatg aatctggcat cctaggtcct ttgttatatg gggaagtagg ggacacctta
14401440
ttaattatat ttaaaaacca ggccagtagg ccttacaaca tttaccccca cggtataaca ttaattatat ttaaaaacca ggccagtagg ccttacaaca tttaccccca cggtataaca
15001500
gatgtcagac cactgtactc aaggaggcta ccaaaagggg tgaagcacct aaaagacttc gatgtcagac cactgtactc aaggaggcta ccaaaagggg tgaagcacct aaaagacttc
15601560
cccatcctac ctggtgagat tttcaagtat aagtggacag tgactgtaga agatggtcca cccatcctac ctggtgagat tttcaagtat aagtggacag tgactgtaga agatggtcca
16201620
accaaatcag atcccagatg cctgacaagg tactacagta gctttgtaaa tatggagaga accaaatcag atcccagatg cctgacaagg tactacagta gctttgtaaa tatggagaga
16801680
gacctggcct cagggttaat agggccccta ctgatctgct acaaggagag tgtagaccaa gacctggcct cagggttaat agggccccta ctgatctgct acaagggagag tgtagaccaa
17401740
agaggcaacc aaattatgtc agacaagaga aatgtcatcc tctttagtgt ttttgatgag agaggcaacc aaattatgtc agacaagaga aatgtcatcc tctttagtgt ttttgatgag
18001800
aataggtcct ggtacctgac agaaaatatc caaagattcc ttccaaatcc agcaggggta aataggtcct ggtacctgac agaaaatatc caaagattcc ttccaaatcc agcaggggta
18601860
caactggagg accctgagtt ccaggcctcc aatatcatgc acagcatcaa tggttatgtg caactggagg accctgagtt ccaggcctcc aatatcatgc acagcatcaa tggttatgtg
19201920
tttgacagtt tgcaactttc agtgtgcctt catgaggttg catactggta tatactttct tttgacagtt tgcaactttc agtgtgcctt catgaggttg catactggta tatactttct
19801980
ataggggccc agacagactt cttgtcagtt ttcttttcag gctatacttt caagcataag ataggggccc agacagactt cttgtcagtt ttcttttcag gctatacttt caagcataag
20402040
atggtatatg aagataccct gactcttttt ccctttagtg gtgagacagt tttcatgtca atggtatatg aagataccct gactcttttt ccctttagtg gtgagacagt tttcatgtca
21002100
atggaaaacc cagggctttg gatcttggga tgccacaact ctgactttag aaacagaggc atggaaaacc cagggctttg gatcttggga tgccacaact ctgactttag aaacagaggc
21602160
atgactgccc ttttaaaggt gtcctcttgt gataagaata ctggagacta ctatgaggac atgactgccc ttttaaaggt gtcctcttgt gataagaata ctggagacta ctatgaggac
22202220
agctatgagg acatttcagc ctatctgctg tcaaaaaata atgctataga gccaaggtca agctatgagg acatttcagc ctatctgctg tcaaaaaata atgctataga gccaaggtca
22802280
ttttctcaaa atcctcctgt cctgaagagg caccaaagag agataaccag gactacctta ttttctcaaa atcctcctgt cctgaagagg caccaaagag agataaccag gactacctta
23402340
cagtctgacc aggaggaaat tgattatgat gacacaataa gtgtggagat gaaaaaggag cagtctgacc aggaggaaat tgattatgat gacacaataa gtgtggagat gaaaaaggag
24002400
gattttgata tttatgatga ggatgaaaac caatctccaa gatctttcca gaagaagact gattttgata tttatgatga ggatgaaaac caatctccaa gatctttcca gaagaagact
24602460
agacactatt tcattgctgc agtggaaaga ctgtgggact atggaatgtc ctccagccct agacactatt tcattgctgc agtggaaaga ctgtgggact atggaatgtc ctccagccct
25202520
catgttctca ggaatagggc tcaaagtggt tctgtgccac agttcaagaa ggtggtgttt catgttctca ggaatagggc tcaaagtggt tctgtgccac agttcaagaa ggtggtgttt
25802580
caggaattca cagatgggtc ctttactcaa ccactgtata ggggagaact caatgaacat caggaattca cagatgggtc ctttactcaa ccactgtata ggggagaact caatgaacat
26402640
ctaggattac taggtcccta cattagagct gaggtggagg acaatatcat ggtcactttc ctaggattac taggtcccta cattagagct gaggtggagg acaatatcat ggtcactttc
27002700
aggaaccagg catctagacc atactctttt tacagctcct tgatatctta tgaagaggac aggaaccagg catctagacc atactctttt tacagctcct tgatatctta tgaagaggac
27602760
cagagacagg gtgcagaacc caggaagaac tttgtgaaac ccaatgagac caaaacatac cagagacagg gtgcagaacc caggaagaac tttgtgaaac ccaatgagac caaaacatac
28202820
ttctggaagg tccagcatca tatggctcct accaaggatg aatttgactg caaagcctgg ttctggaagg tccagcatca tatggctcct accaaggatg aatttgactg caaagcctgg
28802880
gcttacttct cagatgtgga tttggagaaa gatgtgcaca gtggcttgat tgggcctctt gcttacttct cagatgtgga tttggagaaa gatgtgcaca gtggcttgat tgggcctctt
29402940
ttggtatgtc ataccaacac cttaaaccct gctcatggaa gacaagtaac agtgcaagag ttggtatgtc ataccaacac cttaaaccct gctcatggaa gacaagtaac agtgcaagag
30003000
tttgccctct ttttcactat atttgatgag acaaaaagtt ggtactttac tgagaatatg tttgccctct ttttcactat atttgatgag acaaaaagtt ggtactttac tgagaatatg
30603060
gagaggaact gcagggctcc ctgcaatata cagatggagg atcctacttt caaggaaaac gagaggaact gcagggctcc ctgcaatata cagatggagg atcctacttt caaggaaaac
31203120
tataggtttc atgccattaa tggctatatc atggatacat tgcctggctt agttatggcc tataggtttc atgccattaa tggctatatc atggatacat tgcctggctt agttatggcc
31803180
caggatcaga gaatcagatg gtacctcctt agtatgggaa gcaatgaaaa catacattct caggatcaga gaatcagatg gtacctcctt agtatgggaa gcaatgaaaa catacattct
32403240
attcacttca gtggacatgt ctttactgtg agaaaaaagg aagagtacaa gatggcactg attcacttca gtggacatgt ctttactgtg agaaaaaagg aagagtacaa gatggcactg
33003300
tacaatctgt accctggagt gtttgagaca gttgagatgc tgcccagcaa ggctgggatc tacaatctgt accctggagt gtttgagaca gttgagatgc tgcccagcaa ggctgggatc
33603360
tggagggtag aatgcctgat tggagaacac ttacatgcag gtatgtccac tctattcttg tggagggtag aatgcctgat tggagaacac ttacatgcag gtatgtccac tctattcttg
34203420
gtctattcca acaagtgtca gaccccccta ggcatggcat ctggccatat tagagatttc gtctattcca acaagtgtca gaccccccta ggcatggcat ctggccatat tagagatttc
34803480
cagataactg cttctggtca gtatggccag tgggccccca agcttgctag acttcactac cagataactg cttctggtca gtatggccag tgggccccca agcttgctag acttcactac
35403540
agtggttcaa taaatgcctg gtccaccaag gagcccttca gctggattaa agtggacttg agtggttcaa taaatgcctg gtccaccaag gagcccttca gctggattaa agtggacttg
36003600
ctagccccca tgatcattca tgggataaaa acacagggtg ccagacagaa attttcatct ctagccccca tgatcattca tgggataaaa acacagggtg cgacagaa attttcatct
36603660
ctgtacatca gccagtttat catcatgtac agtctggatg gcaaaaaatg gcagacctac ctgtacatca gccagtttat catcatgtac agtctggatg gcaaaaaatg gcagacctac
37203720
agaggtaact ctacaggtac actaatggta ttttttggca atgtagattc atcaggtatc agaggtaact ctacaggtac actaatggta ttttttggca atgtagattc atcaggtatc
37803780
aagcataata tctttaatcc tcccattatt gccagataca tcaggttgca cccaactcat aagcataata tctttaatcc tcccattatt gccagataca tcaggttgca cccaactcat
38403840
tacagtataa gatccacttt aaggatggag cttatggggt gtgaccttaa tagctgcagt tacagtataa gatccacttt aaggatggag cttatggggt gtgaccttaa tagctgcagt
39003900
atgcccttgg gaatggaaag taaggccata tcagatgccc agattactgc aagcagctac atgcccttgg gaatggaaag taaggccata tcagatgccc agattactgc aagcagctac
39603960
tttacaaaca tgtttgcaac ctggtctcct agtaaagcca ggctgcactt gcagggtagg tttacaaaca tgtttgcaac ctggtctcct agtaaagcca ggctgcactt gcagggtagg
40204020
agcaatgcat ggagacccca ggtcaataac ccaaaagagt ggcttcaagt tgactttcaa agcaatgcat ggagacccca ggtcaataac ccaaaagagt ggcttcaagt tgactttcaa
40804080
aagacaatga aggtaacagg ggtaaccacc caaggggtaa agagtctgct gacatctatg aagacaatga aggtaacagg ggtaaccacc caaggggtaa agagtctgct gacatctatg
41404140
tatgtaaaag aattcctcat ctcaagtagt caagatgggc accagtggac actgttcttc tatgtaaaag aattcctcat ctcaagtagt caagatgggc accagtggac actgttcttc
42004200
cagaatggaa aagttaaggt gttccaaggt aatcaagaca gcttcactcc agtggtgaac cagaatggaa aagttaaggt gttccaaggt aatcaagaca gcttcactcc agtggtgaac
42604260
agtctggatc caccactcct aaccaggtac ctgaggatcc accctcagtc ctgggtccac agtctggatc caccactcct aaccaggtac ctgaggatcc accctcagtc ctgggtccac
43204320
cagatagctc tgagaatgga agtgctgggc tgtgaagctc aggacctata ctga cagatagctc tgagaatgga agtgctgggc tgtgaagctc aggacctata ctga
43744374
<210> 394<210> 394
<211> 7056<211> 7056
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 394<400> 394
atgcaaattg aattgagtac ctgttttttc ctctgtctat taaggttttg tttcagtgca atgcaaattg aattgagtac ctgttttttc ctctgtctat taaggttttg tttcagtgca
60 60
acaagaaggt attatctggg agctgttgag ttatcctggg actacatgca gtctgacctg acaagaaggt attatctggg agctgttgag ttatcctggg actacatgca gtctgacctg
120 120
ggagagctcc cagtggatgc taggtttccc ccaagagtac ccaaaagctt ccctttcaac ggagagctcc cagtggatgc taggtttccc ccaagagtac ccaaaagctt ccctttcaac
180 180
acttctgttg tctataaaaa gactctgttt gtagaattca cagatcatct gtttaacatt acttctgttg tctataaaaa gactctgttt gtagaattca cagatcatct gtttaacatt
240 240
gccaagccta gacctccatg gatggggctg ctgggaccaa ctattcaggc agaggtttat gccaagccta gacctccatg gatggggctg ctgggaccaa ctattcaggc agaggtttat
300 300
gacactgtgg tgattacact taagaatatg gcatcccacc cagtgagcct gcatgctgtt gacactgtgg tgattacact taagaatatg gcatcccacc cagtgagcct gcatgctgtt
360 360
ggggtttcct actggaaggc aagtgaagga gctgagtatg atgaccagac tagccaaaga ggggtttcct actggaaggc aagtgaagga gctgagtatg atgaccagac tagccaaaga
420 420
gagaaggagg atgacaaggt ctttccaggt ggcagccaca cctatgtctg gcaggtgctg gagaaggagg atgacaaggt ctttccaggt ggcagccaca cctatgtctg gcaggtgctg
480 480
aaggagaatg gccctatggc ctctgatcct ttgtgtctaa cctacagtta tttgtctcat aaggagaatg gccctatggc ctctgatcct ttgtgtctaa cctacagtta tttgtctcat
540 540
gtggacctgg tgaaggacct taactcaggg ctgatagggg ccttgctggt gtgtagggag gtggacctgg tgaaggacct taactcaggg ctgatagggg ccttgctggt gtgtagggag
600 600
ggaagcctgg ctaaggaaaa gacacagact ctgcataagt ttattctctt gtttgcagtg ggaagcctgg ctaaggaaaa gacacagact ctgcataagt ttattctctt gtttgcagtg
660 660
tttgatgagg gtaaaagctg gcactctgaa acaaaaaaca gcttgatgca ggacagggat tttgatgagg gtaaaagctg gcactctgaa acaaaaaaca gcttgatgca ggacagggat
720 720
gctgccagtg ctagggcttg gcctaagatg cacacagtca atggctatgt taacagatca gctgccagtg ctagggcttg gcctaagatg cacacagtca atggctatgt taacagatca
780 780
ctgcctggtt tgattggctg ccacagaaag tctgtttact ggcatgtaat tgggatgggg ctgcctggtt tgattggctg ccacagaaag tctgtttact ggcatgtaat tgggatgggg
840 840
acaaccccag aagttcactc tatcttcctg gaagggcaca ccttcctggt tagaaatcat acaaccccag aagttcactc tatcttcctg gaagggcaca ccttcctggt tagaaatcat
900 900
agacaggcat ccttagagat ttctcctatt acattcctga ctgcccagac cctcctcatg agacaggcat ccttagagat ttctcctatt acattcctga ctgccgac cctcctcatg
960 960
gacctgggtc agttcctgct tttttgccac atttcctccc accagcatga tggcatggag gacctgggtc agttcctgct tttttgccac atttcctccc accagcatga tggcatggag
10201020
gcctatgtga aagttgattc ttgccctgag gagcctcagc ttaggatgaa gaacaatgaa gcctatgtga aagttgattc ttgccctgag gagcctcagc ttaggatgaa gaacaatgaa
10801080
gaggctgagg actatgatga tgacctaaca gacagtgaga tggatgttgt gaggtttgat gaggctgagg actatgatga tgacctaaca gacagtgaga tggatgttgt gaggtttgat
11401140
gatgacaatt cacctagttt catccagatt aggtctgtgg ctaagaaaca tccaaagacc gatgacaatt cacctagttt catccagatt aggtctgtgg ctaagaaaca tccaaagacc
12001200
tgggttcact acattgcagc agaggaggag gactgggatt atgcccccct ggttctggca tgggttcact acattgcagc agaggaggag gactgggatt atgcccccct ggttctggca
12601260
cctgatgaca gaagctataa gtcccagtat ctcaacaatg gcccccagag gattggaaga cctgatgaca gaagctataa gtcccagtat ctcaacaatg gcccccagag gattggaaga
13201320
aaatacaaaa aagtcagatt tatggcctat acagatgaga cttttaaaac tagggaagct aaatacaaaa aagtcagatt tatggcctat acagatgaga cttttaaaac tagggaagct
13801380
attcagcatg agtcagggat cctgggacct cttctttatg gagaggtggg ggacactctt attcagcatg agtcagggat cctgggacct cttctttatg gagaggtggg ggacactctt
14401440
ctgataattt ttaaaaatca ggcaagtaga ccttataaca tctaccccca tgggatcact ctgataattt ttaaaaatca ggcaagtaga ccttataaca tctaccccca tgggatcact
15001500
gatgtcaggc ctctgtactc aagaaggctg cccaagggtg tcaaacacct caaggatttc gatgtcaggc ctctgtactc aagaaggctg cccaagggtg tcaaacacct caaggatttc
15601560
cctattcttc ctggggagat cttcaaatac aagtggacag ttactgtgga ggatggcccc cctattcttc ctggggagat cttcaaatac aagtggacag ttactgtgga ggatggcccc
16201620
accaaatctg acccaaggtg cctcaccaga tattacagct cctttgtgaa tatggaaaga accaaatctg acccaaggtg cctcaccaga tattacagct cctttgtgaa tatggaaaga
16801680
gacctagcta gtggtctcat tggcccactg ctcatctgtt acaaggagtc agtggaccag gacctagcta gtggtctcat tggcccactg ctcatctgtt acaaggagtc agtggaccag
17401740
agagggaatc aaattatgtc tgacaagaga aatgtgatcc ttttctcagt gtttgatgag agagggaatc aaattatgtc tgacaagaga aatgtgatcc ttttctcagt gtttgatgag
18001800
aacagaagct ggtatctgac agagaacatt caaaggtttc tgccaaaccc agctggagtt aacagaagct ggtatctgac agagaacatt caaaggtttc tgccaaaccc agctggagtt
18601860
cagctggagg accctgaatt ccaggcatct aatattatgc attctatcaa tggatatgtg cagctggagg accctgaatt ccaggcatct aatattatgc attctatcaa tggatatgtg
19201920
tttgatagtc tgcagctgtc tgtgtgcctg catgaagtgg cctactggta tatcctctct tttgatagtc tgcagctgtc tgtgtgcctg catgaagtgg cctactggta tatcctctct
19801980
attggtgccc agacagattt cttgtctgtg tttttcagtg gttacacatt taaacataaa attggtgccc agacagattt cttgtctgtg tttttcagtg gttacacatt taaacataaa
20402040
atggtgtatg aggacacact tacattattc ccttttagtg gagagacagt gtttatgtcc atggtgtatg aggacacact tacattattc ccttttagtg gagagacagt gtttatgtcc
21002100
atggagaatc caggcctgtg gatcttgggg tgtcataata gtgactttag gaatagaggt atggagaatc caggcctgtg gatcttgggg tgtcataata gtgactttag gaatagaggt
21602160
atgacagctc tgctcaaagt gtcttcctgt gacaagaaca caggggacta ttatgaggac atgacagctc tgctcaaagt gtcttcctgt gacaagaaca caggggacta ttatgaggac
22202220
tcttatgagg acatttcagc ctatttactg tccaagaaca atgccattga accaagatct tcttatgagg acatttcagc ctatttactg tccaagaaca atgccattga accaagatct
22802280
ttctctcaga actcaagaca ccccagcacc aggcagaagc agttcaatgc aaccaccatc ttctctcaga actcaagaca ccccagcacc aggcagaagc agttcaatgc aaccaccatc
23402340
ccagagaatg atattgaaaa aactgaccct tggtttgccc acaggactcc catgcctaag ccagagaatg atattgaaaa aactgaccct tggtttgccc acaggactcc catgcctaag
24002400
attcagaatg tatcttcatc agacttgctg atgctcctga gacagagccc aactcctcat attcagaatg tatcttcatc agacttgctg atgctcctga gacagagccc aactcctcat
24602460
ggcctgagct taagtgacct ccaggaggct aagtatgaaa ctttctcaga tgatcccagt ggcctgagct taagtgacct caccagggct aagtatgaaa ctttctcaga tgatcccagt
25202520
cctggtgcca ttgattctaa taattccctg tctgagatga cacacttcag accccagctc cctggtgcca ttgattctaa taattccctg tctgagatga cacacttcag accccagctc
25802580
caccactctg gagatatggt ctttactcct gaatcaggcc tgcagctgag gctgaatgaa caccactctg gagatatggt ctttactcct gaatcaggcc tgcagctgag gctgaatgaa
26402640
aagcttggca ccacagcagc tactgaactg aaaaagctgg attttaaagt gagctccaca aagcttggca ccacagcagc tactgaactg aaaaagctgg attttaaagt gagctccaca
27002700
tccaacaacc tgatttccac tatcccctca gataacttgg cagcagggac tgataacaca tccaacaacc tgatttccac tatcccctca gataacttgg cagcagggac tgataacaca
27602760
agctcactgg gtcccccttc catgcctgtc cattatgata gtcagctgga tactactctg agctcactgg gtcccccttc catgcctgtc cattatgata gtcagctgga tactactctg
28202820
tttggtaaga aatcctctcc cctgactgaa agtggaggcc ctctttccct gtcagaggag tttggtaaga aatcctctcc cctgactgaa agtggaggcc ctctttccct gtcagaggag
28802880
aacaatgaca gcaaactgtt agagtctgga ctcatgaact cacaggaaag ttcttggggc aacaatgaca gcaaactgtt agagtctgga ctcatgaact cacaggaaag ttcttggggc
29402940
aagaatgtgt ctagcactga gtctgggaga ctgtttaagg gcaagagggc ccatggacca aagaatgtgt ctagcactga gtctgggaga ctgtttaagg gcaagagggc ccatggacca
30003000
gccctgctga caaaggataa tgcactgttt aaggtctcaa tcagcctgtt gaagaccaac gccctgctga caaaggataa tgcactgttt aaggtctcaa tcagcctgtt gaagaccaac
30603060
aaaaccagta ataattctgc aacaaacagg aagacccaca ttgatggacc ctctcttctc aaaaccagta ataattctgc aacaaacagg aagacccaca ttgatggacc ctctcttctc
31203120
attgagaatt ccccttctgt ctggcagaac atcttggaat cagatacaga gttcaagaag attgagaatt ccccttctgt ctggcagaac atcttggaat cagatacaga gttcaagaag
31803180
gtgactcccc tgatccatga taggatgctc atggataaga atgccacagc actcaggctc gtgactcccc tgatccatga taggatgctc atggataaga atgccacagc actcaggctc
32403240
aatcacatga gcaacaagac tacctcctcc aaaaatatgg agatggtgca gcagaagaag aatcacatga gcaacaagac tacctcctcc aaaaatatgg agatggtgca gcagaagaag
33003300
gaaggtccca ttccccctga tgcacagaat ccagatatga gcttctttaa gatgctgttt gaaggtccca ttccccctga tgcacagaat ccagatatga gcttctttaa gatgctgttt
33603360
ttgcctgagt ctgccaggtg gattcagagg acacatggga agaactcact taactctggc ttgcctgagt ctgccaggtg gattcagagg acacatggga agaactcact taactctggc
34203420
caaggtccca gtcctaagca gttggtgagc ttggggcctg agaaaagtgt ggagggacag caaggtccca gtcctaagca gttggtgagc ttggggcctg agaaaagtgt ggagggacag
34803480
aatttcctgt ctgaaaagaa caaagtggtt gtgggcaaag gagagttcac taaagatgtg aatttcctgt ctgaaaagaa caaagtggtt gtgggcaaag gagagttcac taaagatgtg
35403540
ggactgaagg agatggtgtt tcctagttca agaaatctct ttcttaccaa tcttgataac ggactgaagg agatggtgtt tcctagttca agaaatctct ttcttaccaa tcttgataac
36003600
ctgcatgaga acaacaccca caatcaggaa aagaagatcc aggaggaaat tgagaagaag ctgcatgaga acaacaccca caatcaggaa aagaagatcc aggaggaaat tgagaagaag
36603660
gaaaccctga tccaggaaaa tgttgtgctg ccacagatcc acactgttac tgggaccaaa gaaaccctga tccaggaaaa tgttgtgctg ccacagatcc acactgttac tgggaccaaa
37203720
aatttcatga aaaacctgtt tctcctgtct accagacaga atgtagaggg aagctatgat aatttcatga aaaacctgtt tctcctgtct accagacaga atgtagaggg aagctatgat
37803780
ggggcctatg cccctgttct ccaggacttc agatccctga atgactccac caacaggact ggggcctatg cccctgttct ccaggacttc agatccctga atgactccac caacaggact
38403840
aagaaacata ctgcacactt tagtaagaag ggggaggagg agaacctgga gggattggga aagaaacata ctgcacactt tagtaagaag ggggaggagg agaacctgga gggattggga
39003900
aaccagacca agcagattgt ggagaaatat gcttgcacca ctagaatctc acctaacaca aaccagacca agcagattgt ggagaaatat gcttgcacca ctagaatctc acctaacaca
39603960
agccagcaga actttgtgac ccagaggtct aagagggccc tcaaacagtt tagattgcct agccagcaga actttgtgac ccagaggtct aagagggccc tcaaacagtt tagattgcct
40204020
ttggaggaga ctgagctgga aaagaggatt attgtggatg acacctctac ccagtggagc ttggaggaga ctgagctgga aaagaggatt attgtggatg acacctctac ccagtggagc
40804080
aagaatatga agcacctgac cccaagcacc cttactcaga ttgattacaa tgaaaaagaa aagaatatga agcacctgac cccaagcacc cttactcaga ttgattacaa tgaaaaagaa
41404140
aagggtgcca tcacccagag ccccttgagt gactgtttga caaggtccca cagtatccca aagggtgcca tcacccagag ccccttgagt gactgtttga caaggtccca cagtatccca
42004200
caggctaaca gatctcctct gcctattgcc aaggtcagct ccttcccttc catcagaccc caggctaaca gatctcctct gcctattgcc aaggtcagct ccttcccttc catcagaccc
42604260
atctatctga ccagagtgct gttccaggac aactcctctc atctgccagc tgcctcctat atctatctga ccagagtgct gttccaggac aactcctctc atctgccagc tgcctcctat
43204320
aggaagaagg atagtggtgt gcaggaatca tctcactttc tgcagggagc caagaagaac aggaagaagg atagtggtgt gcaggaatca tctcactttc tgcagggagc caagaagaac
43804380
aatctgagcc tggcaattct cacacttgag atgacaggag accagaggga agtgggaagt aatctgagcc tggcaattct cacacttgag atgacaggag accagaggga agtgggaagt
44404440
ctgggcactt ctgctaccaa ttctgtcacc tacaagaaag tggagaatac agttctgccc ctgggcactt ctgctaccaa ttctgtcacc tacaagaaag tggagaatac agttctgccc
45004500
aagccagacc tgcctaaaac atctggaaag gttgagctgc tgcctaaggt gcacatatac aagccagacc tgcctaaaac atctggaaag gttgagctgc tgcctaaggt gcacatatac
45604560
cagaaggacc tattccctac agagacatcc aatggctccc caggccacct ggacttggta cagaaggacc tattccctac agagacatcc aatggctccc caggccacct ggacttggta
46204620
gaggggtctc tcctgcaggg cactgaaggt gctatcaagt ggaatgaggc taatagacct gaggggtctc tcctgcaggg cactgaaggt gctatcaagt ggaatgaggc taatagacct
46804680
gggaaggtgc catttctgag ggtggccaca gagagctcag ctaagacacc cagcaagctg gggaaggtgc catttctgag ggtggccaca gagagctcag ctaagacacc cagcaagctg
47404740
cttgatcccc tggcctggga caatcactat ggaacccaga ttcctaagga ggagtggaag cttgatcccc tggcctggga caatcactat ggaacccaga ttcctaagga ggagtggaag
48004800
tcccaggaga agtccccaga gaagactgct ttcaagaaga aggacactat cctctccctg tcccaggaga agtccccaga gaagactgct ttcaagaaga aggacactat cctctccctg
48604860
aatgcctgtg agtctaacca tgctattgct gccatcaatg aaggccagaa caagcctgaa aatgcctgtg agtctaacca tgctattgct gccatcaatg aaggccagaa caagcctgaa
49204920
attgaggtga catgggccaa gcagggcaga acagagaggc tgtgcagcca gaacccacct attgaggtga catgggccaa gcagggcaga acagagaggc tgtgcagcca gaacccacct
49804980
gtgctcaaga ggcaccagag agagatcact agaaccactc tgcagtcaga ccaggaagag gtgctcaaga ggcaccagag agagatcact agaaccactc tgcagtcaga cccaggaagag
50405040
attgactatg atgacaccat ctcagttgag atgaaaaagg aggattttga tatttatgat attgactatg atgacaccat ctcagttgag atgaaaaagg aggattttga tatttatgat
51005100
gaggatgaga atcaatcccc aagatctttt cagaagaaga caagacatta cttcattgct gaggatgaga atcaatcccc aagatctttt cagaagaaga caagacatta cttcattgct
51605160
gcagtggaga gactgtggga ttatggcatg tcctcctcac ctcatgtgct gagaaataga gcagtggaga gactgtggga ttatggcatg tcctcctcac ctcatgtgct gagaaataga
52205220
gcccagtctg gctctgtgcc ccagttcaaa aaagtggtgt ttcaggagtt cacagatggt gcccagtctg gctctgtgcc ccagttcaaa aaagtggtgt ttcaggagtt cacagatggt
52805280
tccttcacac agcccctgta caggggtgag ctgaatgagc acctggggtt gctgggcccc tccttcacac agcccctgta caggggtgag ctgaatgagc acctggggtt gctgggcccc
53405340
tacatcagag ctgaagttga ggataatatt atggtgacct tcaggaatca ggccagtagg tacatcagag ctgaagttga ggataatatt atggtgacct tcaggaatca ggccagtagg
54005400
ccttactctt tctactccag cctgatctca tatgaggagg accagagaca gggggctgaa ccttactctt tctactccag cctgatctca tatgaggagg accagagaca gggggctgaa
54605460
cctaggaaga attttgtgaa gcccaatgaa acaaagacat acttctggaa ggtgcagcac cctaggaaga attttgtgaa gcccaatgaa acaaagacat acttctggaa ggtgcagcac
55205520
cacatggctc ctaccaagga tgaatttgat tgcaaggctt gggcctattt ttctgatgtg cacatggctc ctaccaagga tgaatttgat tgcaaggctt gggcctattt ttctgatgtg
55805580
gacctggaga aggatgtgca ttctggcctc attggccctc tcttggtgtg tcacaccaat gacctggaga aggatgtgca ttctggcctc attggccctc tcttggtgtg tcacaccaat
56405640
accttgaatc cagcccatgg cagacaggtg actgttcagg agtttgctct gtttttcacc accttgaatc cagcccatgg cagacaggtg actgttcagg agtttgctct gtttttcacc
57005700
atctttgatg agacaaagtc ctggtatttt acagagaata tggagaggaa ttgcagggcc atctttgatg agacaaagtc ctggtatttt acagagaata tggagaggaa ttgcagggcc
57605760
ccctgcaaca tccagatgga agacccaacc ttcaaggaga actacagatt ccatgcaatc ccctgcaaca tccagatgga agacccaacc ttcaaggaga actacagatt ccatgcaatc
58205820
aatggatata tcatggacac cctgcctggc ctggttatgg ctcaggatca gagaatcagg aatggatata tcatggacac cctgcctggc ctggttatgg ctcaggatca gagaatcagg
58805880
tggtatctgc tgtctatggg gtcaaatgag aacatccata gtatccactt ctctggccat tggtatctgc tgtctatggg gtcaaatgag aacatccata gtatccactt ctctggccat
59405940
gtgtttacag tgagaaagaa ggaagaatat aagatggccc tgtacaacct ctaccctgga gtgtttacag tgagaaagaa ggaagaatat aagatggccc tgtacaacct ctaccctgga
60006000
gtgtttgaaa ctgttgaaat gctgccttca aaggctggaa tctggagggt ggaatgcctg gtgtttgaaa ctgttgaaat gctgccttca aaggctggaa tctggagggt ggaatgcctg
60606060
attggagagc accttcatgc tggcatgtcc accctgtttc tggtgtacag caataagtgt attggagagc accttcatgc tggcatgtcc accctgtttc tggtgtacag caataagtgt
61206120
cagactcctc tgggtatggc ttcaggccac atcagggact tccagatcac tgcctcagga cagactcctc tgggtatggc ttcaggccac atcagggact tccagatcac tgcctcagga
61806180
cagtatggac agtgggctcc caaactggca aggctccact actcaggcag cattaatgcc cagtatggac agtgggctcc caaactggca aggctccact actcaggcag cattaatgcc
62406240
tggtccacca aagagccttt cagctggatt aaggtggatc tcctggcacc tatgatcatc tggtccacca aagagccttt cagctggatt aaggtggatc tcctggcacc tatgatcatc
63006300
catgggatca agactcaggg agctaggcag aagtttagca gcctgtacat ttctcagttt catgggatca agactcaggg agctaggcag aagtttagca gcctgtacat ttctcagttt
63606360
atcattatgt acagcctgga tggaaaaaag tggcagacct atagaggaaa ctccactgga atcattatgt acagcctgga tggaaaaaag tggcagacct atagaggaaa ctccactgga
64206420
acactgatgg tgttttttgg caatgtggac tcaagtggga tcaagcacaa tatcttcaac acactgatgg tgttttttgg caatgtggac tcaagtggga tcaagcacaa tatcttcaac
64806480
ccccctatca ttgccagata catcaggctc caccctacac actactctat cagatctaca ccccctatca ttgccagata catcaggctc caccctacac actactctat cagatctaca
65406540
cttaggatgg agctgatggg atgtgatctg aactcttgca gtatgcctct gggtatggag cttaggatgg agctgatggg atgtgatctg aactcttgca gtatgcctct gggtatggag
66006600
tccaaggcca tctctgatgc tcagatcaca gccagctctt actttactaa tatgtttgct tccaaggcca tctctgatgc tcagatcaca gccagctctt actttactaa tatgtttgct
66606660
acctggtccc caagcaaggc aagactgcac ctgcagggca gatccaatgc ttggagaccc acctggtccc caagcaaggc aagactgcac ctgcagggca gatccaatgc ttggagaaccc
67206720
caggtgaata acccaaaaga gtggcttcag gtggacttcc agaagactat gaaggtgact caggtgaata acccaaaaga gtggcttcag gtggacttcc agaagactat gaaggtgact
67806780
ggagtgacca cccagggggt gaagtcactg ctgacctcca tgtatgtgaa ggagttcctg ggagtgacca cccagggggt gaagtcactg ctgacctcca tgtatgtgaa ggagttcctg
68406840
atctccagct cccaggatgg ccaccagtgg accctgttct tccagaatgg aaaggtgaag atctccagct cccaggatgg ccaccagtgg accctgttct tccagaatgg aaaggtgaag
69006900
gtgttccagg gaaaccagga ctcctttacc cctgtggtga actccctgga ccccccactg gtgttccagg gaaaccagga ctcctttacc cctgtggtga actccctgga ccccccactg
69606960
ctgaccagat acctgagaat ccatccccag agctgggtgc accagattgc ccttaggatg ctgaccagat acctgagaat ccatccccag agctgggtgc accagattgc ccttaggatg
70207020
gaggtgctgg gatgtgaagc ccaggacctg tactaa gaggtgctgg gatgtgaagc ccaggacctg tactaa
70567056
<210> 395<210> 395
<211> 5013<211> 5013
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 395<400> 395
atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct
60 60
accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg
120 120
ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac
180 180
acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt
240 240
gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat
300 300
gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta
360 360
ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga
420 420
gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg
480 480
aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat
540 540
gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa
600 600
gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg
660 660
tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat
720 720
gctgcatctg ccagggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc gctgcatctg cccaggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc
780 780
ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc
840 840
accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat
900 900
agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg
960 960
gacttggggc agtttctgtt attctgccac atcagcagcc atcaacatga tggtatggaa gacttggggc agtttctgtt attctgccac atcagcagcc atcaacatga tggtatggaa
10201020
gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag
10801080
gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagatttgat gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagattgat
11401140
gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc
12001200
tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc
12601260
cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga
13201320
aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc
13801380
atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg
14401440
ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca
15001500
gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt
15601560
ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct
16201620
actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga
16801680
gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag
17401740
agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag
18001800
aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg
18601860
cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg
19201920
tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct
19801980
attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag
20402040
atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct
21002100
atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt
21602160
atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat
22202220
tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc
22802280
ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc
23402340
ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag
24002400
attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat
24602460
ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc
25202520
ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc
25802580
caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag
26402640
aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact
27002700
tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca
27602760
agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt
28202820
tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag
28802880
aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc
29402940
aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt
30003000
gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag
30603060
gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct
31203120
gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct
31803180
cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt
32403240
tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat
33003300
atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc
33603360
tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct
34203420
agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac
34803480
atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat
35403540
ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca
36003600
ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt
36603660
tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct
37203720
tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat
37803780
ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg
38403840
tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg
39003900
ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg
39603960
tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt
40204020
ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag
40804080
acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag
41404140
tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg
42004200
tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat
42604260
gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc
43204320
attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc
43804380
ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct
44404440
cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt
45004500
aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc
45604560
aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc
46204620
tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag
46804680
gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga
47404740
gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc
48004800
tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg
48604860
tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg
49204920
accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag
49804980
gtgctgggct gtgaggccca ggacctgtac tga gtgctgggct gtgaggccca ggacctgtac tga
50135013
<210> 396<210> 396
<211> 5013<211> 5013
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полинуклеотидpolynucleotide
<400> 396<400> 396
atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct atgcaaattg agttaagtac ctgttttttc ctgtgcctgt tgagattttg cttctctgct
60 60
accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg accagaaggt attacctggg agctgtggag ctgtcatggg actacatgca gtctgacctg
120 120
ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac ggagagctcc ctgttgatgc taggtttccc cctagggtgc caaagtcctt tccttttaac
180 180
acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt acctcagtgg tgtacaagaa gacactgttt gtggagttta ctgaccacct cttcaatatt
240 240
gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat gctaagccaa gacccccttg gatgggtctc ttgggcccta ccatccaggc tgaggtttat
300 300
gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta gatacagtgg tgattaccct caagaatatg gcttctcatc ctgttagtct gcatgcagta
360 360
ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga ggggtcagct attggaaggc cagtgaagga gctgagtatg atgaccagac cagccagaga
420 420
gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg gagaaagagg atgacaaggt gttccctggg ggatcacaca cctatgtgtg gcaggtgttg
480 480
aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat aaggaaaatg gacccatggc ctctgaccca ctctgcctga cttactccta cctgtctcat
540 540
gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa gtggacctgg tcaaagatct gaactctggc ctgattgggg cactgttggt gtgcagagaa
600 600
gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg gggtctcttg ccaaggagaa gactcagacc ctgcacaagt tcatcctgct gtttgctgtg
660 660
tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat tttgatgaag gcaagtcttg gcattctgag actaagaaca gcctgatgca agatagagat
720 720
gctgcatctg ccagggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc gctgcatctg cccaggcctg gcctaagatg cacactgtga atggatatgt gaataggtcc
780 780
ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc ttgcctggcc tgattggatg ccataggaag tctgtgtact ggcatgtgat tggcatgggc
840 840
accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat accacccctg aggttcactc tatttttctg gagggccata ctttccttgt gaggaatcat
900 900
agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg agacaggcct ctctggagat tagccctatt acatttctga ctgctcagac cctcctcatg
960 960
gacttggggc agtttctgtt aagctgccac atcagcagcc atcaacatga tggtatggaa gacttggggc agtttctgtt aagctgccac atcagcagcc atcaacatga tggtatggaa
10201020
gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag gcctatgtca aagtggatag ctgccctgaa gaaccacagc ttaggatgaa gaacaatgag
10801080
gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagatttgat gaggcagagg actatgatga tgatctgact gattctgaaa tggatgtggt gagattgat
11401140
gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc gatgataata gcccttcctt tatccagatc aggtcagtgg ccaagaagca cccaaagacc
12001200
tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc tgggtgcatt atattgctgc tgaggaggag gactgggact atgcccctct ggtgctggcc
12601260
cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga cctgatgata gaagctataa gtctcaatac ttgaataatg gcccacagag gattgggaga
13201320
aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc aagtacaaaa aggtgagatt tatggcctac actgatgaga ctttcaagac cagagaggcc
13801380
atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg atccagcatg aatcaggcat tttgggtccc ctgctgtatg gagaggtggg ggataccctg
14401440
ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca ctgatcatct ttaagaacca ggccagcaga ccttacaaca tttaccctca tgggatcaca
15001500
gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt gatgtgaggc cactctactc taggagattg cccaagggag tcaagcatct taaggacttt
15601560
ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct ccaatcctgc ctggggagat cttcaagtac aaatggacag tgacagttga ggatggacct
16201620
actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga actaagagtg accccaggtg tctgaccaga tattactcta gctttgtcaa tatggaaaga
16801680
gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag gacctggctt caggcttgat aggccctctt ctcatctgct acaaagagtc tgtggaccag
17401740
agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag agaggaaatc agattatgtc tgacaagaga aatgttattc tgttttcagt ctttgatgag
18001800
aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg aacagaagtt ggtacttgac agagaacatt cagagatttc tgcctaaccc tgcaggagtg
18601860
cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg cagcttgagg accctgagtt tcaggcttcc aatatcatgc attctatcaa tggctatgtg
19201920
tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct tttgatagcc tgcagctgtc tgtgtgcctg catgaggttg cctattggta catcctgtct
19801980
attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag attggggccc aaactgattt cttgtctgtg tttttcagtg gatatacctt taagcataag
20402040
atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct atggtgtatg aagatacctt gacacttttc cctttctcag gagagactgt cttcatgtct
21002100
atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt atggagaacc ctggactgtg gatcctggga tgccacaact cagacttcag aaacaggggt
21602160
atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat atgacagctc tgcttaaggt ctcctcatgt gacaaaaata caggagacta ctatgaagat
22202220
tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc tcctatgagg acatctctgc ttacctgctc agcaaaaaca atgccattga gcccagaagc
22802280
ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc ttcagccaga attccagaca tcccagtact aggcagaagc agtttaatgc caccaccatc
23402340
ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag ccagaaaatg acattgagaa gacagaccct tggtttgccc atagaacccc aatgcccaag
24002400
attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat attcagaatg tgagcagctc agacttgctg atgctgctga ggcagtctcc tactccccat
24602460
ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc ggcctgtccc tctcagatct gcaggaagcc aagtatgaga cattttctga tgacccctcc
25202520
ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc ccaggggcta ttgacagtaa caacagcctg tctgaaatga cccacttcag acctcagctc
25802580
caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag caccacagtg gggatatggt gtttacccca gagtcaggcc tgcagctgag actgaatgag
26402640
aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact aagctgggaa ccacagctgc cacagaactg aagaagctgg atttcaaggt gagctctact
27002700
tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca tcaaataatc tgatttccac tatcccatct gacaatttgg cagctggcac tgacaataca
27602760
agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt agctctctgg gcccacctag catgccagtg cattatgaca gccagttgga caccactctt
28202820
tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag tttggaaaga aatccagtcc cctgacagag tcaggaggac ccctttctct gtctgaggag
28802880
aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc aacaatgata gtaagcttct ggagtcaggc ttgatgaact cccaggagag ttcttggggc
29402940
aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt aagaatgtga gctctaggga gatcaccaga accactctgc agtctgacca agaagagatt
30003000
gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag gattatgatg acactatctc tgttgagatg aagaaggagg actttgatat ctatgatgag
30603060
gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct gatgagaacc agtctccaag aagtttccag aagaagacca ggcactactt tattgctgct
31203120
gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct gtggagagac tgtgggacta tggaatgtcc tcctcccctc atgtcctgag aaatagagct
31803180
cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt cagtcaggat cagtgcccca gttcaagaag gtggtgttcc aggaattcac agatggaagt
32403240
tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat tttacccagc cactgtatag aggtgaactg aatgaacatc tgggtctgct ggggccctat
33003300
atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc atcagggctg aggtggagga caatattatg gtgaccttta gaaaccaggc ctcaaggccc
33603360
tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct tacagcttct actcttccct catttcatat gaggaagacc agagacaggg agcagagcct
34203420
agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac agaaagaact ttgtcaagcc caatgaaacc aaaacctatt tctggaaggt gcagcaccac
34803480
atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat atggcaccca ccaaagatga gtttgactgc aaagcctggg cctatttctc agatgtggat
35403540
ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca ctggagaagg atgtccattc aggtctgatt ggaccactcc tggtgtgcca caccaacaca
36003600
ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt ctgaatccag ctcatggcag acaggtgaca gtccaggagt ttgccctgtt tttcactatt
36603660
tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct tttgatgaga ccaagagctg gtattttaca gagaatatgg aaagaaactg cagagcccct
37203720
tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat tgtaatatcc agatggagga cccaaccttt aaggagaact acaggttcca tgccatcaat
37803780
ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg ggctacatta tggataccct gcctggcctg gttatggccc aggatcagag gatcaggtgg
38403840
tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg tatctgctgt caatgggctc caatgagaac attcatagta ttcacttttc aggacatgtg
39003900
ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg ttcacagtga gaaagaagga ggagtataag atggccctct ataatctcta cccaggggtg
39603960
tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt tttgagacag ttgagatgct gccatctaag gcaggcatct ggagagtgga atgcctcatt
40204020
ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag ggagagcacc tgcatgctgg catgtccacc ctgtttctgg tgtactccaa caaatgtcag
40804080
acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag acccctcttg gtatggcctc tggccacatt agggatttcc agattactgc cagtggtcag
41404140
tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg tatgggcagt gggcccctaa gctggccaga ctgcactatt ctgggagcat caatgcctgg
42004200
tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat tccaccaagg aacctttttc ttggattaaa gtggatctgc tggccccaat gatcatccat
42604260
gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc gggatcaaga cccagggagc taggcagaag ttcagcagcc tgtacattag tcagttcatc
43204320
attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc attatgtaca gtctggatgg caaaaagtgg cagacataca ggggcaattc cactggaacc
43804380
ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct ctgatggtgt tctttggaaa tgtggatagc agtggtatca agcacaacat tttcaaccct
44404440
cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt cccatcattg ccaggtacat cagactgcat ccaacccact acagcattag gagcaccctt
45004500
aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc aggatggagc tcatggggtg tgacctgaac tcttgctcta tgccacttgg aatggagagc
45604560
aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc aaggccatct ctgatgccca gattactgct agttcctact tcaccaatat gtttgccacc
46204620
tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag tggtcaccca gcaaggccag gctgcacctg cagggaaggt ccaatgcttg gaggcctcag
46804680
gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga gtgaacaatc caaaggagtg gctgcaggtg gacttccaga agactatgaa ggtgacagga
47404740
gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc gtgaccactc agggagtgaa gagcctgctg acctccatgt atgtgaagga gtttctgatc
48004800
tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg tccagctccc aggatggcca ccagtggacc ctgttctttc agaatggcaa ggtgaaggtg
48604860
tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg tttcagggga atcaggactc cttcacccca gtggtgaatt ccctggatcc ccctctgctg
49204920
accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag accagatacc tgagaatcca cccccagtct tgggtgcacc agattgccct taggatggag
49804980
gtgctgggct gtgaggccca ggacctgtac tga gtgctgggct gtgaggccca ggacctgtac tga
50135013
<210> 397<210> 397
<211> 1670<211> 1670
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полипептидpolypeptide
<400> 397<400> 397
Met Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg PheMet Gln Ile Glu Leu Ser Thr Cys Phe Phe Leu Cys Leu Leu Arg Phe
1 5 10 151 5 10 15
Cys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu SerCys Phe Ser Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser
20 25 30 20 25 30
Trp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala ArgTrp Asp Tyr Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg
35 40 45 35 40 45
Phe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val ValPhe Pro Pro Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val
50 55 60 50 55 60
Tyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn IleTyr Lys Lys Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile
65 70 75 8065 70 75 80
Ala Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile GlnAla Lys Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln
85 90 95 85 90 95
Ala Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala SerAla Glu Val Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser
100 105 110 100 105 110
His Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala SerHis Pro Val Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser
115 120 125 115 120 125
Glu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu AspGlu Gly Ala Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp
130 135 140 130 135 140
Asp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val LeuAsp Lys Val Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu
145 150 155 160145 150 155 160
Lys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr SerLys Glu Asn Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser
165 170 175 165 170 175
Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu IleTyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile
180 185 190 180 185 190
Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys ThrGly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr
195 200 205 195 200 205
Gln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu GlyGln Thr Leu His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly
210 215 220 210 215 220
Lys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg AspLys Ser Trp His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp
225 230 235 240225 230 235 240
Ala Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly TyrAla Ala Ser Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr
245 250 255 245 250 255
Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser ValVal Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val
260 265 270 260 265 270
Tyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser IleTyr Trp His Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile
275 280 285 275 280 285
Phe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala SerPhe Leu Glu Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser
290 295 300 290 295 300
Leu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu MetLeu Glu Ile Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met
305 310 315 320305 310 315 320
Asp Leu Gly Gln Phe Leu Leu Ser Cys His Ile Ser Ser His Gln HisAsp Leu Gly Gln Phe Leu Leu Ser Cys His Ile Ser Ser His Gln His
325 330 335 325 330 335
Asp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu ProAsp Gly Met Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro
340 345 350 340 345 350
Gln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp AspGln Leu Arg Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp
355 360 365 355 360 365
Leu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn SerLeu Thr Asp Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser
370 375 380 370 375 380
Pro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys ThrPro Ser Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr
385 390 395 400385 390 395 400
Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala ProTrp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro
405 410 415 405 410 415
Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu AsnLeu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn
420 425 430 420 425 430
Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe MetAsn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met
435 440 445 435 440 445
Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His GluAla Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu
450 455 460 450 455 460
Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr LeuSer Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu
465 470 475 480465 470 475 480
Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr ProLeu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro
485 490 495 485 490 495
His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro LysHis Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys
500 505 510 500 505 510
Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile PheGly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe
515 520 525 515 520 525
Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser AspLys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp
530 535 540 530 535 540
Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu ArgPro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg
545 550 555 560545 550 555 560
Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys GluAsp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu
565 570 575 565 570 575
Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn ValSer Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val
580 585 590 580 585 590
Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr GluIle Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu
595 600 605 595 600 605
Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu AspAsn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp
610 615 620 610 615 620
Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr ValPro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val
625 630 635 640625 630 635 640
Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr TrpPhe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp
645 650 655 645 650 655
Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe PheTyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe
660 665 670 660 665 670
Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu ThrSer Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr
675 680 685 675 680 685
Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn ProLeu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro
690 695 700 690 695 700
Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg GlyGly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly
705 710 715 720705 710 715 720
Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly AspMet Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp
725 730 735 725 730 735
Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser LysTyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys
740 745 750 740 745 750
Asn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His ProAsn Asn Ala Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro
755 760 765 755 760 765
Ser Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn AspSer Thr Arg Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp
770 775 780 770 775 780
Ile Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro LysIle Glu Lys Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys
785 790 795 800785 790 795 800
Ile Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln SerIle Gln Asn Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser
805 810 815 805 810 815
Pro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys TyrPro Thr Pro His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr
820 825 830 820 825 830
Glu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn AsnGlu Thr Phe Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn
835 840 845 835 840 845
Ser Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser GlySer Leu Ser Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly
850 855 860 850 855 860
Asp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn GluAsp Met Val Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu
865 870 875 880865 870 875 880
Lys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe LysLys Leu Gly Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys
885 890 895 885 890 895
Val Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp AsnVal Ser Ser Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn
900 905 910 900 905 910
Leu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser MetLeu Ala Ala Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met
915 920 925 915 920 925
Pro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys LysPro Val His Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys
930 935 940 930 935 940
Ser Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu GluSer Ser Pro Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu
945 950 955 960945 950 955 960
Asn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln GluAsn Asn Asp Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu
965 970 975 965 970 975
Ser Ser Trp Gly Lys Asn Val Ser Ser Arg Glu Ile Thr Arg Thr ThrSer Ser Trp Gly Lys Asn Val Ser Ser Arg Glu Ile Thr Arg Thr Thr
980 985 990 980 985 990
Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser ValLeu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val
995 1000 1005 995 1000 1005
Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu AsnGlu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn
1010 1015 1020 1010 1015 1020
Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe IleGln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile
1025 1030 1035 1025 1030 1035
Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser ProAla Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro
1040 1045 1050 1040 1045 1050
His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln PheHis Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe
1055 1060 1065 1055 1060 1065
Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr GlnLys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln
1070 1075 1080 1070 1075 1080
Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu GlyPro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly
1085 1090 1095 1085 1090 1095
Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr PhePro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe
1100 1105 1110 1100 1105 1110
Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu IleArg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile
1115 1120 1125 1115 1120 1125
Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys AsnSer Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn
1130 1135 1140 1130 1135 1140
Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val GlnPhe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln
1145 1150 1155 1145 1150 1155
His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala TrpHis His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp
1160 1165 1170 1160 1165 1170
Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser GlyAla Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser Gly
1175 1180 1185 1175 1180 1185
Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn ProLeu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro
1190 1195 1200 1190 1195 1200
Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe PheAla His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe
1205 1210 1215 1205 1210 1215
Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn MetThr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met
1220 1225 1230 1220 1225 1230
Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp ProGlu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro
1235 1240 1245 1235 1240 1245
Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr IleThr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile
1250 1255 1260 1250 1255 1260
Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg IleMet Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile
1265 1270 1275 1265 1270 1275
Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His SerArg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser
1280 1285 1290 1280 1285 1290
Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu GluIle His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu
1295 1300 1305 1295 1300 1305
Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu ThrTyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr
1310 1315 1320 1310 1315 1320
Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu CysVal Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys
1325 1330 1335 1325 1330 1335
Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe LeuLeu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu
1340 1345 1350 1340 1345 1350
Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser GlyVal Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly
1355 1360 1365 1355 1360 1365
His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly GlnHis Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln
1370 1375 1380 1370 1375 1380
Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile AsnTrp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn
1385 1390 1395 1385 1390 1395
Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp LeuAla Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu
1400 1405 1410 1400 1405 1410
Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala ArgLeu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg
1415 1420 1425 1415 1420 1425
Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met TyrGln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr
1430 1435 1440 1430 1435 1440
Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser ThrSer Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr
1445 1450 1455 1445 1450 1455
Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly IleGly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile
1460 1465 1470 1460 1465 1470
Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile ArgLys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg
1475 1480 1485 1475 1480 1485
Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met GluLeu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu
1490 1495 1500 1490 1495 1500
Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly MetLeu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met
1505 1510 1515 1505 1510 1515
Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser TyrGlu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr
1520 1525 1530 1520 1525 1530
Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg LeuPhe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu
1535 1540 1545 1535 1540 1545
His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn AsnHis Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn
1550 1555 1560 1550 1555 1560
Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys ValPro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val
1565 1570 1575 1565 1570 1575
Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser MetThr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met
1580 1585 1590 1580 1585 1590
Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His GlnTyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln
1595 1600 1605 1595 1600 1605
Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln GlyTrp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly
1610 1615 1620 1610 1615 1620
Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro ProAsn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro
1625 1630 1635 1625 1630 1635
Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val HisLeu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His
1640 1645 1650 1640 1645 1650
Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln AspGln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp
1655 1660 1665 1655 1660 1665
Leu TyrLeu Tyr
1670 1670
<210> 398<210> 398
<211> 31<211> 31
<212> БЕЛОК<212> PROTEIN
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Описание искусственной последовательности: синтетический <223> Description of artificial sequence: synthetic
полипептидpolypeptide
<400> 398<400> 398
Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr SerSer Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser
1 5 10 151 5 10 15
Asn Asp Ser Asn Val Ser Pro Pro Val Leu Lys Arg His Gln ArgAsn Asp Ser Asn Val Ser Pro Pro Val Leu Lys Arg His Gln Arg
20 25 30 20 25 30
<---<---
Claims (55)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/817,904 | 2019-03-13 | ||
US62/856,432 | 2019-06-03 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2021129628A RU2021129628A (en) | 2023-06-28 |
RU2812852C2 true RU2812852C2 (en) | 2024-02-02 |
Family
ID=
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017075619A1 (en) * | 2015-10-30 | 2017-05-04 | Spark Therapeutics, Inc. | Cpg reduced factor viii variants, compositions and methods and uses for treatment of hemostasis disorders |
RU2653444C2 (en) * | 2012-02-17 | 2018-05-08 | Дзе Чилдрен'З Хоспитал Оф Филадельфия | Aav vector compositions and methods for gene transfer to cells, organs and tissues |
US20190032083A1 (en) * | 2016-03-03 | 2019-01-31 | University Of Massachusetts | Closed-ended linear duplex dna for non-viral gene transfer |
WO2019032898A1 (en) * | 2017-08-09 | 2019-02-14 | Bioverativ Therapeutics Inc. | Nucleic acid molecules and uses thereof |
WO2019051255A1 (en) * | 2017-09-08 | 2019-03-14 | Generation Bio Co. | Modified closed-ended dna (cedna) |
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2653444C2 (en) * | 2012-02-17 | 2018-05-08 | Дзе Чилдрен'З Хоспитал Оф Филадельфия | Aav vector compositions and methods for gene transfer to cells, organs and tissues |
WO2017075619A1 (en) * | 2015-10-30 | 2017-05-04 | Spark Therapeutics, Inc. | Cpg reduced factor viii variants, compositions and methods and uses for treatment of hemostasis disorders |
US20190032083A1 (en) * | 2016-03-03 | 2019-01-31 | University Of Massachusetts | Closed-ended linear duplex dna for non-viral gene transfer |
WO2019032898A1 (en) * | 2017-08-09 | 2019-02-14 | Bioverativ Therapeutics Inc. | Nucleic acid molecules and uses thereof |
WO2019051255A1 (en) * | 2017-09-08 | 2019-03-14 | Generation Bio Co. | Modified closed-ended dna (cedna) |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021204620A1 (en) | Central nervous system targeting polynucleotides | |
AU2016343979A1 (en) | Delivery of central nervous system targeting polynucleotides | |
AU774643B2 (en) | Compositions and methods for use in recombinational cloning of nucleic acids | |
KR20230019843A (en) | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence | |
KR20210149060A (en) | RNA-induced DNA integration using TN7-like transposons | |
KR20210143230A (en) | Methods and compositions for editing nucleotide sequences | |
CN108753824B (en) | Viral vectors for the treatment of retinal dystrophy | |
KR20200093635A (en) | Gene editing using modified closed terminal DNA (CEDNA) | |
CN113271955A (en) | Enhanced systems for cell-mediated oncolytic viral therapy | |
CN111344395A (en) | Methods of generating modified natural killer cells and methods of use | |
KR20200064129A (en) | Transgenic selection methods and compositions | |
KR20180097631A (en) | Materials and methods for delivering nucleic acids to Wow and vestibular cells | |
KR102628872B1 (en) | Tools and methods for using cell division loci to control proliferation of cells | |
JP2023036921A (en) | Materials and methods for delivering nucleic acids to cochlear and vestibular cells | |
US20200188531A1 (en) | Single-vector gene construct comprising insulin and glucokinase genes | |
CN111733174B (en) | Isolated nucleic acid molecule and application thereof | |
CN112313334A (en) | Homologous directed repair template design and delivery to edit hemoglobin-related mutations | |
CN112041334A (en) | Expression of human FOXP3 in gene-edited T cells | |
KR20220130093A (en) | Compositions and methods for treating sensorineural hearing loss using the autopurin dual vector system | |
CN111094569A (en) | Light-controlled viral protein, gene thereof, and viral vector containing same | |
KR20230035689A (en) | Engineered cascade components and cascade complexes | |
US11129890B1 (en) | Non-integrating HIV-1 comprising mutant RT/IN proteins and the SARS-CoV-2 spike protein | |
CN110637090A (en) | Plasmid vectors for expression of large nucleic acid transgenes | |
KR20210151785A (en) | Non-viral DNA vectors and their use for expression of FVIII therapeutics | |
KR20240004253A (en) | Method for treating sensorineural hearing loss using the Autoperlin Dual Vector System |