CN1777676A - 与精神分裂症相关的电压门控离子通道基因及蛋白质 - Google Patents
与精神分裂症相关的电压门控离子通道基因及蛋白质 Download PDFInfo
- Publication number
- CN1777676A CN1777676A CNA018224997A CN01822499A CN1777676A CN 1777676 A CN1777676 A CN 1777676A CN A018224997 A CNA018224997 A CN A018224997A CN 01822499 A CN01822499 A CN 01822499A CN 1777676 A CN1777676 A CN 1777676A
- Authority
- CN
- China
- Prior art keywords
- polynucleotide
- canion
- polypeptide
- sequence
- equipotential
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000862 Ion Channels Proteins 0.000 title claims abstract description 22
- 108090000623 proteins and genes Proteins 0.000 title claims description 209
- 102000004169 proteins and genes Human genes 0.000 title claims description 54
- 201000000980 schizophrenia Diseases 0.000 title abstract description 34
- 101000962322 Homo sapiens Sodium leak channel NALCN Proteins 0.000 claims abstract description 392
- 102100039242 Sodium leak channel NALCN Human genes 0.000 claims abstract description 312
- 229920001184 polypeptide Polymers 0.000 claims abstract description 241
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 241
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 232
- 102000004310 Ion Channels Human genes 0.000 claims abstract description 16
- 239000002157 polynucleotide Substances 0.000 claims description 432
- 102000040430 polynucleotide Human genes 0.000 claims description 431
- 108091033319 polynucleotide Proteins 0.000 claims description 429
- 238000000034 method Methods 0.000 claims description 338
- 239000002773 nucleotide Substances 0.000 claims description 285
- 125000003729 nucleotide group Chemical group 0.000 claims description 281
- 230000000295 complement effect Effects 0.000 claims description 131
- 238000012360 testing method Methods 0.000 claims description 104
- 239000012634 fragment Substances 0.000 claims description 101
- 238000009396 hybridization Methods 0.000 claims description 77
- 230000014509 gene expression Effects 0.000 claims description 69
- 241001465754 Metazoa Species 0.000 claims description 59
- 230000008521 reorganization Effects 0.000 claims description 56
- 230000002068 genetic effect Effects 0.000 claims description 51
- 239000013598 vector Substances 0.000 claims description 49
- 235000018102 proteins Nutrition 0.000 claims description 46
- 239000007787 solid Substances 0.000 claims description 42
- 230000000694 effects Effects 0.000 claims description 38
- 150000001875 compounds Chemical class 0.000 claims description 30
- 238000002744 homologous recombination Methods 0.000 claims description 29
- 230000006801 homologous recombination Effects 0.000 claims description 29
- 241000124008 Mammalia Species 0.000 claims description 18
- 239000003795 chemical substances by application Substances 0.000 claims description 18
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 17
- 238000004519 manufacturing process Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 11
- 230000003750 conditioning effect Effects 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 10
- 230000004071 biological effect Effects 0.000 claims description 7
- 239000008194 pharmaceutical composition Substances 0.000 claims description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 74
- 201000010099 disease Diseases 0.000 abstract description 67
- 238000011282 treatment Methods 0.000 abstract description 27
- 208000020925 Bipolar disease Diseases 0.000 abstract description 23
- 238000003745 diagnosis Methods 0.000 abstract description 16
- 239000002299 complementary DNA Substances 0.000 abstract 1
- 239000000523 sample Substances 0.000 description 180
- 210000004027 cell Anatomy 0.000 description 173
- 150000007523 nucleic acids Chemical class 0.000 description 130
- 108020004414 DNA Proteins 0.000 description 128
- 102000039446 nucleic acids Human genes 0.000 description 119
- 108020004707 nucleic acids Proteins 0.000 description 119
- 102000054766 genetic haplotypes Human genes 0.000 description 99
- 239000003550 marker Substances 0.000 description 88
- 238000011160 research Methods 0.000 description 79
- 238000004458 analytical method Methods 0.000 description 65
- 238000003199 nucleic acid amplification method Methods 0.000 description 65
- 230000003321 amplification Effects 0.000 description 63
- 235000001014 amino acid Nutrition 0.000 description 59
- 229940024606 amino acid Drugs 0.000 description 58
- 150000001413 amino acids Chemical class 0.000 description 58
- 239000002585 base Substances 0.000 description 53
- 230000008859 change Effects 0.000 description 51
- 238000010276 construction Methods 0.000 description 47
- 238000006243 chemical reaction Methods 0.000 description 41
- 238000005516 engineering process Methods 0.000 description 41
- 238000001514 detection method Methods 0.000 description 40
- 230000001105 regulatory effect Effects 0.000 description 40
- 108091034117 Oligonucleotide Proteins 0.000 description 32
- 239000013604 expression vector Substances 0.000 description 29
- 108700028369 Alleles Proteins 0.000 description 28
- 208000024891 symptom Diseases 0.000 description 26
- 230000009261 transgenic effect Effects 0.000 description 24
- 102000004190 Enzymes Human genes 0.000 description 23
- 108090000790 Enzymes Proteins 0.000 description 23
- 238000011144 upstream manufacturing Methods 0.000 description 23
- 241000282414 Homo sapiens Species 0.000 description 22
- 108091028043 Nucleic acid sequence Proteins 0.000 description 21
- 238000013461 design Methods 0.000 description 21
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 20
- 239000003153 chemical reaction reagent Substances 0.000 description 20
- 239000003814 drug Substances 0.000 description 20
- 239000002751 oligonucleotide probe Substances 0.000 description 20
- 238000002360 preparation method Methods 0.000 description 20
- 239000000427 antigen Substances 0.000 description 19
- 108091007433 antigens Proteins 0.000 description 19
- 102000036639 antigens Human genes 0.000 description 19
- 239000000203 mixture Substances 0.000 description 19
- 239000000047 product Substances 0.000 description 19
- 241000699666 Mus <mouse, genus> Species 0.000 description 18
- 238000007834 ligase chain reaction Methods 0.000 description 18
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 17
- 239000012472 biological sample Substances 0.000 description 17
- 238000002474 experimental method Methods 0.000 description 17
- 241000894006 Bacteria Species 0.000 description 16
- 108091026890 Coding region Proteins 0.000 description 16
- 102000054765 polymorphisms of proteins Human genes 0.000 description 16
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 15
- 241000700605 Viruses Species 0.000 description 15
- 108090000312 Calcium Channels Proteins 0.000 description 14
- 102000003922 Calcium Channels Human genes 0.000 description 14
- 238000010367 cloning Methods 0.000 description 14
- 101150036876 cre gene Proteins 0.000 description 14
- 230000008034 disappearance Effects 0.000 description 14
- 108020004999 messenger RNA Proteins 0.000 description 14
- 108020003175 receptors Proteins 0.000 description 14
- 102000005962 receptors Human genes 0.000 description 14
- 238000000926 separation method Methods 0.000 description 14
- 210000001519 tissue Anatomy 0.000 description 14
- 230000027455 binding Effects 0.000 description 13
- 230000000875 corresponding effect Effects 0.000 description 13
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 13
- 238000009826 distribution Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 238000003780 insertion Methods 0.000 description 13
- 230000037431 insertion Effects 0.000 description 13
- 230000006798 recombination Effects 0.000 description 13
- 238000005215 recombination Methods 0.000 description 13
- 238000012216 screening Methods 0.000 description 13
- 239000007790 solid phase Substances 0.000 description 13
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 12
- 230000000692 anti-sense effect Effects 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 12
- 239000000463 material Substances 0.000 description 12
- 239000002853 nucleic acid probe Substances 0.000 description 12
- 238000012163 sequencing technique Methods 0.000 description 12
- 230000004913 activation Effects 0.000 description 11
- 238000001994 activation Methods 0.000 description 11
- 230000008878 coupling Effects 0.000 description 11
- 238000010168 coupling process Methods 0.000 description 11
- 238000005859 coupling reaction Methods 0.000 description 11
- 230000008676 import Effects 0.000 description 11
- 239000012071 phase Substances 0.000 description 11
- 239000000370 acceptor Substances 0.000 description 10
- 208000015114 central nervous system disease Diseases 0.000 description 10
- 238000013467 fragmentation Methods 0.000 description 10
- 238000006062 fragmentation reaction Methods 0.000 description 10
- 238000001727 in vivo Methods 0.000 description 10
- 230000002265 prevention Effects 0.000 description 10
- 239000000758 substrate Substances 0.000 description 10
- 238000001890 transfection Methods 0.000 description 10
- 238000003491 array Methods 0.000 description 9
- 230000000975 bioactive effect Effects 0.000 description 9
- 239000004567 concrete Substances 0.000 description 9
- 238000005520 cutting process Methods 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 8
- 238000012408 PCR amplification Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 8
- 230000033228 biological regulation Effects 0.000 description 8
- 239000000969 carrier Substances 0.000 description 8
- 238000002405 diagnostic procedure Methods 0.000 description 8
- 210000001671 embryonic stem cell Anatomy 0.000 description 8
- 238000002966 oligonucleotide array Methods 0.000 description 8
- 230000008488 polyadenylation Effects 0.000 description 8
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 8
- 241000701161 unidentified adenovirus Species 0.000 description 8
- 101000962067 Gallus gallus Neuroblastoma suppressor of tumorigenicity 1 Proteins 0.000 description 7
- 206010020772 Hypertension Diseases 0.000 description 7
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 7
- 102000003960 Ligases Human genes 0.000 description 7
- 108090000364 Ligases Proteins 0.000 description 7
- 238000007476 Maximum Likelihood Methods 0.000 description 7
- 208000028017 Psychotic disease Diseases 0.000 description 7
- 230000000890 antigenic effect Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 239000011575 calcium Substances 0.000 description 7
- 206010015037 epilepsy Diseases 0.000 description 7
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical group O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 230000000968 intestinal effect Effects 0.000 description 7
- 150000002500 ions Chemical class 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000003259 recombinant expression Methods 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 108700024394 Exon Proteins 0.000 description 6
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 6
- 241000283973 Oryctolagus cuniculus Species 0.000 description 6
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 6
- 102000018120 Recombinases Human genes 0.000 description 6
- 108010091086 Recombinases Proteins 0.000 description 6
- 108700008625 Reporter Genes Proteins 0.000 description 6
- 239000000556 agonist Substances 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 239000005557 antagonist Substances 0.000 description 6
- 210000003169 central nervous system Anatomy 0.000 description 6
- 239000012141 concentrate Substances 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 238000012252 genetic analysis Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000035772 mutation Effects 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 229920000642 polymer Polymers 0.000 description 6
- 238000007619 statistical method Methods 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 230000032258 transport Effects 0.000 description 6
- 206010002383 Angina Pectoris Diseases 0.000 description 5
- 108010087504 Beta-Globulins Proteins 0.000 description 5
- 108091027305 Heteroduplex Proteins 0.000 description 5
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 5
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 238000004587 chromatography analysis Methods 0.000 description 5
- 239000013611 chromosomal DNA Substances 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- -1 compounds compound Chemical class 0.000 description 5
- 238000013016 damping Methods 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 208000035475 disorder Diseases 0.000 description 5
- 239000000975 dye Substances 0.000 description 5
- 239000012530 fluid Substances 0.000 description 5
- 229910052739 hydrogen Inorganic materials 0.000 description 5
- 239000001257 hydrogen Substances 0.000 description 5
- 230000036039 immunity Effects 0.000 description 5
- 230000001788 irregular Effects 0.000 description 5
- 239000003446 ligand Substances 0.000 description 5
- 210000001161 mammalian embryo Anatomy 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 241000701447 unidentified baculovirus Species 0.000 description 5
- NWXMGUDVXFXRIG-WESIUVDSSA-N (4s,4as,5as,6s,12ar)-4-(dimethylamino)-1,6,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4,4a,5,5a-tetrahydrotetracene-2-carboxamide Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(=O)C(C(N)=O)=C(O)[C@@]4(O)C(=O)C3=C(O)C2=C1O NWXMGUDVXFXRIG-WESIUVDSSA-N 0.000 description 4
- QGZKDVFQNNGYKY-UHFFFAOYSA-N Ammonia Chemical compound N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 4
- 102000006734 Beta-Globulins Human genes 0.000 description 4
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 4
- 208000024172 Cardiovascular disease Diseases 0.000 description 4
- 108091006146 Channels Proteins 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 241000702421 Dependoparvovirus Species 0.000 description 4
- 241000206602 Eukaryota Species 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 4
- 108091092878 Microsatellite Proteins 0.000 description 4
- 241001494479 Pecora Species 0.000 description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 4
- 108091036066 Three prime untranslated region Proteins 0.000 description 4
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000005251 capillar electrophoresis Methods 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- VZCCETWTMQHEPK-QNEBEIHSSA-N gamma-linolenic acid Chemical compound CCCCC\C=C/C\C=C/C\C=C/CCCCC(O)=O VZCCETWTMQHEPK-QNEBEIHSSA-N 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 210000004408 hybridoma Anatomy 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000002844 melting Methods 0.000 description 4
- 230000008018 melting Effects 0.000 description 4
- 229930182817 methionine Natural products 0.000 description 4
- 238000000520 microinjection Methods 0.000 description 4
- 230000002969 morbid Effects 0.000 description 4
- 239000002777 nucleoside Substances 0.000 description 4
- 238000002823 phage display Methods 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 239000004033 plastic Substances 0.000 description 4
- 229920003023 plastic Polymers 0.000 description 4
- 208000020016 psychiatric disease Diseases 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 238000010008 shearing Methods 0.000 description 4
- 239000011734 sodium Substances 0.000 description 4
- 229910052708 sodium Inorganic materials 0.000 description 4
- ATHGHQPFGPMSJY-UHFFFAOYSA-N spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 description 4
- 238000000528 statistical test Methods 0.000 description 4
- 210000001541 thymus gland Anatomy 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 239000011782 vitamin Substances 0.000 description 4
- 235000013343 vitamin Nutrition 0.000 description 4
- 229930003231 vitamin Natural products 0.000 description 4
- 229940088594 vitamin Drugs 0.000 description 4
- 150000003722 vitamin derivatives Chemical class 0.000 description 4
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 3
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 3
- 206010003591 Ataxia Diseases 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 238000009007 Diagnostic Kit Methods 0.000 description 3
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 3
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 3
- 208000019695 Migraine disease Diseases 0.000 description 3
- 241000699660 Mus musculus Species 0.000 description 3
- 208000002193 Pain Diseases 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 108010033276 Peptide Fragments Proteins 0.000 description 3
- 102000007079 Peptide Fragments Human genes 0.000 description 3
- 241000714474 Rous sarcoma virus Species 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 3
- 108010052164 Sodium Channels Proteins 0.000 description 3
- 102000018674 Sodium Channels Human genes 0.000 description 3
- FKNQFGJONOIPTF-UHFFFAOYSA-N Sodium cation Chemical compound [Na+] FKNQFGJONOIPTF-UHFFFAOYSA-N 0.000 description 3
- 108010090804 Streptavidin Proteins 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 102000006601 Thymidine Kinase Human genes 0.000 description 3
- 108020004440 Thymidine kinase Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 210000002459 blastocyst Anatomy 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 229910052791 calcium Inorganic materials 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 210000003743 erythrocyte Anatomy 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 229960002989 glutamic acid Drugs 0.000 description 3
- 208000019622 heart disease Diseases 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 229960000310 isoleucine Drugs 0.000 description 3
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 230000013011 mating Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 125000001570 methylene group Chemical group [H]C([H])([*:1])[*:2] 0.000 description 3
- 206010027599 migraine Diseases 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 229910052759 nickel Inorganic materials 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 230000035479 physiological effects, processes and functions Effects 0.000 description 3
- 238000004393 prognosis Methods 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 239000010703 silicon Substances 0.000 description 3
- 229910052710 silicon Inorganic materials 0.000 description 3
- 229910001415 sodium ion Inorganic materials 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000011830 transgenic mouse model Methods 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- 230000004304 visual acuity Effects 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- XNCSCQSQSGDGES-UHFFFAOYSA-N 2-[2-[bis(carboxymethyl)amino]propyl-(carboxymethyl)amino]acetic acid Chemical compound OC(=O)CN(CC(O)=O)C(C)CN(CC(O)=O)CC(O)=O XNCSCQSQSGDGES-UHFFFAOYSA-N 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- 206010008190 Cerebrovascular accident Diseases 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 108020003215 DNA Probes Proteins 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 238000000018 DNA microarray Methods 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 2
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 239000005089 Luciferase Substances 0.000 description 2
- 208000000060 Migraine with aura Diseases 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- 208000019022 Mood disease Diseases 0.000 description 2
- 241000204801 Muraenidae Species 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- 229920002684 Sepharose Polymers 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 241000256251 Spodoptera frugiperda Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 208000006011 Stroke Diseases 0.000 description 2
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 2
- 108010092262 T-Cell Antigen Receptors Proteins 0.000 description 2
- 206010043118 Tardive Dyskinesia Diseases 0.000 description 2
- 241000218636 Thuja Species 0.000 description 2
- 229910052770 Uranium Inorganic materials 0.000 description 2
- DPDMMXDBJGCCQC-UHFFFAOYSA-N [Na].[Cl] Chemical compound [Na].[Cl] DPDMMXDBJGCCQC-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 229910021529 ammonia Inorganic materials 0.000 description 2
- 230000036506 anxiety Effects 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 238000007846 asymmetric PCR Methods 0.000 description 2
- 230000015097 attachment of spindle microtubules to kinetochore Effects 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 102000005936 beta-Galactosidase Human genes 0.000 description 2
- 238000007413 biotinylation Methods 0.000 description 2
- 230000006287 biotinylation Effects 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 239000012876 carrier material Substances 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 230000003915 cell function Effects 0.000 description 2
- 238000012412 chemical coupling Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 230000003930 cognitive ability Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005336 cracking Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 206010013663 drug dependence Diseases 0.000 description 2
- 230000002526 effect on cardiovascular system Effects 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 206010067039 familial hemiplegic migraine Diseases 0.000 description 2
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 238000003317 immunochromatography Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004816 latex Substances 0.000 description 2
- 229920000126 latex Polymers 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 206010025482 malaise Diseases 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 230000000869 mutational effect Effects 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 208000015122 neurodegenerative disease Diseases 0.000 description 2
- 238000003499 nucleic acid array Methods 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 208000022821 personality disease Diseases 0.000 description 2
- 239000002831 pharmacologic agent Substances 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 206010036067 polydipsia Diseases 0.000 description 2
- 208000028280 polygenic inheritance Diseases 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000003518 presynaptic effect Effects 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 238000003127 radioimmunoassay Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000001177 retroviral effect Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000004062 sedimentation Methods 0.000 description 2
- 238000003375 selectivity assay Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 229940063673 spermidine Drugs 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 208000011317 telomere syndrome Diseases 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 229940125725 tranquilizer Drugs 0.000 description 2
- 239000003204 tranquilizing agent Substances 0.000 description 2
- 230000002936 tranquilizing effect Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- 238000010798 ubiquitination Methods 0.000 description 2
- 230000034512 ubiquitination Effects 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- GEYOCULIXLDCMW-UHFFFAOYSA-N 1,2-phenylenediamine Chemical compound NC1=CC=CC=C1N GEYOCULIXLDCMW-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- CZMRCDWAGMRECN-UHFFFAOYSA-N 2-{[3,4-dihydroxy-2,5-bis(hydroxymethyl)oxolan-2-yl]oxy}-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound OCC1OC(CO)(OC2OC(CO)C(O)C(O)C2O)C(O)C1O CZMRCDWAGMRECN-UHFFFAOYSA-N 0.000 description 1
- 238000005084 2D-nuclear magnetic resonance Methods 0.000 description 1
- 108020005065 3' Flanking Region Proteins 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- 206010061623 Adverse drug reaction Diseases 0.000 description 1
- 208000017194 Affective disease Diseases 0.000 description 1
- 206010001497 Agitation Diseases 0.000 description 1
- 244000105975 Antidesma platyphyllum Species 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 101100238293 Arabidopsis thaliana MOR1 gene Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 108700040618 BRCA1 Genes Proteins 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 101100263837 Bovine ephemeral fever virus (strain BB7721) beta gene Proteins 0.000 description 1
- 238000009631 Broth culture Methods 0.000 description 1
- 229940122642 Calcium channel agonist Drugs 0.000 description 1
- 241000282836 Camelus dromedarius Species 0.000 description 1
- 102000034573 Channels Human genes 0.000 description 1
- 241001227713 Chiron Species 0.000 description 1
- 206010008748 Chorea Diseases 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- WDJUZGPOPHTGOT-OAXVISGBSA-N Digitoxin Natural products O([C@H]1[C@@H](C)O[C@@H](O[C@@H]2C[C@@H]3[C@@](C)([C@@H]4[C@H]([C@]5(O)[C@@](C)([C@H](C6=CC(=O)OC6)CC5)CC4)CC3)CC2)C[C@H]1O)[C@H]1O[C@@H](C)[C@H](O[C@H]2O[C@@H](C)[C@@H](O)[C@@H](O)C2)[C@@H](O)C1 WDJUZGPOPHTGOT-OAXVISGBSA-N 0.000 description 1
- 102000016607 Diphtheria Toxin Human genes 0.000 description 1
- 108010053187 Diphtheria Toxin Proteins 0.000 description 1
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 208000027534 Emotional disease Diseases 0.000 description 1
- 241000305071 Enterobacterales Species 0.000 description 1
- 101100316840 Enterobacteria phage P4 Beta gene Proteins 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 1
- 206010071602 Genetic polymorphism Diseases 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 101001132113 Homo sapiens Peroxisomal testis-specific protein 1 Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 101150003028 Hprt1 gene Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 101000829171 Hypocrea virens (strain Gv29-8 / FGSC 10586) Effector TSP1 Proteins 0.000 description 1
- 208000019025 Hypokalemia Diseases 0.000 description 1
- 102000001706 Immunoglobulin Fab Fragments Human genes 0.000 description 1
- 108010054477 Immunoglobulin Fab Fragments Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 206010024264 Lethargy Diseases 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108010036940 Levansucrase Proteins 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 206010026749 Mania Diseases 0.000 description 1
- 206010027336 Menstruation delayed Diseases 0.000 description 1
- 208000036626 Mental retardation Diseases 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 108700005084 Multigene Family Proteins 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 1
- POECHIXSIXBYKI-UHFFFAOYSA-N N-fluorenylacetamide Chemical compound C1C2=CC=CC=C2C2=C1C(NC(=O)C)=CC=C2 POECHIXSIXBYKI-UHFFFAOYSA-N 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 241001057495 Neda Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 241000772415 Neovison vison Species 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 206010033799 Paralysis Diseases 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 102100034529 Peroxisomal testis-specific protein 1 Human genes 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- 101710182846 Polyhedrin Proteins 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102100029796 Protein S100-A10 Human genes 0.000 description 1
- 101710110950 Protein S100-A10 Proteins 0.000 description 1
- 102000009516 Protein Serine-Threonine Kinases Human genes 0.000 description 1
- 108010009341 Protein Serine-Threonine Kinases Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 108020004412 RNA 3' Polyadenylation Signals Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 241000712909 Reticuloendotheliosis virus Species 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000192023 Sarcina Species 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 1
- 101100289792 Squirrel monkey polyomavirus large T gene Proteins 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 101100460161 Streptomyces fradiae neoD gene Proteins 0.000 description 1
- 239000005864 Sulphur Substances 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 108700005078 Synthetic Genes Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 108700007696 Tetrahydrofolate Dehydrogenase Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 241000795442 Uranoscopus chinensis Species 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Chemical compound CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 229930003756 Vitamin B7 Natural products 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- SWPYNTWPIAZGLT-UHFFFAOYSA-N [amino(ethoxy)phosphanyl]oxyethane Chemical compound CCOP(N)OCC SWPYNTWPIAZGLT-UHFFFAOYSA-N 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 239000011149 active material Substances 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical compound [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 208000027697 autoimmune lymphoproliferative syndrome due to CTLA4 haploinsuffiency Diseases 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000012742 biochemical analysis Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 125000006367 bivalent amino carbonyl group Chemical group [H]N([*:1])C([*:2])=O 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 230000031709 bromination Effects 0.000 description 1
- 238000005893 bromination reaction Methods 0.000 description 1
- 210000005252 bulbus oculi Anatomy 0.000 description 1
- 239000000480 calcium channel blocker Substances 0.000 description 1
- 239000000801 calcium channel stimulating agent Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000022534 cell killing Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000013375 chromatographic separation Methods 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000006957 competitive inhibition Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 239000000287 crude extract Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003935 denaturing gradient gel electrophoresis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000012631 diagnostic technique Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- WDJUZGPOPHTGOT-XUDUSOBPSA-N digitoxin Chemical compound C1[C@H](O)[C@H](O)[C@@H](C)O[C@H]1O[C@@H]1[C@@H](C)O[C@@H](O[C@@H]2[C@H](O[C@@H](O[C@@H]3C[C@@H]4[C@]([C@@H]5[C@H]([C@]6(CC[C@@H]([C@@]6(C)CC5)C=5COC(=O)C=5)O)CC4)(C)CC3)C[C@@H]2O)C)C[C@@H]1O WDJUZGPOPHTGOT-XUDUSOBPSA-N 0.000 description 1
- 229960000648 digitoxin Drugs 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 208000022602 disease susceptibility Diseases 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000002001 electrophysiology Methods 0.000 description 1
- 230000007831 electrophysiology Effects 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 125000000816 ethylene group Chemical group [H]C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000028023 exocytosis Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 108700004026 gag Genes Proteins 0.000 description 1
- 101150098622 gag gene Proteins 0.000 description 1
- 101150056310 gem1 gene Proteins 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000012254 genetic linkage analysis Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 210000002980 germ line cell Anatomy 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 235000009424 haa Nutrition 0.000 description 1
- LNEPOXFFQSENCJ-UHFFFAOYSA-N haloperidol Chemical compound C1CC(O)(C=2C=CC(Cl)=CC=2)CCN1CCCC(=O)C1=CC=C(F)C=C1 LNEPOXFFQSENCJ-UHFFFAOYSA-N 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 239000008241 heterogeneous mixture Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000012203 high throughput assay Methods 0.000 description 1
- 102000057593 human F8 Human genes 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000002706 hydrostatic effect Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- YQYJSBFKSSDGFO-FWAVGLHBSA-N hygromycin A Chemical compound O[C@H]1[C@H](O)[C@H](C(=O)C)O[C@@H]1Oc1ccc(\C=C(/C)C(=O)N[C@@H]2[C@@H]([C@H]3OCO[C@H]3[C@@H](O)[C@@H]2O)O)cc1O YQYJSBFKSSDGFO-FWAVGLHBSA-N 0.000 description 1
- 208000020673 hypertrichosis-acromegaloid facial appearance syndrome Diseases 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000005032 impulse control Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000002198 insoluble material Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 210000002415 kinetochore Anatomy 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 125000005647 linker group Chemical group 0.000 description 1
- 125000003473 lipid group Chemical group 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 125000001434 methanylylidene group Chemical group [H]C#[*] 0.000 description 1
- 238000001690 micro-dialysis Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 125000002757 morpholinyl group Chemical group 0.000 description 1
- 210000000472 morula Anatomy 0.000 description 1
- 230000004118 muscle contraction Effects 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 210000001640 nerve ending Anatomy 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 210000000715 neuromuscular junction Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000002858 neurotransmitter agent Substances 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 229910017604 nitric acid Inorganic materials 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 208000027753 pain disease Diseases 0.000 description 1
- 208000013667 paroxysmal dyskinesia Diseases 0.000 description 1
- 230000001314 paroxysmal effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 208000029308 periodic paralysis Diseases 0.000 description 1
- 230000000505 pernicious effect Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003016 phosphoric acids Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 229920000768 polyamine Polymers 0.000 description 1
- 208000030683 polygenic disease Diseases 0.000 description 1
- 230000003234 polygenic effect Effects 0.000 description 1
- 208000024896 potassium deficiency disease Diseases 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 108020001775 protein parts Proteins 0.000 description 1
- 210000000449 purkinje cell Anatomy 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000012205 qualitative assay Methods 0.000 description 1
- 238000012207 quantitative assay Methods 0.000 description 1
- 239000010453 quartz Substances 0.000 description 1
- 150000003254 radicals Chemical class 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000000163 radioactive labelling Methods 0.000 description 1
- 239000002287 radioligand Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 229940047431 recombinate Drugs 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 210000005000 reproductive tract Anatomy 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000452 restraining effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- HJYYPODYNSCCOU-ODRIEIDWSA-N rifamycin SV Chemical compound OC1=C(C(O)=C2C)C3=C(O)C=C1NC(=O)\C(C)=C/C=C/[C@H](C)[C@H](O)[C@@H](C)[C@@H](O)[C@@H](C)[C@H](OC(C)=O)[C@H](C)[C@@H](OC)\C=C\O[C@@]1(C)OC2=C3C1=O HJYYPODYNSCCOU-ODRIEIDWSA-N 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000002416 scanning tunnelling spectroscopy Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012882 sequential analysis Methods 0.000 description 1
- 208000012201 sexual and gender identity disease Diseases 0.000 description 1
- 208000015891 sexual disease Diseases 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 239000003195 sodium channel blocking agent Substances 0.000 description 1
- 229910052938 sodium sulfate Inorganic materials 0.000 description 1
- 235000011152 sodium sulphate Nutrition 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000003153 stable transfection Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 208000011117 substance-related disease Diseases 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 210000001138 tear Anatomy 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000012256 transgenic experiment Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 229940048102 triphosphoric acid Drugs 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000011735 vitamin B7 Substances 0.000 description 1
- 235000011912 vitamin B7 Nutrition 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/18—Antipsychotics, i.e. neuroleptics; Drugs for mania or schizophrenia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Animal Behavior & Ethology (AREA)
- General Chemical & Material Sciences (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Immunology (AREA)
- Toxicology (AREA)
- Wood Science & Technology (AREA)
- Gastroenterology & Hepatology (AREA)
- Cell Biology (AREA)
- Psychiatry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Plant Pathology (AREA)
- Hospice & Palliative Care (AREA)
- Cardiology (AREA)
- Microbiology (AREA)
- Heart & Thoracic Surgery (AREA)
- Physics & Mathematics (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及新型电压门控离子通道蛋白质CanIon的基因组DNA、cDNA和多肽序列。本发明还涉及CanIon基因的双等位标记。所述CanIon基因可用作治疗和诊断精神分裂症、双极情感障碍(bipolar disorder)和其它疾病和症状的生物靶标。
Description
技术领域
本发明涉及电压门控离子通道基因和蛋白质及其在疾病中的作用。本发明涉及编码CanIon多肽的多核苷酸以及位于所述编码区5’-和3’-端的调节区。本发明还涉及CanIon基因编码的多肽。本发明同时提供了筛选CanIon通道调节剂(如拮抗剂)的方法以及使用这种调节剂治疗或预防各种疾病或症状的方法。本发明还涉及专门针对此类多肽故可用作诊断试剂的抗体。本发明进一步包括在基因分析中有用的CanIon基因的双等位基因标记。
背景技术
基础和临床研究人员使得他们能够对健康和患病中的脑及神经系统功能进行越来越深入的研究。关于中枢神经系统(CNS)疾病包括精神病和神经退化疾病有关的神经化学和遗传机理,业已提出了神经生物学及药理学的许多假设。然而,CNS疾病很复杂,病原学知之甚少以及症状重叠,特征显著,故而难以判断。所以,对进一步的治疗方案和药物开发的努力会更加复杂,并集中在多基因病因上,而且需要一些新尝的去验给疾病分类,为患有CNS疾病的病人提供更准确的诊断和预后信息。
CNS疾病包括的范围很广,和相应地范围很广的遗传原因。CNS病的例子包括神经退化性疾病、精神病(psychotic disorders)、情绪失常(mood disorders)、自闭病、药物成瘾和酗酒、癫痫、弱智及其它精神疾病(psychiatric diseases),包括认知能力(cognitive)、焦虑、饮食、冲动控制(impulse-control)及人格障碍(personality disorders)。可采用精神病诊断和统计手册(Diagnosis andStatistical Manual of Mental Disorders)第四版(DSM-IV)的分类给这些疾病作定义。
即使只考虑一个小亚组的CNS疾病,由于对精神分裂症和双极情感障碍缺乏足够的治疗方法和对此病的分子基础缺乏了解,很显然,需要在治疗发明上有新目标及改进的治疗方法。对于精神分裂症和双极情感障碍,所有用于治疗它们的现有已知分子都有副作用,而且只对症状起作用。故目前迫切需要没有伴随副作用、并针对涉及精神分裂症和双极情感障碍病源机制的目标的新分子。所以,有助发现和特征鉴定这些目标的工具是必要的和有用的。
电压门控离子通道
电压门控离子通道是大分子大家族的一部分,这些大分子的作用包括控制t保持跨越细胞膜的电势、分泌和信号转导。这些通道蛋白质参与控制神经元释放神经递质,并在许多细胞功能包括膜兴奋性、肌肉收缩和突触传递的调控中起着重要作用。Na+通道主要的α-亚基和Ca+通道主要的α-1亚基由大约2000个氨基酸组成并包括离子传导通路。生化分析揭示,具有生理学活性的离子通道由几种不同的亚基组成。有两种与Na+通道的α亚基、β-1和β-2亚基共纯化的辅助亚基。对Ca+通道还鉴定了具有调节作用的其它亚基(α-2、β、γ和δ)。α-2和β亚基似乎可增强Ca+通道α-1亚基的功能活性。K+通道的α亚基与β亚基的比例为1∶1,可导致K+通道复合体呈现(α)4(β)4化学计量(Terlau等,Naturwissenschaften 85:437-444(1998))。例如,Williams等Science 257:389-395(1992);Mori等Nature 350:398-402(1991);以及Koch等J.Biol.Chem.265(29)17786-17791(1990)中进一步讨论了钙和钠离子通道的基础结构和例子。Lee等FEBS Lett.445231:236(1999)进一步描述了与CanIon通道具有高度序列同源性水平的大鼠Ca+和Na+离子通道的核酸序列。
α亚基具有所有电压依赖的阳离子通道的序列特征,并利用了同样的结构基序,该基序包括一6-螺旋束的潜在跨膜域。在钠和钙通道中,这一基序在序列中都重复了4次,产生一24螺旋束。其氨基酸序列在物种之间(如人类和果蝇)和不同离子通道之间是高度保守的。
多基因家族中存在几种由分离基因编码的组织特异性药理学和电生理学上怀质不同的钙通道同种型,它们是由骨骼肌中,每个紧密结合的α、β和γ亚基的装配体联合其它4个装配体形成一种五聚体大分子。例如,神经元钙通道α-1亚类是至少7种不同名为α-1A-H基因的产物。免疫细胞化学研究显示了α-1钙通道亚基的不同分布。α-1A和α-1B主要在树突和突触前末稍表达,与α-1B相比,α-1A通常集中在大量的神经末稍中。在大鼠和人类的神经肌肉连接处,α-1A定位在突触前,而α-1B和α-1A都存在于轴突相关的施万细胞中。α-1E主要位于胞体中,某些情况下在近端树突中以及浦肯雅细胞的远端分支中。α-1C和α-1D位于胞体和中央神经元的近端树突中。
业已按照药理和/或电生理学特性将天然的钙通道分类。电压依赖的钙通道可分类为高电压活化(HVA)型,包括L-、N-、P-和Q-型;中间类型(IVA,R-型);和低电压活化(LVA,T-型)型。(Morena等,Annals NY Acad.Sci.102-117(1999)。
主要的亚类(α-1)属于一基因家族,当在异源表达系统中表达时,这一家族的成员可自身形成功能性通道。(Zhang等,Neuropharmacology 32(11):1075-1088(1993),纳入参考文献)。在天然细胞中,α-1亚基以多亚基复合体的形式和辅助亚基一起表达,其中辅助亚基可修饰α-1亚基的功能特性。在许多情况下,辅助亚基的共表达会影响这些通道的生物物理特性。特别是β亚基对α-1亚基有重要的影响;已显示β亚基可改变活化特征、稳态失活、失活动力学和峰电流。
多种形式α-1亚基的存在造成了这些通道的众多分子多样性。例如,已显示钙通道的不同剪接形式是差异性表达的,对丝氨酸-苏氨酸激酶的磷酸化有不同的敏感性(Hell等,Annals N.Y.Acad.Sci.747:282-293(1994))。已证明离子通道基因的突变与许多疾病有关,包括一些中枢神经系统疾病。Bulman等在Hum.Mol.Gen.6(10)1679-1685(1997)综述了造成许多外钠性紊乱(eposodic disorder)的离子通道突变的例子,这些疾病包括周期性瘫痪、外钠性共济失调(eposodicataxia)、偏头痛、长QT间期综合征和阵发性运动障碍(paroxysmal dyskenesia)。表A(引自Morena,同上)中列出了一些Ca+通道突变疾病。
表A
疾病 | 钙通道亚基 | 模型 |
家族性偏瘫性偏头痛(familialhemiplegic migraine) | α-1A | 人 |
2型外钠共济失调 | α-1A | 人 |
6型脊髓小脑性共济失调 | α-1A | 人 |
Tottering and Learner表型 | α-1A | 小鼠 |
朗-伊综合征 | α-1A,α-1B | 人 |
低钾血性周期性瘫痪 | α-1S | 人 |
肌性发育不全 | α-1S | 小鼠 |
Zucker糖尿病性肥胖表型 | α-1C;α-1D | 大鼠 |
昏睡性表型 | β-4 | 小鼠 |
恶性体温过低 | α-2/δ | 人 |
Stargazer | γ | 小鼠 |
通常联用钙和钠通道调节剂治疗各种疾病和症状。例如,已证明钙和/或钠通道阻断剂可有效用于治疗或预防一种或多种与许多疾病或病症有关的症状,这些疾病或病症有各种心脏疾病和病症(如心绞痛和心律失常)、高血压、偏头痛、中风的神经影响、躁狂症、安定药诱导的迟发性运动障碍、双相极感障碍、疼痛、癫痫等。
已知不同离子通道之间神经系统存在显著功能差异。此外,功能差异还存在于同一离子通道基因的不同突变体以及同一离子通道的剪接变体之间。因此,尽管CNS疾病中牵涉到离子通道,但很难预测哪个离子通道是治疗性干涉特定疾病的有效靶标。已提出的一个问题牵涉到精神分裂症、双极情感障碍或有关疾病的离子通道基因。
本发明报告了这些需要以及其它需要。
发明概述
本发明涉及核酸分子,其包含编码称为CanIon的电压门控离子通道蛋白质的新型人基因的基因组序列。CanIon基因组序列还包括位于所述基因转录的蛋白质的上游(5’端)和下游(3’端)的调节序列,这些调节序列也是本发明的一部分内容。
本发明还提供编码CanIon蛋白质的完整cDNA序列以及相应的翻译产物。
与CanIon基因组或cDNA序列特异性杂交的寡核苷酸探针或引物、用所述引物和探针进行DNA扩增和检测方法也是本发明的一部分内容。
本发明的另一个目的包括含有上述任何核酸序列的重组载体,特别是含有CanIon调节序列或编码CanIon蛋白质的序列的重组载体,以及含有所述核酸序列或重组载体的细胞宿主和转基因非人动物。
本发明还涉及CanIon基因的双等位基因标记及其应用。
最后,本发明涉及可调节CanIon表达或活性的物质或分子的筛选方法,以及与CanIon多肽反应的物质或分子的筛选方法。同时提供了在这些方法中用于鉴定物质的方法。例如,提供了用CanIon通道拮抗剂治疗或预防精神分裂症或双极精神妨碍(bipolar)疾病或病症的方法。
因此,在一个方面,本发明提供了一种分离、纯化或重组的多核苷酸,它包含如SEQ ID NO:1-4或6所示的任何核苷酸序列,或任何这些序列的互补序列。
另一方面,本发明提供了一种分离、纯化或重组的多核苷酸,它包含SEQ ID NO4中至少50个核苷的毗邻链,其中所述多核苷酸编码具有生物学活性的CanIon多肽。
另一方面,本发明提供了一种分离、纯化或重组的多核苷酸,它编码的人CanIon多肽包含SEQ ID NO:5的氨基酸序列或其生物学活性片段。
在一个实施方案中,本文所描述的多核苷酸都附着在一固体支持物上。在另一实施方案中,所述多核苷酸包含一标记。
在另一方面,本发明提供了一种多核苷酸阵列,它包含至少一种本文所述的多核苷酸。在一个实施方案中,所述阵列是可寻址的。
在另一方面,本发明提供了一种重组载体,它包含与启动子可操作性连接的本文所述的多核苷酸。
在另一方面,本发明提供了一种多核苷酸,所述多核苷酸在细胞中的存在会造成CanIon基因表达水平的变化。在一个实施方案中,所述多核苷酸插入CanIon基因中,或插入CanIon基因组区域中。在一个实施方案中,所述多核苷酸插入CanIon基因启动子中。在一个实施方案中,所述多核苷酸是通过同源重组插入的,例如通过置换内源CanIon启动子或增强子区域的一个或多个元件而插入。
在另一方面,本发明提供了包含本文所述重组载体或多核苷酸的宿主细胞或非人的宿主动物。
在另一方面,本发明提供了一种哺乳动物宿主细胞或非人宿主哺乳动物,它包含敲除载体的同源重组而受到破坏的CanIon基因。在一个实施方案中,此宿主细胞含有本文所述的多核苷酸。
在另一方面,本发明提供了一种分离、纯化或重组的多肽,它包含如SEQ ID NO:5所示的氨基酸序列,或其生物学活性片段。
在另一方面,本发明提供了制造多肽的方法,所述方法包括a)提供含有编码如权利要求13所述多肽的多核苷酸的细胞群,所述多核苷酸与启动子可操作连接;b)在所述细胞中可制造所述多肽的条件下培养所述细胞群;以及c)体化所述细胞群产生的所述多肽。
在另一方面,本发明提供了使抗CanIon的抗体与CanIon多肽结合的方法,所述方法包括,在所述抗体可与所述多肽特异性结合的条件下使所述抗体与本文所描述的CanIon多肽接触。在另一方面,还提供了特异性识别CanIon蛋白质或表位的抗体或其免疫学活性片段。
在另一方面,本发明提供了检测细胞中CanIon基因的表达的方法,所述方法包括以下步骤:a)使所述细胞或所述细胞的提取物与以下之一物质接触:i)能在严格条件下与本文所述CanIon多核苷酸杂交的多核苷酸;或ii)能特异性结合本文所述CanIon多肽的多肽;以及b)检测所述多核苷酸与所述细胞或提取物的RNA之间杂交存在与否,或者检测所述多肽与所述细胞或提取物的蛋白质的结合存在与否;其中,检测到所述杂交或所述结合的存在,表明所述CanIon基因在所述细胞中被表达。在一个实施方案中,所述多核苷酸是引物,所述杂交是通过检测包含所述引物的序列扩增产物的存在而测得的。在另一个实施方案中所述多肽是抗体,例如,抗CanIon抗体。
在另一方面,本发明提供了鉴定候选CanIon多肽调节剂的方法,所述方法包括:a)使本文所述CanIon多肽与测试化合物接触;以及b)确定所述化合物是否与所述多肽是否特异性结合;其中,测到所述化合物与所述多肽特异性结合表明所述化合物是所述CanIon多肽的候选调节剂。
在一个实施方案中,此方法还包括在所述候选调节剂存在时测定所述CanIon多肽的生物学活性的变化,其中,当所述候选调节剂存在时与所述候选调节剂不存在时所述CanIon多肽生物学活性的变化说明此候选调节剂是所述CanIon多肽的调节剂。
在另一方面,本发明提供了鉴定CanIon多肽调节剂的方法,所述方法包括:a)使本文所述的CanIon多肽与测试化合物接触;和b)在所述化合物存在和不存在时检测所述多肽的活性;其中,当所述化合物存在时与所述化合物不存在时所检测到的所述活性的差异表明所述化合物是所述CanIon多肽的调节剂。
在本方法的一个实施方案中,所述多肽存在于细胞或细胞膜中,所述生物学活性包括电压门控通道活性。
在另一方面,本发明提供了一种制备药物组合物的方法,所述方法包括:a)用本文所描述的方法鉴定CanIon多肽的调节剂;以及b)将所述调节剂与生理学可接受的载体组合。还提供了使用所述药物组合物的方法。
还提供了这里所描述的CanIon调节剂、多肽、多核苷酸或抗体在药物制备中的应用,例如,治疗人体或治疗本文所述的疾病或症状。
还提供了在体外或体内使用和检测CanIon多核苷酸和多肽存在的试剂盒。
附图简述
图1是含有CanIon基因的染色体13q区域的BAC图谱。
图2是示范性计算机系统的框图。
图3是一个实施方案的流程图,步骤200将新的核苷或蛋白质序列与序列数据库进行比较,以确定新序列和数据库中序列的同源性水平。
图4是一个实施方案的流程图,计算机中的步骤250用来确定两个序列是否是同源的。
图5是一个实施方案的流程图,步骤300用来检测序列中某一特征的存在情况。
简要说明序列表中提供的序列
SEQ ID No 1含有CanIon的基因组序列,包含5’调节区(上游非转录区)和外显子1-7。
SEQ ID No 2含有CanIon的基因组序列,包含外显子8-27。
SEQ ID No 3含有CanIon的基因组序列,包含外显子28-44和3’调节区(下游非转录区)。
SEQ ID No 4含有CanIon的cDNA序列。
SEQ ID No 5含有由SEQ ID NO 4的cDNA编码的氨基酸序列。
SEQ ID No 6含有扩增子的核苷酸序列,包含双等位基因标记A18。
SEQ ID NO 7含有一个引物,它包含实施例2所述的附加PU 5’序列。
SEQ ID NO 8含有一个引物,它包含实施例2所述的附加RP 5’序列。
根据序列表的规则,以下代码被用于序列表以指明序列中双等位基因标记的位置并鉴定在多态性碱基中存在的各个等位基因。代码“r”在序列中表示多态性碱基的一个等位基因是鸟嘌呤,而另一个等位基因是腺嘌呤。代码“y”在序列中表示多态性碱基的一个等位基因是胸腺嘧啶,而另一个等位基因是胞嘧啶。代码“m”在序列中表示多态性碱基的一个等位基因是腺嘌呤,而另一个等位基因是胞嘧啶。代码“k”在序列中表示多态性碱基的一个等位基因是鸟嘌呤,而另一个等位基因是胸腺嘧啶。代码“s”在序列中表示多态性碱基的一个等位基因是鸟嘌呤,而另一个等位基因是胞嘧啶。代码“w”在序列中表示多态性碱基的一个等位基因是腺嘌呤,而另一个等位基因是胸腺嘧啶。各个双等位标记初始等位基因的核苷代码如下:
双等位标记 初始等位基因
5-124-273 A(例如)
某些情况下,双等位基因标记的多态性碱基会改变编码多肽中氨基酸的相同性。这在附加的序列表中用特征VARIANT表示,在多态性氨基酸位点用Xaa代替,并将Xaa定义为两个可互换的氨基酸。例如,如果双等基因位标记的一个等位基因是密码子CAC,它编码组氨酸,而此双等位基因标记的另一个等位基因是CAA,它编码谷氨酸,则编码多态的序列表将在此多态性氨基酸位置含Xaa。这时,Xaa被定义为组氨酸或谷氨酸。
在其它情况下,Xaa可表示由于核苷酸序列的双关性而多份不知道的氨基酸。这时用特征UNSURE表示,在未知的氨基酸位点用Xaa代替,并将Xaa定义为20种氨基酸或遗传密码暗示的有限数目的氨基酸中的任何一种。
详细描述
综合家族成员的精神分裂症和双极情感障碍、从双胞胎和收养研究所得的证据以及全球发病没有差异这些现象,都表明虽然环境危险因子在一定程度上是必要、充分或互相作用的原因,但精神分裂症和双极情感障碍主要还是遗传状况。例如,普通人群1%会发生精神分裂症,但若一个人的祖父母有精神分裂症,则他患此病的危险增大至约3%;若父母一方有精神分裂症,则他患病的危险增大至约10%;若父母双方都有精神分裂症,则他患病的危险增大至约40%。
鉴定涉及特定中枢神经系统疾病如精神分裂症等特定性状(trait)的基因,可通过目前用于基因作图的两种主要策略进行,它们是:连锁分析(linkage analysis)和相关性研究(association studies)。连锁分析需要研究其成员有多人患病的家族,这种研究现在用于检测单基因基因或寡基因固有性状。与之相反,相关性研究检查与性状阴性(T-)对照相比,无亲戚关系的性状(T+)个体的标记等位基因的频率,这种研究通常用于检测多基因遗传。
遗传连接或“连锁”根据对染色体上两个相邻序列在减数分裂过程中通过交换含有最少重组的一个序列的分析。要进行这种分析,已将诸如微卫星标记等染色体标记精确定位于基因组上。遗传连锁分析根据系统树、疾病的传递和标记的传递计算带有所用染色体标记的靶基因重组的概率。因此,如果某给定标记的特定等位基因与疾病一起传递的频率比带有该等位基因(重组水平在0和0.5之间)的机会要多,就可以推断在该标记附近可找到此靶基因。用这种技术可以确定一些表示家族性癌症遗传倾向性基因的位置。为了能包括在遗传连锁研究中,受该疾病遗传影响的家族成员必须符合“信息性”标准:每一代有数个成员患病(可获得其结构DNA),而且该家族最好有众多兄弟姐妹。
以前的连锁研究结果支持染色体13可能在13q32上隐藏有一个精神分裂症易感性基因座的假设(Blouin JL等,1998,Nature Genetics,20:70-73;Lin MW等,Hum.Genet.,99(3):417-420,1997;Brzustowicz等,Am.J.Hum.Genet.65:1096-1103(1999))。然而,尽管连锁分析是检测性状有关基因的有力方法,但其分辨率通常不可能超过兆碱基水平,通常需要进行互补研究以细化对最初用这种方法鉴定的区域的分析。
采用位于染色体13q31-q33区的27个公共序列标记位点(STSs)构建了覆盖染色体13q31-q33基因座的候选基因组区的细菌人工染色体(BAC)重叠群(contig),以便筛选一个7种基因组相当的专有BAC文库。从这些材料产生了新的STS,使得能构建该区的密集型物理图谱。通过原位染色体杂交确定BACs的大小并绘图,以供验证。最小的一组BACs已被鉴定并全部测序,产生几种重叠群导致一个4Mb以上的重叠群的最终构建物。此图谱的构建导致对CanIon基因的鉴定,定位于与精神分裂症明显连锁的基因组区域中。
CanIon氨基酸序列的特征是CACHANNEL,一种有7个元件的指纹,它为钙通道的α-1亚基提供了信号(Ref.PR00167,BLOCKs+数据库)。该指纹衍生自6个序列的最初排列对比:这些基序出自能够区别这些通道和其它阳离子通道的保守环区;基序1和2编码跨膜区段4和5以及5和6之间的部分(第一次内部重复);基序3相应于重复1的区段6和重复2的区段1之间的部分;基序4编码重复2的区段5和6之间的部分;基序5相应于重复3的区段6和重复4的区段1之间的部分;基序6和7编码区段4和5之间以及重复4区段的5和6之间的部分。
图1显示了覆盖所关注的包含CanIon基因的染色体13区域的BAC重叠群,并显示了与连锁研究中最为重要的遗传标记有关的CanIon基因在基因组上的位置。特别地,Blouin等(1998)用452微卫星标记物在54个复杂系谱上对精神分裂症的易感性基因座进行了基因组的广泛扫描。发现家族精神分裂症之间最显著的连锁在染色体13q32上标记D13S174附近。Brzustowics等(1999)估计在21个加拿大家族中微卫星标记物跨越染色体8和13。在每个分析模型中产生正的LOD记分的染色体13q区域中的标记物,采用了:常染色体显性和隐性以及狭义和广义的精神分裂症定义。在隐性-广义模型下,用标记物D13S793得到了最大的三点LOD记分:在重组部分(θ)为3.92,同质性下为0.1,和异质性下当α=0.65且θ=0时为4.42。参考图1,CanIon基因部分位于标记为‘区域E’的重叠群上,部分位于标记为C0001A10的重叠群上。CanIon基因侧接有两个在连锁研究中意义最为重要的标记。标记D13S174也位于重叠群C0001A10上,而标记D13S793大致位于距CanIon基因3.5Mb的着丝粒上。
目前迫切需要鉴定涉及精神分裂症、双极情感障碍以及其它CNS和心血管疾病和症状的基因。同时也需要鉴定涉及这些疾病的新离子通道。这些基因和蛋白质在治疗精神分裂症、双极情感障碍、或其它CNS症状以及其它诸如心脏病和高血压等症状中可能提供新的干预点,而且可以进一步研究和特征分析CanIon基因和其相关生物途径。认识这些基因和涉及这些疾病和症状的有关生物途径使研究人员能了解精神分裂症和双极情感障碍的病原,从而研究出针对这些病因的药物和治疗方案。例如,阻断CanIon通道的化合物可用于治疗任何疾病或症状,优选精神分裂症或双极情感障碍,以及疼痛病、癫痫和各种心血管疾病,如心律失常、心绞痛和高血压。也急切需要检测对精神分裂症、双极情感障碍和其它症状易感性以及预防或随访这些疾病演化的新方法。诊断工具可能也证明极其有用。的确,例如,早鉴定出有产生精神分裂症危险的人,就可以早期和/或预防性给药。而且,准确评估药物的效能以及病人对药物的耐受性可使临床医生提高精神分裂症和双极情感障碍治疗方案的效益/风险比。
本发明涉及与CanIon基因有关的多核苷酸和多肽。与CanIon的基因组或cDNA序列特异性杂交的寡核苷酸探针和引物也是本发明的一部分。本发明的另一个目的包括含有任何本发明所述核酸序列的重组载体,尤其是含有CanIon调节区或编码CanIon蛋白的序列的重组载体,以及含有所述核酸序列或重组载体的细胞宿主。本发明还包括能够调节CanIon基因或蛋白质表达或活性的分子的筛选方法,以及使用这些分子治疗或预防精神分裂症、双极感情障碍、或任何其它疾病或症状的方法。本发明还涉及特异性抗这种多肽的抗体,可用作诊断试剂。
本发明还涉及CanIon相关的双等位基因标记以及它们在遗传分析分析中的应用,这些方法包括家族连锁分析、人群连锁失平衡研究以及病例一对照人群的相关性研究。本发明一个重要的方面是,双等位基因标记使得能进行相关性研究以鉴定与复杂性状有关的基因的作用。
定义
在详细叙述本发明之前,下面给出一些定义说明和限定了阐述本发明所用的术语的含义和范围。
本文所用的术语“
CanIon基因”包括编码CanIon蛋白质的基因组、mRNA和cRNA序列,包括基因组DNA的非翻译调节区。
本文所用的术语“
异源蛋白质”意指除CanIon蛋白质以外的任何蛋白质或多肽。例如,异源蛋白质可以是用CanIon调节区进行的另外一些实验中作为标记的一种化合物。
术语“
分离的”要求物质与其来源环境(例如,若物质是天然存在的,即为其天然环境)分开。例如,天然存在于活动物中的多核苷酸或多肽不是分离的,但自天然系统中部分或全部共存物质分离出来的同一些多核苷酸或DNA或多肽是分离的。这些多核苷酸可以是载体的一部分和/或这些多核苷酸或多肽可以是组合物的一部分,由于载体或组合物不属于天然环境的一部分,故这些多核苷酸仍然是分离的。
例如,天然存在于有活动物中的多核苷酸不是分离的,但自天然系统中部分或全部共存物质分离出来的同一些多核苷酸或多肽是分离的。特别排除在定义“分离的”之外的是天然存在的染色体(如染色体扩散)、人工染色体文库、基因组文库及作为体外核酸制品或作为转染/转化宿主细胞制品存在的cDNA文库,其中宿主细胞是体外异质制品或作为单个克隆的异质群体而被接种。特别还将上述文库中其特定多核苷酸占载体分子中核酸插入片段数小于5%的文库排除在外。定义“分离的”还尤其不包括全细胞基因组DNA或全细胞RNA制品(包括用机械剪切或酶消化的所述全细胞制品)。“分离的”还特别不包括以上所述作为体外制品或通过电泳(包括印迹转移)分离的异质性混合物的全细胞制品,其中本发明的多核苷酸没有与电泳媒体中的异源多核苷酸作进一步分离(例如,从琼脂糖凝胶或尼龙印迹的异质性条带群切理一条条带作进一步分离)。
本文所用的术语“
纯化的”不要求绝对纯;它只作为一个相对定义。初始材料或天然材料的纯化至少是一个数量级,优选使用两或三个数量级,最好是四或五个数量级。例如,从0.1%浓度到纯度至10%浓度是两个数量级。为了便于说明,已经将与cDNA文库分离的个体cDNA克隆用常规方法纯化至电泳均一性。由这些克隆所得的序列不能直接从文库或整个人的DNA制得。这些cDNA克隆不是天然存在的,而是通过局部纯化天然存在的物质(信使RNA)而制得。mRNA转化为cDNA文库涉及产生合成物质(cDNA),而纯的个体cDNA克隆可通过克隆选择从该合成文库分离得到。所以,从信使RNA产生cDNA文库以及然后从该文库分离个体克隆导致天然信使纯化大约104-106倍。
本文所用的术语“纯化的”还描述与其它化合物分离的本发明的多肽或多核苷酸,包括但不限于:多肽或多核苷酸、碳水化合物、脂质等。术语“纯化的”可用于指定与寡聚形式,如同质或异质二聚体、三聚体等分离的本发明的单聚多肽。术语“纯化的”也可用于指定与线性多核苷酸分离的共价连接的多核苷酸。当一个多核苷酸样品的至少大约50%,最好60-75%具有单一多核苷酸序列和构象(线性对共价封闭)时,该多核苷酸基本上是纯的。基本纯的多肽或多核苷酸通常分别约占多肽或多核苷酸样品的50%,最好为60-90%(重量/重量),更常见的是纯度约为95%,最好是99%以上。众所周知,多肽或多核苷酸纯度或均一度有许多方式测定,如先对样品进行琼脂糖或聚丙烯酰胺凝胶电泳,然后观察到凝胶染色后为单一条带。对于某些目的,采用高效液相层析法或本技术领域熟知的其它方法可获得高分辨率。作为另一个实施例,本发明的多肽或多核苷酸的纯度“至少”可表示为相对异质性多肽和多核苷酸(DNA、RNA或二者)的一种纯度百分比。作为一个优选实施例,本发明的多肽或多核苷酸分别相对异质性多肽或多核苷酸的纯度至少为10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、98%、99%、100%。作为另一个优选实施例,此多肽或多核苷酸的纯度分别相对异质性多肽或多核苷酸为90%和100%之间小数位至第千位的任何一个数字的范围内变化(例如,多肽或多核苷酸的纯度至少99.995%),或表示为相对于除运载体中的化合物和分子以外的全部化合物和分子的重量/重量比。本发明权利要求以每个小数位至第千位表示一个纯度百分比的数字表示的各种纯度。
术语“
多肽”指氨基酸的聚合物,不论其长度如何;所以,肽、寡肽和蛋白质都包括在多肽的定义中。该术语也不限于或不排除多肽的表达后修饰,例如,与糖基、乙酰基、磷酸基、脂类基团等共价连接的多肽明确包括在术语多肽中。在该定义内还包括含有一个或多个氨基酸类似物(例如,包括非天然存在的氨基酸、只在不相关生物系统中存在的氨基酸、来自哺乳动物系统经修饰的氨基酸等)的多肽、带有取代键以及本领域知道的其它修饰的多肽,无论是天然存在或非天然存在。
本文所用的术语“
重组多肽”指人为设计和包括至少两个多肽序列的多肽,这两个多肽序列作为相邻多肽序列在初始天然环境中是找不到的,或者指由重组多核苷酸表达的多肽。
本文所用的术语“
非人动物”指任何不是人的脊椎动物、鸟类,和更通常指哺乳动物,最好是灵长目动物、家禽,如猪、山羊、绵羊、驴和马、家兔或者啮齿目动物,最好是大鼠或小鼠。本文所用的术语“动物”用于指任何脊椎动物,最好是哺乳动物。术语“动物”和“哺乳动物”明确包括人,除非前面带有术语“非人动物”。
本文所用的术语“
抗体”指由至少一个结合区(binding domain)组成的多肽或多肽群,其中抗体结合区通过抗体分子的可变区折叠而形成,与内表面的形状和电荷分布形成三维结合空间,该空间与抗原的抗原决定簇的特征互补,可以与抗原进行免疫反应。抗体包括重组蛋白质,其包括结合区,以及片段,而片段包括Fab、Fab’、F(ab)2和F(ab’)2片段。
本文所用的“
抗原决定簇”是决定抗原—抗体反应特异性的抗原分子的一部分,在本发明指CanIon多肽。“表位”指多肽的抗原决定簇。一个表位在空间构象中可包括至少3个氨基酸,此空间构象对该表位是唯一的。通常,一个表位包括至少6个氨基酸,较常见包括至少8-10个氨基酸。确定组成表位的氨基酸的方法包括X射线结晶图;、二维核磁共振及表位作图法,例如Geysen等(1984年)、PCT公开号WO 84/03564及PCT公开号WO 84/03506所述的肽扫描法。
本说明书所用的术语“
核苷酸序型”一般用于无差别地指多核苷酸或核酸。更准确地说,术语“核苷酸序列”包括核材料本身,故不限在生物化学特指的特异性DNA或RNA分子的序列信息(即在四个碱基字母中所选择的字母顺序)。
术语“
核酸”、“
寡核苷酸”及“
多核苷酸”在本文可互换使用,包括RNA、DNA或RNA/DNA杂交序列,具有一个以上核苷酸单链或双链体形式。本文所用的术语“核苷酸”是形容词,描述包括任何长度单链或双链体形式的RNA、DNA或RNA/DNA杂交序列的分子。术语“核苷酸”在本文也用作名词,指单一核苷酸或多种核苷酸,意味着一个分子、或较大核酸分子中的一个单元,就寡核苷酸或多核苷酸内的核酸而言,其包括嘌呤或嘧啶、核糖或脱氧核糖分子、以及磷酸基团、或磷酸二酯键。虽然术语“核苷酸”本文也用于包括“修饰后的核苷酸”,其包括至少以下一种修饰:(a)另一连接基团,(b)嘌呤的类似型,(c)嘧啶的类似型,或(d)糖的类似型,类似连接基、嘌呤、嘧啶及糖的例子可参看PCT公开号WO 95/04064。本发明的多核苷酸序列可用任何已知方法制备,包括合成、重组、活体内产生、或其组合、以及用本技术领域已知的任何一种纯化方法。
“
可操作性连接”在调节序列如启动子指,所述调节元件相对于核酸处于正确位置和方向,以调控RNA聚合酶的启动和所述核酸的表达。本文所用的术语“可操作性连接”指多核苷酸元件以功能性关系相连接。例如,如果启动子或增强子影响编码序列的转录,它们就是操作性连接于一编码序列上。
术语“
性状”和“
表型”在本文可互换使用,指生机体任何看得见的、检测得到的或可测量的性质,如疾病征状或疾病的易感性。本文所用的术语“性状”或“表型”通常指疾病征状或疾病易感性、与治疗相关的有益应答或副作用。所述性状最好是,但不限于,精神分裂症或双极感情障碍之类的精神病、其它CNS或如癫痫或疼痛病等神经元疾病,以及心绞痛、高血压和心律失常等心血管疾病,以及任何这些疾病或症状的任何方面、特征或特性。
本文所用的术语“
等位基因(allele)”指一核苷酸序列的变体。双等位基因多态性有两种型式。二倍体生物体的等位基因型可以是纯合或杂合的。
本文所用的术语“
杂合性比例”是指人群中在某特定等位基因上为杂合的个体的发生率。在双等位基因系统中,杂合性比例平均等于2Pa(1-Pa),其中,Pa是最少见的等位基因的频率。为了用于遗传研究,遗传标记应有合适的杂合性水平以使得随机选择的个体有合理的杂合概率。
本文所用的术语“
基因型”指存在于个体或样品中的等位基因的相同性。在本发明的上下文中,基因型宜指存在于个体或样品中的双等位标记的等位基因的描述。术语使样品或个体的双等位基因标记作“基因型分型”包括在双等位基因标记上确定个体携带的特异性等位基因或特异性核苷酸。
本文所用的术语“
突变”指频率低于1%的不同基因组或个体之间的DNA序列差异。
本文所用的术语“
单倍型”指个体或样品中存在的等位基因的组合。在本发明的上下文中,单倍型优先是指在一给定个体中发现的并可与某一表型相关联的双等位标记的等位基因的组合。
本文所用的术语“
多态性”指不同基因组或个体之间发生的两种或多种变替基因组序列或等位基因。“多态的”指在一人群中可找到其特异性基因组序列的两种或多种变体的条件。“多态性位点”是变异发生的基因座。单一核苷酸多态性是在多态性位点上用另一个核苷酸取代一个核苷酸。删除一个核苷酸或插入一个核苷酸也会产生单一核苷酸多态性。在本发明的上下文中,“单一核苷酸多态性”宜指单一核苷酸取代。通常,在不同个体之间,多态性位点可以被两个不同核苷酸所占据。
术语“
双等位基因多态性”和“
双等位基因标记”在本文可互换使用,指人群中具有相当高频率的两个等位基因的单一核苷酸多态性。“双等位标记的等位基因”指存在于双等位标记位点上的核苷酸变体。通常,本发明双等位标记的较少见的等位基因的频率经验证大于1%,优选此频率大于10%,更优选此频至少20%(即杂合性比例至少为0.327,甚至更优选,此频率至少为30%(即杂合性比例至少为0.42)。较少见的等位基因频率为30%或更高的双等位标记被称为“高质量的双等位标记”。
就多核苷酸的中心而言,在这里用以下方式描述核苷酸在多核苷酸中的位置。当某多核苷酸有奇数个核苷酸时,与此多核苷酸的3’和5’端等距的核苷酸被认为是此多核苷酸的“中心”,且与此核苷酸直接毗邻的任何核苷酸也被认为在中心,或者,位于中心的核苷酸本身被认为是“在位于中心的1个核苷酸之内”。对于某多核苷酸中奇数个核苷酸,位于此多核苷酸中央的任何五个核苷酸被认为是在位于中心的2个核苷酸之内,依此类推。当某多核苷酸有偶数个核苷酸时,所述多核苷酸中央是一个键而不是核苷酸。因此,中央的两个核苷酸中任何一个都被认为“在位于中心的1个核苷酸之内”,同时,多核苷酸中央的任何4个核苷酸被认为“在位于中心的2个核苷酸之内”,依此类推。对于包含一个或多个核苷酸取代、插入或缺失的多态性,如果距此多态性的取代、插入或缺失的多核苷酸与此多核苷酸3’端的距离,和此多态性的取代、插入或缺失的多核苷酸与此多肽5’端的距离之间的差异,为0或1个核苷酸,则所述多态性、等位基因或双等位标记在此多核苷酸“中心”。如果差异为0-3,则此多态性被认为“在位于中心的1个核苷酸之内”。如果差异为0-5,则此多态性被认为“在位于中心的2个核苷酸之内”。如果所述差异为0-7,则此多态性被认为“在位于中心的3个核苷酸之内”,依此类推。
本文所用的术语“
上游”指从特定参考点朝向多核苷酸5’端的位置,或者,对基因而言,从编码区到启动子方向的位置。
本文所用的术语“
碱基配对”和“Watson & Crick碱基配对”在本文可互换使用,指由于序列相同性通过氢键相互结合的核苷酸,例如在双螺旋DNA中可以发现胸腺嘌呤或尿嘧啶残基通过两个氢键与腺嘌呤残基连接,而胞嘧啶残基通过三个氢键与鸟嘌呤残基连接(参看Stryer,L.,Biochemistry,第4版,1995年)。
本文所用的术语“
互补”或“其互补物”指能够在整个互补区与另一种特定多核苷酸形成Watson & Crick碱基配对的多核苷酸序列。对本发明来说,当第一个多核苷酸的每个碱基与第二个多核苷酸的互补碱基配对时,就认为第一个多核苷酸与第二个多核苷酸互补。互补碱基通常是A和T(或A和U),或C和G。“互补物”在本文是“互补性多核苷酸”、“互补性核酸”和“互补性核苷酸序列”的同义词。这些术语适用于多核苷酸对,但只基于其序列而非基于两个多核苷酸实际结合的任何一组特定条件。
变体和片段
1-多核苷酸
本发明也涉及本文所述的多核苷酸变体和片段,特别是含有一个或多个本发明双等位标记的CanIon基因。
本文所用的术语多核苷酸变体是不同于参照多核苷酸的多核苷酸。多核苷酸变体可以是天然存在的变体,如天然存在的等位基因变体,或者它可以是天然存在的未知变体。这些非天然存在的多核苷酸变体可通过诱变技术制备,包括应用于多核苷酸、细胞或生物体的技术。通常差异是有限的,这样参照品和变体的核苷酸序列大致相似,许多区是相同的。
本发明的多核苷酸变体包括,但不限于,与选自核苷酸序列SEQ ID No 1-4的多核苷酸或者与具有选自核苷酸序列SEQ ID No 1-4的多核苷酸中至少12个连续核苷酸的多核苷酸片段的相同性至少是95%的核苷酸序列,与选自核苷酸序列SEQ ID No1-4的多核苷酸或者与选自核苷酸序列SEQ ID No 1-4的多核苷酸中至少12个连续核苷酸的多核苷酸片段的相同性优选至少是99%,相同性更优选至少是99.5%,相同性最优选至少是99.8%。
变体多核苷酸中的核苷酸变化可以是沉默变化,这意味着它们不会改变该多核苷酸编码的氨基酸。然而,核苷酸变化也可以导致由参照序列编码的多肽的氨基酸取代、加入、缺失、融合和截短。这些取代、缺失或加入可能涉及一个或多个核苷酸。可在编码或非编码区或二者内改变这些变体。编码区的变化可产生保守性或非保守性氨基酸取代、缺失或插入。
在本发明的上下文中,特别优选实施例是那些多核苷酸编码基本上保留与成熟CanIon蛋白质相同的生物功能或活性的多肽的实施例,或者是那些多核苷酸编码保持或增加一种特定生物活性,同时降低另一种生物活性的多肽的实施例。
多核苷酸片段是其序列与给定的核苷酸序列,最好是CanIon基因及其变化的核苷酸序列的一部分而非全部完全相同的多核苷酸。这种片段可以是CanIon基因内含子或外显子的一部分。它也可以是CanIon调节区的一部分。优选地,这种片段包括双等位标记A1-A17中至少一个或其互补物,或是与双等位标记A1-A17中一个或多个连锁失平衡的双等位标记。
这些片段可以“独立的(free-standing)”,即不属于其它多核苷酸,也不与其它多核苷酸融合,或它们可包含在一个较大多核苷酸内,形成此多核苷酸的一部分或一个区域。事实上,这些片段中有几段可存在于一个较大多核苷酸内。
这些片段可任选地由或基本上由一段连续的跨距长至少8、10、12、15、18、20、25、35、40、50、70、80、100、250、500或1000个核苷酸组成。一组优选的片段包括本文描述的CanIon基因的双等位标记A1-A17中至少一个或其互补物。
2-多肽
本发明还涉及本文所述的多肽变体、片段、类似物及衍生物,包括突变的CanIon蛋白质。
变体可能有以下变异:1)用保守性或非保守性氨基酸残基取代一个或多个氨基酸残基,而这些被取代的氨基酸残基可能或可能不是由遗传密码编码,或2)一个或多个氨基酸残基中包括一个取代基团,或3)突变CanIon与另一种化合物融合,如可提高多肽半衰期的化合物(例如聚乙二醇),或4)加入的氨基酸与突变CanIon融合,例如,前导或分泌序列或用来纯化突变CanIon的序列或前蛋白序列。这些变体也为本领域技术人员所知。
多肽片段是其序列与给定多肽序列,最好是CanIon基因及其变体编码的多肽的一部分而非全部完全相同的多肽。
对于本发明的多肽氨基酸序列中的氨基酸取代,可用“等价(equivalent)”氨基酸取代一个或多个氨基酸。本文所用的术语“等价”氨基酸用于指任何一个可被具有相似性质的其中一个氨基酸所取代的氨基酸,这样,肽化学领域的技术人员可预计该多肽的二级结构和亲水性质基本上无改变。通常,以下几组氨基酸表示等价变化:(1)Ala,Pro,Gly,Glu,Asp,Gln,Asn,Ser,Thr;(2)Cys,Ser,Tyr,Thr;(3)Val,Ile,Leu,Met,Ala,Phe;(4)Lys,Arg,His;(5)Phe,Tyr,Trp,His。
本发明的修饰过的CanIon肽分子的特定实施例包括,但不限于,抗蛋白水解的肽分子、其-CONH-肽键被(CH2NH)还原键、(NHCO)反键(retro inverso bond)、(CH2-O)亚甲氧键、(CH2-S)硫亚甲键、(CH2CH2)碳键、(C0-CH2)廿二烯酸亚甲基键、(CHOH-CH2)羟乙烯键、(N-N)键、E-alcene键或-CH=CH-键修饰和取代的肽。本发明还包括人CanIon多肽或其片段或变体,其中至少一个肽键按以上所述进行过修饰。
这些片段可以是“独立的(free-standing)”,即不属于其它多核苷酸,也不与其它多核苷酸融合,或它们可包含在一个较大多肽内,形成该多肽的一部分或一个区域。然而,一些片段可包含在一个较大的多肽内。
作为本发明多肽片段的代表性例子,这些片段长5、6、7、8、9或10至15、10至20、15至40、或30至55个氨基酸。优选是那些在CanIon蛋白质中含有至少1个氨基酸突变的片段。
核酸或多肽之间的相同性
术语“序列相同性百分比”和“同源性百分比”在本文可互换使用,指在多核苷酸和多肽之间所作的比较,将两个最优排列的序列在比较窗口中进行比较就可以确定“序列相同性百分比”和“同源性百分比”,其中在比较窗口中部分多核苷酸和多肽序列与参比序列(不包括插入或缺失)相比可包括插入或缺失(即缺口(gap)),使两个序列得到最优排列。计算百分比时确定两个序列具有相同的核酸碱基或氨基酸残基的位置数,得出匹配位置数,将匹配位置数除以比较窗口的总位置数,再将所得结果乘以100就得到序列相同性百分比。可用本技术领域已知的任何一种序列比较算法和程序来评估同源性。这些算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson and Lipman,1988年;Altschul等,1990年;Thompson等,1994年;Higgins等,1996年;Altschul等,1990年;Altschul等,1993年)。在特别优选实施例中,用本技术领域熟知的基本局部相似性搜索工具(BLAST)来评估蛋白质和核酸的序列同源性(例如,参见Karlin and Altschul,1990年;Altschul等,1990、1993、1997年)。具体地说,用5种特定BLAST程序实施以下任务:
(1)BLASTP和BLAST3将氨基酸查询序列与蛋白质序列数据库进行比较;
(2)BLASTN将核苷酸查询序列与核苷酸序列数据库进行比较;
(3)BLASTX将查询核苷酸序列(双链)的六框概念翻译产物与蛋白质序列数据库进行比较;
(4)TBLASTN将查询蛋白质序列与被翻译在所有六读框(six readingframe)(双链)中的核苷酸查询序列数据库进行比较;以及
(5)TBLASTX将核苷酸查询序列的六框翻译与核苷酸序列数据库的六框翻译进行比较。
BLAST程序通过鉴定查询氨基酸或核酸序列和最好获自蛋白质或核酸序列数据库的测试序列之间的相似节段,本文称之为“高分值区段对”(hig-scoring segmentpairs),来鉴定同源序列。最好借助分值矩阵来鉴定(即排列对比)高分值区段对,许多分值矩阵已为本领域所熟知。分值矩阵最好采用BLOSUM62矩阵(Gonnet等,1992年;Henikoff和Henikoff,1993年)。其次也可采用PAM或PAM250矩阵(参见Schwartz和Dayhoff,eds.,1978年)。BLAST程序可评价所有已鉴定的高分值区段对的统计学意义(statistical significance),最好选择能满足用户规定的有统计学意义阈值的区段,如用户规定的同源性百分比。最好用Karlin统计学意义方程式来评估高分值区段对的统计学意义(参见Karlin和Altschul,1990年)。
也可以用缺失参数或用户提供的修改参数来使用BLAST程序
严格的杂交条件
为了限定本发明这样一些杂交核酸,严格的杂交条件如下:
杂交步骤65℃在6xSSC缓冲液、5xDenhardt’s溶液、0.5%SDS及100μg/ml鲑鱼精子DNA存在下进行的。
杂交步骤后进行以下四步清洗:
—最好在65℃用2xSSC和0.1%SDS缓冲液洗5分钟两次;
—最好在65℃用2xSSC和0.1%SDS缓冲液洗一次30分钟;
—最好在65℃用0.1xSSC和0.1%SDS缓冲液洗一次10分钟。
这些杂交条件适合长度大约为20个核苷酸的核酸分子。按照本领域技术人员熟知的技术,以上所述的杂交条件也可根据所需核酸的长度作出修改,在此不再作叙述。例如,根据Hames和Higgins的书(1985年)所述技术可对适当的杂交条件作修改。
CanIon基因的基因组序列
本发明涉及CanIon基因组序列。本发明包括CanIon基因或CanIon基因组序列,该序列由或基本上由SEQ ID No 1-3序列、其互补序列以及其片段和变体组成,或包括SEQ ID No 1-3序列、其互补序列以及其片段和变体。这些多核苷酸可被纯化、分离或重组。
本发明还包括纯化的、分离的、或重组多核苷酸,其包含的核苷酸序列与SEQ IDNo 1-3核苷酸序列或其互补序列或其片段的序列相同性至少是70、75、80、85、90或95%。关于SEQ ID No 1-3核苷酸序列的核苷酸差异通常随机分布于整个核酸。然而,优选核酸是关于SEQ ID No 1-3核苷酸序列的核苷酸差异主要位于外显子包含的编码序列外部的核酸。这些核酸及其片段和变体可用作寡核苷酸引物或探针,以检测测试样品中存在CanIon基因拷贝,或用以扩增CanIon序列内的靶核苷酸序列。
本发明的另一个目的包括在上述规定的严格杂交条件下能与SEQ ID No 1-3核苷酸序列或其互补序列或其变体杂交的纯化的、分离的、或重组的核酸。在优选的实施
方案中,所述纯化的、分离的、或重组的核酸能与人CanIon基因特异性杂交,更优选的,所述核酸能够与人CanIon基因的核苷酸杂交但基本上不能与大鼠CanIon基因的核酸序列杂交。
特别优选的本发明的纯化的、分离的、或重组的多核苷酸,其包含一段连续的跨距SEQ.ID No1-3的至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或10000个核苷酸或其互补物的。应注意的是,本章节描述的多核苷酸也包括任何大小和序列的核酸片段。
CanIon基因组核酸包括44个外显子。SEQ ID NO 1-3中外显子的位置详细列在下面的表B中。
表B
外显子 | 在SEQ ID NO 1中的位置 | 内含子 | 在SEQ ID NO 1中的位置 | ||
开始 | 结束 | 开始 | 结束 | ||
1 | 2001 | 2026 | 1 | 2027 | 19187 |
2 | 19188 | 19334 | 2 | 19335 | 22995 |
3 | 22996 | 23178 | 3 | 23179 | 39730 |
4 | 39731 | 39814 | 4 | 39815 | 41336 |
5 | 41337 | 41476 | 5 | 41477 | 41564 |
6 | 41565 | 41693 | 6 | 41694 | 73012 |
7 | 73013 | 73167 |
外显子 | 在SEQ ID NC 2中的位置 | 内含子 | 在SEQ ID NO 2中的位置 | ||
开始 | 结束 | 开始 | 结束 | ||
8 | 43726 | 43868 | 7 | 43869 | 43997 |
9 | 43998 | 44102 | 8 | 44103 | 52092 |
10 | 52093 | 52179 | 9 | 52180 | 77567 |
11 | 77568 | 77699 | 10 | 77700 | 98225 |
12 | 98226 | 98393 | 11 | 98394 | 106566 |
13 | 106567 | 106758 | 12 | 116759 | 144108 |
14 | 144109 | 144246 | 13 | 144247 | 159793 |
15 | 159794 | 159868 | 14 | 159869 | 191291 |
16 | 191292 | 191428 | 15 | 191429 | 192966 |
17 | 192967 | 193108 | 16 | 193109 | 211539 |
18 | 211540 | 211613 | 17 | 211614 | 225005 |
19 | 225006 | 225107 | 18 | 225108 | 225543 |
20 | 225544 | 225613 | 19 | 225614 | 228449 |
21 | 228450 | 228541 | 20 | 228542 | 228629 |
22 | 228630 | 228752 | 21 | 228753 | 231288 |
23 | 231289 | 231345 | 22 | 231346 | 231588 |
24 | 231589 | 231709 | 23 | 231710 | 231812 |
25 | 231813 | 231944 | 24 | 231945 | 232988 |
26 | 232900 | 233067 | 25 | 233068 | 235354 |
27 | 235355 | 235459 |
外显子 | 在SEQ ID NO 3中的位置 | 内含子 | 在SEQ ID NO 3中的位置 | ||
开始 | 结束 | 开始 | 结束 | ||
28 | 2895 | 4001 | 26 | 4002 | 9610 |
29 | 9611 | 9731 | 27 | 9732 | 9815 |
30 | 9816 | 9914 | 28 | 9915 | 15775 |
31 | 15776 | 15869 | 29 | 15870 | 16381 |
32 | 16382 | 16488 | 30 | 16489 | 16696 |
33 | 16697 | 16771 | 31 | 16772 | 17933 |
34 | 17934 | 18053 | 32 | 18054 | 23643 |
35 | 23644 | 23712 | 33 | 23913 | 24927 |
36 | 24928 | 25076 | 34 | 25077 | 25912 |
37 | 25913 | 26006 | 35 | 26007 | 30766 |
38 | 30767 | 30899 | 36 | 30900 | 31560 |
39 | 31561 | 31676 | 37 | 31677 | 34043 |
40 | 34044 | 34201 | 38 | 34202 | 37492 |
41 | 37493 | 37643 | 39 | 37644 | 39651 |
42 | 39652 | 39801 | 40 | 39802 | 41562 |
43 | 41563 | 41680 | 41 | 41681 | 44130 |
44 | 44131 | 45841 |
因此,本发明包括纯化的、分离的、或重组的多核苷酸,此多核苷酸含有选自CanIon基因44个外显子中每一个的核苷酸序列以及与它们互补的各个序列。本发明还提供了纯化的、分离的、或重组的多核苷酸,此多核苷酸含有CanIon基因的至少两个外显子的组合,其中,所述多核苷酸排列在所述核酸中,从所述核酸的5’端到3’端,与SEQ ID NO 1-3的顺序相同。
内含子1指位于外显子1和外显子2之间的核苷酸序列,依此类推。所述内含子的位置详细列在表A中。因此,本发明包括纯化的、分离的、或重组的多核苷酸,此多核苷酸包括选自CanIon基因43个内含子的核苷酸序列,或与其互补的序列。
这一章节题为“CanIon基因组序列”,应注意的是,本章节所述的多核苷酸也可包含任何大小和序列的核酸片段,它们位于CanIon的基因组序列其中一侧或者在这些基因组序列中两个或多个之间。
CanIon cDNA序列
业已证明,CanIon基因表达导致产生至少一种mRNA,其核酸序列在SEQ ID No 4已有叙述。
本发明的另一个目的是纯化的、分离的或重组的核酸,其包括SEQ ID No 4核苷酸序列、其互补序列及其等位基因变体和片段。此外,本发明的优选多核苷酸包括纯化的、分离的、或重组的CanIon cDNA,该CanIon cDNA由或基本上由序列SEQ ID No4组成,或者包含序列SEQ ID NO 4。本发明特别优选的核酸包括纯化的、分离的、或重组的多核苷酸,该多核苷酸包括一段连续跨距SEQ.ID No4的至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或6000个核苷酸或其互补物。在优选的实施方案中,所述连续跨距包括CanIon相关的双等位标记;最好选自A12-A16。
本发明也涉及纯化的或分离的核酸,该核酸包括的多核苷酸与SEQ ID No 4多核苷酸的核苷酸相同性至少是95%,与SEQ ID No 4多核苷酸、或其互补序列、或其具有生物活性的片段的核苷酸相同性优选为99%,更优选为99.5%,最优选为99.8%。
本发明的又一个目的涉及纯化的、分离的或重组的核酸,其包括能在本文规定的严格杂交条件下与SEQ ID No 4多核苷酸、或其互补序列或其变体或其具有生物活性的片段杂交的多核苷酸。
本发明的另一个目的涉及编码CanIon多肽的纯化的、分离的或重组的多核苷酸,所述多肽包含连续跨距SEQ ID NO 5的至少6个氨基酸,其中所述连续跨距包含至少1、2、3、5或10个SEQ ID NO 5中位置277、338、574、678、680、683、691、692、695、696、697、894、1480、1481、1483、1484、1485、1630、1631、1632、1636、1660、1667、1707、1709上的氨基酸。还包括编码CanIon多肽的纯化的、分离的或重组的多核苷酸,所述多肽包括SEQ ID NO 5的氨基酸序列或它的衍生物或生物学活性片段,以及编码CanIon多肽的纯化的、分离的或重组核酸,与SEQ ID NO 5的氨基酸序列至少有80、85、90、95、98、99、99.5或99.8%相同性。
SEQ ID No 4的cDNA包括5’-UTR区,其始于SEQ ID No 4位置1的核苷酸,止于位置65的核苷酸。SEQ ID No 4的cDNA包括3’-UTR区,其始于SEQ ID No 4位置5283的核苷酸,止于位置6799的核苷酸。
因此,本发明涉及纯化的、分离的或重组的核酸,其包括CanIon cDNA其互补序列或其等位基因变体的5’-UTR核苷酸序列。本发明还涉及纯化的、分离的或重组的核酸,其包括CanIon cDNA、其互补序列或其等位基因变体的3’-UTR核苷酸序列。
这一章节题为“CanIon cDNA序列”,应注意的是,本章节所述的多核苷酸也包含任何大小和序列的核酸片段,它们位于CanIon基因组序列其中一侧或者在这些基因组序列中两个或序个之间。
编码区
SEQ ID No 4cDNA的相应mRNA中含有CanIon开放阅读框(open reading frame)。更准确地说,有效的CanIon编码序列(CDS)包括SEQ ID No 4核苷酸位置66(ATG密码子的第一个核苷酸)和核苷酸位置5282(TGA密码子的最后一个核苷酸)之间的区域。本发明也包括分离的、纯化的和重组的多核苷酸,其编码包含SEQ ID No 5的一段连续跨距,至少6个氨基酸的多肽,优选至少8或10个氨基酸,更优选至少12、15、20、25、30、40、50、100、200、300、400、500、、700或1000个氨基酸。
以上揭示的包含CanIon基因编码序列的多核苷酸当置于适当表达信号的调控下,可在所需宿主细胞或所需宿主生物体中表达。这些表达信号可以是包含在本发明CanIon基因的调节区中的表达信号,或者相反,这些信号也可以是外源调节性核序列。当这样一个多核苷酸置于合适的表达信号之下,也可被插入到载体中,以便表达和/或扩增。
CanIon调节序列
如上所述,CanIon基因的基因组序列在非编码5’侧翼区和非编码3’侧翼区含有调节序列,这些侧翼区邻接含有该基因44个外显子的CanIon编码区。
自5’和3’调节区衍生的多核苷酸可用于检测测试样品中是否存在CanIon核苷酸序列或其片段的至少一个拷贝。
可按下述方法评估包含在CanIon中的5’调节区的启动子活性。为了鉴定具有有关生物活性的SEQ ID No 1多核苷酸片段或变体,本领域技术人员可参考Sambrook等的书(Sambrook,1989年),书中叙述了携带标记基因(即β半乳糖苷酶、氯霉素乙酰转移酶等)的重组载体的应用,当在具有生物活性的SEQ ID No 1多核苷酸片段或变体调控下,可检测到标记基因的表达。将位于CanIon基因第一外显子上游的基因组序列克隆到合适的启动子报导载体,如从Clontech公司获得的pSEAP-碱基、pSEAP-增强子、pβgal-碱基、pβgal-增强子或pEGFP-1启动子报导载体中,或Promega公司的pGL2-碱基或pGL3-碱基无启动子萤光素酶报导基因载体中。简单地说,这些启动子报导基因载体中每个都包括多个位于报导基因上游的克隆位点,而这些报导基因编码容易测试的蛋白质,如分泌的碱性磷酸酶、萤光素酶、β半乳糖苷酶、或绿萤光蛋白质。将CanIon编码区上游的序列以两种方向插入到该报导基因上游的克隆位点,并导入合适的宿主细胞中。测定报导蛋白质的水平,并且与克隆位点无插入物的载体所得水平进行比较。与对照载体的水平相比,含有插入物的载体中表达水平有所提高,表明插入物存在启动子。若需要,可将上游序列克隆到含有增强子的载体中,以提高弱启动子序列的转录水平。在缺少插入物的载体中观察到显著水平的表达,表明启动子序列存在于已插入的上游序列中。
上游基因组DNA内的启动子序列可用常规技术,如外切核酸酶III或适当的限制性内切核酸酶消化技术,在上游DNA构建嵌套5’和/或3’缺失以作进一步限定。例如,Coles等于1998提出,可将产生的缺失片段插入到启动子报导基因载体中,以确定该缺失序列是否使启动子的活性下降或消失,具体可参考本文的引用文献。这样,就可以明确启动子的边界。若需要,可用定点诱变或接头扫描鉴定该启动子内的诱变或用二单个潜在调节位点以单独或联合除去启动子内潜在的转录因子结合位点。可通过将突变插入到启动子报导基因的克隆位点中确定这些突变对转录水平的影响。这类测试是本领域技术人员所熟知的,WO 97/17359、美国专利US5,374,544、欧洲专利EP 582796、美国专利US5,698,389、美国专利US 5,643,746、美国专利US 5,502,176及美国专利US5,266,488都有叙述,具体可参考本文的引用文献。
可通过与不同种类细胞和组织的CanIon启动子操作性连接的可检测的多核苷酸的表达水平,评估CanIon基因的启动子的强度和特异性。此可检测的多核苷酸可以是与预定寡核苷酸探针特异性杂交的多核苷酸,或者是编码一可检测蛋白质的多核苷酸,包括CanIon多肽或其片段或变体。这类试验是本领域技术人员所熟知的,美国专利US5,502,176和美国专利US5,266,488都有叙述,具体可参考本文的引用文献。以下对其中一些方法作详细讨论。
优选使用带有位于CanIon编码区5’端和3’端调节元件的多核苷酸,来调控感兴趣异源多核苷酸的转录和翻译活性。
所以,本发明也涉及含有多核苷酸的纯化的或分离的核酸,该多核苷酸选自5’和3’调节区、或其互补序列或其具有生物活性的片段或变体。在一实施例中,“5’调节区”位于SEQ ID No 1的位置1和2000之间的核苷酸序列。在另一实施例中,“3’调节区”位于SEQ ID No 3的位置45842和47841之间的核苷酸序列。
本发明还涉及含有多核苷酸的纯化的或分离的核酸,该多核苷酸与选自5’和3’调节区的多核苷酸的核苷酸相同性至少是95%,与选自5’和3’调节区的多核苷酸、或其互补序列、或其变体或其具有生物活性的片段的核苷酸相同性优选是99%,更优选是99.5%,最优选99.8%。
本发明的另一个目的包括含有多核苷酸的纯化的、分离的或重组的核酸,该多核苷酸在本文规定的严格杂交条件下能与选自5’和3’调节区的核苷酸序列、或其互补序列、或其变体或其具有生物活性的片段的多核苷酸杂交。
5’调节区的优选片段长大约1500或1000个核苷酸,优选约500个核苷酸,较优选约400个核苷酸,更加优选约300个核苷酸,最优选约200个核苷酸。
3’调节区的优选片段长至少50、100、150、200、300或400个碱基。
具有“生物活性”的SEQ ID No 1和3多核苷酸衍生物是包含所述多核苷酸片段的多核苷酸,或由所述多核苷酸片段组成的多核苷酸,其功能是在重组细胞宿主中作为表达重组多肽或重组多核苷酸的调节区。它也可用作增强子或阻抑物。
对本发明而言,如果所述调节性多核苷酸含有包含转录和翻译调节信息的核苷酸序列,而这些序列与编码所需多肽或所需多核苷酸的核苷酸序列操作性连接,则核酸或多核苷酸会起到表达重组多肽或重组多核苷酸的调节区作用。
本发明的调节性多核苷酸可用适当限制酶切割SEQ ID No 1和3的核苷酸序列来制备,如Sambrook等(1989年)提出的方法。此调节性多核苷酸也可通过用诸如Bal31等外切核酸酶消化SEQ ID No 1和3来制备(Wabiko等,1986年)。这些调节性多核苷酸还可通过核酸化学合成来制备,本说明书的其它章节会有所叙述。
本发明的调节性多核苷酸可以是重组表达载体的一部分,可用于在所需宿主细胞或宿主生物中表达编码序列。本说明书的其它章节将对本发明的重组表达载体进行叙述。
本发明的优选5’调节性多核苷酸包括CanIon cDNA、或其具有生物活性的片段或变体的5’非翻译区(5’-UTR)。
本发明的优选3’调节性多核苷酸包括CanIon cDNA、或其具有生物活性的片段或变体的3’非翻译区(3’-UTR)。
本发明的又一个目的包括纯化的或分离的核酸,所述核酸包括:
a)含有一调节性核苷酸序列的核酸,此调节性核苷酸序列选自:
(i)含有5’调节区多核苷酸或其互补序列的;
(ii)核苷酸序列,该序列含有与5’调节区核苷酸序列或其互补序列的核苷酸相同性至少为95%的多核苷酸的核苷酸序列;
(iii)含有在严格杂交条件下能与5’调节区核苷酸序列或其互补序列杂交的多核苷酸的核苷酸序列;以及
(iv)(i)、(ii)和(iii)中的多核苷酸的生物活性片段或变体;
b)编码所需多肽或感兴趣核酸的多核苷酸,其与上述(a)所限定的核酸操作性连接;
c)任选地,含有3’调节性性多核苷酸,最好是CanIon基因的3’调节性多核苷酸的核酸。
在上述核酸的一具体实施例中,所述核酸包括CanIon cDNA或其生物活性片段或变体的5’非翻译区(5’-UTR)。
在上述核酸的另一具体实施例中,所述核酸包括CanIon cDNA、或其生物活性片段或变体的3’非翻译区(3’-UTR)。
5’调节区的调节性性多核苷酸或其生物活性片段或变体是操作性连接在编码所需多肽的多核苷酸或多核苷酸的5’端。
3’调节区的调节性多核苷酸或其生物活性片段或变体最好可操作性连接在编码所需多肽的多核苷酸或多核苷酸的3’端。
由上述核酸编码的所需多肽可有各种性质或来源,包括原核生物或真核生物源的蛋白质。在CanIon调节区调控下表达的多肽中包括细菌、真菌或病毒抗原。也包括真核生物蛋白质,例如,“管家”蛋白质等胞内蛋白质、受体等膜结合蛋白质以及内源性介质等分泌蛋白质,如细胞因子。所需多肽可以是CanIon蛋白质,特别是SEQ IDNo 5氨基酸序列的蛋白质或其片段或变体。
由上述多核苷酸通常是RNA分子编码的所需核酸可能与所需编码性多核苷酸互补,例如与CanIon编码序列互补,因而可用作反义多核苷酸。
这样一种多核苷酸可包括在一重组表达载体中,以便在宿主细胞或宿主生物中表达所需多肽或所需核酸。本说明书在其它章节将对含有本文所述多核苷酸的适当重组表达载体再作叙述。
多核苷酸构建物(polynucleotide construct)
术语“多核苷酸构建物”和“重组多核苷酸”在本文可互换作用,指人为设计的线性或环状,纯化的或分离的多核苷酸,它们至少包含两个核苷酸序列,这两个核苷酸序列在它们原先的天然环境中未发现是连续的核苷酸序列。
能够操控CanIon基因在重组细胞宿主和转基因动物中的时间和空间表达的DNA构建物
为了在细胞水平和多细胞生物水平上研究缺少CanIon基因合成的生理和表型结果,本发明还包括DNA构建物和重组载体,它们能够有条件地表达CanIon基因组序列或cDNA的特异性等位基因以及该基因组序列或cDNA的拷贝,它们带有SEQ ID No1-4的CanIon核苷酸序列或其片段的一个或多个碱基的取代、缺失或插入,这些碱基的取代、缺失或插入位于外显子、内含子或调节序列内,但最好位于5’调节序列或CanIon基因组序列的外显子内或SEQ ID No 4 CanIon cDNA内。在一优选实施例中,CanIon序列包含本发明的双等位标记。在一优选实施例中,CanIon序列包含本发明的双等位标记优选双等位标记-A17之一。
本发明包括重组载体,其包含本发明所述的任何一个多核苷酸。更具体地说,本发明的多核苷酸构建物可包含在“CanIon基因的基因组序列”章节、“CanIon cDNA序列”章节、“编码区”章节、“寡核苷酸探针和引物”章节中所述的任何一个多核苷酸。
按Gossen等(1992和1995年)以及Furth等(1994年)所述那样,第一优选的DNA构建物基于控制CanIon基因表达、并来自大肠杆菌(大肠杆菌)转位子Tn10的抗四环素操纵子tet。这样一种DNA构建物含有7个来自Tn10的tet操纵子序列(tetop),融合于最小启动子或CanIon基因5’调节序列,所述最小启动子或所述CanIon基因调节序列可操作性连接于一感兴趣的多核苷酸,该多核苷酸编码有义或反义寡核苷酸或编码包括CanIon多肽或其肽片段的多肽。当同一个细胞也包括编码融合于单纯疱疹病毒的病毒蛋白质VP16活化区的野生型(tTA)或突变(rTA)阻抑物的核苷酸序列,并置于诸如HCMVIE1增强子/启动子或MMTV-LTR等启动子控制下,这种DNA构建物就会起到该感兴趣核苷酸序列的条件性表达系统的作用。事实上,本发明的优选DNA构建物包括含有tet操纵子序列的多核苷酸和含有编码tTA或rTA阻抑物的多核苷酸。
在一具体实施例中,该条件表达DNA构建物含有编码突变四环素阻抑物rTA的序列,该感兴趣多核苷酸的表达在缺乏四环素的情况下是沉默的,在四环素存在下才会被诱导。
可以进行同源重组的DNA构建物:置换型载体
第二个优选的DNA构建物从5’端至3’端包含有:(a)包含在CanIon基因组序列中的第一核苷酸序列;(b)包括阳性选择标记的核苷酸序列,如抗新霉素标记(neo);以及(c)包含在CanIon基因组序列中、位于第一CanIon核苷酸序列(a)下游基因组上的第二核苷酸序列。
在一优选实施例中,这种DNA构建物还包括位于核苷酸序列(a)上游或核苷酸序列(c)下游的阴性选择标记。该阴性选择标记最好包括胸腺嘧啶核苷激酶(tk)基因(Thomas等,1986年)、潮霉素β基因(Te Riele等,1990年)、hprt基因(Van der Lugt等,1991年;Reid等,1990年)、或白喉毒素A片段(Dt-A)基因(Nada等,1993年;Yagi等,1990年)。阳性选择标记最好位于CanIon外显子序列内,使编码CanIon蛋白质的序列被隔断。例如,Thomas等(1986、1987年)、Mansour等(1988年)以及Koller等(1992年)对这些置换型载体进行了叙述。
第一和第二核苷酸序列(a)和(c)一般可位于CanIon调节序列、内含子序列、外显子序列或含有调节和/或内含子和/或外显子序列的序列内,没什么差别。核苷酸序列(a)和(c)的大小在1至50kb范围内,优选1至10kb范围内,更优选2至6kb范围内,最优选2至4kb范围内。
可以进行同源重组的DNA构建物:Cre-Loxp系统
这些新的DNA构建物采用了P1噬菌体的位点特异性重组系统。P1噬菌体具有称为Cre的重组酶,它可与34碱基对Loxp位点特异性相互作用。Loxp位点由两个被8bp保守序列分隔的13bp的回文序列组成(Hoess等,1986年)。将Cre酶重组在两个具有相同取向的Loxp位点之间导致删除该DNA片段。
Gu等(1993和1994年)首先描述了将Cre-Loxp系统与同源重组技术结合使用。简单地说,待插入到基因组靶位置的感兴趣核苷酸序列带有取向相同并位于待从重组基因组切除下来的核苷酸序列两端的至少两个Loxp位点。此切割要求重组细胞宿主胞核内存在重组酶(Cre)。通过以下方法可在需要的时间引入重组酶:(a)如Araki等所述(1995年),将Cre酶直接注射到所需细胞,或如Baubonis等所述(1993年),以脂质转染法将酶导入细胞,在含有此酶的培养基中培养重组细胞宿主;(b)如Gu等(1993年)和Sauer等(1988年)所述,用包含Cre编码序列的载体转染细胞宿主,该Cre编码序列与重组细胞宿主中起作用的启动子可操作性连接,启动子任选为可诱导性启动子,所述载体被导入重组细胞宿主中;以及(c)如Gu等所述(1994年),在细胞宿主基因组中导入多核苷酸,该多核苷酸包含与重组细胞宿主中起作用的启动子可操作性连接的Cre编码序列,启动子任选为可诱导性启动子,所述多核苷酸通过随机插入或同源重组被插入到细胞宿主的基因组中。
在一具体实施例中,构建了含有通过同源重组插入到CanIon基因中的序列的载体,使得选择标记侧接同一取向的Loxp位点,以Cre酶处理可消除此选择标记同时保留通过同源重组插入的感兴趣的CanIon序列。此外,还需要两种选择标记:选择重组的阳性选择标记和选择同源重组的阴性选择标记。Zou等(1994年)叙述了使用Cre-Loxp系统的载体和方法。
因此,本发明第三个优选DNA构建物从5’端至3’端包括:(a)包含在CanIon基因组序列中的第一核苷酸序列;(b)包括编码阳性选择标记的多核苷酸的核苷酸序列,所述核苷酸序列还包括两个限定的重组酶识别的位点,如Loxp位点,以及两个被置于相同取向的位点的序列;以及(c)包含在CanIon基因组序列中并位于第一CanIon核苷酸序列(a)基因组下游的第二核苷酸序列。
限定的重组酶识别的位点如Loxp位点的序列最好位于核苷酸序列(b)内靠近要条件性切除的核苷酸序列的适当位置上。在一具体实施例中,两个Loxp位点各位于阳性选择标记序列的一侧,以便发生同源重组后在需要的时间进行切除。
在采用上述第三个DNA构造的方法的优选实施例中,如Gu等(1994年)所述,由于在重组宿主细胞的基因组中存在操作性连接于启动子序列的Cre酶的编码序列,此启动子序列优选可诱导性启动子,更优选组织特异性启动子序列,最优选具有可诱导性和组织特异性二者的启动子序列,在需要的时间切除靠近重组酶识别的两个位点(优选两个LoxP位点)的多核苷酸片段。
如Gu等(1994年)所述,在重组细胞宿主基因组内存在Cre酶可能是两种转基因动物交配的结果,第一种转基因动物带有CanIon衍生的感兴趣的序列、含有上述Loxp位点,第二种转基因动物带有操作性连接于适当启动子序列的Cre编码序列。
如Anton和Graham(1995年)以及Kanegae等(1995年)所述,用基于腺病毒并含有Cre基因的载体也可实现对Cre酶表达的空间和时间控制,使细胞转染或有生物在体内转染,运送Cre酶。
以上所述的DNA构建物可用于将本发明所需核苷酸序列,优选为CanIon基因组序列或CanIon cDNA序列,最优选CanIon基因组或cDNA序列的替换拷贝,导入靶基因组(targeted gene)的预定位置内,从而产生靶基因的替换拷贝(敲(knock-out)同源重组)或用另一个同源性足以产生同源重组的拷贝取代靶基因的拷贝(敲入(knock-in)同源重组)。在一具体实施例中,上述DNA构建物可用于导入包含本发明至少一个双等位标记,优选选自A1-A17的至少一个双等位标记的CanIon基因组序列或CanIoncDNA序列。
核反义DNA构建物
含有本发明载体的其它组合物包括核序列SEQ ID No 4的寡核苷酸片段,优选是包含CanIon基因起始密码子的片段,作为抑制相应CanIon基因表达的反义工具。使用本发明反义多核苷酸的优选方法是Sczakiel等(1995年)或PCT申请WO 95/24223所述的程序,具体可参考本文的引用文献。
最好在与CanIon mRNA的5’端互补的多核苷酸(长15-200bp)中选择反义工具。在一实施例中,采用了与所需靶基因不同部分互补的不同反义多核苷酸组合。
本发明的优选反义多核苷酸与含有翻译起始密码子ATG或剪接位点的CanIonmRNA序列互补。本发明的另一些优选反义多核苷酸与CanIon mRNA的剪接位点互补。
如Liu等(1994年)所述,本发明的反义多核苷酸宜带有被自切割核酶序列取代的3’聚腺苷酸化信号,这样,不需要3’端的聚腺苷酸就可以产生RNA聚合酶II转录物,这些反义多核苷酸不能从胞核输出。在一优选实施例中,这些CanIon反义多核苷酸在核酶盒中还包含组蛋白茎环结构,可稳定切割的转录物抵抗3’-5’核酸外切降解,Eckner等(1991年)叙述了这样一种结构。
寡核苷酸探针和引物
自CanIon基因衍生的多核苷酸可用于检测测试样品中存在的SEQ ID No 1-4和6核苷酸序列、或其片段、互补物或变体的至少一个拷贝。
本发明特别优选的探针和引物包括分离的、纯化的或重组的多核苷酸,该多核苷酸包含SEQ ID No 1-3一段连续跨距至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、5000、10000或20000个核苷酸或其互补物。其它优选的本发明的探针和引物包括分离的、纯化的、或重组的多核苷酸,其中所述连续跨距包括选自A1-A17的双等位标记。
本发明的另一目的是纯化的、分离的、或重组的多核苷酸,该多核苷酸包含SEQID NO 4的核苷酸序列及其互补序列,以及它的等位变体和片段。此外,本发明优选的探针和引物包括纯化的、分离的、或重组的CanIon cDNA,该cDNA由或基本上由SEQ ID NO 4的序列构成,或包含SEQ ID NO 4的序列。特别优选的本发明的探针和引物包括分离的、纯化的、或重组的多核苷酸,此多核苷酸包括SEQ ID No 4的一段连续跨距至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或6000个核苷酸或其互补物。本发明的另一些优选探针和引物包括分离的、纯化的或重组的多核苷酸,此多核苷酸包含SEQID No 4的一段连续跨距至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或6000个核苷酸或其互补物,其中所述连续跨距包含选自A12和A16的双等位标记。
在另一些实施方案中,本发明的探针和引物包括分离的、纯化的或重组的多核苷酸,该多核苷酸包含SEQ ID No 6的一段连续跨距至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、300或400个核苷酸或其互补物。在优选的实施方案中,所述SEQ ID NO 6的连续跨距包含双等位标记A18。
所以,本发明还涉及核酸探针,其特征在于它们能在上述规定的严格杂交条件下与选自SEQ ID No 1-3的人CanIon核苷酸序列或其互补物或其互补序列的核酸杂交。
在一实施例中,本发明包括分离的、纯化的或重组的多核苷酸,该多核苷酸由或基本上由一段连续跨距SEQ ID No 1-4和6之一的8至50个核苷酸组成及其互补物,其中所述跨距在所述序列中包含CanIon相关双等位标记;任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地与其连锁失平衡的双等位标记。任选地,其中所述连续跨距长18至35个核苷酸,而所述双等位标记可存在于所述多核苷酸中央的4个核苷酸内;任选地,所述多核苷酸由所述连续跨距组成,而所述连续跨距长25个核苷酸,所述双等位标记存在于所述多核苷酸中央;任选地,所述连续跨距的3’端存在于所述多核苷酸的3’端;以及任选地,所述连续跨距的3’端位于所述多核苷酸3’端,而所述双等位标记存在于所述多核苷酸3’端。在优选的实施方案中,所述探针包括,或者由或基本上选自以下序列:P1-P18及其互补序列的序列构成,。
在另一实施例中,本发明包括分离的、纯化的或重组的多核苷酸,该多核苷酸包含SEQ ID No 1-4的8至50个核苷酸及其互补物的连续跨距,或者由或基本上由SEQID No 1和3的8至50个核苷酸及其互补物的连续跨距组成,其中所述跨距的3’端位于所述多核苷酸3’端,而所述多核苷酸的3’端在所述序列中位于CanIon相关双等位标记上游20个核苷酸处;任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,其中所述多核苷酸的3’端在所述序列中位于所述CanIon相关双等位标记上游1个核苷酸处;且任选地,其中所述核苷酸基本上由选自D1-D18和E1-E18的序列组成。
在其它实施方案中,本发明包括分离的、纯化的或重组的多核苷酸,该多核苷酸包括选自B1-B17和C1-C17的序列,或者由或基本上由选自B1-B17和C1-C17的序列组成。
在又一实施例中,本发明包括用于杂交试验、测序试验以及基于酶的错配检测试验的多核苷酸,来测定SEQ ID No 1-4和6的CanIon相关双等位标记上的核苷酸或其互补物的相同性,以及包括用于扩增含有SEQ ID No 1-4和6的CanIon相关双等位标记或其互补物的多核苷酸片段;任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡。
本发明涉及本发明的多核苷酸在测定CanIon相关双等位标记的核苷酸相同性中的应用,最好是在杂交试验、测序试验、微测序试验或基于酶的错配检测试验以及扩增包含CanIon相关双等位标记的多核苷酸的区段中的应用。
本发明的探针或引物长度在8和1000个核苷酸之间,或者长度具体为至少12、15、18、20、25、35、40、50、60、70、80、100、250、500或1000个核苷酸。更具体地说,这些探针和引物的长度在8、10、15、20或30至100个核苷酸的范围内。较好是10至50个核苷酸,更好是15至30个核苷酸。较短的探针或引物有缺乏对靶核酸序列特异性的趋势,通常需要较低温度才能与模板形成足够稳定的杂交复合物。较长的探针或引物的生产费用高,有时可自身杂交形成发夹结构。本领域技术人员可凭经验决定在一组特定测试条件下探针和引物的适当长度。优选的探针或引物由含有选自核苷酸序列P1-P18及其互补序列、B1-B17、C1-C17、D1-D18、E1-E18的多核苷酸的核酸构成,在表1、2和3中列出了它们各自在序列表中的位置。
稳定性杂交物的形成取决于DNA的熔解温度(Tm)。熔解温度又取决于探针或引物长度、溶液离子强度以及G+C含量。探针或引物的G+C含量越高,熔解温度越高,这是因为G:C对通过3个氢键连接,而A:T对只有2个氢键。本发明探针的GC含量通常在10%和75%之间的范围,优选在35%和60%之间的范围,更优选在40和55%之间的范围。
可用任何合适的方法制备这些引物和探针,例如包括适当序列的克隆和限制,进行直接化学合成,如Narang等(1979年)提出的磷酸二酯法、Brown等(1979年)提出的磷酸二酯法、Beaucage等(1981年)提出的亚磷酰胺二乙酯法以及欧洲专利EP 0 707592所述的固体载体法。
检测探针通常是核酸序列或不带电的核酸类似物,例如,国际专利申请WO92/20702公开的肽核酸、美国专利US5,185,444、5,034,506和5,142,047所述的吗啉基类似物。由于探针不能另外加入脱氧核苷酸三磷酸(dNTPs),致使探针是不延伸的。这些类似物本身通常是不可延伸的,而核酸探针经过修饰探针的3’端而成为不可延伸的,以致羟基不再能参与延伸。例如,探针3’端的作用是捕获或检测标记,因而会消耗或阻断羟基。此外,可简单地切除、置换或修饰3’羟基,1993年4月19日提交的美国专利申请号07/049,061叙述了一些修饰,这些修饰也使探针不可延伸。
若需要,可用光谱学、光化学、生物化学、免疫化学或化学方法引入任何一种本领域已知的可检测标记来标记本发明任何一个多核苷酸。例如,有用的标记包括放射活性物质(包括32P、35S、3H、125I)、萤光染料(包括5-溴脱氧尿苷、萤光素、乙酰氨基芴、毛地黄毒苷)或生物素。多核苷酸最好在其3’和5’端带上标记。法国专利FR-7810975中或Urdea等(1988年)或Sanchez-Pescador等(1988年)叙述了核酸片段的非放射活性标记的例子。另外,本发明的探针可能具有的结构特征使它们可以扩增信号,例如,Urdea等(1991年)或欧洲专利EP 0 225 807(Chiron)描述的分支(branched)DNA探针。
标记还可用于捕获引物,以利于固体载体上的引物或诸如扩增的DNA等引物延伸产物的固定。捕获标记附着在引物或探针上,是与固相试剂的特异性结合成员(例如生物素和链霉亲和素)形成结合对的特异性结合成员。所以,取决于多核苷酸或探针携带的标记类型,它可用来捕获或检测靶DNA。而且,应了解,本文所提供的多核苷酸、引物或探针本身可用作捕获标记。例如,若固相试剂的结合成员是核酸序列,可选择使它与引物或探针的互补部分结合,从而将引物或探针固定在固相上。若多核苷酸探针本身作为结合成员,本领域技术人员就会知道探针将含有与靶序列不互补的序列或“尾巴”。若多核苷酸引物本身作为捕获标记,引物至少有一部分可与固相上的核酸自由杂交。DNA标记技术已为技术人员所熟知。
本发明的探针有多种用途。它们较多用在基因组DNA的DNA杂交上。也可用这些探针检测PCR扩增产物。它们还可用来检测用其它技术在CanIon基因或mRNA中造成的错配。它们还可用于检测CanIon基因的表达,例如在Northern印迹中。
本发明任何一个多核苷酸、引物或探针可方便地固定在固体载体上。本领域技术人员所知的固体载体,包括反应盘的孔壁、试管、聚苯乙烯珠粒、磁珠、硝酸纤维素条带、膜、如胶乳颗粒等微粒、绵羊(或其它动物)红血细胞、耐久细胞(duracyt)等。固体载体不是关键的,可由本领域技术人员选取。因此胶乳颗粒、微粒、磁珠或非磁性珠、膜、塑料管、微滴定孔壁、玻璃或硅芯片、绵羊(或其它动物)红血细胞以及耐久细胞都是合适的固体载体。将核酸固定在固体载体上的适当方法,包括离子、疏水、共价相互作用等。本文所用的固体载体指任何不溶性材料,或通过后续反应可成不溶性。可根据其吸引和固定捕获试剂的内在能力挑选固体载体。此外,固体载体可保留能够吸引和固定捕获试剂的附加受体。附加受体可包括带电物质,其电荷与捕获试剂本身或与捕获试剂偶联的带电物质相反。另外,受体分子可以是固定(附着)在固体载体上并能够通过特异性结合反应固定捕获试剂的任何一种特异性结合物质。受体分子能使捕获试剂与固体载体材料在进行试验之前或在试验期间间接结合。所以固相可以是塑料、衍生塑料、磁性或非磁性金属、试管的玻璃或硅表面、微滴定孔、薄片、珠粒、微粒、芯片、绵羊(或其它适当动物)红血细胞、耐久细胞及本领域技术人员已知的其它构造。本发明的多核苷酸可单独附着或固定在固体载体上,或以至少2、5、8、10、12、15、20或25个本发明不同的多核苷酸组成的组合附着或固定在一个固体载体上。此外,本发明以外的多核苷酸也可作为本发明一个或多个多核苷酸而附在同一个固体载体上。
所以,本发明还包括检测样品中存在含有SEQ ID No 1-4和6核苷酸、其片段或变体以及其互补序列的核酸的方法,所述方法包括以下步骤:
a)使能够与包含在SEQ ID No 1-4和6核酸、其片段或变体以及其互补序列中的核苷酸序列杂交的一个核酸探针或多个核酸探针与待测样品接触;以及
b)检测探针和样品中的核酸之间形成的杂交复合物。
本发明还涉及检测样品中存在含有SEQ ID No 1-4和6核苷酸序列、其片段或变体以及其互补序列的核酸的试剂盒,所述试剂盒包括:
a)能够与包含在SEQ ID No 1-4和6核酸、其片段或变体以及其互补序列中的核苷酸序列杂交的一个核酸探针或多个核酸探针;以及
b)任选地,进行杂交反应所需的试剂。
在该检测方法和试剂盒的第一优选实施例中,所述一个核酸探针或多个核酸探针用可检测的分子标记。在所述方法和试剂盒的第二优选实施例中,所述核酸探针或多个核酸探针固定在底物上。在所述方法和试剂盒的第三优选实施例中,所述核酸探针或多个核酸探针含有选自P1-P18的核苷酸序列及其互补序列、B1-B17、C1-C17、D1-D18、E1-E18的任一序列,或含有选自A1-A18及其互补物的双等位标记。
寡核苷酸阵列
可用包含多个本发明寡核苷酸引物或探针的底物检测或扩增CanIon基因中的靶序列(targeted sequence),还可以检测CanIon基因编码或非编码序列中的突变。
本文列出的任何一个多核苷酸均可附在固体载体的重叠区或随机位置。此外,本发明的多核苷酸可附在有序阵列中,其中每个多核苷酸附在固体载体的不同区,与其它任何一个多核苷酸的附着位点不重叠。这样一个多核苷酸的有序阵列最好设计成“可寻址”,记录不同位置,而且可作为试验步骤的一部分被存取。可寻址多核苷酸阵列通常包含多个不同寡核苷酸探针,其与不同已知位置中的基质表面偶联。弄清每个多核苷酸位置的准确位置,使得这些“可寻址”阵列在杂交试验中特别有用。本发明的多核苷酸可用在本技术领域已知的任何可寻址阵列技术中。这些多核苷酸阵列的一个具体实施例称为GenechipsTM,美国专利US5,143,854、PCT申请WO 90/15070和WO 92/10092都有叙述。通常用将光蚀刻法(photolithographic methods)和固相寡核苷酸合成组合起来加入机械合成法或光引导合成法(light directed synthesis)产生这些阵列(Fodor等,1991年)。通过开发通常称为“超大规模固定聚合物合成”(VeryLarge Scale Immobilized Polymer synthesis”(VLSIPSTM)技术,其中探针一般固定在芯片固体表面上的高密度阵列内,将寡核苷酸阵列固定在固体载体上。美国专利US5,143,854和US5,412,087以及PCT申请WO 90/15070、WO 92/10092和WO 95/11995提供了VLSIPSTM技术的示范例,它们叙述了通过光引导合成技术等形成寡核苷酸阵列的方法。设计提供固定在固体载体上的核苷酸阵列的策略时,还开发了展示策略,以在芯片上排列和显示寡核苷酸阵列,尽可能得到最多的杂交模式和序列信息。PCT申请WO 94/12305、WO 94/11530、WO 97/29212和WO 97/31256揭示了这种展示策略的例子,具体可参考本文的引用文献。
在本发明寡核苷酸阵列的另一实施例中,最好用寡核苷酸探针矩阵检测CanIon基因特别是其调节区中发生的突变。为了这个特定目的,特别将探针设计成具有使其与携带已知突变(缺失、插入或取代一个或几个核苷酸)的基因杂交的核苷酸序列。例如,根据Huang等(1996年)或Samson等(1996年)所用的技术,通过已知突变,已鉴定到CanIon基因上发生的突变。
另一种用来检测CanIon基因中突变的技术是使用高密度DNA阵列。将构成高密度DNA阵列一单位元件的每个寡核苷酸探针设计成与CanIon基因组DNA或cDNA的一特异性序列相匹配。所以,然后用与靶基因序列互补的寡核苷酸组成的阵列来测定靶序列与野生基因序列的相同性,测定其含量,并检测靶序列和CanIon基因的参照野生基因序列之间的差异。在这样一种设计,称为4L平铺阵列(tiled array)中使用一套四个探针(A、C、G、T),优选15个核苷酸的寡聚物。在每套四个探针中,完全互补物的杂交能力比错配探针的杂交能力更强。因此使用含有4L探针,而整套探针含有在已知野生参照序列中所有可能的突变的平铺阵列,来扫描长度为L的靶核酸基因的突变。靶序列中的单碱基变化可能会干扰15-mer探针套的平铺阵列的杂交信号。结果使突变位置侧接的探针信号或“足迹”特征性消失。Chee等(1996年)对这种技术进行了叙述。
所以,本发明涉及含有至少一种作为探针和引物的上述多核苷酸的核酸分子阵列。优选地,本发明涉及含有作为探针和引物的至少两个上述多核苷酸的核酸分子阵列。
本发明进一步的目的包括核酸序列的阵列,与核酸序列含有至少一种选自P1-P18、B1-B17、C1-C17、D1-D18、E1-E18的序列、与它们互补的序列、其至少有8、10、12、15、18、20、25、30或40个连续核苷酸的片段的序列,以及至少一种含有选自A1-A18及其互补物的双等位标记的序列。
本发明还涉及核酸序列的阵列,此核酸序列含有至少两种选自P1-P18、B1-B17、C1-C17、D1-D18、E1-E18的序列、与它们互补的序列、其至少有8个连续核苷酸的片段的序列,以及至少两种含有选自A1-A18及其互补物的双等位标记的序列。
CanIon蛋白质和多肽片段
本文所用的术语“CanIon多肽”包括本发明的全部蛋白质和多肽。本发明的组成部分还有由本发明多核苷酸编码的多肽、以及含有这些多肽的融合多肽。本发明包括人的CanIon蛋白质,其包括由或基本上由SEQ ID No 5序列组成的或包含SEQ ID No5序列的分离的或纯化的CanIon蛋白质。
本发明涉及由选自SEQ ID NO 1-4和6的核苷酸序列、其互补序列或其
本发明包括分离的、纯化的以及重组的多肽,该多肽包含SEQ ID No 5的一段连续跨距长至少6个氨基酸,优选至少8至10个氨基酸,更优选至少12、15、20、25、30、40、50、100、150、200、300、400、500、700、1000、1200、1400、1600或1700个氨基酸。在另一优选实施例中,一段连续氨基酸序列包含突变或功能性突变位点,包括CanIon蛋白质序列中氨基酸的缺失、加入、置换或截短。
在优选的实施方案中,本发明包括分离的、纯化的、或重组的多肽,该多肽包含SEQ ID No 5的一段连续跨距至少6个氨基酸,优选至少8至10个氨基酸,更优选至少12、15、20、25、30、40、50、100、150、200、300、400、500、700、1000、1200、1400、1600或1700个氨基酸,其中所述连续跨距包含至少1、2、3、5或10个SEQ IDNO 5中位置277、338、574、678、680、683、691、692、695、696、697、894、1480、1481、1483、1484、1485、1630、1631、1632、1636、1660、1667、1707、1709上的氨基酸。优选地,所述SEQ ID NO 5的连续跨距包含位置277上的丙氨酸;位置338上的丝氨酸;位置574上的缬氨酸;位置678上的亮氨酸;位置680上的丝氨酸;位置683上的苏氨酸;位置691上的组氨酸;位置692上的丝氨酸;位置695上的丝氨酸;位置696上的丙氨酸;位置697上的异亮氨酸;位置894上的异亮氨酸;位置1480上的赖氨酸;位置1481上的精氨酸;位置1483上的谷氨酸;位置1484上的缬氨酸;位置1485上的异亮氨酸;位置1630上的天冬氨酸;位置1631上的丝氨酸;位置1632上的甲硫氨酸;位置1636上的苏氨酸;位置1660上的丙氨酸;位置1667上的苯丙氨酸;位置1707上的苏氨酸;和/或位置1709上的丙氨酸。还提供了编码任一这些多肽的多核苷酸。
本发明还包括纯化的、分离的、或重组的多肽,此多肽至少包含一段与SEQ ID No5的氨基酸序列或其片段有70、75、80、85、90、95、98或99%的氨基酸相同性的氨基酸序列。
CanIon蛋白质优选分离自人或哺乳类组织样品或由人或哺乳类基因表达。可用此领域已知的常规表达方法制造本发明的CanIon多肽。将编码所需多肽的多核苷酸与适合任何方便宿主的表达载体连接。可用真核生物和原核生物的宿主系统以及一些较常见的系统组合形成重组多肽。再将多肽与裂解细胞或培养基分离,然后纯化至应用所需的纯度。纯化可用本技术领域任何一种已知技术,例如,差别性提取、盐分馏、层析法、离心法等。例如,可参照用于各种蛋白质纯化方法的酶学方法。
另外,通过化学合成制备较短蛋白质片段。或者从人或非人动物的细胞或组织提取本发明的蛋白质。蛋白质的纯化方法是本领域技术人员所知的,包括使用去污剂或离液剂破碎粒子,然后用差别性提取,通过离子交换层析法、亲和层析法、密度沉降以及凝胶电泳分离多肽。
可采用包括SEQ ID No 4在内的CanIon cDAN表达CanIon蛋白质和多肽。用常规克隆技术将编码待表达的CanIon蛋白质或多肽的核酸操作性连接于表达载体的启动子。表达载体中的CanIon插入片段可包含CanIon蛋白质或其部分的全部编码序列。
表达载体是任何一种本技术领域已知的哺乳动物、酵母、昆虫或细菌表达系统。有许多供应商提供市售载体和表达系统,包括Genetics Institute(Cambridge,MA)、Stratagene(La Jolla,California)、Promega(Madison,Wisconsin)以及Invitrogen(San Diego,California)。若需要增强表达和有利于蛋白质的适当折叠,使密码子前后序列和该序列的密码配对对于导入表达载体的具体表达生物体最优化,Hatfield等的美国专利US5,082,767对此进行了解释,具体可参考本文的引用文献。
在一实施例中,CanIon cDAN的全部编码序列通过cDAN的聚腺苷酸化(poly A)信号可操作性连接于表达载体的启动子。此外,如果编码CanIon蛋白质一部分的核酸缺少用作起始位点的甲硫氨酸,就要用常规技术将起始甲硫氨酸导入该核酸的第一个密码子旁边。类似地,如果CanIon cDAN的插入片段缺少poly A信号,就要用以下方法将该序列加入到构建物:例如,用Bg1I和Sa1I限制性内切核酸酶从pSG5(Stratagene)剪切下poly A信号,并将该信号掺入哺乳动物表达载体pXT1(Stratagene)中。pXT1含有LTRs和莫洛尼鼠白血病病毒的gag基因的一部分。此构建物内的LTRs位置得以有效地进行稳定转染。此载体包括单纯疱疹胸苷激酶启动子和选择新霉素基因。按以下方法得到编码CanIon蛋白质或其部分的核酸:采用与CanIon cDAN或其部分互补的寡核苷酸引物,通过PCR技术扩增从含有SEQ ID No 5的CanIon cDAN以及含有掺入到相应cDAN 3’引物5’端的5’引物和Bg1II的Pst I限制性内切酶序列的细菌载体获得编码Canlon蛋白质或其部分的核酸,小心要确保编码CanIon蛋白质或其部分的序列与poly A信号置于适当的位置。将最终PCR反应所得的纯化片段用Pst I消化,用外切酶形成平端,用Bg1 II消化、纯化并与pXT1连接,这时该片段含有poly A信号,并用Bg1II消化。
在产品说明书列出的条件下用脂质转染试剂(Life Technologies,Inc.,GrandIsland,New York)将已连接的产品转染到小鼠NIH33T3细胞中。转染细胞在600ug/mlG418(Sigma,St.Louis,Missouri)生长后,选择阳性转染子。
以上步骤也可用于表达负责可检测表型的突变CanIon蛋白质或其部分。
用常规纯化技术纯化表达的蛋白质,如硫酸钠沉淀或基于大小或电荷的层析分离。也可用标准免疫层析技术纯化核酸插入片段编码的蛋白质。在这些步骤中,将含有表达的CanIon蛋白质或其部分的溶液如细胞提取物加到有抗CanIon蛋白质或其部分抗体的层析柱,以附着于层析基质上。表达的蛋白质可与免疫层析柱结合。之后,洗涤此柱,除去非特异性结合蛋白。再用标准技术使特异性结合的表达蛋白质层析柱释放下来,并回收。
为了证实CanIon蛋白质或其部分的表达,将含有编码CanIon蛋白质或其部分的插入片段的表达载体的宿主细胞的表达的蛋白质,与含有无插入片段的表达载体的宿主细胞表达的蛋白质进行比较。含有插入片段的表达载体的细胞样品存在一条带,而含有无插入片段的表达载体的细胞样品则没有此条带,这表明CanIon蛋白质或其部分得到表达。通常可以预测CanIon蛋白质或其部分的条带具有迁移性。然而,由于糖基化、遍在蛋白化(ubiquitination)或酶切割等修饰,条带所具有的迁移性可能与预测值不同。
以下叙述能够特异性识别表达的CanIon蛋白质或其部分的抗体。
如果不可能制备抗体,可将编码CanIon蛋白质或其部分的核酸导入设计采用嵌合多肽进行的纯化方案的表达载体中。在这样的策略中,将编码CanIon蛋白质或其部分的核酸与编码嵌合体另一半的基因一起读框内插入。嵌合体的另一半是β-球蛋白或镍结合多肽编码序列。采用具有抗β-球蛋白或结合镍的抗体的层析基质纯化该嵌合蛋白。在β-球蛋白或镍结合多肽与CanIon蛋白质及其部分之间构建了一蛋白酶切割位点。故通过蛋白酶消化可使嵌合体的两个多肽互相分离。
一种用于产生β-球蛋白嵌合蛋白质的表达载体是编码兔β-球蛋白的pSG5(Stratagene)。兔β-球蛋白基因的内含子II有利于剪切表达的转录物,而将聚腺苷酸化信号导入该构建物可提高表达水平。分子生物学的技术人员对这些技术非常熟悉。标准方法参见Davis等(1986年)叙述的方法,而Stratagene,Life Technologies,Inc.或Promega等公司也提供了其它方法。此外,还可用体外翻译系统如体外ExpressTM翻译试剂盒(Stratagene)从该构建物制备多肽。
结合本发明CanIon多肽的抗体
可使用任何一个CanIon多肽或整个蛋白质来制备能与所述表达的CanIon蛋白质或其片段特异性结合的抗体。
本发明的一种抗体组合物能够与SEQ ID No 5的CanIon蛋白质的变体特异性或选择性结合。特异性结合CanIon的抗体组合物在酶联免疫吸附试验(ELISA)、放射免疫试验(RIA)或其它基于抗体的结合试验中与CanIon蛋白质第一全长变体的结合亲和力必须比与CanIon蛋白质第二全长变体大至少5%、10%、15%、20%、25%、50%、100%。
在一优选实施例中,本发明涉及能够选择性结合含有表位的多肽的多克隆或单克隆抗体组合物,所述多肽包含SEQ.2d No.5的一段连续跨距至少6个,优选至少8至10个氨基酸,更优选至少12、15、20、25、30、40、50、100、150、200、300、400、500、700、1000、1200、1400、1600或1700个氨基酸,其中所述连续跨距包含至少1、2、3、5或10个SEQ ID NO 5中位置277、338、574、678、680、683、691、692、695、696、697、894、1480、1481、1483、1484、1485、1630、1631、1632、1636、1660、1667、1707、1709上的氨基酸。
可以用任何CanIon多肽或完整的蛋白质来产生能够特异性结合表达的CanIon蛋白质或其片段的抗体。
一个表位可包含至少3个空间构象氨基酸,该构象对该表位是唯一的。通常,一个表位包含至少6个这样的氨基酸,较常见至少8-10个这样的氨基酸。在优选实施例中,抗原表位包含的氨基酸数目是3和50之间的任何一个整数。通过常规方法可制备有表位功能的片段。可用Jmeson-Wolf抗原分析法确定表位,例如,用计算机程序PROTEAN以缺失参数来确定表位(Version 4.0Windows,DNASTAR,Inc.,1228South Park Street Madison,WI.)。
本发明还涉及纯化的或分离的抗体,其能够特异性结合突变的CanIon蛋白质、或其含有突变CanIon蛋白质表位的片段或变体。在另一优选实施例中,本发明涉及能够结合多肽的抗体,所述多肽含有至少10个CanIon蛋白质的连续氨基酸以及包含由引起突变的性状编码的至少一个氨基酸。
目前需要的是表达不同种动物的CanIon,不论是野生型或转基因的非人动物或哺乳动物,而不是与抗体结合的,不表达CanIon的动物(即本文所述的CanIon敲除动物)在制备抗体时特别有用。CanIon敲除动物将全部或大部分CanIon蛋白质暴露区识别为外来抗原,从而产生具有较宽CanIon表位阵列的抗体。而且,可用只带有10至30个氨基酸的较小多肽来获得与任何一种CanIon蛋白质的特异性结合。此外,一些动物产生类似抗原序列的CanIon,它们的体液免疫系统会优先识别动物的天然CanIon和此抗原序列之间的差异,并产生针对这些抗原序列中独特位点的抗体。这样一种技术在获得特异性结合任何一种CanIon蛋白质的抗体时特别有用。
按其中一种方案制备的抗体制剂可用于定量免疫试验中,这种试验可测定生物样品中带有抗原的物质的浓度;也可用它们半定量测定或定性鉴定生物样品中存在抗原。这些抗体还可用于杀伤表达此蛋白质的细胞或降低体内此蛋白质水平治疗性组合物中。
本发明的抗体可用本技术领域已知的放射活性、萤光或酶标记之一标记。
所以,本发明涉及一种特异性检测生物样品中存在的本发明CanIon多肽的方法,所述方法包括以下步骤:
a)使生物样品与多克隆或单克隆抗体接触,这些抗体特异性结合含有SEQ ID No5氨基酸序列的CanIon多肽、其肽片段或变体;以及
b)检测所形成的抗原/抗体复合物。
本发明还涉及在体外检测生物样品中存在的本发明CanIon多肽的诊断试剂盒,所述试剂盒包括:
a)多克隆或单克隆抗体,其特异性结合含有SEQ ID No 5氨基酸序列的CanIon多肽、其肽片段或变体,可任选地带有标记;
b)可检测所形成的抗原/抗体复合物的试剂,所述试剂任选地带有标记,或者本身能够被标记的试剂所识别,更特别是,在上述单克隆或多克隆抗体本身未被标记时。
所以,本发明涉及抗体和T细胞抗原受体(TCR),它们能结合本发明的多肽,更具体地说,能结合本发明多肽的表位,包括但不限于IgG(包括IgG1、IgG2、IgG3和IgG4)、IgA(包括IgA1和IgA2)、IgD、IgE、或IgM和IgY。在一优选实施例中,这种抗体是本发明的人抗原结合抗体片段,包括但不限于,Fab、Fab’、F(ab)2和F(ab’)2、Fd、单链Fvs(scFv)、单链抗体、二硫键Fvs(sdFv)以及包含VL或VH区的片段。抗体可来自任何一种动物,包括鸟类和哺乳动物,优选人、小鼠、兔、山羊、豚鼠、骆驼、马或鸡。
包括单链抗体在内的抗原结合抗体片段可只包括可变区,或以下区域的全部或部分的组合:铰链区、CH1、CH2和CH3区。本发明也包括可变区与铰链区、CH1、CH2和CH3区的任意组合。本发明还包括能与本发明多肽特异性结合的嵌合性、人源化、和人单克隆和多克隆抗体。本发明还包括抗本发明抗体的抗独特型抗体。
本发明的抗体可以具有单特异性、双特异性、三特异性或更大的多特异性。具有多特异性的抗体可以对本发明的不同多肽表位具有特异性或者既对本发明的多肽,又对异源组合物如异质性多肽或固体载体材料具有特异性。例如,参见WO 93/17715、WO 92/08802、WO 91/00360、WO 92/05793;Tutt,A.等,J.Immunol.147:60-69页,1991年;美国专利US5,573,920、4,474,893、5,601,819、4,714,681、4,925,648;Kostelny,S.A..等,J.Immunol.,148:1547-1553页,1992年。
通过本发明多肽的表位或带有表位的部分被抗体识别或与抗体特异性结合,可以说明或者确定本发明的抗体。就本发明的分泌性蛋白质而言,这些抗体可特异性结合本发明核酸编码的全长蛋白质、本发明核酸编码的成熟蛋白质(即通过切除信号裂而产生的蛋白质)、本发明核酸编码的信号肽、或者本发明的任何其它多肽。因此,可如本文所述那样确定表位或带有表位的多肽部分,如通过N未端和c未端位置、连续氨基酸残基的大小,或本文所述其它方式(包括序列表)。个体抗体不包括在特异性结合本发明的任何表位或多肽的抗体中。故本发明包括特异性结合本发明特定多肽的抗体,允许排除相同的抗体。
本发明还对本发明抗体的交叉反应性进行叙述和说明。本发明包括不能特异性结合本发明多肽的任何其它类似物、正交物、或同系物的抗体。本发明也包括一些抗体,这些抗体不能结合与本发明多肽的相同性小于95%、小于90%、小于85%、小于80%、小于75%、小于70%、小于65%、小于60%、小于55%、小于50%(用本技术领域或本文所述的方法计算)的多肽。本发明还包括只结合在严格杂交条件下(如以上所述)与本发明的多核苷酸杂交的多核苷酸编码的多肽、。本发明就其结合亲和力而言叙述了本发明的抗体。优选的结合亲和力包括具有解离常数或Kd小于5×10-6M、10-6M、5×10-7M、10-7M、5×10-8M、10-8M、5×10-9M、10-9M、5×10-10M、10-10M、5×10-11M、10-11M、5×10-12M、10-12M、5×10-13M、10-13M、5×10-14M、10-14M、5×10-15和10-15M的亲和力。
本发明的抗体可用于包括但不限于本技术领域已知的纯化、检测以及靶向本发明多肽的方法中,包括体内外诊断和治疗方法。例如,这些抗体可用在免疫试验中定性和定量测定生物样品中本发明多肽的水平。参见Harlow等,抗体:实验手册(ColdSpring Harbor Laboratory Press,第二版,1988年)(引用于本文的参考文献中)。
本发明的抗体可单独使用或与其它组合物结合使用。这些抗体也可在N或c未端重组融合于一异质性多肽或与多肽或其它组合物化学偶联(包括共价和非共价偶联)。例如,本发明的抗体可重组融合或偶联于在检测试验中用作标记的分子以及诸如异质性多肽、药物或毒素等效应分子。参见WO 92/08495、WO 91/14438/、WO 89/12624、美国专利US5,314,995以及欧洲专利EP 0 396 387。
可用本技术领域已知的任何一种合适的方法制备本发明的抗体。例如,将本发明的多肽或其抗原片段给予动物,诱导产生含有多克隆抗体的血清。术语“单克隆抗体”不限于通过杂交瘤技术制备的抗体。术语“抗体”指多肽或由至少一个结合结构域组成的多肽群,其中结合结构域通过抗体分子可变区的折叠形成具有内表面形状和电荷分布与抗原的抗原决定簇特征互补的三维结合空间而形成,从而与抗原发生免疫反应。术语“单克隆抗体”指衍生自一个克隆包括真核生物、原核生物或噬菌体克隆的抗体,而不是指其制备方法。可采用本领域已知的各种技术均制备单克隆抗体,包括杂交瘤、重组和噬菌体展示技术。
杂交瘤技术包括本领域已知的技术(参见Harlow等,1998年;Hammerlin等,1981年)(所述文献列于于本文的参考文献中)。例如,可通过用木瓜蛋白酶(制备Fab片段)或胃蛋白酶(制备F(ab’)2片段)等酶蛋白水解切割从杂交瘤产生的抗体制备Fab和F(ab’)2片段。
此外,可用重组DNA技术或用本技术领域已知的方法通过合成化学制备本发明的抗体。例如,可用本技术领域已知的各种噬菌体展示方法制备本发明的抗体。在噬菌体展示方法中,功能性抗体结构域展示在携带编码抗体功能域的多核苷酸序列的噬菌体颗粒表面。直接用抗原、通常为与固体表面或珠粒结合的或被捕获的抗原,选择文库或组合性抗体文库(例如人或小鼠)中具有所需结合性质的噬菌体。这些方法所用的噬菌体通常是丝状噬菌体,包括带有与噬菌体基因III或基因VIII蛋白质重组融合的Fab、Fv或二硫键稳定的Fv抗体结构域的fd和M13。以下文献叙述了用噬菌体展示方法制备本发明抗体的例子:Brinkman U.等(1995年)、Ames,R.S.等(1995年)、Kettleborough,C.A.等(1994年)、Persic,L.等(1997年)、Burton,D.R.等(1994年)、PCT/GB91/01134、WO 90/02809、WO 91/10737、WO 92/01047、WO 92/18619、WO 93/11236、WO 95/15982、WO 95/20401、以及美国专利US5,698,426、5,223,409、5,403,484、5,580,717、5,427,908、5,750,753、5,821,047、5,571,698、5,427,908、5,516,637、5,780,225、5,658,727和5,733,743(所述文献列于于本文的参考文献中)。
如上述文献所述,选择噬菌体后,可将抗体编码区与噬菌体分离,用于产生整个抗体,包括人抗体或其它任何所需抗原结合片段,和在任何所需宿主包括哺乳动物细胞、昆虫细胞、植物细胞、酵母和细菌中表达。例如,也可用本技术领域已知的方法重组制备Fab、Fab’F(ab)2和F(ab’)2片段,如以下文献所述的方法:WO 92/22324、Mullinax,R.L.等(1992年)、Sawai,H.等(1995年)以及Better,M.等(1988年)(所述文献列于于本文的参考文献中)。
美国专利US4,946,778和5,258,498、Huston等(1991年)、Shu,L.等(1993年以及Skerra,A.等(1988年)叙述了用于制备单链Fvs和抗体的技术的例子。对于某些应用,包括在人体内和体外检测试验等使用的抗体,最好用嵌合性人源化抗体或人抗体。嵌合性抗体的制备方法是本领域所知的,例如,参见Morrison(1985年)、Oi等(1986年)、Gillies,S.D.等(1989年)以及美国专利5,807,715。可用各种技术使抗体人源化,包括CDR-嫁接(欧洲专利EP 0239400、WO 91/09967、美国专利5,530,101和5,585,089)、镶饰(veneering)和重塑(resurfacing)(欧洲专利EP 0 592 106;和EP 0 519 596、Padlan E.A.,(1991年);Studnicka G.M.等(1994年)、RoguskaM.A.等(1994年)以及链改组(chain shuffling)(美国专利5,565,332)。可用本技术领域已知的各种技术,包括上述的噬菌体展示法制备人抗体。还可参看美国专利4,444,887、4,716,111、5,545,806和5,814,318及WO 98/46645、WO 98/50433、WO98/24893、WO 96/34096、WO 96/33735及WO 91/10741(所述文献列于于本文的参考文献中)。
本发明还包括与本发明多肽重组融合或化学偶联的抗体(包括共价和非共价偶联)。这些抗体可对本发明多肽以外的抗原具有特异性。例如,通过将本发明的多肽与针对特定细胞表面受体的特异性抗体融合或偶联,可用这些抗体将本发明的多肽体内靶向特定类型的细胞。利用本技术领域已知的方法还可将与本发明多肽融合或偶联的抗体用于体外免疫试验和纯化方法中。例如,参看上述Harbor等和WO 93/21232、欧洲专利EP 0439095、Naramura,M.等(1994年)、美国专利5,474,981、Gillies,S.O.等(1992年)、Fell,H.P.等(1991年)(所述文献列于于本文的参考文献中)。
本发明也包括组合物,其含有与抗体可变区以外的结构域融合或偶联的本发明多肽。例如,本发明的多肽可与抗体Fc区或其部分融合或偶联。与本发明多肽融合的抗体部分可包含铰链区、CH1区、CH2区和CH3区或全部区域或其部分的任意组合。本发明的多肽可与上述抗体部分融合或偶联,以便用本技术领域已知的方法提高多肽在体内的半衰期或用于免疫试验中。这些多肽也可与上述抗体部分融合或偶联形成多聚物。例如,通过Fc部分之间的二硫键可使与本发明多肽融合的Fc部分形成二聚物。将多肽与IgA和IgM部分融合可形成更高的多聚物。将本发明的多肽与抗体部分融合或偶联的方法是本领域熟知的。例如,参看美国专利5,336,603、5,622,929、5,359,046、5,349,053、5,447,851、5,112,946、欧洲专利EP 0307434、EP 0367166、WO 96/04388、WO 91/06570、Ashkenazi,A.等(1991年)、Zheng,X.X.等(1995年)以及Vil,H.等(1992年)(所述文献列于于本文的参考文献中)。
本发明还涉及作为本发明多肽的激动剂或拮抗剂的抗体。例如,本发明包括完全或部分破坏受体/配体与本发明多肽的相互作用的抗体。本发明包括受体特异性抗体和配体特异性抗体。本发明包括不阻止配体结合但阻止受体活化的受体特异性抗体。可用本文所述的技术或本领域技术人员已知的其它技术确定受体的活化(即发信号)。本发明也包括既阻止配体结合又阻止受体活化的受体特异性抗体。同样,本发明包括与配体结合、阻止此配体与受体结合的中和抗体,以及与配体结合从而阻止受体活化,但不阻止配体与受体结合的抗体。本发明还包括激活受体的抗体。这些抗体可用作受配体介导的受体活化所影响的全部或部分生物活性的激动剂。这些抗体可定为包括本文所述特异活性的生物活性的激动剂或拮抗剂。用本技术领域已知的方法可制备上述激动剂。例如,参看WO 96/40281、美国专利5,811,097;Deng,B.等(1998年)、Chen,Z.等(1998年)、Harrop,J.A.等(1998年)、Zhu,Z.等(1998年)、Yoon,D.Y.等(1998年)、Prat,M.等(1998年)、Pitard,V.等(1997年)、Liautard,J.等(1997年)、Carlson,N.G.等(1997年)、Taryman,R.E.等(1995年)、Muller,Y.A.等(1998年)、Bartunek,P.等(1996年)(所述文献列于于本文的参考文献中)。
如以上所述,利用本技术领域已知的技术可进而用本发明的多肽抗体产生“模拟”本发明多肽的抗独特型抗体。参看Greenspan和Bona,(1989年)、Nissinoff,(1991年)。例如,结合并竞争性抑制多肽多聚化或抑制本发明的多肽与配体结合的抗体,可用于产生“模拟”多肽多聚化或结合域的抗独特型抗体,导致这些抗体与多肽或其配体结合或中和它们。这种中和性抗独特型抗体可用来结合本发明的多肽或其配体/受体,从而阻抑其生物活性。
CanIon相关的双等位标记
本发明双等位标记的优点
与RFLP(限制性片段长度多态性)和VNTR(串联重复序列的可变数目)标记等其它遗传标记相比,本发明的CanIon相关双等位标记有很多重要的优点。
第一代标记是RFLPs,它是修饰限制性片段长度的变异。但用来鉴定和RFLPs分别的方法相对而言比较浪费材料、劳动力和时间。第二代遗传标记是VNTRs,可按小卫星或微卫星将其分类。小卫星是以5-50个重复单位出现的串联性重复的DNA序列,它们沿人类染色体区域分布长0.1-20kb。由于它们存在许多可能的等位基因,它们的信息量非常高。可通过Southern印迹给小卫星记分,以鉴定被测试个体的核酸样品中存在的串联重复的数目。然而,Southern印迹只可能分成104个可能的VNTRs。此外,开发和大量测定RFLP和VNTR标记很费钱费时。
可按RFLPs和VNTRs同样的方法使用单核苷酸多态性或双等位标记,但它们可提供一些优点。SNP集中位于人类基因组中并代表了变异最频繁的类型。估计沿人类基因组的3×109对碱基对分散了107以上数目的位点。因此,SNP以较高频率发生,且与RFLP或VNTR标记相比更加均一,这意味着很可能将在紧靠感兴趣基因座的附近发现这种标记。与VNTR标记相比,SNP不太变化,但会突变得更加稳定。
还有,特征性的单核苷酸多态性的不同形式,如本发明的双等位标记,通常也较容易鉴别因此很容易在常规基础上分型。双等位标记含有基于单核苷酸的等位基因且它们只有两个常见的等位基因,这使得可对它们进行高度平行检测和自动记分。本发明的双等位标记提供了快速、高通量测定大量个体基因型的可能性。
双等位标记集中于基因组中,富含信息并且可大量测定。这些优点加在一起使得双等位标记在遗传研究中极有价值。双等位标记可用于家族连锁研究、等位基因共享法、人群连锁失平衡研究、病例一对照人群或阳性性状和阴性性状人群的关联性研究。本发明一个重要的方面是,双等位标记使得人们可进行关联性研究以鉴定与复杂性状有关的基因。关联性研究检测了非相关病例和对照人群中标记等位基因的频率,且通常被用于检测多基因性状或散发性状。关联性研究可在一般人群中进行,不限于在患病家族的相关个体上进行研究(连锁研究)。可平行筛选不同基因中与疾病或对治疗反应直接相关的双等位标记。这种多基因研究方法是各种人类遗传研究的有力工具,因为它可提供必需的统计学力量以检测多种遗传因子对特定表型、药物反应、散发性状或有着复杂遗传病原学的疾病状态的协同作用。
本发明的候选基因
可采用不同的方法进行关联性研究:基因组宽(genome-wide)关联性研究、候选区域关联性研究和候选基因关联性研究。基因组宽关联性研究依赖于对平均分布并覆盖整个基因组的遗传标记的筛选。候选基因方法根据对遗传标记的研究,所述遗传标记特异性定位于可能与感兴趣性状的生物学途径有关的基因中。在本发明中,CanIon是候选基因。当可获得与某性状的生物学有关的信息时,候选基因分析显然提供了鉴定与该性状有关的基因和基因多态性的捷径。然而,应注意的是,本申请中揭示的所有双等位标记都可用作基因组宽关联性研究的一部分,或者作为候选区域关联性研究的一部分,这种用法在本发明和权利要求中特别提到。
CanIon相关双等位标记和与其有关的多核苷酸
本发明还涉及CanIon相关双等位标记。如本文所用,术语“CanIon相关双等位标记”是指与CanIon基因连锁失平衡的一组双等位标记。术语CanIon相关双等位标记包括称为A1-A17的双等位标记。
本发明的一部分双等位标记列在表2中。还在相关的SEQ ID NO 1-4和6中以单个碱基多态性为特征对它们进行了描述。使得含有一个CanIon双等位标记的多态性碱基的核酸被扩增的引物对列在实施例2的表1中。
17个CanIon相关双等位标记,A1-A17位于CanIon的基因组序列中。双等位标记A12和A16位于CanIon的外显子中。双等位标记A18在CanIon基因侧翼。
本发明还涉及纯化的和/或分离的含有CanIon相关双等位标记多态性碱基的核苷酸序列。在优选的实施方案中,所述双等位标记选自A1-A18及其互补物。序列长8-1000个碱基,优选含有至少8、10、12、15、18、20、25、35、40、50、60、70、80、100、250、500或1000个核苷酸序列的连续核苷酸,所述核苷酸序列选自SEQ IDNO1-4和6或其变体或其互补序列。这些核苷酸序列包含所述双等位标记的等位基因1或2的多态性碱基。任选地,所述双等位标记可在所述多核苷酸中心的6、5、4、3、2或1个核苷酸内,或在所述多核苷酸的中心。任选地,所述连续跨距的3’端可存在于所述多核苷酸的3’端。任选地,双等位标记可存在于所述多核苷酸的3’端。任选地,所述多核苷酸还可包括一标记。任选地,所述多核苷酸可附着在固体支持物上。在另一个实施方案中,以上定义的多核苷酸可单独使用或联合使用。
本发明还涉及纯化的和/或分离的核苷酸序列,该核苷酸序列含有8-1000个连续核苷酸,和/或优选地含有至少8、10、12、15、18、20、25、35、40、50、60、70、80、100、250、500或1000个核苷酸序列的连续核苷酸,所述核苷酸序列选自SEQ IDNO 1-4或其变体或其互补序列。任选地,所述多核苷酸的3’端可位于所述序列中可位于CanIon相关双等位标记上游至少2、4、6、8、10、12、15、18、20、25、50、100、250、500或1000个核苷酸内。任选的,所述CanIon相关双等位标记选自A1-A17。任选的,所述多核苷酸的3’端可位于所述序列中CanIon相关双等位标记上游至少2、4、6、8、10、12、15、18、20、25、50、100、250、500或1000个核苷酸处。任选地,所述多核苷酸的3’端可位于所述序列中CanIon相关双等位标记上游1个核苷酸处。任选地,所述多核苷酸还可包括一标记。任选地,所述多核苷酸可附着在固体支持物上。在另一个实施方案中,上述定义的多核苷酸可单独使用或联合使用。
在优选的实施方案中,包含表2所列双等位标记之一的多态性碱基的序列选自一核苷酸序列,该核苷酸序列含有一段多核苷酸的连续跨距、由该多核苷酸构成、含在该多核苷酸中、或含有该多核苷酸,该多核苷酸选自表1所列作为扩增子的序列的核酸,或其变体或其互补序列。
本发明还涉及编码CanIon蛋白质的核酸,其中所述核酸包含双等位标记多态性碱基,所述双等位标记选自A12-A16及其互补物。
本发明还包括用于鉴定CanIon相关双等位标记上一个或多个核苷酸的相同性的任何多核苷酸的应用或任何多核苷酸。此外,用于鉴定CanIon相关双等位标记上的一个或多个核苷酸相同性的本发明的多核苷酸,包括带有任何进一步限制的多核苷酸,其描述见本公开或以后的那些公开,无论是单独的或以任何形式组合的。任选地,所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述多核苷酸可包含本说明书中所揭示的序列;任选地,所述多核苷酸可由或基本上由本说明书所描述的任何多核苷酸构成;任选地,所述检测可在杂交试验、测序试验、微测序试验或基于酶的错配检测试验中进行;任选地,所述多核苷酸可附着在固体支持物、阵列或可寻址阵列上;任选地,所述多核苷酸可被标记。一种优选的多核苷酸可用于杂交试验以确定CanIon相关双等位标记上所述核苷酸的相同性。另一种优选的多核苷酸可用于测序试验或微测序试验以确定CanIon相关双等位标记上所述核苷酸的相同性。第三种优选的多核苷酸可用于基于酶的错配检测试验以确定CanIon相关双等位标记上所述核苷酸的相同性。第四种优选的多核苷酸可用于扩增含有CanIon相关双等位标记的多核苷酸区段。任选地,任何上述多核苷酸可附着在固体支持物、阵列,或可寻址阵列上;任选地,所述多核苷酸可被标记。
此外,本发明包括供用于扩增含有CanIon相关双等位标记的核苷酸区段的任何多核苷酸的用途或任何多核苷酸。此外,用于扩增含有CanIon相关双等位标记的核苷酸区段的本发明的多核苷酸,包括带有任何进一步限制的多核苷酸,其描述见本公开或以后的那些公开,无论是单独的或以任何形式组合的。任选地,所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述多核苷酸可包含本说明书中所揭示的序列;任选地,所述多核苷酸可由或基本上由本说明书所描述的任何多核苷酸构成;任选地,所述扩增可通过PCR或LCR进行。任选地,所述多核苷酸可附着在固体支持物、阵列或可寻址阵列上;任选地,所述多核苷酸可被标记。
为采用此领域已知的任何方法,可人已公开的序列设计用于含有本发明双等位标记的多核苷酸扩增或测序反应的引物。优选的一组引物是广泛使用的,与选自SEQ IDNO 1-4和6或其互补序列或其变体的序列相同的连续跨距的3’端存在于所述引物的3’端。这种构型使得所述引物的3’端可与所选核酸序列杂交并明显增加此引物扩增或测序反应的效率。可以设计等位基因特异性引物,这样双等位标记的多态性碱基便在所述连续跨距的3’端,此连续跨距位于该引物的3’端。这种等位基因特异性引物倾向于选择性地引导扩增或测序反应,只要将它们和含有存在于双等位标记上的两个等位基因之一的核酸样品一起使用。本发明引物的3’端可位于所述序列中CanIon相关双等位标记上游至少2、4、6、8、10、12、15、18、20、25、50、100、250、500或1000个核苷酸内,适合它们在测序、扩增或定位新序列或标记应用的在任何其它位置上。因此,另一组优选的扩增引物包括分离的多核苷酸,该多核苷酸基本上由选自SEQID NO 1-4和6或其互补序列或其变体的序列中8-50个核苷酸的连续跨距构成,其中,所述连续跨距的3’端位于所述多核苷酸的3’端,其中所述多核苷酸的3’端位于所述序列中CanIon相关双等位标记上游。优选地,那些扩增引物包含选自序列B1-B17和C1-C17的序列。其3’端位于CanIon双等位标记上游1个核苷酸处的引物在微量排序试验中有特殊用途。优选的微测序引物描述在表4中。任选地,所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,微测序引物选自核苷酸序列D1-D18和E1-E18。
为采用此领域已知的任何方法,尤其是可测试本文公开的标记是否存在的方法,可从公开的序列设计本发明的探针。用此领域已知的任何方法可设计一组优选用于本发明杂交试验的探针,这样它们在任何特定的试验条件下可选择性地结合双等位标记的一个等位基因,而不于另一个结合。优选的杂交探针包含所述双等位标记的等位基因1或等位基因2的多态性碱基。任选地,所述双等位标记可在所述杂交探针的中央6、5、4、3、2或1个核苷酸内,或者在所述探针中央。在一个优选的实施方案中,所述探针选自序列P1-P18的各个序列以及它们的互补序列的各个序列。
应注意,本发明的多核苷酸不限于具有围绕序列表所列多态性碱基的精确的侧接序列。当然,应懂得,围绕双等位标记的侧接序列可根据它们预期的用途伸长或缩短至合适的程度,本发明特别考虑了这种序列。连续跨距以外的侧翼区不必与实际产生在病人中的天然侧翼序列同源。特别考虑了,与所述核苷酸预期的用途相一致的核苷酸序列的加入。
可标记引物和探针或固定在如“寡核苷酸探针和引物”一节中所述的固体支持物上。
附着在固体支持物上的本发明的多核苷酸包括带有本文所述或以后那些公开所述的任何进一步限制的多核苷酸,无论是单独的或以任何形式组合的。任选地,所述多核苷酸可一个一个单独附着在一个固体支持物上,或者以至少2、5、8、10、12、15、20或25个本发明的不同多核苷酸为一组附着在一个固体支持物上。任选地,本发明的那些多核苷酸以外的多核苷酸可以像本发明的多核苷酸一样附着在相同的固体支持物上。任选地,当多个多核苷酸附着到一个固体支持物时,它们可附着在随机位置或排成整齐的阵列。任选地,所述整齐的阵列是可寻址的。
本发明还包括诊断试剂盒,它含有一种或多种本发明的多核苷酸和部分或全部必须的试剂,以及通过鉴定CanIon相关双等位标记上核苷酸的相相同性给受试者作基因型分析的说明书。该试剂盒的多核苷酸可任选地附着到固体支持物上,或者成为多核苷酸阵列或可寻址阵列的一部分。用此领域已知的方法该试剂盒可用来鉴定标记部位核苷酸的相同性,这些方法包括但不限于测序试验、微测序试验、杂交试验或基于酶的错配检测试验。
重新鉴定双等位标记的方法
许多方法都可用来筛选基因组片段的单核苷多态性,如与寡核苷酸探针差异性杂交、凝胶电泳测量迁移率的变化或扩增核酸的直接排序。优选的鉴定双等位标记的方法包括适当数量的非相关个体的基因组DNA片段的比较性测序。
在第一个实施方案中,将来自非相关个体的DNA样品合并在一起,然后扩增感兴趣的基因组DNA并测序。然后分析由此获得的核苷酸序列以鉴定显著的多态性。这种方法一个主要的优点是,将DNA样品合并在一起大大减少了必须进行的DNA扩增反应和测序反应的数量。此外,该方法足够敏感,因此,由此方法获得的双等位标记常常证明用于进行相关研究的较少见的等位基因有足够的频率。
在第二个实施方案中,所述DNA样品不合并在一起,因此扩增和测序是分开进行的。当需要鉴定双等位标记以在候选基因内进行相关研究时,这种方法通常是优选的。可对相关性较高的基因区域(如启动子区域或外显子区域)进行筛选有无双等位标记。在进行相关研究时,用这种方法获得的双等位标记可能显示出较低的信息度,例如,其较少见的等位基因的频率可小于约10%。然而,这种等位基因却带有足够的信息以进行相关研究,同时,在本发明的基因组分析研究中,带有较少信息的双等位标记在某些情况下可直接鉴定致病性突变,根据其外显率,这些突变可能是稀有突变。
以下是对本发明者为鉴定本发明的双等位标记所使用的优选方法的各种参数的描述。
基因组DNA样品
可产生本发明双等位标记的基因组DNA样品最好获自非相关的个体,这些个体对应于已知民族背景的异质性人群。可获得DNA样品的个体数目可有较大变化,优选约100-1000,更优选约50-200名个体。优选从至少约100名个体收集DNA样品以在给定人群中获得足够的多态性多样性,以便鉴定尽可能多的标记并产生统计学上显著的结果。
就可用于分析的基因组DNA的来源,任何试验样品都可被冷冻而没有任何特殊限制。这些试验样品包括可用于本文描述的本发明的方法进行测试的生物样品,其中包括人和动物的体液,如全血、血清、血浆、脑脊液、尿液、淋巴液和呼吸道、肠道和生殖道的各种外分泌物、泪液、唾液、乳汁、白血细胞、骨髓瘤等;生物液体,如细胞培养上清液;固定的组织标本,包括肿瘤和非肿瘤组织以及淋巴结组织;骨髓抽出物和固定的细胞标本。用于本发明的基因组DNA的优选来源是各个献血员的外周静脉血。从生物样品制备基因组DNA的技术是精通的技术人员熟知的。在实施例1中提供了优选实施方案的细节。此领域的技术人员可选择扩增合并或未合并的DNA样品。
DNA扩增
通过使用DNA扩增法有助于鉴定基因组DNA样品中的双等位标记。可将DNA样品合并或不合并进行扩增步骤。DNA扩增技术是此领域的技术人员熟知的。
可用于本发明内容的扩增技术包括但不限于EP-A-320308、WO 9320227和EP-A-439182中所描述的连接酶链式反应(LCR)、Guatelli J.C.等(1990)和ComptonJ.(1991)所描述的聚合酶链式反应(PCR、RT-PCR)和基于核酸序列的扩增技术(NASBA)、欧洲专利申请4544610号所描述的Q-β扩增、Walker等(1996)和EP A 684315所描述的链置换扩增以及PCT公布WO 9322461所描述的靶介导的扩增。
LCR和Gap LCR是指数扩增技术,两者都依赖于DNA连接酶以将毗邻的引物退火成为DNA分子。在连接酶链式反应(LCR)中,采用的探针对包括两个主要探针(primaryprobe)(第一和第二探针)和两个次要探针(secondary probe)(第三和第四探针),这些探针的用量都应超过靶子的摩尔量。第一探针与靶链的第一区段杂交,第二探针与靶链的第二区段杂交,由于第一区段和第二区段是邻接的,因此主要探针以5’磷酸-3’羟基关系相互邻接,这样连接酶可将这两个探针共价融合或连接到融合的产物中。此外,第三(次要)探针和第四(次要)探针可以同样的邻接方式分别与第一探针的一部分和第二探针的一部分杂交。当然,如果靶子最初是双链的,则次要探针也将首先与靶子的互补物链交。一旦主要探针连接的链与靶链分离,它将和第三和第四探针杂交,它们可被连接形成互补物:次要连接产物。重要的是应认识到,所述连接产物与靶子或其互补物在功能上是等价的。通过重复杂交和连接循环,可实现对靶序列的扩增。多元LCR的方法也有描述(WO 9320227)。缺口LCR(GLCR)是LCR的一种模式,其中的探针不是毗邻的,而是被2-3个碱基分隔。
为扩增mRNA,本发明提供了以下几种方法:在聚合酶链式反应(RT-PCR)之后将mRNA反转录成cDNA;或者如美国专利5,322,770所述在这两个步骤中使用一种酶;或者用Marshall等(1994)描述的不对称缺口LCR(RT-AGLCR)。AGLCR是对GLCR的修饰,它可扩增RNA。
PCR技术是用于本发明的优选扩增技术。此领域的技术人员熟悉各种PCR技术。为回顾PCR技术,可参见White(1997)题为“PCR Methods and Applications”的出版物(1991,冷泉港实验室出版社)。在这些PCR方法中,需在合适制备的核酸样品中加入待扩增的核酸序列每一侧的PCR引物,同时需要加入dNTPs和耐热的聚合酶,如Taq聚合酶、Pfu聚合酶或Vent聚合酶。样品中的核酸被变性,同时PCR引物与样品中互补的核酸序列特异性杂交。杂交的引物被延长。然后开始另一次变性、杂交和延伸循环。该循环被重复多次以产生扩增的片段,该片段含有引物位点之间的核酸序列。还有一些专利也描述了PCR,它们包括美国专利4,683,195;4,683,202;以及4,965,188,在此将其全文并入以供参考。
PCR技术是用来鉴定新的双等位标记的优选扩增技术。实施例2提供了适合本发明目的的PCR反应的典型例子。
本发明的一个方面是扩增人类CanIon基因的方法,尤其是扩增以下片段:测试样品中SEQ ID NO 1-3的基因组序列或SEQ ID NO 4的cDNA序列或其片段或变体的方法,优选使用PCR。该方法包括以下步骤:
a)使试验样品与含有一对上述扩增引物的扩增反应试剂接触,所述引物位于待扩增的多核苷酸区域两侧;以及
b)任选地检测扩增产物。
本发明还涉及用来扩增CanIon基因序列的试剂盒,特别涉及用来扩增测试样品中SEQ ID NO 1-3的部分基因组序列或SEQ ID NO 4的cDNA序列或其变体的试剂盒,其中所述的试剂盒包括:
a)一对位于待扩增的CanIon区域两侧的寡核苷酸引物;
b)任选地进行上述扩增反应所需的试剂。
在上述扩增方法和试剂盒的一个实施方案中,扩增产物是通过和标记的探针杂交而检测的,该探针含有与被扩增的区域互补的序列。在上述扩增方法和试剂盒的另一个实施方案中,引物包括选自核苷酸序列B1-B17、C1-C17、D1-D17和E1-E18的序列。
在本发明的第一个实施方案中,双等位标记是用本发明者创建的基因组序列信息鉴定的。被测序的基因组DNA片段被用来设计引物以扩增500bp的片段。这些500bp的片段是从基因组DNA扩增的并且对其双等位标记进行了扫描。可用OSP软件(Hillier L.和Green P.,1991)设计引物。所有引物在特异性靶碱基上游可含有常见的作为排序引物的寡核苷酸尾巴。此领域那些技术人员对于可用于这些目的的引物延伸是熟悉的。
用于扩增编码CanIon基因的基因组序列的优选引物,集中在该基因的启动子、外显子和剪切位点。如果双等位标记定位在该基因的这些功能区域内,则它们很可能成为致病性突变。本发明优选的扩增引物包括核苷酸序列B1-B17和C1-C17,它们将详细列在实施例2的表1中。(原文第57页)
扩增的基因组DNA的测序以及单一核苷酸多态性的鉴定
然后用熟练技术人员已知的并可获得的方法测序按上述产生的扩增产物。DNA测序的方法要么使用双脱氧介导的方法(Sanger法),要么使用了此领域一般技术人员都知道的Maxam-Gilbert法。例如,这些方法见Sambrook等(1989)描述。可供选择的方法还包括Chee等(1996)描述的高密度DNA探针阵列杂交。
较好地,可用染料-引物(dye-primer)循环测序方法对扩增的DNA进行自动双脱氧终止子测序。将测序反应的产物在测序凝胶上跑电泳,并用凝胶图象分析检测序列。多态性研究是根据在同一位置的不同碱基在电泳图中产生的叠加峰。由于各个双脱氧终止子都被不同的荧光分子标记,与一个双等位基因位点相对应的两个峰有不同的颜色,此颜色与序列上相同位置的两个不同的核苷酸相对应。然而,由于背景噪音这两种峰的出现可能是人为因素造成的。为排除这种人为因素,对这两条DNA链测序并比较各个峰。为确定是多态序列,必须检测两条链上的多态性。
上述过程使那些含有双等位标记的扩增产物得以鉴定。此测定通过测序100名个体的合并物将检测较小等位基因的双等位多态性频率限制在约为0.1,如通过测序已知等位基因频率的合并物所验证的那样。然而,超过90%的用这种合并法测得的较小等位基因的双等位多态性的频率高于0.25。因此,用这种方法选出的较小等位基因的双等位标记的频率至少为0.1,同时较大等位基因的频率小于0.9。优选较小等位基因的此频率至少为0.2,较大等位基因的频率小于0.8,更加优选较小等位基因的此频率至少为0.3,较大等位基因的频率小于0.7,这样杂合性速度大于0.18,较好大于0.32,最好大于0.42。
在另一个实施方案中,双等位标记是通过对各个DNA样品测序进行检测的,这种较小等位基因的双等位标记的频率可小于0.1。
本发明双等位标记的验证
上述多态性通过验证人群中两种等位基因的存在而评价它们作为遗传标记的用途。上述双等位标记的验证是通过用本发明的方法给一组个体作基因分型而实现并证明两种等位基因都存在的。微测序法是等位基因分型的优选方法。测定基因型的步骤的验证可在该组中各个个体的个体样品上进行,或者对一名以上个体的合并样品作基因分型。如果个体是所述等位基因的杂合子,则该组可少至只有一名个体。优选此组含有至少三名个体,最好是5或6名个体,这样一次验证试验就更有可能验证多个被测的双等位标记。然而,应注意,当在个体数少的组中进行验证试验时,如果取样错误而没有一名被测个体带有两个等位基因之一,则会导致假阴性结果。因此,与证明在序列的某特定位点存在真正的双等位标记相比,此验证过程在证明具体的最初结果是人为因素造成的时用处较小。本发明所有测定基因型、单倍体型、关联性和相互作用研究方法,都可任选地单独用已验证的双等位标记进行。
评价本发明双等位标记的频率
通过测定在双等位标记位置上出现最少见的等位基因的频率,可进一步评价已验证的双等位标记作为遗传标记的用途。这种较少见的等位基因的频率越高,则该双等位标记在关联性和相互作用研究中就越有用。对最少见的等位基因的测定是用本发明的方法确定一组个体的基因型并证明两个等位基因都存在而实现的。这种以基因分型步骤进行的频率测定可在该组中各个体的个体样品上进行,或者对一名以上个体的合并样品作基因分型而进行。所述组必须足够大以代表整个人群。较好的是该组包括至少20名个体,更好包括至少50名个体,最好包括至少100名个体。当然,组越大则频率测定的准确性就越高,因为这可降低取样误差。较少见等位基因的频率为30%或更高的双等位标记称为“高质量的双等位标记”。本发明所有的基因分型、单倍型、关联性和相互作用研究的方法都可任选地单独用高质量的双等位标记进行。
鉴定个体双等位标记基因型的方法
提供了就本发明的一个或多个双等位标记确定生物样品基因型的方法,所有这些方法都可在体外进行。这些测定基因型的方法包括用此领域已知的任何方法测定CanIon双等位标记位置上核苷酸的相同性。在测定已知与其给定性状有关的双等位标记的等位基因时,发现这些方法在关联性研究中可用来确定病例-对照(case-control)人群和个体的基因型,为此测定了存在于个体基因组中的双等位标记的两份拷贝,因此可将个体分为特定等位基因的纯合或杂合个体。
这些测定基因型的方法可个体核酸样品或合并的DNA样品上进行。
可用上述类似的方法测定基因型以鉴定双等位标记,或者用其它测定基因型的方法,比如下面描述的方法。在优选的实施方案中,对不同个体的扩增的基因组片段的比较,可用来鉴定新的双等位标记,而在诊断和关联性研究应用中微测序方法则可用来确定已知的双等位标记的基因型。
在本发明的一个实施方案中包括测定基因型的方法,该方法包括确定生物样品中CanIon相关双等位标记或其互补物上核苷酸的相同性;任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,其中所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,其中所述生物样品来自单个个体;任选地,对所述双等位标记上所述核苷酸的相同性进行了检测以确定所述双等位标记两个拷贝在所述个体的基因组中的存在情况;任选地,其中所述生物样品来自多个个体;任选地,本发明测定基因型的方法包括在本说明书中所描述的具有一步限制的方法,或以后单独说明或合在一起说明的方法;任选地,所述方法是在体外进行的;任选地,在所述确定步骤之前还包括扩增含有该双等位标记的序列部分;任选地,其中所述扩增是通过PCR、LCR、或在宿主细胞中复制包含复制来源和所述片段的重组载体;任选地,其中所述确定步骤是通过杂交试验、测序试验、微测序试验或基于酶的错配检测试验进行的。
供测定基因型的核酸的来源
纯化或非纯化形式的任何核酸来源都可用作起始核酸,只要它含有或怀疑含有特定的所需核酸序列。DNA或RNA可如上所述的细胞、组织、体液等中提取。由于用于本发明基因型测定方法的核酸可来源于任何哺乳动物,从其取得核酸的试验受试者和个体通常理解为人。
含有双等位标记的DNA片段的扩增
提供了用来扩增含有一个或多个本发明双等位标记的核苷酸区段的方法和多核苷酸。应该知道,含有双等位标记的DNA片段的扩增可用于各种方法和各种目的,不限于基因型的测定。然而,许多测定基因型的方法,尽管不是所有的方法,需要对带有感兴趣的双等位标记的DNA区域事先进行扩增。这种方法特别增加了跨越该双等位标记或包括该位点的序列和位于远离于它或最接近它的序列的含量或总数。诊断试验也可能依赖于带有本发明双等位标记的DNA区段的扩增。DNA的扩增可用本领域已知的任何方法实现。扩增技术的描述见上面题为“DNA扩增”的章节中。
一些扩增方法特别适合检测单一核苷酸多态性,并可同时扩增靶序列和鉴定所述多态性核苷酸,这将在下面作进一步描述。
如上所述,通过鉴定双等位标记可设计出合适的寡核苷酸,可用作扩增含有本发明双等位标记的DNA片段的引物。可用本文所描述的最初用来发现新的双等位标记的引物进行扩增,或者用任何一组可扩增含有本发明双等位标记的DNA片段的引物。
在一些实施方案中,本发明提供了用来扩增含有一种或多种本发明双等位标记的DNA片段的引物。优选的扩增引物列在实施例2中。应该知道,所列引物仅仅是作为示范,其它任何可产生含有一种或多种本发明双等位标记的扩增产物的引物组都可以使用。
引物的间隔决定了待扩增的区段长度。在本发明中,带有双等位标记的扩增区段至少约25bp-35kbp。25-3000bp的扩增片段是典型的,50-1000bp的片段是优选的,100-600bp的片段是最优选地。应该知道,双等位标记的扩增引物可以是任何能特异性扩增带有所述标记的DNA片段的序列。扩增引物可被标记或被固定在“寡核苷酸探针和引物”一章中所描述的固体支持物上。
测定DNA样品中双等位标记基因型的方法
可用此领域已知的任何方法来鉴定存在于双等位标记位点上的核苷酸。由于本发明已经鉴定并描述了待检测的双等位标记的等位基因,对此领域技术人员而言,这种检测将十分简单,可用众多技术中的任何一种。许多测定基因型的方法需要对带有感兴趣的双等位标记的DNA区域进行预扩增。虽然目前优选对靶子或信号的扩增,但本发明测定基因型的方法还包括不需要进行扩增的超灵敏的检测方法。可采用此领域技术人员熟知的方法来检测双等位多态性,这些方法包括,如常规的斑点印迹分析法、Orita等(1989)描述的单链构象多态性分析(SSCP)、变性梯度凝胶电泳(DGGE)、异质双链体分析、错配剪切检测和其它如Shiffield等(1991)、white等(1992)、Grompe等(1989和1993)描述的常规技术。其它用来测定存在于特定多态性位点的核苷酸相同性的方法,采用了专门的如美国专利4,656,127所描述的外切核酸酶限制性核苷衍生物。
优选的方法包括用测序试验、基于酶的错配检测试验或杂交试验直接测定存在于双等位标记位点的核苷酸相同性。以下是一些优选方法的描述。特别优选的方法是微测序技术。术语“测序”用在这里通常是指双链体引物/模板复合物的聚合酶延伸,包括传统的测序和微测序。
1)测序试验
可通过测序的方法测定存在于多态性位点的核苷酸。在优选的实施方案中,在测序之前对DNA样品按上述方法进行PCR扩增。DNA测序方法描述见“扩增的基因组DNA的测序以及单一核苷酸多态性的鉴定”。
优选地,最好用染料-引物循环测序法对扩增的DNA进行自动双脱氧终止子测序反应。通过序列分析可鉴定存在于双等位标记位点的碱基。
2)微测序试验
在微测序方法中,用单一核苷酸引物延伸反应检测了靶DNA多态性位点的核苷酸。此方法包括合适的微测序引物,该引物恰在靶核酸中感兴趣的多态性碱基的上游杂交。用聚合酶来特异性延伸与该多态性位点的核苷酸互补的引物的3’端,该引物带有一个ddNTP(链终止子)。然后用任何合适的方法检测掺入的核苷酸的相同性。
通常,微测序反应是用荧光ddNTPs进行的,并通过在ABI377测序仪上电泳以分析延伸的微测序引物,从而可确定如EP 412883所述的掺入的核苷酸的相同性,在此将其全文并入以供参考。或者可使用毛细管电泳以同时进行大量试验。实施例4提供了可用于本发明中的典型微测序方法的例子。
可用不同的方法来标记并检测ddNTPs。Chen和Kwok(1997)和Chen等(1997)已经描述了基于荧光共振能量转移的均相检测法。在该方法中,当等位基因染料标记的双脱氧核苷三磷酸和改进的Taq聚合酶存在时,将含有多态性位点的扩增的基因组DNA片段和5’-荧光素标记的引物一起培育。染料标记的引物被存在于模板上的等位基因特异性染料-终止子延伸了一个碱基。在测定基因型的反应结束时,无需分离或纯化,可直接分析反应混合物中两种染料的荧光强度。所有这些步骤可在同一试管中进行,并实时监测荧光的变化情况。或者,可用MALDI-TOF质谱仪分析延伸的引物。通过加到微测序引物上的物质鉴定多态性位点上的碱基(参见Haff和Smirnov,1997)。
用已经建立的微测序法或其发展产生的方法,可实现微测序。可供选择的方法包括几种固相微测序技术。基础微测序方法和上面的描述相同,只是该方法以非均相试验进行,其中引物或靶分子被固定或捕获在固体支持物上。为简化引物分离和末端核苷酸加成分析,使寡核苷酸附着于固体支持物上或用亲和分离以及聚合酶延伸的方法进行修饰。可用许多不同的方法修饰合成寡核苷酸的5’端和内部核苷酸以进行不同的亲和分离方法,如生物素化。如果在寡核苷酸上使用单一的亲和基团,则可将该寡核苷酸可与掺入的终止子试剂分离。这样就不必进行物理分离或大小分离。如果采用多种亲和基团则可将一种以上的多核苷酸与终止子试剂分离并同时进行分析。这样在每次延伸反应中就可分析几种核酸或多个核酸序列信息。亲和基团不一定要在引导的寡核苷酸上,但可以在所述模板上。例如,可通过生物素化的DNA和包被链霉亲和素的微量滴定孔或包被亲和素的聚苯乙烯颗粒之间的相互反应以进行固定。用同样的方法,寡核苷酸或模板可以高密度模式附着于固体支持物。在这种固相微测序反应中,掺入的ddNTPs可以用放射性同位素标记(Syvanen,1994)或连接于荧光素(Livak和Hainer,1994)。对用放射性标记ddNTPs的检测可通过以闪烁为基础的技术实现。对连接有荧光素的ddNTPs的检测可根据与偶联碱性磷酸酶的抗荧光素抗体结合,然后与发色底物(如p-硝酸苯基磷酸)一起培育。其它可能的受体检测对包括:与二硝基苯基(DNP)和抗DNP碱性磷酸酶偶联物连接的ddNTP(Harju等,1993),或生物素化的ddNTP和与辣根过氧化物酶偶联链霉亲和素,以邻-苯二胺作为底物(WO 92/15712,在此将其全文并入以供参考)。作为另一种固相微测序方法,Nyren等(1993)描述了一种依据酶促发光无机磷酸盐检测试验(ELIDA)检测DNA聚合酶活性的方法。
Pastinen等(1997)描述了多元检测单一核苷酸多态性的方法,其中对寡核苷酸阵列应用了该固相微测序原理。下面进一步描述附着于固体支持物上的高密度DNA探针阵列(DNA芯片)。
在本发明的另一方面,提供了通过进行微测序试验以测定一种或多种本发明的双等位标记的基因型的多核苷酸和方法。优选的微测序引物包括D1-D18和E1-E18的核苷酸序列。应该知道,实施例4中列出的微测序引物仅仅是作为例子,任何3’端紧靠此种多态性核苷酸的引物都可使用。类似地,应该知道,可对本发明的任何双等位标记或双等位标记的任何组合进行微测序分析。本发明的一个方面是一种固体支持物,它含有一种或多种实施例4所列的微测序引物,或含有其至少8、12、15、20、25、30、40或50个连续核苷酸的片段,片段的长度与所述引物相一致且具有紧靠相应双等位标记上游的3’末端,以检测位于双等位标记位点的核苷酸的相同性。
3)基于聚合酶和连接酶的错配检测试验
在本发明一个方面提供了通过基于聚合酶和/或连接酶的错配检测试验,测定生物样品中一种或多个本发明双等位标记的等位基因的多核苷酸和方法。这些试验基于聚合酶和连接酶的专一性。聚合反应对扩增引物的3’端的正确碱基配对有特别严格的要求,而且与靶DNA序列杂交的两个寡核苷酸的结合对靠近连接位点的错配非常敏感,尤其是在3’端。在上面“含有双等位标记的DNA片段的扩增”一节中还描述了扩增含有本发明双等位标记的DNA片段的方法、引物和各种参数。
等位基因特异的扩增引物
通过等位基因特异的扩增也可实现对双等位标记的两个等位基因之间的区别,通过选择性策略,扩增了一个等位基因而不扩增另一个等位基因。就等位基因特异扩增而言,至少一对引物中的一个应与含有本发明双等位标记多态性碱基的CanIon基因区域充分互补,以便与其杂交并引发扩增反应。这种引物能够区别双等位标记的两个等位基因。
这是通过将多态性碱基置于一个扩增引物的3’端而实现。因为延伸是从该引物的3’端形成的,该位置上或其附近位置的错配对扩增有抑制作用。因此,在合适的扩增条件下,这些引物只引导在它们的互补等位基因上扩增。错配的精确位置的确定和相应的试验条件是此领域普通技术人员熟知的。
以连接/扩增为基础的方法
“寡核苷酸连接试验”(OLA)采用了两种寡核苷酸,设计它们能够与靶分子一条链的邻近序列杂交。其中一种寡核苷酸生物素化,另一种被可检测地标记。如果在靶分子中找到了精确互补的序列,则此寡核苷酸将杂交,这样它们的末端靠近产生可被捕获和检测的连接底物。OLA能够检测单一核苷酸多态性,并且如Nickerson等(1990)所述,与PCR联用是有益的。在此方法中,PCR被用来获得靶DNA的指数性扩增,然后用OLA对其进行检测。
其它特别适合检测单一核苷酸多态性的扩增方法包括LCR(连接酶链式反应)和缺口LCR(GLCR),这已在“DNA扩增”一节中描述过。LCR使用了两对探针以指数性扩增特定的靶标。选择每对寡核苷酸的序列以使其可与该靶标的同一链的邻近序列杂交。这种杂交形成了模板依赖性连接酶的底物。根据本发明,可用带有双等位标记位点同一链的近端序列和远端序列的寡核苷酸进行LCR。在一个实施方案中,将设计出包括所述双等位标记位点的两个寡核苷酸之一。在这一实施方案中,选择反应条件,这样,只有当靶分子含有或缺乏与该寡核苷酸上双等位标记互补的特异性核苷酸时这些寡核苷酸才可连接在一起。在另一个实施方案中,所述寡核苷酸不包括此双等位标记,这样当它们与靶分子杂交时,将产生如WO 90/01069所述的“缺口”,在此将其全文并入以供参考。然后用互补的dNTPs(通过DNA聚合酶介导)或通过另一对寡核苷酸将此缺口“填平”。因此,在每一循环结束时,每个单链在下一循环中完全能够作为靶子,并可获得所需序列的指数性等位基因特异性扩增。
连接酶/聚合酶介导的Genetic Bit AnalysisTM是另一种检测核酸分子中预选位点上核苷酸相同性的方法(WO 95/21271)。该方法包括将与预选位点的核苷酸互补的核苷三磷酸掺入到引物分子的末端,它们然后连接于第二种寡核苷酸。通过检测附着于反应的固相上的或通过检测溶液中的特异性标记可监测该反应。
4)杂交试验方法
优选的测定双等位标记位点上的核苷酸相同性的方法涉及核酸杂交。所述杂交探针(可方便地用于此类反应)优选包括本文定义的探针。可采用的杂交试验包括Southern杂交、Northern杂交,斑点印迹杂交和固相杂交(参见Sambrook等,1989)。
杂交是指两个单链核酸由于互补碱基配对形成双链体结构。杂交可在正确互补的核酸链之间发生,或在含有最小错配区域的核酸链之间发生。可设计与双等位标记的一种形式但不和另一种形式杂交,因此能区分不同等位基因形式的特异性探针。等位基因特异性探针通常是成对使用的,一个与含有来原等位基因的靶序列良好配对,另一个与含有另一等位基因的靶序列良好配对。杂交条件应足够严格,这样等位基因之间的杂交强度,更佳地是基本的二元反应就会有显著差异,因此一个探针只与该等位基因之一杂交。在严格的序列特异性杂交条件下,探针只与正确互补的靶序列杂交,这种条件是此领域熟知的(Sambrook等,1989)。严格条件需取决于序列且在不同情况下也是不同的。通常,在确定的离子强度和pH下,所选的严格条件比特定序列的解链温度(Tm)约低5℃。尽管这种杂交可在溶液中进行,但优选采用固相杂交试验。在杂交反应之前可扩增含有本发明的双等位标记的靶DNA。通过检测是否存在探针和靶DNA之间形成的稳定杂交双链体来确定样品中特异性等位基因的存在。杂交双链体的检测可用许多方法进行。各种检测试验模式是熟知的,它们采用与靶子或探针结合的可测标记使对杂交双链体的检测得以进行。通常,使杂交双链体与未杂交的核酸分离,然后检测与此双链体结合的标记。此领域的技术人员应该知道,可采用洗涤步骤以洗去多余的靶DNA或探针以及未结合的偶联物。此外,标准的非均一试验模式适合利用存在于引物和探针上的标记来检测此杂交。
最近开发的两项试验可使以杂交为基础的对等位基因的区别不需要分离或洗涤步骤(见Landegren U.等,1998)。此TaqMan试验利用了Taq DNA聚合酶的5’核酸酶活性来消化与积累的扩增产物特异性退火的DNA探针。TaqMan探针用通过荧光能量转移而相互作用的供体-受体染料对标记。通过扩增时预先提供的聚合酶对TaqMan探针的切割可将供体染料与淬灭的受体染料分离,大大增强了供体的荧光。在反应开始时加入检测两种等位基因变体所必须的所有试剂并实时监测结果(参见Livak等,1995)。在另一种以均相杂交为基础的方法中,使用了分子标记以区别等位基因。分子标记是发夹形的寡核苷酸探针,它可报告均相溶液中特异性核酸的存在。当它们和它们的靶子结合时,它们就会发生构象重组,这恢复了内部淬灭的荧光团的荧光(Tyagi等,1998)。
本文提供的多核苷酸可用来制造可用于检测生物样品中双等位标记的等位基因的杂交试验的探针。这些探针的特征是优选含有8-50个核苷酸,以及它们与含有本发明双等位标记的序列充分互补,而与它们杂交,且优选有足够的特异性以辨别只有一个核苷酸改变的靶序列。特别优选的探针长25个核苷酸。优选此双等位标记在多核苷酸探针中央4个核苷酸内。在特别优选的探针中,该双等位标记在所述多核苷酸的中心。优选的探针含有选自表1所列扩增子的核苷酸序列及其互补序列,或其片段,所述片段含有至少约8个连续核苷酸,较好10、15、20个,最好25、30、40、47或50个连续的核苷酸并包含多态性碱基。优选的探针含有选自P1-P18的核苷酸序列及其互补序列。在优选的实施方案中,多态性碱基在所述多核苷酸中央5、4、3、2、1个核苷酸内,最好在所述多核苷酸的中心。
本发明的探针优选被标记或被固定在固态支持物上。标记和固态支持物将进一步描述在“寡核苷酸探针和引物”一节中。这些探针可以是如“寡核苷酸探针和引物”中所述的不可延伸的探针。
通过测定与等位基因特异性探针的杂交,我们可以检测给定的样品中是否存在双等位标记的等位基因。“杂交试验”特别包括阵列模式的高通量平行杂交,这将在下面进行描述。
5)与可寻址的寡核苷酸阵列的杂交
基于寡核苷酸阵列的杂交试验取决于短的寡核苷酸与正确匹配和错配的靶序列变体之间杂交稳定性的差异。通过基础性结构,获得了对多态性信息的有效进入,含有在选定位置附着于固态支持物(如芯片)的寡核苷酸探针的高密度阵列的每张DNA芯片可包含数千至数百万个单独合成的DNA探针,这些探针以格子样的模式排列,和小到一角硬币大小。
此芯片技术已成功用于许多情况。例如,业已在BRCA1基因、啤酒八叠球菌(S.cerevisiae)突变品系和HIV-1病毒的蛋白酶基因中对突变进行了筛选(Hacia等,1996;Shoemaker等,1996;Kozal等,1996)。Affymetrix(GeneChipTM)、Hyseq(HyChip和HyGnostics)和Protogene实验室已经定制的基础上制造出用来检测双等位多态性的各种模式的芯片。
通常,这些方法都采用了与个体的靶核酸序列区段互补的多核苷酸探针阵列,靶序列包括多态性标记。EP 785280描述了一种用来检测单一核苷酸多态性的排铺策略(tiling strategy),在此将其全文并入以供参考。简单地说,所谓“排铺(tiling)”一般指合成一组多核苷酸探针,此组探针由与感兴趣的靶序列互补的序列以及预先选定的该序列的变体构成,即用一组基础核苷酸的一个或多个成员取代一个或多个给定的位点。排铺策略的进一步描述见PCT申请WO 95/11995中。在一具体方面,阵列是由特异性的已鉴定的双等位标记序列排铺成的。特别地,排铺成的阵列包括许多检测模块(detection block),每个模块对特定的双等位标记或一组双等位标记是特异的。例如,将检测模块排铺成包括许多探针,这些探针跨越包括特定多态性的序列区段。为确保探针与各个等位基因互补,探针按不同的双等位标记成对合成。除了多态性碱基不同的探针外,单取代的探针通常也可被排铺在检测模块内。这些单取代的探针含有的碱基等于或超过被残余核苷酸(选自A、T、G、C和U)取代的多态性两方向上确定数目的碱基。通常,排铺在检测模块内的探针将包括序列位置的取代,包括离双等位标记5个碱基内的位置。单取代的探针为排铺阵列提供了内部对照,以将实际的杂交与人为因素造成的杂交区分开。与靶序列杂交并洗涤阵列后,扫描该阵列以检测阵列上与靶序列杂交的位置。然后分析通过扫描阵列获得的杂交数据以鉴定样品中存在双等位标记的那个等位基因或哪些等位基因。杂交和扫描可按PCT申请WO 92/10092和WO 95/11995以及美国专利5,424,186的描述进行。
因此,在一些实施方案中,所述芯片可包含长约15个核苷酸片段的核酸序列阵列。在其它实施方案中,所述芯片可包含至少含有选自表1所列扩增子的序列以及与它互补的序列或其片段的阵列,所述片段含有至少约8个连续核苷酸,较好10、15、20个,最好25、30、40、47或50个连续的核苷酸并包括多态性碱基。在优选的实施方案中,多态性碱基在所述多核苷酸中央5、4、3、2、1个核苷酸内,最好在所述多核苷酸中心。在一些实施方案中,所述芯片可含有至少2、3、4、5、6、7、8或更多个本发明多核苷酸的阵列。固态支持物和附着于固态支持物的本发明的多核苷酸进一步描述见“寡核苷酸探针和引物”一节。
6)集成系统
另一种可用来分析多核苷酸的技术包括多组分集成系统,该系统微型化和分隔化诸如PCR和毛细管电泳反应等过程于一功能性装置内。这种技术的一个例子描述见美国专利5,589,136,在此将其全文并入以供参考,它描述了PCR扩增和毛细管电泳在芯片中的集成。
当使用微流体系统时可考虑使用集成系统。这些系统包括设计在玻璃、硅、石英或塑料晶片上的微通道模式,置于微芯片上。样品的移动受施加到微芯片不同区域的电力、电渗力或静水力控制,从而产生了功能性的带有不移动部分的显微阀门和泵。
为测定双等位标记的基因型,可将微流体系统和核酸扩增、微测序、毛细管电泳以及激光诱导的荧光检测等检测方法集合在一起。
使用本发明双等位标记进行遗传分析的方法
已有不同的方法可对复杂性状作遗传分析(参见Lander和Schork,1994)。用两种主要的方法研究了疾病易感性基因,这两种方法是:连锁法和关联法,在连锁法中用家族研究寻找一基因座和一假定的性状基因座之间的共分离的证据,在关联法中寻找一等位基因和一性状或造成性状的等位基因之间在统计学上显著相关的证据(Khoury等,1993)。通常,本发明的双等位标记可用于此领域已知的任何方法以证明基因型和表型之间在统计学上的显著相关。该双等位标记可用于参数性或是非参数性的连锁分析法。优选地,本发明的双等位标记用来通过关联性研究鉴定与可检测性状有关的基因,关联性研究是一种不需要使用患病家族并可鉴定与复杂性状和散发性状有关的基因的方法。
可以任何规模用本发明的双等位标记进行遗传分析。可以使用与候选基因相应的整套本发明的双等位标记或本发明双等位标记的任何亚组。此外,可以使用包括本发明双等位标记的任何一组遗传标记。WO 98/20165描述了一组双等位多态性,它可用作与本发明的双等位标记结合使用的遗传标记。如上所述,应注意的是,本发明的双等位标记可包括在人类基因组的任何完整或部分遗传图谱中。在本发明和权利要求书中特别要求了这些不同的用途。
连锁分析
连锁分析以建立遗传标记和特定性状在家族内各后代中的传递之间的相关性为基础。因此,连锁分析的目标是检测显示与谱系中感兴趣性状共分离的标记基因座。
参数性方法
当数据是获自连续后代时,就有机会研究成对基因座之间的连锁程度。对重组部分的估计可使基因座排序并被置于遗传图谱中。当基因座是遗传标记时就可建立遗传图谱,然后可以计算出标记和性状之间的连锁强度,并可用此强度来表示标记和造成那些性状的基因的相对位置(Weir,1996)。经典的连锁分析方法是差距评分(oddsscore)对数法(Lod)(参见Morton,1995;Ott,1991)。差距评分的计算需要详细规定疾病的遗传模式(参数性方法)。通常,用连锁分析鉴定的候选区域的长度在2-20Mb之间。一旦按上述方法鉴定了候选区域,就可用其它标记分析重组个体以进一步描绘候选区域。连锁分析研究通常有赖于最多5,000微卫星标记的使用,这就将连锁分析的理论上可达到的最大分辨率限制在平均约600kb。
已经成功运用连锁分析来绘制简单遗传性状的图谱,这些性状显示出清晰的孟德尔杂交模式并有高外显率(即等位基因α的阳性性状携带者的数目与人群中α携带者总数的比例)。然而,参数性连锁分析有许多缺点。首先,它会受到依赖于对适合各个被研究性状的遗传模式进行选择的限制。此外,如上所述,用连锁分析可得到的分辨率也是有限的,同时它需要进行互补研究以细化对2Mb-20Mb典型区域的分析,该区域最初是通过连锁分析鉴定的。此外,当用于复杂的遗传性状,参数性连锁分析被证明有困难,比如由于多基因和/或环境因素联合作用造成的性状。在差距评分分析中,很难充分建立这些因素的模型。这时,需要巨大努力和花费来征集对这些情况进行连锁分析所需的足够的患病家族成员,如Risch和Merikangas(1996)最近所描述的那样。
非参数性方法
所谓连锁分析的非参数性方法的优点在于,它们不需要特别规定疾病的遗传模式,就分析复杂性状而言它们更加有效。在非参数性方法中,通过显示患病亲属继承的该区域的相同拷贝比预期的多,我们试图证明染色体区域的遗传模式与随机孟德尔分离不一致。即便存在不完全外显率和多基因遗传,患病亲属应显示过份的“等位基因分摊”。在非参数性连锁分析中,可通过状态相同的等位基因(alleles identical bystate)(IBS)的数目或通过世系相同的等位基因(alleles identical by descent)(IBD)的数目来衡量两个个体中标记基因座的一致性程度。患病亲属配对分析(affected sibpair analysis)是众所周知的特别情况,并且是这些方法最简单的形式。
本发明的双等位标记可用于参数性和非参数性连锁分析。优选的双等位标记可用于非参数性方法,以用来绘制与复杂性状有关的基因的图谱。本发明的双等位标记可用在IBD-和IBS方法中以绘制影响复杂性状的基因的图谱。在这种研究中,通过利用高密度双等位标记,可将几个毗邻的双等位标记基因座合并以实现用多等位基因标记得到的效果(Zhao等,1998)。
人群关联性研究
本发明包括采用本发明的双等位标记鉴定CanIon基因是否与某可检测性状关联的方法。在本发明的一个实施方案中,包含检测双等位标记的等位基因或双等位标记单倍型和性状之间的关联性方法。此外,本发明还包括鉴定引起性状的等位基因与本发明的任何双等位标记的等位基因连锁失平衡的方法。
如上所述,可用来进行关联性研究的其它方法有:基因组宽(genome-wide)关联性研究、候选区域关联性研究和候选基因关联性研究。在优选的实施方案中,本发明的双等位标记被用来进行候选基因关联性研究。当可得到一些与所述性状的生物学有关的信息时,候选基因分析可清楚提供鉴定与特定性状相关的基因和基因多态性的简便方法。此外,本发明的双等位标记可加入人类基因组的遗传标记图中以进行基因组宽关联性研究。美国临时申请序列号60/082,614描述了产生双等位标记高密度图谱的方法。本发明的双等位标记还可加入基因组特定候选区域(例如特定的染色体或特定的染色体片段)的图谱中。
如上所述,关联性研究可在一般人群中进行,而不限于在患病家族的相关个体上进行研究。当关联性研究可分析散发或多因素性状时它将极有价值。此外,与连锁研究相比,关联性研究提出了更有力的精细绘图方法,能绘制出更加精细的引起性状的等位基因的图谱。基于系谱的研究仅仅缩小了引起性状的等位基因的位置范围。因此,可用本发明的双等位标记进行的关联性研究细化引起性状的等位基因在连锁分析方法所鉴定的候选区域中的位置。此外,一旦鉴定了感兴趣的染色体区段,如本发明的候选基因之类的候选基因在感兴趣的区域的存在可提供鉴定造成性状的等位基因的捷径。本发明的双等位标记可用来证明某一性状相关联的候选基因。本发明特别考虑了这种应用。
测定双等位标记的等位基因或双等位标记单倍型在人群中的频率
关联性研究探索了基因座之间若干组等位基因频率的关系。
测定人群中等位基因的频率
可用上述“鉴定个体双等位标记基因型的方法”一节所述的方法或任何适用于此目的的鉴定基因型的方法来测定人群中双等位标记的等位基因频率。鉴定基因型的合并样品或个体样品可用以测定双等位标记的等位基因在人群中的频率。一种减少所需的鉴定基因型数目的方法是使用合并的样品。使用合并的样品的一个主要的障碍在于合并时测定精确的DNA浓度的精确性和再现性。鉴定基因型的个体样品可提供较高的灵敏度、再现性和精确性;它是用于本发明的优选的方法。优选地,对各个个体分别测定基因型并用简单的基因计数来测定双等位标记的等位基因或单倍型在给定人群中的频率。
本发明还涉及评估人群中某等位基因频率的方法,所述方法包括:a)按本发明的方法鉴定所述人群的个体的所述双等位标记的基因型;b)测定所述人群中所述双等位标记的比例。此外,本发明的评估人群中某等位基因频率的方法包括带有进一步限制的方法,所述限制描述在本公开内容或以后的那些公开内容,无论是单独的或以任何形式组合的。任选地,所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,通过测定所述人群各个体基因组中存在的所述双等位标记两拷贝核苷酸的相同性,并计算该人群所述CanIon相关双等位标记上所述核苷酸的比例,可实现对人群中双等位标记的等位基因频率的测定;任选地,通过对来自所述人群代表性数目的个体或各个个体的合并的生物样品采用本发明的测定基因型的方法,并计算所述核苷酸占总数的比例,可实现对该比例的测定。
测定人群中单倍型的频率
当二倍体个体在一个以上基因座上是杂合性时不知道单倍型的配子期。利用家族的系统树信息有时可能推断出配子期(Perlin等,1994)。当得不到系统树信息时可使用不同的策略。一种可能的策略是通过分析排除多位点杂合二倍体,仅保留纯合子和单位点杂合子个体,但这种方法可能会在样品组合物中导致可能的偏差和低估低频率的单倍型。另一种可能的策略是独立研究各个染色体,例如,通过不对称PCR扩增(参见Newton等,1989;Wu等,1989)或在PCR扩增后通过有限稀释分离各个染色体(参见Ruano等,1990)。此外,通过对特定的等位基因进行双PCR扩增可测定样品中非常接近的双等位标记的单倍型(Sarkar,G.和Sommer S.S.,1991)。这些方法因为技术复杂、花费高、缺乏大范围的归纳或可能造成偏差而不是完全令人满意。为克服这些缺点,可使用Clark,A.G.(1990)介绍的推断PCR-扩增的DNA基因型的阶段的算法。简单地说,其原则是通过检测明确的个体(即完全的纯合子和单位点杂合子)开始填写样品中存在的单倍型的初步列表。然后筛选同一样品中其它个体中可能产生的已被识别的单倍型。对于每个阳性鉴定结果,在已被识别的单倍型列表中加入互补的单倍型,直到所有个体的阶段信息被分辨或被鉴定为未分辨的。这种方法为各个多杂合个体指定了单一的单倍型,而当有多个杂合位点时几种单倍型也是可能的。或者,我们可用估计人群的单倍型频率而不指定各个个体的单倍型的方法。优选地,可采用基于期望值-最大值(EM)算法的方法(Dempster等,1977),将得到在Hardy-Weinberg比例(随机配对)假说下的单倍型频率的最大可能性估算值(参见Excoffier L.和SlatkinM.,1995)。EM算法是一种归纳的最大可能性迭代估算方法,可用于数据不清楚和/或不完整时。EM算法被用来分辨杂合子成为单倍型。单倍型估计进一步的描述见“统计学方法”一节。也可以使用此领域已知的测定或估计人群中单倍型频率的其它方法。
本发明还包括估计人群中一组双等位标记的单倍型频率的方法,该方法包括以下步骤:a)按本发明的方法测定所述人群中各个个体至少一个CanIon相关的双等位标记的基因型;b)测定所述第二个双等位标记的基因型,方法是对于所述人群各个个体基因组中存在的所述第二个双等位标记的两个拷贝,测定所述第二个双等位标记上核苷酸的相同性;以及c)将单倍型测定方法应用于步骤a)和b)中测定的核苷酸的相同性,以获得所述频率的估算值。此外,本发明的估计单倍型频率的方法包括具有进一步限制的方法,这种限制描述在本公开内容或以后的那些公开内容中,无论是单独的或以任何形式组合的。任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述单倍型测定法是通过不对称PCR扩增、特定等位基因的双PCR扩增、Clark算法或期望值-最大值算法进行的。
连锁失平衡分析
连锁失平衡是两个或多个基因座上等位基因的非随机关联,它是绘制与疾病性状有关的基因图谱的有力工具(参见Ajioka R.S.等,1997)。由于双等位标记密集分布在人类基因组中,且与其它类型的遗传标记(如RFLP或VNTR标记)相比可大量测定它们的基因型,因此它们对基于连锁失平衡的遗传分析特别有用。
当先在人群中引入疾病突变时(通过新的突变或突变载体的迁入),它必然位在于一个染色体上并因此位于连锁标记的一个“背景”或“祖先”单倍型上。随后,这些标记和疾病突变之间发生完全失平衡:有人发现疾病突变仅存在于一特定的标记等位基因组中。通过随后的传代,在疾病突变和这些标记多态性之间发生重组,失平衡现象逐渐消失。消失的步距是重组频率的函数,这样,与疾病基因最接近的标记与那些较远的标记相比显然有较高的失平衡水平。当未受重组打断时,“祖先”单倍型和不同基因座的标记等位基因之间的连锁失平衡,不仅可以通过谱系而且可以通过人群追踪。连锁失平衡通常被看作是一个基因座的一个特定等位基因和第二个基因座的另一个特定等位基因之间的相关性。
预计疾病和标记基因座之间的失平衡模式或曲线显示最大值发生在疾病基因座上。因此,疾病等位基因和紧密连锁的遗传标记之间连锁失平衡的量,可产生有价值的有关于此疾病基因位置的信息。对于疾病基因座的精细图谱,了解一些存在于研究区域内标记之间的有关连锁失平衡模式的知识是有用的。如上所述,通过这种连锁失平衡分析得到的图谱分辨率比连锁研究高得多。与连锁失平衡分析联合的高密度双等位标记为精细作图提供了有力工具。用来计算连锁失平衡的其它方法描述见下面“统计学方法”一节。
基于人群的性状-标记关联性的病例-对照研究
如上所述,成对的特定等位基因在同一染色体上不同基因座的出现不是随机的,与随机的偏差称为连锁失平衡。关联性研究关心的是人群频率并依赖于连锁失平衡现象。如果某给定基因中的特定等位基因直接造成某特定性状,当与该性状阴性人群或随机对照人群中的频率相比时,其频率在患病(性状阳性)人群中将有统计学上的增加。作为存在连锁失平衡的结果,与阴性性状个体或随机对照相比,阳性性状个体中,携带有引起该性状的等位基因的单倍型中存在的所有其它等位基因的频率也会升高。因此,此性状和带有引起该性状的等位基因的任何连锁失平衡的等位基因(尤其是双等位标记的等位基因)之间的关联性,将足以提示该特定区域中存在性状相关的基因。可测定病例-对照人群双等位标记的基因型以鉴定引起性状的等位基因部位缩小的关联性。由于任何与给定的与某一性状关联的标记连锁失平衡的标记,将与此性状关联。连锁失平衡使得可以分析病例-对照人群中数目有限的遗传多态性(尤其是双等位标记)的相对频率,作为筛选所有可能的功能多态性以寻找引起该性状的等位基因的另一种方法。关联性研究比较了非相关的病例-对照人群中标记等位基因的频率,它是剖析复杂性状的有力工具。
病例-对照人群(包括标准)
基于人群的关联性研究不考虑家族遗传,但比较了病例-对照人群中一具体遗传标记或一组标记的普遍程度。它们是基于比较非相关病例(患病或阳性性状)个体和非相关对照(未患病、阴性性状或随机)个体的病例-对照研究。优选的对照组由未患病或阴性性状的个体构成。此外,对照组与病例人群在种族上是匹配的。此外,研究时,对照组和病例人群在已知的性状主要混淆因子上最好是匹配的(例如,对于年龄依赖的性状应做到年龄匹配)。理想的是,这两个样品中的个体以这样的方式配对:它们只在疾病状态上有差别。术语“阳性性状人群”、“病例人群”和“患病人群”在本文可以互换使用。
用关联性研究剖析复杂性状的一个重要步骤是病例-对照人群的选择(参见Lander和Schork,1994)。选择病例-对照人群的主要步骤是在给定性状或表型的临床定义。通过小心选择阳性性状和阴性性状表型组的个体,用本文提出的关联性方法可分析任何遗传性状。经常使用的标准有4个:临床表型、发病年龄、家族史和严重程度。连续或定量性状(如血压)的选择方法包括选择所研究性状的表型分布在两个极端的个体,这样包括具有不重叠表型的这些阳性性状和阴性性状人群个体。优选地,病例-对照人群包括表型上类似的人群。阳性和阴性性状人群包括表型相同的个体人群,各占研究人群总数的1-98%,较好为1-80%,再好为1-50%,更好为1-30%,最好为1-20%,优选在显示不重叠表型的个体中进行选择。两种选择表型之间的差别越大,检测到双等位标记关联性的概率就越大。选择那些差异很大但相对均一的表型可在关联性研究中进行有效的比较,以及可能检测到遗传水平的显著差异,只要被研究人群的样本大小足够在。
在优选的实施方案中,根据表型,征集有50-300名阳性性状个体,优选约100名个体的第一组。此研究中应包括类似数目的对照个体。
关联性分析
本发明还包括测定基因型和表型之间关联性的方法,该方法包括以下步骤:a)按本发明测定基因型的方法确定阳性性状人群中至少一个CanIon相关的双等位标记的频率;b)按本发明测定基因型的方法确定对照人群中所述CanIon相关的双等位标记的频率;以及c)确定所述基因型和所述表型之间是否存在统计学显著的关联性。此外,本发明的测定基因型和表型之间关联性的方法还包括带有进一步限制的方法,如本公开内容或以后的那些公开内容中所述,无论是单独的或以任何形式组合的。任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述对照人群可以是阴性性状人群或是随机人群;任选地,所述测定基因型的步骤a)和b)可在所述人群的每一个人的合并的生物样品一进行;任选地,所述测定基因型的步骤a)和b)都可在所述人群的每个人的生物样品上或其次样品上进行。
采用携带有候选基因区域衍生的双等位标记进行关联性研究的一般方法,是扫描两组个体(病例-对照人群)以测量并作统计学比较两组中本发明双等位标记的等位基因频率。
如果至少有一个或更多被分析的双等位标记与所鉴定性状在统计学上是显著相关的,我们就可假定:此关联的等位基因之-直接负责造成该性状(即相关的等位基因是造成该性状的等位基因),或者更可能,该相关等位基因与造成该性状的系统基因连锁失平衡。相关等位基因对候选基因功能的特征性质通常可进一步了解相关等位基因和性状之间的相互关系(因果或连锁失平衡)。如果有证据表明候选基因中的相关等位基因很可能不是造成该性状的等位基因但与实际造成该性状的等位基因连锁失平衡,则可通过测序附近的关联性标记发现造成该性状的等位基因,并可用发现的相互影响方式的多态性进行进一步的关联性研究。
关联性研究通常以两个连续步骤进行。第一阶段,检测阳性性状和对照人群中来自候选基因的减少数目的双等位标记的频率。第二阶段,用有关区域的高密度标记将负责给定性状的基因座的位置进一步细化。然而,如果被研究的候选基因的长度相对较小,如CanIon,则一个阶段就可能足以建立显著的相关性。
单倍型分析
如上所述,由于突变或迁入的结果在人群中第一次出现携带疾病等位基因的染色体时,该突变的等位基因必然位于具有一组连锁标记(祖先单倍型)的染色体上。这种单倍型可通过人群追踪并可分析它与某给定性状的统计学关联性。将单位点(等位基因)关联性研究和多位点关联性研究互补,也称为单倍型研究,可增加关联性研究的统计学力度。因此,单倍型关联性研究可用来明确祖先载体单倍型的频率和类型。单倍型分析的重量性在于它提高了涉及各个标记的分析的统计学力度。
在单倍型频率分析的第一阶段,确定了可能的单倍型的频率,这些单倍型是基于已鉴定的本发明双等位标记的各种组合的。然后比较单倍型频率以辨别阳性性状人群和对照个体。应该对阳性性状个体的数目进行分析以得到统计学上显著的结果(通常在30-300之间),采用优选数目的个体(50-150名)。研究中将同样考虑应用于一定数目的未患病个体(或随机对照)。第一次分析的结果提供了病例-对照人群的单倍型频率,对每个估算出的单倍型频率计算了p-值和差距率(odd ratio)。如果发现有统计学上显著的关联性,则可大致估算出携带给定单倍型的个体受所研究的性状影响的相对风险。
本发明的另一实施方案包括检测单倍型和表型之间关联性的方法,该方法包括以下步骤:a)按本发明估算单倍型频率的方法估计阳性性状人群中至少一种单倍型的频率;b)按本发明估算单倍型频率的方法估计对照人群中所述单倍型的频率;以及c)确定所述单倍型和所述表型之间是否存在统计学显著相关性。此外,本发明的测定单倍型和表型之间相关性的方法,还包括具有进一步限制的方法,其描述见本公开内容或以后的那些公开内容中,无论是单独的或以任何形式组合的。任选地,其中所述CanIon相关双等位标记选自A1-A18及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A1-A17及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述CanIon相关双等位标记选自A12-A16及其互补物,或者任选地,所述双等位标记与其连锁失平衡;任选地,所述对照人群可以是阴性性状人群或是随机人群;任选地,所述测定基因型的步骤a)和b)可在所述人群的每一个人的合并的生物样品上进行;任选地,所述方法还包括在步骤c)之前测定所述阳性性状人群和所述对照人群的单倍型的额外步骤。
相互作用分析
本发明的双等位标记也可用来鉴定与多基因相互反应而导致的可检测性状相关联的双等位标记的模式。非连锁基因座上的等位基因之间的遗传相互作用的分析,需要采用本文所述的技术测定个体的基因型。在选出的一组双等位标记中以合适的统计显著性水平进行的等位基因相互作用的分析,可被认为是单倍型分析。相互作用分析包括根据第一基因座某给定的单倍型将病例-对照人群分类,并用第二基因座对各个亚群进行单倍型分析。
下面将进一步描述关联性研究所用的统计学方法。
存在关联性时的连锁试验
本发明的双等位标记还可用于TDT(传递/失平衡试验)。TDT可同时检测连锁和关联,且不会受到人群分类的影响。TDT需要患病个体和他们的父母的数据或未患病胞亲而不是父母的数据(参见Spielmann S.等,1993;Schaid D.J.等,1996,SpielmannS.和Ewens W.J.,1998)。这种联合试验通常可降低单独分析产生的假阳性误差(false-positive error)。
统计学方法
通常,可以使用任何此领域已知的方法来测试性状和基因型是否显示统计学显著相关。
1)连锁分析中所用的方法
统计学方法和对连锁分析有用的计算机程序是此领域技术人员熟知的(参见Terwilliger J.D.和Ott J.,1994;Ott J.,1991)。
2)估计人群单倍型频率的方法
如上所述,当对基因型评分时,通常不可能区别杂合子,因此不易推断出单倍型的频率。当不知道配子期时,可从多基因座的基因型数据估计单倍型频率。可用此领域技术人员熟知的任何方法来估计单倍型频率(参见Lange K.,1997;Weir,B.S.,1996)。优选地,可用期望值-最大值(EM)算法(参见Dempster等,1997;Excoffier L.和Slatkin M.,1995)计算最大可能性单倍型频率。这种方法是一种迭代方法,其目标是当配子期未知时从多基因座的基因型数据得到单倍型频率的最大可能性估算值。单倍型估算通常是通过EM算法用(例如)EM-HAPLO程序(Hweley M.E.等,1994)或Arlequin程序(Schneider等,1997)进行的。EM算法是一种归纳的最大可能性迭代估算法,将在下面简要描述。
请注意在本发明“估计人群单倍型频率的方法”一节中,表型是指具有未知单倍型期的多基因座基因型。基因型是指具有已知单倍型期的多基因座基因型。
假设我们有按标记K分类的N个非相关个体的样品。观察到的数据是未知阶段的K-基因座表型,可用不同的表型F将其分类。此外,假设我们有可能的单倍型H(如果是双等位标记K,则我们有最大数目的可能的单倍型H=2K)。
对于带有可能的基因型cj的表型j,我们有
其中Pj是表型jth表型的概率,P(hk,hl)是由单倍型hk和hl组成的基因型ith的概率。在随机匹配(即Hardy-Weinberg平衡)时,P(hk,hl)可表达为
P(hk,hl)=P(hk)2,其中hk=hl,和
P(hk,hl)=2P(hk)P(hl),其中hk≠hl 等式2
E-M算法包括以下步骤:首先,用一组单倍型频率的初始值估算基因型频率。这些单倍型频率可表示为P1 (0)、P2 (0)、P3 (0)、……PH (0)。可从随机数目产生器或用此领域熟知的其它方法获得单倍型频率的初始值。这一步骤被成为期望值步骤。此方法的下一步骤称为最大值步骤,包括对基因型频率进行估算以重新计算单倍型频率。单倍型频率的第一次迭代估算值表示为P1 (1)、P2 (1)、P3 (1)、……PH (1)。通常,sth迭代时的期望值步骤包括根据以前迭代所得的单倍型频率计算将各个表型置于不同的可能基因型中的概率:
其中nj是具有表型jth的个体数目,P(hk,hl)(s)是表型j中基因型hk和hl的概率。在最大值步骤(等价于基因计数法(Smith,Ann.Hum.Genet.,21:254-276,1957))中,单倍型频率是根据基因型估算值重新估算的:
这里,δit是指示物变量,它计数基因型ith中存在的单倍型t的产生数;它可取0、1和2的值。
当达到以下标准时就可以终止E-M迭代。用最大可能性估算(MLE)理论,我们假定表型j以多项式分布。在每次迭代s时,我们可计算出可能性函数L。当两次串行迭代之间的概率的log值差异小于一些很小的数值时,优选10-7,实现了收敛性。
3)计算标记之间连锁失平衡的方法
可以用许多方法来计算任何两个遗传位点之间的连锁失平衡,实践中,连锁失平衡是通过将统计学相关检验应用于自人群采集的单倍型数据而衡量的。
按照Piazza公式可计算出等位基因的每种组合(ai,aj;ai,bj;bi,aj和bi,bj)的任何一对双等位标记之间的连锁失平衡,所述一对双等位标记包括至少一对本发明的双等位标记(Mi,Mj),它在标记Mi上具有等位基因(ai/bi),在标记Mj上具有等位基因(aj/bj),Piazza公式为:
Δaiaj=√θ4-√(θ4+θ3)(θ4+θ2),其中:
θ4=--=在Mi上没有等位基因ai且在Mj上没有等位基因aj的基因型频率
θ3=-+=在Mi上没有等位基因ai但在Mj上有等位基因aj的基因型频率
θ4=-+-=在Mi上有等位基因ai但在Mj上没有等位基因aj的基因型频率
也可按照如Weir(Weir B.S.,1996)所描述的对Δ(综合性基因型失平衡系数)的最大可能性估计(MLE),计算等位基因的每种组合(ai,aj;ai,bj;bi,aj和bi,bj)的一对双等位标记(Mi,Mj)之间的连锁失平衡(LD)。用于综合性连锁失平衡的MLE是:
Daiaj=(2n1+n2+n3+n4/2)/N-2(pr(ai).pr(aj))
其中n1=∑表型(ai/ai,aj/aj),n2=∑表型(ai/ai,bj/bj),n3=∑表型(ai/bi,aj/aj),n4=∑表型(ai/bi,aj/bj),N是样品中个体的数目。
这个公式可用于当只有基因型数据而没有单倍型数据时估计等位基因之间的连锁失平衡。
计算标记之间连锁失平衡的另一种方法如下。对一对满足Hardy-Weinberg平衡的双等位标记Mi(ai/bi)和Mj(aj/bj),我们可按照上述方法估计某给定人群中四种可能的单倍型的频率。
对ai和aj之间配子失平衡的估算是简单的:
Daiaj=pr(单倍型(aj,bj)-pr(ai).pr(aj)
其中pr(ai)是等位基因ai的概率,pr(aj)是等位基因aj的概率,pr(单倍型(aj,bj)按上述
等式3估算。
对一对双等位标记只需要测量一次失平衡以描述Mi和Mj之间的相关性。
然后按下述公式计算标准化值。
D’aiaj=Daiaj/max(-pr(ai).pr(aj),-pr(bi).pr(bj)),Daiaj<0
D’aiaj=Daiaj/max(pr(bi).pr(aj),pr(ai).pr(bj)),Daiaj<0
技术人员应该知道可以使用其它的连锁失平衡计算方法。
可通过测定50-1000名,优选75-200名,最好约100名非相关个体的基因型来确定具有足够杂合率的一组双等位标记间的连锁失平衡。
4)相关性检验
可用任何此领域已知的统计学检验以任何可接受的所需的统计学显著性阈值,来确定测定表型和基因型,此例中为双等位标记上的等位基因或由此类等位基因构成的单倍型之间相关性的统计学显著程度的方法。特定方法和显著性阈值的应用是此领域普通医师熟知的。
相关性检验是通过测定患病和对照人群中双等位标记的等位基因的频率并将这些频率与统计学检验进行比较,以确定频率是否有统计学上显著性差异而进行的,这种差异将表明性状和被研究的双等位标记的等位基因之间的相关性。类似地,单倍型分析是通过估算患病和对照人群中一组给定的双等位标记的所有可能的单倍型频率,并将这些频率与统计学检验进行比较,以确定该单倍型和被研究的表型(性状)之间是否有统计学上显著的差异而进行的。可使用任何可用于检测基因型和表型之间统计学显著相关性的的统计方法。所采用的优选的统计学检验是自由度为1的卡方测验。计算出P值(P值是等于或大于可能偶然发生的观察值的统计量的概率)。
统计学显著性
在优选的实施方案中,对于诊断目的,此种显著性是进一步诊断试验的肯定基础,或者是早期预防性治疗的初步起点,与双等位标记相关性有关的p值对单一个等位标记分析优选约为1×10-2或更小,更优选约为1×10-4或更小,对涉及两个或多个标记的单倍型分析,p值优选约为1×10-3或更小,更优选约为1×10-6或更小,最优选约为1×10-8或更小。这些值被认为可用于任何涉及一个或多个标记组合有关的性研究。
熟练技术人员可采用上面列出的数值作为起点以用本发明的双等位标记进行相关性研究。这样做可显示,本发明双等位标记的和性状之间的显著相关性并用于诊断和药物筛选目的。
表型改变
为确定上述第一阶段单倍型分析的统计显著性,进行进一步的分析是合适的,其中来自病例-对照个体的基因型数据被合并并根据所述性状表型将其打乱。将各个个体的基因型数据随机放在两组中,这两组有相同数目的个体和用来编译第一阶段所得数据的病例-对照人群。第二阶段的单倍型分析最好在人造组上进行,最好第一分析阶段的单倍型所包含的标记有最高的风险系数。这一试验至少被重复100-10000次。重复迭代可确定概率以得到偶然造成的试验单倍型。
统计学相关性的评估
为说明正误差问题,可用同样的病例-对照人群在随机遗传区域内进行类似的分析。用题为“Methods,Software And Apparati For IdentifyingGenomic RegionsHarboring A Gene Asociated With A Detectable Trait”,提交于1998年11月10日的美国序列号为60/107,986的待审美国临时专利申请中描述的方法比较随机区域候选区域的结果,在此将其全文并入以供参考。
5)危险因子的评估
通过差距比率(OR)和相对危险(RR)来确定危险因子(在遗传流行病学中,所述危险因素是在标记位置处存在或者缺乏特定等位基因或者单倍型标本)和疾病之间的联系。若P(R+)是对具有R的个体而言疾病发生的概率,P(R-)是无危险因素的个体的概率,那么相对风险就是两个概率的比率,即:
RP=P(R+)/P(R-)
在病例-对照研究中,由于取样设计,不能直接测量相对风险。但是,所述让步比提供对于低发病率的疾病相对风险的良好近似,并可以估算为:
OR=(F+/(1-F+))/(F-/(1-F-))
F+是病例暴露于危险因素的频率,F-是对照暴露于危险因素的频率。F+和F-通过采用研究的等位基因或单倍型频率并根据基本的遗传模型(显性、隐性、附加等)来估算。
其一可以进一步估计特异危险性(AR),用于说明显示某给定的危险因素而改性状的个体在人群中的比例。这种措施在量化特定因子在病因学中的作用以及危险因素的公共健康影响方面是重要的。这种措施的公共健康相关性依赖于估计病例在人群中的比例。AR按如下所述确定:
AR=PE(RR-1)/(PE(RR-1)+1)
AR是归因于双等位标记等位基因或者双等位标记单倍型的危险。PE是很大程度上接触于人群中等位基因或者单倍型的频率。当研究的性状在一般人群中具有相对较低的发病率时,RR是相对危险与差距比率近似。
识别与本发明双等位标记连续失平衡的双等位标记
一旦在我们感兴趣的染色体组区域中识别出第一双等位标记,使用本发明的论述,本领域的普通技术人员可以容易地识别和这种第一标记不均衡联接的其它双等位标记。如上所述,和性状相关的第一标记不均衡联接的任何标记将和所述性状相关。因此,一旦证实指定双等位标记和性状之间的关联,发现和这种性状相关的其它双等位标记是有极大兴趣的,以提高这种具体区域中双等位标记的密度。在显示和所述性状最高相关性的标记和一套标记的附近将发现所述因果基因或者突变。
识别和给定标记不均衡联接的其它标记涉及:(a)放大来自许多个体的包含第一双等位标记的基因片段;(b)识别在染色体组中躲藏所述第一双等位标记的第二双等位标记;(c)进行所述第一双等位标记和第二双等位标记之间联接不均衡性的分析;(d)选择与所述第一标记连续失平衡的所述第二双等位标记。也可以考虑包括步骤(b)和(c)的亚综合(subcombination)。
在本文中说明了鉴定双等位标记并进行连续失平衡分析的方法,并可以由技术人员在无需过多实验下进行。然后,本发明涉及与所述双等位标记A1-A18连续失平衡,并预计它们在分别与某给定性状的相关性上呈现类似特性的双等位标记。
功能性突变的鉴定
通过比较性状阳性和对照个体的的CanIon基因序列,可以鉴定CanIon基因中负责可检测表型或性状的突变。一旦证实了与本发明的双等位标记阳性关联,可以扫描所鉴定的位点有无突变。在优选的实施方案中,以扫描CanIon基因中的功能性区域如外显子、剪切位点、启动子和其它调控区无突变。在优选实施方案中,比较性状阳性者和对照个体的CanIon基因序列。性状阳性个体宜携带显示为与所述性状相关联的单倍型,而性状阴性个体不携带与所述性状相关联的单倍型或者等位基因。所述可检测的性状或者表型可以包括各种改变的CanIon功能的表现。
突变检测程序基本上和双等位标记鉴定中所用的类似。用于检测这种突变的方法通常包括如下的步骤:
-扩增包含性状阳性患者和性状阴性对照的DNA样品中与所述性状有关的双等位标记或者一组双等位标记的CanIon基因区域;
-对扩增区域进行测序;
-比较性状阳性个体和对照个体的DNA序列;
-确定性状阳性患者的特异性突变。
在一个实施方案中,所述双等位标记选自A1-A18,及其互补物。优选通过筛选较大的病人和对照人群以及借助本文所述的基因分型程序(宜为在个体试验形式中采用的微测序技术)验证候选的多形性。当在病例和对照中与预期的关联结果一致的频率存在时,多形性认为是候选的突变。当它们与可检测表型显示有统计学上显著相关联性时,多形性认为是候选的“导致性状”的突变。
在基因诊断方法中本发明的双等位标记
本发明的CanIon核酸序列和双等位标记也可以用于开发诊断试验,所述诊断试验能够鉴定由于特定基因型而表达可检测性状的个体或者其基因型使他们在随后时间内处于发生可检测性状危险的个体。这种诊断可以用于许多疾病或症状的分期、监测、预后和/或预防或者治疗,所述疾病或症状包括精神分裂症、双极情感障碍、以及其它CNS紊乱,如癫痫和疼痛疾病、心血管疾病,如心脏病、高血压、心律失常,以及许多其它疾病和症状。
本发明的诊断技术可以采用各种方法来测定受试者是否具有与产生可检测性状的增高危险相关的双等位标记模式,或者所述个体是否由于特殊的突变而患有可检测的性状,所述方法包括能分析个体染色体的单倍型,如家族研究、单精子DNA分析或者体细胞杂交。
本发明提供确定个体是否有发生疾病的危险或者患由于CanIon基因突变或者多形性而致的疾病的诊断方法。本发明也提供确定个体是否容易患精神分裂症和双极情感障碍,或者本领域或本文中已知的其它和钙通道有关的症状的方法。
这些方法涉及从个体获得核酸样品,并确定所述核酸样品是否含有至少一种等位基因或者至少一种双等位标记单倍型,表明有发生该性状的危险或表明个体表面由于具有特殊的CanIon多形性或突变(导致性状的等位基因)所致的性状。
在这种诊断方法中,优选从个体获得核酸样品,采用在“测定DNA样品基因型的双等位标记的方法”中所述的方法对样品进行基因型测定。此诊断以单一双等位标记或者一组双等位标记为基础。
在各方法中,从受试者获得核酸样品,并测定一种或多种双等位标记A1-A18的双等位标记模式。
在一个实施方案中,在核酸样品上进行PCR扩增,来扩增其中与业经鉴定的可检测表型相关的多形性。对扩增产物进行测序,来确定所述该个体是否拥有一种或多种与可检测表型相关的CanIon多形性。用于产生扩增产物的引物可以包含表1中所列的引物。或者,对核酸样品如上所述进行微测序反应,来确定该个体是否拥有一种或多种与可检测表型相关的CanIon多形态,此表型由于CanIon基因中的突变或者多形性而引起。用于微测序反应中的引物可以是表4中所列的引物。在另一实施方案中,将所述核酸样品与一种或多种等位基因特异性寡核苷酸探针接触,这些探针可与可检测表型相关的一种或多种CanIon等位基因进行杂交。用于此杂交试验的探针可以包括表3中所列的探针。在另一实施方案中,当与该等位基因的特异性寡核苷酸一起用于扩增反应时,使核酸样品与能产生扩增产物的第二CanIon寡核苷酸接触。扩增反应中扩增产物的存在表明该个体具有一种或多种与可检测表型相关的CanIon等位基因。
在一优选实施方案中,可以测定存在于至少一个双等位标记的核苷酸及其互补物的身份,所述双等位标记选自A1-A18及其互补物,可检测的性状是精神分裂症和双极情感障碍。诊断试剂盒包括本发明的任一多肽。
由于在某些情况下利用它们引发预防性治疗或者允许个体携带显著的单倍型来预见警告信号如次要征兆,这种诊断方法极其有价值。
分析和预测对药物的反应或者药物副作用的诊断可以用于确定个体是否应服用具体的药物进行治疗。例如,若诊断表明个体对用某具体药物治疗可能呈正反应,那么可将此药给该个体服用。相反,若诊断表明个体可能对某具体药物的治疗呈负反应,可以给予另一种治疗。负反应可以定义为不存在具体的药物。此药物可以给个体服用。相反地,若诊断表明个体可能对具体药物治疗呈负反应,那么可以规定任选的治疗过程。负反应可以定义为不存在有效的反应或者存在毒副作用。
临床药物试验表示本发明标记的另一用途。使用上述方法可以识别对作用于精神分裂症或者双极情感障碍或者另一钙通道关联征兆的试剂或者对作用于精神分裂症或双极情感障碍或另一钙通道关联征兆的副作用发生反应的一种或多种标记暗示。因此,这种试剂在临床试验中可以筛选潜在的参与者,以鉴定那些对该药物最可能产生有利反应的个体,并排除那些可能引起副作用的个体。以那种方式,可以测量对药物产生正反应的个体中药物治疗的有效性,而不会因为包括了不可能在研究中产生正反应的个体而降低测量措施,且不会冒不适宜的安全问题的风险。
在尤其优选的实施方式中,可用本诊断方法分析的性状是精神分裂症或双极情感障碍。但是,本发明也包括本文所述预防、诊断、控制以及治疗的相关紊乱症,尤其是有关CNS症的方法中使用本发明双等位标记的预防、诊断、预后以及治疗方法。至于实施例,相关的症状可以包括精神病、情感障碍症、孤独症、药物依赖症和酗酒、疼痛症、癫痫症、精神发育不全以及其它精神病包括认知能力、焦虑、多食、冲动控制以及病态人格等,如Diagnosis and Statistical Mantal Disorder,第四版(DSM-IV)中所定义的。其它症状包括心脏血管疾病,如心绞痛、高血压或者心律失常。
重组载体
本文所用的术语“载体”指环状或线性DNA或RNA分子,这些分子可以是双链或单链,包含至少一个感兴趣的多核苷酸,被转移到细胞宿主或单细胞或多细胞生物体内。
本发明包括一个家族的重组载体,其含有衍生自CanIon基因组序列的调节性多核苷酸、和/或CanIon基因组序列或cDNA序列的编码多核苷酸。
本发明的重组载体通常包括本文所述的任何一种多核苷酸,包括调节序列、编码序列和多核苷酸构建物以及上述任何一种CanIon引物或探针。更具体地说,本发明的重组载体可包括“CanIon基因的基因组序列”部分、“CanIon cDNA序列”部分、“编码区”部分、“多核苷酸构建物”部分和“寡核苷酸探针和引物”部分所述的任何一个多核苷酸。
在第一个优选实施例中,用本发明的重组载体扩增插入的衍生自SEQ ID No 1-3或6的CanIon基因组序列或CanIon cDNA的多核苷酸,例如在合适细胞宿主中的SEQID No 4cDNA,每次重组载体复制时都会扩增这个多核苷酸。
本发明重组载体的第二优选实施例包括含有本发明的调节性多核苷酸或编码核酸或二者的表达载体。在一些实施例中,用表达载体表达CanIon多肽,然后可纯化并且,例如,用于配体筛选试验中或用作免疫原,以产生抗CanIon蛋白质的特异性抗体。在另一些实施例中,用此表达载体构建转基因动物及用于基因治疗。表达需要在载体中提供适当信号,所述信号包括各种调节元件,如来自病毒和哺乳动物的增强子/启动子,驱动感兴趣的基因在宿主细胞表达。本发明的表达载体通常包括显性药物选择标记,其用于建立表达产物的永久性稳定细胞克隆,这是因为它们是将药物选择标记表达与多肽表达相连接的元件。
更具体地说,本发明涉及表达载体,其包含编码CanIon蛋白质,最好是SEQ IDNo 5氨基酸序列的CanIon蛋白质或其变体或片段的核酸。
本发明涉及用于CanIon编码序列的重组表达载体,其中所述载体包含SEQ ID No4核酸。
包含含有CanIon相关双等位标记的核酸的重组载体也是本发明的一部分。在优选的实施方案中,所述双等位标记选自A1-A18及其互补物。
以下部分将详细叙述在本发明的载体中可找到的一些元件。
本发明还包括脊椎动物,最好是哺乳动物特别是人来源的源代、次代和固定化的同源重组宿主细胞,这些细胞被基因工程改造:a)将外源(异源)多核苷酸插入到靶基因的内源染色体DNA中,b)删除内源染色体DNA,和/或c)用外源多核苷酸取代内源染色体DNA。插入、删除、和/或取代多核苷酸序列可以是靶基因和/或调节区的编码序列,如可操作性连接于靶基因的启动子和增强子序列。
本发明也涉及体内外同源重组宿主细胞的制备方法,其中改变了在细胞中不能正常表达的靶基因的表达。这种改变最好能在正常生长条件下或适合产生靶基因编码的多肽的条件下引起靶基因表达。这种方法包括以下步骤:(a)用一种多核苷酸构建物体内外转染细胞,该多核苷酸构建物包括:(i)靶序列;(ii)调节序列和/或编码序列;以及(iii)若需要,不成对的剪接供体位点,从而产生一种转染细胞;以及(b)在适合同源重组的条件下体内外保持此转染细胞。
本发明还涉及改变体内外细胞靶基因表达的方法,其中此基因在细胞中不能正常表达,该方法包括以下步骤:(a)用一种多核苷酸构建物体内外转染细胞,该多核苷酸构建物包括:(i)靶序列;(ii)调节序列和/或编码序列;以及(iii)若需要,不成对的剪接供体位点,从而产生转染细胞;以及(b)在适合同源重组的条件下体内外保持此转染细胞,从而产生一种同源重组细胞;以及(c)在适合该基因表达的条件下体内外保持此同源重组细胞。
本发明又涉及通过改变内源靶基因在体内外细胞中的表达来制备本发明多肽的方法,其中此基因在细胞中不能正常表达,该方法包括以下步骤:(a)用一种多核苷酸构建物体外转染细胞,该多核苷酸构建物包括:(i)靶序列;(ii)调节序列和/或编码序列;以及(iii)若需要,不成对的剪接供体位点,从而产生转染细胞;(b)在适合同源重组的条件下体内外保持该转染细胞,从而产生一种同源重组细胞;以及(c)在适合此一基因表达的条件下体内外保持该同源重组细胞,从而制备此多肽。
本发明还涉及改变靶基因在不能正常表达该基因的细胞类型中的表达的多核苷酸构建物。当该多核苷酸构建物插入到靶细胞染色体DNA中时就会发生这种情况,其中此多核苷酸构建物包括:a)靶序列;b)调节序列和/或编码序列;以及c)若需要,不成对的剪接供体位点。本发明也包括上述多核苷酸构建物,其中此构建物还包括编码一多肽、而且与染色体DNA同源重组后与内源靶基因同在读框内的多核苷酸。
可用本领域已知的技术制备该组合物及其实施方法,可参考以下专利:美国专利6,054,288、6,048,729、6,048,724、6,048,524、5,994,127、5,968,502、5,965,125、5,869,239、5,817,789、5,783,385、5,733,761、5,641,670、5,580,734;国际专利WO96/29411、WO 94/12650;以及科学论文包括Koller等,Proc.Natl.Acad.Sci.USA 86:8932-8935页,(1989年)。
1.本发明表达载体的一般特征
本发明的重组载体包括,但不限于,YAC(酵母人工染色体)、BAC(细菌人工染色体)、噬菌体、噬菌粒、粘粒、质粒或者甚至是线性DNA分子(包括染色体、非染色体、半合成和合成DNA)。这样一种重组载体可包含转录单位,该转录单位含有以下组合:
(1)在基因表达中起调节作用的遗传元件,,例如,启动子或增强子。增强子是顺式作用DNA元件,通常长10至300bp,作用于启动子以提高转录。
(2)转录成mRNA,而且最后翻译为多肽的结构性或编码序列,,所述结构性或编码序列与(1)所述的调节元件可操作性连接;以及
(3)合适的转录起始和终止序列。用于酵母或真核生物的表达系统的结构单位最好包括能够被宿主细胞胞外分泌的翻译蛋白质的前导序列。此外,当重组蛋白质在没有前导序列或转运序列的情况下得到表达时,它可包含N未端残基。该残基可或不可能在以后从已表达的重组蛋白质切割下来时,都可以产生终产物。
重组表达载体通常含有复制起点、使宿主细胞转化的选择标记、以及衍生自高度表达的基因以指导下游结构序列转录的启动子。在适当阶段用翻译起始和终止序列,最好是能够指导已翻译的蛋白质分泌到质间隙或胞外介质的前导序列,装配异源结构序列。在一具体实施例中,此载体适合在哺乳动物宿主细胞中转染和表达所需序列,优选载体含有在所需宿主中复制的起点、合适的启动子和增强子、以及必需的核糖体结合位点、聚腺苷酸化信号、剪接供体和受体位点、转录终止序列和5’旁侧非转录序列。可用衍生自SV40病毒基因组的DNA序列,例如SV40起始点、早期启动子、增强子、剪接和聚腺苷酸化信号来提供所需的非转录遗传元件。
可用SEQ ID No 5的CanIon多肽或其片段或变体的体内表达,以纠正与宿主生物中天然基因表达或与无生物活性的CanIon蛋白质的产生有关的遗传缺陷。
所以,本发明还包括重组表达载体,此载体主要设计用于在需要治疗的病人体内导入适当遗传材料,而在体内产生SEQ ID No 5的CanIon多肽或其片段或变体。可将这种遗传材料体外导入预先从生物体中取出的细胞中,然后将经过修饰的细胞再直接导入所述生物体内的适当组织。
2.调节元件
启动子
选择用于本发明表达载体的适当启动子区,要考虑必须能表达的细胞宿主。用于调控感兴趣核酸序列表达的特定启动子被认为并不重要,只要它能够指导该核酸在靶细胞中表达。因此,若人细胞是靶细胞,最好将核酸编码区置于能够在人细胞中得到表达的启动子,例如人或病毒启动子的附近和控制下。
适当的启动子就它调控表达的核酸而言可以是外源或与含有要表达的编码序列的天然多核苷酸是内源性的。此外,启动子就已插入构建物启动子/编码序列的重组载体序列而言通常是外源性的。
例如,可用CAT(氯霉素转移酶)载体,最好用pKK232-8和pCM7载体从任何所需基因中选择启动子区。
优选细菌启动子是LacI、LacZ、T3或T7噬菌体RNA聚合酶启动子、gpt、λ-PR、PL和trp启动子(欧洲专利EP 0036776)、多角体蛋白启动子、或杆状病毒的p10蛋白启动子(Kit Novagen)(Smith等,1983年;O’Reilly等,1992年)、λ-PR启动子或者trc启动子。
真核生物的启动子包括CMV立即早期、HSV胸苷激酶、早期和晚期SV40、逆转录病毒的LTRs以及小鼠金属硫蛋白-L启动子。本领域普通技术人员懂得如何选择适当载体和启动子。
选择启动子在基因工程领域技术人员能力之内。例如,可参看Sambrook等(1989年)的书或Fuller等(1996年)所述的步骤。
其它调节元件
若采用cDNA插入,一般希望包含聚腺苷酸化信号,使基因转录作适当的聚腺苷酸化。认为聚腺苷酸化信号的性质对本发明的成功实施影响不大,可采用任何这样一个序列,如人生长激素和SV40聚腺苷酸化信号。终止子也被认为是表达盒的一个元件。这些元件可用来提高信息水平,以及使从表达盒到其它序列的连读减至最小。
3.选择性标记
这些标记赋予细胞一种可识别的变化,以便较易鉴定含有表达构建物的细胞。选择转化宿主细胞的选择账标记基因最好是二氢叶酸还原酶或抗真核细胞培养基新霉素、啤酒酵母或四环素的TRP1、抗大肠杆菌(大肠杆菌)的利福霉素或氨苄青霉素、或分枝菌的左聚糖蔗糖酶,后一种标记是负选择标记。
4.优选的载体
细菌载体
作为一种代表性但无限制作用的例子,在细菌应用上有用的表达载体可含有选择性标记和细菌复制起点,其衍生自包含pBR322遗传元件(ATCC 37017)的市售质粒。例如,这些市售载体包括pKK223-3(Pharmacia,Uppsala,瑞典)以及GEM1(PromegaBiotec,Madison,WI,美国)。
有许多其它合适的市售载体是本领域技术人员所知道的,如以下细菌载体:pQE70、pQE60、pQE-9(Qiagen)、pbs、pD10、phagescript、psiX174、pbluescript SK、pbsks、pNH8A、pNH16A、pNH18A、pNH46A(Stratagene);ptrc99a、pKK223-3、pKK233-3、pDR540、pRIT5(Pharmacia);pWLNEO、pSV2CAT、pOG44、pXT1、pSG(Stratagene);pSVK3、pBPV、pMSG、pSVL(Pharmacia);pQE-30(QIAexpress)。
噬菌体载体
P1噬菌体载体可包含在大约80至100kb范围的大插入片段。
Sternberg(1992和1994年)叙述了P1噬菌体载体如p158或p158/neo8的构建。可设计含有CanIon核苷酸序列的重组P1克隆,插入了40kb以上的大多核苷酸(Linton等1993年)。为了制备转基因实验用的P1DNA,优选方案是McCormick等(1994年)提出的方案。简单地说,将含有P1质粒的大肠杆菌(最好是NS3529株)在含有25μg/ml卡那霉素的适当肉汤培养基中培养过夜。用Qiagen质粒大抽试剂盒(Qiagen,Chatsworth,CA,美国)按照制造商的说明书通过碱裂解从大肠杆菌制备P1DNA。用试剂盒内的清洗和洗脱缓冲液在两根Qiagen-tip 500柱上从细菌裂解液中纯化得到P1DNA。进行苯酚/氯仿抽提,再用70%乙醇沉淀DNA。将DNA溶解在TE(10mMTris-HCl,pH 7.4,1mM EDTA)后,用光谱测量法评估DNA的浓度。
当目的是在转基因动物通常是转基因小鼠中表达含有CanIon核苷酸序列的P1克隆时,需要除去P1DNA片段的载体序列,例如,在P1多接头(polylinker)内的稀有切割位点(SfiI,NotI或SalI)上切割P1DNA。再用类似最初报道的用于将DNA与YACs分离的方法(Schedl等,1993年;Peterson等,1993年),从脉冲场琼脂糖凝胶上的载体序列纯化得到P1插入片段。在此阶段,若需要,可在MilliporeUltrafree-MC过滤装置(Millipore,Bedford,MA,美国,限为30,000分子量)上浓缩所得的纯化插入片段DNA,然后,在微透析膜(VS型,0.025μM,购自Millipore公司)上以含有100mM氯化钠、30μM精氨、70μM亚精氨的微注射缓冲液(10mMTris-HCl,pH 7.4;250μMEDTA)透析。在1%琼脂糖(Sea Kem GTG;FMC Bio-products)脉冲场凝胶上电泳,以及用溴化乙啶染色评估纯化的P1DNA插入片段的完整性。
杆状病毒载体
SEQ ID No 5的CanIon多核苷酸或其片段或变体表达所用的适当载体,是可在昆虫细胞和昆虫细胞系中增殖的杆状病毒载体。特别适便的宿主载体系统是pVL1392/1393杆状病毒转移载体(Pharmingen),这种载体用于转染衍生自草地夜蛾(Spodoptera frugiperda)的SF9细胞系(ATCC N°CRL 1711)。
其它用于SEQ ID No 5CanIon多肽或其片段或变体在杆状病毒表达系统中表达的适当载体包括Chai等(1993年)、Vlasaki等(1983年)以及Lenhardi等(1996年)所述的载体。
病毒载体
在一具体实施例中,此种载体衍生自腺病毒。本发明的优选腺病毒载体是Feldman和Steg(1996年)或Ohno等(1994年)所述的腺病毒载体。本发明该具体实施例的另外一些优选重组腺病毒是人腺病毒2或5型(Ad 2 or Ad 5)或来自动物的腺病毒(法国专利申请FR-93.05954)。
一般认为,逆转录病毒载体以及腺相关病毒是,选来用于体内转移外源多核苷酸给哺乳动物包括人的重组基因运送系统。这些载体能有效地将基因运送给细胞,转移的核酸稳定整合在宿主染色体DNA中。
本发明体内外逆转录病毒基因运送载体的制备或构建,特别优选的逆转录病毒包括选自水貂细胞病灶诱导病毒、小鼠肉瘤病毒、网状内皮组织增殖病毒和罗斯肉瘤病毒(Rous Sarcoma virus)等逆转录病毒。特别优选的小鼠白血病病毒包括4070A和1504A病毒,Abelson(美国典型培养物保藏所(ATCC)编号为VR-999)、Friend(ATCC编号为VR-245)、Gross(ATCC编号为VR-590)、Rauscher(ATCC编号为VR-998)以及莫洛尼小鼠白血病病毒(ATCC编号为VR-190;PCT申请WO 94/24298)。特别优选的罗斯肉瘤病毒包括Bryan高滴定度(high titer)(ATCC编号为VR-334、VR-657、VR-726、VR-659和VR-728)。Roth等(1996年)、PCT申请WO 93/25234、PCT申请号WO 94/06920、Roux等(1989年),Julan等,1992年以及Neda等(1991年)也叙述了其它优选的转录病毒载体。
本发明考虑的另一种病毒载体系统包括腺相关病毒(AAV)。腺相关病毒是天然产生的缺损性病毒,它需要另一种病毒如腺病毒或疱疹病毒作为有效复制和增殖性生命周期的辅助病毒(Muzyczka等,1992年)。它也是可将其DNA整合入不分裂细胞中的病毒,显示出整合稳定、频率高(Flotte等,1992年;Samulski等,1989年;McLaughlin等,1989年)。腺相关病毒的一个优点在于对原代细胞的转导较转化的细胞效率较低。
BAC载体
Shizuya等(1992年)开发了细菌人工染色体(BAC)克隆系统,可以在大肠杆菌中稳定保持基因组DNA的大片段(100-300kb)。优选的BAC载体包括Kim等(1996年)所述的pBeloBAC11载体。以这种载体用经酶部分消化大小选择的基因组DNA制备BAC文库,可使基因组DNA与载体中的BamHI或HindIII位点连接。T7和SP6RNA聚合酶转录起始位点位于这些克隆位点侧面,可用其产生RNA转录或PCR方法所需的末端探针。在大肠杆菌中构建BAC文库后,从宿主细胞纯化超螺旋环的BAC DNA。在测定大小和将BAC导入受体细胞之前要将这些环状分子转变成线性型式。此克隆位点侧接两个NotI位点,通过NotI消化从载体上切下克隆片段。另外,用市售酶λ终止酶处理BAC载体,导致独特cosN位点切断,使包含在pBeloBAC11载体中的DNA插入片段线性化,但这种切割方法会产生含有插入DNA和BAS序列的全长BAC克隆。
5.重组载体的输送
为了使本发明多核苷酸和多核苷酸构建物有效表达,必须将这些构建物运送入细胞。这种输送可在体外实现,如在转化细胞系的实验步骤中,或者在体内或活体外现,如在治疗某些疾病状态时。
一种机制是将表达构建物包裹在感患性病毒粒子内进行病毒感染。
本发明也考虑了几种将多核苷酸转移到培养的哺乳动物细胞中的非病毒方法,包括但不限于,磷酸钙沉淀(Graham等,1973年;Chen等,1987年)、DEAE-葡聚糖(Gopal,1985年)、电穿孔(Tur-Kaspa等,1986年;Potte等,1984年)、直接显微注射(Harland等,1985年)、DNA装载脂质体(Nicolau等,1982;Fraley等,1979年)以及受体介导的转染(Wu和Wu,1987和1988年)。其中一些技术在体内外已获得成功应用。
一旦将表达多核苷酸输入细胞,它可稳定地整合入受体细胞的基因组中。这种整合可能在关连位置(cognate location),而且与同源重组(基因取代)的方向一致,或者它可随机整合入非特定位置(基因增强)。在另外一些实施例中,核酸可以作为独立、附加型DNA片段稳定地保持在细胞中。这些核酸片段或“附加体”编码的序列得从充分保持和复制,独立于宿主细胞周期或与宿主细胞周期同步。
在一具体实施例中,将蛋白质或多肽体内送到脊椎动物细胞内的方法包括以下步骤:将含有生理上可接受运载体和操作性编码感兴趣多肽的裸多核苷酸制剂导入到含有该细胞的组织间隙,在那里裸多核苷酸被摄入细胞内,而具有生理效应。这种方法特别适用于体外转移,但也可用于体内。
PCT申请WO90/11092(Vical Inc.)和PCT申请WO 95/11307(Institut Pasteur,INSERM,Universitéd’Ottawa)以及Tacson等(1996年)和Huygen等(1996年)的论文叙述了用于体内外的包含“裸露”多核苷酸的组合物。
如Klein等(1987年)所述,本发明的另一实施例中,通过粒子轰击(生物弹)将包括本发明多核苷酸构建物的本发明裸露多核苷酸转移入细胞,所述粒子是被加速至高速的包被了DNA的显微发射物,使它们可穿过细胞膜,而不必杀死细胞就可进入细胞内。
在又一实施例中,将本发明的多核苷酸包裹在脂质体内(Ghosh和Bacchawat,1991年;Wong等,1980年;Nicolau等,1987年)。
在一具体实施例中,本发明提供在体内产生本文所述的CanIon蛋白质或多肽的组合物。该组合物含有操作性编码该多肽的裸露多核苷酸,它溶于生理上可接受的运载体溶液中,适合导入组织引起组织细胞表达所述蛋白质或多肽。
被注射到所需宿主生物体的载体量随注射部位而不同。作为指标性剂量,在动物体内,优选在哺乳动物体内例如小鼠体内,注射的载体是在0.1和100μg之间。
在本发明的另一个载体实施例中,将它在体外导入宿主细胞内,优选导入从待治疗动物采集的宿主细胞内,更优选为体细胞,如肌细胞。在后一步骤中,将已用编码所需CanIon多肽或其所需片段的载体转化的细胞重新导入动物体内,以便在体内局部或系统性地输送该重组蛋白质。
细胞宿主
本发明的另一个目的包括已经用本文所述多核苷酸之一,特别是含有CanIon调节性多核苷酸或选自SEQ ID No 1-4的CanIon多肽编码序列的多核苷酸或其片段或其变体,转化或转染的宿主细胞。本发明也包括已用上述重组载体之一转化(原核生物细胞)或转染(真核生物细胞)的宿主细胞。更具体地说,本发明的细胞宿主可包含“CanIon基因的基因组序列”部分、“CanIon cDNA序列”部分、“编码区”部分、“多核苷酸构建物”部分、“寡核苷酸探针和引物”部分所述的任何一个多核苷酸。
本发明的另一种重组细胞宿主包括本文所述的任何一种载体,特别是“重组载体”部分所述的任何一种载体。
以下是用作本发明表达载体受体的优选宿主细胞:
a)原核生物宿主细胞:大肠杆菌株(I.E.DH5-α株)、枯草芽孢杆菌、沙门杆菌、以及假单胞杆菌属、链霉菌属、葡萄球菌属等菌属。
b)真核生物宿主细胞:海拉细胞(Hela cells)(ATCC编号为CCL2、编号为CCL2.1、编号为CCL2.2)、Cv 1细胞(ATCC编号为CCL70)、COS细胞(ATCC编号为CRL1650、编号为CRL1651)、Sf-9细胞(ATCC编号为CRL1711)、C127细胞(ATCC编号为CRL-1804)、3T3(ATCC编号为CRL-6361)、CHO(ATCC编号为CCL-61)、人肾293(ATCC编号为45504、CRL-1573)以及BHK(ECACC编号为84100501、84111301)。
c)其它哺乳动物宿主细胞。
在哺乳动物细胞通常是人细胞中CanIon基因表达可能产生缺陷,或者它可先插入CanIon基因组或cDNA序列,再用本发明的CanIon多核苷酸取代动物细胞基因组中CanIon基因的相应部分。用上述特异性DNA构建物通过同源重组可产生这些基因变化。
一种可供使用的细胞宿主是哺乳动物合子,如小鼠合子。例如,小鼠合子用纯化的感兴趣DNA分子进行显微注射,例如,在含有100mM氯化钠、30μM精氨和70μM亚精氨的10mMpH 7.4Tris-HCl、250μMEDTA中浓度已调整至BAC插入片段为1ng/ml的、P1噬菌体插入片段为3ng/μl的纯化DNA分子。如Schedl等(1993年)所述,当要显微注射的DNA尺寸较大时,可使用多胺和高盐浓度,以避免该DNA发生机械断裂,。
可将本发明的任何一个多核苷酸,包括本文所述的DNA构建物,导入胚胎干(ES)细胞系内,最好导入小鼠胚胎干细胞系内。胚胎干细胞系衍生自预先植入的胚母细胞的内部细胞块中的多能、未定型(uncommitted)的细胞。以下是优选的胚胎干细胞系:ES-E14TG2a(ATCC编号为CRL-1821)、ES-D3(ATCC编号为CRL1934和CRL-11632)、YS001(ATCC编号为CRL-11776)、36.5(ATCC编号为CRL-11116)。为了使胚胎干细胞保持未定型状态,将它们在生长受抑制的饲养细胞存在下培养,饲养细胞可提供适当信号以保留这种胚胎表型以及起着胚胎干细胞粘附基质作用。优选的饲养细胞是从任何一种小鼠品系的13至14日胚胎组织建立的原代胚胎成纤维细胞,如Abbondanzo等(1993年)所述,将它们保持在培养中,如Robertson(1987年)所述,通过照射,或如Pease和Williams(1990年)所述,在LIF抑制浓度存在下,抑制它们的生长。
可用宿主细胞中的此构建物用常规方法产生该重组序列编码的基因产物。
转化适当宿主和当宿主生长至合适的细胞密度后,以变温或化学诱导等适当方法诱导选择的启动子,并使细胞多培养一段时期。
一般通过离心收细胞,以物理或化学方式裂解,保留所得粗提取物作进一步纯化。
可用任何一种适当方法裂解用于蛋白质的微生物细胞,包括冻融循环、超声波、机械破裂、或使用溶胞剂。这些方法是本领域技术人员熟知的。
转基因动物
本文所用的术语“转基因动物”或“宿主动物”指其基因组由于遗传和人工操纵而包含本发明核酸之一的动物。优选的动物是非人动物,包括属于选自鼠类(例如小鼠)、家鼠(例如大鼠)、以及家兔(例如家兔)的动物,它们的基因组通过人工和遗传方法插入了本发明的核酸而发生改变。在一实施例中,本发明包括非人宿主哺乳动物和含有本发明重组载体或用敲除的载体进行同源重组而受破坏的CanIon基因的动物。
本发明的转基因动物在它们的多个细胞中都含有克隆的重组或合成DNA序列,更具体地说,其中一个纯化的或分离的核酸含有CanIon编码序列、CanIon调节性多核苷酸、多核苷酸构建物或编码本文所述反义多核苷酸的DNA序列。
本发明的转基因动物通常包含本发明所述的一种多核苷酸、重组载体以及细胞宿主。更具体地说,本发明的转基因动物可包含“CanIon基因的基因组序列”部分、“CanIon cDNA序列”部分、“编码区”部分、“多核苷酸构建物”部分、“寡核苷酸探针和引物”部分、“重组载体”部分和“细胞宿主”部分所述的任何一种多核苷酸。
如本发明所述的其它转基因动物在它们的体细胞和/或种系细胞中包含一个多核苷酸,该多核苷酸含有选自A1-A18及其互补物的双等位标记。
在第一优选实施例中,这些转基因动物是优良实验模型,用于研究与细胞分化有关的多种病理学,特别是其基因组内插入了编码天然CanIon蛋白质或突变CanIon蛋白质的多核苷酸的一个或多个拷贝的转基因动物。
在第二优选实施例中,这些转基因动物可在CanIon基因的调节性多核苷酸的调控下表达感兴趣的所需多肽,导致感兴趣蛋白质合成的高产率,最后导致感兴趣蛋白质的组织特异性表达。
按照本领域技术人员所知的常规技术可设计本发明的转基因动物。关于转基因动物制备的详情,特别是转基因小鼠,可参考1989年10月授权的美国专利4,873,191、1995年11月7日授权的美国专利5,464,764、以及1998年8月4日授权的美国专利5,789,215,这些文献列于本文的参考文献中,公开了转基因小鼠的制备方法。
采用导致动物的基因组掺入了外源遗传物质的步骤,制备本发明的转基因动物。这些步骤包括获取遗传物质或其部分,该遗传材料或其部分编码CanIon编码序列、CanIon调节性多核苷酸、或编码本文所述CanIon反义多核苷酸的DNA序列。
将本发明的重组多核苷酸插入到胚细胞或胚胎干细胞系内。这种插入最好如Thomas等所述(1987年)用电穿孔进行。筛选要进行电穿孔的细胞(如通过选择标记选择、通过PCR或DNA印迹分析法选择),宜通过同源重组找到已经将外源重组多核苷酸整合入其基因组中的阳性细胞。Mansour等(1988年)叙述了可用睛本发明的阳性-阴性选择方法。
然后,按Bradley(1987年)所述分离阳性细胞、克隆并注入3.5日龄的小鼠胚泡中。再将这些胚泡插入雌性宿主动物,生长一段时期。
另外,按Wood等(1993年)或Nagy等(1993年)所述使阳性胚胎干细胞与2.5日龄8-16细胞期(桑椹期)的胚胎接触,胚胎干细胞被内化,集落扩展成胚泡含有产生种系的细胞。
测试雌性宿主的后代以确定哪只动物是转基因动物,例如哪只动物包含有插入的外源DNA序列,以及哪只动物是野生型。
所以,本发明还涉及含有本发明的核酸、重组载体或重组宿主细胞的转基因动物。
衍生自本发明转基因动物的重组细胞系
本发明的又一目的包括从本文所述的转基因动物获得的重组宿主细胞。在一实施例中,本发明包括衍生自非人宿主哺乳动物和动物的细胞,这些动物含有本发明重组载体或由于敲除载体进行同源重组而受破坏的CanIon基因。
从本发明转基因动物的任何组织获得的细胞可在体外建立重组细胞系,例如,如Chou(1989年)和Shay等(1991年)所述,用表达诸如SV40大T抗原等onc-基因的载体转染原代细胞培养物。
筛选CanIon调节剂和与相互作用化合物的方法
在许多实施方案中,本发明提供了可与CanIon多肽、通道和多核苷酸反应、结合或者活化或抑制CanIon多肽、通道和多核苷酸的表达或活性的化合物。此类化合物可以是任何有机或无机化合物,包括但不限于多肽、多核苷酸、脂类、碳水化合物、核苷酸、氨基酸或小分子抑制剂或活化剂。如本说明书其它地方所述,此类化合物对于治疗或预防许多疾病或症状都是有效的。优选地,CanIon活性或表达的抑制剂可用于治疗或预防精神疾病如精神分裂症或双极情感障碍。
筛选CanIon通道调节剂的方法
能够结合CanIon的化合物以及能够调节CanIon功能的化合物在治疗此类疾病中有重要用途。电压门控离子通道通常是作为药靶建立的,因为它们是药物可达到的,由许多基因编码,且通常作为多聚体蛋白质的装配体发挥作用,导致在功能和解剖学上高度特异。此外,由于离子通道的开放和关闭与电压敏感的氨基酸的移动导致构象状态和离子通道的变化有关,可设计状态依赖性分子,这种分子只与处在传导(激活)或非传导(失活)状态的通道结合。
此外,已经证明许多钙通道调节剂对于治疗或预防许多疾病和症状都是有效的。例如,已显示钙通道抑制剂可有效治疗各种心血管疾病和症状(如心绞痛、心律失常、高血压)以及CNS和神经疾病(如偏头痛、中风对神经的影响、癫狂、安定药诱导的迟发性运动障碍、精神分裂症、双极情感障碍、疼痛、癫痫等)。此外,已证明钙通道激动剂有许多用途,如减少局部麻醉的持续时间或削弱局部麻醉的效力。CanIon通道的拮抗剂和激动剂在治疗或预防这些以及其它疾病和症状时有类似的作用。例如,CanIon拮抗剂可用于治疗或预防精神分裂症或双极情感障碍。
由于电压门控离子通道的活化不需要激动剂的结合,所以宜筛选针对CanIon通道功能的化合物。可将包括功能方法和放射性配体结合方法的各种试验应用于表达天然或克隆通道的细胞(小泡或膜)或整个细胞试验。整个细胞功能试验可采用电生理学技术,如膜片箝。试验可能涉及任何类型的电压门控通道,优选L、N和T型通道。也可测量通过该通道的运动离子流,例如用荧光技术、末端放射性示踪技术或细胞生存力技术。
试验还可使用各种毒素、毒液或与通道结合并使通道开放或闭合的化合物(Denyer等,Drug Disc.Today3(7):323-332(1998),在此将其全文并入以供参考)。在一个实施方案中,本发明的试验包括使用大量已知的钙通道激动剂和拮抗剂之一,例如作为阳性或阴性对照。合适的已知钙通道拮抗剂的例子包括苯基烷基胺(如戊脉安)、benzothiazepines(如地尔硫卓)和二氢吡啶(如硝苯吡啶);钙通道激动剂包括FPL-64176和BAY K 8644;钠通道激动剂包括箭毒蛙碱;钠通道拮抗剂包括spiradoline、脉律定、U-54494A((≠/-)-顺-3,-二氯N-甲基-N-[2-(1-吡咯烷基)-环己基]-苯甲酰胺)。此类化合物也可用作“引导”化合物,即作为设计或发现特异性结合或调节CanIon通道的衍生分子的起始分子。
在优选的实施方案中,本发明的试验包括筛选候选物质的方法,该方法包括以下步骤:
a)提供(i)含有多肽的样品或宿主细胞,该多肽含有CanIon蛋白质或其片段,或者由或基本上由CanIon蛋白质或其片段构成,或者(ii)表达编码多肽的多核苷酸的宿主细胞,所述多肽含有CanIon蛋白质或其片段,或者由或基本上由CanIon蛋白质或其片段构成。
b)获得候选物质;
c)使所述宿主细胞与所述候选物质接触;
d)测定所述候选物质对CanIon活性的作用。
可按照熟知的方法实施候选物质对CanIon活性的作用的测定。优选地,候选物质对CanIon活性的作用是激动或拮抗作用。通常,如果转运离子(如Ca2+或Na+)的能力降低则该化合物抑制CanIon。如果转运离子的能力升高则该化合物刺激CanIon。
可用合适的方法测定CanIon的活性。在优选的实施方案中,是通过测量信号传递活动检测CanIon活性的。信号传递活动可包括分子特性或细胞参数的任何适当变化,信号传递活动的非限制性例子包括离子流量的变化,如Ca2+或Na+,或K+流的变化或产生,或者包括酶活性的变化。
一方面,可采用(例如)测量一个细胞或膜片箝中的全细胞电流的技术,通过测量CanIon通道的电生理学性质来监测离子流。在另一个实施例中,可使用荧光或放射性标记来检测已知的CanIon结合化合物的转移,或者检测通过细胞(如标记的Ca2+或Na+)中的离子流。可使用细胞生理参数的指示剂,如细胞生存力的荧光指示剂。在其它实施例中,可检测指示剂物理位置的改变,如采用荧光激活细胞分选以鉴定生理指示剂的排除或摄取。
本发明的试验所用的样品包含多肽或表达多肽的宿主细胞,所述多肽含有CanIon蛋白质或其片段,或者由或基本上由CanIon蛋白质或其片段构成,或者(ii)表达编码多肽的多核苷酸的宿主细胞,所述多肽含有CanIon蛋白质或其片段,或者由或基本上由CanIon蛋白质或其片段构成。优选地,本发明的CanIon试验包括使用表达功能性CanIon多肽的重组宿主细胞。宿主细胞可表达或包含CanIon通道的功能性α亚基,或者可表达或包含一个或多个其它的离子通道亚基,或者是含有CanIon的离子通道复合物。优选地,采用了具有低内源离子通道表达或具有低背景离子(尤其是Ca2+和/或Na+)电导的宿主细胞。
放射性配体结合
一方面,可通过鉴定与CanIon感兴趣的位点结合和最好具有所需的调节作用的高亲和配体,并检测试验化合物转移所述被标记的配体的能力,来筛选CanIon通道。Denyer等(同上)提供了用于电压门控(Ca2+、Na+和K+)通道试验的毒理学/药理学试剂的列表。该方法通常适合于检测与此相同位点结合的化合物,或者与此位点变构偶联(如标记的配体)但不提供关于所述化合物的激动性能或拮抗性能的信息的化合物。
基于细胞的荧光和放射性示踪试验
在另一试验中,CanIon的功能是用荧光-离子指示剂或放射性标记的离子,通过测量渗透性离子的胞内浓度进行监测的。
通常,离子通道如Na+通道在电压刺激后数毫秒内失活。Ca2+通道没有失活现象或者失活程度较低,并可因高K+去极化作用而开放。在基于细胞的荧光和放射性示踪试验中,CanIon通道通常可被毒素或任何试验化合物、或高K+去极化作用活化,这样此通道在延长的一段时间内可保持开放(多达数分钟)。
在基于荧光的试验中,可采用荧光素Ca2+染料(如Fluo-3、Calcium green-1、Molecular Probes,OR,美国)。可用等渗溶液使膜去极化以活化Ca2+通道,或者用毒素或其它化合物使Na+通道活化,在20-60秒内可在细胞中测得所产生的荧光瞬时移动。Denyer等(同上)进一步描述了荧光测量系统和装置。放射性示踪剂22Na+和14C-胍通常被用来分析Na+通道,而45Ca2+被用来分析Ca2+通道。在Denyer等(同上)所描述的优选实施方案中,采用Cytostar-T闪烁微板(Amersham International,U.K.)来进行基于CanIon细胞的高通量试验。
在其它试验中,通过用膜电势指示剂测量膜电势来监测Ca2+对离子通道的功能。生物膜的高电阻可使小的离子流通过质膜,从而引起膜电势的大变化。因此可方便地用电压试验来检测通过膜的总离子流。通常选择细胞系以使内源离子通道的影响最小。有许多可作为膜电势指示剂染料的染料,分成快反应和慢反应染料,以及基于FRET的电压敏感染料。(Aurora Biosciences,加利福尼亚州,美国;可参阅Gonzalez等,Drug Disc.Today 4(9):439(1999)。
细胞生存力
在细胞生存力试验中,离子通道的活性和离子流与细胞生存力直接相关。酵母细胞和哺乳动物细胞系统都可被用作离子通道试验的靶子。例如,使用了采用离子特异性K+摄取不足的酿酒酵母细胞系的酵母系统,其中感兴趣的功能性K+通道在该细胞系中表达,从而恢复K+的摄取并促使细胞存活。(Anderson等,Symp.Soc.Exp.Biol.48:85-97(1994)。这种Ca2+或Na+通道的试验可用来鉴定能够阻遏CanIon功能的化合物。也可使用哺乳动物细胞系统,比如用哺乳类成神经细胞瘤细胞和细胞生存力比色读出器进行的Na+通道试验。用Na+通道开启剂和Na+/K+泵抑制剂处理细胞以促进致死性胞内Na+超负荷。用能够阻遏此通道的试验化合物处理,将提高细胞的生存力,而用可提高通道开放的化合物处理将进一步促进细胞死亡。(Manger等,Anal.Biochem.214:190-194(1993)。
电生理学
电生理学电压膜片箝技术包括测量流过一个或多个通道的离子流。一个微电极被用来控制膜电压,同时通过细胞或膜片箝测量了电流。(Hamill,PfugersArch.391,85-100(1981)。因此可测量存在或不存在感兴趣的试验化合物时的离子电流。已经设计出了大规模筛选化合物的系统(Neurosearch A/S,Glostrup,Denmark;Olesen等,Vol tage gated ion channel modulators,7-8December,PhiladelphiaPA,USA(1995);Denyer等,同上)。
与CanIon多肽相互作用的物质的筛选方法
对本发明而言,配体意味着一种分子,如能够结合CanIon蛋白质或其片段或变体或调节编码CanIon多核苷酸或其片段或变体的蛋白质、肽、抗体或合成化合物。
在本发明的配体筛选方法中,使待测生物样本或已限定的分子作为CanIon蛋白质推定配体(putative ligand)与相应的纯化CanIon蛋白质接触,例如,与本文上述由重组细胞宿主产生的纯化的相应重组CanIon蛋白质接触,以便在该蛋白质和待测推定的配体分子之间形成复合物。
作为一个举例说明的例子,为了研究CanIon蛋白质或含有SEQ ID No5连续跨距至少6个氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、100、200、300、400、500或1000个氨基酸的片段,与药物或小分子的相互作用,例如,可采用Wang等(1997年)所述的通过组合化学方法、与高效液相层析法相连的微量透析,或用Bush等(1997年)所述的亲和毛细管电泳法等制备的分子,具体可参考本文的引用文献。
在另外一些方法中,可用以下试验鉴定,能与CanIon蛋白质或含有SEQ ID No.5的连续跨距至少6个氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸相互作用的肽药物、脂肪酸、脂蛋白或小分子。用可检测的标记来标记待测的结合分子,如萤光、放射活性、或酶标记,并使该分子在发生特异性结合的条件下与固定化的CanIon蛋白质或其片段接触。去掉非特异性结合分子后,用适当方法检测结合分子。
本发明的另一个目的包括与CanIon多肽相互作用的候选物质的筛选方法和试剂盒。
本发明涉及能与CanIon蛋白质或其片段或变体相互作用的物质的筛选方法。由于它们能够通过共价或非共价键与CanIon蛋白质或其片段或变体结合,所以这些物质可供体内外使用。
在体外,所述相互作用的分子可用作检测工具,来鉴定样品最好是生物样品中存在的CanIon蛋白质。
候选物质的筛选方法包括以下步骤:
a)提供包含CanIon蛋白质或片段,或者由或基本上由CanIon蛋白质或片段组成的多肽所述片段含有SEQ ID No.5的连续跨距至少6个氨基酸,优选长至少8至10个氨基酸,较优选长至少12、15、20、25、30、40、50、或100个氨基酸;
b)获得候选物质;
c)使所述多肽与所述候选物质接触;
d)检测在所述多肽与所述候选物质之间形成的复合物。
本发明还涉及能与CanIon多肽相互作用的候选物质的筛选试剂盒,其中所述试剂盒包括:
a)具有选自SEQ ID No 5的氨基酸序列,或含有SEQ ID No 5的至少6个氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸的肽片段的Camlon蛋白质;
b)任选的可用于检测CanIon蛋白质或某肽片段或其变体与候选物质之间形成的复合物的手段。
在上述试剂盒的优选实施例中,该检测手段包括抗CanIon蛋白质或其肽片段或其变体的单克隆或多克隆抗体。
可测试各种候选物质或分子与CanIon多肽的相互作用。这些物质或分子包括但不限于天然或合成的有机化合物或生物来源的分子,如多肽。当候选物质或分子包括多肽时,这个多肽可以是属于噬菌体随机肽文库的噬菌体克隆产生的表达产物,或者此多肽可以是克隆在适合于进行双杂交筛选试验的载体中的cDNA文库产生的表达产物。
本发明还涉及用于进行上述筛选方法的试剂盒。这些试剂盒宜包括CanIon多肽或其片段或变体,任选地包括用于检测CanIon多肽或其片段或变体与候选物质之间形成的复合物的检测工具。在一优选实施例中,此检测工具包括抗相应CanIon多肽或其片段或变体的单克隆或多克隆抗体。
A.从随机肽文库获得的候选配体
在筛选方法的具体实施例中,推定配体是包含在噬菌体载体中的DNA插入片段表达产物(Parmley和Smith,1988年)。特别是采用随机肽噬菌体文库。随机DNA插入片段编码长8至20个氨基酸的肽(Oldenburg K.R.等,1992年;Valadon P.等,1996年;Lucas A.H.,1994年;Westerink M.A.J.,1995年;Felici F.等,1991年)。根据该具体实施例,保留表达能与固定化CanIon蛋白质结合的蛋白质的重组噬菌体,随后可用抗CanIon蛋白质的多克隆或单克隆抗体免疫沉淀CanIon蛋白质与重组噬菌体之间形成的复合物。
一旦在重组噬菌体中构建了此配体文库,使噬菌体群与固定化CanIon蛋白质接触。然后,洗涤复合物制剂,除去非特异性结合的重组噬菌体。特异性结合CanIon蛋白质的噬菌体用缓冲液(酸性pH)洗脱或用杂交瘤产生的抗CanIon单克隆抗体作免疫沉淀,随后通过细菌(例如大肠杆菌)过度感染来扩增该噬菌体群。此选择步骤可重复多次,最好重复2至4次,以便选择更具特异性的重组噬菌体克隆。最后一步包括通过在感染细胞中的表达和分离使该噬菌体插入片段在另一个宿主/载体系统表达,或者对包含在所选重组噬菌体中的插入片段进行测序,选出重组噬菌体克隆来产生此肽。
B.通过竞争实验获得的候选配体
此外,在竞争实验中可鉴定能结合CanIon蛋白质或含有SEQ ID No 5的连续跨距至少6个氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸的片段的肽,药物或小分子。在这些试验中,将CanIon蛋白质或其片段固定在一表面上,如塑料平板上。在带有可检测标记的已知CanIon蛋白质配体存在下,增加肽、药物、或小分子的量,并与固定化CanIon蛋白质或其片段接触。例如,可用萤光、放射活性、或酶标记来标记CanIon配体,使其可被检测到。在测试分子存在下测定结合的带有可检测标记的已知配体量,以确定测试分子结合CanIon蛋白质或其片段的能力。当存在待测分子时,结合CanIon蛋白质的已知配体量下降,表明该测试分子能够结合CanIon蛋白质或其片段。
C.通过亲和层析法获得候选配体
能与CanIon蛋白质或含有SEQ ID No 5的连续跨距至少6个5氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸的片段相互反应的蛋白质或其他分子是候选配体。利用常规技术可将CanIon蛋白质或其片段附着于层析柱上,这些技术包括与适当的层析柱基质,如琼脂糖、AffiGel_、或其它本领域技术人员熟悉的基质化学偶联。在此方法的一些实施例中,此亲和层析柱含有嵌合蛋白质,其中CanIon蛋白质或其片段与谷胱甘肽S-转移酶(GST)融合。将上述细胞蛋白质的混合物或表达的蛋白质的合并物加到此亲和层析柱上。然后如Ramunsen等(1997年)所述在2-D电泳凝胶上分离附着于此核的Camlon蛋白或其片段相互反应的蛋白质或其他分子和分析,所述文献列于本文的参考文献中。此外,可用基于电泳的方法纯化保留在亲和层析柱上的蛋白质并测序。同样的方法可用于分离抗体、筛选噬菌体展示产物或筛选噬菌体展示的人抗体。
D.通过光生物传感方法获得候选配体
如Edwards和Leatherbarrow(1997年)以及Szabo等(1995年)所述,用光生物传感方法筛选能与CanIon蛋白质或其片段相互作用的蛋白质,所述片段含有SEQ IDNo 5的连续跨距氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸。所述文献列于本文的参考文献中。这种技术可实时检测分子之间的相互作用,而无需标记分子。这种技术基于表面胞质基因组共振现象(SPR)。简单地说,将待测候选配体分子附着于表面(如羟甲基葡聚糖基质)上。光束直射不包含待测样品的表面一侧,并自所述表面反射。SPR使反射光强度随角度和波长的具体组合而降低。候选配体分子的结合导致表面的折射率发生改变,检测这种改变作为SPR信号的变化。为了筛选能够与CanIon蛋白质或其片段相互作用的候选配体分子或物质,将CanIon蛋白质或其片段固定在一表面上。该表面包括待测试候选分子流经的细胞一侧。检测结合在CanIon蛋白质或其片段上的候选分子作为SPR信号的变化。待测候选分子可以是蛋白质、肽、碳水化合物、脂质、或用组合化学制备的小分子。实施这种技术时,通过将真核生物或原核生物的细胞或含有内源或重组表达CanIon蛋白质小泡的脂质固定在它们的表面上。
这种方法的主要优点是它可测定CanIon蛋白质和与CanIon蛋白质相互作用的分子之间的结合速率。故可用强结合常数或相反地用弱结合常数特异性选择与CanIon蛋白质或其片段相互作用的配体分子。
E.通过双杂交筛选试验获制得候选配体
设计了依赖于诱饵蛋白质(bait portein)与酵母Gal4蛋白质DNA结合区的融合的酵母双杂交系统用于研究体内蛋白质—蛋白质的相互作用(Fields和Song,1989年)。美国专利US5,667,973和US5,283,173(Fields等)叙述了这种技术,两项专利揭示的技术内容列于本文的参考文献中。
用双杂交试验筛选文库的一般步骤可按Harper等(1993年)或Cho等(1998年)或者Fromont-Racine等(1997)所提出的方法。
诱饵蛋白质或多肽包括CanIon多肽或片段,或者由或基本上由CanIon多肽或片段组成,所述片段含有SEQ ID No 5的连续跨距至少6个氨基酸,优选长至少8至10个氨基酸,更优选长至少12、15、20、25、30、40、50、或100个氨基酸。
更准确地说,将编码CanIon多肽或其片段或变体的核苷酸与编码GAL4蛋白质DNA结合区的多核苷酸融合,该融合核苷酸序列插入到适当表达载中,例如pAS2或pM3。
接着,在专门设计的载体中构建人cDNA文库,使人cDNA插入片段与载体中编码GAL4蛋白质转录区的核苷酸序列融合。所用的载体最好是pACT载体。由人cDNA文库的核苷酸插入片段编码的多肽称为“待捕”(“pray”)多肽。
第三载体含有可检测标记基因,如受一调节序列控制的β半乳糖苷酶基因或CAT基因,而该调节序列对结合含有转录活化结构域和,DNA结合域的完整Gal4蛋白质起反应。例如,可采用载体pG5EC。
也可采用两种不同酵母菌株。作为举例说明但不起限制作用的例子是以下两种不同酵母菌株:
-Y190,其表型是(MATa、Leu2-3、112ura3-12、trp1-901、his3-D200、ade2-101、gal4Dgal180D URA3 GAL-LacZ、LYS GAL-HIS3、cyhr);
-Y187,其表型是(MATa gal4 gal80 his3 trp1-901 ade2-101 ura3-52 leu2-3、
-112URA3GAL-lacZmet-),Y187是Y190的相反接合型。
简单地说,将20μg的pAS2/CanIon和20μg的pACT-cDNA文库一起转化入酵母菌株Y190中。在缺乏组氨酸、亮氨酸和色氨酸,但含有组氨酸合成抑制剂3-AT(50mM)的最低基础培养基上选择性培养此转化体。通过提升滤过试验(filter lift assay)筛选β半乳糖苷酶的阳性克隆。然后使双阳性克隆(His+、β-gal+)在缺乏组氨酸、亮氨酸但含有色氨酸和环己酰亚胺(10mg/ml)的平板上生长,选择丧失pAS2/CanIon质粒,但保留pACT-cDNA文库质粒的克隆。如Harper等(1993年)和Bram等(1993年)所述的Gal4融合那样,使所得Y190菌株与表达CanIon或无关调控蛋白质环孢素亲合素B、核纤层蛋白或SNF的Y187菌株交配;以及通过提升滤过试验筛选β半乳糖苷酶。与调控Gal4融合物交配后是βgal的酵母克隆被认为是假阳性。
在本发明双杂交方法的另一个实施例中,用Matchmaker双杂交系统2(产品号K1604-1,Clontech)评估CanIon或其片段或变异体与细胞蛋白质之间的相互作用。如本文引用的参考文献中Matchmaker双杂交系统2(产品号K1604-1,Clontech)内附手册所述,将编码CanIon蛋白质或其部分的核酸插入到一表达载体上,使它们与编码酵母转录激活剂GAL4的DNA结合区在读框内。将所需cDNA特别是人cDNA插入第二表达载体,使它们与编码GAL4活化区的DNA在读框内。将这两种表达质粒转化入酵母中,将该酵母菌接种在选择培养基上,选择每种表达载体上选择标记的表达以及HIS3基因依赖的GAL4表达。筛选能够在缺乏组氨酸的培养基上生长依赖于GAL4的lacZ表达的转化体。在组氨酸选择和lacZ试验中均呈阳性的那些细胞含有CanIon与由初始选择的cDNA插入片段编码的蛋白质或肽之间的相互作用。
与CanIon基因调节序列相互作用的物质的筛选方法
本发明还涉及能够与CanIon基因调节序列如启动子或增强子序列相互作用的物质或分子的筛选方法。
如本文参考文献中所引用的Clontech公司的Matchmaker单杂交系统试剂盒(产品号K1603-1)内附的使用手册所述,可用单杂交系统鉴定编码能够与CanIon基因的调节序列相互作用的蛋白质的核酸,更具体地说,选自5’或3’调节区的多核苷酸或其片段或变体的核苷酸,而变体最好含有本发明的双等位标记之一。简单地说,将靶核苷酸序列克隆在选择的报导序列上游,将产生的DNA构建物整合入酵母基因组中(酿酒酵母菌)。再用含有编码能结合于CanIon基因调节序列的候选蛋白质的cDNA与编码GAL4等酵母转录因子活化区的序列之间的融合蛋白的文库,转化其基因组中含有报导序列的酵母细胞。将该重组酵母细胞接种在液体培养基中,以选择表达报导序列的细胞。这样选出的重组酵母细胞含有能够结合CanIon基因中靶调节序列的融合蛋白。然后,给编码该融合蛋白的cDNA测序,并可将其克隆到体外表达或转录载体中。采用本领域技术人员熟悉的技术可确证编码的多肽与CanIon基因中靶调节序列的结合,如凝胶阻滞试验或DNA酶(DNAse)保护试验。
如Fried和Crothers(1981年)、Garner和Revzin(1981年)以及Dent和Latchman(1993年)所述,也可单独地进行凝胶阻滞试验以筛选能够与CanIon基因调节序列相互作用的候选分子,具体可参考本文的引用文献。这些技术基于与蛋白质结合的DNA片段比同样的非结合DNA片段移动得慢这一原理。简单地说,使靶核苷酸序列带上标记。再将已标记的靶核苷酸序列与细胞的含有转录因子的总胞核提取物或不同的待测候选分子接触。进行凝胶或毛细管电泳后通过移动阻滞检测CanIon基因的靶调节序列与候选分子或转录因子之间的相互作用。
调节CanIon基因表达的配体的筛选方法
本发明的又一个主题是调节CanIon基因表达的分子的筛选方法。这种筛选方法包括以下步骤:
a)培养在其自身启动子的调控下用编码CanIon蛋白质或其变体或片段的核苷酸序列转染原核生物或真核生物细胞;
b)使经过培养的细胞与待测分子接触;
c)定量测定CanIon蛋白质或其变体或片段的表达。
在一实施例中,编码CanIon蛋白质或其变体或片段的核苷酸序列包括双等位标记A12或A16及其互补物的至少一个等位基因。
使用本领域技术人员熟知的DNA重组技术,将编码CanIon蛋白质的DNA序列插入到表达载体的启动子序列下游处。作为一个举例的例子,CanIon基因的启动子序列包含在5’调节区的核酸中。
在mRNA水平或蛋白质水平上都可定量测定CanIon蛋白质的表达。对于后一种情况,例如,在ELISA或放射免疫试验中用多克隆或单克隆抗体定量测定已产生的CanIon蛋白质含量。
在一优选实施例中,用对CanIon特异性引物对定量测定cDNA的PCR扩增产物,而所述cDNA从培养的CanIon转染宿主细胞的全mRNA通过逆转录而制得,就可以定量测定CanIon mRNA。
本发明还涉及能够提高,或者相反,能够降低CanIon基因表达水平的物质或分子的筛选方法。这样一种方法使本领域技术人员可以选择对CanIon基因表达水平具有调节作用,而且可用作活性物质包含在治疗患有本文所述疾病的病人的药物组合物中。
所以,本发明的部分内容是能调节CanIon基因表达的候选物质或分子的筛选方法,该方法包括以下步骤:
—提供含有一种核酸的重组细胞宿主,其中所述核酸含有5’调节区的核苷酸序列或其位于编码可检测蛋白质的多核苷酸上游且具有生物活性的片段或其变体;
—获得候选物质;以及
—测定该候选物质调节编码该可检测蛋白质的多核苷酸表达水平的能力。
在另一实施例中,含有5’调节区的核苷酸序列或其具有生物活性的片段或变体的核酸也包括SEQ ID No 4的CanIon cDNA 5’非翻译(UTR)区,或其具有生物活性的片段或变体。
在编码可检测蛋白质的优选多核苷酸中,还可包括编码β-半乳糖苷酶、绿萤光蛋白质(GFP)以及氯霉素转移酶(CAT)的多核苷酸。
本发明也涉及本文所述筛选方法使用的试剂盒。这些试剂盒包括一重组载体,其使位于上游且操作性连接于编码可检测蛋白质或CanIon蛋白质或其片段或变体的5’调节区的核苷酸序列或其具有生物活性的片段或变体得到表达。
在另一个调节CanIon基因表达的候选物质或分子的筛选方法中,所述方法包括以下步骤:
a)提供含有一种核酸的重组细胞宿主,其中所述核酸含有SEQ ID No 4的CanIoncDNA的5’UTR序列,或其具有生物活性的片段或变体之一,此5’UTR序列或其具有生物活性的片段或变体可操作性连接于编码可检测蛋白质的多核苷酸上;
b)获得候选物质;以及
c)测定该候选物质调节编码可检测蛋白质的多核苷酸表达水平的能力。
在上述筛选方法的具体实施例中,该核酸含有选自SEQ ID No 4的CanIon cDNA的5’UTR序列或其具有生物活性的片段或变体的核苷酸序列,包括与CanIon 5’UTR序列的内源性启动子序列。
在上述筛选方法的另一具体实施例中,该核酸含有选自SEQ ID No 4的CanIoncDNA的5’UTR序列或其具有生物活性的片段或变体的核苷酸序列,包括本文所述CanIon 5’UTR序列的外源性启动子序列。
在又一个实施例中,该核酸含有CanIon cDNA或SEQ ID No 4的5’UTR序列或其具有生物活性的片段,包括选自A12或A16的双等位标记或其互补物。
本发明也包括调节CanIon基因表达的候选物质的筛选试剂盒,其中所述试剂盒包括一重组载体,其含有包括操作性连接于编码可检测蛋白质的多核苷酸的SEQ ID No4的CanIon cDNA的5’UTR序列,或者其具有生物活性的片段或变体之一的核酸。
如国际专利申请公开号WO 97/05277所述的方法可采用长探针通过溶液杂交分析CanIon表达水平和模式,具体可参考本文的引用文献。简单地说,将上述CanIon cDNA或CanIon基因组DNA或其片段插入紧靠噬菌体(T3、T7或SP6)RNA聚合酶启动子下游处的克隆位点,以产生反义RNA。CanIon插入片段最好含有基因组DNA序列或cDNA序列的至少100个或以上连续核苷酸。在含有经修饰的核糖核苷酸(即生物素-UTP和DIG-UTP)的核糖核苷酸存在下使该质粒线性化和转录。使过量的该双标记RNA与从所述细胞或组织分离的mRNA在溶液中杂交。杂交在标准严格杂交条件(40-50℃,含有80%甲酰胺、pH值7-80.4M氯化钠缓冲液中杂交16小时)下进行。用对单链RNA具有特异性的核糖核苷酸酯(即RNA酶CL3、T1、Phy M、U2或A)消化除去没有杂交的探针。存在的生物素-UTP修饰能够将杂交物捕获在包被有链霉亲和素的微滴定板上。存在的DIG修饰能够用与碱性磷酸酶偶联的抗DIG抗体通过ELISA检测或定量测定杂交物。
也可用阵列定量测定CanIon基因表达。本文所述的术语阵列意味着多个核酸的一维、二维或多维排列,而该多个核酸长度要足以特异性检测能够与其杂交的mRNA的表达。例如,此阵列可包含多个核酸,这些核酸衍生自其表达水平待评估的基因。这些阵列可包括CanIon基因组DNA、CanIon cDNA序列或其互补序列或其片段,特别是含有本发明至少一个双等位标记,优选双等位标记A1-A17至少一个的那些序列。这些片段最好长至少15个核苷酸。在其它实施例中,这些片段长至少25个核苷酸。在一些实施例中,这些片段长至少50个核苷酸。较优选的是,这些片段长至少100个核苷酸。在另一个优选实施例中,这些片段长至少100个核苷酸以上。在一些实施例中这些片段可以长500个核苷酸以上。
例如,按照Schena等(1995和1996年)所述的方法,用互补DNA显微阵列定量测定CanIon基因表达。以PCR扩增全长CanIon cDNA或其片段,用高速机器人(high-speed robotics)使它们从96孔微滴定板移到硅烷化显微镜玻片上重新排列。印刷阵列(printed arrays)在潮湿室中培养,使阵列元件重新复水,在0.2%SDS中洗一次,时间为1分钟,在水中洗两次,时间为1分钟,在硼氢化钠溶液中洗一次,时间为5分钟。在95℃将阵列浸在水中2分钟,转移到0.2%SDS浸1分钟,用水洗两次,风干,黑暗中储存于25℃。
分离细胞或组织的mRNA,或从市场购买,通过单轮逆转录制备探针。在60℃14×14mm玻璃盖玻片下使探针与1cm2微阵列杂交6-12小时。阵列在25℃低严格洗涤缓冲液(1×SSC/0.2%SDS)中洗5分钟,再在室温下高严格洗涤缓冲液(0.1×SSC/0.2%SDS)中洗10分钟。用设有定制过滤装置的萤光激光扫描装置在0.1×SSC溶液中扫描阵列。算出两次独立同杂交的平均比值,可以测定准确的差异表达。
也可用Pietu等(1996年)所述方法,用互补DNA阵列中全长CanIon cDNA或其片段定量分析CanIon基因表达。全长CanIon cDNA或其片段以PCR扩增,并点滴在膜上。然后,将各种组织或细胞来源的mRNA以放射活性核苷酸标记。在控制条件下进行杂交和洗涤后,用磷屏成像(phosphoimaging)或自动放射线照相术检测已杂交的mRNA。进行重复实验,并定量分析差异表达的mRNA。
此外,也可如Lockhart等(1996年)和Sosnowsky等(1997年)所述,通过高密度核苷酸阵列用CanIon基因组DNA、CanIon cDNA或其片段对表达进行分析。将序列具体是包含本发明双等位标记之一,优选包含选自A1A17的一个双等位标记的序列或其互补序列的15-20个核苷酸的寡核苷酸直接在芯片上合成(Lockhart等见上),或合成后置于芯片上(Sosnowski等见上)。此寡核苷酸最好长大约20个核苷酸。
从适当mRNA群合成以适当化合物如生物素、洋地黄毒苷或萤光染料标记的CanIon cDNA探针,然后使这些探针随机片段化为平均大小50至100个核苷酸的片段。然后使探针与该芯片杂交。按Lockhart等所述方法洗涤后,施加不同电场(Sosnowski等,1997年),检测和定量测定染料或标记化合物。进行重复杂交。对不同cDNA样品互相同靶寡核苷酸上cDNA探针产生的信号密度进行比较分析,表明CanIon mRNA的表达有差异。
抑制CanIon基因表达的方法
本发明其它治疗组合物的优点包括用CanIon核酸序列的寡核苷酸片段作为反义工具或三螺旋工具抑制相应CanIon基因的表达。Camlon核序列的优选片段含有双等位标记A1-A17之一的等位基团。
反义方法
本发明反义多核苷酸使用的优选方法是Sczakiel等(1995年)所述的步骤。
最好在与CanIon mRNA 5’端互补的多核苷酸(长15-200bp)中选择反义工具。在另一个实施例中,使用与所需靶基因不同部分互补的不同反义多核苷酸的组合。
本发明优选的反义多核苷酸与含有翻译起始密码子ATG或剪接供体或受体位点的CanIon mRNA序列互补。
反义核酸的长度和解链温度要足以形成胞内双链体,其稳定性足以抑制双链体中CanIon mRNA的表达。Green等(1986年)以及Izant和Weintraub(1984年)叙述了设计适合用于基因治疗的反义核酸的策略,具体可参考本文的引用文献。
在一些策略中,将CanIon编码区的取向与启动子的方向逆置,以便转录在细胞中正常转录的反向链,从而获得反义分子。用体外转录系统如采用T7或SP6聚合酶产生转录物的那些系统,转录该反义分子。另一种方法包括使含有反义序列的DNA与适当表达载体中的启动子操作性连接,体内转录CanIon反义核酸。
另外,Rossi等(1991年)、国际申请WO 94/23026、WO 95/04141、WO 92/18522以及欧洲申请EP 0 572 287 A2也叙述了适当的反义策略。
本发明采用的另一种反义技术包括使用核酶,所述核酶通过其互补多核苷酸尾部与靶序列结合,并且通过水解其靶位点(即“锤头核酶”(“hammerhead ribozymes”))切割相应的RNA。简单地说,锤头核酶的简化循环包括(1)通过互补反义序列使序列特异性结合于靶RNA;(2)定点水解靶链的可切割位点;以及(3)释放切割产物,产生另一个催化循环。的确,使用长链反义多核苷酸(长至少30个碱基)或带有长反义臂的核酶有优点。将这些反义核酶与亲脂基团共价键连续或用脂质体作为方便的载体,得到反义核酶的优选输送系统。按Sczakiel等(1995年)所述方法制备本发明的优选反义核酶,具体制备步骤可参照本文参考文献所引述的文章。
三螺旋方法
也可用CanIon基因组DNA抑制基于胞内三螺旋形成的CanIon基因的表达。
用三螺旋寡核苷酸抑制基因组的转录。它们特别适用于研究当细胞与特定基因有关时其活性的变化。
类似地,可用CanIon基因组DNA的一部分研究细胞内CanIon转录的抑制效应。传统上,认为同源嘌呤序列在三螺旋策略中是最有用的。然而,同源嘧啶序列也可抑制基因表达。这些同源嘧啶寡核苷酸结合于同源嘌呤:同源嘧啶序列的主沟槽(majorgroove)。故两种CanIon基因组DNA的序列也在本发明的范围内。
为了用三螺旋方法进行治疗,首先扫描CanIon基因组DNA的序列,以鉴定一段10-mer至20-mer的同源嘧啶或同源嘌呤序列,该序列可用在基于三螺旋的抑制CanIon表达的策略中。鉴定候选同源嘧啶或同源嘌呤序列后,将含有候选序列的各种含量寡核苷酸导入表达CanIon基因的组织培养细胞中,以评估它们抑制CanIon表达的效率。
可用本领域技术人员已知的各种方法将该寡核苷酸导入细胞中,包括但不限于磷酸钙沉淀、DEAE-葡聚糖、电穿孔、脂质体介导的转染或天然摄取。
用RNA印迹、RNA酶保护试验或基于PCR的策略等技术监测经处理细胞的细胞功能变化和CanIon表达的下降,从而鉴测经该寡核苷酸处理过的细胞中CanIon基因的转录水平。
如在反义方法中所述,用在上述反义方法中所述的技术以根据体外结果计算出的剂量将有效抑制组织培养细胞基因表达的寡核苷酸导入体内。
在一些实施例中,用α端基异构体取代该寡核苷酸单元的天然(β)端基异构体,赋予此寡核苷酸对核酶的更大抗性。此外,可使溴乙啶等嵌入剂附着于α寡核苷酸的3’端上,来稳定此三螺旋。要了解适合形成三螺旋的寡核苷酸的制备方法,可参看本文的引用文献Griffin等(1989年)。
药物组合物和制剂
调节CanIon的化合物
用本文所述方法可鉴定体内外能选择性调节CanIon活性的CanIon激动或拮抗化合物。因此,本发明包括治疗精神分裂症、双极情感障碍和本文所述其它疾病或症状患者的方法,该方法包括施用有效量的调节CanIon的化合物。优选的,所述化合物是选择性调节CanIon的化合物。例如,通过本发明方法鉴定的化合物包括对人CanIon肽具有结合特异性的抗体。还估计,CanIon类似物也可用于调节CanIon介导的活性以及与精神分裂症或双极情感障碍相关的有关生理状况。一般预计,本发明的基于CanIon在中枢神经系统疾病中作用的试验方法,可用于鉴定能够干扰本发明级联反应试验的化合物。在优选的实施方案中,对患有精神分裂症或双极情感障碍的患者的治疗是通过给予所述患者含有治疗有效量CanIon拮抗药的药物组合物进行的。
适应症
虽然CanIon与精神分裂症和双极情感障碍相关的基因组区连续,包括CanIon的适应症包括各种中枢神经系统疾病。神经系统疾病的遗传基础比较复杂,通常具有一些共同的症状。具体地说,如本文所述,适应症可包括精神分裂症和其它精神病、喜怒无常症、孤独症、药物成瘾和酗酒、癫痫精神发育不全疼痛疾病、及其它精神疾病,包括认知能力、焦虑、多食、冲动控制及人格障碍。疾病的定义可参考精神病的诊断和统计手册第四版(DSM-IV)此外许多心血管疾病包括心绞痛高血压和心律失常也可用Camlon调节剂、优选拮抗剂治疗。
药物制剂及给药途径
用本发明方法鉴定的化合物可单独或将它们与适当运载体或赋形剂混合而成的药物组合物以有效治疗剂量给予包括病人在内的哺乳动物,以治疗或减缓精神分裂症和双极情感障碍相关疾病。有效治疗剂量指足够使本文所述方法确定的症状缓解的化合物剂量。有效治疗剂量最好适合连续周期性服用或施用。制剂技术和直接应用的化合物的给药可参照最新版的“Remington’s药物科学”,Mack出版社,Easton,PA。
给药途径
给药的适当途径包括口服、经直肠、经粘膜、或肠内给药,经肠胃外输送,包括肌内、皮下、髓内注射以及胸内、直接心室内、静脉内、腹膜内、鼻内或眼内注射。中枢神经系统疾病的治疗化合物的一种特别有用的给药方法包括通过手术植入能在一段延长时间内输送该化合物的装置。特别考虑本发明药物的缓释制剂。
组合物/制剂
可用含有赋形剂和辅助剂的一种或多种生理上可接受的运载体以常规方式配制用于本发明的药物组合物和药剂。合适的制剂取决于所选择的给药途径。
本发明用于注射的药剂可配制成水溶液,最好是在生理上相容的缓冲液,如Hanks’s溶液、林格(Ringer’s)溶液,或者生理盐水,如磷酸盐或碳酸氢盐缓冲液。用于经粘膜给药时,可在制剂中使用能渗透屏障的适合渗透剂。这些渗透剂通常已为本领域所公知。
供口服的药物制剂包括明胶制成的推装(push-fit)胶囊、以及明胶和甘油或山梨醇等增塑剂制成的密封软胶囊。推装胶囊可含有活性成分和填充物,如乳糖,结合剂,如淀粉,和/或润滑剂,如滑石或硬脂酸镁,以及可任选地,稳定剂组成的混合物。在软胶囊中,可将活性化合物溶于或悬浮于适当液体中,如脂肪油、液体石蜡、或液体聚乙二醇。此外,还可加入稳定剂。所有供口服给药的制剂应配成适合给药的剂量。
以常规方式将口服组合物配制成片剂或锭剂形式。
本发明以吸入方式给药的化合物可借助适当的气体推进剂如二气化碳很容易从加压包或啧雾器以气溶胶形式输送。如果是加压气溶胶,可通过提供阀门(valve)来确定剂量单位以输送计好的量。例如用于吸入剂或吹入剂的明胶胶囊或药筒,可配制成含有化合物和乳糖或淀粉等适当粉未基质的粉末混合物。
也可配制经肠胃外注射例如药团注射(bolus injection)或连续静脉输注给药的化合物。供注射的制剂配成加入防腐剂的单位剂量形式,例如安瓿或多剂量容器中。组合物还可制成悬浮液、溶液或乳液水溶液等形式,并可含有配制剂,如悬浮剂、稳定剂和/或分散剂。
经肠胃外给药的药物制剂包括以水溶型式存在的活化化合物的水溶液。悬浮水溶液可包含增大悬浮液粘度的物质,如羟甲基纤维素钠、山梨醇、或葡聚糖。任选地,悬浮液还可包含适当的稳定剂或能增加化合物溶解性,从而可以制成高浓度溶液的试剂。
此外,活性成分使用前可以与适当运载体如无菌无热原的水形成粉末或冻干剂型。
除了上述制剂外,化合物也可配成贮存制剂。这样的长效制剂,可通过植入(如皮下或肌内)或通过肌内注射给药。例如,可使化合物与适当的聚合性或疏水性物质(如在可接受的油中作为乳剂)或离子交树脂一起配制,或作为微溶衍生物,如作为微溶盐。
另外,可用缓释系统输送化合物,如含有治疗药剂的固体疏水聚合物的半渗透基质。现已确定的缓释物质有很多种,它们已为本领域技术人员所公知。根据其化学性质,缓释胶囊释放化合物的时间为几星期,甚至长达100天以上。
根据治疗药剂的化学性质和生物稳定性,可采用另外一些稳定蛋白质的策略。
此药物组合物也可包含适当的固体或凝胶相运载体或赋形剂。这些运载体或赋形剂的例子包括但不限于碳酸钙、磷酸钙、各种糖类、淀粉、纤维素衍生物、明胶以及聚合物,如聚乙二醇。
有效剂量
适合本发明使用的药物组合物包括一些组合物,其中所包含的活性成分的有效量能够达到预期目的。更具体地说,有效治疗量是指能有效预防疾病发生或缓解接受治疗者的现有症状的量。确定有效量是本领域技术人员能力之内,特别是参照本发明详细叙述的内容。
可从细胞培养试验初步估计本发明方法使用的化合物的有效治疗量,可在动物模型中试用一个剂量。利用这些信息可更准确地确定人类使用的剂量。
有效治疗剂量指能够缓解病人症状的化合物量。用标准制药程序在细胞培养物或实验动物中可确定这些化合物的毒性和治疗效果,如确定LD50(对50%试验人群具有毒性剂量和ED50(对50%试验人群具有治疗效果的剂量)。毒性与治疗效果之间的剂量比率是治疗指数,它可表示为LD50与ED50之间的比值。优选治疗指数高的化合物。
从细胞培养试验和动物研究所得的数据可用于配制人用的剂量范围。这些化合物的剂量最好在包括ED50和,低毒或者无毒性的计算的浓度范围内。剂量可在这个范围内变化取决于所用的剂量及采用的给药途径。根源病人的状况由各个医生选择准确的制剂和给药途径(例如,参看Fingl等的“治疗的药理基础”第一章,1975年)。和计算机有关的实施方案
如本文所述,术语“本发明的核酸密码”包括的核苷酸序列基本上由以下组成,或者由以下任意一种组成:a)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或10000个SEQ ID No1-3核苷酸的连续跨距;b)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或6000个SEQ ID No 4核苷酸的连续跨距或者其互补物;c)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或10000个SEQ ID Nos1-3核苷酸的连续跨距,其中,所述连续跨距包含选自A1-A17的双等位标记;d)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、300或400个SEQ ID No 6核苷酸的连续跨距;e)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、300或400个SEQ ID No 6核苷酸的连续跨距,其中,所述连续跨距包含双等位标记A18;以及f)与上述核苷酸序列任意一种互补的核苷酸序列。
所述“本发明的核酸密码”还包含与以下同源的核苷酸序列:a)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或10000个SEQ ID No1-3核苷酸的连续跨距;b)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、500、1000、2000、3000、4000、5000或6000个SEQ ID No 4核苷酸的连续跨距;c)至少12、15、18、20、25、30、35、40、50、60、70、80、90、100、150、200、300或400个SEQ ID No6核苷酸的连续跨距;以及d)和上述任意一种序列互补的序列。同源序列是指相对于这些连续跨距,具有至少99%、98%、97%、96%、95%、90%、85%或75%的同源性的序列。可使用本文所述的方法确定同源性,所述方法包括具有默认参数或者具有修改参数的BLAST2N。同源序列也可以包括RNA序列,其中尿嘧啶代替了本发明核酸密码中的胸腺嘧啶。应认识到,本发明的核酸密码可以传统的单字母形式表示(见Stryer,Lubert.Biochemistry背页的内面,第3版.W.H Freeman & Co.,New York)或者以任何其它记录核苷酸在序列中身份的格式或密码表示。
如本文所述的,术语“本发明的多肽密码”包括含有至少6、8、10、12、15、20、25、30、40、50、100、150、200、300、400、500、700、1000、1200、1400、1600或1700个SEQ ID No5氨基酸的连续跨距的多肽序列。在优选的实施方案中,所述连续跨距包括SEQ ID No5第277、338、574、678、680、683、691、692、695、696、697、894、1481、1481、1483、1484、1485、1630、1631、1632、1636、1660、1667、1707、1709位的至少1、2、3、5、或10氨基酸。应认识到,本发明的多肽密码可以以传统的单字母形式或者三字母形式表示(见Stryer,Lubert.Biochemistry背页的内面,第3版.W.H Freeman & Co.,New York)或者任何其它记录序列中多肽身份的形式或密码表示。
本领域的技术人员可以理解,本发明的核苷酸密码和本发明的多肽密码可以在任何媒介上储存、记录以及操作,它们可以通过计算机读出或者存储。如本文所示,单词“记录”和“储存”是指用于将信息储存到计算机媒介上的过程。该领域技术人员可以方便地采用任何现有方法,将信息记录到计算机可读媒介上,产生包含本发明一种或多种核酸密码或者本发明一种或多种多肽密码的制品。本发明另一方面是其上已经记录了本发明至少2、5、10、15、20、25、30或50个核酸密码的计算机可读媒介。本发明另一方面是其上已经记录了本发明至少2、5、10、15、20、25、30或50个多肽密码的计算机可读媒介。
计算机可读媒介包括磁性可读媒介、光可读媒介、电子可读媒介和磁/光媒介。例如,所述计算机可读媒介可以是硬盘、软盘、磁带、CD-ROM、数字万能盘(DVD),随机存取存储器(RAM)或者只读存储器(ROM)以及其它本领域技术人员已知的其它媒介类型。
本发明的实施方案包括系统,具体是存储和操作本文所述的序列信息的计算机系统。在图2中以方块图的形式说明了计算机系统100的一个实施例。如本文所述,“计算机系统”是指用于分析本发明核酸密码的核苷酸序列或者本发明多肽密码的氨基酸序列的硬件、软件和数据存储部件。在一个实施方案中,所述计算机系统100是SunEnterprise 1000服务器(Sun Microsystems,Palo Alto,CA)。计算机系统100宜包括用于处理、存取和操作序列数据的处理器。处理器105可以是任何已知类型的中央处理器,如Intel Corporation的奔腾III,或者Sun、Motorola、Compaq或者International Business Machines的类似处理器。
计算机系统100宜为通用系统,它包括处理器105和存储数据的一个或多个内部数据存储部件110,以及一个或多个用于检索存储在所述数据存储部件上的数据的数据检索装置。该领域技术人员不难明白任意一种目前可以获得的计算机都是合适的。
在一个具体实施方案中,计算机系100包括连接于母线的处理器105和一个或多个内部数据存储装置110,所述母线连接于主存储器115(宜为RAM),装置110例如硬盘驱动器和/或其上记录了数据的其它计算机可读媒介。在一些实施方案中,计算机系统100还包括一个或多个数据检索装置118,用于读取存储在内部数据存储装置110上的数据。
数据检索器件118例如可以为软盘驱动器、高密度磁盘驱动器、磁带驱动器等、在一些实施方案中,内部数据存储装置110是包含控制逻辑和/或其上记录的数据的可移动式计算机可读媒介如软盘、高密度磁盘、磁带等。计算机系统100可以有利地包括或者通过从插入在数据检索器件中的数据存储部件读取控制逻辑和/或数据的合适软件来运行程序。
计算机系统100包括显示器120,用于向计算机用户显示输出。还应注意到计算机系统100可以和局域网或者广域网中的其它计算机系统125a-c连接,提供通向计算机系统100的集中入口通道。
用于存取和处理本发明核酸密码的核苷酸序列或者本发明多肽密码的氨基酸序列的软件(例如,检索工具、比较工具和模型工具等)在执行过程中可以驻留在主存储器115中。
在一些实施方案中,计算机系统100还可以包括序列比较器,比较器可参考存储在计算机可读媒介中的核苷酸或者多肽序列,比较上述存储在计算机可读媒介上的本发明的核酸密码或者本发明的多肽密码。“序列比较器”是指一种或多种在计算机系统100上执行的程序,用于将核苷酸序列或者多肽序列和其它核苷酸或者多肽序列和/或包括但不限于存储在数据存储装置中的肽、肽模拟物(peptidomimetics)和化学物质的化合物进行比较。例如,所述序列比较器可以参考存储在计算机可读媒介上的序列,比较存储在计算计可读媒介上的本发明核酸密码的核苷酸序列或者本发明多肽密码的氨基酸序列,来鉴定同源物、涉及生物功能的基序或者结构基序。本专利说明书中特别考虑了所的各种序列比较程序用于本发明这一方面。
图3是说明程序器200的一个实施方案的流程图,用于将新的核苷酸或者蛋白质序列与序列数据库进行比较,以确定新序列和数据库中的序列之间的同源程度。所述序列的数据库可以是存储在计算机系统100中的保密数据库,或通过Internet可以获得的公共数据库如GENBANK、PIR或SWISSPROT。
所述程序200开始于开始阶段201,然后移到阶段202,其中,待比较的新序列存储到计算机系统100的存储器中。如上所述,该存储器可以是任何类型存储器,包括RAM或者内部存储装置。
程序200然后转移到阶段204中,在这里,开放序列数据库,用于分析和比较。然后将程序200转移到阶段206,在这里,将存储在数据库中的第一序列读入计算机的存储中。然后,在阶段210中进行比较,来确定所述第一序列是否和第二序列相同。重点注意的是,这一步骤不限于进行所述新序列和数据库中第一序列之间的精确比较。对于比较两种核苷酸或者蛋白质序列来说,即使它们不相同,本领域的技术人员也知道那些熟知的方法。例如,可以将缺口引入一个序列中,以提高两种测试序列之间的同源水平。在比较过程中控制是否将缺口或其它特征引入测试序列中的参数,通常由计算机系统的用户输入。
一旦在阶段210进行了两种序列的比较,在决定阶段210就可作出两种序列是否.相同的判断。当然,术语“相同”不限于绝对相同的序列。在用户输入的同源参数范围内的序列在程序200中均可以标为“相同”。
若作出两种序列是相同的判断,将程序200移到阶段214,在这里,从数据库来的序列名称就会显示给用户。这一阶段通知用户,具有所示名称的序列完成了所输入的同源物限制。一旦所存储的序列的名称显示给用户,程序200移到决定阶段218,在此作出在数据库中是否存在更多序列的判断。若在数据库中不存在更多的序列,那么程序200移到阶段224,在此,指示器移到数据库中的下一个序列,使它可以与新的序列比较。以这种方式中,排列对比新序列与数据库中的每一个序列。
应注意到,若在决定阶段212已经作出了所述序列不同源的判断,那么程序200将立即移到决定阶段218,以确定数据库中是否存在任何可比较的其它序列。
因此,本发明一方面包括处理器、其上存储了本发明核酸密码或者本发明多肽密码的数据存储装置、具有和本发明核酸密码或者本发明多肽密码进行比较的参考核苷酸序列或多肽序列的可存储的数据存储装置,以及用于进行比较的比较器。序列比较器可以显示所比较序列之间的同源水平,或者鉴定本发明核酸密码和本发明多肽序列密码中的涉及生物功能的基序和结构基序,或者它可以鉴定和这些核酸密码和多肽密码比较的序列中的结构基序。在一些实施方案中,所述数据存储装置其上已经存储至少2、5、10、15、20、25、30或50个本发明核酸密码或本发明多肽密码的序列。
本发明另一方面是用于测定本发明核酸密码和参考核苷酸序列之间同源性水平的方法,所述方法包括如下步骤:通过使用能测定同源水平的计算机程序读出核酸密码和参考核苷酸序列,用该计算机程序确定此核酸密码与参考核苷酸序列之间的同源性。所述计算机程序可以是任何一种用于测定同源水平的计算机程序,包括那些本文中具体列举的,包括具有默认参数或修改参数的BLAST2N。该方法也可以通过使用上述的计算机系统读取本发明2、5、10、15、20、25、30或50个上述核酸密码并确定该核酸密码和参考核苷酸序列之间的同源性来进行。
图4说明计算机中程序250的一个实施方案的流程图,用于确定两种序列是否同源。程序250开始于开始阶段252,然后移到阶段254,在此,将待比较的第一序列存入存储器中。然后,在阶段256中将待比较的第二序列存入存储器中。然后,程序250移到阶段260,在此,读出第一序列中的第一字符,然后移到阶段262,在此读出第二序列的第一字符。应理解,若所述序列是核苷酸序列,那么所述字符通常为A、T、C、G或U中的一个。若所述序列是蛋白质序列,那么它应是以单字母表示的氨基酸密码,使第一和随后的序列可以方便地进行比较。
然后在决定阶段264中,作出两个字符是否相同的判断。若它们相同,那么程序250移到阶段268,在此,读取第一和第二序列中下一个字符。然后,作出下一个字符是否相同的判断。若它们相同,那么程序250继续这种循环,直到两个字符不相同。若作出接着的两个字符不相同的判断,程序250移到决定阶段274,来确定是否读取两序列中更多的字符。
若不读取多的字符,那么程序250移到阶段276,在此,将第一和第二序列之间同源水平显示给用户。通过计算第一序列中和序列总数不相同的序列之间字符的比例来确定同源水平。这样,若第一个100核苷酸序列的每个字符按第二序列中的每个字符排列,那么同源水平就为100%。
或者,计算机程序可以是比较本发明核酸密码的核苷酸序列和参考核苷酸序列,来确定在一个或多个位置上本发明核酸密码是否和参考核酸序列不同的计算机程序。任选地,该程序记录了本发明参考多肽或者核酸密码中任一序列的长度和插入、删除或者替换的核苷酸的身份。在一个实施方案中,此计算机程序可以是确定相对于参考核苷酸序列,本发明核酸密码的核苷酸序列是否包含一种或多种单一核苷酸多形性(SNP)的程序。这些单一核苷酸多形态可能各自包含单一碱基替换、插入或者删除。
本发明另一方面是测定本发明多肽密码和参考多肽序列之间同源水平的方法,该方法包括使用能测定同源水平的计算机程序读出多肽密码和参考多肽序列,并用计算机程序确定多肽密码和参考多肽序列之间的同源性。
因此,本发明的另一方面是确定本发明核酸密码在一个或多个核苷酸上不同于参考核苷酸序列的方法,该方法包括使用能鉴定核苷酸序列之间的差异的计算机程序读出核苷酸密码和参考核苷酸序列,并用计算机程序鉴定该核苷酸密码和参考核苷酸序列之间的差异。在一些实施方案中,此计算机程序是鉴定单一核苷酸多形性的程序。此方法可以通过上述计算机以及图4中所述的方法来进行。此方法的进行也可以使用计算机程序通过读取本发明和参考核苷酸序列的至少2、5、10、15、20、25、30或50个核酸密码,并用计算机程序鉴定该核酸密码和参考核苷酸序列之间的差异。
在其它实施方案中,计算机系统还包括用于鉴定本发明核酸密码的核苷酸序列或者本发明多肽密码的氨基酸序列中的特征的识别器。
“识别器”指一种或多种用于鉴定上述本发明核酸密码的核苷酸序列或者本发明多肽密码的氨基酸序列中某一特征的程序。在一个实施方案中,识别器可以包括能鉴定本发明cDNA密码中开放读框的程序。
图5是说明识别器程序300的一个实施方案的流程图,用于探测序列中存在的特征。程序300开始于开始阶段302,然后移到阶段304,在此,特待核查特征的第一序列存储到计算机系统100的存储器115中。然后,程序300移到阶段306,在此打开序列特征的数据库。这种数据库可以包括一列按特征命名归类的各个特征。例如,特征名可以是“起始密码子”属性可以为“ATG”。另一例子可以是特征名为“TAATAABox”其特征属性为“TAATAA”。这种数据库的例子由University of WisconsinGenetics Computer Group(www.gcg.com)制造。
一旦特征数据库在阶段306打开,程序300移到阶段308,在此,从所述数据库中读取第一特征。然后在阶段310作出第一特征和第一序列的属性比较。然后在阶段316作出第一序列中是否发现特征属性的判断。若发现了此属性,那么程序300移到阶段318,在此,将所发现的特征名显示给用户。
然后程序300移到决定阶段320,在此,确定在数据库中是否存在更多(move)的特征,若不存在更多的特征,那么程序300在终止阶段324终止。但是,若在数据库中存在更多的特征,那么程序300在阶段326中读取下一个序列的特征,并循环回到阶段310,在此将所述下一特征的属性和所述第一序列作比较。
应注意,若在决定阶段316,第一序列中没有发现此特征属性的话,程序300直接移到决定阶段320,以确定在数据库中是否存在任何更多的特征。
在另一实施方案中,识别器可以包括分子模型程序,用于确定本发明多肽密码的三维结构。在一些实施方案中,分子模型程序可鉴定靶序列,该靶序列与代表已知三维蛋白质结构中残基结构环境的轮廓最相容。(参见美国专利No.5,436,850)。在另一技术中,把某给定家族中蛋白质的三维结构相重叠,来明确该家属中结构上保守的区域。这种蛋白质模型技术也采用同源蛋白质已知的三维结构,来接近本发明多肽密码的结构。(参见例如美国专利No.5,557,535)。已常规采用了常规的同源模型技术来建立蛋白酶和抗体的模型。(Sowdhamini等,(1997))。当感兴趣的蛋白质和模板蛋白质的序列相同性不佳时,也可以采用相当的方法来开发三维蛋白质模型。在一些情况下,尽管具有很弱的序列相同性,蛋白质可折叠成类似的三维结构。例如,许多螺旋型细胞因子的三维结构可折叠成类似的三维布局,而不管序列同源性多弱。
现在,编织法(threading mtehod)的最新进展能在许多情况中鉴定类似的折叠模式,这些情况是靶和模板之间的结构相关性不能在序列水平探测到。在使用多序列编织(MST)进行折叠识别的混合法中,使用间距几何程序DRAGON从编织输出减去结构相等量,来构成低分辨率模型、并使用分子模型包如QUANTA来构成全原子成分(fullatomrepresentation)。
按照这种3-步方法,首先使用新型折叠识别算法MST来鉴定候选的模板,MST能将多个排列对比序列同时编织到一个或多个3-D结构中。第二步,将从MST输出获得的结构相等量转变为残基间的间距限制,并与二级结构预测获得的辅助信息一起输入间距几何程序DRAGON中。该程序以不偏倚的方式综合了约束条件,并迅速产生大量的低分辨率模型确证。第三步,将这些低分辨率模型确证转变为全原子(full-atom)模型,并用分子模型包QUANTA来使能量最化(见Aszodi等,(1997))。
然后此分子模型分析的结果可用于合理的药物设计技术中,来鉴定能调节本发明多肽密码活性的试剂。
因此,本发明另一方面是鉴定本发明核酸密码或者本发明多肽密码中特征的方法,该方法包括使用能鉴定其中特征的计算机程序读取核酸密码或者多肽密码,并用此计算机程序鉴定核酸密码或者多肽密码中的特征。在一个实施方式中,计算机程序包括能鉴定开放读框的计算机程序。在又一实施方案中,计算机程序鉴定多肽序列中的结构基序。在另一实施方案中,此计算机程序包括分子模型程序。所述方法可通过使用计算机程序读取一个序列或者至少2、5、10、15、20、25、30或50个本发明的核酸密码或本发明的多肽密码,并用该计算机程序鉴定核酸密码或者多肽密码中的特征。
本发明的核酸密码或者本发明的多肽密码可以在各种格式的各种数据处理程序中存储和操作。例如,它们可以作为文字处理文件的文本如Microsoft WORD或者WORDPERFECT或者作为ASCII文件存储到本领域技术人员熟悉的各种数据库程序中,如DB2、SYBASE或者ORACLE。此外,可以使用许多计算机程序和数据库作为序列比较器,识别器或者用于和本发明核酸密码或本发明多肽密码进行比较的参照核苷酸或多肽序列的来源。下表并不限制本发明,但是提供了使用本发明核酸密码或本发明多肽密码的程序和数据库的指南。可用的程序和数据库包括,但不限于:MacPattern(EMBL)、DiscoveryBase(Molecular Applications Group)、GeneMine(Molecular Applications Group)、Look(Molecular Applications Group)、MacLook(Molecular Applications Group)、BLAST和BlAST2(NCBI)、BLASTIN和BLASTX(Altshul等,1990)、FASTA(Pearson和Lipman,1998)、FASTDB(Brulag等,1990)、Catalyst(Molecular Simulations Inc.)、Catalyst/SHAPE(MolecularSimulations Inc.)、Cerius2.DBAccess(Molecular Simulations Inc.)、HypoGen(Molecular Simulations Inc.)、Insight II(Molecular Simulations Inc.)、Discover(Molecular Simulations Inc.)、CHARMm(Molecular Simulations Inc.)、Felix(Molecular Simulations Inc.)、DelPhi(Molecular Simulations Inc.)、QuanteMM(Molecular Simulations Inc.)、Homology(Molecnlar Simulations.Inc),Modeler(Molecular Simulations Inc ISIS(Molecular Simulations Inc.)、Quanta/Protein Design(Molecular Simulations Inc.)、WebLab(MolecularSimulations Inc.)、WebLeb Diversity Explorer(Molecular Simulations Inc.)、Gene Explorer(Molecular Simulations Inc.)、SeqFold(Molecular SimulationsInc.)、EMBL/Swissprotein数据库、MDL Avaiable Chemicals Directory数据库、MDL Drug Data Report数据库、Comprehensive Medicinal Chemistry数据库、Derwents’s World Drug Index数据库、BioByteMasterFile数据库、Genbank数据库以及Genseqn数据库。许多其它程序和数据库对于在本公开所给的领域中的任一技术人员来说是显而易见的。
使用上述程序可检测的基序包括编码亮氨酸拉链结构、螺旋-转角-螺旋基序、糖基化位点、遍在蛋白化位点,α-螺旋以及β片层的序列、编码指引编码蛋白质分泌的信号肽的信号序列、涉及转录调节的序列如同源框、酸延伸、酶活性位点、底物结合位点和酶切割位点。
在本申请中,引用了各种公报、专利和公开的专利申请。本申请参考的这些公报、专利和公开的专利申请的内容引用于本文的内容中,用于更加完善地说明本发明属于的技术条例。
实施例
实施例1
双等位标记-DNA提取物的鉴定
供体是无关且健康的。它们代表了足够的代表法国异质人群的多样性。从100个个体中提取DNA,并检测双等位标记。
在EDTA存在下,从各供者获取30ml外周静脉血。2000rpm。离心10分钟收集细胞(沉块)。用裂解液(50ml最终体积:10mMTris pH7.6,5mM MgCl2,10mM NaCl)溶解红细胞。以裂解液重悬浮细胞沉块后,离心该溶液(10分钟,2000rpm.)许多次,必须除去上清液中残留的红细胞。
42℃用3.7ml含有以下组分的裂解液将白细胞沉块裂解过夜:
-3ml TE 10-2(Tris-HCl 10mM,EDTA 2mM)/NaCl 0.4M
-200μl SDS 10%
-500μl K-蛋白酶(溶于TE 10-2/NaCl 0.4M中的2mg K-蛋白酶)
为了提取蛋白质,加入1ml饱和NaCl(6M)(1/3.5体积/体积)。剧烈搅拌之后,10000rpm.离心此溶液20分钟。
为了沉淀DNA,向上述上清液中加入2-3体积的100%乙醇,并2000rpm.离心此溶液30分钟。用70%乙醇淋洗DNA溶液3次,2000rpm.离心20分钟。37℃干燥沉淀物,重悬于1mlTE 10-1或1ml水中。通过测量260nm的OD值来估算DNA的浓度(1单位OD=50μg/ml DNA)。
为了确定DNA溶液中存在蛋白质,测定OD 260/OD 280比值。在以下所述的后续实施例中仅使用OD 260/OD 280比值为1.8-2的DNA制品。
通过混合各个体的相等量的DNA来构成合并物。
实施例2
双等位标记的鉴定:通过PCR扩增基因组DNA
在以上获得的DNA合并物上进行实施例1的DNA样品的特异性基因组序列的扩增。此外,类似地扩增了50个个体样品。
使用以下方案进行PCR试验:
最终体积 25μl
DNA 2ng/μl
MgCl2 2mM
dNTP(每种) 200μM
引物(每种) 2.9ng/μl
Ampli Taq Gold DNA聚合酶 0.05单位/μl
PCR缓冲液(10x=0.1M trisHCl pH8.30.5M KCl) 1x
使用本文所公开的CanIon基因序列信息和OSP软件(Hiilier&Green,1991)设计了各对第一引物。这种第一对引物是长约20个的核苷酸,并具有表1中标为PU和RP栏所公开的序列。
表1
扩增子 | 在SEQ ID1中此扩增子的位置范围 | 引物名称 | SEQ ID No1中扩增引物的位置范围 | 引物名称 | SEQ ID No1中扩增引物的互补位置范围 | |||
99-62626 | 12343 | 12810 | B1 | 12343 | 12363 | C1 | 12793 | 12810 |
99-62632 | 13814 | 14296 | B2 | 13814 | 13832 | C2 | 14279 | 14296 |
99-62633 | 24863 | 25396 | B3 | 24863 | 24881 | C3 | 25378 | 25396 |
99-62611 | 69198 | 69650 | B4 | 69198 | 69218 | C4 | 69632 | 69650 |
99-62605 | 73005 | 73483 | B5 | 73005 | 73022 | C5 | 73466 | 73483 |
99-62635 | 79808 | 80334 | B6 | 79808 | 79826 | C6 | 80314 | 80334 |
扩增子 | 在SEQ ID2中此扩增子的位置范围 | 引物名称 | SEQ ID No2中扩增引物的位置范围 | 引物名称 | SEQ ID No2中扩增引物的互补位置范围 | |||
99-79335 | 51031 | 51559 | B7 | 51031 | 51051 | C7 | 51539 | 51559 |
99-79336 | 60925 | 61374 | B8 | 60925 | 60945 | C8 | 61354 | 61374 |
99-79338 | 80271 | 80720 | B9 | 80271 | 80290 | C9 | 80700 | 80720 |
99-79339 | 91037 | 91486 | B10 | 91037 | 91056 | C10 | 91466 | 91486 |
99-79314 | 100285 | 100784 | B11 | 100285 | 100305 | C11 | 100764 | 100784 |
99-79316 | 106568 | 107020 | B12 | 106568 | 106585 | C12 | 107000 | 107020 |
99-79322 | 165864 | 166401 | B13 | 165864 | 165884 | C13 | 166381 | 166401 |
99-79306 | 235713 | 236210 | B14 | 235713 | 235732 | C14 | 236190 | 236210 |
扩增子 | 在SEQ ID3中此扩增子的位置范围 | 引物名称 | SEQ ID No3中扩增引物的位置范围 | 引物名称 | SEQ ID No3中扩增引物的互补位置范围 | |||
99-79310 | 31618 | 32100 | B15 | 31618 | 31635 | C15 | 32080 | 32100 |
99-79311 | 42324 | 42723 | B16 | 42324 | 42344 | C16 | 42704 | 42723 |
扩增子 | 引物名称 | SEQ ID No6中扩增引物的位置范围 | 引物名称 | SEQ ID No6中扩增引物的互补位置范围 | ||||
99-62617 | B17 | 1 | 20 | C17 | 435 | 453 |
所述引物宜包含作为扩增目标的特异性碱基上激的共同寡核苷酸,用于测序。
引物PU包含以下额外的PU 5’序列:TGTAAAACGACGGCCAGT;引物RP包含以下RP’5序列:CAGGAAACAGCTATGACC。在SEQ ID No7中列出了包含额外PU’5序列的引物。在SEQ ID No8中列出了包含额外RP’5序列的引物。
按氨基磷酸酯(phosphoramidite)方法在GENSET UFPS 24.1合成仪上进行这些引物的合成。
在Genius II热循环仪上进行DNA扩增。95℃加热10分钟之后,进行40轮循环。每轮包括:95℃30秒,54℃1分钟,72℃30秒。对于最终延伸,72℃10分钟结束扩增。使用荧光计和作为嵌入剂(intercalant agent)(Molecular Probes)的Picogreen在96孔微量滴定板上测定获得的扩增产物的量。
实施例3
双等位标记的鉴定-对扩增的基因组DNA测试并鉴定多形性
在ABI 377测序仪上进行实施例2中获得的扩增DNA的测序。使用带有染色终止子循环测序程序的自动的双脱氧终止子测序反应来确定该扩增产物的序列。在测序凝胶上跑测序反应产物电泳,并用凝胶成像分析(ABI Prism DNA Sequencing Analysis软件(2.1.2版本))确定其序列。
进一步评估算序列数据,以检测扩增片段中双等位标记的存在。多形性检索依据电泳模式中上述同一位置存在不同的碱基而产生的重叠峰。
在扩增的17个片段中,检测到18个双等位标记。这些双等位标记的位置显示在表2中。
表2
扩增子 | BM | 标记名称 | 多形性 | SEQ ID中BM位置 | ||
all1 | all2 | No1 | No4 | |||
99-62626 | A1 | 99-62626-168 | 12642 | |||
99-62632 | A2 | 99-62632-275 | 14088 | |||
99-62633 | A3 | 99-62633-409 | 24981 | |||
99-62611 | A4 | 99-62611-51 | 69248 | |||
99-62605 | A5 | 99-62605-56 | 73428 | |||
99-62635 | A6 | 99-62635-443 | 80250 | |||
扩增子 | BM | 标记名称 | 多形性 | SEQ ID中BM位置 | ||
all1 | all2 | No2 | No4 | |||
99-79335 | A7 | 99-79335-60 | 51090 | |||
99-79336 | A8 | 99-79336-369 | 61293 | |||
99-79338 | A9 | 99-79338-332 | 80602 | |||
99-79314 | A10 | 99-79314-201 | 100485 | |||
99-79314 | A11 | 99-79314-225 | 100509 | |||
99-79316 | A12 | 99-79316-158 | 106725 | 1658 | ||
99-7932 | A13 | 99-7932-224 | 166087 | |||
99-79322 | A14 | 99-79322-473 | 166336 | |||
99-79306 | A15 | 99-79306-182 | 235894 | |||
扩增子 | BM | 标记名称 | 多形性 | SEQ ID中BM位置 | ||
all1 | a112 | No3 | No4 | |||
99-79310 | A16 | 99-79310-29 | 31646 | |||
99-79311 | A17 | 99-79311-50 | 42373 |
扩增子 | BM | 标记名称 | 多形性 | SEQ ID中BM位置 | ||
all1 | all2 | No6 | ||||
99-62617 | A18 | 99-62617-105 | 105 |
BM指“双等位标记”。All1和All2分别指该双等位标记中的等位基因1和等位基因2。
表3
BM | 标记名称 | SEQ ID No1中探针的位置范围 | 探针 | |
A1 | 99-62626-168 | 12630 | 12654 | P1 |
A2 | 99-62632-275 | 14076 | 14100 | P2 |
A3 | 99-62633-409 | 24969 | 24993 | P3 |
A4 | 99-62611-51 | 69236 | 69260 | P4 |
A5 | 99-62605-56 | 73416 | 73440 | P5 |
A6 | 99-62635-443 | 80238 | 80262 | P6 |
BM | 标记名称 | SEQ ID No2中探针的位置范围 | 探针 | |
A7 | 99-79335-60 | 51078 | 51102 | P7 |
A8 | 99-79336-369 | 61281 | 61305 | P8 |
A9 | 99-79338-332 | 80590 | 80614 | P9 |
A10 | 99-79314-201 | 100473 | 100497 | P10 |
A11 | 99-79314-225 | 100497 | 100521 | P11 |
A12 | 99-79316-158 | 106713 | 106737 | P12 |
A13 | 99-7932-224 | 166075 | 166099 | P13 |
A14 | 99-79322-473 | 166324 | 166348 | P14 |
A15 | 99-79306-182 | 235882 | 235906 | P15 |
BM | 标记名称 | SEQ ID No 3中探针的位置范围 | 探针 | |
A16 | 99-79310-29 | 31634 | 31658 | P16 |
A17 | 99-79311-50 | 42361 | 42385 | PP17 |
BM | 标记名称 | SEQ ID No6中探针的位置范围 | 探针 | |
A18 | 99-62617-105 | 93 | 117 | P18 |
实施例4
通过微量测序来验证多形性
进一步证实了实施例3中所鉴定的双等位标记,并通过微量测序来确定了它们的各自频率。对实施例1中所述的各个体DNA样品进行了微量测序。
如上所述,通过PCR进行了个体基因组DNA的扩增,使用相同的一套PCR引物检测该双等位标记(表1)。
在微量测序中使用的优选引物长约19个核苷酸,并恰好在所认为的多形性碱基
的上游杂交。本发明在微量测序中使用的引物在表4中作详细说明。
表4
标记名称 | 双等位标记 | Mis.1 | SEQ ID No1中微量测序引物Mis.1的位置范围 | Mis.2 | SEQ ID No1中微量测序引物Mis.2的互补位置 | ||
99-62626-168 | A1 | D1 | 12623 | 12641 | E1 | 12643 | 12661 |
99-62632-275 | A2 | D2 | 14069 | 14087 | E2 | 14089 | 14107 |
99-62633-409 | A3 | D3 | 24962 | 24980 | E3 | 24982 | 25000 |
99-62611-51 | A4 | D4 | 69229 | 69247 | E4 | 69249 | 69267 |
99-62605-56 | A5 | D5 | 72409 | 73427 | E5 | 73429 | 73447 |
99-62635-443 | A6 | D6 | 80231 | 80249 | E6 | 80251 | 80269 |
标记名称 | 双等位标记 | Mis.1 | SEQ ID No2中微量测序引物Mis.1的位置范围 | Mis.2 | SEQ ID No2中微量测序引物Mis.2的互补位置 | ||
99-79335-60 | A7 | D7 | 51071 | 51089 | E7 | 51091 | 51109 |
99-79336-369 | A8 | D8 | 61274 | 61292 | E8 | 61294 | 61312 |
99-79338-332 | A9 | D9 | 80583 | 80601 | E9 | 80603 | 80621 |
99-79314-201 | A10 | D10 | 100466 | 100484 | E10 | 100486 | 100504 |
99-79314-225 | A11 | D11 | 100490 | 100508 | E11 | 100510 | 100528 |
99-79316-158 | A12 | D12 | 106706 | 106724 | E12 | 106726 | 106744 |
99-7932-224 | A13 | D13 | 166068 | 166086 | E13 | 166088 | 166106 |
99-79322-473 | A14 | D14 | 166317 | 166335 | E14 | 166337 | 166335 |
99-79306-182 | A15 | D15 | 235875 | 235893 | E15 | 235895 | 235913 |
标记名称 | 双等位标记 | Mis.1 | SEQ ID No3中微量测序引物Mis.1的位置范围 | Mis.2 | SEQ ID No3中微量测序引物Mis.2的互补位置 | ||
99-79310-29 | A16 | D16 | E16 | 31647 | 31665 | ||
99-79311-50 | A17 | D17 | E17 | 42374 | 42392 | ||
标记名称 | 双等位标记 | Mis.1 | SEQ ID No6中微量测序引物Mis.1的位置范围 | Mis.2 | SEQ ID No6中微量测序引物Mis.2的互补位置 | ||
99-62617-105 | A18 | D18 | 86 | 104 | E18 | 106 | 124 |
Mis1和Mis2分别指微量测序引物,与CanIon基因的非编码链或者与CanIon基因的编码链杂交。
所述微量测序反应如下所述进行:
纯化扩增产物之后,按照厂商的推荐在20μl最终体积中加入10pmol微量测序寡核苷酸、1U Thermosequenase(Amersham E79000G)、1.25μl Thermosequenase缓冲液(260mM trisHCl pH9.5,65mM MgCl2)以及与各测试双等位标记的多形性位点处的核苷酸互补的两种相应的荧光ddNTPs(Perkin Elmer,Dye Terminator Set 401095)来制备微量测序反应混合物。94℃4分钟后,在Tetrad PTC-225热循环仪(MJ Research)中进行20轮PCR循环,每轮55℃15秒,72℃5秒、94℃10秒。然后,通过乙醇沉淀除去未结合的染色终止子。在甲醛-EDTA负载缓冲液中最后重悬所述样品,并在加载到聚丙烯酰胺测序凝胶上之前,95℃加热2分钟。使用ABI PRISM 377DNA测序仪收集数据,并用CanIon SCAN软件(Perkin Elmer)进行处理。
凝胶分析后,用软件自动处理数据,此软件能确定各扩增片段中存在的双等位标记的等位基因。
该软件评估这些因素:上述微量测序程序产生的信号强度是否弱、正常或者已饱和,或者信号是否不明确。此外,该软件能鉴定出显著的峰(根据形状和高度标准)。在显著的峰中,以它们的位置为基础,可鉴定出靶位点所对应的峰。当在同一位置处检测到两个显著的峰时,根据高度比率,将各样品分类为结合型或杂合型。
实施例5
制备针对CanIon蛋白质的抗体组合物
从含有编码CanIon蛋白质或者其部分的表达载体感染的或转化的细胞分离获得基本纯的蛋白质或者多肽。例如,通过Amicon过滤装置进行浓缩,调节最终制品中蛋白质的浓度到几微克/毫升的水平。然后,如下所述制备针对该蛋白质的单克隆或者多克隆抗体:
A.通过杂交瘤融合产生单克隆抗体
根据Kohler,G和Milstein,C(1975)的经典方法或其衍生方法,可从小鼠杂交瘤制备对CanIon蛋白质或者其部分中的抗原决定基的单克隆抗体。也可以参见Harlow,E和D.Lane,1988。
简而言之,用几微克CanIon蛋白质或者其部分在几星期内反复接种小鼠。然后,处死小鼠,并分离产生抗体的脾细胞。借助聚乙二醇将脾细胞和小鼠骨髓瘤细胞融合,并且通过在含氨基喋呤(HAT培养基)的选择性培养基上培养该系统来破坏过量的未融合细胞。稀释成功融合的细胞,并将等分稀释液接种于微量滴定板的孔中,继续培养生长。用免疫试验程序如ELISA(最早在Engvall(1980)中报道)及其衍生方法,检测诸孔上清液中的抗体来鉴定产生抗体的克隆细胞。选出的阳性克隆可以扩增,并收获它们的单克隆抗体产品。在Davis,L等人的molecular Biology Elsevier,New York.第21-2章中的Basic Methods中说明了单克隆抗体产生的详细程序。
B.免疫接种制备多克隆抗体产品
可通过用CanIon蛋白质或者其部分(可以是未修饰或修饰的以提高免疫原性)免疫接种合适的非人类动物,制备含有对CanIon蛋白质或者其部分的异源性表位的抗体的多克隆抗血清。合适的非人动物宜为非人哺乳动物,通常选自大鼠,小鼠,家兔、山羊或马。或者,可采用CanIon浓度丰富的粗制品来产生抗体。在存在本领域已知的合适佐剂(例如,氢氧化铝、RIBI等)下,将这种蛋白质、片段或者制品引入非人类哺乳动物中。除了蛋白质外,可以用能提高抗原性的试剂来预处理片段或制品,这种试剂是本领域已知的,包括例如甲基化牛血清白蛋白(mBSA)、牛血清白蛋白(mBSA)、乙型肝炎表面抗原和钥孔血兰蛋白(KLH)。按已知的程序,收集免疫接种动物的血清,进行处理和测试。若血清含有针对不需要的表位的多克隆抗体,可通过免疫亲和层析纯化该多克隆抗体。
有效的多克隆抗体制备受到抗原以及宿主种类有关的许多因素的影响。而且,宿主动物对接种部位、剂量的反应不相同,抗原剂量的不足或者过量可导致低滴度抗血清。多处皮内位点给予小剂量抗原(ng水平)看来最可靠。在本领域知道制备和加工多克隆抗血清(antisera)的技术,例如可参见Mayer和Walker(1987)。在Vaitukaitis,J等(1971)中可以找到家兔的有效免疫方案。
可以以有规律的间隔进行加强注射,当例如在琼脂中对已知抗原浓度进行免疫双扩散作半定量测定,当抗体滴度开始降低时,收获抗血清。例如,可见Ouchterlony,O等(1973)。抗体的平台浓度通常为每毫升血清0.1-0.2mg(约12μM)。通过绘制竞争性结合曲线可以确定抗血清对抗原的亲和力,如Fisher,D(1980)所述的那样。
按照单克隆或多克隆方案制备的抗体制品可用于定量免疫试验,确定生物样品中携带抗原的物质的浓度,它们也用于半定量或者定性鉴定生物样品中抗原的存在。所述抗体也可以用于杀伤表达该蛋白质的细胞或者降低该蛋白质体内含量的治疗组合物中。
虽然已经说明和描述了本发明的优选实施方案,但是应认识到,在不背离本发明的精神和范围下,本领域的技术人员可以作出各种改变。
参考文献:
Abbondanzo SJ等,1993,《酶学方法》Methods in Enzymology,Academic Press,New York,pp 803-823.
Ajioka R.S.等,Am.J.Hum.Genet.,60:1439-1447,1997.
Altschul等,1990,J.Mol.Biol.215(3):403-410.
Altschul等,1993,Nature Genetics 3:266-272.
Altschul等,1997,Nuc.Acids Res.25:3389-3402.
Ames,R.S.等J.Immunol.Methods 184:177-186(1995).
Anton M.等,1995,J.Virol.,69:4600-4606.
Araki K等(1995)Proc.Natl.Acad.Sci.USA.92(1):160-4.
Ashkenazi,A.等PNAS 88:10535-10539(1991).
Aszódi等,《蛋白质:结构,功能和遗传学》(Proteins:Structure,Function,and Genetics,增补本1:38-42(1997).
Ausubel等(1989)Current Protocols in Molecular Biology,Green PublishingAssociates and Wiley Interscience,N.Y
Bartunek,P.等Cytokine 8(1):14-20(1996).
Baubonis W.(1993)Nucleic Acids Res.21(9):2025-9.
Beaucage等,Tetrahedron Lett 1981,22:1859-1862.
Better,M.等Science 240:1041-1043(1988).
Bradley A.,1987,“嵌合小鼠的产生和分析”(Production and analysis ofchimaeric mice).E.J.Robertson(编著),Teratocarcinomas and embryonic stemcells:A practical approach.IRL Press,Oxford,pp.113.
Bram RJ等,1993,Mol.Cell Biol.,13:4760-4769.
Brinkman U.等J.Immunol.Methods 182:41-50(1995).
Brown EL,Belagaje R,Ryan MJ,Khorana HG,Methods Enzymol1979;68:109-151.
Brutlag等Comp.App.Biosci.6:237-245,1990.
Brzustowicz等,Am.J.Hum.Genet.65:1096-1103(1999).
Bulman等,Hum.Mol.Gen.6(10)1679-1685(1997).
Burton,D.R.等Advances in Immunology 57:191-280(1994).
Bush等,1997,J.Chromatogr.,777:311-328.
Carlson,N.G.等J.Biol.Chem.272(17):11295-11301(1997).
Chai H.等(1993)Biotechnol.Appl.Biochem.18:259-273.
Chee等(1996)Science.274:610-614.
Chen和Kwok Nucleic Acids Research 25:347-3531997.
Chen等(1987)Mol.Cell.Biol.7:2745-2752.
Chen等Proc.Natl.Acad.Sci.USA 94/2010756-10761,1997.
Chen,Z.等Cancer Res.58(16):3668-3678(1998).
Cho RJ等,1998,Proc.Natl.Acad.Sci.USA,95(7):3752-3757.
Chou J.Y.,1989,Mol.Endocrinol.,3:1511-1514.
Clark A.G.(1990)Mol.Biol.Evol.7:111-122.
Coles R,Caswell R,Rubinsztein DC,Hum Mol Genet 1998;7:791-800.
Compton J.(1991)Nature.350(6313):91-92.
Davis L.G.,M.D.Dibner,和J.F.Battey,《分子生物学基础方法》(BasicMethods in Molecular Biology),ed.,Elsevier Press,NY,1986.
Dempster等,(1997)J.R.Stat.Soc.,39B:1-38.
Deng,B.等Blood 92(6):1981-1988(1998).
Dent DS & Latchman DS(1993)“DNA迁移率移位试验”(The DNA mobility shiftassay).《转录因素:实用方法》(Transcription Factors:A Practical Approach)(Latchman DS,ed.)pp1-26.Oxford:IRL Press.
Eckner R.等(1991)EMBO J.10:3513-3522.
Edwards等Leatherbarrow,Analytical Biochemistry,246,1-6(1997).
Engvall,E.,Meth.Enzymol.70:419(1980).
Excoffier L.和Slatkin M.(1995)Mol.Biol.Evol.,12(5):921-927.
Feldman和Steg,1996,Medecine/Sciences,synthese,12:47-55.
Felici F.,1991,J.Mol.Biol.,Vol.222:301-310.
Fell,H.P.等J.Immunol.146:2446-2452(1991).
Fields和Song,1989,Nature,340:245-246.
Fisher,D.,Chap.42《临床免疫性手册》Manual of Clinical Immunology,第二版(Rose和Friedman编著)Amer.Soc.For Microbiol.,Washington,D.C.(1980).
Flotte等(1992)Am.J.Respir.Cell Mol.Biol.7:349-356.
Fodor等(1991)Science 251:767-777.
Fraley等(1979)Proc.Natl.Acad.Sci.USA.76:3348-3352.
Fried M,Crothers DM,Nucleic Acids Res 1981;9:6505-6525.
Fromont-Racine M.等,1997,Nature Genetics,16(3):277-282.
Fuller S.A.等(1996)Immunology in Current Protocols in MolecularBiology,Ausubel等编,John Wiley & Sons,Inc.,USA.
Furth P.A.等(1994)Proc.Natl.Acad.Sci USA.91:9302-9306.
Garner MM,Revzin A,Nucleic Acids Res 1981;9:3047-3060.
Geysen H.Mario等1984.Proc.Natl.Acad.Sci.U.S.A.81:3998-4002.
Ghosh和Bacchawat,1991,“将脂质体靶向肝细胞”(Targeting of liposomesto hepatocytes),《肝疾病,用特异性受体和配体的靶向性诊断和治疗》LiverDiseases,Targeted diagnosis and therapy using specific rceptors and ligands.Wu等编.,Marcel Dekeker,New York,pp.87-104.
Gillies,S.D.等J.Immunol.Methods 125:191-202(1989).
Gillies,S.O.等PNAS 89:1428-1432(1992).
Gonnet等,1992,Science 256:1443-1445.
Gonzalez等,1992,Science 256:1443-1445.
Gopal(1985)Mol.Cell.Biol.,5:1188-1190.
Gossen M.等(1992)Proc.Natl.Acad.Sci.USA.89:5547-5551.
Gossen M.等(1995)Science.268:1766-1769.
Graham等(1973)Virology 52:456-457.
Green等,Ann.Rev.Biochem.55:569-597(1986).
Greenspan和Bona,FASEB J.7(5):437-444(1989).
Griffin等Science 245:967-971(1989).
Grompe,M.(1993)Nature Genetics.5:111-117.
Grompe,M.等(1989)Proc.Natl.Acad.Sci.U.S.A.86:5855-5892.
Gu H.等(1993)Cell 73:1155-1164.
Gu H.等(1994)Science 265:103-106.
Guatelli J C等Proc.Natl.Acad.Sci.USA.35:273-286.
Hacia JG,Brody LC,Chee MS,Fodor SP,Collins FS,Nat Genet1996;14(4):441-447.
Hall L.A.和Smirnov I.P.(1997)Genome Research,7:378-388.
Hames B.D.和Higgins S.J.(1985)《核酸杂交实用方法》(Nucleic AcidHybridization:A Practical Approach).Hames和Higgins,Pfugers Arch.391,85-100(1981).
Hammerling,等,《单克隆抗体和T-细胞杂交瘤》(MONOCLONAL ANTIBODIES ANDT-CELL HYBRIDOMAS)563-681(El sevier,N.Y.,1981).
Harju L,Weber T,Alexandrova L,Lukin M,Ranki M,Jalanko A,Clin Chem1993;39(11Pt 1):2282-2287.
Harland等(1985)J.Cell.Biol.101:1094-1095.
Harlow,E.,and D.Lane.1988.《抗体实验室手册》(Antibodies A LaboratoryManual).Cold Spring Harbor Laboratory.pp.53-242.
Harper JW等,1993,Cell,75:805-816.
Harrop,J.A.等J.Immunol.161(4):1786-1794(1998).
Hawley M.E.等(1994)Am.J.Phys.Anthropol.18:104.
Hell等,Annals N.Y.Acad.Sci.747:282-293(1994).
Henikoff和Henikoff,1993,Proteins 17:49-61.
Higgins等,1996,Methods Enzymol.266:383-402.
Hillier L.和Green P.Methods Appl.,1991,1:124-8.
Hoess等(1986)Nucleic Acids Res.14:2287-2300.
Huang L.等(1996)Cancer Res 56(5):1137-1141.
Huston等Methods in Enzymology 203:46-88(1991).
Huygen等(1996)Nature Medicine.2(8):893-898.
Izant JG,Weintraub H,Cell 1984Apr;36(4):1007-15.
Julan等(1992)J.Gen.Virol.73:3251-3255.
Kanegae Y.等,Nucl.Acids Res.23:3816-3821(1995).
Karlin和Altschul,1990,Proc.Natl.Acad.Sci.USA 87:2267-2268.
Kettleborough,C.A.等Eur.J.Immunol.24:952-958(1994)
Khoury J.等,《遗传流行病学基础》(Fundamentals of Genetic Epidemiology),Oxford University Press,NY,1993.
Kim U-J.等(1996)Genomics 34:213-218.
Klein等(1987)Nature.327:70-73.
Koch等,J.Biol.Chem.265(29):17786-17791(1990)
Kohler,G.和Milstein,C.,Nature 256:495(1975).
Koller等(1992)Annu.Rev.Immunol.10:705-730.
Kozal MJ,Shah N,Shen N,Yang R,Fucini R,Merigan TC,Richman DD,MorrisD,Hubbell E,Chee M,Gingeras TR,Nat Med 1996;2(7):753-759.
Landegren U.等(1998)Genome Research,8:769-776.
Lange K.(1997)《基因分析的数学和统计学方法》(Mathematical andStatistical Methods for Genetic Analysis).Springer,New York.
Lee等,FEBS Lett.445 231:236(1999).
Lenhard T.等(1996)Gene.169:187-190.
Liautard,J.等Cytokinde 9(4):233-241(1997).
Lin MW等,Hum.Genet.,99(3):417-430(1997).
Linton M.F.等(1993)J.Clin.Invest.92:3029-3037.
Liu Z.等(1994)Proc.Natl.Acad.Sci.USA.91:4528-4262.
Livak等,Nature Genetics,9:341-342,1995.
Livak KJ,Hainer JW,Hum Mutat 1994;3(4):379-385.
Lockhart等Nature Biotechnology 14:1675-1680,1996.
Lucas A.H.,1994,《B型血友病偶联物的进展和临床应用》(Development andCl inical Uses of Haempophi lus b Conjugate).
Manager等,Anal.Biochem.214:190-194(1993).
Mansour S.L.等(1988)Nature.336:348-352.
Marshall R.L.等(1994)PCR Methods and Applications.4:80-84.
McCormick等(1994)Genet.Anal.Tech.Appl.11:158-164.
McLaughl in B.A.等(1996)Am.J.Hum.Genet.59:561-569.
Morena等,Annals NY Acad.Sci.102-117(1999).
Mori等,Nature 350:198-402(1991).
Morrison,Science 229:1202(1985).
Morton N.E.,Am.J.Hum.Genet.,7:277-318,1955.
Muller,Y.A.等Structure 6(9):1153-1167(1998).
Mullinax,R.L.等BioTechniques 12(6):864-869(1992).
Muzyczka等(1992)Curr.Topics in Micro.and Immunol.158:97-129.
Nada S.等(1993)Cell 73:1125-1135.
Nagy A.等,1993,Proc.Natl.Acad.Sci.USA,90:8424-8428.
Naramura,M.等Immunol.Lett.39:91-99(1994).
Narang SA,Hsiung HM,Brousseau R,Methods Enzymol 1979;68:90-98.
Neda等(1991)J.Biol.Chem.266:14143-14146.
Newton等(1989)Nucleic Acids Res.17:2503-2516.
Nickerson D.A.等(1990)Proc.Natl.Acad.Sci.U.S.A.87:8923-8927.
Nicolau C.等,1987,Methods Enzymol.,149:157-76.
Nicolau等(1982)Biochim.Biophys.Acta.721:185-190.
Nissinoff,J.Immunol.147(8):2429-2438(1991).
Nyren P,Pettersson B,Uhlen M,Anal Biochem 1993;208(1):171-175.
O’Reilly等(1992)《杆状病毒表达载体:实验室手册》(Baculovirus ExpressionVectors:A Laboratory Manual)W.H.Freeman and Co.,New York.
Ohno等(1994)Science.265:781-784.
Oi等,BioTechniques 4:214(1986).
Oldenburg K.R.等,1992,Proc.Natl.Acad.Sci.,89:5393-5397.Olesen等,《电压门控离子通道调节剂》(Voltage gated ion channelmodulators),12月7-8,Philadelphia PA,USA(1995).
Orita等(1989)Proc.Natl.Acad.Sci.U.S.A.86:2776-2770.
Ott J.,Analysis of Human Genetic Linkage,John Hopkins University Press,Baltimore,1991.
Ouchterlony,O.等,Chap.19《免疫学实验手册》(Handbook of ExperimentalImmunology)D.Wier编Blackwell(1973).
Padlan E.A.,Molecular Immunology 28(4/5):489-498(1991).
Parmley和Smith,Gene,1988,73:305-318.
Pastinen等,Genome Research 1997;7:606-614.
Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA 85(8):2444-2448.
Pease S.ans William R.S.,1990,Exp.Cell.Res.,190:209-211.
Perlin等(1994)Am.J.Hum.Genet.55:777-787.
Persic,L.等Gene 1879-18(1997).
Peterson等,1993,Proc.Natl.Acad.Sci.USA,90:7593-7597.
Pietu等Genome Research 6:492-503,1996.
Pitard,V.等J.Immunol.Methods 205(2):177-190(1997).
Potter等(1984)Proc.Natl.Acad.Sci.U.S.A.81(22):7161-7165.
Prat,M.等J.Cell.Sci.111(Pt2):237-247(1998).
Ramunsen等,1997,Electrophoresis,18:588-598.
Reid L.H.等(1990)Proc.Natl.Acad.Sci.U.S.A.87:4299-4303.
Risch,N.和Merikangas,K.(Science,273:1516-1517,1996).
Robertson E.,1987,“胚胎衍生的干细胞系”(Embryo-derived stem cell lines).E.J.Robertson编.《畸胎癌和胚胎肝细胞:实用方法》(Teratocarcinomas andembrionic stem cells:a practical approach).IRL Press,Oxford,pp.71.
Roguska M.A.等PNAS 91:969-973),(1994).
Rossi等,Pharmacol.Ther.50:245-254,(1991).
Roth J.A.等(1996)Nature Medicine.2(9):985-991.
Roux等(1989)Proc.Natl.Acad.Sci.U.S.A.86:9079-9083.
Ruano等(1990)Proc.Natl.Acad.Sci.U.S.A.87:6296-6300.
Sambrook,J.,Fritsch,E.F.,and T.Maniatis.(1989)《分子克隆实验指南》(Molecular Cloning:A Laboratory Manual).第二版.Cold Spring HarborLaboratory,Cold Spring Harbor,New York.
Samson M,等(1996)Nature,382(6593):722-725.
Samulski等(1989)J.Virol.63:3822-3828.
Sanchez-Pescador R.(1988)J.Clin.Microbiol.26(10):1934-1938.
Sarkar,G.和Sommer S.S.(1991)Biotechniques.
Sauer B.等(1988)Proc.Natl.Acad.Sci.U.S.A.85:5166-5170.
Sawai,H.等AJRI 34:26-34(1995).
Schedl A.等,1993a,Nature,362:258-261.
Schedl等,1993b,Nucleic Acids Res.,21:4783-4787.
Schena等Science 270:467-470,1995.
Schena等,1996,Proc Natl Acad Sci USA,.93(20):10614-10619.
Schneider等(1997)《Arlequin:一种用于人群基因数据分析的软件》(Arlequin:A Software For Population Genetics Data Analysis).University of Geneva.
Schwartz和Dayhoff,编,1978,《检测距离关系的基质:蛋白质序列和结构图》(Matrices for Detecting Distance Relationships:Atlas of Protein Sequenceand Structure),Washington:National Biomedical Research Foundation.
Sczakiel G.等(1995)Trends Microbiol.3(6):213-217.
Shay J.W.等,1991,Biochem.Biophys.Acta,1072:1-7.
Sheffield,V.C.等(1991)Proc.Natl.Acad.Sci.U.S.A.49:699-706.
Shizuya等(1992)Proc.Natl.Acad.Sci.U.S.A.89:8794-8797.
Shoemaker DD,等,Nat Genet 1996;14(4):450-456.
Shu,L.等PNAS 90:7995-7999(1993).
Skerra,A.等Science 240:1038-1040.(1988).
Smith(1957)Ann.Hum.Genet.21:254-276.
Smith等(1983)Mol.Cell.Biol.3:2156-2165.
Sosnowski RG,等,Proc Natl Acad Sci USA 1997;94:1119-1123.
Sowdhamini等,Protein Engineering 10:207,215(1997).
Spielmann S.and Ewens W.J.,Am.J.Hum.Genet.,62:450-458,1998.
Spielmann S.等,Am.J.Hum.Genet.,52:506-516,1993.
Sternberg N.L.(1992)Trends Genet.8:1-16.
Sternberg N.L.(1994)Mamm.Genome.5:397-404.
Stryer,L.,Biochemistry,4th edition,1995.
Studnicka G.M.等Protein Engineering 7(6):805-814(1994).
Syvanen AC,Clin Chim Acta 1994;226(2):225-236.
Szabo A.等Curr Opin Struct Biol 5,699-705(1995).
Tacson等(1996)Nature Medicine.2(8):888-892.
Taryman,R.E.等Neuron 14(4):755-762(1995).
Te Riele等(1990)Nature.348:649-651.
Terlau等,Naturwi ssenschaften 85:437-444(1998).
Terwilliger J.D.和Ott J.,Handbook of Human Genetic Linkage,JohnHopkins University Press,London,1994.
Thomas K.R.等(1986)Cell.44:419-428.
Thomas K.R.等(1987)Cell.51:503-512.
Thompson等,1994,Nucleic Acids Res.22(2):4673-4680.
Tur-Kaspa等(1986)Mol.Cell.Biol.6:716-718.
Tyagi等(1998)Nature Biotechnology.16:49-53.
Urdea M.S.(1988)Nucleic Acids Research.11:4937-4957.
Urdea M.S.等(1991)Nucleic Acids Symp.Ser.24:197-200.
Vaitukaitis,J.等J.Clin.Endocrinol.Metab.33:988-991(1971).
Valadon P.,等,1996,J.Mol.Biol.,261:11-22.
Van der Lugt等(1991)Gene.105:263-267.
Vil,H.等PNAS 89:11337-11341(1992).
Vlasak R.等(1983)Eur.J.Biochem.135:123-126.
Wabiko等(1986)DNA.5(4):305-314.
Walker等(1996)Clin.Chem.42:9-13.
Wang等,1997,Chromatographia,44:205-208.
Weir,B.S.(1996)Genetic data Analysis II:Methods for discrete populationgenetic Data,Sinauer Assoc.,Inc.,Sunderland,MA,U.S.A.
Westerink M.A.J.,1995,Proc.Natl.Acad.Sci.,92:4021-4025.
White,M.B.等(1992)Genomics.12:301-306.
White,M.B.等(1997)Genomics.12:301-306.
Williams等,Science 257:389-395(1992).
Wong等(1980)Gene.10:87-94.
Wood S.A.等,1993,Proc.Natl.Acad.Sci.USA,90:4582-4585.
Wu和Wu(1987)J.Biol.Chem.262:4429-4432.
Wu和Wu(1988)Biochemistry.27:887-892.
Wu等(1989)Proc.Natl.Acad.Sci.U.S.A.86:2757.
Yagi T.等(1990)Proc.Natl.Acad.Sci.U.S.A.87:9918-9922.
Yoon,D.Y.等J.Immunol.160(7):3170-3179(1998).
Zhang等,Neuropharmacology 32(11):1075-1088(1993).
Zhao等,Am.J.Hum.Genet.,63:225-240,1998.
Zheng,X.X.等J.Immunol.154:5590-5600(1995).
Zhu,Z.等Cancer Res.58(15):3209-3214(1998).
Zou Y.R.等(1994)Curr.Biol.4:1099-1103.
序列表
<110>根瑟特公司(GENSET)
<120>与精神分裂症相关的电压门控离子通道基因及蛋白质
<130>93.WO1
<141>2001-12-04
<150>US 60/251,317
<151>2000-12-05
<160>8
<170>Patent.pm
<210>1
<211>82293
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>misc_feature
<222>1..2000
<223>5’调节区
<220>
<221>exon
<222>2001..2026
<223>外显子1
<220>
<221>exon
<222>19188..19334
<223>外显子2
<220>
<221>exon
<222>22996..23178
<223>外显子3
<220>
<221>exon
<222>39731..39814
<223>外显子4
<220>
<221>exon
<222>41337..41476
<223>外显子5
<220>
<221>exon
<222>41565..41693
<223>外显子6
<220>
<221>exon
<222>73013..73167
<223>外显子7
<220>
<221>allele
<222>12642
<223>99-62626-168:多态性碱基A或T
<220>
<221>allele
<222>14088
<223>99-62632-275:多态性碱基A或G
<220>
<221>allele
<222>24981
<223>99-62633-409:多态性碱基A或T
<220>
<221>allele
<222>69248
<223>99-62611-51:多态性碱基A或C
<220>
<221>allele
<222>73428
<223>99-62605-56:多态性碱基A或G
<220>
<221>allele
<222>80250
<223>99-62635-443:多态性碱基A或G
<220>
<221>primer_bind
<222>12343..12363
<223>99-62626.rp
<220>
<221>primer_bind
<222>12793..12810
<223>99-62626.pu补体
<220>
<221>primer_bind
<222>13814..13832
<223>99-62632.pu
<220>
<221>primer_bind
<222>14279..14296
<223>99-62632.rp补体
<220>
<221>primer_bind
<222>24863..24881
<223>99-62633.rp
<220>
<221>primer_bind
<222>25378..25396
<223>99-62633.pu补体
<220>
<221>primer_bind
<222>69198..69218
<223>99-62611.pu
<220>
<221>primer_bind
<222>69632..69650
<223>99-62611.rp补体
<220>
<221>primer_bind
<222>73005..73022
<223>99-62605.rp
<220>
<221>primer_bind
<222>73466..73483
<223>99-62605.pu补体
<220>
<221>primer_bind
<222>79808..79826
<223>99-62635.pu
<220>
<221>primer_bind
<222>80314..80334
<223>99-62635.rp补体
<220>
<221>primer_bind
<222>12623..12641
<223>99-62626-168.mis
<220>
<221>primer_bind
<222>12643..12661
<223>99-62626-168.mis补体
<220>
<221>primer_bind
<222>14069..14087
<223>99-62632-275.mis
<220>
<221>primer_bind
<222>14089..14107
<223>99-62632-275.mis补体
<220>
<221>primer_bind
<222>24962..24980
<223>99-62633-409.mis
<220>
<221>primer_bind
<222>24982..25000
<223>99-62633-409.mis补体
<220>
<221>primer_bind
<222>69229..69247
<223>99-62611-51.mis
<220>
<221>primer_bind
<222>69249..69267
<223>99-62611-51.mis补体
<220>
<221>primer_bind
<222>73409..73427
<223>99-62605-56.mis
<220>
<221>primer_bind
<222>73429..73447
<223>99-62605-56.mis补体
<220>
<221>primer_bind
<222>80231..80249
<223>99-62635-443.mis
<220>
<221>primer_bind
<222>80251..80269
<223>99-62635-443.mis补体
<220>
<221>misc_binding
<222>12630..12654
<223>99-62626-168.探针
<220>
<221>misc_binding
<222>14076..14100
<223>99-62632-275.探针
<220>
<221>misc_binding
<222>24969..24993
<223>99-62633-409.探针
<220>
<221>misc_binding
<222>69236..69260
<223>99-62611-51.探针
<220>
<221>misc_binding
<222>73416..73440
<223>99-62605-56.探针
<220>
<221>misc_binding
<222>80238..80262
<223>99-62635-443.探针
<220>
<221>misc_feature
<222>2375,2377,4041..4042,5180,7138,7174,10118,12577,12637,12648,13556
15322,15341,15357,15383,15409,15994,16064..16065,16077,16237
16264,17751,19182,19424,20735,20840,21865,21885,21900,22814,23954
24969,24985,25001,25005..25006,25017,25040,25057,26646,27478
27496,29278,30793,31122,31125,34515,34541,34563,34572,34884,34915
36809,36834,36944,37011,39862,39881,39895,39903,39921,39948
39954..39955,41108,42572,43423,44122,53546,53634,55777,56140
56160,56182,56185,56200,56206,56219,56234,56258,56268,56280,56290
56324,56561,57259,58256,58297,58910,59321,60724,60743,68789,68803
68871,69936,77190,77484,78780,78891,79343,80394,81773,81795,82232
<223>n=a,g,c或t
<400>1
catcaatgca ctccaggcta ggcaacggag ataggccttg tctctaaaaa taacaaagaa 60
aacaaaagaa gagagatact gagcaggtag aaggggtact atgatatttt ggatgtacct 120
gttttttaaa atgattgtct actccaatac acagtgaatc cctatgcatt ataggatgag 180
tgtgctggat tccatgactt ccttgaagcc catgaattct ctgagactgt ctccatcatc 240
attgggattg tttggctcat gagcatgaat tatagagact taacagaggt agttcaacca 300
aggacagaga aaggtctgaa atgcctgttg ggtgaggagt ggcactgaga ttagtaaaaa 360
atcactgcct tgaccacttc aaaacattat aaataaatgt ttaaatattt ccttaatata 420
atttactaac agataattcg aacgaatgtc aaggaataac acactatcat tcagctacca 480
tatatatata gctatatatt tcagtttgtg aaataaacta gtatttagaa caagcaattg 540
aaagccgcaa ataaagatga tgaaacaagt tggtaaatac tttttctaag caaactggtt 600
gtagatttag cattgtttaa attactgtca attttttctt atgaggagtg atttcatcat 660
ttgtttaaaa cctggctttt gacacagttt ttctgaagtc tttagaaatt tgaaaaatta 720
tctcgcatga ctctgtattt catgaaatac caatatttta acatttccct gtaaacaata 780
aaacgtacta atatggatta tgaatgtgaa caaattgtga atggactttt taagaaagta 840
gattaattaa atatctgtaa ccagaaaata catttttaaa atgtaggttt gtgtagtttt 900
acttctatac cttgccacat aacattttgt gatagacaaa tgctctttgt ttagaatttc 960
tcttgtagag aaagcttcat tcagttgttt ctttcccttt atttatatgc ctgtgtgcat 1020
gatgtctaaa tcactggtca ggagttccct ggggattttc gtatctgact acatggcaag 1080
attccagacc caaagtaaac ctttcagaga gtgggaatga gtgggaggat gtcgccctgg 1140
gcatggtgct taggaggcca gatttcccta aacctgctct gctgggagcc ctaggaagcc 1200
tcagatgcag tctgctgtcc aggtatactc acagggtatg gggtggggga ctgtcaattt 1260
ctgaatagac tttgtctcat ccacacgaca acatatttta attttaaagg cgaacgtcaa 1320
cctatttaga aaactataag tgtgactgat gcattcatta tttaataact ccggggtgaa 1380
acttgaggtg aacggtttca ccctttcata ctcaggaatg gaactagtcc tcggtaccgt 1440
gcacagtctg acctcacgct cgcacgctgg gctcccggcc tcctggcagt gcacttaagt 1500
gtaccccgcg tgtgcccggc ggactcccgt gcacaccgcc gccgtgctgt tgagtacgaa 1560
agacccccga gaggagctcg cagatgagag cctagctgtt gctgtgagac tgactgcggg 1620
tggcagccgg caagaaggaa ctgccagtac cgaccctggc gctccccacc aactgcggcg 1680
cagcctcctc tgcggtgccc gcccttcggc atcactgcag tccctgtagc aaagctaact 1740
ttaaaaattt aaataaaata ataatttttt aaaggcccga aaactccggc tcccacccct 1800
cccccagcct gcccggcggc ggcggcgctc agtgagtgac acggcgagcg tgagccgcgg 1860
ccccagccgg gccgagcgcg ctgcctgagc tgagccgccg taggtgaggg gcccgcgtcc 1920
ccgcccgccc tgggcgccgc gcctggcact gatcctgccg gtcgcccact gtcgccgccg 1980
ccgccgcccg cgggcaccat gacagctctg agcgctgggg ttacaggttg gtcaccgccg 2040
ccggtgcccg ggaggctgcg gcgcggccgg ctccgtgccc tgcgcccgag gcccgcgatg 2100
cgcgctcgtt agttccttgg ccggtccggg ccaggacggc tcaggggcgc tggggctgcg 2160
agaggggctg ctagaggggc tgcgggcggg ggccccgcgc gggggagggg tggggagggg 2220
cgcctccacc cgagagcggg gcggtggggt ccttgccggc ctggccgggg cgcgggagcc 2280
gcgatgcgcc ctccctattc ctgcgcgtgg gtgtcggggg cgcctgccgc gggatgcccc 2340
tgggctggct tgggaagccc agggccggcg acacntnggg cctgccccgc ctgggcatct 2400
agcaggtgtt ggggggcagg tggctgagga cgaggccact gggcatcact acagcgctgc 2460
acctgccccc tcggcaccag ggccgctgcc tgggtaaacc tctgggccaa cgcgcgggtg 2520
gggaggtggg ggtgggcagc ctggctccag caggtctccg cgggggctcc gcggccttgc 2580
cccaccccca tgctcctgtg gattgctcct tgctaaatgt cccttatgat attcattggc 2640
cttgttaagc agccgtcatt agggtggcta caccgaacgc aaaacagtgt cctgccaagc 2700
aacaccattt tgtcactgaa tctttaagac accagcaagg atggcctggc tgggatccct 2760
ctgggggccc agatcgcagt cattttgctg acttaatgtt cctctttcag gatggtgtga 2820
gaatgctgaa ctcagaccct tagtgcttga aataccttag aataaatctt tcagtttcag 2880
gtacaatttt tcagacactg tattattaag gatgtgtgaa tacacgctca ctttcaggcc 2940
tcagaaggtt ttactcttaa tctggtgttc gtgtggtcat cagctaggcc cgactgccct 3000
ggtggtgaaa tgtgggttga ggaccagtga ccttcgtgtt agtagttggt ggataacacc 3060
tctaataggg gatcaaaaat taacaggtgg cgattttgaa atatatatgt atgtatatat 3120
atatatatat gtgtgtgatt tgtatgttca taactacaac tgtgatttga tatggcctgg 3180
gagaggagcg gtttcactat ggtagttacc cctgaggcag atgcatctca ggactggctt 3240
tttaaattca aagataaggt ttccacagtt ctaaataaaa atcatggctt cccaaacatc 3300
tgcaacgaga aacatttact ccctaactgg ttggctgtca ttctgcgtgc ttttctagag 3360
tcgatttttc gttcttctgt agtatacttt gacctagcca ctgctaaaac cagacagtgt 3420
gaagacaaaa tccagctttg gagaaaaact taaaaagtga aaaggttcag ttggatcctc 3480
ttctgtgttc atagaagaca taatctgttt gcagaataaa tgtgccgtca ctgataagga 3540
ctatgctaaa atctctacag aactctagga gaaagcatgt cttataaaat agtggttgta 3600
cacttataac tttggatagg acttgcaaga tattcaaagg agaaatgtac ttaaaaaatg 3660
tacttaaaaa aagtctactc aaaatagtgt catttagttg caatttagtg aactgaagat 3720
ttgagtagca ttttcttctt cttgggtatg gcatttcttt gaaatggttt ccaggtgatt 3780
ttatcattcc ggcatgcttt gtgtgtgcat gtatgtgtat acacaaatgt acacatttgt 3840
tttatcattt atcgatgatg ttcagataat ttcagaattt ccatagctgt ataaatttat 3900
cccaggtcag agtcacatgt ggatttcaag tttgtgaatg aaaattcaca tctacacctc 3960
tatatcctaa gataagctaa gcactgggcc agaagctggg tggtgagtga gaaaaagaga 4020
taaactgaga gcctaagaat nnttcaggaa agacaaatat gtaagcaggt ggatatacag 4080
tgagatgtct tattttctag ttttgctgtg gaaactatga tagtgagctt aaacatatta 4140
agaatggtcc ccaaggccac acacggtggc tcatgcctat aatcccagca ctttgggagg 4200
ccaaggcagg cctattgctt gaacccaaga gtccagacca gcctgggcaa catggtgaaa 4260
ccccgtctct acaaaaaaaa aaaaaattca ccaagtgtag tggtgtacac ctgtagcccc 4320
agttacttgg gaggctgagg tggaaggatc gcgtgagccc agagatgtca aggctgcagc 4380
aggctatgat ggcaccactg tactctagaa tgggcgactg ggcacagagt gagactctgt 4440
ttaaaaataa aaaaagaatg cccctgtccc aaaatgttat caacatttta gagcttcact 4500
catgttatac aattctcgcc tgtctcaagg accagcacag attttcatac cttcaaactc 4560
tatgcaaatg cttaaatttt tttaattgat tttttgaatt ttaaagtaac caaagttgat 4620
agagatgata gaatgataga gaaaaaagag taaacagcta gttttaataa ccgaagacag 4680
atgaccacaa tatctgtgtg ttttttgtag tctttttaag ggcttgactt caggtagttg 4740
tcatcgtggc attggacaac ttttatactg tttttaccac tgaatattta ttataaatat 4800
ttaaaatatt tctatataat tttcttactt aaaaattgta aatggctgta taacaccata 4860
cccagtaaat acagcctcat atatttaacc atacctctat cattggacat ttgctgtttc 4920
cagtttttca tcattataaa cagtgtcctg atagttataa tgtagagatt tatttctatt 4980
ttatgttttt cagtataaat atccaaatat gtccatatct gtcacctatt tttccatatc 5040
ttcaaattgg tttcctgaaa aattcagatt ataatttatt tatgataaat ttccagtaat 5100
tatgtctttg aaaaaagaag tatctgaatt attatagaga tatattgtat gtctttaaat 5160
tgatttccta aagaattcan gattataatt ttgaataaat tgcttaatct gcttttgagg 5220
taaatctacc cttttacaaa aagtgttggt ggatcacatt ccctctttta cagaaataaa 5280
agaaggtaac ataataattt ggatgtttga cctttgtgct atataaaaac ttgaccttta 5340
caaaaatcac ctgaaaacca gatgctaaaa tatacctctt agagtaaagc caaaatagga 5400
atactataaa agttcaaagc tggaaaaaga aaaaaatcaa tgcaagttcc tttagaaaat 5460
tggctgttgt attcaggagt ctaattctgc tttttgcttt cctactcaga cttcaagtaa 5520
atgatcaaaa gggcttacat agtgagaaat ctgtaccccc acaggtaaag gaagaagagg 5580
atctttcttt cctaggctgc agaatccaag gcttttctgg tagattcagt atagatggaa 5640
caggactgat aggaaaagct aaagttcagt tcacaatttc ctttctaaga tcagtgtaca 5700
aaaaatacgg aagagagacc ctggaagagc cccttagtat gaaggagcga agttgaaagt 5760
tggaagcagg cttttgtaaa acagaattgc ttgtttctcc atgagatccc agggcaaggc 5820
agccataccg gaatatgttc tgaagacagg gactgacccc acaggtccag ggtgggggca 5880
ggggtaggcc tccgcagcag gagtggaaga attagaagta ggatagacca gaacactgaa 5940
gccaagagaa tcatttatga agagatcaag agtgagaatt atttccaatt atgcaaagaa 6000
aagagatgaa aagaggatgt tgtttggaga gagaatgata tagatggaag acagccaaca 6060
gagacacacc aataaatgtt tttcctgaca gagaggatca cagtgcatgg aacacagcca 6120
tgttttaaag tgagataaga ttcttttttt cttttagatt aaaaacaatc caaatcttca 6180
gatgaaaata agttatcatg taccaaaaca attaataaaa cttagccaac atctacatat 6240
agcctgataa aaactttgga tttgaaaacc aataaaaaga aaaatatttc accagcattg 6300
tgatcaaatg cttcagaaat tacttatcca caaagagaaa atttagatta atgttatact 6360
tcctctctaa aattatcagc aaacataaaa taacgtcctg aaaatctgta gtcctgaaaa 6420
atatcagtag acaattctct tacgttgtaa atgagtcaaa agtgaaaaat aaataggtga 6480
agaaatacat actaggcaag tgatatcagt aaaaaaaaat gaggtagaag tgtgtaaata 6540
tcagaaaaca gttcaaaaaa ttgtttgatt aaatgagaaa aaagaccgta aagtcataaa 6600
agttgctatc tttaatacat ttataactac aggcttccca tatataccaa cgatcagagc 6660
attatagtat gcacagtcaa aagcataatg ctggccgggc gcggtggctc acgcctgtaa 6720
tcccagcact ttgggaggcc gagatgggtg gatcacgagg tcaggagttt gagaccagcg 6780
tggccaacat ggtgaaaccc cgtccctgct aaaaatacaa aaaaattagc taggtgtgat 6840
ggtgggcacc tgtaatctca gctactcggg aggggaggct gaggcaggcg aatcatttga 6900
acccaggagg cagaggttgc agcgagccga gatcacgcat tacactctag cctgggcgac 6960
agggcaagac tccgtctcaa aaaaaaaaaa aaagtctgat gcttatttta ggggaaatgg 7020
aagcggaagc atgcccacag actcaatatc tttttaaaga gttttgtgac ctaaaatggt 7080
attgggagtc agcatttcat cttaagaagt acaaaaaaaa aagaaaaaaa aaagaaanga 7140
ggataaagtt ttaagaatga aaacatgaat gaanttcact atgacataga taaactctaa 7200
atctgatagc aaaaactgag agctacagca ttccaatctg ggaggaatat tgatctacag 7260
gtatatttaa ggtaaattag aatgccaaca aattggaatg atgacaagga ggttagtgaa 7320gaaatgcact ggagaaattg gatatacaat tccaagattg aagaactgga atcagattgc 7380
agtaatggaa atgaagaggt ggatggtaaa gatatatcca caaaaactaa tgctaccacg 7440
tcttagtgat ggaaggaaga gaatgaaagg gagtcctagg ttaaaaataa tttccgatca 7500
tcgagcttgg gtgattgtgc tattgtattc tattaagtct agttaaaaga aattgttacg 7560
gctttatctt tcagttaata gtatctacag ggtaaatcct ttgcttcatt cccttttcta 7620
gttgttttat tgttattttg aaattcacat gagattactt ccagaggcaa tatcgttttg 7680
cttcctttct ttgaaggcat tgaatggcaa tttaaaggtg tagtctagac tagaaaatca 7740
taacagaaac cccaacaaaa actcaaatat cttagttatc cttttataaa acaaaaattt 7800
aattcctgta tacaatgcaa gttagttatt ttaaaagtaa attctgaaga tttctgagga 7860
aagaatagaa tatcctgtat atacatacaa ttataaatca aaatttttgt ctcagacata 7920
ttttgcctgt gttgcttata attagactct cttattcttt tccacacaga gccatgacta 7980
tgcaatgtga actctctaag tgttctcttc tgagcatcta ggctagtgat gcctcattaa 8040
tttggaaaca gtgatgggag aggtgtgcag ggatcacctg aagatgtttt taaaaaaata 8100
caatgtcctg ttttccaccc ttaaagattc tgatttagta tgtctgaggt gaaggaggcc 8160
tcagcttgag tgtcttagtt agcttgggct gctgtaacaa atagcacaga ctaggtggct 8220
taaactccag actttggttt tatacagtct ggagactaag aagtccaaga tcaaggtgct 8280
ggctgattcc tgtgagggct gtcttcctgg tccacagacc attcagctgc ctccgttctt 8340
cttatagatt cgctagtccc attcatgggg tctccacctt catggcctca tgacctccca 8400
aaggccccac ctccaaatac attagagata agagcttcaa catatgactt gaggaaggca 8460
gaaccattca gtttatagtg ttgagaatgt ttctgaacct cccttgataa ttcatatgtt 8520
aagcagtctt taggaattac tattttaaac catccccttt tgagcaaatt tgtggattca 8580
tattgcaaaa tttaacaaac acaaaaacat aatctccctt tgatcttctg ttatgtttaa 8640
atatagtagc aaattttgaa aaccactgtt ttaaaccatc caccttcttt atctaacctt 8700
tacagattca tattataaga ttaaacaacc acaatcaaaa taagtatccc ctttctggtt 8760
tttcataata tataaatgat agtagcagct catcaaaata aaatatccaa cactggataa 8820
ttaatataga gtaggatata tactcagcac agggtaggac ggtggtggcc aggggctggg 8880
aggaggggaa aatggggagt tgttaattac tgggtagaac gtttcagtta tgcaagatga 8940
gtgagctcga gagatctgtg ttatgacatt gtgcctgtag ttaacatttt atagtgaatg 9000
taaaaatctg ttaagacagt tctcgtgtta aatgctccta ctacaatgaa acaaaaataa 9060
aaattactgt gatgtaggtg acaaaaatac gacccagttc cctctcatac tgcttgacag 9120
ttttagtttg ggcatgtagg tgcaatgaca gttttagttt gggcgtgcag ggtgcaatga 9180
caaaagggca ttggggcatt gtggtgtgta ctgaatccct ttagcaaacc caatcacttt 9240
aaaggccaga gaaaattcaa ttttcacaat taaaaaataa aacaaaacag aatccttgga 9300
gaagtaatga cagttttgga gtttttctag aaataaccag agaaaaataa cctgctgttt 9360
tactttggga tttaagaaat agacttataa aaagtgggga accatttttt atttctaatc 9420
agtaccttga caaaaggaaa acagaagagt ctgtttttgg agatggttct ttgaaacatt 9480
tgccttcccc tatgtggtca ccaccttggg tagcccttga agtctgctgg gactggacca 9540
tgcatgcaaa attctgtttt ttgcagagct acattattta gtgagggcca agacacagat 9600
gaatgagtac cccaaaagaa aagtggcagg tggcatttgg aggagagaga gagaaggaga 9660
gaggcagaaa gaaaaagaga aggaagaaca aagaaaacca ggcagccaaa tcagggtctt 9720
gacttttgta caaaattaga ttgaaaatca accacaacaa tccactacct gcaggggcag 9780
gggagtgggc cgctgttctg ttgtggagac acgcattgcc gctgtgatgc ccagggtgtc 9840
agttttttga tgctgtctta gttctcctgc taacatgttc tctgctgtgt tgctggggga 9900
gacgcaggac tccaggctaa gtttaagaga gaaaacatag agctgctgcc tttcctctga 9960
gcagaggcca gattacaggg aatgatgcat ccagctcatt gaagttcaca agctaaggat 10020
acgcggagga gaggcttgct tgagagggcc cggaaggact ggcattgtaa gtctagtggc 10080
aggcatgctc taatttggtt ttattactta gacgtggnaa taggcaggaa cttggagatt 10140
cccgtctctg ttctctggga aagaagactg ttctatttac aaagacttga aagggtcaga 10200
ctgaaagaag acatggacag caaagtattc ctggggtggc aatcagaaag acctggctcc 10260
ctcgtggttt atcacagcta accatgtgac ctcagacaag gcacttatct tctccaaaac 10320
tcagtttcac ctgtaaaatc agaataacag agagagagac acttacctca ttgaggcatg 10380
gtgagaaata ggtaacaatt agcctcacac ttaataaacc ctcagcaaat gttaggtgta 10440
acttgtttaa actgaaaatt tttttaatgt tttacttgtt tcaaagaaat tataaataaa 10500
acacatcatc tttgtgaaca tgtacagaag ttcgtgtttg tgaaatgtac aaaagttctt 10560
aaggttaaaa agtgaaagtc aaatgcttca ccatttctct ccctccctct gttctcccaa 10620
caaatagact acttggattc taaacttgct tccaattcat gtgggtctgg gcatgtttgc 10680
ctccaatttt taatctctgt agtgggaata atactaaaaa ctacttcaga gaggtgtcaa 10740
atgcttagaa tagtgcctgg catggagtaa gctttcaata atatttgttc tcatctttca 10800
agttaaaaaa atgagtacat aatgtctaag cttgcttcta ttctataatt atgcacagta 10860
gtttatggac tttcattcta ccctgagaaa tgatcaaatg cataaaaatc tgagcagtgt 10920
caagagtatt aatcactttt atcattggaa gtcactttgg atatcatcta ttgcaaagtc 10980
ccagacagag gagaaatctt ttctgcaaac tctaaaatgt gtagtcattc cctctgagag 11040
tatccataaa ggagtttacc accttttggg atattccaac atattatgat tggaaactta 11100
tagagtagat gttcttttta tcaaataaac agtcacctct tgataaactt ttgttagaga 11160
atttctattt tgtctgcatt ttccttgcta gaagaacaga gagcactaca aaacaaatca 11220
taacaactgt gttctgggct ttggattttg ggtatgacag aaaaactttc tcaatacata 11280
ccttttaatt gctcttgcac aatctctgta gaaaattaca tacattcttt tagccatgta 11340
tcataggtgg aatctatttt ttagttttca tattcttagc ctagtcagtc aagaaattac 11400
gagactaaaa ctaactctag gaagtgaaga aatctgtcat tttaggaaat ggagagatct 11460
gtctcttcac tacatggggt gagattatca aatgggagtt agtaaatatg tttttctcat 11520
tctttaccaa atttagagaa aaaaataatg aaggtataat agaatatttc taggattcat 11580
cctcaaggaa aaaggaataa taaatggata ataccttcag aaacttgaaa gggttattta 11640
gatagattta atgagaggtt tgatgatttc taccagaaaa aaattgacat ttttataagt 11700
gtgtggtgag aaaaatcata aagtgagtca gataataaaa atggattcaa tttcaggaga 11760
tgagaaatgt ctgtactatt tgcacaaaaa ataattgatg ccaagagttt gtaaacacca 11820
ggctatatga tttaaatata ttgaaaaagt cattttctca tttcctgtcc attctgtaat 11880
atacttaatt tttgattcaa tagttctgtc aggcacattg tcccgtcttg tctctgtgcc 11940
taagtttcct catctgtaaa atggttcttg tgaaaatgga atgacatagt gcatattctt 12000
ttttcttttt ttctttttga gacagagtct cactctgtca cccaggctga ggggcagtag 12060
tatgatcttg gctcattgca gcctctactt cccaggctca agtgagcctc ccacctcaga 12120
ctcctgagta gctgggacta caggtgcatg ccagtactcc cagctaattt tttgtatttt 12180
tttttttttt tgtagagatg ggttttctcc atgttgccca ggctggtctc gaactcctgg 12240
actcaagcga tccactgcct cagcttccct aaatgctagg attacaagtg ggagccacca 12300
cacatggcct gaaaatgtat gatattatta aacagactgg cacataataa cccctcaacc 12360
aacatttttg ttagaaggac tctgtttttg catgacagta aacgtaattt gggttgaaat 12420
caaccagtga gctcactatt ttaacatgga aactctcatg tatcccaaag cactttttca 12480
tggggtatat gtgtgtgtgc aagtgtgtgt gagctactga aggctatttt cctttggaga 12540
aagcattctg agtaggagat aacattcatt tttacangca acttctgttt ttaacacttt 12600
cccttaaatt gtcgtgatga ttgaaatctc aaggcangtc awtgagcnag cccctaaatg 12660
ggagacagca gagttgctgg attctggtct ggaaagtgcc cagtgcgtgt gagaggctgt 12720
ggaggccgtg agaggtgacc tcatggaggg agaggaagag cgtgagcatg caggacacag 12780
atgatctggg ctcagagaaa gaggggaagt tcatacactc aagatgcaca gagaggacac 12840
tcagctgggc agagggaggt gcaggtatca gtagctctga ggctcaaatg ggccctggga 12900
attggaggac ggcagagtgg gcagggatgg tgacacatga ggcaggtgga tggatgttgg 12960
ataacagata ataagacaaa aatatggggt attttttcct agttgaaacc atagcataaa 13020
atgtatgatg ctacattcat ttgctctgaa tggacatgtc ttctgtctga gaaggaactt 13080
agcaagcaaa attgacagtc aaactttaca gaaacaaggc catcttgctg ttaagcatcg 13140
ccttttgtcg tcaagttttc actgtggtgt attgaggtaa aactgaagat gtaaatgtgc 13200
atatagggaa aggacaggaa gctcttgttc aaatgtagat tttagtggtt tgttgttttg 13260
agttctgtgg ctattggaac taaaaagagg aagaaataaa aacatttgaa ataagaatta 13320
atattgtaat gcctacatta acaaattggt aacatcaaat acatgtgtct tcaaaatatg 13380
gggtaatgcc tttctcagat acaaatttaa cactgggaac ctaatctgga aagctgtgct 13440
tatatcagct caccttgtaa ggccttgcac gtataagcat gtaaatgagc tatgggacaa 13500
gaaagacaag gaaggggcac agatgtttga aggtagtgtt tacttacagt taggantttt 13560
ctgcacatgt gtatttattg acagaggatg atgttcacag aatatggcta gatttaaaaa 13620
atctggttac aaaaccatgt gtaagcagcc atttaaaaat aaatgtatgc atggaaaaat 13680
atatgtggca aagaaagtcc taaaagagat acaattcata tcctcttgga gagtaagcac 13740
cctaaagaaa attccacaag agaccataac taattacttc atctgcagcc ccttgttcgg 13800
tggcagacac aatgtatgtg ctcaacaaat tctttgcaaa aatgattgag tctctagaag 13860
tggaatccct gatggctttc atttttgttt cttattttgt ttatatagtt tttctaattt 13920
ttctacaaca aacctgtatt acttgtgtta atgaaaataa aataagaata gaattatttt 13980
cttctaactt aatttaaggt ttaagtattt gagatctagg caaagaaaga ccagtcagct 14040
ctcctggatt tttgcatgaa tctcattatg cccgatagca cagaaacrtg ttgggaatcc 14100
actgctcaat attccttgcc tagggaggta gtatggagcc agcagtaagg tactgaagga 14160
ataagaaaac cactagatgg acgttgaaga gaaagtgcgc cacactagag gctctctttt 14220
aattaatcag ctactctgcc tttaaataca gtatgttgtc ttccatgtca ggaacatgga 14280
gggaaaagac ctagtatgtt ttgttcaatg ttaaatccac gtcacttaac aaaatggtca 14340
ggatagtcaa aaaacaaaac aattatgcaa acatgaatga atgagaaact tctgctagca 14400
atgctggttg gtttcccaaa gacatgaaag tcagagtttg aggtgaagag tcccggagat 14460
gttattgaac attttctttt cttaatttcc ttctcaaact gtgccaggga tactaagcaa 14520
agagataaaa acccaccatt aagtgtgtat gtgtgtgtct gtgtctgcaa tagcgcggtt 14580
gataaacaat ttcacttgca ctcctaaaga ccccacagtt tatgcacaaa agttatcaga 14640
agagtggttg ttggtattga tgtattgaca accttaataa cacctaatga ttaaaaatga 14700
gtcaatgact tctgtcttct ttggggcttt ttagaatgaa atagatgctt tcattttata 14760
caagttgtat gtttatcttc tcacatcttt attcccaaat attaagtttt tcagttataa 14820
caaatcacac acatagacaa agtcttcatg agttaagtga gggaattagg aaagactgat 14880
gtgggattgg cattggataa caaagaggac atggcttgga taaagggttt gaattagttg 14940
agtaaaggtt gcaggatggt gaataatggt atgtttagcc aacctgagtg cagcatgtgg 15000
tatgagtgtg aaaggaaggg caggtacaaa tcagtgggac tcagggtcct ggaaacataa 15060
ggttaaataa agtaggcagt tcgtaagctt caagaatgcc ttcatattca gtgctgtata 15120
cccagcacat accgcagtgc ctgataccac agtggatgca taatatttgc tgtgtgaatg 15180
aatgaatgaa caaatgagtg agtgaatgag aaataagaag atacactgag gttttctggg 15240
ctacaaagga gacctacagt gtgtttggaa gctgattttt ttttatataa aagagggaac 15300
attttgaaag gcatcccaga cntgagggcc catggcctac ntagaaagga gtctagnaaa 15360
tggggatagg tgaaaaaggc cgnttgtaca tatatggaat gaatgagcna agaaaacaat 15420
ccactgctga gagtgggtgc aaagagaacc tgctgggcct tcccgctgca catggggaac 15480
ctgaagagtt tagagcagta gggtctggga catgagagga aggagaaaag caggatgcct 15540
ggctcatgtc gctctctcag gctgaatctt cattcatgat ggtgttggca ccgtcttcct 15600
acatctgcgg gggaagcagc accgatacct ctctaaatta gtagctggac acagatggta 15660
atggaaactg taacaacagg tgatcactta aggggttaag tagagaagac aggcaagaag 15720
ggcatgctgt gaaccataat ttggaagaca ggagaagatt caaaagactt taatactgaa 15780
cccaagagag ctgcaaggga aagaaatgac ccatagtgtt gcaagggcgc tgcagttaaa 15840
gaaaatggaa tattttaatt ttaatactgt gaagacgggg ctggaatgaa gtagggaaag 15900
tatataccaa tagaaatgaa attgctatca cagaatacaa aaactgggtc ttaaccattt 15960
aaaacagcaa tgaacatggg atgaatgagt ttcntgagtt gctataagct gtttctgagt 16020
aaaagattta ttaatggata cattgtgaac tgtgtagcct ctcnnccgat attgaantat 16080
ttaaatacca actactttta ataaatgtcg gaaacctttt gaaagccatg tttttcaaac 16140
tttgtgtact gtcttatgaa ggacactttg gtaaacagaa aaaagagata ttggcttata 16200
aaaacataat aatgataagg ctcagataca caggaancaa tttcctatca aaataataaa 16260
cttnacctag gatacttaaa tatccctact ggtttttatc agagaaataa taggtctgct 16320
gtatgcagtt ttattgattc aacatgaatg aaggcataaa acaatatttc tgtttgcaaa 16380
ggaaaattat tacaatcaac cacctcaaat taattttgaa ttcctcatgt gtttgtaact 16440
taaatttatt ttactacttg aatgctttat ataatattta atagtattaa attaaatcta 16500
gagatccagg agctagttgt tgagttttta tgtatgtgtg gattagccag gtatctttgg 16560
agcttagatc atttcttggg cactgtgaga tttagtggca cctgggagca ggtaaagtga 16620
aggtaaatgt gagtgacagc taatgtcatt cagttataat tgcactattt tggttggtca 16680
gatataacca aagtgggaat tttttaaaaa acaataaatt ctggacatgt atttttctag 16740
ataaacaaat ccataatcaa aaatgatttt tgctttaggt ggcgtattga taataaaggt 16800
gcatggaatt catatgccca ttgtctccac tgctcagtga aagaggaatt gtggacagat 16860
ctctaaaatt ccttatataa tctttgaagt gaaaccactc ttttacttgc tcctttgtat 16920
gtgtcatctt gaaggatttc taaaagattg tatctacact cagtatttgg gtggatagga 16980
gactgtcatt gaagaggcat ctcaaattga ggccaccaga tttccttccc cactaccagt 17040
acatcagaga aaaaaaaaac actttaaata ctctgtatac attaacatgg gatatcaaag 17100
agtcccaaac tccaattata taacataaat taattagtgc agcctactgc aaagcccata 17160
ttcaaactca atattcagag caataacagc ctggaaatac ccagcatgtc ttcaagccag 17220
ttagcttgtt ttcttctggg aataggaggt gaatccgtcc gttttcacac ttctataaag 17280
aaatacctga cgacgctggc taatttataa aggaaagagg tttaattgac tccattctgc 17340
atggctgggg aggcctcagg aaacttacaa tcatggtcga agacaccttc ttcacaaggc 17400
ggcaggagaa agagtgtgtg aagtaggaac tgtcaaacac ttataaaacc atcagatctt 17460
gtgagaactc actccctatc atgagaacag catgggggaa accgccacca taattcaacc 17520
cctctctcca cacgtgggga ttgtggggat tataattcaa gatgaaattt tggggggtgg 17580
gaggacacag ccaacccata tcaggagagt taggcagaga tacctgccca ggtagataaa 17640
ggagcacata gcgatgggga taggtgctca atacaggcaa tcagattcgg agctgctttg 17700
ttctgagttt ctgtgtttta ttctcttttc cagtaaaaac tgcatctgtg ngcgcgcgca 17760
cacacgcgcg cgcacacaca cacacacaca cacacacaca cacacactgc aaacatgttc 17820
ttgtactcca gtgaggacta agtggcaccc attgtgcttg gttaggtttc tttctctaga 17880
cccatggagc accagatagg agagccagtg aacccgcctg atgttaaaac tgcagtgcta 17940
cgttttcctg actcagcctc ttttttttgc ctgaagcgct cttttttttc tgttacccgc 18000
cttgagaaat tctcctaata gtctgcagct tcagcatggt caactctaaa ccccttacac 18060
attgtagtca aacagagctt attttaaatt tcaagtttgc ttggatggcc ttggtcaagt 18120
tattacctgc cttgaggcta gcttttctca tttttctcat gcatgtgtaa gaagatgagt 18180
tttttgtttt ttgttttttt ttggttaggg ctgttgtaaa gatcaaataa aatatcattg 18240
ctaagtgtcc caaacatagt atatgcccat agctgttagt tcctcacctt cctttaagac 18300
tcaatccagg tgctaatcaa atgggaagtc tcacagtcga ctcagggatc atcaggtacc 18360
acctgccttt ataacaattc ttctcacatt gtattgcact tatttgctat ttgtgtcctg 18420
agggctgaca tataatagcc ccccttcaag tgactgctga gttgtggaag gcagtagcaa 18480
tggccatagg gaggtaacgt ctatcacagg atgtagatgt ttcagaattg tggaaattta 18540
agcagttagc aggcatctca tctcccacct caatgtaatt tcatgaacaa tttacttcag 18600
agtagctgga agaatttaga taatcactgc attcataaaa caacatctcc atttagggga 18660
ggttcttccc ccattctttc tgacctccct cccctcccaa gttgggagat caacttgggg 18720
ctactgttgg aagtaagaga cgtctgtgaa tgtcgtatta aattaacact ggggaaacca 18780
tggggaagat ctgtgcattt catctgtatt actcagcagt gttctagcac aaagcacctc 18840
tatgtggaga cagctttagg tataagagca tacatctaaa aagattttcc caagaatatg 18900
tctgccctaa gaagcaaccc attttactct agctattcta aatagctagc ctctaaactg 18960
cttttgaagt acataaaata atccattgct ttgggagaaa aaaatcaagc ttctgttggt 19020
attaatttat ctcatccttt taaagtttct attttcatat gtttattata cactatggag 19080
tagaacacat atatgcctta caaataagta gatatatgtg gggaactcaa ttttttgatg 19140
agggcaagat ggtttagatg acaaatacaa cttttccttt tncccagact gtggttttgt 19200
gcttgctcac caaagctaac ctcagcatgc tcaaaaggaa gcagagttcc agggtggaag 19260
cccagccagt cactgacttt ggtcctgatg agtctctgtc ggataatgct gacatcctct 19320
ggattaacaa accagtaagt ttcttctttg agtatggaga agcatatgtg gatgtgagat 19380
aaatgtgatt gacaaattca aatatcatgt acctttggct tcgnaaatat ctgagctgca 19440
gtagaatatg gatgaggttc agagtctgga agtagagaac aatccaatga aatagtgaga 19500
tgtcgctatg agttactcac ataggaagat gcactgggta gtctgatccc ctcccctccc 19560
cacgctgtgc accctgtcct cagagtcaca tggtgtagag atgataccac ttctcaggct 19620
gatccaaagc tggggtccaa gatgagcaac ctgttctgaa tgaacctcct ttacttgttg 19680
tcaacgttcc tgaatccgtg agacaatatg cacatgtttg gaattaaagg tctccttctg 19740
atttgcaaaa tttgagtaaa aggtcaatga gataatggat ggtatctctg aagaactttg 19800
tcaccttcac cgcctaatta agttgatgag gatttgagaa gaactgctag gccaggcacg 19860
actgtgtgcc agaaagcata gtaaccagaa ctaagcctga caggcatgca tatccatgag 19920
tgctggaatc tcagctctgc aaaaccaagc aggatcaact tcttactcat ctcatggttg 19980
atgctgaagt aacaaaagga aatggcctgt tccctcttgc agtgcttgtc cttcccccaa 20040
ccatgataca cacatgatct gcttggactc tttgctgtcc ttcccagtct ctcttcctct 20100
aatctgccct ccaggttact ttccctgcct gctcacattt ctttctatat ttctattttt 20160
attcacatca cgcttctgct ttataatcat ggaagcatcc ctattacctt cattgcaaat 20220
taaaatacgt tagtgtgaca ttcctgcttc ttttcattca ggacctaacc tgtccagcaa 20280ctgctccttt cctgtgtcag cacactgtcc acttgagccc catcagcagc ctcctactcc 20340
tctaggctct ctggattgtt cacattgctt tccctgctcg tactgctccc tggccccagt 20400
gaccctttcc cagctcctct gatgagtcaa atcctcctca tccattagga ctggatgaga 20460
tgtcacctct ggcatcctcc tctgaaaggc ttatttccgc cacagacaga atgtacctct 20520
cttctctttc cacttagcct gttttatatt tgtatgtaaa tataaagtga tctgtaaata 20580
actgtatttt tatatgtatc atatattatg tgtatattta cattatatac attgtaggtc 20640
gtgtgtatat ttatataata tacatatatt tatggatcta ttgtcttagg tatatataca 20700
tgttatatac acatacatat aaacatataa caggnttata tgtatatcac atatatacac 20760
attacacata cacatatatg ttatatgtgt taacatatat gcatattacc cacacatata 20820
aaatatcatg tgtatataan catatataca tgtcgcatat gcatatacat atatattata 20880
tgtatgtata atgtgtacat atatttatat gtgcatgcat ataacatgta tatgtaatat 20940
gtatatatgt tatatacgtg agactataca tgatatatgt atattatgtc ttatctagaa 21000
catgttttat aatgttatat aatgtgacat gtttttgcct cttgcagtgc ttgtctttcc 21060
cctaaccatg atacatgcag gatctgcatg gactctttgt tgtccttccc agtctgtctt 21120
tctttctcta atctgccttc cagactacat gtgtttacat gtatgtgtat ttacatgaaa 21180
cataatatat acatacatat aacatgctat gtgtatatgc acacattata tatatgtatg 21240
tgtgtgtata tatatatata tatatatata tatatatata tatatatata atacattcat 21300
aggtgtttta cttcttggac tgcaaagcag gagtcagaag tgtgttgctt ccatattttg 21360
ttctccattc ccagcattct gacacatagt aggccttcat tcatacttag agaattgaat 21420
ggaatagaga atgaagcacc cctaactttt tcttagtgtc catcttatta cagagctttc 21480
tacaaactta tgaagaaggt agtataaaag atgtggcctt ggaggcactt actaaaatta 21540
ataattcttc attaaaatta tgtctttaaa ctaaaaacac ttttgttgtt gaagaactta 21600
tatttggaag ctcttttgta taattagatt ctttatgttg aaagtccaga tggggctaaa 21660
ttcacacacc aatgtttatt gaagtgcttc caaattgcat gaaaaataca tcaaccttta 21720
aagtaaactg aatcatcagt ggcttatgtg gtatggaatt agcagcaaaa tatcttcatg 21780
taaatattat aactgtcaga taaatattat aactcctcag ctgcaagtgt ctgagtctcc 21840
tgaaagttct gacagtcttt tctanttttt catcttgagt gtttngctag tatatatagn 21900
ctgcagaatc catctactac aagactaaaa tttttttcag agtattatat taaagaatta 21960
tcataatttc atatatgtcc cagatagtca ataaaaacgt atttggatta tgtttaagaa 22020
ttgtatacta attgattaac tggtaatatt aattgtggtg ggtttagcat ggagatgcag 22080
ttaagtattt ttttaatcct agatactagt tttcataaaa aaatattgag tatgagtgat 22140
tgtatgtcct gtatatatat tcatgttaac acacacttat ctttaattct ttcttcttat 22200
tttggggtta aagaaaatct tcagacagca gacatgcctg tagtgttgca cagaaagtta 22260
ttttgtggaa ttttgaaaga tgtctgggct aaatttgtat aaaatgtgtt ctccaaaata 22320
aagagaaaaa tctatgcatt tttttcaaat gtaggatgag accagatttt taaaaagttt 22380
ctttgtattt ttatacaaag gcattatata tcagatacaa atagaaagga aattctaaat 22440
atgggatgtg ttatatatca attcatttaa aaagcatttc ttaactacta tgataggccc 22500
ttgtgctaga tgctagggaa gttatggtaa atatagtatg cccctaattc taggtactta 22560
tagtacaaaa atgaaaaaaa agtaatggca catcaagttc ctatgtgact aaattacaaa 22620
cacatatttt aattgaacca gaatcttcct atattgtagt ctgatgccca ggaggttatc 22680
agatgtttgg gagagcctga tcaggttccg tctatgcttt gggtctttgt aacgcatggc 22740
cacagaaatg cctccacctt tctgtcttag tgtgtttatg tggaaaatag gtgccttgag 22800
aattaaatga tatnaaaaac gtgaaaatat ttgtagcaca ttatatgcac ttagatgtta 22860
gatttcttct tcttcacctc catattagta aactatttta acctcagtat tatgttttcc 22920
acttagtgtg gttcataata caagtttgag atatcagtta tggtgccgtg tagtaactct 22980
ggaccatcat tgcagtgggt tcactctttg ctgcgcatct gtgccatcat cagcgtcatt 23040
tctgtttgta tgaatacgcc aatgaccttc gagcactatc ctccacttca gtatgtgacc 23100
ttcactttgg atacattatt gatgtttctc tacacggcag agatgatagc aaaaatgcac 23160
atccggggca ttgtcaaggt gagcacttcc atgtcattta aactaagaac ctaaatgtgt 23220
tgaaagtctt aatcccttta atcatatttt cttgttcatt tcagtaaaac aaaacatcat 23280
tttatcttat acatatggaa gtccttttta aaaaggcata actccagaga ctgggagaaa 23340
ttgttgcatg agactatttt aaaagttaaa taaattttgt aagtcacaaa ctcttggaat 23400
atctgagaag gaacaagatg gtttgactaa tgactgtgtg aagtctcgag tagggttatt 23460
catgccactt agggctgagc ccacaaccca gcacaggggc tggcccagag aagcacctta 23520
ttatttgttg acttagggag tgcagaatca gagtcccatg atagagttag agcatgatat 23580
tattgcagca cgatgtcatt tacttgatgt gttttgaaaa tacaaaagga taaaaaaaaa 23640
aggacatgag atggaaaaaa tgtctggggc caaaaggaaa attatgtgtc atgtgaaatt 23700
agtaccaatt ggaaacaaaa tagatataaa atgttttaaa agggtaaaga aagggaaaga 23760
aaaggaagaa aatttctgtc actggatatc ttttccttcc atagcactaa tctttacata 23820
ggttaaacat atgtagatga tgctgtccct agagtattta aattgtacta tttggggaag 23880
cagtaatagg agtgcagatt ttagagtttg acaaatgaca gacgactcag atcttagttc 23940
tttcacttac tggnttgtat cagcatctca agttagctaa ttttggtgag aaagtgtttt 24000
attttgtaca aggattttga gaatctactg agacaatata taacacataa ttatttgtca 24060
atttcattgc ttccctttta tacataatta attgtgtgcc atccttgaaa gacagagatc 24120
acagacaatg cattaatagg ttcttgttta actttttatt gtggacttta aaaaatttac 24180
cccaaagtat attacagtta taatgtgaat ccctgtaact acacatcaac aattatcaat 24240
atttagccaa ttctgtttca ttttaaagca aatctgagaa accaagtcat ttcagaaata 24300
actccttttg tattggtgac tgataaaatt ttctcttttt ataaccacca taccattatc 24360
aaatataata atattttacg tatgataaaa tatttgtaac aagacttagc aataattcct 24420
taatgtaggc taatacttaa cccaccgttc atatttccta atattgtcac aaattttttt 24480
tatggttggt ttcttcaact caagactcag acaaggttta catagtatac ttgattgttt 24540
ttgttttcgt ttttgggagg gaggttcact tttgttgccc aggctggagt gcaatggcac 24600
gatctcagct cactgcaacc tctgcctcct gcattcaagc aattctcctg cctcagcctc 24660
ccaagtagct gggattacaa ggcctaagcc accaccccgg gctaattttg tattttcagt 24720
agagatgggg cttctccatg ttggtcttga actcccgacc tcaggtgatc tgcccgcctc 24780
ggcctcccac ttatgtttct taagtctcct ttaagtctct gtaagtccac taagtttcag 24840
cttttcacat cctgcaaaaa attttcctat gtcattgatc cattggaaga catgcgtctt 24900
ttgtcttgtg gaagattcta catttgagat ttggctgatt gcttccagat ggtgctcttg 24960
aatagtttnc tgtgtactcc wtgtncctct gaactgcttt ngtanntttt gaccagncaa 25020
tgcacacagg tgcttctttn cccacatggt cacctcnaaa atatgtcaga cttctggata 25080
tttgccagtc tgaagggtgg gaaacggtaa tccactgtag ttttaatttg catttccctt 25140
ttgagagtga ggttagatgg gattttatgt atcaagagcc atttttaagt tactattttt 25200
tcattcaatt ttggccactc tgtgtgtgtt agaagtatca gctgtttgtg atataagttg 25260
caattgtttt tcccagtttg ccattgtcat tggctttgtt tgtggttatt tgtaccatac 25320
acaattctta tccaaatcat ggacaaactt tctattgtct gcattttatg tcatacagga 25380
gagttttgta ggtttcctca tacagatttt gcacattctt ggttatattt atgctttggt 25440
attttattta atcattttgt tatttgtatg aggtcttcta ttacatgttc taacttgttc 25500
ttttaaatga aggctgttgg tttctataca ttaatattat attctgctac tttactaaat 25560
gttctagatt cttgtattag tcataatagt tttcctgcta attcttttga tgcttccata 25620
tgatcatatc atattcaaat aaagaaagat ttgtcttttt ctttgtaatt tttatgccct 25680
agttgctttt acttacttaa agtaaaataa atgaattgac taacactgcc ggtaaaattt 25740
taaatactag tagaggtagt gaacattttt attttgtttt gtttttggtt tatctagaac 25800
atctctagtg tttcttcatt aactagttca aaaaattggg atttgaagta tgtgtacatt 25860
attggattaa gtgaataaac tttaatttca cattttgaga gttgtagcac aactagcttt 25920
ttaatttgtc aaatgtttat ttttaatttg tcaaattatt attttttcct tagtgcttgt 25980
aagagaagag atttttaaat attgagttat ccttccattc cgataaagaa aaatccctac 26040
tgggtcaaca tacattttta ttctatttta atgtgttgtt ttgttatata tgttattatt 26100
ttccttattt taaatttggt ctaatctttg tcaggttttg atattagatt tttcatgtgt 26160
gtgggtggcg ggcatgtatg cacactataa aatagtctga gcactctcag aattgttttc 26220
actttaaaag tttggtatca gttcccggtg aaatcatctg gtcctgttgc gtttttgtgg 26280
gggttccttt gcagtatttc ctatttcttc tatggaaatt gtctgtttta tttttatttt 26340
tattttttat tttttgtttt ttttttgttt ttgtttttgt tttttcgaga tggagtctca 26400
ctcttgtcac ccaggctgga gtgcagtggt tcattttcgg ctcactgcaa cctctgtccc 26460
ccaggttcaa gcgattctcc tgccttagcc tcccgagtag ctgggactac aagcgtgtgc 26520
caccacgcct ggctaacttt ttgtgtgttt agtagagatg cggtttcact gtgttggcca 26580
ggatggtctc aatctcctga ccttgtgatc cacctgtctt ggcttcccaa agtgctggga 26640
ttacanggcg tgagccactg tggcagacct atgtcttcat tttttagtag agacaagatc 26700
ttgctctgtt gcccaggctg gagtgtagtg gtgtgatcat agctcactgc aacctccagc 26760
tcttgggatc aagagatctc ccacctcatc ctcccatgta gctgggacta caggtgtgtg 26820
ccaccatgtg tggctgattc ttaaaacttt ttttagagac agggtcttgc tatgttgccc 26880
aggctggtct ccaactccca gactcaagcg atcctcccac ctcggcctcc caaagtgctg 26940
ggattacagg cgtgagtcac agtgttcagt caaaactgtc tgtttcagac ttgcttggtc 27000
tattggggtc tatttggtga agtatatttt cttaggaaat tatcccctat ttattttgtt 27060
taattatttg gtaacataga cctgtgtaaa tagcttttct ttcctctgtt tgattttctc 27120
ctaattttgt atttttttgt tattttggtt agcattttgt tgtcatcagg ttggctagca 27180
gtattttttg tttgttccat tttgttttag gttagccaat tggtttgctc attttgttga 27240
ttttttttaa aaagaatcag cttaattaac ttattaattt ttgtttaatt tttttccttt 27300
aaaaatattt ttattatact ttaagttcta gggtacatgt gcataacatg caggtttgtt 27360
acatatgtat acatgtgcca tgttggtgtg ctgcacccat taacttgtca tttacattag 27420
gtatatttcc taatgctatc cctcctccct cccccgaccc catgacaggc cccggttntg 27480
tgatgttccc cttccntgtg tccaagtgca tttattagtt tctttctttg ctttatttgg 27540
tttactttat gggtctgttt ctaacttttc gaaggtgttt gtctcacatt ttcatttctt 27600
gagactctta aatctgctgc ttccttgcct cgtggttaaa atgttaacca caaggataat 27660
gttaaccagc agcataaaat gttactgctg agaatgtttt ttttccctcg aagtggcttg 27720
ctcttttctc ctgaatacgg aaagagactt tccctttatt gttcaagtca gcagctctat 27780
gagaatgtat gttatctttt tgttgatagt tacggatata ttttcctagt ttcatcatgt 27840
gatatttatt ttattgcatt gttttcagga ttccttttgt attctaatta taccaggatc 27900
tatggtttgg tctttccttt cctttgtttt ctttccatgt atttccctct gtttttatgt 27960
tttctacatt ctctttccct tgcttcactc ctcatgctgt cccctcactc ctctgtcccc 28020
tgtatttcac tcctctttct caaatacttt tttcatttct ttttcatcat ttcctgaaca 28080
gtttttgttc tttctttttt cagtctctta tcatttagac atcatttctg tgttttctta 28140
tttctagttt tgtgattctt ttggagcttc tatttgttta aatttctttt ggtcatgttg 28200
tcatattcga ttatagtctt catctgcttt gagtgtttat tttctgttta tacgtttatg 28260
tattatttta tttttacttt tattattttt tgagacagaa cctcgctctg tcacccaggc 28320
cggagtacag tggtgcaatc ttggctcact gcaacctcca ccttctgggt tcaagcaatt 28380
ctcctgcctc agcctcctga gtagctgaga ttacaggcac gcaccaccac acccggctaa 28440
tttttgtatt tttagtagag atggggtttc accacgttgg ccaggccagt ctcagactcc 28500
tgacctcagg tgattcgcct gccttggcct cccaaggtgc tgggattcca ggcgtgagcc 28560
accatgcccg gcctatgtat tatttcattc atcttattct gtaatgtttt tacaagggct 28620
tcatcatgat ccgtttgttt ggttgttctt cttgttgttc acatgaaatg ggagtttttc 28680
ccacacattg ggtagagtag cctctgcata ttgtcagtac gaggggtccc tccactgttg 28740
ttatcctgat gggtaaacat ggagcttttc tgtgtaccga ccgtcaggtt ctgagctctg 28800
ctgcctctgg actgctggcc caattatcga atatttctta cccactggcc ccagtgtccc 28860
tgccctactg aattgccatt ctaaacatgg ggctgtggtc tggaaagggt ttttgttggg 28920
tgtcctttgg agtttctaat attccattgc ctctgatctt tctgcagttt cttggggaca 28980
ttggtagtca tttgtttttg ttttgttcct ttgttttaca ttaacctgca acttgcagcc 29040
taccagttta catttctaca aatgttgcca tttattttaa ggttcacctt ctgagatatc 29100
tgctcagcat tccacacgta tttattagtg attttggggt tttggaaatc tactggttta 29160
tggaagaggt gggcatcctc catagcttca atgaacagat ttcaggatga ttccaaaatt 29220
gtctgtatct tccacaatgt ggctaggcta gtttttataa gcactaggtt tagataangc 29280
ataggttcag aaaactggaa cctgtctcag gaggccatct tgggagaaag ttggtcttgg 29340
gagaatgcta acatctctgt tattcacagt actcccctgg acgttgcccg gccctagctc 29400
acattctgtg tagttgcccg gccctagctc actagagggc catgaatggc cctgtcactt 29460
gtgtgtagtg gttattgggg ccatggcaac ctttgcccat gcattgaaag atctgaatat 29520
tctgggtgaa gcattttatg attgaaattg ccatgtgttg acttcttaag ggttccattt 29580
gaatgaaaca aataagtgac atgttcctac aagaaaactt ttgttttttt aagtcattaa 29640
ataaagactt agatttcaca tcactaaaat gatagtaggc attctgctag ttgtcacagt 29700
ctaatgataa aaagaacaga ggcatactta atatataaat tatatactca ttccaagtga 29760
acagagcagt gagagaacac aagttttaat aatgtaaatg ttagaagttg aatcaatagt 29820
taaaagagaa agaaatgact taggaccaaa tcgttttcaa aatgctgtaa attagccatt 29880
tccagtattt tcacatttcc atcaacattt gggtgatgag ctatttacta caaccaaaaa 29940
tttttttttt tattttcaat ctgtaagagg tgaaatttaa aatgaaaatc aaataaggtt 30000
ttctggtttt cattcagaaa taattggatc aaatacaact gtaatgcaat tttagtaata 30060
ttgcactgtt aacattatct tgaagtagtc agctcaactt catagctcag taaaactggt 30120
attctatgtt taaatgctag ctaacgtttt agttaaatat agttaaatat gaaatctgtt 30180
tatcctgaac caagctttaa atgtatcaac tcactaaatt tttaccatca tggcctctat 30240
tattgttaga gggtaataat tatatcagta agtactgtca ttttcatgat attaaatcta 30300
agccacagtt ttattatttt tatactacag acttcttcaa acatgcatgt cataacagat 30360
acagctcaaa gagtatattg ggcttgatat tattttctta tattcaaaac ttaaactttt 30420
aataagactt tattttagca aaatgtcctt tgtcacatta aatgtatgtt cctaatttat 30480
attttattag ctttgcattt ttgtatttgt aaatttgttt tgcttttata cttacatgag 30540
aaatttgtac atattgtagg tgtttaagtt acatcataat aaaaacacac tgtcacatcg 30600
aagttctata cctttcaggg gccctctcat attactcaag tttgagttac tatgctttct 30660
tcaactctac cataattttt aaaacttttg ttaagcactt gtctgctgaa aacctcatca 30720
tttttcatac tttttctacc ttaatacatt tgccaatagc actgcagtta tctctcaatt 30780
ctttagtccc ttncacccag aataatttgc aaatatgtgc tgcattttct cactaacatt 30840
taagcttgta ttttttcata cataaatagg aacgttatga atatacatgt tctattttaa 30900
tcttcaggtt acacttttca tagtaagttt tcacattgtt tggaacagag ttgtgcaaat 30960
atgaaatgtt taatattcac tgatttccaa ctaaaatatt tctaaggaat agtcaaattt 31020
agttattgag tgagcagtac ctgttagcca tgtgttctgg gtggaaaagt gtgtgtgagt 31080
tgatgtacac atatgccagt gatttgcgaa atgctaacct gntanttttt tttttttttt 31140
ttttttttga gacggagtct cgctctgtcg cccaggccgg actgcggact gcagtggcgc 31200
aatctcggct cactgcaagc tccgcttccc gggttcacgc cattctcctg cctcagcctc 31260
ccgagtagct gggactacag gcgcccgcca ccgcgcccgg ctaatttttt gtatttttag 31320
tagagacggg gtttcacctt gttagccagg atggtctcga tctcctgacc tcatgatcca 31380
cccgcctcgg cctcccaaag tgctgggatt acaggcgtga gccaccgcgc ctggccaacc 31440
tgttattttt taaagagtct tttccatgca taaaactatg ttagtccata agaaaatatt 31500
tatagaagca aaccaatgta ttttttgccc agctgtcatg cacagttctt taaaattata 31560
cctagccaat tttggcaatg ttatggtgta cctaagagtc atacctaatc gttaaagtag 31620
tgttatccaa tgatacctag tttataaaat tatgcacgac aaaccaaacc cagaaacttt 31680
attttttcaa aacaaacgtg tcaaagctgt ggcttcctag cattgcctac taagtttatt 31740
gacctagtaa tttgccaaat atattaaaat atgtataaat ataaatataa aatatgtaag 31800
atatgaaaat gtttaagata tttaagatat aaatgtaata taagaatgag ttatattctt 31860
aaacccaagt acagtttcca agttttcctt tagtcatcca gcaaccattt attgaacact 31920
tacaatgagc tcatctctgt ccttggagaa gggaaacaga caaaaccaag cagagctcct 31980
gtcctcagag aaaacctggt tcactctgtg ggacagactt agcacataca ggcactcttc 32040
attttcaaca tccaatatat ttctgaaaac atggtggata gcatattttc agaaaatagg 32100
cacttctctt tcactaattt atatgggaaa actaataatg tattagggga gctcgactga 32160
tttctccaaa tatcactgca ttaccatcta atacctatac aagtcaacct gcatatttct 32220
gcaaaataaa aagcatttaa aacatccctt acccaattat ttgcactaat caaaccacag 32280
tggatgtttt atatgtgccc aacaataaca ggaagtttct gttattaagt aaatttaaaa 32340
aatacattaa agtaccatcc accatatttt attgaattgt tgatatcatc aattgtaaaa 32400
aaaaatggca tcacttcaca gattcacggg tctctaagaa ataataaagg cttctaatta 32460
tactttgact gtaagatgta agattttaat tgaagcatca attagaagat gcatgctgaa 32520
tccagaattg tgcaactgtg ttggagcagg gtagggtgtg ttttagaatt ggtgaaatat 32580
gataaaatgg gcctgggttg gtaaactcaa tttttggatc ttttgaaagg ctaactttca 32640
ggggaaaggt aagacagagg aagatatcaa tgcactagta ttaaatagtt aagtaggtaa 32700
acaatgctgg tacaagattg ggcccaaaag gtgaacaaca gagatacacc tgcattgcac 32760
actatacctt tggcagaatc cactggcaac tttaatgtct ccattggcac acgtgcaaag 32820
tcattatggt ggttcttcta ggttcatagt gattctgggg caaacatttt ttgcagatat 32880
aaatagcaaa tattagtata atgagaatct acatagagag ggaccttctt tttttttatg 32940
aaagggcttt aatagtggtc tgtaaaagct atgggggagg caggcataaa aaagaaaaac 33000
accaaaactg tctgcttggg gatatcagag aagtcttgaa gaaagaggaa cgtgaaacaa 33060
tgccttgaag gatgagtaag tgtggtctgt ggcaggggtg atggaagtaa gatagaagta 33120
agggatctca cggagaaaga aaaggaatat gaggcacaaa ggagtggaac agcaaggtac 33180
atgccgagct caaagtagtc agaagtggca gatgggctgt gcacaggagg cagctggaga 33240
ggagtttgtg aaactagacc tggctgcatc atggagggcc cagcaggctc tgcaaggagt 33300
tctgactttg ttctgtggtc agtaaagatg catggaggat tttcatctga gagtggtaca 33360
atctgatttg tgtttgaata gttcactctg gaagttacat gctggatgca cagctgggga 33420
gagaaactga agcagaaagt ccttccagca agaaatgtct ttaacaattt ttgttggagg 33480
aatgcatttg ttttaagtgt tttccatctt ttataatatt cccaaagctt gaaggtgctt 33540
gcccatcaat tcccactcct caacagcttt cttctaattg cctccctaat tcctcttgct 33600
ggaagcattt tcactcacca aatccctaga ggtgaaaaga aactatttgg atgatacatg 33660
tctgtgttgt tgcagagcac ttcatgcatt gcagactgtg agttctttag accattctca 33720
gttgtctatt tcacatctgg caatagatac aagtaaaagt agcatgcatc ctttaagcac 33780
tgttgaagta atatataatg atgctaagac atagtgacag atgggccctg gaaacttggg 33840
acaataaatc ctgttctcat gaaactgtac cagtgcatat cattttgtca ctgcaaaata 33900
tatccctata aatgtgtttc ctttttctgc ttgttaaata cttgcatgat atgttgttac 33960
tttcttacct tatcgttgat tggcagtctt caagtgttta ccgttataaa aattgacata 34020
tacagctctt gaagcactcc tctcctcagc caccaaagtc ctgatttttg cgcatagctc 34080
aagcactctc tgccctccat ttcttgttga tggaacaaac aaattaaaac attttttcat 34140
atttaaggtg ttaaaatatc ttgagtacca ctgggcattc atatgtgtta gcttctggtt 34200
gcatatttta gaattgggtt gcaaatatta taacttgagc ctcaatacag tagaatttta 34260
aaggatctgg ccatgcttat aaatggaatc aaagcaactt tgactactat ggctagggct 34320
tctgacgata atttgataaa tgtgccagat acaaaacata atccaagatt gtattgcaaa 34380
gtgtcagatt tcaaggtctg cattctactt atttaaaagt attataaact tattgtgcct 34440
tagcaattat tgataatgat taatatgata gtaattttaa ttcctaccag ttcaattgta 34500
tttacaatca tggtnaatgt ataaaatatg taaaccgtaa nctgtatttg catggcatgt 34560
ttnagttctg cnttatgcaa actatgctaa tccaggaagt atccataagt catctcataa 34620
tctcatctgt gatctttcat ggttacaaag gagccagaaa ggaataattt ctttttagaa 34680
gcatataaat aatttcagtg aatagatgga tggatggatg cattcattaa gaaatattaa 34740
ctgacatctt gctgtataca ttgtatatta actgacatct tgctgtatac actgtatcta 34800
agacatggtt catgtaccta tctcatcatt catttaatat ctgctatatg tcacccactg 34860
tactgggtgc tgcaaacaca accnttaaat tatccgactt aaagtctcag ggtgnttact 34920
catcttcaga atacactcaa acatttacca tgagagatag acttcttttt ttttttctaa 34980
tgtaactcca gagaatacgt tcagagaaga tttaagtagg aaactcaaac ttcaccatca 35040
gatccaataa gttggagaga ccaaatataa attcatgaaa taaccaatat ggattacaaa 35100
ggcatattct gcgagtaaca caagatgcac attatttata tacatgagct gagttgtcag 35160
ttgttgcatg acgcctgagt taaggtgatc agaggaggct gtagtcagat cactctggaa 35220
ggaaaggttg gcacagactt ggcagaattt ttcgggaaga tggacagcat gaaaaacaat 35280
gaacattaaa aagccaaaga ttttttacaa atggaaaaat gctgagggtt gctggccttt 35340
gtatcttggg tcataactct gcttataaaa gatgtttatg aatattgaat gactcttgga 35400
aacatgagcc aaaaagtaat acatgaaact tatgcccaga ggattatttc catacttcac 35460
tgggaaaata aaaagaggtc aattctgatt gaccactgca taccatctag catgtgctga 35520
gcttgttggt gacacaggaa tgccactata tgtttctgaa aagtccaagg cagaagacat 35580
tccaaacaaa acaattaaat tacttcctat ggaaaagaaa gttttctaca ttacatggta 35640
gaatttttgc taagccagtt tttataactg aggtcgttcg aaattaagat gtttgtatgc 35700
ttctaatttc tgatcaccac tggtgcttct aaaatgattt aaaataattc attattttat 35760
atagtttgaa atgtagtgtg ggccagtttt acaacattaa tttccttagc aaagaaatca 35820
gaaacaaaaa ttcagtcaca tctgttattg atagcttttc attctgaatt ggtgaggccc 35880
caatttttaa atttaaattt atttttgcca actggagaag tgattttgtt aaagctaaaa 35940
tgtccaactt aaaaaaaaaa ttgaaaagct atttttaaaa atttaacatg taagcattgg 36000
tccaaaaaca tatcagaata cattgtgaaa agcatgtctc tcctccacct ttggctcctg 36060
gccattcact tgcccgcccc cctccccata acacaaaggg aagtatcact gtttatcctc 36120
atttgttaac attgtaaatg tacctcattg taatggtgaa ctctcattca atgttccacc 36180
gagtttaatt catttctaaa gcaaattatg agcaattaaa aagagggtaa ttgtagtgct 36240
gctacatata acattgttaa tgacaaaaat gaaataaaat agtaatactg ttttgaaaaa 36300
gtacaatata aattcatcct atttgggtgc ccgtgtactc aacgatctat aattactctt 36360
ttcctgccta atatgtactc attcattgct cccaatttta acatagttct ctgctgagtc 36420
cccataaaat ttcagttttc gtttttggaa ttctttgcct ttttaaaaac aagtgacaac 36480
tctgcctagt tcttaaaata aagatgaagt gatacttttc tttttttttc cctaacacac 36540
aagtaaaaaa catttgttca tttaataaaa gtccatttga aaatatacac ttttattttt 36600
cttcatgaca cttgtcaaca tataacataa tgaatatttt atattttatt tcattcagaa 36660
tgtaaattgc ttaaagacag aagcgtttgt tttgttcacc ctcgtatccc tagttcttga 36720
acactgccta ggttaaaggg atgcttatga gctgagggaa agaaggaagt aagggaggga 36780
gagagggagg aaggaatgaa gggcacaanc tttaaataat tcatcttcta ttanccttct 36840
tgggtattaa tcaaatttag gctcagaaaa agtcaatttt atatgggcta tgttatctgt 36900
atttagatta taattaattt acattttcaa ctgtgcaata tacnaggcaa gtatgatgct 36960
tatagttaaa gatcctctgt gagatcttta acacaactat taaaaaatgc nactataaaa 37020
aaagttgaag atgactataa aaaatcctta cgttatttgt tatatatgta acctttgtga 37080
tgcgtttatg tgtagcacat aaacaccagt agcatcggta gcatcctaag atgcagcttt 37140
tctcttcctt gggtataaat cttcatatga tgataatcac acaatttaat aaggccattg 37200
tccttcttgt cacccagagc caagcttcag agtttgcttt catatctctt ttgtgagtct 37260
tcccaaaccc aggagtcacc aagtttggtt gattaccttg cccctgaaaa cattatttgt 37320
ccgttcattt gggaattaac attggtttct ctaaactccc catagaatta atcttaccat 37380
ctttcccacc atgtttatag ctttaagtta ttttgcttta tatactagct ggatgtgttc 37440
acatctgttt ttctacaaga ctgttctttt ggttgttggt ggtggtgatg gtggtgtgtg 37500
tgtgtgtgtg tgtgtgtgtg tgttagctag gcattatata tcctctaatg taaaacaggc 37560
acttacccag tgttcattaa gttgagttta tacttcattt ttgggtcaaa taacttccat 37620
taagtgtttt atcatagtgt tagttttgca tacaccataa actatttcca gaaacctctc 37680
aaggagatat ttggatactt atttgttact aaaggtagag gcttatgtca atatcctgca 37740
acatgtttta tcatttgatt tgaaatcttg acattttatt tctattttca tttccctagc 37800
aggtttaatc agaggaggta atgatatatg tgactgaatt cagaattgac ttacatggat 37860
gattacagaa ttcatgattt aatgggatag tcctaaaaaa gcaaaggctt ttctgtttaa 37920
agtttctaat ttttaacctc atgaagtttt ctgttttatt attccaaagg cattttttaa 37980
attcccatgt tattaaagca ttctaatgtc agaatagata ccctattaaa aaatgaaagt 38040
ggtacatctt tatctttctt ttacatatgc aatcccaatt aaaattaaag tcaatatgtg 38100
ttttccttgc aaattaagac aagtttcttc ttcacttttt tttgttagtc ttgaattcta 38160
tttttattac actgtggtcc aagagaatgg ttgttttgat ttcagttatt ttgcattttc 38220
tgagagatgt tttatgtctg attaagtgtt gatgttagaa tatgtgctat gtgacaatga 38280
gaaaaaatgt atatatatat atgtgtatat atacatccac atatatacag tggaaagttc 38340
tgtagatgtc tatcaggtgc atttgatctt tgggggtttt tgccttaatg atctaatact 38400
gtcaaggtgt tgaaatctcc caatattatg cagaactgta agtctctttg aacatctcta 38460
agaacttgct ttataaattt gggtgttcct gtgtaaagtg catatatagt taggatagtt 38520
gggtcttttt ttattattat aaaaaatttg cagaatgtgc agttttgtta cacaggtata 38580
cacgtgccat ggtggtttgc tgcaccatca acctgtcatc tacgttaggt gtttctccta 38640
atgctatccc tctcctagcc ccccacctct tgacaggccc gtgtgtgatg ttcccctccc 38700
tgtgtccata tgttctcatt gttcgactcc cacttatgag tgagaacatg cagtgtttgg 38760
ttttctgttc ctgtgttagt ttggctgaga gtgatggttt ccagcttcat ccatgtccct 38820
tcaagaaaca tgaactcatc cttttttatg gctgcatagt attccatagt atattgggcc 38880
acattttctt taaccagttt atcattgatg ggcatttgga ttgattccaa gtctttgcta 38940
ttgtgaatag tgctgcaata aacatacgtg tgcatgtgtc cttgtactag aatgatttgt 39000
aatcctttgg gtatatatcc agtaatggga ttgctaggtc aaatggtatt tctggttcta 39060
gatccttgag gaatcgccac actgtctttc acaatggttg aactaattta cactcccacc 39120
aacagtgtaa aagtgttcct agttctctac atcctctcca gcatctgttg tttcctgact 39180
ttttaatgat caccattaaa ctggcgtgag atggtatctc attgtggttt tgatttgcat 39240
ttctctaatg accagtgatg atgagctttt tttcttcttc actttttaat cagcttgaag 39300
tgaatgcctt gttagttttc ctactaacgg tgctaaacct agcagtttta aagaccttcc 39360
tgttgaccac agtgcactct tggttcttgt aggcagggag ctggcttagg acctacatag 39420
catatttgga acaatggctt ctggttcttt aagtgttaga atttgtgtgg ctgagaaaaa 39480
aaaaatagtg atattttccc tttgcatgaa ttaaatattt tacctgcaaa gttgcttgtc 39540
ttttataaat tatttttctt ataagtaatg ctacttaaaa tgctaaactt attccttgtg 39600
aaagtctgtt ctattatgat acaaaaattg tagatagctt ttattgaaat aatatttgac 39660
attttcctcc acagattgtt ctttaaaata tttgctttgc ctaataatgc catgtaaaat 39720
ttatttttag ggggatagtt cctatgtgaa agatcgctgg tgtgtttttg atggatttat 39780
ggtcttttgc ctttgggttt ctttggtgct acaggtaatt aaatattttt taaattacaa 39840
gcaggtattc tccaaaatgg gnaattattt tgcattaaaa ngtctaaata gaaantatta 39900
canaaatata tatcaaatgt ngattgtgta attgcctaca acattttnat tttnnatttt 39960
tattttaaca gatgtgatta gtctgtttac tctgacatat ttgaaatttg aaaaattaat 40020
tttaattgat acgtaatact tgtatgtatt tatgggggac tgagtgatat ttgatgtata 40080
caaggtgtaa tgatcaaatc tgcataatta gcaattttat atcacctcaa acattttatt 40140
gttagaaaag tcaatagctg taatatctta attattgtca gttatgattg tgaattattt 40200
ctcaatcaga aacgaaaatc aatactatag aaaattatta gctgttaatc agatataaaa 40260
tatattccct gaaatgaagg aaacaatgtg gagcaatatt tctgtatttg taaataaaaa 40320
attgaactta aaaatttaaa gtctagtctc cccatatttg gataggtatt agccaacata 40380
aaatactata ttgcaaatat taaatgcttt attataagtg atggggaacg tacattaaaa 40440
agacttacag gacagatttg attggaaaat aagtagaatt aatttctgtg cattcattca 40500
gacatgattt tgccttttaa ttcaactaaa gttactatat tctattgatt tgatttgatc 40560
tgttttgatt tggttgtggt aagaatgcct aacatgaaat ctactgtttt aatgaatttt 40620
aattgtacaa taaattattg ttaactgtag gtacaatgtt gtacaggtct ctagagttca 40680
atcatctatt ctttatttaa aaattcagaa ttcaaaactt cacagcccat tctgccaact 40740
catcatagtg tttgttgata agctttcctt tcatattttt ataaagttca cctctcccac 40800
aatttaattt catcactcat atattttttt aatcagcttt gtcaggttga attgtttctc 40860
acattaatgt gttcttttcc atttaataac tattatgtga ttgacaaaca tttcaaatta 40920
ttattttgcc tgttagtaaa tagtgcaatt cttttttaat attttaaccc tttctctatt 40980
actttatttt ctagatattc aaaagcctcc actaaagaac gttattaaca agaaagacag 41040
catacttact atatattcta agttggcact tcttgtaact aaaaactgtc ttaacgaacg 41100
agacaggnaa atgaataaga ttaatgttgt tcttattagt ttatgtattt gtttctgtta 41160
agatagctat agcttcaaaa tatactcaaa agaaagtgga ttttggtgga aaataatgta 41220
tggctaaatt cagagtagag gtgcacctac ttatgctgct aacatctgta tgttccatga 41280
ctataagcaa tgctaaggga aaatccaacc tcatttaccc atcttttaat ttgtaggtgt 41340
ttgaaattgc tgatatagtt gatcagatgt caccttgggg catgttgcgg attccacggc 41400
cactgattat gatccgagca ttccggattt atttccgatt tgaactgcca aggaccagaa 41460
ttacaaatat tttaaagtga gcgctgcttt acaataagtt aagaggaaaa gtttatgaag 41520
ttttttgtaa gttttatgta ctttacctac ttttgtttct ctaggcgatc gggagaacaa 41580
atatggagtg tttccatttt tctacttttc tttctacttc tttatggaat tttaggagtt 41640
cagatgtttg gaacatttac ttatcactgt gttgtaaatg acacaaagcc agggtaagtt 41700
tatctattaa ctgcatttta atctagttga ttaacaaaga tatctctgta attttcataa 41760
gaataacctc tatgtcagat tttttaaaca gtgcttatgt cctctttgtt ctgtgtctct 41820
gcttcctcgg tattgttttt gtccaatttt tattttattt tattttattt tatttttgag 41880
atggagtctc gctctgtcat gaggctgggg tgcagtggcg cgatctcggt tcactgcaac 41940
ctccgcatcc cgggttcaag cgtttctcct tcctcagcct gccaagtagc tgggactaca 42000
ggcgtgcacc accatgcccg actaattttt gttttgtcca atttttaaag acaagtattc 42060
aagacaggac agattggaaa atgtaacctg gtggaaaagt agattaagca aatgcaaagt 42120
gtacatttag aaaccttagt gtggcaaaat ggggagtgtg ctaacataat aacataaacc 42180
tagagcttca ctgtggaagc ttttcatatt agaatgagtt acatgttcgg gaaaaaaagc 42240
tcatttttat tattatttac ttttgtcatc attccctaaa atagtttcct aaatgattat 42300
aacatcattt ctagactaaa cactattatc tgttgcattt gactgttgta gggttggtgg 42360
gtaagataga atgtatgtac tttaattacc tattatgtat tatgcaatag agcacctgcc 42420
tcttctactt ggctgatcat tgttaatata caactccagg gatgtgatgg caggagagag 42480
cagagtggga tgttggcccc tggatggtcc agaagtgtcc cattaggtgt tagctagata 42540
tagagtttgg ggttccaagc acaacccaga angtgcaaca gatatgacta tgccagattt 42600
cagggcagca gggattgggg ataatacaat tgattttata ccttatattc aaatcttcac 42660
ataggaattt gtctatttat aaatgaagaa ctcatccata aattaccgat tgaaaaatct 42720
tgattcaaat cttagaaatt agatttaaag cactttgtaa aattcaaaaa gagattacaa 42780
gcagccattc atcttcaaaa tatttttaat atatcaatat ctacttacaa accaattggg 42840
tatataagga tcattgagtt taaaaacatt gaaagggtta tgttgtgttt tctgcagttg 42900
gaggatttct ttttcataaa gtctatatac ttgtatatat acaaagtaaa taaaccacaa 42960
ataagtgaat atctctgtga gtatagacat catgataagc ttggctcaat tccaacactt 43020
tattttatga gtttgcataa attatttagg ttactcctca atgaagtaga ttaataacag 43080
gacatacttt ctagaggcat caggaagagc aaatgaggga atgaatgtaa agacaagcaa 43140
agtaaccagc acatagtaaa ggcattcact gtatgccagc tgtcattatt ttgttgtcat 43200
aaagagatac gtaaacacgc ttacatgctg aggtggtagg cataagtgta tcctccaaaa 43260
tagagataac atggttaaaa aaaaggaaag agcaataaag aagaccaaaa tttaaacttg 43320
taagagtgtg aaaggaaaac atctatgagt aactcatggc tatgttattt tactgacaaa 43380
gtaactaaat taattctgag tttatttcac atttataatg gtncatttaa ttattagtct 43440
ctcacagaaa taaatttaat aattgaattt ctaattcatg cacaaacagt atatgtatat 43500
tatgcaactc ctaataatta tataatgttc taaaaactaa aagtgaattt agttgtttgc 43560
tgttgcacca ccccaaagaa tgtcaactcc aaaaaggtag agattttgtt tccacgtgtt 43620
ttcagaccag gaggcatgtg caagtttcta ggaaaatatg aatgtattca gtaacttcaa 43680
aacatcagta taatttcact ggttaaatgt taaacagtaa agcataatct attagtcaag 43740
gccttaatta attttatttt tatttagaag gcatgcatct catacctact tagaaattta 43800
ccagaggggg ctgtgcacag tggctcacac ctgtaatctc agcactttag gaggctgagg 43860
agggtagata acctgaggtc aggagttcca gaccagcctg accaatacgg tgaaaccccc 43920
tctctactaa aaatatgaaa attagccggg catggtggca caggcacctg taatgccagg 43980
aggcacctgt gatcgggagg ctgagacaag agaattgctt gaatccagaa ggcggaggtt 44040
gcagtgagct gagatcgcgc cactgcactc cagcctggac cacagagcaa gactccgtct 44100
caaaaaaaaa aaaaaaaaaa angaaagaaa tttaccttag gttcacagaa gtgtggacag 44160
ataccatgcc ttccttgatt atccatagta ttatgttgaa gtaaagatct cattttttct 44220
tgttttttaa tataactttt atttttgcat gatgtgagtg aataatctat tcaaaattat 44280
ttttaaaaga aaaatactgt tgctactaac cccactccta atcttcatta ttattgttca 44340
aaatagcctt ggaaaataac tttttgataa ccattttctg gacatattat tattttcccc 44400
tattattgaa attatgtctc tactttaacc actttattga gattttggtg aatataaaaa 44460
tctttacata tttattatat atgtcttgag ggaactattt cctttttctg tcagaattaa 44520
atccagagag taagttattg catttattat tctacttcct gaaaattatg atccttctca 44580
aattaacttg tatatttctt atgaggtact tcctgaaaat aatgatcctc ctcaaattaa 44640
tttgtgtatt tcttatgagg tacgggtcaa gatgtagtct taacttagtg gttggaatgg 44700
acatcggtat cttaggagaa gctctcagta tttccgttaa gtgggatgtg agctgtagag 44760
ttttcaaagt gaggaagtta cctttaattc ctatagtgcc aagagttttt gatcattgat 44820
gtatgctaaa ttttgtccag tgcttttccg ttttgttcag ttaatgtaat gaattacatg 44880
attgactttt taaatagaaa ccaatcttgc atttctggta tattgctaat ttggtcatat 44940
tgtattcctc tttatacatt ggaagatttg atttgctaat gtttttgtta caaattattg 45000
catctttgtt cacaaggagc attattttta ggttttttaa attgaaatat ctttaccggg 45060
tcttgaaatc cgggtaatgc tgtcctcata aaacaagtgg aacatgtttc caagggttaa 45120
tataagattc atattctttc tttcttaaat gtttgataga attcatgagt aaaactcagg 45180
gcctgaaatt ttctttgtga gaacgttttt cattacaaat taaatgtatt caacttacag 45240
agctatggag ttgttatctt tcttgttctg ttaagttggt aaattttgct tttcaaagag 45300
cttacctatt tttataattt gtcaatattg cataatgttt atacaaatgc cctctgatta 45360
tcttttgaat gtctgattat ctttttaaca tctgtagaat agtggtaata agccattttt 45420
tcctgacatt gataatttgt acctttctct ccattttttt atgtcttctc aattgtatta 45480
ttcttttcac acacacacaa gaatctttgc cctatttaat gttctctatt gttagtctgt 45540
ttttcatgtt gattttttat cttcattatt tccttatttc tgctttttag tttttgtttt 45600
ctttttcatc tttcataaaa tgaaggtata tagacatctt ttaacatttt tctaatacaa 45660
taatttaaaa atataatttt cctctaagca ctgttttagc ctctaagcac tgttttagct 45720
gcatttccaa aatgttgata tgttgtattt ttattattat tcaattcaaa tatcttctaa 45780
tatatgtgat ttctcctttg acctgtaggt tatttagaag tgcattttta gaaggatgag 45840
attttctaaa aatgttattt gggtgcataa ttttattctg ttgtggtcag acaatagtcc 45900
ctgtgaaatt tcagcctttt gaaattcatt aggaatcatt ttaaggacca gtatatggtc 45960
tgaattggtg aaaattccat gagaatttga aaagaaaaaa gtgaaatctg cagtttttga 46020
gtataatatc tataaatgtc accaaagtca agttggctga taatttgttc tgggtatttc 46080
tatccttctt ggtttttaaa atcagggttg ttctagcaat tgctgagaga gtactattca 46140
attttctaga catgacagaa attttcaatc tctcttattt ttgtcagttt ttgctttcta 46200
taattttcaa ctttaattag gcgcataacg tgtcattgta tctttcagat gggctgacct 46260
ttttatcgtc atgaattttg aatttttttc ctaattagct tcgggatgcc agggtatatg 46320
atgggtcaag aacatgacgt ttcaaatttt tcagtaatca taactctaaa gtaatgtgta 46380
actctaaaat aatttatttt atttaatcat cttttatctt attaatcaat tgatttgttc 46440
ccacaattac ttacgtgtac tttagaccat tcctggattg acagtaaaag ggagcacatg 46500
acaaattctt agttttagag catgggctgc acaatcctga gcccagcctg gtggtgatga 46560
aattaagccc agtactaaga gcgtaaatga agaagaaact cagtagtaag agagtgtgga 46620
ccaactggtc agatgctcta atcagcaact ctcattccac tgtcaaaacc ttggagattt 46680
tgtatgtttt ttaaataggt gaagtgaatc aagtggtgcc taccaaattt attttgtcct 46740
ctgcatcagt gcgtggcata caacattaac aatgagaagc aactaactcc tataagctat 46800
tttgggggaa tagaggatgg tacaaatatc acaactttac agcaaatatt acaactcctt 46860
caaaacacag tttggcagtt tttaaaaaaa taaaaataaa agagttgatc aagctgggta 46920
cagtggcaca cacctgtaat ctcagcactt tgggagactg aggtgggatg atcacttgag 46980
cccaggagtt tgagactaga gtgagctatg attgcgtcac tgcactccag cctgggtgat 47040
agagtgagac ccagtctcta agaagtaaaa atgaaagaaa gaaaaaaagt tggacaggca 47100
cctgccacat ctcatttatt ccactccagg tatttaacca aaataaataa aaatgtatgt 47160
ccatagaaag atttacacat gaatgcccac agcaacttta ttcatagtac tccaaactgg 47220
tgacaaccca aatttccatc aacagataga taaactaatg atggtatatc catataataa 47280
atactgttta ataataataa ataatgaact attgatgtat acagcatctt ggataaatct 47340
caaaataatt atgatgactg aataaagcca gatttaaaaa gaggacatgt tctattattc 47400
catttacata aaattctaga aaatgcaaac ttatctttaa tgatagaaaa gaaatcagca 47460
gttgcctagt gataaaggtt gtggtgggaa ttaagggatt acaaaggggc ctcaagaaac 47520
ctttggggtt tattgacatg ttcattatct tgactgtgct tctgtacatg tgccaaaact 47580
tatcaaactg tacactttcg tatgtgcagt ttatgttatg tcagttacac ccactgaaac 47640
tgcttaaaat gtctcagtgt gaagtagaaa tctaattttt catatggtta agcaattgtg 47700
cctgcactat ttattgtgtg ctattaccca ctgagtttag tttcacctgt ctcattcact 47760
aattccctgt ctatacgtgg gtctgttcct gtggggctct gttgtgcttc actggtctat 47820
tggactacct ctttgccaat atcacactct gaaagtcttt cagattacaa tctggcttta 47880
cacatggggt catatttcca gctttcagct ttacatgggc tcaagacctg gtcttccgcc 47940
tcacatgggc attaaaaccc aggcattagc tcccattcat aacactatgt caactcatgt 48000
tccttctgtt cctactcatt tactgctttc cttcttatgt tttgacattt tggaatgcag 48060
gttttgtatt gtgagcctaa atgcggagtt tttaatgcta tctatttgtt tgtagtggaa 48120
ggagttgaat ttggtgtagt ccatcttgcc acaaccagga ctcacatcca tagctatttt 48180
tttttctatt tttgtctaag gtccttgagg acacgtatga gaaaggtaaa gaggatattg 48240
tgttatattc atctttttat ccttactacc tagtatccta acacagaata aataattagt 48300
aactatttat tgaaggcatg gttgagaaca tattctattt agacagataa tattaacatg 48360
atgacaaatt gataaagaag atgaaataaa aaagaaacag agaaaagtaa gttgctaaaa 48420
gcaggaaagg agaaatggct aaaaaataga aaaacaaagt ttaagcagaa agaagcagtg 48480
aattagttca tatacggagt aagaaaattg aagcaagtgg tgagtaaggg agttgactgt 48540
gtgggtgagg gaagagacaa atgcatggaa gaaaatctgt aggtagttgg atttattttt 48600
ttagtgtatg taggctgtag aatatgccta gattgttcta tgagtgaata tgaaaatgga 48660
aaaagatatt gtgtgggttg gagacaatca atatggagat gaagaacagg gaaatcttct 48720
ggataagaaa gcagctgtgt agtactgcag tgggtacaga ggctggcttc aaattaccgt 48780
tttattaaaa ccaagtcaga atgtgagagt tataaaactt gtaaatgcag ctagaagatc 48840
aggcattatg ctggcaaacg aaagctcata ttggcacata aatgatcgca gaaattgaga 48900
acagatacac gaatgtcttc tgaactcatg accctagagt tgcttcagta agtattcttt 48960
gctagttcca cgctgtattt ggtaccaaga aaagaatgat actgaaaaaa tgcatgaaaa 49020
catgccttgt gatctaaata ttagctccag ctcattactt tattctaaaa atgaagttca 49080
ccatgaaaaa tttcataaat gttgacagaa tgcttagtta cctgagacat agccattatg 49140
gtgaaatggc tgcatttttc tctttcccat atgtgtaaaa cctgcctagt agcatacaca 49200
cacacacaca cacacacaca cacacacatt tattttgtct tctttttatg tgactctttg 49260
tttactattt aagaagaaaa tgcttaacta gccacatggt agtaatgttg ctcataatca 49320
caactgttat agctttgata attcatttca agaatctatc aataatatct tttttgttgt 49380
tgtttttttg agacagactc tcactctgac acccaggctg gagtgcagtg gcatgatctc 49440
agcttactga aacatccatc tcccaggttc aagagattct cctgcttcag ccccccaagt 49500
agctgggact acaggcgtgt gccaccacac ccgggtaatt tttgtatttt tagcagagac 49560
agggcttcat catgttggcc aggctggtct cgaactcctg acctcaagag atctgcctgc 49620
ctcagcctcc caaagtgctg ggattaaagg cctgagccac catgtccagc cttattttta 49680
aaaaaaaatt tcagttcaat attactgcat tttaaagccc cacacataag cagaaaaact 49740
gtcagcacca ttttaccgtt actattagcc cagacataaa tgtagtttta ctcttagaga 49800
ctcaagaaat atccaaactc aaaataaaac agaaaatgtt aattgatttg aaaattttta 49860
aacttttctg tttccttttg tagcctctaa actatgactt tttttgctgc tataaagaca 49920
catgcacacg tatgtttatt gcagcactat tcacaatagc aaagacttgg aaccaaccca 49980
aatgtccaac aatgatagac tggattaaga aaatgtggca catatacacc atggaatact 50040
atgcagccat aaaaaatgat gagttcatgt ccttggtagg gacgtggatg aaattggaaa 50100
tcatcattct cagtaaacta tcgcaagaac aaaaaaccaa acaccgcata ttctcactca 50160
taggtgggaa ttgaacaatg agaacacatg gatacaggaa ggagaacatc acactctggg 50220
gactgttgtg gggtgggggg aggggggagg gatagcttta ggagatatac ctaatgctaa 50280
atgatgagtt aatgggtaca gcacaccagc atggcacatg tatacatatg taactaacct 50340
gcacattgtg cacatgtacc ctaaaactta aagtataata ataataaaat aaaataaaat 50400
aaaataaaat aaatttcaaa aaagtcaaaa aaagaattcc ctgtgtaaga acattcaaag 50460
tgaaaggagc atcataggga aaagacaaac cgtgaaagca gagaaatagg agacgccaca 50520
tcaagacacc accatgctta caagttggca ttttattctg aagaccataa tgaactgcca 50580
aagaagctga aacctaaaat aaaattattg tttttacata taaagatgat ttttcacatc 50640
tatatttatg atctcacctt ttaaatcagt atctactttt gaaaatgtac atgtaacctt 50700
caacatatac acagaaaata agataaacta atttatatag ttttgtttca atcctacaca 50760
attagagttg atttttactc catatttaga tttccagaat cccagctcat taatttaata 50820
tttattaagc ataaaagctt taagacctag aatgcatggg acgtggaatt aagcactagg 50880
gataaaagag gaagaaaaaa ataggtcatg tcctggagga gctcacactt gaggcagcca 50940
aagattaatt accttaggca ttgattagta ataataataa taattagtta gaaagtgtta 51000
tcagatgtca aaaaagagag aaaatgtgag ttttatagtc tttgtaaaga atatgacctt 51060
tgagcaaact ctagaattag gaatggagtg tttgaattgg aaattaaggc aggataatac 51120
ctttcagatg aaacaatgta atagagtact aggatgtata atagaatgct ggccccaaac 51180
tgggatggta gatttaagtt gtgagtttct ttctacaact gcagagtcca ttgaataaat 51240
acaactttat atattaaaat taaaaaaata aaaaaaaata aaaaaagaaa ttctgtcatt 51300
tggaataaca ggaatgaatc tagaggacat tatgctaagt gaaataagcc aggcacagaa 51360
agatcaatac tgcatgatct cacgcatatg tggaatccta accagttaat tcattgaagt 51420
agagaggaca atggtggtta tcaggggctg cggcgagaag gagatggagc tgcaagggaa 51480
tgaggagctg ctgatcaaag ggtacaaagt ttcagctagg cagtaagagt aagttttgag 51540
atccatgcac aacagggtga caatggtcaa taataatgcg ttatatatgt caacataact 51600
aagaaagtaa atttcaaatg tatcatcaca aaaaagttaa gtgatatgat ggatatatta 51660
attggcccga tgtaaccatt atgtcttgta tacatacatc aaaacatcac atggtgctgc 51720
attaaagtaa tacaattatg atttgtcaat taaaatacta ttatttaaaa aatgtattat 51780
acacatctcc gagtcacata ttaagctaag gtatgatggc tgtgttttca gcaatcagtg 51840
ttaccagcta ctgccgtgac ctcatttctc ttaatcattt aagagaaacg attaagagaa 51900
gttgttaaca attgttccaa gttctgccta attgatttgc atgtattata gcctaatcat 51960
gacagagatt tcagaccaga aacttgcata tcttgggttt catagttgac ctccagaact 52020
gattgtgttt aatatgtgag gcaaacaaga taaagaagca acacaatata tacagttttg 52080
cttttaaatg gaacttagtt cctgtaaggc ccaatagcag gaaatcttag ttatgtcttc 52140
agtagcagta ctagtaaagc tttagattct tctctgttaa tgaatggaga cctaaggcaa 52200
ttatgaaaag agtaatgaga tttgactaag caaagcagct catttcctaa agaaagttga 52260
ggagagcaat ggcttgtagc agaaacaggt gttgtgaaat accaactgtg atggcagaaa 52320
tctccccgaa gctggaacag gaatgtttaa aaatgagctg gcaggttaaa tagaaaagat 52380
gaagacttac ctgacacctt attatcattc ctgaaaaaga agggaaacat attcatagct 52440
cggtatcaaa taatgaaatc ttatttccaa gagtgagata attagaaaaa ctttaaggta 52500
agtaagtgta accattaaat atatgaaagt ttaatataga gagagcagga ttcaaacagg 52560
aactcaggaa catattcgcg atggctggac cactagcttt aagcccagag gttgggtgat 52620
cacacatcac agatgcccag gacaatcttg gcttatccct actgtttcaa agtaatcact 52680
aacagcctgt tattcgattt taaggaatct caatgtagac aatgcatttt atggtcacct 52740
tgcccagggg aagtttatag aacttggtat tttataaaat atcaccaaga gttgaattag 52800
agataatata aagttggatt tttttgcagt ttgctcttgc tggtccaaat acattttaca 52860
tttattaaaa taaatacatt aaaatttatc aactaaatta aaatttattt gtcacgtatt 52920
ctttagggta cttggcaaat aagtgaagta ttgtcttata aattttgttg acaaaataaa 52980
gaggtttttt catggaatgc tatgcagcca tgagaaagaa tgagactatg tcctttgtag 53040
caacatgaat gaagctggag gccgttatcc taagcaaact aacacaggaa gagaaaacca 53100
aataccgctt gttctcactt atgaatgaga gctaaacact gagtacatac agacacaaag 53160
aaggcaacaa cagacactgg agcctacctg agggtggagg atgagaggaa ggtgaggact 53220
gaaaaactac ctatcgggtg ctatgcttat tagctgagtg gcgaaacaat ctgtacgcca 53280
cgctcgcatg acacgcagtt tacctatata acaaacctgc acatgtatcc ctgaatctaa 53340
aataaaagtt aaaagaaaaa gaaatacaaa tggaaacata ctggaattta gagcattaat 53400
ttttaatttc taaggacttt atcaagagac agttttgtag aatatgtaaa atcataattg 53460
ccccaaattc atgcaacggt ctatgacgtc ttcttgattc ctatgtattt atttatttac 53520
atatgtttat tgacacaata gatgtnaagt atttttggag tacatatgat atttcgatac 53580
attgatgtaa ggcataataa tcaaatcagg gcaattggca tatccatcac ctgnaaacat 53640
ttttcttaat actgggaaca tttgaattat tctctactag ctattttgaa atatgtaata 53700
aattactgtt tactatagtc accctactga tttatcaaac gcttaggtct tatttatttt 53760
atctgactgt atttttgtac ccattcacca acctttcttc atccaaccct ggcctttacc 53820
cttccccttc tctggtaaca accaatctac tttctatctt cataagatcc acttacttaa 53880
ggcctaaata tgagtgagat catgtgatat ttgtctttct gtgcttggct tatttctttt 53940
aacataatga cctccagttc tgtccatgca gctgcaaacg tcaggatttc actcattttt 54000
atggctgaat agtattaaca ctgtgtgtgt gtatatatac atatcacatt ttctttatcc 54060
atttatccat tggtgggcag ttaggttgat tccgtatttg gctatttgga atagtgctgc 54120
agtcaacatg tgagtgctgc tatctcttaa atatatagat ttcctccctt ttggatatat 54180
acccaatagt gaaattgctg gatcatagag ttgttccatg tttagttttt ttcagtccgt 54240
actgtttttc acagtggctg tcagaatttg cattaccacc aacagtgtat gagtgttcct 54300
gtttctctac attctcacca gcactcactg tcttttttat aaaagccatt ttaacttggg 54360
gtgacatgat atttcactgt agcttttatt tgcatttccc tgatgattag tgatgttaac 54420
catttttata tacctacttg ccatttgtat gtcttctttt gagaaatgtc tattcagatt 54480
ttttgcccat ttcttaatca gattattaga tttttcccat tgagttattt gagttcttta 54540
tatattctgg ttattaatcc tttgtcagtt gaatcatttg cagacatttt cccttattct 54600
gtgggctgtc acttcaattt gttgattgtt tcctttgctg tgccgaagtt ttgagcttaa 54660
tgcaattcca tttatctatt tttgctttag ttgcctgtgc ttttcagatt ttgccccccc 54720
aaaaatttgc ccagtccagt gtcctggagc atttacccaa tgttttcttc taggagtttc 54780
atagattcag ttcttagatt taagtcttta atcctttatt atttgatttt tatatgatga 54840
gaggtaggag cataatttta ttcttctgca catggatatc catttttccc agcaccattt 54900
gttgaagaga ctgtcctttc cttaatgttc ttgatacctt tgtcaagaat gaattggctg 54960
taaaagcatg tatttatttc tgggttttct attccattcc attgggatat tttctgtttt 55020
tttaccagta ccatgctggt ttggttgcta tagctttgta gcatattttg aagtcagtta 55080
gtgtgatgcc tccagctttg ttctttttgc acgagattgc tttggctatt cagaatcttt 55140
tgtgttttaa tataaatttt aggatagttt tttatattcc tgtgaagaat gtcattggta 55200
ttttgataga gattgcattg aaactgtaga ttgcttcggg tagtgttgac attttaacaa 55260
tattgattct tccaattcat gagcatcgaa tatctttcca ttttttgtgt ccacttcaat 55320
ttctttcatc agagtgttat agttttcatt gtagagatct ttcacttctt tagtcacaat 55380
tattcctagg catttttaat tttttaataa atattgtaaa tggcattgct ttcttgattt 55440
atttttcaga ttgttcactg ttggtgtata taaatgctat taatttttgt atgttggttt 55500
tgtatcctgc aatttactga gtttgcttat catttctaac agtttttggt ggagtcttta 55560
ggattttcta agtgtaagat catgtcgtct gcaaatgagg ataattttat ttcttccttc 55620
ccaatttgga tgtcgtttat ttctttctct tatctgattg ctctggctag aacttccagt 55680
agtatgttga ataaatctga tgaaaatggg tgtcctgatc ttgttccaga tcttagcaga 55740
aaggctttca atttttccgc ctttggtatg atgttangcc atgggtttgt caaatatggt 55800
ctttattgtt ttgaggtata ccccttttat actcaatttt ttagtgtttt gataataaag 55860
acatgttgaa ttttaccaaa tgctttttct gcatctattg aaataataac atggtttttg 55920
ttcctggttt atttatgtaa tgtatcatgt ttattgattt ccatatgtta agccatcctt 55980
tcatttctgg gaggttaaat aatatgtcca gatggtaagt aagaaagcca ggattttaac 56040
tcaagtctaa cttccaagcc tatgtacgtt ttaccatttg agaaacttct gtattttaat 56100
tctacattca taaacctata gacatataga gatccacatn ccatatgtat aaactgtttn 56160
ataatatatg tagtataatt tnctnacatt aaagtttttn attaangtct ggtttctant 56220
ccctatgtat atgnttatgt ttcatgggat tcgacttnca tctaaatnct ataaactagn 56280
tgatatattn atatattttt agtactatct atatatctct tttnaaaatt gttctgcaca 56340
ttgatctcca agatgtgaac cacctgaggt gccagaaacc agcctttcat atgataataa 56400
tattaataaa gtaaatataa gaatatattt cagaataaat tgaactttca gatgaaaatt 56460
aataccagca tgatttttac cagaatagca aaaatgtttg tgagagtctt cagtatacca 56520
aaagaaaacc atgcagtttg aatgggggtc taaaaggaaa ngtaacttat tttgatccat 56580
cttttgatca tatgtttact tcccaaaaag aagataatgt aatattatag gttataagat 56640
tcttattttt agtggtaaat aacttttatt gaacaattgc tgtatgttat tttctcactt 56700
aatacttata acaacccgat aagttatgtt ccatttttac actgtatatt acagccaagg 56760
aaattgaagc tgagtaaagt taaacaaagt ggctgagatg aaacagcttg tatcagaagc 56820
aagactagac ccatttctcc ctcacactgc tttctatgct ttcagttgta acttgttcag 56880
tgtatgagat aaccttcctt caacatgtgt gtccaaaatg tttgaataaa atatttagtt 56940
ttcctttagt tacaaggagc ctattcttaa aagacaagtt ctcagtggga cgcatgagta 57000
agtggttaat tacgattgct tattttaaga ctgaattcta aaggcatgca ctggaacttc 57060
tgaacatcct ctgtgagtgt ggaatgagga gctctaccta ttctgtccct cacaaatagt 57120
gtttactgta gccgcctcca cagaatcgat atttactatc acttttgtat ctcaggttcc 57180
acccaaccag cttggttttc cccatgatag aaaccataat aagtatgcat aactacagca 57240
gcaccaagag taaattttng aaaattaatt tttaggatga aatctctttg gtaaagaaaa 57300
tcacctggca aaagttgtaa aaaatactga ttccaagcca catttgtgat tcgtattttt 57360
aggcaaggct gagattctca gaattggcca ggttagaaat caatcgttta aaattttagt 57420
tttgcaatta aactccaaaa gatatgttat agagtagaac acaaaattac atggcttttt 57480
aaaaaaatag accttgagtc ttcaaagaaa tgttagtctt ctagctagct gcttactgcc 57540
ctgcccaagg gtagcatgcc tgtcctcttc ccttaagact atttccccag aaatgtccaa 57600
ggagcaccag aggtaattag agcctcctgt ctttcctgca aagaggcagg tatgtctttg 57660
ttttctggga cggacaacca tctcaatttt atttatttag tgactcttac atgttcttat 57720
ttctagagat tgaattgggc tggtgtactt tgtggttgag tgtggttgga gtcgtcaggg 57780
gcattggcac ttttaaaatc cctcactgac tttacttttc gtgttcacat cattggggag 57840
tttgtaaatc cattctttca ttgctataaa gaaatacctg aaactggcag ggcacggtgg 57900
ctcatgcctg taatcccagc actttgagag gtcaagacgg gcagatgact tgagactagg 57960
agttcaagac caacctgggc aatatggtgg aaccccatct ctactgaaaa tacaagaaat 58020
agctgggaat ggtactgtgc acctgtgatc ccagctactt gggaggctga ggcacaagaa 58080
tcgttggagc cgggaggtga gggaggttgc agtgagccga gatcatgcca ctgcattcta 58140
gcctgggtca cagagtgaaa ctccatcgaa ggaaggaagg aaggaaggag agagagagag 58200
agagagagag agagagagag aggaagagag gaagagagga agaaagagaa agaaangaaa 58260
gaaaaaaaga gagaaagaaa gaaaaaagaa aggaaangaa aaagagaaag agaaagaaaa 58320
gaaagaaaga gaaagaaaga aagaaaaaga aagagaaaaa gaaaaactga gactgggtat 58380
cttatttctt ttattacatt tttgggtcct atatttgtat catacagaat gagttctgta 58440
tatttttcag atggaaaaga aatattgact taaaaggtac ctctcaaatc ttaatgtgta 58500
caataaactg gagatcgtgt taatgtagat tattttttca gaagatctgg aagaaagcct 58560
cagtttctga atttttaaca agctcaccag taatgtcaat gtttttggcc aaagaagaat 58620
attttgtcaa aaattcagta agtggaagag cctgtgtttc tttttctagt ttttctggct 58680
tgtaaacaaa gatgagagtt ttcatttacc aaagacagat atatgcaaag aaaacctaag 58740
aaagaagggc agctgccaga ttaaatgtga tggtttatgc acatcagctg cataaagata 58800
cctaataatt aagagaaaaa taattaactc tgtagtgcga cagtctgtca gagagctctt 58860
taaccaagtg aatcataaac attaactgca ctaggacaaa tttttatgan tgtgctgatg 58920
cacacagaag gacgcagcat cactgctgtg atattgcccc ctcaaaagta cattatagtc 58980
taaatttaac cataaagaga catcagtttt atgcgaagct caagatacac gtatctttca 59040
tgttctgtaa tttgtaatgt tgattttaag tagtctttag caccctaggg agcaagcatc 59100
tcctaataat ttttttcaga actttctggg taataaatgc catcctgttaaataagtatt 59160
ttctactttt tttcctgctt tgtatccatt tattcacttg tttgcttttt aaaaaatttt 59220
tactttaagt tgtgggatac atgggcagaa tgtgcaggtt tgctacctag gtatacatgt 59280
gccatggtgg tttgctgcac ctgtcaaccc atcatctatg nttttcagcc ccgcatgcat 59340
tagctatttg tcctaatgct ctccctcccc ctgcccctca ccccgcgaca gaccccagta 59400
tgtgttgtat gttctcattg ttcaactccc acttatgagt gagaacatgc gctgtttggt 59460
tttctgatcc tgtgttacgt ttgctgaagg tgatggcttc cagcttcatc catgtccctg 59520
caaaggatat gatctcattt ctttttatgg ctgcatagta ttccatggtg tatatgtccc 59580
acattttctt agtccagtct atccttgatg ggtatttggg tggttccgtg tctttgctat 59640
tgtaaatagt gttgcaagaa acatacgtgt acatgtatct ttatagtaga atgatgtcta 59700
ttcttttggg tgtataccca gtaatgggat tgctgtgtca aattttattt ctggttctag 59760
atccttgatg aatcatcaca ttgtcttcca cagtggttga actaatttac attcctacca 59820
acagtgtaaa agcgttccta tttctccaca tcctcgccag catttattgt ttcttgactt 59880
tttaataatc gccgttctga ctggtgtgag atggtactgc attgtggttt tggtttgcat 59940
ttccctagtg atcagtggtg ttgagctttt tttcatgttt tttggctgca taaatatctt 60000
cttttgagaa gagtctgttc atatcctttg ttcacttttt gatggggttg tttctttttt 60060
tcttgcaaat ttgtttacat ttcttatagg ttgtggatat tagacctttg tcagatgggt 60120
agattgcaaa aattttctcc tattctattc tgtaggttgc ctgttcactc tgatgatagt 60180
ttcttttgct gtgcataagc tctttagtac ttctagttta attagatccc atttgtctgt 60240
tttggctttt cttgccattg cttttagcat tttcatcatg aaatcactgt ccatgtctat 60300
gtcctgaata gtattgccta agttttcttc tagggttttt atggttatgg gtttaacatt 60360
taagtcttta atccatctcg atttaatttt tgtctaaggt ataaggggtc cagttttagt 60420
tttctgcaca tggctagcaa gttttctcag caccatttat taaataggga atcctttccc 60480
cactgcttgt ttttgtcagg tttgtcaaag atcagatggt tgtagatgcg tgatgtgatt 60540
tctgaggtct ctgttctgtt ccattggtct atatggctgt tttggtacca gtgccatgct 60600
gttttggtta ctctagcctt gtagtatagt ttgaagtcag gtagcatgat gcctccagct 60660
ttgttctttt tcctaaggat tgtcttggtt atacaggctc ttttttggtt ccatatgaaa 60720
tttnagggta gtttttttct aanttctgtg aagaatgtca atggtagttt gatgggaata 60780
gcattgaatc tataatttat tttgggcagt atggccattt tcatgatatt gattcttcct 60840
atccatgagg atggaatgtt tttccatttg tttgtgtcgt ctcttatttc cttgagcagt 60900
gatttgtagt tctccttgaa gaggtccttc acgtcctttg taagttgtat tcctaagtat 60960
tttattctct ttgtagcaat tgtgaatggg agttcattca tgatttggct ctctgcttgt 61020
gtatttttgg tgtataggaa tacttgtgat ttttgcacat ccattttgta tcctgagatt 61080
tgctgaagtt gcttatcagg ttaaggagtt ttcgggctga gatgatgggg ttttctaact 61140
atagaatcac gacatctgga aacagaaaat ttcacttcct ctcttcctat ttaaataccc 61200
tttatttctt tctcttgact gattgctctg gccagaacat ccaatactat gttgaatagg 61260
agtggtgaga gagggcatcc ttgtcttgtg ccagttttca aaaagaatgc ttccagcttt 61320
ttcccattca gtatgatact ggctgtgggt ttgtcacaaa tagcacttat tattttgaga 61380
tatgttccat caatacctag tttattgaaa gcttttaaca tgaagagttg ttgaatttta 61440
tcaaaggcct tttctgcatc tattgagaat catgtggctt ttgtctctgg ttctgtttat 61500
gtgatgaatt acgtttattg atttgtgtat gctgaaccag ccttacactt cagggatgaa 61560
gccgacttga ttgtggtggg taagcttttt gatgtgctgt tggattcggt ttgccagtat 61620
tttattgagg atttttgcat tgatgttcat cagggatatt ggcctgaagt tttatttttg 61680
ttgttgttgt gtctctgcca ggttttcgta tcgggatgat gctgacctca taaaatgagt 61740
taggaaggag tccctccttt tcaattcttt tggaatagtt tcagaaggaa tgataccagc 61800
tcctctttgt acctctggta gaatttggct gtgaatctgt ctggtcctgg gctttttttg 61860
gttggtaggc tattaattac tacctcaatt tcagaacttg ttattggttt atttagggag 61920
ccaacttctt gggagggtgc gtgtgtccaa gaatttatcc atttcttcta gattttctag 61980
tttatttagg tagacatgtt tatagtattc tgatggtatt ttgtatttct gtggggtcag 62040
tggtgatatc cccgttatca ttttttattg tgtctatttg attcttctct cttttcttct 62100
ttatcagttt agctagcagt ctgtctatct attttgttaa ttttttcaaa aactagctcc 62160
tgaattcatt aattttttga atggcttctt gtgtcactgt ctccttcaat tctgctctga 62220
tcttagttat ttcttgtctt ctgctagctt ttagattttt ttgctcttgc ttctctagtt 62280
cttttcattg tgatgttagg gtatccattt gagatatttc tagctttctg atgtgggcat 62340
ttagtactat aaatttcctt cttaacactg ctttagttcc cagatattct ggtacgttgt 62400
ctctttgttc tcattggttt caaagaactt cttgatttgt gccttaactt cattatttac 62460
tcaggagtca ttcagcagca ggttgttcaa tttccttgta attgtgttgt tttgagtgag 62520
tttcttaatc ctgagttcta atttgattgc actgtggtct gagagactgt ttgttatgag 62580
ttcagttctt ttgcatttgc tgagcagtgt tttacttcca attatgtggt tgattttaga 62640
ataagtgcca tgtcgcactg agaagaatgt atattctgtt gatttggggt tgagagttct 62700
atagatgtcc attaggtcca cttgatccag agctgagttc aagtcctgaa tatccttgtt 62760
aattttctgt ctcgttaatc tgtctaatat tgacagtggg gtgttaaatt ctcccactat 62820
tattttgtgg gagtctaagt ctctttgtgg atctctaaga acttgtttta tgaatctggg 62880
tgctcctgta ttgggtgcat atatatttag gatagttagc tcttcttgtt gaattgatcc 62940
ctttaccttt aagtaatgcc attctttgtc tttttttatc tttgtttgtt taaagtccgt 63000
tttctcagag gctaggattg caacccctga tttttttttt ttctttccat ttgcttggta 63060
ggtcttcctc catcccttta ttttgagcct atgtgtgtct ttgcacatga gattggtccc 63120
ctgaatacag cataccaatg gatcttaact ctttatccaa gttggagact gggtatttta 63180
taaagaagaa aggtttaatt ggctcatggt tctccaggct gtacaggaag catggcacca 63240
ggcacctgct cagcttctga tgaggcctca ggaagcttac aatcatggca gaaggcagac 63300
ggggagcagg cacatcacgt gacaagaatg aacacgagag agagatagtg gaggggaggt 63360
gccctacact tgtaaatgac cagatcccct gtgaactcag agcaggagct cattgatcac 63420
ctaggagttg gctcaagcca ttcatgaggg ttctgcccct gtgatccaat cacctcccac 63480
caggccccac ctccagcgct gaggagtata cttcgatgag atttgcgcaa ggacaaatat 63540
ccaaactata tcagggagtc gttagtatgt ctggccacct tgaaaggatg aaagcttatt 63600
ggagtggaaa aaaaattgcc tctctccagc catacaactc agtcaaacca cattcaatta 63660
acataaatat attttgacct ccaagtatgt aagaggtgat ttatattcac aatttctaat 63720
ttataataca gtttcataaa tttgatcttc acaagaaaga tgagcaaatt gctccttgcc 63780
aaagttaatt ggctgaatta ccaactgaag ttctgttatg cttggcccca aattctggtg 63840
gcccctttcc attatgtcaa ctggctctct ttacatatag attctcaccc tgtagtttcc 63900
agttcctaag gcaaaaggag aaaagttgct gcgtgaggat ctcttggccc agattttaaa 63960
agtcaaagac agtggactgc cttataacct caaacggttt cacatttcag tttggagctg 64020
atcagtgcat cctctgtgtc ctgatgctta acttttcttt tcttttcttt ttgaggtgga 64080
atctcactct gttgcccagg ctgtagttca gtggcatgat gttggctcag tgcaacctct 64140
acccgctggg ttcaagtgat tctcctgcct cagcctccca agtagctggg attacaggca 64200
tacgctacca aacctggcta atttttgtat ttttagtaga gatgggtttt actgtgttgg 64260
ccaggctggt ctcgaattcc tgaccttagg tgatccgccc gcctcggcct cccaaagtgc 64320
tgggattgca ggcgtgagcc actgcacccg accaactttt ctgatattat tttgaatatg 64380
ttcatgccct ctcattgcct tatcctaacc caactgcagt cttctggctt ctgtcaggtg 64440
cactgtccct tatccatact ggcaaagtag ttgagggagt caacttgggg aacatatatt 64500
attttaaaaa gctattcaga tataacaaga taactattta aaatattcct ttaaaataaa 64560
atcatgtact gcattgtcac ttaaatttca tagtcacaat atttgaaaaa atacttaatt 64620
ttaccatttt tatgcatgat ggctacaatt ctttacaact ttgcctacca accctttcag 64680
gaatgggtga aaggagtggg aaaatcatat taaaatactc agttttacaa cttatttcct 64740
agaaaaaatg tgccaggtta acttgtttat taaaagaggt gtgatgtcaa tattatttcc 64800
tgcttcagaa tatttatctt gttttgcagt tccactaaaa gtccaggcgg agccattgaa 64860
agttttccaa aatcaataaa taatttatct ctgcaaataa gactcttgct ttccagggtg 64920
ggattagtat tccaaagcat ccagcattag aattagctag accaattcat aggagtttat 64980
aattaatcct gaccagagga agctaaataa gagtgaaaat gaagtcagat gattgtctga 65040
agtgaagctg gaaggcggta acagccagac taagttttct gtaagtacat gcaatgacca 65100
ggaaaacctc tcaatctagg ggtcagcttt tagcaagata atgtgtcttg ctaaattttt 65160
atatctgcca caaaaggcaa gacaagcacc acgtaaggta tcaaaggcta tattcattat 65220
tctcttgagt gcaaaagagt ctgtgtctgt gtctatgtat gattgtgtgt gggtgtaatt 65280
ttctccatgg gtttatttag aattgtgttc ctctattttt gatgtatttc tagaacatac 65340
tatataaata aaaatgaagc cttacagatg caatcaaaaa caaaatgctc aagttgtata 65400
gtgttatctg ttgcatgtgg atttgttggg ctacttattt atttacatca ctgacaattt 65460
cttatggaat gccgacttca gaaatgtatt gtagcttgga ctctgcaaat gtcttttaca 65520
acaaatgggt caaatttcga taccaagaag tcatccttag cctgtttgtc tttagctttt 65580
taacaaaaaa aggtaataac aatgtaaaca aaattgctat gtataaattc ctatcatagg 65640
tatatgtttt gaaaatctag caagtaaatt tagtaataat ttattttgtg agtatctttt 65700
gacctttttt gtcctttctc acctactagg aacagtttat aatcagctca tgctgcatca 65760
gtcacagtat ccatttaggg tagcacgaat ccttgtcttt taccctaatc tataaatctc 65820
taacagtgta gtttaaaaat tgcttttgta tgataacaac tgcttgttaa caatccttgt 65880
atctcactaa acagctacac tcaccagaga aaaggtgaaa aggtctctct ctttctctct 65940
ctctttcttt ctgtcactct ctctctctca tatgcaaatg caggctctga cattttcact 66000
ttccagaatg ttatgctgtt tattccatcc ctagaactag tacgtgtgca tcctttaata 66060
atagtcactc caagcaacac cctattgcaa ggttttccca gtacccacca tctgccaccc 66120
gtagtcatag ttgatgtttc cgctttgaac ttcagttaac atcaggagca tatagatagc 66180
tcttaaagca ttcatcacac tctcctgtgg tcattccttt tttattctct ctcatactaa 66240
gcagtaaagt ccctgagtcc attttattcc ttttattcat ctccattcct agcatgctgt 66300
gtggcataga gtaggcttgt caaaaataat tattatgaat taataaacag acattcaaat 66360
acaattaagt gcccccctac gaatacagga aaatttttct gaaaagaggc taagtcatca 66420
taagcatagt catattcatt aatgacagtg attacagaag gccaacacta agtgcagtgc 66480
cagaagccat gatggtagtt ccatatctgt agagaaagac gatattgtga ataacgaaga 66540
gaggaatctt aacatgaagt cttaagctat tgcctttgtc gttggtgagt cttgtggtga 66600
gaggagaact atgcacagtg aagcatatgt tgaattatgg ggcacatgct tttgcttaag 66660
tatatccctt ttcttttata tgaaagcgtt atgaggtcct tctgggaatt gttttttaaa 66720
cagctggaaa gtttctcatt tttcagatga ggaaactgaa gctcaaatgt ttcaagtgaa 66780
tctcccaagg taattaagtt ggttaatcac cgaactgaga tgatcatctt tgtgttgtga 66840
tatacagctc agtgctctgc accgctagga gtggtgaata acttaaaacc acaggactct 66900
gaggtcctga ggtattgttt gtggccatta tcaacaattt tagtaacaag ttcagaacac 66960
attttcttag atctcaaact cctacaaaat gttatttgta aatagaatgt tttgttaaga 67020
attaaaaaca aacaagcaaa catatgctag gaggataatt gaaggctttt aaaaaaacaa 67080
ttagctgctc ccagggattc tagtactcat tttgatacat ggaagctact aaagccagaa 67140
atttaaaaca ttgaaaatca gtgccaattt gtggattatt acacttaaaa gtgcataaaa 67200
caacaggatc cacttattaa agagtttctg tagtttacaa ataaataatt caccatagat 67260
ttaaataatg gtagaaagac acattcattc attcattcat ttattcagaa aataattatt 67320
aaacatctac tatatattag gtttctccag agagaatata gaatagaata tattatatat 67380
atgtatgtgt atatacatat atgtatgttg gcttagctca aaagatatgt ctatagatac 67440
agatacagat ataaagagat ttactttaag gaattggctc atgtaatttt gtaggctgtt 67500
aagaccaaaa tcttcagggc agcctggaaa tttcagcaga agctgatgtg gcaggccaaa 67560
ggctctgcca aagatgtggt aggccagtga cctctccctg cagagaagtc aaaatctttc 67620
ctattaataa gatgagtccc actcacatta tggagggtaa catgctttac tcaaagtcta 67680
tcaatttaag tgttaatcac aactgtaaaa taccttcaca gcaacatcta gactggtgtt 67740
caaccaaaca gccaggcacc atactttagt caagttgata cataaattta actatcatag 67800
acgctgtgtc agggacttca tggaattgga aattacacta aggaacagtt gagtttggaa 67860
gacatccaat gaacagatga ccacacaaac atgaattgcc tttgtctcaa gtgccagaaa 67920
caaaaagtga gggtaccttg agaagttata gcagggaaac ctggcccagt ggaaggcact 67980
tggagtggct cccccgagaa aatgatagtt aagctggggc ctgaaggcta caaaaatggg 68040
gttaaccaaa gaaaacagga gagacttcca agtggaggag aagaccctgc attaggcagg 68100
agctgggaga aggccaacgt ggtcagacac tgggatactt gggggaaagg gggtacaaag 68160
gggtgtttga agtgtgggag gagccagatc cttcagtatc ttgcagacca tgttacaggt 68220
ttgccactgt taaggtagga cagtgattat gaagggtctc tccatatgct ttgtgccaaa 68280
tgtatcagaa aggctaagag tgggaggcag ggtggccagt gaggaggcca gataagagtg 68340
tgtgtagaga gggagatgga gagaatggaa ttagctcaaa agatattttg agaatatgtt 68400
ggagaacgtg acgattactt atgagggttg agggagaagt aggtatcaag catgattcta 68460
agacttcaag tttgctccac ggtttggaag ctggtcctgt ttgttatgac agggaactct 68520
ggtttaggat ttcaaattga ataagggacc tattgagctg gaggtacttg tggtgtagcc 68580
aagtggagaa atctaataag cagttggaca tgtagctcta agactctaca acgatgtaaa 68640
ggatgacaga gaattgagaa atcatgaaag tggatgagat tgcctgggag agttatcatg 68700
aaaagagaaa ggtcaaagac agagctcaga gcagctcatg actaaaggtc agctcacgac 68760
tagaggagat ggaaaagcag aatggcctna agaaatatgg acnaaaccag caccttcaaa 68820
gccagcagag ttgcatctgt gtcttcctcc catactcaca tctctctcca naccacagcc 68880
atgatcactg ttagtgattc atggagttag gttgggtcca cctggataat tcaggatcat 68940
ctcccaaatt taatgtcttt agccttaatc acacctataa ctttagttcc cttttgctat 69000
gcaacattat ctactcacag gttccatatg ttagaatggg gacatcttta ggggaccagt 69060
tttttctcta ccacaaaaac aacaattcag agcactgctg agaggtcaca gaagataaaa 69120
ctaaaatttt tctgattggg tatatcatat ggaagtgaac aaaagtaatt tcattgtctt 69180
ggagtcacag aaatgggcta aaaagttaaa agagggagat tacaagtaga tactttattc 69240
aagaaatmtg tgagtaagaa atgctggtct tgaaacccgt ttaaacatga gtggatattt 69300
attaccactg aaagaatcat tgtctatgtc caggattttc ctggtggggc aagaattcca 69360
tccaccccac ccccaactcc agagagtcac ttgttctcta tccaaagtac ctgagggaaa 69420
atgactacgg aaataattaa ggttaatgaa taaaaataaa ctctggaaga ttcttgttaa 69480
ctgaaaaaaa tgaaacaaag attaacaaat atatattctg aaactcttga cattcatttc 69540
aatttttaaa aacagtaatt accttgtggt tttagataca tgtgttccag ggcaattaat 69600
cttctaataa atgtgtttct aataaacatt tgctaataac ttgatgttgg taaaaatgtt 69660
tcaagcctgc tgcctctgaa gccaaagact tcaaaataat atctagtgag agttgtgctt 69720
aaaatgagta tcagcactaa tatgaaagaa aaagcaaata taataggaag aaaaaaggaa 69780
aaaatactct aatatttata aattaattta aaaaatcata atcattaaca gttgagtgat 69840
taacttattt ttggcaccat tctgagtgtt gcacattatc taatttaatc attaaaatgc 69900
ccctacaaag aatgcaataa ctatcctcat tttggnaagt gggataactg aggctataca 69960
cacagggctg gagtttcaat ctaggaaatc tacaactttc aaactgtcaa taacagtagg 70020
taacatctag cattgattgt ctatcaagta cctgttttat acaatttaca gatgtaaata 70080
cttacgtctc accccaggct tatgaggtag acgttttcac accattatgg attggaaaac 70140
taaagcatgc ttaagtcaca catgtaataa gtaggtcaga actcacagcc aagaagattg 70200
gctccaaagt ccaatttctt ctccaaatat ctgaaatatg atttttttgg aaactttttc 70260
atgtagacag agtgttatct tagacatttc tgctattgta tttttaaaag tatttggaat 70320
taaaaatata tgtaattttg atgggctagt agacccttcc ctctctgaac ttcaccttgc 70380
cttcaagagt aaatgaagaa ctaggtgatc catatagtat ctcttagctg catagttcta 70440
tgaacatgct aaagtttctt ctcctctttt aacaagtctt tattgttctg tttttacatg 70500
ctgggattta tgctacattg tattattgta atgattaata atcatttaga tcaagcatta 70560
tttgagtaca gtacttgcaa cacattaggt gctatgcaaa gtgcattact tggtttactt 70620
tacttaaccc tcacatgagc tttgctttta attatgatta ctctctgtac cttacagatg 70680
aggaagctga gcttagaggc ccttagagcc ttatttaagt cacacaacca gtaaatggca 70740
gagctgggat caaacccaga aagcctcact ctgaaactca gaagcccagt ctccttacca 70800
tcttactgtt atattgtagg taccaaatca ttgatgacaa gcatcgttga tgaggttaat 70860
agtatttgta ccacacattc tgaaacagag tcagatcaga ctgaagcaaa gatgaatcat 70920
ttggcctaca tgtaagaatg agaaatgggg agatatacac gatgtgtctg tctaaaataa 70980
tatctttctg acccacccaa ttgtggtaat ttccacaatt agagcctttc ccttgggttt 71040
tacagatggg gtccaaagga ccagcttaaa atatgactag agggagcaat gatttaacca 71100
cttatttcct gagaccagca gacagatgag ctcatctgct gctgacaaag ggcagaaccc 71160
taaaggaata gcttagggtg tttgaatcat gggtgaagtt tctggagctt tgtttatggc 71220
tgagaagtgg gcaaagtatc accagccatg gggtgtgtgt gtgtgtgtgt gtgtgtgtgt 71280
gtgtgtaaaa ctatgtacgt gtgtgtatgc gtggtggcag caaatagcta agggattgca 71340
caattaggtg tcagacttta gagaaagcat attataaaag ggatggaagc agcaactgaa 71400
cataagaagg tattaaagaa aaagagtcat ctggtaagtc tacctcaatt tggtcagaaa 71460
ctcacgtgac tgaggctgtc ttagggttgt tctccattta agaaattcct agaaacattg 71520
atgtagtggg aaattagtgt aacacaatta tggatttaga aggcttctga aatcatcaag 71580
cccagacttt ggcgtctgct caatctgtgt gggatacctc agatagcagc tatttggggt 71640
ccatttttaa ggtcaaccca gaatgagagt ctacagtcag cagtcctatg ttatctatac 71700
ttgctgtcag gaaagccatt acatatctaa atcctttata tcaagttgat atccaaccta 71760
ttcttaagaa ggataaaaat gggttatgtc attatccacc taaaggattc ttatattcct 71820
agagctatca ctaaatcacc tcataatctc tctttcctat gggatacctt gagttccttc 71880
catttctcct tatttgtctg gttatttcta aactagacac cttccaacac tcagaaggac 71940
aagtatcatt gatgagtttc gtagtattcg tactgcaaag aaaatgattt tcatcatgca 72000
acattgctta gaagtgggga agtaaaatgt gtgcccacag tgagacaaga attttgtgaa 72060
tcacaatgac tcctcagaca agttaacgtt ctttgcaaat ctgtagaaaa attccttcct 72120
ttgcttatct gggtctcagt ctgtaatggc aaaaaccgta atggtgatag tattcttata 72180
aagagctatt gtggggatga atcagatatc atttgagaat gtttaatatg taattaatgt 72240
tatgaatatc atttatggat tatgaatctt aaaactatat tcagatacac atacacaatt 72300
ttgcaaataa catcatatat atatatatat atatatatag agagagagag agagagagag 72360
agagagagag agagagagag agagagaaag tctctcaagg tctcatatat atattaccaa 72420
ttaccacagt tgggtgggcc agaaagatat gattttagac agacacgtca cgtatatctc 72480
ctcatttctc attcttatat gtaagccaaa tgatccatct tcgcttcagt cttaactgac 72540
tctatatttc aaagtgtgtg gtacaaatat tattaacctc atcaacaatg cttgtcatca 72600
gtgatttggt atctacaaca taagagcaag aaggtctctc aaggtctctc tttctctctc 72660
tctccctctc taaatatata tatatatata tatatatatt ctctttgctg tactcttaga 72720
tagatagata gatagataga tagatagata gatagaaaga gcaaaggtct ctcaaggtct 72780
tgctctgttg cccaggctag aatgcagtgg catgatcata gttcactgca acctcgaacc 72840
cctgggctca agggattctc ctgcctatgc ctcccaaagt gcaacgatta caggcatgag 72900
caacctcact tggccagata catagatatt aatgaagggt aattacatta ttcattgtaa 72960
tcaacattta tgattgttga aattgtctaa cactttcatg tgttgttcac aggaatgtaa 73020
cctggaatag tttagctatt ccagacacac actgctcacc agagctagaa gaaggctacc 73080
agtgcccacc tggatttaaa tgcatggacc ttgaagatct gggacttagc aggcaagagc 73140
tgggctacag tggctttaat gagataggtc tgtcttactg gtaaaatacg ttttaagttt 73200
ctattttgtg atgtttatga agtggacaga ataattaaat aattgatact aatattttga 73260
ctggctgtag tatagaagaa atacaaatat aaattttaat tctatgccta ttttataata 73320
tattctaccc gacagtgcgt agcatacaag ctgtgtatgt atatgggcag cagtgtttgt 73380
atggagttac agatctctca tttttgacta tttcgattct caataacrgc atttaagcat 73440
ttaaaaatat ttgtttgttg aacagggttc tgggttgttg actcaaagat aaacaaaatt 73500
tggtttcctt tcatatgtaa ctatgtaact ataccctaat aggcaaggta agtcttaaaa 73560
actgtaatac taggtattga tgagtgcatt agagctgaaa agtgctcctt gattagaata 73620
caattaatga actacttagt gaatatgcat caactaagta ataaatgtat gggaaatgct 73680
tgtgcatgag aactatgtgc tcaaatgtgt acattcttct tggcttgcct tattaagtcc 73740
taaaatgtgc cattacatac ataatgaaag aatttagcat ctgccattta gttgatatca 73800
ttgtattttt ataattccat gcaagttgcg catattatat tattaaagca aaaaatgtat 73860
aattccaaac aagtatttta tgccttgaga attgttatca gagtaatttt ttaaactaaa 73920
atttcttcaa gtgtcaggcc tgcgtgctaa accataaagt tacagctttt atatagaata 73980
tagtactgaa cgtgggctga tggtatcttt ttaaagtcag ttttgcaaat aacatctcag 74040
gttttcatct ttatgtttta gtatttcctc atattttatt tcaagcatta tagttagatg 74100
gcattcttcc atctcttttg accagtaata ttgtctccta tttcacaaaa atccagaagc 74160
caactgatgt gaagcaattt caattttcta tactctctta aacttatcca actttgtaat 74220
tagtcttaaa tccttccctc tgtctcaaaa gtacagaggc atcatgaatt ataccaataa 74280
cttttaggca tgaggaagaa atcacagatg tggtatggga ggcgagatgt atataggctg 74340
ataggctgtg cggaataagc ttcaggagtt ccaacagctg ggcatgacta gaatgcatgc 74400
cttatcagag tctgcagctc tttcttttag ggtctgagtg tatccatgtc ttctatggag 74460
agtggtcacc attccagggt taaggttgcc cttacagaaa ataacctcca attttttaaa 74520
atcatgtagc taaagcacct cataccctca ccgtttttaa tgcaacaatt gtacccaaat 74580
tcaaaatgca gcattatatt caagttgatt catctttctt cactctgact tacaatggct 74640
ttgcttaata tagggtagaa tctctttttg agagaaaaag tctccttgta ctgtgctgac 74700
ttgagaggac cagttctagg aggaaattgc cttggaggca gtcgccccct actaaagcaa 74760
ttatcttact atagctgtac tgttaattta tctcccaagg atttaagctc cttgaaaaca 74820
ggaagtgcat cttttcgtct tcaagtctcc agggcacagg gctatgcctg gctcacaggg 74880
agccctccat aaatatttac taataggctc aacaaagcgt atgtcttttt aattcattgg 74940
taaccaggca tgtttgtatg aggaggcaga gccacaatag agaatttagt tgttttcttg 75000
ttgttctttt gcctgatttt gtctgttttt gttggcaata ttcattattc ctcatgactc 75060
cttcctttct atacaggctt aatttcatcc gtttgcttat ttttcccaaa ttcatcatca 75120
ctgtatgact aattgttaga taatgaaatg ttgatcttgt accataacca aaacattttt 75180
aaatggtcgt tataatttag atcgaaattg atagctgctt cctgatatta tgtatctctg 75240
tagatacaca aactactata tttaaaagtt cttatggaaa caaaagacaa ttttttgccc 75300
aaaatgagga aaataaaata ttttattaga cacatgtgat catctcttca tgcatgcatt 75360
tgaatttaaa acataattag gtgcctaatt atgcatatga atttggctaa tatacttgaa 75420
tatgtaagta attatggtta gttaaaaagg agcccatttc cttttcttac taatcaaatt 75480
accattcaaa acatgaattt caattcactt ataaaatttc tggcagaagt agctttatgt 75540
ctcattaaga tttaacactg atgatgttga aaaattcaaa ttttaaaata tattaaaagc 75600
cagagtcatg gagtagaaaa aattacaagg aacccctgtt gtaagattga agagtaaaga 75660
catctttgcc tctttgtgtc cccaaaatca tccaaatatc aagaagattg agaaacagaa 75720
atgaaatttt catgtttaag aactctgaaa agctgtaact ataaaccaca tcacaggact 75780
gggcatctaa cagaaaactt cctgagaaga ttctgcctac tgtggatctc agacagcacc 75840
agcaggatag caatattcta agataatgca tgttcctgga ggaacacaac tgtctcatat 75900
ttgagtcagg gaatcagagc aaaggctgat tgtggaggct tactaggacc ccatgcagca 75960
tcacaaggca gaggccctca tttctgcagg cagttggtgg ggagatagag tggaggggac 76020
acaactgctt tgttgctgct gatctgggtt ggctagaatg ggataaaagc taaacggaag 76080
gttttcatgg ccactataac ttaggatgac ctggggaacc ttttaaaaca aacagattct 76140
caagcaccat cctcatgtca attaaatcac aaccttagag tgatccaagg aatagatggc 76200
ttttaaaggc tctccaggtg attaatttat gtgcatgcag agttatgaac cattggacta 76260
aagaaataca cacatagaca cacacacacc tgtattataa aaaccttcaa ttccatcttg 76320
atccattttg gttgttgtaa caaaatgtca cagaatcagt gtctcataac caagagaaat 76380
ttatttctca cagttctaga gtctgggaag tccaagagca agacagcagc agatttcatg 76440
cctggtgaag gctcacttcc tggttcatag aatggcacct tttcactgtg tcctcacgta 76500
gtagaagcag taagggttct ctcttgaacc tccttcataa ggttactaat accattaatg 76560
tgggctccac cttcatgatc taatcacacc caaaggtcct accttctggt agcatcaccc 76620
ccatgggggt tagaaattca acaaatgaat ttgggggaaa catcagcatt ctgtccattg 76680
cactatccta gaacattacc ctgttcctcc ccaaagtgaa acagtgacag acatctggtc 76740
taacaaaaat ttatttcaaa gatgagtcat aattgaaaga atgaggacca catctataaa 76800
aatgtacttt gaggtacttt taaaactgaa aaaaaatcat gatatataac tcataaaagc 76860
ttagtaggaa acagagcact gaattacaga ttcgaaggat gcagcttttc tcagtaagtg 76920
aacatagaac agtcaacact gagacacatc ttagtaaaat tgttggaaat caaagctaaa 76980
gaaaacattc attaggcatc cagaaaaaat aaggtcaagt tagctataag gaggtacatc 77040
agagaggcct gaaacttcat gtcaatatgg aactctagaa tgtaatggca caatgcttac 77100
aaattcttta gggaaagaat gggtcaagct ctttctgaat atttttgaag aggcaggaac 77160
atagagacta tattttgcat gaaatcttcn ttgaaaacat tcagttaatc aagaatttct 77220
tatcatgagc tagtctctag tatctatttg ttttaagaac aaagctaata taactgtagg 77280
atttacaaaa tacaatgtaa atattataaa ttatgaatat ctagaagaga taagatgaaa 77340
accgggggag atagtgtgat tatgttgata ttcttaacat tcacatttta gcagttaaaa 77400
aagtaacatt tatacaatat atgaaatgta taatagagat atgtgcatac ttgtcatgag 77460
atgagaatgc atgataaact cagnaaatta ctttctttag aaataactca aaaatccaaa 77520
taatattatc tatgaccacg tcccaaaaaa tcatttcaat atgagtaata atattggaat 77580
caattctttc taaatcttga taatagttct caaaagaaaa gtaacaaaca gtatattttt 77640
taacctctga atagagttat gctatttgct gtagcatgtt taaaattatt aggggcacat 77700
gactcctttg tggtaaagtt tgcttgaagc acagttgttc aaaagaatgg ccctggggtt 77760
tagatcatga ctccacttta tattagtgtg acagccttag gaaagtaatt aactctcttg 77820
cctcaatttc cccatctagg aaatggggta agtgatagac ctaccttata cagttaatgt 77880
aaagagcaac tgagaaacta cacttagagt acgtgtagcg tagaacaaac gcagaatgaa 77940
ctagaaattg ggatgcacgg gcaaaatatg aatgtatctc tgtgttattt gagggaaaat 78000
ggtgtaataa taagggaggg caggacatag atattttcac actcacacac tgcatctgat 78060
atgattccct ttgtttacag acattaacta tgcaggtttt ccagtatctt attcaaggga 78120
gaggcattgg ggcaggggca cggtgttttt tgtttgtttg tttgtttgtt tgagatggag 78180
tctcggtctg tcgcccaagc tggagtgcag tggcacaatt ttggctcact gcaaactttg 78240
cctcctgggt tcaagcagtt ctcctgcctc tgcctcccag ttagctggga ctacaggcgc 78300
ccatcaccat gcctggctaa tttttttgta tttttagtag agacggagtt tcaccgtgtt 78360
agccaggagg gtctcgatct cctgacctcg tgatccaccc gcctcggcct ccaaaagtgc 78420
tgggattaca ggcgtgagcc actgcacccg ccggggcacg gtgttcttaa ccttgcatct 78480
tgcctatgtt aactcatatc tcccatttca ttttattcca atcaatgact agcattctag 78540
aaggcaagtt tttggtgatg tttggtcttt attcatcaat tattcccctc ccctctcaca 78600
aatgtcctga cttctgtgct tgtaccaatc tctctagaat ctgatcaaca tttagcccgt 78660
gtcattgaat tttctagttt gatgaagcat catgcatatg tttaatttta tttatttatc 78720
catatacatt cgaatctgtg acccctggat tggagcctct ccctttcagc gcctttcaan 78780
caggtgctcc ttccacagag cctaagtaaa gcaccagctg gggcattgag cagaaggcac 78840
agccatgctg tgatgtgcag gggctccagc actaagtgat ttattttccg nacctcctct 78900
aattccctga gccacgtgac aactgagata ctagttattt ctgtctcttt cttccattta 78960
tgcacctttc catctttatt tctggatagc tttcctgtgg ctccttccta aggaccccca 79020
actgactcat ccctgctaag acattagccc gtgcactcaa gatatcacac actccccatg 79080
ttgcaagctt cctgagtagt agacataatc taaaggacat cttgcaaaat cgcaaaattt 79140
atttagcaga cattgagatt ccgtgattgc agtatgggtg gcaaggtggg taggaatcat 79200
acagtggtaa ggtttgggga ttgacaacat cctaaaagcc acactgtcga agtgacacaa 79260
aatcacagca acttacccta tttagaaaat gtgtcttccc ttttctgaat acttacccca 79320
ctttcagttc ctacttccgc tgnttcccac ttgctcataa acatatgaga cataaaagct 79380
gagacataaa agaggcgaca ctgtgatttt ctgtaataac actggaaatg aaattacaga 79440
agtttagagc tggaacagat aatgcagtca tacattttac ccacacaggt ggggatctga 79500
gagtcagagt gagtgggatt agaattacag agaactccgg gcagaggcag gctgaactca 79560
cttctccaga tttgcagatg tccaccatac ttgctgtttc caccaaaccg tcttacaact 79620
caaaatagtg tttaagaaga aaattcaaaa acaatttgca aagcttagtt ttattcctaa 79680
ttttctagtg gaatgttagc attatttccc tttagtgaaa tgctgatggg gaagaccgtt 79740
atccaaacag aggtgatgtg ccagttagaa agaaagcaac acaaaatata ccatatatgc 79800
gaaataaatc acagcaaaaa aacaccatcg aactggtgat tccttgtcat gaccttttaa 79860
aagaaagtaa aacatttggt acaagagatg agaacaaaac tattcaggtg gttatttgaa 79920
cccttcattc attgtacagt caggtaaaaa ataaaaaatg ttcagtttgg actaaacaac 79980
ttaatgaatg tcattggatg ataaaactca tcctgaaaag tcacttagga agtaaatcgc 80040
tatcatgcat tttttattag tctttagaat catcagaata aatgacaaaa gcccattttc 80100
aaaaaaatcc agaataaatg aaattcaact gaaacagctt atagcagagg aagcccacaa 80160
gcaagataaa ctatgaatca agacattctg aaaataacta atagaaaaga catacaacat 80220
atgcccttaa cactacacga gctgtatatr gtggatcact ttgcctgttc tatatattca 80280
aaagtcgaag gtaaagccag gaaataataa acactgtatt cttatggtga ctaattgtcc 80340
atcagacagt cgttactttt gtaattactg tcattactta ggacaactgt tggntatcat 80400
ttatcgattg catattatgt gcctggcacc agtgaaaagg ttttgcatcc attgtgtttt 80460
taatcctcaa aatcagccca tggggtatca ttatccctca gctgatgagt ggggagaatg 80520
agataagcaa gaatgaactc tcccagagcc tcttaccagc cgcatttgga agccatgtct 80580
tgctgccccg tgtgctgagg ctgaagcctg tgctcttgat ctacaaacta ctacgttacc 80640
agagtagcca gccatgagta accttcattc ctgtggcttg tcaggacacc tggtccatta 80700
taaagtctca ttatgatgat ggaagaaaca catcttccaa aagagtgacc tgccatagtg 80760
gcatatcctg caacatggtg acctccctct tgtcctgaag tctttagaca agtcttagaa 80820
aaaagaataa atgtgggctg ggcgtggtgg ctcaagcctg taatccaagc actttgggag 80880
gctgaggcag gcagatcacc tgaggtcagg aattcaagac cagcctgggc aacatagtga 80940
aatcctgtct ctacagaaat acaaaaatta gctgggcatg atggcgggtg ccagtaatcc 81000
cagctactcg ggaggctgag gcaggagaat cgcttgaatc tgggaggcag aggttacagt 81060
aagccgagat tgagccactg aactccagcc tgggcaacag agcaagactc tgtctcaaaa 81120
aataaataaa taaataaata aataaataaa taaataaata aataataaag agtaaatgtg 81180
aaggaatgtg acgtccactg caaactgatg gccccttaag gggttggtct ctggctttaa 81240
gtctagtccc ttgtattctg tattctgtga gacagagagt tggtgcataa tatatgttag 81300
ttgaatgaaa gaatataaat attaaacaat gtacctggga ggcaatgcag ttttataagc 81360
tactgagctg taaacatctg ggcaaggatt agagataatg ccagaaaaaa ttagtaaata 81420
ctacttttga tgtaaaatta ggtggtagac acatcatggc tagagatgtg ggagagaact 81480
tagcaagcaa aagaaaatat gctatttggt atattttagt aagttttgtg tgtatttgaa 81540
ctaaattcaa aatgccgtga taaggcatgt gtttgctata tgtaatgtat agctacatgc 81600
attaatttct gttgtgtatt tgaatttact ttctttgaga tatgaatatt taaatttgct 81660
ttctaaatta tcacaaatta accaacaaat ttatacaagg tgattttgga aatccacatt 81720
aattaatttc tttattagaa tgtgacataa acagtattta ccttattagt ttntctttac 81780
gaaaaaatta taaangcttt tctatatata tcctccttaa aatattagat aagaaaacta 81840
caagtcgtca gctccacagg agttaacatg tggattttgg atgctaagaa caaatttaag 81900
atgatgactt gtaatcttca tgaattgctt ttggcaacaa taaattaatt gggcctttca 81960
agaaaatgca gaaaactaag gtaaagggtg attgagtctt ccagatttcc tatattccca 82020
actcacttct gaagaacgta attatgagta ttgaaatttg ggactggtat tttttacaag 82080
aagaaatata ctgtagctgt tatttacttt tgtggtattt ttcttctttg aatttgggta 82140
gtattgacta taagctatgg actcagctcc ctgtgtgggt cataaatcag ttttattaaa 82200
tattgattta gaaatatcag ttattatttt cntcactggt ggagttctgt gcttcggact 82260
acccctgtat cttgctgaaa taggattgac aat 82293
<210>2
<211>237961
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>exon
<222>43726..43868
<223>外显子8
<220>
<221>exon
<222>43998..44102
<223>外显子9
<220>
<221>exon
<222>52093..52179
<223>外显子10
<220>
<221>exon
<222>77568..77699
<223>外显子11
<220>
<221>exon
<222>98226..98393
<223>外显子12
<220>
<221>exon
<222>106567..106758
<223>外显子13
<220>
<221>exon
<222>144109..144246
<223>外显子14
<220>
<221>exon
<222>159794..1 59868
<223>外显子15
<220>
<221>exon
<222>191292..191428
<223>外显子16
<220>
<221>exon
<222>192967..193108
<223>外显子17
<220>
<221>exon
<222>211540..211613
<223>外显子18
<220>
<221>exon
<222>225006..225107
<223>外显子19
<220>
<221>exon
<222>225544..225613
<223>外显子20
<220>
<221>exon
<222>228450..228541
<223>外显子21
<220>
<221>exon
<222>228630..228752
<223>外显子22
<220>
<221>exon
<222>231289..231345
<223>外显子23
<220>
<221>exon
<222>231589..231709
<223>外显子24
<220>
<221>exon
<222>231813..231944
<223>外显子25
<220>
<221>exon
<222>232900..233067
<223>外显子26
<220>
<221>exon
<222>235355..235459
<223>外显子27
<220>
<221>allele
<222>51090
<223>99-79335-60:多态性碱基C或T
<220>
<221>allele
<222>61293
<223>99-79336-369:多态性碱基A或G
<220>
<221>allele
<222>80602
<223>99-79338-332:多态性碱基C或T
<220>
<221>allele
<222>100485
<223>99-79314-201:多态性碱基G或T
<220>
<221>allele
<222>100509
<223>99-79314-225:多态性碱基A或G
<220>
<221>allele
<222>106725
<223>99-79316-158:多态性碱基C或T
<220>
<221>allele
<222>166087
<223>99-79322-224:多态性碱基G或T
<220>
<221>allele
<222>166336
<223>99-79322-473:多态性碱基A或G
<220>
<221>allele
<222>235894
<223>99-79306-182:多态性碱基C或T
<220>
<221>primer_bind
<222>51031..51051
<223>99-79335.pu
<220>
<221>primer_bind
<222>51539..51559
<223>99-79335.rp补体
<220>
<221>primer_bind
<222>60925..60945
<223>99-79336.pu
<220>
<221>primer_bind
<222>61354..61374
<223>99-79336.rp补体
<220>
<221>primer_bind
<222>80271..80290
<223>99-79338.pu
<220>
<221>primer_bind
<222>80700..80720
<223>99-79338.rp补体
<220>
<221>primer_bind
<222>91037..91056
<223>99-79339.pu
<220>
<221>primer_bind
<222>91466..91486
<223>99-79339.rp补体
<220>
<221>primer_bind
<222>100285..100305
<223>99-79314.pu
<220>
<221>primer_bind
<222>100764..100784
<223>99-79314.rp补体
<220>
<221>primer_bind
<222>106568..106585
<223>99-79316.pu
<220>
<221>primer_bind
<222>107000..107020
<223>99-79316.rp补体
<220>
<221>primer_bind
<222>165864..165884
<223>99-79322.pu
<220>
<221>primer_bind
<222>166381..166401
<223>99-79322.rp补体
<220>
<221>primer_bind
<222>235713..235732
<223>99-79306.pu
<220>
<221>primer_bind
<222>236190..236210
<223>99-79306.rp补体
<220>
<221>primer_bind
<222>51071..51089
<223>99-79335-60.mis
<220>
<221>primer_bind
<222>51091..51109
<223>99-79335-60.mis补体
<220>
<221>primer_bind
<222>61274..61292
<223>99-79336-369.mis
<220>
<221>primer_bind
<222>61294..61312
<223>99-79336-369.mis补体
<220>
<221>primer_bind
<222>80583..80601
<223>99-79338-332.mis
<220>
<221>primer_bind
<222>80603..80621
<223>99-79338-332.mis补体
<220>
<221>primer_bind
<222>100466..100484
<223>99-79314-201.mis
<220>
<221>primer_bind
<222>100486..100504
<223>99-79314-201.mis补体
<220>
<221>primer_bind
<222>100490..100508
<223>99-79314-225.mis
<220>
<221>primer_bind
<222>100510..100528
<223>99-79314-225.mis补体
<220>
<221>primer_bind
<222>106706..106724
<223>99-79316-158.mis
<220>
<221>primer_bind
<222>106726..106744
<223>99-79316-158.mis补体
<220>
<221>primer_bind
<222>166068..166086
<223>99-79322-224.mis
<220>
<221>primer_bind
<222>166088..166106
<223>99-79322-224.mis补体
<220>
<221>primer_bind
<222>166317..166335
<223>99-79322-473.mis
<220>
<221>primer_bind
<222>166337..166355
<223>99-79322-473.mis补体
<220>
<221>primer_bind
<222>235875..235893
<223>99-79306-182.mis
<220>
<221>primer_bind
<222>235895..235913
<223>99-79306-182.mis补体
<220>
<221>misc_binding
<222>51078..51102
<223>99-79335-60.探针
<220>
<221>misc_binding
<222>61281..61305
<223>99-79336-369.探针
<220>
<221>misc_binding
<222>80590..80614
<223>99-79338-332.探针
<220>
<221>misc_binding
<222>100473..100497
<223>99-79314-201.探针
<220>
<221>misc_binding
<222>100497..100521
<223>99-79314-225.探针
<220>
<221>misc_binding
<222>106713..106737
<223>99-79316-158.探针
<220>
<221>misc_binding
<222>166075..166099
<223>99-79322-224.探针
<220>
<221>misc_binding
<222>166324..166348
<223>99-79322-473.探针
<220>
<221>misc_binding
<222>235882..235906
<223>99-79306-182.探针
<220>
<221>misc_feature
<222>6485,14246,14248,14250,14252..14254,14256..14262,14969..14980
17712,18786,19477,19496,21043..21064,21547,24607,24946,24974
25072,25124,25136,25142,28843,31239,31372,37750..37751,40488
46542..46557,49309,49326,49357,49395..49398,49400..49402
49408..49409,56275..56280,61048,61050,61059,61856..61857
61860..61861,64842,66307,66326..66327,69835..69840,70893,70905
73279,76154,76354..76355,76371..76372,76407..76408,77095
78933..78934,79363,89491..89492,95836,95838..95839,95841..95842
95958,96966,97049,97067,97078,97292,98642,98712..98713,98716
98740..98741,101368,101373..101374,101376,101378,101401..101403
101406,110014,129061,129066,129973..129974,135336,135345,135359
139924,147368..147369,147469,147507..147510,147767,151694,151729
163111,164480,169764,173340,173390..173391,173398..173401,173407
173414,173419,173426,174800,174894,175041,175486,176256,177240
178864,181149,181154,181230,181287,183433,186606,186648,191065
191267,193117,193203,193223,193380,194051,194053,194057,196577
198388,198655,198828,198849,198862,199667,199693,199701,199704
199747..199748,201117,201224,201226,201314,201410,202524,203887
204396,204939,205891,205930,205998,206908,207363..207364,210938
212018,214253..214254,217022,217333,219027,219909..219912,220924
222620,222882,223870,224902..224903,224911,224914,226899,226915
227232..227233,227415,228441,228446,229373,229471,233305,233405
233512,233601,233629,236096,237468,237471..237472,237478..237482
237486,237488..237490,237492,237495..237496,237498..237499
237504..237507,237509
<223>n=a,g,c或t
<400>2
gatgttaaat aaggcgataa aatatgagga agaaaaatac ttttattcaa attataatgg 60
gatgtaaatt gaattttgtt gatgctgctg ctaaaaattg attcatcaga gttaaatgat 120
attaaagcat atttcatgct accatatgtg atatcagatg agaactttac aaataaatag 180
aaaacagaaa gttatatatc tacaaccatg atttattaca gaacgtatat ttttactgca 240
gtcataaaag aaaaagccca gtaaagacta atttgtaaaa tatgtaattg agatttataa 300
tgctttcaaa aaaaaaaaag caccaagggg tttttctgat gcatttatct tgatgtttac 360
tgttgccata ggaattactt attgattttt atgaaaacac atatggaaga gagaactaag 420
gcaatagaat tcaactaaaa gggcttcatc tatgataatt ctgtttgctc tgataaaaat 480
tcctttatca tggaacaagg aaaacctgac atatttttgt tgagtcgagg acaagatcaa 540
gaaacatcct atgaggaata tttgtgaaaa ctcttagcca aatgcaagga gttttatcct 600
tgtatcttga atcataagtg cccctaggtt acatgaaatg tgtgcttgag gatttttaaa 660
gggactgtct ttaggtttct caggttctca aatagggcca cagacttact taaactgaaa 720
ttaggtgtcc agatattctt cagaatgtta ggaagaaagg agtttaaagg cagaaattgc 780
aggcatgact ttttaaaaat aaggttgtcc attgtctgct gaaagatgtt taggagttct 840
tgttgaatgg atgagaaaag atagtgacta gaggagtttt tcatcagaca gtgaaaggaa 900
attttaaaag taaattttgg agagcataaa gtgatgattt atttcatgtt atatgtagaa 960
gacagtgttc attggaaata tctagtggat tccaagaaat tagcattttt atggttgtat 1020
tttaaacatt tataagttaa aaaagtaata cttcaaataa tgtaagagat ttaatgattt 1080
aagaaagtaa taaattctgc catatataat tccctccctc cttccctctc ttcctttctt 1140
ttctcatttc ttctcccctc tctgtaagtt tcatggtatg ttataacatg tttttcattc 1200
ttcccttact gatagacatt taagtggttt tcagtctttc cctgcaataa gtaatgctgt 1260
gttgaataca ggcatatata cattctgtgc tcatgtgtga ttatgcttta gaacagattc 1320
ctagaaacaa tttctgggtg aaatgatatg cacattttta atatgagata gctggcggtt 1380
tactttttta aaagataagg attcatagta ctgcctttat tgcgtgagtg aatttttata 1440
aatacaaggt attctttttc aatatgcata aatattgaag aaaaaaaata atgtaggcat 1500
ttcgtattcc gtactctgta ctcttctgaa cactggcagt ccattctctt cttgaatgta 1560
tgtattcatc ccattcttcc tggaatgcct ctctccattc tcttcttgaa tgtatgtgtt 1620
catcccattc ttcctggatt gcctctctcc taccgctccc cctaccccca tctcctgtga 1680
ctcacctgtc aggacctact caggtaagtt tcccctaatc tgccagcagc actcatctcc 1740
cttctgtctg aactgtgata gcaaggtttg tgcatcaaag tggacacttc gttacttcgt 1800
tctacatgtg tcccaccgtc tgggagtgtg tgtgtgtgtg tgcacacgtg cgtgcctgtg 1860
tgtgttttac ccttatgttc tggattcgtt cattagaccc agttgtctca ggtgggagca 1920
gagcctcagg cacttctttt gatgtctttt ctcgctctca ttgaactcgg tatatacttg 1980
aggactggct gatcacattt atgagaattt tatatttgat agattgcctt ttgaaaatca 2040
tcattctgca gaaatttagt aattgaaaat ttaaatcaaa ttcaaataca actctaggct 2100
ctaatttcac tgttcgtttg aatgtatgac ttctctgtta agccagatac tcacgtgaaa 2160
caaatgtgaa tagaatagca tggaaatcgt gtatggacag tcaaggaaac tttctctgct 2220
ggcgacagca gcctgcagaa cataattccc tggacactct atgaaatcaa atccgtttta 2280
tcaactaatc agttggagca aaaaataata atagtgttat ttaggaaagc cgtaacacag 2340
ctcttacctc aaggctaatg aagacctgac ccttgaactc taggggcttc catgttccag 2400
cttgtgagcc ctgctttgcc aaaaccctgc tgaagaggta agagcctcct tctctggaga 2460
gaaagccccc agcctttgac aaagtgcttc tagcctgagc catgtgggct atgaaaaaga 2520
agttggtcat cccgaggagt cactggacag tggagagagc ccatccattt ttctccttta 2580
ttcttcccta cccctcagct ctcactccct taggacttgg gattctggaa tcataaaagc 2640
aaaatattct aaatatacta aaacatgcta aataacttaa atatgctaaa taaaattaaa 2700
actaaaataa acgtattaga ataaatcatg aatggctaat aaatataagc tgccaccatt 2760
aaaacaaaaa taacaaccac taccacaatt gctactataa agattattat tgatcagctt 2820
tatttttagg taagtagaaa agtgagatgt atttctattt ttctgagaat gtaaccattc 2880
tgaaagaata ggagatactt tctcacagta agcagaagaa tgagatgtac tcataaataa 2940
tatattcaac aaacagttat tttgcactta ctctatatag gtactgaaaa tagaatgatg 3000
ttaataaata tgaacagccc tcaaacagag atattaaaat aaaacaagaa atgaaggtga 3060
aataaattta gaagaaacga tggatcatta acttgtagta gttcttacag ccatgtgctg 3120
gatgcaggca tccctgtctg agtgtgtgcg tgtgtacaga cattgtttcc aaactttttt 3180
actataactt tgttaaagtg aagcgtgagc actccacatt tgctgcaagt ctcacttccc 3240
ctatttcctt tatttctcac atttacgtaa cttgtctaac ctctgaaaca aatgttttta 3300
ttagttctgg taatgcaaaa taatctttag agaattacgt ttttattttt gcttttgtta 3360
aataagatct acagtagcat aagttaagtg tgccaccttc attttgtagc tggctaaata 3420
tttctgcttc ctgtgtactt ttctgaaaat ggctttaatt tgtcttattt ttgataatta 3480
gcttcaatta gtgcagaatt ctcctttggt attgattgga cataaaacct gagatatgtt 3540
cgttgtattc tggaatctat tactgccaat aacaagccta ccgtgagtcg aattttaagg 3600
ctttcctttt tttttttttt tttttttttt tggctttgtg aatttgggtt ttttttaaca 3660
tcgtttttct ctggtagttt ttaagattta ccctttgtct ttgctgtctt atggtcttag 3720
tatcctgtgc ctaggcatgg atttttattt tttatctact gtgaactcat tctctgcata 3780
tgagactcat gcctttcttc aattctggaa ggtttttagg tattatcttc tcaaaacagc 3840
tctcttctcc attctctcta ttctttgttt tctggaatac tgattaatat ttgtttttat 3900
catatttttt attctatcct ccatgtcttt aaatcgtgct ttctaacttc cctctatttt 3960
cttgacttct cttgttacca cacaatgggc gggttcagtt gcttggcagg tgggagtcca 4020
atgaccacaa ccaaggagga tttaaccaag ggatttcatt actggcaaca agtaagtaga 4080
acactgggga tagttcccaa agcagtgcct ccccagacac aggtggaaac agggctttgt 4140
gggggctgct tagctgagtc actgtgtgca gaggtggagt gcaggcaggc acagctgttg 4200
ttcatgcttc ttcatatgtt gcccatacag aaaatggcac ataagctctt ccctgggcag 4260
ggcatttagt atggtaaggt gaagaggtct ccaaagttca tctccagctc aggcatcccc 4320
ggatgcctgg gaccagtttt ttgtgtttgt tctttgtttt gcaggggctc ggcttcttcc 4380
tagaacactt ttaaacaacg gaaactcaag gtgcaacagt taaaagtgga tagttcttca 4440
cagtgtgtac ccaaaaaccc agggaccctg ggttacactc ttgatccttg attagttgca 4500
caaggaatct tctatcattc tccgtccctc caagagttgt ttacgtattt tcaagctcaa 4560
attctttgct gaactcttaa ttttctctca gtgtgtctag actgctattt atttatcgaa 4620
ttttcaattc caacatctat aatttttata cctaatattt ctatctaatt ctgtttcaaa 4680
cctgcctgtt cttttatctt agattcctgt tcttgctgtt ttctttctaa tcttttcttc 4740
atctcaccaa acattttaaa catgcttatt ttagaatttg tttctaatgc ttccatattt 4800
tctaactctc ctttacaata gttcattttc ttgtgtggtt tataatattg gctatgagct 4860
catttccact ggctatgagc tcatttttca ggggtactct ggcctgaact gtgactgggg 4920
ttgtgtttgc tgcagtttca tggatatcaa ccgttcttac tgatactcgt gttacttttg 4980
tggcttaaag aatatattaa tgtgttctca tgctgctaat aaagacatac ttgagactgg 5040
gtaatttata aagaaaaaga tttaatagat tcacagttcc acatggctgg ggaggcctca 5100
caatcatggc acaaggtgaa gaagtaaagg tatgtcttac ttggtggcag gcacatctta 5160
catgggggca ggcaagagag cctgtgcagg gaaactgccc tttataaaac cgtcagatct 5220
cgtgaggctt attcaccatc atgagaacag cacaggaaag actcgccccc atgattcaat 5280
tacctcccac tgaatccctc ccaggacaca tggggattat tatgggagct acaattcaag 5340
atgacatttg ggtggaaaca cagctaaacc atatcaggga aggagaggtc cttgaactat 5400
ttgcattatg ggggcactgt aaaattagac tacacacttc agttggccca ggtctggatt 5460
ctgatttctc tgaggagact cttttgcccc gcatggatct ggacagaagt caagcaacat 5520
tctgcttttt tctgagctgg aggccagggt tcttccagtc cagataaaat gcagaacaat 5580
cctttgtaac acccagcttt gtagagacac ctcagctcca acttactgtc ttatattagg 5640
tgcctcccaa ctcctctctc tattgggacc cagaagccct gaagatttat attgactcca 5700
agtacatctg tgaaccattt ggcttcagct gctgctcaca gctctgattt tatattctcc 5760
caaactctct gaccgctgga tagtttgctc atgtagcttt gagataattt atacattcaa 5820
aacttactct cttttatcta tttccttgtg ttgatttggc atagggtgag gagggtaagg 5880
gaaaaaggtg tctaaataag catagtccaa cacattgacc taaagcccat atatatatat 5940
gctgctaata acattatata tatgtatata tatattatat ataatttttt ttgaaacagt 6000
ctctctctgt cacccaggct ggagtgcagt ggcatgatct cagctcactg cagcctcctc 6060
ctcccgggtt caagcaattc tcatgcctca gcctcccaag tagctgggac tacaggcgtg 6120
agccaccacg cccggctaat ttttatattt ttagtagaga cagggtttca ccatttcggc 6180
caggctggtt tagaactcct gacctcaggt gatctgccca cctcagcctc ccaaagtgca 6240
gagattacag gtgtgagcca ctgtgtccag cctatgtttt tatattttta ggattcccat 6300
gtaatgatgc aattttcctt tctttgatat gatgcatcta tgattttata ttctaaatgt 6360
atttttatac ttatatataa aatgcatttt attaattaag cattagttct taaaagttgg 6420
tatttccttg aacttttaat tttacaaata ttccatttcg gtgttattat ttttagtatt 6480
ttttngctgc tgaatagtta tgccaacctc tgtgcagcct gggaagacaa cacatcagca 6540
gtcaatttgt gtaaagacaa aataatatta gagagcaaga gaatgagaca agactgcaaa 6600
tcagcaatga taattattga gtactgagaa caattccagt ggattaagat ttgggatgct 6660
taagcttctt aatattaatt gcagcaaata ttcaaatgct ttcactttcc atataagtac 6720
ttcagcaaat aagcaaaata tgaaataaaa accctaattc agaattacct aaatataaaa 6780
caagtaaatt gtcctaggca attcttacca tcttatgtcc agtaaaacaa taacctatat 6840
ttgtgcatac agatatatta tctcatttaa aaactagcgg tgattgtaaa tcttgacacc 6900
aaattgaagt tgaactgaaa gaggctttcc tgtaaagata cttaggatcc ttacattgta 6960
tgtaaggaaa gtcacctagt cctcacatca accccaggtg tgacatgtta ttaacttatt 7020
ctaatggtac agatgttgag atgcagagaa cagaagcagc tcttagggga cagagacagg 7080
gctcagtgat gattatattc acctgtcatg gggtagagct acaatagtga gtattctgtg 7140
gatggtccta tccagataaa agaaggaatt ggtttcagga catagtctgc atcttactag 7200
gtggggaatg ttggacaagt tacttaacct cttctgccct gtaaaatagg gataaaaatg 7260
gtacatatca cagagtgtca taggaagact aaagtagact attctcatcc tcacacctaa 7320
tgagttctca atatttaact gattataatt atctttacta gatacataat taattaaata 7380
aattaaggaa ttatagagca aatagtcata gggtcacaca gatagaaagt gggaaaaata 7440
ggagacaaac ctatgtctat attcattcca tggcattaga tttagattac ctccttttag 7500
tctggcaaaa cactcatgat tatacaatgt aatttaaaaa tatacagtac tttgctgggt 7560
gtggtggtgc atgcctgtgg tcccagctac ttgggaggct gaggtgggag gatggcttaa 7620
gcctgggaag cagaggttgc aatgagccga gatcacgcca ccgcactcta gcctgggctg 7680
tagaacgaga tactgtctca aaaaagaaaa aaaaatacag tactcacatt ttactttgct 7740
agtatatgct gtattcactg gtgtatgctc tcttgcatgg agactttcat tgggaataaa 7800
atgtttgaaa ctattttact atttcttgca ctgctttgag atactaccag caaagctatt 7860
tctaagctaa gacgctatgt cctggcagga cttctaaaga cttaaagcaa tgctgtagct 7920
gtgtatttac aactgactag agcagggatc agcaaaccat ggccagtggg tcaaatcctg 7980
cttactgcca gtttttgtaa acaaagtttt atcgcaactc cctgcccatt tgtttagaca 8040
tggtctgtgg ctgcttttct ccaacagcag aaaagttcag tagtttcaac agaaaccctg 8100
aggcccataa agcctaaaat gtttaccatc tggccattta cggaaagtta gccaaccccc 8160
agactagaat aaaggtagga aaaaccactc agcccaagct tcttttttga ttctatcttc 8220
ccacagctgc ctagaatcct ttgcagtctt tatcctagga ggctcagagg ctataacaca 8280
tctctaattt tgtctagatt tgtgagaatc catttctcac aaatccagtt ctggccctct 8340
ttccctgact cgatgttcct tgaactctaa acatgaattt ttaaaagaag gattacctgg 8400
gatgggtata tccctgaaag tcacctcctt tctgctgcct ctcacaaata cacaggctat 8460
gtgccttaaa cctgtcattc actttaagga atttttgaaa agtggataat aggttagaca 8520
taaaattcac tgaatctggg ttaaatttaa tcagtgagta ttctttagaa tggaagcatg 8580
agcctgaatg attaaagaaa ttgcttaaaa aattagaatc aaaatactaa atatcatccc 8640
ccccccaatg ttttagctag aaaaattact tgaaaatgag ccagagaagg agaaaaataa 8700
ttatcttaca gaaaactaat aaaaatacaa taaactatca tttatttaaa tacaataaac 8760
tatcatttgt taaaatacaa taaacatgca aaagcgctat cattgatagc acttttaatg 8820
tttaaataac ccactgatta ctttctctag tggattattt gcaagggtag agtaagaatc 8880
gttgcttctc tggacacata acccatttgc catgtgacat tgcctccctt ccaccaagaa 8940
gtggaatgta tttttcctcc ccttaaatct gatgcctata actttctttc cccttgagat 9000
aatggcagag tggcattgtg caagttttgg aactaaggtc ccacgaggcc ctgcggctct 9060
ctctcttgtt tatctgagta ctgccctaag atgaccatgg agagaagccc agtctagcct 9120
agaaaaggag aagaggccac atggagaact gaggtcagcc agccccagct gcttgacttc 9180
tgaacaaagc cttctccgac tatttggccc tgttagaccc agctgagatc agcagaagaa 9240
tcacccatct gaccctagcc caaattgcct tctgcagaac cacgggccaa taaatagcag 9300
atgctttaac ccaccatatt ttgcagtgat ttgttatatg gcaacatatc attgaaaaac 9360
cctcatttta ccaaagaagg ggggtcatga cattaagcaa ctacctaaac ccacaatgta 9420
aatggcaagt cagggattta gatgcaaatc attccaacta aaaatgtata ctctaaatca 9480
atgccctgta ctatactctg tattttccaa aaactaatta gattgtgtca tcagcatttc 9540
tgaagacaga ggtagtcgtc tgggaagtag agttttctca accagtattt tgcacttgtt 9600
gggatttttg agatcaggaa tgttttggaa aacctgagat gtgcagtcac atctctgagc 9660
agtgttttaa gtttattcat tcactcattc attcattcag caaatattta ttgagatcta 9720
ctatatgtta ggcactatgt ttaccactgg aaggcaggca ccaggtaagt acaaacacag 9780
aaactgagat ggatggcatt gcattttcat ttgattacaa atttattctt gcttataagt 9840
tgattaccta ccttattaag agctgatttg tttcaagttt tagaactcca attgtgtcct 9900
taaatttttg tctagcttaa aacatagtgc tagatttcaa gaagtaaatt gtcaaacagg 9960
tttgctgttt agtttttgta aaaaaggaaa cttgtaggca gaaacaaaaa ccaaaataaa 10020
taaaatctaa attatggtaa taactaaaga tagttgaggc attaacagag tttgactgaa 10080
ctctcaagtc tcaagcaaat ttctaaacta aactgttttc ttctgttaat cagtttaaaa 10140
gggaatacct tgtgctaatt tttcttggtg ttggtaacat taataaagct ctgtgaaatg 10200
aggccagaag gaacagaaat tgagtcaaaa taatgataac acctcttaca tattcttacc 10260
atcttgtctc ctagccacac acaccatgtt taaacctaaa aggagagaca cctggagggg 10320
ttaattagct tgcagctgtc tgtgactagt ctgcagagga taaaacggat atcagccgta 10380
agaaagcagc tagcactagc ctggatgatg aacaaagaaa agaagcagct gctgaggaaa 10440
agcacatttt gctgaccttt gaggagggct taagaggccc tttgccccct gaaaatggga 10500
cctgggaaga aagtcttgat ggcagacagt acaaaatcaa gggacagcag ctggctgttt 10560
tgtgtaaggg gcaaaattca agaggatttg tgaatcattg tgatttacag tgaccattaa 10620
ctattgtaat aaggagagaa aaatcaacat ccattcagtg cccacattgc aaattgccaa 10680
gcactggagg ggtactttca cctaggccaa caaacttaat aagcagagaa acccttcagt 10740
gttttggctc ctacagctca agtgtactag gttggcaagt ggaagttcct ttggtcatct 10800
ctgtttatac acttgtttga gatatttcat aaagtcagcc catttgttac tttatctgta 10860
gtatgtgctg tttcatgtgg aagatgcttg ccttttgata gtattccaaa ctgaccaacc 10920
ctgtacggat ttaagccact gagaagctat gaacagacag gtgaagtttt ggtattgcca 10980
ggaaccagct tgtccagaag tttaatcctt taaggaaaag gatagcaagc ccaatgcaac 11040
agcccttcat gctaaaaact ctcaataaat taagtattga tgggacgtat ctcaaaataa 11100
taagagctat ttgtgacaaa accacagcca atatcatact gaatgggcaa aaactggaag 11160
cattcgcttt gaaaactggc acaagacagg gatggcctct ctcaccactc ctattcaaca 11220
tagtgttgga agttctggcc agggcagtca ggcaggagaa agaaataaag ggtattcagt 11280
taggaagaga ggaagtcaaa ttgtccctgt ttgcagatga catgattgta tatctagaaa 11340
accccatcgt ctcagcccaa aatctcctta agctgatagg caacttcagc aaagtctcag 11400
gatacaaaat caatgtgcaa aaatcacaag cattcctata caccaataac agacagagag 11460
ccaaatcatg agtgaactcc cattcacaat tgcttcaaag agagtaaaat acctaggaat 11520
ctaacttaca agggatgtga aggagctctt caaggagaac tacaaaccac tgctagacaa 11580
ttgttaaaaa ctaaagttgt tggggaacaa attgtactta aaatatattt attgtgtaat 11640
ctgataaaat attttaaatt ctggtgttac aaagatttag tgtttctttt gttcttttta 11700
caaaacagaa acccactaaa atgttaactg attgacatta tattttttgc tttcgtcagt 11760
gttaaatact tgttgcacag tagtatgagt tgtttctatc atttactctt ctacaagcca 11820
gttgagacgt gttacgagga ctcaaaatat tctaattggc ggtgaccaaa tgtcatacaa 11880
ttatgaagta tacaagccat tctaaccttc acagtaaatt tttttaccct ctggttgcat 11940
acttaaatag aattatacta ataatgcata ttttctgagt gttaatgtca tgtgaaattg 12000
ctactaagtt aaacgttgct tcccatggtt ttctgggtga tgggtgttta ttctgcttat 12060
tcagtgcctc tctacataga ggaacctatc tcagtaactc ctatactact ctacaacaaa 12120
atggcagaag aaaagttacc catttgaaaa aataccttat tttccaaaca gaagtcttca 12180
gacaggcagt gcacaatatt tgccttccag aaaaggagat tgcataaatg cataacttac 12240
atgttagtac atgtgactgt ttccctgtct tatcctgaat gcatggaaag tcatgagact 12300
tatttttttc ttcctactgg attccattat aaaacctcta tttgtatagg ttataaattc 12360
taaccaataa ttgagcttac tatgttgagg ctgtaggcag aggataagat ttacatgtca 12420
gactttatgt tctgctcttt ggattaggct aattttcaaa agttattgac tgtaaaataa 12480
taatcatgca ctgaggaaat acaatattaa aataaatttt gaagaagatg gaattatagc 12540
aggggacctg tggaaataga atctaagaac atattgtaca tatgctgaat taatagagtt 12600
gcattgtgtc gttcacatag caaattcagt acagattgtt tgttaatgtc aacagattat 12660
gccgtaaaat ttgtaatttg tttggcaaat cttgacaatg ctgagacatt tattctagtt 12720
aatacaaatg gctaaggtct gtaattatga gttatttaag ctaagaaatt tggcaagttc 12780
attattcatc agtctctacc tactattcca aattaattga ctgttttata tactgataca 12840
attaatagta aactttttat attaagtata catatgtgaa ataaaatcat attattattg 12900
gattataaga tgttaataat ggtaagtcat gactgttatt ttgttgaagt gattttttag 12960
aatttttaaa ggtttattca acaaaataga gttatcttac ttaaaaatgg atgcttaggg 13020
ccaggcgcag tggctcacac ctgtaatccc agcactttgg gaggccaagg cgggcagtat 13080
cacctgaggt cacaagtttg agaccagcct ggccaacatg gtgaaaccct gtctctacta 13140
aaaatacaaa attagccggg catggtggtg ggcacctgta attccagcta cttgggaggc 13200
tgaggtagga gaattgtttg aacccgggag gcggaggttg cagtgagccg agatcatgcc 13260
actaaatttc aacctgggcg acagagtgag actctgtctc aaaaaaataa aaaataaaaa 13320
aacaacgctt agagattttt aaattaaatt agtttcaata cttctataat agttaaaaca 13380
agtggtttct atttaaatca caaatgatag aggttagaga tgaaactaaa catatgagat 13440
catcaagtcc aaccttctgc tacgatatta gacttcaaat ggaaagcaca tcaaacgtta 13500
accagatgat ttctttgata gtctgtttaa aaatattgaa ttaataaact ggaaacattt 13560
taaaaattgc tgttcttttg gaattaatat aaaaacatat actttaaagt aaggaatttt 13620
atactgatta agttatacac tgcttagcct agcatgtgta tgttatactt aaaaatgtgc 13680
attgtacatt gtcaaataat ttgcacacga tcatttacac atctgtattg ttcacattga 13740
cgtactttgt gtcatatata tttgtgcatt atcagttgat ttgcacattg cacaccagag 13800
tcacacagtt atagatctgt gtgaattccc tatattccac atgcatggac atgttcatat 13860
atacccacac aaatacaccc catgaaatga tatccagtta atgaatacaa aggtttttaa 13920
aggagaaatt cattagaaaa aaatcctata agcctctagt tttcccaatg aattaatcta 13980
agaatggata ttttattttt tccatgtttg acttgtaaag taaaacttta gtaataaaga 14040
gtgtctgcct tacagttcat atatttcttg aatttaaaaa actcaattac ataagaaata 14100
cattaattct tttctttaaa ctattaagac agcaaagtct tttttatgat tatctacaat 14160
tccggtcctc tctccggtat ctccaagata acatgattat gagtttaatg tatgacattt 14220
aaaactttga aactcacttt catatngntn tnnncnnnnn nntacataga atatatggag 14280
tgttgtttac atattattta tatgaataaa tatacaccta ctccaggtaa tttagtggtg 14340
actatcacgt attttatttg gtcattctac aattgattga tgccttttgt gtgtgtgtga 14400
ttactaatac tggagtatta atatacttgc atgagtctcc ttgtgtacca tgggaatagt 14460
tctgtatttg aaaatagaat tactgggtat gcacattttt aatttttaat atatacttcc 14520
aaattgttcc tgcatactcc caccagtact aagaatgtat ctgttttcct cttagcatgt 14580
caatatttga tataatgaaa cttgtaaatt ttagccaact aaatgagtgt gatttctatt 14640
cctttatagt aactgatgag gttataatca agttaagcat ttttttatat gtttattggc 14700
cactcaggtt tttttcttct acgaattgct ggttcacatg cttcgcccat tttccttctg 14760
gacttgtgtg tgtgtctttt tcttacatat attggtatat ttgacttttg tctattattt 14820
attttaaggt tataggattt tagagttaat gaaaggataa aatgctggag gcctagaatt 14880
cagaatcgta cataggattc taaacagaag ccatgttcta aataaggatt tggcttgtgg 14940
gacaaaagaa aaatgtggaa tttcacagnn nnnnnnnnnn acatttatgg gcaatagaga 15000
atcaagaatg actttgtcat aacatcggca tcattgaatg gtattgtcac ctataccatg 15060
atcaagaaat taacggtgtt gctctgcaga ctggcaaatc tcattgccct ttcttctaac 15120
cctgggaaag tattattaca atggaaaaag atatgcgaca agatattgta ttaatagggt 15180
gttagaatca aataaaagga gggatagatg tagtaagaga agcagatttt atagctatcc 15240
ccattccaag aataaaaaac aaaaaaataa taggcgagtt cattgtgggc atctgtcagg 15300
aacaaggaag gatagagctc tgaaagctga ctgcagtcac taacaaaaac ccttttgaga 15360
catattccaa gaacctgaaa aactggtaat ggacccttcc ttatactcgg tgtcttgaaa 15420
ggcagtaaac tgtctaatgg gatataaaaa tagagtcttt ttttcctccc ccactctaat 15480
attctcctat tttaaaaacc ttctttatat ggcactgcaa ataatagcac acagcaagaa 15540
ctgtactttg cagtattatt gagcatctca agtgtctgaa aggtacaaag ctaacaacca 15600
aatgacttca gaatggaaaa tgtcccagaa tttttaattt tccttctaaa acagaaatat 15660
aggggaagca aaaacaacct taatctaaaa tccagcttaa aatgacaacc agaggttttc 15720
tagcttatat tttatttcag aatgcttagc aaatttcttg actttgtatt aattttagtg 15780
agttgtaatt tgaggaaact catggttttc taagatcctt tatacctgaa aagttgtcgc 15840
atacgtgtaa gacttgcttt gttattgttg ttgtaaattg aatacctgaa ggtagatttt 15900
agtacactaa ataatcatga tgttcattct gtgctaatag gcaggaaaga tggacaatag 15960
aacttactgg gatgccagga agtgctctga tcacccagga gtgagacatg agatgggcag 16020
aaagaacaag attagttaac tatcatggga aacataagaa gaatttggct ttagggattg 16080
tgtgtttgag attgattttt aaaagaaaaa gacctattta aaaatccaca gatgcttagg 16140
gaatagaata gctatttttt taattcataa attttatatt ggttagtttt cacagcagtg 16200
aattatcaac tttatataaa agtaaaatga taatttgata tatttcctga tatgagtcca 16260
cattttcaga gccatctaaa ttcagccttg tttgttcatt atacatatat aagaaaatcc 16320
ttcttctatg caacaaatgg ctgtatataa aatatacatg acttgttgat ttaaaatctt 16380
ttaccttttt ttctcatcat aaaggtaaaa cacatgcatt tcataaatgt ttgaaaatgg 16440
gaacgtatgt accaaaaaaa tcacttcaaa atcatggttt acgtatcttc taaaaacatg 16500
taatcaaata taacaaagta tatttaggcc aatattttga ctatgataaa atcgctttga 16560
ttcagaaggt attgtgtttt ctgagtattt cattatttaa agcagaaggt ttcatctttc 16620
agaagtgtca ctccagcctg ggtgtcctgt gtggttgagt caaatcagtg cttccactat 16680
cagtaggttt ggcacaggat gaagcaagaa catcaaacta aaggggccaa gaacaatagg 16740
tgggagaggc tgcaggagga gcagagaggt cctgataatg aggttccctg actatagcag 16800
gttaggacta gacaagccct gtgaccaaca gaggaaagag tttctgagca ctttctatat 16860
ctggctgtac cttgggggac ttcctccatt ttgtctgggc tcatccacag tcctgctaag 16920
agattctgca aaatatactg cagttctcat tcatgtgccc cttgagatgc atttgagctg 16980
caggtatttt ccctccagtg gtacccagtt tattatttct agtccattca actcataaca 17040
acatccagca gcactttacc cacaggtggg tgtttattag gtttttattt cttttgtcca 17100
ggtttattga gtttgaagag taggcaggga tttctgtttt tatgagtcac ttgtcagctg 17160
taatgaagtc ttcttcacta aaaaaaagat gtgaggacaa tcttgcgcag tgtcataatt 17220
attctaaaaa tacatcatgc ttaattgtat ccacaaaggt tttaaaaatt taaacatcag 17280
ttttgagttt tagggctttc ttattggtga attatcaata attgtagtgc tttcttgaaa 17340
agttccctgg ggtggatttc cttagttgca tataattcta gcctcttcag cctactaagg 17400
ataaaaggga catgaagtac acatatctgg gaattaatta catttttctg ctcaagagcc 17460
aagtcatttt cagaaattga tgtcaaatag gtcttccata gctgaaagtg ctaggtgtct 17520
cttcacatag ttaagatttc cccctattca gaaatattag tttctgatga caatggaaaa 17580
ttccaaatgc agcagcttca ctgtgttcta ataatgttca tgcttaggga tcctgaaacc 17640
acttgcagta tgcctggtct agccacagca gggagccggc gcccatgcca gttcccagag 17700
ctgaccaccc cnaccgcagc cagcgtgtct ggctgtgcac catggccaga ctccatgctc 17760
actcactcat gcaccccgca ctgctcccca cctggctcaa ccttggtggg catgggatcc 17820
aggctggtag tgaaagtcaa atgctgcctg ccaggccggg tgggcagaac gagcccagcg 17880
ggtgagaaaa acttgggcaa acgtgccact ggctacagag gtttccggct ggtgaagtga 17940
caccctaagg attctgtgac aatgggaaaa ggggtaatga agggatagag cagattaagg 18000
aatttaaaac ccagttgagc aagtatatct gtaaataatg tacttttgta tactacaaaa 18060
ccacaaagaa aggatctccc tcctctatta tcacagggtc atcccggaag aactgacatt 18120
tcaatacgtt aaaaaataag tagataatgt ttttagcttt aaaaaaaagt ggaataatct 18180
atgcatatat aaagaataaa tgcacataac atttatgtgg gttatgtaag cagaggtaag 18240
cattataata aagcaaacac tgatgagcca ctggtgagga aacataacct tcctaaatct 18300
ctgaggcttt cagagtggct cttggcccat gtagaggtaa gggtgtgaaa gaacaggaag 18360
agagggcgtc catgtttgag aaaccacaaa atcacaggag tcgctaaagg agtagtttaa 18420
ttggttatat ggaggaaatc tggagtgatg ttagaagatg caattgacca gatcaggtgg 18480
atcacagagg ccatcctgag cagtacaata ggaaattaat cagggatccc ctatggttac 18540
cataccttat gggtttaaac caatgatgct tacgagggag aagttagctt ttctggacaa 18600
tgtccttggt gtgcactttt cagatggaga ttggcaagcc aatggctaag gagggtgaat 18660
cagatcaaaa ttcttccttg actttcatag catttccaga ggatgtctag tttatgagta 18720
aaatgtcttg ccttcatctc ataaaattat ctctatgtcc tcacctgtaa agatgttcta 18780
tatcanaaca ttattattta tacaaataat tatattttct taaaaagact tttttgtaca 18840
gtaaaataag tggaagcaaa cttaaatgat tcagaacaac tttctaaata tttgactaaa 18900
caatttcagg aaatagccat ttaatccctc gaaaacaaaa tttggcttcg gttaattttt 18960
agaaaatcct aagatgagga gatgaagcta aaaaaaatat attgaacact gtgcatttca 19020
ataaagaatt tacagaatag ctggaaaatt aaggttaagt atacaaggta attatatatt 19080
tatttttaaa atgaaaaggc atttaacaat ctaaaaacta catcaaatac attatattta 19140
gcatcatgaa actacttaat tatctgcacc tatcagtgaa gcattttttt tctcataaat 19200
ctgttctatg ataatctaca ggaagacata attttaaaat ttgtaaggat tagagtggat 19260
ggtcacctgg tcccaacctt tggaacattt gaaaagcaag gaacatataa actgaacatt 19320
aattttctcc ttgcaatgta tacaagaaat ttaaaaaaga attttccaga gtacaggtat 19380
aaaagggtat attcttgaca gggaatcaga gtgctgacag atggctaaga tttccatcca 19440
agaaaaattt gatgtttgaa cttaagaaaa tggaaanttt ctttgctgga cctcanataa 19500
tattttcagt aatgacagaa agtcaggaaa gatgaatgtg gaaacaaaat gttcttgaac 19560
acatgaaata aataggtaat ttagatacag tgggtggtgc cagtatgctc tgtaggtgaa 19620
gaataaatct ggaatcctag gaggtcgccc taaccagtga ggtctctctc acttatgaac 19680
ataaaatgtc tgggtactta ggactcctct aggcaataaa tgaccttcag ttagattgag 19740
ggctgatcga actgagaggg attagtacat aatttaatct atttgctaat tagcatgatg 19800
aattagacca ttgtcatctg ttgctgtgtg ggagaggaag aggacaaggc atttaagttt 19860
tgatgagaag gacatttatt gaatagcatt gtacacttta agagtggatt ctcatatatg 19920
atctaagtat cttagtctat agactaagtt tgattctttc ctttcattag tgacagagct 19980
acaactgtca cttgagtatt gggtgacttg acttctcttc caagtcgaac acactgcata 20040
acatggaaag aaggcaagga agaggagaat atatcttgtc ccatcactgg tcatttcagg 20100
ggagattttg gcactgaaga cagatcagga gcatatcaga taggaacaaa aaaaacaggc 20160
ttggtagctt aaaaggagga gtcaagtctt accaactctg aacactcacc tcagtagtga 20220
tgtttcattt ttaccctctt agggtaaaag agtctggtat ttctaagtat atgctttcta 20280
gtgtttgtgt ttactatatt taagaaacac cattagatca attcttatta atgattactt 20340
gatattaatc attatgatta gacactagtt taaaagcata gattagtttc attaaagact 20400
tttcttgaga gattatatat taaatgggtg gtgtacacat tcttactaag aaagttttct 20460
gctgtttata tcttaaatta atgtagaatt tctcccttaa tttctacata gaaacttagt 20520
atagataagc ttgtgcagtc agctgtgaat tcatctaggc ctactaccat ttcttcatct 20580
cctctaaaga ataaaatatg aactatcttg ttgaaattaa gtgctactag atctatactg 20640
ctagtgatcc tgtaatatca atacatgcat gcatacatac ataaatattt taagaaggaa 20700
aagaaatctg gttggaactg atgccttccc agtgagcctt tgctggctct tgacagtttt 20760
cgctctcttc tttaagggtg ttcagattat ctagactttc tagaattaat gattatttta 20820
tcgttttgac aatttttctt tctaagttaa aaccacattg gcattttgtg aatatgatca 20880
tatttctcat tttgaccaat ttttccctag cattacagtt cgttaattta ctggtaatta 20940
aataatgatt aaacatatta attaaacaaa taatgattat ttatttttgt attacgtttt 21000
attccttaaa gcctctctcc atcgttaacc cttttccttt gtnnnnnnnn nnnnnnnnnn 21060
nnnnaagccc ttccttagca tctcactgga ggtacgttca ggcagcatca ctttagtatc 21120
tcgccagcat tgtcctcttc ccgccagtgg gaaccaacta acaagtacac tctcaggtat 21180
gaacttaagt acaggcaagt caacagattt catatgcatc caaatgacac gttaaataca 21240
aagctttgct cacctgcctt tgtacaggag tctgctgctg ctgggtttta atgaaactta 21300
aaggctgaat caaagcctta ttagtgggag gatctttgac atgaaattct ttttgttcag 21360
tataatttgc attttgtatt catttgaaaa attgtcctgt gcatttgttc gaatatcgag 21420
aatagagaac tgagtgattc ctgggtttat gtgggtgata ttgtggaaat aagaggtgct 21480
gtggtatgta cagctagtcc ccaaatatga ttgtatttta ctagagatag agaattcaca 21540
gtgactngaa ctattcaggc tgtaaaatat aggaaccatc tgccatagaa taagcatatt 21600
aggaaaatgc cacctattcc tacattagtc tggcccttgc tccaaaattt cacatgtact 21660
catatgtttg ttttccgtgt ctctgattga tgcagctagc taatgcctaa tgacagtttt 21720
tttaatcatt ccctatatac atttttttat tttattatta tactttaagt tttagggtac 21780
atgtgcacaa tgtgcaggtt tgttacatat gtatacatgt gccatgttag tgtgctgcac 21840
ccattaactc gtcatttagc attaggccta tctccaaatg ctatccctcc cccctccccc 21900
caccccacaa cagtccccag tgtgtgatgt tcgccttcct gtgtccatgt gttctcattg 21960
ttcaattccc acctatgagt gagaacatgc ggtgtttgat tttttgtcct tgcgatagtt 22020
tgctgagaat gatggtttcc agcttcatcc atgtccctac aaaggacatg aactcttcat 22080
tttttatggc tgcatagtat tccatggtgt atatgtgcca cattttccta atccagtctc 22140
tcgttgttgg acatttgggt tggttccaag tctttgctat tgtgaatagt gccacaataa 22200
acatacatgt gcatgtgtct ttatagcagc atgatttata atcctttggg tatataccca 22260
gtaatgggat ggctgggtca aatggtattt ctagttctag atccctgagg aatcgccaca 22320
ccaacttcca caagggttga actagtttat agtcctacca acagtgtaaa agtgttcctg 22380
tttctccaca tcctctccag cacctgttct ttcctgacat tttaatgatt ggtgtgagat 22440
ggtatctcat tgtggttttg atttgcagtt ctctgatggc cagtgatgat gagcattttt 22500
tcatgtgttt tttggctgca taaatgtctt cttttgagaa gtgtctgttc atatccttca 22560
cccacttttt gatggggttg tttgtttttt tcttgtaaat ttgtttgagt tcattgtaga 22620
ttctggatat tagccgtttg tcagatgaaa aattttctcc cattttatag gttccctatt 22680
cactctgatg acggtttctt ttgctgtgca gaagctcttt agtttaatta aatcccattt 22740
gtcaattttg gcttttgttg ccattgcttt tggtgtttta gacatgaagt ctttgcccat 22800
gcctatgtcc tgaatggtat tgcctaggtt ttcctctagg gtttttatgg ttttaggtct 22860
aacacgtaag tctttaatcc atcttgaatt aatttttgta taaggtgtaa ggaagggatc 22920
cagtttcagc tttctacata tggctagcca gttttcccag caccatttat taaataggga 22980
atcctttccc catttcttgt ttttgtcagg tttgtcaaag aacagatggt tgtagatatg 23040
tggcattatt tctgagggct ctgttctgtt ccattgatct atatctctgt tttggtacca 23100
gtaccatgct gttttggtta ctgtagcctt gtagtatagt ttgaagtcag gtagcttgat 23160
gcctgcagct ttgctctttt ggcttaggat tgacttggtg atgcgggctc ttttttggtt 23220
ccatatgaac tttaaagtag ttttttccag ttctgtgaag aaagtcattg gtagcttgac 23280
cacatagttg gaagtaaagc actcctcagc aaatgtaaaa gaacagaaat tataacaaac 23340
tgtctctcag accacagtgc aatcaaacta gaactcagga ttaagaaact cactcaaaac 23400
cgctcaacta catggaaact gaacaacctg ctcctgaatg aatactgggt acataatgaa 23460
atgaaggcag aaataaagat gttctttgaa accaacgaga acaaagacac aacataccag 23520
aatctctggg acacattcaa agcagtgtgt agagggaaat ttatagcact aaatgcccac 23580
aagagaaagc aggaaagatc caaaattgac accctaacat cacaattaaa agaactagaa 23640
aagcaagagc aaacacattc aaaagctagc agaaggcaag aaatagctaa aatcagagca 23700
gaactgaagg aaatagagac acaaaaaacc tttcaaaaaa ttaatgaatc caggagctgg 23760
ttttttgaaa agatcaacaa aattgataga cctctaacaa gactaataaa gaagaaaaga 23820
gagaagaatc aaatagacgc aataaaaaat gataaagggg atatcaccac cgatcccaca 23880
gaaatgcaaa ctaccatcag agaatattac aaacacctct acgcaaataa actagaaaat 23940
ctagaagaaa tggataaatt cctcgacacg tacaccctcc caagactaaa ccaggaagaa 24000
gttgaatctc tgaatagacc aataacaggc tctgaaattg tggcaataat caatagctta 24060
ccaaccaaaa aaagtccggg accagatgga ttcacagccg aattctacca gaggtacaag 24120
gaggaactgg taccattcct tctgaaacta ttccaatcaa tagaaaaaga gggaatcctc 24180
cctaactcat tttatgaggc cagcatcatc ctgataccaa agccgggcag agacacaacc 24240
aaaaaagaga attttagacc aatatctttg atgaacattg atgcaaaaat cctcaataaa 24300
atactggcaa accgaatcca gcagcacatc aaaaagctta tccaccatga tcaggtgggc 24360
ttcatccctg ggatgcaagg ctggttcaac atacgcaaat caataaatgt aatccagcat 24420
ataaacagaa ccaaagacaa aaaccacatg attatctcaa tacatgcaga aaaggccttt 24480
gacaaaattc aacagccctt catgctaaaa actctcaata aattaggtat tgatgggacg 24540
tatctcaaaa taataagagc tatctatgac aaacccacag ccaatatcat actgaatggg 24600
caaaaantgg aagcattccc tttgaaaact ggcacaagac agggatgccc tctctcacca 24660
ctcctattca acataatgtt ggaagtcctg gccagggcaa ttaggcagga gaaggaaata 24720
aagggtattc aattaggaaa agaggaagtc aaattgtccc tgtttgcaga tgacatgatt 24780
atatatctag aaaaccccat tgtctcagcc caaaatctcc ttaagctgat aagcaacttc 24840
agcaaagtct caggatacaa aatcaatgtg caaaaatcac aagcattctt atacaccaat 24900
aacagacaaa cagagagcca aatcatgagt gaactcccat tcacanttgc ttcaaagaga 24960
ataaaatacc tagnaatcca acttacgagg gatgtgaagg acctcttcaa ggagaactac 25020
aaaccactgc tcaatgaaat aaaagaggat acaaacaaat ggaagaacat tncatgctca 25080
tgggtaggaa gaatcaatat cgtgaaaatg gccacactgc ccanggtaat ttacanattc 25140
antgccatcc ccatcaagag atttttttac acattccata tgtgaatatc ctattttctg 25200
attcagttct gactttattt ccattatatg tgaatgtgtt tctttactat ttttctatca 25260
gtttccttcc tggtcaattg actatatggg aaaatatttt atccattcaa tattcaaaaa 25320
tagtttattg aggacccact atgtgctagg catttgatca caacagtgaa aaacagagaa 25380
aaaatccttg ctttcatgga gtttacaaat tctaccaaag gaaacaggaa ataatgaaaa 25440
taagtaagta aaataaatag catgctacat agtaataagt gtcaaggaga aaaggaaagc 25500
agacaaagag aggggaaggt gtgagcagga attgcagttt cagataaggt ggccatgaag 25560
gtgtcccttc aaggaaaatg tagtagttgg gaaggggcaa gtcacatggc tctctgggga 25620
agagtgtgca gggcatcggg agcagccctt gcaaaggcct tgagaaggaa gcatgcccca 25680
tgctctcctc ctcatatgag gaggccaaca ggtcttgaat gaagctatgg agaaagagaa 25740
agggaatacg attggaaagg taacaaggaa tggatcacgt agagccttcc agggcaacgt 25800
aatgaccttg gctattcctt ttaaatgaga tggaaagccc gtggagcatt ttgagtagag 25860
gcgagacaaa actgatcagg acaactctgc ttgctgggca gagaatagaa tcaagggaag 25920
caatgacaga agagactgtc ctaagagtcc aggcgagaga tggcagtggc ttggacaaag 25980
gtggtagcag tggaggtcac agaagatgct gaatatagtg ttcatgttta ctttatggga 26040
tttactaaga gattggctgt gtgttaaaag gaaaagatca ttctaaagct tctggcctca 26100
gtgattagat agacttgcca ttaacttcca gaagagcatg tttgagggga aatatgagga 26160
tctcggtttc attacatgtt aagttccagt aatgtgatta gattgaaaat gctatagctg 26220
gtagaatttt ttcacttttt atgtcaaaac agaaaacatg attgaataat gaaaactaca 26280
catgctcaat ttttttaaaa ttgttttctt tgacacagta aaggatcaat gagacttgct 26340
taattcttgt caagaataca aagtcaacaa tggctgagat gaaaatattt tccataaagt 26400
aaaatgatca aatttgcaaa agcttggtta catgatgtga atttcactca aaccacaagg 26460
cattacacta gagtcttgct gaaatttaag acagactgtc ttaggaatta tttgccaata 26520
gacaaaatga atatggggtg gttgatgtgc tgaagtggcc aatgagcatg ctttgattga 26580
cagatgagga aatgtatccc tacattttat caaactatgt ggtgtctgat ttatatcact 26640
gaggtggcca ttcattatgg tcatgaactg tgaggtcaaa gcacttgcaa aaacttgcca 26700
aaatacttcc tattccagta ctaaatattt ctcatatttg tttgcctaga ataacaagat 26760
gcaggcttgg tagtcctttc aagaatgtga atttctttgg tatgtctgag tttagtaatg 26820
ttgaattgtg tgtgtgtgtg tattattctt aagactttgc ctgtatttta acattttatt 26880
tggtaaaaat agcattattt tggcaagatt tttaaagcct tgaaatggga caaattaaag 26940
tataatgctt tttcttgaga aataatttat tgctccatgt tgttgaatca taccattagt 27000
catgaaacca aaaccctata tttaaaaagt aacaatctca tattcaaagt atctcctttg 27060
aacatttcaa agaatcttaa gcaaatcttt atgtgacatt aaattgtaca ttttaccttg 27120
ttattttaga tctatgggtg gagttcattc ttcgggctaa gtgtaggtat gaagtgtgaa 27180
tttctgtgtc ttggtatgcc agtaacttag ggcaaggtta gtagagtggc ttttgtgaga 27240
aaaaaagagc tgttttatca gacatcagtt ggaactttgc cttgttttgt ttccctgaac 27300
cgtccaatct gcttcatata cttgtgtgaa atcctaaaat gtctgtatgt caataatttt 27360
tagttagcat attttttcca aacagacatc cttgtgaaca tcagccgttt ctgagaactg 27420
ggcccacgga ccatagctac tttgagtctc agtctatgta atagttgggg taaagtaagc 27480
tttaaagaga gaactcacaa cacaatggct caagcaagac acaagttgat ttctttctga 27540
agctgccatc ctgggtatgt gggtatttgg atgagctggg ccccatgaag tcatcccaaa 27600
gtgcaggcct ctgtggcatc tctgccaaac tcaacactta ctctccaagt ctgtccttgg 27660
cttctctatt tctagctggt ggaagggaag ggaaaaatga gtccagggaa ggagtttttg 27720
tagatggctt gggagttgca tacatcagga agaactttgt cacaaggcca caactccttg 27780
caggaaattc taggaaacat attccctcac tgagcagcca tgcgcccagg aagaagagaa 27840
gaatgagtct agagtcgcaa gcagcaatat ctactacagg cttaaataac caaaggacaa 27900
aatgcccagt ccattataaa tatattccaa aaatgaagcc atgaaatttg acttcattta 27960
ttgaagtcaa aacaaattta ttgttatgaa ctaatttctc tattttatat ttctcaaatg 28020
attacatttt taacacagaa caaagccata gttagaattt cagtaatcgt atggaatatc 28080
caaaaggtac acccaataca cccaaaagct aaaccagagt cactgctaaa ttttatattg 28140
ttctgattta cctaacagat tagtgaaaat aattaaaatc ttgctgcttt ttaaatttta 28200
aatatcggat tttggttaga actctaagaa tatttaaaac tatctttacc tactcttgtt 28260
ggacaatcat ttgaggagct aagagtgcag agaaggcaga gaaatgttct cctcaaccca 28320
agcaaaagca cagaagaact attgctaatc caaaatgcag gaaggaaatt tcacccctcc 28380
tcccttccct tttcttgggc tagtctgttt aactttaaaa gcagaatttt tgctctcaca 28440
aagtatacca gacaggaatt tgttcaaatt cctcaaaacc aagccaagaa aagtttcaga 28500
aagttcagac atgcatggca gagtggaaag aacatagtct gtggaggcga gcacggattc 28560
attggaatgc cgctccagac atccactctg ggtgaactca gggatgtgtt tagtctcatt 28620
aagccacagt cttttcattt ttaatgtaag agtgataaga acgacttgcc agtgtgttgg 28680
tggagaactg aaatagagaa aggcctggtg tgtaacagga tgtttctctc catctgtgta 28740
atctgtgaca gtcctaggaa gttcaaagtt atgactgttc tgggtttgtg gccaacagtt 28800
gtctgtggct tccatgggtt ggagctgtct aatggggccc agnccaccat cgctctgctc 28860
agaagctaat cataccaaaa catgaggttt ttctccaagc gacaaagagg ggctaagcac 28920
ccaaggatct ccataatagt agcaggaaaa tgaagctgag accttaccct gacttagaag 28980
ttcataacaa taatggcccc aaacaagatg ctcatgtcta ttggttgtgg ttaataatca 29040
tgcaacaaca tgaacttcaa acccagccta tgcttggctc ttccagggac tgaaggcatc 29100
tcagagcccc accccttacc tcagaaaccg caggaaggag cctgggttct cagagtccaa 29160
gaaaatgcac ctgataatag cacctgaact tcctccacac aaagaaagcc tgatagggac 29220
aggggattaa gcttgcatgg agggcaggat ccaacccaca gtagcacttc cttgccatgc 29280
gaccttagca aatggcttaa ctcgctttct gtatcagtaa aatggtgttt gtagtactaa 29340
ggtgtcagtg aggattaaat gagccaagcc tgacccacag caattcatga caagtctcag 29400
ccactttaat gaatgtgatg atattctaac gtttgggatg ctgaggtgga ggacgatggt 29460
gtcccacctc ctgcaaatgc catgtgaaca ctgaagctac acaagcaatg gctctaaagt 29520
caaagccagc atcaggactg gtataaaaga atcaccagga caagggcagg gcagagggga 29580
ggccaaagca gctttgtcag tgcctgcacg gctggaccta gaggaatttc tcgacataga 29640
gggtaaaaca acccattggc ccacatttct gaggaccgac gtgggagaag ggtcacatga 29700
ggccatgaaa tgggcatctg cagaggaaat ggaagccagt gtctggagac aagtggagcc 29760
attgagctag caatgcgtga tagatactgt gggaagggat gtggggaatg cagcacctct 29820
caagggaggt ggctgagtct ggcaatgagg gcctggggca tccttagtca gcaaagcagg 29880
tctgcagcct cgggagctct ggcagctggt gtgggtcacc aactggcctc gggcaccatt 29940
catggaaatt aatctggata gtcccctcct ggagaccctc caggatggca gatgagcaga 30000
ctggccggct ttcaaagtct gctgacctct ataattgtgg ctcttcacat ggtccaacac 30060
actcttccct tttacatgtg tttcctcttt gaatatttcc accagcccct ctccctgacc 30120
tctctctgct ttgttacttt cctttgccca tttaatctac attttatgtt ttgtccagat 30180
taacatacct gtgtttcatc tgccaggcac tggcccaggc cctaggaata tggtggtgac 30240
caacacagag tggctgcttt catggagttt acaatctaca aagggacaaa aaggataaac 30300
aactttaaac tttaaaattt ggacaaactt ttataaatac tgcatttttc caataaaatg 30360
agataaacaa tggtataacc tacattgtac agaatctgtg tctccctaaa attaaagctt 30420
tgagataaaa ggagacaaga ggtattgttg gacttgaatt tgtcgtgcaa ataagattaa 30480
aaccttgaat attagccttt tgattgttgt ctctttttgc agtatgaggt agttgtgaat 30540
tctaggtcaa aacataaggg ttaaaaggct ggaaaaatta aataggccaa atgaaagaat 30600
tgtcttgcta aaatgtctat gtagatgata aaatgtcctt gtgcctcttt aacttcaatg 30660
atttgtgctg gatattttat aagcgtccat taggcaatag caaatttatt caactataag 30720
agaattacga aacacaacta tcataggaga tacttatttc cttccaacca ataagtaacc 30780
accagtgatg agaaggcaga aagtgacaag attaaccaag taagagagtt ggatacaaca 30840
ttcaactcca tttcttcatg tcccaataag agacaacgtt tgacctgccc tctcattcct 30900
aatcttgttg aatgaatcta gtacagaggt tcataaaaac cgtcaggtat ataatgccgg 30960
attttgtcaa caaacaataa caataatttt ttctttaaaa attattccag gccaggccgg 31020
gtgcggtggc tcatgcctgt aatcccagca ctttgggagg ctgaggcggg cggatcacga 31080
ggtcaggaga tcaagaccag tctggccaac atggtgaaac ccccatctct actaaaaata 31140
caaaaatcag ctgggcgtgg tggcagggac ctgtagtcgc agctactcgg gaggctgagg 31200
caggagaatc actttaacac gggaggcgga gattgcagng agctgagatc cagccaccgc 31260
accctagcct ggcaacagag caagattccg tctcaaaaaa aaaaaaaaaa gaaaagaaaa 31320
aaattattcc aggccaggtg tggtggctca cacctgtaat cccaacactt tnggtggcca 31380
aggtgggtgg accgcttgag ctcaggactt caaggccagc ctgagcaaca tggcgaaacc 31440
tggtctctac aagaaataca aaaattaacc aggcgtggta gtgagtgcct gtagtcccag 31500
ctcctcatcc gcctgtaatc ccaggcggag attgaagtga gccgagatgg caccactgca 31560
ttccatcctg ggtgacagag ccaaaccctg tctcaaaaaa taacaaaata cacaccaggg 31620
cctgtcaggg ggtgggaggg aaggggaggg agagcatgag gacaaatacc tagtgcatgt 31680
ggggcttaaa acctagatga tgggtcaata ggtgcagcaa accatcatgc cacatgcata 31740
cctatgtaac aaacctgcac attctgcaca tgtatcccag aacttaaatt taaaaataaa 31800
ataaaaataa taacataata aaataacaaa aaagtcttta catctgaaat aagtgtactt 31860
aaaattaaaa ataaaattaa agtacaaaaa cttaaaataa aaatcatttt agatatttcc 31920
tcagatttaa atggaggtca ttgaagctca aacacctggc tgcaaagtga tttgtaagac 31980
gaacacctac actctacaaa aagacttatg aataccctgc attggttgat gaacaagaac 32040
agtgagttat accttctgaa tagtgaatta aataaaatac tattaaagtt ttaaataatt 32100
gccaattgct ccatatttct ctgcatgtta gagtttagct agtgtttcca gggatgattt 32160
ttctgtattc ctcccagtca ggaatagcca gtcagtatta ctccatcagc cacagcacaa 32220
atgtctgatt gctctcttga ggtcgttagc ccagatactt gctagaaagg tatgattgct 32280
ggccaaatga gctctggcct ggtgcagccg tcttgccaat gtgcctaatg agagcgcgga 32340
aagacatttt attccaggca taagcaggcc agatcacagc tgcccaaagc tctctggctt 32400
tgattaagtt tgttgtgcta ttatgtaatg ggtacttgaa ccatattccg tgaatgaccg 32460
ttttccttcc tctttcgcca ctattctaag tatgttgtct gtatctaatg ttgccttgca 32520
gttagttgtt aaaatcaagc agaaaagaaa acaggcaaat attaaaacgt aaatagaaaa 32580
agttgttggt ggggaaaatg acttataatg cattattctg acataatgtc ttggggtcca 32640
ccaggagaat cgccccatca caattcagcc tctctctgtg ctaatgacgg ccttttcatc 32700
ctgtgctgtt agtgatgcat aagccaaatt gtgaccaggc agactagacc acatgtaagc 32760
agagaaccac gtctttgtag acattaattt aaaactcgtt ctaatcaaat atgttcattt 32820
atctgtacta tttttgatct atatcttaaa tcaaaacgaa gcttttttga cttctggttt 32880
ctgtttctgc ttgtaaagag cttggaagtt atcaatcctg tcttcataac aagaaaaatg 32940
ctgagcacac tgaaagtcag taactggaaa tcaacagtgt tttaaaagtt aattggttac 33000
aattttctca tattcttctc tcacctctgt agagttctgg tctacattgg aaatgctgga 33060
aaagtaggaa tatacagtac agagctttct tggcagcata acttaataca tgaaaaatga 33120
tttttaattt tagtttaacc tttaaactgg aatctgtagc acattggaaa aaaaaaacct 33180
aaaccagttg aacaaatttc aattttaaac atgttttcag gctttggaag cttactgaag 33240
aatgtggata gcaaatacag gaaaaattct gtgaatattt ttattcacat atgtaaacgt 33300
gaagttataa gacagaacaa tttccccatg tacaagcttc aaatttttag cagttagtta 33360
acattttcta ttcagtttta accattaagt tgtaatatta ttacaaatga tattagaaca 33420
catctttgct tttagtgctg tattataaat atttaaatta atgacattca gtgtaaattt 33480
ggtatttatc gtaatacaaa taagaacttt atttttagtt aattccatgt gttatttgta 33540
tttcttatct cacatttatt taaaattaca tttggtccct atcactcagg tatgtttctt 33600
ccctcccacg tagacctaat cggatttttt aaaattggat tttaatctgc ctttataaac 33660
aaacgtcaat tatttatttc caatcttggt tgatcttttt attccgagat tatttactag 33720
ttcattcagc cttcctatta aaaataaata aataaataaa taattgctct tgtagctctt 33780
ctgaggtaga ctgaccaggt ctaccttatt gttaattttt gcattttcat ttttattgaa 33840
tatgtatgat gatgcagata tgaaccatgt gcatatctca gaataggagg aaaaatatct 33900
tagtactttt gccaaatgct tggttctaat ttttggacta ttatgaattt tttatgtcat 33960
aactattatc ttaacattat gcgaacttct agcccttttg cttcaatttc ctttgaaaag 34020
atttccttcc aataaatctt taaaatatgg gtgacaaaac taaaagaccc tcagaggaaa 34080
catatttctg gtatgacata ttttgtgtac tctttaggac aattgaaaag cttctaatta 34140
acatttcttt agcgccttag tggtgatcag cagtatcatc actgccctag tgcatccatg 34200
gaagttgagg tccagggtgt actgactcac acaggttacc taggtaagaa gtaatggatg 34260
actggaatgt taggaactgt aaatgacagc taactgtggc aaagcgtagg gttttgtttt 34320
tttttttctt gtcttgtctt ttttttttga gacagagtct tgctctgtcc ccgaggctgg 34380
agtgcggtgg tgtgatctcg gctcactgca ccctctgcct cccaggttca agcaattctc 34440
ctgcctcagc ctcccaagta gctgggatta caggtacatg ccaccaggcc tggataattt 34500
ttgtattttt agtagagaca aggtttcacc atgttggcca ggttggtctc aagctcctga 34560
cctcatgatc cacctgcctt ggcctcccga agtgctggaa ttacaggcat gagccactgc 34620
gcccggcctt tcttttcttc ttaagacaac taatggaaaa taaacttcca agaagctctt 34680
ttgacctgac ctcactgctc ctcaaaggca gaatgctgat tcacaggctg aggggtatct 34740
gaccaggttt ctttgctacc cttactctca gcctacctgg aaattgccga gcgcaggggg 34800
cgcagggagt gctgtagttg gcgtgtggac tgagcgtcct gggaactgtt ctgctgtagt 34860
acctacactt tcctgccaat gtcagcatcc ggcttgtcaa cacttctttt ccatttgtga 34920
atactatagt gaaagccttc acctctcctt tctttgaagt attctctgtt cagaacttgg 34980
aactttagaa attttctaca tttaaggaaa catatttcaa ctatgattct ttattactta 35040
taaaaaatta acttagaaga tatatgtaaa catgtgtatg gtttaaggta acaaagtgag 35100
tttaccaata tggcaagttg tgccaaaaga gtgcttaagt gtaaaaaaca aacaaagaaa 35160
ccaaaatcaa aattaaagta gctcaaaaac ataaagttta taaatatttt taaggcattt 35220
ataattttaa aaaagtcctt ttatgtttgt cccatgttct ggaatagcaa ataaaaaatg 35280
tggtttttgc tttattttgt tttattgcct tgatatgcca cgtggcaagc ctcaggctgg 35340
gtgtgtggag cacatgactt gagtgtgtgg acaagttgtg ttgaagatta ttattacagg 35400
cacaatgtta cagcacagtc tatcagggaa aaatacttaa gtttattttt ttgaggctga 35460
gcgtggtggc ttatgcctgt aatcccagct ccttgggagg ctgaggcaga aaattggttg 35520
aacccaggag gtgaaggctg cagtgagcca agactgtacc actgcactcc agcctgggtg 35580
acagggcgag actccatctc agaaaaagaa aaaaaggaaa ggaagaaaga aagagagaga 35640
aaaaaaagag aaagaaagga aggaaggagg gaaggaagga aggaaggaag gaaggaagga 35700
aggaaggaag gaaggaagga aggaaagaaa gaaagaagaa aaagaaaaag aaggaaggaa 35760
ggaaaagaag aggaagaaga agaaggaggg aaggaaggaa ggaggatcgg agggagaaaa 35820
catggtttac agaggtttta ttcactagga tggtaacatc ctcccaagta atttagttct 35880
agctgcttta tcgtttagta aatctctgca attcaggatg cacctttctt gctgttgctg 35940
gtctgctgat ccacatgatc ttatttcatg tatgtggatc atccagccac cgtgacaaat 36000
gttcattatg ttgagtccag atgtccacct taagagtaca cacccctcgc tgctgctttt 36060
tttttttaat tatgtcacac taaatacatt tactttatga taactactgt tggggtacaa 36120
tttactctta ccacagaacc agctctcagt taagaagaaa gtgctgagat ggtgtgggga 36180
aatttggtga agaaaaacat tatagtaagt tacagtcaat ctcactactg acctttggct 36240
aaaatttttt ttaatatgtg gctaaaatct gcataacaga tggtatatct gagtgaagag 36300
attattagag gatgagagaa actgagagtt caccaaaaat aaaaactaat aattgcaata 36360
tagattttgc catcaaaagt gacctcaaat gcaagtttgt agctgaattg aagaggtggc 36420
cactttgttc ttaatctggt ggctgctgct taggtttcat tgtagaggct actgagctgt 36480
tttgcaagtt tgtattatct gtctcatgat ccagacagaa ccagagtcta ccaacgtgga 36540
ttaagaatta gtctgttttc ttctgtgttt ttctatgaat atactgaatg tctcatcttg 36600
attcagaaga aaaacctgaa agcttaccca aaaacaaaca aacaaacaaa caaacaaaca 36660
aaaaaaaccc tgtgtgtggt ttgtcttggg acagttcaga aggcagtcat ttaatttcgt 36720
ttgggaacat tttgcactat ttatttcatt caaaatatgt taatttattt tcgattttaa 36780
ttaatgtact tttgtaatgg cttattccgc aagcagagat agcctccctt cccccaaatt 36840
ctaagatatg catgtataca gtcatcttac tacatagcag gaattttaaa aagaaataag 36900
cttttctttc cagtgcctag ttgttaaaac agcaaaatga taaaaattta tgtaatggta 36960
ctattgagct gtctactgtg tggcaaatac tttatacaaa taagcaatgt cttaggatct 37020
aggcttttag ccttcaaaaa tctttaaaga agaatgaaat gtcattttta agtcttgtat 37080
ttgatctcaa gtgaagagat tcaattcatt tcaaaaatac ttaatataaa ttatatgcta 37140
gaccctgtgc taggcactgc agggcaaaag ctgaagaatc agagaggctg tcaagttaga 37200
aaagtgtttc tcaattggca atttttccaa caagggccac tggtgaatgt ctacaagtat 37260
ttttggttgg gggttgcagg gactgttgga atttagtggg tagaggtcag gggtgtggct 37320
acacatcttg caatgcatag gacagacctt cccattaaag catcatccac ctgcagatgt 37380
cactagtacc aaacttacat tttgtgtagc ttcagcaagt tctctcttaa actattcatc 37440
gctctctttt ttcattagtt ctgcagttta ataagaatat tgccctatgg agcagttcta 37500
gcactttggg aggccgaggt gagtggatca cctgaggtca ggagttcgag gccagcctgg 37560
ccaacatgac gaaaccctgt ctctactaaa aatacaaaac ttagccaggc gtggtggcat 37620
gtgcctgtag tcccagctac ttggggaggc tgaggcagga gaatcacttg aatctggagg 37680
cagaggttgc agtgcgttga gatcaagcca ctgcactcca gcctgggtga cagagcaaga 37740
caccgtctcn naaaaaaaaa aaatagctgg agattaggca agttgtatat atgtaaacat 37800
aaaaagacag aaacaaataa aaaccaatat agcacaaccc accccatctt gaacaagttg 37860
tacttctaat catgcacatg tgaaaacatc aagctcttat ttgaccacca ttcaggattg 37920
aatatttagt cattgcaaat gtagttgagc aaataagtat ctatttggag tttaggatta 37980
ggatcataca cttccacagt taaatctact gactgacagt agacagttca ttgagacaca 38040
gatacagcat agtcatccat gtatagtggt tgagtaacgt gtaagtttct tttcccttcc 38100
aactgaaggg gatgctcaaa ctgagattta accaggacaa agtcaatcag cttctctctg 38160
aaaagggtga tgtctgatca gagtcagctg gaggatcaga aagagtcatt tagaaaagtc 38220
tgagggaaac tgatgatctt gagtaacaag aaagttgcca ttttgttcac cacagatgaa 38280
agtctattcc cagacagtaa atgaagccgg ataatcaggc caatttcata aacagtagat 38340
cagattggaa gagttaaagg accagataag aaaacaagca cctgtagcag gatgacccga 38400
gtaacacaaa ggatgattca cgcaaagggg gtgcaaggac taattctgca gactcctata 38460
gcttgttgtg ccttgcaagc ccaagagagg ttcccaaagg gactgaagcc tggcagcatc 38520
cagtgaatgg gctctagcat acctggtaag gagctgtctc agaagatggg gtgttccata 38580
tccctggagg ggttaaagtt caagaacatt gctgaggatc caaacactgg gagagagaaa 38640
gaaatggatg gtcataaaat aaatcctctt tgttctttta aaaattctga gtgtgggagt 38700
gaaggtgatt tttcagacca agcccttggg tactgactca ttcttattcc actgtctcgg 38760
gcttacatct ccaattctaa cttcccaact tctgtcatgg cagatcaggt attaccattg 38820
ttagaatagt actataggta ttttgtgttt ggagagaggt ttagtggtag gaccccaggt 38880
ttgtagtgtg ttgctagtta tcatcacaat tttatgaccc tctcacttga gagtggaatg 38940
acaatgtggt tatgtaacct aagactagaa gaaacaaatg ggagtactcc caaaacacaa 39000
atatctcacc tcttttttca tgggaaaaga gtcagcagaa gagggcaaag cggtaaataa 39060
aatcctaaag gtaatcaaaa cagatgggaa tataattttg ttcagagcta taaaaaatat 39120
cctctactat tctcaataca ggcagtgtgt agaaagtttc aaggttagta tttatcttct 39180
aaacatagac ttgtggtctt cttatttaat caattcaaac caccagtgga agaggtcaga 39240
aagaatgaat gaaatcagga gaactgatta tcatgagtat cattgttgtg attgcatttc 39300
ttgcacagct ttaatttgtg ccttgagagt ttggggtctg agaaagtagt gctattccaa 39360
gagctctcca gggatatttt tggaacaggc cttattgttc tctaaaaaat taatgcgtta 39420
tattcccagg tgctgttgta gcatcatttt tcatttaaca aaaatatggt cgtttagcca 39480
gaaattttag ttctataatt aaaatggact aaaaatattc tgtagcacat ctagaaaaaa 39540
tattttaaat gtatcaatgt tcttcctaga aattttccat gttggatcaa acagtagatg 39600
aagacttttc tgtgtgtata gcatgggttt ttatgtttat atatgagtgt gcaggtgttt 39660
taagagaatt ttgaaaatca gcaaagcaaa gtcaattcac tacaaaatag tttccaaatt 39720
atctgtgcag tattaatatt gaggaagaat taatcaaaaa gcaaatattt gagaaatgct 39780
ttcctatgtc tgtaggctac aaaatcattg tttaatttat caacaatctt tgagtgctcc 39840
tcagtgtctg gtacagaaat gaaagataca gttttaactt tagagtgctc acacctactg 39900
agggaaacaa acaaggtaga gaattcagta tgacgagtga catgagacag ttgaatggga 39960
ggctctctgg gagtactaag ggccattgcc tagtgtagct gagggcacag aggagctgag 40020
ctgggcagcc caggagtctg tcaagagggc cagagggaag cagtgcaggg ccagcagcga 40080
gagcgggact gtgcaaaaga agtttcagta gctacagttt ctttctcagg gtcctccact 40140
tcccaaagaa aatgaaagga acatacattt gatttttgtc agtttaaata ttggtcgacc 40200
attggaaaac catttttgaa aagtgatttc ttttgctatg tttggcaaag ccaggagtag 40260
taaagagatg aggaaggacc atcttcgtcc attgcctttg cctttgtaac tgttacttct 40320
tcacagcctt tctacccagt gtagttcacg tatgggaaac atttctttcc atcgtcagcg 40380
tcttcctggg gagtgttttg gttatacttt cacgaatgtc tcacctcttt gtgtcaacaa 40440
acccttctct ttgagctgta ctgtgggttt ctgtttcttt cctttttntc ctttgtccaa 40500
ttagaaaaaa aaatggagta gaagtttcaa ggctactagt tcaatgtgct cttttttact 40560
tgactccaaa tgacatcttg cttgcagatg tgattaagaa agatctggac agggagaggg 40620
aggataattt tcaatgttcc tctcaaattt aatcttatag tgacaagctc catattctac 40680
atgaaaatgc tcagttaata cagctattaa acttgaatgg tagataatag tggatttctg 40740
tagccactgt ttggtttcat tcaaaaacct agaggaaaat aagggatata cattataaat 40800
tgtttgttta atgttaaaaa tatgtttcat attcagtgca cataaagcaa aggtattgtc 40860
cagtgttagt acctatgaat catcaataaa aacagttgct tctgtttgct gttgacattt 40920
tatgtatgtg ttgttcctct ctgaaccttt ttcttaaaag tcaactttta agaaacttat 40980
aagtttactg tggagagcct atgaacagat gcatgagggg gcgcctgttc atatggataa 41040
gatagggcta taaatgccct tatcttgcca gggctcttct aggcctcttt agggttaagg 41100
catactccct tctgagaatt tgtgttgtaa ccggttgtct agcttcacgt cctgtttcta 41160
tggattgttt gtaaccagct tttgctgcaa ctgttactgc tgattaatac cttgctaatc 41220
ataggttatg gaaagactgt tttctgtttt aaggctctgt tagaaattgc tgatgcacac 41280
aatattgtaa attcttatct ctgtatactg tacttctgca tacagatatt atgttaaaga 41340
attacttcat ccccatgtga ccatctcact tcataatcaa atgactctaa atccctcact 41400
aaactacccc caccctcact aaacttaaca ataaatgctg gtatatccag tacgttggcg 41460
gcatcacagg accagaaggc agtgatcccc ctggacccag ctttcactaa aaaaaaaaaa 41520
aaaaaaaaaa agaaacaata aacttagcca ttataatccc tcagaaaaac attaactata 41580
tttaaggata ataagagaaa ataatctctt tttaacatac ttattgatac ataataattg 41640
tacatattta tggggtacct gtgatatttt gttttatgga taaaatgtgt aattatcaaa 41700
tcaagatatt taggatatcc ataacctcaa gcatttatca tttctatgtg ttgggaacat 41760
ttcaaggcct ctctgctagc tattttgaaa tacacaatac attgttgtta actataatca 41820
ccctcgtctg ccatggaaca ttacaactta ttccttctat ctaactctat gtttgtaccc 41880
attaataatt tctttttaaa gccccagtct caatcaagag aaatataaat agcatggtaa 41940
aaaaaaattt tttttgacct gatgatatgg gttcaatttc tggttctacc actttccacc 42000
ttggagacct tcattaacca gtgaccttca cttttctttt ctgtaagatg gtattgataa 42060
tatctgccct catccccact tcgccatttg cctagctaat aagacagaga tttccttagc 42120
atgttgtgtt aaagaggcta gaaactcaac atgctttaca aataccagct gtatgacaag 42180
gagttacagt accaatgtac aaaatatgat ttttaaaatg aaaggcagga catttatgaa 42240
gttatattct atagaaagta tattagcaca cattaatgca taataggcga taggactgca 42300
ctttgcttct ttctcttagc ttttctttcc agcctctttt tctcccttgt catcaagtct 42360
gcggctggac ttgccttctg ttctgcatgc cttggtgttt gctgttgctc tgattctgct 42420
ttctcatgca caggctcaaa gaaacagtga ggctgcccca acctgtgcaa ctctcctctt 42480
tgtttggata cttggtcata tgcacattct agtttaaatt tctgtgtaac taaaacatgt 42540
atgagtggag attggtttta tattctgtaa taataaaact tatttataga agtagaattt 42600
attgaggtac aaatgtttac cagttttatg aataacaact tatatttatt ttataaacaa 42660
cttcaatggt atatgtgtgt gtgttttctc acaaaagcat attgagcaat tattttcaat 42720
tttatagtca taaatgatac ctgaaatatc ttaagaacct accctgtgat ttacaggaat 42780
taagtcatta aatccttaca acacagtaaa gtctgtgtta tttcccattt tacagatgga 42840
gaaactaact acagaaagac tattaaagag gcaagatatc atcacagttg gatgtgtggg 42900
gctttgtacc agaatgactg agttaattcc agttccctta attattatct ttgcatcctc 42960
agacaagtca ctttatcttt atatgcttta gtttccctgt ctgtaaaaca tcttatagtg 43020
ttgttaggat taaacacatc ttttccctac atggcatttt aggttctctt aaccaatgtt 43080
aaaaaatcta tccacatatt tttagctttc ctttctttcc attactagaa gtactttcta 43140
tgaggtaatt ctcccagaaa atacaaagtc ctatttggtg attcactgcc ttacattctg 43200
gtgttcggta acaccatgga atccaaagac aagctccatc atatcaattg tggagcctga 43260
gatactttac tctccctgtg agaaagtgat ttcaaatgaa actcagttct cccatttatt 43320
tcattttggt taaaactata gcaggtgctt ttcagcttat tgaatgtgtt aggctccaag 43380
tggcaagctt aaatggtaca tatccttttt ttaattatac atatatatac ttggtttgac 43440
tgtttatttc cttttccaca ttattatttg catttaacag ctaaaggtat aatatcaaat 43500
tattttattg ttagatgttg aaattaccct ggcttgaagt cagaaacaac tttattaaaa 43560
ttttaagaga acagtaaaat gtgttgcatg tgattctaat caatttttga agcacttttg 43620
tcattgagaa aataagtatg gataaatatt gattgttttt ctggaaaatg ctttcttatt 43680
tcaaaagtca gctgtgactc agtctgtcct cctctgtcat gacaggaact agtatattca 43740
ccgtctatga ggccgcctca caggaaggct gggtgttcct catgtacaga gcaattgaca 43800
gctttccccg ttggcgttcc tacttctatt tcatcactct cattttcttc ctcgcctggc 43860
ttgtgaaggt actgcgaaga attgtactaa gaaagtctat gttctgtgat agttctgcag 43920
atcttttgtt tggttttggt tgccctctgc tttgtcattc ttagactttg gtaaatgtgg 43980
tttgtgattt ttttcagaac gtgtttattg ctgttatcat tgaaacattt gcagaaatca 44040
gagtacagtt tcaacaaatg tggggatcga gaagcagcac tacctcaaca gccaccaccc 44100
aggtacgcta tcagcaagag gatgttataa cccattcgag catgcacatg tctcaccctc 44160
accatcagtg gaccttgggg aagctcttgc atgatgggct tctatagtct gactcaggaa 44220
gctgtttaaa aatacagttg ccagtcaggc acagtggctc atgcttgtaa ttccagcact 44280
ttgggaggct gagggagagg gattgcttga gcccaggagt ttgagatcag cctaggtaat 44340
gtagcaagac cctgtctcta caaaaaaatt ttaaaaatta gccaagagta gtggcatgag 44400
cttgtagtcc cagctactca gtaggctgag atgggaggat cacttgagct caggaggtca 44460
aaggtacagt gagctgcaat cacaacactg caccccagcc tgggtgacag agcaagatcc 44520
tatccccaaa aaacataaaa gaaaataaaa taaaacaggt tcaaaggccc aaacacagaa 44580
caatcaaatc agagcttcca ggcagtgagg taatgacacc tatattttgt aacagctccg 44640
tgggtggttt tgatacaaaa ccaagatcgt caaccacatt tattacatac ctttgattct 44700
gacatcacaa atcctcaaat ggcttgtgga taaaatgcaa ccactatgga atttcttact 44760
tttatgggta tttattcatg tacttgcaag cctatgtaat gtctatgtgt aggattagaa 44820
ttttgtaatg gaaaatatat ttcattcaga acaaaccaca gtacaataaa ctatgaaaaa 44880
gatccctcaa ccccaaatgc atgtttgtga ttttttaaag aatccctata tattcagaag 44940
gattcccata agttccatag caatattgtt tccataaaac cataaggctc ctgagaattt 45000
gaaggtgggc tacagatttg ctaaaagcag cagggcagtt attacaaaag agggcaattc 45060
agatccaatg cctttgtttt tatttttggt tttgtttcac gtgtgtgttt ttgtggtgtt 45120
aaaaaaagga agggcagatt tgtgtatctt cttctagcgt gaatctttat aaaagagaga 45180
gaaaatataa attccagaat caggaataaa atgatataat gccttgtaat tattataata 45240
ttaaattcta aaggatattt aacaactttg taaacactta caaatactgt taagacaaag 45300
gtatctatca aggagccgag gtgtacaaat tttacttttg aaaaccctca agttgagctt 45360
ttaataatta tttgttaaaa tgcaattaaa cacactaatt tgggaaaagc ctggtggtgt 45420
tgaggcatct ttatgatgct gtaaaagtct gaattgtcca gtcaattcat tatagatgaa 45480
atagtgtcag tcttattcag tttttacaaa caactgttca aacttccatg aaaggttttt 45540
tgaatatgct atccaggtta tatcagaaat gccatgtaga aaagccttca agaaatcaac 45600
catagcaagt tctcatctcc tctctcctct ctttttgcaa actatgagag ataagaaagt 45660
tcccggtcca ttccgaggtg gcagcctcta gaaggacatg ttttcagtta tgactttgag 45720
acctaaatgg aatatggaac tatgatctca gcccttaact cacatgcagt gttcctggag 45780
atgacctaag attcctttaa aaccatagta tgtttatgga gtaactctca cgtataaaat 45840
cacagctgga aaaaatagtg tttggaagca ccaccaagtc aggcaatggt tctaatagaa 45900
agggaaatgt gaagagactt ggaacaaagt tgtacagaat cattttgatg caaaattgta 45960
cttaatcaag aggaataaat tggtaattca gaggtaatgc gtctagatat tcagcagtgg 46020
taatcataca gagaattgtg aaaaaccttc attaagaaaa atgctatagc tgaggacctg 46080
gttgctaagc aaccaaagct cctgctgtca gcctctgggt gaaacaccac tcaggcagcc 46140
tagcaacgag cttcaggccc cgcccaccct ggctagccac ttgcgagtgg gccctctgat 46200
gcttttatgt gtagagaagg gagagacata atttgccatg atgctattat gtttgtaaaa 46260
tatgaccaaa ttccgtgaac agggacttct cattcagtgg tttaaaacac tagatcacaa 46320
gttactaatt tgaaggaaat aaaataaaga tgattattat aatgcacaca gcttttcaaa 46380
catggaagta cattcttgcc tttctctagc atatggaaaa tttgcagttg ttaaatatag 46440
gctattctca tcaaaggact aaagggtcct gggcttgttg gacttgttga tgtctaagtc 46500
tgcagacttc ccataacagc catgtgtata gaaaatatgt gnnnnnnnnn nnnnnnntat 46560
atatatatat atatatatat atgcacattt tcagaacaaa gaaggggctt tctgttatat 46620
taggcagctc actaggaact ggctctgaca gggaccattt caagggaggc gaaaggaaat 46680
ctgtgatgag aactgtttct ttaaaataac gaagcaatat ttttcaattg aatggtcacc 46740
accaaatgcc tccaagacac agcataggaa caaattacag agacattaat gccaagggtc 46800
tttaggagac cataatataa catgtaactg gaaaacagaa ggaaaatgat gtagaaaatt 46860
tcaaattact aaatattgac tctggcctct gagagccttg tgatttcata cctgcctgat 46920
tcttagacgt gggtaactat tgccttgtgc tcagttgtgg attgggttga aggataagtg 46980
attcatacac ccatgatata ataccctgct ttgttaatcc actatagggt tacccaggcc 47040
acaacttttt agtgatgtcc catgactgga tgttgggatg tgcaggtgag ctgaaagacg 47100
aagtcctgag taccgtatct cactaaccca gacctttact cccattattt agatgcttta 47160
cttcagatac ctgttatgag ccccatggtc ctctgatcta gactagctca tgatggagat 47220
gagcttatcc caactttgcc ttgagtagaa ctcaaagaac tgctaaattt tagagccaca 47280
caaggctact tttctgttaa aatggtagga gacagaaagc aggcttctga cagtcaatac 47340
atatctaact tttataaatg aatcataatc caataggatc atattgaagg tttggtaaat 47400
aattaaatat tctgattgca caaagacagc aatcatttct gggtctgtta ttatctctga 47460
ttgagcactc ttgctgacat gtgttttctg aattaatatc ccctaattaa cagagaagac 47520
tgataaaggt agaactggtg tgggaagaat gggcactttt gagtttttct cctttgggtt 47580
tccatcaaca ttcttagaat atgggttata caatgcctaa agcaacttgt gcataaatgt 47640
tcagtgctgg gttaaaaagt agagaaaaaa tggatgaaaa gacacatgat ccaaaatgga 47700
aagaatttct cctccaaaaa gaaagctaca tataacttaa tgctcaaaga aaatacttta 47760
gcaaaaatgt gtttactgtg ttccaagacc atttatttcc tcatgaatat acatcattaa 47820
aatatgtgag aaaacaattc aattaatgca tttcagggaa gggtgcttct agcatggtgt 47880
aataatgagt gccttctaat aagaaaccat aataatagaa tagtacaatc atcataggaa 47940
accataaatg agaattaaat tttgtgaggt tgcatcattg aatatattat ttcgtaatga 48000
aatcaagcca ggtatccact ttcactattt tctgtcatag tgactattag ctattttttg 48060
aaaaaccata aattttcaaa gaatccaaag agcatgcaaa ttgcaaagta aattttagat 48120
tttctctgca ttactgtgta tgtggatgtg tgtgtgcctg tcttgagttt ggaattctaa 48180
ttcagctgct agtgattctc cattaccaag attctttctc ttaccactat ccattagata 48240
acctgttatt catgttgttg atgatgatga tattatgcct ataatggaac aatcccagaa 48300
gcatttttag ctactttaca aaccaaccga ccagttataa aactgtagca gttgcaaatg 48360
gacaggcctg agagaattct caaagttgaa atctccatgc gcttccaaat gattgtgcta 48420
agaggagagt gccatggaaa ttcatttgtg ttattggtga gattctacta attcagaaca 48480
tcttcttaca gtcactccca tatattgaga tctgcactag tctaatggct ttacaaactg 48540
tcttatttaa ttttcataat aatactgtga agtgggcact attaatgtct ccactttgca 48600
tgtaaaaaat gacaatgatt ggaaagttaa ttatctaacc caatgttata taactggcta 48660
gtggtaaaac tgggactcaa aaccaggttg ctcagctgca agagcctttt tattcagcat 48720
gagatgctac cacctttcaa tttagccatt acaagccctg ctgtcaacat gctgtctttg 48780
ttctggcctc atgttaactt ttcttttctt aaaaaagaca gtatttattg ctggctgaaa 48840
gggacattcg catacattgt tgccaagagt atgaattaaa acatcttttc cagaaaaccg 48900
tttggcaata tgtatccaaa agtaaaacat acatactatc tgaccaagaa agtccgcttt 48960
tagaaatgta tcctaagaaa aattgggggc agtagccaag ggcatatgtt tgaggatgtt 49020
tatgaggcat tatggcaatt ttttaaaaat ggaaacaatc ttagtctcta gcaataagtt 49080
atcgattata aattatgaaa ttggaataaa tgcaaaccat taaaataaga attgaacttt 49140
attgatgtga agatatgctg atgacatatt agtacaaaaa aagatcctat gtttgtctgt 49200
gggatgcagg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtataatac ctggaatgtt 49260
aactgtaaaa tgttagtggt ggtgtctctg gggaatgggt ttaagctgnt tcttttgcaa 49320
ctcatncctc attttctaag cctttaatag taaaatnatt taattataga atgagaaagg 49380
aaaattacat cagtnnnntn nnaaaaanna aattaatgga cattctaaca gaaaccacgt 49440
atactagtta agttacattc agttgcaagg gacaaaaaag cccaaaataa gttgcttagg 49500
tgacgtatgc gatgaggaat cccattctct ctcatataaa gttggaggtg ctcattcagc 49560
atggtatggt tgtctgtgtt gccacggatc cagacacctt ccttcctgtt ccactttgca 49620
cagcccccat taccacagtc accttgtaga ctagcatggc tgctgtagct ctaaccctca 49680
catccatatc ccagagagca ggaagaagaa ggaaatacag gaaaagaggg tttctgcttg 49740
catcctatag tcctgtatgt agttacatgg tcaagctcag cttcaaaaaa agggcaagaa 49800
ctggcctttt ttcttggtag cctagtggcc ccatacagat tctctttgta aaacagggaa 49860
aagagataca aaggaaagac tggcagtccc tgccacgctc cccgcaagga tttgagtctc 49920
tgaggattct tggcttctgc tagctagccc agcttctgtc tcaaagatct actgtaatat 49980
taaccaatct aaatgttgta taattcaggg gattaaagag aaattgaacg tttttgcatt 50040
tcctttactt atttcataca aataagtgac cttgggagaa cacttttact gaaaattaaa 50100
ttgattcttt tgattttggt ctattgaaaa aaaaatttaa gagagaaaat tagtctgcta 50160
ctgatcaaag tcaatatatg ccccagggat cctttatgcc acaattagag agtataggat 50220
gtatcaacag agggttttta ttaataactg gtgactggca atgctggttt tgtcttttat 50280
ccttaaaatg aggcttccag aattttgaca gaaactttac aaggtcctat aacaggtttg 50340
catctccact gatgtctata ttctcagaat gagctattca ggaagaatat gcttgattca 50400
ccccaaaaag agtttttgca gtttattcta aagaaaatca gaatcctgta aatggacagc 50460
tgagatgagc aatttgcagt tggcatcttt gtcaaaggag ctttatgtaa atgtgcacct 50520
taattttgtc atttaaaaat acatatagga ggcagaagct gggggattgc ctgagctcag 50580
gagttcaaaa ccaccctgga caacaagctg aaaccctctg tctagtaaaa aaaaaaatac 50640
aaaaattagt tgggcattgt ggcgggtgcc tgtagtccca gctactcggg aggctgagac 50700
aggaaaattg cttgaacccg ggaggtggag gttggagtga gtggagatca cgcccctaca 50760
ctccagcctg ggcgacagag caggactcta tctcccccca aaaataaata aataataaaa 50820
atacatatag ggactgtgat ttttggcaac tgtctctcac cacctcactc attttataga 50880
aggcaagttt attttccaca aaggatctac caccactact accagggatt tgaaactcta 50940
attacaaatc ctaggtaatg ggatctttgc atcatctcat tcgtatttcc atcagcagtt 51000
accccttcga atacagggtc agactaacag gaggacataa ataagggtga caaaggaaac 51060
atttatttct gtaaaacagc gacctcaggy aggaatgaaa cagtgagcac ttgtagttag 51120
tatcattatt tagaaaaaca aaaatgttta attttgccct attcctacca tacacacata 51180
cacacacact cgctcctaag aactagaaag aaaaatatgt tagtgggaaa atacgtgaaa 51240
gtgggaaatg tcttccagct gggtgtaata ttgacacata ggtaatatgt gatgatacct 51300
aggagataat aggtacctag gagataataa cctaggtatc taattcaatg gatttcagat 51360
ttagtgggcc tgtagcatct tgaatttcat cacttgggtc tttaatccaa aagaaactac 51420
ttgttccctt cataatacgt acataaaatt tctgctgagc aggttaattg ctgcctagtt 51480
aaaataatta cacaaagtgt attaagcaat gtggcaatct tctaccatta aaataacacc 51540
agttctttcc ctatgccaca cgcacacttc ttattttatg gatcctgaga atatttttat 51600
taggtcagtg ctcctgttca gccttgaggg taagatacca tggtagtcca agccagggag 51660
tggaagactg tccactaaat aaaaataaaa atttgcaacc tatagtaaaa acacaccaga 51720
cacaatgctt ttaaattctg attttcattt tctcccagat ctaatagata tttatcaata 51780
taatggggat aaaatactaa agtatttctc ttgtggagaa gaatatttga gcaattatat 51840
gcaaagcata tgcaagacag aaagtgcctg acatagcaag tagtcaataa actcaagtta 51900
ttatcattgt tcttttttca ttcatttaag ctttcaatgt taaagaacta taattgaaat 51960
gacttcattc caaatataaa tccataagaa gacaaatttt tgataacata aaaatataca 52020
aagctggaga catagagttc tcaatgttcc atattaaatg tctctgactc atctcccttc 52080
tttgtcttga agatgtttca tgaagatgct gctggaggtt ggcagctggt agctgtggat 52140
gtcaacaagc cccagggacg cgccccagcc tgcctccagg tgcagtacaa tgacattttt 52200
aaaaatcgcc cagcaaaggt ctttgaattt tatttcatcc aagaaaatcc acagctcttt 52260
aagctctaga tttgtccaaa tttaaaatcc tgaagttaga gatggtattt cactccttcc 52320
tctattccca ggacctagct tttttttttt taacatacac aatagggatt tgataagttt 52380
ctgatggctg caggcatgta agagcatttc agtggtattg aatcaatgaa gaattttgtt 52440
gacatgtgaa atcttataaa aatattcttt accgaaggac tgagttatgt ggcagtgggc 52500
aaattcattg tttcatacct ccccgagtaa ctgggaaaaa tatgttaata catagtctct 52560
ctgtttttct gcatttggaa gctttcagag gaacataatg tagaggtgtt tctttagcaa 52620
agtgcactga tagcaaacat aaggattgca ggtggggcct gagagtcctc atgagataga 52680
ttctcacagt gattagaaga tggagtctca cgtccctgcc tgtgaacttt ctggaaaaac 52740
catcttctcc aagctgccat tgacaacaat atggataaca ataataacaa taaggcccaa 52800
taaactcctt tatctcttct tcagggggcc atactgacat cttctcttcc ttggtttccc 52860
ctccttgccc cctaaatatc agtaactcat tcaaaataat gtcaccttac caagagcagc 52920
acccctaact ttccataata ttttcacttt cattttccct ccaagcagcc cactcgtagg 52980
accggagaat tgattcttcc acctggagaa ttttattttc tttagccttt ttggttttca 53040
gtgacaaatc ctcttctcgc aaggggtggt ttccatagtt gtttatatcc tgccctcata 53100
atttggagaa gtgttcacat ctgccgtggg atgagactgt atctcttttc tttcttttgg 53160
gtctttctcc agatagggac ttcttatgca actcaaggat gggtacatga aaaataaaat 53220
tgtactctga gccattactg tgggctatgt ttatatggcc attttaccat agagttattt 53280
acttcttttt gtttctattt gtattgaggt gtgattaaca aataaaattg taaatactta 53340
aggtatacaa tgtgatgatt tgatatatgt acacagtgta aaacgattgt tgcaaccaag 53400
ctaattaaca cacccatcac cgcatatatt cagtagttac ctctgtgtgt gtggggtggg 53460
gggtaacact taagatctaa tctcctagca aatctcatgt atacaataca gtattattaa 53520
ccattaatga atcactttgt ttattagatc ctgagaactt ggccatcttt tgactgataa 53580
ctaatatctc cccatttcta ccccctgtcc ccagcccctg gtaaccacaa tcctactctc 53640
tgcttcaatg aatttgactt tttgagattc catatataaa tgagattatg cggtgtttgt 53700
ctttctgtgt ctagttcatt tcacttagca taacgtcctc caggcttatc catatagttg 53760
tcaatggcag gatttttttc tttattatgg ctgagtaata tttcattgta tgtctatacc 53820
acattttttt tatccattca tccatcagta gacacttagg ttgttccctg tcttgaccat 53880
tgtgaataac gctgcagtaa acacggggct gcagatgtct ctttgagata ctgatttcat 53940
ttcctttggg catatatcca gaagtgggat tgtgggatca tatggtagtt ctatttttaa 54000
ttttttggga aacctccata ctgcgtttca gaatggctct accaatttaa atccccacca 54060
acagtgtaaa agggttatct tttctttatg cctttgccaa atagttatct tttgtctttt 54120
tgatggtgac cattgtaaca gatatgaggt gatatctcaa tgtggtttaa atttgtattt 54180
ccctgataat tagggatcgt atgcactttt tcatatacct attggccatt catatgtctt 54240
ctttggaaaa aaatctactc agaatttgct catttataat cagattattt gcattttgtg 54300
tttgtttttg ttttttagtt tgggggcttt ttgttattga gttgtatgag ttctttgcat 54360
cttttgaata ttatctcctt ttcagaaata tggtgttcca attttcccct gttccataga 54420
ctgccttttc attttgttta ttgttagtta tttatttctg tcagtttaaa aaaatggagg 54480
gcaataagta gaaaagctta caatgaatat tgataagtat tattttgtgg tcctccttcc 54540
atcctatatt tgatgttgac tatgctgcta atataaaact actacaacta cctttactcc 54600
tactatcact actaatagta ataacaataa tgacaaagat tatagtacta gcttcttacc 54660
taaaaagcac ttttattgac attatttttt aatccatcaa ctgatattta ctgagtacca 54720
actatgtgct agacactaag atagtcttga aagaaacatg cacagtctcc acactcatag 54780
agcttacagt atgcttgaga gtgggaggga aaaaggcagc attgagctag caatcacaag 54840
agtgatgtgg gttttgaaag aagtaatgca agatgcaatg agaatatata aattggggtc 54900
cgctttgaga ggtcagggaa ggttttagtg cataatctta aaatcaaaac cttgagtaat 54960
tccagcattt tgggaggctg aggcaggcag atcacctgag gtcatgagtt tgagaccagc 55020
ctggccaaca tggtgaaacc ccatctctac taaaaatcca aatattaccc aggtgttgtg 55080
gtgcacgcct gtaatcccag ctacttggga ggctaaggca caagaatcac ttgaacccgg 55140
gaggtggagg ttgcagtgag ctgagattgt gccactgcaa tgtagcctgg gcaacagagt 55200
gagactctgt ctcaaaaaaa aaaaaaaaga gagagagaga atgaggaaaa gaatgactaa 55260
ggatgaggtt tactacaacc ctgtgatgta gaaagaccta catgcctggt cagccattta 55320
taggagaaag tgctgattca gagaacatag ggatgtgaat tacattcaac cagagggaga 55380
acccaggact aatggctggg tcttatggct cctagcccca tgctttatcc agctgaaaaa 55440
aatatgcaag taatcataag ttcgtgatag agaaataaac tatcagggct actctgagtg 55500
ccaaatcaga gtcgtatggt atccagagct ttaaaatcta ttaaatcctt gttaatagat 55560
gcctcaaggt ggccatctga aattaggagg caagtcagcc tccttatcac aaagatttga 55620
gaataacaag ggattaatga cagggtgaag tgtgatgaca aaatcgagca aggagatagt 55680
aaaataaaga ttggaatggt gtggggatag atgttgggct tgaagtgtat agatgtggca 55740
tctcagagac ccctatatga gatatgtgtt atgaatatag cagcatgctt atgacatctt 55800
atgaatgtga ctcatatgct tagaaactgg ggggaaaggg gtcaggtaat tcagtgtgac 55860
acaagtttca ttccactcaa cttcatgtgt ttggccctga ataaagcttt ccagaggcag 55920
caatgaagag tgcatggaag aaaagtggga tggccaagaa gttatctgtt tgtaccgggc 55980
aggagctgtg attagagaga gaatacattt ctatgtctca gcaagaaaat aattaattaa 56040
ttaaaagaaa agaattaagt aaaaatatat tgaagataaa atggtcctga aatacttgat 56100
ggctttcact aatgattaat gccatctaaa actgggtaac aggaaaactt tcatctcagt 56160
cttccactcc ctggcttgga ctaccatggt atcttaccct caaggctgaa caggagcata 56220
taccacttct ttttatttat ttatttattt atttatttat ttatttattt atttnnnnnn 56280
tttatttatt tattttttga gacggagtct cgctctgtcg cccaggctgg agtgcagtgg 56340
cgggatctcg gctcactgca agctccgcct cccgggttca cgccattctc ctgcctcagc 56400
ctcccaagta gctgggacta caggcgcccg ccactacgcc cggctaattt ttttgtattt 56460
ttagtagaga cggggtttca ccgttttagc cgggatggtc tcgatctcct gacctcgtga 56520
tccgcccgcc tcggcctccc aaagtgctgg gattacaggc gtgagccacc gcgcccggcc 56580
ctttttattt ttaaaacaag caaaatgtga acatgttctc ataaaaaatt aatatggaaa 56640
taaaattaaa aggaagagtt tacttgaaat cttctttcaa tgtatccttc ctcattcttc 56700
ttccaatgag taacttggag gttaatgttg agtcgattct tctcagactc ctgcatttat 56760
gcattttatc tcacatgaaa aagcatttct gcctccagga agcactgaca ttttcacaga 56820
atgtttcctc ttcctacacc acttccttct cactcatcct tcagaactca gctcaaacat 56880
cactttctta tcctcaaaaa ataagccagg tacctctgtt acatgttttc atatcatcct 56940
acacttttct tttatgtctg tcataatttt aataaaataa attaaggata taattagttg 57000
ttgatgtctg cttctccaac caggggaaat tccattactt tagagaccat accagtcatg 57060
gtcacttctg caactgtgct ttagacatga gagatgatca attatgttta ttaaccgaga 57120
acagtccagt gaaagaagga ggcagtacct tcttggctta tgaaagtact tatttgacct 57180
ctcgcttaga agctgctctg tttgtcctcc tggtcttgtc tgtaagaact agaaattgaa 57240
tagactgtgg caataacacc cttttccata cagaacactt atttctatat gcatgtcgtt 57300
ggagtctaaa gcaagcagta cacttggagt ttgcttccag aaagtgcctc gcagaggttg 57360
taggactttg gatatctctg gatagttttg ccaggatgtc tcctctaata tgtggtggca 57420
gagccttggc aggacataac cctgacttct gttatgtttc acctctttca gaactctttt 57480
catcttgtaa gcatataaga taaatttgtc ttatgtttag aaatatagtg ttaggaatag 57540
catcattgaa aagaacccaa actcattctt tttttttttt tttttttttt ttgagacaga 57600
gtctcactct cctgcccagg ctggaatcca gtggcacaat cttggctcat tgcaacctcc 57660
gcctcccagg ttcaagtgat tctcctgcct cagcctccag agtagctggg actacaggca 57720
tgcgccacca cgcctggctg atttttgtat ttttagtaga aaccgggttt caccatgttg 57780
gtcaggctgg tcttgaactc ctgacctcat gatccgccca cctcggcctc ccaaagtgct 57840
gggattacag gtgtgagcca ctgtgcccag ctgaacccaa actaattgta tgttaatgag 57900
aaaacagagt ttattggaat gaaacatttg aacggctgta ctttgtaatt ttgaaactgt 57960
tgaaataaat tagaaaaaat gaggtatcaa taatatctga gagacagcaa actgatgttt 58020
gagttcccat ttaactactg ggaactgttg attttgttca aagtgggact ttgtttttaa 58080
atttgaccca aagtttaaaa accagagtat tttacataaa aacccacacg tcctacccat 58140
cttgtaaaag agaatgatct ggcaataaag agctctcatt tccacctggc tagagttggc 58200
cagagctgag tggtggctgc cacatgagca gaggcagaga ggctttattg tgcctcagtt 58260
tcccaactct ccatattgtc tccacagcac tggaggtgag tgttttacct acccaagaat 58320
tcatacattt atttttctaa gagtagagaa agatttctct ttgtccgtga ctctatcgtg 58380
tggaaataaa taaacaagta ataaattcat aaatatataa atgtataaag atacacaaat 58440
gcatggatga atgaataaag aataaataca aggcatttta aaagcaccct gtgattacag 58500
aaaacaatga gaaatgaacc tagtatttta agaaaaaagt tattccgatg tgttaaatat 58560
gtaaccctaa gcctagtttt ctcattatgt tacttgctag gtctcaggag gcacttggtt 58620
gggtgactca cggaataaat gaaaataatg taactttaga tcacaaagat tatataataa 58680
caattagtcc acacatttca gtgattccaa aatagtattt tcatatattt tatgttttta 58740
acattttaaa atgttaaaat cataactcag cataattgga agctggctca agttctctta 58800
taaatgaaat gtactaaaaa atcaaaactg tctccattgg tattatgtat tatacttttc 58860
accatatttt ctactctgta tcctcatcca gttactataa gtaattaggt aatttaataa 58920
aacaagattg attaaggtgg cttaattttc ctcaccatta ttaaattaaa tacatgaagt 58980
aaccaatgct tctgtgatgc tgagtttttt acgagtaata atttattctc tctttctccc 59040
tctctctcta tgtgtgtgta tatatacaca aacatatata tacacacgtt tttatatata 59100
catatataag tgcatatgtg tgtatatgta tatgtgtata tacatatata tagaaacatt 59160
gctggcataa aactattagg attttatata tttcaatggg cagtgattct gatcacacat 59220
tagcaactaa ttttaaattg ttttcctaca ttcccacatg tgcacataca tattttacct 59280
tatatcaaat atttccatta ttatggtatt tgtttcctct tttcaaatat tgcttatgga 59340
gatagtcaat gaattagggc acataaaaga tcttcttact cttctacaga aaaaataggc 59400
tctattgagc catttgtgga ggagaatata ggcatctttt gtctgcagtt tgaaaccaca 59460
aatttatttt gtgttctgaa acacaaatta caattacaat catagctata attataatta 59520
gaataggaac catatgcagg catgcaagga aacgattcaa tctggtgccc ttgaagtgat 59580
ctttctgttt ttataataaa tgaaaatgca catacttgta aatttaactg caagaccaca 59640
agtttggagc aggaggacta gcagaaaggt attgttagct tggtaagtta tatgtggtga 59700
gctctttaac gccacttgtt aaaatttttt gttaatcaac ttaattatat taatttgtct 59760
aggacatttc tcatgtttat ccagttatta atgaaattta taccatgctt aataaggctg 59820
agtttaataa gatactgagc atggtaaatg tgtgcaattc ctaataaatt tatcctcacg 59880
ttaaaacgag taagcgaatg tcctagaacc cctgaaaaac cccctcccat cctctgtcat 59940
gcctgcaatg tctttctggc tctttctcat ctctgtgcat tgctgatgtg cttgtcactt 60000
aggggcccct cgtgcctgtt cctttttttt tttttttttt tttttttttt ttgagaagga 60060
gtctcgctct gtcatcaggc tggagtgcat tggtgcgatc tcggctcact gcaacctcta 60120
cctcccaggt tcaagcgatt ctcctgcctc agcctcctga gtagctgaga ctacaggcgc 60180
ccgccaccat gcccagctaa ttttttgtat tttagtagag acggggtttc accacgttgg 60240
ccaggatgat ctcgatcttc tgacctcgtg atctgcctgc cttttcctgt ttttggtcca 60300
tactgtgggg acaagatgac tcgtggtgaa aaagaaaagc ctaggaacat agataagcca 60360
agccccatac ctggtttctt ttcctttttg tgctacaact gcctaaatgc gcatctccca 60420
acatgacctc ctcacctctc ccttcttcct ccccagctac agatctcctt atcttcacct 60480
gatgcataga cacccaacac aacatcttgt tttgagacta cacgctattg tggtctgtta 60540
gagataagac tctggaaaca tatttcagct acactaccta ccagtggtac gcgacaggac 60600
acgtttatgg aaaatgggga tgagaatgca gttttcctgg gtttgagaga attattgagt 60660
atttatgact tagtaaagaa ttatttggaa ggaacagacc atctgctcaa agggaacatt 60720
gattgcaagt gtcattcggc ctttctctgc ctgtctctca ctctccgttt gagccacatg 60780
atttctgtct gtgagcctgc ctctgttttc tcaccttgaa cactggcttt attctgtttt 60840
gttttggttt gtttctctcc ttgcatatta cccaagtatg gctgattgtg actgggtgta 60900
atgacctccc aatcaaaagc cctaacgaga ctccccagaa aacacccaaa ggtgaaggtg 60960
cactgggaaa aaatgaagtt gcgtgggggc atcagaaaca ggaggcgtgg ccgggagcag 61020
caggtcagga gagtgcaaat ggaagganan gagcaggtnc tgctgaagcc aagtattgga 61080
tttccctgca gagcaaaccc aaagtcgttt gaaaccgccc tttttaatcc tctctgaaag 61140
ccttgcccca tctctgctgg aaccactact caaccaccct ccttagcttc atggaatggg 61200
aggagagagg acacaactct ttggccatac taagtggtga gacttgactg cagtacttac 61260
aactcaggga tcatttttcc tgtcaaactt ctraatctta taggacttga gaagtttatt 61320
aagagctaaa aaaataggct attacagtct cacctgaagc tcaaatcatg ctgtataaga 61380
tagtttcttt agagaaacac cacgtagtta ctataaactt acaaatggac aatttgtaaa 61440
ttggtgctat tttacaacat aatattaagt cgatttcctt gcatttaaaa aatacatatt 61500
ctgaaataat ttagaaacac agataaaaaa tacctatgtg tctgtcagaa ataataatag 61560
ctaatattta tggaccactc actgtgtgtt ttattaggta ttaaattatt taatgctcac 61620
agcaccataa aggtaggtac taatacgatc tgttttacaa aagaggaggt tgaggcacag 61680
acagcataag gaatttgatg aaggtcacat agttactgaa tggggatttc atctcaggca 61740
gtccacgtta tacttttaac tacttcattt tcacccctgt gtattaccct actgtgaaaa 61800
taacccagtt tcttcattca tttattcatt ccactatcga tggacattga gcttgnnttn 61860
nattgttttg ctattgcaga ccttctaaga cctttcttat ccgtgccttt gtatgcacac 61920
gtgagagagg tgttctaaca tatatagcta ggacagcaat ttctgggtta aaggatatga 61980
gcacctttga ctctctgaga tatggcagat ggctctccgg atgatagggc tattttgtat 62040
gccttctaga aacgtgtaag ggtgctcgtt gtctacatct tcatctgcac ttgatgttat 62100
caggctttta caccagatga cacgaaatgg tgtcctgtaa tgtaaatttg catctccctg 62160
atctccctga ttaatggatg ttgaacattt ttaggttcaa gggccacaca ttttcttttt 62220
tttttttttt ttttttttga gatggagtct tgctctgtcg cccaggctgg agtgcggtgg 62280
cgtgatcttg gctcactgaa agctccgcct cctgggttca cgccattctc ctgccccagc 62340
ctcccgagtt gctgggtcta caggtgcctg ccaccacgcc cggctaattt tttgtatttt 62400
tagaagagac ggggtttcac tgtgttagcc aggatggtct cgatctcctg actgtagatt 62460
gcttgtttat ctcatttgcc catttatctg ttgatttttc taagtgatgt tcaggaattc 62520
tgagtgtttc taaagggtat attgtttctt tctaaataaa aatttaagat attagatata 62580
aagacaaatc taaaatatta aatgcttgac acatgtgcct ttttcatctc tcccatgttt 62640
agtcaataag gcaattcttt tatgtggtat taaagaaacc gattagaaag ttgcttcgtt 62700
gtgtgcttaa gtgtgagtct tagaaaggtg aaaagttata attgactctt ttagcaccaa 62760
accaagcagg tatatagctg tttaaatact attttagcat aagccatagc tgtgggaagg 62820
gtcactccag tgcttgataa atagaagtct attcaattgg accctcattc ctcagcggct 62880
gctgtgacaa gccgttttcc cgctgctgct caggtaggag ttttcatctc ttgacacttt 62940
gacagatgtg gctgcacact tttgaaccat cttccaacac acccccgtgc tctattacca 63000
tgaggaaagt ctctgacaag agaatgaaag tacatatgca tgagacgtgg tacaatggat 63060
gtcagtttcc ctctggtagc atattccacc gcgtgcctcc tgtgaggaac agagggaggt 63120
aacaggtgct tgctgaaagt aggtcaaacg gtggcgaaat tattccttca gtgttttaat 63180
gctctttgaa aacatttcca ttgaaggcta agattgaggg gaggtggcct gtgtgatgtg 63240
agcatttcaa gtgacaaagt gacatcctag gcactcctga aactgtcttc ttcgtgaacc 63300
ttcccacaaa ctggcagatc atttcaagaa ttgatggagc ccatgagaat gtaggttccc 63360
tccagaacgc agctctctcc ccagcccatt cccacaaaga aactaggttt tccctgcatt 63420
tccagaaacc tccaaaccaa cccattatgc ttctcctttt gtcctctcca aattcaatct 63480
gatccttctt caattctgtc attacttcag tattttgata ttttttgact cattctctcc 63540
actccatctt catattcctg ccctcaaaat caggtcagtg cttcctcaac agagtgatct 63600
ctgattcctt gattatattt ggtcattttc ttttttgttt ctctttcttc tctattgctt 63660
cattcacgat aggcatttgc caaaaatttt ctgaattata cgtgattgta catatccagc 63720
tgcgttcacg tgcagaaaac atagcctcac acacagcaga cccaaattct tactctcccc 63780
ttaggcaggt gtcaaacgat acttccccca aatgctcacg catgcacgca aacagagaca 63840
cacagtcaaa aacacagcat gcatgtgtac acacacatac acactcatac aggctcacac 63900
atgcatgcag agacacacag tcaaaaacac agcatgcatg tgtacacaca cacactcata 63960
caggctcaca catgctcaca cgcacacaca cctcaaacac acacagtgac acagacacac 64020
acatgcacac tcgtgcacat acacatgcct acacacttat acatgctcat gcacgctcac 64080
acaactcaca tgtacataca cacacagtga cacacaatcg cagacacaca catgcacaca 64140
ggcacacaca catatctaca cgcacatgct catgcacaca cacttcacac gtacatacac 64200
acagtgacac acaatcacac gcacacacat atgcacacat gcatatggct acacacacgt 64260
gcatgctcac acacacctca caatgcacac tcacaaacgg tgacacactg acacacacac 64320
acatgcatgc acacagacat gcatacacac gcttatacac acacacacct cacgcatact 64380
cagtgacaca gtgacacaca gacatttaca tgcttatgca cacatgcaca cacacatgca 64440
caaacacact tgtacataat catgcatgct cacacataca cacgcacata cctcacacac 64500
acacatacac tcacacacag gcgcacacac attcattttc aatttctcag gggaatataa 64560
aacaactgct tggaggaaaa gtttgtagga aaaagtgaat ataaaaatgg ttatgcagta 64620
attacctgga ataaatatta aaaccaggaa aaataaaata gctacatgta gaaaggggta 64680
gctaaaatgc tacttgaaaa aggcctattg taattttgaa gtcagtggcc aaataaacta 64740
aacagagagg ccaattgtat aaatcctcag ttctaaatat cccatatata tttatttaaa 64800
tatatattca atatgtatct aatatatcct gattatattt cnaaataata attatattta 64860
gaatagacac cagatgacca ggcataggat aataaaaaat aagattaaaa tatcagtgtt 64920
atttttattt atttgtttat ctgtcttact ggcaattaaa cagttttgct tctttgattt 64980
ttaaacctca ctggaagaaa tatgcagaac attttaaaat tatttgcatg ccacattatc 65040
tcaaactaaa ttcctgtctc ctattatatt ttcatcctcc agtttgaatc agtcctataa 65100
ctcttgaatg tttacaatta tattaattag gagacatgtg ctaacttatg ccaagcattt 65160
ttaaaatgtc cattggagac aaatttccat caccaaagat ttgttgcatt gtcacctttg 65220
gcaaaaatga aggatgagtt tttctgtttg ttcgtttggt ttggttttgc aagtcttgat 65280
ctccaggtta aatacacagc cttctttaag acttaaaccc agggtttgaa agtgctgtgt 65340
attttctcag tgttcaacac aatctgcagt agaagggttt ggagcagcaa tatgatgcct 65400
tatgcactct aaagctgctg acaggtttag acataatcta aaatgtaagt cactttgtgt 65460
atcaggcagt tcagtccttc gcatttgttt taatgttttt cctaaatact ctaaatattt 65520
caaaatgagt ctttccttaa agattctaca tagctcaaaa ttattttatt tatgtatgca 65580
tttattaaat atcacaagtg aggtcctgca ttgcattaga aatgcagtgt attagaaagg 65640
acagctagct tcaattttga attcataatt tgtctcttga gtttaaaaca aaagttttgt 65700
gttcaactgc ccaccgttta atactaaaaa taaaagatga acataaaagt caatttgaag 65760
tgattctaga tgtaggaatt taattagctg tgggaatgtc aatgacatct caaaaccatc 65820
atggcgtcgt gtcacctgtc tagcagccct attgtagtcc ttcctgactt ctcactaact 65880
tacccatgaa gacaaagata aagaaaaact cacaacaata caggtaacta agaaagcacc 65940
ttttgtcaaa gtctgttgag attattcagt aactatgtgg ttggcggagt actagtgaga 66000
aaaatataaa acatcatgta tattcaaatt gtttaatcta atgcgtccat ccttttagga 66060
actcagtact gaagtctagg aacatcaggc taaaaaaaat aatggttgga tttttctact 66120
ctttctagac accagggaac atgagagaaa attattgtgg aaggactaat attcttattt 66180
ttattattac ctatgtccag ccaagtaagc aaggtcaaca cttcaccgtt gaaaagccaa 66240
gattttagca ttttcattct taatttttac tctagtattt cactgacact tgagtgtatg 66300
tcagaantca gagggtcatg aagaanngga cagccctggt gactgccaca ggctgagact 66360
tactgctgga acatgtatag tgaggcctcc tttgttgacc atcaccctgg gtcttcttgt 66420
gcccaaagca gaatggtgtg gcttcctgga ataggagatc atattacttg aagcaacaag 66480
attgtattgc ttgaactcta gtgtcctaat ttgttttact cactttgtat taatacatgc 66540
caaagatagg gaaggggatg aaagggtctt gggaccacca tctaggttac agcatccctc 66600
ttttaggagt ccttgctaag acacctcagg ggaaactgcc tttctgaagc ctggctcatg 66660
gtccagttaa ctatgtcaac agtaccaaca ttactttcat ttaatacagg agatagagaa 66720
atgtttcacc cccgaggcta ctttcctcag aaggaggcag aagatgctcc atggccaatt 66780
gagtacatgg aggaaattaa gttatatcaa aaattattgt tgaatctact atgaatccag 66840
ccttgcagga actgagtact gaagcttagg aacaccaggc taaaatatat atatatatat 66900
atatatatat atatgagctt tttctactct ttctggacac caaggaacat gaaagaaaag 66960
tgttgcggaa taactaatat tttttatttt tcttacccat gtccagccaa gtaagcaaag 67020
tgaacacttc attgttgaaa agccaagatt ttagcatgtt tattcttaat ttttcttcca 67080
agtcaataat gaagtcatgc aggggtattg agttcttaat ccataaatta taggttagtt 67140
aattgaaagg tttttgtaca tgtcatcatt tacttttcct ttctcctact aatccataaa 67200
tgtaggccac aaagtgtgag gaaaccagga gattttaagt agtgttctat aagatagttt 67260
aaattgtgaa tatccattat ggcattgtac tctaggaaat acatgttgtc ctaaattgaa 67320
gctttcataa agaaaatttc ccatgtttta aatcaattca agacagatga ttttattggg 67380
caggatatag gaaaagttct gttttaaata tttcttactt taactgatat atttgtatct 67440
ctgtagtctt agtggcagta tcccaatgcc cagaaatggc ttttgtgtgc tcctagtgct 67500
tagtaaggca tcatagctat gtgactgcca tggcattatg attgataagg agtctctaaa 67560
cagcagaaaa ggactatatg taatatatat gacccagact agagtaacaa agctaaacac 67620
cttagaaaag cccagaaaat agtctcccct tcccacaagg gttattattt atgatcaatg 67680
tatgagtttt caaataccct acagcagact cagagatgcc ataagagctg ggggagctgg 67740
gtggtgaaca atcaagttga agtccaggag tcctgactgt tagcattttc tgctttccat 67800
aatgtaaatg ctcccaccat ggccaatttc aagtcaccaa catgacatca gtaaacatga 67860
aggtggagag agatgtgatt gcagctccag cacaccacag ctggggcaag ctgcactccc 67920
actgcagtca gagatggcat atacatacat acatgtcata catgtctatg taaacacgtt 67980
gcaaaatttt gtttgcagaa agtggaattt ttgatgcctc catccaaagt acctagtttc 68040
caacatcact gtagagggaa agagagaggg agactttcga gaaggcacac cctttctcaa 68100
agtgacacat ccaaagtgat gcatcacttc catttctgtt ctggttgtga gaaccaatca 68160
cattgctcca cttcagtaat agtaagctga gtgatgtaga tgagctatat gccaggaaga 68220
ggaaaccagc ttggtaggta taatagcttt tgctaaacca caaggcatcc taaaacttaa 68280
tggcctggac agacactaac tcttgctcat gaatttgcgg atcagttgaa cagccctgct 68340
agtctgagcc aatctcagct gactacagct gagctcaccc ctgcctctgc ggtcagccac 68400
tcgtcagctg gcatctctga ttttgggtgt ggctcgccat taattggaat gaagagaatg 68460
gcagggccca tggccacctg gccaccatgc aacaggctag gctgcagggt tgatgtggtc 68520
gctcggggtt ccaagagcag caagagtaat ttctaataca caagtatttt ccaagtctct 68580
gcttacttca cctttgctac catctcactg accaaaataa gtcacatggc tgagtctgga 68640
gttggtgtgg aggatactgc caaggatgtg tggatacagg gaggtgaatt caattggagg 68700
ccactgggtt ttttcacaca ggctaagagg aatttgaaaa tcactggctt ggcatcataa 68760
tcaatcctgc ttagaggtga tttctttcac accagccatt actggtgctt tttccttctt 68820
gttaaaatct agtttgtgtt gtaaagtcaa gaggagctgg tgattgaaaa aaataacatc 68880
cacatgtgtt tgttgatttg tgatttcaca tctaacctta ctcttacaga gtagagtgaa 68940
agctatactc acatggccta gagataaagg gtctgtccag gattccctta ctcggctctc 69000
cattccaata aagagagcca gccactgata gggcgtggca gctggcaggg tgtccactga 69060
aatcataggc tcttggtacc tttgtggaga tggacatgtg gattcccttc tgtcctgact 69120
ctctaaggac gcatcaggaa cagacagatg ggaaaggcag tctctaagga tatccactgg 69180
ttatgttttc agtgttgata taagtgttac ctttttcata taaattcttt gtattggaca 69240
gaataattgt gtacattgat agtagaagta atgaatatcc agatgtcttc taaataaggg 69300
aagcaaaaga tgtcccactt gcaaatggga gatttatttt aggttttatg catttggtct 69360
tttacattgt gtccttgttc ttatgttcat ggctcatatg caagatggtt tctgagaatt 69420
tcatcatgta attgcattgt tctccaaata agtttatttc aaaatccaat taaaacacaa 69480
gttttagtac atggctgatg cagtattcag tggaggagac tttgttttac taagttgagt 69540
tgttttactc actcaagcag caatttaaag acagatttca tttctgagct gtactattca 69600
ttatcctaat ttatatttat tgcaacctct gagaccacta ttttgtctct ttgcctacag 69660
tcttcagaat ctttaagtta ctgtttcata ggaaaaatta ttggagaaat ttaatagaaa 69720
gagcttttat gaagtactta agcatttata ccacaaaaaa agataagata gctttagatc 69780
attttgaaag tttataaatg ttcacggtcc atttcaagat tactaatctc ttccnnnnnn 69840
acctgatttc ttatgttaca ccttcaggcc ttccctgtaa gcaactgact gcatctctac 69900
tttcaaatcc ttagagtgct ttccaagact gaaataatga gagttacaga gcacacggtg 69960
tccactgcag gctagactct acactgaagt ctcatttatt ttcgttttac agccaaaaga 70020
tgtagatgtc atcatactca tttcctctgt gagaaaactg agtcacagaa aggtgaaatc 70080
cagcacagag acaagattta aactcagttc atcctgtctt caaaattgat attccattaa 70140
accatggcaa tcttaaatct ttctgtgaaa aacagattgt cttcagcttt cagatttagg 70200
gttcatgtac ttataccttc tatccaacca caaatacttg gtgaggaagc tgctgtcact 70260
cttttttaat atatagagca atgttgactg atgaattttg actgtctgat acaaggcaag 70320
agactacctg gtttgggctc acaatgtcta agatgtttct atctctgtgg gcctagaaat 70380
ctacttagac tttctgagcc tgtttctcca tatgtaaaag gggatgcaaa agtatctacc 70440
tcacagagtt gttgaggatt aaagatgtta ttacatgagc aagcaacatc tttggaatga 70500
atcttggcac aaaccaagca ctccagaaaa cagtagctct tatttcaata atccatcctg 70560
ttggtgtcca ttttaattgc gtgagaagcc ctccccgtgt ttggcttaga cttccacagt 70620
ctcctgggag gtttgctttc atggcaggac tcagaatcaa tgcgggaaaa agtgaccttt 70680
cttgttgttc tgcttgaggt tggactcagt cccattgttc cagactcatt gtctcattac 70740
acttttggac acaaagcaag atgaaagcgt tggttgctgt tatgagtttt atatctgtag 70800
ttgtcaaagt tacagagacc ccacgttggc aagtcacctt gtgtggaacc ctatggtcag 70860
gtaccatttt gtagccctgg gcacttttat acnaatcatg tttcnataga aggtgatttg 70920
agctggtata caagacagtt tgagctggtg tctgtcaaaa tcgttgacaa tgctgtgtta 70980
gtttcctgtt gctgctgtaa caaataacca caaattcagt gacttaaaac cacacacatg 71040
tattctctta gaactctgca gttagaagtc caaaatggac ttccttaggc taaacacaag 71100
gtatcaacaa ggctgcattg ctttgggaga ctctggagaa gaaatggctt ccttgctttt 71160
ttcacatcct ggaggccacc tgcatttgca tttcttaact ttatgagagt ctgtaatgat 71220
gtctttataa tgcctccaaa tggttgcaaa actaacacat gcttttgttt ttatgaagcc 71280
aaacagattt agttgatttt tgaccatgga gttggggtat ggggacaagg ttggcagcca 71340
tttttatgtt agtgtagtcc aacatattac attccagcca gcatctgtgg tattctattc 71400
tagtcattat agacttttag aatcatgaaa ctgtgaagtt gcaaataatc ttataggtca 71460
cccagtgcag cctgctatta aggagtatcc cctacaacag tgcttctcaa aattcaacat 71520
gctcacgaat cacctgggaa ccgtgttaaa gatacagatt ctgattcagt aggcctggga 71580
tggggcctga gatcctgcat tcttaataat tgcttccagg ttgctgctgg tccagggacc 71640
acactttgag taacaatgct cattcctgac agataatgct gccttgggga ttaatctagt 71700
atagactctt tgtattttga aaattccagc tgtcatatac acagataagt aatttttgga 71760
tcaaagccaa actaaaaaca tatccaaaac tcctctgctt ttaaaaaatg taaaccaaaa 71820
tgacattgca attaaaggaa actttaaaaa atcaaatgtg tatgtggagt ctgaaggacc 71880
ttatattaaa atatataaat aaaaaagaat atgcacacac atatgtgaat ccacatatgt 71940
atgtactcac atacacatat actagagatg tatgtgttca tctgtctaca tagataggta 72000
gagggataga tcatgcatcc atattaaata atgcaattgt gaagacctca agtcatataa 72060
tattttgtgg tactgactca gctttaacat tttcctttat attaattttt attagaaaat 72120
aaaaaattga aaagtataaa tttggacttt cctgtagata caaggatgaa tctaaatgta 72180
atgtcatcag cctttttaca ttaaagaaac tgatagccag tttcaagcac tggctgaagt 72240
gaattgagtt gaagtgggcc atgccactag ctctaacttt aaagctggag ttactgattt 72300
taatatttaa atgtaggtac tgcacatatt tatcacctta attcttattt aatatttgaa 72360
agttactgct ttggagaaag tcagctaagc aatggtgatt atagtgtatc aaaatccatt 72420
gtaagtgatt attttaataa ctctgaacca acagggacat gtagacattc agacaaaaaa 72480
caacctaatt ataatgacag caccaaagtg aagctgtgac agttacaaaa ccaatttaaa 72540
agtttcctga cagccatggc taaaagcttt gtttggatct ttcagtaata acagtttact 72600
taagacataa atccacagct aaggaaaata gaaaaagaaa gttgtggctt ttctgccatg 72660
cagatgaaat ggaaatcagc agaaatattt ctaatagaac attatgctga aaggagtata 72720
gaaaaggaat aatagtaatg gaatttaact ctcacaatgc aagaaagact aaataacaat 72780
aaaaatttta atgagcatag aaatgtgcca gatgatttgc ctatctgtgt tatgaaggtc 72840
agtcatttct gcaagtaaat tgatgtgcat ataaacatgt tgattggcag ctctggaatt 72900
tgatttttgt attacctgta aaataaagtc aaagggaaac ggatatgcat caatagccac 72960
ggtgacagga agccttaata aaagtctact ttcccgatgt cactggcatg tctcaaatta 73020
ttagatcctt atcaatgtta cttacctcac tagactatgg gctgagtctg atatgcaaca 73080
taattaattc ttcaacctcg ggtaattaat ttctcattcc cgaacagaaa aatgcttgat 73140
tcacaaaatt gcattccttt tttctgtaaa cctttgtaga atatttgtaa gtgtaatcac 73200
tgttctaagc cctttacata tattgactca tttaaaatta ataacaagtc tttggagtag 73260
gtactatttt ctccacttna tcaatgagaa aacagaggtt taagtaactc ccctggggcc 73320
acagtgccag taagtggtgg agttacggct ccaggcagtt tggcccagag cacctgatgt 73380
aggataagga agaccccatg aaacacatac atagagtcat ggagacattg gcagtgctca 73440
gaagaggcag ttcttgttct cttaccccat tttagtaata acagtttgct taagacataa 73500
atccacagct aaggaaaata gctctttgag ctgcaaggac taaaggattc tcaggtcaga 73560
ccagacagta agggcatgtg ttaataaata cccagaagaa atgaaacctc agaaagagga 73620
tgtgtggtgg cgctagtccc tgggcagatg tggctcagtg gtgtgttgtt tgtgctcagt 73680
tcctttccat aggtctgctt ctctctcctc tttctgctgc ccagggcctt cagcctccac 73740
tctctccatt taagtattct ctaccccaca gtgggcagcg ggccccagaa tggactttaa 73800
atagactagg gtaaaatgac ttagtctctc tgaactgtgt gaaatgtgag taatatatct 73860
caccatatag agctatggtg gatattaaag tagataaaac aaataacatt tgaataatgt 73920
ggattatgac caagtcggat ttatccctgg gatacaagga tgattcaaca tatgcaaata 73980
aatgaatgtg atacatccta tcaacagaat gaaggataaa agctatatga tcatttcaat 74040
tcatgctaaa aaagcatttg gcaaaattca acatctcttc atggtaaaac ccctcagcaa 74100
aactggggat agaaggaaca tacatcaaca taataaaagc tatatatgac agacccacag 74160
ctagtatcat actgaatggg gaaaatctga aaagcctttc ctctaatacc tgcaacatga 74220
caaggatgcc cactatcacc tctgttattc aacatagtac tggaagtccc agctagaaaa 74280
ataggacaag agaaagatta aagggcatcc aaattggaac ggaagaagtc aaattatcct 74340
tgtttgcaga tgatatgatc ttatatttgg aaaaacctaa agactccaca aggaaactat 74400
aagaactgat gaacaaacct agtaatgttg caggatacaa aatcaacata caaaaattag 74460
tagcatttct ataagccaac agcaaacagt gtgaaaaaga aatcaagaaa gtaatcccat 74520
ttacggtagc tacaaataaa ataaaattcc ttgcaattaa ccaaaaaatt gaaggatctc 74580
cataatgaac actatcaaac agtgatgaaa gaaatcgaag aggacaccaa aaatggaaaa 74640
atattccata ttcatggatt ggaagaatca atattgttaa aatgttcata ctacccaaag 74700
cagtctacag atgcaattga atccttatca aaataccaat gatattcttc acagaaatag 74760
aaaaaaattc taaaattata tgaaaccaca gaagagccaa atctatccta aacaaattga 74820
acaaagctgg gggaatcaca ttacctgact tcaatttata attcaaagct acagtaatca 74880
aaacgccgtg gtactgccat aaaaacagac acatagacca acgaaacaga atagagaacc 74940
cagaaggaaa tccacacacc tacagtgaac tcatttttaa caaaggtgcc aagaacatac 75000
actggggaaa agagagttcc ttcaataaat ggtcctggac atccatatgc agaagaatga 75060
aactaacccc tatctctgta aggtacaaaa atcacatcaa aatggattaa agacttaaag 75120
ctatgacctc aaactatgaa attactacaa gaaaacactg gggaaaatct ccaggacatt 75180
ggactgggca aagattttat gagcaatacc cccataagca ccggcaacca aagcaaaaat 75240
ggacaaatgg gattacatca agttacaaag cttctgcaca gcaaaagata caattaacaa 75300
agtgaagaga caacacacag aattagagaa aatatttgca aactacccct ctgacaaagg 75360
attaataacc agaatatata aggacctgaa acaactctat aggaaaaatc taataatctg 75420
atcaaaaaat gggcaaaaga tttgaataga catttctcaa aagaagacat acaaatgaca 75480
caaacaggca tatgaaaagg tgttcaacat cattgatcat cagagaaatg caaatgaaaa 75540
ctacaatgag acatcatatc accccagtta aaatggttta tattcaaaag tcaggcaata 75600
ataaatgctg gtgaggatgc gaagaaaagg gaacccttct acactgttgg tgggaaggta 75660
aattagtaca atcactatgg agaacagttt gaacattcct caaaaaacta aaaattgagc 75720
tgctgtaatt tagcaatccc actgctgggc atatacccaa aagaaaggaa ataagtatat 75780
ctaagagaaa tcttcactcc catgtttgct gcagcactgt ttgcaataag atttggaagc 75840
aacctaagtg tccatcaaca gacgaataga taaagaaaat acagtacata tgcgtaatgg 75900
agcactattc aaccatagta aagaacaaga tccagtcatt tgtaacaaca tggatggaac 75960
tggagatcat tatgttaagc gaaataagcc aggcacagaa agacaaacat cacatgttct 76020
cacttatttg tgggatcaca aaatcaagat aatcaaactc atggacatag agagtagaga 76080
ttggttgcca gaggctgaga tgggtactgg ggggacgggg ggaggcaggg atggttaatg 76140
ggaacaaaaa aaantagaaa gaatagataa gacctactat ttgctagcat aatacagtga 76200
ctgcagtcaa taataataac tgtacatttt aaaataactt aaagagtgta acataatcat 76260
ttgtaactca aaggataccc cattctccat gatatgctta ttccccattg catgcctgta 76320
tcaaaacatc ttgtgtactc cataaatata tatnngtgta tatatatata nntttatgtg 76380
tgtgtgtata tatatatata tatatannca cttactatgt acccacaaat atttttaatg 76440
tgaataatat ggcctggaac atagtaaccg tttaatacat gataaccttt ataataatac 76500
tcattatggc caggcatggt ggctcatgcc tgtaatccca acactttggg aggccgaggc 76560
gggcggatca tgaggtcaga agatcgagac catcctggct aacgtggtga aaccctgtct 76620
ctactaaaaa tacaaaaaaa ttagccagac gtggtggcgg gcgcctgtag tcccagctac 76680
tcgggaggct gaagccggag aatgacgtga atccaggaag cagagcttgc agtgagccaa 76740
gatcacgcca ctgcactcta gcctgggcga gagagcgaga ctctttctca aaataataat 76800
aataataata aataatactc attatttttt aatgtttaat tatctttatc ttaatgtagg 76860
cagtagactt ggaccagact tgggttccag tattgagtcc atcttcaatc cctgtttgac 76920
agtgggaaag ttacttaacc tctttgagcc tcagtttcct tattagaata ggttcctagg 76980
gctgttatga gttaatttat gtaaagcacc tagaaaaact ccaggtagag agcaagtatg 77040
atgtacatgt cacttactag aagttgtagt aaaattttca acaaatattt atggnaagta 77100
ataagtaaaa aataaatctc aggtttctct tacttttcca gttgtataat aatcatctct 77160
aaaatatttt catctgcagt attctcccta aacacagaat aaagaaatac ttgttttgtg 77220
ttactagctt tttaaaagcc atttatccat acagtcagaa ttaaggataa atactaccca 77280
accaaccaat taaaaattaa gatgcaagcc atacacaaat gatatatgtt ttccattttt 77340
agtcaaaagt ctctgaaacc atcttcctag tcactgttta gctgcctgaa agaaaggttc 77400
ccttgcctgc ccagttcagc agtgtgggac atggatggct ttatcttgga agccctgttt 77460
tgcatagcag cacatcacaa aggtgctgtc agccaaggac taagtcaatt acacttaatc 77520
atgaggttta tttctttgtt aagagtctgt ctgtttcgcc ccctcagaaa atgatgcggt 77580
catccgtttt ccacatgttc atcctgagca tggtgaccgt ggacgtgatc gtggcggcta 77640
gcaactacta caaaggagaa aacttcagga ggcagtacga cgagttctac ctggcggagg 77700
taagcagctc tccaccgtgc agatcgctgg gcaaggagca ggtgaaccgc ggacagtgcc 77760
tcttagagat gcaaaagtga agtgtagcct gttcattact tgactttcac caaagctgaa 77820
tcattgtctg cttcttaagt ggttcctctg gtcacagtgt ggcctgattc atttcctgtc 77880
accgcgggcc tgagtcatct tcctcacagt atgtcacgtt gccagggtaa cccttttccc 77940
ctgggtctta ctctagaatc ttgctgtttt cctatccacc tcttattatc tctccctttc 78000
tcagcgtaca ttagtttgtt tcctactaag tacaagcagg cacagattca gaagatcata 78060
aataagctgg tcagctcagc aatacgtaga agagggctgg aaggacatat agagagatgg 78120
taatgataaa ttactcctct agaaacgggt gttacaacct acattaaaga caccaattaa 78180
aggtaggttt catgattaaa taagcatctc cctagcactc tacatatcat attacagttt 78240
tggaatagta cttcctattg ataaggtaat tttgttaata cctgattctt aaaatatttt 78300
aatttttatt tctttcaata agcattttgc atttatatta aagcatttta ataattttcc 78360
aagatctttg tttttttaat gtaaaaactt acctaaaata tatctcagaa ttcaatggtt 78420
acatatttac aaaaaaattg attgacaacg tagaaaccca ttcattgtgt gagtgaggta 78480
tacatacaca gttgtacaac gcttcaataa atccaaccta tgaaaaagta aactgaaaag 78540
acagaaaaaa gtcacaattt tattattttt accaaagcat ttttcacata aaaaaaatca 78600
atttgccata taattaagtg ttattacatt cctagaattc tctcagtaca tttaaaaatt 78660
gatttggtta ataaaaattt agtctaccca cgcacaagct tttctgaaaa agaattgatt 78720
gcatgtacct aacgagcata gacatctacg tggatatcaa gaaactttta agtagtcgct 78780
tctgaattct cctcttcatg gaagtatgtc tcctgaaaca aaataccgtt aatacaaaac 78840
ttttactggg ctacagtctc tgtgatgcaa catttgccca atggccacct ggtatatgga 78900
gcttacaatc tagcaaaaaa aaaaaaaaaa aanncaataa acaataagag ttttgtgcta 78960
tggagaacta atgacagggg ctgatgaaga aattatatcc agcccagcct ctgaaaaata 79020
ggtataattt tgctgaaaat ccagcacacg atgaatggat tgtcaataaa agcagagaga 79080
aggtcgggta tggtggctta cgcccgtaat cccagaactt tgggaggcca aggcgggtgg 79140
atcacgaggt caggagttcg agacaagcct ggccaacatg gtgaaacccc atctatacta 79200
aaaatacaaa aaattagctg ggtgtagtgt cgggcacctg taatcccagc tactctggag 79260
gctgaggcag gagaatcact tgaacctggg aggcggaggt tgcagtgagc caagagcgca 79320
ccactgaatt ccagccaggg tgacagagtg agactccatc tcnaaaaaaa aaaaaaaaag 79380
cagaaagaag cctagactga tactaatatt tgcaggtaaa tttctaacac agggaaagaa 79440
caatgaagga agcctcatca agttatttct gtttttccca ggaagtagga agcaaggtct 79500
gcatccagcc agatgatgag acagtgaagt gggaagttgg caaagaaagg ggagagggaa 79560
gaggtgcctg gggttaggca aaaaattaac aatacagcaa atgcaacatt aaagatccat 79620
ttaggactat ggatttacag tgataccaat tcagatagct ctgcgacttt ttagccctgt 79680
ataagaagag ggaaaagcaa catttaaatc aatccacctt tagggatttt tttcaggtta 79740
ggggaactga gaaacaaggg gaaaagatgg attgctggca aaggagttga aatgatgacc 79800
ctgtggtttc tgttggatgt ggaaatggga ggagaatgga ggagtgaagg tgaaggatca 79860
atggtctcta tatggttaaa ggacgggtac caccaaagtg atggaataat agaaccagaa 79920
gaggttatga tcagagagtg gagtccagga ttttacaatt ccagggtaat tctaagtaat 79980
gaaatataaa atctagggtg tcacgtgaat gtgggtggct taaacatatt gatggagtca 80040
aggcagaaat ggaaacgact gttgaagcta aggcgctggc tgagtcttca catggacatt 80100
gaagtcactc agagtgaggc cagttcttgg agagaagagt ggagtcaggg agcaaagtca 80160
cggggaatga gcgagtgact gatgaacaga ttgacagaag gacagaagac agctacaggg 80220
agagtgggtg acagcatggt ttaacctcat ggaatacgtt gcaaaggagt atcaaggagt 80280
aatggatggg cacctcttcc tcgtctacat gttctactag aaagggctgg aaagggctgc 80340
aggggtaact catgtatttg agagagaatc agttgaggca cagacagaaa gtagattctg 80400
ggaacagaga ttgataatgt agaggacatt atttaacgta ggagagactc aaagattagt 80460
tcaaggctct gaggagggag aagtgggaag atcgatgaga cagaagaatg atacaagagt 80520
aatagcatca gtaggtaaag atttgctggc aaaaatgcca ggaaacaaaa gcagaaatga 80580
ccacaagaga ttacagttat gyttatctct ctgggaggag gaatctgcat ctgctcctga 80640
gggaatcttg acattagaga ttacagtaac attgcttttg tgatctagca cagggtgggc 80700
aggtggtcac actaaatcag tcctggagca taagtgaata ggccctccac actggcaaca 80760
gcagggaagg gaattcttta gtaaatttta cctaactttt tcatgtacag aattgatcct 80820
ttcctaatgt gtttatgtat ggtagatgat ttatcctcat accttaagaa attccaacaa 80880
aatgtcaaat aattgaatgt tgtagagttg actggttact atttaagtgt attgtagagt 80940
ccaggggtag ttggtaaatc cttgtctttt ttctttttta tataatatta aaaataaaaa 81000
caacctcaac aacagacaga caggattgga tggtggaatt cagtatatat tatgtgtcca 81060
ataattgttg tcccctgaca ataataataa gaaagggtgt gggaggaaac tttgagaggt 81120
ggtggatatg tcaatggcat tgatggtaat ggtttcacag gggtacactt attcccaagt 81180
tcatcacatt ggtacattac atgaatgcag cttttaacat gtcattcatt cttttttttt 81240
tttttttttt ttttgagaca gagtctcgct ctgtcgccca ggctggagtg cagtggcggg 81300
atctcggctc actgcaagct ccgcctcccg ggttcacgcc attctcctgc ctcagcctcc 81360
caagtagctg ggactacagg cgcccgccac tacgcccggc taattttttg tatttttagt 81420
agagacgggg tttcaccgtt ttagccggga tggtctcgat ctcctgacct cgtgatccgc 81480
ccgcctcggc ctcccaaagt gctgggatta caggcgtgag ccaccgcgcc cggccacatg 81540
tcattcattc ttaacaaagc ggcaaatcag ttaaccagct aaaaactaac ttgaaatcct 81600
ggaaaaataa ataaataaat aaactaggta gtggtgattt tgttgactta aacaaccaga 81660
tagaccccat cagtgtactc ttgaactact taagcattct gaatttgttc cactctaggt 81720
tttggggttt ttttgttgtt gtttttgtct cctttttttt tttttttttt ttttgagaca 81780
gtcccactct gttgctcagg ctagagtgca gtggcaccat ctcggctccc tgcaacctct 81840
gcctcccaag ttccagtggt tctcttgcct tagcatccca agaagctggg ataacaggca 81900
cacccagcta atttttgtat ttctagtaga gatggggttt cgccatgtta gccaggctgg 81960
tctcaaactc ctgggctcga gcgatccatc catcttgacc tcccagagtg ctggaattac 82020
aggcgtgagc catcactcct ggccgttcca ctctgttttt gattttgtgt gtttgacttt 82080
ccccaagtat gtttcgtttt tattcagatt acattgccat ttctctttgt atcagaaact 82140
tatacatgag acaaagtgat ttgtttcaaa tgaatgtgaa aaagtcactt taattaaact 82200
tactttttca taatatattc tatttttata aagtttataa agatgtcttg agtttaggcc 82260
agggtttggc aaactctttc ttgcagaccc agatagtaaa cattttgcct tttgtagacc 82320
accctctctc tgtctcaact actcaactct gaaattgtac aaaagtgagt gtgtctcaga 82380
atggttgttt tccaataaaa ctttatttac aaaaatggat cttggtttaa gctatagaaa 82440
cagagagcaa tgtcaaataa ttgaatattg gattatattc aattatttaa aatacaaata 82500
aataataaca ttttgtgtta aagtcaaata ttttaatact gacaacaata aagctatgat 82560
ttttgggggg cccattatgt tctaagtgct ttaaaagaat tcattgtctc atttaattct 82620
caaaatagtt ataataacag caattcaagt ttatagacta taatgatgca gtatgtaagg 82680
caatagcatt atgtaatatt ttgaaaagtt tattttaaaa atggatcaca acaggtcatg 82740
agcttttaaa gaagttattt tttaagttcc cacatattcc agaataaatt atttagaaaa 82800
tctaaaataa agcactttac ccattaagag ccaactcaca gtctaaaaat caccctttaa 82860
gaataaatta agatacttag cttctgttgt gaagctgggg acttgttttg ttactttgga 82920
ttaattaacc tacatttaga attagttaag aaacaggaaa cagtttacct cttttgtagc 82980
ctatgcataa acagaaaaag gtaaagttta ttttcctctg taagaatttt aacttttcat 83040
tgtgatctaa gagaatatat tattattgca cattaaatca tatgttataa tgaacatgat 83100
tacattttaa aatatatatt attttcttaa gaaataaaat ataagcaata tttttcttat 83160
tattatatga atgtatttgt atccattaga ctgtacattt aacaaaattt atcagcacag 83220
cacaggagat taaaagcttt atcttctttt atctcaattc ttcttttgag aaactcacaa 83280
acagatggga gagatacaac aaggaaggca acggacctac agagaggccc aaagttagct 83340
ctgtgtcacc ccctagcatt atccccagct atgttctctg atttcctcta gacctatctg 83400
aatggggagc tcaatcctct tccacctcct ggtgttaagt attaatgagg acagtcatgt 83460
tttccaatga agccagaggg gagaaagaag tcctaggact ctgtgctaca taccccacag 83520
taaattaact agaactcctc ttaccctcaa ctctgtctat ccctcctacc cagcctactc 83580
ccatatctcc ccaacttgtc atcagccagg caggctcttc ccctgctact catgcacagc 83640
aattccactc cacccccaga cttgcatctt cacttgcttt ttgttcagca aaacaaaaag 83700
ctctgctatt aagaggatct agattcctca gaaaagaaag tatcatctat tacttaagcc 83760
ctcttagtcc cccacaggaa atatttattt taaatacatt cagagtttct ctgcaaagat 83820
ttcacatgga tataaaattt ttcatctcat ttcaattata aagtcagaga acagagagga 83880
agaagggcct agtatccttt cttacatggc agttgtgctt ggtgatgggg aatcagaggt 83940
aaataaagta aataagatat ggccatcgat gtgtgactct aaggacctct ttctactctt 84000
agaagctata gttctgtgag attatctggt gtaatcttga gtgaggtgta tacctaaaat 84060
ttgtggcaat aacatgattt atcaaagaaa ttttagtgac tctacaagaa gaaattaaga 84120
acaatttcca agtcagtgtt tgtctcaaca catcatatcc atatgagcag ttttagttat 84180
taaatccgtg tttccaatag atctaaaaat cattctctat tgtggtagac taaatatgta 84240
ttaagttgtc ttgtcggagg gaatgagtca taaactgcca aggtgctagt tcgctgagag 84300
aagttacagc ttgagagaat gttgtttcta aaacagatta ttgatgaagc aaaacgtgct 84360
gagactaaat taattttaca caaataagat ttgggcagga ttagacttat ttatgtcaga 84420
tacctatgat gtcagaagca accattagcc tttgtgtatt aatatgatta ttttgcagga 84480
ttctttttct atggttattt ttccttcttt ttgaaatttc tatcctttga aaatctgtga 84540
ctttctttta tttccttctt aattagaaag tatttcataa attcaacaca tagagaaaat 84600
attataacca atatttgtgt gtccgtcacc cagattttta aaaaattaat agtttttcat 84660
gtttgggtca ggtttttcaa tcagaaataa aacatcatta gtagagtaga agatccctgt 84720
gtaccacttc ttgatctcct ccttctccct aatccacaga gaactatatt catcatatca 84780
atgcatgctt tataatagta tgaagtatta aggtgccact ttttcaatcc tcattatatt 84840
tgggaaattg attcatgtcg attgaagcat gaatttattt gttctgcatg taagggcaat 84900
gggtatttca attgcttcca actttttgct gttgaaaaca atacttcagt aaacattgtc 84960
attagaattt ctgtgccaca tttgggagag ctctttctaa atatatacct agacttaaaa 85020
ttgtgaattt gtcagatatg ctcactttca actttgctaa atattgttaa attgaacttc 85080
aaagtgcttg tgtcaattta cattcctacc aggatatatg agcagctcta cttcatacta 85140
cttttttttg ttcaggattt ttaagtttct tacaatctca tataatcatt atagtcttaa 85200
tatacatttt cttggttacc atagagattt gacctttttt tcgtattctg tcagccctga 85260
atttcctctt ctataatttt gcctgtttaa tctgtaccct aattgatttt tcagttatct 85320
agtagtatgc agtgcagaca tctcccagcc ttcagcttgt cttttaactt ttatttgctg 85380
tcttttcttc aatagaagtt attaatttta acactgtaag atatagtcat ctttaatttt 85440
tgattcagtg ctttttgtgt cttatctata ccagagtcat taaagacatt ctcttatagt 85500
aaaggctaga gttttcaagt tgtgcttttt caattttaga ctccaataca tttggaatga 85560
gataaggact tgattttttc cccatatata aacaattgtc cttcgaagat tcattgaaaa 85620
ttcattcttt cctcactcct gtagtgcaat ttctgtcata tatcaggttt acacatgtgc 85680
acaattgtgt ttctggacac ctcagtctgt gtctatacat caaagcttta gttgataaca 85740
tgttgtcata agtgctatcc tttataataa accttgagat ctattagggc aagctactga 85800
tgttgatatt cttcttcaga tttgttttat ctgttcttgg tcttgctatt cttgctctac 85860
attatgaaaa tttaattcat tttagtaatg agattttaat tgatgttaag aacatctcta 85920
ttcagttatt ctaaccttcc ttagtgtttt ccaacaatgc tttataattt tctccaaagg 85980
tcttccacat tttttgttac attcatgcct acatatccta cagtttcttt tgtgaatgaa 86040
ataatttcaa ttacattttt attgatgtag gaataatatt aattttttat attgacctaa 86100
ttcatagcca gcaactttac tacaattggt tgtttgtgat catccataga cttgattgga 86160
atttctatgt agataattgt atcttctgaa attaaggttt tgtctttcca cgtctaatta 86220
tcatatctct gatttttttc ttcttttatt atccgggtgt gggtctctaa taaaatgttg 86280
aatagaggca gtgatagtgg acatgctggg tgtttttcta tattttgata cgaatgctta 86340
tgatttcatc attaatgtca tttgtaggtt tttatagatg cctttcatca tgttaataaa 86400
gctcacttct atttctaggt tgccaagagc atttctcatt atgagttgag tattcaatct 86460
tcttctacct atactgagct gactacacag actttccttt ttaatttctt agtgcagtat 86520
attagaataa tagatatttt gatactgaaa ctattttaga ttcctgaaac acttgatttt 86580
atagcattac ttttaataaa caaatccaat aagctgacat tatattagga attttcaatc 86640
ataaggatag tagttctgtg attttatttt cttttacatt gctagtctga ttttgttagg 86700
gaagttacac ttcctttcac aaatggaata gacatatttt tctctttttc tcttctgtga 86760
aagaatgaat aaagtccctc tggaacacca tctagggcta ttgtttgcag tgggatccct 86820
ggtggagaaa gggagaagag agatcttgat taatgactta ttttatggtt tgattattat 86880
ggtttgtcag tttcatggtt tattgcttgc tatttataga gtcattaatt ttaactaatg 86940
tctcacattt ccacagtttt ctctcaggat ttttataatc tctattgaaa ctgaatgtat 87000
aatccttttt gctgccaata ttgtttattt ataactttct tttttataga agtaaatgac 87060
ttctgatgct aactacctgg attttagacc aaacttcaca gcacagaggc acagtcctct 87120
acaagattac ccttactcga gatactaact gtaagctcag ggggttccag ggcctccctg 87180
acatatgaca tatcatatgg ctaatatggt tgatatgaca tatgacatat catatgacat 87240
atcaacaggc taaaaactcg ggggtttcca ctagccttct caagtttgat aatttgctag 87300
aatgactcac agaaatcagg aaagtgctat acttctgatt acatttttat taaagcaaaa 87360
aggttgcaaa tcagagccag ccaaaagaag agatgcagag agaaaggtct ggagagtcct 87420
acatgtgaaa cttgctgttt cctcttttca tggagtgagg acatatcacc ctctcagcac 87480
atggatgtga aacaatattc agagcgctga gaaccaggga agctcacctg agctttgtgc 87540
tgaggcttct gattgggatt tccttaggta ggcatgatcg ctggaatcac tggccatgca 87600
cacaaggttg gagtttctga catggccagt gctcatgaat gatctcattg ccataaacta 87660
ccagggtcac cataaataac aaagatacct atcaattggc aaattccaag gatgtagagg 87720
ctacttccca ggaacttgag gcaaaagcca gtaaaattct ttatttttca ttcaaagaac 87780
cagcttttag tttggttgac actaacagtt tctaatgtac ctgaaattat tggttcgttc 87840
ccaatatttt gaactattaa gtccctttat ttctttgttt tttaaatttc tcctctcacc 87900
tttattattt tctctttttc atttatctct ttggtcatct taaacttctt tgaaaattct 87960
tactggggtt ctctgggtgg aatataaatc attctattat aaagatacat gcatgcatat 88020
gttcatcgca gcactgttca caatagcaaa gacatggaat caacccaaat gtccatcagg 88080
gatagactgg ataaagaaaa tgtggtacgt atacactatg gaatactagg cagcgataaa 88140
aaggaacgag atcacatcct ttgcagggac atggatagat cgggaagcca tcatcctcag 88200
caaactaaca caggaacaga aaaccgaaca ctgcatgttc tcacttataa gtgggagctg 88260
gataatgaga acactgaata gctgaacatg gacacaggga gaacaacaac acacactggg 88320
gcctatcagg aggtgggggg aggggtagca tcaggataaa tagctaatgc atgtggggct 88380
taatacctag gtcatgggtt tataggtgca gcaaaccgcc atggcacaca tttacttatg 88440
taacaaacct gcatatcctg cacatatatc ctggaacttt aaatttaatt gaatttaatt 88500
taaaaaaata aaataatgaa aacaactaaa tgatggtgaa aaaaaagttt gacaaaatta 88560
attttactga gagtaaattc atagtttgaa ttttagaatt ttgttttctt tctcattaga 88620
tttatttaaa atctttgcat gctgcctcat ttggcttggg agattttctt atttctctct 88680
ccctccctct atgatcactt ctactttctt agggatattg cagttgcctt aaccttgacc 88740
ctggacccta ccatccagag ccaggttttt aagtgtcatt tggagaatgc tagccccttg 88800
atatgggtga tatcacagtt cttgtcacta gtctatattc cataaaatat cttgttctga 88860
tttttcagat aagctgataa tttctcctcc tgcctctgga ggcctgcagc tgcctataag 88920
gtcttagcct tgggtagttg gtctctgtcc tttccttagc agagaaaccc attctagtcc 88980
ctgtcttttc actatgaagg ttctcatctt taccttatct aaggtgcctt agtctcctca 89040
ccctatagga agcaattgag tccaacattg cctgattctt gacctagcat atgtttctgt 89100
tgcatttctg gtcaacaaag aggttaacct cgtttagaat tccttcctgc ctctttggtt 89160
tcctgttttt tcctttgatc acagtatgtt tgaaacagaa ggggtttcat aaatcatgaa 89220
ctcattttgc cgtcttgcag ggagtcctct tttctagaaa agtgatttct gcattcctct 89280
gaagacattt ggttttatga tatttgttaa aatgaagagt catttatttt ggccccaaca 89340
aaatctgaca cccacgtttg agttcattaa tcataaaaat tggccaaatg aagaaaataa 89400
tcaatcttgc catagcagca gtctttgaca ttattggtga gtttaatttc attttctggg 89460
aaacttcaag taaataggtt tcttctgaca nntacttttt ggggggtgtt tctaaaagat 89520
ctggacatta tcttgttagg taaaaatata atacaataat gacaatctgg acttctcaac 89580
catccatctc aaaatttgct ctttataaca tactgatata cactataagc taagagtagg 89640
tgatttacag acagctccag actgatacag gtaatcagta atcacttttt gttgttattg 89700
aatctgaatt tcatgtaaga gaatgggatt gcctgaactg attttcttgt gagctttgtc 89760
ctgtaatctt cctttgtgat aaatatgcat ttttttctca tgatatccat catgattctt 89820
tgaaattaga aaacagagac tgcaacacaa atattagata acacatttca aatatctttc 89880
cactcatggg caatgtccat ctctaccatt ttatctcata ggcctgtgtt tacgagatta 89940
gttaaactct gctgttgtta ctggtagagg gtctcgactg caagttgtcc aggttcttga 90000
cgttttgaat aaagaactgg acaaaacgca cagcaaagca aggaaagaaa gaagcaagga 90060
aagcagagat ttattgaaag tgaaagtaca cttcacagtg tgggagtgag cccaagcagc 90120
agctcaaggg ccccagatac agaatcttct caggtccaaa taccccctag aggtttccca 90180
ttggccacct acttggtgtt caccccatgt aaatgaagtg gttgcccgca atcagaggct 90240
gaggtgaagt tacgaagtta cattcctagg caagtgtctg gttgggaaaa gcaaccgatc 90300
agaggtactt tcaattatcc atctgccgca cagaaaaggt gggggtttgc aaagggagta 90360
gcccctggtc cttttgctac tcaggcatgg aaagttaggg tttttctttc aatttagttc 90420
taagaagtca gtgtgaaatg gacttaggtt ccctgcctcc agaccctatt ctcctgcctc 90480
attatggcga catcaaacca ggtatatcgg ttgagcatgc attctcaaca gggagtaaaa 90540
tcacctccaa aggggtgaaa atatgttctt agttgggggg tagaaaattc tctcttttat 90600
aatgcagatt gccttgtaga ccaaataacc aaagtagagt atgtaaaaag atatataata 90660
tggtagaggt atcaaaactc catgaggtgg tgattaagaa caaaatctct aaaagacttc 90720
ttagaagagg tgatttaaaa aaagattggg aaacactgct ttggggtatt tgtaagaaga 90780
aataaatatt tctcttcttt tctatgcatt gtttctaagt tttcttaaag taatgcaaaa 90840
aaaaagaaaa gtttattata ctcttacaaa ttttgtctta actcttaaaa agttaagttt 90900
taacttgtag gtactcacaa aggtggaatg cactgcagaa tatgaaacag aagaagggtc 90960
ccaatgagcc cttcttggtg caggggctgc agactgagga gggccaaagc agtggagggc 91020
tgccaggcta agagtgacaa atggaagcca ccgttccact tttccacagg ctgcctgctg 91080
aatgcctggg atttgcagaa agccttgaga ttggacacct gcacaggtga ctttggtggg 91140
agccctccag gcaactaggt tctgcagaga ccccagttgc cttctccctt ttagatggct 91200
cccagcatgc ccctggcaaa ttccaccctg tccagctacc atcaaggttg agttcactgc 91260
aataatctgg agctgcacat tgagaagtgg ttactagagc ttgcctccac tgcttctatt 91320
ttggttcttc tgaactatta tagtcctctg aatttaagtc ctgtaccaaa ccccataacc 91380
tacactgaaa tacttagtga tcatttaaac taatttgatt ttcctaatca ccttctttaa 91440
atcctgacac agttcttctc tatggcagga taacccatac cttcaagtta agttaggcat 91500
atttttatgt gcattgattt tccataaaat gttatcactt tggcatgaat atttcagaga 91560
gctagagtgt tggcttgtaa aagttaacaa attatgttca aagcaagcca tttgattcca 91620
agagaatctg gaatcaggaa ttctagggga aaatcagtga gactatagat atttaaatat 91680
aatcacataa caatttgcta aatcttttag tgccttttag tgtctttcaa aagaatatca 91740
ttttcccaca gagaaaattg taatgcaaac agatccagct gcatatttta ctataaatta 91800
tgctcattta aacagttcat tccatctgtc cttttgataa tatatgcagt tagtaaggtg 91860
attaattgta tgtatacata attagacaat ctattggaat atctttcagg cattcattag 91920
tagttttctt ttaaaaaaac actttaaaat ggatcaccac tctttttttt tggaatgaaa 91980
atctcagtct gaaaatacag gtgaagggag agatgatgta atgaatgcct attactgctt 92040
cctctgctaa tacagcaacc aggtcaggca tgtggatggg accttcatga cacatcaatt 92100
tcagtttctc ctgagattcc ctagtatcca taggagagaa aacaggttca agtcttcccc 92160
atatcattgc aaggccagaa ctaagaagcc tgtgctagag aggaagtacc tgtcgcagga 92220
cttgcagcaa agtctgagtc ctctggtccc ctgaggccac tgctcagggc agagagcctt 92280
tcatttcccg cagaggagct ggacctgcct gtatgctgct tgtggtccag gagcagtcca 92340
cagagtcctg tgggtctcag tgggccagga agggaagctc actagagact gaattactcc 92400
aggtggagaa gggggtcaat aaatgactcc actcatttct gggaaatcct gtcaccaaaa 92460
agccttcttc agatgttcag caaaggagct atggcttttc aggtctttcg cctccgtaaa 92520
ctatggtgcc ctctactacc cctcatttgc cactgcttaa gatagcataa aagacaaacg 92580
acaattacat caaaaacatg tatccatggt gaaggaaaga aaagttaact cacacacaaa 92640
gggagactca gaaactgagg atgaaactca gagaatcaag acaaatgtct agtctagaga 92700
tttcccaagc aagtagaatt gatgggcgag agaatccgtt gttgttgttg ttgttgttgt 92760
ctcaagaaaa agtaagcagg gcacaaaata caatttctgt aacttcaact aaaaatgtcc 92820
aaaaaatgag ttaaaaaagg gcatagtcct tgagagctag tttttaatat gggagatgaa 92880
gcaggaaaaa ataactcaaa aagtggtaga gatataataa taagggcaaa gtaaaatagc 92940
ctatccacac agctatgaat aataggagtc cctgaaggaa aaagcgaaca gatagaagaa 93000
aagttgtcat aaacaacgga agaaagctta cataaatgaa aaaaaaaaaa aaacataaat 93060
ctgcaaactg aaagagctca ctaaatttta gtgagattaa atgaaaatag atgcttactc 93120
atgtcctggt gaccttccta ggttgcaagc ataaagaagt aaccttgttc agcccctaaa 93180
caggctgaac ctaaacctga aaaagtaaaa taaatgtatt gtgcaatgga tgactcatct 93240
acaatactgg aaagtggaag gtaatgaatc aatatacata gactactgag agaatagaac 93300
tgcaactaca gaatctgaac acagacaaca tgttcatctg tcagtgttaa aaatgcattt 93360
tatatacaaa aggactaaga gagcataaaa ccctttgtat ttatttgaga aaactacttt 93420
aaagtgtgct aatcacaaga taagtaaatt gcaatctcaa tgactagaca aaagaagaga 93480
gaattgatgg gcattggatc tcaatagata ataataaata tgtcaaatag ggatctttga 93540
aaaaagagaa atgataacat taaagaaact agtaataaat ttgtaaatga tttcagcaaa 93600
accaggactt aggaaagggt gtgatatcaa aggagagtgg gatggtagaa gtgtactatg 93660
aagtttgcag atgtgtgggg tggagggatg agtgagccag caatttagtt gtgaagcaat 93720
aagaaaaaag cattggtttg atgtctaacc attgagaatt aagccaggag attagaaaaa 93780
ccaagtcgag cgtccaaatt aatgaatagg gaaagaaatt agcaaatagt tgaccaagtt 93840
aaaaaaagac aagataaggt taaaaatgaa acagcaatga cataaaatac acaggaagcg 93900
taagaccaag tataactttg gcacattttg tttgagcagg ttgaattttc ttatcaaaaa 93960
ccctagaaaa tctgagtatg tttaaacaca aaataaaaat tgtacactgc ttataggaag 94020
cacatacaaa gtggccctgc aaggtaacta aaaatcattt ctaccaaaca cttaaaatat 94080
taagacgttt taaatgttca gcagagtgtg caaaaaatta aggaaaattc ttgaggccaa 94140
aaattaaatg tgacgtgagt ccagaatacc aggtgggccc caaggcagtg gctgccctga 94200
ggacatttgc aaatccttgt gaccagaact tgcagttttc aggagtgtgt ccaggatgga 94260
agtgactaga ggcctgtgca aagtgaagag gcagaagaga ggccccacat aacatcagga 94320
aggaaaaatc ccatccctca gagggaaagg atgggatcat cattctggac cttgacccct 94380
ggcagatcaa aaatgttatc tctggccggg catggtggct cacgcctgta atcccagcac 94440
tttgggaggc cgaggtgggt ggatcacttg aggtcaggag ttcgagacca acctggccaa 94500
catggtgaaa ccccatctct actaaacata caaaaattag ccaggcatgg tggcatgtgc 94560
ctgtaattcc agctactcgg gaggctgagg caggagaatc acttgaacct gggaggcaga 94620
ggtcccagtg agctaagact gatcatgcca ctgcactcca gactgggtga cagagtaaga 94680
ctctgtctca gaaaaagaaa aaaaaaggtt atcatgttat ctgtactgaa ttgtgtaaga 94740
cagcctgccc actcgtgggg ttggagctca aaatcccatt acgtccagaa tctgagaaac 94800
agcagccaaa agttgattta agggggaccc aaatttctaa gatgacccag gttccctgga 94860
agaaccaatt ctttctggaa aaatatgtac cctaaatgca ggtcttgaaa atctagagac 94920
aatcaatgat ttcctggcaa aatacaaact gccaaattga tggatgagat aagaaacctg 94980
atctgaacag cactggacag ctttgctcca ccatcaccaa aaggcctgtg cccatgtggg 95040
tttcctggtg ctttctgtct acttttaaag gtgtgctaat tcttatttta tttcagaaat 95100
tttcatacaa aagataaaaa ctgtacagaa tgaatgataa agctagcata atcttagcca 95160
aaacctgata atgatataca agtaaaacta taggccaatt tcacataaaa cagtaactgt 95220
gaaaattata aataaaatat attacccaat aaaatccaac atgttagcat tatcatctag 95280
agtttttttc caaaaataaa taaatggtta acatcaggag cttttgtgtt atatttcatt 95340
gcctcagtga attaaaggtt aaatcctttg aaggagaata ggaagaaaag gaaagtcttt 95400
aaacatgata aaaattaatc accaagactc atttcaacca ctatatatga acgctgaaga 95460
aactttcatt gaaaacaagg agcaagttat ggattcctat tattaccatt ttgtatttag 95520
caaccattat ataactgtac ctttataact aatgcattca tatgattaac tccaaaataa 95580
atcttaaaaa tgaaataatc ttattttatt tccttatgaa attgtgcaca tttctataaa 95640
aatcgtgaga ctttatgaaa aatattagaa ttaatagaag aatctagtaa agtgggtaca 95700
gaaggtcaat atagagaaat caatagcttt tcttcccact ggaactaact gggtagaaat 95760
agtaaaaaag aaaaaataca tagatagata gagagagaga gagagaaaga aagataggat 95820
atttaggata tttatntnna nnaaacttat taaagaacgt aaaatccagt tcaaataaat 95880
aggaaaagag tgcattcctg gatatgaaga ctagtattaa tcttcttaaa gttctatttt 95940
atatgtaaaa ggtaaagnaa aaaaatcata aagttgtaga catatgtgaa catgtaaatt 96000
ttatgtttgt agcactaaca atatcaaagt tagaaaccag actgttggct agggaaaaaa 96060
tgtttgcagt atatatagca aagattattg tcctcaatac caacaactcc caaaacgcat 96120
aaggaacaca acataacacc atataatagt gtcaaggtta cggacagtaa catttaatta 96180
ctttaaaaag aaattaaagt gattaataaa catataaaca gatgagcaac aataagtttg 96240
attacactga tactggcatg gatttgagac aagataactt tcctgtattg ctgaagggca 96300
aatgatttct tataatattt tgaaagtaat cactttaata ttttctaaat ttaaaacaca 96360
ctaatctgtc tttgccccag caataccaac tttggaaatc tatttataga tatgaaagcc 96420
tcaataaata ctggtattga gggaggatgc ttagtgcagc ctttttattg aagtagcaat 96480
gtgcttaacc accttcctga tgattcctgc aaataccacc catcaatgaa ttagtagaga 96540
aaatgttgag ttacataaac attgaacact atgggaaatt atgcagctga taaataaaac 96600
ataggaccta tatcccttaa tctggaggga tatccacgat tgttagtgac tcagaaaaca 96660
agttgcagag tgatatataa tattcctgca tacccaaatc tttatcattc acagttcacg 96720
taactttagg taataccaag aatgcctatt tgtctttaga attttttttc tttccagagt 96780
aaatacctgt cacattattt ttaacaactt catagaactg tatgtaatat ttatacataa 96840
taagtgtata gaaagtatga acttgacaga ggacaatgac atctttaaaa ttagaaatag 96900
tgctttcata aattgtaaca attgttttta catctcatgt aaaaacatgt aattgcaagc 96960
ctgttnctgt gattgcatat gtgtggatga agaagcagat gatcaaggaa agaatataca 97020
tgacattaac atgaaatacc tgagaaacnt gggcaaagga gttcatncca cgtgtttngt 97080
ggacttaaga tcatttcaaa tttaaaatat attaccttgt tatgtttttt aaggagggaa 97140
atggcaatta aaattaaaaa gcaactagaa tctgcagaaa tggtagattt gagaagtgat 97200
gctaatttcc tcttcacatc taaattaact atctgcagtg cctttaatgt ttcatttctt 97260
aaaacactat tattaaaact gcattttccc cncatgttcc atatatgagt ggaagaaaat 97320
cccttctgat actccacatt agtctagaag aagagaagca aggtctgcta tattcctatc 97380
ttcaataaat catgtagtgt cttctcagag ggacatatta tgactaatcc cagtagtcac 97440
cctcatagtc tttaattaga agttaatctt ctattgcaaa ttttaattcc agctgcaatc 97500
tcctttacaa aatgaaaatt cttgttcata ggacatgtaa aggaaataac atgctgtctt 97560
tatgtgtgtg ttttataata ttgttatttg gaatagtaaa ttcatagaat gcatgtgaga 97620
gattaaaaga tcaaataaat gtgttaatat actaatattg atcattaatt ttattaatat 97680
taaagtaaca tattgattta tttgcataag cacacataga tcaattgctt ggtatgaaat 97740
ctcaatttct cttttgccat gtggcctaaa gcataaagga ataaatgata ttttaacttt 97800
taaattttag tttaattagg ttaataatat gtaagttgtt attttataat atgccatgta 97860
cattaaataa attttatctt aaaaaataca acatacaaaa aaattcagcc ttttgtgtac 97920
atagaaagtc tttaaataat aatggtttta aaataatatc aaatatagat aataaagaaa 97980
taatgccact cacaaacatt caaaatcata acatgttttt ataattgttt aagattgctt 98040
tggtctactg tgttctagtt ggtatgtttc aaatgcattc ttaaagtaaa atgtcattct 98100
tgaccttatg gggcacctta gtgtatatga tagtggcaaa aattcataca ctgacaaata 98160
tgtgaaataa tttagaataa attatagttc tgaatttcaa tttcaatgtt tctttgtttc 98220
tctaggtggc ttttacagta ctttttgatt tggaagcact tctgaagata tggtgtttgg 98280
gatttactgg atatattagc tcatctctcc acaaattcga actactactc gtaattggaa 98340
ctactcttca tgtataccca gatctttatc attcacaatt cacgtacttt caggtaataa 98400
aaataatgcc tatttgtctt tagaaattta tttatttcca gagtaaatac ctgtcacatt 98460
attttaacaa ccacatagaa ttatatataa tatttatata taataactat tatggtaaat 98520
atgaacttga gaaaggcaca atgacatctt acaaattaga aaagtgcatt cacaaattgt 98580
aacaatcgct ttttaaaact cctgaaaatt cacagaaaca atgtagatgt tttacttact 98640
tnttcctaaa ttagcagtat atagatacac atatttttat atatggataa catatatcca 98700
tacatgcgta tnnaantttt aaactacata agatgttggn ncaaacttta aagactagga 98760
aacattaatt taatcccaag tgtttctctt ccttgtcgat aaggctaagt gtttgctcaa 98820
caacggttta taatgaaaat attaaaggtt tataaaactt acctttacag attgtaatta 98880
ctcatacagt attatttata aatgcctgtt acttcatgat ggcacttata attcttattt 98940
aacttgtaat aattggatat ctttttttaa atgtgatata ttggatcaca ttgctttcta 99000
attatgcaat aaacagtaat tattagttac attctttgtt attattgaat atagcaacac 99060
gctcactgtc ctggtaaata cttagtcaaa atgataaaat atgtctacat ggtattctag 99120
tcaaaaacac ctcaaatgta gtcattttcc tgattcaaac ttggtcattt attttttatt 99180
ttattttatt ttattttata ttattttatt ttttatttta ttttatttta ttattattat 99240
actttaagtt ttagggtaca tgtgcacaat gtgcaggtta gttacatatg tatacatgtg 99300
ccatgctggt gtgctgcacc cactaactcg tcatctagca ttaggtatat ctcctaaagc 99360
tatccctgcc ccctcccccc accccacaac aggccccaga gtgtgatgtt ccccttcctg 99420
tgtccatgtg ttctcattgt tcaattccca cctatgagtg agaatatgcg gtgtttggtt 99480
ttttgttctt gcgatagttt actgagaatg atgatttcca atttcatcca cgtcccctac 99540
aaaggacatg aactcatcat tttttatggc tgcatagtat tccatggtgt atatgcgcca 99600
cattttctta atccagtcta tcattgttgg acatttgggt tggttccaag tctttcctat 99660
tgtgaagagt gccgcaataa acatacgtgt gcatgtgtct ttatagcagc atgatttata 99720
gtcctttggg tatataccca gtaatgggat ggctgggtca aatggtattt ctagttctag 99780
atccctgagg aatcgccaca ctgacttcca caagagttga actagtttac agtcccacca 99840
acagtgtaaa agtgttccta tttctccaca tcctctccag cacctgttgt ttcctgactt 99900
tttaatgatt gccattctaa ctggtgtgag atggtatctc attgtggttt tcatttgcgt 99960
ttctctgatg gccagtgatg gtgagcattt ttccatgtgt tttttggctg cataaatgtc 100020
ttcttttgag aagtgtctgt tcatgtcctt cgcatttata taatttatca tggaaacact 100080
agaatgtgca ttgattgttt tctaaataga tattgttaaa tatttgggaa ataaaatgac 100140
agtagaattt taaagaagta attttgagaa acaggactct aaccccttag gaaaaagaac 100200
atgcattgca actttattga ttttatttat tagtaatacc aaaatattat tttcagaaca 100260
atattcactt taactgccag atcacaggta actagacact tttagtacct gggggaaagg 100320
acatgcaaat ataattcaca aaaagtaaaa agcaaaaccc cctacaaacc caggcaaaaa 100380
gctgagccct tgtaatcaca gctaagcata ttgaaaccac agagggtttt catagttcaa 100440
gcgctcactt ccctcagcat ccgtggatgt aaatctctcc tcatktgttg agttatatcc 100500
tgaagcttrg ctatcataag tgacatggct ggggcaagag atatacatgt ttaaaactct 100560
tgatacaaaa tgtgctttcc aaacattcct gtgattataa gctcttgtgc actgctctct 100620
agattcacaa agttatcatg gccattgagt acctacctta gggcatcatt gcacataatt 100680
atagagaata tcctttatat caaaacaaca gcataccttt tttacaaagc tattaaagta 100740
gccaaattaa gaaaattggt gttgcctatt tcagcaaagg tacagtataa aatatattca 100800
gggccttaaa attgctatag tctctgacat gccatttttc agtaaaaagt tagaaaataa 100860
catttgtgtg caaaatattt attatagaat taatgagaga aaaaagaaaa ctgtttaaat 100920
gacaaacatt tgaggaatag cttaataagt cataacgcga atttaaccat aaaattataa 100980
ttgtgatgag ttttttataa cttagaaata tgactgtttt atttaaacga taaacagcat 101040
aaattatatt atatacataa ctacatatat gtatgtatat atttattata tacatatgta 101100
aaatacctat aaaatggaaa aaaatgacta gaaagaaacc aatttattac aaattattaa 101160
tcatctctag tttcctactc ttgtcatcat gtctgatttt cctactagtc tgttttttta 101220
caaaatatct aatattagcc tgcaaggctg taaccatttt atagatagac agatgataga 101280
tagatagata ggtagatgat agatagatag atagtagata gatagatagt agatagatag 101340
tcaaatcaca gtgaagtttg caatttcnag ttnngncntt gattttggat tattctgtaa 101400
nnngtnctgt ttaatttatg ttaatgatta ggtgattttc atttgtatct ctctatacat 101460
ggccatgctt ctctttttct aatgtattaa taatgaataa aaatgatctc agttaatttg 101520
tggctagaaa gtaaatctct tgagaaactt aggtgtcaca agggtttttg caaatttgca 101580
tgtggagaat ccactgtacc agacagagcg gctctttgta taaaggccta cattggtctt 101640
ccctattggt cctcacactt ctcatttcaa tcaacctttc tttactgtgt tggcaacaag 101700
tctttcctta gacaatttca tatttctcac atttaaatga agtaatgttt agtgcaaagt 101760
ggcttccttt aaaatattag ttatctgtta gactaactac tgaagttatt catgtattta 101820
ttcaagtgat atttctgagc ttctactatg tgtcagccac tgttccagat actgaagatg 101880
gagcagtgga caaagcagag aggattccca ttttatgaag ctgaaattct aaaggcaaac 101940
agttcacaaa gaagtacaca aaggaatgtg aagtacaagt actggaaatg tcttaaggaa 102000
gaagtgtgca gggtaaaaag catagagatt gtgtagtagg ggctatttta gattagttgt 102060
tcatagaagc cctctctgaa gaggtgaggt ttgagcagag actgaatgaa gtgaaggagc 102120
aaactgtaag gaggtctgag gggaagcatt ccaggtggag agaatcacac tgagcatgtc 102180
ctgaggtggg tgcatgattg atgtgttcaa ggaatagcac aaaggccagc gtggctgggc 102240
tgcaaccaat gcagggcagc atggcctgtg ggaaatcatc aggtcttgca aaacgctgtg 102300
gttcttacat atcggtatca tcctgatgat attgactggt gcgtcttgtg aatttcctgt 102360
gggtcgggca tcttgctgag tgcattgtct catttgtttc tcataacaag ccctaagata 102420
aggactgtat gtgtaaattg aggtctcaag aaatctgttg acttgcccaa gaccgcatac 102480
ctagcagatg atggagctaa atcttcttcc cggctgggcg cagtggctca cacctgtaat 102540
cccagcactt tgggaggccg aggcgggtgg atcacgaggt caggagatca agactatccc 102600
ggctaacatg gtgaaacccc gtctctacta aaaatacaaa aaattagcca ggcgtggtgg 102660
tgggcgcctg tagtcccagc tacttgggag gctgaggcag gagaatggtg tgaacccggg 102720
aggtggagct tgcagtgagc tgagattgcg ccactgctct ccagcctggg ccacagaggg 102780
agactccgtc tcacaaaaaa aaaaaaaaaa attcttccca agaacatgaa tttcagagtt 102840
catattctta actatgcaat ttctacagca tctcactaca aatcaacaga gtgaccttta 102900
agagaaggac tcagaaatgt gaccaggaaa atgtgtttca gagacaaaat gttctgaagt 102960
gcttatcttt gagagtatgg tttacttcat gttgtatctg taggaacaca aaatcaaaaa 103020
tctttatagg gtagatagag tgaaaaacct gctgatccct gaataaatga aaaggcacaa 103080
ttagactcac tgacagggat ttttcctttc taggaatgca ggtttaaccc tttgaaaatg 103140
ctgatcaaat caccaatgtg gaagtggtat taaatagttc catttttttc aagctgttta 103200
cagttaggta ctgaattatt tatgtccgaa aatagacaaa tctgataaaa atgtgaaatc 103260
tttccagatt attattctgg aaattaatac gaatgttaat actttaatag ttcttatgat 103320
aaagctgttt gcttgttctt tgtaaagatt atctgagagt aatatgtcct gatttgggaa 103380
tgtatgttaa gaattacagc aggatggccg ggtgcagtgg ctcacacctg taatcccagc 103440
actttgggag gccgaggcag gcggatcacg aggtcaggag atcgagacca tcctggctaa 103500
catggtgaaa ccccgtctct actaaaatta caaaaaaatt agctgggtgt ggtggtgggc 103560
gcctgtagtc ccagctactc gggaggctga ggcaggagaa tggtgtgaac ccgggaggtg 103620
gagcttgcag tgagccgaga tcgctccact acactccagc ctgggcgaca gagtgagact 103680
ccgtcacaaa aaaaaaaaaa gaaaagaaaa gaattacagc aggaaaaatt ggtagctgca 103740
ccatgtggta tgatgcttaa tttgaacaac ataatttctt acatatgttt aaaaattgca 103800
aattagcatg aaggaaacat gctttagtca ttttttttca attggtttac ttacatgctg 103860
taaaccatat catttgcatt ctgcagacaa taggaataag actgaccact gatacttcct 103920
gttaaatcaa agtaaatgca gtaaacgtgg tttcaggtat ggcaaaattc agaggccgat 103980
atggtgtcag gggctcagtg tatgtcttca cctacctttc ttctgttggt gtgtcggtgt 104040
cattcttaag ctggttttct ctatgtgaag gcaaagatgg ctcccaggag ctctgtaaga 104100
gtttgtgtga ctcttacagc agtacccgtt ggggattaaa aaaaaaaaaa aaagaaatag 104160
aacatttctt attaaaggca tccagcaaaa gccctgagga tgactcagat gactgtgaat 104220
actctggcca gatctggatc atgacgggtg gggagtcctt cttgcacctt tgtactaagg 104280
ctggggtagg aatgatttgc taaaggaaaa ccaggcagag ttgaagaagc cagaggcact 104340
ggaaagccaa aaagaaacaa atgttatttt agacatgtaa aaattaaaat ctaattttta 104400
aaaatgaatt ttctgtttct tactgtgttc taaatacact attcatcttt aacagacaac 104460
tcaatctctt attgacatca aaaaatcttg gatgatcatt gtataaacta tatttcattt 104520
atgccaagaa tgcaattttc ctatgttaat atctctgaat ttgggagctg ttataatcag 104580
tggtgtgtta tactttaatt ggcagcattt ttttatttct tagagctaca tacaaaattg 104640
gtgacatctt agacttaatg aaaagttgta tttttcacac tatatacttc agcttttaat 104700
tatgtactaa tttatacata ctaatcatat aaatatgtcc ttaaaagctg tgtctttgtg 104760
ttatactcgc tttgtaatag tagccattga atcctatttg tccaacacaa agtttggcac 104820
atagtaatca ataaaggttt gttaaacaaa tgagtgaata aatttgtcaa ttaattactt 104880
attttttttt gcaaatgtga gtatgcaaaa catctaaata tatctgtata tatttagatg 104940
tgtgtgtgtg tgtgtataca cagtcatgca tcatttaaca gcagagatac attttgagaa 105000
atgcattgtt aggcaatttt gttgtcgtgt gatcatagag tttacttaca caaacctaga 105060
tgtatagccc actatatacc taggctatat ggtatggcct attgctccta ggctacaaac 105120
ctgtacagtg tatgactaca ttgaatactg taggcaattg tcacacaaag gtaagtattt 105180
gtatatctaa acatagctaa atatagaaaa ggtaagtctt ataggaccac catcctatac 105240
gtggcccata cttgactcaa aagttatgcg atgcatgact aaaatatatg taaatatata 105300
cacacacaca tatacatgcg tgtatatata gagagagaat agttgagtac atataacaaa 105360
gatccaaaaa tacaaaactt acataagaca gaagtttatt tctctgcagc agttggtaag 105420
tatgcaggga aagcaggtgg ctgtgccccc catggtcacc cagcctgtcg ggttggacag 105480
gacctgtcgt attctatgca agccttctat ttctggtcca aaggggctac actatttgtt 105540
tccatttcca ggcaagagaa aggtatttta aaaaggattc agagaaagtt taacttaatg 105600
caccaaaact tgtacaaatc atttcctctc acattccgta ggtctgaacc cagtccactg 105660
gagacagcta gctgcaaggg agactggaat gtgtaggcta tagccccagg caaccacttg 105720
ctaggttaga attcggaaag ttctgttttt taaaggagga aagagaaaat ggatactggg 105780
ctgataatct caataagaag taaagattct tggcaaaagt ttgcttctct ttccatttcc 105840
ttgtgatttt ctaataatac ctaggaaaat attttatgag acagtgaata taactaatac 105900
aggttgagta tctgtatccc aaatgcttgg gaacagaagt gttttggctt tcgatgtttg 105960
tcagattttg gaatatttgt atgtatgtgc ataatgagat atcctgggaa tgggacccaa 106020
gtctaaacac aaaaattgtt tatgttttat aaacacctca aatacattcc ctgaaggtag 106080
ttgtatgcaa tattcttaat agttttttta tgcatgaaac aaagtgtgta tacattgaac 106140
catcataaag caaaggtgtc aggtgtagaa tttttcactt atggcctcat atcagcactc 106200
aaaaacttta aatttttgag cattttatgt tttaaattag gaatgttcaa cctgtattga 106260
attaaaggtt tccttgcata tttgaacgtt agaaaaatat taattttatt tcaacaatac 106320
gtactagtga atatcatttt gtataatcat ataatatgtt aaaacactta gttcatccat 106380
tcatttggga tttattgagc tagaccaatg gttattctat tgttaatttt agtcactaga 106440
tattcaaata gagaggtatg attttcataa agcactataa aataatattt tagtatgaat 106500
atatttaaga ttcagtgtaa ataaatgatc atatgtgtaa ataaatgttt ctctctccct 106560
tgataggttc tccgagtagt tcggctgatt aagatttcac ctgcattaga agactttgtg 106620
tacaagatat ttggtcctgg aaaaaagctt gggagtttgg ttgtatttac tgccagcctc 106680
ttgattgtta tgtcagcaat tagtttgcag atgttctgct ttgtygaaga actggacaga 106740
tttactacgt ttccgagggt aagagtttta aaaatgcagt aagttaaatt cattgttctt 106800
attttagtaa taatgattaa catcaaagta atttcacttt agtcattcag aagtattatc 106860
ctatttttga taacttggga taattagatt ttaatattta aaattgtctc ttctgcaggg 106920
tgcaggtgtt tgagaccatt ttcagcattg tcagattata tatcaattct aaaattctgg 106980
aaataatcta atagagttag atgctgaaac ctgaatgcta gggttcttag cacctataaa 107040
ttaaaataca gcagaatttt aaaataaagc ttgcattttt gtgttcaaga gagttaacat 107100
atttttaatg ttttataatt tatatattgt tatgttagtc agaatctaga aggaagcttt 107160
tgattttcaa taaaataaaa ttcataggct cttcagattt taaatgtctc tcagctttct 107220
cagtagaatt cacttaagct aaaaaggaag ttagaaatca atggatccat aaacaaaagt 107280
catgtaagag gtacagctct taaccagaag gaccttgaaa tttaactcta tgtggactta 107340
gaaacataaa aaaatacaat gaccagacaa ataatgtata tatttttacc ctaagttgaa 107400
atagtaaggc ctattatatg gtgtattagt ccattcttac actgatgata aagacatact 107460
cgatgaaact gggtaattta taaagaaaaa gaggtttaat ggactcacag ttccacgtgg 107520
ctggagaggc ctcacagtca tggtggaagg tgaaaggcac atcttacatg gtggcaggca 107580
agagagaatg agagccaagc taaaggggga aacctcttat aaaaccatca gatctcgtga 107640
gacttattca ctaccacaag agcagcaggg gggaaaccgc ccccatgatt caattatctc 107700
acacctggtc ccttccacaa cacatgggaa ttatgggagc tacaattcaa gatgacattt 107760
gggtggggac acagccaaac catatcatat gggaagaata atattggggt aaaaacaaca 107820
tatattttta aaagttaagc tttgacagca aaagggtctg tacttctaat ggatagctta 107880
gctttatttt agggattttt ttaaaaatcc tatgctaaat ttattatttt agctaccagt 107940
gttggaattc atccttttat aatgcagatt cttcattcat gtgccgccaa ggatttgtcg 108000
agtgccttta aagcatctgg tcatttaggt aatcatgggg acataagtcc tcaagaaatt 108060
ctcagttgag gggaggaacc agtaggtaag cacagggcac cacaggcctt gatgaaggca 108120
gacaccaggt gctctgggga cacagaggca aggccgattc ccaggcatgg aaaagtccag 108180
aaaggcttat gggaacaggt gactccaatg gctggatgta gccaaaggaa gtgcaaggga 108240
acggattccc atcacaggaa cagcatgtac taaatgtctg aggtgagcaa atccttcttc 108300
cagaacttag caagaaccat caatggtaag aggaggacaa aaggccaagg aactctgaag 108360
tcggttgaaa gtgtgatcgt atctgtcatg ccaaactcct atcaactcta gtagggaagg 108420
caccaggttc aagaggctga agaagagacc cagagccagc agatgagaca tggggtttca 108480
ttgagggctt acatacaggg gagggagtcc aatgctggct ggctggtcag gagaacaaga 108540
cctgcttgca aaatgcatgc aatttacata gcatttttac ttagcacact cccccagcaa 108600
cctccacatg gaaatcttaa ttcaccccag acttggggcc tcaattccct gtgtatagcc 108660
agtgttccac gggaggagat ggggactcag atgttcctca tcaacaagga gtcagtctct 108720
gggttggcca ctcctagatt ccctagctca gaacacacat tcaggtgtgt ctggcaagaa 108780
gggtcattct cggggtatgc ttgagttatt gctttcaggt gcacttacat acgatgttta 108840
agtgctgatg agagagggca agtagctagt gaggttgcag atgggtgaga taaggaggat 108900
gatggcaaag gttcctgcag aggtgggaga aggcagtatc cacagcaaga ggacaaagat 108960
tggccttaga caggtgttga gctgacaggt gtcgaggtga tcctcaggac agcaagccaa 109020
gctgaaagtt acaatcaaga ctttgttccc tcactgcaac agtacaggca ggaggcaaag 109080
gtaggcaccg ctctccagct ctccagcgtc cggaggtgtt ggttaagggt caggtggatc 109140
agcaggcatg ggggagggag ggctcttttc cttgctaagc agtcctgaac aaaaggttcc 109200
agccattcct gcacctaggg aggggaagca taaggaagga agggatagga gaagaaagga 109260
acggagccag catggaggaa agtgcctcat ctgggccctg atcaggaggc ctctgcacag 109320
aggcacctgg tctgggactg cagctatggc catgatccca gctggcctgg cagggcagag 109380
ctgagtcata aattgcaagt ccctccagaa atggcagtgc cctggtcatg caccatgtct 109440
agggtgggga tggcagtggt ccccgggagg tctcccaggc aaggccttgc catcaggtct 109500
gaatggatca cacataggat tttggccagg agcaggactc ctggaacgga ggctggaggg 109560
aggcaagcca aaatgatagc cacatcatta ggcccacctt ctctgggtct gccccttcac 109620
tgggtaaata aaaagatcag ctggccatct tttccatggg aacatgggga tggttattgt 109680
aagagttaaa gaggtaagaa acacaaaaag cagctcaaca gtaaaagaca gatttatttt 109740
ggagaataaa ctttagaggg gcttctggcc aattttgctc aggagcattc tctcttacag 109800
actaagggta tttaagggtg taggaagtgg ggagcttatc gcaggttcgg aatgtttcta 109860
tgtgagggaa agtttattgt ggggttggga ttgggatgtc tggttggagg ggaggctgtc 109920
tcagggttgg cgtgtttctg gtcagagggg gtttatctta gggttggaat gtttctggtg 109980
atgctgacat taggcattag gctgatgttt gggngcttga tttgggtgtt tttttaatca 110040
aagggaactt aaaatggtgg tgtttctcca agacgacgat ctcctgctct gtcaatccag 110100
tccctacagt tatagaaagg aagaggggtg gtatattctt tctggctact tcctgctgag 110160
tggagggtca gagggttctt tggtcttggg ttgattgtgg gagtaatgcc atctgtagat 110220
gtttttaggt aattgtgaga tgtccatgat cctgtcagtt aaaaaatctt tgaaaaaggt 110280
gaattaagcc aggtaagcac attagtccta ggcatattat taggagaggg cccaagaatg 110340
ggatggtcca tgttaggatt ttgtttctaa accaagaatg tatttggttg ttttggtatt 110400
cctttcacgt tttagccctt tcttcaagtt tttcagcagc atctcttact aggcctgatt 110460
ggttgagata gaagcaacat tcctcactca gtgagaggca gagaccccct ttttcagcca 110520
ttgtaagatc taatcccagt ctattttgga ggactgctcc aggcaaggag tctaattggt 110580
cttcgactct tataaggctt tgggctatat cttttaataa atcctgtagt tctgttgaaa 110640
gaactttaaa gtatgttaag gagttggcca gtctgcctgc tcccaatcca agcccggagg 110700
ttatacataa ggcagccatt aaaggaatga cttggatgct cctccttttt ctaacatact 110760
ggatgaatgg aacaggtgaa gattgattag gaggaactag tccaacggag ggagaaagat 110820
aaactagggt acaggttctg gtctagttgg tggggagaaa aagatatgtg ttggtaccgc 110880
ataaaaagaa cgagcctttg tcataatgca ggcggagata gggaaagaag ataagcaaat 110940
taaagatggg gtgttttttc tttcctgcgg ttttttactc caggtggaca aggaggaggc 111000
cagggagaca cccactatag tagagatata ggaagagtta ttttttacac atttaatgca 111060
atcggatgtt gcaccattga tattgagcca tggaaaaagt tgggcaccag gggcagcgca 111120
agttaggcag gaggcattgg ttgacggaga ggctgtaaac tagctggttg cagaaatgct 111180
ccatttgttt caggtgatac ttggtagtca acgtggctac tttgatggtc agaggggtgt 111240
ttaacaatga tagtgtgatt gcattggtta gatgttaagg accctacagg gaaatttccc 111300
tccgaggctg aaaagcaaag tgaggcttgt tgtaaaaggg gggtgtgtgt agttatgggc 111360
ccttcaatgg gagggtcttg gtgcttaagg cattgtagag agttgtaata ggtttgaaat 111420
attttgttgg cccgattggc cctggaagtg aaataatctc tgaacagggt gtcggctctc 111480
tcaaaaaagg aagctccttt tgggagttta taagttaggg ttatatttcc tgttcaaagg 111540
tcatgaagag gtgtaggaag ggctgtgtaa gctgaggaag acagcgataa gcatatccag 111600
cactctggag caaaggaaga gttagctttg cagcaagagg gattgtgtaa ggtttataga 111660
gcattctagt ttgagagcag tgaggagtgg ttttattggt gaggttgata tgattaggga 111720
atttatattg aaagaaacaa tcaaaaagag aaaaaagtta tttgggtagt agtaaagtcc 111780
tggaaagttc cttgaagcca taggtaccat agaacagtca gaaactgatt agcatgtata 111840
atgggagctt tgtaagggta ccactgaagg tctgtagcaa ggttggttag gaagcagtga 111900
aagtttggga gagaaagaga cataagcagc ttatgtggat ttctcttcct tttcctccag 111960
gatttaggtg aggcgaaggg aagtaggtcc tgtggagaca caagagaagg ctgaaggggt 112020
tttagatttg gttgtttgtg tatgtggtga agggaagtct gttttcttga gagaggtata 112080
atgaaaccag ttggggagtc cctggagttt tgctgccatg ggtgtagtaa ggatgatctg 112140
gtaaggtcct ttccatttag gtgtaaggag ggaattgggg ctaggactgg gatcttttat 112200
cagaacccag tctcctggct gtaggaaggg attagaggag ttggtgacaa gttgtggcag 112260
gtgtttgtca gcatattccc aaatgaaatg gcagatggta tgtacaagag gggaaatgag 112320
aggggttggc agaggtgggg cttgaccctg aggtggacca aaaggggcaa gtggtctccc 112380
atatgtgagt tcaaaggggc tgagcattaa aggtttatgt gagagcacct gaatttttag 112440
aagggctaaa ggcaaaagtg taaccgagtc tttatgtgtc tggagtgagt acctggtgag 112500
ggtgtttttt agaatgccat tcattttttc aaccttttct gaagattgag gtcgataggg 112560
gatgtgtagc ttccaggtaa tttgtagggc ttgtgaaagt gtttgagtaa tctgagaaat 112620
gaattcaggg ccattatcag attgaaaaga aagaggcacc ccaaacctgg ggatgatttc 112680
tgttattaat ttggaggtga cattagaggc tcgtttgttg gttgtgggaa aagcctcaag 112740
ccattccaaa aaggtatcaa ccagaactaa aagaaatcaa acccttttta ctgggggtat 112800
atgggtaaaa tcaatttgcc aatcctgtcc tggaaggtgt cccctggctt gatggattgg 112860
gaaagaagag tgtctagtgt tggaatgggg tgaagctttc tggcaaatag agcattgatg 112920
ggaaatggct tttaactgtt cctttatatc tggggttatg tgtttatggg aatttaagaa 112980
gtgttgtaga ggtgaatggc tagcatggaa gaggttgtga atgtcccgta aaagagttgt 113040
ttttttcagg gtcaggtagg actaatttgt tttgtatgaa tcagtttggg gggtttgaat 113100
tgtgcccctg ccatgattag ttgttgtgtt tggtgttctg gataaaagaa ggggatatgt 113160
tgtatgaagg gaaataagta ttggggaatt gggtgattgg ttgagacatg ttttgcccag 113220
tagtcagcct catggttccc taaagaaatg tggcttttgt ctgatgttct ttgccatgaa 113280
taactgcaac cttttctgga agtagaagtg cctttaatag aggatgaatg agctttccat 113340
taatgatagg ggttcctata actgtgagat agccccgctc cctccaaatt taggcattgg 113400
aatggatgat gttataagca tatttagaat tggtgtatta ttaacttgtg tgttttttgg 113460
tagggttagt gctcttatta gggcaactaa ttctgcttgt tgggcggatg tgcccaaagg 113520
caagggggca gcctctatca ctcttctaga tgggagagag tgggtatcat aacgctatcc 113580
ctcaatgatg gcatatcctg cttggagagg agggtttttt gatgcactgc catctataaa 113640
ccagtctggg gctcccttta tgtgagtgga agtaagatgg tgaaacatgg taggaggact 113700
ttcaattaga tcagagcatg agtattggtc aggatctaaa atcggtattg agggtaaaag 113760
agaggcggga ttaggtgggg agcatctatg aagagagata gcgggttgaa ggagggttaa 113820
atgtaaggct tgcatatgag aggatgagat gggggtgagc gcctatggct gaccatatct 113880
tgtagactgt gagaagaaaa tacctgaagg ggtttgtaga acatgagttt ttgtgtctca 113940
gagataatta gagaggctgt ggccaaaatt tttaagaaaa gggaccagat tttataaatg 114000
gggtctagtt gttttgaaaa atatgccact gttgagaagg agtctcccat aagttgggct 114060
aatagtccaa gggcctgatt atgagaactg tgtaaatata gatgaaaagg tcttaggagg 114120
tttggaatgt ctaaagcatg ggcctgcaat aaggcacgtt ttagatgaga aaaagcatga 114180
taaaggtctg gggtgggagt gagtggttgg tcaagatttc cttttgtgtg ttcataaagg 114240
ggtttagcaa taatggcaaa atttgctacc cataatcgga aatatcccac taatccaagg 114300
aaggaaagta agtccctttt cgttttagga aatgggattt gttgaacacc ttgctttcat 114360
gccaacagca tttctcgggt atttggagtt atgatcagtc ctaggtatga aactttcggt 114420
gaggttaatt gggccttcct tttggacacc aggtacccac attcagccaa aacatttaaa 114480
atcttggtgg tgtgttgaat acaatggtca agaaaggggc tgcaaaggag taaactgtcc 114540
acatattgca gcaaaatcct gggttgtaga ggtagttggg agaggtctaa ttgaagtgac 114600
tgaaatagtg atggctgtct ctaaaccccc aggggaggac agtccagatg agttgttggg 114660
agtagcctgt gtcagggttg gtccaagtga aagcataaag gttttgagag gagggatgta 114720
gagggatagt aaaaaaggtg tctttggcca ggtgcagggc tcatgcctgt aatcccagca 114780
ctttgagagg ctgaggtggg cggatcatga ggtcaggaga tggagaccat cctggccaac 114840
atggtggaac cctgtctcta ctaaaaacac aaaaattagc tgggtgtggt ggcgtgtgcc 114900
tgtaatccca gctactcagg aggctgaggc aggagaatca tttgaaccag ggagtcagag 114960
gttgcagtag attttgctac taaatgtact ataagaaaaa aaaaaaattc aaaaggacct 115020
tcaagtattt tcagaaattt ttaaattttg gagttgtgaa taaggactgt gggcctctat 115080
ttttaaaaaa tgcatttaag agtctgtact tctgtcccta caagtccgat tgtgcatcaa 115140
tgccccattg ctttttagct atgtgatact gggcaaatca ttctttacat ttttattctt 115200
cacaaccaag atgtaagccg aaatgtgttt ttttttcttc tgcattttgt gtattaaata 115260
atatacaaag atgacacaac tgggcttaga aagtatttct taaaagacta gattacagcc 115320
tatgtaatat atttgaaatt gataatatta tctgtataaa tggcaaggct gctttttaga 115380
tccattcctg acttagcccc tctatacttg ctctattttc cagctataat agtaatcaag 115440
tagtattaca ttttcagatc tccaattact caattgcacc attttgcctg attattttga 115500
ccatcataat gaaagcagct cggcctctcc caggccccct aatcagttat tcagcagctg 115560
acaatggtga cagcctgaac gtgtgaagtg actagaagga gtatattttt cctttcacat 115620
aaatgttact aaaggtgaaa tccatgaaga gtaataaaat tttacaagga aatgttaaaa 115680
aatattacaa ttacaaaagg ggtcattatc atccctaatc aaataaagca tcaccaattg 115740
gtcttacttg ccagatagaa aatcattcag gagagatgat taaaaacata ttttactcaa 115800
ggctagattt gtcgtcagac gcacatccct gggtttcttt tccctccctt ctctagacat 115860
tatccagtgg ttgagtgctt aaggtaggtt ggttaattac agtattagcc aaggcacagg 115920
acatgaccag aacaaatttt ctgcaagaaa aatcacatga tgtatcgcaa agtgaaatac 115980
agactttaaa aatcagcaat tgtctatgtt atcttgactt gggtccaggc cgtcttggag 116040
gctgcctccc agcaatgttt atagggctgc agaatggtgt gggaaaataa agtgtggaag 116100
cacatgggag gcttggggag ggcactcacc ctgaatctgc ttcagcacta tttaccaggt 116160
gtgtagtctt aggtgacact taatttgtct gagcttcatt catttttaaa atggtaatga 116220
tgtctatcaa acaggcatga taactaagag ccctacttac acatagtaag actttgaagc 116280
ttggagagct tgcataaccc acacaaagtt acacagctgg acagctggat ttgaagttgt 116340
ctactgctcc taccaactat tatccattag gtcacttcta gccaagcaaa cacactagaa 116400
agtgttcagt taggaaatac ttattgagtg ccaagaatat aaatattttg tcaatctgta 116460
cctggaagga aaggcctctg gaatagttca tcacaaactt cccagaggac ttcaggaaat 116520
caagaaaggt atagaggtat taacattttg gggcacagcc tgtgagtgtt aggaatgatc 116580
atgtcaggat cccaaaccag cacctgatag tctctgtgcc acagcagaaa cagcatttgt 116640
ctaagaagat cccacacatg agacaggtga aaggatgttc caagtgacag cttgtgaaga 116700
ggtgtttgaa tggagaatga gcaacaatgc tgaaccaaca caaacatctg tcatccttac 116760
atactgggtg aggctcagca tgccggattc cttttcccag tattgttcat tcctccagga 116820
tcctcattac cctccatcat tccccttacc ctatccaatc agaagcgtct gcataattcc 116880
gttgcaaaca ctttggctgc aagtaacaga aaacttgatt ccagttgact ttaagaataa 116940
ggaaatttat tccataaaat tcaagagatc aggtagcttt caggaagtca ggactggatc 117000
tttcactgaa attctcttaa ttgttgtttg aattgtcagt gttcccccaa aaatgtatgt 117060
tgatatccca actcccagaa cctcaaaata taactatatt tgaaatacag gtaatcaagt 117120
taaaatgaag taatcagggt ggaccctaat ccagtatgcc tgatgctttt atgaaaaggg 117180
aaagaacaga cacaaatatg cataagagga agatgatata gacccacagt atattagcct 117240
gttctcacat tgctataaag aaatacctga gactgggtaa ttacaaagaa gagaggttta 117300
attgctcccg gttctgcagg ttgtatagga agcatggcag catctgcttg gctcctgggg 117360
aaaccacaag aaacttacaa tcacagcaga aggcaaaggg gaagcaggca agtcttatat 117420
ggctggagca ggaggaaaag aaagagagag gaggtgctac acacttttaa gcaacctgat 117480
ttcatgatga ctcactcagt gtcatgagaa cagcactgag aagatggtgc tcaaccattc 117540
ctgagaaacc acccctataa tctaatcact cccatcaggc cccacctcca atattgggga 117600
ttacaattga acatgagatt tgggtgggga cacagatcta aactgtatga cacggggata 117660
tggccatggg actggaatgg catctacaag ccaaggaatg tcaaagaatg ctggcaaaca 117720
ccagaagccg taagatacaa gggaagattt ttttccctag agctgtcaga gcacagccct 117780
gctaacacct taattttaga cttctggcct ccatacctgt gagacaatac atttctgttg 117840
ttttaagcca ccaggtttgt ggagcttttt taccacagcc ctagcaaact catacagtga 117900
ccttctccat gggttgtctt cctatgttag caaaatggat gtgacatttc caggcttcct 117960
gatgacatct agaggaatat gtgggtcctc tgttcccagg cctcctcctt aggaccagga 118020
aaccttttct atcatccctt tccttccagc aaacttgctg tcatctctca ttggcaggat 118080
tgagtaacag ggtcattcct agaattaaaa ttactggctt tggttaatca catgggaagg 118140
agtagatgtt gtgaagacaa ctacttgggt cagacccaaa acctggacaa gatttctctc 118200
agctctgtct ccaaagctgc tcctatattc cccatgcaaa caaggtttgt aaatagacgt 118260
ggtagaaaga aagctggtgt ttaattcctt tcaccagaaa catctggacc ccagatcctt 118320
cccaagatgc ccaaataggt aggtacctgc aaagtagcta gcatagggct ggacacagag 118380
tagatcagtt atggattcct gctctccctg tttttatggt actggtcagt ttctatcaca 118440
taccattgac attacacatg ggtcttactg cctttgctag tctacaggta ccttgaggtt 118500
gagagcatgt gcattcctta cacctccaag agcacttaac actgtgcagt gggatctgta 118560
agcatcagta agtagagtca gaaaggaaga cagctaggac tctatcagta tataagccca 118620
agagatggag aagggatgct cgaattctac tcgatggaaa aacaaagaat gctatattga 118680
tagaatttaa taaaacaact ttgtcatctc aagccaataa ctttctgttc tagtttggac 118740
caaacagcta cactgctaaa tagaaataac aagatgaaat cctgatgtaa ggcaatatgc 118800
aacagttcct gttttgttgg gatgaatata ttgtatgagt acaatttaga tgaactattc 118860
attctggaac agcctgtaca ggtcctaaga cagattgcca taagcaagaa caaccacagt 118920
ctttctgtat caaaaacaaa ttgcatgttt ttccataatt gcctaacaaa agctcataag 118980
cagcttcagt aagattttac tcagtttttc ctccatttat tatagaaagc aactgcctct 119040
aaattactga aataaatgca gtaaacattc actgtccatc tttaaccagc tctgtatctt 119100
tattccttct gatttcccac taaaataata aacagacctc atatgtttag cggttgtata 119160
aatggggata gtttttattt ctaagtaata tattatcctc tataacacaa agtacttaaa 119220
ttttagtatg atttatttga tataggtttt cttaattttc attctctaaa tgttaattac 119280
ttgctctatt gagttttcac ttataaaata tgtccaaaac agttattgca cgatagaagc 119340
aacaaatgct ataaaacaca taattaaaaa ttaactttcc tttcctcttg ccaccaaaat 119400
gactagtcgt gcagttagtt gtattaaagg aattaccaaa aaatttgaag aaacaatttg 119460
ctccttaatt ttttaaatta tttgtcagat gtagtgagag tgtgtgacat ttttaataga 119520
ttcaaggttt attttaatat ttaaaactat tagttcaatt aatattgctg aaatctttaa 119580
tttttgttct gtctttcatg tatttttaat tttatcatga aatatttgat gtgcaaaaag 119640
atatgaataa taataaaaca tactcctctg tggccatact taacaaacac taaattgcaa 119700
tagacctgaa gtccctgggt gcctcttcct gatctctgtc ctctcactct cccatggaga 119760
atcacttttc tgattttgat gtgtgttttg ttaataaatt tctttatact tttaatgcat 119820
atatggacat caactgaaaa tcatatatct tttgtgtaat ttaaacttgc cttatatggt 119880
ctcattctgt actatttctc ctgctaattg cttttattgc tcaatattat gtttatgaga 119940
gttacctaaa tgagtacatg gagctgtatt ttatttattg tcattactgt ataaaaagca 120000
actacatatt atattgcata tataatacat tctttataca gacagaacac aatttatttt 120060
ttcattttcc tgtgcagtag gcagattcta agctgtcccc catgatatct ccgcacgagt 120120
gtccataccc tgcatcatcc cctacccttc gatactggta ggatttgtga atatgatggg 120180
ctgtcattcc tgtgaatagg ttgctaagca tttaatgttg agtcagtcat aaatagagat 120240
tgtcatgtgt gggcctgtcc taatcagagg tactggcctt ttcttagatt taaagcaaga 120300
aagggtcttc tgttggcttg cattaggaga tatacctaat gtaaatgatg agttaacggg 120360
tgcagcacac caacgtggca catgtataca tatgtaacaa acctgcacgt tgtgcacatg 120420
taccctagaa cttaaagtat aataaattaa taaataaatt aataaatagg aaaaaaaaag 120480
taagcctcca tgttgtgaag tgctgtgtgg ccaagaccct gggcaacagc catcaagaaa 120540
gcaggactct cagtcctgca accctaagga acaaccctct gataataacc caaatgaagt 120600
tagaagaaga ccgcaagctc cagatgagac caaagcccag ccagcatctt gatttccacc 120660
ttttgagact ctgagctgag agcacagtta tattacacca tgcccacatt ctgaccttca 120720
aaaactgtga agtaacaaat gagtgttaag ctgcttcgtt tgtggtaatt tgttacacat 120780
caatagaaaa gtaatgcatc caggtgttgg atgtttctaa atattgtaaa tccaaacagt 120840
actgctctga acatttttgt acattgattt gtgcacatgt gaaataattc tttttagggt 120900
atgtatctgg gaatagagtt gctgggtctt agaataaaca tatcctcatt tctcattggt 120960
attgataaac tttcattcca aagtagtttt accaatttat cctaagctat cagcagtata 121020
tgagagtatt ctctacttta ccactcagga acacttggtc tggtcaggct ttattttgct 121080
tgaaacactt agctcttcat ttagcctgaa ttgatttttg tggctgctgt gagagaggga 121140
acaattttat ttccatttgg ataaacaatt gccacagtac catttattga ccaatctatt 121200
catgccccct agttctgcat catatgccag ctgtgtcata acgtggttcc atatgtgagt 121260
gcccaagtca agaggcacag gctcccttgt catccccttt tgccattgaa ttttttttac 121320
tggatctgga tcaacctcct ctctgaggtt taaaaccaat aactatatag ctttgctcaa 121380
gtatctcagc agtctcctcc tttcaaaggt tcatgacttt gtaccttatc tctgacacaa 121440
cattaaaaac caaagtctag cagagatcgg aaattctcta gagaaactga cttttcttga 121500
ttcaagctac ttcttagctt ttggtccctg gagtttttaa ttattttctt ggactattca 121560
cctttaaaag gatgcttttt gcattttatc cagaatttcc tggggttttt gaatcatttt 121620
tttccataca ggatgagaaa ctgaggttca ctaataaatt tttgagaaga agaaacagta 121680
ctccatggac tctcagatgg atagactttt ttaaaaatta tactttaagt tctagggtac 121740
atgtgcataa cgtgcaggtt tgttacatat gtatacatgt gccatgttgg tgtgctgcac 121800
ccattaactc atcatttaca ttaggtatat ctcctaatgc tatccctccc acctcccccc 121860
accccatgac aggccctgga gtgtgatatt ccccaccctg tgtccaaatg ttctcattgt 121920
tcaattccca cctatcagtg agaacatgca gtgtttggtt ttctgtcctt gcgatagttt 121980
gctcagaatg atggtttcca gcttcatcca tgtccctaca aaggacatga actcatccat 122040
ttttatggct gcatagtatt ccatggtgta tacatgtgcc acattttctt aatccagtct 122100
atcattgttg gacacttggg ttggttccaa gtctttgcta ttgtgaatag tgccacaata 122160
aacatacgtg tgcatgtgtc tttatagcag catgatttat aatcctttgg gtatataccc 122220
agtaatggga gggctgggtc aaatggtatt tctagttcta gatccttgag gaatcgccac 122280
actgtcttcc acaatgattg aactagttta cagtcccacc aacagtgtaa aagtgttcct 122340
atttctctat atgcctccag cacctgttgt ttcctgactt tttaatgatc gccattctaa 122400
ctggtgtgag atggcatctc attgtggttt tgatttgcat ttctctgatg gccagtgatg 122460
atgagcattt tttcatgtgt cttttggctg cataaatgtc ttcttttgag aagtgtctgt 122520
tcatatcctt cgcccacttt ttgaaggagt tgtttgattt tttcttgtaa atttaagttc 122580
tttgtagatt ctggatatta gccctttgtc agatgggtag attgtaaaaa ttttctctca 122640
ttctgtaggt tgcctgttca ctctgatggt agtttctttt gctgtgcaga ggctctttag 122700
cttaattaga tcccatttgt ctattttggc tcctgttgcc attgcgttgg gtgttttact 122760
catgaagtcc ttgcccatgc ctatatcctg aatggtattg cctagatttt cttctagggt 122820
ttttatggtt ttaggtctaa catttaagtt tttaatccat cttgaattaa tttttgtata 122880
aggtgtaagg aagggatcca gtttcagctt tctacatatg gctagccagt tttcccagca 122940
ccatttatta aatagggaat cctttcccca tttcttgttt ttgtcaggtt tgtcaaagat 123000
cagatggttg tagatgtgtg gtattatttc tgagggctct gttctattcc attggtctat 123060
atctctgttt tggtaccagt accatgctgt tttggttact gtagccttat agtatagttt 123120
gaagtcaggt agcgtgatgc ctccagcttt gttcttttgg cttaggattg tcttggcaat 123180
gcgggctctt ttttggttcc atatgaactt taaagtagtt ttttccaatt ctgtgaagaa 123240
agtcattggt agcttgatgg cgatggcatt gaatctataa attaccttgg gcagtatggc 123300
cattttcatg gtattgatcc ttcctatcag atggataaga cttcagatgg atagactttt 123360
taaaatgagc atgatctagg gcaggccatc ccagtgtttg cctttactgt ccgcagcctc 123420
acagtctttt gcctttgttt gcattgagga tattgtgtcc tctttgaatg tcatagcctc 123480
agctttaccc tccctcagtc tgccacacca ctgaaaatca tctttcacaa aatatctgat 123540
atacccattt atgatgaaga taaataaatc atgttcttgg tttttcattc ataattctat 123600
caacattctt tatgcaacac agctaggaag catactgaca tgaacaaatg tactcactgc 123660
cctctttaac tatagcattg tcaagaaccc aaggaaggac tgaaacaact catcccatag 123720
tagaacacat aagaaagatc tcaagtaagc caaaggtgac atatgctaca atagatgtac 123780
tcagttctaa agtaatagca aagacatttg ggagagtatt ttaaaattct gggaatttac 123840
tgtgtgccta gcacttccaa atatcagctc atttaatgag agaaaaatat tgcttccaga 123900
gaaggaggtg tgcagagctt tataaagatt tgtctttagg ggtgaatata atttcaacag 123960
gtagagattt gggtcatggc attagatgaa ggcattccat ataagaaaaa ccaaatgagt 124020
aaattagaga catggagaat cacaggcatg gagggacata tgaccaaagg atggcagtag 124080
caatgggaaa ccagacatgg agggtcttca gtggttggaa ctgtgacaca agggagcttt 124140
tgaagatttt tactttattt tttttaattt tttttttctt ggagaatagc agaagagcta 124200
ttttgaggaa agttacactg gaagaaatgt tatttctatg aggaggtatt ttcattgaac 124260
aaaattcatt tttattgatg aaagacaaga atttatgatc agttgataaa tttcaggcat 124320
ctttggagat attttatatt tttttctgtg aggctgttac tgtgtcaaat ctttcacagt 124380
ttcataaaat tgagtctcat ctgaagcttt aggccagatt gttatccatg gttgagcatg 124440
actctgcaat agaaactaac aatttggctt attttaaagt gataccatga gatatatata 124500
tatatatata tagtttattg tcattgtctc cccccccaaa aaaaactgta aaattaattt 124560
tcattatttc ctttctacta taacattagg gttttttttt ccttgctcct gttggaattt 124620
atttttgtgg tgactcatct gtggcataat gatgaaatga taaaataata tcctgtgtac 124680
ttccttttag aggatgattc acataaaatt ggccatcttt tcctgctgtt gtatattaat 124740
atcattggtc cactgaactg caatgatcag aattatgact ttccttgaat aaagcatcct 124800
gtttcctacc cctaacccta gaagagtact ctttcaggga gaacctattt ttgcagctca 124860
tcttattttg gtagtttttc accaatcatc ttatttgcaa tttcccaact atttaattgt 124920
catcttacat taatattatt ttaataatca gactgttcca ttgttcaaat tttaaaaata 124980
aatgaaagtc attaatgaaa agtattgtct cattccatta taatgagctt cctcaagtat 125040
gttttcagtg atgaaaacat gaccgtgtta ttaaatattt tgtggattct tgcctacaaa 125100
aagaggacag ttcatacatt tgtgtctgta tgccttttag ctctactgca taaagaatgt 125160
cggtggaatt ttgaacaaca aaacaggcac atgatttatg tagtcttgcc tacaaaaaat 125220
acagtctgta atgagactct attgtcagtc tctcatggct acccacaatt tcctatcaat 125280
aaaacaggat aataatacat aacttagagg attggtagga agattaaagg aagtaacagg 125340
tgcaaagtag ttagcactgc gcctgccatg taaacaggca cttaacaagt agtagcagtt 125400
gtccttctta aatgcatgga aagcccatgt cttagcatgg catgctgaat tcctagcagc 125460
actgaggtag cccagcatcc aagggtaaat gactggagaa ttaatggaat ggtgggcact 125520
cagttttctg tgttgtatag aaagtttaaa actttaaaaa tagtccccaa ttccagttta 125580
ggagattatt tttaatcagt cttttgcgac tttccagaca aatgcaaaag gtaaaaaaaa 125640
atcatattac agaaaaataa gacaaaccga caagttattt ccagacgcgg aaatagctta 125700
tcattaacta ttacatatac ggaactaaac agagaccatt cacccaatga tatgtatatt 125760
cattctttct cttgggtata cccttcttgg atgtaacacc cagagtctta gtgtgccaga 125820
agactaaaat gcctacttct gcagaggact gtctctaaca ttttttctag gaatcaatgt 125880
tgaaatctta atttccagga agcatgatgg gataaagcat aatgtgtgta cgtgtgtgag 125940
catgcatctg gctgagcaca tgtgcatgca gatgggggtg gggaaggaga gagggacccc 126000
ccctaagcaa atggaagcta atgggctgca tcctataatc ttaaattgtg caatacaaaa 126060
ggaaaagcag agcaggtggg accagatgca gaaagaacct tagtagctag tttagatgga 126120
ggtctgcagt attgctgctg tggcttttgc tgttgcttct ttgtgttgtt attttagttt 126180
tcagaattcc ggagaaaaag gcaacaggca aaagataaaa atcctgcctc aatccaacag 126240
aaatgtactt gctaaattcc tgtgagaact ctgcaaagtt ggcaataaag aatgcatatt 126300
aatatgaacc accaaaaagt gaattctgtt aacattctag acaaatgtca catttgctgt 126360
ctcttgggat aaaccaagtc atttcaagtt gagtaaaatg aagtaaagcc agtgggatta 126420
tgcaaaggta cagcaaatga aaggaaaggc aacactctct tgaagagcga gggagaactt 126480
tcctgtatta ctcactagac aaagattatt atcttcatct tatagttgct gccaattcaa 126540
caataaataa aaagaaatgt ttattatatt tggccttgtt ctaacagaat ataatgtgtc 126600
cggcaataat tatatccagg tcaaataaat ttaatcaaaa tttaaagtaa ttaaaaataa 126660
aacaaattaa gatggaaaca aaaaatggca ctccaaaacc taaaaggctc atcatgagga 126720
cactcatgtt tcccagaatc ccggaccaag cgtgactaat ttttctagca aatatacact 126780
ttgatagaca aacatgttta tacaagttct acagtgatta tgaggtacca actagttcct 126840
agagaagcat aattattcct gatcaagtcc agaaagacat ttttctggat gttattaatc 126900
ttaatggtta ctatatgtga ttgcttttta tgtgtgagag tttacaagag ccttgaagaa 126960
aaatggagag atggatgggt atacacagag agagagaggt gcacacacac atagatatcc 127020
acatatatct aatataattc tcaaaacgac ttcattaagg aaaattatgg acgttataaa 127080
aaagaagcag tgaggaacag caccagaaat tgatgagaac caacaagaaa acatataagg 127140
ctacaataac tagaagtgca tgacttaggg ttcgcagaca gatgaatggg caaacacgca 127200
ttgctataaa gaaatacctg agactgagca atttctaaag caaagaggtt taattggctc 127260
accattctgc aggctgtaca ggaagtgtag caccagcgtc tgctccttgt gaggcctcag 127320
caagcttcca gtcatggcag aaggtgaaag gggagcaagc ggtttcacat ggcgagaaca 127380
gaaacaaaag agagaggagg cgccaactct ttcaaacaac cagatctcct gtgaatttag 127440
agcttagagc gagagctcac tcgttatcat agacagcacc aagccatttg tgagacagct 127500
gccccgtgac ctaaacacct cccagcaggc cccacctcca acactgggga tcacatttca 127560
acatgggatt tggaaaggac acacatgcaa accatatcac catatattca ctcaaacaac 127620
atgtaacaaa gtgtcacaat gaatgattaa aagacatatt aaacaagtta agttgggaat 127680
actaaagccc tctcatactg tgtccggaat tgttgggttc ttggtcttgc tgacttcaag 127740
aatgaagccg cagacccttg cggtgagtgt tacagttctt aaagatggtg tgtctagagt 127800
ttgttccttc tgatatttgg acgtgtccgg agtttctgcc ttctggtggg ttcctggtct 127860
cgctggcctc aggagtgaag ctgcagacct ctgtgatgag tgttacagtt cataaaggtg 127920
gcacatctgg agttgtttgt tcctcccgtc gggagttctt tgtccctcct ggtgggttcg 127980
tggtcttgct ggcttcagga gtgaagctgc agaccttcgt ggtgagtgtt acagttcata 128040
aaggtggcgc atctggagtt gttcgttcct cctgttggga gttgtttgtc cctcctggtg 128100
ggttcgttgt cttgctggct tcaggagtga cgctgcagac cttcgtggtg agtgttacag 128160
ttcataaagg cagcgcctct ggagttgttc attccttccg gtgggttcgt ggtctcgctg 128220
gcttcaggag tgaagccgca gacctttgcg gtgagtgttg cagctcataa agacagtgcg 128280
gacccaaaga gtgagcagca gcaagatgta ttgcaaagag caaaagaaca aagcttccac 128340
agcacggaag gggacccaag caggttgctg ctgctggctt gggtggtctg cttttattcc 128400
cttatctggc cccacccaca tcctgctgat tggtccattt tacagagcgc tgattggtcc 128460
attttacaga gtgctgattg gtgtgtttac aaatctttag ctagacacag agtgctgatt 128520
ggtgcattta caatcctttg gctagacaga aaagttctcc aagtccccac tcaacccaga 128580
agcccagcca gcttcatgtc tcaatactat gtatcaaaac attttcttga tgaattagag 128640
caaggatatt taaagaatga aaaatgtaga gaacaaaaag aaaataaaat cttaatcttg 128700
gatagtcaaa ggccacctaa gcctaacaga ataaaatcaa ttacaaagaa gaatgaattt 128760
gaatttttaa acaagtcaaa aataaccacc aaaaatattt tctaaacaaa atatgaaata 128820
caaccttaac ttaccatttc agtaagaaaa tgtcaaatgg acaagattta tttgctatat 128880
ttggtttttg ttatcaacaa tgcacactgc tggcaaggaa gcacagatac tgtgatatat 128940
tgcatgtggc agtgaaaatt tgtgtaactt ttctgagaat tggtttttta ttatataaaa 129000
tgacactaaa aagcatctta tcctttgatc ttctaattgc atttataaaa atctctccta 129060
nagaanagta acctgagatg catacaaaga ttgatcttca aaaaatgttt tttgttgcat 129120
tatttactgt tttgaaaatt ttgaaacagt ttttctgtcc aaccatagta gaatgactaa 129180
gtaaattttg aaatatagtg gtttatcatg caattatcaa aactatattt ttatagacta 129240
attagtgatg taagtcatga gtgagagaaa tggtgatgat aaaatatttt taaaaatttt 129300
accaaactat atttgcagct gaattcaatt ttgattcaag tacatttgta tgcctagaaa 129360
caaactgata gaatgtttaa attacaaaac aaaatatata cattttttgt tatatgtgta 129420
tatatatata tatatattta aaaaacctgt tgtttgaatt attttatgct tcatatattt 129480
tggtattttg agatttttta ctatgaaaat cttcaaaaat ggaaacaggt ggactgataa 129540
acaaatagat ataaaacctt actttatagt taaacatcag tgagaaaaaa actgtttttt 129600
aaatggcaag tacatgaaca ggtaaagttc taaaagaaag aaaatacaca cacacacgga 129660
catgctagtt atatttacaa taaaactaat ttaggttttt gacttgtaaa atattttatt 129720
aaagtaaaat aatttcaatt aagtgtttat tcataaacag ctatcaagtt tatttttaag 129780
gtattaaagt actaaataag cactattaga agtgtggctt tgaaatttat atctgcaaaa 129840
gaccacatca tttttgataa agctctttat ttgtgagctt agtgaagaga aatgagaaat 129900
caaagttgat tacacaggtt actttttcac atgataagag aaagatacag ggagggagga 129960
aggcaggaat tgnntgagat tttagaaaat ctcagattta aaacttttaa aaattaagta 130020
ttgggcatga ggaaatgagc agagaaaata gtagtcatat ttccacattt gtaaagagaa 130080
gaacaatagc caggcaaact ccatgtctga agtgtggttt attttaatat gcaaaacata 130140
agcatttctc tgaccaaagc tgctttctat ttaaagctaa atataaaaat attatttttg 130200
agcatagtat tgcgagaaca tagtgaaatt tcctatgtag attctgtgct gttttagtta 130260
cggaaatatt tttaattaat cctccattta acaatggggc atacatctgt gtttttcgaa 130320
gcactgtttt gtatatatta gtaattatca ttgcactgaa atgaaaatat caatttcatg 130380
tacaatttta tagcacatat ttgattgaca atgaaatgca tttaacttat aaaaatgtaa 130440
tatggctgac attagcaaaa tctcttatta agaaataggt cataagtact ccaagaaact 130500
tgacagtctg ttctatgaag agcattaatt caaaagtccc ctatttgcat aaatctccag 130560
gtctcatttt cacagctgtt tgttgtcagc tagacggttg cagttcaaca ttattttaac 130620
ataatcggtg ggaagtatac ctttcaacta aaaataccat gctctgcaag aaagattgtc 130680
aggggtaaaa tataagttca ttcagttgat cttgatattt ttccttaaaa taaatatttc 130740
taatacagga actttaagtc tcaaattact gaaatatttt tattattaaa atatattttg 130800
taattttata ttttcataaa aataaaaagg ttatgtgttc atacataaaa atgttaatca 130860
gtagagctta ttttagcaaa gagtaaaaaa tactgaggat atctattttt cattaatcag 130920
ccaagcatta tatggagtgc aatataggtg tgctggaaaa aagaggatta aaatttttag 130980
atattgctga gaatatgcat gtatgttctt tgttttatta attttaataa tggaaaggga 131040
tcagcaatta ttagatctta aatgtctttt acctgtaaca cccaagagca cagaaggaat 131100
caaagtcaag agatctcagc ctggatactg agcaacacca tttgctacct gtaagctgga 131160
gttcttgatt taaaccctat gtacttcagc tctccatctg cagtaggggc cattatatct 131220
acagtaatca cttcacaggg tcattgctaa gattatatta aataatggac aattaactac 131280
tgtgggaatt gcaaagcacc atacaaatgc tagtcctggt tcagtgcctg ttctcatatc 131340
atttcatctt agctgcaatg aaatcctagt acaaattcat gaccttgtcc agctgtcatt 131400
tatggtataa tacataaaag ttaacccaag catagccaag gaaagagaca attggacata 131460
cctacatata ttttcataac tagcaaaaag attcgctggt ttttgccaat gtgcttctgt 131520
tacttttttt ttcttttact cttgaaatta tatttaagtg tagactccac ttaaagtaat 131580
ttgctgctgg aataggcata atgttctgat gtctgctttg cttctaatta tgttcaagct 131640
cattttgaca tttaaggcca attacaaaag tctagattca gaagactttt ccttagtcat 131700
ctaaaatttg aacaataaac agtttttttc tcctctctct ttattcattt aagtggtatg 131760
cttggcaaca agcatatttt gggaattgta aaagcaaaat aaataatgtg ggttcatttt 131820
gaaaaaagaa ctacttggtc tttcttgcca acataaaagg cagtcacaga attaactgaa 131880
accaccagtt tcaactttat ttcctcctaa atcacaagga ataaggaatt attttacaga 131940
tacagtgata ttttaaacgc ctaagttcta ttaacataaa ggtaattgac ttcaacagat 132000
ctctaattcc aaaagagttc atacatagag agatatgtat aaaaatagct acaaaatctt 132060
tatcatttaa aagtcactca taattaaact ccccagacta ggaccctaca ccaaaattca 132120
gttagtgttc cattgcgttt taacatccag tcatgtgatg acttacgaca tagagcaaag 132180
cacttaattt acctgcctcc ttattttcag tcaatttgcc aactgcaatt tttactgttg 132240
attcagtaga agaccctgat gagttgacag caccaaaagg caattcatag catctattag 132300
taagaagtca ctgtagcttc tttgtttaac ttttataggt aagatctggc ttggaaaaat 132360
agactggaaa gtatattgta aaaaaaacaa aattttccaa ttgactgtca ttatcagtta 132420
atagattata gaatagtaga cctttatagc tggaagatat gtatcgtgta cttcaaagat 132480
gaaaggaaat aatgtctttg aaaacactgt caaattttca aaattatgta tctaaaagaa 132540
attccttaaa aaatagttta tcctttataa tttttgaact ttataaaaat ggaatcacac 132600
catatatgac caaacatttt aagtcataaa gaatacacag gaattctggg ccgggcacag 132660
tggctcacac ctgtaatccc agcactttgg gaagctgagg tgggtggatc acctgaggtc 132720
aggagttcaa gaccagcctg gccaacatgg tgaaaccccg tctctactaa aaaatacaaa 132780
agtcagccag gtgtggtggt aggcacctgt aatcccagct acttaggaga ctgaggcagg 132840
agaatcgttt gaacctggaa ggtggaggtt gcagtgagcc aagatcgtgc cattgcactc 132900
cagcctgggc gacaagagcg aaactctgtc tcaaaaaaaa gaaaacatag gaattccgga 132960
atttaaccac tgtgatagaa gttgcttttc cttgggacaa tatttttaag gcagatttca 133020
aaattattat ttcaactatt ctttatataa tgctttatta tttttaaagt attcacatat 133080
atgttatttt gattttcaaa acaatcttcg agtgacaatg ggattgcata tttgagaaag 133140
gctggtctca ggacggctga atgtttttcc caaagccgtt aagtaagtcg gtgacttaga 133200
ctcagacgct gtgaaagcag aggctgagta cttggttctt gacctcactg atctgctggc 133260
ttacagagca tcctggtctg catactcagc gattcaatct ctatcttaaa cgcagtccct 133320
cagccattcc ttctagaaag gtgatctctt tagagtgaga gcagtgatgg aggtggctga 133380
agttacacca gggggagcag ctttgaaaag ctcctggctg ataggcatgt actaatggga 133440
gcaggagctt tgttggcagt gtcgaagtcc ctttggaggc tgtgtgagga gggaacccat 133500
ttccctggga tatagctctc tccacagggc agctggatgg ctaggggcag ccatggagta 133560
tcagattcac ctaggaatcg atatttttcc tgagggtttc acaaaaaaag acagagagat 133620
ggaatttgaa gaactgggaa gagtgtgatt gaattggagg gatctgaaat aaagaaatag 133680
ctatggtcaa tggctctaac caacagtact atatttatac tccaaattcc aaatccacac 133740
tatgtgtatt taggtacaat ttagtttagc catagtaagt tgtggcttct ggagctttta 133800
tttaccatag gattttaaat acatttcatg tcatcttcat tggttttcct taacccctaa 133860
ttctccacaa gatcttcatc ccgtcagtta tgactttgcc aaccaatata ctttttagaa 133920
atgtaacccc aacattaggt acgaccagca tttactgtat atcaatatta tcctaaatat 133980
tgctgtagct ttgaatagct gaattaagtt ttaaataaaa gcaaaggaat tataaaacaa 134040
aatattaacg gattatgagg tcagtgggtt tttctgaaga taaaactatt ctactaatta 134100
ttgctgtttg ggaaaaatag aaacaaggag actgagtaaa tgaatcatta aggcaattaa 134160
aaacagaaga gaagtcactt ttgcactcag tgaataccat caaggcaagt cttctatttt 134220
agggctgtct tatagtaaga tataacaggg actctctcaa taaaaaggtt gagctactat 134280
ataaatcatc aagtagattt tattttgaaa gcaacttttt ttgtagagaa agagttcttg 134340
aaaccagtta aagatttaaa aagttgatac aagttatgtt gtaaaatcaa agttatatgt 134400
ggatgatacg agttgtattc cccaccacat tttaacattt ttagtgtata tatttttaaa 134460
tgaaaaaatg tacattttac acgtatttta gtacaaacag taaaaaaaaa gtcagaagta 134520
atttatcaaa acatatgttt acacaaaaac ttgtatataa atgttcataa cagcattatt 134580
cataatagcc aaaaggtgga aacaacccaa atatcaactg ataaataggt aaaatgtggt 134640
atatccatta ataaaatatt atttggcaac aaaagggaat gaagttccga tgcatactac 134700
aacatggatg acccctggcc acatattggg tgattccatt tatagaaaat atccagagta 134760
caaaaagcca tagagacaga aagtagatgt ctttgatttc caaaggctga gggagggagg 134820
aatggagaat gacagctaac aagtatgtag cttcttttgg ggataaagag aatgttctta 134880
aattagatag tggtaatggc tgcacaacca tgtgaataaa ctaaaaccca cttaatcgta 134940
cactttaaaa ggtgaacttt atggtatgca aattgtatct caaaaaccta tttcttttaa 135000
aagtcaaaaa aaatagtata gaccccttcc atagttcctt agtcctttcc attctagtcc 135060
ttagagttac aggtttattg tatacacttt caagcattta tatgcacaca aaagcatatc 135120
tatgtgcttg ggatatagca aagggatggt actatatatt ctacttactc tactttgacc 135180
aaaacccaag atgtttaacc attctacttt ttcttaatat ttgactatgt ttgaacttaa 135240
attgatatcc acacatacta aaataccaaa atatgcattg agtcatcaaa tttcaaaggt 135300
catccatgat attttttaag ggcttaaaac tccttngcat gatcnttcag cctgtttant 135360
tcagcatagg aaaataccct tgctttgcct tcacctaact ctaaggaagt ctattagaga 135420
tatttagggt cagaaatggg ttcttggggc ttgagagaga aaaggatctt ctgctattga 135480
tgatctggct ctgccatgac cctatggcat gggtcctcag tggccctgtg ggaagcctag 135540
tgtaggcaac atggcctagc ccacctatgt tgatgtttaa ggggtgctag gaacaaaaga 135600
gaagctgtgg aaacttttgc ttatccccct ttcttccctc tttggtggtc ttatttttat 135660
ccgacgctct taatctcaac ttataaccgg aaaatacagc accaaagcgt gagggcattt 135720
aggggaaaaa tgttatctgt tttggaagta atatcaagga agatcaggga caaatgcaga 135780
actggaagca aggactaagg ttggatttag caggatttcc tgaaagattg gatgtaggat 135840
gtgaggaaat gagatgaacc aaagatgtct tcagggtcat tggcctgaat aacttgaaga 135900
atagatttgc cattttcttg gctgggaagg agtgcagaaa gaacaggttt gaaagtgggg 135960
catgaggagt ttcatatgac acatcaaata cttgagattc ctgttatcta acatctgtcc 136020
aagtaaaaat gtggagttga ttctggaggt ggggctggaa atataactgt ggaagtcatc 136080
agaacataca agggatgtga aggcattaca atggatgaga tcaagcaggt agtgagtatt 136140
gagatataag aaaagatctg aggtcaagta ctggagctct gtaacattta gacattagga 136200
aattgaagag aaaccagcaa aggagcatgc aaagggctgg cattggattt tgtggctctg 136260
tagtgcagtg ctctggctct tttggtgact gaaagatgct tgttcactgc ttttctctgt 136320
gttttcaccc ggagcatccc tgtgacattt ctatatatat atatttattt atactctaag 136380
ttctagggta catgtgcaca acgtgcaggt ttgtacatat gtatacatgt gccatgttag 136440
tgtgctgcac ccattaactc gtcatttaca ttagctatat ctcctaatgc tatccctccc 136500
ccctcccccc accccacaac aggccccagt gtgtgatgtt ccccttcctg tgtccaagtg 136560
ttctcattgt tcaattccca cctatgagtg agaacatgcg gtgtttggtt ttttgtcctt 136620
gcgatagttt gctgagaatg atggtttcca gcttcatcca tgtccctaca aaggacatga 136680
actcatcatt ttttatggct gcatagtatt ccattgtgta tatgtgccac attttcttaa 136740
tccagtctat aattgttgga catttgggtt ggttccaagt ctttgctatt gtgaatagtg 136800
ccacagtaaa catatgtgtg catgtgtctt tatagcagca tgatttattt atttattttt 136860
tccaactctt ttttttatta tactttaaat tttagggtac atgtgcacaa tgtgcaggtt 136920
tgttacatat gtatatatat gccatgttgg tgtgctgtac ccattaactt gtcatttaca 136980
ttagctatat ctcctaatgc tatacctccc acctcccccc accccacaac aggccccagt 137040
gtgtgatgtt ccccttcctg tgtccatgtg ttctcattat tcagttccca cctatgagtg 137100
agaaagtgca gtgtttgact tttgtccttg tgatagtttg ctgagaatga tagtttccag 137160
cttcatccat gtccctacaa gggacatgaa ctcatcaatt ttatggctgc atagtattct 137220
atggtgtata tgtgccacat tttcttaatc cagtctatca ttgttggaca tttgggttgg 137280
ttccaagtct ttgctattgt gaatagtgcc acaataaaca tacatatgca tgtgtcttta 137340
tagcagaatg atttataatc ctgtgagtat atacccagta atgggatggc tgggtcaaat 137400
ggtaattcta gttctagatc cctgaggaat tgccacactg acttccacaa tggttgaact 137460
agtttgcagt cccaccaaca gtgtaaaagt gttcgtattt ctccacatcc tctccagcac 137520
ctgttgtttc ctgacttttt aatgatcgcc attctaactg gtgtgagata gtatctcatt 137580
atggttttga tttgcatttc tctgatggcc agtgatgatg agcatttttt catgtgtctg 137640
ttggctgcat aaatgtcttc ttttgaaaag tgtctgttca aatcctttgc ccactttttg 137700
atggggttgt ttgttttctt cttataattt gtttgagttc attgtagatt ctggatatta 137760
gccctttgtc agatgagtag attgcaaaaa ttttctccca ttctgtaagt tgcctgttca 137820
ctctgatggt agtttctttt gctgtgcaga agctctttag tttaattaga tcccatttgt 137880
caattttggg ttttgttgcc attccttttg gtgttttaga catgaagtct ttgcccatgc 137940
ctatgtcctg aatggtattg cctaggtttt cttctagggt tttcatggtt ttatgtctga 138000
catttaagtc tttattccat cttgaattaa tttttgcata agattcctca tacattcctg 138060
ttgtgctttc accctctact ctctggttct caccctgttc tcatatatcc aaggaagatg 138120
atacactcta attagaaaca acaactgaac tcagctcatt attttcaaaa tctttcttct 138180
ccattaggta aaaatcattg cagtctgttt attcaatatg ttttcttttc cacttaaatt 138240
ctgttcatgc agagactgat tcctgggaac atcaatgtgc tggcaacttt gactttgtaa 138300
tttccctttt gttgtcccac tcaactgcat ggctgatctc cattcatttg ttcacttcca 138360
gagcctactg ttggcaatct gatttttctt catagtttcc cattaaaatt cactagagat 138420
gcttttgatt tacttatttc ttccctggca gggtagagtt gcttgttcca gatcacctca 138480
tagcaaactg gaccattctc aagtaaactg ctcatccctg gtgcagttat cagcagggag 138540
gcatctgcag cattaacagt gattgacccg tatagtgatg tttaatatgt gataatgtta 138600
ctagcagcaa acaaaatagc acttgtaaac acagttgttt actcatactt acatgtatag 138660
gtttggactt gaggggtaaa atagcaaaat tacccaactc ccctgctaat aaaacctaag 138720
gaaatgaata aaatgacctg agaaaattat accagcataa ctacagtaag gaagagctac 138780
aatttcatgc cattttctcc gaatagcagc taggaggaaa gaaaagaaga gaaagatgaa 138840
ggaggaggaa aaggaaaggg tcgcggagga ggagaagaga atgagagaga acatgaatat 138900
tctaggctca tcccttaaga ctgtcttctg gaagaagtta agaagaaata aacttggaaa 138960
aacaacgaaa ccgtatactc aaattcccca atctgtgaag tctgtggcca aagggctatg 139020
cagagccctg gaaagtgata agaaccactc atgtatagaa gccacttgtt ccagaggcaa 139080
aataatccac tagatctcac catttttatt tttttcagct gaggaggctt gagagtgaag 139140
gcaaaatgtc ataccttctg aaaatgaatc atctcccatt ctgctacaaa aatgtagcat 139200
aatgaaaata tgaagagaca aaaacagaag cttcaagagt acaggaagct caggataaag 139260
aggggtgtcg aaagccccag gagttgtcct attcgcccat acagagaacc aaaaccaaca 139320
ggaggacatt gacttctccc tcacctggag tcagtggagt gggaatgatg gctggagaga 139380
ggccagtgaa tttggggaag tgaacactta ggactgatta gttctggctg caataaagat 139440
ttcctgaacc tacctgaatt gaagaaatat ctgaagcctg atatttcaag cataattgcc 139500
catacacagc ctcagctaat acttctctcc ctgtacccct ctcctcatac tgaaacagta 139560
aaacacagag aagaaaacct cgttgataaa ttgaaaaagg atgctaatga gtgggatgag 139620
atatctggaa taattctctg cccctgtatt agaaagaatg aaagatctag ataataatgt 139680
taaaagtgga aattttggca actgtggaac cagtctagaa agaaattagt tcaaattaaa 139740
acaggtagtg agaggacccc aagaataata tctatgagag taagaatcaa atggtttctg 139800
ggcaattgat ggtttaaaga aagaacatct gcaggatagt aagaagggtt tattctaaat 139860
gataagtgta atgtgtgaga atctggaagc tacttgagat agaagaaaga aagaatatat 139920
ttanttttcc caatgagaca tgtgagaaat agtcagaaaa tctcagcaaa aacaaaacca 139980
aaccaaagat tgtattaaaa aaaaatggct caaataacgt gagttaaatt ggcccagatt 140040
ctgagcaatt aatggaaagt aaggaaggtt ccatttaacc ttgaccattt actgtctaat 140100
agagtcttgg agggggaagt ataattttag aacattacct ggcccaagag tgagcaatgt 140160
tttcatagga aacattgact atcaacatat tgattatcaa cctgctgaga agcacggatg 140220
acccaattat gatagaaaaa caaaatgtaa atattgtcaa acttgaggat ataaatgtat 140280
acatgacacg agatggaaaa tgaaagcaga gagaagaggt gacctgacaa gtggcaatgg 140340
taataccttc atctcacact ggaaggggtc aagtctttct agtttgatgg aaaaagaaat 140400
cgagatttac atacaaattt gggagtggtt aagggaagtg gggagtgatg ttgtgcctga 140460
atgaaatctt cacatatcat agcagaagtc tatgtctaaa gtggataaat caagaaatcc 140520
taaataggga taggcataac gccatcagaa gtgaaaacaa aaaattcctg tctcattact 140580
tataccaaaa taaatttcag atttaaactg atttaaacag ccaattcagg ttcaacatgt 140640
ttaaaataat aaagcaagga aagtgtcaaa ctactgcata aaaccatggg taaatttatg 140700
tctaatcatg cagtgagaga agtcttttta agcaaaataa aaacacttaa aaggaatgac 140760
aaattagacc acactgaaat ttaaaactga tctttgcaaa aatataagaa atgtataggg 140820
gaaaatgcac tgaacataca tggcagataa aagatgggtt ttcttatttg taaagagttg 140880
gtggaaacca ataaagaaaa taaaatggtc aacagggcag aaaaatggaa taacatgcga 140940
ataggtagtt cagagaaaca acttcctctc tgccttcttt ccactgaaac tctactcctg 141000
tgcattactg aggtcagttg cttcattttc ccaaaactgt tcttgattca cccaagagga 141060
ctaaattggc tcttctctgt tgcccctcag tactttaacc atattttgct tacacaccaa 141120
agttactatt cttccctttc tttttatttt cttttttctt ttgagacagg atctcgctct 141180
gttgtccagg ctggagtgca gtggcacaat ctcagctcac tgaaacctcc gcctcccagg 141240
ttcaagcaat tcttcttcct cagcctcccg agtagctggg attacaggtg accatcacca 141300
caactggcta atttttgtat ttttagtaga gacggggttt caccatgttg gccaggctgg 141360
tctggaactc ctgacctcaa gtgatctgcc cgccttggcc tcccaaagtg ctgggattac 141420
aggcgtgagc catcatgccc agccagtatt cttccttttt gagaattgat cctgttcatc 141480
tttttcttcc cctctcaatt atacaattct taagggaaga aactatgtct tactccactc 141540
aatccccaat gcatcaaacc tttagtaacc actaataatc cttgtttgaa taaataaaga 141600
gcacaggccc tacggacaat gtaagtcagt aagtgcactt gagtcactat ctcaagcaca 141660
ctaccatttg aatttaaatt tctggataaa aatctccaca aaactgataa ggcacccttc 141720
aagcaagaca caagttaatt ttcagcctct aatagaagta tttgttggca ctacctttca 141780
ttggtttatt catttcagca gccataaaca cacagatccc attgtcacag aaagccttgt 141840
tcgcaaatat aatttagtgc atctcacaat atgagctttc aggtggttga gctgtgtgga 141900
aattcgattt ttttttctcc cgagactctg aaatgaaaag aggataaccc cagtgctctt 141960
gcccacatcg cttatctcac aacaacagat tacaatccca taactccacg ttcccaagca 142020
gctactgtgt tgatcaaatg taatgcaaca gatgagaaaa catcagctgg ttcatgccca 142080
agacagctga aaggtgcact tacattttta gtctccagat accaaaataa atctgttggg 142140
cttaatcatg agttgtcctg ctacttttgg ggaaagaaag ccatgtccag tgaaatttct 142200
tttatactgg caggcatttt gactcttcac ctattgctgt tgaatctcca ggatatgtac 142260
atgttttcac accgatacct tcattgaaga aaatacagca atctgatatt tttatgtgaa 142320
tcatctttgg aattcgtgtt cctcaccttt ggatacaata aatattcaag agaaaaaaaa 142380
tacaggaaaa aaataattgc cctcaatgat gagttctgaa atacttataa ggataagtga 142440
tgtgttgaaa aattctcaaa agcaatttta gaaggaataa tttttgcaga gagtggctgt 142500
ctcttgggca ccataacaag aaaaatagta tattgccctt ggtgatggtg cggtcaagta 142560
tcaataacaa cacgcttcat attttcatga acaaaacact tcttcataag gtaatgagat 142620
tatagaaaaa tcaactcaag gtaaaaataa ttactttgca catggacaaa ggataagtgg 142680
aagaacttat cttctagttc gtggttcatt taacaattaa ttgctccttt ttcaaatagg 142740
tccactgtgt tctgggcctt gaacagtgta cctctaagaa agtttgttat ccttactgaa 142800
ggaaattaca gttaggtcgc ttctcagcct tttggctaag atcaagtgtg aaaattatac 142860
ttagattact atgtaattag gcctggtaga tcctgggtag acttcactga atgcaggatg 142920
caatatttgg aaaagtactt actttggagt cctaatgcct gggtgctact tctattagtg 142980
ccagaaatta atagtgtgac tttgggataa tcacttaaca tctttgagcc tcattttcct 143040
tatcttcaaa aaaaaaaaaa aaagaaggaa tcagatgaaa tcatctttac cagattaggt 143100
ctatctttag gtcccccagt gtaactgggt ttctgtcttg gtctcagtcc atccttgcat 143160
tatcctggac tttatttatt ggaatcccaa tatctgagaa ttcaatttat gtctttatcg 143220
tactgaagtc tataaagatg tttttaaaga gtcactagac tccagtgggg caacttgctc 143280
cagatatcat catagtctca ttaaaaagta tttattgact actaatgtgt ataggataca 143340
tgagttggag actcacagat acacatatat ttaattagaa aaatatgtaa gaatgaaact 143400
agccaaagat attggcagaa agtgtgtgaa atttttagct tggctggcct ttgttggaat 143460
gctctatttt ttattttttt gtttgtttgt ttgttttttt ggtcttggct tcttccatga 143520
tcttgaccct gtgccttgaa acttttttta aatcatgaaa aatgtgtttg tcttcaagct 143580
gtccagtgtg gcaatatcac ttagaaatat ttctttttta aagagtccca tgtttttaat 143640
atgatagcta aaataatatg atagaaaggt accataaaaa taaaattata tgcctttata 143700
tgccttagac aagtgtaatt cactataaaa ataagtttct cttagcagca ggaacaaaga 143760
aaaagtaatc tgttgaaaat gttagatagc ttgctgaaag gaaaaaaatt aacggcaaaa 143820
accaaagatc ttgaatttgt ttctaatttg ctcaacagca tttactgcga acaaaactaa 143880
ttttaattca gggtaattat tttcttattc cacatcaaat agttaaatat cacattttta 143940
agatctttat tcttatatct ttcctatgtg ttgaatcaag actgttcttg ccctgatcag 144000
ataaaaatca ataatattga gatcaaagtc ttcaaacatc acatgctaat ttgaagttgt 144060
atgcaagcct aaagctagtg tgtaatacct ttgttctttt cctcttaggc atttatgtcc 144120
atgttccaga tcctcaccca ggaaggatgg gtggacgtaa tggaccaaac tctaaatgct 144180
gtgggacata tgtgggcacc cgtggttgcc atctatttca ttctctatca tctttttgcc 144240
actctggtga gttcagcatt tttttttcaa ttatatcttg gaatttataa tgggatgaac 144300
atcaacagat atttggccta ttgtcaattt caaaatggga gccaaaggac taatgcagac 144360
taatctggtt ggatgagatc cctccttcca ttctaagttt ctacacatca aagaactgct 144420
tgatttgtta agttagatat tttctccatc aggtaccagt gtttgtaaga gggaaaacaa 144480
gacagaacaa aatgaaaatc tcacatttac ataccaattt aagtatcccc aagcattcac 144540
acctagatga tctcaggatc aaaccggaac tccattatta ttttttttct catgtagaga 144600
cactgtcttc agtttcactg catcctcttc acagctgtaa ttaaactgaa gacagaagct 144660
atagacctca gggtgcagtc agttaattag aaatcagcac agtggttttg tgctatgtgc 144720
gactggaaaa aaacacatgg aaaaaaataa aacacattgc tgcaagtatt gtaaaagcac 144780
aagaaaactg aataccaaag tccagtaaga accgacttct gtcacacaag cagatttttc 144840
tcttcaatat acttccatta aaaacaaaga aaaaatgtta tgaaatgcag cctgtgactt 144900
actaaggaat gtaataccaa atgctcatct ctatgtaata aatttgttca tatttaagaa 144960
gcaaacctaa gttctaacat cacgttagaa gttccaagtt gaggactcaa atgtttccct 145020
ttatcaggaa tacaagaaat aaatacaact gctactattg tttttggcaa tatgtcttac 145080
agttacaaaa tatcttacaa tattattgct aatctttgga acacccgatt agatagtatt 145140
cccagttaac agatgataaa actgatactc agaagagttt agtaatttat ctgatgtcac 145200
atggaatgta aatatgacca gagtgttccc aggtctgtct gatctagatt tggtccttag 145260
tcttgcagct aattattatt gcttccctgg ataatgaagt ttaaagttgt ctgaaaaaat 145320
gtctttgtca aatcaaactt ctgccaaaga atcactcaca tcaaacaaat tacatataat 145380
ctctaaggtc agttttaatt ctaaatatct atgaatgaaa taagtccttg ataaactaga 145440
tataacttag aagttgtgtt tgctatagac agacagaggc tttcaaaact aagacatgtc 145500
caccaaaaag ttaatgagaa ttcattgtta catggtgtga agtcatgggc tcaaacagta 145560
gaactacata gacatagttt tggccttttt atacatggag ttgactttta aaagttacgc 145620
gaaagatagg aacattgtgc aataggaatg gaagcctggc ttgcaaagct gaatctggct 145680
gtgctggtgt ttgcacaaca cttagccctg gggtctttgc atcttccctt ccaggacctt 145740
taagcctgtg ccatttattc attcatccat tcatttacac atcatttatg cgttcaacta 145800
agtttattaa gctacttgtg tttaagttac tctaaaacta tggaattgct cagactgttg 145860
attgtgggtt aaatgcagga tagatttcat tgaaatcatc tatgtcaggg aatatcaatc 145920
taattatttt atagtaatca acctaatcat tttcctaata aagcaacaaa atggtttact 145980
ttcctcactg aaaatgtttc acactcagat atatgtttga ttcttaaatc agggacacaa 146040
aaaatgaaag ctggaagaaa aaactagcct attacattat ttagtaaagt aacatttttt 146100
caagtgaaaa ttctactggg gtcactaata taataaaata aaatattaaa actggtatat 146160
agccttcttg ggcaatctaa atcttcttta tgggctaaaa tatggcattg gttatagaac 146220
acttaaagtt catccaagga ctcctggggt tcacctgagg ctttaggaat ccacagagca 146280
caagatgaaa accaatctct aattctactc tttccactta ctgatttaag tatctaccca 146340
aaacatctgt tctaactttt ttattgcaat tttcaaacaa cagttataag ttaaaactga 146400
aaattgaaat aacttgttct tttattcaca ctttttaaaa gtctgtaagg caattgagaa 146460
ttcagaagtc tacatgttaa cgagaacagt ttggtaaatg tggtgtcgta caagactacg 146520
aaattggagg gcaaaaatcc agattcaggt tctagctctg ctggtcactc gatatctgat 146580
ttctgaagac tcacataact tccctgatct ctctgttgtt tgtatcggaa agtgaggata 146640
ataattcaca atacacccag tttccaaggt tgtcatgtat ctgcgagtta accctgtatt 146700
tctgaggatg ttttagagca ccagcactga gcccctttaa atgtagataa gacggtttgt 146760
gcatttaaag ccatatatta ataaatgtta aatttatatt atgttcagat atttttaatt 146820
tatgcaagta tcatttatta gggtatcatt tatgcccctt cctgaattaa tttccattct 146880
tcttctttct ctccttccct atacctcttc tcccaggcaa tgactctgat aattttaata 146940
taaattcatt ttccaatttt tagaacatat ttcactaaat ttaacattct gtcattcagt 147000
agaagactca gtttgtgtaa cactaaggag aaaaacaatt aaactataca catagaggat 147060
aaggtgcatc cctacttcag agtttttaaa aggtgaaagt aaatgtgcat cttaaaatca 147120
atgaaatgca gaggtttccc acacatatat gcatccatta aaaatatagt atttagggcc 147180
agcacggtgg ctcacgcctg taatcccagc actttgggag gctgaggcag gtggatcacc 147240
tgaggtcagg agttaaagat cagcctggcc aacatggtga aaccctatct ctactaaaaa 147300
tacaaaatat tagccaggca tggtggtgag cacctgtaag cccagctact caggatactg 147360
aggcaggnna gaatcacttg aatctgggag gtgggggttg cagtgagccg agatcatgct 147420
gttgtacccc agcctgggca acaacagtga aactccatct caaaaaaant atatatatat 147480
acacacacac agacacacac acacacnnnn gtgtgtgtgt atatatgtgt atatatgtat 147540
atatgtgtgt atatatgtat atatatgtgt gtgtatatat gtatatatat gtgtgtgtat 147600
atatatgtat acatatagta ttttaaactt aaggttacca tctaaataca ttttatgccc 147660
aaaattctga agattaatat taagttttct tagtttgcaa agcactgctc cagtcaactg 147720
atggccatcc ctaggggagt ggtctggtaa tacatacttc tctcccntat aagtccacgc 147780
tggggccaag ttatacatgg tcatgtgttt ccctccttat caattatttg tagcagcaat 147840
ttttagaaca aatggtatca aactcaacat atattctgca gttaaatttt tcactggcta 147900
tttttttctg agatcttttt atcttactcc acatgaagct aatttggtca ttgttataga 147960
gagccgtgtg gtactccgcg gactgtgaat atgccatatt tgtttatcag ttccctttct 148020
gatggctatt taggctgttt tccaaagttg tacttttata atgctgcaat acatttatgt 148080
atcgtgccca cttatgtgaa tttctctagg atatatgtcc aaaagtagaa tgcttagatc 148140
ttaggtactt cccaaattgc tctataccag ggacctgcaa gcccagatac caaatccagc 148200
ccaccacctg tattatacaa cctgtgagct aaaaatggtt tctataattt agtggttata 148260
caggtaccca cagaatatcc tcagtattgc ctcatgaccc tcaacgtcta aaatgtttac 148320
tgtctggacc tttaagaaaa cactgtggac tcctgctcta tagataaatt gtgctaattt 148380
accctcccaa gtgcaatagt tgagaattcc tgtgttctta cactctcact tagacgtcac 148440
attgtttgac atgtgaggtt ttggcaatct tatgagtgaa cactggtatc aattgggctt 148500
gcatttttgc atttccataa ttattaataa gggagcacct cttactatgt ttattgacca 148560
tcttttttgt gactcaattg tttgctttac ctattttcct aaaaacaaat ttgtcttaac 148620
tcatttattg gatatttgtt ggatattaat ctcttgacta ttacatgtgt tgcgaatatc 148680
ctctcttagg cagtattttg tcttccagtt tgtctgtgat gtcttttgac attctatata 148740
tttttatttc atttttagtt aacaaataat aattgtatat atagtagtcc tcctttgtcc 148800
ccaagggaaa ctttccaaga ttcccagtag atacctgaaa ccatggatag tacagaaccc 148860
tatatatact atgtgtttta ttatacatac ataactttga taaagtttaa tttgtaaatg 148920
aggcatagta agaaattaac aacaataata acaaaataga acagttatga caatatactg 148980
taataaaagt tatgtgaata cgcattctct ctctgtctcc atctctcctt ttcaaaatgt 149040
cttaatattt tcaggctgtg gctgaccaca gggaactgaa actacagaaa gtgagacagt 149100
ggataagggg ggggcctact gtatttatgg ggtacaacgt gatgttttga tacatgcata 149160
cattgtggaa tgatcaaatt aggtcaaaac tatcggtttt tcactgatgg tctgtattta 149220
ttttgacctc atgcttaagg aattctttcc cacctgaggt aatacaaata ttctcctata 149280
tcttcttcta attgtttaca atttttgctt ttcaccttta agtctttagc tcatctctac 149340
ttactagtta gatatagcat aagctagatg aaatatactg tttaaataaa actcaaatca 149400
atttttctca gatttatatg agaaactgca aggtttagaa tatttatttg atttatctga 149460
ttatgaagtc taacacaaaa aaggtaaact gttcaaactt ttaaatttct aaattatttt 149520
ttaaatgata tataatttaa taaaaggaaa cactatataa ctaaattaaa acaaagatta 149580
tcacttctat actacccaaa aaaagtctaa tactgaagtc acttccccag ttcacaaaaa 149640
attttgctta aaacatggtc agcagttgtt tctcttttcc tttgtaccct tagactaaca 149700
gttactgtaa tgggctttat gaagtgagtt caatttgatt tgatacagtt ttactgaacc 149760
tctactacca cgtgcaggta ctaacctacg tcctggccaa agtgggaaag agcttaattc 149820
atgtcctctt aggggctaca aataattgga aattagcaat aacgaacaca gacaggctaa 149880
ccaacaaaca aataaaacca gtggttccaa ggcctaaaga tgcaaatggt aagagaggca 149940
tgtgtacatt gctacttgct atgtgatcaa taaacatctg cttcccagtt gttcccaatc 150000
tgccttatga gaaatatcaa aagtagtggc agtgaaacag ctggagatag tctgtgggct 150060
aacatataaa cacatgcgtg agggtgacag gtctgtgtta cacacacatt gcatgcccct 150120
aaaaactaaa cttcacaagt taaaatattc cataagcctg tcttcagagc tgaacttacc 150180
ttaaaatgag catttttgtt taattgtatg tttcctttta caaaatgcta caacgcattt 150240
taacccaaat gggtgagaag ggaaaaaaaa agtagtctgt gtaaacatac aagctctgat 150300
gtgtcttttg ttcacaccga acagtggtgc catacaactt gatgagttcc tgatttagtc 150360
ttcccaggga caggcatgtg ccaagcagcg aaaaataaaa tgtgtggttg cagcttgttc 150420
tggaataaag aacagcaggc tatttcatca cccctggggg caccaatttt cagcccacaa 150480
tgaaaatcaa gctgaagtat atagcaaatg catattcata acctccatgt attgtccctt 150540
tcaaacatct ctctcttccg ccaggtatgt attctgtatt tctgtcctga ctgattgcag 150600
tttattgaat gcttgttaaa ttcatctttt tccccatctt tgccaatgat ttggggatag 150660
ggactatgga agacctaaca agttgaaaga ctccattttt cctgcaatgt ttttctgtct 150720
attactgttt caaaggaaag ccctgtgatg tgaatactga aaagaaagaa aatgtaatta 150780
agcgttcatt gtgggtagtc tttttgttac ctttgaagtg ctgaaattaa cacagcaatc 150840
tcttgatttt gcctcggtag tggcagcttg ctgagaatag tcatattttg ctgacacaaa 150900
tgggcattcc aaagtgtaaa ttaaataact tgattgtata gaattcattt aaaagtgcat 150960
ctgtgttgaa cgtatcccat tttacactgc gctgattaca tttgactttt tgttgaccca 151020
tataaaaagt gaaattgttt cataccacag gcggcaagac agcttaggat agggtgatta 151080
taaatggtaa acaggaaaag aaaaacacaa gagtgtggga cattgattcc tgctgtgttt 151140
ctagtgtata tttcaaaata atttaaagat aagaaattat taataaagtt cacagcaaag 151200
acgaaaataa gattaaaggt gaaatttcag ctaaagggac atctttaagc tatataaaag 151260
gaaaaaaatc ataaaattaa acttcataaa aagaaagaaa aatgaaaagg gaaagctata 151320
tagggtaagg tcatggctat ctgcagagtc agagagaatg taaaatagga tatgttgctg 151380
cagggagaga aattttcaac cagaaaatcc attgtgaatg acaaggctgc cctcttgcaa 151440
aaataaatca tacttttcag ctgtttgaat catgctaatc caaaagtctt attccgaggg 151500
aatgagaact acattatgtt ggacaaaatg atctgcatca caacaaaatt ggaagaaata 151560
attatacttg caaatgcaac tatttcagta atttattgaa tttgactgaa atttattgta 151620
gttaaataga aaaaaaataa atatatctgt ggtcacatgt ataaaactta aacagagcaa 151680
ataactacca cagncattaa ctgaggtgaa tctgggctgt ttcagaggna gaaaaaggaa 151740
gaggaggtat tagagaaaga ggagcgtcat aaagaatatt agagaaatca aacgcctgtg 151800
agaccctggt ccaggtacca gtttgaacct ggaaaattac gcttttgaaa tccactaagc 151860
tgaaaggtca aaatcctatt atatcattca taaatattct gagagagact tcccagactt 151920
cagcaggcct gataatgtgg cattttccac actgaatgca ttgtcaatgc taaacatacc 151980
ttagcaatgg gcattataat ctgagggaaa taaagaatta gatatctgaa atacattgtt 152040
attctccact ttttcattga catcactgat tcataatgta tcaatatcgg tcataaaatt 152100
aaaaagtgga tacatacatc agctgtatat tacacagtag gacaaatgct gtgttgcata 152160
ttaatatgat caaacgctat agacctgtta aaagtgccaa atagtaaatg catgaaaaaa 152220
tagatatttg gctttctttt ttacagcatt gtacaaacta aacaccactg tgttgaaagc 152280
atacatgtac ttagcagggt tcaagaggag atgaaaggtg gtgtcattag cctttttccc 152340
ctgaaattat atcattaaaa aaaaataggg acatagtata tcctgctgca gtataaattg 152400
aaatatcggg ccaggcgtgg tggctccccc tataatccca gcactttggg aggccgaggc 152460
gggtggatca cctgaggtcg ggaattccag accagcctga tcaacatggt aaaaccctgt 152520
gtctactaaa cacacaaaaa ttagcctggt gtggtggcag gcacctaaaa tcccagctac 152580
ttcggaggct gaagcaggag aaccacttga acccgggagg tagaggttgc agtgagctga 152640
gatcgcacca ctgcactcca gcctggggga cagagagaga ctctgcctca atcaatcaat 152700
caatcactca atagaaatat cacataaatc taaatattaa gaaataaata atgcaaagca 152760
aattagttgc ataatttaga acagtcaaag cacaaaggta aaagtgtttt atacatatga 152820
tgacactcct gtgatttaat gtggcaagtc cctgtaaaat tcctttatta catcaatacc 152880
gttttaatat gaacctgtaa atcacattta gtggctatag aaaaaccttt tggcacagca 152940
acatgtggta gtgtaggtaa acattagctg aaggtaatat gcagacatcg ctgtaatggg 153000
ttctgattac taatgagcat tacctcagct ttctgtaaaa acagaataaa tgagaacact 153060
cagagaactg aaaaatggtt cttcctttca gaatgagggc ttgtcaccca ctcccatgac 153120
tttccatacc atgtgttggc aagtgtctga cacccaggtc gacctgctct ttcagtccaa 153180
atccacattg cactgggttt gtaggaaaat actgtatcat tgataacata aattaaatat 153240
gatggacacc aagctgccat tcttccttca cttctaccct ttatcgcagt gcttattgtc 153300
accttattag agtctgtgag aaaagaaccg caaagtcatt ctcacctcct ggcaatcagc 153360
tacagactca ccctgcacct cctgaatctt ctgtttccat tgcaaagaca cagccaaagc 153420
cttgggtcag acttcagtca tctctcaccc ggagtgccag ttgccacctt atcacagtgc 153480
cctacatgcc agggacagtt tgatgaggat caatctgaaa gtccacattc aaatagggct 153540
tcagcggaaa cccaagcccc ctaccacaca catacatctt gaaccagttt ctgttttgta 153600
agtttgtgct tttgtcatgc cactgtcaaa ttaattgaaa aatgatgcct aaacaaagat 153660
atttgctgaa taaaattagg tttatgctac tttcaagcaa acttcaaact ttattatatt 153720
atttttaaat ttgttgcctc cccaagagtt tgttctaatt ctttaagttt gggccttcct 153780
gttgtgaagt cacgcagcgt tttcccagag aagccaaagc tcttccttta ggagtcttgc 153840
cttctcctat ccacagcaaa tatcaaatgc atctgccttg aggagtcagt gcagctggca 153900
tgccgtggct ctctctgtcc tgctctgagg gtggcttttc tctgtttatc ccaaggaaaa 153960
agtatatacc agtttcttgt ttaaccaatg taagaaaaca ttacatatct tttttttttt 154020
tttttttttt tttgagatgg agtctcgctc tgttgcccag gctggagtgc agtggcacga 154080
tctcggctca ctgcaagctc cgcctcccgg gttcacgcca ttctcctgcc tcagcctcct 154140
gagtaactgg gactacaggc acccgccacc acgcccggct aatttttttg tacttttagt 154200
agaaacgggg tttcaccatg ttagccagga tggtctcgat ctcctgacct cgtgatctgc 154260
cggccttggc ctcccaaagt gctgggatta caggcgtgag ccactgcacc cggctagaaa 154320
acattatata tctaataaca ttttgtcaaa ctgcacttaa ccttgtctag ttactatttc 154380
agtgagccag tttatttttt tgttttgttt gtttttagtt tttggagaca gggacttgct 154440
ctgccatcca ggcctagagt gcagtggcac attcacagct cactgcagcc tcgacctccc 154500
aggctcaaga aatcctccca cctcagcctc ctcccaagta gctggggcca caggcatgcg 154560
ccaccatgcc tgactaattt ttgttttttt ttttttttga gagacagggt tgcccaggct 154620
ggtctcaaat tcctggggtc aagcaatcct gcctcagctt cccaaactgc taggattaca 154680
cgcatgagtc accatgccca gctgagccag tttaaacttg ctgcattaca tgcattaaaa 154740
acaaaaacac acacacaaaa agccccagaa cttttaaaag gaaaaattta gcagaaagaa 154800
actgatgtca tcactttgtg attattccag cctccctctc ttatccgtga cctctgtggc 154860
actcaagacg cctgtccatc ctgccttcct ctccagcctc caaaccctct gcctggaagc 154920
cagactctgg ccagacttac tcaccaggcc ctcaccacac cacctggaat gcgttcctca 154980
cagctctttt ccaaaatcag tcttctcctt ggcatctgcg tggcttggga gagcatcctt 155040
ggctctctgt cattgtctca caatcttcga taagtagtgt tcggaaagtg cccccctggc 155100
ccatgtgccc agatgggctc tccaagtcta aatgcttcaa aatggtacag aactaaatgt 155160
gtgaatttat gatggggctt catttctggt cctccttctt cacacttgcg tggccgccct 155220
tcccatccgc tctccaattt tctttcacgt ttctgctttc tgagaagaaa taagactgat 155280
ttctgggatg gagcatgaga gagacagatg cagagagaga gagagacaaa gcgtgtttcc 155340
gtgggagatg cccacacacc tcacttggga gcatcggcag tgttggtacc cacacaggtg 155400
tgttttgaca tccaagactt gaccctaatt cttcttggaa cctgatgggg agagaacctt 155460
gctgggggcc ccacatgggc caggggcagc cagggcagag ttgggcagct gcctgagagt 155520
tctcggtgga gaggcccaga atatcccaca agaacaagtc tccgttagtt ccaagtggaa 155580
tgacagccct ttctgagttt ccctgagttg agagctaata catgtgttgt gggaacaaca 155640
gcccaagcca aaggccacgc ggaggccagg cgtggtgact cacacctgta atcctagcac 155700
tttgggaggc caagatccac ggatctcatg agctcaggag ttcaagacca gcctggtcaa 155760
ccttgtctct acaaaaaata caaaaaaaaa aaaaagtagc caggcatggt ggtaggtgcc 155820
tgtagtccca gctacttggg aggctgaggt gggaggatcg cttgagccca tgaggtggag 155880
gctgcatgag ttgagatcac accactgcac tccagcctgg gtgacaatgt gaggccctgt 155940
ctcaaaaaaa aaaaaaaaaa aaagaccagg tggagagtat agtggattaa atgggcccct 156000
acaaaagata ggaccatggc ttaacccaca gaacctatga acacgacctt attggaaaaa 156060
gagtctttgc agatgtaatt aaattaagga tcttgtgatg agatcatcct ggattatctg 156120
ggtgggccct aagtccaatg acaagcgtcc ttgtaagaca caaaagagca caagacacag 156180
agagaaagcc ttgtgactgg tgttagataa aggccaagtg actggtgtta acaaagccac 156240
aagccgaggg acagaggagg ccaccagcag ctggaagaga caagggagta ttctcccccg 156300
tggcctttgg agagagtgtg gtcttgccga caactcaatt ttggactctg gcctccagaa 156360
ttgtgatcaa ataaatgtct gttgtttgaa gctaccaact ccgtgcacgg tgttacagta 156420
ctctaggaag cgcatatgga ggacatcact gggaatcaga gctcttagct ttgggagctg 156480
agatggtggt caagtcagca gaaagaaagc cccaaacccc ctgtacagcc tcatcagttc 156540
ccctgatggg ggatggagga catattaccc agcttgtagt gggtaacctt gaccttaaac 156600
taccctaaaa agaaaaggag catttattca aatgtaactg agcttgaaag gactgaatgg 156660
aactgatgta gcaagataat gtttccagcc cccaacagaa atggagggat tgtgcaccaa 156720
attcaattca tttgtagaaa aaccaagaaa tttattttag ctttgcataa ctaattttat 156780
gtctgtatat tttcagacat tgtatagcta tactacatgt cagggttgct cggggagaat 156840
taaatgaaaa aaaagctgca atttgttgag ctattattac atttgtaata ttttacaaac 156900
gagagcacca aaactcactg tgggctggca gttgccacgt ggctcatagc tggcacagcc 156960
tgtttgctac ctgagctctc tgactccaag cacagtgctc tcttctatgt ctgcttaatt 157020
cagtgataaa catcactgca gtgagtgcaa tattgtattt atgtatcaga ccaggcagtg 157080
cctcacacat ccatggagtc cagtcaactg tttgtcaaat ttaatagaat aacatagcct 157140
tgctgtcctt aagtagcctg ccctctgtcc agtttggggg atataattaa gaataaaatc 157200
tcctgccaac ccacgaaacc tctccttaaa ggtagaggag agagagccca gttttattat 157260
tgaaaaagct ctaacgcagg ctgcaatgca catcactggc aatctgctaa agagatcacg 157320
gaggcagaaa atacctccct cttttatatc accgctttcc atacgtgttc tcaagataga 157380
aataactagt cctcaagtaa gaaggcttga cagcaccact tgttaaatat agtttatcct 157440
aaattcacct ggtaagtggg gtggccatct gtgggagctg attgccttta tccaaaggaa 157500
aattaaaact tctcatattt ccgtgacaag taggtaggtt tacaacttgg agccagatgt 157560
ctaaactccc accctctacg gagaagggga gacggaggct cttgtcttcc ttgatgttta 157620
cattacttca aggagacagc cctcaaggaa aacattcttt taggttgtag aactggtgag 157680
aagcttattt ggctcttaaa agtatttata tacatctcaa acagaaaggg aaagaattta 157740
caattccaag tcttataaag gaaatgctct aagaaaaggg aggcgaacag gatcccttcc 157800
gacccccctt tttttagatt catgtttgta ctttcactag agagagagga aacatgatta 157860
aattaggaca cagaacaatg cctgctccag tgcccaggtg tgagagaagg ggtataagat 157920
atcccctcct gcagaaggaa accagcaggt gaacatctca gaattcgggg tgagaaatca 157980
agacagggga aggtagactc tgcctctgat attactttct gtcgtcgagg tattgggaaa 158040
tgggctgaac atggagcaaa ctttaaaatg tccagtttgg aatgatgtct ggttcagaat 158100
aagcctgatg cccagttacc agtggtgtac cagtcatggt gatgttaata aaaaccctct 158160
ggtctagatc attctgtatc ttcttcaagt tatggtaaga ctccaaaggg catggctgtt 158220
gaaaagaagg gtgctggcat ttgtcccaag ccaagcatat cccatcataa tttaatcatg 158280
ttgatatact cattaaaatt gaaaaagagc tagccattaa cttctgcata ataacttctc 158340
tagcactggc tgaattatct caactttctg accttcatgc ttaaccacct aatattaaca 158400
aatgggaata attcattaag aagaaaactg aaaagaaaaa tatgagttag aaatgaaaaa 158460
gatgatcaag tgaatatggg acttaaaaaa attcaaagtt gaagagggac tacagcgtaa 158520
aatattttta aaaattatac tattttgttt tattttattt acctgttcta aaagaagcat 158580
acatttttta aaaactgaga aaatcataac attttttaaa agaggaaaaa ttgtattact 158640
ccaatacaca aaagcaagta ccattaatat ttctaaagta cctccttcaa gcattttctc 158700
tattactccg ttatatgcat agttgagctt ctaccatata tatatatata tatatatact 158760
cgtatttact gttataatgt gttttcaaca ccataaaaat tcaccagtgt attaggtatc 158820
tgttgctgtg taataaatta cccacacatt agaagcctac caggaaatag atgtttatta 158880
tctcaattag tttctcaagg ttgggaatct gagacaggct tagctgagtg tttctagttc 158940
aaagtgtcat gaggttgcag ttgagatgtt gtctacagct gcagtcacct tgaagtttta 159000
ctagggctgg agtgcctctt tccaagatgg gtcactccag tggctgttgg caggaggcct 159060
cagttcctca ccacatggac ctctccagag ggctgcttga gcatcctcac aacatagcac 159120
ctgcttccac agagcaggtg atctaggaga gaccaagggt aaagacacag tgtattttat 159180
tgcctagcct cataagtcac acacaattat ttctgcaacc tgctgatgac acaggccaga 159240
catattcagt gtggaaggga actacacaaa ggcatgaacc aggagtctag aacaacgctg 159300
gaggccatct tgaagagtag ctaccacatg ggaatttgta atggctgcat gtatcttatc 159360
acataaatct ctataactgt attgactatt catgcaaagt tggatgttat ttctaatatt 159420
tccttattac aaacaaccct ctaataagca cctgtgtata ttaagctttt catcaatagt 159480
tcagatcact tttttagaat attatcacac aagtgggatt gttgagttca aaaaaacctt 159540
tttcttaatt tcctttttaa gtaagttggt ttcataaagc aagttaacat attatttcaa 159600
tgaacgtatg cattttattt catgtatttg tgataaatac cttgaaatgc ctatgcaatg 159660
attcatcact gcatgtttat tttgcattta atgaattata tactcaatat attttaggta 159720
gctatattat acatataata ttttgatact tatggcatgt gggttttttc attgttattt 159780
caccatttta tagatcctcc tgagtttgtt tgttgctgtt attttggaca acttagaact 159840
tgatgaagac ctaaagaagc ttaaacaagt aagtagtgtg tgggggattt tttttaaaaa 159900
ggacaaaaaa ccaggggcaa accatttgct tataggcaat attaaaaatt tgagcttcaa 159960
agtaaaaata aaatgtaata aggctatcga aggtggtaaa atggtgttaa gtttaacttt 160020
tatctaatat taacaaggga aactttctat tactctataa atatcctagg aatagtttta 160080
ttatttttga ataaaagtaa aatgggcaga gtatagttaa ttggatttgg agactgttct 160140
ccttctgcca ttaaatgaag gttgtttgga aatgagatgc ctcaaggcca gattttgcat 160200
aattatatgt aatagtcttt atcatcatca taaaaatact acaatcaacc tgcctggtct 160260
ctagacacta aaggacaatt tagtctgggt gcccatagtg agtataagaa acagaataaa 160320
tgatcaaatg tggacccagt tatgtatgaa aacagacggg atgtcatcat ggtgaaagtt 160380
ataccccaga gaatgaaact agaaataggt gaatgctgtg ttcttaatgg caggaggatt 160440
acagctatcg tcaatcattc ctatagcttc tgttgcatgg aggatatttg gcttgaatat 160500
ttggctctat caaagagtac agaccctttg agaagaagag ctcgcaagag agtgggacaa 160560
tgggtggaac gttcttgtat caccctcccc aaaactgaga gaatagttga gatgttaact 160620
accaaactct acccaactgt tagaatgtta taatgttgac agaaccacac ctgttataat 160680
gttaacagaa ccatggctct gaaactttcc atttggaatt ataagcaggc cctccatatt 160740
cagaatttcc caaagctctc tatttttaac aaagcaaaaa gtataaccta tttaaatttt 160800
ttaatttttt ttaatctatc tcatgatcag gttaggcatt tcattttatt actcttacct 160860
ttaaagccta tgcttttaac agagggtatc aacaaggaaa aaaaaaaaca gaacaaacaa 160920
acaaaaaaaa attgttatga agattcctac ttggagcata ccaagaaagg ttttgagttc 160980
tttaccatcc tacagctacc caggcaaatg ggcatcttcc cggctctgct agagatgatt 161040
tcttccccgt cttttcactc tgtggcagca gtgatagatt cttcaaatga gagttgggac 161100
attcctttat gccatcaatg aaaatacttt gtgtggcttc tagttgcaga aaaaaatatc 161160
taataggtga attcaagatt gaaagtgacc agccatataa ttagacatga tcaataaaaa 161220
tctgctgctg tagaaccact ttagtccatg ctttacaaat ctggtattga gctgtcactt 161280
ttccttcatg ccatggttat tatgcacaga tatgtactat cctctgagac agtatgttac 161340
aatgtgtatt ctatagataa aatttaaaat atccaatttt ttttagctag tgctaccgcc 161400
aggttccata tgcttttaaa taaccatata attccagccc tcatttgtaa aataattttt 161460
ctgctggaaa gcaacaaaat aaacttgtat gtagcaattt tttcaggatt gtgaattcaa 161520
acctaaggat actttgcagt gttcattttt ttcaacattt taacttattt atatatacac 161580
gtatatgcat agcctactta aattttttgt catctttata tctagtggtc acaataggca 161640
tttcatatct gacccaaagt gaagaagcaa caataaaaag tcaggacttt aattggcatt 161700
gacattcttc ctgggctata aagttttaat aaactatatg gcccttcact ttgggtaaat 161760
gtcattattt ataaaatggc ttttaatcac ttgctagata ttagtgaagc tttgtgtttc 161820
tggaaattct gtatatcaga actggttatc caattgcact agcctacaat ttggaccata 161880
tactctgggt atttgggcat tgaaaactcc aatcataacg cagcaattcc atttttgtta 161940
gtacttttta cactattctt tattcatggt tggactgaaa ctatgtatct attaaattct 162000
tctattaatt tcatacttga aactcgttga acctgaaatt cattatagca aatattatta 162060
aactaagtta aagtgttcct ggttaacttt ctctcatttt tgtatgatta tgttttgttt 162120
tcagtagttt ttaacaacgg tgtcattttt tatgcccctg atttttctta ttttcagtga 162180
tcttggcctt taaggtaggg ctcatttgca tatttttaaa aacacacaca ttctcatgca 162240
ttcactttca tatacacatg tggtcatgtg gatacctgaa actttagact gtcttttaca 162300
gattctttta aaaaacaatg aaattggtac cctaaatatt tgtttcaatt gtccatgtac 162360
aaatccagtc cttaagattt aaacttatgt actctatttt tactactccc agatagagag 162420
tagagtggag gaaatgttca aaaaaagtat ttgattttct taatgtttca agtttcagaa 162480
agcgctatgc attccaaatt ccatctttgc tccgttcaaa ctttttgctt cttttaccac 162540
atctgcttgt atgtagattc tcatagctat ggtgacattg gttgaattct tgctcagtat 162600
caagtgtttt atgttttcac ttatttttca caacgaccca ttcaatgcag gtgttattat 162660
tatgtccatc ttacagatga ggaaactaag acatagagag gttaagtaac ttgctcaagg 162720
ttacacagcc aacaaatgtc ggagctagaa tttgaaccta ggcaatttgg accgaaagcc 162780
cacactctta acctctaaac tgtattgatt caaactaaag ctatataaag gccaaacatg 162840
agtcatgcat actggggagg gcactcatag gactatgaat tatttgttta taaataatga 162900
tgttgtagat aacaaaggca tcctcatatt caagtaactg ttagaatgaa ggacagtttc 162960
tgagaatagc ggtgaatgca gcaacccaat cgttaaaact attcacatta gttctttgtt 163020
tcctctcaaa actcagagga tctaatcaga gccactggag ttacagtctt gctgcgcgat 163080
ggcaaacgcc actcaaggtg ccactttgca natgatcttc ttggagtgat gatcctcctc 163140
agacgcctac ataacaggct tgcagcatag cagcatttta gtgactttaa tgtcttttat 163200
tatcgatatg tttttaactg tgttaatatg taaaagttgg ttcatagatt tttttcaaga 163260
gtaataaaaa ccagggcctg ttcgctctaa aatgggggtg ttggccaggc gcggtggctc 163320
acacctgtaa tcccagcact tggggaggct gaggtgggcg gatcacgagg tcaggagatc 163380
gagaccatcc tggctaacac ggtgaaatcc cgtctctact aaaaatacga aaaacaaaaa 163440
aattagctgc gcgtggtggc gggcacctgt agtcccagct acttgggagg ctgaggcagg 163500
agaatggcgt aaacccggga ggcggagctt gcagtgagcc aagatggcgc cactgtactc 163560
cagcctgggt gacagagcga gactccgtct caaataataa taacaataaa tgggggtgtt 163620
aacatgcaac actcagtagg gctcaacaga ggaagaggaa gcagccctca tacaggggag 163680
aggagaggcc gcccttaagc taagggtgtg agatggtggt agaaagtgaa aaggtactag 163740
tgaagaaatt ataatggaaa agaaggaaga agtgaagtag gaaaacacca gatatgaaat 163800
aaagagtatg actataactc agggataaag gtgcaggaat gtggccaaat ccagagttag 163860
gaatgtgagc aagtcagtgg ccaaaagtca aagcccacca gggcgttccc ctcagaagct 163920
ccctgagggc aggcatgggc tgcatgatgg attgtcggtg ggcccgtgtt ctcctggaag 163980
agaagcatgg cgctgtatgt cttttcccat tatttttcta tgcaacctcc gtgtgcatca 164040
gaggtggttt ctagccaagg actgctgagc tctaggcgtc ctcatgagaa gctatggtgt 164100
catttttaat acttcaggaa gctggaagag aattgtgcat tcacttaata taagcccgca 164160
cctgctaaat aaaatgtcaa gtttaatact tttagctgga aacctgaaaa ttctaagtgg 164220
cagcactgtt tccttaatac tatagttctg aagtgttttc atatatagtt tcctttaagc 164280
aaatttgttt aaagctacaa tgaatttctt attgcttaat cgaggcattt tggcaggaaa 164340
gaagtttggg ttttagaatc cagaggagaa agtaaaagga ctttttgcac agaaattttg 164400
agaggctctg gtgtgtttat tcccatcacc gcctctccaa gacatcacca gtgtgtgccg 164460
tgatggtcac ctctatggcn ttttcctttg tcacttccca caatcatgtt ccaaaaactc 164520
acctcaatca tataaccata tgaaattcct ctattgcctt ccctgtgtgt tatatatatg 164580
acacagctga ttgctaatag caatagggca gcgtaatctt ttcatagctg ccatcattta 164640
catgaccccc atattgaagt acgtagaaac catatttctc ttttcagcat ccccaaaagc 164700
caatacagag acctcggaaa aaaatatata tgtgtgtgtg tgtatatcta ttattacata 164760
tatgtaatat atgtaacata tatgtatatg tcatacatta aatacaaaaa tatattataa 164820
ttttgtatta catatatgta atatctatac atatatgtat atattaaata taaagattat 164880
atttataaat atatgtaata catgacataa attatacata atgtgtgtaa tatatgtaac 164940
agtatataaa aattatattt tttatattta gtatttatac acacatatat ataaaacatt 165000
gtttctgcat gacatttaaa aattggctaa aaatgagatt gtggtgagct gaggagattc 165060
ctgataaatc agttggtata gaggctacaa caaaaccctt gacctaaaac ttctctgaac 165120
agaagagttg atgactgtga agctcaagtg atgcaggaat gacactgggg aatgtacaca 165180
gagttttgca aggtttgaat atgaagagaa ttcttgcagc tttaatgatt tttgcaaatt 165240
tggtgaaaga cagatataaa gggttttctt ttaagtggta taaaattcat taagctttga 165300
gggaagaaaa aacccacaga aaagcctgag gggaggaatc atcgaaaagg gaagtatagg 165360
tagtctgttt agattaaatt cagagctgtg aaattgaaaa ctgtttaccc agccctgtat 165420
ccagtctcac ttgaatcctg gttccaattt aatgatgttt ggtctttgct agagtccact 165480
gcatagtgtt ggatagatat tatatattaa gaagctttcc tttcttattg actgtgactt 165540
ttttaaacaa aaaccataaa tatcttatat tctcttttgt taaagtatga gctctaggtg 165600
aatgtttttc tttagcctta agctgcatga tagttgattt tatgtgtcaa cttgactggg 165660
ctaagggatg cccagatagc tggtaaaaca ttgtttctgg gtgcatctgt cgggtggttc 165720
tggaaagatt tgcatttgaa ttggtagcct gagtaaagca gacctccttc cccaatgtcg 165780
ttaaaccact tccaaagctt tgaggtccca gatagaacaa aaaggtggag gaaagctgaa 165840
tttgctgtct gtctcattgc ctgcaccatg taaacaacct tctcctgccc tgaggaatcc 165900
tggttcttag gccttcaaaa tgttgccctg gcttccaaag gtctccagct tgaagagagc 165960
agatagtggg acttatcatc agcctccata attacatgag ccaatacctt aaaataaata 166020
ctgatgtata ttttattggt cctgtttctc tggagaatct tgcctaacac acctgaagct 166080
ctcattkgca tgtccatttt gtcgcctata ttgagttcat tccagattga gggcggtagc 166140
aaggtggcag ggatactgct ggaagatgcc attcggctga gcactggttg catctcctga 166200
tgttagttga atcttcaatc ttctcagcat tttgtcagtc tctcatgaat gaactcaaac 166260
taatgtaatt ttaaaagact gatataactg ctgcaggagc aaatgctatc tattgagaac 166320
taccttgtgt aggctrcttt atattaaatt atcacattta atcctaaata ttaaagacgt 166380
ggcaactaac attcagggga gtgaatttct cacccaagtc cacacaattc atatgtgcct 166440
gggtcagagc cacaaaggct gtctgaccct aaaccaatgt ccttgctgaa aaaggccatg 166500
ctgcctgcag agaaccagct ccttcattta taatgaaaag catatctagg tgtggattgg 166560
atgagatgct tatccatttt ttagatcagc atattttctc cctgtgggta ttcaaagaag 166620
aagccaaatt ataatcagac tatagcttag tgagccagga atcaggatgg agagggaggc 166680
gagaaaggtt gtgtgattta aatacataga tgatggtttg atagatgcag caaaccacca 166740
tggcacatgt aagcctgtgt aacaaacctg cacattctgc acatgtatcc cagtatttaa 166800
agtaaaatct aaaaataaat aaaaatattt ttaaaaatac ataatggcat aggctaagat 166860
aggctgagat caactgagtt atctctttta cagttgagat attagtgacc tagaaactaa 166920
atctactcat tctgtgaaac tggggtctgg acactcatct actatgctat agatattgtg 166980
ttggggctag ggacatgtga tggtcaggac actgtttcta ccctcaaaaa taactcctga 167040
gccagtggga gaaaaagaca agtaaacagg cagtttgggt tcagtggtga tgattataag 167100
gataatgttt cggaagcaca cagaaaacat ctaaagcaga ctgtgaaatc agggacgttt 167160
tctcacaagc aggtgcagac tgaaatctgg aggttgagta gtgctaatcc aggtgaagag 167220
ggttggagga agatggcatg aaggagggta gtgaagacca agggaactgc agagtctttt 167280
ttaggtggga aaaaaacaga gtggctttct cgacactaag agtttgctgt ggctaatgtg 167340
tagagcaaga gagaaaattg ttaactggaa aaataaggag ataccagcac aggaaatgct 167400
tgagcagcac taagcatttt gatattattc tgatggtatt gatgccacag ggtgtcataa 167460
tcatacctac attttggtgt cagtgtgaaa tgcactggag ggcacccaga ctggagatgg 167520
aagaatccgt tcttgaggca agtggtgatg gcagcctgaa ccaaaggaaa taggaatgag 167580
agaatatcga aagcggtgga gtacagagaa gaggatttag tgacaaattg gatgtaggaa 167640
gtgagaaaaa ccaggacaca gggatgtcac ccagatttct agatttcttt aagtgcgctg 167700
atgcagaaga aatacaagag aaagaagaaa tgagagtttt gtttatttgg gttttttttc 167760
gggggaagaa gtttggtcat attttccctg agatgcctgg gaaatatcta tgagacaatg 167820
tctatggaga gatacaaagt ttaaagctta ggtggaatat ctaggctgaa atagatactg 167880
aaaaagagca aaatcaacat gcagatggta atttaagcct ttagagagca ggaacttacc 167940
aagggaagga tggttcccta aggggtaata aataaatggt atgaaccagt gaggaggagc 168000
caaaatgtgt atgagaagtc acagcacaag aggtaagagg aaagcctaga atgtgtttgt 168060
caccaagatc aaaaggtgaa agagtttcaa gagagatcct tgttcaacga tctcaaagac 168120
ttcagagagg tcaaaaaaat agtcaccatg gaaagcaatc ccatttacag tagcaccaaa 168180
aagaataaaa tacttggaat aaacttagcc aaggaggcaa agacacatac cctgaaaact 168240
ataaaatact gaggaaagaa cttaagccac aaataaagat gaattctgac ttacgatgat 168300
tcgacttaac agtttttgtt tttgtttttt tttgacagag tctcaacctt ttccttaggc 168360
tggagtgcag tagcatgatc tttggctcac tgcaacctct gcctcccagg ttcaagtgat 168420
tctcctgcct cagtctacca agtagctggg attacaggca tgcaccacca aatccaacta 168480
atttttgtat tttcagtaga gacagggttt caccatgttg gccagggctg gtctcgaact 168540
cctgacctca agtgactcac ctgcctcagc ctcccaaagt gctgggatta caggcgtgaa 168600
ccacctaacc tggcaactta caattttctg attttatgat ggtgcaaaac agatacacgc 168660
tcagtatgct cctcaactta tgatggaatt atatccagaa acactcatag taacttgaaa 168720
atatcataag ttaaaaaatg cacttttaca gtattttcaa cttataatga atttataaac 168780
cctattgtaa gttgaggaac atctgcaagt gaaaagacat tctgtgttga agaactggaa 168840
ggcttaatat tgttaaaatg ttcataccat ccaaagcaat ctacagattc aatgcaatct 168900
ttcgtaaaat tccaatgacg ctttttgcag atatagaaaa gaaatcttaa aattcatacg 168960
aaatcttaag ggataccaaa tagccaaaac aattctgaaa aagaacaaac ttgaagatgt 169020
catacttcct gatttcaaaa catattacaa agataaaata atcaaaacag tgtgatactg 169080
gcataaaggc acacatatag accagtggaa cagaatagag aggccacaag taaaccctca 169140
catatatagt cacatgatct tcaacagtgg tgtcaagacc acactatggg gaaaggacag 169200
tctcttcaac aaatgatgtt gaaaaattgg ataccacaca caaaagaatg aagtttggcc 169260
cttaccttat atcatatata aaaattagct caaaatggat taaggacctt aacaaaagac 169320
ctaaaaccat aaagctccta gaagaaaaca aggcaaaagc ttcatgacat tggaattgtc 169380
aatgatttat tggatatggc acagacagca aaagcaaaaa taggagactg cattaaactt 169440
aaaaacactt gcacgtcaaa ggaaacaatc aatagagtga aaagccaacc tatgggattg 169500
tagaaaatat ttgcaaatcg tgtgtctgat gaggagttaa tattgagaat atgaaagagc 169560
tcctatagtc aacaagaaaa atacaaataa tctgttttaa aaataggcaa aatacttaag 169620
ctgacattta tctaaaaaag gtatacaaat ggccaagtag atgaaaagat gttcaacatc 169680
actaatcatt agagaaatgc aaatagaaac cacaatgaga taccacttta tacctattag 169740
aatggccact atcaaaaaaa aaancagttt ggcaagaatg tgaaaaaatt gcaacatttg 169800
tactttgttg atgagaatgt aaaatggtgc tgctgctgcg gaaaacagta tggcagttcc 169860
tcaaaaaatt aaaagtagca tgatcatatg ataaaatata cttctggata tgtatatcca 169920
aaagaaatga aaatagaatc tcaaagacat atttgcacac tcatgttcat tgcagtattt 169980
ttcacaataa cagaaggtgg aagcaaccct agtgtccacc agtggatgaa tagataaaca 170040
aaatgtggta tctacacgca aggaaatatc attcagcctt aaacatgaat aaaactctga 170100
cacatgctac acatggatga accttgagga catcatgcta agtgaaataa gccagtcaca 170160
aaaagacaaa ttctgtatgg tttctcttat gtgagtttat ctaaagtagt caaattcaga 170220
gaaacagaag acagaatgag agttgccagg ggctagggag gggagtaaac ccattgttgt 170280
tcaatgggta cagagtttcc actttgaaag atgaaaaagt tctggagatc tgttgtacaa 170340
caatgtgagt atgtttaaca ctgctgaact gtacacttaa aatggttaag atggggctag 170400
gcgtggtggc tcacgcctgt aatcccaaaa ctttaggagg ccgaggtaag cacattgttt 170460
gagcccagga atttgagatc agcctgcgca acgtggcaac accctgtctc tactaaaaat 170520
acaaaaaatt agcctagccg gacatggtgg cgcatgcctg tagtcacagc tacgtaggtg 170580
gccaaggtga aaggattgct tgagcccaag agatcaaggc ttcagtgagc tgtgatcatg 170640
ccattacatt tcggcctggg caagagtgag accctgtctc aaataacaac aacaacgaca 170700
aaaatgatca agatggcaaa atttatgttg tatgtttttt accacaatta atttctttta 170760
tttaaaactg atcatattaa caataaggag gtggttagtg aaggcaataa gagcaagctc 170820
agggccttcg atgatacaga gctgggttgc agaggatagg gaatcaatga cgggtaagga 170880
agtgaaggtg gatcaccaac cttttcctca aacgcctcat actctgtttc cagatagacc 170940
acctggttgc tggctgattc ttaattttgt tagatatgtt aacaccattt gctacagtgc 171000
tacccaacct tttgccattg tggtatgcat agagaatgat atttgtacaa cacgctgaag 171060
tcaataggta ggaagcaaaa gcagctggaa atatcagata tcaaggattc ctgatgctcc 171120
agggaacagc tgcccaggag cgagaggacc gtaccctgaa gaacctataa atcattagtg 171180
gctgagagtt gaaaaactct gcatttcact caaatctgtt gatgctacct aactccactt 171240
gaagccattc tttcaatctt ttggtcagag atgactcttt tgaggtcagt ttattattgc 171300
ccataacttt ccatgatgta aatctcaaaa gatcagctta tagagcattt gatctgctat 171360
ttctgaaata gctacttact tttataataa attcttactt ttataataaa tgttagactt 171420
tttataataa attctctgtc acactaagac ataaacagca ataaaattgg tttgaagaaa 171480
tgaaatggct aagacagaac agtttagatc aaggtttaag ccaagaagtc acaacagagg 171540
ctcagaattt gggaatatca attatcaaca taaaaacaac agcctaggaa tctagaagtc 171600
attcaaaaag tagaaatatg ggaggccaag gtgggaggat cgcttgagcc cagtagttgg 171660
agaccaacct gggcaatata gtgagaccct catctctaca aaaaataaaa attatcgcag 171720
tgtggtggtc catacctgtg gtcccagctg cttgtgaggc tgaggtagga gaatcacttg 171780
agcctgggag gtcaaggctg cagtgagctg tgattgtgcc actgcattct agcctgggca 171840
acagagaaag accctgtccc cccaaccccc caagaaagat aaagatagaa acagccaact 171900
ggatttttac agtcaaataa gtataggtgg gagattcaaa aagtcagttc aaaacagaag 171960
tacctgttag aattgatgtt ctcctgatat gagtggaatt ctgtccctca aataggtacg 172020
tggaagccct acgcctcagt ccctgtgaat gtaacttgat tggaaatagg gtctttgtag 172080
atgcaatcag gttaagatga ggtcattagg gtggactcaa tatgactgtt gtcctcataa 172140
aaagagaaga gacacagaca cagacacaca gagagagcac tgtgtgttga tgaagccaca 172200
gaccagagtg atgtggtcca caaggaacac ccaggattgc tggcatcaca agcagctgga 172260
aaagtcccat ggagtagacc cccctcagaa cctccagaag gagcttgcct tgctgacatc 172320
ttgatctcag acttccagcc cccagaaata tgagacaata catttctgtt ttcagccacc 172380
cagttttttg gaactttgtg gcagcggccc tagacaacta acacacctcc agagccttgt 172440
tctctggact caagaagaaa cgatcccttc taaagctggc aagtagcctg gctgagagca 172500
tggggcagca gggaacaatg gacgtaccct tggaatccta cgccagcctg cgccaccctg 172560
gagcagcttt ctcagcagtt ggagttattt tcttctgcct ttctttgatt ataggaatca 172620
aaccccatca tagtaaaatt ttatagactt gagactttct tagaggaaag gtttctgtaa 172680
gcccttccaa aatttcatgt catgtgtgat taactcaaac cagaaggaca ttgttttaga 172740
gaccttttct ttgcctcatc catgggtact cgggactgtt ttgttagcat gatctctctt 172800
accatggaac aaacatgaaa ctacacacct aagattgtcc actcgagtct acaatggtgg 172860
gttgtcggtt gtatcattct ttaattgtgc taattcagaa ttattttcat tctagtttcc 172920
acagcactct gcaaggtaac ccttcaatta aaatatatat atatataggc caggcatggt 172980
gactcacacc tgtaatccca gcactttggg aagccgaggc aggtggatca cctgtggtca 173040
ggagtttgag actagcctgg ccaatatggt gaaaccctat ctctactaaa aatacaaaaa 173100
attagccagg cgtagtggcg ggcgcctgta gtcctagcta cttgggagac tgagacagga 173160
gaatcacttg aacccaggag gcagaggttg cagtgagctg agatcgcgtc tgcgaatctc 173220
catctcaaca agagtgaaac tccatctcaa aaaaataaat aaaataaaat atagtgggat 173280
ttggagggaa gatgtgccca aacaggagag aagctcacac ttcaactcca actgaacacn 173340
cacccactgc ttaactgtaa ggatgctatt ttattttgtt tcctttaatn ncaagagnnn 173400
nacaaanatt gttnaagana gcatgnagct tactgcactg taccattgaa aacagcaagg 173460
atgataagga agagcaacct cgcagcactt tttctttcag atcctgtcac aggcagtggg 173520
aaactagatt gcaatggttc taagagaaaa gcatgacagt tttcagtttt atgcggtgcc 173580
tggcagttgt tgaattacaa aaaggcactc ttatagttgt gttaagattt gttgtgagga 173640
gttagaatag tgaggtttac cctgtgtgga cctacacatt aaataggaac atgctggagc 173700
tggagtcatt gccctgattc cttttggact caactttcac acagtccgtt tggatctttt 173760
ttcaagtaat tcatgtactt ttccgttctt ctggaagcat cctcacaatc tgctttatca 173820
tccattcttc aaatatttga gtacctacca tgtgtacaac gctaggccag gtacaataat 173880
aagtaagttc tttgctccca tggagccttc tggtctaata ggggagttgg atgtaaatca 173940
agtaattaaa ataattccta actgtgtaaa gattgagatg agctttcttc agaaaataac 174000
atcatttaag gagagacact cgtagaagac cccgacacaa atggtggtca ggggtgagga 174060
tgaagaaagt tacaggagag ctaagttttg caagatgagc cttgtggact tcacggaggt 174120
gtggtgggtc aggggagggg agcacaactc cagggagaag ggaaagcctc tgtgcaccca 174180
gaatgcagga agaccagggt ggagtggtat agagtaagtg tggaaaagtc agcagggcat 174240
gaaccatgca gtgccttgag aaacacggta aggtcattta ccatttgttt tttgtttgtt 174300
tgtttgtttt gagacagtct cactctgtca cccaggctgg agtgcagtgg tacagtcttg 174360
gctcactgca acctctacct ccaaggttca agcgattctc ctgcctcagc ctcccgagta 174420
gctgggatta caggcgtgcg ccaccactcc tggctaattt ttatattttt agaagagacg 174480
gggtttcacc atgttggcca ggctggtctt gaactcctga cctcaggtga tccgcctgcc 174540
ttggcctccc aaagtgctgg gattacaggc atgagccacc ataccagcca gaacatttac 174600
ctttaatgtt tacctttaac ctgagccact gaaagcttat aagatgggag gcagtggtga 174660
accagagagc tgtttggaaa ataaaatcaa gagggacttg gtgataggtt ggatttaaag 174720
acatgagtga gagagtctca aagatgattc ctggtttcag gtttctacag ttgcatgaat 174780
gaaatgtcat taactgagtn aagaaacact agcatacaac cgtatttggg ggaaacgttc 174840
atcaactcag ccttgggcat gttgagttgg tgaatctttc aagatgtctg aacngagatg 174900
cctaatagtt gtgtataggt ctggagttca ggggagaagg atggctgcct agagatataa 174960
atgtggacat tcaatgtaat tctcaattat ttattcaggt gctgttctag acatgtggcg 175020
taggtcaatg aacagaacag ncaaaaatga ctgcctcctt tgagcttcag tcctagtaaa 175080
gttctccatg ttttcataat actggaaggt gtaaatctgg atgagattgt atagggtggg 175140
aagaaaaaat atgctggagc cttgaggaag agcaacattt aataactgct ggtgtttgcc 175200
tttatggtaa ctcaacctgt ctctgttttc ctccttgtgt attttcactt tcagttccat 175260
tgcaaatagt caacattttc tgtatctcag gttcaaaact tgatcaataa gaacagattt 175320
ggtcgatcca gctaatcaat atgattcctt ttaggcagga atttcatctc tgattgcctc 175380
gcaatgctgg ccagtcttat agaaagtccc tgtctttggc ccggtttctg gctcaaccag 175440
ctttgacaag ggtgatgagt tactttgtac cataaggcaa tttatnagga agaaacacct 175500
tcataaaaaa aaacaaaaac aaaacaaaac aaaaaacaga acaggcagac atttggagaa 175560
ctcacctgca tattacagag agatttaata tgtttatcta ttgcatgcca ctgtaattta 175620
acagtctagg caaaggtaac agaaaagagg agctgagata atccagctcc tccccaacca 175680
ctcattcagg aggaagcaga tgtgagtgcc attgtagggt cctgagggag tattggttcc 175740
catttcctag cctgcccctc ctccccacgc ttggtcagtt acaccttcat atggctcctg 175800
ttctcacttt acctctctgc tttatgataa gcgcagataa aaggcaagag acacagacaa 175860
agcgaaaaag aaggaagagg gaaggaaatt tagaagggac cttgcaaaca ttttccttcc 175920
actgagtggt ccacaggagg aaacaatgaa aacttctctc tcctttggga ggccaaggcg 175980
ggcagatcac aaggtcagga gatcgagacc atcctggcta acatggtgaa accctgtctc 176040
tactaaaaat acaaaaaatt agtcaggcat ggtggtgtgt acctgtagtc ccagctactc 176100
aggaggctga ggcagtagaa tcgcttgaac ccaggaggca gaggttgcag tgagccgaga 176160
tcgcaccgct gcacttcagc ctgggcgaca gaatgagact ccgtctcaaa ataaaataaa 176220
ataaaaataa caaaaaataa caaaaaacaa aaaaanacct tctctctcac taacaaagag 176280
atgtgatttt ggagaaatgt cttccctctc tttcagtttt accaaatcta acttgggtat 176340
ctttagatcc ggtgtgccct cttttctttg atgacacgag tcctaactcc tatatattgt 176400
cttatatgat tgttttatgt catccaagct ggcacttata tcatctccct ggtctcatag 176460
gcatttaaat ctgggcccct gcactagacc ctgacaagat ctcttctaga tctaaaattc 176520
tcatccggga aagagtcgag agctgtcatt actgggacac ctgtagctgt atacttcatt 176580
atgacagatc tgttgtttat gtccagtgtc tcttctgatt ttggggtgtt catgctgcat 176640
ggttttctaa tatacgtagt tctaatatgt tctctgttca ttactgcgaa tttctgctcc 176700
gacccctggc cacctacaca aaccgcaatc cccagcatag gcaacatgtt agtaaccacc 176760
cggagggggc gactgcaagc catgatgaag agctgggtct accatgtacc tgacctgtgc 176820
tgcaagctct ggcactagag ctggggtcac agggccctag ataagtaatc tcctctgaga 176880
atagtcagat tttgtcaata catacaattt tctcttagca gaaatcttgg ttgtattaat 176940
aaatgctgtc attgacagca ttgctttgta tttgtacatg gatcaaatga aagaataaaa 177000
gtcaggaaag tgatgatatt cattccttgc catttactta atatgccatc aaactttccc 177060
actttcctat tattttttca ctctgggagt ttaggaaagg gaattatatg actacctgga 177120
ttctcatatg ccttcaacat atttttaact ggatcatttc atcttactct ggatttgtgc 177180
ctaaaatctc agtgctaagt gctctatctt ctaaattgag attccacctt ccaaagatgn 177240
actggtggtc ctcttattcc tgattatctt cccagctcac actcccccag atgaaataag 177300
gagagtgctg tgggaggaaa gttgtggtag aatcatcagt agcagtgttt acggagagag 177360
attattcctc ctttgccaaa gcgcaagaga ggacttccag agaatcactt gtaggagtga 177420
ggagtaccag tcaaacagaa agagactggc tcttctatct ggaagcttgg aaacccgtag 177480
ctctactcag ttcagccact agattacagc aagctgagtt ggttgtgaaa ggaagctggc 177540
atcttccttc tgaagaatgg tgcagatggg ggtagagtga acctgccctt gcgtgacata 177600
gacagttctg aaagtcagag gccagccaga gtacagctag cagtagcttg tcaagaaagg 177660
actgtcaaga agaatatttt ctaagattaa tgctgggctg ggggaacccc acccctttct 177720
ccttctctgc cacctcagac agtgcagagg ggagctcagc ggtgcccatg acagatgtta 177780
gaggaaggtt ggggaggcag agggctgcac aggcagaggc caagccaaga catgctcatt 177840
caggagagga ttaaaggaag gacctaagga agacaagatt ctctttctct taggacgtct 177900
ttggctgcgg aagaccagag taaaactctc cttatacaaa aaagaaatca cacaaattat 177960
atgttaaccc tatcaacaaa ggacataagt gctgaatggg tgtagatcca aaccaaacta 178020
gaagggaggt cagtggtttc ctaagataat accttctgct cctaactctc cactctgacc 178080
ccaactttgg aggagctaca cccaaaagaa gaagatgtgg agcaatgaaa gaaaagacag 178140
ttggttgctc accctgtaat ctcagcactt tgggaggctg aggtgggtgg atcacaaggt 178200
caagagtttg agaccagcct ggccaacgtg gtgaaaccct gtctctacta aaaatacaaa 178260
aattagctgg gtgtggtggc gcctgcctat aatcccagct actcaggaag ctgaggcagg 178320
agaattgctt gaacccagga ggcagaggtc gtagtgagct gagatcacgc cattgcactc 178380
cagctctggg caacagagca agactccatc tcaggaaaaa aaaaaaaaaa agaccatgtc 178440
ccctccctag ctcaaaacca tatgtcatac tgtcatgtaa tggggtgagg aagaagggag 178500
gtttgaatca gatatgagac tagactgcac tgaagtaaat ttttaataac caaagttgac 178560
caaaaagtta gggaattaac tagggataac aaccagtctt ttatcctcat ttataatcca 178620
actttcctat aattgaggat gactgatttc actgttggcc ttcccttaca ttccacttgg 178680
agcattactc agtgagaggt agggcatccc caggcacagt gagaggtgag acattcctgg 178740
cattctgtca ccgtgaaatt tccagtcctc atcttgtgtt ttctgtaatt cagctctaaa 178800
gccagccatt tcttcaaaga gtgctgattt gttttattgg agaatggtat ttagggacca 178860
aaancctagc actaggtttc tcattgtttc cagtatatca gtgtttctag gctctctcag 178920
caagaagagc agggaaatac atgtatgtgt actaactcaa gtacacacat acatgtattt 178980
agctagtttt gtatatattt acctatctat gcatgtgtct tacataacca tagaaccatc 179040
tgccttgata acttgtactc aggtattaac aatatactaa ttttgttaga ttgttactgg 179100
gacatgagtg cagtatatac atgttatttt ctttaatgtt atccctattt ccacttgttt 179160
ttaataaaat atgtggatta atgtgaattt tcatagtgta tctaataagc ccttttatca 179220
acataggaga catttaaaaa ctattcattt gaccacagac atacacaaaa atgataattg 179280
gaaatgcatg attgtggcca gaaaagaaat tacttaaggg aataggacac tgctggggtc 179340
caagacccca atgttaagac tgcattccaa agtacgtatt ttccatgcct ctaatttaaa 179400
gtgtcatatt tatttgatag taaataccat tactgataca acgttacatg cacactaagt 179460
gcaacaaata agggaatttt ctatagaaaa tgagagccag agttcatacc atcagagaaa 179520
gaagttataa atgagcagag gggagatgcc acaggagaac ctgtggggct agattaggag 179580
tatcagtaag aactcagctt attttaagag agaggatagg taggtagtta catgcatata 179640
tatatatata cctgcataca tatggttgga gggttatgta agatacatac gtaggtaaat 179700
atatacaaaa ctaggtaaat gtgagagagt gtgtgtacat gagttagtat acatacatgt 179760
atttccccgc tctttctgct gagggagcct agaagtaagg atatactaga aacaatgaga 179820
aacctagtgc tgggattttg gtccctaaat aacattctcc aataaaacaa gtcggcactc 179880tgaagaaatg gctggcttta gagctgaatt aaagagaaca caagatgagg ataggacatt 179940
ttgtggtgcc agaaaataaa gaagacctaa aaaggaaaaa acaaacaagc aaacaaacaa 180000
acaaacaaaa tagatagaag tatgtctgaa gactagagaa gccgactgaa agtgccccca 180060
gtggccaaag caggaagact ttgagcaatg aaatgaataa ggaaagtact gggttataac 180120
ccaaagaata caataaatag tcacaaatac atatttatac agatacatga ttgaataaat 180180
aaataaagga ggagggacaa ctgattctct cagaataatt ccaagtaaga aatgtagaga 180240
aatagaaata atagaataat aaatgaagta aacagaaaat tgccattagg aaactattgt 180300
tgtaattgcc acagacaaga gctgatgaat accaaaatta gtatgtgaaa ctttaaggag 180360
aaataaaaca tttgcatggc ctcaaagtgt cctctccaag tcttttttta attattgtag 180420
cagctttaac atccacccac aaattctttg atactcctcc ttcctaagag ataaagcttt 180480
aattcttcta agtgtcagtt ggagtcagtg acttgcttca agccaatgga gtaggaaaag 180540
agaaacactg aatgtaactt tataatgcag aaacctggca gacatcacct tacccaagta 180600
aggacagtta acctcaatgt catatacaca ctgatatgac gagaagggcg tatcatctcc 180660
atggtatttg tcccaaaaat gtataagctc agtctaatca tgagaaaaga tcagacaacc 180720
caaaattggg ggacactctg caaattacct gactgatact cctcgaaacc atcaaagtca 180780
ttaacaacaa gaagaattag aggaattgtc acagccaaga gaaacttcag atgtgacaat 180840
gaaatgcaat gtggtttcca ggatgagctc ctggatcaga cgaaagtcat tcgtgcaaaa 180900
acctgggaat tcccaataac ttctttagtt aaaagtattt gaccaaggtt aattttgtag 180960
ttttgataaa tgttctatgg tatataacat gctgggtcaa ggtatacagg aactctctgt 181020
actatctttg caactctcat gtgagtttta aattacttca aaatagtgtt tttgtaaaca 181080
ggatgagaat tttctatggt aagctgtaat aatgcaacat agaaattagc tcctgtgttg 181140
ccttgttcna aagnatatgt acatctgtgt agctttctgc catgaatacg ttgtatcaag 181200
tttatacttt attattcttt tttgatcttn aaaaagctgg gaacacacac tttatcaaga 181260
gccaaatgct ttttgtgatt ttgtttncta atagaaaatc tgatgtaact tgtcattact 181320
cctctttcat ctttgccagt aatataactc atctgaaatc ggcagacttg cttgtgctgg 181380
ataatataga tgattccata ttgtaaaggc tctaagaaaa caataataga atgaagagaa 181440
atattacaaa tgatcctctt ctgcctgttg atgggactcc gttagtgttg ccttcttgtt 181500
ctcatctcat caccattgga ttatcattgt attgtgtgca caatttgagg ccacagggcc 181560
acagagagtt gtgcccttaa ttaaaaatgc atcatgctag taggggaaaa gcacacgtaa 181620
ttagaaagtt atagtgcaaa cccctgagca aggtgcaaca gagggagatg tgactaaatg 181680
caaggtgcac agaggaagat gtgcctaatt tggtttagag gcaggtcctg gaagatgtgt 181740
ctaaaaatga tgcataaaat tttcttagga aaacgagaga aaatatccca tataagagga 181800
ataacaggca caagattcac aagtaaaagt gtaccaattg cttgaaagtg ttgttttggt 181860
gtggcagtat acaacagttt tagaagctca agctctggaa tcaggaaaat tgttgtcaaa 181920
ttccagttct gccacttcta gctatgtgac ttcaggcagc taattgaagc tccatggacc 181980
tgtttcctca tcgatgacat tgcataatat ggagctaatt atggtaccga catcagggag 182040
ctaattttta gggttaaata atattagcat aaagtgttca gcatcatatc cagcacgcgt 182100
gtttactgct tcacctacca gttgttattc tgagaaatat tcctggagaa gatggttttg 182160
gaaggattta taagagttaa ataagtgtat tgcaggcatg gggagcagta tcttcatgtg 182220
acatccctgt gtgagggggg cacagaccta caggttagag catagagggc aaagcactgg 182280
aagacccgct tatgccatgc taagaagatt agaatttctt ctgtacataa ttgatagtct 182340
ttgcattact ttaaggacca gagggacata aaggtatttc ttttctagat gttctaaaag 182400
attggtttaa agggaaaaaa ctaagacaga aagccagtta ggaaggtttc aggagtctca 182460
acgagatgaa atttggatga ccaattgacc attggattca gcaaaatggg aaatacgctg 182520
actttgccaa gagcagcccc actgaggcag ggggggacac ctgagacagg agaggctgga 182580
agaggggtgg gaagcgatat aatggtgctg taagcatctc tttgaagaag caaccttaaa 182640
tagcaaagga ggcatgatca ggagaaatgg tttaactgcc tattttcgtt ttcattttta 182700
caaccaagag tcttgagaaa acaatccaat caacatagca aacgagaaga aattggggaa 182760
agagggagag gttgagttgt ctcagattag ccagagggaa gggactcaag cacacatatg 182820
tgtcacccca ttcatatggg tgaagtcctc ctcctgtaga gcaagcagtc actgtggcat 182880
ggtgatagct ttggtttgta tagcacattt cccttgagta attcaaatta caggcatatt 182940
gctatctcac ttacacgtct ggcatttata tgaaagacta aagatcctca ttttttattt 183000
gagaacactg aaatccaaag gggtgaagag attataaaac tgaacaaaag tttaaatcca 183060
tgtcttctta ctttgttttt tactgttttt acttatgcta tctctgatgt tttataaatt 183120
aaaaaaaaga gaaaaattac atgggagtgt atgtgcgtgt ttgtgtgtgt gtaagtgtgt 183180
gtgtgtgtat cctgaattcc ctttggtgtg acatttttcc ctagcactta acgaagaatc 183240
atctcacaat aagaaccaag tatctagttg acatgaaact ctaatataat ttcctctgaa 183300
gtggagcaaa aaagatatat actttttttt atcacactga gcatatttct atgactcagt 183360
aaattctctg atggaaacaa ctgtgtctca gtggagtaac aaaggacaga tataatataa 183420
aatagagatg ttntgggacc tagaagaata aacctacaaa atcaatcttt attcatcacc 183480
actgtctcta agaaattatt aattacatta atgggatatt aaaggacaat aatatgagca 183540
aaatgtgctc attcaacata attaggtatt ctggatttga atagtttttt ttttctttta 183600
ctaattcatt agagttgttg gttagcttag ccttgctgca aatattatct atgttgttgc 183660
acaaagtaac cttctgaagg acatttaaag cttgtaagat cttaagggtt gtgataacag 183720
catgaaagta aacattttat gcacacttca gggatatcat aagtggcagg aatgcaacag 183780
tctgttataa gtgctctgct gagctcccaa accaacaaac acaaaacagc cacttaattg 183840
cccagtgcat ccgcccctcc gaaaacagag cttctcttca tacttactta agggacatgc 183900
tgcttggacg aatgagtaac cagccaggat acagcacatg cagttaatca gctaatgtta 183960
tgaacatttt ggatgtcagc tatcacataa aaatgtagct tttatggccc ataggctaac 184020
caagaaatga gccctccaat ttctatctgt ggcttcagtc gatgcgtcca aataattgaa 184080
aaccccactt tgaccttgga tatactgggt gtattaaata tttttgtaaa acggggaaaa 184140
attagtgact taaacatgtt ttttgatgaa acgtttgaaa actgtacagt atcgctgtct 184200
tctatgcact aatttgactt ggttgccttt tgtccacagc agaaaagaca gtgcccaccc 184260
acctgaagaa attctgtatt ggatttcaca ggccagtgag ggatattctt tgtatttgca 184320
tattaaggtt ttataattac acagaggtat tattaaaaac caacatgtgt gatcattatt 184380
ccagatgccc catctgtttt gactgtgcga tttgggttgt aaaatcacat atacaaatta 184440
gcaagagaaa ctcccttgaa aaataatagt ttacgcctta gcaagactct atgttctgaa 184500
ttgctatgtc atatatatag atacagaaaa aatagctaaa gccactgtgt aaagaagcaa 184560
agagacttca gccttaattt attcacataa caaagaggag ggactccttt cttctgattg 184620
aagataatgt ggttattttt cctatattga acaaccaaaa aatattctac agttacatca 184680
actcacaaat ctatgcacag ttttcaaact aacacggact agatttcaaa atgagaatct 184740
cccaagtctg aatgtttttt aaattgtttt cttttgggaa atcataccaa aaaattacaa 184800
aaatttttat ttaatgtaat tcttcaattc agttattcct cacagcaatc agaaaggaac 184860
tgaaactgaa taatgtttga atattttaac agaagaaagc acaggctgaa atagggaaga 184920
tttaagcgat gaggcagaac acagtatgtg tcgtgcagag caattacacc cgaagtctct 184980
tgagaagtca gggaaagcag aggatttcag ccgcccgatg tgtaatgata tctcagccag 185040
gcagatgctg agccgtagaa tagcactgag cttagacgac ttctagtttt aaagctcaag 185100
gtttgaagtt tgtttctttg attctaattt cattcttgca aatgtgcttt tctttaccat 185160
gtgaatgtgt gacaaagcta tcatttgatc tctcggttgc agccagactt catgctcagc 185220
tgaggccatt ataaacttcc tttgtactgt tctttacatt agatttttca atatgagaaa 185280
taaaatccta ggattctcta cactgtgttc ttttccttca agaatcatga tcttaaaaac 185340
actttttaaa tggacattta caattataat tactttatgt taaaagatct tcttttcttg 185400
gtatagtata atgatcttaa aaattcataa ccacttctta taatatatat tattcattca 185460
tttgcatcaa agtaaattta atcttgcaaa atctttgctt aaatgcaaaa aaggggaaag 185520
aatttggata aaaggtagaa taccatttca ttacatttta aagaaactta atagtggctt 185580
caaaataaca tgtaatactt tgtgtatcat ggtcacctca tcccccacca ccaacacaca 185640
ccctgtctac tcccatctta ctctttcttc ctttttctgt gtctgtagct tggtcaaaat 185700
catgggttgg gaaagacgtc aaagttttgg tggctgatag tgccgaagta agaatggaat 185760
aattttgctt aactgcatca tcttcccttt tgaaaaactt ttaactgaac tctaatatac 185820
atatagaaag aggtatagta tacatttttg taaactgaac acacccagca ccctgctcag 185880
gaaatattga ctgtgcctta gaagctcctt tccatactcc ctcccgctcc ccgccacccc 185940
cacccaggac gaccactctg cagacacccg gcagcacacg tcagtgccac ctgctggttt 186000
aacttcctcc acgtggaatg gagtacatac aacagtatgt actctgttgt tgcgtctggc 186060
tcccttcact caatgttatg ttgtgaaatc cacatttctt acactgagat gtagttcact 186120
cattcaaata tttaaataaa cccaaatgta ttttcccact caactgctag tgggcatttg 186180
gacagttcac attttgggac ttttaacaac tgacactgct gtggccaagg gagggcttgt 186240
gccttgtggg tgtgcacgca gttcttgcag gcacgcacct aggagaggat ccacagggct 186300
gctggattta cctgtgctca tttttagttg atgctgcttc tctcttaata acagcaaaga 186360
gtgcatggga actgctgtcc agaagaacaa gtccttgctt ttaggaggtt tgattcagtg 186420
cctcagccat gagattcaaa atactcaccc ttcaagcagc cgctcatcct tctctgtgtt 186480
aactggccct taatgcacaa ctgtagggca atgatgccag gtttgcacaa tcgtgaagaa 186540
ccttctgagt ctccaaaaag agcttcccgt ctgttctttg tagtttcaca gcgcaatgac 186600
caagtngtgc tgagttctaa ttcatttatt tacaaagagt tctatttnct actccctaga 186660
atgtactata gaagtaaatt taaaatggta tcttgttcct aaggagcgta caagctttgg 186720
ggagtgtaaa tatctctaat accaattaga atgcgggtga aacccatttt taaaatgtgt 186780
aaacaaggtg actgttggta tcctacatat gttaaacaat atattcaagg atattcgata 186840
aaatataact tgccatttct ccaacatgtc cctttataat tttttttttt tttttttgag 186900
acagtctcgc tgtgtccccc aggctggagt gcagtggcac aatcttggct cactgtaagc 186960
tccacctccc gggttcacgc cattctcctg cctcagcctc cctagtagct gggactacag 187020
gcgcctgcca ccacgcccag ctaatttttt gtatttttag cagagacggg gtttcaccgt 187080
gttagccagg atggtctcga tctccttacc tcgtgatccg cccacctcgg cctcccaaag 187140
tactgggatt acaggcgtga gccactgcgc ccagcctaca aaatttttat atctgtactt 187200
tgtctaaaca ttcattagtt tgtcaacgac agacatcagt tcaggttaaa cgacacagga 187260
gtctaatttt attctcttct gtgaatctaa ggacacgcat actccacact aacaaattta 187320
ttcaatcaat caatagatat tttatgctta tctctctacc cttcaggata tatctaaaat 187380
cttttctttt atttcccagt tgtctgctgg agagtttagc ttagagttga gttccgccac 187440
ctgatcaata ccattattcc ttcactgaat atttgctcag ctcaccttgt gtccagtgcc 187500
atgccagcca ctgcccgtgg aataatgagc agagccctgc atggttcctg tcctcaccaa 187560
gtttacagtc tcagggaaaa gagaactgtt gtgcaagggg tcacacaata tagtgtcaaa 187620
cgacagtacg agtagggggt ttaaggcatt cccccaaaat ttttgtccag ctggatcctc 187680
agaatgagac catctttgga aattgggtct ttgcagaggt aaccagttaa gttaattgtt 187740
ctggatggtc cagtgtttgg catctataag gaaaaggaga gggggattca gattcagaga 187800
cacagaaaca cgcaggccca gaaggccatg tggtgacaga agcagggatg gggtgttaca 187860
gctacaagcc agggaactcc gagcatggct gagaatcatg agaaacaaga gaaaggcaag 187920
gaaggactct cgcctggagc cttcagagag agcatggccc tgctggcgcc ttggtttttg 187980
acttctagcc tccagaatgc tgagagagta aatttctatt gtgttaagct aatgatctag 188040
tggtaatgtg tgacaggagt cctaggaaac taatgtattg tggattcaat tgacccgtaa 188100
gaaattgcag atgttcaact gctttgagcc acacaaacag caatattata ggattcatcc 188160
taccatgtta tgagcttgta agaggaaaac tttgtcagag aaagcttctg tgaggaattt 188220
ctagtggaac tgaaatctag aaaacaagta gaatttgatg gagttcaaga gaaaaagagg 188280
aagaaagggg aacccagcag agggccagca gagggccggc agaggtgggg gaggcacaga 188340
ggttctgagg cagagggtgc agatgtttcc aagcaactga aggatgtgac tggaacccgg 188400
tgtggggata gagctagctg aggctggaca ggcagggagg ggccaaaaaa aggcctctga 188460
gcctagattg aagattgaga ttttgaccag gcatggcagc tcgcacctgt agtcccggct 188520
actcaggagg ctgaggcaag aggatccctt gagcccagga gtttgaggcc agcctgggca 188580
acattgcaag atcccatatc tttaaaaaag aaaagtttat atttttgttt ttgtttgtta 188640
aaacaaaagt ttttttgttt gtttgttaaa agcagtgggt agccaggtgt ggtggtgcat 188700
gcttataatt ccagcgactc aggaaactga ggcttgaacc agaaggcaga ggttgcggtg 188760
agccaagatc gcaccactgc actccagcct gggagacaga gcaagactcc atctcaaaaa 188820
aaaaaaaaaa aaagagagag agaggaagaa aaaggcagtg gaatgccatt gaaaagtttt 188880
aagacagagc gtgagaaatg gcaataaccg cagaatgaag agcagattag aaagagctga 188940
agcagatgga gaaagcactg caggaaatgc aggaacccag tggtgcattg gccagggagg 189000
cactggtggg gatgcaggca gtgggcaggc ctagaggctt ttaggaaaga actctgtgtt 189060
ctcatttcaa tgatatgtcc caattaatat accatttgcc cttgtgtctg tttgaagaca 189120
ttgaattctc ataaaatatg cataccagtc ctgatacatc tagagccccc aagtcaactc 189180
ttctgaccac gtgtgtctat tctgctgccc gtgaagtctc gtggagtaga agtagtgcct 189240
tcattttttt tcttatttct ctctttgctc tataccttgt gtttccgagc actctgttcc 189300
tatatctgcc agagtggcca ttctatttta ttatcattgt ctctttatag aactatctac 189360
ccagttatac tgtgggctcc gtgagggcga gtgcagtgac ttatttcttt ttatatcccc 189420
tgagcttagc acagaacctg acctgtaaga tttgatttat aagtgacagt atcaatgtat 189480
aaataaatga gtcagcaaat gcatgaatta acaatacttt atttctgctc tgtcttatca 189540
cctttggcct gatatacctg ccttacactc tgatctgatc taatagatta actgcttttt 189600
ctacttctgc tctatttacc actgacaagt atttttctac tagttgtatc aacttttaga 189660
aaacaagact cttcctggta aatctcttta ctcgtgtgtg gaatcatttt tctaactgtg 189720
tacctctcac agagatgcta ctactttttg ttttgtgtct ttgggagcta attccttacc 189780
attgtcatca tcataaccat ggaactgttg agaacgtgcc attttgcaca cattactgcg 189840
ttgagcactc cagttaggaa gggaggaagg caacgaacag cagtgactcc ttctccaaat 189900
aagattacca tctaagacag aaaaaccaaa ggctacccac aaaatcaaat cagacttaca 189960
aatggctaag gtaaatgttt atgttacaca aaacaaaaac ataagagcga tttctgcagc 190020
ctaataagaa aaccagaaat caggatgtat aatctcatca tgagctcaca accaatagga 190080
tagttgagtc atccatcata ttgaaatggg aatgtttccc caaaaagaag ccctcctgtt 190140
ctccttagcc aatttgtatt tccacatata ggagggatgc attgccatct ctcttcctgt 190200
tttaaaagct ctcttggcct ctaattctta tctttccata attcctaaaa caaattatag 190260
agtaaaacca tacccaacaa ggaggtaaat gagtggatga tttttgaaac ccacccccca 190320
aatccctcca aaaaggcagc ctgaattaca tgtactcttt gaaaggcatc agtgttaaaa 190380
gatgcagttt gggaagccgg gacagaagac agggcagacg tggggaaggg tgttccactc 190440
tgcagaaggt cctggagaag gggagaggta aacagaagta aagagggact ccaagagacg 190500
tcggcactgg gagagaaaaa gagagcatag gaaagtatag catgaattct ggaagccaca 190560
gtccaccttt gtagtatctt agttcagcct tgttccagtt tatgatgtta aacctgagct 190620
tccctgaaac tcaatttgta gaaatataaa tatacactct taaataaatc catttgattg 190680
tcattcctca caaagatatc atatggcatt taagttcgtc gtgtccaagc atgtttgcag 190740
ccaaatggaa aactcgctgc atggaccaaa tgtggtattt gtgttttgag cttttctgtt 190800
ttaatctgct aggcgacata accaattttc ctgccattgt ctctctttac aaatgctact 190860
acttagtatg attctgtagt taattttttt taaatttttc atggttttta aaaattttta 190920
attctagcgt taggcatgtg taaacaaatt ttattgttta aatatgcaag taatagtaaa 190980
ccattaaaaa tgtctgagat gaaaagagac ttgtctttgg gaataaaatg acataaagtt 191040
ttccttgaat ttttttctgg tttanttttt ttgttgttaa gttttgtttt tgttttttct 191100
gttaactcaa aagttttagc tcatagagca atttatggcg ggcaagagag gtatacttgg 191160
taggcctttg ctgccatcta ctggcatttc atgtaattac ttattgcttc cattctaaaa 191220
ctaattttgt gtaacgtata taatagtatt ataggttccc ccttttnttc ttctttccaa 191280
tttttcttta gttaaagcaa agtgaagcaa atgcggacac caaagaaaag ctccctttac 191340
gcctgcgaat ctttgaaaaa tttccaaaca gacctcaaat ggtgaaaatc tcaaagcttc 191400
cttcagattt tacagttcct aaaatcaggt accaaaatac ttctttaatt gcatatttca 191460
catatattgt aaaagattca tcatcttaaa tctgatttaa cccttctttt aagtatatgt 191520
gggttgggtt tctttctatt ttattgtcat ctttctacta cctctacctc tatttaaaat 191580
aaataaataa ataaacaact ttgactcttt taagcaatgt attcacagaa gagtcacttt 191640
ataactgcag tagcctaagc aagaaggctg cttcccatcg cttctctctg ggatgactcc 191700
tcgggaatgg gacatcccag gaaactggag aagctgctca gtgttgcagg gatggcaggt 191760
agacatcaat ctcagacccc aaccgtatga gactaaaatt gcctctgtgg cccttttatt 191820
ttcaagcaaa cagggaaacc acagctggcc cagtttgtgt actactacag tgtttatgga 191880
gcctaccatg tcaggttacc atatataatt tgccttccac tttttaaaag aagaaccgtg 191940
gcgtttttcc actcatactg atttgatttt ctaccacgtt tgccctccag ttaagcaaat 192000
gcataaaaga tgctttaaac acctattttt aataataaaa ggaaattctt ctagttatag 192060
ctcaagaaat tacaaacaga attacagtaa tatgttacta gctttaaaaa taattctgtg 192120
gggggttata aaagtatgag actatatatg gtgccataat atttaaaatt cgggtagaaa 192180
tatatttgca tttctaattt taaaaaacaa aattaattga atttggtaat ttgaagagac 192240
gttacttgaa ttttcgttat gctttgaaga tcagatgaac gcacttgctt ttgagtctta 192300
aaatgtaaaa ttctctctta gtcattctta tgataaatgg acatttagag agagcaacta 192360
attcttccaa gtcttagagg gggaaaaaaa gtgttttatt accacaataa gattcaaaaa 192420
actgggctgg gtgcggtggc tcacacctgt aatcccagca ctttgggagg ccgaaccggg 192480
cagatcacct gaggtcggga gttcgagacc agcctgacca acatggagaa atcccatctc 192540
tagtaaaaat acaaaattag ctgggcgtgg tggcgcatgc ctgtaatccc agctactctg 192600
gaggctgagg caggagaatt gcttaaactc gggaggcgga ggttgtggtg agctgagatt 192660
gcaccattgc actccagcct gggcaacaag agtgaaactc cgtctcaaaa aaaaaaaaga 192720
ttcaaaaaac taccatcggt tactgagtaa tattgcttga aagttatttc aaggatattg 192780
ctttttaagc aggagtcact gagtttcagg aagctgttgc taatgaaata ttttagtcat 192840
gatctagttt tctatgatct tttatcactg ctttatcttt gctcaagcaa actcatcatt 192900
gcaaaatgct gtcacttgct cccttccact aataatgcct gatgcacata tacttcattt 192960
gcaaagggag agttttatga agcagtttat tgaccgccag caacaggaca catgttgcct 193020
cctgagaagc ctcccgacca cctcttcctc ctcctgcgac cactccaaac gctcagcaat 193080
tgaggacaac aaatacatcg accaaaaagt aagatcngct gtttcgaata accaggcttc 193140
taaaaagcat ctatgtttga gaaaagaacc gcagagttct ttagggtcct ggaatccaat 193200
ttnctcaaga gaataatgaa aanaaaatga tttcatttgt aaaagatatc atgaaaccta 193260
acatttttta ctctatgcat tgaaattttg catttgcccg tgtaagcttt tgagctgcgc 193320
cacgtggcag ccatgcgact ttgtaaacat caagagcctc ccaaatctgc attttctcan 193380
gtgcggaata aagggctggg atctccaagg ctcagtccag gtgtaatgac ctgccatctc 193440
ctgcaagtac aactgcttat gtctacttat tacatcagag aggatacgag agcatgtttc 193500
tctaaaatcg gtcgaaagaa ttgccattta ttcaatgctt agtatgtggc aggaacttag 193560
gtgcaagagc ttattcatgt tctagtttac ctatttcttt atcatttgaa aagtagaagg 193620
gaaaattttt ttcagattcc acagcaaagt atcagtaggg aaccacatat aaataaagca 193680
aatttaggta ataattttaa agaaatgtac tttttcattt attcactttt aaaaaaaata 193740
atataagggc tgtgtgccgt ggctcacccc tgtaatccca gcactttggg aggccgaggc 193800
gggtggatca cttgaggtca gaagttcgag accagcttgg ccaacatggt gtaaccccat 193860
ctctactaaa aatacaaaag tcagccgggc gtggtggtgg atgcctgtaa tcccagctac 193920
tcgggaggct gaggcaggag aatcactcga acctaggagg cagaggttgc agtgagctga 193980
gattgtgcca ctgtactcca gcctgggcaa cagagtgaga ctccatctca aaaaaaaaaa 194040
aaaaaaaaaa nangacntag aatgtattat ctaggtataa taagtaaaca tatttatata 194100
tacacacata gacatataaa tgtatatgtg tgtatatatg tatgcatagt atcaaactat 194160
atatatcagc ttggtcacat aatcaatgtc agttcagtta gaaaatgaaa gattaataat 194220
tgtcctttaa tattaaagag attaaacagt agagtttgca aaaacatcta gttcacttgc 194280
aagtattcca ctttggcatt cctagagtgt tttttattcc tttacattgt tactgccctt 194340
tttcttttgc ttatagtgaa atccatattt ctctatgatc atgtgacaat aaaatgccaa 194400
ctgtttcatc ctccaggatc ttctttctct ccgctttctt tcccttccca cagggatgaa 194460
ccctttggaa ttccctcacc tttctcttta tctcgcctcc cctttttctc ctctttcttg 194520
cctccccttt ttcctccttt ttcacctccc ccttttctcc tcctctttct cacctcccct 194580
cccctaatgt gatactactc ccgtttacct ctcccccagc tcccaggttc tctgctgtag 194640
ttcagtcatg ttgctcttgc tgaaaatgat gatgattttc tttgcaggat gtctcttctt 194700
tttcaaggat ttccatgtgt tgattttcct tcagccatct agagatgcta ttctactatc 194760
tttgcagaat ccaagattgt aaatgacaag tctgatgcca atgtcatttt ttttttaagt 194820
aattagcctt ttggttggta gacttggttt gcttgtttct tcaggaaaac ttgtaagatt 194880
ttctgtgtat ccttggagtt cagaagcttt cttagaatat accttatatg tcttttttca 194940
tcagaactgc tccaactaga gtcttttcag cttgccaact aagatatttg ctcagggaaa 195000
tttccattta ttttgcgttc aattgttact cttccatctg cttctctctc ccctgggatt 195060
gccatctctc tatttttgtt ctgtgcttgg tcttccagga cactaattag atttcaactg 195120
aggtcatcct ttgcttctaa atttctcgtg aaaaattatg atatggacat atgaccctta 195180
actatcctta aaggcttgca tattaccctt agctgtcctt agaggcttta cttttatctt 195240
ttatttttat ttttttagag atgagatctt gctgtgttgc ccaggctggg gtgcagtggc 195300
tattcacagg cacggccata gtgcactata gccttgaact cctgagctca agtgatcctc 195360
ctgcctcagc ctcccgagta gccgggacta taggcatggc caccatgcct ggcttttttg 195420
atttttttaa attaaactta tcacctctct tcttcacagt tataatccac tcaacactgt 195480
gcatggggca tggaagcaga aggtcatatg tcagtggata aacaagtggg aagatagtgc 195540
cttggcttca gccagtcagt ctgaaattgc agtttgcgtg gactagaaag caggttgttt 195600
tgttttgttt tgtttccaaa gcagattgta agccagaagt ctgggctgtc cttgtgacca 195660
cttatctcca ggaagaggat agagagctga tttccattat ggccaaagtc acaaaaccat 195720
gacatgcttt taaaaatcac tggtaacact accccactgg aaacacaaaa ttgaaatatg 195780
agtttatttt ctctctaaaa ggaaatgtga ttgtttctca catttcctga acacagtatt 195840
ttgatttggt gaggacaaag ataaaaagag tcttgagagg catgtgccgg gctgaggagg 195900
agtctaaaga gaatgtggcc cgcccctctg tgcgcccgcc cgaagcgaac cctccccagg 195960
tacagttgga ataacacgtt ttatcccata caacatgtct tattgctccc acttggaaag 196020
tggaatgtca aaaacatact ttttcttcat cagaggaccc tattatggga gtggcaagac 196080
aactgctcct gttactatcc acgctttctt aaagctttga ttcgatctag gttgtcagaa 196140
aagtagactt aattcttttc aggatccacc attttcagca atagttccca ccagttcttg 196200
gtgttcctca taagacctta ggatttgtca accttgttga gtgcccctgg gccagggaaa 196260
tctaaagcag aaaatccctc ttcaaaggat ttcagtgata aggatttaat ggaagcacaa 196320
attgcggaga cagcattctg gcatttgtat tatgaatacg gcaagccttt ttcattttta 196380
ttaagaaacc cgaaagccac ttaaaaacaa gagcgcataa acacagaaca aaaatccccg 196440
tcacagaccc taccaccatt agttcccctt ataaagtatt tttcagcgag cacttagaaa 196500
tttccattaa aatcccaatt gcctttggaa atcctagtca cagtaaagtg acaggcaggg 196560
ttcttcactc tacgtgnaaa aaaaaaacca cccagccctc tgcaaattgt gcaaattgag 196620
gctgtgtttc ctcagtgact ggtatgaaag aaaaaggaca ttagaggctg gtttatcggt 196680
gattctcata acatgaacaa aggaacaata aaataaaact gttctcttaa tggttatctt 196740
gtaccaggag aaacttctga cttcactatg ctagagggaa tcacctttct ctttccaggg 196800
aaaatagtga agccccaggt gcctgaagac tgcaagttca gggagaaaaa aacaacaact 196860
gacagcaacc ccagaagggg gctggggttt gatgaagcat tgcagaaaac acaaaagcac 196920
attaggcaag attttctccc agtaattacc caagctttga acagggatga gtaattccca 196980
tggcaacctc actttgcaga aaccatgttt ttaaaaatag ccctggtgga tcacctttat 197040
tatacagttt aaaatacctg tccttctccc agaaaacaac cagcaaacaa aaatctttaa 197100
aatcttgggg ctgacccaga tcctaaaagg aaaagacagg aaagagtgtt ttcctgcctg 197160
tcgtttgaga ctccatagaa acgaccttcc caagtggtca tttccccatc cctttatcct 197220
gctacctacc gttcctgtga gcaattgtga gaggttcctt ttcttcctga ttcaaggatt 197280
ttgacagggg cttttccagt ttccaagcag aaagaaatca agcaacaatt tctacttgta 197340
tttttcctcc atattattga aattaaactc tagtttcctt aagcagagtg gtgattaata 197400
aagtgagatc tgaacttgac tttccagtaa ccctgtaata aaagcagccc gctctgttct 197460
ccgaagtgag acatccagtc aaggtcaagg tctcacctgt ggttgagtct acagcgtctc 197520
actgccctgt ggcctgagga tggttctgtg ctgctgtctt ggctgatgca ccatttctta 197580
tgtcagaacc tgcaatagcc tgggaagcat gagtgaacct cctggagcca tgctaggatg 197640
agggctgtcc cagcacctcc acctcgtgcc cctgtacttc ccagcataga atcagagccc 197700
acataataat gaacagtgaa tattttctct gacagtaggg caatatctgc ccaccctctt 197760
gtcagcctcc tttctgctga agcatatgat agttctttaa taagccttca caatgaacag 197820
ctaacttatg tacagtaaag aggaaaatga tcattggaat gactatgttt tgtttaccca 197880
tttgatttta taactcatta acattcattc agtcattcaa caagcactta tagagcaccc 197940
gttattcatc tgctattctc tgggctgtgg gaattcaaca gtgagcaaga tgcgaactgt 198000
accctttaga agctcatagt ccaatgggag gaaatgcaca tacatgcatg aaagtaaaaa 198060
gtattactgg aaccatgaga cagaaccccc taagttcccc ttacagaaga agtgtgattg 198120
attgataaag gaagaaagca ccccaggcag agggggacat atatgcaaag gtatgcaaag 198180
catcaggtgc tcgatgtttg agagaaattg ggtagaagag tgattaagtg gtgcaggttc 198240
caaccctcat cagtaaagtg gagataattc tcattttcaa ggtttgttgt gagaatcaaa 198300
taatgtaata atgttaaata cctagcattg cacctgggct agcatatgtt ctgtgcctct 198360
caaaccagac aagaaaggtt actgttanta aactgtacca tgaagtcaga ctcagcaaac 198420
agatttctat tcatcagtta ggacaaaaga cttttacata aatttaacct tcagatgtaa 198480
cagtctagtt gagtgcaata tattaattac tgatcaattt ccttatggta cctaagtctg 198540
atttttttag agtttgattt ttgttgatat tttagttgct atccctattg tctacacggt 198600
gtcttcgaat ctgaagaagt aaattaggtc attctggtaa gatttactct tccgnttttt 198660
ttattgccat acagcatttt ataatgttct atatgattat agagtgcttg ataatttgtt 198720
cttgtaactc ctcacatagc aagttactca gcctgatcta taatttccag gatgaatgaa 198780
tgtttgttca ccttaaaaga gagagagaga gagagagaat gaacaaanga acgaacgaac 198840
acagcctgnt ttcattttta gngcttttgg tcttttgaaa gaattttttt tttaaataat 198900
ggcttagctt ctctgcagta ccattcaaga tgtatctcca ggaaaagagt gacagatgac 198960
atgatgctac catgtaacca tgggttgtat ctcaaaggga agaattggtg ttcctcatgt 199020
caaatatgaa aactctgtac acttctctct agcttaaaaa tgctttagta gataatggat 199080
tcccaattta gtcacaataa tggaaagaaa taaaaagatg cgtaagattt catcatcact 199140
ggccatcaga gaaatgcaaa tcaaagccac aatgagatac catctcacac cagttagaat 199200
ggcgatcatt aaaaagtcag gaaacaacag gtgctggaga ggatgtggag aaataggaac 199260
acttttacac tgttggtggg accgtaaact agttcaacca ttgtggaaga cagcgtgcta 199320
ttcctcaagg atctagaact agaaatacat ttgacccagc catcccatta ctgggtacat 199380
gcccaaagga ttataaatca tgctgctata aagacacatg cacatgtatg tttattgcag 199440
cactgttcac aatagcaaag acctggaacc aacccaaatg tccatcaatg atagactgga 199500
ttaagaaaat gtggcacata tacaccatgg aatactatgc agtcataaaa aaggatgagt 199560
tcatgtcctt tgtagggacg tggatgaagc tggaaaccat cattctcagc aaactatcac 199620
aaggacaaaa aaccaaatac tgcatgttct cactcatagg tgggaanctg aacaatgaga 199680
acacttggac acnaggaagg nggnacatca cacactggga cctgtcatgg ggcaggggga 199740
ggggggnnag ggatagtatt aggagatata cctaatgtaa atgatgagtt aatgggtgca 199800
gcacacaaac atggcacatg catacctatg taacaaacct gcacgttgtg cacatgcacc 199860
ctagaaccta aagtataata taaataaata aataaataaa taaataaata aataaataaa 199920
taaaacgatg cgtactataa aatcaaacca ttttttcttc ttactggtct ttgcagtaaa 199980
ttctcaagct aaaaccaaat atctgtgtgt gtgagcactc accctttcat ccaacaatca 200040
tttttgagga ccattatatg caaacagttt gctgggccct gagtaaacaa acacatcttt 200100
ctatattcaa ctaacattag agtaggaatt ccctctcaat gattattttt gcagaatatt 200160
taattgtgta accattttta ggttggaact atgtatcagc tgtttgtatt ccttagtaaa 200220
tgcgcattga gagtcaaaag taaatcagtc taggattaag aattttttat aggtaattta 200280
aaagattttt aatcgcattt tctgtatcat gcacaaaaga ggtatcaagg agttaaggcc 200340
gctgctaaat ctatcttgga aatttacatt ttgctcttct ttttaaactt tttcctcttc 200400
tgactacagt tttacttata aattgtctct tctatcaagt gtcatgctag tctcagtgtg 200460
ttgtatttgt tgctgatgat ggtgttgagt ccaagtcctg cttccttgtg ttgccacaga 200520
ccttaaattt cgaatttcta cacccataat cccagcactt tgggaggcca aggctggcgg 200580
atcacctgag ctcaggagtt cgagaccatc ctgggcaaca tggtgaaacc ccatctctac 200640
taaaaaaaag tagctgagca tggtggcaca caactatagt cccagctact cgggaggctg 200700
aggcatgaga attgcttgag cccagggggc ggaggttgca gtgagccaag atcatgccac 200760
tgcactccag cttgggcgat acagcgagac tccgtctcaa aacaaaaaaa aattttggaa 200820
tttctaaatt cacaaacagg ttaaaagcat ctgacattta ctctagaatc acaagcccac 200880
tcaccttctt ttgtctctgc agatttccaa tctttgcctt cctgtttata ttagatataa 200940
tcataaagtc attttgtatt ttacttttgt aattaaaatc tatctagcgt atatttatag 201000
ttttgtttgt ttgtttgttt gagacggagt ctcgctctgt cacccagcct ggggtgcagc 201060
ggcacgatct cggctcactg caagctccgc ctcccgggtt cacgccattc tcctgcntca 201120
gcctcctgag tagctgggac tacaggcgcc cgcaaccacg cccggctaat ttttttgtat 201180
ttttagtaga gacagggttt caccgtgtta gccaggatgg tctncnattt cctgacctcg 201240
tgatccaccc gcctcggcct cccaaagtgc tgggactaca ggcgtgagtc tccgcacccg 201300
ggcatttata gttncttatc attaagtact gtatattaaa cctatctaaa tttgtttcag 201360
tactcgaaga tattgctttt ccctcgattt ttgcacagtt tcattatttn atgtgtaaga 201420
tgttggagat ttgaccaagt gaccccaggc tactgtgtta gtggccgaaa cattgtcata 201480
acattcacgt gcaaaaaaaa atcagatcca ttaagtttta aattgtttag tttctaatat 201540
tacaagctgt tcctatatat caagttagtt gattcatttc aaaataagca gtccctcttt 201600
gtaattttta cgtcattcat atttcttatt ttcaaggact aactacatta aaatatataa 201660
gatagaaaaa gtaatacttt aatattatga aattaattca attttcaaat atatttcaag 201720
caccaacaat gcacagtgct agacaatgaa agaaaatgta ataaacaaag aatacattat 201780
acatatccta aggagtttac aatctattgg aatttacaga aagataaaaa gatgtttcac 201840
acagggcagg gatcaacttg tgctgggtgc ctaggagtcc aaaggaagag cgaagatttg 201900
gtgtatgcat ggcatgcaca cacgtgcaca tgcatgttta tatgaatatt ttaactccta 201960
cacatagtgt ttttacaggg ttcagaacac atgatattga aataagttac aataggaaat 202020
cttttttttt gtttgtttgt ttttttgaga cagagtctcg ctctgtggcc catgctggag 202080
tgcagtggca cgatctcagc tcactgcaag ctctgcctcc caggttcacg ccattctcct 202140
gcctcagcct cccgagcagc tgggactaca ggcgcccgcc accatgcccg gcttattttt 202200
tctatttttt agtagagacg gggtttcacc atgttagcca ggatggtctc gatctcctga 202260
cctcgtgatc cacccacctc ggcctcccaa agtgctggga ttacaggcgt gagccaccgc 202320
acctggccta caataagaaa tcttgaccca tcatctaaaa ttctcttcac aaaattcaca 202380
ttttaagata ctgttcaaag cttcataaca tgatattata atggtattca cctttatata 202440
catccataat caacatttta atcttgctga tgctcacatt aatcaccttt taaaattttt 202500
tttctaagca taatgtcaat tccnagagaa agtttatttt atagaaacat cttgccacac 202560
acatgatctg tcgtatgcac tttgggatta attatgaatt cacgggtgca tgaaaattca 202620
aatacagtca aatgagatac caccttcgac ccatgcaatt ttaagtaatt gcttattccc 202680
aattactata ttttatttgg gagacttatt caataaagtg gctcgttaca ataattacac 202740
tacaactttc tagcagaaat gacattcatc aagccatatt cattggaccg tggttttgtg 202800
tcttatggtc atatgttttt ataaccactt tcccatttat tattaacctg ttaatatttg 202860
taaagtgaga aaagaaaaat ggagccactc aaactttttc ccagttagaa acagaaatgt 202920
attgttaaca ttgtaaatca aaaaagctat tgaatattta taatacttgt ggtgtgcttt 202980
gtcaaataaa tattgatggc ttcattctga aggtggtttc tagggtcaag ctatggttct 203040
ttaggtctaa gcattgccgc atcctaaagg aatctatatt caagataggt ctgtggttac 203100
ttctgggtga ttgaattaat caaattaata ttctgattga ttgagagttt tgatggatcc 203160
cagattttaa ggaatcagta agtgtaaaat ataaaaacta tgatcatact agctttaatg 203220
agttaggaaa tgtattgatc tctttcagtg cttcagagtc attattctga aaatcaatta 203280
tgcatatgta gaacaaacaa aaagttggtt agtttcgatt ttgcattagg atgtgagaat 203340
agcaagagtt tataatatgt gtaaacaaaa tatttcaagt caagcagata atattttgtt 203400
atgatatagt ttagaaaatg cttttttata ctaagcctag tgacatttta catagacata 203460
atgcagtgaa aagatttgaa cactgaagct gcatgatcca gagttctagt aataattttg 203520
caatttatta tctgagtgaa cttagacaac ttaattttta tgagccttag atctttaatc 203580
tggaaaaaag agataataat accttaccta cctatgagga ttagtttgaa gattaagttt 203640
aaaatatgta tatatcacct cagcacagat caaggagcca agaaatacag atgtagaagt 203700
tataaaatgt acatttttaa atgtgcaatg ggcatctata aaattcttca ttcaatgact 203760
agagaataac attctaattc aagaacacat gtatgatttt aaatgtaacc atttaccaca 203820
gacttctaaa tatatacaca tcagtgtcct agaaaagata ttatttgacc aaaatgtaac 203880
aaaatcngaa acctaataag aagaaaataa ccacaaaaaa acctacacat tcagaaattt 203940
aaaactattt tcaaataagc acagaagaaa caccaatgaa aataagaaaa tatctacaat 204000
taaaaaataa tgaacaaaag atgcatcaaa cttgtgggaa gtagctaatg gcatttttag 204060
aggaaaaaat ttagccctga atgaatatct agtaaagaaa taaaggctta aattaatcct 204120
ccaagcattc atttcaagaa tttagaaaaa ttatcaacca aggaaacact aagatagcag 204180
aaagaaagaa ataataaaga gaaaagcagt tattaatcaa atggggggaa agaggtgata 204240
aataatatca acataattga aattttgttc tttggaagca gtaataaaat tgataaatct 204300
actttaaaat tcaacaagaa aaaattaagg agccttcttc tataaagatg acagaggcat 204360
tgacattgtt ttttaacctt gaattcccac atgaanaaca aaaagaatac caagatatca 204420
aaaccccaaa tccatagtta atatttacca taaaactcgg taatccacaa accctaaata 204480
aaagcaagtg ttgacaaaca gccacatgat ttgcatgata ttagtgtctg tgggaggaaa 204540
ccaagcttag ttacagagcg tccaatgttc atggaatggt agaacatctt ctttgctcca 204600
ttctgaaata aaaagtccag gagtggaatc aaaattgaac aggccaggaa caagagtgat 204660
aaggataaaa gcagatccag acaaaatttg tggggggagg aggattggga aacagagctt 204720
ggaaattcca gaaagaaagc taccatattt gatcgatata ttaaaacaac agaagaggaa 204780
actctgaagt tagaagagaa atactaaact gtttgggaaa actaattttg tataaaaatg 204840
agtaaggaaa attatcaaag ccaaattccc tgcaaacgtt attataagaa aaaaacagca 204900
gaatactgtc tctcactgta gacaaggaaa gcaacctana aaaacgtgct ctaaccagct 204960
caaactgtag catactattg aaaaattagt taaaagacat taaaaattac ataaggatga 205020
aatagcaaca taaataaaag ttagaaaaac tcagaaatga ggtgccagaa ctgagaaaag 205080
ttataaatta aagcaatgaa aactaaacga gaaggaacat aaagagacct cagatgattc 205140
aaaagtgaga aatagaaaat ggagaagagg gcatttttta aaatcaaaga gaaatgaaga 205200
aagagatgaa aatgatttgc aagaaaaatg acaaattgaa gaaagtcaaa aatccgacat 205260
ctgcattata ggtgtcccta aggaagaaaa accacagcaa gagaataaaa cgtatactaa 205320
acttttctga aacataaaaa gatatgaaac tatatattga cagcacacac ctaaaaatat 205380
tggagtaaat gattaaaaac aatacataca ccagacaaat gacaggtctt taaatttttt 205440
aaaaatatat tatctagccc aaataagaac aagtgattta taaaggaaag aacgttagat 205500
tatcatgaga tttttcagca gcaatgcttt atgtcagaag aaaatagagt aacatatata 205560
ggatgcccag gcaaagaata tctgagccag atttttttcc atcctgaaaa ctgactttca 205620
actttcaagg tcagagaaac tgctttcaag atctaagaat atgagtaatg taagatacaa 205680
gtaatcttgt ttcaatgaac ctgtaatcta ctaaaaaaca tgcctcagat aacctaaatg 205740
aactccaaaa gggactctta aaccatttgg cataaaaatt cacattcata tgtaacaact 205800
aactacataa ggacaacatg aagagtgaaa tatgtaataa ttatttgttc taatatggat 205860
agagtacaga tatacaaatg aggaggtgaa ngggaagaag atatgcaaac ccttaagata 205920
ttcagtagtn ttcttggttg tgtattttca ttctgagact attgtctatg aaatgtgaaa 205980
taaaactgag tcactgtnga gacaatctaa ttctggcatc cctggtgctc ttgataatca 206040
agagtgctct ttgtggagaa aaaaggagat atagatatca tatagaaaag cttaggtaaa 206100
aataaaaatc ctaaagaaaa cgtggcatgt atacaccatg gaatactatg cagccatata 206160
aaagaatgag ctcatgtcct ttgcagggac acggatgaag ctggaaacca tcattctcag 206220
caaactaaca caggaacaga aaaccaaaca cagcatgttc tcagtcataa gtaggaattg 206280
aacaatgaga acatatgggc acagggaggg gaacatcaca cactgggtgc tatcggggtg 206340
gggggcaagg ggagggatag cattaggaga aatacctaat gtagatgacg ggttgatggg 206400
tgcagccaac cactgtggga catgcatacc tacgtaacaa acctgcacgt tctgctcatg 206460
taccccagaa cttaaagtat aactaaaaaa aaaaaaaaaa aatcctgggt catgaattta 206520
aattgaaaac atcagaataa acccaggcaa aatatttgaa acagtgacca actccatagc 206580
agtgagcatc tatgggctct agatatgttc ttgaaacacc atttttccaa ttttccaata 206640
agtaaaccag ggcttcttga agaaaatggt tgattttgaa taggaagtgt acaagctgac 206700
cttggagcat cttgtcatac taggaacaag gaagctttgt caaagactac gagggtcata 206760
taaaaagaac ctacagactg accaacttga aaaactccca atgagcacag tagagataat 206820
ttgactaaca gtaagaaatg gtaattgaca tggactgaaa tccattaaac attaaataag 206880
tttaaatctt gagttcataa tgacattntt ttaaatagta attggttacc ttgagcgatg 206940
atagaaaatc aaccatgtaa aattaataag taaaagtcga taatcaagca tttatcttgg 207000
cttttccata ccagttttgc tactgggtaa ccaaataata caggagggaa agcacctcat 207060
tataaaacta tcccaactaa taaatgaaaa agaaatgaca gttttgcaaa cggaatgaag 207120
tcaagggatc taagaaatga acatcaagac ccgtaacatc acaaaaagaa acacacacac 207180
tctgttcctt tcgatggaag aatctgacac cacctatggc cttgccaaag ggatgaaacc 207240
agagtctgta tgatgaaacc tctggatcca gctgccgatt ttcagaaaat agaagacaga 207300
agaacgtgtt gaactgtacc aagagtgtgc tttcagcaaa atccagactc tctcttggct 207360
ggnngtgcgg tggcttactc ctacaatccc agcatattgg gaggccacgg caggaggatc 207420
acttgagccc aggcatttca agaccagcct gtgcaacatg aagaaacccc atctcttaaa 207480
aaaaaaaaaa tgttacttag ctatatgtga tggcacacgc ctgtagtccc agctactcag 207540
aaggctgaga caggaggatc gattcagccc aggaggtcaa gactgcagtg agtcatgata 207600
attccactgc atgcactcca gcctgggtga cagaacgaaa ccctgtcaaa aaaagaaaaa 207660
aaaaaatcca gactcaaaaa ctataggtca aatggcccag gtttctctat tttaagggga 207720
aaaaagggta acatgtagat taattagaag acatcgccaa aaaatcagca agattcatac 207780
attggaatgt ctttcaggtc caaattattc aatcacaaat aactctatgg gaattgagtt 207840
gaagcttttg aattatgtgt taaagtatgt aattctggaa acgtgtttta acttagaagt 207900
tcaagactta aaatatctct atattgttga taatttaaat ttaatttact tgttttgagt 207960
tattaattct gtcaaagaat tgttatctga ggcagttgga tgttttcagt ttccaaacaa 208020
aaccgaagaa aatcttcttc aacgaatctt tgactttttt caaagtaaac tccttgtaat 208080
tccatcattc atccccttcc tttttattcc cacatctctg atatgtttac atccagaatg 208140
agcaattact ggctcctttc atagctgtaa tttacaattt cagatctgaa attactcatc 208200
atgaaatgga tctctgtatt ctttgttttg ctaattattt caggtgattg tcagtatctt 208260
ctagagccag aagagggcac tgcagagcag tgtagctctg agctctttat gtttagcaca 208320
gtctaggaat gccctttgcc aaaaaaaatt cgcaaagctt tactatagaa gtaagaaaaa 208380
agaagggaat aactagataa tcactatagg ccttctttat ttagtagaaa aaagaaagta 208440
tataacgatc taaatacata tctaggacat caaatgtaat atcatatata tatgtataag 208500
tagatgaaag aagacatata tatgtgtgtg tgagtccttt ccttctttta agaacatccc 208560
aaaggccagg tgtggaggct cacacctgta atcccagcac tttgggaggc caaggtcggt 208620
ggatcacttg aggtcaggag tttgaggcca gcctggccaa catggtgaaa cctcgtctct 208680
actaaaaata caaaaattag ccggtgtggt agtgcatgcc tgtaatccca gctactaggg 208740
aggctgaggc aggagtattg cttgaaccca gggggcggag gttgcagtga gccgggatca 208800
caccactgcc ctccaacctg ggcaacagag tgagactctt tctcaaaaaa caaaacaaaa 208860
caaaagaaca tcccaaagct aaatctgatg tttttctatt ataatattga ttctcctgct 208920
acctctggca ttagttataa aaacagttct caagtactct cctgtatgaa ttaatactgt 208980
attttgtctt agttcaaatt caggacaaag gccattcagt agccttttag caatcttgtg 209040
cagggcagaa atcatttagg caatagtgta ccagatatta tcccaaaagt ttttcctaac 209100
gtgaaattgc aggggcagta gataagtgat tggattcaga ctctcatctt ccactgaagg 209160
aaagacaact aacacatgtc attgtccttt caagatgaaa taagagttgt ggaatctgga 209220
gtcctctctt aaaactcact gtcacaggac ctctgtgcct gggtctgtct caggactatg 209280
tgtgttctta ggtgtctaaa gagcagatgc tccacgatga tggggccacc agctgagtct 209340
tccatctcca aaagcggctc caagcagctt tccttaggag ctgagctgtc aactcaagag 209400
aggttaaatc catgtcaaaa gtcaactttt ggccgggtgt ggtggctcat gcctgtaatc 209460
tcagcacttt gggaggctga ggcaggtgga tcacaaggtc aggagttcaa gaccagcctg 209520
gccaatatgg tgaaacccca tctctactaa aaatacaaaa atcagtcggg catggtggcg 209580
ggcacctgta gtcccagcta ctcgggtggc tgaggcagga gaatcgcttg aacccaggag 209640
gtggaagttg cggtgagctg agattacgcc actgcactcc agcctggatg gcagagcaag 209700
actatcttaa aaaaaaaaaa aaaattatgc caaaagtcaa ctctttcagg aggggagaag 209760
taggaaagtt tcaagattta tcattggaaa tagcatgtat gtgctaccaa gaaaatggaa 209820
gttccaaata gttggtatcc actcttgtct ccttgtccat acattaattt ttctcctaag 209880
agttctagtg aataatgaaa ccaattccgg tttttcattt ttgagcagaa aaatgaacaa 209940
accacctttc ctcatgaggg ggaaatcacc agtatgttca gtgatgctga tctttactac 210000
atatctgctg taaaatatga aaagtggatt gctagttttg atgttatcta ggttatcatt 210060
tgtgactaaa aagacctgtt tgttactctg gttcttctcc actatggctt tatggacaca 210120
ctgactgaca ttatagcatt tgttcatagc tttgtttgta gaatggggtg ctgtgagttt 210180
gtacctcaac atacctaacc cttgttgaaa agaaactaac taggtgatct atttttactg 210240
aatacagagt tttctgtctt ctgagggttt tctttccccc ctcaactttg tttgacacac 210300
agtatgccct gtagggcttc ttgcctggtt tcaagatctg gctagcacag cacttataca 210360
ggtagtttgt accaaattaa cttgccctgt gcacacatgt ccacttcagt ccttcaccca 210420
gtaccgcctt tgcctctagg aatcttagcc ttccttcaag gcccagtata acctccactt 210480
tttcattgaa gcctttgccg actagtccag acttgctgtt ccaccgcaga gagctccagc 210540
ccctctgatc ttgtgttttc tcctttacgt atcatctagc actgtgccat ctactgcact 210600
gtacttgtca ctgatgatct catgtgtcct acccttgtct tcctatctag gctattcact 210660
tctagaaacc aagaactcca aattctattt accctaaatc tcctatggtc actaatatca 210720
tgctaagtgc tcagtaaatc taatctattg atcaaaatga acaggtctca attactatct 210780
tcagtctgac tactggagtt acactttcct gttatttatt atttattcta gttatttatt 210840
attgtgaatc tagttattta tttattatta tgagaacata gtggcccatt tgcctgtttt 210900
ctctttgccc ttcttctgcc tgctttaact ccttgtanac cttccaccaa tctaaaatct 210960
gcaactagca agccacacag aactgagctt ggggagtata tctttgaatt tacagtcagc 211020
atccaggatg gttttctcct tagttctctt ctctggagta attttatcat cgccaactag 211080
gaagagatct tgaatgccca tttcattcat tccccacacc tgcaagcaaa acaactccta 211140
aactcattgt tcagattagt gttaggttac aggccaagaa cctgcagcag acataatgtg 211200
gattagagaa cattgcgcta atcaaagaca aataaggagt ccagtatgag ggtcaacgtt 211260
aaagtctttg gaaactgaaa attttattca gacgaaggcc attatcagag tgaggcacag 211320
ccaatgcacc atccgtggct gggacgtggg gccccacaag tttgttcatg gtgctgccca 211380
aataaaagta aaaatagaca agaattgtca attgtacgat gatgctttag cgaaacatat 211440
tcatgtttca tgttttaaca atgtcatcta ttgaatgatt tgacagtata ttatttctta 211500
acattccaaa actaaaagtc atactcttat cattttcagc ttcgcaagtc tgttttcagc 211560
atcagggcaa ggaaccttct ggaaaaggag accgcagtca ctaaaatctt aaggtaacac 211620
caattaatgt tgacacatat ttaaacacaa gtgggattat attaatcgaa aaatagcttt 211680
ttgaaaaatg aattaatgtt ctgggcatca gcatatactt tctgccagaa agtagctttg 211740
agtatctatg tacttataaa caatgtaaaa gacatattga tgtcatttct aaaaaaaaat 211800
tttagtagct cagtaggcct ttctttcaag tatttaaaca taaatgataa gtataaacat 211860
tgaccaaaag gtgaaaataa cttactgtta tttttaacag ttttatatct tttgtgatat 211920
gtaaaggaga aattgcaatc taaaggataa atggtaaaag ggtaaacttt ttcattatag 211980
ttcattacac tattaagagc acatttatta aaaatccnga aataataaaa agtataccaa 212040
tcttagaatg cctatgaaaa catatgcttt taatgctact ttctagaaga tgcgctgaaa 212100
tgaagtatca aggaggaaaa ctaagcaacc gacttgagtg ttttataaga ctatatgtta 212160
tattatggag taacatgatg agtataaaaa cacataggca tttagaatat catttattgg 212220
tacatatatt acatagacat atgtagatga cacaactcaa gattgggagc tggaggtagg 212280
atcgctcgca aggcgagtgg acagattcat gccaggaagc cccctgcaaa cctgcggtga 212340
gtgataagga gttctagctc ccttctacta gatttattac taggaataga cattaatgca 212400
ttctctccag aatgcatatt actataactt ggaagactgt gtgagaaaat aaagcttagt 212460
atatatgatc tttaaaacta ttcttacttt ataatactac ctaaaatttg tgtgcaaaaa 212520
aaatttccta actcatcaag acagtatttc tctcaatatt ggctgacgtt catgcataga 212580
gttaagtatg tgttggagta gctgtcatag gatgaaaata agcatttcta gggcttgtat 212640
attatcacca caaaatgtga tgagataaac agacaaggtc tcattgaaat agacaacctg 212700
cgccccaact taggcttact cccgactggc tggtaactcc atcctggtat taccatcaga 212760
tcatgcagtg aggctggcct tgaaccacac atgttacatc aggatcatga ttccagctgc 212820
acctacatca gacaggttca tggtagggtc ctacagcaag gctgatccac tcactaaaaa 212880
gagaaattca ccctcaagcc agaaactacc tacaaggaca tcataattct cagtctgcat 212940
cgagtatctg cctgccaagt caggaactac agggacctta ctcacctgtc cagagccact 213000
gccttgcagt gtgaatgggc cctctgtgtg aatgggttcc cagagacttt ccaaggcaga 213060
tgcagaaaca gatactggca aggaagagat ttccagacct cacttctcta ggaactcttc 213120
cttaaaactg atctatcact ttaccttttt caccctcctg tccttattta cccctctctc 213180
agtttacaaa agaaaggtga aactctcact catccggaaa ctatggcgtg tattaatctg 213240
ggatgtaaaa tcctctgggt tgccaagcaa aaggaccgtt cccacctgga tttctccaaa 213300
aagagggtcc catggggccg tgccttatta tttatccagg tgacagtttt atggataact 213360
tccttcccaa agctatccac cttagattag gccttagaaa taacatgatt gtcacaaggg 213420
catgtggtta catgttattt gaattgaaaa ataaagccag actttttctg acagattcag 213480
ctgattggtt caacaatgaa aactgattta ataagtgccc aatgtcataa aattgaatag 213540
attggatggc gaagagtctc caatattttc ttaaaattat tttcaagcac aaacacaata 213600
atgctagaaa ttacattctt ctatttaacg tggtgcaaga gggatatagt tgctgatttt 213660
taaatataca gaagtgtttt tgttttttca attatataat gtacatgagc aatattttta 213720
agactatcag ggaatataga cacctctaac ttgcctaaca atggtgtagt ttaggggata 213780
cccacagcca ataaataata ttttactgca gcccagcata ctacagaatg agaggcagca 213840
ccttaaaact acctgagcta tatcaccttt tgaaactcag gaaataaaaa gccataattt 213900
gaaaaaataa aaaaccttag aattttttaa aatacaaatt tgatcttaga aagccatttt 213960
gttttttctt ctgtgcgaat ggtttcttca ttgcttctat gctagtttct gcatgaatta 214020
agggcaagtg caaaaaatca aactgatatt ttgggaatac ttatcttttc accactaatc 214080
gtagtaatag taatggcaat gataccatac ctgcattata atgtgatcca tcagttaaaa 214140
agtcaagaat agattgggtc catgtcaatg agtgtttgta ttgttttata ctgtttttca 214200
aggaacaata acagctaaaa ggaaaaaaag agggagaaaa agaatttttt ttnnaaaaaa 214260
aaaaaaggaa aacatttgca gtaacctcag gacaattgat tcgaataacc ttccacaaaa 214320
ttgggaagga gaaaaagctc tccaccactt tttcagtgtc tttttactgc ctctagggac 214380
tccgctctcc taggctccaa ccttgctgtc gattaaactc tgccaaggtt cctggataac 214440
ttagcagtgg ggtctcccag gaccatttgc attttgaaag aaggctttta aaaaatgaaa 214500
gggcttttaa gacaaagagg atgcagattc tgtcttttaa tagatgggtc tatcttgata 214560
taaataaaag aaatctggaa gagactgccg ttttagtgtt ctattcctct taactttcta 214620
ggtgttctta atttcataga attattgttt ttagtcttat ccaagaggtt cctcgccagg 214680
gaggtaagta acagcagtat agggaggctt gaaaaagaga cctgagctgg atcattccgg 214740
caaatatcac aggttggcat tcgtcctaat ttgtgtgcag atagagataa atcacaaaaa 214800
ccttaaatcc agagtgatat aagaatagga agtttttatg aaatattagc gtcttgagat 214860
aactttccaa aaaataacaa gtatttggga aaaaataaag caaccccttg acttaaggtt 214920
tctggaggcc tggctgtgta aacagacaat taatttcaat tctcagctct cttgtctatt 214980
ccatgggagc taggaggagg cgatcttcag ggcccctgaa gatctaatgt aggatactgg 215040
acttggtgtt aaatcccccc tggctgggat caggctctgc ttctctgtaa cattgaacac 215100
ctcactaatc tgaccctcag ttttcttatc taccttaaaa agattgtctg aataatctat 215160
tgaccaagca aaatttaata cttattccag taagggaaac tgccactttg ttttcataat 215220
gtctcagaag ggataagtga gaggtggata tatgtaaggt tttgggtttg ggtttcagtg 215280
tttgtaggat ggaggtctgt ttagactggg cagaattctt gatatgagtt gaggagtatt 215340
gaagatgcct ggtatggaca agtaatagtt actgttctga agacggcagt gctgtggttg 215400
aggaccagaa agagaaagcg acctgcctgg tgcctctcca ctgctttcca tgttctttcc 215460
cccggctttg gttcaacatt tgagtaatcc attctttaca gcgagtttgc ccttctattt 215520
tcattctcct tcttgacttg ggtgatctaa gagaagaaaa ataaatggtg accttatgtt 215580
gtcctcttca cacatgaaat ttattttttc ttttgtgcct ttcagatttt taaccagaca 215640
catgtattac ctttaacaaa caaatacaac tgacttttat agtggttttt tttttttttt 215700
aagtttggca ttgatcccca ttgggtagag tcttcacaaa aaatcctaat gaataccaac 215760
tatttgtagg tgactagctt gaccagttga gtgacctact gtctggagaa aggggttggc 215820
ccagcagtct atagttcaga taaatgaatt tgtgggaagt gcctgaaatc aacggtgaag 215880
ttgctgactg tttaacagct ttaccttcct ggacaagtca agtcatattg acgcagaggc 215940
tcagctctca gccctggaaa ttaagctgga gagctgccag gggtcttagt tctcaggggg 216000
gacccacatt tccaaatatc catcttccat ttgaaacagg atccacatta ttctagcaga 216060
aagtatgtta tatacattac tatgaacagg aaattccagc ccacagagga agaagtcttt 216120
cagagaggaa gggccctaga gcctgaggta tgtaactcac aggtagaatc acccatttct 216180
atgtataatc atctttaatt catgttcttg tacttttgaa aattaattga tgttttgaga 216240
aatataaatg aattttttga tatatttgag aactctttga tgagaaaaaa aaaagtgggc 216300
catttttaca gaacttgagg ctactggccc atgctaaaat gcagatgatt cacttggcac 216360
aaacaggcat ctgagttgtt gttttttaag agttatccga agaggatgtt ccactacctg 216420
aattataaaa tccaggattg ctattaaatt tattgttgtt ctgacttaga ctgtatcgtt 216480
cagctccact aaataaagct tcttttcaaa aggcagtgac cttttctctc atcaggcgaa 216540
ataaaaaaca aatagcaatg tactttcaaa agcatcacta cctttgttga gatttcctct 216600
aattcaaagc cctgaaatcg agcaaaaaat gcattatcgt tcctgcaagg ctgaatgaat 216660
agagaaatgt taaaataaaa caattaaaca ttttacatta gtttagaaag ttccatcctt 216720
gtgtggtttg ccatgagtac ctccttagtg aggacaatat atttataacc tttcgaatgc 216780
tcagtctcgt atgatgtttg cattctgaca tttggtttta taacgtaact ttctttgcca 216840
tgcacttata ttaataactg tttaagtctt aaggaatagt ctttagttta gtgctactta 216900
ctacagaaaa aaattaaacg gatttaataa aatacataga gatagttttt ctcttatcat 216960
tttaaaagaa tcatttaatg actataaata caacttatat actacttaca tatatatata 217020
ancactatgt atttattaat ctgcaattat gtaaatgaca ttagctggat tttttttcct 217080
gaaagaaagt gcccctaaga attcacgcat tcattcgaga aatatctctg tagtgtctca 217140
catgccaggc atttcacacc atttgctttt tcccatttgg aaagttctcc ttttataatt 217200
attgttccat aggttagcca gctattcagc aactttggat aaggtcatat tatttctctg 217260
cagctccgca ttctgggcag aactagcaag acaccctgta cactgctggg agggcctgag 217320
taccttacag cgntcccctg gacctttgag ctcagctcct cagtggaaag ggaaggtgct 217380
ggactgaccc tacagatgag agaaagaaac gacagagacc cttgcagcct agggtttgtg 217440
ccaacccctg agatagcagc aatttttttc ttagcatttg gtatgaataa ccccaagttt 217500
taagaaaata gagtatgaga atgaatgtca taaatattta tctttgcaat tctatgaagt 217560
ctgcctggtt attgttggct ttttcttaag attttcctga cacttaaaaa ctctgataag 217620
ttagttgaaa gactatttgg aaataagcta agtagataga tgaaaattaa ctgtattcag 217680
acaaccataa actaaggaga caagatgtgt agatatatgt ttttgcataa aacataaaat 217740
agtaaagatt taaaagtggc aaaatataac taaaacaaaa ataatatatt ctaatcacat 217800
ttttagatag tacctgattt gcggtaatca aaatatgtta tattttattg agatagcata 217860
tgatttatag attgttttta gttaagccca aaagtgatta taatagtgtt atggattaga 217920
agggctacta ttgagtttta ccaaacagat gtgggaagtt ttttttaata gactattttt 217980
tgagcagttt taggtttgcg gcaaaatgga gcaaaggtac agagatttcc catgtacctt 218040
ctgcccccac acaggcacag tctccccaac tatcaacatc cccatcagag tggtacattt 218100
gttacaattg atgaacctac actgacacat cactatcacg ccaagtctgt agctgacact 218160
agggttcact cctagagtac tatagtctat gggtttgaac aaatatgtga tgatgtgtat 218220
ctatcattat aacatcatac agagtaattt gagtgctcta aaaatcctct gtgctccacc 218280
tattcattcc tccctcccca caaaccctgg caaccaatga tctttttact gtttccacag 218340
acatagaaat gcacatagaa atacatagat atgtgtctcc atagacatgc attgatgttg 218400
atggcagctt tattcctaat tgccaaaact tggaagcaac caagatgtcc ttcagtagga 218460
gaatggataa gcaaactgtg gtacatccag acagtggaat aattattcag catggaaagg 218520
aaattagata tcatcatgga aagacatggt gtaaacataa atgcctgtta ctgagtaaaa 218580
gaagtcagtc tgaaaagtct acatactgta tgattctaac tatatggcat tctgggaaag 218640
atagaaccat ggagatggaa agatatctta acaaggtctt tcttttgtta ttttgtcact 218700
ggagagtaaa gtagtaaaga aaaatggaat acatatctgt tgaaaattgg ccaatgcagt 218760
tcctgcagca tttacaaaat ttcactttta ttgtagtaaa aagttcagcc tttgcattgt 218820
aatttgcatg tttcggagtc agtagttggg ttactaaatt tgaagcccag tgaatgatgc 218880
ggggttgcag acatttttta tgctgaaatt taatagatgc acgaaaggca tggatttctc 218940
atgagttaat ttttcttttt tgtttatagt atgggtataa gtgcgtaaga taaagacatt 219000
caaggtttat tttattttct gcctacnatg aagttctggt cgcccatgta tttacatgcc 219060
tttctatgaa aacattttta tgaataacac aagattggga agaactaact ggcagttgct 219120
atgaaagagc cagatccatt tactcaggat agggctgact cacaaaggag tggggtatcc 219180
actaggataa aaatgcagct ttttcctcat ctcagcaaga ggccattacc gacgagctca 219240
cccattagca tccgctgttg tctctacttg ggaagatcac attgtcactc tagtggagtc 219300
aggtaagagc catttccagg aaatactcat tatctattct cttagttata cagtcatagt 219360
tttacataat taccactgaa agactatttt cctgttgtct gctaatgtga ttacattaca 219420
ttaaccaacc ttggataata cttttaaatg tattacttgt ggagttcaag atttgagcaa 219480
aatccctcaa atgtaatgct ctgcaaagtt atactgcagt tcctttagat ggtaattacg 219540
tttaatacca gacggtattg tgtaatctaa cttttctata atgagtgaaa ataatttgaa 219600
gactcatagg cctctccctt tcattacaga atgtataggc tttttccaca cccttgttct 219660
gggacattaa gaaagaagac atggagacaa agaagaaaag aaccggggac cccctgctac 219720
tgtgtctata aacaactagt ggtgtttaaa ggctaataaa gctccaaaga tctctcttat 219780
aaccataatc tttgggccaa ttttaaaata ttttagatgg agaaatgtca agaaaaatag 219840
agacaatttc aagacatgat tctctttccc caacgtccat aaaagattat atatatatat 219900
atatatatnn nnggctgtca tataaggagc aattgaaatt ccacagcaca aaggcaatgc 219960
agggggaaaa aaaaggatca atctttcata ttattttttc tcaaaggctt ggcaagaaac 220020
caggggtaat atttttgcaa ctgggaatgt gtgtttgctg aagaatattc ccacatttga 220080
atcatcctca ggggtcctca tcttgtttta ctttcaaagg tagacagggc ataacattaa 220140
ccccaactgg gaaaaggaaa atgcctcact gtaattctcc tccagggaac aggaataaag 220200
ggattacata tgcctgcata atgaagaatt tcctcaccca gacaagacaa aagacttcat 220260
tatttttcac cagacacttg aagtcttgtg cctcccagtt gcagaagctg aggaggcagg 220320
ccagtttttt atatgaagcc actagatgga gttcctaaga aactggcctt ctagtacttg 220380
ccattgtgaa aagatctagg gaagatgtta aaaaccttgg tacctgacac tacccagtct 220440
ttcctctaag aaaagtgaga ctgtccctga agatcacagt attcttccag taaaattagc 220500
cttgccttta ctctgggaag caaataaatg agcattttct ttctgaaaat gcacctcctt 220560
tgtccttaca tgagaccaaa aggcatctca atactaatga aaaatgtaaa gtggcaaaat 220620
ataacaaaat ggaatattca agttcttctc cttctgggta ggtctgttac ttcgtaactt 220680
taaggatgta tgcatctcat ttcttatata aaatattgga agtctcaaat tttgtagtta 220740
ctcactattt cggcttgcaa gtattagatt cctgtaagag gaggtatatg gagactatgt 220800
tcccagcaac agatctgatc tccagttaaa gaaattgaac taagttcacc tgctacagcc 220860
tgctctgctc cctcttggct ttcaggcttc cctaatagct ttcacataca acatagagaa 220920
agangtatga agtttttagt cgtaagaagc aatgtctttt ttttttcatt actgtctctt 220980
ctagtgtagg tatgcagccc attattcttg agtggcatca tattctaact tgagataaaa 221040
ttaagattat ttaacttgcc cctttaaaag tatattttaa acacatgctg ttttgtccgt 221100
gattattttc atgcttcaaa agcagggagt gatcagaaaa gaaaatattt gatcttcacg 221160
gaatttcaag gttcattcat tccacaaata tttattgagc acctactgtg gataagagct 221220
gagaaataat catgaccaat tttaaagaaa accctactct cttagagctc tttggagcat 221280
ggcatatgtg acgaactaaa agaacaaaga aaatggcatg gagagaacga ggttcctcct 221340
ggtaaagatg agaccagaaa gggaggttag agggacacta aacggggctg tgcaagccat 221400
gctgctcgtt aggcttagtc tttttaaggc agtgataata accgcattcg tgatctattg 221460
ctgcaggaca aattactcca aaacttaagt gatttaaaca acacgttttt catctcacag 221520
ttttagtcag gaatctgggc atcccttagt catgtctctc tccaagctgc atgcatttgg 221580
acttgaatgg gaagagcccc actcaatcgc atggttgtta gtggattcag ttcctcgtga 221640
gctgtgatat gaaggcctca gttccatccg gtttgctgga ttcctcccca agtggaactc 221700
tccgtagagc acctcacaat atgcagcttg cttcaccagg gcaagcaagc aagatgggaa 221760
gagcaagtca gcgagagaga gagagagaga gagagagaga atgaatatgc tatgtagagt 221820
gttataacat ccaccatgac gcgggaaaag atacaacagg aaataatagc aactaaaatt 221880
caaagaaagc gttgatgttt ccaaagcact gtcacattca taatcatctt tacttcttcc 221940
agctccctgt gaagtcagaa ggaaaggcat tattgttctc tgcattttac atatgggaaa 222000
tggaggctta gagaaagcac atcacctgtc taaggtccca cagcttataa aagctgaagt 222060
cagaagtgtg tgcttttaaa gcttatgttt tctcaactca tcttctccat taggcttcca 222120
gacaaaggca gaactttcca tcagcagctg cactgcaggg tgcacttctt tgaaccatga 222180
gaggctagca agttagggat ggggtcacac agtccccacg cacctgccgc taccctccct 222240
actcacccct ccccaccttt tcacttactc attctgttca tcaggcagca tgagggccag 222300
aaactgaact tcctaggaat gggaggctga gtgataaagt ggtccctaat caactcacag 222360
cctagtaagg ggaataacta atgataacaa aatgccatga gcgttaaaca agcttggtta 222420
ataacatact gtaggaacat ggagtataaa acaagtcttt ttttgtgctt tcacataggt 222480
gaaatattca tttctcattt catgttactt ttcagagccc atttatatca gtctgtcatt 222540
atactgtgca tgttaaaaca ctatttggta tttatttcat ggtttgcctt actgtatatg 222600
cttatctata gtaacattgn tattcccttt aaaaaataat aaagcaaact tttaccatgc 222660
ttttgtatga acctgggcac attggattag agtatatgta acctcttagc aggtctgatt 222720
gtgtccaact gaagttcata gctttctgcc aacactgtta ttttccaaaa tagcaaaatt 222780
tcttacatga ccaacaaatg tgacaatggc ttaggctgta caaggctgtt tcattatgca 222840
gaaacgtcct atcatgggaa tctttctata cctgtctcaa tntccaggtg agctctaggc 222900
caaagggtca taaaacttcc ttcccattgc cttgctcctg catccaccgt ccaacctcag 222960
gtttataact tccatctgcg gtccttccct cattcaccag gaacctgtgt gtggccagtg 223020
gtctccttgt ataatggaat aagatttttc agaatgttct cgttagacat atttatatat 223080
ctgtagaaaa gttgcttcat gctgtttagt aaatgaaaaa tagtgattat ttagggtttg 223140
tttccaagaa tacatttaca ttcagtgaat ttgtatgatt tttcatagat attcaccata 223200
attatcttca tccacattaa aagcattttt aaggacttaa atatgacata tttagtaagt 223260
tcttatataa tgtattacta tataataagt tcttatatga tgtattatat aagttcttct 223320
gtaatatatg tgttatattt aaatacttaa aaatgcttct attatacatg tatcataaga 223380
gctgctattt taagtgcgct aagcacatac aaatcttttt ctcaaagatc ttaattctca 223440
gacagatggt aatcatattc aaagccattc aagaaatgca ttttaagaaa cataaatgtg 223500
aaaataatat gtaaaaaatg gcagaattgt gtgttcaggt gttgagcaaa tagagtatca 223560
ttagatttgc atatcataaa atcattgcat tttcaacctg tgagctatct ttcagagcaa 223620
ggctttctct tcattttacc aatgaggaag ttaggcccaa agatcactca actacttcat 223680
aacagtgtaa cttctggcac acaggtcttt taatcccttg tgttattttc ttgccactta 223740
tcaactatct caagggaatt cctgtcattc ccagttggag aaaattttct ggagaataat 223800
ttttttttct caccaaaatc attcacacca caggtgttag gccacccaat tgtcttcact 223860
cattagcaan atcagaaatt aacacaagtc cagttattgt ccaaaaagaa catgttttta 223920
aaagtcttcg tggtttaaac aagtggtaac tggttaccag taagctgcaa gcttcagatt 223980
gaggtttctg taggtaataa ttccaaaaac tgtgtgcttt tttttttttt ttgaactgtg 224040
gttttaaaaa caacacataa catttaccat ctaaaccatt tctaagtgta cagttcagtc 224100
gtgttaagta tgtttacatt gttgtgcata attccagctt tagttacttc tctttatgac 224160
tcatttttgc ttgtaagctt atgttttcct atcttcctaa agttctacaa aatctccttg 224220
gaacatatat ttaatcattc caggagcctg agtggacaaa tccttcccaa agggggttta 224280
ttagaaacct tgtttaaatt caaaaccgac atcatgattg cctgtgtgta ttaatctgtt 224340
ttcatgctgc tagtaaagac atacctgaga ctgggcaatt tacgaaagaa agaggtttag 224400
tgaacttaca gttccacgtg gctggagagg cctcacaatc atagcagacg gtgaaaggca 224460
cgtcttatat ggcagcagac aagagaagag agcttgtaca gggaaactcc cctttttaaa 224520
accatcagat cttatgagac taattcacaa tcacgagaaa agcacaagaa agacctgccc 224580
ccatgattca attacctccc accgggtccc tcccacgaca catgggaatt caagatgaga 224640
tttgggtggg gacaaagcca aaccatatca ctgtgggtag gctggccttc tgcttatggt 224700
gtcctgatag aagctctacc attatttttg gaaaggaggg aggaggcaga aggaggaggg 224760
gcaagagggg agctttctgt ttattttcca gcccttcttc atagctgtga tacttctgct 224820
ttgtaagtgt tcttgacgca gagcgtaaag ttcattttcc tttataatta tacgttattt 224880
gctgtatttt gtgttttcat tnnggtgttg nccntttaaa ataataaaag taatgagcac 224940
ttatgtgtta ttcatctcaa gtgtacaaac catgcattta tcttgggctc cttttttttt 225000
cctagagctt gcacccgaca gcgcatgctg agcggatcat ttgaggggca gcccgcaaag 225060
gagaggtcaa tcctcagcgt gcagcatcat atccgccaag agcgcaggta aatacttggg 225120
aagacagggc ttcagagact ctaaaaaagg ggggttttac aggaaatggt cgctgtacac 225180
agtcacggct gtcagccctg gctgccagac aggcatggct gaggaatcgc gttctatttg 225240
ctgtttgtta caataatgaa acacctaatc agatccaaag attcaaaaaa atctctactt 225300
cacaatcctt ttccttagag atggccaaat tctcaccttt aagatcagaa ggaaaaattc 225360
tgaattttgt tagatgggat caaagacatt tggagagagt ataagcttct gctatgaaaa 225420
gaaatcatag gcatttgtgg cgttgtagca gaaaaagtgt tttattttga ttttatcatg 225480
gtcactgctt gaaaggccag tttgatcttg agatgtatta accagtgcct gtggttgttt 225540
taggtcacta agacatggat caaacagcca gaggatcagc aggggaaaat ctcttgaaac 225600
tttgactcaa gatgtaagtt ttaagcaatg ctttggattt cagaaacgtg attatgaaaa 225660
tgtatttaaa tgactgctta gacaatgccc agtgtctttc tgctgcattc ccatgtctcc 225720
ttaagacttc ataccagagg gaatcaggaa actcaggata tgaattatgt agccaagtat 225780
cagaagtaac tgttaacagc agaaaactcc agtcatccca cacaaagcac atgtcttagt 225840
taaaatagta acacaaaagt gtcattatca gttggatttg acttgaaatt aaagacattt 225900
taagcattgt atataggatt gatttgcatc attgactttg aatattcact gagaatcgaa 225960
tattctagaa tctagatcaa gggtctataa tttcagggct ttatatatta ggaagtgaaa 226020
ttttatttct agaagaattt tcctgtcaag gactacctag tatttcccag gaaagctttt 226080
tgcttttaga ctctaagtca tggatttatt tactggctct ataaatagtt atcaagtgtt 226140
tgctctgtgc tgggttctgt tttaaggaac gaggagcagt ggggtaataa gatagactca 226200
gtgccctcct ggagcttaaa ttttagaata ggagacagat aataagttca taaaaatata 226260
atggaatttc tggagtgatt tctttttatt ttccatcatc tcttcattac tgtgacagat 226320
ttgctttata atgtaaagta aaatgaagtc atgtaaataa atcaaaggtg gggatttggg 226380
ggcagggaat tttagatacg atggttatcg tagacccatc tgcattatcc cggagaccca 226440
aatgaaatga aggagacatg aaaaaaatgc agagaagcca agcgttatat ggcccagcag 226500
ctataccatg caaagattac aatgaaaggt ttgggaaatg catattaaat aaccgtaatt 226560
atgaagccct ggtaaaaaga caggcgttag gttgaatctg gatgaactgg cttaaaaagt 226620
aatcttgaat gttcagagcc aaggatggca cttgagaaag gagggctagc aagagaaagt 226680
tagcaaagcc ttggggttat ttcgtttttc tctttttcac cacttatctc ttatttcttg 226740
agcttttgga gtgcttgcat actacatctg ctttcattct gtagaaactg ctgttttagt 226800
ccaagtacat ggtttttatt aagtgttccg ggcaaaatca agagcgagaa gttggcaatg 226860
agaacacctg atatcaccaa taccctatag acatggttnc tagttggcac agagnctctg 226920
tttaccacca tgatttttaa tatccatagc tctatctgat tggctaccat attgttgaca 226980
tagaattgcc atcaaatcca acatatggcc tgcgcaactt agaactgcag agtcagccat 227040
attgcacgga gaacattttc aggtgaaaag tcaaagaggc aaccctcatt caaagcgcct 227100
tcaatatgtt tcaaccgaaa tgtacaacct acttaagaat caaatcagaa catgtctttg 227160
aaaataatgt gtttaaacat agacagcaaa ggccctattt gaatagtctc agtgccggag 227220
cttacttctt cnnagagact tcctacccta tttttcatgt agaagtatag taaaatccat 227280
ctcccacctt ctccatagca aaatgccatg gggttctgat catttccaat aaattcttat 227340
aatgtctttt ctcccacaaa ggggagattt aaattagaga attttaactt tttcacttat 227400
tcggaatgat agcangacac agataattaa gtctaaggag tgctttctgt aaaatctact 227460
gagttactgg aactctggcc ttgcaccttc catggggtcc atctaaaggg ctgtgaaggg 227520
cctgcatggc ctgctcacct ctcttagctt tacccacact ggcatcctgg ctattccaca 227580
tgtagacacg ccaggcctgc tcctagctct ggaagaacac atttctgtag tcctaccaca 227640
gcctgcaccc tcacctcctt ctagtctttc ctcaaatagc accttcatat tgaggtctac 227700
cctgacctgt tcatttaaaa tcataatctt ctagcctgtc tgtgtctctc tatgcctttc 227760
acccattgtg attttttaaa aaatcggatc actaagcatc ctcttacata cttattttga 227820
attatttttt atctgtctcc cactgactag aacatcctat gagaataagg atgttttgtt 227880
tccacttgcc atatcctgca cactagaata gtgcctggca cataatagga tttcaatcaa 227940
tatgtgctga atgaattact ttttagagga acaaatactc ttgctatgaa gactgtggcc 228000
attaaatatg tgcatttaat cgtatacata ttttatatac tgtaaattta tatatttaat 228060
gtaagtatat acatttactt taaattacat atttaatgta aatatatacc tttagtataa 228120
atatacataa ttataaatat atacatttca tatagatata tatttattgt aaatatatac 228180
ttagtataaa tatacatatt taatgtaaat atatacattt agtgtaaata tacatatttg 228240
ttgtaaatat atacatttag tataaatata cattgtaaaa tatacattta atataaatat 228300
ataaatatat gtttaacagt aaatatatgt aattaatatt tatactttat attgagggag 228360
atattagttt taagtttttt aactgataat atattttgca ttcaaaaccc tcctgtttta 228420
acacaccccc tgttaattta ntttcntagc attccaatac agtgagatat agaaatgcac 228480
aaagagaaga cagtgaaata aagatgattc aggaaaaaaa ggagcaagca gagatgaaaa 228540
ggtacaggtt gctgcagtgt cccatggctc tcattcggga atggcaaaat ttcccttagc 228600
ctcattctcc catgaatttc tccttcaagg aaagtgcaag aagaggaact cagagagaac 228660
cacccatact tcgataagcc actgttcatt gtcgggcgag aacacaggtt cagaaacttt 228720
tgccgggtgg tggtccgagc acgcttcaac gcgtaagtac acttcatttc agccaggtgt 228780
ttggcctgag ccatgcaaac agcaggggtg ttgtcatatg aagaagaagg aacgtgtaat 228840
cctaatgggg tcacaaaata aactgcggac taattaatca tgctgctcct ctttgctgaa 228900
cacccgacca ggtggaaaac aaaggtcgca agtagttaac atttatagaa aactcgcatt 228960
gataaaacac aaaacagcca ttttcgtttg tgcattttaa cagtttcctg atacacttat 229020
atcggcatta ttaactccat attttatttt ggaagtactg agacaaaagg agactaaagg 229080
acatggtgaa aggaaggtca ttgtccatgt cttccatgag gcttgtagtt cctttgtggt 229140
aaaaatacct caatttgttt tttggagaat aacgtaaagt tgattagtgc tttcattacc 229200
aactgttata agaaggaaac ccactgttca ctgtctctac cctaccaaca tggaagaaat 229260
gtgtaagaag ccgtaagtag agtggacatt gaagacacta gttgtggaca cctaagccaa 229320
gtttgacagg caacaaatgg atgaaatgga tttttgtcaa gcatacctgt atnagtccat 229380
tttcatgcca ctgataaaga catacctgag actgggtaat ttataaagaa aaagagattt 229440
attggattca cagttccaag tggctgggga ngcctttcaa tcatggtgga aggcaaaagg 229500
cacatcttac atggcagcag acaagagagg gaagtgaaag cagaaacccc tcataaaatc 229560
atcagatctc atgagactta ttcaccacca caagaacagt atgggggaac cgcccccatg 229620
attcaattat ctctgactgg gtccctccta caacatgtgg gaattatggg agctaccatt 229680
caagatgaga tttgggtagg gacgcagagc caaaccctat cagtaccttt aagtaaatat 229740
tctgaagaca ttaagagtca tggaggaaat gagaaaactt tccatgttcc cattatgtag 229800
ttggagtgtc cctgatgcca tcgtttaagt aaattgattt ctttgttatt aattagtagc 229860
atatgataat cactatctgt tatggactga attgttcccc ctccacaaaa tccatacggt 229920
agagtccaaa ccctcagaac ctcagaatgt gactgtattt ggaaatagga attttaaaca 229980
ggttaattaa aatgagatca ttagggtggg ccctaatcta atatgattgg tttccttaag 230040
agaacatttg gacacagaca tatacagaga gaagaccttg cgaagacacg tagggagaag 230100
acggctctcc acaagtcaag gagacagccc tggaacaggg ttttccctca cagccctcag 230160
aaagaaccaa ctcagctggc atcttgatct tggatttcca gcctccaaaa ctatgagaaa 230220
ataaacttat gttgcttgag ccatccagtc ttaagcacca gtggtacttt gttacagcag 230280
ctcgaggaaa ctaatacaca ctattataac atttcaggga tggaagagac ctcagggacc 230340
actcggtgtc atttgtgtgc cccctccttc aacagaggag gacatttaag cgtgcagaag 230400
ttgagggctt tgctcaggga cccagctact acctggctct ctcttgattg ccagactatt 230460
gttctttctg ctgttctata aagactttca caatttaaag caactgagtc acaattatta 230520
aaatcttcca tgagttttca aagtaaagga agaaaatgcc attttggaga ttgatttgat 230580
cagttcttga agtacgtttt ttttatcttg aattatcctg ttggctgcct gtaccttaac 230640
atctcatggt taattctcca cttcacttag tgtgatgtaa tttccctttt atcagcaagg 230700
cagctgatgt tgaatacaat tgatgaagac tctgttgtaa ttggggacac atacacaaag 230760
actgtaagca atctcattga cagtgctcac aggcttcctg aaagtagaaa caacgactct 230820
cccttccaag aaattctaaa taaatcattc taccacatca cagttaaatg cagggggaag 230880
aagtctattt aaattatgga gtatttaatt aaataatctt gaataactaa cattcttgaa 230940
ctattaaggc aaagatttca aatgagtgtt tttaaatgaa agtcaaaact taattttgta 231000
ctacccatgt cagaaaattc tgaacaaagt cacaaagtct aaaatcaagt attttgagaa 231060
atataaaact ttattttcat aagcatcaac tgcaaattct ttggattttt tctttcatca 231120
atgttctctg acctccagag ttacctacag ttaacatatt ttataatgga cattgtagag 231180
aggctgtaaa agagatttta ggtagatgag atgtttgcaa atatgatttt tagcaagtta 231240
aaacatgctt gctttgttgc agaattttat atatgtgttc tcttacagat ctaaaacaga 231300
ccctgtcaca ggagctgtga aaaatacaaa gtaccatcaa ctttagtaag catcaccaac 231360
ttcattttcc atgcacattt aaagttttca tgtactattt tatgctgcat acaacgatta 231420
aaattctctt ttattttctt gctatatagt gctatgaaat agatgattgg ggaatgatgt 231480
ttttaaaata ccagtcatgt tgatagagcc acagaagcca tcatctctaa ctcttagaag 231540
cctttcctgg aacctttatg tttctcaatt ttgtttggtc tttggcagtg atttgctggg 231600
attggtcact tacctggact gggtcatgat catcgtaacc atctgctctt gcatttccat 231660
gatgtttgag tccccgtttc gaagagtcat gcatgcacct actttgcagg taccgcttac 231720cgctgcaaaa tctcagctta caactaggag gtaaaatact gacctgctgt ttttccgttc 231780
attgtaacca aactgccttt tgcccgtttc agattgctga gtatgtgttt gtgatattca 231840
tgagcattga gcttaatctg aagattatgg cagatggctt atttttcact ccaactgctg 231900
tcatcaggga cttcggtgga gtaatggaca tatttatata tcttgtaagt ctttgcttat 231960
tgcctaaatg aaaaatgtaa tggttttgta aaatctcctg catttcttgg tataagcgca 232020
agaggtatga gttacagagg cttagattcc ctaaccgaat tcttaaatgg actctagagt 232080
agttcattat atgcaaataa gggccatgca tgtaaaatct aaattaagag catcataaat 232140
atctatggat agttatattg ttcaaataca ctaatcacaa ttttatgtat gaatgagaca 232200
tacattaata aggtctaaca tggcaaatct agtttgcatc ccacaaacct tatggcttct 232260
atactaaaaa aaaaaagttt gcctcatata aaccatgtta ttgattatga gccccttatt 232320
gctgaaagca aactaaagtg attgtgattg tatctctctc ctgattccat tgcataaaat 232380
acctggctat agcagttgcc cattcaactg tctagtaaaa ctcgctggaa aaccatagaa 232440
atgggctcag agaatttttt atttttcctg tatgtccaag gaggcatgaa atcaatgtct 232500
ttgcagagac aacaaggaga attgtgatca ttaacaagta gcatgttgca ggtcattaat 232560
aaaatagcag taaccttgat aaaaggaatt ccagccagat cgacatcagt ggagcctcca 232620
gagtagtaag ttaaaagaag aggcagaacg cactggtgta cacacacaca cacacacggt 232680
gtggacaccc ccatttcttt cctgcataca catgatgact ttcctttgag gtacctagca 232740
agtctagatg aggtttgttg tttaaagtta acagatggca cgtacaacca gtgagtggaa 232800
tctctgctaa atgaaaagtt gtggccagtc ggctgtcaga aaatgtaaat agtaggggat 232860
gaattgtata aattccagag atcatttgtt cccctttagg tgagcttgat atttctttgt 232920
tggatgcctc aaaatgtacc tgctgaatcg ggagctcagc ttctaatggt ccttcggtgc 232980
ctgagacctc tgcgcatatt caaactggtg ccccagatga ggaaagttgt tcgagaactt 233040
ttcagcggct tcaaggaaat ttttttggta tgtgagaatt atcctttgat tccagttcac 233100
agtagtccac ctctaatgca gctaatgagg gaaaagtgag tcttgcttat tgaggtcaat 233160
tcaatagttt tggttattgc cagagggtaa tggaggcact aacaaaacac aatgcacctt 233220
caaacacttt actcatgggc acttctggcg tatgagttta tttaattcac ctaaagagaa 233280
gcactctgag atttgaaaga gttcntatct gctgactctt tcggtactaa cctcttgact 233340
ctaattccta ctctgggttt tagtttcctc ccatctgaaa atgaaggata agaagattca 233400
acacngtgta ctccacaaat gggattagga attcatgctt ttgggctcct aatctcattc 233460
tgtgtgttcc tgaaataata tagcacagaa tttgtcttta gatctcagga gntgttaaca 233520
taaaacaact ttaaaaatgc aacatatagg tataacccac ttcaattaac ttcagcatta 233580
cagtaatgag tgattacaaa ngatgattga gggggcaaaa cgtactttnt agctgggcaa 233640
acattgattt agggtcttct gaaaacaagg tcagagataa aacaacaaga aagaggctca 233700
ttgttcacaa tctgttacag aaagatcttt gccttacaaa acagtgatca aaagtttttt 233760
ttattattga tgaggtctgc ttgtgcatga gaagcatgaa ttaatttaca taggcttgtt 233820
ttgtatcttg ctttctagag acttacctgt gatgagaaaa cagctgtagt tgtagttgac 233880
acaaatgtat tttaaagata gattgtgatg ttactagagg tatatatatc attactgact 233940
ttttttttct ttttttttga gacagaatct tgctctgtcg cccaggctgg agtgcaatgg 234000
cgcaatctca gctcactgca acttccacct actgggttca agagattctc atgcctcagc 234060
ctcccaagta gctgagacta cacgcatgtg ccaccactcc cagttaattt tttgtatttt 234120
agtagacacg gggctgcacc atgttaccca tgctgccctt gaactcctga cctcaggaga 234180
tccacccacc tcagcctccc agttgctgaa tttctttttt aagatgggtt taaaaattct 234240
tgttttcttt atgcaaagcc ataaaacagt gactcttcac acagctggaa ttaaaagaaa 234300
atatcacctg actgctaatg tatatgaatc ttttgatcaa taataaattt tagaggagaa 234360
tttgtgcctt tccctaatgg tggtcagtgt gattttagta cacttaggta tatgtttagg 234420
ttattcaacc agtgcagttc acttgttcca tattttgccc tctgccactc gtctctgctg 234480
agaccaaaga agtcagccag cagagggagc atgagttaat taacagattt gctcttcagg 234540
actgaattct ctcctctcct ctatgcatag aacattctcc taacgcacac cttcacagtt 234600
acaagacagc taagccactg tcccgctcat ttgtgctctg ctaataaaaa tatgaatcca 234660
ggccgggcac agtggctcac gcctgtaatc ccagcacttt gagaggccca ggcgggtgga 234720
ttgcctgagg tcaggagttc aagaccagcc tgaccaatat gatgaaaccc tgtctctact 234780
aaaaatacaa aaattagctg ggcttggtgg cgtgtgcctg tagtcccagc tactcgggag 234840
gctgaggcag tagaattgct tgaacccagg aggtggaggt tgcagtgagc tgagattgca 234900
ccattgcact ccaccctggg ggacagagtg gcactccatc tcaaaaaaaa aaaaaaaaaa 234960
agaaaaaaaa ataaatatat atatgtccat ttgggaaaaa atagacaaaa tataattact 235020
taaacatttt tttcctttgt tccattaaat aaaaaagatc aaggtgttga ttttaaagtc 235080
agaaaagttc aagccatatc aaaaatacct tattccattt tcttacatga aattcatgtt 235140
tccatttaaa aaattcaaag cttgttaatt ttctcctttt gaccttccag taaggctaat 235200
tgtgtgacct atggtggaga agttaaaata tatcatcaaa aacccatgat ttttatacaa 235260
tgttatctta gaagtcctat ttatgtcact gtttaaacca aacctaatat ttagtcttta 235320
acaagagatt taacatttca tcaatttctt tcaggtctcc attcttttgc tgacattaat 235380
gctcgttttt gcaagctttg gagttcagct ttttgctgga aaactggcca agtgcaatga 235440
tcccaacatt attagaaggg taagatgtat ctttctgtct tttgaaataa aaattaaggg 235500
ccaagtgtgg tggcatgtgc ctacaatcct agcactttgg aatgccaagg agggaagatt 235560
acttgaactc aggaggtcaa ggttgcagtg agctatgatc tcaccactgt actccaacct 235620
gggcaacaga gcgagagccc tgtccctaaa aagaaaacaa aataataata aggtgtttac 235680
actcccttgg caagcatgtg gtaccagtgg ctgacaagcc tagtttaaga actccctata 235740
aaaccctaag aattctcttc ccacaaaccc ctttttgctt aagcatgtga tatgtctctt 235800
ctggctagaa aggttaataa gatgaaaagc acacctcaga gaatgtcact cttccctcct 235860
attccagtgt caacccactg ttgacaactt gagygtggtc acccaagatt ccagctgttt 235920
acagctgtaa gctttggata ctttcccttg aggtcttagc taacttgatc cttcctttgt 235980
tgtcacataa gactcatatc agcaaacagc cccatgcaaa aatgtccaag aagcagcgtt 236040
tggttctcac cactttttat tgcttcccca ctctcagctt tctccccatt agaaangcca 236100
gtgcctttac attagctcta gctgcccaga atctccctct ttatgacaac caacaaggac 236160
ctccacaaag acccaaactt gaatacttgc actacggcgt ttctttctct ttcttcagtc 236220
attggttata agggaaggct agctgctgta acaagcccaa tatttcggta gcttcacata 236280
atgaaatgta tatattgcat cttggatcag ttgcaatata tacatttgca atatatacac 236340
tatatacagc tctcctccaa atgaccactc agggactcac atgccttcta tcctatgccg 236400
ccaccctttg ccatgtcttc agagccttct tcaatgagct ggagataaca gtggagagcc 236460
atctccaact gagtgggctg tgggagaatc tgctccaccc acattcctct gtaaagagca 236520
gagatactgc aaggggggct ggaatttagt tgtgtgctcc agaaaaataa aagggggaca 236580
cagtttggtt aataattaga caatttttgt aatatcataa agtgtcccat tctcttagga 236640
ttcttatgtt acaagtaaat tcataaagta aaccaaccac tgctgatgta taaactagaa 236700
aagcattttc tctttgatcc caataaaatg atgcctcagt tcctaaatgt atatcttcaa 236760
aaggcctact agacctgaac tacattattt atttctagca aatatggcta tctagtatag 236820
attttaaatg atacaaattg ttctctaatt gtgacaaaat acaggtaaca tctttgttca 236880
gccaaaatac attataaatt atattaataa tgagaatttg aaacaaaggc cagactggga 236940
gagacattcc aagagctttg atacacctga gaagacagaa caaggaatgt ggcctgacgg 237000
tcatgccgta tcaaattagc tgataaagaa agtgacagag acctgacgca ttcatccaca 237060
agcttgtgtg tggaaagaag agtgattttt gatccacact gaacagaggc cagaaagata 237120
ataacacttc aggatgaagc ctgctaggaa tcttggatga ctcagtatat taacagtggc 237180
ctggccgggc gcggtggctc acgcctgtaa tcccagcact ttgggaggcc gaggcgggcg 237240
gatcacgagg tcaggagatc gagaccatcc tggctaacaa ggtgaaaccc cgtctctact 237300
aaaaatacaa aaaaaaatta gccgggcgta gtggcgggcg cctgtagtcc cagctacttg 237360
ggaggctgag gcaagagaat ggcgtgaacc cgggaggcgg agcttgcagt gagccgagat 237420
cccgccactg cactccagcc tgggcgacag agcgagactc cgtctcanaa nnaaaaannn 237480
nnaaanannn anaannanna aaannnnana aaaccggggg ccctaaaaac gggggggttt 237540
tactttttcc ccttatcccc ccccaaagtt aaaaattggg ggggaccgcc ccccccaaaa 237600
aaccctaacc cccattttta ggggcctttt ttcctttttc caaaaacagg ggggttttgc 237660
caaggtttaa atggaaaccc taagggaacc tccccttttt aaaagccccc ccccccaacc 237720
aaaaccttta aaaaaaattt ggcccgggaa aacggggttt aaattttttt gtttttcaaa 237780
aaccaaaaaa aaaaggccgg ggccggggcc aaaaacccct taaagaaagg ggacccccgt 237840
taaatttttt ttgaaaaact tccccccttt tttctaaaaa aaaaaataat tccaaaaaag 237900
gggggaaagg taatcccccc acttttaaaa cccccccctt tcctttaaaa aaaaaaaaaa 237960
t 237961
<210>3
<211>47841
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>exon
<222>3895..4001
<223>外显子28
<220>
<221>exon
<222>9611..9731
<223>外显子29
<220>
<221>exon
<222>9816..9914
<223>外显子30
<220>
<221>exon
<222>15776..15869
<223>外显子31
<220>
<221>exon
<222>16382..16488
<223>外显子32
<220>
<221>exon
<222>16697..16771
<223>外显子33
<220>
<221>exon
<222>17934..18053
<223>外显子34
<220>
<221>exon
<222>23644..23712
<223>外显子35
<220>
<221>exon
<222>24928..25076
<223>外显子36
<220>
<221>exon
<222>25913..26006
<223>外显子37
<220>
<221>exon
<222>30767..30899
<223>外显子38
<220>
<221>exon
<222>31561..31676
<223>外显子39
<220>
<221>exon
<222>34044..34201
<223>外显子40
<220>
<221>exon
<222>37493..37643
<223>外显子41
<220>
<221>exon
<222>39652..39801
<223>外显子42
<220>
<221>exon
<222>41563..41680
<223>外显子43
<220>
<221>exon
<222>44131..45841
<223>外显子44
<220>
<221>misc_feature
<222>45842..47841
<223>3’调节区
<220>
<221>allele
<222>31646
<223>99-79310-29:多态性碱基A或C
<220>
<221>allele
<222>42373
<223>99-79311-50:多态性碱基G或C
<220>
<221>primer_bind
<222>31618..31635
<223>99-79310.pu
<220>
<221>primer_bind
<222>32080..32100
<223>99-79310.rp补体
<220>
<221>primer_bind
<222>42324..42344
<223>99-79311.pu
<220>
<221>primer_bind
<222>42704..42723
<223>99-79311.rp补体
<220>
<221>primer_bind
<222>31627..31645
<223>99-79310-29.mis
<220>
<22 1>primer_bind
<222>31647..31665
<223>99-79310-29.mis补体
<220>
<221>primer_bind
<222>42354..42372
<223>99-79311-50.mis
<220>
<221>primer_bind
<222>42374..42392
<223>99-79311-50.mis补体
<220>
<221>misc_binding
<222>31634..31658
<223>99-79310-29.探针
<220>
<221>misc_binding
<222>42361..42385
<223>99-79311-50.探针
<220>
<221>misc_feature
<222>26,350. 351,353,356..357,366..367,371,383,389,392,396,399..400
404,411..412,416,421..422,435..438,440,442,446..447,450,455
457..459,461,463..465,1805,2175,2328,2402,2561,4048,4661,6659
6799,7509,7534,8289..8290,8294,10663,10789,11052,12083,12904
13017,13916,14116..14117,14680,14971..14974,17093,18448,18669
18767,18808..18811,18838,18971,18985,20714,20903,21355..21367
22901,24093,24112..24115,24171..24173,24868..24869,25356,25797
25879,26062,26234,26824,27130,27254,27437,28745,28781,29278,29475
29526..29528,29617,31152,31790..31791,31796,32011,32262..32273
32296,32415,33656,33719,39140,39142,39343,39944,40945..40947
41948,42166..42169,43371..43372,46709..46720
<223>n=a,g,c或t
<400>3
gtttaaaaaa aaggtgaagg cctctnggct ttttttcccc aaattttttt gggaaaaaaa 60
agattttttt ttcccccctc cacaagggcc caaaaaataa aaacccttcg ggagaaaccc 120
gcttgggaat tttggggggc tccgggaatt taccaagggc ccggcccggg ggggggggtt 180
ccccccttta ttcccccccc ttttgggggc caaggggggg ggtttccagg gttgggggat 240
taaacccttt ttggttaaaa aggggaaacc cccttttttt ttaaaaaaca aaaaaaaaat 300
aacccggggg gtgggggggg gccccttttt cccccttcct tgggggggtn ngncannaaa 360
aagggnntaa ncccgggggg ggnggtttnc antaanccnn aatncccccc nngccnccca 420
nncggggggg aaaannnnan ancccnntcn cccanannna nannnaaaaa aaaaaaaaaa 480
aaaaaaaaaa aaaaaaaaac agtggcctaa gagcatggtg attttacatt atccactcat 540
acccagccaa agctgaagat tgatggtgac agcagccagc agatgagcat agacacagat 600
ttcatgatgc atttatcctg tttcctagag cagtgaggtc tgtgcgaggc tcagatggaa 660
agcctaagga gactcagcca tcatagagag caccagcacc aagcagaacg attgaaaaga 720
aattggcacg gtgagacggg gcttgagtct ttttgtcttc tcaaatccaa acataagagg 780
ccgaggccga ggccaaaaac gccatgagtg aaggtgacgt cggctgaagt tctgttggag 840
aacttcagcc catcttacta aaagaagaga taaatccaaa gaaaggggga aagtagatac 900
accaacattt agatcacaca cagttcctgt taaagacaac gaagcttcag ttgctgcgcc 960
catagtttcc agttgggaag atgtgttttc ttgtatgagg ctgagcactt cctccctctg 1020
ctcctttgtt tgttgtctta aaactcaaca gatgtcatga gatcaatata gatatagata 1080
tggagcctag gactttgtca ccaaaaccct gtaaacaaac gctgaggata ccttttgaca 1140
aatagtcatt aaatgtcagt tgtgtccaag gcactgtgat aggtgaaatg aaatgtggaa 1200
gggaaacatt aggaggtcct tgcttctgtt ttgtggcatt ttctgtccaa tcagaacgtg 1260
tttcatgttc aagcaacagt aatataaagt cagcagtttt caaaagccta tgagaagcag 1320
aaataacatg taatctatga tgtcagcatg ggaaattgtg cttccaactg ggagtactgt 1380
actgggaggg cttcagggag gaggtgggat ttgagatgag caggaaagga ccttccaagg 1440
agagcaagca gtgaagaagg acacggagca tacaaagaag ggtcacagtg tagaggcagg 1500
gaccgaacaa ggaggaagga gcatgggctt cgaaatcaca gcttctgaga ttggaatcct 1560
acttcaggag aggtgatggc ctggtctggt cacttaatcc ttctggaacc tatttctgcc 1620
ttgaatgctt ctcacacaat gatattatga agattagatt accttgttta tgcgaagtac 1680
ctaacctgat ctcaacagtg agtgttagtt tcattcccgc ccatgtagga aaaaactgaa 1740
gaacaaggcc agaaatgtaa gttagggaga gatcctcaag tgcctgaaat gcctggctaa 1800
ggggntttgg aatttcgttg atgagaagtg agaaaccaca aaaggttggt aagaagagga 1860
atcagacaca tcctagtgcc cacaaagtac aaagcaccat tcctagtgca gtttttgtta 1920
cccatatcct aatgaggata tccattccta atgaggaaaa caggtgtaga aagattaaat 1980
aatttgtcca aggtcaccca cctaataagt ggagaagcag ggaactagtg tccaggcacc 2040
ctggcttttc accaagatac cagactgctt catgcaatca aaggtgggct caggtgggtt 2100
caggaagaca aattggaaaa ggcagtgagg ccaaatatgt caagggacct ttatacaata 2160
cactacaaca cagcnctttc caaataatgt tctacataaa aaggtatggt tatggaaaga 2220
taatcgcaat gtagttttag ctgaaaaaag tgggcgatgg aagaatataa actttatgag 2280
ctcagataca tataggaaaa aagactggaa ggatatactc caaaacgntt cattgtgttt 2340
gtctgtggca attgtgggta agttttcttc cttttatttg tccaggcttt ataaattaaa 2400
gnatgtgtta tttgcattaa aatattctta ttttaaagaa tcatgctggt aatccagaaa 2460
gaagtaacgt tggcattact aaactcatcg tagtaagaat ggagacttgg gccaagaagg 2520
acagggaaag cccagggaac cctaagcttg atgctgggct nctgctggga tgctggtcca 2580
gggacagaaa ggaggaggcc aagaggagac atggcttagg gtcaaagagg acgtgaagca 2640
gattaaaatg gaatttttgt tgaaatattc aaacagtgat caagaatttt accatctaca 2700
ccttgaaccc agaaaagaga tttaggttca aaatatgacc atcatagcca aagaaacaaa 2760
aataaccaaa gggagaatag gaaatgagtc aaaaacttcc tatagatgtt taatttttaa 2820
aaccttttta acagctttat tgagatgtaa tccacatacc acacaataca cccacttcaa 2880
gtgttcaatt caatggtttt ttagcgtatt catagagttg tatacacgac agccactttt 2940
agaacatttg tatctccttg aaaagaaacc ctatgtctct taactattac ccccatccct 3000
ttagcctcca cctcaagacc taaacaacaa ctaatattct ttttgtctct atagagttca 3060
ctgttctgga cttctatatg aataaaatca taacatatgg tcttttgtga cttttttctc 3120
aattagcata atattttcaa ggatcctcca tgttgtagca cgtatcagga cttcatccct 3180
tcctatggct gaataatatt cacttgtatg gttggaccac attttgttta tctgtttgtt 3240
caaaaatgga catctggatt gtttccacct tttggctatt gtgaataatg cttatataaa 3300
cattttatac aagtttctat agggacatat attttcatct ctcttgggta gatacctagg 3360
agtggagttg ctggctcata tggtaactct gtgttagtgg tttgaggacc tgctagaatg 3420
ttttccaaag tggttgcacc attctacatc cccaccagta tgtaagggtt ccagtatgag 3480
gattgcgatt cctccacatc ctcgccaatg cttgttgtta tctgactttt tggttatggc 3540
tttctcagtg ggtgtgaggt gatatatcat tatggttttg atttgcattt tccggatggc 3600
agatggcaca tgatactgag catcttgtcg tgtgcttttt ggccatttgc atatcttcct 3660
tggagaagtg tctactcagg tcctttgctc atttaagtaa tattctcagc atcgattttt 3720
aactgcctgt ctccaaagtc tttgttacta tttgctgggt agctgtccac atcactgttg 3780
ttagataaag ggcttttggg attccgtgaa agaagaaaga gtttcctatc ctttatcttt 3840
tctgagttca ttttctgacc aggtttcccc tctcctcttg tttttctact ttaggaagat 3900
tgcaatggca tattcagaat taatgtcagt gtgtcaaaga acttaaattt aaaattgagg 3960
cctggagaga aaaaacctgg attttgggtg ccccgtgttt ggtaagtata tcataaaaaa 4020
atattctgaa gaatggtgtg tttgtcanta taaggcttta aataagtatc atatggcatg 4080
taactaaaag tagttttgct agagatgtta aaatgatctt aagtcataca gggcgaagcg 4140
ctagattata ttggaagata gaaataaggt aaaaaataag agagcaagta gtgcaatgag 4200
ttctgtatag cttcatgaaa ctagagaaat attatctcag tatttttcta atacttcaga 4260
aatatgtatc tggattcaaa tgccttaaaa aattaggctt aacaggattt tctgtcaaat 4320
taaaactaaa cttatcctga gtttatatct ttaaaggagg atctgatgtc ctcataatag 4380
aaccctaaat cataaagcta tttccatttt aaaacccatt tacactgaag gacttccatt 4440
attgaaacac tagagaggaa taatcagtga cacagttgat tgcttctaac tttcccttta 4500
atattccttt ttctttaaat tgagttttca aagcacttag atcaaagcta gaaataccta 4560
gtaccttctt tcttatttta ttaatgacca tgagtgaatc tctcagtctg tgtcattggt 4620
gaactgagtg ttctgtcacc ttcatttgtc ctttaaaatt nttatctgtt ttttaagttt 4680
tcttttagaa aatgtgtaag aataacaact gagtcacagc acctctgctt ttgtcacaat 4740
tgatgttctt ttctaaatgt caaaactctt taaaaggaac agcatttcac ccagctgtac 4800
cctagcactc actgttacct ctctttggca tttttctcat atgaaattcg cttttatacg 4860
taatccaata gaatgcatat tgggttttta ttttttaaaa tatccaagaa ctgagaaaaa 4920
ggattcattt ggggtatgtg gcttcagctt ggagagagag gaatgtgaga catgagaata 4980
tcctggcccc actgctgact agaaaagccg tccaatttcc attgaaataa aaattaaagg 5040
agcataaaaa ttttcttcca tgagataaaa attaattata gcataaagtt atttatgtta 5100
taatttatta atttttatta attcaaagat aatatcatgg aagtaaatgt agtcaggaat 5160
agagaacact ggggcatttc atttccttca ctatagagaa aggtagaggg tgcctcccac 5220
ctctgccaag tgaggtaccc cagggggatc acttaacgtc agagatgggc agggcaagaa 5280
gagagactct tgtggccagg ctgctcatca ccatctggag agcagggtta tctggtgttc 5340
ctggagagcc cagtagtcac tgcctagggc cacatcatct gagtcctctt gagccttgcg 5400
gcaaagggct ttgtgctggg aaagggtaac cccctccaaa gggtccgtag gtgtgtttcc 5460
aggagccaga cttgagaatc acccagagac tgcacactta caggagaaaa ggtgcaatga 5520
ggcactcctg ggctggagag ggggttcaaa ctcttgaaca cctatggcca gaatccaatt 5580
gtatcagatg cacaagactt aaactccatt cctccattcc tttcaacgac atcccacctc 5640
agtcatgtga gaatctcgtg gtggcctgaa gaggatgagt ggaagtgaag aaagtggcca 5700
acttttcttc ctttcctcaa accggggtcc ttgagctgct aaggatggga ttgttatatg 5760
agttatagga tcagttggat gtaaaactga attactgaaa ataaccaaaa agctctggga 5820
cctccccaag aattcagaca gggagctgga acacacttga aggtagtgtt tggagaaaag 5880
taaacctgcc agttgtgccc tatagcactc aacctagtcc ataaaaccag ctacatggga 5940
tttttaaaat caaagttaat ttaaatgcaa tattttatgg aaggtattat taggggtttc 6000
aaaggcaatg ccattctaga agcataagca aatagccagg cattccttga acatcatcac 6060
aagtgctctt gtccatttct ccaggataat gtgacttgga ttgtagtgaa atagacacct 6120
tcgatctaat aaatgtcatc tgtaaccatg ataacttttt acactttcct tcttaagtaa 6180
gctaatcaag agttggaagc tgaaattttg taattttata ttggctaaat tatgattaag 6240
aaaataacat atctaggaat acactagagg aatgctttgg taattataat taggacataa 6300
atatgcacta attcaggaga cagtctagtt tcaatattct ctcttcagat taataaatgt 6360
actttcttct gaatcactca gacttgatga gtcacctcag taaaaaggat taaacatatc 6420
atggattata aatacagtgt gatttatttt aagaggaggt ctggaatata ggaaaatggc 6480
atgcatggga gaaaaactaa caaagtattc aggcttataa taaatgtatt tattgagtgc 6540
ttgctcttca ccagctagta tgcttgtcac tgtggtaagg ccctgaataa gcgatggccc 6600
ctacccctta ggagcttaaa gtctagtggg aaacagaaaa taaaattaca aataatttna 6660
tataatatgc taagggcttt aatgctgcac agagaagccc ctaagcttac ctctggctca 6720
cccgaaactc atctccatgt aatgttaagc tacactgtga tatgttctag gaagaaggtg 6780
atcaggtttt atagggtcna aggcccaaac aatttggggt accaacatct cagaagggcc 6840
tgtacaaaag aggggtccta ccccttaggt ttctttggct tcatcatata cctgcctctg 6900
attcctacag aaaggctaag ggtacaatgg acacacagga gaagcaccta accccaacta 6960
tgcagggcca aagagaagga ccagatgaga agacacactg gttacctttt gaaggacaac 7020
caataggaac tagccaggtg aagggggcag ggtcagaggc aggtgaggag gaaagtctag 7080
gcataggttt ggtattacaa gttaaggcaa ctctatgccc aaagctcaag gcaaaaagcg 7140
ttggggtgct gtaggaagta cgacgtttct gatttctttt aggagagatg gttgtgtaag 7200
atacagcatg ccgtttttgg acaaagtctt tttctgcatt tccacatcca agggcagacg 7260
ctcagtcacg tcttcagggt gcccccatgt tccccaaggg aagagcagct ctccctacct 7320
tgatcttggg gggccttgga gcacctcctc tgggaggtaa aaaactgaca aaattatgtg 7380
gtcagatcta atgtcttagt tttctgaatt ggacaggcaa gattacaata tttcacaaat 7440
taaccagaaa aaatgacaac cttttcaatt caaggaaggg tagcaggtaa aaatgacaat 7500
aatagatgnc atttgggatt tattgaagga ctcngtagtt acaggtaaag tttcaaactt 7560
tgcaactttg ctagcatgaa gaaagcataa gaaaacactt tacatgatta aaactgaaaa 7620
agacttattt ttttaatgtg ataaattctt ccaactattg aagtctttga tgctacattt 7680
tgttttactt ggtttagtta gaatattttt cacatattct aacttctaga agatctagaa 7740
cataacagta gtttcagtgg ctgcaaattc agctaagaaa gcacttctac aaaagaaaat 7800
gagcaggtaa ggaagtccaa caccggctct gagaaccggt tcacttgctt gtaaaaaatc 7860
cttattcaag caaactgtgg catctgtaga atccttataa cttctgtcta ctgtaaaata 7920
tatgaaattt agtggaaaca tcccaaagga aagattgttg gaagcatcca aaagaatata 7980
tttgtacttt catacataaa aaaatataaa gcagaattcc aaaatatgca tttctgagtg 8040
gggcttttgc actatattaa agaccgtctc cactaatcag ccctaagccc ttaagaacaa 8100
atcagtttca gtttaatgtt ttcttcttat atcctcatct atttaatatt caaaaaactt 8160
atgaaggcac atcttgtgat tgtctctata gtttaaaaaa cataaaagat ggtagaaaag 8220
tacagaacca gattttccct agagcgttgc ctgtcctgag ggttaaattt tgagaaatga 8280
gctagcagnn gggnaaaaaa tgatcaaaat ataatttaaa taggctccaa ggggcctact 8340
ctagtcagtg gtccggagct cagttcttca ttaaattcaa gaaatatagt ccatgatttt 8400
ccagtgtttg gttatcaaaa tcttaattat ttaaaattag cctctaataa gaaggaaaga 8460
gggggaaaag ccactgaaag cttcttctat taacaacaaa aatgttagct aagaaccata 8520
acaattaaag aagatgcaat ctagtaaaaa ggatcacttt tataattggg aagagaaaag 8580
tataaccatg ttaaaagaac aagaaatgag acatccctgg cccccacaga agtgggagct 8640
aaacagtggg tacacctcga cataaagttg gaaactctgg acagcgggga cttcaaatgg 8700
gaggaggaag gaaggaggtc ataggttgga aaaattacct gttggattct gcgtgcacta 8760
tctgagtaat gggttcatta gaagctcaaa ccccagcatt atgcaataca cccatgtaac 8820
aagcctgcac gtgtaccccc caaatctata agaaaacaga aaatgaataa gccaatgagt 8880
ttcaggaatc aggaatcagc ggtggaggta gaaagcatac cacccataaa ggggaccaga 8940
ctaagagtcc actgagaaga ctcagagtta ataagaaaaa atccaactgg aagagagtaa 9000
tttggaaaaa tacatactac aagcaaacac ctcttgccgt ctcagtgacc tctaaatgca 9060
tcactacttt ccagccctgt gttcaccatg atgacacaaa gtgaaataaa gtgactaaat 9120
tctactctac actttctata ctaacacagg caattgtaat ttatgccttt cgaaagattt 9180
tcagttacaa aactatttca aaatccacat ccaaaatcca atgcttcttt gtgcaaatcg 9240
ataaaatcat ctgtccagtc ctcagggtaa tcaggacaag gtagaaatgt tgcagaacct 9300
ctcaagctag aactagagct gttttacatt gagatcaccc catcattacc taatgaacac 9360
aatcaattat aacacattga tgcattgtta tgatttagca aacgaatgcc atatagcgta 9420
aaaatgtgtg tgtatacata tacacacata tgtatgtgtg tgtgcacgca cacgtgtgtg 9480
tgtatatatg tgtgtgtata tacacacaca cacacatatc ccacactcat gactggaaag 9540
ggctacagat atttgccttc gggtgctgct tattggaatt tcacagaaca ttcctgtatt 9600
ggaatcgcag ggcgaatcct cggaacttta atttcgacaa tgtgggaaac gctatgctgg 9660
cgttgtttga agttctctcc ttgaaaggct gggtggaagt gagagatgtt attattcatc 9720
gtgtggggcc ggtaagcgag cacatcgaat cctttgaaca cttcaagagc agctttcatt 9780
tgttttgatg aataaccata ttttccttta tgcagatcca tggaatctat attcatgttt 9840
ttgtattcct gggttgcatg attggactga ccctttttgt tggagtagtt attgctaatt 9900
tcaatgaaaa caaggtaagg atttttggtt tggataccac agggtttagc cttttctagc 9960
cactcacttt gagctatttg tttcttttca cacgcggcgt gaagccgctt taaactgtaa 10020
tgtgactggt gtaaataatc tctataactg ttttacaagc tccctcattg ctgcttttca 10080
gacacattat ttaagagtac agttctcttg ctaaatttac ccttttggta acagtgtcat 10140
taattcaccg acaactgaga ggcgcgtctc ctattgttca aattgaaaag aaagatgggc 10200
agcaagttat taaaatacaa tagatgaaag tgattcgcta attacaggta atattacttt 10260
cactaaatgt aaattgtatg cttctgtgta actcagtagg tgaactcagg attttgatgg 10320
gggtgagggg agtctggtag aaatttcaaa atcctaattc acagaaaaaa agattttgtg 10380
gcagggcatg gtggctcacg cctgtaatcc cagcactttg ggaggccaag gcgggtggat 10440
cacttgaggt caggagttca agaccagcct ggccaacata gtgaaaccct gtctctacta 10500
aaaatacaaa aattagccgg gcgtggtggc gcatgcctgt aatcccagct actgggttgg 10560
ctgaggcatg agaatcgttt gaacctagaa ggcagaggtt gcagtgagcc gagatcacac 10620
cactgcatcc agcctgagca acagagcgag actcaaaaaa aanaaagaaa aaaaagaaaa 10680
aaagattttc taatttcata tgaacttgac atactttgtg aactcgggaa gcctgttgag 10740
tttgtaacag ctctaatgat tagaacaaag gctcacaaat gggaaaatna caatgtagtt 10800
tcctatcaaa gtgtgagttt ggggaagaac attctattag cactccttgg agaggggctt 10860
gctcatctag gcacttgagc tatgccctct attgtttgag acgcagtctt tggaatcata 10920
gtaagggaag tgcatgcagt ttttgagcac acactgtgta ctaagatttt acatattcaa 10980
tcaattctca caactctcaa atgcacggtt gcagaaaaag caatgactag tctggggctt 11040
ataaggtgtg anaaacaggg ccagaattca gaattggtgc ctattaccgc aggctctgtg 11100
attcttcgaa ggcatgagta gaataaagtc aaccttcact ctgcattaag ttgaagctag 11160
atctgcctgt aaagcaccgt gctgctcgat gttattcatg gctaggactg attcccatgc 11220
gttcacatca gagctcttca gtttgtgttg ctacacatgg gactgtatct gtcattcact 11280
gtcctcaggc tcaacgtgag tggtaccagt tagccagtca attgacacct ttgatgtgtg 11340
gctaatgagc atgtcatttc attcaggctt tcaaagggtg agatttaaaa attcctcttt 11400
tgggccccga ctctacttgg accctcagaa acatgggatg ttagagacag aaagaacagt 11460
agtgatcatg tcacccagcc ccttatttta ctcctatcac attcattaac gagatgcttt 11520
gagccctaca gtgttgagtt taataccaag cagaaagagg aagaaggatc tttttagatg 11580
cctttgagcc atgtaatgca gcagacactg agaattctag aatataagca gaagctaatc 11640
agtcaattaa caggagagtt taggcactgc ttgcccagaa caccgttaag aagccgtctg 11700
agcagacacc tgatttcagg aagattagaa tgtatcacag ctcacaattc agcaacatac 11760
atagaacaac ataaaatgtt cagtaactgg aaataaatgt ataattaatt gcaacacttg 11820
agcttagaga agtggctgag gttagcagaa taaccaggga ggtctccatc cagcactgta 11880
tttatgttct gcaggtagga aagagtaacg tggcctgttt gggggatctg gggcgtatgt 11940
tctatcagct caaatgggca cttaaagaaa ggagaaattg acaagaaatt atattaccaa 12000
gctttacaaa cttgatttgt taattggaga tatcaattgc taaattatgt gagcctttta 12060
gaaaagtttc tttctctgca agnttttttt ttttttttag aaagcagctc atgagctgcc 12120
atctaacagc atttatacat tattcaatca ttcaacagat gtatttgagc atctactagg 12180
tgccagaggc tgctcttgac actgaggacc tagtgaacta acctaaacac taaacacaga 12240
aaagttattt gccctcatgg agcacacatc ttaatagtca tacccaaagg cacataggta 12300
aatttccaaa tgtagagaca acagagatag aaaatgaggg aatctttagg gtacaattca 12360
gaatcatgca aaaatatgtc ttcttttgaa aatggaaacc tctttaaaga gttccaagtc 12420
tatattagta atatagattt ttttctgatt tctctactat gtaagacaat gtgtttgatt 12480
tattaaccta acttgataat aataaacttt cagaggtttt tatatattaa tgatcagatg 12540
atatctccat gcctattatt cttttagatc ctttcagagt tcaactttcc aaaatttttt 12600
ttatgtataa caaagtaatt acattagtgt ctatggtggc cagagaacaa gtgtttgctt 12660
ataattagtg agaaaagtgg tttagcaatg tgattatcag aaaagaacaa ttttaaacaa 12720
acactattat tgggaataaa tgatgtacta aagaatgaca aaataatcac cagaaagata 12780
tagaacttcc aaatcccaaa atgtacaaag caaaaattaa acaagttgta aaaagaagct 12840
agaaaatcca aaatcatagt gaaagatatt aacatatatc tcaaaaaatc tcataattca 12900
gagnagaata aaaggaaata tgagatttga tacaataaac acaatcaagt gaatgtataa 12960
ggaaaactct aattacaaca atttgagaat gtgcattatt ttcaagcaca aaatgtntct 13020
cccagaaggc cataattacc caagaattga taatgtaaga atgttttctg accataatga 13080
aaacaaaaac aaaaaaaact ctacaatttg gaaatattaa gacaatacta taaataattt 13140
atgagttgaa gaaattataa tagaaaatca caaaatattt acagacaaaa cattttatag 13200
cgtcatatac aaaaactaat gaggtatagg taaatcagta attacaaata aatgtatcat 13260
tttaagtgta tatattaaag aagaatcaca agttaaatat taatatgtca aatatccaaa 13320
tcaataaatt ataataaagt aaaatcaaat aaagtagggg ggaagaaagt aacaaagatt 13380
aggacacaaa ttaatgatac agaaagtaag gaaacttgta tagcttctat aatattcaag 13440
aataacaaaa gctgggtttt ggtttttttt aaatcaagtc aataaacctc taggaaggtt 13500
gaacaaaaat aaaaacatga aacaagaaag taagctacaa tcattaaaag agtgtcagta 13560
ttgttatagg tatagaaaat tagacttaca gaaaaaacta gaaagaccca gcagggaccc 13620
atgtatgtag aaaacagaag cagctcaaca aattagtgca gagggtggtg agaccaacaa 13680
ggagtggtgt tgggagtatt gattgtattg atgtaaagag ctatgctgag atctctacct 13740
cactgcatac tcaaaaatga attccagatg aattaaagac ttcaatatga aaagcaaaat 13800
ttaaaccatt tttaaagcat gtcagcattt attttttatt tgaatttcag ataagcagca 13860
aataatgttt ttgcctttat tatttttaat cagcgcataa ttgtacatat ttatcnggta 13920
cagtgtgata tttcaattca tgtattataa tgtgtaatga tcaaatcagg ataattagca 13980
tatctatcac ctcaaacatt tatcactgtt ttgtgttggg aacattcata atcctctctt 14040
ctaggtattt aaaaataaac aattaattgt tgtcaattag attcaccata tattaccatg 14100
gaacactaaa atttannttc ctccattcta gctgtatttt catatccatt aatcaacatt 14160
tgactatccc tattctagtt cccctcccca cccctagtaa gcatttgttt tttgccctgg 14220
agtagttatg gatttcatcc cattagccac caagtgaaat ctataaagga aaaaaattat 14280
aaactcgatt atatttaaat taaaattttc tgaatgacaa aagacactct aagcaaaata 14340
aaaatacaag ccaagactaa gagaaaatat gtacaactta cataattgat aaaagattag 14400
tatccagcat gtataaagaa tctctacaaa ccattaaaaa gtaaatatca aaatacaaaa 14460
atgagcaaag gatatgaatg ggcaattcac ataggaagat acaagcatca ccatttacac 14520
acatgcaaat gtttcatctc gttaatatta aaacaacatt agatacattt tcacacctat 14580
caaaatggtc agattacaat gtctggcaat atcaagtatt gcaagaatat taggatatgg 14640
taacacctgt gtattgctgg taggaaattt gttttggttn ttgctctttg gaaagcaagt 14700
tggcaacatc tggtaaatgt aaagatgctt aaattcctag accccatcaa ttcttctcct 14760
agagatcaac aatggagaaa ccctcataga tatttactgt gagacagtac atggatgctt 14820
attgcagcat tggttatagt ccataaatca aaaatgaata acttcggata ttcgtacagt 14880
ggatggtgtt tgtgagcagt taaacaaatt agatttagta atctagttgt atggaaagta 14940
tactgttcaa tgcagatata aagaaacagc nnnnataatc acatgttgga gtccatttct 15000
ataaatatta aaaaattcag aacaaattct tacgtattga ttcatgcgta agcacaaaag 15060
tctgaaaaca tagtaaggag gatgcacgcc tgaagggtag tggttagctc tgggtaagga 15120
aagggagagt ggggtttttg tctagttttt aaaattacac ttcagctttt atgataaaat 15180
ataatgcagt gcagtgcaat acaatataat ataattttaa tcatatgcat tttaatcaag 15240
tactctatta tacagaatat ggaattccat ttaggcagtt atcacagcac tactttctta 15300
aaatgcaaac tctatgactt tgtatctctc aaaaacagtt ttgcaattgc acatattaga 15360
cattttttaa agaaagacaa cataccctta actggaagcc acagcattga caagctataa 15420
ttttgctgct atgaaatgaa aggaaactaa ctactattag tgagtatcct tttttgaaaa 15480
tgtaattatg tagaaactcc tctttacatt ttcccaaacc tgaatattac acatctccaa 15540
agatacaagt cgaaggctgc tgaattctct ctgaaacacc tggtcatcat tttgggaact 15600
cctcccaaga ccaactttga gcattctgac catgtttctc tcaccaccac ggttggaaga 15660
acatggtcag tgcaagccct cacatcagtc ctgtttgtct cggcacccca tctgccatgt 15720
tcttggtgca agcacatgac aaaaggcctt ttcctgcttt cttttgtctg ttaaggggac 15780
ggctttgctg accgtcgatc agagaagatg ggaagacctg aagagccgac tgaagatcgc 15840
acagcctctt catcttccgc ctcgcccggg tacccaaaat gctctgattt tattcatgtt 15900
gggcactagt gtgcacgatt ccccaggagt ctcagattta aattaaaata ataatcgtga 15960
ggccgctggg aggttgtgca taaggtaata cagaaacagg ctccaaacca cagatctctc 16020
cataaggcta ttaaaatcaa ccacccaaag gctgtgcttc agtgctctca gactaagcct 16080
taatgaaaaa atgaattttt aaataaaata tatttgctct tgccttttaa aaatataagt 16140
gaaatgtatt aaactgacag aaattgaatg atgcacttct ccttccaata tagacggcat 16200
catgcactgt cgttttgaat attcagagcc agccattgct gcaaaaacac ctcacaatag 16260
acggaactgt ttggggagaa aaatgtaatg ggttttaaga taagcattta agaaaataaa 16320
cgacaagaaa gtaaatgtga cctgtgtcta aaatgccctt gcccaaacct ttcttttcta 16380
gataatgatg gttttagagc taaaatgtat gacataaccc agcatccatt ttttaagagg 16440
acaatcgcat tactcgtcct ggcccagtcg gtgttgctct ctgtcaaggt acttcgtttc 16500
accctaagac tccgggaatg aattttgtat tcactgctac atccgagagt atcacaagct 16560
gctatatgca ttcacggtta tgttcttggg tgtaaaaatt aagattcact gtcaatggca 16620
aagtgggcag aagaggggca agcctgtatg tgtccgatgg acgtgggcaa cgactcgtgt 16680
gctgtttctg ttgcagtggg acgtcgagga cccggtgacc gtacctttgg caacaatgtc 16740
agttgttttc accttcatct ttgttctgga ggtactgtaa tgagtcagct agctctgggg 16800
gaatctgtgc acagttttaa agtaaatcag cctccctctt tgatgccact tactctcctc 16860
tctgtgttcc attgcctttg aagtttgccc ttaggatatt tcctacttaa gcggttctgc 16920
ttaactcgaa caaagacatc actttatcca tcagattttt ctaactacag aaatgctgct 16980
gtcgattgtt gtgtctgaac attggcctgt ctagttatgc gagttctgat atttagaggg 17040
aatggtgcaa gccactataa ttcattgact caaattgcaa tagagacgca aancaagttg 17100
gcccagacaa ggttatttta acatgtgatt ctcataatat tgctttccag ggcagtcttc 17160
ctgaaataca agcagattct tattttgccc tacactggtt gatgtttccc aaaatctatg 17220
gccttttgct taaggaagaa aaatgtccca tgatcagaac tagtcataaa acgaagagga 17280
aagagtgtag agaacacaga tttgtaagct acttagcttc aaaaataaaa tcatatatct 17340
tggtaataaa ctcttatttt tagttactac atgtttacaa ttattcttta aatagatagt 17400
ataaccgagc atgctggctc actcctgtaa tcccagaact ttgggaagcc gacgtgggtg 17460
gatcacctga ggccaggagt ttgagaccag cctggccaac gtggtgaaac cccatctcta 17520
ctaaaaatac aaaaattagc caggagtggt tgcacgtgcc tataatctca gctactcggg 17580
aggctgaggc aggagaattg cttgaacccg ggaggcagag gctacagtga gccaagatca 17640
tgccactgca ctccagcctg ggtgacagag cgagactcag tctcaaaaaa taataataaa 17700
taaatagaca gacagacaga tagatagtgt aggcacgtgg cctaaaagga aacctcaaag 17760
ggcattaaag tgtttgtctc attttcaatg gaaaagatac tgtgtccaca tcaaataatt 17820
taaaattttc ttcatttgaa aaaaatacat acacataatg catctcaagt taatacattt 17880
aaatatgtac taaacactct ctctgtttat tttcttcttt gctttttctc caggttacca 17940
tgaagatcat agcaatgtcg cctgctggct tctggcaaag cagaagaaac cgatacgatc 18000
tcctggtgac gtcgcttggc gttgtatggg tggtgcttca ctttgccctc ctggtaagca 18060
tagaagtcaa gttgatttca gctgattatt tcagtttggt tcagttctgc tcagtcctgt 18120
ttccagtctc attttactcc acatcaacct gctctgaggt gttagatgga cctccctaaa 18180
gcccagcttt gactgtgatg ggctctcaga catgcttgtg tctacatgta cacaccccca 18240
cactcttcac acaggcaaaa cctggcccct caaagaccta gacgatgcaa gctagaaaga 18300
gaaggacctt caagatcttc tggtttagcc cctcatttta ccaaagggga aaacaagaaa 18360
gagagaggaa gactgcaaca gagactgaga actgtccaaa ttcacacaag ctagtatcag 18420
aagactatag tcctgttttc ctgttttnct cagctgaaat atagcatttg ttccactttg 18480
ttataatcag tatttcacaa tgtgattctc aagtgcttcc actgtttcat tttctataag 18540
acatttagcc tccacttctc taaagcatat gattctccat ctctatatct gtgttctcac 18600
tattttacct aaagtgcctt caccctccat tcagtctgag atcccactca aaatctgcag 18660
ctatgggtnt actgaactgt aatctagggc catattgtcc aatgaaaata aaatgtggcc 18720
acagatatca cttaacattt tctagaagcc acaataaaaa agtagtngtt tagaaaatat 18780
aactattaaa ttgttaataa ttattaannn nataaataat aattaattat ttaattangt 18840
aatatatttt attatttaaa atatgtatta attaaaagat gcattatgtg tatgtgtatg 18900
tatatatttt tattatttat atagttatat attatatatt aatatattta attaaataat 18960
taatttaatt nattatataa ttaanttaat aattatttaa ttatataatt atttggttat 19020
aattatttat gtataattat tatttatata cttataacta ttatgtatgt aattatactt 19080
atgtaattat aattatttat ataatttaat tattaacaat ttaataatta tattttctaa 19140
actatatcca aagtattatt attttcatgt gtaagcaata taaaattatt gagataagta 19200
gtatccttgt atctgtgtgt gaagtctttg gctgagtatg tatcttacat ttacagcata 19260
tcttcattta aattgccaca ttttaagtgc tcagtaacca catgtggttc catgtggctg 19320
ctggttacca tgttggatag cacagctctg gaagatatgg gtcctagtct aggttccacc 19380
attttccagc cttgactaat ttatttgcct tcaatgatcc tttgtttcct gctctgaatg 19440
gccaatataa cttcataatc cacctattcc ctctggcatt atgaagatca agtgagataa 19500
tatatttgag gctttcttga actagaaaga ttatacaagc ctgtaggcat tattataatt 19560
accttctttt tgttagtcat acttgatctc atcccaagga atattatcgg tttttccctg 19620
tttccttcta tccattctcc catcccctta gtgttagaga catgctggga aagactcatt 19680
tacacatcct aaagggcttg ccttaatacg agacgctgtg ctcatgaaca tagtgagcgt 19740
ccttcttaaa ccagtggtta ccttcagcat caggggctgt atgaagccta ggtgagctct 19800
cagtcatcct gaagtatttt ctcagcaata aatggttctc aattcctagt acaagacaca 19860
gtactagtaa ctgagaagaa tgtaataagc aaaacaaata tagttgctgc tcttgtgaac 19920
cttatatcct agaaaagtag atagatagtc atcaattgct cacaaatcta tgagtataat 19980
gactatgatg agggagatga aggagagcct gtgttcctgt gacaacatag ataatagtgg 20040
gagatggctt catcagagag gtcttggaag acatccccaa gggagtgatg gctccatctg 20100
taggataagg ggagggcatt tcaggtagtt gtccctgtga tggaaagatg acagagctgg 20160
aagaaggata gatacatagt actagcatag tacaagattt ggatgggtaa gaaggtatca 20220
gacctcttag gaccttgcag tccaggtgaa gaattcagat tctcatccta aaaactattg 20280
gttgtcatta cttccaaaac ataaagaggg aaggtatctg caatagatct ttagctaaca 20340
tgggaagaaa aggcagcaag gcccatgttt ttcctttctc cagataaaat ttgtattagt 20400
cccttctcac actgttatga agaaataccc aaaactgggt aatttataaa ggaaagatat 20460
ttaattgact caaagttcca catggctggg aaggccccag gcaacttaca atcatggtgg 20520
aaagggaagc aaacacatcc ttcttcacaa gggaacagga gagagaagaa tgagtgccca 20580
gcaaaggggg aagtccctta taaaaccatc agatcttgtg agaactaact caatatcatg 20640
agaacaggat gggggaaact gcctccctta attcaattat ctccacctgg tccctcccac 20700
aacatgtgga gatnatggga actacaattc aagatgagat ttgggtgggg acacagttaa 20760
accatatcat tctgcctgga cccctcccaa atctcatgtc ttcacaattc aaaatacaat 20820
cataccctcc caacagtccc cgaaagtctt aattcattcc agcattaact taaaagtcca 20880
agcccaaagt cttatctgag aanaggaaag tttctgctgc ctatgagcct gtaaaatcaa 20940
aagcaagtta gttacttcct agatacaatg ggggtacagg cattgggtaa atatacccat 21000
tccaaatggg agaaattggc caaaacaaag gggctatagg caccatgcaa gtccaaaatc 21060
caatagggca gtcattaaac attaaagttc caaaataatc tcctttgact ctgtcttata 21120
tatatccagg gcacactgat gcaagaggtg ggctcccatg gccttgggca gctccaccat 21180
tgtggctttg cagggtacag accccctcct ggactggtat tgagtgtctg tggcttttcc 21240
aggcacacag tgcaagctgt cagtggatct accattctgg agtctggagg atggtggccc 21300
tcttctcaca gctccactag gcagtgctcc agtggggact ctgtgtgtgg actcnnnnnn 21360
nnnnnnncaa ccacacattt tccttccgca ctgccccagc agaggttctc catgagggct 21420
ctacccccac agcaaacttc tgcctggaca tccagttgtt tctatacatc ctgtgaaatc 21480
taggcagagg ttcccaaacc tcagttcttg acttctgttc acccacaggc ccaaaaccat 21540
gtgtaagcca ccaagtcgtg gggcttgcac tctttgaagc atcagcctga gctgtatatt 21600
ggcacctttt agccatggct ggagcagaag ctgctggaag gcagggcacc atgtcccaaa 21660
gctgcataga gcagagggag cctggggccc acccacaaaa ccattgttcc cttctaggct 21720
tccaggcctg tgatggaagg ggctgctgtg aaggtctctg gcatgccctt ggggacattt 21780
tccccattgt cctggtgatt agcattcagt ccctcgttac ttatgtaaat ttctgcaact 21840
ggcttcaatt tctccctagt aaataaggtt ttcttttcta taaaaatcat cagactgcac 21900
attttccaaa tatttatact ctgcttcctc ttgaacactg tgtcacttag aaatttattc 21960
taccagatac cctaaatcat ctctcttaaa ttcaaagttc cacagatctc tagggcaggg 22020
gcaaaatgct gccagtctct ttgctaaagc ataacaagag tcacctttgc cctagttccc 22080
aataagttcc tcatctccac ctgagaccac ctcagcctgg acttcactgt ccatatcact 22140
atcagtattt tggtcaaagc tatccaacaa gtaggaagtt ccaaactttc ccatatcttc 22200
ctgtcttctt ctgagtcctc caaattgttc caacctctgc ctgttaccca gttccaaagt 22260
cgcttccaca ttttcaggta tccttatagt agccccccac tctaagtacg aatttactgt 22320
gttagtcctt tttcatgctg ctatgaagaa atacccaaaa ctgggtaatt tataaaggaa 22380
cgaggtttaa ttgactcaca gttctgcatg gctgggaagg cctcagaaaa cttatgatca 22440
tggtggaagg ggaagcaaac acatctttct ccacatggtg gcaggaagaa gtatgagtga 22500
ccagtgaaag gggaagcccc ttataaaact atcagacctg gtgagactta atcatcacaa 22560
gaacaggatg agggaaacca ccccagtgat tcaattatct ccacctggtc cctcccagga 22620
tacatgggga ttatgggaac tacaatccaa aataaggttt gggtgggaac atagccaaac 22680
catatcgaaa tgcaacctaa agctactgag tccaagcaaa agtcaagtag actctctaat 22740
cccagataac ctcagagagg aaatcttaaa cccaaagacc aacttccctt ttctgcctaa 22800
ttgcctttgt tcttctccaa gaacctcttt ggtcttggaa ggatgctcat tctccaccgt 22860
attttgcagt ggactattgg gaaggaaagt tccccatcca nggatgctat gtgcacacat 22920
tcatgtgctt ggacctcacc aaggatctca ctggaccccc ttcgcggggc ccatctgtga 22980
ctgtcatcat ttggctaggc aagcctcctt gagagtaatc acactctggc atcggctgaa 23040
tgtcaaggtt gttattgcag ttatagctgg tgggatcttt gtttctcaaa tgaagctttc 23100
ttattcataa agtgcagtca tctcttcctg ctaatcacac ccttgaaaaa agagctggat 23160
gtgttcctga gcagggagga cctctctgaa atcagcttag aggaatgagt gtatgtttgt 23220
tcttcagtgg tgtctagaat ctgacttctg gcaatctttt ccaccatcag ccctttctct 23280
ttgccaggat tcctttacct cctatgtcag ttgaccttcc tatgttgcac tgttaccctg 23340
tgtttttcac accctgtatg caaaagagct ggtcaccatt ttatgtaaaa taaatttcaa 23400
aatacagaat ttagctgagc aaaacagaac ccgaagtttc atttgagact gaattttaaa 23460
tctaatattt attcatgagt ttttgcagtg accttttcag cacctttttt agatcacttt 23520
cttataataa tttacacata ttaagctaat tattcagtat acttcacaga aggcttaaaa 23580
aatggaactg taacaagatc ttttgtgcaa attatgagaa gctgtcttct gtttaaattt 23640
cagaatgcat atacttacat gatgggcgct tgtgtgattg tatttaggtt tttctccatc 23700
tgtggaaaac atgtaagtac attgttaaga atcttatctt aaaggtcata tatgtgttaa 23760
tgaaagaatg gtgattaatt gattacagcc ttacctcggt tatttaggga tgtaatcaca 23820
aattactaga catcataagt caagattaac aaatattaaa cattgttaaa tgaatcagta 23880
gcttagttat cattcgatgt gtttcctgcc atttatgttg cttattcttt atattcaata 23940
attaagtaaa ttatttaaat ttattaattt aattaattaa agataaccag tcatgaaaac 24000
aaaaaccaat attctttctt aatgcatttt tatttttatt ttcaataaag ttaagtaact 24060
tcaaagaaaa ataatcttta atgaattttt atngtttcca tgattccaga tnnnnttttt 24120
tttttttttt tttgagatgg agtcttgctc tgtcaccagg ctggagtgca nnngtggcag 24180
gatctcggct cactgttttc tccacctccc aggttcaagt gattctcctg cctcagcctc 24240
ccgagtagct gagattacag gcatgtgcca ccacacccag ctaatttttg tatttttagt 24300
agagacaggg tttcaccacg ttagccagga tgagattcca gattttttaa tattatttgt 24360
taatgtccat gggtatattc cacatatatt tttcattttt tacaatgctg tttccttttt 24420
tattacaaac gttatttcat atatacattc catatataca cataaccaat atacttaata 24480
tttgatagtt atttagtatt ataccattgc ttaggtttgt ttttgtgaaa gtctgtttgt 24540
ggaagaaacc tgagtttact tgctgtcagt caaaaatgtg tagcccttat catagagaat 24600
tgaggagcag aagagaaaat ggaaggtgaa aatgcttagt gttactctta ttaatttgtg 24660
tgaagaggct gaaatgtttg aagtaaaaat aaaattcgcc caacgcctgg tgggttttga 24720
agaatatttt gatgtaatac cttatagaaa gcaactttca aatgatacac ctaagagtga 24780
ttttgagcca atctgcttaa agattagttg ctacccaggt cttccatagc ttaatagatt 24840
gaatattctc tctctctctc tctctctnng tctctgtctc tctctctctc tctctctgtc 24900
tccccgcttc ccacccctgg tccccaggta acgctaaaga tgctcctctt gacagtggtc 24960
gtcagcatgt acaagagctt ctttatcata gtaggcatgt ttctcttgct gctgtgttac 25020
gcttttgctg gagttgtttt atttggtact gtgaaatatg gggagaatat taacaggttg 25080
gtatatactt atctttctat tcatttatca agcaaaccct ttggtaataa aattttaaat 25140
aaacaaatgt tttttgtcta ttaaagtcta ggagagggga aagggaagta atcagttgga 25200
aattaaaata aaatagccaa gttttaaatg atatttttcc agttgaaaaa ggttattcaa 25260
ctgaaaaggt ctactttcaa aaccttagaa aaattagaaa taaaagaaaa caaaaagaat 25320
ctataattcc accaacattc agtaatcatc actccnaatt ccagcacttt ttctatctac 25380
atattgccaa aaaatgatat attattttta gatggaacaa ttttaagata actctgggtt 25440
tctttctcag caaaatatgg gaatttagag ccccccaaat ggttgtaata tatgaaaagc 25500
agttttcaac gatttgccta agttttatag atgcatcatt ttttttcaag tcctgataca 25560
acaaagtata taccgatatg tcaagttgta ggaattagat acatggctgc cccacctttt 25620
atagcatcgt ccaagtgaaa gaaggaatca cttagttgcc aaagcctgcc tacttagtca 25680
ttcaagatga atggtaataa attagtggcc atgctagagt tgggtgttca gacggctata 25740
cttggaggca agtataaatg acaaattaat aaaaaggtat aacctttgga aaaggtnact 25800
tagcaaccaa atttgctaca acctccactt gttttggtgt tggcaaacca tgctatttca 25860
tgacaaaccc ttctataant cacattctgt taattttttt ttcttaaatt aggcatgcaa 25920
atttttcttc ggctggaaaa gctattaccg tactgttccg aattgtcaca ggtgaagact 25980
ggaacaagat tatgcatgac tgtatggtaa atatctctca tcatgaacaa ggcttagact 26040
tagaatcagc atgaaactct tncaacacaa tgttggcagg atcatccttg ttagcgttaa 26100
gactttatgt atgaaatata aatcctgaca cttcagtcca taaaattgca ttattataca 26160
ttccaatgtg tgaatattta gggcaaaata ctcaattaac ccaacttgag ctattgtagt 26220
tccattcaac aaantatgca ttttgtgagt gttgttcttt ccctcccatc tttaatattt 26280
tggtaatgaa agtcaaacag gaagcccttt aatttaatgt gttcagtgga tagttcactg 26340
cccctcagct atatgctagg ccctaggtct tcaacaactc caaggcacac tcaaggagct 26400
tacctcaagg gctctgagtt actcttcctt tatactataa agtatacttt atacttcctt 26460
cttactatat cctgtcttcc ccaagcatca tccttctggt ctcagtttaa acaggtcttt 26520
tgccttaagc taagacagcc agctacatgt tcttatgctg ctctatagtt ctcctttgta 26580
ataaggagct gtagtgaatt actggcttac attcatttat tttatctctt tctcaccgta 26640
ggacagacca atgctgtgtt aaaaaatgtc tgcagtgatg gaaatctgca ctgtccaatt 26700
cgggagccac tagccatatg tggttatgga gcatttaaaa tgtggctaac acaactgagg 26760
aactgaattt tagttttaat tttatattat tacattttaa ttaacataaa tttaaattta 26820
catngctgca tggagctagt ggtcaccata ttggactgca cagcactcaa ctgtcagtag 26880
gaagaagaga tagggccgcc tatgtctttc ttaccagtct ctccccaaac ttggcacaaa 26940
cctagcacac agtaggagtg ctgggacttc atgcatgaat taacaaggag aatttgccaa 27000
atcaaataga atacaaggca aaatttaatg aatcttaaat aaaaatacaa gcagaatgct 27060
gggattatag aagagagagc tagtttatct ggctgagaaa aaccagaaag ttctctcaga 27120
ggtgtcggcn ttttatagag cctgtaaaca atgagagagt ttttgatgac ttaagtcttg 27180
tgctattcca tagcatccca taacagtgtt ccaagaatgg ggcttactcc tcacacaatt 27240
tgaatgtgaa tttnctatgt gcaggcacat cttgttttac tgtgcttccc ttattgcctt 27300
ttgcagacat tgcattttta caagttgaag gtttatggca atcttgtgtg gagcaggtct 27360
atcagggcca tttttccaat agcatgtttg ctcactttct ggttctgtat cacattttgg 27420
taattctcac tatttcngac tttttcatta ttatctgttt tggtgatctg tgatcagtga 27480
tcttttgatg tttcttttgt agtttttttt gaggggtgcc atgaaccatg ctcaataaga 27540
tggagaattt aattgataaa tgtcatatgt cttctgattg ctgcaccgaa catctgtttc 27600
tccaactctt ctctcttttc ttgggcctcc ctatgtcctg agacacaaca atattgacat 27660
taggccgatt cacaacccta caatggccta taagtgttca agtgaataga agattcacac 27720
atcagtcact tcaaatcaaa agctagaaat gattaagctt atggaggaag gcatgtcaaa 27780
agctgagtta gcccaaaagc taggtccctt gcaccaaata gttactcaag ttgtaaattc 27840
aaaggaaaag ttcttgaagg gaattaaaat gctactccag tgaacacatg actgataaga 27900
aatagcctta tggctgatat ggagaaaaaa ttttaccggt ctcagtagaa gatcagacta 27960
gccacaacat gcccttaagc taaagccaaa tgcagaagaa ggcccttact ctcttcaaat 28020
ttatgaaggg tgagagaggt gaggacgctg tagaaaaaaa tgtttgacgc tagcaaaggt 28080
tggttcatta tgtttaagga aagaaagaag ccatctccat aatatgaaag tgtaagtgct 28140
gctgatataa aagctgtggc aagttatcta gaagatctag ctcaaataat taaggtggct 28200
acactaaaca atggattttc aatgtagaca aaacagcctt ctattggaag aagatgccct 28260
ctagaacttt catagctaga aaggagaagt caatgcctgg attcaaagct tcaaataaca 28320
gacttactct gttgttaggg actaatgcag ctggtgactt tcagtggaag ccaatgctca 28380
tttaccattc caaaaatcct aggaccctgc aatggtttga ctgtgtcccc acccaaatct 28440
catcttgaat tgtagttccc ttaatctcca tgtgtcgtgg gagggaccag gcagagataa 28500
ttgaatcatg ggggtggttt cttccatcct gttcttgtga tactgagtga gttctcacta 28560
tagccgtcat gagatctgat ggttttataa gaggtttttc cccccatttt cttggcactt 28620
cttgctgcca ccatgtgaag aagaacatat ttgcttcccc ttccgccgtg attgtaaatc 28680
tcctgaggcc tcccaatccc tgctgaactg tgagtcaatt aaatctcttt cctttataaa 28740
ttacncagtc tcaggtatgt ctttattagc agtgtgagaa nggactaata cagtctctta 28800
agaattatgc taaatctacc ctgcctgtgc tctataaatg gaacaacaaa gcctggatga 28860
cagaatagct gtttgcagca tggtttgctg gatatttaag cccactcttg agacctactg 28920
ctcagaaaaa aaagattgct ttcaaagtag tactgctcat taacaatgca tctacctggt 28980
cacccaagag ctgtatcagg agatgtataa ggagattaac attgttttca tgcctgctaa 29040
cacaacatcc attctgtcca tggatcaaga agtcatttca actttcaagt cttattattt 29100
cagaaataga tttcataagg ctaatagctg ccatagatag tgattgctct gatggatctg 29160
ggcaaagtat attgaaaacc ttctggaaag gattcactat tctacatgcc attaagaaca 29220
ttcatggcca ggcgcagtgg ctcacgcctg taatcctagc actttgggag gtcaaggngg 29280
gtggatcacg aggtcaggag atcgagacca tcctggctaa catggtgaaa ccttgtctgt 29340
actaaagata caaaaaatta gccgggcatg gtggtgggcg cctgtagact cagctactcg 29400
ggaggctgag gcaggagaat ggcgtaagcc caggaggcgg agcttgcagt gagcggagat 29460
tgcaccactg cactncagcc tgggcgacag agtgagactc cgtctcaaaa aaaaaaaaaa 29520
aaaaannnaa cattcatgat tcatggaagg aggtcaaaat atcatcaaca ttaacaggaa 29580
tttggaagaa gttgattcca gccattatgg atgactntga ggggttcaag acttcagtga 29640
aggaggtcgc tgcacatgtg gttggtagaa atagcaagag aactagaatt agaaatggaa 29700
cctgaagacg cgactgaatt gctgcagtct cctgatcaaa cttgaaggaa tgaagattgc 29760
tccttatgga tgatcagagt ggtttcttga aatggaatct actcttgcag aagatgctat 29820
gaacatagtc ataatgacaa caaaggattt ataatgttac ataaaattac tcgataaacc 29880
agcagcaggg tttgagaggg ttgactccaa attcgaaaga agttctattg tgggtaaaat 29940
gctagcaaac agcatcacat gctgcagaaa aatctttcat gaaaggaaga gtcaattgat 30000
atgataaact tccatgttga cttgttttaa gaaatcgcca cagccacccc aaccttcagc 30060
agccaccacc ctgctcagtc agcagctgtc aacattgagg caagaccctc caccaccagc 30120
agaagattac aactcactga aggctcacat gattgttagc ttttcttagc aataaaagta 30180
ctttttatta aggtctgtac ctttttggac ataatgccat tgtgcactta ataagccaca 30240
gtatggtata aacatgagtt gcatgtgcac tgggaaacca aaacatgcat aggactttat 30300
tgcaatattc actttatcac agcagtctgg aactgaaact gcaatgtctc cgaggtatac 30360
ctgtagagtc tatattccca aatcttaacc cattacttca gtcagagaaa aacttgcaaa 30420
tgtcttttta tttgattttc tgcagtttga tcacagtggc tacttatcac ttggggctgg 30480
tggtggtggc agaaagaata tctagtggag atcagttcat tttcattgtg cttttaaaaa 30540
tggcaataac cttgggattc tacaagataa cagcatagca taagtgaaat attcttcttt 30600
atttctgcta cagatgatgt acccaatgta tgtggctttt gaaagcttac tttgaagtta 30660
attatatgct atatgtttag gaatctattc attaactata gtcagctaaa agaaatttgt 30720
attctctact cttatcctct ccttcttcca ccccaatgcc ccaaaggttc agcctccgtt 30780
ttgtactcca gatgaattta catactgggc aacagactgt ggaaattatg ctggggcact 30840
tatgtatttc tgttcatttt atgtcatcat tgcctacatc atgctaaatc tgcttgtagg 30900
taagtgatgt tagttgaata ctttttactc tttaaactca ggtacttaga taattatgta 30960
ttattttcaa gcaattaccc tggatttctt ggggtgggtg tttcatggca ttaattataa 31020
attgttgtct ctcaatccag aagctgaaaa gacctttgaa aggcacgtaa atgacagttg 31080
actgcaattt taagagttgt agcatttatt atgatcatta atttcaaaag ggctcttctc 31140
atggattgag tngaacaaat atcagagagg actatctttc tagccttgaa atatcacatt 31200
tatgtttttg aaaggtacac cttatttacc cagatgtggg cccacccaga actcaatttg 31260
acctttaaaa atggccctgg aactctcaac taagagttaa agccagctgg catgactatc 31320
tctatacaca gaatgtgtgt ttgtgcttac gaccctcatg ttttggaaag gcaggagctg 31380
gagaaatagc ttagtccaag tgtaaacatg ccaatttgga aaccatacta aaagcacttt 31440
aaaaatttgg cttatgatat aggtgataga atccattatt aataatagat gttttactct 31500
ttctaaaata tgacagatta gcataatggt ctaacttctg aatttttctt tttttaaaag 31560
ccataattgt ggagaatttc tccttgtttt attccactga ggaggaccag cttttaagtt 31620
acaatgatct tcgccacttt caaatmatat ggaacatggt ggatgataaa agagaggtat 31680
gggagtgggt tgttgtttca tgcctcacct caaagagact tatcaacatg tctcaaacac 31740
ttaaatggtt ttcaggttgg caaatgacac agattgaatt tttaaatggn ntgaanttgc 31800
agaaagccat catttacagt tcagcagaat cctctaggaa gggagacagc atcgttcctc 31860
cttacatgat cttcaaccat gaacatcctc ttcttcagac tttccgaagg ccagcaggga 31920
aaggaagcca aagggactct gtaggaatca gccttgggct caggccagaa aaagaggtga 31980
cactgaaact accaaaggga cagtatatta ncaaattcat gatcacctca aactcaagta 32040
gcaatcccaa ttaaaagtac aaaggagtta tttaagtggc atctgaaggt gtgtattgga 32100
ttatttttga gttactactt gaatgtttta accataaagt ttacccaacg tttcttaaaa 32160
ttagccaaag tagctgcagt ctgctcttcc tcttcttgtc attgtcgtca tcaacctcca 32220
cctccttccc ttcctcctac tcctcctcct ctaccccctc tnnnnnnnnn nnntcttccc 32280
cctcctcttc cccctnctct tccccctcct cttccccctc ctcctcgtcc acctcctctt 32340
ccacctcatc ttccccccta cctcctcctc ctctacccct tcctctacct tctcctcccc 32400
cacctcctcc ttctncactt cctcctgttc ttcctccctc tcctcttctc tcttcctcat 32460
cctagcaaac actcaggcac agttctaggc actgaggata tagcagtgaa caagatggaa 32520
cagctcctgt actcacagag cttacagtct aataggtgga gacaaataat aaaaagtgaa 32580
ataataataa atagtgcagt atttccagaa gttaaaacta tagacagtag ttggggttgg 32640
ggctgcgccg gcaggaatga ccatgaagga ggcctgaggg gtgctgtggg acctcatgtc 32700
tgaacaacaa ggaaagttct gccagggtat ttggggcgag atctggaaat agttcaagaa 32760
gagttgatga agggcacaaa gaccaagaag ccagcctggg catcataaat gaggggctcc 32820
ggcagtgcac tcaccccaat ttgctccctc ttcttggtac ccctgcccgc ccaggcttca 32880
gtcttgaggg ctttcctttc aaggtagtga gagccctgcg tgcagggcat ctgagctcac 32940
tctcagctcc tcaggatcca cctgtctctc tgtaactgtc acccacggga acctgctttc 33000
atgcaataca cacatgaaga cccactgccc tgcacaccga gatgtcagta actggcaggc 33060
agtcatggtc gccagtgttc cgcccagcac tttcattcaa agaaagatac agccaggggg 33120
catggtggtt tgtgttgcat ggaaggtagc aacacatctt agattctcag tgtctggatc 33180
agttctgacc ccagaagagg gcagagctga aggcctaatt ctcttgtata tagtttttct 33240
aatcctgaag aagacatgaa aaggagttag ttagctcttt tttttttttt ttttttgaga 33300
tggagtccca ctctgtcccc aggctggaat gcagtggtgc aacctctgct tcctgggttc 33360
aagtgattcc ccagcctcag cctcccaaat agctgggact acaggcatgt accactatgt 33420
ccgggtaatt tttttatttt tagtagagac tgggcttcat catgctggcc aggctggtct 33480
cgaactcctg acctcaggtg atccacccgc ctcggcctcc caaagtgctg agattacagg 33540
catgatccaa cacgagttat cttttaatgg tagaaaaaca tgtaataaac attgagacgt 33600
tcctagcatc ccgattgagt gaagaggagg attacacgtg tgtgtcttgt ccattncctt 33660
gtgtgagtac attatggccc actcagtgca tgtgttggag gtggcgtctg tgggacagnc 33720
tatgcaagca tcagcctggt gagagcaaga gtagggtcct ggggggctga aggggagctt 33780
cccatgcctc actccaaatg ctgcaatgtg gtgacatccc agaaagagaa gcaccagcag 33840
aaatttatca ctcagttttc tatcctctgc tcttcttagt gcacttaatt ctaccaggct 33900
ccaaggaggt gaccagcttt cttcacatct ggtgctaatt atgctagctt ttgagaaata 33960
gcaccttttt ttttttcttt tgagaaaccc aagtgaatca tcgaggcctg atgatttgct 34020
acttcttgtg ctctgccccg cagggggtga tccccacgtt ccgcgtcaag ttcctgctgc 34080
ggctactgcg tgggaggctg gaggtggacc tggacaagga caagctcctg tttaagcaca 34140
tgtgctacga aatggagagg ctccacaatg gcggcgacgt caccttccat gatgtcctga 34200
ggtacaaggc aggctttcgc agggctgaat gggggccaga aaccacagct gtcagccttc 34260
aaggcctctg cagtacaatt aacaagtgtg tttccaaccc aaaatgccac atctgctgtg 34320
gtcgtgaagt ggggtcacat gtcccaggcg ctaagtgccc tttcctgccg tcctccagtg 34380
aacatttcca agtaggtgcc tcgcagggga gggctgggcg gctgtgccct gatgtcccgt 34440
agggacccct gcccactgag gtgcaccccg aggggagagg tggaagggat ctgggagagc 34500
acagtcccac cccttccctg tgatgcggga actgcccaga agagctgagt gacttgcttg 34560
cggttacagg gctctggcaa agctgggact aacatgcaga gcacctcact tgcatgggtc 34620
tgatgagaat ttgcctggcc tgctctgtga tggttgcccc gttggctaaa acaccagatt 34680
ttccagacat ttcatgagcg cccagacagg acagagggtc aaatggagtc tctgcctttt 34740
cttcttcctg ggagacttct gtatttgttt ccttgggcta ctgtaactta gcaccttaag 34800
ctgagggatt taaacaacag aaaggtatgg tctcgaagtc ctggatgctg gaagcccgag 34860
atggaggtat tgcggggctg attccttctg aggcctgtga gggagaatct agcctagcct 34920
ctcccctggc tgctggaggt gcgctgccaa tgttggtcat tccttggctt gtagaagcat 34980
cagcttggtc tcccttcatc ttcacatggc attctgtttg tgtgtgtgtg tgtgtgtgtg 35040
tgtgtgtgtg tatctatgtt caaattcctc cttttataag aacatctgtc gtattacatt 35100
aggagtccat tctactccac tgtgatctca ttttaactta attactaatt acatctgcaa 35160
tgttctattt ccaaataacc ttacgttctg aggtactaga ggttaggact ccaacatatc 35220
tttttttggg aggaaacatt taacccataa cagcttctta agcaggagtc catggataaa 35280
acagaggccc atggacttgc aagggggaaa caattacatc tttattttca ctaatcactc 35340
tttgaaatgt gtcattctct tccatgatga acgtaggcaa caaaccacag tcgcattagc 35400
aatatccatg tctttgttac caggagaaat catagatatt ttcagatgac ataactgact 35460
gccttgactg acatcttaaa atatcattta tgctcaccag tgcttctgag ttatggtagt 35520
catttgagct ctgctagatg gtattattta atggaataat aaaggaagca cttacttatg 35580
ttactttatc actgccgttt taaagtaaat ttgagaattg tattttaata taattggttt 35640
cctttgtaat acggtgtatt tcattccgtg catttaaagc attatttcaa gaaatgtccc 35700
ataagctcca ctgccacagg ggtccatgcc acagaaaaaa ataagagcga ctgactagca 35760
gtagctattt taatcacata gcagtaccta caaggagtgt gtgggatatt gtgttgtgtc 35820
tcaaatttca ggagaactca ggtgtacaga aatatgcttg tggccagaag ctgaaaaaaa 35880
aaaaggatca gatcagcaca ggaagaatct gggaaaagtt ctctcaagtt atcaatttca 35940
cctcccacta tccagttctt ccaccaacaa gctaaaaagc agaaaaacat gggacggaga 36000
aatgcatgtg aatcacaaag gaggtcatct ctgtcagaat gtttctgagt ctttcctcct 36060
agtggcaaat ttttttggtt gacatgaggc agataggcat actgttgtca ttaataatta 36120
atattcagcc tctttggaac acaccgatgt atctaataaa aatagaccca ggcaaaatct 36180
gtgatggggc tgtctctccc cttcctattt attcccctag cccagtatat gataaaaaca 36240
aacagtgaag ataaaagcaa tgaagctttg atgggattct tgatgagtca gggaagagag 36300
gaagagaaaa ttcatttttt ttccctctgt ggtgggaaga gatttagcaa agagaagccc 36360
aatgtaccag tgctctcaag agcctccagg ctgtgatttg ggctctagga tggaactgag 36420
ctcacagaag tgggtagctc acaggtgcac cagggtgcat gggtctgagc cataacctgg 36480
aatcctgtgg ctacacctgg gtgcatcaca ctgccaagag gggctgtctt ctcctctggt 36540
ggtggactgc tcagtccagg catcctggga gctgccttat tgccccatga actgtaatgc 36600
tgtgttggct ttacctacaa ctgcatgggc ctgctgtgtg tcaagggtta aatgggagtg 36660
gatattcaac cctgggtttg tttggtagcc tctgaaatta ataaggaaga ccaggcatgg 36720
tggctcacac ctgtaatccc agctctttgg gaggctgagg caggtggatc atttgaggtt 36780
aggagtttaa gaccagtttg accaacatgg tgaaaactcg tctctactaa aaatacaaaa 36840
ctagctgggc atggtggcac acacctgtaa tcccagctac ttgggaggct gaggcagaag 36900
aaatgcttga acccaggagg cggaggttgc agtgagctga cagcgcgcca ttacactcca 36960
gcctggtcaa caagagtgaa gctccatctc aaaaaaagaa aaaattaatt aataaggaag 37020
atacagaagg atgaatgaga gaaacagaga gggaagtggg atgcagggag tagggatgtg 37080
tgacgcacag ccgagcatat taaccatcac ctcggggggc taagtgtgaa gaaagtatgg 37140
gaggtgcggt cttccttctg cagagaaagt cgcgagcctt ttcctagcct ggatcttttg 37200
ctttacaggc acttagatgg cacttactac tataagagcc tcacagatat taactcactt 37260
agtcattaaa taaaggagtt accaggacta tctatcatct ttgttttaca gacgagggaa 37320
gggagacaca gagaggtgac aggaccagcc caagacatgc gggtggcgag gggtggcgtc 37380
aaaacactag acttattaga ctgagtgatg tcctctctgg attttgacgt atctaagggt 37440
gtaaatctca ggtgaatcag agctgcgatt gcaggtgtgt ttctcccacc agcatgcttt 37500
cataccggtc cgtggacatc cggaagagct tgcagctgga ggaactcctg gcgagggagc 37560
agctggagta caccatagag gaggaggtgg ccaagcagac catccgcatg tggctcaaga 37620
agtgcctgaa gcgcatcaga gctgtgagtg aactgcacac atgcaggttg ggtccccgcc 37680
ccgccccgcc ctgccccgca ggaggatgaa agaaaagagc ttcgtgaaca tgggattagc 37740
tccttctgtg atcagccttc tatcccttta aactatgtcc actacctcca cctacagtgg 37800
tcagatcatg atgcagactt tcactctagt ccacagtcag ccctgccctc tttagcagag 37860
tccattagga gtttccatgg aatcccattt ttataatatg acatgaagac ttaaaaagca 37920
gtttattggc caggtgtggt ggctcatgcc tgtaatccca gcactatgag aggtcaaggg 37980
gggagctcaa ctcacttgag gccaggagtt ggagaccagc ctgccaacat ggcaaaaccc 38040
catctctact aaaaatacaa aaattaacca ggcgtggcac acatgcctgt agtcccagct 38100
actcaggagg ctgaggcatg agaatcactt gaacctggga ggtagaagtt gcagtgagct 38160
gagatcatgc cactgcactc cagcctgggt gacacagtga gaatctgtct caaaaaaaaa 38220
aaaaaagttt attgatatta aaatatgatg tccatttatt aaactcaact gttcaaaatt 38280
ctagaatttt ccacatattg aatttgcaaa actactttaa attgctgcta aaaatttcaa 38340
caaactgtga taatgtcatt tattctgaaa agaccacctc tcaagattaa tgatgtttcc 38400
tgcttcctga cttataagcc tataagattc tctaactcat aaattaatga atgtatactg 38460
cattgacata tactgtattt acagtgaatg tttctatgag ataattactt ttatgaatgc 38520
ttttggcatg tttcacagac agggaaaaaa cccaaagcaa tcactaaaca tttatatata 38580
acagagattg tttcaatcct cttcctcaga gcaacaacgt caattgcaga aacatgtatt 38640
tctattggag gagaaaaggt tcccagagaa aagatacaac tcaacctcct atagcaaggc 38700
cagctgccca gtgatgtccc atcactgctg gccactgtag ctatgttagc tccagggatc 38760
aatctgtcct cctctggctc tgagagggca caaggagtcc tggctttagt atatgccgag 38820
acagactggt ctcctggatt gacctgaaaa cttcagaacc aagacaagca caaaggtttt 38880
ctcatccacc caaggctctt tgcctcttac aacttgcagg aaagtgggaa aggggttggg 38940
attgtattgg cttaatgagc ctagaataaa ataagaggag aaaaaataga atagccacat 39000
tagtaatttt aaataagaca taagctgggc acagtgtctc atgcctgtaa tcccagcaca 39060
ttgggaaact gaggcgggag gatcgcttaa gaccagaagt ttgaaactag cttgggcaac 39120
agagtgagac ctcctctctn gnaaaaaaaa aaaaaaaaaa aaaattaatt agccagccac 39180
agtcatgcac acttttagtc tcagcttctc aggaggctga ggcaggagca tagcttgagc 39240
ctaggagttt aaggttacag tgagctataa taatcgcacc actgaactct agtctacggg 39300
acatagtgag atcctatcta aaaaaaaaaa aaaaaaaaaa aancagaaaa caccaacaac 39360
aaaaagaaaa acaaataaat aaaatacaag catcaatgac cgtcactatt ctgattgtta 39420
cacaaatgaa aatggactgg gaagtcaatg catacctctc taagcccacc tttgcatcag 39480
cctaccttaa ttgaacattg aaattagttc aggatcctta cttggaaatt cctaagaggt 39540
cacccgtcat gcaggtctta ggagagggga gaagaaaata agatttgtgt ggcggtgggg 39600
caggcaggat gctgggctta ttttactgaa caaacaatcg catttccata gaaacagcag 39660
cagtcgtgca gtatcatcca cagcctgaga gagagtcagc agcaagagct gagccggttt 39720
ctgaacccgc ccagcatcga gaccacccag cccagtgagg acacgaatgc caacagtcag 39780
gacaacagca tgcaacctga ggtatgggca cgaggcgtcc tctgtcccag gacactctgt 39840
gggcttcttt cttttaataa aaataaataa aatgggtgct ggtcagatca ttcaaacaag 39900
gtgacaatat ttctaatagg aatattttca ttaaaaaaaa aaanggcaac ggaaatccat 39960
tgatccagat tatgtctatg tctttgccat cttggatgca gttgaggtta tttaaaaaga 40020
gtctgactca tatgaatgcc aaaaaaagtg aatgccctga acttcataat tctgtagttt 40080
tatttttgtc taaagagtta acatcagctc taagggctgc atttgaatct gggtatatta 40140
catggagtat ggtttacagg aagctctgcc ctaaatattt tcctcccttc tctaaagtca 40200
tagaaatttg cagtaaaatc agtgaaaatg tttgtaatta gctttcaacc tccttaaata 40260
atcagactca ttgaagatat atcctttcct ggttgggtat cagaagaaca tatggaattc 40320
aggacaattg gcttgaggag tttctattta ttaagtcaca gcatattttc attttcaaac 40380
tctatgtatg tgtctatata aaaaagtaca aggagttatc agcgtcctgg agagtcctgt 40440
gctgtgagaa gcagctggct gggaggacct gcccctttat gaggcagcaa ttacgatttg 40500
aggttaacaa cgtggagctg atcccgtgct ctgtgcagag cccccagcag caccaggctc 40560
catggtgtgc agcaacgcag ccaggggcca gagtaccttt ggaagcctaa ggctccacgg 40620
cccagcaggg tgctccagga ggcccactgg tgccatagct cagttttcag tagatctcat 40680
gttttgggct ccccagcctt tagaaatcat ctgccaccga ctgcagggac ttctgcggag 40740
ttagtcaacc aaggggcaag gggaggcatc tgcagtggcc ttgccactgg tcaccctgaa 40800
gatggttggc aatgtctcgc atgggagagg gaggcaggct gaagtcagga cagacagtga 40860
gacagggcta atgaggttgg agaaagtgat gatttcagag ccctctgttt ttagatgaaa 40920
aagcctaaga aagaaagagg tgacnnnaaa aaaaaaaaaa ggatactaaa gagatgtgaa 40980
gaccaaggct tttgttagga aagggagagg tgacaggtga acctgagaac aggtgaaatg 41040
tgtgggaagt cttggcatct ctctttcttt cactgtagct tagattgtta tcagctccat 41100
cctccaccag ggcccatcat acagctttgc ctgcagagaa ctctttccct gaagctctaa 41160
gtgtggatct ccaggctggt gacagtagac tgcccccgcc cagccggtcc ccactgcccc 41220
accttccttc ctgcagttcc ccttccttac cccctggttt gccagcgaag atatgaaggg 41280
aaacaatgac attctcaggc atggagggga acgaagcagt gggggttacc caggacaaga 41340
tgtcccagga agagtggtgt ctccttcagc agggcgtgca gtggtggctc tttttcttct 41400
gtgacccttt atacccattt tcacttttcc ccattgtgga cactctgagt ccatgttgtt 41460
cttcccactt gtcctcctgc catgtgtttt cctttcttat agtaaaagga ggagagcgca 41520
gggttaaaaa gacggtaact gtgtgcttct cctcccatgc agacaagcag ccagcagcag 41580
ctcctgagcc ccacgctgtc ggatcgagga ggaagtcggc aagatgcagc cgacgcaggg 41640
aaaccccaga ggaaatttgg gcagtggcgt ctgccctcag gtaggtccat ccaggcattt 41700
ctccagcgat cgaggcattt taaaggtatt tactctgttt gtgtgttttg ggtcttgcct 41760
ttcaaaatgc aagtctgcat ctacagttgt ttacagacag caacataatg aaaaatgtag 41820
tcttgtcaaa aacattgtcc cccaaaataa cttctctaaa tatgacttac attagccccc 41880
attttccggg tacatttcag gctatcatgg ttgagaagcc agcacctatg aaaaagacaa 41940
gattcagnaa gagggagaaa tttccaaggg ctttctgtgt gcctcaaggc atgctcaaac 42000
atgggcaaaa gtattcaact gaagagggag tgggcagatg caatcattca gaaaatgcca 42060
cgaagttctc aaaaaaggga caggcccccg atttctctca gcacactttg cagctgagcc 42120
ggtcactggc tttaggcaag ctgctttacc tccatacaat aacaannnnc aacaacaaac 42180
acttacgtag tactcactgt atgccagtca ctcttctaag tgcattactt gtgttctctc 42240
attcaatcct ttaataaaca gtcccattat tttccatatt ttactgattc agtaagagaa 42300
ttttcttcta tgagcttctt ctctataggg ttttggaaag ccaggataat cccattaaga 42360
gcactcagga atsgagggag agcaatgctc cccacagccc agtgtccttg tacatgtttt 42420
tttctataga taactaagtt catgctaaag caggagcttt ataatgctct ttaactgtgc 42480
cccaacttca gcccaattga aaggagaaga tgtgtagcat atgtgttcca caaagcagat 42540
gacagcacag cttacatttt gaggctgacg atgttcagtg ggtcttcact gggactacca 42600
ccaaggaaag tatccccttt catatccagg aacttatttt tcagagatca gagaagatct 42660
aggttcctcc tgattcaaac acagcagaga atgacagcat caagacaacg tagatggtgg 42720
tgccaggtca taaattacaa gctgagtcgg ttcaatttta tcctgtaggc aattaggagc 42780
tagcaaagat ttctgagcag tatgtgactt ttggaatctg tgctttagga agttgacttg 42840
gcagcaaagg agggaattgt ctatgacaga gcctggaggc aggttacaag ctggaggaag 42900
ttaccgtggt gtgagcacaa ggcaacaaag gcatggacag agctgggggc cagatactgc 42960
agggacagat aggagaggtg acctggggag aatgcacagt ccttggtatt catttaaatg 43020
gacaaaagaa atgatgctgt caaaagtact tccattgggc caggcgcagt ggctcacccc 43080
tgtaatccca gcactttggg aggccgaggc aggtggatca tttgaggcct ggagttcaag 43140
accagcctgg tcaacatggt gaaaccctgt ctctactaaa aatacaaaaa ttagctgacc 43200
ggtagtggtg tgcacctgta atcccagctg cttgggaggc tgaggcagga gaatcacttg 43260
agcctgggaa gcagaggttg tggtgaacca agattgtgcc gctgcactcc tgtctgggtg 43320
agagagtgag aacctgtctc ccaaaaaaaa aaaaaaaaaa aaaaaaaaaa nngtacttcc 43380
actggtccat gcctaggtgg tccccaccaa aaacggtgat cgtgaaatag acatgctctt 43440
ggggtcaggc tgagtttgag gaggcagagg agaagaaaaa tagtattttg agggggcagc 43500
aacaatgtca caggtgtcat gctatgcact ttcctaagtc atctcatgta acctgtttta 43560
atcctgacaa tagtctaatt aggacatttt cattgtcttc atcttacaat ggaggaaact 43620
tgggttcaga gacgtgaagt tgcccatagc tacatatcca caggttgcag aggtgggtcc 43680
caacaccatg actgtgaggc cccagaacca cacctttcct cccataccct cactgcatcc 43740
cccctcgcct ttactgtggg tcacactctc cttccttttt gtttttttta ttgcatatgc 43800
taatgaatgc acaggtttct gtgacactta atagttcccg aattggaatt tttttagtga 43860
ttttctagtt tttttaatta tttcaaaatg aaaggggtga gcagcacgtt tttttcccaa 43920
atgacatcat tagttgtcca tgagcacaat taaaaaaaaa atctatcgtg aacataaaga 43980
atcaagtcct gaaaaggatg tttacttagc atctgtggct aggacacgtt agccaaaagt 44040
atcactgatg ggaatatcat gggtttttag gagtgattac aatagggtga agcaatacca 44100
agtggctcat aggactcatt aattccacag ccccaaaacc aataagccat tcagtgtcct 44160
cagtcaactt acggtttgga ggaaggacaa ccatgaaatc tgtcgtgtgc aaaatgaacc 44220
ccatgactga cgcggcttcc tgcggttctg aagttaagaa gtggtggacc cggcagctga 44280
ctgtggagag cgacgaaagt ggggatgacc ttctggatat ttaggtggat gtcaatgtag 44340
atgaatttct agtggtggaa accgttttct aataatgtcc ttgattgtcc agtgagcaat 44400
ctgtaattga tctataactg aattccagct tgtcacaaga tgtttataaa ttgattttca 44460
tcctgccaca gaaaggcata agctgcatgt atgatgggtt actatcaatc attgctcaaa 44520
aaaatttttg tataatgaca gtactgataa tattagaaat gataccgcaa gcaaatgtat 44580
atcacttaaa aatgtcatat attctgtctg cgtaaactaa ggtatatatt catatgtgct 44640
ctaatgcagt attatcaccg ccccgcaaaa gagtgctaag cccaaagtgg ctgatattta 44700
gggtacaggg gttatagctt tagttcacat ctttcccatt tccactagaa atatttctct 44760
tgagagaatt tattatttat gattgatctg aaaaggtcag cactgaactt atgctaaaat 44820
gatagtagtt ttacaaacta cagattctga attttaaaaa gtatcttctt tttctcgtgt 44880
tatattttta aatatacaca agacatttgg tgaccagaac aagttgattt ctgtcctcag 44940
ttatgttaat gaaactgttg cctccttcta agaaaattgt gtgtgcaagc accaggcaaa 45000
gaaatggact caggatgctt agcggtttaa aacaaacctg tagataaatc acttgagtga 45060
catagttgcg caaagatgtt aagtttctta agaaaccttt taataactga gtttagcaaa 45120
aagaataaaa ctatatagct caatttattt aaaaaaatct ttgcatgtgt gatgttatca 45180
ttggcttcat ttcttaccca aggtatgtct gttttgccat aaatcagcag agtcatttca 45240
ttctgggtga tcctaacaca ccattgctat gttagatttg aaatgacatc tctgttaaaa 45300
gaatcttcta tggaaataat ggtgccctgc aaaatcttcc tctgaactca caggttaggg 45360
atcacacaac ttacttaatc gttttttgtt tttgtttttt ttccttatat gtcaatggcc 45420
catgtcctcc gggaaaatta gaaaagcaaa atgattacaa agtgctgtta gatttcttgt 45480
gctgggccag ccaagtagaa gtggacttga cttggacctt taactatttt attacagatt 45540
ggacatttgc tgttcagatg ttttttaaca gagggattat ctcagaatcc tgtgacctcc 45600
aggttgtttt ataatctatt tttctctatt taacattcct cagatagata ggcaaatagg 45660
acattccttc tgtgtcacag aagtatcgtg gtagtggcag tctacagttt atatgattca 45720
ttgtaactat gagataaaga acaaccagtc atgtggccaa aaggattaga tttgatttga 45780
tgttcacttg gagtttactt tttgtacata caagataaaa taaatattgg atttgtaaaa 45840
taatttactc tgagttgacc atttttaaac ccttttcttg gtggggcagg cactcggtag 45900
cagcacattg caaacctgga ttgaatattc agtccataat tagttggcaa aagctgtgtc 45960
cctgatactc atttcaactc aattctctga gccagaatgt tcctttcaca cttgtgctga 46020
taaggctgag tgaataccct gtgccctcta agcctacaat gaacagaaaa ggcacttaca 46080
ggtccagggc atgggtctgt actagtgctg cataaaaaca agatgttttt ggctcattac 46140
acttgagtaa tacagcttca ttctcacgaa actgctgagc cctttctaaa acgtctggaa 46200
ttgatgttca gcagaacatc attgttgttc attctgcagt gaagccaggg gcagaatacc 46260
aatgtattta aagccatagc accctatatt ttcaatgaag cgaaacagtc acacacttcc 46320
tgtaggactc ctctctacga ttttcctgaa acaggtagag catatgcaag ccagagaaat 46380
taagcgccac ccccatttag attttacccc tagatatgta aacatatgaa aaatcccatt 46440
acacagatgg gaaaacttgg gtcacagtgt tccctggtcc gtagggaagc cagacactga 46500
tactaatcct gtcatcacgc cacccactgc ctttaattag agggtgctgt cagttccaaa 46560
ggcaccagaa agcatatggg gtggaatact tacttgactc agagcccctg agagagcagg 46620
ccacacatgt gtgacctgta tggcacttca aggagactca aagggaacaa ggatggacag 46680
aatggaaggg ccaatgctat tcactctann nnnnnnnnnn tttttttttt ttttttgaga 46740
cggagtcttg ctctgtcacc caggctggag tgcagtggca cgatctcggc tcactgcaag 46800
ctccacctcc cgggttcaca ccattctcct gcctcagcct cccaattagc tgggactaca 46860
ggtgcccgcc accatgccca gctaattttt ttgtattttt agtagagacg gggtttcacc 46920
atgttagcca ggatggtctc gatctcctga cctcgtgatc cacccgcctc ggcctcccaa 46980
agtgctggga ttacaggcgt gagccaccgt gcccggccca ctctattctt aatggtactt 47040
ccagaccaac atacatcagc agtgtctggc tggctgtgcc ttggccaagc tgaatgagat 47100
aagggtacat agaagaaaaa ccagtgttat aaagccttac aggaaagcag ctttaagcca 47160
gtggaatgat gtgtttgcct gtttccttgt aggaagtggc attctataca tgggtggttt 47220
tcagtatatc agtaagcagt ggaactgttt ctaaggcctt caacagatcc caaaatttta 47280
accagccaaa agccaggcag ccctcgttga agttgaggtg aagatgaaaa cggcactcat 47340
gtggtctctt ctcacccact attatgggtt gaagtgtgac ccccagaagg ataggttgaa 47400
gtcctaaccc ttagtacctg tgaatatgac cttattagga aatagggtct tcgcagatat 47460
aattacttat gaggaggtca tactagagga gggtaatccc ttactccaac atacctggta 47520
tcctctgaag acacaggcat gtggggagga tggccatgag acggtgaagg cagaggcatc 47580
ggagctatgc tgcccagagc caagggacac ctgggctacc agaagctgca agaggcaagg 47640
aaggcgcctc ccagaggctt ctaagggaga atggccccct gtcaacacct tgattctgga 47700
cttctagcca gaagaactgt gagaacatac atttctgttg ttttaagctg cccagtttgt 47760
ctgctttttt atcattttat cattttagtt ttttagttta gtctctgtct tctactaact 47820
ccctttccaa ttctacttta g 47841
<210>4
<211>6799
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>5’UTR
<222>1..65
<220>
<221>CDS
<222>66..5282
<220>
<221>3’UTR
<222>5283..6799
<220>
<221>polyA_signal
<222>6081..6086
<220>
<221>polyA_signal
<222>6777..6782
<220>
<221>allele
<222>1658
<223>99-79316-158:多态性碱基C或T
<220>
<221>allele
<222>4481
<223>99-79310-29:多态性碱基A或C
<400>4
gacagctctg agcgctgggg ttacagactg tggttttgtg cttgctcacc aaagctaacc 60
tcagc atg ctc aaa agg aag cag agt tcc agg gtg gaa gcc cag cca gtc 110
Met Leu Lys Arg Lys Gln Ser Ser Arg Val Glu Ala Gln Pro Val
1 5 10 15
act gac ttt ggt cct gat gag tct ctg tcg gat aat gct gac atc ctc 158
Thr Asp Phe Gly Pro Asp Glu Ser Leu Ser Asp Asn Ala Asp Ile Leu
20 25 30
tgg att aac aaa cca tgg gtt cac tct ttg ctg cgc atc tgt gcc atc 206
Trp Ile Asn Lys Pro Trp Val His Ser Leu Leu Arg Ile Cys Ala Ile
35 40 45
atc agc gtc att tct gtt tgt atg aat acg cca atg acc ttc gag cac 254
Ile Ser Val Ile Set Val Cys Met Asn Thr Pro Met Thr Phe Glu His
50 55 60
tat cct cca ctt cag tat gtg acc ttc act ttg gat aca tta ttg atg 302
Tyr Pro Pro Leu Gln Tyr Val Thr Phe Thr Leu Asp Thr Leu Leu Met
65 70 75
ttt ctc tac acg gca gag atg ata gca aaa atg cac atc cgg ggc att 350
Phe Leu Tyr Thr Ala Glu Met Ile Ala Lys Met His Ile Arg Gly Ile
80 85 90 95
gtc aag ggg gat agt tcc tat gtg aaa gat cgc tgg tgt gtt ttt gat 398
Val Lys Gly Asp Ser Ser Tyr Val Lys Asp Arg Trp Cys Val Phe Asp
100 105 110
gga ttt atg gtc ttt tgc ctt tgg gtt tct ttg gtg cta cag gtg ttt 446
Gly Phe Met Val Phe Cys Leu Trp Val Ser Leu Val Leu Gln Val Phe
115 120 125
gaa att gct gat ata gtt gat cag atg tca cct tgg ggc atg ttg cgg 494
Glu Ile Ala Asp Ile Val Asp Gln Met Set Pro Trp Gly Met Leu Arg
130 135 140
att cca cgg cca ctg att atg atc cga gca ttc cgg att tat ttc cga 542
Ile Pro Arg Pro Leu Ile Met Ile Arg Ala Phe Arg Ile Tyr Phe Arg
145 150 155
ttt gaa ctg cca agg acc aga att aca aat att tta aag cga tcg gga 590
Phe Glu Leu Pro Arg Thr Arg Ile Thr Asn Ile Leu Lys Arg Ser Gly
160 165 170 175
gaa caa ata tgg agt gtt tcc att ttt cta ctt ttc ttt cta ctt ctt 638
Glu Gln Ile Trp Ser Val Ser Ile Phe Leu Leu Phe Phe Leu Leu Leu
180 185 190
tat gga att tta gga gtt cag atg ttt gga aca ttt act tat cac tgt 686
Tyr Gly Ile Leu Gly Val Gln Met Phe Gly Thr Phe Thr Tyr His Cys
195 200 205
gtt gta aat gac aca aag cca ggg aat gta acc tgg aat agt tta gct 734
Val Val Asn Asp Thr Lys Pro Gly Asn Val Thr Trp Asn Ser Leu Ala
210 215 220
att cca gac aca cac tgc tca cca gag cta gaa gaa ggc tac cag tgc 782
Ile Pro Asp Thr His Cys Ser Pro Glu Leu Glu Glu Gly Tyr Gln Cys
225 230 235
cca cct gga ttt aaa tgc atg gac ctt gaa gat ctg gga ctt agc agg 830
Pro Pro Gly Phe Lys Cys Met Asp Leu Glu Asp Leu Gly Leu Ser Arg
240 245 250 255
caa gag ctg ggc tac agt ggc ttt aat gag ata gga act agt ata ttc 878
Gln Glu Leu Gly Tyr Ser Gly Phe Asn Glu Ile Gly Thr Ser Ile Phe
260 265 270
acc gtc tat gag gcc gcc tca cag gaa ggc tgg gtg ttc ctc atg tac 926
Thr Val Tyr Glu Ala Ala Ser Gln Glu Gly Trp Val Phe Leu Met Tyr
275 280 285
aga gca att gac agc ttt ccc cgt tgg cgt tcc tac ttc tat ttc atc 974
Arg Ala Ile Asp Set Phe Pro Arg Trp Arg Set Tyr Phe Tyr Phe Ile
290 295 300
act ctc att ttc ttc ctc gcc tgg ctt gtg aag aac gtg ttt att gct 1022
Thr Leu Ile Phe Phe Leu Ala Trp Leu Val Lys Asn Val Phe Ile Ala
305 310 315
gtt atc att gaa aca ttt gca gaa atc aga gta cag ttt caa caa atg 1070
Val Ile Ile Glu Thr Phe Ala Glu Ile Arg Val Gln Phe Gln Gln Met
320 325 330 335
tgg gga tcg aga agc agc act acc tca aca gcc acc acc cag atg ttt 1118
Trp Gly Set Arg Set Set Thr Thr Set Thr Ala Thr Thr Gln Met Phe
340 345 350
cat gaa gat gct gct gga ggt tgg cag ctg gta gct gtg gat gtc aac 1166
His Glu Asp Ala Ala Gly Gly Trp Gln Leu Val Ala Val Asp Val Asn
355 360 365
aag ccc cag gga cgc gcc cca gcc tgc ctc cag aaa atg atg cgg tca 1214
Lys Pro Gln Gly Arg Ala Pro Ala Cys Leu Gln Lys Met Met Arg Ser
370 375 380
tcc gtt ttc cac atg ttc atc ctg agc atg gtg acc gtg gac gtg atc 1262
Ser Val Phe His Met Phe Ile Leu Ser Met Val Thr Val Asp Val Ile
385 390 395
gtg gcg gct agc aac tac tac aaa gga gaa aac ttc agg agg cag tac 1310
Val Ala Ala Ser Asn Tyr Tyr Lys Gly Glu Asn Phe Arg Arg Gln Tyr
400 405 410 415
gac gag ttc tac ctg gcg gag gtg gct ttt aca gta ctt ttt gat ttg 1358
Asp Glu Phe Tyr Leu Ala Glu Val Ala Phe Thr Val Leu Phe Asp Leu
420 425 430
gaa gca ctt ctg aag ata tgg tgt ttg gga ttt act gga tat att agc 1406
Glu Ala Leu Leu Lys Ile Trp Cys Leu Gly Phe Thr Gly Tyr Ile Ser
435 440 445
tca tct ctc cac aaa ttc gaa cta cta ctc gta att gga act act ctt 1454
Set Set Leu His Lys Phe Glu Leu Leu Leu Val Ile Gly Thr Thr Leu
450 455 460
cat gta tac cca gat ctt tat cat tca caa ttc acg tac ttt cag gtt 1502
His Val Tyr Pro Asp Leu Tyr His Set Gln Phe Thr Tyr Phe Gln Val
465 470 475
ctc cga gta gtt cgg ctg att aag att tca cct gca tta gaa gac ttt 1550
Leu Arg Val Val Arg Leu Ile Lys Ile Ser Pro Ala Leu Glu Asp Phe
480 485 490 495
gtg tac aag ata ttt ggt cct gga aaa aag ctt ggg agt ttg gtt gta 1598
Val Tyr Lys Ile Phe Gly Pro Gly Lys Lys Leu Gly Ser Leu Val Val
500 505 510
ttt act gcc agc ctc ttg att gtt atg tca gca att agt ttg cag atg 1646
Phe Thr Ala Ser Leu Leu Ile Val Met Ser Ala Ile Ser Leu Gln Met
515 520 525
ttc tgc ttt gty gaa gaa ctg gac aga ttt act acg ttt ccg agg gca 1694
Phe Cys Phe Val Glu Glu Leu Asp Arg Phe Thr Thr Phe Pro Arg Ala
530 535 540
ttt atg tcc atg ttc cag atc ctc acc cag gaa gga tgg gtg gac gta 1742
Phe Met Ser Met Phe Gln Ile Leu Thr Gln Glu Gly Trp Val Asp Val
545 550 555
atg gac caa act cta aat gct gtg gga cat atg tgg gca ccc gtg gtt 1790
Met Asp Gln Thr Leu Asn Ala Val Gly His Met Trp Ala Pro Val Val
560 565 570 575
gcc atc tat ttc att ctc tat cat ctt ttt gcc act ctg atc ctc ctg 1838
Ala Ile Tyr Phe Ile Leu Tyr His Leu Phe Ala Thr Leu Ile Leu Leu
580 585 590
agt ttg ttt gtt gct gtt att ttg gac aac tta gaa ctt gat gaa gac 1886
Ser Leu Phe Val Ala Val Ile Leu Asp Asn Leu Glu Leu Asp Glu Asp
595 600 605
cta aag aag ctt aaa caa tta aag caa agt gaa gca aat gcg gac acc 1934
Leu Lys Lys Leu Lys Gln Leu Lys Gln Ser Glu Ala Asn Ala Asp Thr
610 615 620
aaa gaa aag ctc cct tta cgc ctg cga atc ttt gaa aaa ttt cca aac 1982
Lys Glu Lys Leu Pro Leu Arg Leu Arg Ile Phe Glu Lys Phe Pro Asn
625 630 635
aga cct caa atg gtg aaa atc tca aag ctt cct tca gat ttt aca gtt 2030
Arg Pro Gln Met Val Lys Ile Ser Lys Leu Pro Ser Asp Phe Thr Val
640 645 650 655
cct aaa atc agg gag agt ttt atg aag cag ttt att gac cgc cag caa 2078
Pro Lys Ile Arg Glu Set Phe Met Lys Gln Phe Ile Asp Arg Gln Gln
660 665 670
cag gac aca tgt tgc ctc ctg aga agc ctc ccg acc acc tct tcc tcc 2126
Gln Asp Thr Cys Cys Leu Leu Arg Ser Leu Pro Thr Thr Ser Ser Ser
675 680 685
tcc tgc gac cac tcc aaa cgc tca gca att gag gac aac aaa tac atc 2174
Ser Cys Asp His Ser Lys Arg Ser Ala Ile Glu Asp Asn Lys Tyr Ile
690 695 700
gac caa aaa ctt cgc aag tct gtt ttc agc atc agg gca agg aac ctt 2222
Asp Gln Lys Leu Arg Lys Ser Val Phe Ser Ile Arg Ala Arg Asn Leu
705 710 715
ctg gaa aag gag acc gca gtc act aaa atc tta aga gct tgc acc cga 2270
Leu Glu Lys Glu Thr Ala Val Thr Lys Ile Leu Arg Ala Cys Thr Arg
720 725 730 735
cag cgc atg ctg agc gga tca ttt gag ggg cag ccc gca aag gag agg 2318
Gln Arg Met Leu Ser Gly Ser Phe Glu Gly Gln Pro Ala Lys Glu Arg
740 745 750
tca atc ctc agc gtg cag cat cat atc cgc caa gag cgc agg tca cta 2366
Ser Ile Leu Ser Val Gln His His Ile Arg Gln Glu Arg Arg Ser Leu
755 760 765
aga cat gga tca aac agc cag agg atc agc agg gga aaa tct ctt gaa 2414
Arg His Gly Ser Asn Ser Gln Arg Ile Ser Arg Gly Lys Ser Leu Glu
770 775 780
act ttg act caa gat cat tcc aat aca gtg aga tat aga aat gca caa 2462
Thr Leu Thr Gln Asp His Ser Asn Thr Val Arg Tyr Arg Asn Ala Gln
785 790 795
aga gaa gac agt gaa ata aag atg att cag gaa aaa aag gag caa gca 2510
Arg Glu Asp Ser Glu Ile Lys Met Ile Gln Glu Lys Lys Glu Gln Ala
800 805 810 815
gag atg aaa agg aaa gtg caa gaa gag gaa ctc aga gag aac cac cca 2558
Glu Met Lys Arg Lys Val Gln Glu Glu Glu Leu Arg Glu Asn His Pro
820 825 830
tac ttc gat aag cca ctg ttc att gtc ggg cga gaa cac agg ttc aga 2606
Tyr Phe Asp Lys Pro Leu Phe Ile Val Gly Arg Glu His Arg Phe Arg
835 840 845
aac ttt tgc cgg gtg gtg gtc cga gca cgc ttc aac gca tct aaa aca 2654
Asn Phe Cys Arg Val Val Val Arg Ala Arg Phe Asn Ala Ser Lys Thr
850 855 860
gac cct gtc aca gga gct gtg aaa aat aca aag tac cat caa ctt tat 2702
Asp Pro Val Thr Gly Ala Val Lys Asn Thr Lys Tyr His Gln Leu Tyr
865 870 875
gat ttg ctg gga ttg gtc act tac ctg gac tgg gtc atg atc atc gta 2750
Asp Leu Leu Gly Leu Val Thr Tyr Leu Asp Trp Val Met Ile Ile Val
880 885 890 895
acc atc tgc tct tgc att tcc atg atg ttt gag tcc ccg ttt cga aga 2798
Thr Ile Cys Ser Cys Ile Ser Met Met Phe Glu Ser Pro Phe Arg Arg
900 905 910
gtc atg cat gca cct act ttg cag att gct gag tat gtg ttt gtg ata 2846
Val Met His Ala Pro Thr Leu Gln Ile Ala Glu Tyr Val Phe Val Ile
915 920 925
ttc atg agc att gag ctt aat ctg aag att atg gca gat ggc tta ttt 2894
Phe Met Ser Ile Glu Leu Asn Leu Lys Ile Met Ala Asp Gly Leu Phe
930 935 940
ttc act cca act gct gtc atc agg gac ttc ggt gga gta atg gac ata 2942
Phe Thr Pro Thr Ala Val Ile Arg Asp Phe Gly Gly Val Met Asp Ile
945 950 955
ttt ata tat ctt gtg agc ttg ata ttt ctt tgt tgg atg cct caa aat 2990
Phe Ile Tyr Leu Val Ser Leu Ile Phe Leu Cys Trp Met Pro Gln Asn
960 965 970 975
gta cct gct gaa tcg gga gct cag ctt cta atg gtc ctt cgg tgc ctg 3038
Val Pro Ala Glu Ser Gly Ala Gln Leu Leu Met Val Leu Arg Cys Leu
980 985 990
aga cct ctg cgc ata ttc aaa ctg gtg ccc cag atg agg aaa gtt gtt 3086
Arg Pro Leu Arg Ile Phe Lys Leu Val Pro Gln Met Arg Lys Val Val
995 1000 1005
cga gaa ctt ttc agc ggc ttc aag gaa att ttt ttg gtc tcc att ctt 3134
Arg Glu Leu Phe Ser Gly Phe Lys Glu Ile Phe Leu Val Ser Ile Leu
1010 1015 1020
ttg ctg aca tta atg ctc gtt ttt gca agc ttt gga gtt cag ctt ttt 3182
Leu Leu Thr Leu Met Leu Val Phe Ala Ser Phe Gly Val Gln Leu Phe
1025 1030 1035
gct gga aaa ctg gcc aag tgc aat gat ccc aac att att aga agg gaa 3230
Ala Gly Lys Leu Ala Lys Cys Asn Asp Pro Asn Ile Ile Arg Arg Glu
1040 1045 1050 1055
gat tgc aat ggc ata ttc aga att aat gtc agt gtg tca aag aac tta 3278
Asp Cys Asn Gly Ile Phe Arg Ile Asn Val Ser Val Ser Lys Asn Leu
1060 1065 1070
aat tta aaa ttg agg cct gga gag aaa aaa cct gga ttt tgg gtg ccc 3326
Asn Leu Lys Leu Arg Pro Gly Glu Lys Lys Pro Gly Phe Trp Val Pro
1075 1080 1085
cgt gtt tgg gcg aat cct cgg aac ttt aat ttc gac aat gtg gga aac 3374
Arg Val Trp Ala Asn Pro Arg Asn Phe Asn Phe Asp Asn Val Gly Asn
1090 1095 1100
gct atg ctg gcg ttg ttt gaa gtt ctc tcc ttg aaa ggc tgg gtg gaa 3422
Ala Met Leu Ala Leu Phe Glu Val Leu Ser Leu Lys Gly Trp Val Glu
1105 1110 1115
gtg aga gat gtt att att cat cgt gtg ggg ccg atc cat gga atc tat 3470
Val Arg Asp Val Ile Ile His Arg Val Gly Pro Ile His Gly Ile Tyr
1120 1125 1130 1135
att cat gtt ttt gta ttc ctg ggt tgc atg att gga ctg acc ctt ttt 3518
Ile His Val Phe Val Phe Leu Gly Cys Met Ile Gly Leu Thr Leu Phe
1140 1145 1150
gtt gga gta gtt att gct aat ttc aat gaa aac aag ggg acg gct ttg 3566
Val Gly Val Val Ile Ala Asn Phe Asn Glu Asn Lys Gly Thr Ala Leu
1155 1160 1165
ctg acc gtc gat cag aga aga tgg gaa gac ctg aag agc cga ctg aag 3614
Leu Thr Val Asp Gln Arg Arg Trp Glu Asp Leu Lys Ser Arg Leu Lys
1170 1175 1180
atc gca cag cct ctt cat ctc ccg cct cgc ccg gat aat gat ggt ttt 3662
Ile Ala Gln Pro Leu His Leu Pro Pro Arg Pro Asp Asn Asp Gly Phe
1185 1190 1195
aga gct aaa atg tat gac ata acc cag cat cca ttt ttt aag agg aca 3710
Arg Ala Lys Met Tyr Asp Ile Thr Gln His Pro Phe Phe Lys Arg Thr
1200 1205 1210 1215
atc gca tta ctc gtc ctg gcc cag tcg gtg ttg ctc tct gtc aag tgg 3758
Ile Ala Leu Leu Val Leu Ala Gln Ser Val Leu Leu Ser Val Lys Trp
1220 1225 1230
gac gtc gag gac ccg gtg acc gta cct ttg gca aca atg tca gtt gtt 3806
Asp Val Glu Asp Pro Val Thr Val Pro Leu Ala Thr Met Ser Val Val
1235 1240 1245
ttc acc ttc atc ttt gtt ctg gag gtt acc atg aag atc ata gca atg 3854
Phe Thr Phe Ile Phe Val Leu Glu Val Thr Met Lys Ile Ile Ala Met
1250 1255 1260
tcg cct gct ggc ttc tgg caa agc aga aga aac cga tac gat ctc ctg 3902
Ser Pro Ala Gly Phe Trp Gln Ser Arg Arg Asn Arg Tyr Asp Leu Leu
1265 1270 1275
gtg acg tcg ctt ggc gtt gta tgg gtg gtg ctt cac ttt gcc ctc ctg 3950
Val Thr Ser Leu Gly Val Val Trp Val Val Leu His Phe Ala Leu Leu
1280 1285 1290 1295
aat gca tat act tac atg atg ggc gct tgt gtg att gta ttt agg ttt 3998
Asn Ala Tyr Thr Tyr Met Met Gly Ala Cys Val Ile Val Phe Arg Phe
1300 1305 1310
ttc tcc atc tgt gga aaa cat gta acg cta aag atg ctc ctc ttg aca 4046
Phe Ser Ile Cys Gly Lys His Val Thr Leu Lys Met Leu Leu Leu Thr
1315 1320 1325
gtg gtc gtc agc atg tac aag agc ttc ttt atc ata gta ggc atg ttt 4094
Val Val Val Ser Met Tyr Lys Ser Phe Phe Ile Ile Val Gly Met Phe
1330 1335 1340
ctc ttg ctg ctg tgt tac gct ttt gct gga gtt gtt tta ttt ggt act 4142
Leu Leu Leu Leu Cys Tyr Ala Phe Ala Gly Val Val Leu Phe Gly Thr
1345 1350 1355
gtg aaa tat ggg gag aat att aac agg cat gca aat ttt tct tcg gct 4190
Val Lys Tyr Gly Glu Asn Ile Asn Arg His Ala Asn Phe Ser Ser Ala
1360 1365 1370 1375
gga aaa gct att acc gta ctg ttc cga att gtc aca ggt gaa gac tgg 4238
Gly Lys Ala Ile Thr Val Leu Phe Arg Ile Val Thr Gly Glu Asp Trp
1380 1385 1390
aac aag att atg cat gac tgt atg gtt cag cct ccg ttt tgt act cca 4286
Asn Lys Ile Met His Asp Cys Met Val Gln Pro Pro Phe Cys Thr Pro
1395 1400 1405
gat gaa ttt aca tac tgg gca aca gac tgt gga aat tat gct ggg gca 4334
Asp Glu Phe Thr Tyr Trp Ala Thr Asp Cys Gly Asn Tyr Ala Gly Ala
1410 1415 1420
ctt atg tat ttc tgt tca ttt tat gtc atc att gcc tac atc atg cta 4382
Leu Met Tyr Phe Cys Ser Phe Tyr Val Ile Ile Ala Tyr Ile Met Leu
1425 1430 1435
aat ctg ctt gta gcc ata att gtg gag aat ttc tcc ttg ttt tat tcc 4430
Asn Leu Leu Val Ala Ile Ile Val Glu Asn Phe Ser Leu Phe Tyr Ser
1440 1445 1450 1455
act gag gag gac cag ctt tta agt tac aat gat ctt cgc cac ttt caa 4478
Thr Glu Glu Asp Gln Leu Leu Ser Tyr Asn Asp Leu Arg His Phe Gln
1460 1465 1470
atm ata tgg aac atg gtg gat gat aaa aga gag ggg gtg atc ccc acg 4526
Ile Ile Trp Asn Met Val Asp Asp Lys Arg Glu Gly Val Ile Pro Thr
1475 1480 1485
ttc cgc gtc aag ttc ctg ctg cgg cta ctg cgt ggg agg ctg gag gtg 4574
Phe Arg Val Lys Phe Leu Leu Arg Leu Leu Arg Gly Arg Leu Glu Val
1490 1495 1500
gac ctg gac aag gac aag ctc ctg ttt aag cac atg tgc tac gaa atg 4622
Asp Leu Asp Lys Asp Lys Leu Leu Phe Lys His Met Cys Tyr Glu Met
1505 1510 1515
gag agg ctc cac aat ggc ggc gac gtc acc ttc cat gat gtc ctg agc 4670
Glu Arg Leu His Asn Gly Gly Asp Val Thr Phe His Asp Val Leu Ser
1520 1525 1530 1535
atg ctt tca tac cgg tcc gtg gac atc cgg aag agc ttg cag ctg gag 4718
Met Leu Ser Tyr Arg Ser Val Asp Ile Arg Lys Ser Leu Gln Leu Glu
1540 1545 1550
gaa ctc ctg gag agg gag cag ctg gag tac acc ata gag gag gag gtg 4766
Glu Leu Leu Ala Arg Glu Gln Leu Glu Tyr Thr Ile Glu Glu Glu Val
1555 1560 1565
gcc aag cag acc atc cgc atg tgg ctc aag aag tgc ctg aag cgc atc 4814
Ala Lys Gln Thr Ile Arg Met Trp Leu Lys Lys Cys Leu Lys Arg Ile
1570 1575 1580
aga gct aaa cag cag cag tcg tgc agt atc atc cac agc ctg aga gag 4862
Arg Ala Lys Gln Gln Gln Ser Cys Ser Ile Ile His Ser Leu Arg Glu
1585 1590 1595
agt cag cag caa gag ctg agc cgg ttt ctg aac ccg ccc agc atc gag 4910
Ser Gln Gln Gln Glu Leu Ser Arg Phe Leu Asn Pro Pro Ser Ile Glu
1600 1605 1610 1615
acc acc cag ccc agt gag gac acg aat gcc aac agt cag gac aac agc 4958
Thr Thr Gln Pro Ser Glu Asp Thr Asn Ala Asn Ser Gln Asp Asn Ser
1620 1625 1630
atg caa cct gag aca agc agc cag cag cag ctc ctg agc ccc acg ctg 5006
Met Gln Pro Glu Thr Ser Ser Gln Gln Gln Leu Leu Ser Pro Thr Leu
1635 1640 1645
tcg gat cga gga gga agt cgg caa gat gca gcc gac gca ggg aaa ccc 5054
Ser Asp Arg Gly Gly Ser Arg Gln Asp Ala Ala Asp Ala Gly Lys Pro
1650 1655 1660
cag agg aaa ttt ggg cag tgg cgt ctg ccc tca gcc cca aaa cca ata 5102
Gln Arg Lys Phe Gly Gln Trp Arg Leu Pro Ser Ala Pro Lys Pro Ile
1665 1670 1675
agc cat tca gtg tcc tca gtc aac tta cgg ttt gga gga agg aca acc 5150
Ser His Ser Val Ser Ser Val Asn Leu Arg Phe Gly Gly Arg Thr Thr
1680 1685 1690 1695
atg aaa tct gtc gtg tgc aaa atg aac ccc atg act gac gcg gct tcc 5198
Met Lys Ser Val Val Cys Lys Met Asn Pro Met Thr Asp Ala Ala Ser
1700 1705 1710
tgc ggt tct gaa gtt aag aag tgg tgg acc cgg cag ctg act gtg gag 5246
Cys Gly Ser Glu Val Lys Lys Trp Trp Thr Arg Gln Leu Thr Val Glu
1715 1720 1725
agc gac gaa agt ggg gat gac ctt ctg gat att tag gtggatgtca 5292
Ser Asp Glu Ser Gly Asp Asp Leu Leu Asp Ile *
1730 1735
atgtagatga atttctagtg gtggaaaccg ttttctaata atgtccttga ttgtccagtg 5352
agcaatctgt aattgatcta taactgaatt ccagcttgtc acaagatgtt tataaattga 5412
ttttcatcct gccacagaaa ggcataagct gcatgtatga tgggttacta tcaatcattg 5472
ctcaaaaaaa tttttgtata atgacagtac tgataatatt agaaatgata ccgcaagcaa 5532
atgtatatca cttaaaaatg tcatatattc tgtctgcgta aactaaggta tatattcata 5592
tgtgctctaa tgcagtatta tcaccgcccc gcaaaagagt gctaagccca aagtggctga 5652
tatttagggt acaggggtta tagctttagt tcacatcttt cccatttcca ctagaaatat 5712
ttctcttgag agaatttatt atttatgatt gatctgaaaa ggtcagcact gaacttatgc 5772
taaaatgata gtagttttac aaactacaga ttctgaattt taaaaagtat cttctttttc 5832
tcgtgttata tttttaaata tacacaagac atttggtgac cagaacaagt tgatttctgt 5892
cctcagttat gttaatgaaa ctgttgcctc cttctaagaa aattgtgtgt gcaagcacca 5952
ggcaaagaaa tggactcagg atgcttagcg gtttaaaaca aacctgtaga taaatcactt 6012
gagtgacata gttgcgcaaa gatgttaagt ttcttaagaa accttttaat aactgagttt 6072
agcaaaaaga ataaaactat atagctcaat ttatttaaaa aaatctttgc atgtgtgatg 6132
ttatcattgg cttcatttct tacccaaggt atgtctgttt tgccataaat cagcagagtc 6192
atttcattct gggtgatcct aacacaccat tgctatgtta gatttgaaat gacatctctg 6252
ttaaaagaat cttctatgga aataatggtg ccctgcaaaa tcttcctctg aactcacagg 6312
ttagggatca cacaacttac ttaatcgttt tttgtttttg ttttttttcc ttatatgtca 6372
atggcccatg tcctccggga aaattagaaa agcaaaatga ttacaaagtg ctgttagatt 6432
tcttgtgctg ggccagccaa gtagaagtgg acttgacttg gacctttaac tattttatta 6492
cagattggac atttgctgtt cagatgtttt ttaacagagg gattatctca gaatcctgtg 6552
acctccaggt tgttttataa tctatttttc tctatttaac attcctcaga tagataggca 6612
aataggacat tccttctgtg tcacagaagt atcgtggtag tggcagtcta cagtttatat 6672
gattcattgt aactatgaga taaagaacaa ccagtcatgt ggccaaaagg attagatttg 6732
atttgatgtt cacttggagt ttactttttg tacatacaag ataaaataaa tattggattt 6792
gtaaaat 6799
<210>5
<211>1738
<212>PRT
<213>智人(Homo sapiens)
<400>5
Met Leu Lys Arg Lys Gln Ser Ser Arg Val Glu Ala Gln Pro Val Thr
1 5 10 15
Asp Phe Gly Pro Asp Glu Ser Leu Set Asp Asn Ala Asp Ile Leu Trp
20 25 30
Ile Asn Lys Pro Trp Val His Ser Leu Leu Arg Ile Cys Ala Ile Ile
35 40 45
Ser Val Ile Ser Val Cys Met Asn Thr Pro Met Thr Phe Glu His Tyr
50 55 60
Pro Pro Leu Gln Tyr Val Thr Phe Thr Leu Asp Thr Leu Leu Met Phe
65 70 75 80
Leu Tyr Thr Ala Glu Met Ile Ala Lys Met His Ile Arg Gly Ile Val
85 90 95
Lys Gly Asp Ser Ser Tyr Val Lys Asp Arg Trp Cys Val Phe Asp Gly
l00 105 110
Phe Met Val Phe Cys Leu Trp Val Ser Leu Val Leu Gln Val Phe Glu
115 120 125
Ile Ala Asp Ile Val Asp Gln Met Set Pro Trp Gly Met Leu Arg Ile
130 135 140
Pro Arg Pro Leu Ile Met Ile Arg Ala Phe Arg Ile Tyr Phe Arg Phe
145 150 155 160
Glu Leu Pro Arg Thr Arg Ile Thr Asn Ile Leu Lys Arg Ser Gly Glu
165 170 175
Gln Ile Trp Ser Val Set Ile Phe Leu Leu Phe Phe Leu Leu Leu Tyr
180 185 190
Gly Ile Leu Gly Val Gln Met Phe Gly Thr Phe Thr Tyr His Cys Val
195 200 205
Val Asn Asp Thr Lys Pro Gly Asn Val Thr Trp Asn Ser Leu Ala Ile
210 215 220
Pro Asp Thr His Cys Ser Pro Glu Leu Glu Glu Gly Tyr Gln Cys Pro
225 230 235 240
Pro Gly Phe Lys Cys Met Asp Leu Glu Asp Leu Gly Leu Ser Arg Gln
245 250 255
Glu Leu Gly Tyr Ser Gly Phe Asn Glu Ile Gly Thr Ser Ile Phe Thr
260 265 270
Val Tyr Glu Ala Ala Ser Gln Glu Gly Trp Val Phe Leu Met Tyr Arg
275 280 285
Ala Ile Asp Ser Phe Pro Arg Trp Arg Ser Tyr Phe Tyr Phe Ile Thr
290 295 300
Leu Ile Phe Phe Leu Ala Trp Leu Val Lys Asn Val Phe Ile Ala Val
305 310 315 320
Ile Ile Glu Thr Phe Ala Glu Ile Arg Val Gln Phe Gln Gln Met Trp
325 330 335
Gly Ser Arg Ser Ser Thr Thr Ser Thr Ala Thr Thr Gln Met Phe His
340 345 350
Glu Asp Ala Ala Gly Gly Trp Gln Leu Val Ala Val Asp Val Asn Lys
355 360 365
Pro Gln Gly Arg Ala Pro Ala Cys Leu Gln Lys Met Met Arg Ser Ser
370 375 380
Val Phe His Met Phe Ile Leu Ser Met Val Thr Val Asp Val Ile Val
385 390 395 400
Ala Ala Ser Asn Tyr Tyr Lys Gly Glu Asn Phe Arg Arg Gln Tyr Asp
405 410 415
Glu Phe Tyr Leu Ala Glu Val Ala Phe Thr Val Leu Phe Asp Leu Glu
420 425 430
Ala Leu Leu Lys Ile Trp Cys Leu Gly Phe Thr Gly Tyr Ile Ser Ser
435 440 445
Ser Leu His Lys Phe Glu Leu Leu Leu Val Ile Gly Thr Thr Leu His
450 455 460
Val Tyr Pro Asp Leu Tyr His Set Gln Phe Thr Tyr Phe Gln Val Leu
465 470 475 480
Arg Val Val Arg Leu Ile Lys Ile Ser Pro Ala Leu Glu Asp Phe Val
485 490 495
Tyr Lys Ile Phe Gly Pro Gly Lys Lys Leu Gly Ser Leu Val Val Phe
500 505 510
Thr Ala Ser Leu Leu Ile Val Met Ser Ala Ile Ser Leu Gln Met Phe
515 520 525
Cys Phe Val Glu Glu Leu Asp Arg Phe Thr Thr Phe Pro Arg Ala Phe
530 535 540
Met Ser Met Phe Gln Ile Leu Thr Gln Glu Gly Trp Val Asp Val Met
545 550 555 560
Asp Gln Thr Leu Asn Ala Val Gly His Met Trp Ala Pro Val Val Ala
565 570 575
Ile Tyr Phe Ile Leu Tyr His Leu Phe Ala Thr Leu Ile Leu Leu Ser
580 585 590
Leu Phe Val Ala Val Ile Leu Asp Asn Leu Glu Leu Asp Glu Asp Leu
595 600 605
Lys Lys Leu Lys Gln Leu Lys Gln Ser Glu Ala Asn Ala Asp Thr Lys
610 615 620
Glu Lys Leu Pro Leu Arg Leu Arg Ile Phe Glu Lys Phe Pro Asn Arg
625 630 635 640
Pro Gln Met Val Lys Ile Ser Lys Leu Pro Ser Asp Phe Thr Val Pro
645 650 655
Lys Ile Arg Glu Ser Phe Met Lys Gln Phe Ile Asp Arg Gln Gln Gln
660 665 670
Asp Thr Cys Cys Leu Leu Arg Ser Leu Pro Thr Thr Ser Ser Ser Ser
675 680 685
Cys Asp His Ser Lys Arg Ser Ala Ile Glu Asp Asn Lys Tyr Ile Asp
690 695 700
Gln Lys Leu Arg Lys Ser Val Phe Ser Ile Arg Ala Arg Asn Leu Leu
705 710 715 720
Glu Lys Glu Thr Ala Val Thr Lys Ile Leu Arg Ala Cys Thr Arg Gln
725 730 735
Arg Met Leu Ser Gly Ser Phe Glu Gly Gln Pro Ala Lys Glu Arg Ser
740 745 750
Ile Leu Ser Val Gln His His Ile Arg Gln Glu Arg Arg Ser Leu Arg
755 760 765
His Gly Ser Asn Ser Gln Arg Ile Ser Arg Gly Lys Ser Leu Glu Thr
770 775 780
Leu Thr Gln Asp His Ser Asn Thr Val Arg Tyr Arg Asn Ala Gln Arg
785 790 795 800
Glu Asp Ser Glu Ile Lys Met Ile Gln Glu Lys Lys Glu Gln Ala Glu
805 810 815
Met Lys Arg Lys Val Gln Glu Glu Glu Leu Arg Glu Asn His Pro Tyr
820 825 830
Phe Asp Lys Pro Leu Phe Ile Val Gly Arg Glu His Arg Phe Arg Asn
835 840 845
Phe Cys Arg Val Val Val Arg Ala Arg Phe Asn Ala Ser Lys Thr Asp
850 855 860
Pro Val Thr Gly Ala Val Lys Asn Thr Lys Tyr His Gln Leu Tyr Asp
865 870 875 880
Leu Leu Gly Leu Val Thr Tyr Leu Asp Trp Val Met Ile Ile Val Thr
885 890 895
Ile Cys Ser Cys Ile Ser Met Met Phe Glu Ser Pro Phe Arg Arg Val
900 905 910
Met His Ala Pro Thr Leu Gln Ile Ala Glu Tyr Val Phe Val Ile Phe
915 920 925
Met Ser Ile Glu Leu Asn Leu Lys Ile Met Ala Asp Gly Leu Phe Phe
930 935 940
Thr Pro Thr Ala Val Ile Arg Asp Phe Gly Gly Val Met Asp Ile Phe
945 950 955 960
Ile Tyr Leu Val Ser Leu Ile Phe Leu Cys Trp Met Pro Gln Asn Val
965 970 975
Pro Ala Glu Ser Gly Ala Gln Leu Leu Met Val Leu Arg Cys Leu Arg
980 985 990
Pro Leu Arg Ile Phe Lys Leu Val Pro Gln Met Arg Lys Val Val Arg
995 1000 1005
Glu Leu Phe Ser Gly Phe Lys Glu Ile Phe Leu Val Ser Ile Leu Leu
1010 1015 1020
Leu Thr Leu Met Leu Val Phe Ala Ser Phe Gly Val Gln Leu Phe Ala
1025 1030 1035 1040
Gly Lys Leu Ala Lys Cys Asn Asp Pro Asn Ile Ile Arg Arg Glu Asp
1045 1050 1055
Cys Asn Gly Ile Phe Arg Ile Asn Val Ser Val Ser Lys Asn Leu Asn
1060 1065 1070
Leu Lys Leu Arg Pro Gly Glu Lys Lys Pro Gly Phe Trp Val Pro Arg
1075 1080 1085
Val Trp Ala Asn Pro Arg Asn Phe Asn Phe Asp Asn Val Gly Asn Ala
1090 1095 1100
Met Leu Ala Leu Phe Glu Val Leu Ser Leu Lys Gly Trp Val Glu Val
1105 1110 1115 1120
Arg Asp Val Ile Ile His Arg Val Gly Pro Ile His Gly Ile Tyr Ile
1125 1130 1135
His Val Phe Val Phe Leu Gly Cys Met Ile Gly Leu Thr Leu Phe Val
1140 1145 1150
Gly Val Val Ile Ala Asn Phe Asn Glu Asn Lys Gly Thr Ala Leu Leu
1155 1160 1165
Thr Val Asp Gln Arg Arg Trp Glu Asp Leu Lys Ser Arg Leu Lys Ile
1170 1175 1180
Ala Gln Pro Leu His Leu Pro Pro Arg Pro Asp Asn Asp Gly Phe Arg
1185 1190 1195 1200
Ala Lys Met Tyr Asp Ile Thr Gln His Pro Phe Phe Lys Arg Thr Ile
1205 1210 1215
Ala Leu Leu Val Leu Ala Gln Ser Val Leu Leu Ser Val Lys Trp Asp
1220 1225 1230
Val Glu Asp Pro Val Thr Val Pro Leu Ala Thr Met Ser Val Val Phe
1235 1240 1245
Thr Phe Ile Phe Val Leu Glu Val Thr Met Lys Ile Ile Ala Met Ser
1250 1255 1260
Pro Ala Gly Phe Trp Gln Ser Arg Arg Asn Arg Tyr Asp Leu Leu Val
1265 1270 1275 1280
Thr Ser Leu Gly Val Val Trp Val Val Leu His Phe Ala Leu Leu Asn
1285 1290 1295
Ala Tyr Thr Tyr Met Met Gly Ala Cys Val Ile Val Phe Arg Phe Phe
1300 1305 1310
Ser Ile Cys Gly Lys His Val Thr Leu Lys Met Leu Leu Leu Thr Val
1315 1320 1325
Val Val Ser Met Tyr Lys Ser Phe Phe Ile Ile Val Gly Met Phe Leu
1330 1335 1340
Leu Leu Leu Cys Tyr Ala Phe Ala Gly Val Val Leu Phe Gly Thr Val
1345 1350 1355 1360
Lys Tyr Gly Glu Asn Ile Asn Arg His Ala Asn Phe Ser Ser Ala Gly
1365 1370 1375
Lys Ala Ile Thr Val Leu Phe Arg Ile Val Thr Gly Glu Asp Trp Asn
1380 1385 1390
Lys Ile Met His Asp Cys Met Val Gln Pro Pro Phe Cys Thr Pro Asp
1395 1400 1405
Glu Phe Thr Tyr Trp Ala Thr Asp Cys Gly Asn Tyr Ala Gly Ala Leu
1410 1415 1420
Met Tyr Phe Cys Ser Phe Tyr Val Ile Ile Ala Tyr Ile Met Leu Asn
1425 1430 1435 1440
Leu Leu Val Ala Ile Ile Val Glu Asn Phe Ser Leu Phe Tyr Ser Thr
1445 1450 1455
Glu Glu Asp Gln Leu Leu Ser Tyr Asn Asp Leu Arg His Phe Gln Ile
1460 1465 1470
Ile Trp Asn Met Val Asp Asp Lys Arg Glu Gly Val Ile Pro Thr Phe
1475 1480 1485
Arg Val Lys Phe Leu Leu Arg Leu Leu Arg Gly Arg Leu Glu Val Asp
1490 1495 1500
Leu Asp Lys Asp Lys Leu Leu Phe Lys His Met Cys Tyr Glu Met Glu
1505 1510 1515 1520
Arg Leu His Asn Gly Gly Asp Val Thr Phe His Asp Val Leu Ser Met
1525 1530 1535
Leu Ser Tyr Arg Ser Val Asp Ile Arg Lys Ser Leu Gln Leu Glu Glu
1540 1545 1550
Leu Leu Ala Arg Glu Gln Leu Glu Tyr Thr Ile Glu Glu Glu Val Ala
1555 1560 1565
Lys Gln Thr Ile Arg Met Trp Leu Lys Lys Cys Leu Lys Arg Ile Arg
1570 1575 1580
Ala Lys Gln Gln Gln Ser Cys Ser Ile Ile His Ser Leu Arg Glu Ser
1585 1590 1595 1600
Gln Gln Gln Glu Leu Ser Arg Phe Leu Asn Pro Pro Ser Ile Glu Thr
1605 1610 1615
Thr Gln Pro Ser Glu Asp Thr Asn Ala Asn Ser Gln Asp Asn Ser Met
1620 1625 1630
Gln Pro Glu Thr Ser Ser Gln Gln Gln Leu Leu Ser Pro Thr Leu Ser
1635 1640 1645
Asp Arg Gly Gly Ser Arg Gln Asp Ala Ala Asp Ala Gly Lys Pro Gln
1650 1655 1660
Arg Lys Phe Gly Gln Trp Arg Leu Pro Ser Ala Pro Lys Pro Ile Ser
1665 1670 1675 1680
His Ser Val Ser Ser Val Asn Leu Arg Phe Gly Gly Arg Thr Thr Met
1685 1690 1695
Lys Ser Val Val Cys Lys Met Asn Pro Met Thr Asp Ala Ala Ser Cys
1700 1705 1710
Gly Ser Glu Val Lys Lys Trp Trp Thr Arg Gln Leu Thr Val Glu Ser
1715 1720 1725
Asp Glu Ser Gly Asp Asp Leu Leu Asp Ile
1730 1735
<210>6
<211>453
<212>DNA
<213>智人(Homo sapiens)
<220>
<221>allele
<222>105
<223>99-62617-105:多态性碱基G或C
<220>
<221>misc_binding
<222>93..117
<223>99-62617-105.探针
<220>
<221>primer_bind
<222>86..104
<223>99-62617-105.mis
<220>
<221>primer_bind
<222>106..124
<223>99-62617-105.mis补体
<220>
<221>primer bind
<222>1..20
<223>99-62617.pu
<220>
<221>primer_bind
<222>435..453
<223>99-62617.rp补体
<400>6
tgaggatgag gggcaaacac agaggaagaa tctgggcccc atgaggtcaa cagtgagctg 60
ctaaaattaa cctgaaattt ccctgctggg agacattgtg ttgtsaaata gttttatacc 120
atcttttact aggttttcaa ttaccagcag ttggatgcac cctgtgatcc aatggataca 180
aatgagattt agaagtgcac tttaacttaa ataaaataaa tagccttgtc taatgtatta 240
acgagaaaga catttttgtc ttatttatat gtcttatgtt ctttgaaatg aaataaatga 300
ccatatatgc ttgtaaagag agggagtcta cagatatttg gagaaaggac attctgggtg 360
gagagaacac agagtgcaaa ggacttgaag ttaaagtgca tccagcagtc tcaaggaaga 420
gtaaaggggt ccatgtgagt ggaataaggt gag 453
<210>7
<211>18
<212>DNA
<213>人工序列
<220>
<223>序列测定寡核苷酸引物PU
<400>7
tgtaaaacga cggccagt 18
<210>8
<211>18
<212>DNA
<213>人工序列
<220>
<223>序列测定寡核苷酸引物RP
<400>8
caggaaacag ctatgacc 18
Claims (23)
1.一种经分离的纯化的或重组的多核苷酸,其特征在于,所述多核苷酸包含如SEQ ID No 1-4或6所示的核苷酸序列之一,或与这些序列之一互补的序列。
2.一种经分离的纯化的或重组的多核苷酸,其特征在于,所述多核苷酸包含SEQ ID No 4的至少50个核苷酸的连续跨距,其中所述多核苷酸编码生物学活性CanIon多肽。
3.一种经分离的纯化的或重组的多核苷酸,其特征在于,所述多核苷酸编码人CanIon多肽,该多肽含有SEQ ID NO 5的氨基酸序列或其生物学活性片段。
4.如权利要求1-3中任一项所述的多核苷酸,其特征在于,所述多核苷酸附着在一固体支持物上。
5.一种多核苷酸阵列,其特征在于,所述阵列含有至少一个权利要求4所述的多核苷酸。
6.如权利要求5所述的阵列,其特征在于,所述阵列是可寻址的。
7.如权利要求1-4中任一项所述的多核苷酸,其特征在于,它还包含标记。
8.一种重组载体,其特征在于,所述重组载体包含权利要求1-3中任一项所述的多核苷酸。
9.一种重组载体,其特征在于,所述重组载体包含权利要求2或3所述的多核苷酸,其可操作作地与一启动子连接。
10.一种宿主细胞,其特征在于,所述宿主细胞含有权利要求8或9所述的重组载体。
11.一种非人宿主动物或哺乳动物,其特征在于,所述动物含有权利要求8或9所述的重组载体。
12.一种哺乳类宿主细胞或非人宿主哺乳动物,其特征在于,所述宿主含有因与敲除载体同源重组而受破坏的CanIon基因。
13.一种经分离的纯化的或重组的多肽,其特征在于,所述多肽含有如SEQID No 5所示的氨基酸序列,或其生物学活性片段。
14.一种制备多肽的方法,其特征在于,所述方法包括:
a)提供含有编码权利要求13所述多肽的多核苷酸的细胞群,所述多核苷酸可操作地连接于一启动子;
b)在有助于所述多肽在所述细胞内生产的条件下培养所述细胞群;
c)从所述细胞群中纯化所述多肽。
15.使抗CanIon的抗体与权利要求13所述的多肽结合的方法,其特征在于,所述方法包括使所述抗体与所述多肽在所述抗体可特异性结合所述多肽的条件下接触。
16.一种检测细胞内CanIon基因表达的方法,其特征在于,所述方法包括以下步骤:
a)使所述细胞或所述细胞的提取物与以下两者之一接触:
i)在严格条件下能与权利要求1、2或3所述多核苷酸杂交的多核苷酸;或
ii)特异性结合如权利要求13所述多肽的多肽;以及
b)检测在所述细胞或提取物内所述多核苷酸和某一RNA种类之间是否发生杂交,或所述多肽与所述细胞或提取物内某一蛋白质是否结合;其中检测到存在所述杂交或所述结合则表明所述CanIon基因在所述细胞内被表达。
17.如权利要求16所述的方法,其特征在于,所述多核苷酸是寡核苷酸引物,其中所述杂交是通过检测存在含有所述引物序列的扩增产物而测定的。
18.如权利要求16所述的方法,其特征在于,所述多肽是抗CanIon的抗体。
19.一种鉴定CanIon多肽的候选调节剂的方法,其特征在于,所述方法包括:
a)使权利要求13所述的多肽与测试化合物接触;以及
b)测定所述化合物是否与所述多肽特异性结合;
其中测得所述化合物与所述多肽特异性结合表明所述化合物是所述CanIon多肽的候选调节剂。
20.如权利要求19所述的方法,其特征在于,所述方法还包括在所述候选调节剂存在时测试所述CanIon多肽的活性,其中所述候选调节剂存在时所述CanIon多肽的活性与所述候选调节剂不存在时的活性相比有差别,表明该候选调节剂是所述CanIon多肽的调节剂。
21.一种鉴定CanIon多肽调节剂的方法,其特征在于,所述方法包括:
a)使权利要求13所述的多肽与测试化合物接触;以及
b)检测所述化合物存在和不存在时所述多肽的活性;
其中测得所述化合物存在时的所述活性与所述化合物不存在时的活性相比有差别,表明所述化合物是所述CanIon多肽的调节剂。
22.如权利要求20或21所述的方法,其特征在于,所述多肽存在于细胞或细胞膜中,且所述活性包括电压门控离子通道活性。
23.一种制备药物组合物的方法,其特征在于,所述方法包括:
a)用权利要求19-22中任一项所述的方法鉴定CanIon多肽的调节剂;以及
b)联合所述调节剂与生理上可接受的动载体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US25131700P | 2000-12-05 | 2000-12-05 | |
US60/251,317 | 2000-12-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1777676A true CN1777676A (zh) | 2006-05-24 |
Family
ID=22951418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA018224997A Pending CN1777676A (zh) | 2000-12-05 | 2001-12-04 | 与精神分裂症相关的电压门控离子通道基因及蛋白质 |
Country Status (16)
Country | Link |
---|---|
US (2) | US20040091497A1 (zh) |
EP (1) | EP1339840B1 (zh) |
JP (1) | JP2004525614A (zh) |
KR (1) | KR20030074643A (zh) |
CN (1) | CN1777676A (zh) |
AT (1) | ATE339500T1 (zh) |
AU (2) | AU3357302A (zh) |
BR (1) | BR0115937A (zh) |
CA (1) | CA2430712A1 (zh) |
DE (1) | DE60123109T2 (zh) |
EA (2) | EA008252B1 (zh) |
ES (1) | ES2271092T3 (zh) |
IL (1) | IL156073A0 (zh) |
MX (1) | MXPA03005069A (zh) |
UA (1) | UA79927C2 (zh) |
WO (1) | WO2002046404A2 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020042100A1 (en) * | 2000-07-03 | 2002-04-11 | Chunhua Yan | Isolated human ion channel proteins, nucleic acid molecules encoding human ion channel proteins, and uses thereof |
CA2446708A1 (en) * | 2001-05-10 | 2002-12-19 | Mochida Pharmaceutical Co., Ltd. | Novel voltage-dependent cation channel protein |
US7634363B2 (en) | 2005-12-07 | 2009-12-15 | Affymetrix, Inc. | Methods for high throughput genotyping |
US20080075789A1 (en) * | 2006-02-28 | 2008-03-27 | The Regents Of The University Of California | Genes differentially expressed in bipolar disorder and/or schizophrenia |
FR2906532B1 (fr) * | 2006-09-28 | 2008-12-12 | Biomerieux Sa | Nouvel oligonucleotide marque |
KR20170066403A (ko) * | 2014-10-13 | 2017-06-14 | 다우 아그로사이언시즈 엘엘씨 | 딱정벌레류 및 노린재류 해충에 대한 저항성을 부여하는 copi 코토머 알파 서브유닛 핵산 분자 |
KR20210087830A (ko) * | 2020-01-03 | 2021-07-13 | 삼성전자주식회사 | 기판 적층 구조를 포함하는 전자 장치 |
CN114982679B (zh) * | 2022-07-22 | 2023-08-01 | 中国水产科学研究院长江水产研究所 | 一种黄鳝家系建立及优良家系选育方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6008001A (en) * | 1993-11-05 | 1999-12-28 | Yeda Research And Development Co. Ltd. | Diagnosis of the susceptibility of contracting schizophrenia |
WO1999066041A1 (en) * | 1998-06-16 | 1999-12-23 | Human Genome Sciences, Inc. | 94 human secreted proteins |
WO1999004825A1 (en) * | 1997-07-22 | 1999-02-04 | Millennium Pharmaceuticals, Inc. | Methods and compositions for the diagnosis and treatment of neuropsychiatric disorders |
WO1999028342A2 (en) * | 1997-12-03 | 1999-06-10 | Merck & Co., Inc. | Low-voltage activated calcium channel compositions and methods |
WO1999057316A1 (en) * | 1998-04-30 | 1999-11-11 | Institut Pasteur | A highly conserved polynucleotide sequence linked to a genetic predisposition to schizophrenia, a method of diagnosis, and applications thereof |
EP1121428A2 (en) * | 1998-10-13 | 2001-08-08 | Genset | Genes, proteins and biallelic markers related to central nervous system disease |
AU778868B2 (en) * | 1999-03-30 | 2004-12-23 | Serono Genetics Institute S.A. | Schizophrenia associated genes, proteins and biallelic markers |
WO2001083752A2 (en) * | 2000-04-29 | 2001-11-08 | Millennium Pharmaceuticals, Inc. | 23949 and 32391, human ion channels and uses thereof |
JP2004513618A (ja) * | 2000-07-07 | 2004-05-13 | インサイト・ゲノミックス・インコーポレイテッド | 輸送体及びイオンチャネル |
-
2001
- 2001-04-12 UA UA2003076265A patent/UA79927C2/uk unknown
- 2001-12-04 DE DE60123109T patent/DE60123109T2/de not_active Expired - Fee Related
- 2001-12-04 BR BR0115937-2A patent/BR0115937A/pt not_active IP Right Cessation
- 2001-12-04 EP EP01984902A patent/EP1339840B1/en not_active Expired - Lifetime
- 2001-12-04 EA EA200500974A patent/EA008252B1/ru not_active IP Right Cessation
- 2001-12-04 CA CA002430712A patent/CA2430712A1/en not_active Abandoned
- 2001-12-04 KR KR10-2003-7007511A patent/KR20030074643A/ko active IP Right Grant
- 2001-12-04 AU AU3357302A patent/AU3357302A/xx active Pending
- 2001-12-04 US US10/433,580 patent/US20040091497A1/en not_active Abandoned
- 2001-12-04 JP JP2002548121A patent/JP2004525614A/ja active Pending
- 2001-12-04 AU AU2002233573A patent/AU2002233573B2/en not_active Ceased
- 2001-12-04 EA EA200300642A patent/EA006367B1/ru not_active IP Right Cessation
- 2001-12-04 CN CNA018224997A patent/CN1777676A/zh active Pending
- 2001-12-04 AT AT01984902T patent/ATE339500T1/de not_active IP Right Cessation
- 2001-12-04 MX MXPA03005069A patent/MXPA03005069A/es active IP Right Grant
- 2001-12-04 WO PCT/IB2001/002798 patent/WO2002046404A2/en active IP Right Grant
- 2001-12-04 IL IL15607301A patent/IL156073A0/xx unknown
- 2001-12-04 ES ES01984902T patent/ES2271092T3/es not_active Expired - Lifetime
-
2008
- 2008-03-18 US US12/050,492 patent/US20080184381A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
WO2002046404A9 (en) | 2002-08-15 |
AU3357302A (en) | 2002-06-18 |
ES2271092T3 (es) | 2007-04-16 |
AU2002233573B2 (en) | 2007-03-01 |
EA200500974A1 (ru) | 2006-02-24 |
US20080184381A1 (en) | 2008-07-31 |
DE60123109D1 (de) | 2006-10-26 |
MXPA03005069A (es) | 2003-09-05 |
US20040091497A1 (en) | 2004-05-13 |
ATE339500T1 (de) | 2006-10-15 |
BR0115937A (pt) | 2003-09-30 |
EA008252B1 (ru) | 2007-04-27 |
JP2004525614A (ja) | 2004-08-26 |
EA200300642A1 (ru) | 2003-12-25 |
KR20030074643A (ko) | 2003-09-19 |
CA2430712A1 (en) | 2002-06-13 |
IL156073A0 (en) | 2003-12-23 |
WO2002046404A2 (en) | 2002-06-13 |
EP1339840A2 (en) | 2003-09-03 |
UA79927C2 (en) | 2007-08-10 |
EP1339840B1 (en) | 2006-09-13 |
WO2002046404A3 (en) | 2002-12-12 |
DE60123109T2 (de) | 2007-05-16 |
EA006367B1 (ru) | 2005-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2724527C2 (ru) | Композиции и способы модулирования экспрессии рецептора гормона роста | |
CN113853437A (zh) | 腺相关病毒载体用于在内耳中的毛细胞和支持细胞中校正基因缺陷/表达蛋白质的用途 | |
EP0973898A2 (en) | SECRETED EXPRESSED SEQUENCE TAGS (sESTs) | |
KR20210138587A (ko) | 개선된 면역요법을 위한 조합 유전자 표적 | |
CA2936612A1 (en) | Atf6 polymorphisms associated with myocardial infarction, method of detection and uses thereof | |
AU2016351889A1 (en) | Detection of foetal chromosomal aneuploidies using DNA regions that are differentially methylated between the foetus and the pregnant female | |
EP0973899A2 (en) | SECRETED EXPRESSED SEQUENCE TAGS (sESTs) | |
KR20160037895A (ko) | 성장 호르몬 수용체의 조절인자 | |
KR20080096495A (ko) | 소과 동물에서 배최장근 최대력, 근내 지방, 식용우소매유통 생산량 및 순 사료 섭취량으로부터 선택된 형질을평가하는 방법 | |
KR101621273B1 (ko) | 카텝신 c의 용도 | |
KR20220160053A (ko) | 다발성 골수종에서의 면역요법 표적 및 그의 식별 방법 | |
CN1423696A (zh) | 人类精神分裂症基因 | |
CN101151371B (zh) | 治疗中的逆转录转座子抑制 | |
US6262334B1 (en) | Human genes and expression products: II | |
JP2001245666A (ja) | 新規ポリペプチド | |
US20040091497A1 (en) | Schizophrenia-related voltage-gated ion channel gene and protein | |
AU778868B2 (en) | Schizophrenia associated genes, proteins and biallelic markers | |
CN115151558A (zh) | 哺乳动物序列中的靶向整合增强基因表达 | |
KR20210144822A (ko) | Ube3a-ats를 조절하기 위한 화합물 및 방법 | |
CN111344408A (zh) | 用于调控fndc3b表达的寡核苷酸 | |
CA2474759A1 (en) | Gene for peripheral arterial occlusive disease | |
KR102477906B1 (ko) | 유도만능 줄기세포 분화 특이적 lncRNA, 및 이의 용도 | |
KR20210116480A (ko) | 기분 장애의 설치류 모델 | |
KR100998272B1 (ko) | 단백질 지령부위내 단반복 염기서열을 갖는 신규 유전자 | |
KR100934286B1 (ko) | 골다공증 예측용 다형성 마커 및 이를 이용한 골다공증예측 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1088358 Country of ref document: HK |
|
AD01 | Patent right deemed abandoned | ||
C20 | Patent right or utility model deemed to be abandoned or is abandoned | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1088358 Country of ref document: HK |