TW202334402A - 包含整合cas9基因以產生穩定整合位點的哺乳動物細胞,以及包含穩定整合位點及其他位點的哺乳動物細胞 - Google Patents
包含整合cas9基因以產生穩定整合位點的哺乳動物細胞,以及包含穩定整合位點及其他位點的哺乳動物細胞 Download PDFInfo
- Publication number
- TW202334402A TW202334402A TW111139393A TW111139393A TW202334402A TW 202334402 A TW202334402 A TW 202334402A TW 111139393 A TW111139393 A TW 111139393A TW 111139393 A TW111139393 A TW 111139393A TW 202334402 A TW202334402 A TW 202334402A
- Authority
- TW
- Taiwan
- Prior art keywords
- mammalian cell
- protein
- stable integration
- seq
- cell
- Prior art date
Links
- 230000010354 integration Effects 0.000 title claims abstract description 181
- 210000004962 mammalian cell Anatomy 0.000 title claims abstract description 136
- 101150038500 cas9 gene Proteins 0.000 title 1
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 325
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 187
- 210000004027 cell Anatomy 0.000 claims abstract description 150
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 85
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 85
- 239000002157 polynucleotide Substances 0.000 claims abstract description 85
- 238000000034 method Methods 0.000 claims abstract description 44
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 16
- 108010067390 Viral Proteins Proteins 0.000 claims abstract description 15
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 13
- 229920001184 polypeptide Polymers 0.000 claims abstract description 12
- 108020004414 DNA Proteins 0.000 claims description 111
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 84
- 108700008625 Reporter Genes Proteins 0.000 claims description 80
- 239000003550 marker Substances 0.000 claims description 58
- 108091033409 CRISPR Proteins 0.000 claims description 52
- 230000004048 modification Effects 0.000 claims description 42
- 238000012986 modification Methods 0.000 claims description 42
- 238000003780 insertion Methods 0.000 claims description 37
- 230000037431 insertion Effects 0.000 claims description 37
- 210000004978 chinese hamster ovary cell Anatomy 0.000 claims description 33
- 239000002773 nucleotide Substances 0.000 claims description 24
- 125000003729 nucleotide group Chemical group 0.000 claims description 24
- 230000002401 inhibitory effect Effects 0.000 claims description 18
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 17
- 102000018120 Recombinases Human genes 0.000 claims description 17
- 108010091086 Recombinases Proteins 0.000 claims description 17
- 230000000295 complement effect Effects 0.000 claims description 17
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 claims description 13
- 210000005260 human cell Anatomy 0.000 claims description 12
- 238000010354 CRISPR gene editing Methods 0.000 claims description 11
- 108091006047 fluorescent proteins Proteins 0.000 claims description 11
- 102000034287 fluorescent proteins Human genes 0.000 claims description 11
- 239000003446 ligand Substances 0.000 claims description 10
- 241000701161 unidentified adenovirus Species 0.000 claims description 10
- 210000003425 amniotic epithelial cell Anatomy 0.000 claims description 9
- 230000001404 mediated effect Effects 0.000 claims description 9
- 241000702421 Dependoparvovirus Species 0.000 claims description 5
- 108700012359 toxins Proteins 0.000 claims description 5
- 108010068426 Contractile Proteins Proteins 0.000 claims description 3
- 102000002585 Contractile Proteins Human genes 0.000 claims description 3
- 102000004190 Enzymes Human genes 0.000 claims description 3
- 108090000790 Enzymes Proteins 0.000 claims description 3
- 102000003800 Selectins Human genes 0.000 claims description 3
- 108090000184 Selectins Proteins 0.000 claims description 3
- 101710172711 Structural protein Proteins 0.000 claims description 3
- 230000000692 anti-sense effect Effects 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- 229940088597 hormone Drugs 0.000 claims description 3
- 239000005556 hormone Substances 0.000 claims description 3
- 230000031787 nutrient reservoir activity Effects 0.000 claims description 3
- 231100000654 protein toxin Toxicity 0.000 claims description 3
- 102000009109 Fc receptors Human genes 0.000 claims description 2
- 108010087819 Fc receptors Proteins 0.000 claims description 2
- 102000005665 Neurotransmitter Transport Proteins Human genes 0.000 claims description 2
- 108010084810 Neurotransmitter Transport Proteins Proteins 0.000 claims description 2
- 238000003306 harvesting Methods 0.000 claims description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 claims 2
- 108091081021 Sense strand Proteins 0.000 claims 1
- 230000003213 activating effect Effects 0.000 claims 1
- 230000035772 mutation Effects 0.000 claims 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 abstract description 9
- 238000004519 manufacturing process Methods 0.000 abstract description 7
- 239000013603 viral vector Substances 0.000 abstract description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 136
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 20
- 239000013612 plasmid Substances 0.000 description 15
- 208000005229 Autosomal recessive Robinow syndrome Diseases 0.000 description 14
- 238000001945 resonance Rayleigh scattering spectroscopy Methods 0.000 description 14
- 150000007523 nucleic acids Chemical group 0.000 description 13
- 230000008488 polyadenylation Effects 0.000 description 13
- 210000002706 plastid Anatomy 0.000 description 11
- 230000008685 targeting Effects 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 102000039446 nucleic acids Human genes 0.000 description 9
- 108020004707 nucleic acids Proteins 0.000 description 9
- 239000002253 acid Substances 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 102100021705 C1GALT1-specific chaperone 1 Human genes 0.000 description 7
- 101000896591 Homo sapiens C1GALT1-specific chaperone 1 Proteins 0.000 description 7
- 239000004098 Tetracycline Substances 0.000 description 7
- 210000000349 chromosome Anatomy 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 238000005215 recombination Methods 0.000 description 7
- 229960002180 tetracycline Drugs 0.000 description 7
- 229930101283 tetracycline Natural products 0.000 description 7
- 235000019364 tetracycline Nutrition 0.000 description 7
- 150000003522 tetracyclines Chemical class 0.000 description 7
- 239000000543 intermediate Substances 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 5
- 241000699800 Cricetinae Species 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 150000007513 acids Chemical class 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 4
- 108020005004 Guide RNA Proteins 0.000 description 4
- 101000594765 Homo sapiens Protein NOXP20 Proteins 0.000 description 4
- 102100036207 Protein NOXP20 Human genes 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 102000005962 receptors Human genes 0.000 description 4
- 108020003175 receptors Proteins 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 4
- 206010059866 Drug resistance Diseases 0.000 description 3
- 102100034477 H(+)/Cl(-) exchange transporter 3 Human genes 0.000 description 3
- 101000710223 Homo sapiens H(+)/Cl(-) exchange transporter 3 Proteins 0.000 description 3
- 101000829168 Homo sapiens Succinate-semialdehyde dehydrogenase, mitochondrial Proteins 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 101710143114 Mothers against decapentaplegic homolog 6 Proteins 0.000 description 3
- 102100030590 Mothers against decapentaplegic homolog 6 Human genes 0.000 description 3
- 102100023673 Succinate-semialdehyde dehydrogenase, mitochondrial Human genes 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 102100022523 Acetoacetyl-CoA synthetase Human genes 0.000 description 2
- 102100036792 Adhesion G protein-coupled receptor L4 Human genes 0.000 description 2
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 2
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 102100022526 Bone morphogenetic protein 5 Human genes 0.000 description 2
- 102100023310 Centrosomal protein of 128 kDa Human genes 0.000 description 2
- 101710170458 Centrosomal protein of 128 kDa Proteins 0.000 description 2
- 102100029397 Chloride channel CLIC-like protein 1 Human genes 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108091006020 Fc-tagged proteins Proteins 0.000 description 2
- 102100023378 Fer-1-like protein 4 Human genes 0.000 description 2
- 241000710198 Foot-and-mouth disease virus Species 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 229930182566 Gentamicin Natural products 0.000 description 2
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 2
- 101000678027 Homo sapiens Acetoacetyl-CoA synthetase Proteins 0.000 description 2
- 101000928172 Homo sapiens Adhesion G protein-coupled receptor L4 Proteins 0.000 description 2
- 101000899388 Homo sapiens Bone morphogenetic protein 5 Proteins 0.000 description 2
- 101000989992 Homo sapiens Chloride channel CLIC-like protein 1 Proteins 0.000 description 2
- 101000907567 Homo sapiens Fer-1-like protein 4 Proteins 0.000 description 2
- 101001017764 Homo sapiens Lipopolysaccharide-responsive and beige-like anchor protein Proteins 0.000 description 2
- 101001009683 Homo sapiens Neuronal membrane glycoprotein M6-a Proteins 0.000 description 2
- 101000591234 Homo sapiens Phosphatidylinositol phosphatase PTPRQ Proteins 0.000 description 2
- 101000591236 Homo sapiens Receptor-type tyrosine-protein phosphatase R Proteins 0.000 description 2
- 101000826125 Homo sapiens Single-stranded DNA-binding protein 2 Proteins 0.000 description 2
- 101000797207 Homo sapiens tRNA (adenine(58)-N(1))-methyltransferase non-catalytic subunit TRM6 Proteins 0.000 description 2
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 2
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 2
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- 102100033353 Lipopolysaccharide-responsive and beige-like anchor protein Human genes 0.000 description 2
- 102100030394 Neuronal membrane glycoprotein M6-a Human genes 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 102100034101 Receptor-type tyrosine-protein phosphatase R Human genes 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 102100023007 Single-stranded DNA-binding protein 2 Human genes 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 108700026226 TATA Box Proteins 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 150000001413 amino acids Chemical group 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000009126 molecular therapy Methods 0.000 description 2
- 108010079892 phosphoglycerol kinase Proteins 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 102100032968 tRNA (adenine(58)-N(1))-methyltransferase non-catalytic subunit TRM6 Human genes 0.000 description 2
- 108700020534 tetracycline resistance-encoding transposon repressor Proteins 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 101150084750 1 gene Proteins 0.000 description 1
- 101150028074 2 gene Proteins 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 235000017399 Caesalpinia tinctoria Nutrition 0.000 description 1
- 101150117824 Calr gene Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 101150027751 Casr gene Proteins 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 241000006867 Discosoma Species 0.000 description 1
- 101150029010 Edc3 gene Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108010058643 Fungal Proteins Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102000018071 Immunoglobulin Fc Fragments Human genes 0.000 description 1
- 108010091135 Immunoglobulin Fc Fragments Proteins 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 108050005311 LexA-like Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 101000819644 Lysinibacillus sphaericus UPF0309 protein in nagA 3'region Proteins 0.000 description 1
- 108091027974 Mature messenger RNA Proteins 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 101150082137 Mtrr gene Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 102100026925 Myosin regulatory light chain 2, ventricular/cardiac muscle isoform Human genes 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 102000016387 Pancreatic elastase Human genes 0.000 description 1
- 108010067372 Pancreatic elastase Proteins 0.000 description 1
- 108010064851 Plant Proteins Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100273994 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) CFT2 gene Proteins 0.000 description 1
- 241000701835 Salmonella virus P22 Species 0.000 description 1
- 101000901034 Streptococcus gordonii Accessory Sec system protein Asp2 Proteins 0.000 description 1
- 108700025695 Suppressor Genes Proteins 0.000 description 1
- 241000388430 Tara Species 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108010084455 Zeocin Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 125000004093 cyano group Chemical group *C#N 0.000 description 1
- 108010086385 cytomegalovirus immediate-early proteins Proteins 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 238000006392 deoxygenation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 108091006086 inhibitor proteins Proteins 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 108010065781 myosin light chain 2 Proteins 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 239000002858 neurotransmitter agent Substances 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 235000021118 plant-derived protein Nutrition 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 239000013587 production medium Substances 0.000 description 1
- -1 promoters Substances 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 101150006320 trpR gene Proteins 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0684—Cells of the urinary tract or kidneys
- C12N5/0686—Kidney cells
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/635—Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0681—Cells of the genital tract; Non-germinal cells from gonads
- C12N5/0682—Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/30—Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2820/00—Vectors comprising a special origin of replication system
- C12N2820/002—Vectors comprising a special origin of replication system inducible or controllable
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2840/00—Vectors comprising a special translation-regulating system
- C12N2840/20—Vectors comprising a special translation-regulating system translation of more than one cistron
- C12N2840/203—Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Urology & Nephrology (AREA)
- Virology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Reproductive Health (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本發明提供包含多個穩定整合位點之哺乳動物細胞。本發明提供基因體學地引入至基因體安全港中且在該特定基因體安全港,包括但不限於另一基因體安全港之外基因體學地引入的位點。編碼所關注多肽或RNA之所關注多核苷酸可插入至根據本發明提供之該等穩定整合位點中。本發明之細胞及方法可用於高產率產生任何蛋白質,包括病毒蛋白。此外,本發明之細胞及方法適用於產生病毒載體,諸如AAV、抗體及其他蛋白質。
Description
本申請案主張2021年10月18日申請之美國申請案第63/256,675號之優先權,該案特此以全文引用之方式併入。
本發明提供包含多個穩定整合位點(Stable Integration Sites,SIS)之哺乳動物細胞(包括細胞株),哺乳動物細胞包括人類及嚙齒動物細胞(包括細胞株),該等穩定整合位點可使用整合Cas9基因產生。本發明提供以下之穩定整合位點:(1)基因體學地引入至基因體安全港(Genomic Safe Harbor;GSH),例如AAVS1 (腺相關病毒整合位點1)及AAVS1樣中,及(2)在該特定基因體安全港,諸如不同基因體安全港或不為基因體安全港之其他區域之外基因體學地引入。編碼所關注多肽或RNA之所關注聚去氧核糖核苷酸可插入至根據本發明提供之該穩定整合位點中。
電子序列表之參考
本申請案含有序列表,該序列表已按.XML格式以電子方式提交且特此以全文引用之方式併入。2022年10月7日創建的該.XML複本被命名為「135975-97402.xml」且大小為709,205位元組。此.XML檔案中所含之序列表為說明書之部分且特此以全文引用之方式併入本文中。
哺乳動物細胞株為用於產生商業數量之治療蛋白(諸如抗體)的較佳途徑。然而,已報導,由於遺傳及表觀遺傳不穩定性,導致經修飾之哺乳動物細胞通常表現產量減少。Hilliard及Lee,
Biotech.Bioeng.118:659-75 (2021)。
多核苷酸之整合為用於產生且維持轉化細胞之較佳途徑。將特定序列整合至人類AAVS1中論述於Liu等人, BMC Research Note, 7:626 (2014)及Ramachandra等人,
Nucl.Acids Res.39: e107 (2011)中。人類AAVS1稱為基因體安全港。Papapetrou等人,
Molecular Therapy24:678-84 (2016)。Gaidukov等人,
Nucl.Acids Res.46:4072-86 (2018)已揭示整合至著陸墊(landing pad)中之DNA位點。
中國倉鼠卵巢(CHO)細胞及嬰兒倉鼠腎細胞用於產生治療蛋白,且已廣泛研究倉鼠基因體。Hamaker及Lee已報導CHO染色體基因座作為穩定整合之潛在位點且將其稱為「基因體熱點(genomic hot spot)」。
Curr.Op.Chem.Eng.22:152-60 (2018), 在153。在表1處,Hamaker及Lee鑑別30個熱點基因座,其中17個藉由基因鑑別且13個未經標註。
Curr.Op.Chem.Eng.22:152-60 (2018), 在154。此研究之後,Hilliard及Lee試圖使用表觀基因體分析鑑別CHO中之安全港區域。Hilliard及Lee,
Biotech.Bioeng.118:659-75 (2021)。作者確定10.9%之CHO基因體含有具有增強之遺傳及表觀遺傳穩定性的染色質結構。作者進一步確定在由Hamaker及Lee鑑別表1中之30個熱點中,其中五個與藉由高通量染色體構形捕獲(Hi-C)確定之穩定區域重疊。最接近該等區域之基因為
ALDH5A1、
SMAD6及
CLCN3,且兩個其他區域未經標註。Hilliard及Lee,
Biotech.Bioeng.118:659-75 (2021),見補充表3(S3)。Gaidukov等人
, Nucl.Acids Res.46:4072-86 (2018)在表1亦鑑別用於在CHO細胞中整合之基因座。Lee等人
, Scientific Reps.5:8572 (2015)鑑別
COSMC基因座。
本發明有利地採用整合Cas9基因來有效地產生哺乳動物細胞中間物,該等哺乳動物細胞中間物進一步經修飾以提供具有多個穩定整合位點之哺乳動物細胞以用於穩定整合多個DNA卡匣及其他所關注聚去氧核糖核苷酸。根據本發明,穩定整合位點可位於基因體安全港或其他區域中,包括新鑑別的基因體安全港。
本發明提供一種哺乳動物細胞,其中其任何細胞可包含位於基因體安全港中之第一穩定整合位點及不位於基因體安全港中之第二穩定整合位點,其中第一穩定整合位點包含編碼第一報導蛋白之第一報導基因且第二穩定整合位點包含編碼第二報導蛋白之第二報導基因,其中第一報導蛋白及第二報導蛋白不同。第一穩定整合位點及第二穩定整合位點可包含重組酶識別位點(RRS)。第一報導基因及第二報導基因可處於SV40啟動子之控制下。第一報導基因及第二報導基因可為螢光蛋白。細胞可進一步包含編碼處於CMV啟動子之控制下之抑制蛋白的多核苷酸。細胞可為人類羊膜上皮細胞(Human Amniotic Epithelial)、HEK 293細胞、CHO細胞或BHK細胞。編碼所關注蛋白質之多核苷酸可插入至第一穩定整合位點或第二穩定整合位點中。第二穩定整合位點可位於與第一基因體安全港不同之第二基因體安全港中或位於不為基因體安全港之區域中。
本發明亦提供哺乳動物細胞,其中其任何細胞可包含位於基因體安全港中之第一穩定整合位點及不位於第一基因體安全港中之第二穩定整合位點,其中第一穩定整合位點包含編碼第一蛋白質之第一多核苷酸且第二穩定整合位點包含編碼第二蛋白質之第二多核苷酸。第一蛋白質及第二蛋白質可為病毒蛋白,諸如腺病毒相關病毒蛋白或腺病毒蛋白。舉例而言,哺乳動物細胞可包含編碼腺相關病毒蛋白之多核苷酸及編碼腺病毒蛋白之多核苷酸。編碼蛋白質之其他多核苷酸包括但不限於例如抗體基因。細胞可具有第二穩定整合位點,該第二穩定整合位點位於與第一穩定整合位點所位於之第一基因體安全港不同的第二基因體安全港中,或位於不為基因體安全港之區域中。
本發明進一步提供一種哺乳動物細胞,其中其任何細胞可包含位於基因體安全港中之第一穩定整合位點及不位於基因體安全港中之第二穩定整合位點,其中第一穩定整合位點包含編碼第一報導基因之多核苷酸,該第一報導基因編碼第一報導蛋白,且第二穩定整合位點包含編碼Cas9之多核苷酸及編碼第二報導基因之多核苷酸,該第二報導基因編碼第二報導蛋白,其中第一報導蛋白及第二報導蛋白不同。第二穩定整合位點可進一步包含選擇標記基因及內部核糖體進入位點(IRES)。第一穩定整合位點及第二穩定整合位點可包含重組酶識別位點。第一報導基因及第二報導基因可處於SV40啟動子之控制下。第一報導基因及第二報導基因可為螢光蛋白。細胞可進一步包含編碼處於啟動子(例如,CMV)之控制下之抑制因子(例如,TetR)的多核苷酸。細胞可為人類羊膜上皮細胞、HEK293細胞、CHO細胞或BHK細胞。編碼所關注蛋白質之多核苷酸可插入至第一穩定整合位點或第二穩定整合位點中。選擇標記蛋白可賦予抗藥性。第二報導基因、選擇標記基因、IRES及SV40啟動子可佈置於DNA卡匣上。細胞可進一步包含編碼處於啟動子(例如,CMV)之控制下之抑制蛋白的多核苷酸。第二穩定整合位點可位於與第一穩定整合位點所位於的第一基因體安全港不同之第二基因體安全港中,或位於不為基因體安全港之區域中。第一報導基因可由5'基因體安全港同源臂及3'基因體安全港同源臂側接。5'基因體安全港同源臂可包含CRISPR sgRNA目標位點且3'基因體安全港同源臂可包含CRISPR sgRNA目標位點。
本發明進一步提供用於製備至少一種所關注蛋白質之方法,其中其任何方法可包含:(a)提供哺乳動物細胞,其包含位於基因體安全港中之第一穩定整合位點及不位於第一基因體安全港中之第二穩定整合位點,其中第一穩定整合位點包含編碼第一報導蛋白之第一報導基因且第二穩定整合位點包含編碼第二報導蛋白之第二報導基因,其中第一報導蛋白及第二報導蛋白不同,且其中第一及第二穩定整合位點包含重組酶識別位點;(b)藉由重組酶介導之卡匣交換盒式交換(cassette exchange)將編碼所關注蛋白質之多核苷酸引入至穩定整合位點中,及(c)在允許表現編碼所關注多核苷酸之多核苷酸的條件下培養哺乳動物細胞。第一報導基因及第二報導基因可處於SV40啟動子之控制下。第一報導基因及第二報導基因可為螢光蛋白。細胞可進一步包含編碼處於CMV啟動子之控制下之抑制蛋白的多核苷酸。細胞可為人類羊膜上皮細胞、HEK 293細胞、CHO細胞或BHK細胞。編碼所關注蛋白質之多核苷酸可插入至第一穩定整合位點或第二穩定整合位點中。第二穩定整合位點可位於與第一穩定整合位點所位於的第一基因體安全港不同之第二基因體安全港中,或位於不為基因體安全港之區域中。第一穩定整合位點包含編碼第一蛋白質之第一多核苷酸且第二穩定整合位點包含編碼第二蛋白質之第二多核苷酸。第一蛋白質及第二蛋白質可為病毒蛋白,諸如腺病毒相關病毒蛋白或腺病毒蛋白。舉例而言,哺乳動物細胞可包含編碼腺相關病毒蛋白之多核苷酸及編碼腺病毒蛋白之多核苷酸。編碼蛋白質之其他多核苷酸包括但不限於例如抗體基因。第二穩定整合位點亦可位於不為基因體安全港之區域中。
本發明進一步提供產生具有多個穩定整合位點之哺乳動物細胞的方法,其中其任何方法可包含:(A)提供哺乳動物細胞,其包含第一DNA卡匣,該第一DNA卡匣以5'至3'順序包含編碼第一lox位點的多核苷酸、啟動子、編碼選擇標記蛋白之選擇標記基因、IRES、編碼第一報導蛋白之第一報導基因、可操作地連接至操縱子之啟動子、Cas9基因及第二lox位點;(B)整合第二DNA卡匣,其包含多核苷酸,該多核苷酸以5'至3'順序包含含有CRISPR sgRNA目標位點的第一基因體安全港同源臂、第三lox位點、編碼第二報導蛋白之第二報導基因、第四lox位點及CRISPR sgRNA目標位點的第二基因體安全港同源臂,其中第一lox位點、第二lox位點、第三lox位點及第四lox位點不同,其中第一導引臂及第二導引臂可含有具有變異之區域(若需要,以避免重新創造可靶向位點),且其中第二報導蛋白與第一報導蛋白不同;(C)將第一DNA卡匣與第三DNA盒式交換,其中第三DNA卡匣以5'至3'順序包含編碼第一lox位點的多核苷酸、啟動子、編碼第三報導蛋白之第三報導基因及第二lox位點,其中第三報導蛋白與第二報導蛋白不同,藉此提供具有多個穩定整合位點之哺乳動物細胞。哺乳動物細胞可為人類羊膜上皮細胞、HEK 293細胞、CHO細胞或BHK細胞。供使用之報導基因可為螢光蛋白。步驟(A)之細胞可進一步包含編碼處於啟動子(例如,CMV)之控制下之抑制因子(例如,TetR)的多核苷酸。步驟(B)之細胞可進一步包含編碼處於啟動子(例如,CMV)之控制下之抑制因子(例如,TetR)的多核苷酸。步驟(C)之細胞可進一步包含編碼處於啟動子(例如,CMV)之控制下之抑制因子(例如,TetR)的多核苷酸。選擇標記蛋白可賦予抗藥性。Lox位點為最常用類型之RRS;然而,亦可使用不同RRS。
本發明亦提供產生具有多個重組酶介導之盒式交換位點之哺乳動物細胞的方法,其中其任何方法可包含:(A)將啟動子及編碼抑制因子之多核苷酸隨機整合至細胞基因體中,其中抑制因子可結合於配位體;(B)將第一DNA卡匣隨機整合至細胞基因體中,該第一DNA卡匣以5'至3'順序包含編碼第一lox位點、啟動子及視情況存在之操縱子、編碼第一報導蛋白之第一報導基因、IRES、編碼第一選擇標記蛋白之第一選擇標記基因及第二lox位點的多核苷酸,其中第一lox位點及第二lox位點不同;(C)將第一DNA卡匣與第二DNA盒式交換,其中第二DNA卡匣以5'至3'順序包含編碼第一lox位點、啟動子、編碼第二選擇標記蛋白之第二選擇標記基因、IRES、編碼第二報導蛋白之第二報導基因、啟動子及視情況存在之操縱子、Cas9基因及第二lox位點的多核苷酸,其中第一選擇標記蛋白及第二選擇標記蛋白不同且第一報導蛋白及第二報導蛋白不同;(D)整合第三DNA卡匣,該第三DNA卡匣以5'至3'順序包含多核苷酸,該多核苷酸包含含有sgRNA (單導引RNA)目標位點、第三lox位點、編碼第三報導蛋白之第三報導基因、第四lox位點的第一基因體安全港(GSH)同源臂及含有sgRNA目標位點的第二GSH同源臂,其中第一lox位點、第二lox位點、第三lox位點及第四lox位點不同,其中第一導引臂及第二導引臂可含有至少一個具有變異之區域(若需要,以避免重新創造可靶向位點),且其中第三報導蛋白與第二報導蛋白不同且可與第一報導蛋白相同或不同;及(E)將第二DNA卡匣與第四DNA盒式交換,其中第四DNA卡匣以5'至3'順序包含編碼第一lox位點、啟動子、編碼第四報導蛋白之第四報導基因及第二lox位點的多核苷酸,其中第四報導蛋白與第三報導蛋白不同且第二報導蛋白較佳與第一報導蛋白不同,藉此提供具有多個穩定整合位點之細胞。Lox位點為最常用類型之RRS;然而,亦可使用不同RRS。
本發明進一步提供包含經修飾基因體之哺乳動物細胞,其中給定基因體藉由在基因體之不同區域插入至少三個DNA卡匣而經修飾,其中經修飾基因體包含(1)在修飾之前與選自由SEQ ID NO: 1及2所組成之群組的至少一者至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的第一去氧核糖核酸序列;(2)在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的第二去氧核糖核酸序列;及(3)在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%一致的第三去氧核糖核酸序列,其中第一去氧核糖核酸序列藉由插入第一DNA卡匣而經修飾,第二去氧核糖核酸序列藉由插入第二DNA卡匣而經修飾,且第三去氧核糖核酸序列藉由插入第三DNA卡匣而經修飾。哺乳動物細胞可各自具有(a)第一DNA卡匣,其包含啟動子及選自由可選標記基因及報導基因所組成之群組的至少一者;(b)第二DNA卡匣,其包含啟動子及選自由可選標記基因及報導基因所組成之群組的至少一者;及(c)第三DNA卡匣,其包含啟動子及選自由可選標記基因及報導基因所組成之群組的至少一者。此外,哺乳動物細胞可各自具有(a)第一DNA卡匣,其包含啟動子、可選標記基因及報導基因;(b)第二DNA卡匣,其包含啟動子、可選標記基因及報導基因;及(c)第三DNA卡匣,其包含啟動子、可選標記基因及報導基因。第一去氧核糖核酸序列包含穩定整合位點及其中插入之所關注基因。所關注基因可編碼選自由以下所組成之群組的所關注多肽:抗體、抗體鏈、受體、含Fc蛋白、阱蛋白(trap protein)、酶、因子、抑制因子、活化因子、配位體、報導蛋白、選擇蛋白、蛋白賀爾蒙(protein hormone)、蛋白毒素、結構蛋白、儲存蛋白、轉運蛋白、神經傳導物質(neurotransmitter)及收縮性蛋白。哺乳動物細胞可為人類細胞且第一去氧核糖核酸序列與SEQ ID NO: 1至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致。替代地,哺乳動物細胞可為CHO細胞且第一去氧核糖核酸序列與SEQ ID NO: 2至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致。第一去氧核糖核酸序列可包含使用選自由SEQ ID NO: 13至419所組成之群組之導引序列產生的穩定整合位點。此外,第一去氧核糖核酸序列可包含藉由使用在選自由以下所組成之群組的核苷酸位置範圍處與SEQ ID NO: 2中之目標序列結合及/或互補的導引序列產生的穩定整合位點:(a) 1至2000;(b) 2001至4000;(c) 4001至6000;(d) 6001至8000;(e) 8001至10,000;(f) 10,001至12,000;(g) 12,001至14,000;(h) 14,001至16,000;(i) 16,001至18,000;(j) 18,001至20,000;(k) 20,001至22,000;(l) 22,001至24,000;(m) 24,001至26,000;(n) 26,001至28,000;(o) 28,001至30,000;(p) 30,001至32,000;(q) 32,001至34,000;(r) 34,001至36,000;(s) 36,001至38,000;(t) 38,001至40,000;(u) 40,001至42,000;及(v) 42,001至末端(44,232)。
此外,提供包含經修飾基因體之哺乳動物細胞,其中經修飾基因體包含去氧核糖核酸序列,該去氧核糖核酸序列包含藉由插入至少一個DNA卡匣而經修飾的AAVS1樣區域,且其中選自由SEQ ID NO: 13至419所組成之群組的導引序列與AAVS1樣區域之有義股或反義股結合及/或互補。哺乳動物細胞可進一步包含在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的第二去氧核糖核酸序列;及在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的第三去氧核糖核酸序列,其中第一去氧核糖核酸序列藉由插入第一DNA卡匣而經修飾,第二去氧核糖核酸序列藉由插入第二DNA卡匣而經修飾,且第三去氧核糖核酸序列藉由插入第三DNA卡匣而經修飾。第二去氧核糖核酸序列在修飾之與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致;且第三去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致。第一去氧核糖核酸序列包含藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性之目標序列結合及/或互補的導引序列產生的穩定整合位點而產生:(a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
亦提供包含經修飾基因體之哺乳動物細胞,其中經修飾基因體包含AAVS1樣區域中之穩定整合位點,其中穩定整合位點係藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性之目標序列結合及/或互補的導引序列產生:(a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
進一步提供根據前述一段落之哺乳動物細胞,其進一步包含在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的第二去氧核糖核酸序列;及在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的第三去氧核糖核酸序列,其中第一去氧核糖核酸序列藉由插入第一DNA卡匣而經修飾,第二去氧核糖核酸序列藉由插入第二DNA卡匣而經修飾,且第三去氧核糖核酸序列藉由插入第三DNA卡匣而經修飾。哺乳動物細胞可具有在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的第二去氧核糖核酸序列;及在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的第三去氧核糖核酸序列。
此外,提供產生所關注蛋白質之方法,其中該方法包含以下步驟:(1)培養上述哺乳動物細胞;及(2)收穫所關注蛋白質。亦提供根據上述方法中之任一者製備的細胞,以及使用所揭示細胞之方法。
定義
除非另外規定,否則本文中所用之所有技術及科學術語具有與本發明所屬領域之具有通常知識者通常所理解相同的含義。
在數值及範圍之情形下,術語「約」係指近似或接近所陳述值或範圍之值或範圍,使得本發明可執行,諸如具有所尋求之速率、量、程度、增加、減少或表現程度、濃度或時間,如自本文中所含有之教示內容顯而易見。因此,此術語涵蓋之值超出僅由系統誤差引起之值。舉例而言,視執行能力而定,「約」可表示高於或低於在大約+/-10%或更大或更小之範圍內之所陳述值的值。
「AAVS1」可為基因體安全港且係指腺相關病毒整合位點1,且據報導,其實質上位於人類染色體19上且含有大約4.7千鹼基。根據本發明,可使用AAVS1基因座。
「AAVS1樣」係指CHO細胞中發現之AAVS1同源物且揭示於本文中。可根據本發明使用含有AAVS1樣基因體安全港(GSH)之AAVS1樣區域。SEQ ID NO: 2為AAVS1樣區域之實例。
「DNA卡匣」或「卡匣」為一種類型之核酸部分,其包含至少一啟動子、至少一個開放閱讀框架及視情況存在之聚腺苷酸化訊號(例如SV40聚腺苷酸化訊號)。其他核酸部分(諸如操縱子)亦為視情況存在的。DNA卡匣因此為多核苷酸,其包含兩種或更多種較短多核苷酸。卡匣可包含一個或多個基因及啟動子、強化子、操縱子、抑制因子、轉錄終止訊號、核糖體進入位點、內含子及聚腺苷酸化訊號。
據報導,「COSMC」已發現於倉鼠細胞中。部分或整個COSMC基因座之同源物為根據本發明使用之候選物。
「CCR5」係指C-C趨化因子受體5型基因,且據報導已發現於人類、小鼠及大鼠細胞中。部分或整個CCR5基因座之同源物為根據本發明使用之候選物。
「基因體安全港」或「GSH」係指可接納多核苷酸(諸如DNA卡匣)之插入且准許插入多核苷酸以起作用且不對轉化細胞造成不當負擔的細胞基因體中之位點。因此,基因體安全港為經由本發明之實踐產生用於插入DNA卡匣之穩定整合位點的理想位置。本文中可利用的基因體安全港包括但不限於AAVS1及AAVS1樣。作為候選物之所報導基因座包括但不限於CCR5、COSMC及Rosa26。
「基因體安全港同源臂」或「GSH同源臂」衍生自基因體安全港且與基因體安全港具有同源性。較佳地,基因體安全港同源臂包含約100至2000個鹼基,更佳約300至1800個鹼基,更佳約400至1600個鹼基,更佳約500至1500個鹼基,更佳約500至1300個鹼基,更佳約500至1100個鹼基,更佳約500至1000個鹼基,更佳約600至1000個鹼基,更佳約700至1000個鹼基,更佳約800至1000個鹼基,且仍更佳約900至1000個鹼基。通常,待插入至基因體安全港中之多核苷酸將由5' GSH同源臂及3' GSH同源臂側接。舉例而言,參見圖4及5,其展示進一步由GSH同源臂側接的lox位點側接之DNA卡匣。
「hRosa26」係指鼠類Rosa26基因座之人類同源物(「反向定向剪接受體」)。「Rosa26」係指部分或整個Rosa26基因座,且據報導,除小鼠及人類細胞以外,已發現於之倉鼠細胞中。部分或整個Rosa26基因座之同源物為根據本發明使用之候選物。
「內含子」為位於外顯子之間的DNA區段。內含子經移除以形成成熟信使RNA。較佳的內含子為可影響轉譯起點之彼等內含子,且範例為hCMV-IE內含子(人類巨細胞病毒即刻早期蛋白)及FMDV內含子(口蹄疫病毒)。
「核酸部分」包括單股或雙股核苷酸序列之任何佈置。核酸部分可包括但不限於多核苷酸、啟動子、強化子、操縱子、抑制因子、轉錄終止訊號、核糖體進入位點及聚腺苷酸化訊號。
「可操作地連接」係指與一個或多個其他核苷酸序列處於功能性關係的一個或多個核苷酸序列。根據選定設計,此類功能關係可直接地或間接地控制、引起、調節、增強、促進、准許、衰減、抑制或阻斷作用或活性。範例包括單股或雙股核酸部分,且可包含兩個或更多個以使得序列可對其他序列發揮至少一種功能作用之方式佈置於給定部分內的核苷酸序列。舉例而言,可操作地連接至DNA多核苷酸序列之編碼區的啟動子可促進編碼區之轉錄。諸如強化子、操縱子、抑制因子、轉錄終止訊號、核糖體進入位點及聚腺苷酸化訊號之其他元件亦可與所關注多核苷酸可操作地連接以控制其表現。達成可操作連接之佈置及間距可藉由本領域具有通常知識者可獲得之方法,諸如使用西方墨點及RT-PCR之篩選來確定。
視具體情況而定,「操縱子」表示以使得多核苷酸序列可藉由能夠結合於操縱子之分子之相互作用調節的方式引入多核苷酸序列中或附近的DNA序列,且因此防止或允許多核苷酸序列之轉錄。本領域具有通常知識者將認識到操縱子必須充分接近啟動子定位,使得其能夠控制或影響啟動子之轉錄,此可被視為一種類型的可操作連接。操縱子可置放於啟動子之下游或上游。此等包括但不限於大腸桿菌(
E. coli)之Lex A基因之操縱子區域,其結合Lex A肽及乳糖及45個色胺酸操縱子,其結合由大腸桿菌之Lad及trpR基因編碼的抑制蛋白。噬菌體操縱子來自λ Pi及噬菌體P22 Mnt及Arc。較佳的操縱子為Tet (四環素)操縱子(TetO或TO)及Arc操縱子(ArcO或AO)。操縱子可具有天然序列或突變序列。舉例而言,Tet操縱子之突變序列揭示於Wissmann等人,
Nucleic Acids Res.14:4253-4266 (1986)中。
Tet操縱子為較佳的,且可用於使用抑制因子控制轉錄,諸如四環素抑制因子(TetR)。抑制因子之合適配位體為四環素(tet)、去氧羥四環素(dox)及其衍生物。當配位體結合於TetR時,Tet抑制因子對Tet操縱子之親和力減弱且Tet抑制因子自操縱子分離,且藉此操縱子變得准許轉錄。其他抑制因子可經配對以供其自身各別操縱子使用。
當描述序列時,呈其各種文法形式之片語「百分比一致性」或「一致%」意謂包括沿連續同源區域顯示所陳述一致性的同源序列,但在計算百分比一致性時不考慮比較序列中不具有同源物的空隙、缺失或插入之存在。如本文所使用,同源物之間的「百分比一致性」或「一致%」測定將不包括同源物不具有同源序列以在比對中比較的序列之比較。因此,「百分比一致性」及「一致%」不包括空隙、缺失及插入之罰分(penalties)。
在核酸序列之情形下呈其各種文法形式的「同源序列」係指實質上與參考核酸序列同源的序列。在一些實施例中,若兩個序列中至少50%至99%、75%至99%、85%至99%、90%至99%、95%至98%、98%至99%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多其對應核苷酸在相關殘基片段上一致,則將兩個序列視為實質上同源。在一些實施例中,相關片段為完整(亦即,完全)序列。
「多核苷酸」包括共價接合之核苷酸序列,且包括RNA及DNA。將寡核苷酸視為較短多核苷酸。基因為最終編碼多肽之DNA多核苷酸(聚去氧核糖核苷酸),該等多肽通常自DNA轉錄之RNA (聚核糖核酸)轉譯。DNA多核苷酸亦可編碼不轉譯但實際上充當RNA「產物」之RNA多核苷酸。多核苷酸之類型(亦即,DNA或RNA)自術語之使用之情形中顯而易見。藉由其編碼之多肽提及或鑑別的多核苷酸根據密碼簡併闡述且涵蓋所有適合序列。包括本文中所揭示之彼等的多核苷酸在指示時包括一致性百分比序列及同源序列。
「多肽」及「肽」係指共價接合之胺基酸序列。多肽包括天然、半合成及合成蛋白質及蛋白質片段。「多肽」及「蛋白質」可互換使用。將寡肽視為較短多肽。
「啟動子」表示DNA序列,其引起與其可操作地連接(亦即,以使得在適當訊號存在且抑制因子不存在時轉錄所關注核苷酸序列之方式連接)的DNA序列之轉錄。可將所關注多核苷酸之表現置於本領域中已知之任何啟動子或強化子元件之控制下。真核啟動子可與TATA盒可操作地連接。TATA盒通常位於轉錄起始位點之上游。
可使用的適用啟動子包括但不限於SV40早期啟動子區、SV40 E/L (早期/晚期)啟動子、含於勞氏肉瘤病毒(Rous sarcoma virus)之3'長末端重複序列中之啟動子、金屬硫蛋白基因之調節序列、小鼠或人類巨細胞病毒主要即刻早期(CMV-MIE)啟動子及其他CMV啟動子,包括CMVmin啟動子。植物表現載體包含胭脂鹼(nopaline)合成酶啟動子區、花椰菜嵌紋病毒35S RNA啟動子及光合成酶核酮糖二磷酸羧化酶之啟動子;來自酵母或其他真菌之啟動子元件,諸如Gal 4啟動子、ADC (乙醇脫氫酶)啟動子、PGK (磷酸甘油激酶)啟動子、鹼性磷酸酶啟動子及以下動物轉錄控制區(其展現組織特異性且已用於轉殖基因動物中):彈性蛋白酶I;胰島素;免疫球蛋白;小鼠乳房腫瘤病毒;白蛋白;C.-胎蛋白;C.1-抗胰蛋白酶;3-血球蛋白;及肌凝蛋白輕鏈-2。根據本發明可使用各種形式之CMV啟動子。
諸如CMVmin啟動子之最小啟動子可為截斷啟動子或核心啟動子且較佳用於受控表現系統中。最小啟動子及開發方法為廣泛已知的且揭示於例如Saxena等人,
Methods Molec.Biol.1651:263-73 (2017);Ede等人
, ACS Synth Biol.5:395-404 (2016);Brown等人
, Biotech Bioeng.111:1638-47 (2014);Morita等人
, Biotechniques0:1-5 (2012);Lagrange等人
, Genes Dev.12:34-44(1998)中。存在此項技術中描述之許多CMVmin啟動子。
「所關注蛋白質」或「所關注多肽」可具有任何胺基酸序列且包括任何蛋白質、多肽或肽,及其衍生物、組分、域、鏈及片段。包括但不限於病毒蛋白、細菌蛋白、真菌蛋白、植物蛋白及動物(包括人類)蛋白。蛋白質類型可包括但不限於抗體、雙特異性抗體、多特異性抗體、抗體鏈(包括重鏈及輕鏈)、抗體片段、Fv片段、Fc片段、含Fc蛋白、Fc融合蛋白、受體Fc融合蛋白、受體、受體域、阱蛋白及微型阱蛋白、酶、因子、抑制因子、活化因子、配位體、報導蛋白、選擇蛋白、蛋白賀爾蒙、蛋白毒素、結構蛋白、儲存蛋白、轉運蛋白、神經傳導物質及收縮性蛋白。亦包括上述之衍生物、組分、鏈及片段。序列可為天然的、半合成的或合成的。所關注蛋白質及所關注多肽由「所關注基因」編碼,其亦可稱為「所關注多核苷酸」。在整合多個基因(相同或不同)的情況下,如自使用之情形顯而易見,其可稱為「第一」、「第二」、「第三」、「第四」、「第五」、「第六」、「第七」、「第八」、「第九」、「第十」等。
亦稱為「異種特異性重組位點」之「重組酶識別位點」(RRS)用於重組酶介導之盒式交換(RMCE)中。舉例而言,Cre/Lox、Dre/Rox、Vre/Vlox、SCre/Slox及Flp/Frt為適合的RRS系統。根據本發明使用之適合RRS包括Lox P、Lox 66、Lox 71、Lox 511、Lox 2272、Lox 2372、Lox 5171、Lox M2、Lox M3、lox M7及Lox M11。如自使用之情形顯而易見,此等位點一般可稱為第一(1)、第二(2)、第三(3)、第四(4)、第五(5)、第六(6)、第七(7)、第八(8)、第九(9)、第十(10)等。Cre/Lox為最常用之RRS,但根據本發明可使用其他RRS代替Cre/Lox。
如本文所使用之「報導蛋白」係指能夠直接地或間接地產生可偵測訊號之任何蛋白質。報導蛋白通常發螢光或催化比色或螢光反應,且通常稱為「螢光蛋白」或「顏色蛋白」。然而,報導蛋白亦可為非酶促及非螢光的,只要其可藉由另一種蛋白質或部分偵測,諸如用螢光配位體偵測到之細胞表面蛋白。報導蛋白亦可是經由與發螢光或催化反應之另一種蛋白質相互作用而起作用的非活性蛋白。因此,可使用如由本領域中具有通常知識者所瞭解到任何適合的報導蛋白。在一些範疇中,報導蛋白可選自螢光蛋白、螢光素酶、鹼性磷酸酶、β-半乳糖、β-內醯胺酶、二氫葉酸還原酶、泛蛋白及其變異體。視具體情況而定,螢光蛋白適用於識別已經或尚未成功插入及/或置換之基因卡匣。流式細胞測量術及螢光活化細胞分選適用於偵測。螢光蛋白之實例為本領域中熟知的,包括但不限於迪斯科馬珊瑚(Discosoma coral) (DsRed)、綠色螢光蛋白(GFP)、增強型綠色螢光蛋白(eGFP)、氰基螢光蛋白(CFP)、增強型氰基螢光蛋白(eCFP)、黃色螢光蛋白(YFP)、增強型黃色螢光蛋白(eYFP)及遠紅螢光蛋白(例如,mKate、mKate2、mPlum、mRaspberry或E2-緋紅)。參見例如美國專利第9,816,110號。報導蛋白由多核苷酸編碼且在本文中稱為「報導基因」或「報導蛋白基因」。如自使用之情形顯而易見,報導基因及蛋白一般可稱為第一(1)、第二(2)、第三(3)、第四(4)、第五(5)、第六(6)、第七(7)、第八(8)、第九(9)、第十(10)等。可將報導子視為一種類型之標記。「顏色(Color)」或「螢光」以其各種文法形式,亦可更特定言之係指報導蛋白或基因。
亦稱為「抑制因子」之「抑制因子蛋白」為可結合於DNA以便抑制因子轉錄之蛋白質,且由多核苷酸編碼,在本文中亦稱為「抑制因子基因」或「抑制因子蛋白基因」。抑制因子屬於真核及原核來源。原核抑制因子為較佳的。抑制因子家族之實例包括:TetR、LysR、LacI、ArsR、IcIR、MerR、AsnC、MarR、DeoR、GntR及Crp家族。TetR家族中之抑制因子蛋白包括:ArcR、ActII、AmeR、AmrR、ArpR、BpeR、EnvR、EthR、HemR、HydR、IfeR、LanK、LfrR、LmrA、MtrR、Pip、PqrA、QacR、RifQ、RmrR、SimReg2、SmeT、SrpR、TcmR、TetR、TtgR、TrgW、UrdK、VarR YdeS、ArpA、BarA、Aur1B、CalR、CprB、FarA、JadR*、JadR2、MphB、NonG、PhlF、TylQ、VanT、TarA、TylP、BM1P1、Bm3R1、ButR、CampR、CamR、DhaR、KstR、LexA樣、AcnR、PaaRR、PsbI、Th1R、UidR、YDH1、BetI、McbR、MphR、PhaD、Q9ZF45、TtK、Yhgd、YixD、CasR、IcaR、LitR、LuxR、LuxT、OpaR、Orf2、SmcR、HapR、Ef0113、HlyIIR、BarB、ScbR、MmfR、AmtR、PsrA及YjdC蛋白。參見Ramos等人,
Microbiol.Mol.Biol.Rev.,69:326-56 (2005)。另外其他抑制因子包括PurR、LacR、MetJ及PadR、
「可選」或「選擇」標記蛋白包括賦予某些性狀之蛋白質,包括但不限於抗藥性或其他選擇性優勢。選擇標記可使細胞接受針對某一毒素、藥物、抗生素或其他化合物之可選標記基因抗性,且准許細胞產生蛋白質且在毒素、藥物、抗生素或其他化合物之存在下傳播,且通常稱為「陽性可選標記」。抗生素抗性標記之適合實例包括但不限於對各種抗生素賦予抗性之蛋白質,該等抗生素諸如卡那黴素(kanamycin)、觀黴素(spectinomycin)、新黴素(neomycin)、健大黴素(gentamycin) (G418)、胺苄青黴素(ampicillin)、四環素、氯胺苯醇(chloramphenicol)、嘌呤黴素(puromycin)、潮黴素(hygromycin)、吉歐黴素(zeocin)及/或殺稻瘟菌素(blasticidin)。存在其他可選標記,通常稱為「陰性可選標記」,其引起細胞在陰性可選標記蛋白之存在下終止傳播、終止蛋白質產生及/或使細胞致死。胸苷激酶及某些融合蛋白可充當陰性可選標記,包括但不限於GyrB-PKR。參見White等人
, Biotechniques, 50:303-309 (May 2011)。如自使用之情形顯而易見,可選標記蛋白及對應基因(可選標記基因)可一般稱為第一(1)、第二(2)、第三(3)、第四(4)、第五(5)、第六(6)、第七(7)、第八(8)、第九(9)、第十(10)等。在圖式中,除非另外規定為陰性(neg.)標記,否則可選標記為陽性可選標記。
「單導引RNA」或「sgRNA」用於將Cas9靶向至一位點且通常長度為17-24個核苷酸。
「穩定整合位點」或「SIS」為用於對所關注DNA多核苷酸進行位點特異性整合之區域,包括包含基因及/或其他開讀框、啟動子及視情況存在之其他元件的卡匣。穩定整合位點包含外源DNA卡匣,且可根據本文所描述及描繪之本發明方法,較佳在GSH中產生。構築體可藉由多種方法插入至SIS中。可產生多個穩定整合位點且位於不同染色體、相同染色體之不同區域或染色體之相同區域中之不同位置上。
「四環素反應元件」或「TRE」包含由包含17-18個核苷酸之間隔子隔開的19個核苷酸TetO之七個複本且為可商購的。TetO序列可變化且核苷酸取代為已知的。舉例而言,基於Tet操縱子之經變異序列揭示於Wissmann等人,
Nucleic Acids Res.14:4253-66 (1986)中。間隔子不為序列特異性的。間隔子可為類似的,但不應全部相同。將TRE視為如本文所使用的一種類型之操縱子。
本文所闡述之所有數值限制及範圍包括範圍或限制之數值周圍或其間的所有數值或值。本文所描述之範圍及限制明確地命名且闡述了由範圍或限制定義且涵蓋之所有整數、小數及分數值。本文所描述之範圍及限制明確地命名且闡述了由範圍或限制定義且涵蓋之所有整數、小數及分數值。因此,除非本文另外指出,否則本文對值範圍之敍述僅意欲用作個別地提及屬於該範圍內之各個別值的簡寫方法,且各個別值係併入本說明書中,如同其在本文中個別地敍述一般。
詳細描述
本發明提供具有多個穩定整合位點之哺乳動物細胞,且適用於產生包括病毒蛋白之所關注蛋白,及產生包括腺相關病毒載體(AAV)之病毒載體。一個或多個穩定整合位點可在基因體安全港內且一個或多個穩定整合位點可在特定基因體安全港之外。可產生多個穩定整合位點且位於不同染色體、相同染色體之不同區域或染色體之相同區域中之不同位置上。
基因體安全港論述於Pellenz等人,
Hum.Gene Therapy30:814-28 (2019);Papapetrou等人
, Molecular Therapy24:678-84 (2016)中。
較佳地,穩定整合位點含有允許重組酶介導之盒式交換(RMCE)的識別位點。細胞基因體之穩定修飾可用已知方法採用異種特異性重組位點(亦稱為RRS)進行,諸如Cre/Lox、Flp/Frt、轉錄活化子樣效應物核酸酶(TALEN)、TAL效應子域融合蛋白、鋅指核酸酶(ZFN)、ZFN二聚體或RNA導引之DNA核酸內切酶系統,諸如CRISPR/Cas9。參見美國專利第9,816,110號,第17-18欄;Sajgo等人
, PLoS ONE9: e91435 (2014);Suzuki等人
, Nucl.Acids.Res.39: e49 (2011)。亦可進行在人類、小鼠及大鼠細胞中使用Bxb1整合酶進行之整合。Russell等人
, Biotechniques40:460-64 (2006)。
如自使用之情形顯而易見,亦稱為異種特異性重組位點之重組酶識別位點一般稱為第一(1)、第二(2)、第三(3)、第四(4)、第五(5)、第六(6)、第七(7)、第八(8)、第九(9)、第十(10)等。根據本發明使用之適合lox位點包括但不限於Lox P、Lox 66、Lox 71、Lox 511、Lox 2272、Lox 2372、Lox 5171、Lox M2、Lox M3、lox M7及Lox M11。亦可使用其他RRS。Lox位點為最常用類型之RRS;然而,亦可使用不同RRS。
同源臂較佳在切割位點之約10至20個鹼基、更佳10至15個鹼基內開始。亦可使用較大距離,但其效率較低。為了確保插入至基因體安全港中之DNA卡匣在同源性修復有可能重建可靶向位點之情況下維持穩定性,如由熟練的具有通常知識者所確定,可使DNA卡匣之導引臂區含有破壞CRISPR目標位點之功能的變異(例如,鹼基錯配)。存在可獨立或一起採用之兩種方法。第一種方法為插入鹼基取代以在CRISPR二十個鹼基目標位點或原間隔子相鄰模體(protospacer adjacent motif,PAM)中產生鹼基錯配,其通常為2至6個鹼基。第二種方法為產生供體質體,其中插入分隔CRISPR目標位點或將CRISPR目標位點與PAM分隔。
人類細胞株包括羊膜細胞(諸如人類羊膜上皮細胞)、希拉細胞(Hela cell)、Per.C6細胞及HEK 293細胞。HEK 293細胞之實例包括但不限於HEK 293、HEK 293A、HEK 293E、HEK 293F、HEK 293FT、HEK 293FTM、HEK 293H、HEK 293MSR、HEK 293S、HEK 293SG、HEK 293SGGD、HEK 293T及其突變體及變異體。根據本發明,亦可使用嚙齒動物細胞株,諸如Sp2/0細胞、BHK細胞及CHO細胞及其突變體及變異體。CHO細胞包括但不限於CHO-ori、CHO-K1、CHO-s、CHO-DHB11、CHO-DXB11、CHO-K1SV及其突變體及變異體。
本發明之哺乳動物細胞係藉由有利地產生且利用具有卡匣之細胞中間物來產生,該卡匣包含由重組酶識別位點側接且經由RCME整合至基因體中的Cas9核酸內切酶基因。以不受任何理論束縛為前提,當表現時,本發明之整合Cas9基因之用途似乎藉由增加由Cas9核酸內切酶引起之基因體DNA中之切割之出現來增加整合至基因體安全港中之同源臂之效率。使用本發明之穩定整合之Cas9基因提供比不具有穩定整合之Cas9基因的HDR大10、10
2、10
3、10
4、10
5、10
6、10
7、10
8、10
9或10
10的HDR效率。最終,此中間細胞可進一步經歷RMCE以移除含有Cas9基因之卡匣。
作為用於工程改造細胞之起點,所關注多核苷酸序列以及可操作地連接之啟動子及視情況存在之操縱子可藉由轉染含有該等多核苷酸序列及元件之質體引入細胞中。因此,本發明包括如所描述之細胞之產生。
適合質體構築體可由本領域的具有通常知識者製得。先前所描述或本領域中已知之適用調節元件亦可包括在用於轉染細胞之質體構築體中。適用調節元件之一些非限制性實例包括但不限於啟動子、強化子、編碼適合mRNA核糖體結合位點之序列以及控制轉錄及轉譯終止之序列。適合質體構築體亦可包含非轉錄元件,諸如複製起點、其他5'或3'側接非轉錄序列及5'或3'非轉譯序列,諸如剪接供體及受體位點。亦可併入一個或多個可選標記基因。與本發明一起使用的適用可選標記蛋白及報導蛋白為已知的且可容易地由本領域的具有通常知識者鑑別。
編碼所關注基因之質體構築體可使用病毒載體或經由轉移之非病毒方法遞送至細胞。
核酸轉移之非病毒方法包括裸核酸、脂質體及蛋白質/核酸結合物。引入細胞中之質體構築體可為直鏈或環狀的,可為單股或雙股的,且可為DNA、RNA或其任何修飾或組合。
質體構築體可藉由轉染引入細胞中。本領域中具有通常知識者瞭解許多不同轉染方案,且可選擇適用於轉染細胞之合適系統。一般而言,轉染方法包括但不限於病毒轉導、陽離子轉染、脂質體轉染、樹枝狀聚合物轉染、電穿孔、熱衝擊、核轉染、磁轉染、奈米粒子、基因槍粒子遞送(基因槍)及專用轉染試劑,諸如脂染胺(Lipofectamine)、Dojindo Hilymax、Fugene、jetPEI、Effectene或DreamFect。
本發明藉由以下實例進一步描述,該等實例說明本發明之許多實施例及範疇,但不以任何方式限制本發明。在實例中,除非另外規定為陰性(neg。)標記,否則可選標記為陽性可選標記。
實例 1
此實例係關於在啟動子(諸如CMV啟動子)之控制下產生包含抑制因子(諸如TetR)之哺乳動物細胞。參見圖1。細胞經包含啟動子及抑制因子基因之多核苷酸轉染。將多核苷酸隨機插入至細胞基因體中。西方墨點及Taqman可用於細胞池中,以鑑別轉形體且測定平均複本數。抑制因子(諸如TetR)之整合允許控制處於啟動子及操縱子之控制下的多核苷酸之轉錄。
實例 2
此實例係關於進一步工程改造實例1之細胞。DNA卡匣1示意性地描繪於圖2中且包含側接lox位點(1及2)且進一步以5'至3'順序包含啟動子、編碼報導蛋白(1)之報導基因(1)、IRES及編碼選擇標記蛋白(1)之選擇標記基因(1)以及聚腺苷酸化訊號。DNA卡匣(1)視情況可包括與啟動子可操作地連接之操縱子。DNA卡匣(1)隨機或位點特異性地插入至細胞基因體中。DNA卡匣(1)上之第一lox位點及第二lox位點不同。
在tet操縱子用於DNA卡匣(1)中之情況下,多輪-配位體/+配位體分選及單細胞分選將鑑別用於dox調節之表現的Lox位點穩定細胞。因此,當存在配位體(諸如去氧羥四環素或四環素)時,TetR將不結合於操縱子,且藉此准許報導基因(1)及選擇標記多核苷酸(1)之轉錄的條件。
實例 3
在此實例中,進行RMCE以用實例2之細胞中之DNA卡匣(2)置換DNA卡匣(1)。如圖3中所示意性地描繪,DNA卡匣(2)包含側接lox位點(1及2),且進一步以5'至3'順序包含啟動子、編碼選擇標記蛋白(2)之選擇標記基因(2)、IRES及編碼報導蛋白(2)之報導基因(2)及處於第二啟動子(視情況可操作地連接至操縱子)之控制下的Cas9基因。
在一實施例中,CMV啟動子可操作地連接至tet操縱子以控制Cas9基因之轉錄。當細胞處於存在去氧羥四環素或四環素之情況下時,TetR不再能夠結合tet操縱子,且因此允許Cas9基因發生轉錄。報導蛋白(1)與報導蛋白(2)不同,且選擇標記蛋白(1)與選擇標記蛋白(2)不同。
實例 4
此實例係關於將DNA卡匣(3)整合至基因體安全港中。參見圖4。DNA卡匣(3)以5'至3'順序包含多核苷酸,其包含含有sgRNA目標位點、lox位點(3)、可操作地連接至編碼報導蛋白(3)之報導基因(3)之啟動子、聚腺苷酸化訊號、lox位點(4)的第一基因體安全港同源臂及含有sgRNA目標位點的第二基因體安全港同源臂,其中第一導引臂目標位點及第二導引臂目標位點在需要時可各自含有具有變異之區域,以避免重新創造可靶向位點。Lox位點(1)、lox位點(2)、lox位點(3)及lox位點(4)彼此不同。報導蛋白(3)與報導蛋白(2)不同。報導蛋白(3)及報導蛋白(1)可相同或不同。在此實例中使用約1000個鹼基之同源臂。
當表現Cas9核酸內切酶時,增加DNA卡匣3整合之效率。以不受任何理論束縛為前提,本發明之整合Cas9基因之用途似乎藉由增加由Cas9核酸內切酶引起之基因體DNA中之切割之出現來增加整合之效率。使用本發明之穩定整合之Cas9基因提供比不具有穩定整合之Cas9基因的HDR大10、10
2、10
3、10
4、10
5、10
6、10
7、10
8、10
9或10
10的HDR效率。
若需要,則第一及第二基因體安全港同源臂之變異確保DNA卡匣(3)將藉由避免重新創造可靶向位點而保持整合。其中之較小卡匣(亦即lox位點(3)與lox位點(4)之間的區域)可用於RMCE且稱為穩定整合位點。
實例 5
此實例係關於細胞株之最終形式且示意性地描繪於圖5中。為確保細胞株隨時間推移之穩定性,較佳移除Cas9基因。因此,DNA卡匣(2)係藉由RMCE置換為DNA卡匣(4),且移除Cas9基因。DNA卡匣(4)包含側接lox位點(1及2)及處於啟動子之控制下的編碼報導蛋白(4)之報導基因(4)。報導蛋白(4)與報導蛋白(2)及報導蛋白(3)不同且較佳與報導蛋白(1)不同。
所得細胞將在基因體內具有兩個整合位點,一個整合位點在基因體安全港(例如,穩定整合位點)內,且一個整合位點在特定基因體安全港之外。有可能藉由應用上文所描述之方法,包括使用整合Cas9基因及使用額外及不同GSH同源臂來創造又其他整合位點。
實例 6
此實例為相較於習知HDR使用如本文所揭示的具有同源定向修復(HDR)之Cas9之效率的比較。如文獻中所報導,HDR為精確的,但不頻繁地發生所需重組事件:1/10
6-10
9個細胞(0.0001%至0.0000001%)。Hsu等人
, Cell157:1262-78 (2014)。
為評定穩定整合之Cas9基因之優勢,修飾具有美國專利第7,771,997號(「穩定位點1」)及第9,816,110號(「穩定位點2」)中所揭示之位點的CHO細胞。Regeneron提供一套稱為EESYR®之貨物及服務。在穩定位點1及穩定位點2中具有整合序列之CHO細胞揭示於US 2019/0233544 A1中,且在其中各自稱為「增強型表現基因座」。可根據本文中描述及描繪之本發明使用此等專利及實例11及12中所闡述之序列。
CHO細胞經修飾以包括處於穩定位點1中之啟動子之控制下的氰基螢光蛋白報導基因及處於穩定位點2中之相同啟動子之控制下的選擇標記基因及黃色螢光蛋白報導基因。此外,處於第二啟動子與操縱子之控制下的Cas9基因亦插入至穩定位點2中。可根據本文中所含有之教示內容最終移除Cas9基因。
氰基螢光蛋白可藉由將位置66處之酪胺酸殘基改變為色胺酸來變為發綠色螢光。sgRNA遞送質體包含選擇標記(胺苄青黴素抗性)、POL III啟動子(RNA聚合酶III啟動子)、目標序列及gRNA架構、POL III終止子及消化位點1及2。Pol III啟動子包括H1及U6。
如圖6中所描繪,構築含有HDR模板之sgRNA遞送質體:104聚體插入物(具有57 bp臂及45 bp臂)、含有同源臂之401聚體(具有198 bp臂及201 bp臂)或1030聚體(具有524 bp臂及504 bp臂)插入物及實現自氰基變為綠色之序列,其在此實例中由2個核苷酸(「修復核苷酸」)構成。將HDR模板插入至sgRNA遞送質體之消化位點(例如,NotI及/或其他適當位點)中以形成sgRNA目標質體。不具有插入物(無HDR模板)之sgRNA遞送質體用作對照。
圖7展示對照在Q1中不展現綠色陽性。具有HDR模板之細胞在Q1中展現綠色陽性,且Q1中之綠色陽性群體隨HDR模板之大小增加而一致地增加(自左向右)。具有1030聚體HDR模板之細胞展示最大修復效率,其為約6.5%。
此實例之細胞具有穩定位點1及穩定位點2以及在根據本發明之GSH中產生之SIS。因此,此細胞具有三個用於穩定整合所關注基因之位點。
實例 7 - 產生包含基因體安全港 (AAVS1) 中之穩定整合位點的中間人類細胞
在此實例中,起點為具有由lox位點3及4側接之穩定整合之Cas9基因的HEK293細胞。Cas9基因處於至少啟動子(未描繪)之控制下。亦示意性地描繪AAVS1。參見圖8。可根據實例1至實例4及圖1至圖4製得此細胞。
靶向質體含有sgRNA目標位點、用於插入至諸如基因體安全港(此處為AAVS1)之區域中的左同源臂(此處為GSH同源臂)、Lox 1位點、報導基因(顏色1)、Lox 2位點、用於插入至諸如基因體安全港(此處為AAVS1)之區域中的右同源臂(此處為GSH同源臂)。關於替代靶向質體,參見圖9A及圖9B。在3'端處,一種靶向質體具有報導基因(顏色2),參見圖9A。其他靶向質體在3'端處具有陰性選擇基因(陰性選擇1)。參見圖9B。啟動子及視情況存在之其他部分(諸如操縱子)由圖9A及圖9B中以5'至3'方向指向之箭頭表示。兩種質體均將顏色1插入至諸如基因體安全港(此處為AAVS1)之區域中。
Cas9介導之靶向質體(例如,圖9A或圖9B)整合至HEK293細胞之基因體安全港(AAVS1)中示意性地描繪於圖10中。顏色1由Lox 1及Lox 2側接。所關注基因可經由RMCE置換顏色1。
當根據圖9A之靶向質體經恰當整合時,細胞將為顏色1陽性及顏色2陰性。當根據圖9B之靶向質體經恰當整合時,細胞將為顏色1陽性且將能夠傳播,因為陰性選擇基因經移除。將此細胞視為中間物。最終,細胞可在lox位點3及4處進一步經歷RMCE以移除含有Cas9基因之卡匣,如圖8中所展示。參見例如實例5。
本發明方法之精確度展示於圖10及圖11中。圖11更詳細地描繪圖10之插入。細胞基因體(包括AAVS1)側接插入物及5'端及3'端。顏色1由Lox 1及Lox 2側接。圖11左側鑑別與5'接合點PCR一起使用的5'基因體引子及3'插入引子之位置。圖11右側鑑別與3'接合點PCR一起使用的5'插入引子及3'基因體引子之位置。
接合點PCR展示將正確大小片段擴增且標記為「穩定Cas9靶向細胞」。參見圖12及圖13。獲得且偵測穩定Cas9靶向細胞及5'接合點及3'接合點,其建立正確插入。陽性及陰性對照在各凝膠之右手側管柱處。
實例 8 - CHO 區域及序列
對於CHO細胞,可採用美國專利第7,771,997號(穩定位點1)及第9,816,110號(穩定位點2)中所闡述之序列。美國專利第7,771,997號及第9,816,110號之一致性百分比值內的序列及同源序列特此以引用之方式併入。本文中所揭示之AAVS1樣區域可用於產生根據本發明之穩定整合位點。
根據本發明使用之候選基因座報導於文獻中。Hamaker及Lee,
Curr.Op.Chem.Eng.22:152-60 (2018)鑑別30個熱點基因座。Hilliard及Lee,
Biotech.Bioeng.118:659-75 (2021)尋求使用針對Hi-C穩定區域之表觀基因體分析鑑別CHO中之安全港區域,且發現與由Hamaker及Lee鑑別之30個區域中之5個重疊。參見Hilliard及Lee之補充表3。Gaidukov等人
, Nucl.Acids Res.46:4072-86 (2018)亦鑑別用於CHO細胞中之整合的基因座,包括假定的Rosa26。Lee等人
, Scientific Reps.5:8572 (2015)報導倉鼠細胞中之COSMC基因座。總之,此等論文鑑別CHO中之若干未標註區域及基因區域,且該等基因區域闡述於以下:
實例 9 - 具有三個或更多個插入位點之 CHO 細胞
BMP5 | SSBP2 | TRMT6 | CLCC1 | FAM114A1 (NOXP20) |
LRBA | DCN | CEP128 | AACS | ALDH5A1 |
SMAD6 | PTPRQ | ROSA26 | ADGRL4 | GPM6A |
K1AA1551 (C12ORF35) | HPRT | CLCN3 | FER1L4 | COSMC |
使用US 2019/0233544 A1中所揭示之細胞引用含有多個插入之CHO細胞。穩定位點1及穩定位點2可首先根據本文中含有的利用整合Cas9基因之教示內容使用。一旦一個或多個穩定整合位點被創造於基因體安全港中,諸如AAVS1樣區域(參見例如SEQ ID NO: 2)及對應體導引序列(參見例如SEQ ID NO:13至419)中。導引序列可在選自由以下所組成之群組的核苷酸位置範圍處結合於SEQ ID NO: 2中之目標序列:(a) 1至2000;(b) 2001至4000;(c) 4001至6000;(d) 6001至8000;(e) 8001至10,000;(f) 10,001至12,000;(g) 12,001至14,000;(h) 14,001至16,000;(i) 16,001至18,000;(j) 18,001至20,000;(k) 20,001至22,000;(l) 22,001至24,000;(m) 24,001至26,000;(n) 26,001至28,000;(o) 28,001至30,000;(p) 30,001至32,000;(q) 32,001至34,000;(r) 34,001至36,000;(s) 36,001至38,000;(t) 38,001至40,000;(u) 40,001至42,000;及(v) 42,001至44,232。
美國專利第7,771,997號及第9,816,110號之穩定位點1及穩定位點2可用於表現所關注基因以編碼所關注蛋白質。具有SIS之細胞最終可具有3、4、5、6、7、8、9、10或更多個位點以供表現所關注基因。
較佳地,包含穩定位點1及2之CHO細胞經修飾以在基因體安全港中產生第三位點,亦即穩定整合位點。用於產生此類CHO細胞之較佳基因體安全港在AAVS1樣區域中。根據本文中所含有之教示內容,可使用其他CHO細胞類型來產生多個位點。
圖14示意性地描繪包含整合至具有側接RRS (此處為lox 1及lox 2)之基因體之區域中的三個卡匣的例示性細胞。視細胞類型而定,三個卡匣中之各者可整合至不同穩定整合位點及示意性地描繪為位置A、B及C之其他可用位點(諸如穩定位點1及穩定位點2)中。報導基因可相同或不同。陰性選擇基因可相同或不同,但較佳相同。根據本文中所含有之教示內容,細胞可含有額外穩定整合位點及整合卡匣。
圖15示意性地描繪在位置A、B及C處示意性地描繪的圖14之細胞之修飾。三個卡匣各自包含側接RRS (此處為lox 1及lox 2)、所關注基因、陽性選擇標記基因及報導*基因。陽性選擇標記基因可相同或不同,但較佳相同。報導*基因可相同或不同,但各自必須與圖14之細胞中的報導基因中之任一者不同。所關注基因可相同或不同。圖14之卡匣藉由RMCE由圖15之卡匣置換。根據本文中所含有之教示內容,細胞可含有額外穩定整合位點及整合卡匣。
陰性及陽性選擇之組合確保經歷所有位點中之重組的細胞之分離。若所關注基因在三個卡匣中之各者中相同,則細胞可引起高產率蛋白質表現。舉例而言,7、8、9、10或更多公克/公升(g/l)之蛋白質產量為可能的。
圖16展示來自使用Cre-lox重組穩定整合至經2個整合位點(穩定位點1及2)或3個整合位點(穩定位點1、穩定位點2及AAVS1樣(參見SEQ ID NO: 2))工程改造之CHO K1衍生之宿主中的五個不同人類IgG抗體之結果。使用流式細胞測量術分離同基因型細胞株(ICL)。將進料分批生產之ICL接種至化學成分確定的生產培養基中,且生產培養進行13天。使用基於蛋白A 的HPLC之方法測定經調節之培養基中之抗體效價,且表現給定抗體(1、2、3、4或5)之各三位點細胞相較於比較兩位點細胞表現更大量的蛋白質。相較於兩位點細胞,三位點細胞可提供10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%或更大之增加。
替代地,不同所關注基因可用於卡匣中。舉例而言,抗體之重鏈及輕鏈序列可為所關注基因。
轉變為四位點細胞,較佳包含穩定位點1及2之CHO細胞經修飾以在基因體安全港中產生第三及第四位點,亦即穩定整合位點。用於產生此類CHO細胞之較佳基因體安全港在AAVS1樣區域中,其可為第三位點。第四位點可產生於其他基因座中,包括但不限於:
BMP5 | SSBP2 | TRMT6 | CLCC1 | FAM114A1 (NOXP20) |
LRBA | DCN | CEP128 | AACS | ALDH5A1 |
SMAD6 | PTPRQ | ROSA26 | ADGRL4 | GPM6A |
K1AA1551 (C12ORF35) | HPRT | CLCN3 | FER1L4 | COSMC |
根據本文中所含有之教示內容,可使用其他CHO細胞類型來產生多個位點。
圖17示意性地描繪包含整合至具有側接RRS (此處為lox 1及lox 2,或lox 3及lox 4)之基因體之區域中的四個卡匣的例示性細胞。視細胞類型而定,四個卡匣中之各者可整合至不同穩定整合位點及示意性地描繪為位置A、B、C及D之其他可用位點(諸如穩定位點1及穩定位點2)中。報導基因可相同或不同。陰性選擇基因可相同或不同,但較佳相同。根據本文中所含有之教示內容,細胞可含有額外穩定整合位點及整合卡匣。
圖18示意性地描繪在位置A、B、C及D處示意性地描繪的圖17之細胞之修飾。四個卡匣各自包含側接RRS (此處為lox 1及lox 2,或lox 3及lox 4)、所關注基因、陽性選擇標記基因及報導*基因。陽性選擇標記基因可相同或不同,但較佳相同。報導*基因可相同或不同,但各自必須與圖17之細胞中的報導基因中之任一者不同。所關注基因可相同或不同。在此圖中,存在兩個所關注基因1之複本及兩個所關注基因2之複本。圖17之卡匣藉由RMCE置換為圖18之卡匣。根據本文中所含有之教示內容,細胞可含有額外穩定整合位點及整合卡匣。
陰性及陽性選擇之組合確保經歷所有位點中之重組的細胞之分離。四位點細胞適用於製造雙特異性抗體,其中兩種不同重鏈/輕鏈質體可靶向不同位點。
實例
10 -
基因體安全港序列
基因體安全港序列及類似者為本文中所描述的,且許多在文獻中且可公開獲得。例示性序列闡述於以下。
人類 AAVS1 序列人類AAVS1 (
表示 安全港插入之天然RBS及導引RNA位點)
(SEQ ID NO:1)
GAATTCCTAACTGCCCCGGGGCAGTCTGCTATTCATCCCCTTTACGCGGTGCTACACACACTTGCTAGTATGCCGTGGGGACCCCTCCGGCCTGTAGACTCCATTTCCCAGCATTCCCCGGAGGAGGCCCTCATCTGGCGATTTCCACTGGGGGCCTCGGAGCTGCGGACTTCCCAGTGTGCATCGGGGCACAGCGACTCCTGGAAGTGGCCACTTCTGCTAATGGACTCCATTTCCCAGGCTCCCGCTACCTGCCCAGCACACCCTGGGGCATCCGTGACGTCAGCAAGCCGGGCGGGGACCGGAGATCCTTGGGGCGGTGGGGGGCCAGCGGCAGTTCCCAGGCGGCCCCCGGGGCGGGCGGGCGGGCGGGTGGTGGCGGC
GGTTGGGGCTCCGGGCGCGTCGCTCGCTCGCTCGCTG GGCGGGCGGGCGGTGCGATGTCCGGAGAGGATGGCCGGCGGCTGGCCCGGGGGCGGCGGCGCGGCTGCCCGGGAGCGGCGACGGGAGCAGCTGCGGCAGTGGGGCGCGGGCGGGCGCCGAGCCTGGCCCCGGAGAGCGCCGCGCCCGCACCGTCCGCTTCGAGCGCGCCGCCGAGTTCCTGGCGGCCTGTGCGGGCGGCGACCTGGACGAGGCGCGTCTGATGCTGCGCGCCGCCGACCCTGGCCCCGGCGCCGGAGCTCGACCCCGCCGGCCGCCGCCCGCCCGCGCCGTGCTGGACTCCACCAACGCCGACGGTATCAGCGCCCTGCACCAGGTCAGCGCCCCCCGCGGCGTCTCCCGGGGCCAGGTCCACCCTCTGCGCCACCTGGGGCATCCTCCTTCCCCGTTGCCAGTCTCGATCCGCCCCGTCGTTACTGGCCCTGGGTTTNCACCCTATGCTGACACCCCGTTCCAGTCCCCTTACCATTCCCTTCGACCACCCCACTTCCGAATTGGAGCGCTTCAACTGGCTGGGCTAGCACTCTGTGTGACACTCTGAAGCTCTACATTCCCTTCGACCTACTCTCTTCGATTGGAGTCGCTTTAACTGGCCCTGGCTTTGGCAGCCTGTGCTGACCCATCGAGTCCTCCTTACCATCCCTCCCTCGACTTCCCCTCTTCCGATGTTGAGCCCCTCCAGCCGGTCCTGGACTTTGTCTCCTTCCCTGCCCTGCCCTCTCCTGAACCTGAGCCAGCTCCCATAGCTCAGGTCTGGTCTATCTGCCTGGCCCTGGCCATTGTCACTTTGCGCTGCCCTCCTCTCGCCCCCGAGTGCCCTTGCTGTGCCGCCGGAACTCTGCCCTCTAACGCTGCCGTGCCGTCTCTCTCCTGAGTCCGGACCACTTTGAGCTCTACTGGCTTCTGCGCGCCTCTGGCCCACTGTTTCCCCTTCCCAGGCAGGTCCTGCTTTCTCTGACCAGCATTCTCTCCCCTGGGCCTGTGCCGCTTTCTGTCTGCAGCTTGTGGCCTGGGTCACCTCTACGGCTGGCCCAAGATCCTTCCCTGCCGCCTCCTTCAGGTTCCGTCTTCCTCCACTCCCTCTTCCCCTTGCTCTCTGCTGTGTTGCTGCCCAAGGATGCTCTTTCCGGAGCACTTCCTTCTCGGCGCTGCACCACGTGATGTCCTCTGAGCGGATCCTCCCCGTGTCTGGGTCCTCTCCGGGCATCTCTCCTCCCTCACCCAACCCCATGCCGTGTTCACTCGCTGGGTTCCCTTTTCCTTCTCCTTCTGGGGCCTGTGCCATCTCTCGTTTCTTAGGATGGCCTTCTCCGACGGATGTCTCCCTTGCGTCCCGCCTCCCCTTCTTGTAGGCCTGCATCATCACCGTTTTTCTGGACAACCCCAAAGTACCCCGTCTCCCTGGCTTAGCACCTCTCCATCCTCTTGCTTTCTTTGCCTGGACACCCCGTTCTCCTGTGGATTCGGGTCACCTCTCACTCCTTTCATTTGGGCAGCTCCCCTACCCCCCTTACCTCTCTAGTCTGTGCTAGCTCTTCCAGCCCCCTGTCATGGCATCTTCCAGGGGTCCGAGAGCTCAGCTAGTCTTCTTCCTCCAACCCGGGCCCTATGTCCACTTCAGGACAGCATGTTTGCTGCCTCCAGGGATCCTGTGTCCCCGAGCTGGGACCACCTTATATTCCCAGGGCCGGTTAATGTGGCTCTGGTTCTGGGTACTTTTATCTGTCCCCTCCACCCCACAGT
GGGGCCACTAGGGACAGGAT TGGTGACAGAAAAGCCCCCATCCTTAGGCCTCCTCCTTCCTAGTCTCCTGATATTCGTCTAACCCCCACCTCCTGTTAGGCAGATTCCTTATCTGGTGACACACCCCCATTTCCTGGAGCCATCTCTCTCCTTGCCAGAACCTCTAAGGTTTGCTTACGATGGAGCCAGAGAGGATCCTGGGAGGGAGACTTGGCAGGGGGTGGGAGGGAAGGGGGGGATGCGTGACCTGCCCGGTTCTCAGTGGCCACCCTGCGCTACCCTCTCCCAGAACCTGAGCTGCTCTGACGCGGCTGTCTGGTGCGTTTCACTGATCCTGGTGCTGCAGCTTCCTTACACTTCCCAAGAGGAGAAGCAGTTTGGAAAAACAAAATCAGAATAAGTTGGTCCTGAGTTCTAACTTTGGCTCTTCACCTTTCTAGNCCCCAATTTATATTGTTCCTCCGTGCGTCAGTTTTACCTGTGAGATAAGGCCAGTAGCCACCCCCGTCCTGGCAGGGCTGTGGTGAGGAGGGGGGTGTCCGTGTGGAAAACTCCCTTTGTGAGAATGGTGCGTCCTAGGTGTTCACCAGGTCGTGGCCGCCTCTACTCCCTTTCTCTTTCTCCATCCATCCTTCTTTCCTTAAAGAGCCCCCAGTGCTATCTGGACATATTCCTCCGCCCAGAGCAGGGTCCGCTTCCCTAAGGCCCTGCTCTGGGCTTCTGGGTTTGAGTCCTTGCAAGCCCAGGAGAGCGCTAGCTTCCCTGTCCCCCTTCCTCGTCCACCATCTCATGCCCTGGCTCTCCTGCCCCTTCCTACAGGGGTTCCTGGCTCTGCTCTTCAGACTGAGCCCCGTTCCCCTGCATCCCCGTTCCCCTGCATCCCCCTTCCCCTGCATCCCCCAGAGCCCCAGGCCACCTACTTGGCCTGGAACCCCACGAGAGGCCACCCCAGCCCTGTCTACCAGGCTGACCTTTTGGGTGATTCTCCTCCAACTGTGGGGTGACTGCTTGGGCAAACTCACTCTTCGGGGTATCCCAGGAGGCCTGGAGCATTGGGGTGGGCTGGGGTTCAGAGAGGAGGGATTCCCTCCAGGTTACGTGGCCAAGAAGCAGGGGAGCTGGGTTTGGGTCAGGCTGGGTGTGGGGTGACCAGCTTATGCTGTTTGCCCAGGACAGCCTAGTTTTAGCGCTGAAACCCTCAGTCCTAGGAAAACAGGGATGGTTGGTCACTGTCTCTGGGTGACTCTTGATTCCCGGCCAGTTTCTCCACCTGGGGCTGTGTTTCTCGTCCTGCATCCTTCTCCAGGCAGGTCCCCAAGCATCGCCCCCCTGGCTGTTCCCAAGTTCTTAGGTACCCCACGTGGGTTTATGAACCACTTGGTGAGGCTGGTACCCTGCCCCCATTCCTGCACCCCAATTGCCTTAGTGGCTAGGGGGTTGGGGGCTAGAGTAGGAGGGGCTGGAGCCAGGATTCTTAGGGCTGAACAGAGCCGAGCTGGGGGCCTGGGCTCCTGGGTTTGAGAGAGGAGGGGCTGGGGCCTGGACTCCTGGGTCCGAGGGAGGAGGGGCTGGGGCCTGGACTCCTGGGTCTGAGGGTGGAGGGACTGGGGGCCTGGACTCCTGGGTCCGAGGGAGGAGGGGCTGGGGCCTGGACTCGTGGGTCTGAGGGAGGAGGGGTCGGGGGCCTGGACTTCTGGGTCTTAGGGAGGCGGGGCTGGGCCTGGACCCCTGGGTCTGAATGGGGAGAGGCTGGGGGCCTGGACTCCTTCATCTGAGGGCGGAAGGGCTGGGGCCTGGCCTCCTGGGTTGAATGGGGAGGGGTTGGGCCTGGACTCTGGAGTCCCTGGTGCCCAGGCCTCAGGCATCTTTCACAGGGATGCCTGTAC
CHO AAVS1 樣區域序列(插入之導引物進一步展示於以下實例13中)
(SEQ ID NO:2)
CCAGCACCCACATGGTGGCTCACAACTGTCCGTAACTCCAGTTCCAGAGGATCTGATGCCCTCTTCTGTCTCCCGCGAGCACCTGGCACACACGTGATGCACACTTAAACACATGCAAGCAAACCATCAGACACATAACTTTTTTTTCCAATTTTTTAAAGATTTAGTTATTATTATTTACTTAATAAATATTTATTATATTTATTACATATACAGTTTCTGCCTACATGCCAGCAGAGGGCACCAGATTGAATTGTAGATGGTTGTGAGCCACCATGTGGTTGCTGGGAATTGAACTCAGGACCCCTGGAAGAGCAGTCAGTGCTCTTAACCTCTGAGCCATCTCTCCAGCCCCTCCATTTTTTTTTTTTTAAATAAAGAAATGTAATGTCCTAAGTGGGGCTTAGAGAGTGGAAGCAGATAAAGAAAGATGGAGTTAAGAATTTTAAGAAGCCAGTTGGCGGTTGTGCATGCCAGCACTCAGGAGGCAGAGGCAGGTGGATGGATCTCTATGAGTTCGAGGCCAGCCTGGTCTACAGAGAGAGAGTTCCAGGACAGACTTCTCCAAAGCTACAGAGAAACCCTGTCTGAACCCACCACGACCACCACAAAGAAAAAAAGGATTTCAAGAGGAGAGCCAGGTTTATAGCAAGAGAGAAAGTTGTGAACTAATGCCCAGGGCTTAGTGTGGCCTACCTCTGGGCTGGGTCTCTCTCTGAACACAGGGTGGAGCTGCCCCGGGAGGAAGAAGCGGCTCCGTACAGTCCCGAATTCTACAGTGGCTGGGAGCCTCCCGCCACTGACCCGCAGGGCCGCGCCTGGGAGGACCCGGTGGAAAAACAGCTACAGCATGAGAAGAGGCGCAGGCAGGTGAGGCAGGGTTGCCGGGGGAGCACTGGGCTCCCCGTTTCTGCACAACATGGGCGAGCAGGACGTCTGAGGTCTAGCCTGCCTGACCCCAAGCTCTCTCTCTTCCCGCAGCAAAGCGCCCCCCAGATCGCTGTCAATGGGTGAGTGACCGCTGCAGGGTGGCCAGGGATGGGGTTGGGAGGACTGAGTCCCGGGGTCACCCCGGCTCTGACTCCGACCCTCCCCCTTTTTTCTTGTCTTTTTTTTTTTTTTTTTTTTTTTTTAAACCTCTGCCTTCCCGGCTCTTTGCAGGTGGGTGAGGTGGTGAGGAGGCGGGGCTGGGGTGGGGGTGGGGGAGGAGCCAGGAGGGAGGGGGGGAGGAGCCCAGAACTCTGGGTCCAAGGGAAGAGGGAAAGGAGGCTTAGTTTGCTGAAGCTATGAGAGTTAGGGGCTGAAAGTGGGTGGGTCTAAAGGCTTGGACCCCACACCCCCACCCCCGGCATCCTCAAAAGATTGAAAAGGTGCAGTTTGGTGTTCTAGGACCTGGGAGAGCACCATGCTTGAGTCCCCAGAGCACAGAGCACTGGGTGTCAGAGAAAAAAAAAAAATGGAGACCAAAAAGCAGGGTTGGGACTTCCGAGGATTCAGGGACAAGTTTGAGGAAACGTGAGAAAGTGCTGGCATCCCTGGACCACTAACTGAGGTGGGACTTCCGGCTTCCTAATGCGCAAAGGAATAGCACGTACTGAGCAAACTGGAATGCTCCCAGGGCTGAAAGAATGGAGGAAATTGAAGGTCAAGGCACGGACTCCTGCCTAGGTCCCTGGGAAGGAAAGAACTAGGGACCTAAATTTACAGTTCTACCAAACTATGGAAGCTGAGGGCTGCAGGTCCAGGTGAGGAAGTGATGGAGAGGGGGTCACAGCCCTAGGATCCTTGGGGAAATAGGGGCCAGGAGTGGAGGGCGTGGATGTGGCTTGAGAACAAAATGATAGACTTGGAGGAGAGGAATTGGGGGCCTAGGTGAGAGCCCCAGCAGAGGGTCTCAGCAGGGACGGCATACTGGGAGCTGTCAGTCCCACACATGGGGCGCCGAGGCCCTGAAGAGTCCCCTCCTCCCTTCCACAGGTAGGCCTGATCCGGGATGAGGTCTCTCTTGCTGGGGGCGCCAGAGCTAATCGTCCCCCAGGCTGCCTGGTGCTGCAGGGCCCTCTTGTCTGTCTGTCTGCTTCTGAATCTTGGGCTCAGCACCTGCAAGCTGTTTACTCGCCTTCTCTGGCTGTAATTTCTTTGCCTGGAAGGGTGAGGACTCTCTGGCGCTGTAAGGGGCTTGCAAAGAGCTCAGTGCCGTGACTCAGCCTGAGTTCAAATCCAGCTGCATGAAGAACAGTACAGAGTGACCCTGACAAGGGCAGCCTAGGGCCAGCTCAGTCACACCTTTCTCTTTCTTGTGCACTGGCCGTTACTACAGTATCCCTCGGTTCCTTCATATAGAAAGAGAAATAGTGAGCCGGGCAGTGGTGGCGCACACCTTTAATCCCAGCACTTGGGAGGCAAAGGCAGGTGGACCTCTGTGAGTTCAAGACCAGCCTGGTCTACAAGAGCTAGTTCCAGGATAGTCTCCAAAGCCACAGAGAAACCCTGTCTCGAAAAACCAAAAAAGAAAAAAGAAAGAAAGAGAAATAGTGAGACCGGCAGTGGTGGTGCACGTCTTTAGTCCCAGCACTGGGGAGGCAGAGGCAGCCGGATTTCTGTGAGTTCAAGGATAGACTGGTCTACAGAGTGAGTTCCAAGACAGCCAGAACTAAACAGTGAAACCCTGTCTTGGAAAAAAAAAAAAGTGAAATAATGGCCATATTCTGGTGATGGTGTAGGCCTGTGGTCCCAGCTACTCAGAGACATGAAGCAGGAGAATAAAAATCAAGGCCTGCTTTGACTACAAAGTGAGCTTCAAAGGCCAGCCTGGGCAAAGCAACAAGGCCTTGCCTCAAAATGAAAAAATAAAAATAAAAGAGGCTGGAGAAATGGCTTAGTGGTTAAGAGTACTGGCCGCTCTTCCAGGGGACCAGGGTTCAATTCCCAGCACCCAGACATACAGCAGCTCACAACTCCAGTTTCAGGGAATCCGGTGTTCTCTCTGGTCTCTGTAGGCACCAGGCACTCAAGTTGTGCAGACATAAAATAACACAGAGGGCTGGGCTGGGGCTCAGTGGCAGGCATTTGCCCAGAATCCCCCAGTAAAGACATAGCTCAGTGAATCCAGAGCTGAGGGGCTGGGCGTATATTAATGGTGGAATCCTTGCCTAGAATTCAACCAGCGAAGGGCTGTGGCCGTGGCTCGGCTGTAGAACCCTGTCCTGGTATCTACCATGAAGGGCTGGGACATGGCTCAGAGATAAAACACTTGCCTAGACTCTACCGCTGAGAGCCTGGGGTGTGGATCAGTGGACAGTGCCCGCCTAGCATGCACAAGGCCCCTGGGTTCAATCCCCTGTACCACAAAAAAAAGGGGGGGTGGAGGGAGGGTAAGAGTGAGATCTCAGGAGAAGGAAGGAACCAAATTCATGGAACTACAAGGGAACTCCAGGAGAATCGAAGCGTTTCTGGCGTACGTTGCTGTGTAAGCACAAGGGTCGGCTATTTTTGCACCCTGTTCATTATCCTAGCGGGTGATGGGAATAGATCTGCTGTCTCTAGCCGATTCCTCATGATCCTCACTGATGAAAATGCAGGTGAGGGGCTGGAGAGATTAAGAACACTGTCTGCTCTGGCACTGGACCTAGGTTCATTCAGCTCCCCACAGCACATGGTGGCCCACAAATATCTGTAACTCCAGCTCTAAGAACCCAGGTCTAGGACACCCTCTCCTGGACTCTGTGGCTACTGCACACAGGTGATGCACATACACACACATGCATGCAGGCAACACACACACACACACACACACACACACACACACACACACAATGCATGTGAACGACTGGGGATGAAGCTCGGAAGCTAAGCACTTCCCTGGCATGCACGGGCCCTGGGTTCAATCCCCAGCACCCCATAATGAATTAAATCGTTATCATGATACGGTGTGTTTACTGCATGGTGCCAGGCAAGGAAATGAGCTAACTCCATTCAAGCTGTGACTCCAGTGTCAAGCCTGTATTAACATATTAACCTGGGCCTCTGCTCTGACCCCCTGCTTGGCTCTAACCCCACCTCACACCTTAGAGTCCAGACCAGCAGGGCTGGCTACCTCCTAATCTCCTGCTGGTTTCTTTCTCCCCAGTCATCAAGATCCAGACCTGGAAGCCGCCGAGCTAGAAGAGAGAGCCAGAAAGTGGGTTCTGTGTAACTATGACTTCCAGGCCCGAAATAGCAGCGAGCTGTCTGTCAAGCACGGAGATGTGTTGGAGGTTAGCGGTGTGGGGGGCCTGAGACCCTGAAATTGGTCAATTTAGCCCTAGGTATAGAACCGGAGCGTGAATTCTCTCCTTATACGCCACCTAGGTCCTGGATGACAGGCGCAAGTGGTGGAAGGTTCGGGACCATCAGGGACAGGAGGGTTATGTACCCTATAACATCCTGACACCCCACCCTGGACCTCAGGTGCACCGCAGCCAAAGTCCTGCAGGAAACCTAGTAAGTCGGCGTGTTCTTGCTTCTTCGGGGAGAAAGGGGGGCAAGATCCTAGGTCCTGGGGATGAGGACAGAGAAAATCAGGTGTGAAGGTTGCTGTTTGGAAAGGGGGGGGGGTGGTCAGATGTTTATTGGGAAAGGAGCTGGAAGCCTCTCTTCATTCCCTTCCAGGAGACGAGTACTCCTCCTCCCCCACCCGCACCAGCTCCAGCCCCTGCTCAGGTGCGACCCCACTGGGACAGTTGCGACAGTCTCAACAATTTGGACCCCAGCGAGAAGGGTGAGTGGTGGAGCGTCACTCTGGGAAGTGATCCTTGTCTTCGCTTTTCAGGCTCCACCCTGGGCACCCTAGCGGCTCCCAGCCCCCTGACCCCAGAACCCCTGAGCGCGCACTCCCCTCCGCCCCCCCCCCTCACGGTTTCGCTTCTGCAGAGAAATTCTCCCAGATGCTCAGTGTCAATGAGGAGCTGCAGGCGCGCCTTGCGCAGGGCCGTTCGGGTCCCAGCCGGGTAGCCCCGGGACCCCGCGCCCCGGAGCCTCAGCTCAGCCCGCGCTCTGAGGCCTCGGTGGTCCGTGCCTGGCTGCAGACCAAGGGCTTTAGCTCGGGGTGAGTGGGGCTCCCCCCGGGGCTAGTCTGAAGAGACCTGTGCTTGAACTGAAAGGCGAGGTTCCCATTGGTCCAGGGGTGGGGGCGTGGAAACTGTGGAGCAGGCCCAAATTGCAACGCCCAATGCCCAGGGACAGGCTCCAAACGGAGGCCACAGGAAAGGAAGTCCCATCCCCTTTCCGAAGCCCCAAATCTCCAAGAGTTTGAACATCCCCCCCTCCCCCCAGCTTCCTTGTTTGAGAACTCTGATTGCACAAGCAGCTAGGTAGGTGTGGCGTGATTGGTGGAGGGCCGAGGGAGCTTGATGAGCTGTGATGGCCCCTGCTGCCTCGCTCAGGACTGTGGACGCGCTCGGCGTGCTGACCGGAGCACAGCTCTTCTCGCTGCAAAAGGAAGAGTTGCGGGCGGTGTGCCCCGAGGAAGGGGCGCGGGTGTACAGCCAAGTCACCGTGCAGCGCGCGCTGCTGGAGGTGAGCGAATCCTTGGGGCCGGACAAGGCGACGGAGGGTAGGGTGGGGATGGGGGACCTGGGGGGAGGGGGTCGTCCAGGGTTCACATACTAAGATCTTGATTTCTACCCCGCTCTGCAGGACAGAGAAAAAGTGTCGGAGCTGGAGCCGTGATGGAGAAGCAAAAGAAAAAAGTGGAAGGCGAGACCAAAACAGAAGTTATTTGATCCTTCCTGACTCGGTCACAAAACGTGATGGCATGGCGGGGCTCCCAGCGCCCCCTAGGACAACAGTCGCCAGACTCCTCCCCGTGACCGGGGACAGTAGATGTCCCGAAGGATCGCCCACCCTCATCTCCCGGCTCACTCGCTCGCTCGCTCTCCTGGCGGGCAGGCTGCGCTGACAGTGCCGGCTGGAATCCTTCCGGGGGACCTCAGACTGACGGGGACGGGGACGGGGACGGGGACGGGGACGGAGCATACAGACACTACCAGAGAGGCACGCCCAAGAGGCGCACGGAGGGAGGGCCCTGGGCGTCGTGACGTGCTATAAACAGCCTCCTTTCTAGACCATGCGTGTCACCTGCTGTCCCCTTCTCTCGCCGGCTACCCAGGAGCCAGGAATCTGAGAGATGCCCCACGCTTCCTCCCCATAAACCTGGAGAGTCCAGCCCAGGCTTCCTAATCACCAGTCTATCCTCGCACTGGCCCCATCTACATCCCTTCTCCTGTTCAAAACCCTCGCCTGGCTGGCTCCTCGTTGTTCTCAGTCCTGTCTCCTGGTGTTTAAGGCCTGGGCTTTTCTCATTGTCTCCGCCCACCCTGCATTTCGGCCCAGCCGCTCCAGACCACAAGCGGTTTGCACTTAACGCTTCTGAGGGTTGGAGCGGCCCCCATCACCCTGGCTCGGCTCTCCTAGCCACACCGTGGACACCCGTGTCCAGCCTCTAAGGACCGGCCATGCAGATCTGGACGCTCCCGGGGCATGCCACGGGCTCTTGGTTCTTCCTGGCCCCTCAACAACTTTCTCCCTGCCAAGCCCTGCAACTTGTCCAGGTTATGCAGGTGGATGGTAAGAGCCGGTTTTCTCATCCGCGCTAGGTTTATCTAAGGCCTTTCTTTTCCCTGCATCCTTGGAACACTCCCAAGAGTCCCACCGTTGCAGTCGGCCTCTGCTCCCCGCGCAGCTCAGTCCTTACCTGGGCCACCAGGTGGCGCACCTCGAATCTGACCCAGGAGGGCCAGCCTTGGGCTGACTTCACTAAGCCCCCTTTCCTTCTGGAACACTGTAGCGTTCCAGTAAGCCTTTAGTGTCCATTCCCTTGGTTTCTCCTGGTACATGAGATAAAACCTAACTCCAGCATGACAGCCGATGGCCTGTGACCCCTATGGGCTCAGGTCGCCCTTCCTCTCTGTTCGGGACTCCAGGCACTGGTCCATGCTGTTGGTTCTGTTGGGATGTCTTGGCTCCATGGTGTCTTATCACTGCCTGGGGCGTCATTTCTTATGTCGCGCTTGGTTGGTTTGTTGGAGGCCGTCTGGGTACAGCCCCAAACTCTCGGTCCTCCAGTTTCAGTTTCCTGCATGTGGGGATATTGGCAGGCGCCCTGCTGCCACCCTCTTTTCTAATCGAGAAACCAAAAGTACAAGCAGTTGCCCAAGCTGTTTTGATTCCGGCAGTGAGGTCCCAGACTACAGACTGAAATGCCAGCAGGAGCCATCTGGCTTGCTGGGACATCAGGTGATCAGGTGCCTGTGGCTGGCTCTCTGTGGTTTGGAGTCTGACCTTTTCATCCTGACTTGACCCTCTGTCGATCACTTTGTCCATCCATCACTCCCCAAGTCTACATCCAGCCAGGGGCACCTGTCAGAGCTCAAGCCGGATGGTAACCTGGTGGTCAGGCCTCCCAGCTCAGGTGGAGCTCAAGTTCTTAACAGAGCCATGATCACACACAAAGCCATCACCTCAGCGCCACAGCACGCCAGGCCTGCTCTACCCCACGCTGCACACGGTTCTCATCATCATGCAAAAGGTGCTTCCTTCAGATACAGGGCTCACCGTCACCTTCTAGCATCTGTCTGTGCAGCTTGTCATGGGGCCTACTTTTGACTGTCATAAACACCACACACGCACATATATATACACACCAGATACACACACACCACACACATGCCCAATACACTGTGCATGCGCACACACAAACACACACACATACCTCATACACCATACACCCTATAACCCACACCAGCCATACCACACACCACATATACACAGTTCACCTCAGACAGCATGGCACACCACACACACACACACACACACACACACGCGCGCGCGCGCACACACACACACACACACACACACACACTCCGCACTCTCCCCTTCTCCACAGCACTGTAGCTGAAATCCACACAGTGGCAACCTTCCTCAGTGTACTGGCTGCTGGACCAAGCTGTTCACTCCTGTGACGCCAGCTGGCAGAACAGCCCATTCCTGACTGTCAGGATGGAGGAGGCACCACGCGATCCATCTCAAGACTGATTCCTGGCTCTGCCCCAGTCACTGTGGCCACGAAGGACTACTTACCATCACCTACTCCTTTCCCAGAAAACCTAGACTTGCGGTTTCCTATGTTGGCCATCCTACCTTTTCAATGTTAAGCCACTGACTCCGCTCACTTCCAAAGCACTGAGGGTCAATGTGAGCACCCGGATCAGGTCACAGGCTTCCTTCTGACCCCCCCTACCTCACCTGGGGCTCTTTCTCTCCAGCTGCTCACTCGAGCAAGCTCCCCTCCCCACACCTGTGAGCAAGCTCCCAGCCACCCACTGGCCCTCATCCAAATGGATGAGCGGTTTCAGTCAGATACACAGGCTGAGTATACAAGCAGGAACCAGTGCCCCACACCCAGGGGGAGACAAGTCACTGAGTGGCAATGTCACGACTTTATTTGTGGTGCCTGTGCTTTGTCTCAAAAATACCTTCTCCCCCTCCCCAGACAATGGGTGGGAAGGAGGCAGCAAAAATAGAAGACAACCCTCCCTATTGCACACGGACCCTATATACAGGCCCACCTGGCAGAGGCCAGTGGGGCTCTTGGCACATTCCTGGATCCCTGCTGGGGAGGGAAGGGATACTGGGTAGCATCACACGTGAGGTGGGCCCGGGGCAGCCACTCTGCTCCTGGATACTGATCCTGGCTTCCTTGGTCCTTGCTTCCTTCCTGGTCCCATCTCTGGTGCCTGCCCACTCTCGGCAACATTTCCCTACCTGGCTCAGCCTCCCACCTCCACCCTGGTTCTGGGGACTCTGTGCTTTCCTCCGGGTTCTGAGGTCCCGAGAGGAGGTTATGGCTTCTCAACAACTTCCCCCGGAGCCCTGTCACTCATGTTCACTCGGGGGAAGGGGTGCGTGTGTCAAAAGCAGCTGTATAAATACGGTGCGGGAGCCCCTCCAGAGTCACTTGGAGAGCTTGCTAATGACGCGGATCAGTGCTGCATTCTCATCCTTGAGCCGCTGGTTGTCAGCGCGGAGGTCGGACAGGGCCTAGGGGGCAGGGTGGAGTCAGCTGGGCAGGGCGGGGCAGGGTGGGCTCTGGCCACCGCCCTTCACAAGCTCGTTACCTTCAGCTCCTCCTCCAGCTCTGCGGCCTTGCGCTCCAGGGCCCTGCGCTCCTGCAGGAATGGGCTGGGCTCAGAAGCAGGGTAAGGGCAGGGGACAGGGCAAGGGCGGGACACCACCCCAGCGGCCCAAACTCACGAATCTCTCCAGCTCCAGGAGGGCGGGCCTCTCGGCAAAGCGTTCCTGCCGCTGGTAAGGGCAGAGAAGACTGGGCGTCAGGAGCTGCTTCTTACCCCTAGGACATCAGAGCCCTGCCCCCCCCCCCCGAGTGGGGGACCTCCAACCTCCCAGCCACGGCCAGGCCCCTTGCCACTGGGGCTCTGACTCCCACTGCCCCAACAGCTGGTTCTTAGGTCTCAGTATCTGCACCTGCGTGGCCCGCTCAAGCTCCACCTTGAGCTGTGCCAGCCGCAGGGTGGTCTCTGTCAGGGCCTCACGAAGCCGCTCGTTCTCCCTCCGAAGCTCCATGTACAGCTAGGGACACAGAGGAAGCAGGCAGGCTCAGAAGGGCCCGGGAAGGGGCCAGGACAGGGTGGGGTGGGGCAGGAGGTAGCATGCGGCACCTTCCGGAAGCTTCCATCGGGTTCTTCCTGTTCCTGCTTGGATTCTGGATTGAGGTCTCTCTGCAAACGCTGTCTACGGGCAGTGGAGCCGCCATCCACGGTGCTGGACAGAAATTCAGGCCTTAGGGCCCAGGCCCTGCCCGAGGGGTGCCCCAGCCCCCACGCATGACCCGGCCTACCTGCACTCCAGGCTCCGTTCTGCCGGCCCCGCCTCCTCCCCCTGCAGAAGAGCCCTGAGAGTTCAGTCTCCATGCAACGTCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGGCCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGCCCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCCTCCGCTGCCCCTCCCTCCAGCCCGCCCCCGCCTCCACACAGCATCCTCACCTCCGCGGCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGGCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCAGCATCCTCACCTCCGCGGGCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCCCGCCTCCACACAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCCGCCTCCACACAGCATCCTGACCTCCGCGGCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGGCCCTCCCTCCAGCCCCCCCCCCCCCGCCTCCACACAGCAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCCCGGCCTCCACACAGCAGCATCCTCACCTCCGCGGCCCCCTCCCTCCAGCTCCGCCCGGCCTCCACACAGCATCCTCACCTCCTCGGCCCCTCCCTCCAGCCGCCCCCCCCCCGCCTCCACACAGCATCCTCACCTCCGCGGCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCAGCATCCTCACCTCCGCGGGCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCCGGCCCTCCACACAGCATCCTCACCTCCGCGGCCCCTCCCTCCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGGCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGGCCCCCCCCCCCCCACCCCCCGCCTCCACACAGCATCCTCACCTCCGCGGGCCCTCCCTCCAGCCCGCCCGCCTCCACACAGCATCCTCACCTCCGCGGGCCCTCCCTCCAGCCCGCCCCGCCTCCACACAGCAGCATCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCCGGCCTCCACACAGCAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCCGCCTCCACACAGCAGCATCCTCACCTCTGCGGCCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGCCCCTCCCTCCAGCCCGCCCCGGCCTCCACACAGCATCCTCACCTCTGCGGCCCCTCCCTCCAGCCCGCCCGGCCTCCACACAGCATCCTCACCTCCGCGGGCCCCCTTCGCTCGTGGCCGACCTTTCGATGCTCCCTGGCCGCCTGTGGTCCCTGGCCCTGCCCGTCGGGCGCCTCTGCTGGGGAACCAGTGGGAATCAGCTCAGACACCACCATAGGGGCCCCTGTCTACTGTGCAGGGAACCTGACTTAGCCCCCAGTGAACAAAGACACTTTATGGGGAGACAGGATGGCTCCCTGGGGAGCGACTTCCCAGAAAGCCGACCTCACCTCTCTGGGCAGGGCCCTCAGCGTTCTCCACGCCAGGGACCCGAGGTCTCCGAGAAGGGTCCTGCCGGGGAGGAGCACAGTCAGAAACAGGGAGACGGGTCCACCCGCCCCAGTTCACCTGACCCTGCTCACCAGGCTGGGCAGGGCAGGCTGCTCTGGCTCTGGAGCCTTCCCTGCCACCTTCTCTGCTTCCTTCAAGTCTGTCAAGGTCACGCCCTAGTGTAGAGAACTCGGTCAAGGAAAAAGGGCCTAGACTTCCACAGGACTCAAGTTCAAGACCCCGGCCCTCCTCCCTCAGACCCGGGAGCACAGCCCCAGCCCCATCCCACACCTGTGTAGACCTCCGAGACTGGCGCATAAGGCGGGAGCGAGCCTTCCGCTGAGACTCGGACTCTTCATCACGCACAGGCATCTGGTAGGACCTGAGTGGAGAATGTCCCCTTGGGTGCTGTCGCACTGTGAATGACACCTTAGGGGAGTGCACATTCTGGCAGAGAACGTGTCAACTGGGCAAACAGGACCCCAGGAGCCTACCCAGAGCCCCAGAGACCCCTAAACACTGTCTTCCCCTAGCCTCTTTACCTCCGCCGATCCCTGGAGTCAGGTAGGGCTGCTGCAGAGGCTGCGAGGGCATTTGGCTTCACTGGGGATCCAGGCTCCCTCCTGGAGGATGGGGCGGAGTGATCCGAAGAAGGAGGCATGGCAGCCTCACACCTGTATGGATTCATTCATTCATCAGCAAATATTCCTCAAGCCCGCATTCTGTGTCAGGCATAGGAGAGACCACAGAGAAGGAGCCAATCATGGCTGCTGATGAGCCATTTCTGGGCAAAACAGATAAAACAAACAGCAGCCAAAGAGACCAGTGTGGAGCTTGGGGAGAAAAGGTGCTTGGAAAAAATAAAGAGAATAAGCAATTATTTGATGCACCCTAAGGGCTTTCTCAGATCTCAAATGCCAGGATGGCACCAGACCTGTCCCCTTGCCCCAGCCACTGGTACTTACAGGGTAGAGGGCTCTGGCACTTTCTGGGCAGGGGTAGGGGTTATTCTGGCAAGACGGGGTTCCCTGGCCTGTGGAGACAGGAGAGAAGCAAAGGAGGCACTGTCTGCCCCAAGGCAGGAGCCTGTACCCCACACACTTCACGGCACCTACCTGAGAGGAGGCCTTTTCTAGGAGGGAGGAGGAGGCTGAGCGCTGCAGACCGAGAACCCCCTCTGCACCCCTCCTCTCTGAGGGACCCAGGGCACCAGAGCTTCCTGTCTTCTGGAGACCGCCGCGCCTGGAGAAGGGAGCCTCTTCTGGCGGCTGGGAGAGGAAGAAGGTCTTCATTACTGAGCAAAGCAATGACCCTTCTCCTCAGAGCCTACGCGTGTAACTCCAGGGGAATTACAGTAAACCACAGCCAAAGCAATGACCCTCCTCCTCAGAGCCTACGCGTGTAACTCCAGGAGAATCACAGTAAACCACAGCCAAAGCAATGGCCCTTCTCCTCAGAGCCTACGCGTGTAGCTCCAGGGGAATCACAGTAAACCACAGCCAAAGCAATGACCCTTCTCCTCAGAGCCTACGCGTGTAGCTCCAGGGGAATCACAGTAAACCACAGCCAAAGCAATGGCCCTTCTCCTCAGAGCCTACGCGTGTAGCTCCAGGGGAATTACAGTAAACCACAGCCAAAGCAATGACCCTTCTCCTCAGAGCCTACGCGTGTAACTCCAGGAGAATCACAGTAAACCACAGCCAAAGCAATGGCCCTTCTCCTCAGAGCCTACGCGTGTAACTCCAGGAGAATCACAGTAAACCACAGCCAAAGCAATGGCCCTTCTCCTCAGAGCCTACGCGTGTAACTCCAGGAGAATCACAGTAAACCACAGCCAAAGCAATGGCCCTTCTCCTCAGAGCCTACGCGTGTAGCTCCAGGGGAATTACAGTAAACCACAGCCAAAGCAATGACCCTTCTCCTCAGAGCCTACGCGTGTAACTCCAGGAGAATCACAGTAAACCACAGCCAAAGCAATGACCCTTCTCTTCAGAGCCTAAGAGTGTAACTCCAGGAGAATCACAGTAAACCACAGCCCAGGCAGGTGCCACCAAAAAAAAAAAAAAAAAAAACATTACTTCTTGGTCCACAAGGACCTAAGAACCAAGTCAAAAAGCCACTTTCCTCAGCGGAAGCAGAAGTATTTACCGTATCCCACCCGCTGCCCCAAACCTCACATCTGCTCAGGGCGCTCAGGCTCACCACAGGGCTCTTGGGGCTGGAGGACACAGGAGAAGACACGCCATTGAGGGCTCTTGGTTGCACAGGAGGGTGATCTGTGTGCAGGAACAGGAGAGGGGGGTCACAGGAGAGGCCGGCCGCCTCTGAGATTGGGGACCCACAAGTCCAGCTCCTTCCTCAGACCCAGGGTCCAGCATCCCTACCAGCTGCCTCTTCTTCTCCCTCATCCTCATCCCCAAGAGAGGGGCCCGCGGCCCCACCAGGCCGGCGCTCCTTCGACAGATCCTGCAGGGAGATCTTCTCACGGCTGCTCAAACGACACACGGAGCTCCTAGGAGGACAGGGTGTCCGTGTCCAAGTCTGGGGGCGAGTCCGACCCACCCCAGGCCTAGGCATCTCTTACCTTCTGTGCTTGCTGTTGGAGGGCACCTGTGGCTCTTGGCCTCGGCTCTGAGAGGCTTCCTTTTGGTTCCGAAGCTACAAGGATGGAAGGGGGCAACTGGGGAGGGGCAGAGAGCACAAGCCCTCCAGGGTCTCCTGGCCGCCCCCTCTGTGCCACCTCTCCACCTCGAGGGCCATCACGCATAACTGGGCTAGTCACACTTTATGCAGGGTCCTGCAAACATGGGGGACTCAGTAACCCGGCAGCACACTGGCTCTGGGGCTTATTCAGGCTCTCCCAGGCTTGGCCTGGTCCAGCTGTCACTGCCTCCAGCCTCATTCCCAGGGGGATTCGTCTTCTTCCCAGGAGCGAGCACCTTGCTCAGACTTCCCCCTACCCTCCAGCACATCCAGGGCAGGACAGGGCAGGTGGCTCTTTCTGGTTATCACAGGCCAGCTCTCAGCTCAAGGACAACGGCCACCGTCCCATACTAAGCAGTCTGGTGTCGTAACCCCAGGAACACCTCTTGCCCATGCCCTCCTTGCATCCCAGTGTGCCACGGGACTCCTCTCTGGACAATGTTCCCGATGGTTCCACGAGGCCCGGGCCACCTCACTAAATAATGGAATTGCAGCCATGCCGTCTGCTTGGGGCCACACCCATGATGCCTCACTCTCCACTTTCCTAGCAAAAGTGCTAACTAGAGTGGGGGGGGGGTAGATACAGGTTCAACCTGTGTCACACACAGCTGTCTTCCCAAGCGAGCAGGCAGGAAACTCTGGGCATAGCCTCAAGTCCTCCAGATATGGAGGTGCCTCTGTTCTTAGCCCTCCACCAGAGCTGGGCTGACAGGTGGGAATAGCGGGTCTCAGTACTGAGGGTGTCAAGGGACAAAGACTGTCAGCCCTCCCGGTTACTGTTACCTCCTCAGAGCTGCCAAGTAAAGAGGCAAACTAGAGTCGAGACTCACGTCCTCCTGTTTCTGGGCCAGTTCCTCCAAAAGGTTCATCACTTCCTCATCAGCCAGGTCACAGGGCCGCTGCCCCTGAGTAGGAGAAGGAGGCAGATGACGGTGATGGTGGTGGTGTAGTAGGGGCTCCCCCGCCACCCTGCCCCACCATCTGAGATGGCCCTTACCGCATGGGTCAGCGAATCCATGCCCCCACCGTGCTCAGCCAGGAGACGGCAGGCGTCCTCCACACCCCAGTGGGCTGCTGCGTGCAACGGTGTCCAGCCATCTCCATCCCGGAGCTCTGTGTCGTAGCCAGCTTGGAGTAGCAGCCTAAGGGCCAGGGAGGCTTGGGTCAGATGGCAAGCTAGGCCAATGGCTGATCTCAACTTCTGTTCTGTGGCCACAGGACTACTGATCAATACCCAAGCGTTACTAGTTTTACCAGCAACCAGCCCCACCCCAAGCTCAACTGAGCCCTCCCTTGGACCAGCAGCTACTAATGAAAAAGCTCCCTCATACCACAGGGATCCCACTCCTCAGGCCCCAGGGTAAAGGGTTAGGGCAGTGGTGAGGCGATGAGGTGGATGCAGGACTCCCCACTAACGCAAGCCCATGGAGAGGATGGACCCTGAAGGGGCTGTGATGCTGGAACCACTGGAACCACGCGGTTTTAGGACACGGATCCTCAACAGTGTCAAGCAGCTCTCACACCCTCTCTACAACTGGAGACATCACCACTAGAATCCTAACTTACGGGTACAAGCAGGAAGCACCAGTGTGTGGGAGCTGGAGAGGCTGCTCAACCCCCTCCCACGCACAGGACAGCCCTACCACAGCACGGTAAGACCCCAAACATCACAGTGCCGGAGGAGAGCGAGCCTGGCTCAGCCTTCCAGAAGGTAACAACCTGGAGCTCTCAAAACTCAGCATGGCACGAGGCGAGGCCTCTTTTGGAAGCAGTGTGATGAGGTCCTGTGTCAGTGAGGAAGGCTTCAAGCCCAGGGAGGCAGAGGTACAAGGCACAAGGTGCTGTGTGGCCCTGGGACCCTCCTCCCTCACACTTCCCAAGATTCCCCTGTCCCCTTGCAGCAGGGCACGCTGGGCTTCTTGTTACATTCCCACATGCCAGGGTCTCTAGCCAGCTGTGCGCTCCTTCTGGTCAGTATCCTAGGAGCCTGAAGCGTGCCACCCAGCCACACCCCCTAGTCCATCAGCACTTCCTCACCTGGCAGTTTCTTCACCACCATCTCTGCCAGGGGGCCTCCCTACTGCCCACTAGTTATAGCCTCCCAAGGCCAAGGTTTTCTTTGTATAAGCTTAGTGTTATTTACCATTAGTGTGTGTGTCTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTCTGTGTGTGTGTGTGTGTCTGTGTGTGTCTGTGTGTGTCTATGTGTGTGTGTGTCTGTGTGTGTCTGTGTGTGTGTGTGTCTGTGTGTGTGTGTGTGTGTCTATGTGTGTGTGTGTCTGCGTGTCTGTGTTTGTGTGTGTGTGTGTGTCTGTGTCTGTGTGTTGTGCATAAATGCCAACACACATGCCCCAGTATGAAGATCATGGATGAAGATCAGAGGACATATTCAGGATTCACTTTCTCCTTCCACCACCGGTTCCAGGACCTAACACAAGTCACCAGGCTCTTGTGTGGCCAACACTTTTACCTCTGAGCTATCTCACTGGTCTAGAAGCCAACGTTTGCAGCTGGACCCTGCTACTCCCCAGAGGACCTGTGGCAATGTCTACAGTCATCACACAACTGGGTCAGAGGTGCTGCAATGGACTGGACAGCCATCAGAATAGAATGACCCAGCCCATCAAGTCTCTCATTGGCTACGGTGGGTACACATCTGAAACACCACGACCAGCCCAGGAGGCTAGCCCCTAACAGACACCAATATTTACCTGTACTTCAATGAGTACAATCATAGAAGACTTTTAATACAGTCAGAAACAATAGATAACTATAAATTCAGTGAACAGGAGTCTAAACGCAAACTCACACAAAGGGGGCCATCACAAAATTACAAAATTCAGTATGATGGCTCACACCTGCAATCCCAGAACACAGAAGCTGAGGCAGGAGGACAGCTGTGAGTGCAAGGCCAACCTAGGCTATCTATCCAGTACCAGGCTAGTCAGGACTACATAGCAAGACCTTGTCTCCATTAGAAAAGAAAGAAGCCAGAGGGGAGGGAGGCAAGCATGGTGGCTCTCACCTCTATCCCACAGGAAGGTGAAGGAACAAAGAGTAGAAATTCAAGACCAGTGAACTAGAGGCGATCATGACCGACATGAGCTATTTATGGAAGAGGCCAAATAAACAAACACAAAAGTTGTCATCAGTGCATTTTTTTTTTCAGGGCTGGGACTGGAACCCAGAACGCTAGGCAAGTGCTCTATCCCTGAGGCACCCCCCCCTTCCCTCACGGGTAGACACCAGGGAAGCATCTATCTACCTATGGCCTGCGACCACAGCCCAGTGCTTCAGTTCTGGGACAAGTATTGGCTCACTTTCTCTACTAACTAGCCCCCCGGACCTATGCAGGTGACACCGGGGAAAGCATTTAAGCACAAAGACAGGAAGGAGTTCTGATCACCAGAATCCACTTAAAAACTCAGTGGATAGCTGTTATAAAAAAATGACATCAGGGTGGAGAGAGATAGATGGCTCTGCTCTTCCAGAGACCCGGGTTCAATTCCCAGCACCCACACGGCAGCTCCAGGGGTTCTGACCCCTCACACTGACATAACACAGACAGGCAAAGCACTAATTAATGCACATTAAAAAAAATAACATCATGAAATCTGCAGGCAAATGGATGGAACTGGAAAAAAAAAAAAAAAAAAAAAACATCCTGGGTGAGGTAACCCAGCCCCAGAAAGACAAACATGGTGTGTACTCATTTACAAGTGCACATTAGCTGTTCAGTGAAGGACAATCGTGCTACAATCCACAGACCCAGAGAGGCTAGGTAACAAGGAGGGCTCCGGGGAGGGACGGTGCACGGATGCCCCAGGGAAAGGGAAAGAGAAAAGACTTTGCAGATGGAATGGGCAGGTAGGGATGGAAACAGGAGAGGTGGGGAGAGGGAGTGGAGGGGAAATACTGGGGGGGGTGGCTGCAATGGGGGCTCACTTTGGGGGTGTTAAGGAAACCCAGCACAGTGGGAACTCCTGGACTCTGCAAGGGTGGACCTAGCCAAGTAACGAGGGACACAGAGTCTGAACCGGCTACTTTGGGTAACAGGCAAGGCTCCCAGCAGTGGGACATCAACCCGGCCACAAAACTTTTGACCTACGATGTGCCCTGCCTGCAAGGTGTGCTGAGGTAATGGTGGCGCAGAGCTTGTGGGAGTGGCCAACCAATGACAGGTCCAGCTTGAGGTCCATGCCACAAGAGGGAGCCCACGCCTGACACAGCCTTGATGGCCAGGAGCCTGGATAGCCCGAGACCTGGGGTAGAACCAAATACAATTGGGGGAAAAGAAAAAAAGGCAAGAAACAATTCTTAATGATATTCTGCTGTTCTCATGGATCTGTGGCTAGCCCAACTGTCGTCAGAGAGCTTTTTCCAGCAGTTGACGGGAGCAGATGCAGAGACCCACAGCTCAGGGAACCCCACAGGAAGGATTATGGGGGGGGGGGGCGCGAGGACACCAGGAGAACAAAGCCCACAGAATCAACTAAGCAGGGCTCCTTGGGGCTCATGGAGACTGAAGGAGCTAGCCATCAGGACCTGTATGGGTCTGCGCTGGGTCCTCGCCTGGTGCTCTTGCGGGACTCCTTAACACTGGGACTGGAGCTGTCGCTGACTCTTGTGCCTGTTTGGGGACCCAGACAAGCATAACTGGTTACGCTGTGCTTGGCTGTCATCTCTGAGATGCCTGTTCTTTTCTGAAGGGAAACAGAGGACTGGATCTGGAGGAGGGGTGGAGGGGAACAGGGCAGAGGGGAGGGAGGAATGTAATATGAGAGGAAAAAACAACAACTACAATTATTGAGTGGACATGGCAGCCCATCTGCAGAGACAGGCCACCCTCAGACGGAGATGGCAGCTAAACTTGCCAAAAAGGCAAGCTGAGGGATCGGCCAGAGGCCCTGCCTCAATATTAGAGTGGAGAGCAACCAGAGAAAGTACTACATGCCAACACACACACGAGTGTGAACACACACACACACACAAGTCATACCCATACACATGCACACGCGCGCGCGCACACACACACACACACCACAACCGTTAACCAGACATATAGTTGTGTGGAAACAAACCTAGTTTTCCTTGCAACTAGGACTGGCCAATGGTGAGAACTGGGTTAATGGAACACAGATATTAAATATGCACACTTCTGGAATGTTCTCCTGAAAAGGAATAGACATTCGCTCCCTTTGCCTCTGCTTCCCACCAACTTGAGATATAGACGCAAAGGCAGGTGAGGCAAGTCACCCTCAAGTGAGAGGCACCGCTAGAGCAGGGCGCAAGCTCTGCACTCGGAGATTTAGGGCATCCTGTCCCCCAAAAGGAATGGGCTCAGAGCGCACTGGGACTCATGCTGTAACTACAGAGACTGATGCCCCTCCCCCAGGAGCACAACTATGCAGGCAGGCTGTAAGTCTGGGGGTGGCACGAGGTCTTAAATCCTGCTGGAGAAAACCTGCCTGCAACCTTACCAGTATGAAAAGCAGAGAGGTTCATCTTAATTCAATTTGGGTCTTTGTTTTTTTGTTGTTTTTTTTTACAACAGGATCCCTCTATAAAGCACTAGCCTCACACTCAGTATATAGACAAATCTATCCTGGAATTCCAGTAATCCTCCTGCCTCTGATTCTCAAGTGTAATTATAGACATATAACACCGTATCAAGCAAGCAAGTGCACACACGCACGCACACGCTCTTGTTACATAGCCTGGGCTAGCCTACAACTCACAGCAATCCTGCCTCGACCTCCCAAGTGAGGAAATTAAAAGCGTATACCACCATGCCTGGCTTAATGCCATTTTTTTAGGTTGGTATTATTTTTATGCGTATATGTTTTGCCTACATGTATGTATGCATACAAATACACACAGACACAGAGATAAATAAATGTAATTTTTAAACCTCTTTGGCTTTAGGTATGTAAACCAGGAGAAGAAAAGGACAAGAGCCCCGAAAAGCTTCCAGACACAAAACAATCACTCTGGCCTCGCTCACCTCATCACCTCGATGTAGCCCTTGGCGGCAGCCACATGCAGGGCAGAGGCCCCGGTCCGGGGGTGGCGGGCCTCTGGCATGGCACCCCCATTCAGCCAGCACCTTGTGTCATGAAGCAGCAGTTCTTCTTCAGCCCGCTTGGCTGCCTCGACATCCACACCTGGGAGAATGAGAGGTGACAGGTGGACTCACACAGGGTGGCCTAGGAAACCCCGGCTGCGGTCTCAACTAGTCACAGCCCGGCCCCGTGACTCATCAAGTCTCTGGACCACTCAGGAGACCGGGACTGCCCCAGTGTTTCCCAACTGTGCTCCCTGAAGACCTGGGCACCACCGAGGGGGCCAAGACAGGCCAGGAATGGAAACCACAGGTCCTGACCCCTGTGGGTCAGTATCCTCTTTATGTTTTTCTAATAGAAAACCCCACACCGGATTCCATCTAGGTTTTCCTACCCCTCCAGCTATAAGCTAAAGCCAGCGCCTTCACACAATGTCACTGCTGGTTCTTCTCCCTTTGAAGTACGATAGGCCAAACAAAACTTCACTACGGCGTTGTACGTGGTGGCTCCGGCCTCTATTCCAGATCTCAGCCTTGGCAGGATGACCGGTGGCCTCGAATCTGAGAACAGCCTGAGCTACATACATGGTGTCAAGCCAACCAGGACTAGAGAGACAGACTCTGTCTTAGACAACAGTAAAAACTAAAACTCAAAAGCTTCTGGGCGGTGGTGCACACCATTAATCCCAGCACTCGGGAGGCAGAGGCAGGCGGATCTCTGTGAGTTCGAGACCAGCCTGGTCTCCAGAGTGAGTGCCAGGATAGGCTCCAAAGCTACACAGAGAAACCCTGTCTCGAGAAAAAAAAAAAAAAAAAAAAAAAAGCTATTTCCCAAACTATTTGCATGCATAGTTTCATTCTTGCCCAGATGTCCAGGCATTTGACACCTCGCTGGCCCACGACAGAAGTGAGAAGTGAGTGACTGCCTTGGCACTTTGTGCTTATGCGGGTATGCTGCATGCCTGTGACCCCAACACAGGCAAGAGGCAAGAGACCAGCAGGGCTCCACAGAGACCCTGAGTCAAAAGACAAACAGAGGGGGAGGGGCTGGAGAGATGGTTTAGAGGATGAAGTGCCAAGCCCGATGACCCAAGTTCAATCCTGGGAACTCATGAGGCAAAGGAAAGAATCAAGTTGCACAAGGGGTTTCCCTTTGTGAACCCAGCTTGGCCTCAAACTCACAGCAATCCTCAGTCTCTGGAAAGCTGAGATTAAGAGGGGGTTTTTTTGTTGTTTATTTGTTTTTTTTGGTTTTGGTTTTACGAGACAGGGTTTCTCTGTGTATCTTTGGAGCCTATCCTGGCACTCGCTCTGGAGACCAGGCTGGTCTCCAACTCACAGAGATCCACCTGCCTCTGCCTCCCGAGTGCTGGGATTAAAGGCGTGCACCACCAACACCTGGCTAAGATTAAGAGTTACACACCACACCTGTACTCCCTGCACTCAAAGAGGCTGAGGCAGGAGGATTGCTCCAAGTCCAAGGTCAGCCTGGGCGCCAGCATGAGAGCCTGTCTCAAACACCTCAGGGGGGAAACAGAAAGCCAGGCAGACTAGCTGAGGCTGAAGCACTCCAGCCCTCACTGTGACCCTCATCCCTTAAAGCACCCCTAACTCACTGAGACCACAGCAAAATGGCCTCTGCTGAATAACTTCCTCCTGGGAAGGTTATTACTGCCCATGCTTTTGCAGTTGTGAAACTCTTGACTTGCCGAAGTTCCTCAGAGTTGAGCTGTTGTATCCAGTAGCCGGCAGCTATGTGGAACTGCCGAGCGAGCACTCGAAACTGAGACATGCTGTGAACGTCAAGTGCACTCGGGATTTCAAAACACAGGAAAAGGTAAGGGCTCTCGTGGACAGTTGTCTCTAAACTGTTTTGTGCACACGTGCATGGCAGCGTGGTCAGGGGGCAATTCTGAGGAGCCGAGTCCTGCTTCCCACCTTGCTGAGGCTGGGTCTCTGGATTCTGCGGCTGTGCTGTGTACTCTAGGCTACCCGGCCCACAGGGCGTCCCCACAGTTCTCCCACCTTCCTCTAGGACCTGGGAGTACGGACGTGCACCAGTGCCGCCGCCGGCTTTTTACAAGGGTTCTAGAGGTGGTAACTTGGGTGCATCTAACATCTTTACTGGCTGAGCTATCTCCCCAGTTCCCCTTACTGTGTTGATTGCACCCAACGGAATACTGGGTTTGTTTTTTGTTCTGGAGCGTGCGTGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGATACAGACACAGAATCTTAACAGAGAGACAGAGTCTTACATTATATAGTGGAGGCTGAATATCTAGTCTTCCTGCCTCCCAAGTACTATGGGATAGTCCTTCTGTACGCTACGAATATGGACTCTTCTCATTGGTTAATAATAAAGCTGAGTTGGCCCACAGCCAGGCAGAATAAGGGTAGGCGGGAAAGCCAAACAGAGATACAGGGAGAAAGAAGGGCAGAGTTGAGTGAGACGTAAGCAGCCACCAGGGAAGCAAGATGCCAGGTGACAGGTAAAGCCACGAGCCATGTGGCAAAACACAGGCTAATAGAAATGGGTTGATTTAAGTTGTAAGAGCTAGTTAGTAATAAGCCTGAGCTATAAGCCGAGCATTCCGTAATCAATACGAGCTCTTGTGTATTTATTTGGGGCCTGGCGATTGGAACTAAAGGGAAGCTTAGACTACGGACTTGCACCTCCATGCTTAGTTTATGGGTTCAGAGGACCATGCTAATGGATAAGCACTCTACCAACTAAGCTACACCCCCAGCCTATGGCTTGCAAGTTTCAAACTACATCTGTGGCTCATTCAGGATTTCCACTGGGCGTCACTGGCAAAGGCCTTCAGGTCCCACCTGGAGCGCTGGCTCAGCCATTAGAGCCATTAATGGTAGACTCACAACCTACACAAGAGACAAAAACCCACACAAGGGGTGGAATGCAGAGACTCAACCAGTTCCAAGCCAGCCGGGACTAACAAAGCAAGATCCTGGCTCATAAACCCAGGAGCAGGGTTTAGCCCAGTGGTGGTATGCCTGCCTGGAAAGGGATGGCCCCAGGTTCAGGCCTCTACACAGAGGGCTGCTTTCCTCACCACACTCCCTCTTAACCAAGGTGAGCAGCCGCTCCCCTCAGCACACACATTGTACACTGCCACCATAAAGCTTTACATGGGACCCAAGAAACAGTCCTGAAAGCTGGTTCGGGATGTTCTTTCTCATTGCAAGGCAAGGCCAACTCCATGCGGACACCGGCTGCAGCTTGGTGCTACCTGGCGGCAGCCGGGTCCTAGCTCCTTGTGTCTCCTGGCCAACTAGGGTTTCCCTTGTGGTGGCAGAGTTCAAGAATGCATGGCGAAAGTCCACCCGCAGCACAGTCACAGGGAACAGGGCAGGGAGGGCCAGGCCCGCCCTCGTCCTCCAGACTCCTGCTTCCTTAAAGGGAGTCTCCCACAGTTCCACCTACTGTGGGGGGAAGGGGAAGGGGAAGGGCGGAGCTCCCTTGCTGTTCTTCAACCACCAGCCAGTACTCCCGTGCAGGCTCAAGGGCAGCCTGTGCTCTCCACACAGCCAAGACCTGCTTGCTTGTTACTCAGTTTTTCTTACACAGGCCGTTAGCTGATTAATTGGGTTTTTATTTTATGTGTATGGATGTGTTGCCTGTGTGCATGAATGTATACATGTGTGCTGGTGCCCGAAAAGGCCAGAAGAGGGTGTCAGATTCCTCTGGAAATGGAGTTACAGGTGTCATGTGGGTGCTAGAGTTGAACCCGAGTCTTAACCACCGAGGCATAGCCACTGATTCAGCCAGACTGACCAGCCTGCAAACCCCAGGGATCCTCTGTATCGGCCTTGCCCCACACCTGCTAGGATTACAGGTGGTGGTGGGCTTGGCTTTGTGGTTGCTGGGGAACTGAACTTAAGACCTCAGTATGTGCACCAAACCCTTCTACTGACTTAGCAACATTCCCGTGGAAGTCCTGAAAATGAAGGACGGGGGGAAGGATACTGACTCTGCTGTAAGAAAATTCTTACATTTATGTTATTGTGTGGATGTGTGTGCACTCAAGCACAAATGAGAGCTAGAGAGGGCCTGCAGAAGTCACTTCTCTCCTCCCACCAAGCGGATCCCAGGGACTGAGCCCAGGGGTCAGGCTTGGTGGTGAGCGCCTTCGCCCACTGAAGCACCTCACCAGCCTGAAAATAAAGCTCTCATGGCACCCAGCCACGTCTGCTTTTTCTCATCCCGTCGCTGGCTCATTTCCCCCGATAGCAGCTGGTAGAGTCATTATAGCAAGACCGTGCACCCTGTAAGGCCTGAAACACATACTGACCAGCCCTCCACAGGTCCCAGCTGACTCCTGCTGGGACCACTGAGTTATAAATCAGAGCGTCATCTACCGGCTGCAGAGGCGACAGCTTTTTGGTGTCACCAACAGCAAACACTGTGCTGTATTCCTGTGCACTCACCACCTGTGAGAAAATGCACCAGGGCAGGAGCTCAGGCCTGCAGCTTCAGCCAGGTTAAGGCCGGCCTGAGCTCTCCTTCCAGGCACAGCCTTGCACTACTCTAGCTGGCATCTGTAACTACCGCAGTCCACTGTGCCCATCTCTGCATGCTACAGCCCTCACTGTCCTTCCTGGATGTCAGTTTCCATGGGAGACAGCTTCGCCTTTCTCCAAAGCACATCCTAAGTCTCCTTCCTACCCTGTCCCCCCAAGGGGGGCTCCTCCTCCACGGACACTGTGCTTTCAGTCTTTGCCAGGGGTCTGACCTAGGCCTGGGCCGCACCAACACTGCTAGGACCTGGCAGCACCCACTCTTCCTCCTTCAGGAACCACGTCCTGACTTTCCTCGCCCACAGGGCTTCAGTGTGACACTTGTCACAAGGTGACAAGTCCTCCTGCACACTGGTGGGCTCTGGGACTGACATGAGATCATGTGCCAGTGTCACACAGAGAGCTGTGGCTCAGCCACTGAGGGGGGTAGGGCTACTGTACCCCACCTAGGCATTAGCCCTGCTAAGCACCACAGGGAGAGACCAGACCCCACCAGGAGGCCAAAGCGGCTGGTGGCATTAGGGATCCACTGCCAAAGACTGGAACTCTAGGGCTTGGACAGACAGATGGCTCAGTTGGTAAAGTGTTCACCACACAAGCTGCAAACCTGAGTTCAACCCCCAGCACCCATGTAAAATGCCAGGCATGGTGGAGCATGTGTAATCCCAGTACTGGGGAGGTAGAGACTGGAGGACAACCGGGGTTCACTGGCCAGCCAAACTAGCCCAATCGTGGAAGCTACTGAGACACCCTGACTCAAAAATCAAGGTAGACGGCTCCTGACGAACATTCGATTGACCTCTGGTCTCCAAACACACCTGTGCACGCACACATGCACACACAAACATATGAAGGACTGAGATTCTGCATACGTTAAACAGCAACTCTCTCCTCCCCCTTTTTATTGCATTCATTTACTGGTGTGTGTGGCTGAGAACAATCTATGGGGTCAGTTCTCTGGTCCACCAAGTGGGTCCAAGGAATCAGACTCAGTTGTAGGCTTGGCAGCAAGCACCTTGACCCACTGAGCCATCCAGCCAACTCTCTTTTTTGTTTGTTTAGTTTGTTGGGTCAGAATCTCTCTGTGTAGTCGTGGCTGTCCTGGAAGCCACTCTGTAGACCAGGCTGGCCTCAAACTCAGAGATTCACCTGTCTCTGCCTCCAGTGCTGGGAATAAGGCATGTGATAGGGTTAAACCCACCACACCCAGCTCTACTCCCAGGGTTGTTAGCGCCTGGAAACCACATTGGATGCTCTGTGGCTATGACTTTGGGAGCGCTATTATTTTCATTACGCTTGGTGTCTCACACAAATGGAAACCTCGCACTTGTCTTTGAGTGGCTGACTTGCTCCATGTAGGTCCTTAAGTCTCATCCAAATCTGGCAGGCGGTGGTGGCGCACGCCTTTAGTCCCAGTACTCAGGAGGCAGAGGCAGGCGGAGTTCGAAGCCAGCCTGGTCTACAGAGACAGTTCCAGGACAGGCTCCAAAGCAATACAGAGAAACCCTGCCTCAAAAAACCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGAAAGAAAAAGTTTCATCCACATCGTTAGACGTGTTGGTTTCCTTCCCTGTTAAGGATGAGCAGCATTCTTTTATCTGTATAGACCACATTTTGCTTATCCAGCCAGTGATGGACTTCCTACCCTCCCTGGTCCTGAGGCTGGAATTCTCATACCAGACCAAGTGCCACAGGCTGGAGTACTAAGCAACACCCAAGTCCTAGGCTACTGTAAATACGCCTGCAGGTGGCTTTCTCTTTGCCCAACACCACAAAACATAAAGAAGGGAGCCAGACATAGAGGCAACTACTACAATCCAGACCCTCAAGAGGCTGAAGCAGAAGGATCCAAAACCGTACTACAGTCAGTTTCGCCGCAGCCGAGGCCAACTAACTAATTAATTAACAAAATAATACGTATTGTGGGTGTGCATCTTGCGATGCTTGTGTTGTGGTGTGGGGATTGAACCTGCCTACGCTCAGCAAACGCTCTGCCAGTATGAAGTGTCCAGTCCTCTCCCACACACACGCGAACACACGCGAACACACGGGAACACACGCACACACACACACACACACACACACACACACACACACACACACGCACACGTATATTTAAGATCTTTCCTCTCTCTCTCTCTCTCTCTCTCACACACACACACACACACAGGGTTAGTTAAGACCTTATTTGTATTACTTTTAATTGTGTGTGCGTGTGTCTGTGCAGGGCACGCACACACGTGTTTCAGTACCGGAAGAGGTGTGGGATCCCCCAGGTGCTGGAGCTACAGTGAGCCAGACACTGGTGCTCTGAACTGAACTGAATCCTCTGCCAAAGCAGAAAGCACTCTCTGGACTCCTGCTTTTGTTGGTTTTGTTTTGTTTTGTTTTGTTTTGTTTTGTTTTCTTTGTACTTTTCAACAGATTCTCACTAAACTGTCCAAGTTGGCTTGAACTCCCTCTGTAGTTCAGGCAGGCCTTGAACTCACAATTCCTCAGGCCTGGGAGAGCGGAATCTTTTCGTCAAGAAAACACCCCATTTGAAAACTGAGGAATGCTGTATCAGCACAGGAAGGGGGAAGCTCAGGCCTTGTGGCTTAGAGAAGCGGCCTTGTGCCATGGGGTTAAGAGCCCCAGGCTGCCCCATCTCGTTGGCTGAGGGAGGCGCTTCCCGTTATCTGAGCAGAGCTTCCAGCATCAGCAACATAGTCTCCAAGTGGCTGAGGAATGGAAGGAGGATGGACTGGAAAGGAGAAAACAGGAAGGGTACTGCCGCCTGTGTGTGGGGAAAGGGGCAGAGCTGGACAAAACAGTAAAGGCGTCTATTTAAAGTGTGCGATTCCATCTGCACGAAATGTCCGCAACAGACAGATCCCTAATGAGAGAAACCTTAGAGGCTTGCCCAGGGATGGGACAGGGGACTAGACTTTTGAGGGTGACTTTAAAATGCTCTGAAATCAATGTGGCATCGACTCCGACAACTCTGTGGACCACAGCACAACCAGGAAGTGCACTTTGGATGGGCAAACTTCTGGGCATATTAATTACAGCCCCAAAGGCTGCTTTGTTATAAAAAGCACTGGTGGGCTGGCCGGCTAGCTCAGCAGGTCAGGCGCTTGCCACCAACAACCTGAGTCCCAGACCAAGGCCACATGGTGGAAGGAGAGGCCTGCCAGAAATTGCCCTCTGACCCCCACAGTGCCGAGCACTCACACTCATGATAAACTAAATAAATCTAAAAAACAAAACAAGACTTCAAAAGCAGCAGATGGAGCGCTGACACAGACACTCGGGAGGCTTGGGCAGGACGGCTCCAAATTCAAGGCCAGCCTGATCTACGCAGTGAGTACCAAGCCAGCCAGGACTTCGTAGCAAGACCCTGTCTCAAAGACATAAACAGGGCTAAAGGGCTGCCTCAGTGGTTAACAGCGCTGGATGCTCTTCCTGAAGACCCAGGTTCAATTCCCAGCACCCCGGGCAGGCAGCTCACAACCATCTGTAACTACACTCCCAGGGATCCAGTGCCATCTTCTAGCCTCCGCAGACACCAGGCACACATGGAACAAAATACCGGGACATAAAGAACACACTGTGTGGTGAAGCCCAGGGAAGGATCTGTGGTGGCTGTCACAGTACCGAGGCGACTCTTCTGAGTTTGAATCAGGGGACGGGAAGGAGAGCTCAGCTCAACCGCTGCTACCTGTGGCTCCTGACCACTGCCCTTCAGCTCTTGGTGCCCACTGGCTACCAAGCATTCCCAAGTGACTCGCAGTCACCTGAAATTCAATATGCCAACATGGTGAACCCACTGTCTCTCCATCCTGCGTAGCAACACGCAAGGACGGGGAGCCAAGACTATGCCTCCCATGAACTATCTGTCCTCTGTCCCCGCTTATCTCCTAACTGGACAGTCCCCAGTCTGGAACTGGTGCCTTATGTTCCTGGAGAGCCTGCAAAGCTGCCTGTTTGCTGATCCCTTTCCTTCCAGACCCTGCACTACAGAGCTGAGAGCCACCCAGCTATAACCCAGTGTTTCGTTTGTAGCTGACAGGGACTCACAGAGCCCAGGCTGCTCACAAACTTACTATGTGGGGAAGCCTGACCTAAACTCCTGATCTTCCTGCCCTGCCTCCCAAGGCTGGCTGGGATTACAGGCCTGTGCCGGGACACCTGGCCGGGACACTAGCTTGTCAGGCAGGCAGAGAGGGCTCTCAAGCCCTGTTAAGAACTTGCTATTGGGAACACACACGCCCCACCCAGGAAAATGAATAGGACCCAACATGGAGTTTCAAGGGGCATGATGGGAGCTCAGGAGAGAATCCTCTGCATGCTCCAGTGCCTCCTAACACGAGCTGGGTCTAGCCATCTTGCTGCTTACTCCTCGACAGGCCCTTGCTGACAGCACCTCCCTCCTTCAGTTCCTCAGACACTCACAGCAGTTGGGGCTCTTACTCTGTGTCTGGCAGTGTCTCACTAGACCCTTGGCAACCCACCCTGGGGACACGTACCACCCCCACTTCACAGGGAAGGAAACTGAGGCACAAAGAGCAAGAGTACAAGGAAATGGGCTGGGCCTTTGAGCCCAGACTCCCAGACGCCAAAGCTCTCGATCCCACAGGCCCACCTCGGCGGGCGATCTCCGCCTTCAGCAGCCCCTCCATGGCATCCGACTCAGCCAGGTCCAAAGACAGGTCTCCATCACTGTTGACGGCGGCGATGTTGGCCCCATGGCTCAGGAGGTACCTAGGGGCAGGGGAAGGTCAGAGCCACCAGGCCTGGACCTAACGCCTAACCCAAGCCCTGCCCTTCAACCCCAGCCTCACCTGGCAATGTCCAAGTACCCACAGGAGGCTGCCACATGCAGCGGCGTCCAGCCCTCGTTGTCCGCCTGGTTCACAGTAGCACCCTGCTCCACCAGGAAGCGCACCACCTCCAGGTTCTCGTCTATGCAGGCCTGGGGACGGGGACAGGCCCATCAGCTCCCGGCCGGGCCAATGAGAGGTGTGGAAAGCAACGCCGATGGGCTGCAGCACAGATTCCAGGGGCCCTCTGGTCAGTGGCCGCCTAAAATATGCCTCGTTACCCATGCTTGGGTAATCTATGCATGCAGAGCTCATGGAGACTAGAGCAGGCTCCAAAAGGCAGATTGAAAAGGCGACCAGGGAAGAGGCGGAGCTGCCATCCCTGCATGTGACTGCTGAACATACCCTATGAGGCAGAGGAACCCCAGAGCCCAGCCATGTTCTTCCAAGGGGCAGGGCAAGGCTAGGTTGAGGCAAAACGCTCACCTAGCCCTGGGTTCCATCCACAACACAGGAAAAAGAGAGATCACCACAAAGAGACACACGCACATCCCAGAGTTGAGGGCTTGGGGCACAGTTCCCAAAAGGGATGAGTAGGCTATGTTCCCGGTGTCCAGGGATCCAAGCAGACCAAGCTCTGGGTCACTGAGGGCCTACCGTGCACAGGTCTCCTCAGAACTTCTTTTCTAAACACCCCACACCACACTAATCCCCCACCTCCTCACCCTTCGAACCAACAGCTCAGGAGAGGAAGGCCTCACCCTAGCCAGCACAGCACCCAGGGCCACAAGAGAGCTGGTCTCAATCCCTGATGACACTGCTTGGACACTGGAACCACTGAGTCTAGGGAGGGGGTTAGGTCCGGACTCCTGGGTCCTCATGAAAATTAACCCCCTTCTACAAGCGCGACCATCTGGAGAAAGAGGGAAGGAAGCTACGAGGGCCAAGTGCATGAAGTCATGGAAATTTAGGCTGGGGGGGGGGGCACGTGCCCTGGGAACGGGATGAACTCTGGGCTTCACTCTGGGCTCAGTTTATTTCCACCCTGTTGTCATGGTGATGGGAGGGGGGGCAAGGAGGCAGATGGGCCTTTCCCTTTCAAGGACCTGGCCGGGTACGGGCATCCATGTGAAAGATGCCTGAGGCTGGGCACTGGGGACCCAAGAATCCTCCTCCCTCAGATGTAGAACTCTAGCCAATCCTCTTTCCTTAGACCCAGGGATCCAGACTTGGCCCTCCTCCCTCAGGCCCAGGTGCTAGGGCTCCCCATCTCTCCCCTGCTCAAACCTAGGACTCTTAACTCCCAGCCCTACCTACTCCAGACCCAACTCATAGCCATTATTGGACAAGGCAATTATTGGACAAGGGAAAGAGGAAGGAATGTCCCTGCCTTGCTAAGGCAGAGGCTGGGGCTTAGGAAATGTCATTGCAGGAGGCTGATGCCCCAAGGAGGGTCTAGAACCGGAAACACTAAAAAGTCTGAGGTGTAGAAATCACCACAGACTGGGTGGCTCAATGCCCCTGCTTTCCTGGGACTGAAACTAGTTTCAGGAGTTTTCACTGCTGAAGCCAGGGCAGTGGTACTAGGAGGTGATGCTACGTACGCACCACTCCAAACCCCAGCCCCCTCTGCGTTCTGGCCCTGAAAGCCAAATGATCTCACTGAATCTGATCTCCAGTCTCCCAAGCCTCCTGCAAAGGCCTGAAGAGTCAGGTCACCAAGGTGTCTGCATGGCGGGAGGAGAGTCCCACCTGGAAGGCTGACACGTCAGGCCTGAGGTCACAGGTTCCTGTCAGAGAGGATGCTCTAGGGACCTCCAGCAGATGCAGAGGAAGGGGATGCAGTTGGGAGGGAACTCTTGGGAGGGCCAGGGACTTTGGTGATCATGTGAGCAGCCTGAGCTGATCTCCTGGACTGGTCAAAGACGCTGACACCCTGAGTGTGGCCTCGGGAAAACAGGACCCTGCTATATATAGAGGACGATGTCCCACACAGCTCACGCCGGCCCCATAAAGGAAGTTTTCCACAGGACGCCTCTCACCATAGAGTCCCTCTGGGGACAGGGGTGACCACTGGTCCCATTCTACAGGTAAAAAAACTAAGGCGCACCGAGAAAAGACACTCAAGATACAAGACACAAGAAGCAGACTGACACAAAAAGTCAGCACGGACTTTTTTTGTTTGGTCAAGATTTTGCAACTGGGTCTCATGTGGGCTATCAAGATGGCCTCAAAGTCACTGTGTAGATGAAGGTGACACTGAATTCCAACCCTCCTGCCTCTACTTTCCAAGCACCTGATTTCTGTGGTATTGGGGTTGGAACCTGAGGCTTCCTGCACTCTAGGCAAGCACTCTGTCTAAAAGACAGCCCAGCCCAGGACAGACGGATTCTGTTTTTCCTCTGCCTGGATGAGTGAAACACTGAACCTTTATTCCCCACCTCCACGAGCATCCTAGCAAGAGGACGACAACCCAGGAGATGGAAGTTGCCATGAAAGACTGAAAGTGAACCAACACTGTGGCCAGGAGGAAGAAGAACGGGGATGGGGGCTCTGCTGTGACTAATCTTGTCCCTGACAATGCCAGCTTTTGGATGACGGGGAGATAAAAGCATCCCGAATCCAGAAGGATCCCGGCAATACAAGATGGTCCTCACTCTCGGGGCACAGATCACTGGAAAAAGATAATCACAGTGTCTGAGTCGCCCAGGGTCCTGGTGGGGTAGGTTCTAGAAGGTGACAGGGTGGAAATCTAAGAGACAGGGCATAGTTTTTAAAGCAGGATGCTGCCCAAATATAGTCCATGGGGTGGTAGGTGGAGTGGGCATGCCTGTAATCCCACAAATGAGGGGGTCAGAGACACAGGACCTGTATTTGAGGTTGGCCTGGGCTACACAGGGGAAAAAACAAAAAACAACAACAAAAACAAAACCAGAGGAGAGAGAAATAGGGCTTGGAAGACCGAATGCTTAGAAGTTTCCAGAAAGGCAAATCAATGTGGACACAGAGAGAGAAAGACAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGTTGAGGAGAAACCTATGGGGGGTGGGGGTGGGTGGCAAGATCACCAAAAGGGGATGAGCCGAGAATTGAATTAATAGGACATGGGGAGGGGAGGAAGGTTATGGGATGGGGCCCAACAGACGGTGGAGCGCCTCTTCTCCAGGGGAACAAAGGGGTACACTGCCTTGGAGGGGCAAAGGACCCTCCTGAGGCCACAGCGGACAGCACGGGTCACAGGAAGTGGGGTAGGGAACAAGGTGGACCCCCCAAAAGAAGTGACACTGAAGGGCCTGGGCCTGGCTAGCCTCAGAGGAGGGAGTGGGGGATTGGGGGGGGGGGCGTCAAGTCAGAGCTGGGCCCTGGAAGCCTGCGGCACAGCCAGGGCAGCCACCAGCCTGGAAAGGCACGGGGTGTAAGCCATCCGTGTGCGGAAGACGCCGCCGGGGAGAGCGGTGACAGCGCGGATGACAGGGGCGAGGCGGCCCCTGCAGGGCAGGAGGCGGGGAGGGAGGAGGGGTGGCTCGGGGGGCCCCGGGGAGGGAGGATGCTCGGGGGCCGCTGACCTGGTGCAGGGCGCTGATGCCGTCGGCGTTGGTGGAGTCGAGCACCGCTCGGGCAGGCGGCGGGACGCCGGCGTCCGATTCCCCGCTGGCGCCGGGATCGGGGCCCCCGGGGTCCCCGGGATCCCCGGGGTCGGCTGCGCGAAGCATCAGGCGAGCCTCATCCAGATCGCCGCCCGCACAGGCCGCCAGGAACTCGGCGGCGCGCTCGAAGCGCACGGTGCGAGCACGACGCTCCCCGGGGCCCGGCTCAGCCCCCGCCCGCGCCCCCCACCGCCGCAGCTGCTCCTGCCGCCGCTCGCGGGCTGCCGCCGCCGCCGAAGACGACGACGACGACGACGACGACGACGACGCCGCCCCGGGGCCGTCCTCGCCCGACATCGCGCCCCACACCGGGCCGCTCGCCCGCTCACCCACCGAGCGAGCGAGCGAGCGAGCTGAGCGAGCGCCCGCCCGAAGGCCGGCCGGCGACGAACAGCCGCCACCCGCCCGCTCGCTCGCTCGCCCGCCCGCCCGCCAGCCCCGGGGGCCGCCGGGAACCGCCGCCGCCGCCGCCGCCGCCGCCACAAGCACCGCCCCGAGGCTCAGGCTGGGCCCCACCCCTCCCCCCACGGACGGGCGTTGACGTCACGACGCTGCCCCACAGCCCTCTGGGAAATGGAGTCCTCCGTTGAGAAGCCCGCAGGGTTTTTTCAGCAGACTCGCTAACTGCTGAGGGAACGGTCGGGGTGGCACGGAAGCCGCCAGCAGGCGCGCCTACAGCCCCCAGCACCTGAGAGGCAAACTGCTCTCTCGAGTTCGAGGTCAGCCTGGGCTACAGAGGCAGTGCCAGGGTAGCACCAATTGCCTAAAGCAGGACACGCCCCCCCCCGGGAATGCTGGAAATCTGAGTTTAGAGGCGGGACGGGATGCCCGGGGGGATGCTGGGAGATGTAGTTTTTTTGGTAAAGCGGCGCAAAGGATGGCGCGTGGGAAATGATGGCGTGTAGCGGAACCCGAGAGACGCAGAAATAAGACTCGCGTACTTTCAGTTGTGTTTTTGCTGTGAGATGGGTTTGCCCTCGAGCTCGCTGTGTGACTGCGATTGTCTGTTTTAAACTCCCGACCTTCCTGCCTCCGTCTCCTAATTGCTGGGGTTGCAGACGTTTGTTTGGGTTTTGTTGGTTTGGTTTGGGTTGGGTTTTTTCTTGGGGGCGGGGGTATTTTGTTGTTTTGTTTTTGTTTTTGTTTTGAGACAGCGTCTCACTATGTAGCCCTGCCTGGCCTGAAACTCGCTACGTAGACCAGGCTGGCCTCGAACTCATAGAGACTCCTCCCCCCACACTTCTGCCTGGTATGAAGGGGGCGCCACCAGGTCCCGCTTGTTTTGGTTTTGGAATCTGCCCCTCCCTCCCTCCCCATCAACACCCGATGAAGGACAAGGATTTGTGAATGAATGAATGAATGCATGAGTGCATGAATGAATGGGCTCCCCAAGACGTCGGGGAGACCAGGGGCCCACGGGAAACTGAGTCCTGAAACCAGATTAAACACCAATCGCCGCCAAACTCCTCTGGGTAACTAAGGTTCCCGTGCAAAATCCAAGGGTATCGGGTAGCATGGGGCAAGCTGGGAAATGTAGTCCCAGGGCCACGCCTCCTAAAGAGTTCAGCCCCCAGACTTCCAAAACTGCCTGAGATGCCAAGGTACCCCGGAAAGTCAGTTTCCAGATGAAGACAAGCCTCCGGTCTCCAGCGGTAATCCCTTGAGCACCCGGGAAGAAGGGTCCCCAAAGAACCACACATTTCTCCTTAGCCCACTCGGGGCTGCGGGGGACGCTAGGAGATGCTCTCCCGGCTGCATCAATGCTCTCCTGGAATTCTGGGATCGGTAGCACAAAATGTGATGCTCCGATAGGTTTGGAAGTTTTGTTAGTAGACCCAACAGATAAAAGAACACCTTGATCTTTCAAGAATCTTCCCCCCACCCCCACCCCCACCCCCACCTCCACCCCAAAAATTGCAATTTGAGAAGGACAGAAACACTTTTGAGACAGGAACACAGACTCACACACACACACACAAAAAAGTAGAACAGAAAGCTGTCAAGTTTATAGAGAGAAAACACGTCTTCCTAAGGGTCGTTAGGGCAGCCCCGTTCACACTGTGACCCTTGGATTTGTGAATGAGAGATAAATTACAGACCCTGGCAGAGTCTAGGGAATAACGACCATAAATCCAAAAGGATAACCCTGTGGTTTTTAAGATGTGAGATCACACACACACACACACACACACACACACACACACACACACACACACCATTCTTCCCCAAGGCAAGAAATCAGATATTTCAACCCCTGGGGTCCAGAAGGAAGGAGGTCGCTGACTCCAAAAACTGTCTTCTGATTTCCACCATGGATTTCCACACACACACACCCTATCAACACACACACTAAATAGACGTTTATAAAATGATCCACAAAATAAGGCTACACCAACACACAGAGGTAAGACTGTTGTTAGACAGTTTTGGTCTGGTTGGGTTTTTTTTTTTTTTTTTTTTTTTTTTGAGTAGCCTTCTCCTGTCCCATTTCTCATGCCTCTACACACACCTGGCCTCTGGGTGTGTTATTTTAAAACATCCTTAGAAGAATTAATGACCTTGTACAACCAGTTTAAATGCAAGAGGCAATTAATTTTGTTTTGTTTTGTTTTTCGAGACAGGGTTTCTCTGTGTAGCTTTGGAGCCTGTCCTGGCACTCGTTCTGTAGACCAGGCTGACCTCGAACTCACAGAGATCCCCCTGCCTCTGCCTCCCGAGTGCTGGGATTAAAGGCGAGCCCGGCAGCACTGGAGATTTAACTCAAGGTCTCCTGAGTGCTCGACAAGCTACTCCCAGCCATGAACTTGATATCTCTTTAATGGCAGCTGATGTCTCTCCCGGGCAACATGGAGCTGTCCAGCCAAGCCGCACAGCCAGCCACGCATAATGACAACACGGAAGAACTCAAGCGGATGTCTGGAGGGCCTTTATTTTGAGTTACAGATGGGGGACACACTCCAGAGGCTCCCAGGCTCCATGCAGTGGGGCGTGTCCTGGCAGTCTCACTTCCAGCGGCCTCCAACTCGACCCTTCCCAGCCCCCTTTCGGCTGTGGGAGAAGAAGGTGGAGTCAGGAAGAAGCCCGGAGCCTCCGAGATAAGCTTAACACAGTCCCTTTAAAATTAAGGAAGTCCACCAAATACCCACCCCCACCCAGAGGGAAGAGAGAGCAGAGGTCAGCAGAGCTGTTTTTTTTTGTTTGTTTTTTGGGTTTTTTTTTTGCAGTAGTGAGCATAAAGTCAAGGCCTCACACGTGCTAAGTATGTTCTGTACACTGAGCCACGCCCCTTGCCTCTCACTGGCGATTCTAAGCAAGGGCTCTACCACTGAGCCACATCCCCAGCCCCTCACTGGGGGATTCCAGGCAGGGGCTCTACCACTGAGCCACGCCCCCAGCCCCTCCTCACTGGGGGGATTCTAGGTAGGGGCTCCACCACTGAGCCACACCCCCAGCCCCTCCTCACTGGGGGGATTCTAGGCAGGGGCTCCACCACTGAGCCACGCCCCCAGCCCCTCCTCACTGGGGGGACTCTAGGCAGGGGCTCTACCACTGAGCCACGCCCCCAGCCCCTCCTCACTGGGGGGACTCTAGGCAGGGGCTCTACCACTGAGCCACGCCCCCAGCCCCTCACTGGGGGATTCTAGGCAGGGGCTCCACCACTGAGCCACACCCAGCCCCTCACTGGGGGATTCTAGGCAGGGGCTATACCACTGAGCCACACCCCCAGCCCCTCACTGGGGGATTCTAGGCAGGGGCTCCACCACTGAGCCACGCCCCCAGCCCCTCACTGGGGGATTCTAGGCAGGGGCTCTACCACTGAGCCACACCCCCAGCCCCTCACTGGGGGATTCTAGGCAGGGGCTCCACCACTGAGCCACGCCCCCATTAAGGGCATCTCTTTCAGATAATTCCCAGTAGGGGGTTGGTGGCCATGTTGGAGTTGACTTTCTTGGGTTAGTTCGGAGAACACATGCAAATTTATGAGTAAGGGGCCTGAGGGAGAAGGAAGGGTGAGCTGGAGTTGGTGACTTGCATGCAACAATGTTGAGTGAGGCTGGAACAGTACAGAAAATGCTAGAAAAAGGCAGAGACTGAGCAGTGAGCGGCCTGGATACGGTGGAGCACATCGGTAATCTCTGCACTCTGAAGGGGATGAGGCAGGAGGATCACCGAGAGTTTGAGGACAACCTGGGCTATATAGCAAGAGCCTGACTCAAATGAAAACAACAACAACAGCAAAAAAGTCGGGTATGATGGCTCTGTAATCCCTGAACTTGGGAAGCAGAGGCAGGAAAGTGTCAGGAGTTCAAGGACACCCTCAACTACAAATGGAGTTCAAGGTCATTCACGCTTACAGGAGACCTTGTCTTAAAGCAAGAAATAGAAGGAAAAGGGGCAGGAAGTGGACAGACAGATGGAGAAGGGGGGAGGGGGGAAAGAAAGGAAGAAAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAAAGAAAGGCAGACAGAGGGGGGCACTGAGATGGCTCAGCAGGTAAAGGAGCTTGCAGCCAAGCCTAGGCCCTGAGTTTCAACTCTGGGACCCACATGATAGAAGGAGAAAACCGACTTGTTCGAGTCATCCTTCGGCCACATCTGCACCATAACAGCACACACACACACACACACACACACACACACACACACACGCACGCACGCACGCACGCACGCACGCGCGCGCACACACACACACACACTATGCGGTGTGATATGATACAAAAAAAAGTGTAAAAGAAAATGTACTCAGAAAGAAAGGGTTGGAGGGAGGCAGAGAGGCGGGGAGATTGAGACCAAAGAGTTGATAAAGAGAAGCAAGAGATTGGAGTGCAGGCCAATAAACACAGCACTCAGCAGGCTGAAGCCAGGGGACCAGGAGGAGTTCAAGGTCAGCCTCAGCTACCTAGTGAGACTGGGCTGCATGAAACCTTGCCTTAAAAATAAATAGACAGAGCCGGGCAGTGATGCGCACGCCTTTAATCCCAGCACTTGGGAGGCAGAGGCAGGCGGATCTCTGTGAGTTCGAGACCAGCCTGGTCTACAGAGCTAGTTCCAGGACAGCCTCCAAAGCCACAGAGAAACCCTGTCTCGAAAAAACCAAAAAATAAATGAATAAATAAATAAATAAATAAATAGACATACCAAAAAAAAAAAAAAAAACAGGAACAGTGAGTCATGCCAATCATCCCCACATACATGGGATTAAAGCAAGAGGATCTCCTACAGGTTCAAAGAAAGCCTGGTCTACATAGTGAGTACCAGGCCAGCCTGGGCTACAAAGTAAGACTTCCTCGAAATAATAAACAAACTAAACAAACAAACAAACAAATAAATAAACAAACCCGAGAGAACAGATACAGAAAGGATGTCTCAGGGAGCAAGGAACAAAGACATATAAGATGCCAAAAGGAGGGCTGGAGAGATGGCTCAGCAGTTAAGAGCACTGGCTGCTGTTCTGGAGGTCCTGAGTTCAATTCCCAGCAACCATATGGTGGCTCACAGCCATCTATAATGAGATCTGGTGCCCTCTTCTGGCCTGCAGGCAGGCATACAAGCTGGCAGAACACTGCATACATAAATAAATAAATCAAAAAAAGATAACACTTTAAAGAAAATGATACTTTGAGAATTCTATGTATAGAGCCAGGCGGTGGTGGCGCACGCCTTTAATCTAGGTCCTCAGGAGGCAGAGGCAGGAGGATCTCTGTGAGTTCGAGGCCAGCCTGGTCTACTGAGCAAGTTCCAGGACAGGCTCCAAAGCTACAGAGAAACCCTGTCTCAGAAGAAGAAAAAATAAAAGATCCCAAAGGGCAGTGGTATGCAGAAGACAGGGAGGAAGGGAGGGAGGGAGGGACAGAGGGAGGGACAGAGGGAGGACAGCAGGCCTTTTGTGGAAGCAGCACTTACAATTTCTGGGCATGGCTGATTCGGTTGTACAGCACATTGATCTGTAGAACGAGAAGCCAGGCTAGGTGCAGATGTCCAACCAAAGCCCTGCCCTGCCTATCACCCCTGTCACCCCAGCCTGGACCCCAACAGAGGCAGGTCCCACCTCGTATTTCTGTTGCTTCAGTTTCTCCATCAGATCAAATTTCTCTGACTCGAGCTGGTGGATCCATTCCGACAGCTCCTGGGCCTTCTCCCTGGCAGAATGAGAATAACTGGGATGCAGCGAGACTATGTTCTGGGCCCAGAAAGGTTGAGACACCTACCCCAAGCCTCAAGGCAAGTCTCTCTGAGCTTGATACAGTTGGTATGCTAAGCCACTATGAGCCTGATACAGTTGGTATGTTGTGGAATGTTACTTTAACTATGTAAAGATGCCTTACATTTGTTTACTTTGTGGAATGTTACTTTAACTATGTAAAGATGCGTTACATTTGTTTACTTTGTGGAATGTTACTTTAACTATGTAAAGATGAGTTACATTTGTTTACGCTGTGGAATGTTACTATAACTATGTAAAGATGCGTTACATTTGTTTATATTGTGGAATGTTACTTTAACTATGTAAAGATGCGTTACATTTGTTTACGTTGTGGAATGTTACTATAACTATGTAAAGATGCGTTACATTTGTTTAGGTTGTGGAATGTTACTTTAACTATGTAAAGATGCGTTACATTTGTTTACTTTGTGGAATGTTACTCTAACTATGGGAAGGTGTGTTGCATTTGTTTCTGCTGCATTTGTTGAGTTGGATAAAGGTGTGTTGCTGTTTCACCTTGCCTGCCTAAGGCACCTGATTGGTCTAATAAAAAGCCGAACAGCCAATAGCTAGGCAGGAGAGGGATAAGCGGGGCTGGCAGGCAGAGAGAATAAGTAGGAGGAGGAATCTAGGATGCAGGGAGGGAGACCAAGGGAGAAAGAGAGGGAGATGCCTGGAGCCAACCAGACATGGAGTAGTCAAAATGCAGATGAAGAGAAACAGGTTAATTTAAGTTATAAGAGCTGGTAGGACAAGCATAAGCTAAGGCCAAGCTTTCATAACTAAATTATCTCTCCACGTCTTGATTTGCGAACCGGTTGGTGGCCCGAAAGGAAGGCAGCTACACTGGTAAATTCTTGTTAAGATTGGAGGCTGAAGTTTTAAAATATGGCCACTTTCTGAAACGGAGGTCTCCCAAAGGAGAGAAGGAAGTGATGACTGGGAGCCCCAGAATCGGAAAGATGTTTGGTTTTTATTTATTGCTTATGTAGTGTGTGTGTGTGTGTGCGTGTGTGTGTGTTTAATTTTGATTTCTGAGACAAGGTCTCGTGTAACCCAAGCTTCAATATATAGGAGAGGATGACCCAGAACTTCTGATCCTCCTGCCTCCCCCTCCTGAGTGCTAAGATTCCACCTAAATGAGGGAGAGAGCACTGTCAATGCCAGACTCCACAGGCCATGCCAGGCACAGGACAGATTGCACCCGAGTGACATTTTGAACAGAGAAAGCAACAGTGGCCCAGAAAAGGAATGTCACTTGCCTAAAGTGACACAGCACCAAGGCTCACACCTGGAACATCACCCACGGAAACCTTAGGAGAGCCACAGGTGTTGCTGTAGTTCCTTGTCCCACCAGGTCCCTTCGTCCTTCTCAGCCCCAAATAAACACACAGATACTTATATTAATTATAAAACTGTTGGCTGATGGCTAGGGCTTCTTATTGGCCAGCTCTGTCTTAATTGACCCATTTCTATAACTCTATGTATCTCCACGTGGTCTTGGCTTACCGGAGAATGGCCGGACCTGTTACTCCTTTTGGCAGCTACATGGTGTCTTCCCTGTGGCCCCTCTCTACCTACCTTTCCCAGAATCCTCCTCGTCTCCTAGCCCCGCCTATCTTGCTGCCTTTATTGGCCAAGCAGTGTTTCATTCATCAACCAATAAGAGAAACACATATACAGAAAGGCATCCCCCATCACACAGGCACTTACCGGAGTTGGTCCTCCCCCATGTAGTCGATGTTCAAGGGTTTTTTCCTCTCAGACAGGATCCTGAGCTTCATCTCCCGGCCGGTCTGCCGCTTCCCACGTTTCTGCTCAGCCTGGAGGGGGAGGAATCCCAAGCCAGGGATGGGACCTGGAGGCCAAATCCACTCAGGGTCCTACAGTCATGGCCAGGGCCTCCACCACTTGCAAGGGGCCCAGGCTGCAGCCCTCCTCCCCCAGACCCAGGAATCCAAGCTCCATGCCTCCTCCATCAGACACGGGAGTACAGGCCCACTCTTCCCTTGCACCCAGGCACCACCAGAATGTTATCTAAAGCGACAGCTGCCCCCCCTTACCCAAACCCCAACGGGATCCAGGCTCAGTGCCCTTCCTGAGGACCAGCATTCTGCAGCTCCCCTTCCCTCCTCCTTGTAAACGCAGACACCCCCCCCCCAGGGCTAGACTCACCTTGACCAGGTAGCCCCCAAAATGAGCCCCCATGTTGGAGAGAACCTTCTTCTTCTTGGCATCGTCCTCGGCTCGCTTCTTGGCTTCCTCCTCCTCTTTGCGCATCTTCTCTTCCTGTGAAAACAGAGGGGTTCCCTCCATGTGGCCCTACTAAGGAAGGCACGAGCCTGGGTAGTGCATGGCTAGGCTCCATAGACGGGGCCGCAGAGGGATCCACTCCTAAACTTGATATATAGTTCACCGAGCCCTCAGGTTGGCAGAAATCCTCCTGCCTCAGCTTCTCCAGGGCTGGGATCACAGGTCTGAGCCCACCGCAGGCAGCAAAGCTCAGTCATTGTGCTATGGTTTTGAGTCTCTTGATCCAGCCATGCCTGAACTTTTTAAAATTTATATGCAGTTCATCCTTTCACTAGGAAAAACAAAAAACAAAAACAAAAACAAAAAAACCTTGCGCTGTACATTACAGGGACTTTCTGAGAACCACAGGGGACATCAACGGCAGGAAAGGAAAGTATTCGTCTCCAAGAAAGGGGCAGACACCTACCGCCAGCTTGGCCTGCCGCTCCCGCTCCTTTTCGGTTCTGAATCGCTGCTGCTCAGCTCTCTCTGCACGACGCCTCTCCTGGGGTGGGGTTGGGGATGGAAGAGAGGAAGATAGCGGAGGGGGATTGGAGGCTACCCTCTCCCCCAGTTTATCCCTCCCTCCACCAGTAGACAGCAAGAGAGGTAAGTGCGGTTTCTTTTGTTTTCTTTTCCTTTTTTGAGATAGTCTCAGAGAGCCCAGGCTGGTCTCAAATTCGTGGCAATCTACCTTCCTTGTCCCTCTAAGAGCACGCCTGGCCGAAATACGCATTGGAGTGCAACCACCCGGTGTCCCCATTGTTTCTCCCGGAGACCCCAAAGCACTTCACGGAGGAAGGGACGAGGAGGGACCGAAGGACCCGGCCTCCCCGGCCTCCCCGGCCTCCCAGGCTCACGATGCGATCTTTCAGCGCAATGAGCTCCTCTTCCTCCTTTTTGCGCTGCTCGAAGTGCACGTCAATCAGAGTCTGCAGCTCCAGTAAGTCTTTCTCCATGCGCTTCCGGTGGATGTCCTGCAGAGGGAGCCCGTGAGGCAGAGGGACCAGACCCTAGAGCCGCCCCTCTCCGGCCCCAGGGGATGATGATTGACAGCCAGCTGGGACGGCTTCCAGCAGAGGTCAGCAAAGCATTCCTGGCTGGCAACAGGGCACCGAGGTAAATGCAGGCATTTTCAAGAAAGGAGCAAAGAGGGGCGCCTATCAGAATGGGCTCAAGGCGCTGAGGAGCCAGCAAGTATGTCTGGGGTGGGACACCTGTCGCTTACATCAAAGTCCACACGCTCCCCTTCTGGGATCTTGGGGGGGATCAAAGGAGGCACCACAGGACGGCTGTCGGGACAGAAATGGGAAGAGATCATTAGCAGGCTGGCCTCCTCATCCCCCCTCACCACAGACAGTTCAAAGTGACAGCTGCCCCTGAGTCTAAGCAGAGACCAGTCAGAAAGTACACCGTCTGAGCATGTTGGGTTTAATAAAACGTGTAAGACGGTGTGTTTTGCCTGTTTTGACATACTTGTAAAAAAAAAAAAAAAATGGACAGAGCCTGATGGCACAAACCTGTCACCCGATCTACTTGGGAATCAGAGACAAGTTCCGGGCCTGCCTGATCTACAGTAAAGCTAAAGCCATCCCTGGAAACTTGTGAGACCCGGCCTCAAACTAAAAAGTAAAAACAGGACTGGGACTGTGGCTCAGGGGTAGAGCCCCTGCCTAGAATCCCCCAGTGAGGGGCTGGGGTGTGGCTCAGTGGTGGAGCCCCTGCCTAGAATCCCCCAGTGAGGGGCTCGGGTGTGGCTCAGTGGTAGAGCCCCTGCCTAGAATTCCCCAGTGAGGGGCTGGGGTGTGGCTCAAGACGGAGCCCTTGTGTCAAACATATAAGGCCACAGGTTGGACACTGGACATTAAAAGGG
CCR5 序列(
表示 用於插入整合位點之假定導引物)
(SEQ ID NO:3)
GTAAACAGAGTCCTGTAATGCAAGGTCCGGCCTTGGCAGCCCCAGCCTGGAGCCACAGTGAGATGTGAGCCGAGGGTTATGCTGGGAAAAACCTCTCCCTCCCAGCACCTGAAAGGCTCTGCAGGCCCAGCAGCTCAGCAAGCAAGGGTAAGGGCATGGACTAACATCTTATTTCATACTATCCCTTATAACACATCCTAATGTAATCAGCTCACAATATGAAATTATTTCATTTCTCTCCAGTCATTGTTTCAATGGGGCCTTAGGGTTGACTGGATTCTGGAGGGCCCTGCCTAGAGGAGGGGGTGCATTCTGTCCCTATGTCCCCTCCTGCTCCATCCTCCACAGCACGTGCCTAGTGGTCTACCTTGTGGGGAATTCTTGTACCTCCCTCTTCTAGGCATGGACTAGCATTGAGAAGTGGGAGAGGAGTGTTAGGAAAAAGGGCAAATATAGACATACCTTGTCTTATTGTGCTTTACAGATATTGTTTTTGTTGTTGTTGTTGTTGTTTACAAATTGAAGGTTTGTGGCAACCCTGCCTCGAGCAAGTCTATTGGTGCTGTTTTTCCAACAGCATGTGCTTGTTTTACATCTCTGTGTCACATTTTGGTAATTCTCCCAATATTTCAAACTTTGTCATTATTTCTATATCTGTTATGGTAATCTGTGATCAGTGATCTTTGATGTCACTATTGTAGTTGTTTTGGGGCACCATGAAGTGCACCCATGTAAGATGGCAAACAATCAATAAATGTTGTGTGTGTTCTGACTGCTCCATGGACTGCCTGTTCCTGAGACACAATAATGTATATATAACAATTATATATATATATATTTATAACAATTATATATATATATATATATATTTTTTTTTTGAGGCAGAGTCGCACTCTGATTGCCCAGGCTGGAGTGCAATGATGTGATTTCAGCTCACTGCAACCTCTGCCTCCCCAGGCTCAGGTGATTCTCCCACTTCAGCCTCCCAAGCTGGGACTACAGGTGTGCACCATCACACCCGGCTAATTTTTTTTTTGTATTTTTAGGAGAGACAGGGTTTTGCCATGTTGCCCAGGCTGGCCTTAAACTCCTAGACTCAAACAATCCACCTGCCTCAGCTTCCCAAAGGGCTGGGATTACAGGCATGAGCCACTGTGCCCAGCCCAAGACACAATAATATTGAAATTAAGCCAATTAATAACCCTACAATGGCCTCTAAGTGTTCAAGTGAAGGGAAAAGTCCCACGTCTCTCACTTTAAATCAAAATCTAGAAATGATTAAGCTTAGTAAGGAGGACATATTGAAAGTCAAGGCCAAAAGCTCACCTCTGCACCAGTTAGCCAAATTGCGACTTCACAGGAAAAGTTCTTGAAGGATATTTAAGCTCTACTCCAGGGAACATGCAAATGAAGAGAAAACAAAGCAGCCATATTGCTAATATGGAGAAAGTTTGAGTGGTCTGGAGAAAAGATCCAACCAGCCACAACATTTCCTTAAGTCAAAGCCTAATCCAGAGCAAGACTCTAACTCTCTTCAATGCTATGAAGGCGGAGAGAGGTGAGGAAGCTGCAGAAGAAAAGTTTGAAGCTAGCGGAGGTTGGTTTGTGAGGTTTAATGAAAGACAACATCTCCATAACATAAAAATGCAAGATGAAGCAGCAAGTGCAAAGGGAGAAGCTGTGGCAAGTTATCCAGAAAATCTAGATAAGATAATTGATGAAAGTGTCTACACGAAACAACAGATTTTCAGTGTAGACAAAACAGTCTTATGTTGGAAGAAGATGCCATCCAGGACTTTCACAGCTAGAGAGGAGATGTCAAGGCAAGCTGCAAAGCTCCACAGGACAGGCTGACTCTCTTTTTAGAGGTGAATGCAGCTGATGACTTTAAGTTGAAGTAAATGTTCATTTACTATTTTGTAAATCCTGGTGTCATTAAGAATTATGCGAAATCTACTCTATCTGTGCTCCATAAATGGAACAATAAAGCCTGGATGACAACACATCTGTTTACAGCATGGTTTACTGAATATTTCAAGCCCACTATTGAGAACTATTGCTCAGAAAAAAAGATTCCTTTCAAAATATTACTGCTCTGCACCATGTCGATCAAGAGCTGTGTTGGAGATGTACGAGAATATTCATGTTGTTTTCATCCCTGCTAACACAAACATCCATTCTGCAGTCCATGGACCAAGACTTTCAAGTCTTATTAAGAAATATATTTCATAAGGCTATTAAGAAATAGCTATATATATATATATAGCCTTATATAGTTTATATAGCTACCATTGATAGTGATTCCATTGATGGATCTGAGCAAAGCAAATTGAAAAGCTTCTGGAAAGTAGTCATTATTCTAGATGCCATTAGGAACATTTGTAATTCATGGGAGGAGGTCAAAATACCAACATTAACAGGAGTGTGAAAGACATTGATTCCAACCCCCATAGATGACTTTCAGGGGTTCACGTCTTCAGTGGAGGAAGTCGCTGTAGATGTGGTGGAAACAGCAAGAGAACTAGAACTAGAAGTGGAGCCTGAAGTTGTGACTGAATTGCCGCACTCTCATGATCAAACTTGAACAGATGAAGAGTTGCTTCTTACATATGAGCAGTGAAAGTGGTCTCTTGAGATGGAATCTCCTCCTGGTGAAGATGCTGTGAACACGGTTAAAATGACAACAATCGATTTAGAATATTACATAAATTTAGTTAATAAAGCAGTGGCAGGGTTTGAGAGGATTGACTCCAATTTTGAAAGAAGTGGGTAAAATGCTATCAAATAGCATCACATGGTATGGAGAAATCTTTTGTGAAGGGAAGAGTCGACCAAGGTGGCAAATTGCATTGTCATCTTATTTTAAGAAATTGCCACAGCCACCCCCAGCTTTAGCAACCACCACCCTGATCAGTAAGCAGCCATCAACATCAAAACAAGACCGCCATCCTCTTCAGCAAAAACACTATGACTTGCTGAAGGCTCAGATGATGGTTAGCATTTTTAGCAATACAATATTTTTAATTAAGGTATGCACATTGGTTTTTCTGACATAATACTATTGCATACTTAATAGACTACAGTATAGGATAAACACAACTTTTATATGCACTGGGAAACCAAAAAGGTTATTTTTGAGATATTTGCTTTACTGTGGTGGTCTGAAGCTGAACTCACAATCTCACCAAGGTGTGCCTGAACCTCTTTAGCTAACTGGCCACTGCCACAGTCCACTCTGTGTTGGTCAAGATGCCCCAGAGTGGCAGGCACACTGTGTGGTCACATCCAAGGGCCTAGATATGGTGGGGGCTCCAAATGGATCTAGATATGTGAGATCTCTCTTTGATTTGACTTCTTCCAACCCACCATTTTCTGGGTGCTGGGCTCATCTCACCCAGAAAGTAGGACCCAATGTGACAGTTCCTGCCCAGTTCCCTCCTGTGGTAGCCACTTGACCCAGGGGCACTCTTGATCCTTGCAGCCTCACTTACACACCCTATCTCTACCCCTATTAACTCTCTCCAATCCCCACTCCCCCTGCTCAGCTTGTCTGCTGCCCAGTGGGGGCCCCACCCATGCTGGCCTCTCCTTTTGCAAGTCCCCATTCCTCATATGGTTTCTTCAGAGCCCCTTTCTTTGGCTTTGAGGAGAGATGCCCTCACTCGCTTCCCCACCAATCCTGCCCACTTCTACAATCCATTCATTATCCTAATTGCCTCCGTATACAGACTGGAGTGAGAGGAGTTGATGTGATGGGTGTGGATACAGGGCTGGTGCTGTCATCTTCTAGTAAGCCCTGGGAGAGGTGTCTGAGCCCAGGTGTCAGTGGTTTTCTTTGGAACTGTGAGTGCATAACACTTCTTTGCCTTCAGCCTTAGGCCATAGTTGCTAGTTCTGGGACAACCAGAAAAGCCCTACATAATCTCGTGTTATGTGCAGAGCTGAGTATAGAGCTCCAGGTATGATCTGACTCACTTAAGATCACAGTGAGTCTATTGTATTGTTGAACTGTTAGCTTAGACATCTGTTACTGTACCTACATGGCACTAGCCTCACGCCTAGACACCGATCTGAAAGAAATCCCCTAAATGCATAGAGAAGACTTCTCAGCTGAGCTAAGGGGCTCCCACCAGGTTTGAGCCTATCTAATGAATCCATGAGGTAGACAGCCTGCACATGTCCACTTGGTTTGATGAATTGCACAAATCCCTATGGGGGATGTGGTTCATGGGCTGGGAAGTGGGTTACCCTGGGAAAGGTCTACAGGACAGAGGCAGGGATGGAGACAACAGCATGGTGAGTTCCCAACCCACCCACGATGATAGGTGTCTGAGGCAGAAGGTAAAGAGGCTGTCACCTGGTGGGTGTCATAAGACTCAAGTGTCATTGTTGAGGCACATGGGTAACAAAGCGTGGCACTGGATGGGGGTAGATTCTTCCTATTTCTGTGAGGATCAGGGGGACTCCCTGGCTCTCCTGCTAAAGGTGGCTCTAGGGACAGGAAGAGTGTACTTCTTGACAGGGATGTCAGAGCACTGATGGTGACAATCAGTGTGACACTGCTCACATGACTGAACAACCGAGAAGAGCCCGACTGTCTACTGAACAACGGGAAGAGCCCGACTGTCAATGACGGAGCTCTGTTAAATATAGTTAAGGCTATTTTGTTGAATGAATGAAGCCAGACAGGAAAGAGGACAGTATCTTTAATCCATTTATAGAAGTTAAAGACAGGCTTATTTAATCTCTATGAAGACAGAGTGGCCCTTACCTCTGGGTGGAGCAAAAGGCACCTTCTGAAGTGATAGGGATGTTCCTTATCATCTTGATCCGGAGTGGTAGTTACATGCATGTGTGCATATCAAAACTCACCAAGCTGTACCACTAAGTGTGTTCTTCCTCAATAAAAATAATAAAGAACTACACTTATAAAGAATTTTTTAATAATATAGGAAAATGTCTACACTATAATCTTTAGCTAAAAAAAAAAAAAAAAGAAGCCGCCTACAGAATGGTATATGCATGAGAACAATTAATCGAAAAGTGCATGGGAAAAGTCAGGATTGAAACATCATGTTTTAAAAGACATTGTTTTGATACTGTGAGAATGTACCTAAGTTTTTCCTTTTTTCTGTTTTTCCCAATTTTATACAATGAGCATGTGTTGGTTTTATAATTAGACATTTTGTTTGTTTGGTTTGGTTTTGAGACACAGCTTGCTGTCACCCAGGTTGGAGTGCAATGGCCCAATCTTGGTTCACTGCAACCTCCATCTCCTGGGTTCAAGAGATTCTCCCACTTCAGCCTCCTGAGTAGCTGGGACTATAGGGGCGCACCACCACATCCAGCTAATTTTGTGTATTTTTAGTAGAGATGGGGTTTCACCATGCTGGCCAGGTTGGTCTCAAACTCCTGACCTCAAGTTATCCACTCGCCTTGGCTTCCCAAAGTGCTGGGATTATAGGCATGAGCCACCGCACTTGGCCTAGACATTTGTTTTTAAAAATAAAAGATTCATTTGCTCTTTTTACAGCCCGTCTCACTGTTGACTGATATTGACCAGGAGTCAACTCAGGCCCCAGGGATTTTCACAACAGCTGCTGTATGGCAGGGTTTCTGCTCACTGTGCTCATGTAGTTGGCCCTTGCACCCAAAGTGAATAATTAACATTCTCCCCATCCTGTTGACGATGCTCTGAAAATATGGTCCAGAAATGGTGTGAGCAAGGAGACAGCAAAGCAATGCTTGGAACATAGGTGCAGTGACTAGACATGGGGCAGCTGTTTAAAGACAAAAAGGCCCCAAAAAGGAGGGATGGCACGAAACACCCTCCAATATGGGCATGGAGTCTAGAGTGACAAAGTGATCAAAAGTTCATTTCCTATGGGGTGTCCGAATGTACTTAATAATAAAAAGAGAACAAGAGCCATGCAAACTGAGAGGGACAAAGTAGAAAGAGTAGCAGACACCAAGCAACTAAGTCACAGCATGATAAGCTGCTAGCTTGTTGTCATTATTGTATCCAGAACAACATTTCATTTAAATGCTGAAGAATTTCCCATGGGTCCCCACTTTCTTGTGAATCCTTGGGCTGAACCCCCCTGTCCTGAGTGGTTACTAGAACACACCTCTGGACCAGAAACACAAAAGTGGAGTAACGCACACTGCAAAGCTGTGCTTCCTTGTTTCAGCCTGTGAATCCTCACCTTGTTTCCCATCTAGCCTATATTTTTCAAACTAACTTGGCCATAGAATCATGTAGTATTTAGGGTGGAAGCTGCCCCAGGTCTAGCACGTCATTTAACAGATGAGGAAATGGAAGCTTGGGCAGTGGAAGTATCTTGCCGAGGTCACACAGCAAGTCAGCAGCACAGCGTGTGTGACTCCGAGCCTGCTCCGCTAGCCCACATTGCCCTCTGGGGGTGAGTATGTCTTCACATCCTCCAATACCCTAATGACAGACAAACAGAACATGGCAAAGCCTCAGCTCTGCATGGTGAAAGTAAGAACCAGCAATTGCCACAAACAGAAATACAGTGTTGGTCCGGCAGCCTCCGGGGGTTCTGCACAAGTGGATTACCAGTGAATACAAGGCTATCTATCTTTCGAAAAACCAAAGTTGTATTTATGCTATCTATTTTCTATAAAATTTTATATTAATTTATTTGTTACCTATTTTTGAACTCTTTCAAAAGCACACTTTATATTTCCCTGCTTAAACAGTCCCCCGAGGGTGGGTGCCCAAAAGGCTCTACACTTGTTATCATTCCCTCTCCACCACAGGCATATTGAGTAAGTTTGTATTTGGGTTTTTTTAAAACCTCCACTCTACAGTTAAGAAAACTAAGGCACAGAGCTTCAATAATTTGGTCAGAGCCAAGTAGCAGTAATGAAGCTGGAGGTTAAACCCAGCAGCATGACTGCAGTTCTTAATCAATGCCTTTTGAATTGCACATATGGGATGAACTAGAACATTTTCTCGATGATTCGCTGTCCTTGTTATGATTATGTTACTGAGCTCTGTTGTAGCACAGACATATGTCCCTATATGGGGCGGGGGTGGGGGTGTCTTGATCGCTGGGCTATTTCTATACTGTTCTGGCTTTTCCCAAGCAGTCATTTCTTTCTATTCTCCAAGCACCAGCAATTAGCTTTACCTTTTCAGCTTCTAGTTTGCTGAAACTAATCTGCTATAGACAGAGACTCCGGTGAACCAATTTTATTAGGATTTGATCAAATAAACTCTCTCTGACAAAGGACTGCTGAAAGAGTAACTAAGAGTTTGATGTTTACTGAGTGCATAGTATGTGCTAGATGCTGGCCGTGGATGCCTCATAGAATCCTCCCAACAACTCATGAAATGACTACTGTCATTCAGCCCAATACCCAGACGAGAAAGCTGAGGGTAAGACAGGTTTCAAGCTTGGCAGTCTGACTACAGAGGCCACTGGCTTAGCCCCTGGGTTAGTCTGCCTCTGTAGGATTGGGGGCACGTAATTTTGCTGTTTGGGGTCTCATTTGCCTTCTTAGAGATCACAAGCCAAAGCTTTTTATTCTAGAGCCAAGGTCACGGAAGCCCAGAGGGCATCTTGTGGCTCGGGAGTAGCTCTCTGCTGTCTTCTCAGCTCTGCTGACAATACTTGAGATTTTCAGATGTCACCAACCGCCAAGAGAGCTTGATATGACTGTATATAGTATAGTCATAAAGAACCTGAACTTGACCATATACTTATGTCATGTGGAAAATTTCTCATAGCTTCAGATAGATTATATCTGGAGTGAAGAATCCTGCCACCTATGTATCTGGCATAGTGTGAGTCCTCATAAATGCTTACTGGTTTGAAGGGCAACAAAATAGTGAACAGAGTGAAAATCCCCACTAAGATCCTGGGTCCAGAAAAAGATGGGAAACCTGTTTAGCTCACCCGTGAGCCCATAGTTAAAACTCTTTAGACAACAGGTTGTTTCCGTTTACAGAGAACAATAATATTGGGTGGTGAGCATCTGTGTGGGGGTTGGGGTGGGATAGGGGATACGGGGAGAGTGGAGAAAAAGGGGACACAGGGTTAATGTGAAGTCCAGGATCCCCCTCTACATTTAAAGTTGGTTTAAGTTGGCTTTAATTAATAGCAACTCTTAAGATAATCAGAATTTTCTTAACCTTTTAGCCTTACTGTTGAAAAGCCCTGTGATCTTGTACAAATCATTTGCTTCTTGGATAGTAATTTCTTTTACTAAAATGTGGGCTTTTGACTAGATGAATGTAAATGTTCTTCTAGCTCTGATATCCTTTATTCTTTATATTTTCTAACAGATTCTGTGTAGTGGGATGAGCAGAGAACAAAAACAAAATAATCCAGTGAGAAAAGCCCGTAAATAAACCTTCAGACCAGAGATCTATTCTCTAGCTTATTTTAAGCTCAACTTAAAAAGAAGAACTGTTCTCTGATTCTTTTCGCCTTCAATACACTTAATGATTTAACTCCACCCTCCTTCAAAAGAAACAGCATTTCCTACTTTTATACTGTCTATATGATTGATTTGCACAGCTCATCTGGCCAGAAGAGCTGAGACATCCGTTCCCCTACAAGAAACTCTCCCCGGTAAGTAACCTCTCAGCTGCTTGGCCTGTTAGTTAGCTTCTGAGATGAGTAAAAGACTTTACAGGAAACCCATAGAAGACATTTGGCAAACACCAAGTGCTCATACAATTATCTTAAAATATAATCTTTAAGATAAGGAAAGGGTCACAGTTTGGAATGAGTTTCAGACGGTTATAACATCAAAGATACAAAACATGATTGTGAGTGAAAGACTTTAAAGGGAGCAATAGTATTTTAATAACTAACAATCCTTACCTCTCAAAAGAAAGATTTGCAGAGAGATGAGTCTTAGCTGAAATCTTGAAATCTTATCTTCTGCTAAGGAGAACTAAACCCTCTCCAGTGAGATGCCTTCTGAATATGTGCCCACAAGAAGTTGTGTCTAAGTCTGGTTCTCTTTTTTCTTTTTCCTCCAGACAAGAGGGAAGCCTAAAAATGGTCAAAATTAATATTAAATTACAAACGCCAAATAAAATTTTCCTCTAATATATCAGTTTCATGGCACAGTTAGTATATAATTCTTTATGGTTCAAAATTAAAAATGAGCTTTTCTAGGGGCTTCTCTCAGCTGCCTAGTCTAAGGTGCAGGGAGTTTGAGACTCACAGGGTTTAATAAGAGAAAATTCTCAGCTAGAGCAGCTGAACTTAAATAGACTAGGCAAGACAGCTGGTTATAAGACTAAACTACCCAGAATGCATGACATTCATCTGTGGTGGCAGACGAAACATTTTTTATTATATTATTTCTTGGGTATGTATGACAACTCTTAATTGTGGCAACTCAGAAACTACAAACACAAACTTCACAGAAAATGTGAGGATTTTACAATTGGCTGTTGTCATCTATGACCTTCCCTGGGACTTGGGCACCCGGCCATTTCACTCTGACTACATCATGTCACCAAACATCTGATGGTCTTGCCTTTTAATTCTCTTTTCGAGGACTGAGAGGGAGGGTAGCATGGTAGTTAAGAGTGCAGGCTTCCCGCATTCAAAATCGGTTGCTTACTAGCTGTGTGGCTTTGAGCAAGTTACTCACCCTCTCTGTGCTTCAAGGTCCTTGTCTGCAAAATGTGAAAAATATTTCCTGCCTCATAAGGTTGCCCTAAGGATTAAATGAATGAATGGGTATGATGCTTAGAACAGTGATTGGCATCCAGTATGTGCCCTCGAGGCCTCTTAATTATTACTGGCTTGCTCATAGTGCATGTTCTTTGTGGGCTAACTCTAGCGTCAATAAAAATGTTAAGACTGAGTTGCAGCCGGGCATGGTGGCTCATGCCTGTAATCCCAGCATTCTAGGAGGCTGAGGCAGGAGGATCGCTTGAGCCCAGGAGTTCGAGACCAGCCTGGGCAACATAGTGTGATCTTGTATCTATAAAAATAAACAAAATTAGCTTGGTGTGGTGGCGCCTGTAGTCCCCAGCCACTTGGAGGGGTGAGGTGAGAGGATTGCTTGAGCCCGGGATGGTCCAGGCTGCAGTGAGCCATGATCGTGCCACTGCACTCCAGCCTGGGCGACAGAGTGAGACCCTGTCTCACAACAACAACAACAACAACAAAAAGGCTGAGCTGCACCATGCTTGACCCAGTTTCTTAAAATTGTTGTCAAAGCTTCATTCACTCCATGGTGCTATAGAGCACAAGATTTTATTTGGTGAGATGGTGCTTTCATGAATTCCCCCAACAGAGCCAAGCTCTCCATCTAGTGGACAGGGAAGCTAGCAGCAAACCTTCCCTTCACTACAAAACTTCATTGCTTGGCCAAAAAGAGAGTTAATTCAATGTAGACATCTATGTAGGCAATTAAAAACCTATTGATGTATAAAACAGTTTGCATTCATGGAGGGCAACTAAATACATTCTAGGACTTTATAAAAGATCACTTTTTATTTATGCACAGGGTGGAACAAGATGGATTATCAAGTGTCAAGTCCAATCTATGACATCAATTATTATACATCGGAGCCCTGCCAAAAAATCAATGTGAAGCAAATCGCAGCCCGCCTCCTGCCTCCGCTCTACTCACTGGTGTTCATCTTTGGTTTTGTGGGCAACATGCTGGTCATCCTCATCCTGATAAACTGCAAAAGGCTGAAGAGCATGACTGACATCTACCTGCTCAACCTGGCCATCTCTGACCTGTTTTTCCTTCTTACTGTCCCCTTCTGGGCTCACTATGCTGCCGCCCAGTGGGACTTTGGAAATACAATGTGTCAACTCTTGACAGGGCTCTATTTTATAGGCTTCTTCTCTGGAATCTTCTTCATCATCCTCCTGACAATCGATAGGTACCTGGCTGTCGTCCATGCTGTGTTTGCTTTAAAAGCCAGGACGGTCACCTTTGGGGTGGTGACAAGTGTGATCACTTGGGTGGTGGCTGTGTTTGCGTCTCTCCCAGGAATCATCTTTACCAGATCTCAAAAAGAAGGTCTTCATTACACCTGCAGCTCTCATTTTC
CATACAGTCAGTATCAATTCTGG AAGAATTTCCAGACATTAAAGATAGTCATCTTGGGGCTGGTCCTGCCGCTGCTTGTCATGGTCATCTGCTACTCGGGAATCCTAAAAACTCTGCTTCGGTGTCGAAATGAGAAGAAGAGGCACAGGGCTGTGAGGCTTATCTTCACCATCATGATTGTTTATTTTCTCTTCTGGGCTCCCTACAACATTGTCCTTCTCCTGAACACCTTCCAGGAATTCTTTGGCCTGAATAATTGCAGTAGCTCTAACAGGTTGGACCAAGCTATGCAGGTGACAGAGACTCTTGGGATGACGCACTGCTGCATCAACCCCATCATCTATGCCTTTGTCGGGGAGAAGTTCAGAAACTACCTCTTAGTCTTCTTCCAAAAGCACATTGCCAAACGCTTCTGCAAATGCTGTTCTATTTTCCAGCAAGAGGCTCCCGAGCGAGCAAGCTCAGTTTACACCCGATCCACTGGGGAGCAGGAAATATCTGTGGGCTTGTGACACGGACTCAAGTGGGCTGGTGACCCAGTCAGAGTTGTGCACATGGCTTAGTTTTCATACACAGCCTGGGCTGGGGGTGGGGTGGGAGAGGTCTTTTTTAAAAGGAAGTTACTGTTATAGAGGGTCTAAGATTCATCCATTTATTTGGCATCTGTTTAAAGTAGATTAGATCTTTTAAGCCCATCAATTATAGAAAGCCAAATCAAAATATGTTGATGAAAAATAGCAACCTTTTTATCTCCCCTTCACATGCATCAAGTTATTGACAAACTCTCCCTTCACTCCGAAAGTTCCTTATGTATATTTAAAAGAAAGCCTCAGAGAATTGCTGATTCTTGAGTTTAGTGATCTGAACAGAAATACCAAAATTATTTCAGAAATGTACAACTTTTTACCTAGTACAAGGCAACATATAGGTTGTAAATGTGTTTAAAACAGGTCTTTGTCTTGCTATGGGGAGAAAAGACATGAATATGATTAGTAAAGAAATGACACTTTTCATGTGTGATTTCCCCTCCAAGGTATGGTTAATAAGTTTCACTGACTTAGAACCAGGCGAGAGACTTGTGGCCTGGGAGAGCTGGGGAAGCTTCTTAAATGAGAAGGAATTTGAGTTGGATCATCTATTGCTGGCAAAGACAGAAGCCTCACTGCAAGCACTGCATGGGCAAGCTTGGCTGTAGAAGGAGACAGAGCTGGTTGGGAAGACATGGGGAGGAAGGACAAGGCTAGATCATGAAGAACCTTGACGGCATTGCTCCGTCTAAGTCATGAGCTGAGCAGGGAGATCCTGGTTGGTGTTGCAGAAGGTTTACTCTGTGGCCAAAGGAGGGTCAGGAAGGATGAGCATTTAGGGCAAGGAGACCACCAACAGCCCTCAGGTCAGGGTGAGGATGGCCTCTGCTAAGCTCAAGGCGTGAGGATGGGAAGGAGGGAGGTATTCGTAAGGATGGGAAGGAGGGAGGTATTCGTGCAGCATATGAGGATGCAGAGTCAGCAGAACTGGGGTGGATTTGGGTTGGAAGTGAGGGTCAGAGAGGAGTCAGAGAGAATCCCTAGTCTTCAAGCAGATTGGAGAAACCCTTGAAAAGACATCAAGCACAGAAGGAGGAGGAGGAGGTTTAGGTCAAGAAGAAGATGGATTGGTGTAAAAGGATGGGTCTGGTTTGCAGAGCTTGAACACAGTCTCACCCAGACTCCAGGCTGTCTTTCACTGAATGCTTCTGACTTCATAGATTTCCTTCCCATCCCAGCTGAAATACTGAGGGGTCTCCAGGAGGAGACTAGATTTATGAATACACGAGGTATGAGGTCTAGGAACATACTTCAGCTCACACATGAGATCTAGGTGAGGATTGATTACCTAGTAGTCATTTCATGGGTTGTTGGGAGGATTCTATGAGGCAACCACAGGCAGCATTTAGCACATACTACACATTCAATAAGCATCAAACTCTTAGTTACTCATTCAGGGATAGCACTGAGCAAAGCATTGAGCAAAGGGGTCCCATAGAGGTGAGGGAAGCCTGAAAAACTAAGATGCTGCCTGCCCAGTGCACACAAGTGTAGGTATCATTTTCTGCATTTAACCGTCAATAGGCAAAGGGGGGAAGGGACATATTCATTTGGAAATAAGCTGCCTTGAGCCTTAAAACCCACAAAAGTACAATTTACCAGCCTCCGTATTTCAGACTGAATGGGGGTGGGGGGGGCGCCTTAGGTACTTATTCCAGATGCCTTCTCCAGACAAACCAGAAGCAACAGAAAAAATCGTCTCTCCCTCCCTTTGAAATGAATATACCCCTTAGTGTTTGGGTATATTCATTTCAAAGGGAGAGAGAGAGGTTTTTTTCTGTTCTGTCTCATATGATTGTGCACATACTTGAGACTGTTTTGAATTTGGGGGATGGCTAAAACCATCATAGTACAGGTAAGGTGAGGGAATAGTAAGTGGTGAGAACTACTCAGGGAATGAAGGTGTCAGAATAATAAGAGGTGCTACTGACTTTCTCAGCCTCTGAATATGAACGGTGAGCATTGTGGCTGTCAGCAGGAAGCAACGAAGGGAAATGTCTTTCCTTTTGCTCTTAAGTTGTGGAGAGTGCAACAGTAGCATAGGACCCTACCCTCTGGGCCAAGTCAAAGACATTCTGACATCTTAGTATTTGCATATTCTTATGTATGTGAAAGTTACAAATTGCTTGAAAGAAAATATGCATCTAATAAAAAACACCTTCTAAAATAATTCATTATATTCTTGCTCTTTCAGTCAAGTGTACATTTAGAGAATAGCACATAAAACTGCCAGAGCATTTTATAAGCAGCTGTTTTCTTCCTTAGTGTGTGTGCATGTGTGTGTGATGTATACAAAGAGAGAGATAATTGTATTTTTGTATTTTCTTTTAAATAATTTTTAAAATTGACCCTTTTCCTGAGACAAATTGCCAGAATAGTTTGTATTTAGAGATGGTACCTCTAAGAGTAAGGTTGCTGGTTGCTGAGCAATTGACTTGAAAACTTTTAAAATTCAAATTTTAATTCCACTACTCAAAAGAATTGCCATGTTTTAAAAAAGAGAATTGGTGCCATAAGTTAGTTGTCTATGTTTGAAAATGAAGAAGATATGCAACGTCATGGCCTGGTCACTTACCCGCAGCCCTGAGTTGTAGGCACATCATATGTGAGAATGAGGATGCTTTTCTTTCATTTAAAATCCCTCCCCAAAACTTGGCTCTAATTGCAGTCATGACAATCATGTACATTTGGATTTATGTGCACGAGTCTCTTACCCTGAGAGAGGACAGGTGCTACAGGTGGAGGGGACCCGTCTGGGTCACGTTCACATTTTGAACATGCTGGTTTTCAGTCACTGCACACTCATCTCCCAGCACAGGTCATGGGCAGCAGATGCAAAAGCTGCCCGTGGTCCTATTTGGAGGTGCATGAAATGAGCAGAAGACAGAACAGCTTGATCTGACTAGAAGGGCAGCTTGTCCCTACCAAGACTTGAAGGATTGCCTTTCATCTGTTAGGGTAAAAGGTAGAATGAACCAAGGAAGGGCAGGAGGGGGCTGGGGTTAGGGTAGAAGGAAGGGGCCATGGAGAAGGGAGATCCATCCCATAGGAGGAAGGCAGTGCGGCAGGGAGGTTTGAAGGTATCAGCTTTTGTGGCTGACATACATGCAGTCATGTCAATTGCTCGTTTTTCCTTTTCCATCTTATTAAATGTCTTCCAACGTTAGCACGAAGAAAAGCTATTTGCAGTGTTGCCAGCCTTTCCAGAGCCCGTCCCCATTACCTCCCCAGGCCCATGCCTTTACTCCTTGGAGTTTCAACTCACGACCTTCAGGATCTGACTTTATTCACCAACTCTGGGGTGAACGTACCTTCTGTCTCCACCCAGAGGTCTCTATCAAAGAGGAGATTGCATGCCATGGATAAAGTCAAAGTAGAGGTGACTGTCCTTAGGAAGAGTAATGTGAAAATTCATAAACTGGGATTCTGTTTACATTTTGTACTCCAGGGGTTCTTAGTTTAAATCGCTCTGAATAAATTAAGATGCAATGGCATTTCAACTGTTATGATTAAATTTACAAATCATTTATTTTCTATCACGGGGAGAGATAGAGCTCCAAATGCAAACATAACTGCTCAAGTGTTAACACTTATAATGAAAACATAAGAATTACCACCAACTACCCTGGGGGCTAGAAGCAGAAATGTGAACCAGAAAACAAATCATGAACTTTCCTTTTTTTTTTTGAGATGGAGTCTCGCTCTGTTGCCCAGGCTGGAGTGCAATGGTGCGATCTCGGCTCACTGCAACCACTGCCTCCCGGGTTCAAGCAATTCTCCTGCCTCAGCCTCCTGAGTAGCTGGGACTACAGGCATGCACCACCACGCCTGGGTAATTTTTTGTATTTTTAGTAGAGACAGGGTTTCACCGTATTAGCCAGGATGCTCTCGATCTCCTGACCTCGTGATCTGCCCGCCTCGGCCTCCCACCGAAGTGCTGGGATTACAGGCATGAGCCACTGTGCCCGGCCAACAAATCATGAACTTTCTAACTGCAGTTCCTTGTAGCTTGTTAACACATCCACTTACTTATTGTCAGAGTACGTGGAGATTTTCCACAACCCTCGGGGATAAGGCTGAACAGAAGAGGCAAAAACGTGAAAACATTTCGATAGCTCCTATACTTTGAAATAAAATTCACTGTAAAAGTTGCTTGTATTTTTCCAAAACAGAGTCAACCCTTAATATTTAAGATTCTGTATACAAATACATATTTTTATATAATTAATATATATTGTCATATGACATATATCTTTATATTAATATGCATGCATATAATATATATTTCCTTCCTAATTTTCTATAAGCAATTTTACAAGACTGACTTCTATTTGCCTCCTTATTGTTACTACGTGGTTTGATAATCCGTTTTGTGTCATTGTGATTCTGTCATGTTTTGGGGACTTATTTTTGTTTCTCTGGGTGGTCACTAGTTTTTTTAAAGCATTCATGGAAGAGTGTGAATCTTTTACAAGCTAGGAAGCCATGGCAAGCCTTGGGTCATACTGCCCCCGCGAGGCCACATTGGCAAACCAGCAAGGGTGTTCAACTTCCAGACTTGGCCATGGAGAAGACACACGAGGAGGCTTTTCACATTCAGCTCTTTAATGTTTGTCTCTGCCGGCACCATCCCAGTTGTGAAAAAGAGGTATTTCCACAGCGGCTCAGGGTAGGTAGTGCACAGCTCACATTCATCATTTCTGAAAACCGAGAGGAGTCTCCATTCGGGGTACAGGTTGATGCCTGTCGTGGAATGAAGGTTCCAACACCCAGACCAATCTCTGCAGTGTGCTGCTCTCATGAGCTTGCAACAAGATCAGAAAATGTTTTGTGACTAAGCATTTTTCATATTGCATAAAATGCTTCAAGCTCCTCCCTTGTTTCTCTCTATAATCCTGTATATCTGATGATTGTGGGTACCAAGTGTTTGAAATAATCAAATGTGATTTGATGTTGGTAAATTTCTTTTTTTTTTTTTTTTTACTTCTATTTTTTTTATTATACTTTAAGTTTTAGGGTACATGTGCACATTGTGCAGGTTAGTTACATATGTATACATGTGCCATGCTGGTGCGCTGCACCCACTAACTCGTCATCTAGCATTAGGTATATCTCCCAATGCTATCCCTCCCCCCTCCCCCCACCCCACCACAGTCCCCAAAGTGTGATATTCCCCTTCCTATGTCCATGTGATCTCATTGTTCAATTCCCACCTATGAGTGAGAATATGCGGTGTTTGGTTTTTTGTTCTTGCGATAGTTTACTGAGAATGATGGTTTCCAATTTCATCCATGTCCCTACAAAGGACATGAACATAGCAAAGACTTGGAACCAACCCAAATGTCCAACAATGATAGACTGGATTAAGAAAATGTGGCACATATACACCATGGTAAATTTCTTTATCATTCGCACTCTCCTTTCTCTATTATTGTTATTGTAACTGAACCGCAGATTAGTCACTCATTGCTTGCAGAATCCAATTAACAAGAGCGAGGTCAGATATAAAGAAAATGATTTATTCCAAACCTCCTTCAGGGAAGAGGTGCAGCCTCCTGCCTCTAAATGCACTGCTTCGCCAGGCGTGGTGGCTCACACCTGTAATCCCAGCACTTTGGGAGACCGAGGAGGGCAGATCACTTAAGGTCAGGAGTTCAAGACCGGCCTGGCCAATATAGTGAAACCCCTGCCTCTACTAAAAATACAAAAAATTAGCCAGACGTGGTGGCGGGTGCTTGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACCTGGGAGGTGGAAGTTGCAGTGAGCTGACATCTAGCCACTGCACTCCAGCCTGGGTGACAGAGTGAGACTCTGTCTCAAAATAAATAAATAAATAAATAAATAAATAAATAAATAAATAGTAAATGCACTGCTTTGCTTTTGGAGCAGAAAGCAGGCACTTTGAAAAGGCAGGGGAGGAAGTGAGCAAGGGCAGGGGGTCTGCACACTGGCATGGTGCCTGATCTATCCAGGCAGTTGAATTGGCACTTTCATAGGCAGAAATAAGTTGAAAAAGTGGCCTAAAACTCTCTAGGTGGGAGTGGATAGTGGGCATGCCTTCAACCTGCCTTTCTGGAGGGTGAGTTCCATGGCAACCCCCTGAAGGGTGAGAGTTCCATGGAGATCATGCTTTGGTCTGTAAATCAGCTGTTAACTCTCTAGAAAGTTCTGTCTTGGAGCATATAGTTAGATGAACTTGCCCTGTAAAGAATGTCTGGTGAAGGGGAAGTAAAAGGTGAGATTTGCATTTCTAAAGGGCTAAGTAGAAAGTGGGGTACAAGAGGAAAGGAGAAAAGAGAAAATAATTTAAAAAATAATTGTAACTTATTCCCTTTTACTTAGAAAAAAGGGAATACTCAGTTACATTATCACCTCGTTTACATCAAACCCTCTTATGGAATCCTATGGTTTGAAAACAAAAAGGTTGTTGAGGACCAGTGAGCCCAACCCCTTTGCTTTATAAATGAAGAGCATTGCCTGCCCTAAGCCCCAGAGACTCTGATGTCGTGGGTCTGGAGTGGGCTCCAACAGCGGCATGTTTTGATGGTGCTTCCCAGTGGCACGCCAGCGATGAGCCTTTGAGTAGGGAAAGTAGGAGCACTCGTGACTCCCTTCACGATCAGCACCTGTGTGCTAATAAATTCACAAAAGCCAACATATTGGAGTCACTCAGGGAGTTTTACAAATAGTGAGGTTAAATCCAACCTCAAATAGTTCTGATTCGATCTGCCTGCATTGCTGCCCTGTGGTTCCCCACTGTAGAAGCTCCCCAGGTGATTCTAAGTGTAGCCAAGTCTGAGAAATACTGCCTAAAGCCTGTTGGACTGACAGCAAGGGCTGTTGTCTGAGCAAGACTTTGCCTGGCCTGGGGTGGCATGTGCACCAGGAAGAGTCTCAACTTTCATAACAGAACATTCCCCAAGCTGGTTTTTTTAAAGCATGTGAATCTAGACTTCATTGGCAATACCAAAGATCTGTATTTGAGGCTCCAAGTATTTCACTTTCATTTTTGGTTTTGGGTTATGTTTTCACCCTTCCTTTCCAAGTGAAAAGTAAACAGAAGTGGGATGTCTGGCGCCCATGCTGAGCTTGGCAACTTCAAATTCAATAGAGAAGAAGTCTCTTGTATAGAAAAGGGCCTGTCTGAGATGTTTCTCAAATAAATATAGATTTTGCTTATGTGGCTAAAGGATTCTTCTCCCCCCATTTCCTTATCCCTGCAGTGAGCCATCCTTCTTAACTCTTTCCATGAAAGCATTATTCCTGAAGAACTGGGAACTCATGCCAGCCCTGATCAGGCAATGATAATTCTGCAGAGAATTAGAATTTAGATTTAAATTGTCAACTCTTATACATCCTGGCATATGGTTTAAACACATGTACACACACACAAACACCTCCTACTATTTACTGAAGAGCAGATATCTGATAACTTAATCTTTTTGGTTTTGAGTCAAGACAATTCCTCCTTTTGAAACTGCATACCGCTGAATATAATAAAATGTAATTAAGATTAAAAATAAGAAACTAATGGGAGAATTTCAATATTGTCTATGTTCACTTTAAAATTCCTCTACTTAGGTTTACTGCCATTACCAAAGACTATTCAAAAATCCTTTTTAGGAGAATCCTAATGGTTTCCTGACATATAATCAAATAAGGACTCTGTTGATTGGCTAACTCAATCTTCCTGTGCCAAAAAGCAGAGCCCAGCAGAGAAGAGGGCAGGGACTTGAAAGTCAGACTGACTCGAGTTCCAGCCTTGGGGCTGTGGGAGCTTGGGCAAGTGACTTAACGTCTCTGGCTCTCAGGATCTAAAAGGATTTCCAGTAGTAATTTGGGGTGTTACTGATACAGGAGCTAAAAAGAAATTATTTAGGTGGTTAGTGAGGGTCAGAGAGTCCTCGGTAAGATTTGCCTTTTAACAAAAAGCAGCCCCAAAATCATTTGTTTGCTAACAAAGAGAAGCCTGTAAAATTGAGCTGCAGACATAGATAAGCAAGCTGGAAGCTTGCACGGGTGAATGCCGGCAGCTGTGCCAATAGGAAAAGGCTATCTGGGGGCCAGGCATGTTCAACATGGATTCTCCATCTTCCCTTTTCTTTGTCAACCAAGTGTACAGTAAAGGAACAGGCAACATGGCACGGGCCAGGTAGAGAACCCTTCTGCATAATAAAAGATTAGGGTGAGATGGCCAGCTTCTTCCCGTGCTATGTAAATGGCATACCTGGTCCAACCAGTCTTTTGGGCCCTGTGTAAATCAGACACCGCCTCCTCAAGTTAGTCTATAAAACCCCATGCATTTTACCGTGAAACTGGGAGATCCACTCGGAACCCCCTCCTGCACGAGAGACCTTTTCTCTTTTGCCTATTACACTTCCGCTCTTAAACTCACTGCTCATGTGTTAGCATCCTTGATTTCCTTGGCATGAGGCAACGAACCTTGTGTATTACCCCATACAAATGATGCTGCTTCATTACTAATAGCAACCTGACAGGGTTGTGTTGGGGTATAAATTATCTAGACCAGGGAGATCCAATATAATTTTTTTGTAATGACGGGAATGCTTTGTATCTGCATCATCCAAAATGGTAGCCACCAGGCCAGGGTGAAATGTGGCCAGTGTGACTGAGGAACTGAATGTTTTCCATGATTTAATTTAAATGTGGCCAATGGCTACTGTAGGAGACAGTGTGAGTCTGGCATATTATAAATAATAAATATTAATATAATTTGAACTTTGGCATCAGTGTTTCCTAGATTTGAATTACTATGCAAGTTGCTTACTGTTTCCAAGCCTCAGCTTTCTAATCTGTAATTGGGGCTAATAATAGTATCTGCCTTACAGGTTTGTTCAGAGGATAAATGAGAAATTGCATGTTGAGGGCTTAACACAGTGCCTGGCACATAAAAGCTCTGGTAACAGTTAGCCACTTTAATAATTTGCTAATAATGGCTATTTCTTCTTCAGATTAGGATGTGCTCCCCCAAACAGTGCACTTAGACATAGCGGGCAATCCAGCTCACTCTCTGCAGTGAGAGAGAAGCACTGGCCGACCAGAGTCAGCCAGGGGCTCATGGGTATGAAATCAACAGCATGATTTTGTAAGTAATGGATGGAAAGGGCCTCACAACTTTATGGCACTGTGTTCAATTTGCTTGGTCTTCTGTAGCTCCTTTTGAAAGCCTTTTAGGGTGGATTAACCTGCTACCAATAATTCTGGTCAGATGTAGACTCCATAGCTCAAAGCAAACTGAGAGAGTGAGGGCAGCAGGCCAATTCCCCACCCCTTCCTTCTGGACTCTGACAGAAGCTTACACTCAAGGAAGAGCAAGTAGGAATTAACGTGTTAAGAGCTAGGTAAGCAAAACCCAATGAGAAGTTCTGGCAAAGCCCCATGGGCAGGGGTGGCTTAGGCACAGGAAACAAGTAGGATTTCATACCACGCGCCTCAGTCTACTTCCGGGGCCCTCATCCTCAGCTGTGCCTATGCAAAGGAGAGCAACCAATAAACCCCACCGCCACTCTCCTACTGTGGAGGCCAGGGATGGCCAGGGGTAAGAGAGGGATGGGAAGTGTTTCCTCCAGCCGTCCTCTGAGAAGGAGAGGAAACTGGGCAGAGCTTCTGTCCTCCTTCAAGCAGAAACAGAAACAAAAGAAACCCCTAAGGGGGTTCTTACTTCCCCTCTAGTTCAGTTGTGCACTAACCATCTGCAGCTCAACATTCAGCATTCATTCATTGATTCAGCAAACATTGAAGGAGGGCCAGCTATGTGCCAGATGCCAACTCATGCCATGAAAGAGAGTCCCTGTCCTTATGAAATTCACTATTTAGAGAGAAAAGCAAGCAAAAAGGCAAAGTTTGAAAAGTACTGTTGAAGTGGCATCATTGTCTGGGGTGAATACCTGAGGTTTGTGGTCTCACGCCAAGGGAATCAAGGACTCAGGCACACAAGAAGTGAGTTTAAGAGCAGAGGTTTAATAGGCAAAAGAAAGAGAAAAAAGAATAGCTCTCTTGCCTGCACAGAGAGAGGGGCACCTGAGTGGATCTTCCTGTTTTGTGGTGAAATGCAAGGCATTTTATAGACGAGCTTGAGGAAGTGGTGTCTGATTTACTTAGGACCCGAGAGATTGGTCAGACCAGGTGTGATGTTTACATAGCATACAAAGAAGCTGGCCATCCCATCCTAATCTTTTATTACGCAGACGGGGTCTATACCTGGCTGGTGCCATGTTGTCTGTTCCTTACTGTACACGTGGTTGACAAAGAAAAGGGAAGATGAAGAATCCATGTTGAACATGCCTGGCCCCCAGATAGTCTTTTCCTATTGGCACAGCTGCCGGCATTCACTCTTGCAAGCTTCCAGATTGCTTATCTATGTCTGCAGCCCAATTTTACAGGTTGCTCTTTGCTAGAAAAGAAATGATTTGGGGGCTGCTTTTCATTAA
hRosa26 序列(SEQ ID NO:4)
(
表示 用於插入整合位點之假定導引物)
ACCATTTAAACCTCAAATTAAGCAACCCACAGAACCAGGAAGTTCAAGGACCATGTCTGTTTTCACCACGATGTCTTTCCCCACCCCCCCACCCCCCACTCCACCCCCCACTAAGGGCAGGGTATTGTATCTGCCAGACTGGGTATTTGTTGAACAAGCGAGTATTTTCGCCTATTAGCTTAGTTTTTAAGGAAATCATTTTTTACTTGATTCATCATAGCTTTAATTCTATTACATACTACAATAAAAATTTGACAAGACTGATACAAATATGTAGTGGGCAATAGTTTGCCGTCTTCTTCCCTAGTATGGTGTTTTTCAATCTGGTGACTAGAATAGGCAGTGGGCTATAAGCAGGATTCATAAGGCCTGGAGCTGAGTTATATGTGACACTGCCACCTATTCATTGTGTGACCTTGGTTTTAACCTTCAAAGTGGGTCTCCTGGACTAAAAGAATGTGAAAAGATGGGGAAATAAATCTGTAATCTGAACATGGAATGACTTAGTTACAGACCAGACATATTGTTACTGGGAATGAAAAAGTCAATATATTTGAGGGGAAAAAAATGTAAATAAATATTGAGAAAGATTTTACAAATCTAATTAGGGGAAGATAGTTATCTCCCAATACTAGAGGGTACCAGAGTGCTTTTAAGGGGAACATTTGGTTACCCTTATTTCTTTAAAAAATGGCAGTTTAGGAAATTCTGCCCTAACTGTAGTCCCAATGTCAGATAGGACTCAGGTCTCCACTGCAAGGACCAAAATGTTAAGTTGAAGACTGAAAATGGGAAAATTTGGAAATGTCTTTGGAACCTCAAGTACATAAAAGCCTGTAAGTGCTTCATACTCATTAACAACATAGGCATAGAAAAAAGATATCCTTATTCTCAAGCATAGCCTTTTCTAATAAGTTCATGTTAGATGTCATGAAGTTTAGTGAGGAGTGAAAATCTATGAGGAAAAACATGAACCATTCTACTCTGGCAAAAGTTCAGGACAAACACCATAGGCCTGTATACCAAATTTTAAACCATGTTGAATAATGTGAAAAAAAGCATCACATTGCTTATGAAAGGCTTTCCTGTCGCCCCTTAATACTTCTGTCTCAGGCTAACATGTTTGTTAATGAGTTACAGTGGTGAAGTTAAGGAAATCTGCTTCCTGTCCTAGCATGCCCATTATCCCAGCCATACAGATTTAATACCAGGAGTCACTTTAACTCCATGAAGTCATTCAACAGGTACTTGAGTATTTACTATGTGCGTTTGTGCTAGAGTAGCCATTTCTTAAACTTTGTGGCCTCAGAGAATCCCTTCACATTCTTAAAGATTGAGGGCCCCAAATCACTTTACTAGTATCTTACCATATTAGAAAGTAAAATATTTAAATATTATAGCAACAAATGCATATTTTTAAAAAAATAGGTGCATTGTTTTACATTTTGGCAATTGTTTCCCTAAATGTCTGACTTAAATAGAAGACAACTGAATTGTTTCTTTTGCATTCAATTGGTTACAATGTTACTAGCAGTTTTCTATAATCTCACGTATTAGTCATTAGGAAAATATAGCTTCACTGAGTTATGTCAATCTCCCAAATGTTGGCCCATTTTACTGTATACTACCTAAAATATCATTGGCCGGGCACAGTGGCTTAAACCTGTAATCCTAGCACTTTGGGAGGCCAAGGTGGATCACCTGAGGTCAGGAGTTCAAGACCACCCTGGCCAACATGGTGAAACCCCATCTCTACTAAAAATACAAAAATTAGCCGGGTACAGTGGTACACACCTGTAGTCCCAGTTATGCAGGAGGCTGAGGCAGGAGAATTGCTTGAACCCAGGAGACAGAGGTTGCAGTCAGCCAGATGTCCCAAAAAAAAAAAAAAATTATTTTCAATATCACTATCTCATGAAGTATTGGGAAGCTGTCAAGTTCCTGATATTAGACACAAGTTTTCCCGAAATTCTGATTTTGACTCAACGTTTGGATTTTATCATTGAAAACAATTGCTGTCAGTTGTTAGGCTCCAAGGAAATAGCAGATAATTCAGCTTACATGAGTGCTTTTTCTTGAGACAACCATTTCAAAAAGTTATGTACTGTAGGGTTTAAGATTTAACAAAATGTCACTGCTTTCACAAGGACATTCTTGAGTGAAACTGGTTTTTTTCTTTTGTGGGGGTTCACACCACAAATGCATGGCAGTGAAAAATAACTTAGAGTTTGATGCCACTGCCACAGTTTGTGCCAAGGTGCCTGAAATTTTACTTTTACCTACTGTTGCCTTATCACCACTCTTATGTCAACATATAGTTTAGCATAAACCATGAGATTTTAAAAAGTTATTCTACACTTGCATTATTTCAGGACATGTGTTTGTTGCCAAGCTTTCACGTAAGAGTATCTTTAACTAGTTGGTGCTGATGCCTGGCAAATACAAGCCAAGTAACAAGTCCAGCCATGTTTATGCACGCATCCATTGATAACGTATTAGCACAGTCAGCCCTCCATATCCTCAGGTTCTGCATCTGCAGATTCAACCAAATGTGCTTGAAAATATTTGAGAATATTTAATACAATAGTACAAATATAAGTACACAATGTAACAACTATTTATATAGCATTCACATTGTATGAAGTATAAGAAATCTGGAAATGATTTAAAGTATATGGGAGGATGTGTGTAAGTTGTATGCAGATACAGCGCCATTTTATAAAAGGGAATTCAACATCCTTGGGTTTTGGTGTCCTTGGCAAATGGCCAGCAAGGGTGGGGGAGTGCTGTCCAGAAACCAATCCCAAAGCAAGGGACAAATATATACTTCTACAGATGAGATATTAACTCAGAATCCATGTCTGCACACACATCTTTAATGACAAGTTGCTTTATCACTCAACAGCGGCACTACTATGATCTTTTACTTACACTTCAGCCAGCAGAGACATTCAGCAGTGTGAGATTTTTTAAGTTTTTCAGCTATTGTGTATGTTTCTAGTGTATAATAAAGTAACTTATCCTTTAAGATACTTAAGTAGCTTTTCATTTCTAGCTTTAAAACCTGTTTTTTTTTTTTTCCCAGTAGTGGCATACCTGCATTAAAAAATAATGCCTTACCAAAAAAAGCACTCTGAATGATTGGTTTCAAAATGATGCCACAACATAGGTGGCACCAACACTATTCAAGATCATTCCATTCCCATCTCTAAAAAAATTTTTGGCTGGGTATGGTGGCTCACGCCTATTAACTCAACATTTTGAGAGGCCCAAAGCAAGATCACTCAGGGCTAGGAGTTGAAGACTAGCCTGAGCAACATGGCAAGATCCTGTCTCAAAATTCTTTTTAAAATTTTTTTAAAAGCCCAGGCTTGGTGGCGCATGCCTATAGTTCCAGCTACTCAGGAGGCTGAGGCAGAAGGATCTCTTGAACCCAGGAGTTTCAGGCTGTAGTTCACTATGATGGCAGCTGTGAATAGCCTGGGCAACACAGCAAGACCTCATCTCCAAAAAAAGACAAAAGAACTAAATTATTCTACTGCAGAACATGATTAGGTAAATATCTCCAAAGCAGAAAGACAGGTTTCATATTTTCGTTAGTTTGAGTCAGTCCTTCCAAATCAAATCTTGTTTTTTATTAGTATACAGATGGTATAGCCAGTAAGTAAATGAGAAGCAGTCTTTTTAAGCCGATCCATTCTTAAATGAAAAAATATATAAATATTTTAGAATAAATTTATTAAATTCTAAAGTTGTAGAATTTTTAAATTTGGATATTTTGGGAAAATATTTAAACCACTATTGCAAACAAAACAACAAAATGTACTTATGTTTATACTTAGGCACAAAGAAAACTACAGTATTTTAAAGTAACCATTACACAATATTGAGGTTGCAAAGATTACTGAAGGCATAACCTAAAAAATGAGTTGATTTCTAAAAATGGGAAAAAGGAAAAAAATAATTTCTAAAAACAAGTATGCATACCTAAACCTACCTAATGACACCTTAGAAAATTCAAGTATAGCACCATTCATTAACATCAATGAGGATGTCATCACACATCATGTAGCCTCTGCACACCGTGAGAATAAATGAAAAAGACAGGCATCTTGCTATCATGACAATAGTTTTGACCTCGCAGACCTCTCTGTGCTTACGCAACGGATAAAGCCATAAGAACTGTCCTGCCCTCAAGGAGCAACCTAAAGTAGGAAAAAAAAAACAAAATTACACAATTATTATTTACAATTGTGAGAAGAGCTCTTGACAACATTCAAATGGAGGATACAGTGTAGTAAGGGTGAGGGTATCAAGGCTTCCTTGAGAAGTGATGTTTTGAGGCCATTCTTTCTTCTCAATAACTGGTATTTGGTTCCTGAATCCTTTAACTTCCTTACCATTGTCACTCCTAAGCCAAATCTCATTACGTCATGTCTAGACTACTGTTAAGAGAACCACTTAAGTGGTCTCTGCAGCCCTCAATTTATTGGTGTTATCTATGGGAAAATTGCTCAAACTCTAAGCCTTAGTTTCCTACCCTATAAAATGGGGTTTTATATACAAGGAACATACTAAATACACAGGTATACCTCAGAAACACGGCAGGCTCAATTCCAGAGCACTACAATAAAGCGAATCTCATGAATTTGTTGGTTTCCCAGTGCATAAATTATGGTTACACTATACCATAGTCTATTAAGAAGTGTACAATAGCATTATGTATAATTGATAAATACATCACTGCTAAAAAAATGCTAACAATCTTTTTGCTGGTGGAGGGTCTTACGCCAACGTTAACGATGGCTACTGACTCATCAGGGTGGTGGTGGTTGAAGATTACGATAGCTGTGGCAATTTCTTAAAAGACAATGAAGTTTGCCACACTGACATCCTTTCACAAGACTTCTCTGTAGCATGTGATGCTGTTTGATAGCATGATAGCATTTTACCCACAGTAGAACTTTTTTTTCCTTTTCCTTTTTTTTTTTTTTTAAACGCAAGGTCTCACTCTGTCACCCAGGCTGGAGTGCAGGGGCGCCATCTCGGCTTACTGCAACCTCCTCCTCCCTGGTTCAAGAGATTCTCCTGCCTCAGCTTCCCAAGTAGCTGGGACTACAGGTGTGCACCACACCTGGCTAATTTGGTAGAGGTGGGGTTTCACCATGTTGGCAAGGCTGGTCTTGAACTCCTGACCTCAAATGATCTACCAGTCTCGGCCTCCTAAAGTACTGGGATTGCAGGTGTGAGCCACCACACCCAGCCAGTGGAACTTATTTCAAAATTGAAGTCAACTCTCTCACACCCTGGCACTGCTTTATCAACCAGGTTTCTGTAATTCCTAAATCCTTTATTGGCATTTTAACAATGTTCACAGCAACTTCACCAGTAGATTCCATCTCGAGAAACCACTTTCTTTGCTCATCCCTAAAAAGCAACTCCTCATCCATTCAAATTTGATCATGAGATTGCAGCAATTCAGTCACATCTTCAATGCTTTACTTCCAGTTCTAGTTCTCTTCCTGTTTCCACACCTGCAGTACACAAAAAGCATTCAATAACTATTACTTCATTTCTTCTACCTATGTTTCCATTAGCTTTTGCCTATAGTACGCACTAGAGTATGTTACCATTATTTGTTATAAGTAGTACCTCATTATTACACTATTCGTAAGCAATACCTCAAGGTCTAAGATTAGATTTTAAATCAAGGTCAGTAAAAATAGAAAAGGCTGTGAAGACTGTTGACTGACTTTACCAGAATCCATACACTAGAGGTGAGATTAGTTAGGTGATGAAATAACCATTCTATAAACATGATCTGAAACTCTGTTACTGTTGTCAGCAGGAAAAGCCAATGTTACATATGTTTAAAAAAGAAAAAAAAAACCCAAAACCAGAAAACAAAAGGTGACAAAGTATCAAGACAAAAGGTCACTGATGACTGATCTCTAGGAAAAGCTGGAAAGCAGGATTATTAAATGTAACCACGACTAAGATAAAAATCAGAGACAGAAAAGTCTTTGTCACCAAGAAGATATACTCCATGAGAGAGCAGAAACAATTCATCAGGTTTAACCCTGCTCTAGATAAAATAAAACTATCTGATTCAATACTCACACTTCTCTAATAATCCAATACATTATCCCATCTCAAGAAGAGAGAGTCACAGATAAGAAAAAAAAGGCTTCTTGAGAAGTATGTGCTCTAATATAAACTAATATGCCACTAAGAAAGCAACCTGCAAAGTCCAGTACCAGACTTCTGGATTTGTGACCTAACAAGGTGCTCTACAATTAACCTAACAGTCAAACCAGAGTGTTGTAAAAGAGAATTATGTAATTATGCCAAACCTCCACTCACAAAAAATATATGGAAGTAACCTAAGTTTACATTTTGCAAATCTCACACACACACTAGCCCTGACAAAAGTTTCACCAGCTTTCTCATCCAAGTACAAGCGTGTAATATACTTAATAAATTTGTCTTATAAGGGTAAGAAATAGTATGTAACTACTTGAAAAGGAGATAGGTAGCTGGTTAATTTAAACAAAAAGCCCAAGGAAGTAAGGTGCAGGAAAAGGATAACTGCAATGATTAGTACAGGAAACCCAAAGAAGAACTGAATGGTGGGATAGATGTACTCAGAGACCATGAGGCATCAGTTTCCTCTATGAATAGAATATTAGGAGATGTAGGTTAAATGGGACCCTGAAGTCTCTCCCAAAAAGCCTTGTTTATATGTTTTCTGAGCTTAACTATTACTTGAGAATCAATTTCACGTATAAACCAACAAAACTAACATTTATTGAGCTTCCAGCTCTGTGCTTAGGCACTGAAAAATCACTTTCCTTAAGGATTGCAATTAAGCAGGAGAAACACAAATAAGGTGAACTTCTCTTGTTCGAAAGAATATATTTCAACATTCCTTTTAAAAGGAAAACCTGACCTGCAAGTTTCCAAAAATATTAATTACTATTCCTCTTTGCCTCTCAAAATTCCCATTCTGTTATTTTTTAGGAGGAGGAAAAAACAGTTCATTTGAGGAAAAATTGAGGGTCACATACTATACAATTGAGAAGAGTTTCTCTGAAACTGTAATCATTTTTGGCAGGTAAATAGGCATATCCGAGTCAGCAAATGAACTTGAAGATACTGAGTTATACTGCCTGCCCTGTGGGGTTCCACCTTCCCCAAAAGAATTCAGAATTTTTGGGTGATCTGAGAATCTACATTAAGACAACTGTCTCCACACACAGGAGGCCTGAAGATCGCTGACATAAGGGTCTTTTTAAAAAGTATATTTAATGGCCTAGGGCGGTGGCTCACACCTGTAATCCCAGGACTTTGGGAAGCTTAGGGCAGGAAGATCACTTGAGCCCAGGAGTTCTAACCTGTGCAGCACAGCAAAAACCCATCTCTACAAAAAAAAAAACACAAAAAAATTAGCTGGGCATGGAAGCGTGTGCCTGTAGTTCCAGCTACTCAGGAGGCTGAGGCAGGAGGATCACTTGAGCCCAGGAAGTCAAGGCTGCGTGAGCCATGATCATGCCATTGCAATCCAGTATGTGACACTAAGACTCCGTCTCAAAAAAAAAAAAAAGATAATTAAAATGTGTAAGATACTGTATTAGCAATATAAAAAGCATTTGGTGTTAAAATGTTGGTATTATAATTCCTCAGGATAAAACTTACTTTGTGATTGTTTTCTATAACTCAAGATATGATGCTTAGAGCTCCTCCAATCAAGTGTTTCCAGGAAGTGAAAACTTGTAGGACAGAAATTTAGGCTGGGTTCATTTGTATCACACAGACCTATTCTTCATTCAAGTTCTGATATATTTAACTATGTAGCTCCTGTAACAGTTTAATGGAATCTCACCTCCCTAAAATTCATTATGCATTTTTTTTTGAAATCCAAACTCATTAACGCTTGCTTTCACTGTTGTCCAAGGCAGGCACATCTTTAAAAATGGTTTGTTGGACTTAGCTTTCAGCTAAATATATAATAAATAAAACAAAACAAGCAGTTAAATGAAATGTAATGGGCCAGAGAGCTTCAGCTTTTATTTCCTTACTGCTCAGTAAAAAGAGAAAACCATCAATGTCCACGTATTCTGTAATCCACAGAACAAGTCCGGGGCTACAGCTATACTGTCCACAGTTGCAATTCAAATTAGATAAAAAATAAAAATTCAGTTCTTTAGTCATACCAGCCACTTTTCCAATGCTCAAGATTAATAAAATGTCAAACCATAAAGACATTTACATGTCGCTCACTCCATTTACTTAAAGTTGGCTAGACATCAGAGTATACTAGGAGCTCAGGAGTACAAGACACTATTCCTTCAAAAAGCTCAGAATAGTTAAGGTAATTTAAATCAGCAATGACAACAACCCCAGAATTACTATGACCCACGCAGTACAAACTGCTCAGGAGTCAGAAGAAAACTGCTTTTTTAAAAGGGCAGTTTGGGTCATAGAACAACAGACCATGGAAGGCATGACCAAAGGGGAGATGACATTTGAATCTGCAGGATTAAAAGCAGCAAGGGTAGCATTCCAAAAAGAACCACCCCACAAAGATATATGACGTCTCTATGATTTGGGTAACTGCAATTCATTCCATGTGACTTCAGGAGAGAGGTCATATTTGTGTGTGTAGTATGTGGAAAATAGTGAAAAATGAAAAAGCTGTTAAATTGAGGAAAGTCTATCCAGGGACCTTATGCATCACATTCACGAGAACAGAATTCATCCTGTAAACCAGGGGTGTCCAATCTTTCGGCTTCCCTGGGCCACACTGCAAGAACTGTCTTGGGCCACATATAAAGGACAGCTGATGAGCAAAAAAAAAAAACAGACAACAACAACAAAAAAAACACCCCGCAAAAAAAACTCCTAAAACTTTAAGAAAGTTTACGAATTTGTGTTGGGTCGCATTCAAAGCTGTCCTGGGTCCCATGCGGCCCGCGGGTTAGACAACTTGCTGTAAACAGTACAAGCCAGTAATGGAGTTTCACCTGTCATTTTCATGCTCTATCTTCCTTTAGGACAATCATCCTAACAAGATGTAAGATGGATCAAAAGATAACACTAAAGACAGAGACAGCAATTTGGAAGCTATCACACAGGCATCTGAGATCAGTTACTAACTGGTAAGAACAGAAATGAGAGGTATTTAGAGGAAGAAAAAGGGAGATGTTGCCTAACCTCAGATCCAATTCTCTGTAAAGCAGTAGTCAAGATCACCTGGACTGTGAAGACGGTCAGGGACAGAATCCCAGCTAAGGAAAAAGGATAAAATGAAAATCAAGATAAACATTTAAGAACGTGAACTAGGGAGGAATAAAAGCACTGCTGGGTAAGAGTCAAGCCCCAGCTCAAGCCTTAATTTGTGGTGGAACCAATCTGTCTGGTTTCGCGAGACACCAGGCTACCCAAGATCAAGAGAGGGAGAAAGCTAGTGCTATGTCTGAATACTAGAGGAGCAAGTACAACAAATGGAAAATGGGATCAAGTATGAGTGAGAGTTGCTAAGATGCCTGGTAGGGATGCAAAGGGGTAGAGAGCCTGGGGAGAGAGGGTGAGGGAGGGAAGCACTGGTTTCTCAAGCAAAAGCTAAAATTTTTCTATTAAGATTTAACCTGATGCTACACTTTGGTGGTGCAGCAAGGGTCTCAAATGGTATAAAACTCAGGTGATCATGCTTTATGTCTGTCTCTAGAAAAATGCTCCAAAAATGATAAGTAGTGATAATCCGCAGTCTCGTTGCATAAAATCAGCCCCAGGTGAATGACTAAGCTCCATTTCCCTACCCCACCCTTATTACAATAACCTCGACACCAACTCTAGTCCGTGGGAAGATAAACTAATCGGAGTCGCCCCTCAAATCTTACAGCTGCTCACTCCCCTGCAGGGCAACGCCCAGGGACCAAGTTAGCCCCTTAAGCCTAGGCAAAAGAATCCCGC
CCATAATCGAGAAGCGACTCGAC ATGGA
GGCGATGACGAGATCACGCGAGG AGGAAAGGAGGGAGGGCTTCTTCCAGGCCCAGGGCGGTCCTTACAAGACGGGAGGCAGCAGAGAACTCCCATAAAGGTATTGCGGCACTCCCCTCCCCCTGCCCAGAAGGGTGCGGCCTTCTCTCCACCTCCTCCACCGCAGCTCCCTCAGGATTGCAGCTCGCGCCGGTTTTTGGAGAACAAGCGCCTCCCACCCACAAACCAGCCGGACCGACCCCCGCTCCTCCCCCACCCCCACGAGTGCCTGTAGCAGGTCGGGCTTGTCTCGCCCTTCAGGCGGTGGGAACCCGGGGCGGAGCCGCGGCCGCCGCCATCCAGAAGTCTCGGCCGGCAGCCCGCCCCCGCCTCCAGCGCGCGCTTCCTGCCACGTTGCGCAGGGGCGCGGGGCCAGACACTGCGGCGCTCGGCCTCGGGGAGGACCGTACCAACGCCCGCCTCCCCGCCACCCCCGCGCCCCGCGCAGTGGTTTCGCTCATGTGAGACTCGAGCCAGTAGCAAGGGCCCGGTCCCACAGCTTCGACAGCCAATCAGGTGTCGAAGACAAGCAGGCGGCGGGTAAACCGACTCCCCCGAAGGAAGGGGAGGGTGGGAGGACGCCCGCGCCAGAGCCGATTTCACTGACCCTCCCCTCCCGCCGCAGGAGGCCGGCCGCGCCCGCACACCCAGCATCTCTACACCCCACCTACCTACCCGCCCCACCCAGGGGGCAACGCGAGAGTCGCTAAGCGGCTGCGTACTCCCGACGGCGTAACTGACAGGAGCTTTACTCCAACCAGAATACGCCATTTGTGTTTTCACACACGGCGGGAGGAGAAACGGCCAATCGGCGACAAGAGGCTAGCCGGAAGCGCTCCTCCCTCTGCGAGAGCAATGGCTCCGTCCGGTTTCGAGCATTTTCCGCTCCCTTCTCCCTCCCCCTCCGGTTGCCGCAGGGCGGGCCTCCCTCCCGCCTGCATCCAGCCACCCCTTTCCCTCCCAACGTAACAAACATTATGTTCCCGACTTCCCACGGGAAAGGCAACCCCCGCAAGCCACCAGACGGCCCCCCTAGCCACCCATCCCCCCAGTGTACCGCACCTCCCCTCCCACCAGAGTTCCGCTCCCCTACCTAGCCGAGGCTCTCTGAGGAGCCGGAGCGCCGAAGCACAGCCTCTTCTCTAGGCGGCCCCGGCGGCTTCCGCTGATTGGCGGCGAGTGGGCCAATGGGTGCGGGGCGGTGGGCGGAGAGGCCAATGGCGCGGCGGGAGGGGGCGTGTCCCGGGTGCCCCTGGCGCCGGCGCTGGGAATCCCCGTGCGGTCAGTGGCGTTTCCGCTCGGGCAGCGGGCTGAGTGAGCTGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCCGCTGCCGGGGGAGGGGCGGCCGCCGCCCGCCTGCGCTCAGAGACTCACGCAGCCCCAGTCCCGCCAGTCCGCCAACACAGTAGTGCCGGCCCCCCTCTTTCCCTGGCCCTGCCCCCCCTCCCCGCCTTTGGCTCGCTCCGCCTTTCTGCCCCCCACCCCCACCTCACGGGTACGGGCCATTCCCGGCCAGGAAACGCCGTGGCGCCGCGTTGGGCCTAACTCGAGTCCTGCCGCCTCCCGGGAGTGCCGTGCGCCGCAGCCCGGGCCCAGGCCCCGGCAGCGCCTGGGACAAGGTAAGGGTCCGACAGAAAAGAGACCGAACCTCACGATCGGGCCCCAGGGGAGGGAAGGGTCACCTCCTCCGTCTCCCCGCGCTCGCTCTCCTTGGGTCGTGGGCCTGGCCCTCCCCAAGCTCTTAGGAGGATGCTGCCACTTCTCACCCCCCTCGCCGCCTTGCACACACCGTTGCAACACCCCATTTTCCCAGGGAGAGAGATCCCCCTCTAATCTAGGCGACCCAACTCCCCCTTTCATGTTTTTCCTGGGTCAGGACGCTTCCCCTCCCCCAACGCCTCTTCACCCCCTTTCCTGGGAACTGCCTACTCCACGTTTACCTTTCCCTTGAGGAGAGGCCTCTTGCTGCCCTCCGCTCGAAATACACAGGCATACTTTTTTTCTCTCCCCGATCCCCCACTCCCTACCCCCGTTCTCGCGGCCTTGTGACAGACAACTCTGATCGCTCTGGGGGCCGCGATCTCCCCTCCGTAATCTTCCTGGACGCCTTCCCTCTCGTTTTCTGGCTTCCCACCTCAGATGGCTGCTTCCCAAAGGCATTACCTTCGCCACCCCCACCACACGTTCTCTGGCTCCCCGTGGCGTGTGCCACAGCGTGTCTGAGATAGCCTCGTTGAATGTGTAGGGTTCGAGCCTGGAGTTGAGCCAGATTGTGTCGTTTTACTTGCCTTGGGCGTGGAGAACGATCTTGTGAGAATATCTTCAAAGGCAGAAAAATATTCCCTTTATGAATTCTCTTTCCCTCTGCGTGTAAGTCGGGAATGTGAAGAGGAGTGTAGGAAAGAGCCCTGGTTCAAGTAGGTAAATCGCATGAGAGGGAAAGTTAAACTGTTGGGAAAGCCCCTTCTATGCTAATTGATTCTATAGAGTCCTTGCTTGTCTCACTTCTTGGGCGTCAGTGGTCTTTCTCTTGGATATGGATGCTGCAGTCAGCTCTGCTGGTCTGGGTCAGGGGTGCGTGTATGACCTGCATTTTCTGCTTTCTCATGTTACTTGTGCAATGTATTCACCGGTAACTCATTTCTTTCCCAGACCTCTGGGTTCCACTGGGCTTTGTCTATATTTAAGTTCATTTCTCCAGTTTCCTTCCTGCACATAGGTACTGAACGAATCCCCAAGTTCTGTGCTAATTACCTTCATCAGTTGACTAAACAAGTTTTTAGATGACATATTTGTGACCAAGGTCATATTTACATTTCTTTGTTGGACAGATGTTACATAGCTATACTTGTGATTGGGGAGGATCCAGCTGAGTGGAGTGTGCTGAGCTTTTTAGGAGAGTGTGTACTCCCTATTTGAAATTATTTTTTGGTTGTTAATTTTATATTATTAATGTTTTTAGGTCACAGAAAGTTCTAAGTGGTAATTTTAGATGTGTGGGATCTGAGCTAGGACTAAAGCAGAGAATACCCACGTAATCAGAGGTTTCTGGGCTCCATAGAGGACGTAGGGCTTTTTTTTTTCTATTGGATTTCTTCCAGTTTTCTCAGGATCATTAGTTCTCTTCTGTAGCCAAAAATTCTGGCCTGTTATGGGATTAGAGTCTTTAAGGTTTACTCAGACTGTCATTATGTGTAGAAAAATGAATTATGCCCTTTGGTAGGACATGACACAAGGCTCTGTTTCTAGCTGCAAATTTAAATTAGATTGTAGAGTGCTTGGGAAATTGGCTTTCAAAAGACCAAAGCTTAATCTTCACTCCTAAACTGCTGGCTTAATTAAAATGGATATTTAGAATTTGGTAAATGTTGATTTTTCTAATAAAAGGCCTTGGTTTAAAAGGGTGACCTTAGGATTGTTTCTTTCTTAAAAGCATAATTCCAGCCCTTCTGGCATGGAGCACTGGTCCAAAAAAAAAAAAAAAAAGTGTGTGTAAGGAGTGGGGGTGGGGTAAAGAGAAGGTTGTTCCTTTGGGTTGGATCACAGGGGTGAGTATACAAGGCAGCAGCAGCTGCTGGCTCTGGAGCTCTGGTTGCTACGTGAGAAGCTTGAGTAGTGCTGGCTGCTGTCTCCAGGGAAGGACAGCAGTGCAGCGTCCATTAATGCTGCTGGCTGCAGGGAGCAGCACTTAGGCGATGGCTGCTTCAGGACTAAGAAGAAACCTTGCTTTTCTGGGAATTTTCACTGCTGAGCTGGTTTGCTTTTTATTGGTGGGGAGATGGGAATTAGTAATTCATAATCTCCTACCCATTTATGGATATTGGCATCTGGAAACTGGATCATGGTTAAAGCCTTTCTTTTTTTGTTTGTTTGATTTGATTTTTGTTTTTTGGCAGATTTTTGTTTTTTATCTAGACATTTGTGCTTGGATAGGACTAAAAGTTCCATTAGAGTTTTAATTTTTCAATCAGTTTAAAAACCCAAGTAATAATTTTAAGAATCTTTCTGATAACCACAATAGGAAGAAAATAACAGGAATTTTTTCCTGCAGCTCACATATCATGCCTTCCTCCATCTCTTTAATCATAGAATCAATTCTTATTATTTTGTTATGTGTCTCCATCCTTTCGATTAGACCACATTTACCTTATAGACGATTTGCTAAACATTTTACTAAGCTTGAACTCTTAAACTCTAAAAAGGTGCCATTTTGGAGTGGTTTCTAAATAAATATTTTTAATTTGTATATTAGTAATAAACTTCTCCAGATTAGATATTTTCTTTGGAGTTTGACTTATAAGATTGATTCATTATATACATGTTGGATATAGCCTTCTGACATCACAAATATATGTCTTTGGCCATAATCCATCTGAAATGTAGGACAGACCAGAAGAAATATGCAGAAATCGAATAAGTCTAGTTCAGGATACTGAGAAGATGGCCTCTGAGCCCCTTAGGTGATCTCCCCTCCCCCACAACTCCTGAACATTAGGATGATCTCTGATTAAGCAAAACAGTCTGAGCGTGGAAAAACTTGAAGGAGAACCACCACCACCAATTATATGCAATACTGGACATATTCCTGTGTGCTGTTTTTCTTCCCCAAGACTCGTGTATCCTATACTTTTTTCTCTCAGAATTTTGATTTGTTCATTTTCGTGTAAATGTACTTAAATCTCACAAACATCTATAATTTGTAGTATCACTCTGGCATTTGTGGCAGAGAACCAAAAAGAATGGAAATGAGTTTTGTCATTCACAAATGTGGCTCACATTGTTTTCCCAGTAATAAAAGCAGACCAATGAAACAGAACCTTTAATGGATACTATTTTAGGAGGTTCCAATTCTTATTACTATCACATAGATAAGATGCAATAGCAGATAAATATGATTTCATGTATACTGGCTGTTTGACATACTTAGGGTTTAAGATAAAAATGTTTGTAGTTTTTTACTCTGTGGCTTAAGTTGCTATATAAAATAATTGCTTTTACACTCGAATTTCCTGTTGTTTGGAACCTTTTGTGCTCTTGATATTATCATTTTTTAGAGGATCATACAGGCCCTTTTCATAGAAGGATTTACTTAAGTTATACCCTTGAAAACTTTTTTATATCTTTTGATACTGTTTTGTGTCCAGGAACTGACTTTCTGAAATTATTCTGGCTTTTCTGGGGAGAATGACTATTTCATTTTTACCTTTGAATGGGGAAATAATAAAGTGCAAAGTACAGATTTGCAGATAATTACTTTTGCTTTATCCTCTCCATGTTGAAATAACTTATGAAAAATTAGGCCATAGTTAACAGCAGTCAATGACTATTGGATACATTTTATCAGAGGGGAACTGGATCATGAATAAAATAAAATTTTAAAAATAATTTTTGGCTGAACTCTGGTGATTCATCAGTTTAATTTGAAGTCAGAAGGTCTAGCAGTGAATTTTATTTATAAAAATTGTATTTCAAGTGTTGAAAACTGAAACTTCTTGACCAGTATATTTTGTTTGAGGCATCAAACTTTGCAAAATGTGCATCGTATATTTAGTGATATAACTGGTAGTCATTTGTAATTTAAAGTATTCTTTCAAAGGCACTCTTTAGAAAGTAATGTAGTGTACCCGTGATGGGCAGGGATTGGTACCATTCCTTACTGCCAAAAATTCCAAAATATGTGGCAAAATGATTGATTTATCTTGTGGGTGGGATTCTGGGAAGTTCATGAAAGGTGGAGAGAATATAGTTTCCTTCACTTGTCTATATACATTTTGTTAAATAAGTCTTAGGAAAACTGTTTTATTGTATCTTTAATTATGAATTGCGTAAAAGATACCCAGTAACTTTGGGGGGAGGTGCTGTTAGAAAGCATTACATTGGAGAGAATTCCCCTACCCTGGGACAAAATGCATTCTGTCTTTAATACTTAGCGAAGGGAACTATGGGATAAAATAAACAATGAAGGTAAGCTCAGTCTGCTTTATATGTGCCCTCACTGAGCAAGGAATTTGTAATCGCATCGTGCCTCATTCGTTTATACCATCATATTGATTTTGTTTGCTGAGTACCTGAGGGAATACCTTACTTAATGTAAGGTCACATTAAGTATGTTTGATATGAAGACAGGGAAAGGAATTTTCTGCTTCTTGGAGTAATGTCTTAGTATTTTTAAAACACTTAAGTTTTTACATCAGGCCAGTTTTGCCTGATGCTCATGTCTGTTGCTTTGGTTGGGCTGCTGCTTTCTCTTCTGTGTTCTTATGGGTTCGTTGTGGTATAAGGATTCCCACAGCTTTCATGGCAGTATGAAGTAATGAGAAGCATTGCCTTAGCCATGTTAGTTACATGTATACTTTTGGCCTATGTTATGAATCACAAAAAGCGGTAGCTATAGGAATGTATACAAAATAGATTTCTGTCTGGGGAATCAAGTTTTTGATTTGTGCTACCTAATGGAGGGGAAAATGCTGAATTTCTTGCTGCTCTGTTTGAGAAATAGATGGAAGCATGGGAGGAGCCAGAGACCTCTGCAGCAGGATTTGGTCTAAGTAGAAAAGGAAGATTTTTGTTTCAAATTGCCAGCTGCTTATGTCAGACTGACTCCCTTATTATGCCTCCAGTAGGCCTGTCAATATGGCCAAACAGCTAGATAAGTGCGGGGCAGGACAAAGGGCTCTTTGCACAGCAGGGAGGCAATGTTGGTGGGGGAGGGGCAGGAGGTAGGAAAGGCAAGAGGAGGAGGTTCTTTTCCCTGGGAGATTATTCAGTTTGGCATACAATTAAAGAAATCATTTTTAGTTCCCACTCAAGCATTGAATTTTTGCCAACCACATACTATTAACCCCAAATTTGATACATTTCAGAATATCTTGTAGGGATCCATTCTCGCCAAGGAAAAATAAAAAAATAAATAAAGCTCTGTATAGGTTAAAATAAAATAAATCCCACACTCTGCACCCTCCTAGGTGCAAGTCACCTCCCGAGGAGACCCGTTCTAGAGCTGAATTCTCATTAAGAAATGGAAAAGAATACTCTATCTGAATAAAAACACATTGTAATACAATGTGTTTATTTGGGTTGGGATTGGACCTGAACATGTAGAATAATTTGTTTCCCTTTATGAAATAGTTGCTCGTAGTTGTCTACAATTTTATTTCATTAAGATAGGTAGCACATTACAGCTTTCATGTGTTGGGTTGCCATATGTAAAATGCTAACTGAAGAAAGGCTACTTTTTAATTTCAGCCTCATCCTTAGTTCCTGGAGAACCTGATATTTCCTGGAGATTACTCCCTCCCCCACCTTTTAGTTTAGGCAACCTCTTTTGATACATTTGTGTTCAGCTCGCATACAAGTGGGATAGTTGCATCCAGTTTATTAAGACTTAGTATGAATCATAGAGTTGGAAAAGATCTGTTGGTTATCTGGTCCTTTAAACCAAAATCATAATGAAATATTTTGAAATTTGGGTCCCTATTGAAGTTTTCATTAAAATGTTAAAGGATCGGTGTTCTGAACAACATTTTTAGTTACTTTTAAAATAAATGTTTTGCGTCAGTTCTTTTTTTAAAAATAAAGAATTTCATTTATAGGCAAATTAGCTGGCAATTATTTGAATTGTGATAGGATTTCTCTTTTATGAAGGAATATATGACAAGGTTTTTCAAAATGCTTAATATATTTTAAAAGACTTTAATTTTTAGAAATAATTGGTTTGAACAGTTTTCCAAGAGCACATTTGTTGCTTGGGTTGAGGTACCACCTATATTGCAATGTTACTAAACTAGCCTTAAAGTTTTCCCTTCTGTCTATACTGCATGCAACAATAAAGGGAACTGGAATGTTAATTTCCATTTATGGATTAGCAGAGGAGATGTTTTAACCGATTAATAACCAAAAAACTGCCTTTCGTACACGTAATATTAAGCAAGCCTGACCAAGTTTTGTGTTATTTCTCTCTGTTAAAGAAAACTGGATGTGTTACTACTTAACATTATATTGTTATTTAATGGTCTTGGCAGTAATGATATAATATTTCGACCAAAAGAAATTTTGAGTAATTAATTATTATTGTAATTAGTTGGAAGTTTCTCATCAGTAAAATAGCAACAGCATTAACACAAAATCTAGTGAGCTATATTTTATATTACTACAGAAATTTAGGGTAGTCATTTCTTTCTTTATAATTTATTCACATGGATTATTTCCATAAATTTGTGGGACTAAAATAGAAGCCATCTAGTCAAGCACCAGTCTCCATACCAGACAGTTTTCTCTGCATGTGCTATGACCCACATTGCCAGTATTAAACATCCTTTACACCCTCCCCCTTCCCAGATAATTAGAAATCTCTTCAGGGTAGCTTCCATTGCTCCTATTACCTGGATCTTGCTAGAGGCTCTAAGAAGTTCCTGGTAAAAGTGAGACAGTAAGGGACCACATTTTGATTCCAAAGGTTTTGATAACTGTTAGGGCTCCCCAAACAGCTAATCTCATTTTCACCAAGACTTAGCCAGCAGAGGGCTGGAATGGAGGTGAAACACAAGCACTGTACCTCATCTTGCCTGTGCAGCTGCTCCACCTTATTTCCTGCTATTATTATCTCACAACGCCTCCTCCCATCAAAAAGAAACTAGGACAAAGGGGGAAAATTGGATGGGCTAATGTGATTTTTATTATGCTAGGTTGTGGGCTTGTTTATATGTACTTAAATACAAAGCTAATTTGCCCCATTCTTAAAAGTCTTTAGTGATAGAGATTTTGTAACTTCTGTATCTTCTACTTTCTTTCTTGATAAACCATTTCAGATTCTCAGCCTTACAGAAAGAAAGGTTTTAAGCATACTTAATTTTCGTTGGCCGTTCACAGTCATTATTACCACCAGATGCCACTGTATTATTAGCTTGAAGAAAGGTGGGCTCTCTTCTGTACATAATATCTGCAATTTGTTTTGGAAAATACTAATTTGTATAAATCTGATTTATGACTAAAATAAGGTTAAAAATTAGACCTCTATGTATGTTTACCCTATTACCTTAGTGGGGGTGAAATTAATTAGCTCTTTGAACATAAATTTTTCATGTCTTAGAGTTCTTTTTTCAAGCTGCATAATTTATGTTCTTCAAGCCATTTTTATCCCATACCACCCCCACAAAGGGGGAAATTTTATTTTTTATCATTTTTATTGTCTTTCAATGGTGAGATTTTCGCCACCCCACTCCTGAAATGTGAAGACTCAAATAAAACTGAGTAATCTAATAAGGTATATGCGTTGCTGAATGTAGTAAGATGATTGTTTCATCATTCTTAGATATTATGATCTAGTTTGAATCTGGTTTCCAGTATCATGTTAGCATATTTAATACTGTTGATATGTTAATTTTAATACATGCCCAGGTGGATCTCCTTGCTTTCTATTTGTGCCCCTTGTTTGTCGTTTTGTATGAAGGGGGTTTTTGTTGTTGGATTTTCTTCCCCATCTCTGTGTCCTGTTATGTTCTTTGGCTTATGTTTCAAAAATTCTGTTTCCTACCACCAACCTCTGTACATGCCACAACACATACAATTTGTACTTTCACAGTTTCTGTGAAGTAGGATGATCTGCAGTTAATAATCAACTGTTTGGGCATTCTTGGTATCCAAGGAAGGTTTTACTTAGAAGGAAGAACCTGGAAGGACCTGTTGGCAATTAGACTACTTCTGCGTTTATTTTACATTTTCCCTTATTAACGTAGGCTGTTGAGAGTTGACTTGTTTTATAAGAGAAACCAGATTGACAGAGAAGACCCCCAATCAGATAGAGTTATTTTAAAAATAAATGTGTTTATTATGGTAACATTTGGGGTAGAATCTAAAGGGCATATTTTTAAAAAAACTTTTAGTTCTAAAGACAAAAGAGTTTAACCTAAAACAGAACAAAGAGAAGGGCCTTTGAAGCAGTATGATTGATTATAT
實例 11 - CHO 及小鼠穩定位點 1 序列 - 美國專利第 7,771,997 號211> 6473
<212> DNA
<213> 灰倉鼠
<400> 1
(SEQ ID NO:5 )
tctagaaaca aaaccaaaaa tattaagtca ggcttggctt caggtgctgg ggtggagtgc 60
tgacaaaaat acacaaattc ctggctttct aaggcttttt cggggattca ggtattgggt 120
gatggtagaa taaaaatctg aaacataggt gatgtatctg ccatactgca tgggtgtgta 180
tgtgtgtgta tgtgtgtctg tgtgtgtgcc cagacagaaa taccatgaag gaaaaaaaca 240
cttcaaagac aggagagaag agtgacctgg gaaggactcc ccaatgagat gagaactgag 300
cacatgccag aggaggtgag gactgaacca ttcaacacaa gtggtgaata gtcctgcaga 360
cacagagagg gccagaagca ctcagaactc cagggggtca ggagtggttc tctggaggct 420
tctgcccttg gaggttcctg aggaggaggc ttccatattg aaaatgtagt tagtggccgt 480
ttccattagt acagtgacta gagagagctg agggaccact ggactgaggc ctagatgctc 540
agtcagatgg ccatgaaagc ctagacaagc acttccgggt ggaaaggaaa cagcaggtgt 600
gaggggtcag gggcaagtta gtgggagagg tcttccagat gaagtagcag gaacggagac 660
gcactggatg gccccacttg tcaaccagca aaagcttgga tcttgttcta agaggccagg 720
gacatgacaa gggtgatctc ggtttttaaa aggctttgtg ttacctaatc acttctatta 780
gtcagatact ttgtaacaca aatgagtact tggcctgtat tttagaaact tctgggatcc 840
tgaaaaaaca caatgacatt ctggctgcaa cacctggaga ctcccagcca ggccctggac 900
ccgggtccat tcatgcaaat actcagggac agattcttca ctaggtactg atgagctgtc 960
ttggatgcaa atgtggcctc ttcattttac tacaagtcac catgagtcag gaggtgctgt 1020
ttgcacagtg tgactaagtg atggagtgtt gactgcagcc attcccggcc ccagcttgtg 1080
agagagatcc ttttaaattg aaagtaagct caaagttacc acgaagccac acatgtataa 1140
actgtgtgaa taatctgtgc acatacacaa accatgtgaa taatctgtgt acatgtataa 1200
actgtgtgaa taatctgtgt gcagcctttc cttacctact accttccagt gatcaggttt 1260
ggactgcctg tgtgctactg gaccctgaat gtccccaccg ctgtcccctg tcttttacga 1320
ttctgacatt tttaataaat tcagcggctt cccctctgct ctgtgcctag ctataccttg 1380
gtactctgca ttttggtttc tgtgacattt ctctgtgact ctgctacatt ctcagatgac 1440
atgtgacaca gaaggtgttc cctctggaga catgtgatgt ccctgtcatt agtggaatca 1500
gatgccccca aactgttgtc cagtgtttgg gaaagtgaca cgtgaaggag gatcaggaaa 1560
agaggggtgg aaatcaagat gtgtctgagt atctcatgtc cctgagtggt ccaggctgct 1620
gacttcactc ccccaagtga gggaggccat ggtgagtaca cacacctcac acatactata 1680
tccaacacac acacacacac acacacacac acgcacgcac gcacgcacgc acgcacacat 1740
gcacacacac gaactacatt tcacaaacca catacgcata ttacacccca aacgtatcac 1800
ctatacatac cacacataca cacccctcca cacatcacac acataccaca cccacacaca 1860
gcacacacat acataggcac acattcacac accacacata tacatttgtg tatgcataca 1920
tgcatacaca cacaggcaca cagacaccac acacatgcat tgtgtacgca cacatgcata 1980
cacacacata ggcacacatt gagcacacac atacatttgt gtacgcacac tacatagaca 2040
tatatgcatt tgtatatgca cacatgcatg cacacataca taggcacaca tagagcacac 2100
acatacattt gtgtatgcac acatgcacac accaatcaca tgggaagact caggttcttc 2160
actaaggttc acatgaactt agcagttcct ggttatctcg tgaaacttgg aagattgctg 2220
tggagaagag gaagcgttgg cttgagccct ggcagcaatt aaccccgccc agaagaagta 2280
ggtttaaaaa tgagagggtc tcaatgtgga acccgcaggg cgccagttca gagaagagac 2340
ctacccaagc caactgagag caaaggcaga gggatgaacc tgggatgtag tttgaacctc 2400
tgtaccagct gggcttcatg ctattttgtt atatctttat taaatattct tttagtttta 2460
tgtgcgtgaa taccttgctt gcataaatgt atgggcactg tatgtgttct tggtgccggt 2520
ggaggccagg agagggcatg gatcctccgg agctggcgtt tgagacagtt gtgacccaca 2580
gtgtggggtc tgggaactgg gtcttagtgt tccgcaagtg cagctggggc tcttaacctc 2640
tgagccatcc ctccagcttc aagaaactta ttttcttagg acatggggga agggatccag 2700
ggctttaggc ttgtttgttc agcaaatact cttttcgtgt attttgaatt ttattttatt 2760
ttactttttt gggatagaat cacattctgc agctcaggct gggcctgaac tcatcaaaat 2820
cctcctgtct cagtctacca ggtgataaga ttactgatgt gagcctggct ttgacaagca 2880
ctttagagtc cccagccctt ctggacactt gttccaagta taatatatat atatatatat 2940
atatatatat atatatatat atatattgtg tgtgtgtgtt tgtgtgtgta tgagacactt 3000
gctctaaggg tatcatatat atccttgatt tgcttttaat ttatttttta attaaaaatg 3060
attagctaca tgtcacctgt atgcgtctgt atcatctata tatccttcct tccttctctc 3120
tctttctctc ttcttcttct cacccccaag catctatttt caaatccttg tgccgaggag 3180
atgccaagag tctcgttggg ggagatggtg agggggcgat acaggggaag agcaggagga 3240
aagggggaca gactggtgtg ggtctttgga gagctcagga gaatagcagc gatcttccct 3300
gtccctggtg tcacctctta cagccaacac cattttgtgg cctggcagaa gagttgtcaa 3360
gctggtcgca ggtctgccac acaaccccaa tctggcccca agaaaaggca cctgtgtgtg 3420
actctggggt taaaggcgct gcctggtcgt ctccagctgg acttgaaact cccgtttaat 3480
aaagagttct gcaaaataat acccgcagag tcacagtgcc aggttcccgt gctttcctga 3540
agcgccaggc acgggttccc taggaaatgg ggccttgctt gccaagctcc cacggcttgc 3600
cctgcaaacg gcctgaatga tctggcactc tgcgttgcca ctgggatgaa atggaaaaaa 3660
gaaaaagaag aagtgtctct ggaagcgggc gcgctcacac aaacccgcaa cgattgtgta 3720
aacactctcc attgagaatc tggagtgcgg ttgccctcta ctggggagct gaagacagct 3780
agtgggggcg gggggaggac cgtgctagca tccttccacg gtgctcgctg gctgtggtgc 3840
atgccgggaa ccgaaacgcg gaactaaagt caagtcttgc tttggtggaa ctgacaatca 3900
acgaaatcac ttcgattgtt ttcctctttt tactggaatt cttggatttg atagatgggg 3960
gaggatcaga gggggagggg aggggcgggg agacggaggg aggaggggag gaggggagga 4020
ggggaggagg ggaggagggg aagggatgga ggaaaatact aacttttcta attcaacatg 4080
acaaagattc ggagaaagtg caccgctagt gaccgggagg aggaatgccc tattgggcat 4140
tatattccct gtcgtctaat ggaatcaaac tcttggttcc agcaccaagg attctgagcc 4200
tatcctattc aagacagtaa ctacagccca cacggaagag gctatacaac tgaagaaata 4260
aaattttcac tttatttcat ttctgtgact gcatgttcac atgtagagag ccacctgtgt 4320
ctaggggctg atgtgctggg cagtagagtt ctgagcccgt taactggaac aacccagaac 4380
tcccaccaca gttagagctt gctgagagag ggaggccctt ggtgagattt ctttgtgtat 4440
ttatttagag acagggtctc atactgtagt ccaagctagc ctccagctca cagaaattct 4500
cctgttccgg tttccaaagt actggagtta tgagtgtgtg ttaattgaac gctaagaatt 4560
tgctgattga agaaaacctc aagtgggttt ggctaatccc cacgacccca gaggctgagg 4620
caggaggaat gagagaattc aaggtttgcc agagccacag ggtgagctca atgtggagac 4680
tgtgagggtg agctcaatgt ggagactgtg agggtgagct caatgtggag actgtgaggg 4740
tgagctcaat gtggagactg tgagggtgag ctcaatgtgg agactgtgag ggtgagctca 4800
atgtggagac ctgtatcaag ataataatag tagtagtaac aatgcaggcg agggtgtggt 4860
tgagtggtag agcagttagt tgatttgaca tgcttgaggt ctcccggtcc atctgtggcc 4920
ctgcaacagg aagggaggga ggaagggggg gaacgagaga gaggaaagag agacagaagc 4980
taagataggg aatgagagag gaaggaagaa acgggaagaa attcagactc cttcctgagt 5040
tccgccaacg cctagtgaca tcctgtgcac accctaaggt ggcctttgtg tggcactggc 5100
ttgggtggtc gggaaaggca ttttcagctt gttgcagaac tgccacagta gcatgctggg 5160
tccgtgaaag tttctgcccg ttaacaagaa gtctctacta cttgtgacct caccagtgaa 5220
aatttcttta attgtctcct ggtgttctgg gttttgcatt tttgtttcta aggatacatt 5280
cctgggtgat gtcatgaagt ccccaaagac acagtggggc tgtgttggat tgggaaagat 5340
gatttatctg gggtgtcaaa aggaaaagaa gggaaacagg cacttgggaa aatgtcctcc 5400
cgcccacccg aattttggct tggcaaccgt ggtggaggag caagaaacac gtggacgttt 5460
gaggaggcat ggggtcctag gaggacagga agcagaagga gagagctggg ctgacagcct 5520
gcaggcattg cacagtttca gaaggagatt acagcatgac tgagttttta gggatccaac 5580
agggacctgg gtagagattc tgtgggctct gaggcaactt gacctcagcc agatggtatt 5640
tgaataacct gctcttagag ggaaaacaga catagcaaac agagccacgt ttagtgatga 5700
aactctcact ttgcctgagt catgtgcggc catgcccagg ggtcaggctg acactcaact 5760
caaaaacaag tgagaaattg aagacaatcc gtggtggcag ctactggaag ggccaccaca 5820
tccccagaaa gagtggagct gctaaaaagc catttgtgat aggcacagtt atcttgaatg 5880
catggagcag agattacgga aaaatcgaga atgttaatga ggcaacattc gagttgagtc 5940
attcagtgtg ggaaacccag acgcttccat cccctaaaag gaacatcttg ctctcagtca 6000
aaatggaaat aaaaattggg gcttgaattt ggcaaatgat tcagaactct gtgtaggtat 6060
tttcacacgc acagtggata attttcatgt tggagtttat ttgtgctaaa aggcagaaaa 6120
gggtaaaaag cacatcttaa gagttatgag gttctacgaa taaaaataat gttacttaca 6180
gctattcctt aattagtacc cccttccacc tgtggtaatt tcctgagata gtcagtgggg 6240
aaaagatctc tccttctctt ctttctcccc ctcccctcct ctccctccct ccctccctcc 6300
ctccctcctc tccctccctc cccctttcct tctttctttg ctccttctcc tctgcctcct 6360
tctccctttc ttcttcattt attctaagta gcttttaaca gcacaccaat tacctgtgta 6420
taacgggaaa acacaggctc aagcagctta gagaagattg atctgtgttc act 6473
<211> 7045
<212> DNA
<213> 灰倉鼠
<400> 2
(SEQ ID NO:6)
actagcgtgc aattcagagg tgggtgaaga taaaaggcaa acatttgagg ccatttcctt 60
atttggcacg gcacttagga agtggaacat gcctaatcta ctggtttgta ccacctttcc 120
ctataatgga ctgtttggga agctcctggg caaccgattc tggcatctca ttggtcagag 180
gcctgttaaa tggtactctt atttgcaaag aaggctgtaa cttgtagctt taaaagcctc 240
tcctcaagaa agaagggaga aaggatatgg ctagacatat ctaatagact taaccactgt 300
gaaaagcctt agtatgaatc agatagaacc tatttttaac tcagttttga aaaaaataat 360
ctttatattt atttgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 420
gaaccacatg tagcaggtgc tggaggaggc cagaagaggg caccagatct cctggaactg 480
acaccacaca tggttatgag ctgcctgatg tgggtgctgg gaactgaact ctcgtgttct 540
gcaagagcag caactgttct cttaactgat gagccatctc tccagccccc cccataattt 600
taattgttca ttttagtaaa ttttattcat aatcaattat cacagtataa aacaatgatt 660
ttatatatat catatacata tcaaggatga cagtgagggg gatatgtgtg tgtgtgtgtg 720
tgtgtgtgtg tgtgtgtgtg tgtgttattt gtgtgtgtgc tttttaagaa ggtgccatag 780
tcactgcatt tctctgaagg atttcaaagg aatgagacat gtctgtctgc caggaaccct 840
atcttcctct ttgggaatct gacccaaatg aggtattctg aggaactgaa tgaagagctc 900
aagtagcagt gtcttaaacc caaatgtgct gtctagagaa agtcaacgtc atcagtgagc 960
tgaggagaga tttactgagc ggaagacaag cgctctttga tttaagtggc tcgaacagtc 1020
acggctgtgg agtggagcct gtgctcaggt ctgaggcagt ctttgctagc cagctgtgat 1080
gagcagtgaa gaaagggtgg agatggaggc agggtgggag cagggctatg gttcagacta 1140
ggtatcgtga gcacaccagc tggttgactt gtggtctgtg ggtcaggcgt tgtaaacgcc 1200
ctcagggtca ggcagtcaca ttgcttgaag ctgaatgggt gaggcaacac agagagtgca 1260
aagaaggcaa agtaccacct cttccccgac ccaggtcact tctgggttat agctgagact 1320
ccggacagca tgcaaccagc tggttagagc ttcagggaaa acttgatgtc tgcatgttgc 1380
tatgaaatgt gattcggtac atctggagaa aatttataat gctggctcag tcaagcactg 1440
aacaaaggta ccttggcttt gggagctaca tgacattgac ttgtaggcag actttttttt 1500
ttctgcccgc caattcccag ataaccaata tggaggctca atattaatta taaatgctcg 1560
gctgatagct caggcttgtt actagctaac tcttccaact taaatgaacc catttctatt 1620
atctacattc tgccacgtga ctttaccttg tacttcctgt ttcctctcct tgtctgactc 1680
tgcccttctg cttcccagag tccttagtct ggttctcctg cctaacctta tcctgcccag 1740
ctgctgacca agcatttata attaatatta agtctcccag tgagactctc atccagggag 1800
gacttgggtg ctcccccctc ctcattgcca tccgtgtctt cctcttccct cgcttccccc 1860
tcctcttcct gctcttcctc ctccacccct cctttcatag tattgatggc aagggtgttc 1920
tagaatggag gagtgcccat aggcatgcaa agaaaccagt taggatgctc tgtgaggggt 1980
tgtaatcata agcgatggac acaattcaag ccacagagtg aagacggaag gatgcactgt 2040
gctctagagc aacttctggg gcagaatcac agggtgagtt tctgacttga gggcgaagag 2100
gccacgagga agggagtgag tttgtctgag ctagaagcta cggcccacct cttggtagca 2160
gacctgccca caagcatgct ttgttaatca tgtgggatct gattttcctc taaatctatg 2220
ttcaactctt aagaaaatgt gaattctcac attaaaattt agatatacgt cttttggtgg 2280
ggggggtgta aaaaatcctc aagaatatgg atttctgggg gccggagaga tggctcagag 2340
gttaagagaa ctggttgctc ttctagacat tctgagttca attcccagca accacatggt 2400
ggctcacaac catctgtaat gcgacctggt gccatcttct gacatgcatg gatacatgca 2460
ggcagaaagc tgtatacata gtaaattgat aaatcttttt ttaaaaagag tatggattct 2520
gccgggtgtt ggtggcgcac gcctttaatc ccagcactct ggaggcagag gcaggtggat 2580
ctctgtgagt tcgagaccag cctggtctat aagagctagt tccaggacag cctccaaagc 2640
cacagagaaa ccctgtctcg aaaaaccaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaga 2700
gtatggattc taagaaagcc gtaacagctg gagctgtgta cggagttcag cgtggtacta 2760
gaagaacaga cattcatgat gaaacacccc aggattttta cttagtatct agtttccatt 2820
gttgttttga gaccggctct tatgctctcc aggctggcct caaactgctg atcttcccgc 2880
ctctacctct caagtcctgg gactacttgg ctcataaaac agtttttgtc gggctccctg 2940
aagttatggt tgtacaaacc gtgggggtca atatactcac ttgggcagag agagaaggtc 3000
tgaatcccag acaatgactg catctcagga cagttgggaa gaggacaatg gcagaaggac 3060
ttagaaaaga tagactggag ggtggaaaag cagcaggaac agagaaacaa aacaggaagc 3120
ttgctatcca gggccactct ggagtcctgt ggcaagatgg aagcgggcta ggggaataca 3180
tttgtgctac tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgat caatgcctat 3240
caatgttgaa ggggaaatat gtataccaca ttgattctgg gagcaattct cagtatctgg 3300
cctagagaaa ggaatggccc ctgcagaata gacagagtga atggtgccct ttatcatttg 3360
ctaaagtgaa ggagaaataa acatccttcc atagagtttc aggtaaatga accccacagt 3420
tcatctgtgc cgtggtggag gcctggccaa cagttaaaaa gattagacac ggacaaagtc 3480
tgaaggaaac acctcgaata ggaagaggag agccacctca ttctgtaact ttcctcaagg 3540
ggaagatgtt ccaagagtgg gaataaatgg tcaaaggggg gatttttaat taggaaaacg 3600
atttcctgta tcacttgtga aactggaggt tgatttgggg cataggacaa tagatttgat 3660
gctttgcaaa aagctgtttc aaagcagaga aatggaatag agacaattat gtagcgagga 3720
gggagggtgg ggcgaagatg gagacagaga agtggaagct gactttaggg aagaggaaca 3780
tagaccacag gggcggggcg gggggcaggg gcggggggcg gggctcaaag gaggcagtgg 3840
gaacgttgct agtgttcgca gcgtaagcgt gaatgtgcaa gcgtctttgt ggtgtgtgac 3900
caggagtagc gtggctggct tgtgtgctgc ttgtaatccc agtctttgag gtttccacac 3960
tgttccacag tgggtgtgat tttccctcgg agagcatgag ggctctgctt tccccacatc 4020
ctccccagcg ttcgttggta tttgtttcca agatgttagt gggtgagaca aagcctctct 4080
gttgatttgc ctttaacagg tgacaaaaaa agctcaacca ggagacattt ttgccttctt 4140
ggaaggtaat gctcccatgt agagcaatgg gacccatctc taaggtgagg ctactcttgc 4200
agtttgcacc cagctcttct gatgcaggaa ggaagttggt gggcaagcaa gactgtttgc 4260
ttcttgcgat ggacacattc tgcacacaaa ggctcaggag gggagaaggc tgtttgatgt 4320
ttagcactca ggaaggcccc tgatgcatct gtgattagct gtctccatct gtggagcaga 4380
cacggactaa ctaaaaacca gtgtttttaa attgtcaagc ctttaaggtg aggaaattga 4440
cttattgtgc tgggccatac gtagagcaag tgctctgcat tgggccaacc cccggctctg 4500
gtttctaggc accagaatgg cctagaacta actcacaatc ctcccattcc aggtctcagg 4560
tgctagaatg aaccactata ccagcctgcc tgcctgccta cctgccttcc taaattttaa 4620
atcatgggga gtaggggaga atacacttat cttagttagg gtttctattg ctgtgaagag 4680
acaccatgag catggcaact cttataaagg aaaacattta gttgggtggc agtttcagag 4740
gttttagtac attgtcatca tggctgggaa catgatggca tgcagacaga catggtgctg 4800
gagaaaggga tgagagtcct acatcttgca ggcaacagga cctcagctga gacactggct 4860
ggtaccctga gcataggaaa cctcacagcc caccctcaca gtgacatatt tccttcaaca 4920
aagccatacc tcctaatagt gccactccct atgagatgac agggccaatt acattcaaac 4980
tgctataaca ctttaaagta ttttattttt attattgtaa attatgtatg tagctgggtg 5040
gtggcagccg aggtgcacgc ctttaatccc agcacttggg aggcagaggc agatggatct 5100
ctgtgagttc aagaccagcc tggtctataa gagctagttg caaggaagga tatacaaaga 5160
acagttctag gatagccttc aaagccacag agaagtgctg tcttgaaaac caaaaattgt 5220
gctgggacct gtctctgctt tggttgcttc ccactccccc agagctggac tcttggtcaa 5280
cactgaatca gctgcaaaat aaactcctgg attcctctct tgtaacagga gcccgaagtc 5340
aggcgcccac ttgtcttctc gcaggattgc catagacttt ttctgtgtgc ccaccattcc 5400
agactgaagt agagatggca gtggcagaga ctgggaaggc tgcaacgaaa acaggaagtt 5460
attgcaccct gggaatagtc tggaaatgaa gcttcaaaac ttgcttcatg ttcagttgta 5520
cacagactca ctcccaggtt gactcacacg tgtaaatatt cctgactatg tctgcactgc 5580
ttttatctga tgcttccttc ccaaaatgcc aagtgtacaa ggtgagggaa tcacccttgg 5640
attcagagcc cagggtcgtc ctccttaacc tggacttgtc tttctccggc agcctctgac 5700
acccctcccc ccattttctc tatcagaagg tctgagcaga gttggggcac gctcatgtcc 5760
tgatacactc cttgtcttcc tgaagatcta acttctgacc cagaaagatg gctaaggtgg 5820
tgaagtgttt gacatgaaga cttggtctta agaactggag caggggaaaa aagtcggatg 5880
tggcagcatg tacccgaaat cccagaactg gggaggtaga gacggatgag tgcccggggc 5940
tagctggctg ctcagccagc ctagctgaat tgccaaattc caactcctat tgaaaaacct 6000
ttaccaaaca aacaaacaaa caaataataa caacaacaac aacaacaaac taccccatac 6060
aaggtgggcg gctcttggct cttgaggaat gactcaccca aacccaaagc ttgccacagc 6120
tgttctctgg cctaaatggg gtgggggtgg ggcagagaca gagacagaga gagacatgac 6180
ttcctgggct gggctgtgtg ctctaggcca ccaggaactt tcctgtcttg ctctctgtct 6240
ggcacagcca gagcaccagc acccagcagg tgcacacacc tccctccgtg cttcttgagc 6300
aaacacaggt gccttggtct gtctattgaa ccggagtaag ttcttgcaga tgtatgcatg 6360
gaaacaacat tgtcctggtt ttatttctac tgttgtgata aaaaccgggg aactccagga 6420
agcagctgag gcagaggcaa atgcaaggaa tgctgcctcc tagcttgctc cccatggctt 6480
gccgggcctg ctttctgcaa gcccttctct ccccattggc atgcctgaca tgaacagcgt 6540
ttgaaatgct ctcaaatgtc actttcaaag aaggcttctc tgatcttgct aactaaatca 6600
gaccatgttt caccgtgcat tatctttctg ctgtctgtct gtctgtctgt ctgtctatct 6660
gtctatcatc tatcaatcat ctatctatct atcttctatt tatctaccta tcattcaatc 6720
atctatcttc taactagtta tcatttattt atttgtttac ttactttttt tatttgagac 6780
agtatttctc tgagtgacag ccttggctgt cctggaaccc attctgtaac caggctgtcc 6840
tcaaactcac agagatccaa ctgcctctgc ctctctggtg ctggggttaa agacgtgcac 6900
caccaacgcc ccgctctatc atctatttat gtacttatta ttcagtcatt atctatcctc 6960
taactatcca tcatctgtct atccatcatc tatctatcta tctatctatc tatctatcta 7020
tctatcatcc atctataatc aattg 7045
<211> 6473
<212> DNA
<213> 灰倉鼠
<400> 3
(SEQ ID NO: 7)
agtgaacaca gatcaatctt ctctaagctg cttgagcctg tgttttcccg ttatacacag 60
gtaattggtg tgctgttaaa agctacttag aataaatgaa gaagaaaggg agaaggaggc 120
agaggagaag gagcaaagaa agaaggaaag ggggagggag ggagaggagg gagggaggga 180
gggagggagg gagaggaggg gagggggaga aagaagagaa ggagagatct tttccccact 240
gactatctca ggaaattacc acaggtggaa gggggtacta attaaggaat agctgtaagt 300
aacattattt ttattcgtag aacctcataa ctcttaagat gtgcttttta cccttttctg 360
ccttttagca caaataaact ccaacatgaa aattatccac tgtgcgtgtg aaaataccta 420
cacagagttc tgaatcattt gccaaattca agccccaatt tttatttcca ttttgactga 480
gagcaagatg ttccttttag gggatggaag cgtctgggtt tcccacactg aatgactcaa 540
ctcgaatgtt gcctcattaa cattctcgat ttttccgtaa tctctgctcc atgcattcaa 600
gataactgtg cctatcacaa atggcttttt agcagctcca ctctttctgg ggatgtggtg 660
gcccttccag tagctgccac cacggattgt cttcaatttc tcacttgttt ttgagttgag 720
tgtcagcctg acccctgggc atggccgcac atgactcagg caaagtgaga gtttcatcac 780
taaacgtggc tctgtttgct atgtctgttt tccctctaag agcaggttat tcaaatacca 840
tctggctgag gtcaagttgc ctcagagccc acagaatctc tacccaggtc cctgttggat 900
ccctaaaaac tcagtcatgc tgtaatctcc ttctgaaact gtgcaatgcc tgcaggctgt 960
cagcccagct ctctccttct gcttcctgtc ctcctaggac cccatgcctc ctcaaacgtc 1020
cacgtgtttc ttgctcctcc accacggttg ccaagccaaa attcgggtgg gcgggaggac 1080
attttcccaa gtgcctgttt cccttctttt ccttttgaca ccccagataa atcatctttc 1140
ccaatccaac acagccccac tgtgtctttg gggacttcat gacatcaccc aggaatgtat 1200
ccttagaaac aaaaatgcaa aacccagaac accaggagac aattaaagaa attttcactg 1260
gtgaggtcac aagtagtaga gacttcttgt taacgggcag aaactttcac ggacccagca 1320
tgctactgtg gcagttctgc aacaagctga aaatgccttt cccgaccacc caagccagtg 1380
ccacacaaag gccaccttag ggtgtgcaca ggatgtcact aggcgttggc ggaactcagg 1440
aaggagtctg aatttcttcc cgtttcttcc ttcctctctc attccctatc ttagcttctg 1500
tctctctttc ctctctctcg ttccccccct tcctccctcc cttcctgttg cagggccaca 1560
gatggaccgg gagacctcaa gcatgtcaaa tcaactaact gctctaccac tcaaccacac 1620
cctcgcctgc attgttacta ctactattat tatcttgata caggtctcca cattgagctc 1680
accctcacag tctccacatt gagctcaccc tcacagtctc cacattgagc tcaccctcac 1740
agtctccaca ttgagctcac cctcacagtc tccacattga gctcaccctc acagtctcca 1800
cattgagctc accctgtggc tctggcaaac cttgaattct ctcattcctc ctgcctcagc 1860
ctctggggtc gtggggatta gccaaaccca cttgaggttt tcttcaatca gcaaattctt 1920
agcgttcaat taacacacac tcataactcc agtactttgg aaaccggaac aggagaattt 1980
ctgtgagctg gaggctagct tggactacag tatgagaccc tgtctctaaa taaatacaca 2040
aagaaatctc accaagggcc tccctctctc agcaagctct aactgtggtg ggagttctgg 2100
gttgttccag ttaacgggct cagaactcta ctgcccagca catcagcccc tagacacagg 2160
tggctctcta catgtgaaca tgcagtcaca gaaatgaaat aaagtgaaaa ttttatttct 2220
tcagttgtat agcctcttcc gtgtgggctg tagttactgt cttgaatagg ataggctcag 2280
aatccttggt gctggaacca agagtttgat tccattagac gacagggaat ataatgccca 2340
atagggcatt cctcctcccg gtcactagcg gtgcactttc tccgaatctt tgtcatgttg 2400
aattagaaaa gttagtattt tcctccatcc cttcccctcc tcccctcctc ccctcctccc 2460
ctcctcccct cctccctccg tctccccgcc cctcccctcc ccctctgatc ctcccccatc 2520
tatcaaatcc aagaattcca gtaaaaagag gaaaacaatc gaagtgattt cgttgattgt 2580
cagttccacc aaagcaagac ttgactttag ttccgcgttt cggttcccgg catgcaccac 2640
agccagcgag caccgtggaa ggatgctagc acggtcctcc ccccgccccc actagctgtc 2700
ttcagctccc cagtagaggg caaccgcact ccagattctc aatggagagt gtttacacaa 2760
tcgttgcggg tttgtgtgag cgcgcccgct tccagagaca cttcttcttt ttcttttttc 2820
catttcatcc cagtggcaac gcagagtgcc agatcattca ggccgtttgc agggcaagcc 2880
gtgggagctt ggcaagcaag gccccatttc ctagggaacc cgtgcctggc gcttcaggaa 2940
agcacgggaa cctggcactg tgactctgcg ggtattattt tgcagaactc tttattaaac 3000
gggagtttca agtccagctg gagacgacca ggcagcgcct ttaaccccag agtcacacac 3060
aggtgccttt tcttggggcc agattggggt tgtgtggcag acctgcgacc agcttgacaa 3120
ctcttctgcc aggccacaaa atggtgttgg ctgtaagagg tgacaccagg gacagggaag 3180
atcgctgcta ttctcctgag ctctccaaag acccacacca gtctgtcccc ctttcctcct 3240
gctcttcccc tgtatcgccc cctcaccatc tcccccaacg agactcttgg catctcctcg 3300
gcacaaggat ttgaaaatag atgcttgggg gtgagaagaa gaagagagaa agagagagaa 3360
ggaaggaagg atatatagat gatacagacg catacaggtg acatgtagct aatcattttt 3420
aattaaaaaa taaattaaaa gcaaatcaag gatatatatg atacccttag agcaagtgtc 3480
tcatacacac acaaacacac acacacaata tatatatata tatatatata tatatatata 3540
tatatatata ttatacttgg aacaagtgtc cagaagggct ggggactcta aagtgcttgt 3600
caaagccagg ctcacatcag taatcttatc acctggtaga ctgagacagg aggattttga 3660
tgagttcagg cccagcctga gctgcagaat gtgattctat cccaaaaaag taaaataaaa 3720
taaaattcaa aatacacgaa aagagtattt gctgaacaaa caagcctaaa gccctggatc 3780
ccttccccca tgtcctaaga aaataagttt cttgaagctg gagggatggc tcagaggtta 3840
agagccccag ctgcacttgc ggaacactaa gacccagttc ccagacccca cactgtgggt 3900
cacaactgtc tcaaacgcca gctccggagg atccatgccc tctcctggcc tccaccggca 3960
ccaagaacac atacagtgcc catacattta tgcaagcaag gtattcacgc acataaaact 4020
aaaagaatat ttaataaaga tataacaaaa tagcatgaag cccagctggt acagaggttc 4080
aaactacatc ccaggttcat ccctctgcct ttgctctcag ttggcttggg taggtctctt 4140
ctctgaactg gcgccctgcg ggttccacat tgagaccctc tcatttttaa acctacttct 4200
tctgggcggg gttaattgct gccagggctc aagccaacgc ttcctcttct ccacagcaat 4260
cttccaagtt tcacgagata accaggaact gctaagttca tgtgaacctt agtgaagaac 4320
ctgagtcttc ccatgtgatt ggtgtgtgca tgtgtgcata cacaaatgta tgtgtgtgct 4380
ctatgtgtgc ctatgtatgt gtgcatgcat gtgtgcatat acaaatgcat atatgtctat 4440
gtagtgtgcg tacacaaatg tatgtgtgtg ctcaatgtgt gcctatgtgt gtgtatgcat 4500
gtgtgcgtac acaatgcatg tgtgtggtgt ctgtgtgcct gtgtgtgtat gcatgtatgc 4560
atacacaaat gtatatgtgt ggtgtgtgaa tgtgtgccta tgtatgtgtg tgctgtgtgt 4620
gggtgtggta tgtgtgtgat gtgtggaggg gtgtgtatgt gtggtatgta taggtgatac 4680
gtttggggtg taatatgcgt atgtggtttg tgaaatgtag ttcgtgtgtg tgcatgtgtg 4740
cgtgcgtgcg tgcgtgcgtg cgtgtgtgtg tgtgtgtgtg tgtgtgtgtt ggatatagta 4800
tgtgtgaggt gtgtgtactc accatggcct ccctcacttg ggggagtgaa gtcagcagcc 4860
tggaccactc agggacatga gatactcaga cacatcttga tttccacccc tcttttcctg 4920
atcctccttc acgtgtcact ttcccaaaca ctggacaaca gtttgggggc atctgattcc 4980
actaatgaca gggacatcac atgtctccag agggaacacc ttctgtgtca catgtcatct 5040
gagaatgtag cagagtcaca gagaaatgtc acagaaacca aaatgcagag taccaaggta 5100
tagctaggca cagagcagag gggaagccgc tgaatttatt aaaaatgtca gaatcgtaaa 5160
agacagggga cagcggtggg gacattcagg gtccagtagc acacaggcag tccaaacctg 5220
atcactggaa ggtagtaggt aaggaaaggc tgcacacaga ttattcacac agtttataca 5280
tgtacacaga ttattcacat ggtttgtgta tgtgcacaga ttattcacac agtttataca 5340
tgtgtggctt cgtggtaact ttgagcttac tttcaattta aaaggatctc tctcacaagc 5400
tggggccggg aatggctgca gtcaacactc catcacttag tcacactgtg caaacagcac 5460
ctcctgactc atggtgactt gtagtaaaat gaagaggcca catttgcatc caagacagct 5520
catcagtacc tagtgaagaa tctgtccctg agtatttgca tgaatggacc cgggtccagg 5580
gcctggctgg gagtctccag gtgttgcagc cagaatgtca ttgtgttttt tcaggatccc 5640
agaagtttct aaaatacagg ccaagtactc atttgtgtta caaagtatct gactaataga 5700
agtgattagg taacacaaag ccttttaaaa accgagatca cccttgtcat gtccctggcc 5760
tcttagaaca agatccaagc ttttgctggt tgacaagtgg ggccatccag tgcgtctccg 5820
ttcctgctac ttcatctgga agacctctcc cactaacttg cccctgaccc ctcacacctg 5880
ctgtttcctt tccacccgga agtgcttgtc taggctttca tggccatctg actgagcatc 5940
taggcctcag tccagtggtc cctcagctct ctctagtcac tgtactaatg gaaacggcca 6000
ctaactacat tttcaatatg gaagcctcct cctcaggaac ctccaagggc agaagcctcc 6060
agagaaccac tcctgacccc ctggagttct gagtgcttct ggccctctct gtgtctgcag 6120
gactattcac cacttgtgtt gaatggttca gtcctcacct cctctggcat gtgctcagtt 6180
ctcatctcat tggggagtcc ttcccaggtc actcttctct cctgtctttg aagtgttttt 6240
ttccttcatg gtatttctgt ctgggcacac acacagacac acatacacac acatacacac 6300
ccatgcagta tggcagatac atcacctatg tttcagattt ttattctacc atcacccaat 6360
acctgaatcc ccgaaaaagc cttagaaagc caggaatttg tgtatttttg tcagcactcc 6420
accccagcac ctgaagccaa gcctgactta atatttttgg ttttgtttct aga 6473
<211> 7045
<212> DNA
<213> 灰倉鼠
<400> 4
(SEQ ID NO: 8)
caattgatta tagatggatg atagatagat agatagatag atagatagat agatagatga 60
tggatagaca gatgatggat agttagagga tagataatga ctgaataata agtacataaa 120
tagatgatag agcggggcgt tggtggtgca cgtctttaac cccagcacca gagaggcaga 180
ggcagttgga tctctgtgag tttgaggaca gcctggttac agaatgggtt ccaggacagc 240
caaggctgtc actcagagaa atactgtctc aaataaaaaa agtaagtaaa caaataaata 300
aatgataact agttagaaga tagatgattg aatgataggt agataaatag aagatagata 360
gatagatgat tgatagatga tagacagata gacagacaga cagacagaca gacagcagaa 420
agataatgca cggtgaaaca tggtctgatt tagttagcaa gatcagagaa gccttctttg 480
aaagtgacat ttgagagcat ttcaaacgct gttcatgtca ggcatgccaa tggggagaga 540
agggcttgca gaaagcaggc ccggcaagcc atggggagca agctaggagg cagcattcct 600
tgcatttgcc tctgcctcag ctgcttcctg gagttccccg gtttttatca caacagtaga 660
aataaaacca ggacaatgtt gtttccatgc atacatctgc aagaacttac tccggttcaa 720
tagacagacc aaggcacctg tgtttgctca agaagcacgg agggaggtgt gtgcacctgc 780
tgggtgctgg tgctctggct gtgccagaca gagagcaaga caggaaagtt cctggtggcc 840
tagagcacac agcccagccc aggaagtcat gtctctctct gtctctgtct ctgccccacc 900
cccaccccat ttaggccaga gaacagctgt ggcaagcttt gggtttgggt gagtcattcc 960
tcaagagcca agagccgccc accttgtatg gggtagtttg ttgttgttgt tgttgttatt 1020
atttgtttgt ttgtttgttt ggtaaaggtt tttcaatagg agttggaatt tggcaattca 1080
gctaggctgg ctgagcagcc agctagcccc gggcactcat ccgtctctac ctccccagtt 1140
ctgggatttc gggtacatgc tgccacatcc gacttttttc ccctgctcca gttcttaaga 1200
ccaagtcttc atgtcaaaca cttcaccacc ttagccatct ttctgggtca gaagttagat 1260
cttcaggaag acaaggagtg tatcaggaca tgagcgtgcc ccaactctgc tcagaccttc 1320
tgatagagaa aatgggggga ggggtgtcag aggctgccgg agaaagacaa gtccaggtta 1380
aggaggacga ccctgggctc tgaatccaag ggtgattccc tcaccttgta cacttggcat 1440
tttgggaagg aagcatcaga taaaagcagt gcagacatag tcaggaatat ttacacgtgt 1500
gagtcaacct gggagtgagt ctgtgtacaa ctgaacatga agcaagtttt gaagcttcat 1560
ttccagacta ttcccagggt gcaataactt cctgttttcg ttgcagcctt cccagtctct 1620
gccactgcca tctctacttc agtctggaat ggtgggcaca cagaaaaagt ctatggcaat 1680
cctgcgagaa gacaagtggg cgcctgactt cgggctcctg ttacaagaga ggaatccagg 1740
agtttatttt gcagctgatt cagtgttgac caagagtcca gctctggggg agtgggaagc 1800
aaccaaagca gagacaggtc ccagcacaat ttttggtttt caagacagca cttctctgtg 1860
gctttgaagg ctatcctaga actgttcttt gtatatcctt ccttgcaact agctcttata 1920
gaccaggctg gtcttgaact cacagagatc catctgcctc tgcctcccaa gtgctgggat 1980
taaaggcgtg cacctcggct gccaccaccc agctacatac ataatttaca ataataaaaa 2040
taaaatactt taaagtgtta tagcagtttg aatgtaattg gccctgtcat ctcataggga 2100
gtggcactat taggaggtat ggctttgttg aaggaaatat gtcactgtga gggtgggctg 2160
tgaggtttcc tatgctcagg gtaccagcca gtgtctcagc tgaggtcctg ttgcctgcaa 2220
gatgtaggac tctcatccct ttctccagca ccatgtctgt ctgcatgcca tcatgttccc 2280
agccatgatg acaatgtact aaaacctctg aaactgccac ccaactaaat gttttccttt 2340
ataagagttg ccatgctcat ggtgtctctt cacagcaata gaaaccctaa ctaagataag 2400
tgtattctcc cctactcccc atgatttaaa atttaggaag gcaggtaggc aggcaggcag 2460
gctggtatag tggttcattc tagcacctga gacctggaat gggaggattg tgagttagtt 2520
ctaggccatt ctggtgccta gaaaccagag ccgggggttg gcccaatgca gagcacttgc 2580
tctacgtatg gcccagcaca ataagtcaat ttcctcacct taaaggcttg acaatttaaa 2640
aacactggtt tttagttagt ccgtgtctgc tccacagatg gagacagcta atcacagatg 2700
catcaggggc cttcctgagt gctaaacatc aaacagcctt ctcccctcct gagcctttgt 2760
gtgcagaatg tgtccatcgc aagaagcaaa cagtcttgct tgcccaccaa cttccttcct 2820
gcatcagaag agctgggtgc aaactgcaag agtagcctca ccttagagat gggtcccatt 2880
gctctacatg ggagcattac cttccaagaa ggcaaaaatg tctcctggtt gagctttttt 2940
tgtcacctgt taaaggcaaa tcaacagaga ggctttgtct cacccactaa catcttggaa 3000
acaaatacca acgaacgctg gggaggatgt ggggaaagca gagccctcat gctctccgag 3060
ggaaaatcac acccactgtg gaacagtgtg gaaacctcaa agactgggat tacaagcagc 3120
acacaagcca gccacgctac tcctggtcac acaccacaaa gacgcttgca cattcacgct 3180
tacgctgcga acactagcaa cgttcccact gcctcctttg agccccgccc cccgcccctg 3240
ccccccgccc cgcccctgtg gtctatgttc ctcttcccta aagtcagctt ccacttctct 3300
gtctccatct tcgccccacc ctccctcctc gctacataat tgtctctatt ccatttctct 3360
gctttgaaac agctttttgc aaagcatcaa atctattgtc ctatgcccca aatcaacctc 3420
cagtttcaca agtgatacag gaaatcgttt tcctaattaa aaatcccccc tttgaccatt 3480
tattcccact cttggaacat cttccccttg aggaaagtta cagaatgagg tggctctcct 3540
cttcctattc gaggtgtttc cttcagactt tgtccgtgtc taatcttttt aactgttggc 3600
caggcctcca ccacggcaca gatgaactgt ggggttcatt tacctgaaac tctatggaag 3660
gatgtttatt tctccttcac tttagcaaat gataaagggc accattcact ctgtctattc 3720
tgcaggggcc attcctttct ctaggccaga tactgagaat tgctcccaga atcaatgtgg 3780
tatacatatt tccccttcaa cattgatagg cattgatcac acacacacac acacacacac 3840
acacacacac acacagtagc acaaatgtat tcccctagcc cgcttccatc ttgccacagg 3900
actccagagt ggccctggat agcaagcttc ctgttttgtt tctctgttcc tgctgctttt 3960
ccaccctcca gtctatcttt tctaagtcct tctgccattg tcctcttccc aactgtcctg 4020
agatgcagtc attgtctggg attcagacct tctctctctg cccaagtgag tatattgacc 4080
cccacggttt gtacaaccat aacttcaggg agcccgacaa aaactgtttt atgagccaag 4140
tagtcccagg acttgagagg tagaggcggg aagatcagca gtttgaggcc agcctggaga 4200
gcataagagc cggtctcaaa acaacaatgg aaactagata ctaagtaaaa atcctggggt 4260
gtttcatcat gaatgtctgt tcttctagta ccacgctgaa ctccgtacac agctccagct 4320
gttacggctt tcttagaatc catactcttt tttttttttt tttttttttt ttttttttgg 4380
tttttcgaga cagggtttct ctgtggcttt ggaggctgtc ctggaactag ctcttataga 4440
ccaggctggt ctcgaactca cagagatcca cctgcctctg cctccagagt gctgggatta 4500
aaggcgtgcg ccaccaacac ccggcagaat ccatactctt tttaaaaaaa gatttatcaa 4560
tttactatgt atacagcttt ctgcctgcat gtatccatgc atgtcagaag atggcaccag 4620
gtcgcattac agatggttgt gagccaccat gtggttgctg ggaattgaac tcagaatgtc 4680
tagaagagca accagttctc ttaacctctg agccatctct ccggccccca gaaatccata 4740
ttcttgagga ttttttacac cccccccacc aaaagacgta tatctaaatt ttaatgtgag 4800
aattcacatt ttcttaagag ttgaacatag atttagagga aaatcagatc ccacatgatt 4860
aacaaagcat gcttgtgggc aggtctgcta ccaagaggtg ggccgtagct tctagctcag 4920
acaaactcac tcccttcctc gtggcctctt cgccctcaag tcagaaactc accctgtgat 4980
tctgccccag aagttgctct agagcacagt gcatccttcc gtcttcactc tgtggcttga 5040
attgtgtcca tcgcttatga ttacaacccc tcacagagca tcctaactgg tttctttgca 5100
tgcctatggg cactcctcca ttctagaaca cccttgccat caatactatg aaaggagggg 5160
tggaggagga agagcaggaa gaggaggggg aagcgaggga agaggaagac acggatggca 5220
atgaggaggg gggagcaccc aagtcctccc tggatgagag tctcactggg agacttaata 5280
ttaattataa atgcttggtc agcagctggg caggataagg ttaggcagga gaaccagact 5340
aaggactctg ggaagcagaa gggcagagtc agacaaggag aggaaacagg aagtacaagg 5400
taaagtcacg tggcagaatg tagataatag aaatgggttc atttaagttg gaagagttag 5460
ctagtaacaa gcctgagcta tcagccgagc atttataatt aatattgagc ctccatattg 5520
gttatctggg aattggcggg cagaaaaaaa aaagtctgcc tacaagtcaa tgtcatgtag 5580
ctcccaaagc caaggtacct ttgttcagtg cttgactgag ccagcattat aaattttctc 5640
cagatgtacc gaatcacatt tcatagcaac atgcagacat caagttttcc ctgaagctct 5700
aaccagctgg ttgcatgctg tccggagtct cagctataac ccagaagtga cctgggtcgg 5760
ggaagaggtg gtactttgcc ttctttgcac tctctgtgtt gcctcaccca ttcagcttca 5820
agcaatgtga ctgcctgacc ctgagggcgt ttacaacgcc tgacccacag accacaagtc 5880
aaccagctgg tgtgctcacg atacctagtc tgaaccatag ccctgctccc accctgcctc 5940
catctccacc ctttcttcac tgctcatcac agctggctag caaagactgc ctcagacctg 6000
agcacaggct ccactccaca gccgtgactg ttcgagccac ttaaatcaaa gagcgcttgt 6060
cttccgctca gtaaatctct cctcagctca ctgatgacgt tgactttctc tagacagcac 6120
atttgggttt aagacactgc tacttgagct cttcattcag ttcctcagaa tacctcattt 6180
gggtcagatt cccaaagagg aagatagggt tcctggcaga cagacatgtc tcattccttt 6240
gaaatccttc agagaaatgc agtgactatg gcaccttctt aaaaagcaca cacacaaata 6300
acacacacac acacacacac acacacacac acacacacac atatccccct cactgtcatc 6360
cttgatatgt atatgatata tataaaatca ttgttttata ctgtgataat tgattatgaa 6420
taaaatttac taaaatgaac aattaaaatt atgggggggg ctggagagat ggctcatcag 6480
ttaagagaac agttgctgct cttgcagaac acgagagttc agttcccagc acccacatca 6540
ggcagctcat aaccatgtgt ggtgtcagtt ccaggagatc tggtgccctc ttctggcctc 6600
ctccagcacc tgctacatgt ggttcacaca cacacacaca cacacacaca cacacacaca 6660
cacacacaca caaataaata taaagattat ttttttcaaa actgagttaa aaataggttc 6720
tatctgattc atactaaggc ttttcacagt ggttaagtct attagatatg tctagccata 6780
tcctttctcc cttctttctt gaggagaggc ttttaaagct acaagttaca gccttctttg 6840
caaataagag taccatttaa caggcctctg accaatgaga tgccagaatc ggttgcccag 6900
gagcttccca aacagtccat tatagggaaa ggtggtacaa accagtagat taggcatgtt 6960
ccacttccta agtgccgtgc caaataagga aatggcctca aatgtttgcc ttttatcttc 7020
acccacctct gaattgcacg ctagt 7045
<211> 13515
<212> DNA
<213> 灰倉鼠
<400> 5
(SEQ ID NO:9)
tctagaaaca aaaccaaaaa tattaagtca ggcttggctt caggtgctgg ggtggagtgc 60
tgacaaaaat acacaaattc ctggctttct aaggcttttt cggggattca ggtattgggt 120
gatggtagaa taaaaatctg aaacataggt gatgtatctg ccatactgca tgggtgtgta 180
tgtgtgtgta tgtgtgtctg tgtgtgtgcc cagacagaaa taccatgaag gaaaaaaaca 240
cttcaaagac aggagagaag agtgacctgg gaaggactcc ccaatgagat gagaactgag 300
cacatgccag aggaggtgag gactgaacca ttcaacacaa gtggtgaata gtcctgcaga 360
cacagagagg gccagaagca ctcagaactc cagggggtca ggagtggttc tctggaggct 420
tctgcccttg gaggttcctg aggaggaggc ttccatattg aaaatgtagt tagtggccgt 480
ttccattagt acagtgacta gagagagctg agggaccact ggactgaggc ctagatgctc 540
agtcagatgg ccatgaaagc ctagacaagc acttccgggt ggaaaggaaa cagcaggtgt 600
gaggggtcag gggcaagtta gtgggagagg tcttccagat gaagtagcag gaacggagac 660
gcactggatg gccccacttg tcaaccagca aaagcttgga tcttgttcta agaggccagg 720
gacatgacaa gggtgatctc ggtttttaaa aggctttgtg ttacctaatc acttctatta 780
gtcagatact ttgtaacaca aatgagtact tggcctgtat tttagaaact tctgggatcc 840
tgaaaaaaca caatgacatt ctggctgcaa cacctggaga ctcccagcca ggccctggac 900
ccgggtccat tcatgcaaat actcagggac agattcttca ctaggtactg atgagctgtc 960
ttggatgcaa atgtggcctc ttcattttac tacaagtcac catgagtcag gaggtgctgt 1020
ttgcacagtg tgactaagtg atggagtgtt gactgcagcc attcccggcc ccagcttgtg 1080
agagagatcc ttttaaattg aaagtaagct caaagttacc acgaagccac acatgtataa 1140
actgtgtgaa taatctgtgc acatacacaa accatgtgaa taatctgtgt acatgtataa 1200
actgtgtgaa taatctgtgt gcagcctttc cttacctact accttccagt gatcaggttt 1260
ggactgcctg tgtgctactg gaccctgaat gtccccaccg ctgtcccctg tcttttacga 1320
ttctgacatt tttaataaat tcagcggctt cccctctgct ctgtgcctag ctataccttg 1380
gtactctgca ttttggtttc tgtgacattt ctctgtgact ctgctacatt ctcagatgac 1440
atgtgacaca gaaggtgttc cctctggaga catgtgatgt ccctgtcatt agtggaatca 1500
gatgccccca aactgttgtc cagtgtttgg gaaagtgaca cgtgaaggag gatcaggaaa 1560
agaggggtgg aaatcaagat gtgtctgagt atctcatgtc cctgagtggt ccaggctgct 1620
gacttcactc ccccaagtga gggaggccat ggtgagtaca cacacctcac acatactata 1680
tccaacacac acacacacac acacacacac acgcacgcac gcacgcacgc acgcacacat 1740
gcacacacac gaactacatt tcacaaacca catacgcata ttacacccca aacgtatcac 1800
ctatacatac cacacataca cacccctcca cacatcacac acataccaca cccacacaca 1860
gcacacacat acataggcac acattcacac accacacata tacatttgtg tatgcataca 1920
tgcatacaca cacaggcaca cagacaccac acacatgcat tgtgtacgca cacatgcata 1980
cacacacata ggcacacatt gagcacacac atacatttgt gtacgcacac tacatagaca 2040
tatatgcatt tgtatatgca cacatgcatg cacacataca taggcacaca tagagcacac 2100
acatacattt gtgtatgcac acatgcacac accaatcaca tgggaagact caggttcttc 2160
actaaggttc acatgaactt agcagttcct ggttatctcg tgaaacttgg aagattgctg 2220
tggagaagag gaagcgttgg cttgagccct ggcagcaatt aaccccgccc agaagaagta 2280
ggtttaaaaa tgagagggtc tcaatgtgga acccgcaggg cgccagttca gagaagagac 2340
ctacccaagc caactgagag caaaggcaga gggatgaacc tgggatgtag tttgaacctc 2400
tgtaccagct gggcttcatg ctattttgtt atatctttat taaatattct tttagtttta 2460
tgtgcgtgaa taccttgctt gcataaatgt atgggcactg tatgtgttct tggtgccggt 2520
ggaggccagg agagggcatg gatcctccgg agctggcgtt tgagacagtt gtgacccaca 2580
gtgtggggtc tgggaactgg gtcttagtgt tccgcaagtg cagctggggc tcttaacctc 2640
tgagccatcc ctccagcttc aagaaactta ttttcttagg acatggggga agggatccag 2700
ggctttaggc ttgtttgttc agcaaatact cttttcgtgt attttgaatt ttattttatt 2760
ttactttttt gggatagaat cacattctgc agctcaggct gggcctgaac tcatcaaaat 2820
cctcctgtct cagtctacca ggtgataaga ttactgatgt gagcctggct ttgacaagca 2880
ctttagagtc cccagccctt ctggacactt gttccaagta taatatatat atatatatat 2940
atatatatat atatatatat atatattgtg tgtgtgtgtt tgtgtgtgta tgagacactt 3000
gctctaaggg tatcatatat atccttgatt tgcttttaat ttatttttta attaaaaatg 3060
attagctaca tgtcacctgt atgcgtctgt atcatctata tatccttcct tccttctctc 3120
tctttctctc ttcttcttct cacccccaag catctatttt caaatccttg tgccgaggag 3180
atgccaagag tctcgttggg ggagatggtg agggggcgat acaggggaag agcaggagga 3240
aagggggaca gactggtgtg ggtctttgga gagctcagga gaatagcagc gatcttccct 3300
gtccctggtg tcacctctta cagccaacac cattttgtgg cctggcagaa gagttgtcaa 3360
gctggtcgca ggtctgccac acaaccccaa tctggcccca agaaaaggca cctgtgtgtg 3420
actctggggt taaaggcgct gcctggtcgt ctccagctgg acttgaaact cccgtttaat 3480
aaagagttct gcaaaataat acccgcagag tcacagtgcc aggttcccgt gctttcctga 3540
agcgccaggc acgggttccc taggaaatgg ggccttgctt gccaagctcc cacggcttgc 3600
cctgcaaacg gcctgaatga tctggcactc tgcgttgcca ctgggatgaa atggaaaaaa 3660
gaaaaagaag aagtgtctct ggaagcgggc gcgctcacac aaacccgcaa cgattgtgta 3720
aacactctcc attgagaatc tggagtgcgg ttgccctcta ctggggagct gaagacagct 3780
agtgggggcg gggggaggac cgtgctagca tccttccacg gtgctcgctg gctgtggtgc 3840
atgccgggaa ccgaaacgcg gaactaaagt caagtcttgc tttggtggaa ctgacaatca 3900
acgaaatcac ttcgattgtt ttcctctttt tactggaatt cttggatttg atagatgggg 3960
gaggatcaga gggggagggg aggggcgggg agacggaggg aggaggggag gaggggagga 4020
ggggaggagg ggaggagggg aagggatgga ggaaaatact aacttttcta attcaacatg 4080
acaaagattc ggagaaagtg caccgctagt gaccgggagg aggaatgccc tattgggcat 4140
tatattccct gtcgtctaat ggaatcaaac tcttggttcc agcaccaagg attctgagcc 4200
tatcctattc aagacagtaa ctacagccca cacggaagag gctatacaac tgaagaaata 4260
aaattttcac tttatttcat ttctgtgact gcatgttcac atgtagagag ccacctgtgt 4320
ctaggggctg atgtgctggg cagtagagtt ctgagcccgt taactggaac aacccagaac 4380
tcccaccaca gttagagctt gctgagagag ggaggccctt ggtgagattt ctttgtgtat 4440
ttatttagag acagggtctc atactgtagt ccaagctagc ctccagctca cagaaattct 4500
cctgttccgg tttccaaagt actggagtta tgagtgtgtg ttaattgaac gctaagaatt 4560
tgctgattga agaaaacctc aagtgggttt ggctaatccc cacgacccca gaggctgagg 4620
caggaggaat gagagaattc aaggtttgcc agagccacag ggtgagctca atgtggagac 4680
tgtgagggtg agctcaatgt ggagactgtg agggtgagct caatgtggag actgtgaggg 4740
tgagctcaat gtggagactg tgagggtgag ctcaatgtgg agactgtgag ggtgagctca 4800
atgtggagac ctgtatcaag ataataatag tagtagtaac aatgcaggcg agggtgtggt 4860
tgagtggtag agcagttagt tgatttgaca tgcttgaggt ctcccggtcc atctgtggcc 4920
ctgcaacagg aagggaggga ggaagggggg gaacgagaga gaggaaagag agacagaagc 4980
taagataggg aatgagagag gaaggaagaa acgggaagaa attcagactc cttcctgagt 5040
tccgccaacg cctagtgaca tcctgtgcac accctaaggt ggcctttgtg tggcactggc 5100
ttgggtggtc gggaaaggca ttttcagctt gttgcagaac tgccacagta gcatgctggg 5160
tccgtgaaag tttctgcccg ttaacaagaa gtctctacta cttgtgacct caccagtgaa 5220
aatttcttta attgtctcct ggtgttctgg gttttgcatt tttgtttcta aggatacatt 5280
cctgggtgat gtcatgaagt ccccaaagac acagtggggc tgtgttggat tgggaaagat 5340
gatttatctg gggtgtcaaa aggaaaagaa gggaaacagg cacttgggaa aatgtcctcc 5400
cgcccacccg aattttggct tggcaaccgt ggtggaggag caagaaacac gtggacgttt 5460
gaggaggcat ggggtcctag gaggacagga agcagaagga gagagctggg ctgacagcct 5520
gcaggcattg cacagtttca gaaggagatt acagcatgac tgagttttta gggatccaac 5580
agggacctgg gtagagattc tgtgggctct gaggcaactt gacctcagcc agatggtatt 5640
tgaataacct gctcttagag ggaaaacaga catagcaaac agagccacgt ttagtgatga 5700
aactctcact ttgcctgagt catgtgcggc catgcccagg ggtcaggctg acactcaact 5760
caaaaacaag tgagaaattg aagacaatcc gtggtggcag ctactggaag ggccaccaca 5820
tccccagaaa gagtggagct gctaaaaagc catttgtgat aggcacagtt atcttgaatg 5880
catggagcag agattacgga aaaatcgaga atgttaatga ggcaacattc gagttgagtc 5940
attcagtgtg ggaaacccag acgcttccat cccctaaaag gaacatcttg ctctcagtca 6000
aaatggaaat aaaaattggg gcttgaattt ggcaaatgat tcagaactct gtgtaggtat 6060
tttcacacgc acagtggata attttcatgt tggagtttat ttgtgctaaa aggcagaaaa 6120
gggtaaaaag cacatcttaa gagttatgag gttctacgaa taaaaataat gttacttaca 6180
gctattcctt aattagtacc cccttccacc tgtggtaatt tcctgagata gtcagtgggg 6240
aaaagatctc tccttctctt ctttctcccc ctcccctcct ctccctccct ccctccctcc 6300
ctccctcctc tccctccctc cccctttcct tctttctttg ctccttctcc tctgcctcct 6360
tctccctttc ttcttcattt attctaagta gcttttaaca gcacaccaat tacctgtgta 6420
taacgggaaa acacaggctc aagcagctta gagaagattg atctgtgttc actagcgtgc 6480
aattcagagg tgggtgaaga taaaaggcaa acatttgagg ccatttcctt atttggcacg 6540
gcacttagga agtggaacat gcctaatcta ctggtttgta ccacctttcc ctataatgga 6600
ctgtttggga agctcctggg caaccgattc tggcatctca ttggtcagag gcctgttaaa 6660
tggtactctt atttgcaaag aaggctgtaa cttgtagctt taaaagcctc tcctcaagaa 6720
agaagggaga aaggatatgg ctagacatat ctaatagact taaccactgt gaaaagcctt 6780
agtatgaatc agatagaacc tatttttaac tcagttttga aaaaaataat ctttatattt 6840
atttgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gaaccacatg 6900
tagcaggtgc tggaggaggc cagaagaggg caccagatct cctggaactg acaccacaca 6960
tggttatgag ctgcctgatg tgggtgctgg gaactgaact ctcgtgttct gcaagagcag 7020
caactgttct cttaactgat gagccatctc tccagccccc cccataattt taattgttca 7080
ttttagtaaa ttttattcat aatcaattat cacagtataa aacaatgatt ttatatatat 7140
catatacata tcaaggatga cagtgagggg gatatgtgtg tgtgtgtgtg tgtgtgtgtg 7200
tgtgtgtgtg tgtgttattt gtgtgtgtgc tttttaagaa ggtgccatag tcactgcatt 7260
tctctgaagg atttcaaagg aatgagacat gtctgtctgc caggaaccct atcttcctct 7320
ttgggaatct gacccaaatg aggtattctg aggaactgaa tgaagagctc aagtagcagt 7380
gtcttaaacc caaatgtgct gtctagagaa agtcaacgtc atcagtgagc tgaggagaga 7440
tttactgagc ggaagacaag cgctctttga tttaagtggc tcgaacagtc acggctgtgg 7500
agtggagcct gtgctcaggt ctgaggcagt ctttgctagc cagctgtgat gagcagtgaa 7560
gaaagggtgg agatggaggc agggtgggag cagggctatg gttcagacta ggtatcgtga 7620
gcacaccagc tggttgactt gtggtctgtg ggtcaggcgt tgtaaacgcc ctcagggtca 7680
ggcagtcaca ttgcttgaag ctgaatgggt gaggcaacac agagagtgca aagaaggcaa 7740
agtaccacct cttccccgac ccaggtcact tctgggttat agctgagact ccggacagca 7800
tgcaaccagc tggttagagc ttcagggaaa acttgatgtc tgcatgttgc tatgaaatgt 7860
gattcggtac atctggagaa aatttataat gctggctcag tcaagcactg aacaaaggta 7920
ccttggcttt gggagctaca tgacattgac ttgtaggcag actttttttt ttctgcccgc 7980
caattcccag ataaccaata tggaggctca atattaatta taaatgctcg gctgatagct 8040
caggcttgtt actagctaac tcttccaact taaatgaacc catttctatt atctacattc 8100
tgccacgtga ctttaccttg tacttcctgt ttcctctcct tgtctgactc tgcccttctg 8160
cttcccagag tccttagtct ggttctcctg cctaacctta tcctgcccag ctgctgacca 8220
agcatttata attaatatta agtctcccag tgagactctc atccagggag gacttgggtg 8280
ctcccccctc ctcattgcca tccgtgtctt cctcttccct cgcttccccc tcctcttcct 8340
gctcttcctc ctccacccct cctttcatag tattgatggc aagggtgttc tagaatggag 8400
gagtgcccat aggcatgcaa agaaaccagt taggatgctc tgtgaggggt tgtaatcata 8460
agcgatggac acaattcaag ccacagagtg aagacggaag gatgcactgt gctctagagc 8520
aacttctggg gcagaatcac agggtgagtt tctgacttga gggcgaagag gccacgagga 8580
agggagtgag tttgtctgag ctagaagcta cggcccacct cttggtagca gacctgccca 8640
caagcatgct ttgttaatca tgtgggatct gattttcctc taaatctatg ttcaactctt 8700
aagaaaatgt gaattctcac attaaaattt agatatacgt cttttggtgg ggggggtgta 8760
aaaaatcctc aagaatatgg atttctgggg gccggagaga tggctcagag gttaagagaa 8820
ctggttgctc ttctagacat tctgagttca attcccagca accacatggt ggctcacaac 8880
catctgtaat gcgacctggt gccatcttct gacatgcatg gatacatgca ggcagaaagc 8940
tgtatacata gtaaattgat aaatcttttt ttaaaaagag tatggattct gccgggtgtt 9000
ggtggcgcac gcctttaatc ccagcactct ggaggcagag gcaggtggat ctctgtgagt 9060
tcgagaccag cctggtctat aagagctagt tccaggacag cctccaaagc cacagagaaa 9120
ccctgtctcg aaaaaccaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaga gtatggattc 9180
taagaaagcc gtaacagctg gagctgtgta cggagttcag cgtggtacta gaagaacaga 9240
cattcatgat gaaacacccc aggattttta cttagtatct agtttccatt gttgttttga 9300
gaccggctct tatgctctcc aggctggcct caaactgctg atcttcccgc ctctacctct 9360
caagtcctgg gactacttgg ctcataaaac agtttttgtc gggctccctg aagttatggt 9420
tgtacaaacc gtgggggtca atatactcac ttgggcagag agagaaggtc tgaatcccag 9480
acaatgactg catctcagga cagttgggaa gaggacaatg gcagaaggac ttagaaaaga 9540
tagactggag ggtggaaaag cagcaggaac agagaaacaa aacaggaagc ttgctatcca 9600
gggccactct ggagtcctgt ggcaagatgg aagcgggcta ggggaataca tttgtgctac 9660
tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgat caatgcctat caatgttgaa 9720
ggggaaatat gtataccaca ttgattctgg gagcaattct cagtatctgg cctagagaaa 9780
ggaatggccc ctgcagaata gacagagtga atggtgccct ttatcatttg ctaaagtgaa 9840
ggagaaataa acatccttcc atagagtttc aggtaaatga accccacagt tcatctgtgc 9900
cgtggtggag gcctggccaa cagttaaaaa gattagacac ggacaaagtc tgaaggaaac 9960
acctcgaata ggaagaggag agccacctca ttctgtaact ttcctcaagg ggaagatgtt 10020
ccaagagtgg gaataaatgg tcaaaggggg gatttttaat taggaaaacg atttcctgta 10080
tcacttgtga aactggaggt tgatttgggg cataggacaa tagatttgat gctttgcaaa 10140
aagctgtttc aaagcagaga aatggaatag agacaattat gtagcgagga gggagggtgg 10200
ggcgaagatg gagacagaga agtggaagct gactttaggg aagaggaaca tagaccacag 10260
gggcggggcg gggggcaggg gcggggggcg gggctcaaag gaggcagtgg gaacgttgct 10320
agtgttcgca gcgtaagcgt gaatgtgcaa gcgtctttgt ggtgtgtgac caggagtagc 10380
gtggctggct tgtgtgctgc ttgtaatccc agtctttgag gtttccacac tgttccacag 10440
tgggtgtgat tttccctcgg agagcatgag ggctctgctt tccccacatc ctccccagcg 10500
ttcgttggta tttgtttcca agatgttagt gggtgagaca aagcctctct gttgatttgc 10560
ctttaacagg tgacaaaaaa agctcaacca ggagacattt ttgccttctt ggaaggtaat 10620
gctcccatgt agagcaatgg gacccatctc taaggtgagg ctactcttgc agtttgcacc 10680
cagctcttct gatgcaggaa ggaagttggt gggcaagcaa gactgtttgc ttcttgcgat 10740
ggacacattc tgcacacaaa ggctcaggag gggagaaggc tgtttgatgt ttagcactca 10800
ggaaggcccc tgatgcatct gtgattagct gtctccatct gtggagcaga cacggactaa 10860
ctaaaaacca gtgtttttaa attgtcaagc ctttaaggtg aggaaattga cttattgtgc 10920
tgggccatac gtagagcaag tgctctgcat tgggccaacc cccggctctg gtttctaggc 10980
accagaatgg cctagaacta actcacaatc ctcccattcc aggtctcagg tgctagaatg 11040
aaccactata ccagcctgcc tgcctgccta cctgccttcc taaattttaa atcatgggga 11100
gtaggggaga atacacttat cttagttagg gtttctattg ctgtgaagag acaccatgag 11160
catggcaact cttataaagg aaaacattta gttgggtggc agtttcagag gttttagtac 11220
attgtcatca tggctgggaa catgatggca tgcagacaga catggtgctg gagaaaggga 11280
tgagagtcct acatcttgca ggcaacagga cctcagctga gacactggct ggtaccctga 11340
gcataggaaa cctcacagcc caccctcaca gtgacatatt tccttcaaca aagccatacc 11400
tcctaatagt gccactccct atgagatgac agggccaatt acattcaaac tgctataaca 11460
ctttaaagta ttttattttt attattgtaa attatgtatg tagctgggtg gtggcagccg 11520
aggtgcacgc ctttaatccc agcacttggg aggcagaggc agatggatct ctgtgagttc 11580
aagaccagcc tggtctataa gagctagttg caaggaagga tatacaaaga acagttctag 11640
gatagccttc aaagccacag agaagtgctg tcttgaaaac caaaaattgt gctgggacct 11700
gtctctgctt tggttgcttc ccactccccc agagctggac tcttggtcaa cactgaatca 11760
gctgcaaaat aaactcctgg attcctctct tgtaacagga gcccgaagtc aggcgcccac 11820
ttgtcttctc gcaggattgc catagacttt ttctgtgtgc ccaccattcc agactgaagt 11880
agagatggca gtggcagaga ctgggaaggc tgcaacgaaa acaggaagtt attgcaccct 11940
gggaatagtc tggaaatgaa gcttcaaaac ttgcttcatg ttcagttgta cacagactca 12000
ctcccaggtt gactcacacg tgtaaatatt cctgactatg tctgcactgc ttttatctga 12060
tgcttccttc ccaaaatgcc aagtgtacaa ggtgagggaa tcacccttgg attcagagcc 12120
cagggtcgtc ctccttaacc tggacttgtc tttctccggc agcctctgac acccctcccc 12180
ccattttctc tatcagaagg tctgagcaga gttggggcac gctcatgtcc tgatacactc 12240
cttgtcttcc tgaagatcta acttctgacc cagaaagatg gctaaggtgg tgaagtgttt 12300
gacatgaaga cttggtctta agaactggag caggggaaaa aagtcggatg tggcagcatg 12360
tacccgaaat cccagaactg gggaggtaga gacggatgag tgcccggggc tagctggctg 12420
ctcagccagc ctagctgaat tgccaaattc caactcctat tgaaaaacct ttaccaaaca 12480
aacaaacaaa caaataataa caacaacaac aacaacaaac taccccatac aaggtgggcg 12540
gctcttggct cttgaggaat gactcaccca aacccaaagc ttgccacagc tgttctctgg 12600
cctaaatggg gtgggggtgg ggcagagaca gagacagaga gagacatgac ttcctgggct 12660
gggctgtgtg ctctaggcca ccaggaactt tcctgtcttg ctctctgtct ggcacagcca 12720
gagcaccagc acccagcagg tgcacacacc tccctccgtg cttcttgagc aaacacaggt 12780
gccttggtct gtctattgaa ccggagtaag ttcttgcaga tgtatgcatg gaaacaacat 12840
tgtcctggtt ttatttctac tgttgtgata aaaaccgggg aactccagga agcagctgag 12900
gcagaggcaa atgcaaggaa tgctgcctcc tagcttgctc cccatggctt gccgggcctg 12960
ctttctgcaa gcccttctct ccccattggc atgcctgaca tgaacagcgt ttgaaatgct 13020
ctcaaatgtc actttcaaag aaggcttctc tgatcttgct aactaaatca gaccatgttt 13080
caccgtgcat tatctttctg ctgtctgtct gtctgtctgt ctgtctatct gtctatcatc 13140
tatcaatcat ctatctatct atcttctatt tatctaccta tcattcaatc atctatcttc 13200
taactagtta tcatttattt atttgtttac ttactttttt tatttgagac agtatttctc 13260
tgagtgacag ccttggctgt cctggaaccc attctgtaac caggctgtcc tcaaactcac 13320
agagatccaa ctgcctctgc ctctctggtg ctggggttaa agacgtgcac caccaacgcc 13380
ccgctctatc atctatttat gtacttatta ttcagtcatt atctatcctc taactatcca 13440
tcatctgtct atccatcatc tatctatcta tctatctatc tatctatcta tctatcatcc 13500
atctataatc aattg 13515
<211> 14553
<212> DNA
<213> 小家鼠
<400> 6
(SEQ ID NO:10 )
cttgaagaac acatgttttc caagagggag cacccatgtt ggaatgacaa tgtagttagt 60
gctcctctcc tgtaggttag tgctcctttg ctataggtaa gtgctcctct cctataggtc 120
agtgctcctc tcctataggt tagtgctcct ctcctatagg ttagtgctcc tctcctacag 180
gttagtgctc ctctgctcta ggttagtcct gctctcctat agtacctaga gagctagggc 240
aaatgggcta ggcccgaagt gcagagacaa acagctatgg aagactgggt aagcacttcc 300
aagctacgaa agagcagtgt gaagggtcag ggcttgtgca gttagtaggg gagatcttcc 360
agttgaagaa acagaagaac tgagagccac tgggtatcat cctcctgcgc catgccttcc 420
tggatactgc catgctccca ccttgatgat aatggaatga acctctgaac ctgtaagcca 480
gccccaatga aatattgttt ttatgagagt tgccttggtc atgctgtctg ttcacagcag 540
taaaacccta aataaggcag aagttggtac cagtattgct gtgatagacc tgaccatgct 600
ttcctttgaa agaatgtgga tttggtgact ttggatttgc aacacagtgg aatgctttaa 660
atggagatta atgggtcatc aattcctagt aggaatatgg aagactttgt tgctgggagt 720
atttgaactg tgttgacctg gcctaagaga tttcaaagga gaagaatttc agaatgtggc 780
ataaagacag tttttgtggt attttggtga agaatgtggc tactttttgc ccttgtctga 840
aaagtctgcc tgagactaaa gtgaagagaa tcagattaat tgcattgaca agggaagttt 900
gtggctgcgc tatctggaaa cttacagcca gcctcttgga cctcgggtga cttacgcaaa 960
tactcaggga cagagatgct tgactctgta ctgatgagtt gtcttggatg caaatatggg 1020
ctcttcattt gactacatgt cacgatgagt caggagctgc tctctccaga gtgtgacaaa 1080
gcgaggggat gctgacggta gctgttctag ctttgaaggt aagcctgcac ttatgctaaa 1140
gtcacacata cacgagccgg gtggagaacc tgtctgtgtg gagacacctt tcattacctg 1200
tggcatccag cctctcaagc ttggactgcc tgtgtgctcc tggactctgg aggtcccact 1260
gctctgtcct ctgctgctta tgatactgac attttaaaag aatccagtgg ttcccccctg 1320
tactcggtgt ctacttctac ctggatgttc ctcatttatg ttctgtgaca cttctctgtg 1380
actctgctgc attcctgggt gacatgtgga caccctgtcc ctttgcagac catgatgtca 1440
ctgtcactag tggaatcaga tgccccaagt gttgtcctgt gtttgggaac gtgacaggca 1500
gtacagaagc agaagaggaa gggtgaaaac ggaaatgtca cagcagcatc tgatgtgtgc 1560
ctcagtcacg catgctgctg attggaacta ctcagcatga gagagggcca tggtgaatac 1620
acaaccctat acacactgtg tccatttctc tctctctctt acacagagag agagggagga 1680
gggggagggg gaggcggagg gggaggggga gggagaggga gtgggagagg gagagggaga 1740
gggagaggga gagggagagg gagagggaga gggagagttt aatgtctgtg aagagatacc 1800
atgaccaaag caactcttat aaaggacaac atttaattgg ggctggctta caggttcaga 1860
aattcagtcc attctcacca tggtgggaag catgcaggta gatgtggtgc tggaggaacc 1920
aagagttcta tatcctgatc tgaaggcagc caggagaaga ctgcctcttc tgcacagggc 1980
agagcttgag catagaacat caaagccctt ccccacactt cctccaacaa ggtcatacat 2040
acttcaacaa agacacacct cctaacggtg ccactccctg tggaccaacc atttaaacgc 2100
atgagtctat gagggtcaaa gctcttcaaa ccaccacact catgtacaca cacacacaca 2160
cacacacaca ctctcataca cacacacaca cacactcaca cacacacaca cacacacaca 2220
cacacacaca ccacacacac acacacacac agagttctat tttgcactgt ttcactgtca 2280
caaggttcta cttatctcag acacactgcc aggaattgtg tgggaagact ttcagtttct 2340
ttgggttcac atggacttag cagttcttgg tgatcctgaa agatttctgc agaaagaagc 2400
caaagtgttg agcccaaggc ctggccacac attagtcctg tctagatgaa caggggttta 2460
aaaataaggg ggcatcaagg tgaagccagc aggggctgac ttagagagga gacccaccca 2520
agccaactgc tcgaagtcaa aagcgatgaa tccccatatc cagctgtgcc cggtgctgtc 2580
ttgctacatc tttagtaaat gttcttttag ttgtatgcgt atgaatattt tgcttgcata 2640
tatttgtgta caccataggt gttcctaggg cctatggagg ccagaagagg gcatcagatc 2700
ctttggaact ggaattatag acacttgtta cccatagagt agattgtggg aaatgagcct 2760
ttagtcttcg agagcggcca gtgctcttaa cctttggtcg tttctccagg tctttgagac 2820
tttattttct tggacatcag gacaggatcc agggctttga gcttgtttct tcagccagct 2880
ttcttttcat gtatattaaa ttttatgtta ttttgctttc tttttcccca agacagaatc 2940
acactctata tagctcaggc tgggtttgaa ttcagtttcc ctgtctcagt ctaccgggta 3000
atatgattac agatgtgagt ctgactttgg tatcaaagtc cccagccctt ctggatatgt 3060
gttttaagga tatcagatat atccttgatt tgctttgaat tttcttttta gttacaacat 3120
aattagttcc gtgtcacctg aatatgtgta tgtcacctac atagtcttcc ttcttctctt 3180
cttccctctc ccaccttccc aggtacctgt ctgtcttcat atccttgtgc tgagagtctt 3240
gttgagggag atgatgaccg agacagagcc actggggaag ggagatgggc tagtgcaggt 3300
cttcagagag gagctcgtga atattgtagc ccctttagtc cctggcatgt cctcttgtat 3360
agccaccgcc atgctgtggc ctggcagaag tgaataagtt gtccagctgt tgacaggcct 3420
gccctccaga cccagtctga tcccaagaaa gggcatctgt gtctgtctct gaggccgtaa 3480
gtgctgcctg gttgtctcca gcttgacttg acactccctc cttaataaga gtaccacaga 3540
acagggtctg cagagtccct gggccaggtc cctgtgctgt cctggaatgc caggcgtgaa 3600
tttcctgtga agtaggactt tgctcgccaa gctcccacgg cttgcccttc agatagccag 3660
aattatctgg taccctgcat tgccgttcaa tacgcagagt atcactggaa gcgcgcgcgc 3720
gcacacacac acacacacac acacacacac acacacacac acacgcccac tccatcttta 3780
aaccccaccc cccagcaacg gcggtgtaaa cactctccat caggaagctg aaacgcagtt 3840
gccctctgct ggggagatga aggcagcttg ctgggggcga ggaccgtgct agcaaccttc 3900
cctggtgcac acgggctctg gtgcatgacg ggaacggaaa cgcggaacta aagtcagtcc 3960
tgcttttttt tttttttttt tttttttttt tttttttttt tttttttttt ggcgttggtg 4020
gtggactgag tgacaatcag tgaaatcact taggttgttt ttctcttctt cgttgggttt 4080
gatagacggt gggagagggt cagaggagaa ggggagggat ggggagagag ggaggaggga 4140
ggggcgggag gcggggggcg aggaaaacgt gctaacttct ccaatcctac aagacaaagg 4200
tttggagaaa gccgcactga gtgacccagc agaaggaatc caggaatgtc cgctggaatc 4260
tgactgttga ttccagcgcc atgcagagaa tctaggctgg taggaacatt ctttgtccta 4320
tccgacataa taactccaac caacacggaa aagaaaggct atacaagtga agaaatggca 4380
ttttcacttt catgactata caatcacttc caggtagtaa cacgtgtcta gcacagcggt 4440
tctcaacctg ggggtcacga tcccccactt ttctgcatat cagacatttt tacgttgtta 4500
ttcataacag tagcaaaatt gcagctatga agtaacaatg aaatgcattt atggtgcgtg 4560
tgtgtgtgtg tgggggggta tcaccttaac atttactgta agaaggttga gaatactgct 4620
ccagcagcta gtgtgttgga cttaggttct gggtatatta ttagcaatag ccaaccagaa 4680
tccccaccca ccacagcatt gaggccccat gcagggcttg ctgggagagg cactgataag 4740
acttctttat gtatttattt agagacgaat actcattagg taggccaagc tagcgtcaaa 4800
ctcatggcaa ttctcctcct ccagtttcct aagtactgga ctcaggagtg tgttgccatc 4860
atatacagta aggatttatt gactgaagaa aatctcaagt ggctttggtt aatccctact 4920
acgccagagg ctgaggcagg aggcgcgcaa ggtcaaggct tgcctgggct acatatagag 4980
tgagctcaat tttgacactt ggtgcggtgt tagtagtaat agtaaagatg aaggtgtggc 5040
tcaggtgggg ccggtgattg gacacacttg gggtctcctg gtccatctgc agctgtgcaa 5100
caggaagagc ggagaatgag aggaaagaga gaaaagacag aatgagagag agggaggaag 5160
agagaaaaag gaaaagagag aggaaaggaa aaaggaaaat gaggaaagcg agaaagaaga 5220
aatgagaaag aggaaaggga gaaagaaatg agagagagaa aagaaaagac agaatgcgag 5280
agagggagga agagagaaaa aggaaaagag agaggaaagg aaaaaggaaa atgaggaaag 5340
cgagaaagaa gaaatgagaa agaggaaagg gagaaagaaa tgagagagag aaaagaaaag 5400
acagaatgcg agagagggag gaagagagaa aaaggaaaag agagaggaag ggaaaaagga 5460
aaatgaggaa agcgagaaag aagaaatgag aaagaggaaa gggagaaaga aatgagagag 5520
agaaaagaaa agacagaatg cgagagaggg aggaagagag aaaaaggaaa agagagagga 5580
agggaaaaag gaaaatgagg aaagcgagaa agaagaaatg agaaagagga aagggagaaa 5640
gaaatgagag agagaaaaga aaagacagaa tgcgagagag ggaggaagag agaaaaagga 5700
aaagagagag gaagggaaaa tggaaaatga ggaaagcgag aaagaagaaa tgagaaagag 5760
gaaagggaga aagaaatgag cgagataaaa gacagaattt gagagaggga ggaagaaata 5820
ggaaaagaga ggaaaggatg gagaaaagag agaaagaaag agagatgaaa gagagaaagg 5880
agaaatgaaa tgagagagag agagagacac aaagagccag agagagaaga aaaaagggga 5940
aagagaaaga gaaagaggaa ggctcctctt ggacacatct tcctttatct ttccctgggg 6000
accgccaaag cctggtggca tactgtacat tctgtacact gttcattcaa aacaggctct 6060
gtcttaaaga tggtctgagc ggtcagaaaa gggtattgtt aacttgtttg caaaactgcc 6120
tcaggagagt gctgagtgcg tgaaagttgc tgcccgttaa ggagaagtct ctactacttg 6180
tgatctcacc atcgaaaatt tctttaattg tctcctggtg ttctgggttt tgcagttttg 6240
tttctaagga tacattcttg ggtgatgtca caaagtcccc aaagacacgg tggagctgtg 6300
ttagatgggg aaagacagtc tgctgaggat ttatctggaa ctgtcagaag gaaaagaagg 6360
taaatggggc acttgggaaa gtggcctcta gtttgacttc tggcttagca aaggttgtgg 6420
ggagataagg catacacagt agttagcagg aggcaacagg gtcctgggag gacgcgaggc 6480
agaaggagag gctgggctga cagcatgcaa tcattgcata gtctccaaag gagattgcaa 6540
catggctgag ttttcagagg tcctacagag cccgtggtag agattctgtg ggttctgaga 6600
caacttgact ttagccagat ggtatttgag taatctggga gagagaaaac agctacagca 6660
aacagggcca catttagtga cgaaactctc actttgactg ttgagtcatt tgcagtgggc 6720
cctgaggtca ggctggccct cagctcaaaa acaagcgagg aactgaagca attactcaga 6780
taatccacag ccacagccac tggaaagggc cacatcccca gagacagcac agcaggggtg 6840
ggggtggggc tatgagaaag ttagtgattg tagcagttat ctagaatgtg cggagcagag 6900
gaggttacac aaaaacctag aatgtcattc aatgtgggaa accgagaggc tcccaagccc 6960
taaaaggaac agtttgcttt cagccaaaat ggaaataaaa tttggggctt aaatctggca 7020
aatgattcag accttctgtg taggtgtctt taaatgcaca gcagattgat tttcatgttg 7080
gagtttattt gaactaaaag acagaaatgg tgaaaagcac acctgaagaa attgagatgc 7140
tatgaataaa atcatttact tacagctatc acttaattag tacctccttc caccttgctg 7200
atttattggg ctagtcaagg aagaaaagat cttccctcct ccttctctcc tcctccccct 7260
cctctcctcc tcccctcccc tccttgacct tcctctcctc cttttccctc ctccccctct 7320
tcttctcttc accccctcct cccctcccct cctctgtact cctccccttt cctcccaatc 7380
tcttttttct cccccttctt ctctttctcc cccctcctct tccctcctct tcctccctcc 7440
ctccctcctc ctcctcatcc tcctcttcct cttcatcctc ttctccttcc tccctctcct 7500
cctcctcctt ttccagccct acctaccttc cctttcttct tcatttattc aaagtagctt 7560
tgaacagcac tactcggttt agttgtgtat aaaaggaaaa tgcaggtcca agcagcttgg 7620
ggaagattgc tttttgctct ctggaggcag atgatgacag ttcaagatca ttccttttgc 7680
tccatgtcac aggaaggggg acatgccgaa tctaccagtt tgcagccacc tacacaggat 7740
ccaccttcac ttctaaggaa atgtttggga agctacctac caaccacttc tggcatctca 7800
tgggctagag gactcttaaa tggcactctt atttgtttaa taaaggaggt tgtgacgtgt 7860
agttttaaat cccttccaca caacaattgc tactctctga ccaaaaaaga agggagacag 7920
gatacggcta ggtgtctagt agactttacc actttgaaaa gccttaatat aaatcaggta 7980
gatacatctt tttaacttat tcttgtaaag acaaaaacaa aactttattt ttatttgtgt 8040
gtatgcttgt gtgtgtgtgc ctgtgtgtat accacatgtc gctggtgccg gagaacacca 8100
gaagagggga cctgatctcc tggagctaaa gctatccatg gttctgagct gcctgatgtg 8160
ggtgctggga acagaactct ggtcttctgc aagagcaaca agcctcctct taactacgaa 8220
tctcctcccc atccccccaa atacatttaa ttattcattt tagcagcttt atttcgtaac 8280
tacttatcac agcataaaac aaggatttta tatatattac atgcaatcga ggataagagt 8340
tgaggggaga tgcgtgtgct ccttctgggt gtctgtgctt ttgaagaatg taagcagtgc 8400
acaagggacc gaggcgtgcc tgtctgccag gagctgtctt cttcccttgg actctgagct 8460
gagtgcagtg ctccgaagaa gtaaaagacg acctcatgaa gcaatgtctt caacccaaac 8520
atgctgtcca gacaaagtcc agcttcatta gtgctctgag gagagactta ctgagcctca 8580
ggaaagcccc cctcagcatg gcgaaagtcc actttgattg aagtgactcg aaagccatgg 8640
cagtgcggcg gcggccgcgt ggagcttgtg ctcgagtcgg aagcggcatc tttgtcaggc 8700
ggctgtgatt agcacgggga ggcaggactg gagtgaagga agagttgggg gcggggctta 8760
gcgctctggt ctcctaagct gtagtcagcg cctcaagatt tgtaacctgc cttctgcctt 8820
cccagccagg cagtcaagtg gctccaagct gaagactgca aagtgcccct aaccttttgg 8880
ttatagcgag gctgaagaca ccgtgctctt tcatgaaagc cggatgtctg aaatccgatt 8940
tgataaatat ggataaaacg tataacgctc gatcaatcga atcgaaggag ctcacgattg 9000
gcaccacggc tttggggaca acagagtact gactcgttgg gaggacttgg atacttcccc 9060
tcctcttcca tctcttcccc tttcctcact tcctcctcct tccttctcca ttttctccct 9120
cttcactgtt tcttactatt tttacaaaag attttattta tttatttatt tatttattta 9180
tttatttatt tatttattta tttatttaat gtatgcgagt acactgtagc tgtcttcaga 9240
cacaccagaa gagggcgtca agttccatta gagatggttt cgagccacca tgtggttgct 9300
ggggcctctg gaaggaccgc cagtgctctt aacccctgag ccatttctcc agtacccttc 9360
tcaccgtttc tcttcaatct tcttcctctt ccttctccac tttccttgtc ttcttggttt 9420
cattatcttt ctccctttct tcctcttctc cccttcttcc tcctccactg tagttttcct 9480
tccctactct tttcctgcct ccctcctcct cccctctcat tccccctcct ctttcctcct 9540
tctccctcct cctccttcct tctccctctc ccctctcccc tctcccttct cccttctccc 9600
cctcctcttc ctctttctcc ttctccaccc ctcctgtcac agtatcaatg gcaagggtgt 9660
tctagaatgg aggagtgtcc cctaggcact aacgaaagcc agttaggatg ctctgagacg 9720
ggtacaattc agggagggcc gtggggatgg aagggttgtg ctgcgattca ttctggagca 9780
acccccaggc agaatcatga ggttggttcc ggattcgcag ggcacaattc agaagaggaa 9840
ggtttcagga aggacgagtt tgtctgagat aggagttaca tctgatgtct tggcagcaga 9900
gccactgtac aagcgtgctt tattaaccac gtgggattaa atcttctttt aaatttattt 9960
tcaactctta aggaaacgtg aactttcaca ttcaaattta gacttgcagc tcttatgggg 10020
aaaaaaaggg gatcttaaga atattaagca taggcggctg gagagatggc tcagcggtta 10080
agagcactct ctgctctccc agaggtcctg agttcaattc ctagcaacca cataatagtt 10140
aacaacagtc tttaatgaat tctaatgccc tcttctggtg tgtctgaaga cagttacagt 10200
gtactcatat aaataaaata aagaaattta aaaaaatgaa tattaggcat agattcctgg 10260
atcctaagaa agccatcaga gctggagcca tgtgtgggat cctgcttggt gctggagggg 10320
cagagttcat gcccccgggg tttttactta ttatcacatt ttcatcgttg ttttgaaaca 10380
gggtcttgtg tggtccaggc tggccttgaa ctcatctttc agcctctacc tcacaggttc 10440
tgggattact tggttcctaa aagtatctcc gtcaagctcc ctggtgttat ggctgtgcca 10500
accaggaggg tctatacact cgctcaggta gagggagaag atccgaatct ctgacaggga 10560
ctgctgcctc tcggggcaaa tggagtgaag gacagcggca gaaggattta ggaaagatgg 10620
acgggagagt ggaaatgctg cagaagccag aaaacaaagc aggaagcctg ctgtccagtg 10680
gggctcaaga gcggagggat gcgagggggc tgcgcaggaa catttagcgt ctgcgtctat 10740
gggggtaggg gcggggtgcc agcacctagt cacctgaagg ggaaatgctt gcccagggag 10800
caggtctcag tagctgacct agagaaagga gcggccccta cagaggagac acgggtcact 10860
gtttgttaaa gtgaaggaga aataaatatt ctttcaaaga atcttaggtg agcccagttc 10920
atctgcgctg tggaggcctg gggaacagtt aaaaagaccc tgacacacac ccaaggcaaa 10980
caagcaacac acggctcctt ccgtaagggt ccatgattct ctgaagaatc agccccggaa 11040
tcagccccgg aatcaggtag tccgtaaaca caatgagtgt tttactctgc agaagtccag 11100
cctgctggcg tctcccatta ccaaaataga gggatagtca cgtgagctca ccggctcgat 11160
ttaaggcacg tggttttcca gggtagatga gctttggctt ctggaaccat tatggggcac 11220
gaaggatgga gccaggattt tttttttttt tttttttttc tattagcaat tgatttgctt 11280
gggcttggct ggacttgccc agttcttagg cccagtcttc ttaactgccg atctgaagtc 11340
tgtcatggag tcagcctagc cttctcactt cccttcagct cgaataggaa gaggaggtgc 11400
acaccagatg gtctgagagc agggataaat ggtgtgcctt tgtctttcag tatttcgtta 11460
ttttaagtag gaagatgctt ttctgtatta cattgcttgt gaaaccggaa gttgattcgg 11520
ggcacaggac aatggatttg gtgttttgca aggactgttt cagaagagag aggagtggaa 11580
gggtggttag agtgaggagt ggggtgggac gggatggggg aagagaagga agggccagac 11640
aggctaggta gggctgagag gaggcggtgg gaacttcttg agttagcgca gcagtaaact 11700
tggatgtgcg tgtatctttg tgatatatga cccggagccg tgtagctggc tccgatagta 11760
ctgctaatgt cagtgtcggg gggggggggt cccatactgt tccacagggg ctgcacattc 11820
ccatcgagag caggagggct cctctctcca tacatcctcg ccagcattcc ttgttgtttc 11880
tgtgatgaca gggggtggga tgaaatctct ctgttggttt gagagaccgt gaagaagctc 11940
aaccccagga cattttgcag tcttggaagg cagtgcctcc atgtggagcc gtggagccca 12000
tctctgagtc caggtcactc ttgcagttcg cactcagctc ttcagatgca ggagagacgt 12060
tggtgggaaa gcaagattgt ttgcttgttg agatagacac attctccaca caaaggctca 12120
cgtggggcaa aggctgattg acgtacagcg ttcaggaacg cctgtggtag agctatgatt 12180
agctgtctcc atctatgaag cagacaaaga gttataaaaa aaatcaatgt tttcaaattg 12240
tcaaactttt aacccgacag caagcgctct gtccctgggc taatccctag ccctggtttc 12300
ttgagatggg gtcttttgtg cactagactg gcctagaact cacgatctta gtgttccagc 12360
ctcccagctg ctgggatgag ccgctataac cagtctgcct gccttcctaa attttaagtg 12420
atgggaagtg ggggagaata cagtttaaag tatgcagatc tgagagcagg aacctggcaa 12480
agccaagggg ccggagttac aggcggctaa catgggtgct gggaactgac ccaggtcctt 12540
gagaggagca gtgtgtactc ttgaccaaac aggtccgtct ctccagtccc cgtagtatta 12600
aaaataggta ctacgggcat ggtggtgcac acctttaatc ccagcactag ggaggcagag 12660
gcaggtggat ttctgagttt gaggccagcc tggtctacaa aatgagttcc aggacagcca 12720
cggctataca gagaaaccct gtcttgaaaa caaaacaaca acaaaatagg tactacaaag 12780
cgatgtaatt gtgctcaaac atgcaaaccg aggggactgt atgcataaga aagagaaaga 12840
cggccacact ggttctatct gggtgacagg aaatcagtat ttttattttt cacattcatt 12900
tttttgttgt tgttgttgac acagtgattt ttctatcaaa aacattattt cttttatagt 12960
tcccctgagg agctgttttt aaagccgtgc tttgaaaaac cattgaagga gcagaggcag 13020
ggagactcct gtgtggcagt cggtgaagca ggccctctgc aggcaggctg gccctggact 13080
tgggagtctc tttccctccc tcctgtgctc aaatagcaaa tgtcaggctt caatgtagct 13140
agaaggttct agaatgatta agtttccaag gctgaagagc ttccctgttt gcctttcact 13200
tccctggaga ggtcgttgtg tgttccggag tctgcaaggt gcctttggtg atgcgggtgg 13260
ttcatctcgg gagattccgc ctggaggacc caagttcaag ccctgcctga gctacagagt 13320
gactttcagg tcttctgcgc aattcagtga gacccagtct acaaataaaa agtaaaaaga 13380
aggctgtgga tggaactcgg tggtagagtt ctgggtttac tccctagagg aggggagaag 13440
gaggaggagg gaggaggaag aggaagaaag aagaagagaa gggaagagga gaaggaaggg 13500
agggaagggg ctgacaagaa gagagaagag ggagggaggg gagggaaagg aaggggaaag 13560
gaagggaggg aaggggctga caagaagaga gaagagggag ggaggggagg gaaaggaagg 13620
ggaaagaaga gaagggtaag aagaaactgt tccaatggtc tgggccacag agtgatggcc 13680
ttttgtggtg atcagctgta atccttgatt tgacacaacc tagaatctgg gaagcgagtt 13740
tctgtgaagg agcattcaca ctggctggcc tgtgggcgtg catgtgggag actgtcataa 13800
ttaggttcat taatacagga agtcccagcc cactacaaat ggcttcgttc catacccaag 13860
agatgctaac tgtagacggt tggagaaagc aagcaagctg tggatacccc acgctctttc 13920
acctcggctc ctggggggtg ggtgcactgt gtctcttggt attttaaagt cctgccttga 13980
cgtccctgct gtgacagact gtaactggaa ttgtgagctt tagtccttta gttttctacg 14040
ttggtttttc tcaggatatt ttatcgcagt aacagaaaca agaccaggac acttgatctc 14100
ctctgatcaa cactgaagag ttacaaaaca ggctgaggaa acaaactttc ttctccctct 14160
cccccttctg tccctcccct tccttctcgc tccctccctt gccccctctc tccctgtctc 14220
tgtctctgtc tctgtctctg tctctgtctc tgtctctgcc tctcccctcc cctcccctcc 14280
ctctgtctct gtctctgtct ctgtctctgt ctctgtctct gtctctgtcc ctttctcctc 14340
tatctcctaa atggctggag gccatgctag ctcaatgttg aactttgaac acgtatttag 14400
gaaatctttg ttcttaacag ttctgaagtg ctgaagtggt ggtttagtct ctcggcctga 14460
caagctcact tcctctcact ctgtcttaat gaccaaatct gccatttccc taaaacagca 14520
caggctccag ctccaggttg ctccggagcg gag 14553
實例 12 - CHO 穩定位點 2 序列 - 美國專利第 9,816,110 號<211> 4001
<212> DNA
<213> 灰倉鼠
<400> 1
(SEQ ID NO:11 )
ccaagatgcc catcaactga ttaatagatg ataaaattat tgtacatttc agtgtaatat 60
tattcagttt ttaagaaaaa tgaaattatg taataagcat gtaaatggat atatcttgaa 120
acaaccattc cccattatat tacctaaaca ttgaaagtcc aaaatcatat gatcttttta 180
gtggatctac taatcttttg ctatatgtat tttattgaac tacccatgga tgtgagataa 240
ttggtaacaa cagcacatgg gagagcatgg gatcattcaa ggaagattag agagaatgca 300
ttttttagga gataatggag gagcaataga aaggattaaa tgaggttact gatgaaagtg 360
atggttagag aaggcaatat gaggagggat aactagcact tagggccttt tgaaaaagac 420
atagagaaaa tactattgta gaaacttcct ataattggtg tatagttata tacaccaaag 480
agctcagatg gagttaccct ataatggaaa tattaactac tttttatcac tgtgataaaa 540
catcctgaac agagcaacat agattgggaa gcatttactt tggcttacag ttctaacggg 600
ataaaaattc atgatgaaag aatgaatatg tcagcaaaca gcagtagcaa tggcctgaga 660
agcaggtgag agctcacatc ttgaagtgta agaatgtagc agagagaaca aactgcaaat 720
gaccagaaaa tgcttttgga tcagagccca tacccctctg actgacttct ccagaaattc 780
tgaacaaata aaactcccca aacagagcca taactgaagg tccagtgtct gagactacta 840
ggggtatttc ttattcaaac cactacaatg gggtgggggg agcaatcctc caagtaggca 900
ctacacacag acaaataaaa actctagtaa ctggaatgga ttgacttatt tgaattactt 960
gccagtggag ctacatagag cacaattatt gtatttaaat taccctttat gatcttacaa 1020
aacttgacag taagatcata ttgctaaaga aaccacatat ttgaatcagg gaacatggtg 1080
atatctagtt gttcttcaac tggaaacttc atgctttctg cccagcattc atgttgctgg 1140
aaagagcaat gtacactacc agtgtagaaa ttaaatcatc aatcttatca agatgtggat 1200
cctataagtt acaataaaaa ttagcctgat aagatatccc caccagaaga atattcacat 1260
aaatgctatg ggagcaacaa gctattttct aaattagctt taatcctatt ctacaagaga 1320
gaatccatat ctagaatagt tatagggatc aagaacccat ggcttgattg gtcataggcc 1380
caatgggaga tcctaatatt attgttctac aaaatgaaaa taactcctaa tgacttgttg 1440
ctgcagtaat aagttagtat gttgctcaac tctcacaaga gaagttttgt cttacaataa 1500
atggcaatta aagcagcccc acaagattta tatcataccg atctcctcat ggcctatgca 1560
tctagaagct aggaaacaaa gaggacccta agagagacat acatggtccc cctggagaag 1620
gggaaggggg caagacctcc aaagctaatt gggagcatgg gggaggggag agggagttag 1680
aagaaagaga aggggataaa aggagggaga ggaggacaag agagagaagg aagatctagt 1740
caagagaaga tagaggagag caagaaaaga gataccatag tagagggagc cttgtatgtt 1800
taaatagaaa actggcacta gggaattgtc caaagatcca caaggtccaa ctaataatct 1860
aagcaatagt cgagaggcta ccttaaaagc ctttctctga taatgagatt gatgactacc 1920
ttatatacca tcctagagcc ttcatccagt agctgatgga agcagaagca gacatctaca 1980
gctaaacact gagctagttg cagacaggga ggagtgatga gcaaagtcaa gaccaggctg 2040
gagaaacaca cagaaacagc agacctgaaa aaaatgttgc acatggaccc cagactgata 2100
gctgggagtc cagcatagga cttttctaga aaccctgaat gaggatatca gtttggaggt 2160
ctggttaatc tatggggaca ctggtagtgg atcaatattt atccctagtt catgactgga 2220
atttgggtac ccattccaca tggaggaatt ctctgtcagc ctagacacat gggggaggtt 2280
ctaggtcctg ctccaaataa tgtgttagac tttgaagaac tcccttgaga agactcaccc 2340
tccctgggga gcagaaaggg gatgggatga gggttggtga gggacaggag aggaggggag 2400
ggtgagggaa ctgggattga caagtaaatg atgcttgttt ctaatttaaa tgaataaagg 2460
aaaagtaaaa gaagaaaaga aaacaggcca aaagattata aaagacagag gtggtgggtg 2520
actataaaga aacactatta tctaaataaa aacatgtcag aagcacacat gaacttatag 2580
tgtttatgaa agtatgtata ataactacat aatctcaagc caagaaaaaa atatcatctt 2640
tcagtgatga aggtgatttt atttctccca gaattaaagc caaagaccta atgaaagtaa 2700
ttatcttcaa aaggttgaaa atacatactt tgcaatacac agatctgcct agaaatctca 2760
tgttcacaat acacatgatg ctcaattgaa ttccattcaa tgttacagtt tagataaaca 2820
gtttgtagat aaactcacaa tgtatcattt ctttttattt tttgaccaaa cagcttctca 2880
tctgttattc agaataattc ctcgatggca ggatatccat cccaattggg ggaaggggag 2940
aatttgaaga aaacctagac cacatacata tttgccattg ggaaacaaag tctaaaatga 3000
tgttgttcac atcttctcta ctagtcctct ccccgtccca aagaaccttg gtatatgtgc 3060
ctcattttac agagagagga aagcaggaac tgagcatccc ttacttgcca tcctcaaccc 3120
aaaatttgca tcattgctca gctctgccct tctcatatga cagttacaag tcaaggcttc 3180
caaagtccct ctgtcatgtt tggtgtcaat agtttataca gatgacttca tgtcttcata 3240
tctaatgtct tatatagatt aatattaaac aatgttattt ctctaaccac attttaaatt 3300
aatttaaaaa tccattaatt gtgtctataa aatgcagaca gagtgctgag acacaatata 3360
agcctgatga tctgaatttg aaactcacac ccaccacatg gagaatcaac ttccaaaaat 3420
tttcctatta cttccacact tacaccattg tacaaacaca ataataatga acaaaatgaa 3480
atgaaataaa aaattaagtc tctgtaggta atgctactgt gcagcaaaag taaaaatggc 3540
agcttaagct tgctttatgg ttacacttta ccatcttcca ttaattataa ggacttcaat 3600
catggcagaa ctatgctgtt attgtctcag tgtaacctaa ccaggtgttc cagatgttct 3660
taatgtggac acctaaacta tttgatattt gggttaagat ctttccctct ttcagaagaa 3720
acctcaggac agagggaatc ttgtctttta attttgagtc tgtagacttt ttccatttca 3780
aatatacatg aaacaagtga tgaagaaaat taatcaaaag gtgggaattg caatgatatt 3840
aggttcaata ttaagcttca atattatcat ggaatcgcct gttatacact gagtgtttgg 3900
caataaggga tttttagaag aaggagtttt tattctcaac aggttcctta agtttagctc 3960
aaataaatct aagcaatcca ctctagaatt aaatagtttc c 4001
<211> 14931
<212> DNA
<213> 灰倉鼠
<220>
<221> misc_feature
<222> (2176)..(2239)
<223> n為a、c、g、t或核苷酸缺失
<400> 4
(SEQ ID NO:12 )
catgtacact tatgcaagta tgatatggcc caacacagta ttttacacca atttttatct 60
ataaaatata catgtacatc aaaatatatt attaataata acatcattat tctttctttc 120
caagtaataa acacatacac tgaaattttg gttcttgtgg ataattttaa tgaaacagga 180
aatgcaaatt tatcttagca tgtttacttc actttctttg catagataac cagtaatcac 240
attgatggat catgtagtga aatgtatttt taggtatcta aggaattttg gcttcgtttt 300
gtgcttgttg acactgaatt ctattcctaa caacagtgtg taaggattct gtctgatttc 360
ttttaccagt atttgtccat ttgcattttc tttattattc atggctgctg ttctagaaag 420
tggaaggtag tgtgtcaagt ctgtttaaca tgtttccctg atgatcagtg tcttaacacc 480
tctctgagta catgttggcc aatgtcgttt ctagacccat ctattcttgc ttgacttatc 540
ctggtacatg cctgccaaga aatttctcct catcctttct gtctcttcac tgatttactt 600
gatgtgtgga tttcacattg atcatatgga aatagaagat acaattttct ttattcacag 660
tttggaagac tttcaatctc atagatcatc attatttttt gctactgttc cctatgctat 720
ggtgaaattt ccatttgaat aattgcttaa acaattaaca agaaagaatc tatttttact 780
tgcaataact tccatttcag aacatttact acactgttac tatatccaaa aactagtttt 840
atatatcatg tgagaaatga ctaattcata atttggccat gacatttttt tcagaaacag 900
aaaaagtgac caatacatac acaatgctat aaatattaag acttcagcaa attaaatatt 960
tattcatgat atcacataaa attcatttat tatgttttat ttaaatgtgt ttttaaaaca 1020
gtggtatcac taaatattaa gttagatgtg tttatgtgct taatgaattt atattttaga 1080
atgttataag ttgtatatag tcaaatatgt aataaatttt attttttagg tctttctcat 1140
taaggtattt taattttggg tcccttttcc agagtgactc tagctcatga tgagttgaca 1200
taaaaactaa acagtacaaa atgtacattg cattcagtat tgcacttgat ctttgcactg 1260
aagtttgagt cagttcatac atttagtact tgggaagtac attaagctaa ctttcattgc 1320
tctggcaaaa tgctcgataa gataagagtc tattgtggaa agccatggca gcaggaaagt 1380
aagactgctg atgatgttta atccatagtc aagacgcaga aggagatgaa tgctggtatc 1440
caacattttt tgctgttcat tttctctaga accctagtcc ataaagatgt atgacttgca 1500
ttcaaaatgc gtccccttca gttgttcaac ttttctgtaa atatcctttc aggcatgtct 1560
agaagattgt ttcgcaaata cttctcaatc cattcaagtt gatagtgcag attaatcact 1620
gcagaataaa agcctgtaac ttggctcacg tgccaaggaa tatgcacact cctgacacat 1680
caataagtaa atcaaagtgt agcttttgcc tttaacattg ccagacttat gtaatgttct 1740
gcacgttctt cctccatcac tttttattct aatggtgttt ccttgacatt gaatcacgct 1800
gtggaagctg cttagaatta acattgaaat ctactgatat atttatgatg cagcaattta 1860
gatttactat tttacttaga attttttata attgagagaa tataatattt tcacagttat 1920
ctatctgctg taaatagagg attttaaaaa aaatctctat aacttttttt tacaacacac 1980
agtaaaatta agttaaaatt taataaagtc actatgttga tttcaaagtg tgctacgccc 2040
acggtggtca cgcaggtgta gcagaagatg ccactaaggt gggctaaggc cgatgggttg 2100
gggtctgcgc tccctggaga tgagccccag gcggttccct ggcaatcagc tgcgatcatg 2160
atgcccgatg agccannnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2220
nnnnnnnnnn nnnnnnnnnc tgggtgactt tatggaaaga atttgataga tttcatgatg 2280
tagaagaatt ttattaggct tattttacag gagactaaga ccctgggacc taaagatatc 2340
tgggtcctga gaatcaggaa atgggtagag acgtggttga tggtatgaga cagattttag 2400
agaactctta gatcatgggc aatgaccgca atctgatgct tagaatagat catctataaa 2460
caattatgct gttctttttc tttctgttgt atgatctgat gatgtagccc ccttgccaag 2520
ttccctgatc ccccttgcca agttccctga ttgtaacagt atataagcat tgcttgagag 2580
catattcaac tacattgagt gtgtctgtct gtcatttcct cgccgattcc tgatttctcc 2640
ttgagccttt tcccttgttc tccctcggtc ggtggtctcc acgagaggcg gtccgtggca 2700
aaagtgtata aatgttctaa aacatttgaa ctctaaaaca tgcaaaatga aaaattaaaa 2760
taaataaaca tgaaaattaa aatatattag ctgctaaaag ttaaacaata ctatataata 2820
ttttgttatt agaattcaaa atcacattag ttggatttaa tttgaacatt gcattctttc 2880
aataataatt tcaataaaaa aagtttcccc atgatagtag aaaataataa catatgtatc 2940
tatctattta tttaactaca catatatagc atttgtttca actaaaataa atgaatgagc 3000
aaagcaccta agtaattggt gtctattata tttatgaagc caatagtttc aaataaatta 3060
tcatgcataa ggaggtattg caaatgttaa accttttttg aaacagatat tcccagttac 3120
agaaattata atttctaatc tttcctataa gtagaatgat gataattaat ataggccatt 3180
tgtaaataat gttcagatta aaatattctc tatttcacta gagaagaatg atattaaatg 3240
tattatattt tatttcccat tttgtttgca ccactattct atatccctca gcagtttaaa 3300
tttgtttcac catatgtgtg tgtgtttgta tcttaaatat ggcactaaaa ttagaataat 3360
ttaatataaa tctttaggag aaaagatatt gaattatttt atgttgatag gaaaatatct 3420
tttaattgtc caagaatact ttttcttcta ttttaggact gatcagaccc aggactaata 3480
ttttatatgt actaattcta tgtaccaaaa tatgttatta tctcatgaat tctgtctcaa 3540
tattgaggta ataaaaatag tccatcatga actttaaaat taaaataatg attaattaat 3600
ttttattcat attttgtttg tatgaatggt tatacatcac atgtgtgcct ggtgactgtg 3660
aatgtcagga gaaggtatga aagccactgg aattggaata agagataata tttgagatgt 3720
tatgtgggtg ctgagaatta gacgcaagcc atcttcaaga atagccagca tactatacca 3780
ctgagtaatc cattcatccc tcaataatta tctttgtaga cagtaaatat atttctaaac 3840
tataaatgac cagaaaaatt aatgtattat taatgaagac attcatctca tgtgacacac 3900
ttcacctgtc taaatcagta acactctctc cactaattaa gattttctaa gtgcatgaca 3960
cttactattt ctaaagctgt ccaatggggg ccagtcccca gtcagcaccc agtgagataa 4020
tccatgaatg catttatatc ttaggaaaaa ttcttatcta tgtagtattt agaacatttt 4080
catgtgaggg gataaacaag gaagcacaga tgctttctga tagaaacttt ctctttaatt 4140
catctagaaa aaaaaaacct ctcaggaaaa tctctcttgc tctcctccca atgctctatt 4200
cagcatcttc tccctactta attctagatc tttttctcta tgcctccttg ctgctgccct 4260
gctggctctg ctctatgcct ccccatgtca cttttctttg ctatctcacc gttaccttct 4320
ctgcctcact ctctgccttc ttctctgctt ctcacatggc caggctctgg acaattatag 4380
ttatatgtta cattctcata acacatgata tgtcacatag tttctctcag gctagggata 4440
tcacaatgac tggccaatga gcaagtggcc ttgcatgtag ctctaagttg gtgatggttc 4500
ccagacagta agtagccatt tggttgaaat ttgaggttgg gtagtacatg aagactgaat 4560
tttcttcaaa ctctggcctt gaaatagtaa aacaacacct atgaaaatga cgacctgtat 4620
ttgtctttag aggcaaccac atattgtctg cagggcctgc tttgaatttg ctctgaagtt 4680
agcttgtttg tgtaaaagga agaatcctat atcagcctga gaaatgtaaa atatcctagc 4740
atttcaagtc atcaaaatta tatggagagt ataaatcatc cttctgacta ttcatagtca 4800
tatttgtgtc caccaagtat aaaacacact accaaagggc tgtggaaaaa atcgccataa 4860
ctgttcttat tagggaggca tagcagtggt acctgaggaa gttacagcaa caaccagtca 4920
tccagtcaat aaccccatgg ctttgccact tggaggtacc caataatgtt tggctttgcc 4980
gagtaggact ccaacaaatt cagagggtca atttttaaat gctggttgtc actgctgaac 5040
agtcccattg ccctctgcat aattccacaa tggaaagctt tttacactga ttgccaatca 5100
ttaaacagcc tactcagcat aaacaggtat gatattattc tgcattttgt tacattacta 5160
gatgaattcc tatttcttcc tacaatagtg gaactgaaaa aagatacaca atcatactac 5220
ccctctacta atcttatgac ttatatcatt tcaattttca gaccataatg caaactattg 5280
accaaaacat gtgaagatga aaaatagaaa tgtagaataa tattacatat aaaaagaaaa 5340
ggcggactta ttttgtttta tttcttagca tgcatagcaa tacatgattt gaggtttata 5400
taataaaggg acaataaatc ttcaagaaac ttacccctac tgaattaaaa tattaaagaa 5460
ggtcacacat ttactcaaat atattagact actgggcaaa tagacatgaa aagtagagtt 5520
aatattgagg taggccttct gtgaaatgtc taaggaaatt atgtttcata cagtgtgtaa 5580
ccaagtggga atcatatcag aaagcagtca aaagcttata ttacaagtaa cagatgcttg 5640
gttatatgac ctcccagagc ttgactgtct atacacaaaa agtggtgtta ataaaactgt 5700
aatttgggct atgttttttt aaatggcttc accaacatga aaggaaggga atgagcatgt 5760
catggatgct tagagattat gcttccagca agaagaattg agctttggct cttattacag 5820
aaacatgaca aggtgtgagt tttatttatt agaaattata taatatttta agctggggac 5880
taaaaatttt attgaaacaa acaggcaagg gataggcatg tactagaagc aaaaatagga 5940
tgtcaatgct gtaatgttat tttttggacc aaaatagtat ttcctataga aatgacaatg 6000
atcttaggtt attattcttc ataaagatga caagttcaca agatatccta gttcattaaa 6060
atcgttttag tcatttaata gagtgctgtg atagattaca caaaggaaag cacttacgat 6120
gagaaataat gatatccaca attattttct taattcttag aaacattcta ttgttatatc 6180
tcaatctcag aagccactta ttgctttatt attgaaacat atgaaattgt aagttatata 6240
ttgtctatgg tgacatttca aagaacatgt gacgtacagt gtagcacaga taaagaacat 6300
aactgcagct gaatcagtaa ctaaacttac atacattaaa tctgccatgt tggcaacagt 6360
gtgtgcacta ccaaaggatg tactaatgct cacgacactc ccctatgtca ccctttgttc 6420
atcattacat cataggtcta ttttgtttgc ttttgaaatc tagaccaagt cttttgtgtc 6480
tttccaagca cagagctcat taatttacct catagacttg ttaaacttct tctggttcat 6540
caattgaata gaaatactca ctactaatta tgtgagaccc tgccagtacc atagcacatg 6600
gataattttt acataaaaca tgcatacaag taagattatt cagactgaac atgaatttta 6660
gagaaatcag gaaggagtat atgggagtgg ttggagtgag actagagaaa tgtaattaaa 6720
ctataatctc aatacaaaga tctactaagc aaaaaacatg aaacattgtc attcaagtga 6780
aacatcagtc ttcaaattgg aaagatattt ttactaggaa aatgtctggt agatggttat 6840
tatctagaaa acacaaaaat tagaaaacgg taaactttaa taaaaagaat aatacaatga 6900
gactacatga aaagttctta actaatgaaa caaatatctt gaaacttttt tcttaaaagt 6960
ttaatatcaa taaccatcat ggaaattcaa attaaaacta tttacatatt acccctgaaa 7020
taataactaa tacccaataa aaataatata aacaaaaaat ggcaatgcat gccatcatgg 7080
atttgggaga gagaatgttc attgcagttc tgaatggata ctggtgccac cacggtgaaa 7140
atctctgtat aggtccttcc aaaagctgaa aatagacata tcacaagacc tgccacacat 7200
ttttcaagca aatacccaaa ggactctacc tgactgcaga gacactttct cataaaatat 7260
tattgttgat ctattcataa tatctggaaa atagaaacag ccaagatgcc catcaactga 7320
ttaatagatg ataaaattat tgtacatttc agtgtaatat tattcagttt ttaagaaaaa 7380
tgaaattatg taataagcat gtaaatggat atatcttgaa acaaccattc cccattatat 7440
tacctaaaca ttgaaagtcc aaaatcatat gatcttttta gtggatctac taatcttttg 7500
ctatatgtat tttattgaac tacccatgga tgtgagataa ttggtaacaa cagcacatgg 7560
gagagcatgg gatcattcaa ggaagattag agagaatgca ttttttagga gataatggag 7620
gagcaataga aaggattaaa tgaggttact gatgaaagtg atggttagag aaggcaatat 7680
gaggagggat aactagcact tagggccttt tgaaaaagac atagagaaaa tactattgta 7740
gaaacttcct ataattggtg tatagttata tacaccaaag agctcagatg gagttaccct 7800
ataatggaaa tattaactac tttttatcac tgtgataaaa catcctgaac agagcaacat 7860
agattgggaa gcatttactt tggcttacag ttctaacggg ataaaaattc atgatgaaag 7920
aatgaatatg tcagcaaaca gcagtagcaa tggcctgaga agcaggtgag agctcacatc 7980
ttgaagtgta agaatgtagc agagagaaca aactgcaaat gaccagaaaa tgcttttgga 8040
tcagagccca tacccctctg actgacttct ccagaaattc tgaacaaata aaactcccca 8100
aacagagcca taactgaagg tccagtgtct gagactacta ggggtatttc ttattcaaac 8160
cactacaatg gggtgggggg agcaatcctc caagtaggca ctacacacag acaaataaaa 8220
actctagtaa ctggaatgga ttgacttatt tgaattactt gccagtggag ctacatagag 8280
cacaattatt gtatttaaat taccctttat gatcttacaa aacttgacag taagatcata 8340
ttgctaaaga aaccacatat ttgaatcagg gaacatggtg atatctagtt gttcttcaac 8400
tggaaacttc atgctttctg cccagcattc atgttgctgg aaagagcaat gtacactacc 8460
agtgtagaaa ttaaatcatc aatcttatca agatgtggat cctataagtt acaataaaaa 8520
ttagcctgat aagatatccc caccagaaga atattcacat aaatgctatg ggagcaacaa 8580
gctattttct aaattagctt taatcctatt ctacaagaga gaatccatat ctagaatagt 8640
tatagggatc aagaacccat ggcttgattg gtcataggcc caatgggaga tcctaatatt 8700
attgttctac aaaatgaaaa taactcctaa tgacttgttg ctgcagtaat aagttagtat 8760
gttgctcaac tctcacaaga gaagttttgt cttacaataa atggcaatta aagcagcccc 8820
acaagattta tatcataccg atctcctcat ggcctatgca tctagaagct aggaaacaaa 8880
gaggacccta agagagacat acatggtccc cctggagaag gggaaggggg caagacctcc 8940
aaagctaatt gggagcatgg gggaggggag agggagttag aagaaagaga aggggataaa 9000
aggagggaga ggaggacaag agagagaagg aagatctagt caagagaaga tagaggagag 9060
caagaaaaga gataccatag tagagggagc cttgtatgtt taaatagaaa actggcacta 9120
gggaattgtc caaagatcca caaggtccaa ctaataatct aagcaatagt cgagaggcta 9180
ccttaaaagc ctttctctga taatgagatt gatgactacc ttatatacca tcctagagcc 9240
ttcatccagt agctgatgga agcagaagca gacatctaca gctaaacact gagctagttg 9300
cagacaggga ggagtgatga gcaaagtcaa gaccaggctg gagaaacaca cagaaacagc 9360
agacctgaaa aaaatgttgc acatggaccc cagactgata gctgggagtc cagcatagga 9420
cttttctaga aaccctgaat gaggatatca gtttggaggt ctggttaatc tatggggaca 9480
ctggtagtgg atcaatattt atccctagtt catgactgga atttgggtac ccattccaca 9540
tggaggaatt ctctgtcagc ctagacacat gggggaggtt ctaggtcctg ctccaaataa 9600
tgtgttagac tttgaagaac tcccttgaga agactcaccc tccctgggga gcagaaaggg 9660
gatgggatga gggttggtga gggacaggag aggaggggag ggtgagggaa ctgggattga 9720
caagtaaatg atgcttgttt ctaatttaaa tgaataaagg aaaagtaaaa gaagaaaaga 9780
aaacaggcca aaagattata aaagacagag gtggtgggtg actataaaga aacactatta 9840
tctaaataaa aatatgtcag aagcacacat gaacttatag tgtttatgaa agtatgtata 9900
ataactacat aatctcaagc caagaaaaaa atatcatctt tcagtgatga aggtgatttt 9960
atttctccca gaattaaagc caaagaccta atgaaagtaa ttatcttcaa aaggttgaaa 10020
atacatactt tgcaatacac agatctgcct agaaatctca tgttcacaat acacatgatg 10080
ctcaattgaa ttccattcaa tgttacagtt tagataaaca gtttgtagat aaactcacaa 10140
tgtatcattt ctttttattt tttgaccaaa cagcttctca tctgttattc agaataattc 10200
ctcgatggca ggatatccat cccaattggg ggaaggggag aatttgaaga aaacctagac 10260
cacatacata tttgccattg ggaaacaaag tctaaaatga tgttgttcac atcttctcta 10320
ctagtcctct ccccgtccca aagaaccttg gtatatgtgc ctcattttac agagagagga 10380
aagcaggaac tgagcatccc ttacttgcca tcctcaaccc aaaatttgca tcattgctca 10440
gctctgccct tctcatatga cagttacaag tcaaggcttc caaagtccct ctgtcatgtt 10500
tggtgtcaat agtttataca gatgacttca tgtcttcata tctaatgtct tatatagatt 10560
aatattaaac aatgttattt ctctaaccac attttaaatt aatttaaaaa tccattaatt 10620
gtgtctataa aatgcagaca gagtgctgag acacaatata agcctgatga tctgaatttg 10680
aaactcacac ccaccacatg gagaatcaac ttccaaaaat tttcctatta cttccacact 10740
tacaccattg tacaaacaca ataataatga acaaaatgaa atgaaataaa aaattaagtc 10800
tctgtaggta atgctactgt gcagcaaaag taaaaatggc agcttaagct tgctttatgg 10860
ttacacttta ccatcttcca ttaattataa ggacttcaat catggcagaa ctatgctgtt 10920
attgtctcag tgtaacctaa ccaggtgttc cagatgttct taatgtggac acctaaacta 10980
tttgatattt gggttaagat ctttccctct ttcagaagaa acctcaggac agagggaatc 11040
ttgtctttta attttgagtc tgtagacttt ttccatttca aatatacatg aaacaagtga 11100
tgaagaaaat taatcaaaag gtgggaattg caatgatatt aggttcaata ttaagcttca 11160
atattatcat ggaatcgcct gttatacact gagtgtttgg caataaggga tttttagaag 11220
aaggagtttt tattctcaac aggttcctta agtttagctc aaataaatct aagcaatcca 11280
ctctagaatt aaatagtttc ctaagggcac agctatgaat agagctcaat ttacatataa 11340
aattttgttc accatttatg tcattccagt tttcattagt acaaggaaaa tacaaaatat 11400
ttagatgtca atatcaagtg aatagttcat ctcctttttt aatatatatc acctaaatca 11460
ccattttctc agaaaaatct ggcctgaagt tctgtctgga acttcaacat gaaaaatatg 11520
cacagcttgc tattataaat cctagttgat ttttaagatt catgtctggt gtctgactca 11580
gaggggccag aggctagaca aatatttttt gaatcttcat tgtgaagatt tttaatgatt 11640
attttaatat aaataacaaa gatgatggat aatgtaactt tgtacagttc atagacgctg 11700
aactactttg tgcttaaaat gttagttccc tatcataaat gataggtgat aagtgtatgt 11760
ttaatacttt ccctctgagc tatattcatg tactagagaa ttattttaaa catgaaaaga 11820
ctgtgtttat agtctcagct cctgagaact ggtccaacct taggcaggtg aatgccagga 11880
gcaacgtttt tcttctacag aggatgcttt gctgccaagc aacctggttg tgtggaaatg 11940
ttcctttttt aatcaagttt aaagggtctt catcatgctg ttgctccaca tattttcagg 12000
ttagagcttg gtccttggag tattatcttt taccagaaaa ttcatagtat tctttcaata 12060
actaacaact aaacttttcg ataaaaaaga attggaattt caattttaaa gcctgagtaa 12120
aattcttgtg aatcaggata ttttatttta agtcttatct tttaaaaagt tattttattt 12180
tttaaaaaat tataatatac tttcataatt tccctccttc acttttcttt acaaacactt 12240
ctatagatca ccatgtgttt ttttttttac atttatggcc tctttctgtt cattgttatt 12300
acatacaaat agtcttgcct atagaagaac accacaattt gttacctgat aacaaattat 12360
caacccttaa aacctacaaa ctattgatat tactgaaaag actatactta tagatgtaaa 12420
gatatatgtg tgtgcacata tatagataca catatatgta ggatttttaa ttttagattt 12480
tagacatcaa aattatttat atgactgaga aactagacac tataaatgag cattcagtat 12540
tcaacaccgt gattttagat attgtcacaa tgacagaaaa ttttcttata gaaaatttta 12600
agttttgtga ttgctctgtg cacttagtga agtctcacag aaaaagaatc atagtatttt 12660
tagtttataa taaaaagtac atataattaa aatggttggc acaaaacaac atttgagcat 12720
ttttcctatt tactatcaag tagtatcatt ttgaaataat aatttgacta gtttcaaaaa 12780
tgaaaacaaa atttaaacta aatgcctaat ctagcctgat aacattttta tgaatgaaat 12840
tattcaatag tgttatcaat taggggccca aaacttttcc taaaataaaa cttttaattt 12900
ttttccattt ttatttaaat tagaaacaaa attgttttac atgtaaatca gagtttcctc 12960
accctcccct tctccctgtc cctcactaac accctacttg tcccatacca tttctgctcc 13020
ccagggaggg tgaggccttc catggggaaa cttcagagtc tgtctatcct ttcggatagg 13080
gcctaggccc tcacccattt gtctaggcta aggctcacaa agtttactcc tatgctagtg 13140
ataagtactg atctactaca agagacacca tagatttcct aggcttcctc actgacaccc 13200
atgttcatgg ggtctggaac aatcatatgc tagtttccta ggtatcagtc tggggaccat 13260
gagctccccc ttgttcaggt caactgtttc tgtgggtttc accaccctgg tcttgactgc 13320
tttgctcatc actcctccct ttctgtaact gggttccagt acaattccgt gtttagctgt 13380
gggtgtctac ttctactttc atcagcttct gggatggagc ctctaggata gcatacaatt 13440
agtcatcatc tcattatcag ggaagggcat ttaaagtagc ctctccattg ttgcttggat 13500
tgttagttgg tgtcatcttt gtagatctct ggacatttcc ctagtgccag atatctcttt 13560
aaacctacaa gactacctct attatggtat ctcttttctt gctctcgtct attcttccag 13620
acaaaatctt cctgctccct tatattttcc tctcccctcc tcttctcccc ttctcattct 13680
cctagatcca tcttcccttc ccccatgctc ccaagagaga tgttgctcag gagatcttgt 13740
tccttaaccc ttttcttggg gatctgtctc tcttagggtt gtccttgttt cctagcttct 13800
ctggaagtgt ggattgtaag ctggtaatca tttgctccat gtctaaaatc catatatgag 13860
tgatgtttgt ctttttgtga ctgggttacc tcactcaaaa tggtttcttc catatgtctg 13920
tggatttcaa tagcacaaac aacatacagt atcttggggc aacactaacc aaacaagtga 13980
aagaccagta tagcaagaac tttgagttta aagaaagaaa ttaaagaaga taccagaaaa 14040
tggaaagatc tcccatgctc tttgataggc agaatcaaca tagtaaaaat ggcaatcttg 14100
ccaaaatcca tctacagact caatgcaatc cccattaaat accagcacac ttcttcacag 14160
acctgaaaga ataatactta actttatatg gagaaacaaa agacccagga taggccaaac 14220
aaccctgtac aatgaaggca cttccagagg catccccatc cctgacttca agctctatta 14280
tagagtaata atcctgaaaa cagcttggta atggcacaaa aatagacagg tagaccaatg 14340
gaattgagtt gaaaaccctg atattaaccc acatatctat gaacacctga ctttgacaaa 14400
gaagctaagg ttatacaatg taagaaagaa agcatcttca acaaatcgtg ctggcataac 14460
tggatgctgg catgtagaag actgcagata gatccatgtc taatgccatg cacaaaactt 14520
aagtccaaat ggatcaaaaa cctcaacata aatccagcca cactgaacct catagaagag 14580
aaagtgggaa gtatccttga ataaattggt acaggagacc acatcttgaa cttaacacca 14640
gtagcacaga caatcagatc aataatcaat aaatgggacc tcctgaaact gagaagcttc 14700
tgtaaggcaa tggataagtc aacaggacaa aatggcagcc cacggaatgg gaaaagatat 14760
tcaccaatcc tatatctgac agagggctgc tctctatttg caaagaacac aataagctag 14820
tttttaaaac accaattaat ccgattataa agttgggtag agaactaaat aaagaattgt 14880
taacagagca atctaacttg gcagaaagac acataagaaa gtgctcacca t 14931
實例 13 - CHO 中之 AAVS1 樣區域序列之導引序列(以下導引物可為有義導引序列或反義導引序列)
SEQ ID NO | |
CCCCGCTGGCGCCGGGATCGGGG | 13 |
GAGTCGAGCACCGCTCGGGCAGG | 14 |
TTCCCCGCTGGCGCCGGGATCGG | 15 |
GTGTGCGGAAGACGCCGCCGGGG | 16 |
CGGTGACAGCGCGGATGACAGGG | 17 |
CAGCGCGGATGACAGGGGCGAGG | 18 |
GCCGGCGTCCGATTCCCCGCTGG | 19 |
CGTGTGCGGAAGACGCCGCCGGG | 20 |
GAGGCGCTCCACCGTCTGTTGGG | 21 |
GTCCGATTCCCCGCTGGCGCCGG | 22 |
GACCCCGGGGGCCCCGATCCCGG | 23 |
CGGCGTCTTCCGCACACGGATGG | 24 |
TCGAGCACCGCTCGGGCAGGCGG | 25 |
AGCTCACGCCGGCCCCATAAAGG | 26 |
CATCGTCCTCTATATATAGCAGG | 27 |
AGAGGCGCTCCACCGTCTGTTGG | 28 |
GGTCGGCTGCGCGAAGCATCAGG | 29 |
TGCTTCGCGCAGCCGACCCCGGG | 30 |
GGCCCCGATCCCGGCGCCAGCGG | 31 |
TCCGATTCCCCGCTGGCGCCGGG | 32 |
TCCCGGCGCCAGCGGGGAATCGG | 33 |
TGGTGGAGTCGAGCACCGCTCGG | 34 |
CAAGATGGTCCTCACTCTCGGGG | 35 |
GCTTCGCGCAGCCGACCCCGGGG | 36 |
GTGGAGCGCCTCTTCTCCAGGGG | 37 |
GACGTGTCAGCCTTCCAGGTGGG | 38 |
GCCAGCGGGGAATCGGACGCCGG | 39 |
TCTCCCCGTCATCCAAAAGCTGG | 40 |
GGTGGAGTCGAGCACCGCTCGGG | 41 |
GCTGCCCAAATATAGTCCATGGG | 42 |
ATGCTTCGCGCAGCCGACCCCGG | 43 |
GCGGTGACAGCGCGGATGACAGG | 44 |
ATGCTCGGGGGCCGCTGACCTGG | 45 |
TTGTATTGCCGGGATCCTTCTGG | 46 |
TCCCCGCTGGCGCCGGGATCGGG | 47 |
CTCGACTCCACCAACGCCGACGG | 48 |
GGTGGCAAGATCACCAAAAGGGG | 49 |
GGCGCTGATGCCGTCGGCGTTGG | 50 |
TCCACGAGCATCCTAGCAAGAGG | 51 |
AGGCTGACACGTCAGGCCTGAGG | 52 |
GGGTGTAAGCCATCCGTGTGCGG | 53 |
AGGATCCCGGCAATACAAGATGG | 54 |
GGATGGGGCCCAACAGACGGTGG | 55 |
GAGGACCATCTTGTATTGCCGGG | 56 |
AGTCGCCCAGGGTCCTGGTGGGG | 57 |
GGCGGGAGGAGAGTCCCACCTGG | 58 |
ACCTACCCCACCAGGACCCTGGG | 59 |
TCAGCGTCTTTGACCAGTCCAGG | 60 |
CGTCCCGCCGCCTGCCCGAGCGG | 61 |
GTCCCCGGGATCCCCGGGGTCGG | 62 |
AGCACCGCTCGGGCAGGCGGCGG | 63 |
CGGTGGAGCGCCTCTTCTCCAGG | 64 |
GCCCCGATCCCGGCGCCAGCGGG | 65 |
ATCGGGGCCCCCGGGGTCCCCGG | 66 |
ATTCTCGGCTCATCCCCTTTTGG | 67 |
ACCACCCCATGGACTATATTTGG | 68 |
TAGCAAGAGGACGACAACCCAGG | 69 |
GCTGATGCCGTCGGCGTTGGTGG | 70 |
TACAAGATGGTCCTCACTCTCGG | 71 |
TGCCGGGATCCTTCTGGATTCGG | 72 |
CCCAAATATAGTCCATGGGGTGG | 73 |
TACCTGTAGAATGGGACCAGTGG | 74 |
TCTTGCTAGGATGCTCGTGGAGG | 75 |
ATGCCAGCTTTTGGATGACGGGG | 76 |
ATAGTCCATGGGGTGGTAGGTGG | 77 |
CAGGACCCTGCTATATATAGAGG | 78 |
GGGGCCGGCGTGAGCTGTGTGGG | 79 |
ACCTGGAAGGCTGACACGTCAGG | 80 |
CAGCGGACAGCACGGGTCACAGG | 81 |
CGCCGGGATCGGGGCCCCCGGGG | 82 |
GCGCCGGGATCGGGGCCCCCGGG | 83 |
GCCGGGATCCTTCTGGATTCGGG | 84 |
GCTGTCACCGCTCTCCCCGGCGG | 85 |
GGTGACAGCGCGGATGACAGGGG | 86 |
GAAGACGCCGCCGGGGAGAGCGG | 87 |
AAGGGGTACACTGCCTTGGAGGG | 88 |
CTTCTAGAACCTACCCCACCAGG | 89 |
GGGGCCGCTGACCTGGTGCAGGG | 90 |
TCCCGAATCCAGAAGGATCCCGG | 91 |
TCACAGTGTCTGAGTCGCCCAGG | 92 |
GCTAGGATGCTCGTGGAGGTGGG | 93 |
CTCGTGGAGGTGGGGAATAAAGG | 94 |
TGATCTGTGCCCCGAGAGTGAGG | 95 |
TGAATTAATAGGACATGGGGAGG | 96 |
ACTCTCGGGGCACAGATCACTGG | 97 |
GACCACTGGTCCCATTCTACAGG | 98 |
TGAGGACCATCTTGTATTGCCGG | 99 |
AGAATCCGTCTGTCCTGGGCTGG | 100 |
TGACGTGTCAGCCTTCCAGGTGG | 101 |
AAAAGCATCCCGAATCCAGAAGG | 102 |
TTTTCCCGAGGCCACACTCAGGG | 103 |
AGCGCCCTGCACCAGGTCAGCGG | 104 |
TGAGTCGCCCAGGGTCCTGGTGG | 105 |
CACGTCAGGCCTGAGGTCACAGG | 106 |
GTTTTCCCGAGGCCACACTCAGG | 107 |
GAGTCGCCCAGGGTCCTGGTGGG | 108 |
GAATCCGTCTGTCCTGGGCTGGG | 109 |
CCGGGGAGGGAGGATGCTCGGGG | 110 |
GAGCCGAGAATTGAATTAATAGG | 111 |
GTGACCCGTGCTGTCCGCTGTGG | 112 |
GGGGGCGTCAAGTCAGAGCTGGG | 113 |
CGCGCTGTCACCGCTCTCCCCGG | 114 |
TGCTGCCCAAATATAGTCCATGG | 115 |
AGTTGAGGAGAAACCTATGGGGG | 116 |
ATCGTCCTCTATATATAGCAGGG | 117 |
GAGTTGAGGAGAAACCTATGGGG | 118 |
AGGGGTACACTGCCTTGGAGGGG | 119 |
ATAGAGTCCCTCTGGGGACAGGG | 120 |
CTAGGATGCTCGTGGAGGTGGGG | 121 |
CGCGGATGACAGGGGCGAGGCGG | 122 |
AAAACAGAATCCGTCTGTCCTGG | 123 |
TGCTAGGATGCTCGTGGAGGTGG | 124 |
GAGTGTGGCCTCGGGAAAACAGG | 125 |
CGAGGCGGCCCCTGCAGGGCAGG | 126 |
CTTACACCCCGTGCCTTTCCAGG | 127 |
CTGCCCAAATATAGTCCATGGGG | 128 |
AGGGGCAAAGGACCCTCCTGAGG | 129 |
TCTCACCATAGAGTCCCTCTGGG | 130 |
AGTGTACCCCTTTGTTCCCCTGG | 131 |
GTTGAGGAGAAACCTATGGGGGG | 132 |
CACAGTGTCTGAGTCGCCCAGGG | 133 |
TCCTCTTGCTAGGATGCTCGTGG | 134 |
CACATGATCACCAAAGTCCCTGG | 135 |
AAACAGAATCCGTCTGTCCTGGG | 136 |
GTGCAGGGCGCTGATGCCGTCGG | 137 |
CAGCACGGACTTTTTTTGTTTGG | 138 |
CAGCCGACCCCGGGGATCCCGGG | 139 |
TTTGGTCAAGATTTTGCAACTGG | 140 |
TTGGTCAAGATTTTGCAACTGGG | 141 |
CCTGTCAGAGAGGATGCTCTAGG | 142 |
TGGGTTGTCGTCCTCTTGCTAGG | 143 |
CTCACCATAGAGTCCCTCTGGGG | 144 |
AGACGCTGACACCCTGAGTGTGG | 145 |
GGTGGAGCGCCTCTTCTCCAGGG | 146 |
AACAAAGGGGTACACTGCCTTGG | 147 |
CTGTCCCCAGAGGGACTCTATGG | 148 |
GTCTCTGACCCCCTCATTTGTGG | 149 |
GTCTGAGTCGCCCAGGGTCCTGG | 150 |
GCCTGACGTGTCAGCCTTCCAGG | 151 |
ATGTCCCACACAGCTCACGCCGG | 152 |
GGCTGTGCCGCAGGCTTCCAGGG | 153 |
CACCCCGTGCCTTTCCAGGCTGG | 154 |
TCACCAAGGTGTCTGCATGGCGG | 155 |
GAATTGAATTAATAGGACATGGG | 156 |
AATATAGTCCATGGGGTGGTAGG | 157 |
CAGGGCATAGTTTTTAAAGCAGG | 158 |
CGGCATCAGCGCCCTGCACCAGG | 159 |
GCAGCCGACCCCGGGGATCCCGG | 160 |
ACAGGACCTGTATTTGAGGTTGG | 161 |
GGGGCGAGGCGGCCCCTGCAGGG | 162 |
AACCTACCCCACCAGGACCCTGG | 163 |
GCACCGCTCGGGCAGGCGGCGGG | 164 |
TGGAAGCCTGCGGCACAGCCAGG | 165 |
GAACCAACACTGTGGCCAGGAGG | 166 |
AGCAGGGTCCTGTTTTCCCGAGG | 167 |
TGGGTGGCAAGATCACCAAAAGG | 168 |
AGCCGACCCCGGGGATCCCGGGG | 169 |
CATGGCAACTTCCATCTCCTGGG | 170 |
ACAGCACGGGTCACAGGAAGTGG | 171 |
GGGGGCCGCTGACCTGGTGCAGG | 172 |
AGGGGCGAGGCGGCCCCTGCAGG | 173 |
GTGGTCACCCCTGTCCCCAGAGG | 174 |
TGGGGCCGGCGTGAGCTGTGTGG | 175 |
GGAAGCCTGCGGCACAGCCAGGG | 176 |
CCTGAGCTGATCTCCTGGACTGG | 177 |
ATCCAAAAGCTGGCATTGTCAGG | 178 |
CTCTCACCATAGAGTCCCTCTGG | 179 |
GGGGGGCGTCAAGTCAGAGCTGG | 180 |
GGGTGGAAATCTAAGAGACAGGG | 181 |
CGGGGAGAGCGGTGACAGCGCGG | 182 |
AGAATTGAATTAATAGGACATGG | 183 |
CCATAAAGGAAGTTTTCCACAGG | 184 |
AGTGAACCAACACTGTGGCCAGG | 185 |
GTTGGGAGGGAACTCTTGGGAGG | 186 |
CGGGTCACAGGAAGTGGGGTAGG | 187 |
GGCCTGGCTAGCCTCAGAGGAGG | 188 |
GGTAGGTTCTAGAAGGTGACAGG | 189 |
ACAAGATGGTCCTCACTCTCGGG | 190 |
CAAGGTGTCTGCATGGCGGGAGG | 191 |
TGTTTCACTCATCCAGGCAGAGG | 192 |
TGTGGAAAACTTCCTTTATGGGG | 193 |
GAGGACGACAACCCAGGAGATGG | 194 |
GGGTGGCAAGATCACCAAAAGGG | 195 |
CTGGTGGGGTAGGTTCTAGAAGG | 196 |
ACTCTTCAGGCCTTTGCAGGAGG | 197 |
CAGAGGGACTCTATGGTGAGAGG | 198 |
AGCACGGGTCACAGGAAGTGGGG | 199 |
CTATGGTGAGAGGCGTCCTGTGG | 200 |
CAGCACGGGTCACAGGAAGTGGG | 201 |
ATGGGATGGGGCCCAACAGACGG | 202 |
CTCCCGCCATGCAGACACCTTGG | 203 |
GGGGATCCCGGGGACCCCGGGGG | 204 |
TGTCCGCTGTGGCCTCAGGAGGG | 205 |
GCAGTTGGGAGGGAACTCTTGGG | 206 |
GCCTGGCTAGCCTCAGAGGAGGG | 207 |
GAGAGTTGAGGAGAAACCTATGG | 208 |
ACCTGTATTTGAGGTTGGCCTGG | 209 |
TCGGGCAGGCGGCGGGACGCCGG | 210 |
TAGAGTCCCTCTGGGGACAGGGG | 211 |
GAAGTGACACTGAAGGGCCTGGG | 212 |
AGCAGCCTGAGCTGATCTCCTGG | 213 |
TCATGGCAACTTCCATCTCCTGG | 214 |
GTCACAGGTTCCTGTCAGAGAGG | 215 |
CACCAAGGTGTCTGCATGGCGGG | 216 |
GTAGGTTCTAGAAGGTGACAGGG | 217 |
AATTGAATTAATAGGACATGGGG | 218 |
TTCCAAGCACCTGATTTCTGTGG | 219 |
CTGTCAGAGAGGATGCTCTAGGG | 220 |
GTGCTGTCCGCTGTGGCCTCAGG | 221 |
CCCGGGGAGGGAGGATGCTCGGG | 222 |
GGGGTGGCTCGGGGGGCCCCGGG | 223 |
GTCAAGTCAGAGCTGGGCCCTGG | 224 |
GACACTGAAGGGCCTGGGCCTGG | 225 |
CTGAAAGTGAACCAACACTGTGG | 226 |
AAAGGGGTACACTGCCTTGGAGG | 227 |
TCTGGAAACTTCTAAGCATTCGG | 228 |
AGAGTTGAGGAGAAACCTATGGG | 229 |
CTCTGAGGCTAGCCAGGCCCAGG | 230 |
AGGGGTGGCTCGGGGGGCCCCGG | 231 |
TCCACATTGATTTGCCTTTCTGG | 232 |
AGGGTGGAAATCTAAGAGACAGG | 233 |
CTGTCCGCTGTGGCCTCAGGAGG | 234 |
AGACACAGGACCTGTATTTGAGG | 235 |
GGGTGGCTCGGGGGGCCCCGGGG | 236 |
TGGCTGTGCCGCAGGCTTCCAGG | 237 |
TCCAGAAAGGCAAATCAATGTGG | 238 |
CACCAGCCTGGAAAGGCACGGGG | 239 |
CGGGGTCCCCGGGATCCCCGGGG | 240 |
ACACTGCCTTGGAGGGGCAAAGG | 241 |
TGACAGGAACCTGTGACCTCAGG | 242 |
TCTCATGTGGGCTATCAAGATGG | 243 |
GGGAACTCTTGGGAGGGCCAGGG | 244 |
GAGGCCACAGCGGACAGCACGGG | 245 |
TGTCCTATTAATTCAATTCTCGG | 246 |
AGGGAACTCTTGGGAGGGCCAGG | 247 |
GCACCTGATTTCTGTGGTATTGG | 248 |
GTATCTTGAGTGTCTTTTCTCGG | 249 |
CTGTGGAAAACTTCCTTTATGGG | 250 |
GGGACCTCCAGCAGATGCAGAGG | 251 |
CTGGGGACAGGGGTGACCACTGG | 252 |
TTCAGTGTCACTTCTTTTGGGGG | 253 |
TCCCTCCTCTGAGGCTAGCCAGG | 254 |
GGCGCCGGGATCGGGGCCCCCGG | 255 |
GGTTCTAGAAGGTGACAGGGTGG | 256 |
TTGGGAGGGAACTCTTGGGAGGG | 257 |
ATCAGGTGCTTGGAAAGTAGAGG | 258 |
CGGGGAGGGAGGATGCTCGGGGG | 259 |
TGAGGCCACAGCGGACAGCACGG | 260 |
TGGTCACCCCTGTCCCCAGAGGG | 261 |
TCCCCGCCTCCTGCCCTGCAGGG | 262 |
GGCTGCCCTGGCTGTGCCGCAGG | 263 |
TCCAAAAGCTGGCATTGTCAGGG | 264 |
CAATGCCAGCTTTTGGATGACGG | 265 |
CTGGGCCTGGCTAGCCTCAGAGG | 266 |
GGTTCACTTTCAGTCTTTCATGG | 267 |
AGGAGAAACCTATGGGGGGTGGG | 268 |
TCTAAAAGACAGCCCAGCCCAGG | 269 |
CGGGGATCCCGGGGACCCCGGGG | 270 |
TCTTCTCCAGGGGAACAAAGGGG | 271 |
ACTGACACAAAAAGTCAGCACGG | 272 |
CCTGAAGAGTCAGGTCACCAAGG | 273 |
GGAGGAGAGTCCCACCTGGAAGG | 274 |
GGGCAGCCACCAGCCTGGAAAGG | 275 |
AGCCCTATTTCTCTCTCCTCTGG | 276 |
GCCACCAGCCTGGAAAGGCACGG | 277 |
TGACACCCTGAGTGTGGCCTCGG | 278 |
AATTAATAGGACATGGGGAGGGG | 279 |
GGCTCGGGGGGCCCCGGGGAGGG | 280 |
TAATAGGACATGGGGAGGGGAGG | 281 |
CTCTTCTCCAGGGGAACAAAGGG | 282 |
TCGGGGCCCCCGGGGTCCCCGGG | 283 |
TCCCTGACAATGCCAGCTTTTGG | 284 |
GAATTAATAGGACATGGGGAGGG | 285 |
AATGAGGGGGTCAGAGACACAGG | 286 |
GAAAACTTCCTTTATGGGGCCGG | 287 |
CTTGGGAGGGCCAGGGACTTTGG | 288 |
CCCCTGCAGGGCAGGAGGCGGGG | 289 |
TCAGTGTCACTTCTTTTGGGGGG | 290 |
ATCCCCGTTCTTCTTCCTCCTGG | 291 |
CTTCCTCCTGGCCACAGTGTTGG | 292 |
TGCAGTTGGGAGGGAACTCTTGG | 293 |
TGGCTCGGGGGGCCCCGGGGAGG | 294 |
CTGCAAAGGCCTGAAGAGTCAGG | 295 |
CCGTGTGCGGAAGACGCCGCCGG | 296 |
CCCCGGGGAGGGAGGATGCTCGG | 297 |
TTCCAGGCTGGTGGCTGCCCTGG | 298 |
AGGTCACCAAGGTGTCTGCATGG | 299 |
GGCGGCCCCTGCAGGGCAGGAGG | 300 |
TCGGGGGGCCCCGGGGAGGGAGG | 301 |
CCAAAAGAAGTGACACTGAAGGG | 302 |
GGCCAGGAGGAAGAAGAACGGGG | 303 |
GCCCAGGGTCCTGGTGGGGTAGG | 304 |
GCTAGCCTCAGAGGAGGGAGTGG | 305 |
GAGGGTCCTTTGCCCCTCCAAGG | 306 |
CCACCAGCCTGGAAAGGCACGGG | 307 |
GATTTCTGTGGTATTGGGGTTGG | 308 |
CTAGCCTCAGAGGAGGGAGTGGG | 309 |
CCCGGGGTCCCCGGGATCCCCGG | 310 |
CATGGGGTGGTAGGTGGAGTGGG | 311 |
AATGCCAGCTTTTGGATGACGGG | 312 |
GCCCCTGCAGGGCAGGAGGCGGG | 313 |
GAGGAGAAACCTATGGGGGGTGG | 314 |
AGAAGTGACACTGAAGGGCCTGG | 315 |
CCTCCAGCAGATGCAGAGGAAGG | 316 |
CCTCTTCTCCAGGGGAACAAAGG | 317 |
CCGGGGTCCCCGGGATCCCCGGG | 318 |
TAGCCTCAGAGGAGGGAGTGGGG | 319 |
CAGAGGAAGGGGATGCAGTTGGG | 320 |
CTCCAGCAGATGCAGAGGAAGGG | 321 |
GATTCTGTTTTTCCTCTGCCTGG | 322 |
CTTCAGTGTCACTTCTTTTGGGG | 323 |
CATAGAGTCCCTCTGGGGACAGG | 324 |
GGACCCTCCTGAGGCCACAGCGG | 325 |
CCATGGGGTGGTAGGTGGAGTGG | 326 |
GACACCCTGAGTGTGGCCTCGGG | 327 |
ATGCTTAGAAGTTTCCAGAAAGG | 328 |
AGCTGGGCCCTGGAAGCCTGCGG | 329 |
TACCACAGAAATCAGGTGCTTGG | 330 |
ACCCCAATACCACAGAAATCAGG | 331 |
TTCTACAGGTAAAAAAACTAAGG | 332 |
GGCCCCTGCAGGGCAGGAGGCGG | 333 |
CTCCCCGCCTCCTGCCCTGCAGG | 334 |
TCTCTGACCCCCTCATTTGTGGG | 335 |
GGAGAAACCTATGGGGGGTGGGG | 336 |
ACAGCCCAGCCCAGGACAGACGG | 337 |
CCTGTATTTGAGGTTGGCCTGGG | 338 |
AGCCAGGGCAGCCACCAGCCTGG | 339 |
AGCCTCAGAGGAGGGAGTGGGGG | 340 |
GTTCAGTGTTTCACTCATCCAGG | 341 |
CTGACTCTTCAGGCCTTTGCAGG | 342 |
ATCCCCCACTCCCTCCTCTGAGG | 343 |
CCCAAAAGAAGTGACACTGAAGG | 344 |
TGGCCAGGAGGAAGAAGAACGGG | 345 |
GGGAGGAAGGTTATGGGATGGGG | 346 |
CCTGAGGCTTCCTGCACTCTAGG | 347 |
TAGTTTTTTTACCTGTAGAATGG | 348 |
AAGTGGGGTAGGGAACAAGGTGG | 349 |
GGGTCACAGGAAGTGGGGTAGGG | 350 |
CACCTGATTTCTGTGGTATTGGG | 351 |
TTTGCAACTGGGTCTCATGTGGG | 352 |
GAGAAACCTATGGGGGGTGGGGG | 353 |
GAGGGAGGAGGGGTGGCTCGGGG | 354 |
GCCTGTAATCCCACAAATGAGGG | 355 |
GCAGAGGAAGGGGATGCAGTTGG | 356 |
ACCTGATTTCTGTGGTATTGGGG | 357 |
AAACCAGAGGAGAGAGAAATAGG | 358 |
AACCAGAGGAGAGAGAAATAGGG | 359 |
GAGGAGAGAGAAATAGGGCTTGG | 360 |
CTGCAGGGCAGGAGGCGGGGAGG | 361 |
AGGAAGGGGATGCAGTTGGGAGG | 362 |
GGTATTGGGGTTGGAACCTGAGG | 363 |
TTTTGCAACTGGGTCTCATGTGG | 364 |
GGGAGGAGGGGTGGCTCGGGGGG | 365 |
TCCCCTTCCTCTGCATCTGCTGG | 366 |
AGGAAGTGGGGTAGGGAACAAGG | 367 |
AGGGGAGGAAGGTTATGGGATGG | 368 |
CCTGTAATCCCACAAATGAGGGG | 369 |
AGTTTTTTTACCTGTAGAATGGG | 370 |
AGGAAGAAGAACGGGGATGGGGG | 371 |
TGCAGGGCAGGAGGCGGGGAGGG | 372 |
GGAAGGGGATGCAGTTGGGAGGG | 373 |
CAAAGTCACTGTGTAGATGAAGG | 374 |
GTGGCCAGGAGGAAGAAGAACGG | 375 |
TCCAGCAGATGCAGAGGAAGGGG | 376 |
AGGGAGGAGGGGTGGCTCGGGGG | 377 |
AACCTATGGGGGGTGGGGGTGGG | 378 |
GGGGAGGGGAGGAAGGTTATGGG | 379 |
CACCCACCCCCACCCCCCATAGG | 380 |
AAACCTATGGGGGGTGGGGGTGG | 381 |
GGAGGAAGAAGAACGGGGATGGG | 382 |
GAGGAAGAAGAACGGGGATGGGG | 383 |
GGAGGGAGGAGGGGTGGCTCGGG | 384 |
GGTTGGCCTGGGCTACACAGGGG | 385 |
AGAGGAGGGAGTGGGGGATTGGG | 386 |
GAGGTTGGCCTGGGCTACACAGG | 387 |
AGGTTGGCCTGGGCTACACAGGG | 388 |
TGGGGAGGGGAGGAAGGTTATGG | 389 |
GAAAGTAGAGGCAGGAGGGTTGG | 390 |
GAGGAGGGAGTGGGGGATTGGGG | 391 |
GGGGAGGAAGGTTATGGGATGGG | 392 |
AGAGTGCTTGCCTAGAGTGCAGG | 393 |
AGGAGGGAGTGGGGGATTGGGGG | 394 |
CAGAGGAGGGAGTGGGGGATTGG | 395 |
AGGAGGAAGAAGAACGGGGATGG | 396 |
TTTTTTCCCCTGTGTAGCCCAGG | 397 |
GGTGCTTGGAAAGTAGAGGCAGG | 398 |
CTTGGAAAGTAGAGGCAGGAGGG | 399 |
CTGTAATCCCACAAATGAGGGGG | 400 |
AGGACATGGGGAGGGGAGGAAGG | 401 |
TCATCTACACAGTGACTTTGAGG | 402 |
GAGGGAGTGGGGGATTGGGGGGG | 403 |
GGGAGGGAGGAGGGGTGGCTCGG | 404 |
AGGGAGTGGGGGATTGGGGGGGG | 405 |
AACAACAAAAACAAAACCAGAGG | 406 |
CTATGGGGGGTGGGGGTGGGTGG | 407 |
GGAGGGAGTGGGGGATTGGGGGG | 408 |
TGCCTGTAATCCCACAAATGAGG | 409 |
GAGTGGGGGATTGGGGGGGGGGG | 410 |
AGGGCAGGAGGCGGGGAGGGAGG | 411 |
CAGGAGGCGGGGAGGGAGGAGGG | 412 |
AGGAGGCGGGGAGGGAGGAGGGG | 413 |
GGAGTGGGGGATTGGGGGGGGGG | 414 |
GGGAGTGGGGGATTGGGGGGGGG | 415 |
GCAGGAGGCGGGGAGGGAGGAGG | 416 |
AGGCGGGGAGGGAGGAGGGGTGG | 417 |
GCTTGGAAAGTAGAGGCAGGAGG | 418 |
GAGAGAGAGAGAGAGAGTTGAGG | 419 |
應理解,雖然顯示例示性實施例,但本說明書、特定實例及資料係藉助於說明給出,且並不意欲限制本發明。本發明內之各種變化及修改(包括整個及部分地組合實施例)對於熟練的具有通常知識者而言將自本文中所含有之論述、揭示內容及資料變得顯而易見,且因此被視為本發明之部分。
以下圖式說明可用於在基因體之不同區域中產生具有穩定整合位點之細胞及此後在基因體之不同區域中產生具有穩定整合位點之細胞的中間細胞(intermediate cell)之例示性進展及產生。此等圖式說明本發明之實施例,且不以任何方式限制本發明。
圖 1示意性地描繪具有在啟動子之轉錄控制下編碼抑制蛋白之多核苷酸及聚腺苷酸化訊號的細胞之修飾,其中將該多核苷酸隨機插入於細胞基因體中。
圖 2示意性地描繪在DNA卡匣(1)隨機或位點特異性地插入至細胞基因體中之後圖1之細胞之修飾。DNA卡匣(1)包含側接lox位點(1及2)、啟動子、報導基因(1)、IRES、選擇標記基因(1)及聚腺苷酸化訊號。亦可使用其他RRS代替lox位點。
圖 3示意性地描繪圖2之細胞之修飾,其中DNA卡匣(1)係藉由重組酶介導之卡匣與DNA卡匣(2)交換而經置換。DNA卡匣(2)包含側接lox位點(1及2)、啟動子、選擇標記基因(2)、IRES及報導基因(2)及聚腺苷酸化訊號,以及處於第二啟動子之控制下的Cas9基因與第二聚腺苷酸化訊號(操縱子為視情況存在的)。亦可使用其他RRS代替lox位點。
圖 4示意性地描繪圖3之細胞之修飾,該細胞具有包含側接基因體安全港(GSH)同源臂、lox位點(3及4)及處於插入至基因體安全港中之啟動子之控制下的報導基因(3)與聚腺苷酸化訊號的DNA卡匣(3)。插入為位點特異性整合且在Lox3與Lox4之間產生穩定整合位點。亦可使用其他RRS代替lox位點。
圖 5示意性地描繪圖4之細胞之修飾,其中DNA卡匣(2)藉由重組酶介導之卡匣與DNA卡匣(4)交換而經置換。DNA卡匣(4)包含側接lox位點(1及2)、處於啟動子之控制下的報導基因(4)及聚腺苷酸化訊號。此交換移除Cas9基因。亦可使用其他RRS代替lox位點。
圖 6示意性地描繪實例6中使用之sgRNA質體。
圖 7描繪展示無HDR模板(對照)、104聚體HDR模板、401聚體HDR模板及1030聚體HDR模板之綠色螢光蛋白陽性群體(Q1)的實例6之標繪圖。GFP陽性為縱軸且CFP陽性為橫軸。
圖 8示意性地描繪具有由Lox位點3及4側接之穩定整合Cas9基因的哺乳動物細胞(例如,HEK293)。Cas9基因處於至少啟動子(未描繪)之控制下。亦示意性地描繪AAVS1。亦可使用其他RRS代替lox位點。啟動子存在於基因之5',但未描繪。
圖 9A 及圖 9B示意性地描繪含有sgRNA目標位點、用於插入至諸如基因體安全港(此處為AAVS1)之區域中的左同源臂(此處為GSH同源臂)、Lox 1位點、報導基因(顏色1)、Lox 2位點、用於插入至諸如基因體安全港(此處為AAVS1)之區域中的右同源臂(此處為GSH同源臂)的靶向質體。在3'端,
圖 9A示意性地描繪報導基因(顏色2),且
圖 9B示意性地描繪3'端處之陰性選擇基因(陰性選擇1)。啟動子及視情況存在之其他部分(諸如操縱子)係由以5'至3'方向指向之箭頭表示。兩種質體將顏色1插入至諸如基因體安全港之區域中。亦可使用其他RRS代替lox位點。
圖 10示意性地展示在Cas9介導整合至哺乳動物細胞(例如,HEK293)之基因體安全港(AAVS1)中之後的結果。顏色1由Lox 1及Lox 2側接。所關注基因可經由RMCE置換顏色1。當根據
圖 9A之靶向質體經恰當整合時,細胞將為顏色1陽性及顏色2陰性。當根據
圖 9B之靶向質體經恰當整合時,細胞將為顏色1陽性且將能夠傳播(propagate),因為陰性選擇基因經移除。亦可使用其他RRS代替lox位點。啟動子及視情況存在之其他部分(諸如操縱子)係由以5'至3'方向指向之箭頭表示。
圖 11更詳細地示意性地描繪
圖 10之插入。細胞基因體(包括AAVS1)側接插入物及5'端及3'端。顏色1由Lox 1及Lox 2側接。
圖 11左側指示與5'接合點PCR一起使用的5'基因體引子及3'插入引子之位置。
圖 11右側指示與3'接合點PCR一起使用的5'插入引子及3'基因體引子之位置。亦可使用其他RRS代替lox位點。顏色1基因5'之啟動子描繪為5'箭頭。
圖 12展示藉由
圖 11中示意性地描繪之接合點PCR在HEK 293細胞中擴增的正確大小片段。獲得且偵測穩定Cas9靶向之HEK293細胞以及5'接合點及3'接合點,此建立正確插入。
圖 13展示藉由
圖 11中示意性地描繪之接合點PCR在CHO細胞中擴增的正確大小片段。獲得且偵測穩定Cas9靶向之CHO細胞以及5'接合點及3'接合點,此建立正確插入。亦可使用其他RRS代替lox位點。
圖 14示意性地描繪包含整合至具有側接RRS (此處為lox 1及lox 2)之基因體之區域中的三個卡匣的例示性細胞。視細胞類型而定,三個卡匣中之各者可整合至在位置A處示意性地描繪之不同穩定整合位點(例如,AAVS1樣)中及在位置B及C處示意性地描繪之其他可用的位點(諸如穩定位點1及穩定位點2)。報導基因可相同或不同。陰性選擇基因可相同或不同,但較佳相同。根據本文中所含有之教示內容,細胞可含有額外穩定整合位點及整合卡匣。啟動子存在於基因之5',但未描繪。
圖 15示意性地描繪在位置A、B及C處示意性地描繪的
圖 14之細胞之修飾。三個卡匣各自包含側接RRS (此處為lox 1及lox 2)、所關注基因、陽性選擇標記基因及報導*基因。陽性選擇標記基因可相同或不同,但較佳相同。報導*基因可相同或不同,但各自必須與
圖 14之細胞中的報導基因中之任一者不同。所關注基因可相同或不同。
圖 14之卡匣藉由RMCE由
圖 15之卡匣置換。根據本文中所含有之教示內容,細胞可含有額外穩定整合位點及整合卡匣。啟動子存在於基因之5',但未描繪。
圖 16為相較於兩位點CHO-K1細胞(B及C),比較由三位點CHO-K1細胞(A、B及C)產生之蛋白質的條形圖。
圖 17示意性地描繪包含整合至具有側接RRS (此處為lox 1及lox 2,或lox 3及lox 4)之基因體之區域中的四個卡匣的例示性細胞。視細胞類型而定,四個卡匣中之各者可整合至不同穩定整合位點(及其他可用位點(諸如穩定位點1及穩定位點2))中,且示意性地描繪為位置A及B (SIS)以及C及D (穩定位點1及2)。報導基因可相同或不同。陰性選擇基因可相同或不同,但較佳相同。根據本文中所含有之教示內容,細胞可含有額外穩定整合位點及整合卡匣。啟動子存在於基因之5',但未描繪。
圖 18示意性地描繪在位置A、B、C及D處示意性地描繪的圖17之細胞之修飾。四個卡匣各自包含側接RRS (此處為lox 1及lox 2,或lox 3及lox 4)、所關注基因、陽性選擇標記基因及報導*基因。陽性選擇標記基因可相同或不同,但較佳相同。報導*基因可相同或不同,但各自必須與
圖 17之細胞中的報導基因中之任一者不同。所關注基因可相同或不同。在此圖中,存在兩個所關注基因1之複本及兩個所關注基因2之複本。
圖 17之卡匣藉由RMCE由
圖 18之卡匣置換。根據本文中所含有之教示內容,細胞可含有額外穩定整合位點及整合卡匣。啟動子存在於基因之5',但未描繪。
TW202334402A_111139393_SEQL.xml
Claims (89)
- 一種哺乳動物細胞,其包含位於基因體安全港(Genomic Safe Harbor)中之第一穩定整合位點及不位於該基因體安全港中之第二穩定整合位點,其中該第一穩定整合位點包含編碼第一報導蛋白之第一報導基因且該第二穩定整合位點包含編碼第二報導蛋白之第二報導基因,其中該第一報導蛋白及該第二報導蛋白不同。
- 如請求項1之哺乳動物細胞,其中該第一及第二穩定整合位點包含重組酶識別位點。
- 如請求項1之哺乳動物細胞,其中該第一報導基因處於SV40啟動子之控制下。
- 如請求項1之哺乳動物細胞,其中該第二報導基因處於SV40啟動子之控制下。
- 如請求項1之哺乳動物細胞,其中該第一報導基因編碼螢光蛋白。
- 如請求項1之哺乳動物細胞,其中該第二報導基因編碼螢光蛋白。
- 如請求項1之哺乳動物細胞,其中該細胞進一步包含編碼處於CMV啟動子之控制下之抑制因子的多核苷酸。
- 如請求項1之哺乳動物細胞,其中該哺乳動物細胞為人類細胞。
- 如請求項8之哺乳動物細胞,其中該人類細胞為人類羊膜上皮細胞(Human Amniotic Epithelial Cell)。
- 如請求項8之哺乳動物細胞,其中該人類細胞為HEK293細胞。
- 如請求項1之哺乳動物細胞,其中該哺乳動物細胞為CHO細胞。
- 如請求項2之哺乳動物細胞,其中該重組酶識別位點為lox位點。
- 如請求項1之哺乳動物細胞,其中將編碼所關注蛋白質之多核苷酸插入至該第一穩定整合位點或該第二穩定整合位點中。
- 如請求項1之哺乳動物細胞,其中該第二穩定整合位點位於與該第一基因體安全港不同之第二基因體安全港中。
- 如請求項1之哺乳動物細胞,其中該第二穩定整合位點位於不為基因體安全港之區域中。
- 一種哺乳動物細胞,其包含位於基因體安全港中之第一穩定整合位點及不位於該基因體安全港中之第二穩定整合位點,其中該第一穩定整合位點包含編碼第一蛋白質之第一多核苷酸且該第二穩定整合位點包含編碼第二蛋白質之第二多核苷酸。
- 如請求項16之哺乳動物細胞,其中該第一蛋白質為病毒蛋白。
- 如請求項16之哺乳動物細胞,其中該第二蛋白質為病毒蛋白。
- 如請求項16之哺乳動物細胞,其中該第一蛋白質為腺病毒相關病毒蛋白。
- 如請求項17之哺乳動物細胞,其中該第二蛋白質為腺病毒相關病毒蛋白。
- 如請求項17之哺乳動物細胞,其中該第一蛋白質為腺病毒蛋白。
- 如請求項17之哺乳動物細胞,其中該第二蛋白質為腺病毒蛋白。
- 如請求項16之哺乳動物細胞,其中該哺乳動物細胞包含編碼腺相關病毒蛋白之多核苷酸及編碼腺病毒蛋白之多核苷酸。
- 如請求項16之哺乳動物細胞,其中該第二穩定整合位點位於與該第一基因體安全港不同之第二基因體安全港中。
- 如請求項16之哺乳動物細胞,其中該第二穩定整合位點位於不為基因體安全港之區域中。
- 如請求項16之哺乳動物細胞,其中該哺乳動物細胞為人類細胞。
- 如請求項16之哺乳動物細胞,其中該哺乳動物細胞為CHO細胞。
- 一種哺乳動物細胞,其包含位於基因體安全港中之第一穩定整合位點及不位於該基因體安全港中之第二穩定整合位點,其中該第一穩定整合位點包含編碼第一報導基因的多核苷酸,該第一報導基因編碼第一報導蛋白,且該第二穩定整合位點包含編碼Cas9之多核苷酸及編碼第二報導基因的多核苷酸,該第二報導基因編碼第二報導蛋白,其中該第一報導蛋白及該第二報導蛋白不同。
- 如請求項28之哺乳動物細胞,其中該第二穩定整合位點進一步包含選擇標記基因及內部核糖體進入位點(IRES)。
- 如請求項28之哺乳動物細胞,其中該第一及第二穩定整合位點包含重組酶識別位點。
- 如請求項28之哺乳動物細胞,其中該哺乳動物細胞為人類羊膜上皮細胞。
- 如請求項28之哺乳動物細胞,其中該哺乳動物細胞為HEK293細胞。
- 如請求項28之哺乳動物細胞,其中該哺乳動物細胞為BHK細胞。
- 如請求項28之哺乳動物細胞,其中該哺乳動物細胞為CHO細胞。
- 一種用於製備至少一種所關注蛋白質之方法,其包含: (a)提供哺乳動物細胞,其包含位於第一基因體安全港中之第一穩定整合位點及不位於該第一基因體安全港中之第二穩定整合位點,其中該第一穩定整合位點包含編碼第一報導蛋白之第一報導基因且該第二穩定整合位點包含編碼第二報導蛋白之第二報導基因,其中該第一報導蛋白及該第二報導蛋白不同,且其中該第一及第二穩定整合位點包含重組酶識別位點; (b) 藉由重組酶介導之盒式交換(cassette exchange)將編碼該所關注蛋白質之多核苷酸引入至穩定整合位點中,及 (c) 在允許表現編碼該所關注多核苷酸之該多核苷酸的條件下培養該哺乳動物細胞。
- 如請求項35之方法,其中該哺乳動物細胞為人類羊膜上皮細胞。
- 如請求項35之方法,其中該哺乳動物細胞為HEK293細胞。
- 如請求項35之方法,其中該哺乳動物細胞為CHO細胞。
- 如請求項35之方法,其中該第一穩定整合位點包含編碼第一蛋白質之第一多核苷酸且該第二穩定整合位點包含編碼第二蛋白質之第二多核苷酸。
- 如請求項39之方法,其中該第一蛋白質為病毒蛋白。
- 如請求項39之方法,其中該第二蛋白質為病毒蛋白。
- 如請求項35之方法,其中該哺乳動物細胞包含編碼腺相關病毒蛋白之多核苷酸及編碼腺病毒蛋白之多核苷酸。
- 如請求項35之方法,其中該第二穩定整合位點位於與該第一基因體安全港不同之第二基因體安全港中。
- 一種產生具有多個穩定整合位點之哺乳動物細胞的方法,其中該方法包含: (A) 提供哺乳動物細胞,其包含第一DNA卡匣,該第一DNA卡匣以5'至3'順序包含編碼第一lox位點的多核苷酸、啟動子、編碼選擇標記蛋白之選擇標記基因、IRES、編碼第一報導蛋白之第一報導基因、可操作地連接至操縱子之啟動子、Cas9基因及第二lox位點; (B) 整合第二DNA卡匣,其包含多核苷酸,該多核苷酸以5'至3'順序包含含有CRISPR sgRNA目標位點的第一基因體安全港同源臂、第三lox位點、編碼第二報導蛋白之第二報導基因、第四lox位點及CRISPR sgRNA目標位點的第二基因體安全港同源臂,其中該第一lox位點、該第二lox位點、該第三lox位點及該第四lox位點不同,其中第一導引臂及第二導引臂可含有具有變異之區域,且其中該第二報導蛋白與該第一報導蛋白不同; (C) 將該第一DNA卡匣與第三DNA盒式交換,其中該第三DNA卡匣以5'至3'順序包含編碼第一lox位點的多核苷酸、啟動子、編碼第三報導蛋白之第三報導基因及第二lox位點,其中該第三報導蛋白與該第二報導蛋白不同,藉此提供具有多個穩定整合位點之該哺乳動物細胞。
- 如請求項44之方法,其中該等變異防止重新產生可靶向位點。
- 如請求項44之方法,其中該哺乳動物細胞為HEK293細胞。
- 如請求項44之方法,其中該哺乳動物細胞為CHO細胞。
- 如請求項44之方法,其中步驟(A)之該細胞進一步包含編碼處於CMV啟動子之控制下之抑制因子的多核苷酸。
- 如請求項44之方法,其中步驟(B)之該細胞進一步包含編碼處於CMV啟動子之控制下之抑制因子的多核苷酸。
- 如請求項44之方法,其中步驟(C)之該細胞進一步包含編碼處於CMV啟動子之控制下之抑制因子的多核苷酸。
- 一種哺乳動物細胞,其包含經修飾基因體,其中該基因體藉由在該基因體之不同區域內插入至少三個DNA卡匣而經修飾,其中該經修飾基因體包含 (1) 第一去氧核糖核酸序列,其在修飾之前與選自由SEQ ID NO: 1及2所組成之群組的至少一者至少90%一致; (2) 第二去氧核糖核酸序列,其在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少90%一致;及 (3) 第三去氧核糖核酸序列,其在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少90%一致, 其中該第一去氧核糖核酸序列藉由插入第一DNA卡匣而經修飾,該第二去氧核糖核酸序列藉由插入第二DNA卡匣而經修飾,且該第三去氧核糖核酸序列藉由插入第三DNA卡匣而經修飾。
- 如請求項51之哺乳動物細胞,其中 (1) 該第一去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 1及2所組成之群組的至少一者至少95%一致; (2) 該第二去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少95%一致;及 (3) 該第三去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少95%一致。
- 如請求項51之哺乳動物細胞,其中 (1) 該第一去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 1及2所組成之群組的至少一者至少98%一致; (2) 該第二去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少98%一致;及 (3) 該第三去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少98%一致。
- 如請求項51之哺乳動物細胞,其中 (1) 該第一去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 1及2所組成之群組的至少一者至少99%一致; (2) 該第二去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少99%一致;及 (3) 該第三去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少99%一致。
- 如請求項51至54中任一項之哺乳動物細胞,其中 (a) 該第一DNA卡匣包含啟動子及選自由可選標記基因及報導基因所組成之群組的至少一者; (b) 該第二DNA卡匣包含啟動子及選自由可選標記基因及報導基因所組成之群組的至少一者;及 (c) 該第三DNA卡匣包含啟動子及選自由可選標記基因及報導基因所組成之群組的至少一者。
- 如請求項55之哺乳動物細胞,其中 (a) 該第一DNA卡匣包含啟動子、可選標記基因及報導基因; (b) 該第二DNA卡匣包含啟動子、可選標記基因及報導基因;及 (c) 該第三DNA卡匣包含啟動子、可選標記基因及報導基因。
- 如請求項55或56之哺乳動物細胞,其中該第一去氧核糖核酸序列包含穩定整合位點。
- 如請求項57之哺乳動物細胞,其中所關注基因係被插入至該穩定整合位點中。
- 如請求項57之哺乳動物細胞,其中該所關注基因編碼選自由以下所組成之群組的所關注多肽:抗體、抗體鏈、受體、含Fc蛋白、阱蛋白(trap protein)、酶、因子、抑制因子、活化因子、配位體、報導蛋白、選擇蛋白、蛋白賀爾蒙(protein hormone)、蛋白毒素、結構蛋白、儲存蛋白、轉運蛋白、神經傳導物質(neurotransmitter)及收縮性蛋白。
- 如請求項51至59中任一項之哺乳動物細胞,其中該哺乳動物細胞為人類細胞且該第一去氧核糖核酸序列與SEQ ID NO: 1至少90%一致。
- 如請求項51至59中任一項之哺乳動物細胞,其中該哺乳動物細胞為CHO細胞且該第一去氧核糖核酸序列與SEQ ID NO: 2至少90%一致。
- 如請求項60之哺乳動物細胞,其中該哺乳動物細胞為人類細胞且該第一去氧核糖核酸序列與SEQ ID NO: 1至少95%一致。
- 如請求項61之哺乳動物細胞,其中該哺乳動物細胞為CHO細胞且該第一去氧核糖核酸序列與SEQ ID NO: 2至少95%一致。
- 如請求項62之哺乳動物細胞,其中該哺乳動物細胞為人類細胞且該第一去氧核糖核酸序列與SEQ ID NO: 1至少98%一致。
- 如請求項63之哺乳動物細胞,其中該哺乳動物細胞為CHO細胞且該第一去氧核糖核酸序列與SEQ ID NO: 2至少98%一致。
- 如請求項64之哺乳動物細胞,其中該哺乳動物細胞為人類細胞且該第一去氧核糖核酸序列與SEQ ID NO: 1至少99%一致。
- 如請求項65之哺乳動物細胞,其中該哺乳動物細胞為CHO細胞且該第一去氧核糖核酸序列與SEQ ID NO: 2至少99%一致。
- 如請求項61、63、65或67中任一項之哺乳動物細胞,其中該第一去氧核糖核酸序列包含使用選自由SEQ ID NO: 13至419所組成之群組之導引序列產生的穩定整合位點。
- 如請求項61、63、65或67中任一項之哺乳動物細胞,其中該第一去氧核糖核酸序列包含藉由使用在選自由以下所組成之群組的核苷酸位置範圍處與SEQ ID NO: 2中之目標序列互補的導引序列產生的穩定整合位點:(a) 1至2000;(b) 2001至4000;(c) 4001至6000;(d) 6001至8000;(e) 8001至10,000;(f) 10,001至12,000;(g) 12,001至14,000;(h) 14,001至16,000;(i) 16,001至18,000;(j) 18,001至20,000;(k) 20,001至22,000;(l) 22,001至24,000;(m) 24,001至26,000;(n) 26,001至28,000;(o) 28,001至30,000;(p) 30,001至32,000;(q) 32,001至34,000;(r) 34,001至36,000;(s) 36,001至38,000;(t) 38,001至40,000;(u) 40,001至42,000;及(v) 42,001至44,232。
- 一種哺乳動物細胞,其包含經修飾基因體, 其中該經修飾基因體包含去氧核糖核酸序列,該去氧核糖核酸序列包含藉由插入至少一個DNA卡匣而經修飾的AAVS1樣區域,及 其中選自由SEQ ID NO: 13至419所組成之群組的導引序列與該AAVS1樣區域之有義股或反義股互補。
- 如請求項70之哺乳動物細胞,其進一步包含 第二去氧核糖核酸序列,其在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少90%一致;及 第三去氧核糖核酸序列,其在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少90%一致, 其中該第一去氧核糖核酸序列藉由插入第一DNA卡匣而經修飾,該第二去氧核糖核酸序列藉由插入第二DNA卡匣而經修飾,且該第三去氧核糖核酸序列藉由插入第三DNA卡匣而經修飾。
- 如請求項71之哺乳動物細胞,其中該第二去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少90%至99%、95%至99%或98%至99%一致;且該第三去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少90%至99%、95%至99%或98%至99%一致。
- 如請求項70至72中任一項之哺乳動物細胞,其中該第一去氧核糖核酸序列包含藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少50%至99%一致性之目標序列互補的導引序列產生的穩定整合位點: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 如請求項73之哺乳動物細胞,其中該第一去氧核糖核酸序列包含藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少75%至99%一致性之目標序列互補的導引序列產生的穩定整合位點: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 如請求項74之哺乳動物細胞,其中該第一去氧核糖核酸序列包含藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少85%至99%一致性之目標序列互補的導引序列產生的穩定整合位點: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 如請求項75之哺乳動物細胞,其中該第一去氧核糖核酸序列包含藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少90%至99%一致性之目標序列互補的導引序列產生的穩定整合位點: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 如請求項76之哺乳動物細胞,其中該第一去氧核糖核酸序列包含藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少95%至99%一致性之目標序列互補的導引序列產生的穩定整合位點: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 如請求項77之哺乳動物細胞,其中該第一去氧核糖核酸序列包含藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少98%至99%一致性之目標序列互補的導引序列產生的穩定整合位點: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 一種哺乳動物細胞,其包含經修飾基因體, 其中該經修飾基因體包含AAVS1樣區域中之穩定整合位點,其中該穩定整合位點係藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少50%至99%一致性之目標序列互補的導引序列產生: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 如請求項79之哺乳動物細胞,其中該經修飾基因體包含AAVS1樣區域中之穩定整合位點,其中該穩定整合位點係藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少75%至99%一致性之目標序列互補的導引序列產生: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 如請求項80之哺乳動物細胞,其中該經修飾基因體包含AAVS1樣區域中之穩定整合位點,其中該穩定整合位點係藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少85%至99%一致性之目標序列互補的導引序列產生: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 如請求項81之哺乳動物細胞,其中該經修飾基因體包含AAVS1樣區域中之穩定整合位點,其中該穩定整合位點係藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少90%至99%一致性之目標序列互補的導引序列產生: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 如請求項82之哺乳動物細胞,其中該經修飾基因體包含AAVS1樣區域中之穩定整合位點,其中該穩定整合位點係藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少95%至99%一致性之目標序列互補的導引序列產生: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 如請求項83之哺乳動物細胞,其中該經修飾基因體包含AAVS1樣區域中之穩定整合位點,其中該穩定整合位點係藉由使用在以下核苷酸位置處與至少一個與SEQ ID NO: 2具有至少98%至99%一致性之目標序列互補的導引序列產生: (a) 1至2000;或(b) 2001至4000;或(c) 4001至6000;或(d) 6001至8000;或(e) 8001至10,000;或(f) 10,001至12,000;或(g) 12,001至14,000;或(h) 14,001至16,000;或(i) 16,001至18,000;或(j) 18,001至20,000;或(k) 20,001至22,000;或(l) 22,001至24,000;或(m) 24,001至26,000;或(n) 26,001至28,000;或(o) 28,001至30,000;或(p) 30,001至32,000;或(q) 32,001至34,000;或(r) 34,001至36,000;或(s) 36,001至38,000;或(t) 38,001至40,000;或(u) 40,001至42,000;或(v) 42,001至44,232。
- 如請求項78至84中任一項之哺乳動物細胞,其進一步包含 第二去氧核糖核酸序列,其在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少90%一致;及 第三去氧核糖核酸序列,其在修飾之前與選自由SEQ ID NO: 11及SEQ ID NO: 12所組成之群組的至少一者至少90%一致, 其中該第一去氧核糖核酸序列藉由插入第一DNA卡匣而經修飾,該第二去氧核糖核酸序列藉由插入第二DNA卡匣而經修飾,且該第三去氧核糖核酸序列藉由插入第三DNA卡匣而經修飾。
- 如請求項85之哺乳動物細胞,其中該第二去氧核糖核酸序列在修飾之前與選自由SEQ ID NO: 5至10所組成之群組的至少一者至少90%至99%、95%至99%或98%至99%一致;且該第三去氧核糖核酸序列在修飾之前與選自由SEQ ID NO:11及SEQ ID NO: 12所組成之群組的至少一者至少90%至99%、95%至99%或98%至99%一致。
- 一種產生蛋白質之方法,其中該方法包含以下步驟: (1) 培養如請求項51至86之哺乳動物細胞;及 (2) 收穫該蛋白質。
- 一種細胞,其根據上述方法中之任一者。
- 一種方法,其使用上述細胞中之任一者。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163256675P | 2021-10-18 | 2021-10-18 | |
US63/256,675 | 2021-10-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202334402A true TW202334402A (zh) | 2023-09-01 |
Family
ID=84359032
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111139393A TW202334402A (zh) | 2021-10-18 | 2022-10-18 | 包含整合cas9基因以產生穩定整合位點的哺乳動物細胞,以及包含穩定整合位點及其他位點的哺乳動物細胞 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20230287460A1 (zh) |
EP (1) | EP4419698A1 (zh) |
KR (1) | KR20240099242A (zh) |
CN (1) | CN118451189A (zh) |
AR (1) | AR127674A1 (zh) |
AU (1) | AU2022373655A1 (zh) |
CA (1) | CA3235566A1 (zh) |
IL (1) | IL312192A (zh) |
MX (1) | MX2024004692A (zh) |
TW (1) | TW202334402A (zh) |
WO (1) | WO2023069931A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008151219A1 (en) | 2007-06-04 | 2008-12-11 | Regeneron Pharmaceuticals, Inc. | Enhanced expression and stability regions |
MX2017005306A (es) | 2014-10-23 | 2018-01-09 | Regeneron Pharma | Novedosos sitios de integracion en celulas cho y usos de estos. |
CA3015389A1 (en) | 2016-04-20 | 2017-10-26 | Regeneron Pharmaceuticals, Inc. | Compositions and methods for making antibodies based on use of expression-enhancing loci |
US11781116B2 (en) * | 2017-02-17 | 2023-10-10 | Lonza Ltd. | Mammalian cells for producing adeno-associated viruses |
-
2022
- 2022-10-18 CN CN202280070148.5A patent/CN118451189A/zh active Pending
- 2022-10-18 AU AU2022373655A patent/AU2022373655A1/en active Pending
- 2022-10-18 CA CA3235566A patent/CA3235566A1/en active Pending
- 2022-10-18 KR KR1020247014479A patent/KR20240099242A/ko unknown
- 2022-10-18 EP EP22803451.8A patent/EP4419698A1/en active Pending
- 2022-10-18 AR ARP220102826A patent/AR127674A1/es unknown
- 2022-10-18 TW TW111139393A patent/TW202334402A/zh unknown
- 2022-10-18 WO PCT/US2022/078275 patent/WO2023069931A1/en active Application Filing
- 2022-10-18 IL IL312192A patent/IL312192A/en unknown
- 2022-10-18 MX MX2024004692A patent/MX2024004692A/es unknown
- 2022-10-18 US US18/047,357 patent/US20230287460A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2023069931A1 (en) | 2023-04-27 |
US20230287460A1 (en) | 2023-09-14 |
AU2022373655A1 (en) | 2024-05-09 |
CA3235566A1 (en) | 2023-04-27 |
AR127674A1 (es) | 2024-02-21 |
MX2024004692A (es) | 2024-05-06 |
CN118451189A (zh) | 2024-08-06 |
EP4419698A1 (en) | 2024-08-28 |
IL312192A (en) | 2024-06-01 |
KR20240099242A (ko) | 2024-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2150617T3 (en) | Regions with increased expression and stability | |
AU2019250224B2 (en) | Enhanced transgene expression and processing | |
KR101476010B1 (ko) | 고생산성 세포의 수립을 위한 발현 벡터 및 고생산성 세포 | |
Koromilas et al. | mRNAs containing extensive secondary structure in their 5′ non‐coding region translate efficiently in cells overexpressing initiation factor eIF‐4E. | |
KR100917939B1 (ko) | 신규한 발현 벡터 | |
KR102531749B1 (ko) | Cho 세포 내 통합 부위 | |
KR20210143897A (ko) | 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합 | |
KR20210144861A (ko) | 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위 | |
AU762274B2 (en) | Expression vectors containing hot spot for increased recombinant protein expression in transfected cells | |
KR20220002609A (ko) | 포유동물 세포의 특성을 변경하기 위한 인공 마이크로-rna 및 이들 생성물의 조성물을 사용한 포유동물 세포의 변형 | |
US20030051266A1 (en) | Collections of transgenic animal lines (living library) | |
AU2018204332A1 (en) | Expression cassette | |
AU2017227596A1 (en) | Dividing of reporter proteins by DNA sequences and its application in site specific recombination | |
KR102553990B1 (ko) | Hspa5 유전자의 프로모터 | |
US20230287460A1 (en) | Mammalian cells comprising integrated cas9 genes to produce stable integration sites, and mammalian cells comprising stable integration sites and other sites | |
CN113874512A (zh) | 诱导毛细胞分化的组合物和方法 | |
US20230304062A1 (en) | Controlled transcription of polynucleotides | |
US20230193312A1 (en) | Eukaryotic cells comprising adenovirus-associated virus polynucleotides | |
CN109295000B (zh) | 一种多能干细胞形成必需蛋白crept在诱导多能干细胞中的应用 | |
KR20220133248A (ko) | 인간화 pnpla3 좌위를 포함하는 비-인간 동물 및 사용 방법 | |
Sinegubova et al. | Promoter from Chinese hamster elongation factor-1a gene and Epstein-Barr virus terminal repeats concatemer fragment maintain stable high-level expression of recombinant proteins | |
RU2814721C2 (ru) | Транспозиция конструкций нуклеиновой кислоты в эукариотические геномы с транспозазой из amyelois | |
RU2817770C2 (ru) | Интеграция конструкций нуклеиновой кислоты в эукариотические клетки с транспозазой из oryzias | |
CN111321171A (zh) | 一种应用CRISPR/Cas9介导ES打靶技术制备基因打靶动物模型的方法 | |
US20100190160A1 (en) | Indicator cell lines and methods for making same |