CN112805387A - 用于制备病毒载体的组合物和方法 - Google Patents
用于制备病毒载体的组合物和方法 Download PDFInfo
- Publication number
- CN112805387A CN112805387A CN201980066189.5A CN201980066189A CN112805387A CN 112805387 A CN112805387 A CN 112805387A CN 201980066189 A CN201980066189 A CN 201980066189A CN 112805387 A CN112805387 A CN 112805387A
- Authority
- CN
- China
- Prior art keywords
- edad
- aav
- gene
- protein
- genome
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 239000013603 viral vector Substances 0.000 title abstract description 21
- 239000000203 mixture Substances 0.000 title description 8
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 216
- 241000701161 unidentified adenovirus Species 0.000 claims abstract description 88
- 238000004519 manufacturing process Methods 0.000 claims abstract description 87
- 241000700605 Viruses Species 0.000 claims abstract description 69
- 230000003612 virological effect Effects 0.000 claims abstract description 66
- 239000002245 particle Substances 0.000 claims abstract description 63
- 230000002950 deficient Effects 0.000 claims abstract description 48
- 238000004806 packaging method and process Methods 0.000 claims description 92
- 230000014509 gene expression Effects 0.000 claims description 78
- 102000004169 proteins and genes Human genes 0.000 claims description 72
- 230000037430 deletion Effects 0.000 claims description 55
- 238000012217 deletion Methods 0.000 claims description 55
- 108091026890 Coding region Proteins 0.000 claims description 54
- 230000035772 mutation Effects 0.000 claims description 42
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 claims description 25
- 241000713666 Lentivirus Species 0.000 claims description 25
- NTIZESTWPVYFNL-UHFFFAOYSA-N Methyl isobutyl ketone Chemical compound CC(C)CC(C)=O NTIZESTWPVYFNL-UHFFFAOYSA-N 0.000 claims description 23
- 108090000565 Capsid Proteins Proteins 0.000 claims description 21
- 102100023321 Ceruloplasmin Human genes 0.000 claims description 20
- 101710193695 Capsid protein precursor Proteins 0.000 claims description 13
- 239000000835 fiber Substances 0.000 claims description 13
- CXURGFRDGROIKG-UHFFFAOYSA-N 3,3-bis(chloromethyl)oxetane Chemical compound ClCC1(CCl)COC1 CXURGFRDGROIKG-UHFFFAOYSA-N 0.000 claims description 12
- 101150032643 IVa2 gene Proteins 0.000 claims description 10
- 101800001847 Core protein precursor Proteins 0.000 claims description 8
- 102000009123 Fibrin Human genes 0.000 claims description 7
- 108010073385 Fibrin Proteins 0.000 claims description 7
- BWGVNKXGVNDBDI-UHFFFAOYSA-N Fibrin monomer Chemical compound CNC(=O)CNC(=O)CN BWGVNKXGVNDBDI-UHFFFAOYSA-N 0.000 claims description 7
- 101710101995 Pre-hexon-linking protein IIIa Proteins 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 229950003499 fibrin Drugs 0.000 claims description 7
- 101710159527 Maturation protein A Proteins 0.000 claims description 6
- 101710091157 Maturation protein A2 Proteins 0.000 claims description 6
- 108091005804 Peptidases Proteins 0.000 claims description 5
- 108010015780 Viral Core Proteins Proteins 0.000 claims description 5
- 238000003306 harvesting Methods 0.000 claims description 5
- 230000004543 DNA replication Effects 0.000 claims description 4
- 101710190380 Packaging protein 2 Proteins 0.000 claims description 4
- 101710193132 Pre-hexon-linking protein VIII Proteins 0.000 claims description 4
- 101710143509 Pre-histone-like nucleoprotein Proteins 0.000 claims description 4
- 239000004365 Protease Substances 0.000 claims description 4
- 101710196756 Protein 33K Proteins 0.000 claims description 4
- 230000002829 reductive effect Effects 0.000 claims description 4
- 101710188314 Protein V Proteins 0.000 claims description 3
- 101710177291 Gag polyprotein Proteins 0.000 claims description 2
- 101710125418 Major capsid protein Proteins 0.000 claims 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims 1
- 108010089520 pol Gene Products Proteins 0.000 claims 1
- 150000007523 nucleic acids Chemical group 0.000 abstract description 89
- 230000006870 function Effects 0.000 abstract description 70
- 208000015181 infectious disease Diseases 0.000 abstract description 52
- 230000010076 replication Effects 0.000 abstract description 42
- 230000002458 infectious effect Effects 0.000 abstract description 31
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 23
- 108020005202 Viral DNA Proteins 0.000 abstract description 3
- 239000001963 growth medium Substances 0.000 abstract description 2
- 239000012228 culture supernatant Substances 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 290
- 239000013598 vector Substances 0.000 description 137
- 102000039446 nucleic acids Human genes 0.000 description 68
- 108020004707 nucleic acids Proteins 0.000 description 68
- 239000000047 product Substances 0.000 description 55
- 108020004414 DNA Proteins 0.000 description 49
- 239000013612 plasmid Substances 0.000 description 35
- 239000013607 AAV vector Substances 0.000 description 33
- 108091027544 Subgenomic mRNA Proteins 0.000 description 25
- 239000002773 nucleotide Substances 0.000 description 25
- 125000003729 nucleotide group Chemical group 0.000 description 25
- 229920001184 polypeptide Polymers 0.000 description 23
- 102000004196 processed proteins & peptides Human genes 0.000 description 23
- 108090000765 processed proteins & peptides Proteins 0.000 description 23
- 210000002845 virion Anatomy 0.000 description 23
- 239000012634 fragment Substances 0.000 description 22
- 238000013518 transcription Methods 0.000 description 21
- 230000035897 transcription Effects 0.000 description 21
- 238000012546 transfer Methods 0.000 description 21
- 108091033409 CRISPR Proteins 0.000 description 18
- 241000725303 Human immunodeficiency virus Species 0.000 description 18
- 101150036876 cre gene Proteins 0.000 description 18
- 101710149951 Protein Tat Proteins 0.000 description 17
- 238000006467 substitution reaction Methods 0.000 description 17
- 210000000234 capsid Anatomy 0.000 description 14
- 108020004999 messenger RNA Proteins 0.000 description 14
- 238000001890 transfection Methods 0.000 description 14
- 108020005004 Guide RNA Proteins 0.000 description 13
- 239000003623 enhancer Substances 0.000 description 13
- 238000010354 CRISPR gene editing Methods 0.000 description 12
- 230000001105 regulatory effect Effects 0.000 description 12
- 238000010361 transduction Methods 0.000 description 12
- 230000026683 transduction Effects 0.000 description 12
- 241001135569 Human adenovirus 5 Species 0.000 description 11
- 241000711975 Vesicular stomatitis virus Species 0.000 description 11
- 230000037431 insertion Effects 0.000 description 11
- 238000003780 insertion Methods 0.000 description 11
- 230000001404 mediated effect Effects 0.000 description 11
- 241001529453 unidentified herpesvirus Species 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 10
- 108700019146 Transgenes Proteins 0.000 description 9
- 108010027225 gag-pol Fusion Proteins Proteins 0.000 description 9
- 108700039887 Essential Genes Proteins 0.000 description 8
- 230000004913 activation Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000001415 gene therapy Methods 0.000 description 8
- 230000010354 integration Effects 0.000 description 8
- 230000006798 recombination Effects 0.000 description 8
- 238000005215 recombination Methods 0.000 description 8
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 7
- 241000125945 Protoparvovirus Species 0.000 description 7
- 241000700584 Simplexvirus Species 0.000 description 7
- 239000002299 complementary DNA Substances 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 210000004962 mammalian cell Anatomy 0.000 description 7
- 230000008685 targeting Effects 0.000 description 7
- 108010051219 Cre recombinase Proteins 0.000 description 6
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 6
- 108700026244 Open Reading Frames Proteins 0.000 description 6
- 108091034131 VA RNA Proteins 0.000 description 6
- 238000002744 homologous recombination Methods 0.000 description 6
- 230000006801 homologous recombination Effects 0.000 description 6
- 238000010369 molecular cloning Methods 0.000 description 6
- 230000001177 retroviral effect Effects 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 5
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 5
- 241000713869 Moloney murine leukemia virus Species 0.000 description 5
- 101710163270 Nuclease Proteins 0.000 description 5
- 241000700618 Vaccinia virus Species 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- -1 pseudoisocytosine Chemical compound 0.000 description 5
- 108700004027 tat Genes Proteins 0.000 description 5
- 101150098170 tat gene Proteins 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 4
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 4
- 102100034349 Integrase Human genes 0.000 description 4
- 101710150344 Protein Rev Proteins 0.000 description 4
- 241000714474 Rous sarcoma virus Species 0.000 description 4
- 101150038500 cas9 gene Proteins 0.000 description 4
- 108700004025 env Genes Proteins 0.000 description 4
- 238000001476 gene delivery Methods 0.000 description 4
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108020003175 receptors Proteins 0.000 description 4
- 102000005962 receptors Human genes 0.000 description 4
- 238000010839 reverse transcription Methods 0.000 description 4
- 238000010561 standard procedure Methods 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 108091079001 CRISPR RNA Proteins 0.000 description 3
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 3
- 241000701022 Cytomegalovirus Species 0.000 description 3
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 108091029865 Exogenous DNA Proteins 0.000 description 3
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 3
- 108090000288 Glycoproteins Proteins 0.000 description 3
- 102000003886 Glycoproteins Human genes 0.000 description 3
- 208000031886 HIV Infections Diseases 0.000 description 3
- 241000713340 Human immunodeficiency virus 2 Species 0.000 description 3
- 241001529936 Murinae Species 0.000 description 3
- 102100038313 Transcription factor E2-alpha Human genes 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 101150047047 gag-pol gene Proteins 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 239000013608 rAAV vector Substances 0.000 description 3
- 101150066583 rep gene Proteins 0.000 description 3
- 230000003362 replicative effect Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000003151 transfection method Methods 0.000 description 3
- HPZMWTNATZPBIH-UHFFFAOYSA-N 1-methyladenine Chemical compound CN1C=NC2=NC=NC2=C1N HPZMWTNATZPBIH-UHFFFAOYSA-N 0.000 description 2
- RFLVMTUMFYRZCB-UHFFFAOYSA-N 1-methylguanine Chemical compound O=C1N(C)C(N)=NC2=C1N=CN2 RFLVMTUMFYRZCB-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 2
- 101000768957 Acholeplasma phage L2 Uncharacterized 37.2 kDa protein Proteins 0.000 description 2
- 101000823746 Acidianus ambivalens Uncharacterized 17.7 kDa protein in bps2 3'region Proteins 0.000 description 2
- 101000916369 Acidianus ambivalens Uncharacterized protein in sor 5'region Proteins 0.000 description 2
- 101000769342 Acinetobacter guillouiae Uncharacterized protein in rpoN-murA intergenic region Proteins 0.000 description 2
- 101000823696 Actinobacillus pleuropneumoniae Uncharacterized glycosyltransferase in aroQ 3'region Proteins 0.000 description 2
- 108010057856 Adenovirus E2 Proteins Proteins 0.000 description 2
- 101000786513 Agrobacterium tumefaciens (strain 15955) Uncharacterized protein outside the virF region Proteins 0.000 description 2
- 101000618005 Alkalihalobacillus pseudofirmus (strain ATCC BAA-2126 / JCM 17055 / OF4) Uncharacterized protein BpOF4_00885 Proteins 0.000 description 2
- 102100020724 Ankyrin repeat, SAM and basic leucine zipper domain-containing protein 1 Human genes 0.000 description 2
- 101000967489 Azorhizobium caulinodans (strain ATCC 43989 / DSM 5975 / JCM 20966 / LMG 6465 / NBRC 14845 / NCIMB 13405 / ORS 571) Uncharacterized protein AZC_3924 Proteins 0.000 description 2
- 101000823761 Bacillus licheniformis Uncharacterized 9.4 kDa protein in flaL 3'region Proteins 0.000 description 2
- 101000819719 Bacillus methanolicus Uncharacterized N-acetyltransferase in lysA 3'region Proteins 0.000 description 2
- 101000765604 Bacillus subtilis (strain 168) FlaA locus 22.9 kDa protein Proteins 0.000 description 2
- 101000789586 Bacillus subtilis (strain 168) UPF0702 transmembrane protein YkjA Proteins 0.000 description 2
- 101000792624 Bacillus subtilis (strain 168) Uncharacterized protein YbxH Proteins 0.000 description 2
- 101000790792 Bacillus subtilis (strain 168) Uncharacterized protein YckC Proteins 0.000 description 2
- 101000819705 Bacillus subtilis (strain 168) Uncharacterized protein YlxR Proteins 0.000 description 2
- 101000948218 Bacillus subtilis (strain 168) Uncharacterized protein YtxJ Proteins 0.000 description 2
- 101000718627 Bacillus thuringiensis subsp. kurstaki Putative RNA polymerase sigma-G factor Proteins 0.000 description 2
- 101000641200 Bombyx mori densovirus Putative non-structural protein Proteins 0.000 description 2
- 101000964402 Caldicellulosiruptor saccharolyticus Uncharacterized protein in xynC 3'region Proteins 0.000 description 2
- 101000947633 Claviceps purpurea Uncharacterized 13.8 kDa protein Proteins 0.000 description 2
- 208000003322 Coinfection Diseases 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 101710114676 E1B 55 kDa protein Proteins 0.000 description 2
- 101710175001 E1B protein, small T-antigen Proteins 0.000 description 2
- 101000948901 Enterobacteria phage T4 Uncharacterized 16.0 kDa protein in segB-ipI intergenic region Proteins 0.000 description 2
- 101000805958 Equine herpesvirus 4 (strain 1942) Virion protein US10 homolog Proteins 0.000 description 2
- 101000790442 Escherichia coli Insertion element IS2 uncharacterized 11.1 kDa protein Proteins 0.000 description 2
- 101000788354 Escherichia phage P2 Uncharacterized 8.2 kDa protein in gpA 5'region Proteins 0.000 description 2
- 108010046276 FLP recombinase Proteins 0.000 description 2
- 101000770304 Frankia alni UPF0460 protein in nifX-nifW intergenic region Proteins 0.000 description 2
- 101000797344 Geobacillus stearothermophilus Putative tRNA (cytidine(34)-2'-O)-methyltransferase Proteins 0.000 description 2
- 101000748410 Geobacillus stearothermophilus Uncharacterized protein in fumA 3'region Proteins 0.000 description 2
- 101000772675 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) UPF0438 protein HI_0847 Proteins 0.000 description 2
- 101000631019 Haemophilus influenzae (strain ATCC 51907 / DSM 11121 / KW20 / Rd) Uncharacterized protein HI_0350 Proteins 0.000 description 2
- 101000768938 Haemophilus phage HP1 (strain HP1c1) Uncharacterized 8.9 kDa protein in int-C1 intergenic region Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000785414 Homo sapiens Ankyrin repeat, SAM and basic leucine zipper domain-containing protein 1 Proteins 0.000 description 2
- 101000833492 Homo sapiens Jouberin Proteins 0.000 description 2
- 101000651236 Homo sapiens NCK-interacting protein with SH3 domain Proteins 0.000 description 2
- 108010070875 Human Immunodeficiency Virus tat Gene Products Proteins 0.000 description 2
- 101000908757 Human adenovirus C serotype 2 Early 4 ORF4 protein Proteins 0.000 description 2
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 2
- 241000701027 Human herpesvirus 6 Species 0.000 description 2
- 102100024407 Jouberin Human genes 0.000 description 2
- 101000782488 Junonia coenia densovirus (isolate pBRJ/1990) Putative non-structural protein NS2 Proteins 0.000 description 2
- 101000811523 Klebsiella pneumoniae Uncharacterized 55.8 kDa protein in cps region Proteins 0.000 description 2
- 101000818409 Lactococcus lactis subsp. lactis Uncharacterized HTH-type transcriptional regulator in lacX 3'region Proteins 0.000 description 2
- 101000878851 Leptolyngbya boryana Putative Fe(2+) transport protein A Proteins 0.000 description 2
- 101000977779 Lymantria dispar multicapsid nuclear polyhedrosis virus Uncharacterized 33.9 kDa protein in PE 3'region Proteins 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 101000758828 Methanosarcina barkeri (strain Fusaro / DSM 804) Uncharacterized protein Mbar_A1602 Proteins 0.000 description 2
- 101001122401 Middle East respiratory syndrome-related coronavirus (isolate United Kingdom/H123990006/2012) Non-structural protein ORF3 Proteins 0.000 description 2
- 101001055788 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) Pentapeptide repeat protein MfpA Proteins 0.000 description 2
- HYVABZIGRDEKCD-UHFFFAOYSA-N N(6)-dimethylallyladenine Chemical compound CC(C)=CCNC1=NC=NC2=C1N=CN2 HYVABZIGRDEKCD-UHFFFAOYSA-N 0.000 description 2
- 101000827630 Narcissus mosaic virus Uncharacterized 10 kDa protein Proteins 0.000 description 2
- 101000740670 Orgyia pseudotsugata multicapsid polyhedrosis virus Protein C42 Proteins 0.000 description 2
- 241000701945 Parvoviridae Species 0.000 description 2
- 101000769182 Photorhabdus luminescens Uncharacterized protein in pnp 3'region Proteins 0.000 description 2
- 101710124413 Portal protein Proteins 0.000 description 2
- 101000961392 Pseudescherichia vulneris Uncharacterized 29.9 kDa protein in crtE 3'region Proteins 0.000 description 2
- 101000731030 Pseudomonas oleovorans Poly(3-hydroxyalkanoate) polymerase 2 Proteins 0.000 description 2
- 101001065485 Pseudomonas putida Probable fatty acid methyltransferase Proteins 0.000 description 2
- 101710147134 Putative transposase for insertion sequence element IS986/IS6110 Proteins 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 101000711023 Rhizobium leguminosarum bv. trifolii Uncharacterized protein in tfuA 3'region Proteins 0.000 description 2
- 101000948156 Rhodococcus erythropolis Uncharacterized 47.3 kDa protein in thcA 5'region Proteins 0.000 description 2
- 101000917565 Rhodococcus fascians Uncharacterized 33.6 kDa protein in fasciation locus Proteins 0.000 description 2
- 101710083205 SAR-endolysin Proteins 0.000 description 2
- 101000790284 Saimiriine herpesvirus 2 (strain 488) Uncharacterized 9.5 kDa protein in DHFR 3'region Proteins 0.000 description 2
- 101000936719 Streptococcus gordonii Accessory Sec system protein Asp3 Proteins 0.000 description 2
- 101000788499 Streptomyces coelicolor Uncharacterized oxidoreductase in mprA 5'region Proteins 0.000 description 2
- 101001102841 Streptomyces griseus Purine nucleoside phosphorylase ORF3 Proteins 0.000 description 2
- 101000708557 Streptomyces lincolnensis Uncharacterized 17.2 kDa protein in melC2-rnhH intergenic region Proteins 0.000 description 2
- 101710092804 Tail tube protein gp19 Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 101000649826 Thermotoga neapolitana Putative anti-sigma factor antagonist TM1081 homolog Proteins 0.000 description 2
- 101710099762 Uncharacterized protein in sodM 3'region Proteins 0.000 description 2
- 101000827562 Vibrio alginolyticus Uncharacterized protein in proC 3'region Proteins 0.000 description 2
- 101000778915 Vibrio parahaemolyticus serotype O3:K6 (strain RIMD 2210633) Uncharacterized membrane protein VP2115 Proteins 0.000 description 2
- 108010084938 adenovirus receptor Proteins 0.000 description 2
- 125000003275 alpha amino acid group Chemical group 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000002306 biochemical method Methods 0.000 description 2
- 238000010170 biological method Methods 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 238000011109 contamination Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 101150030339 env gene Proteins 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 108700004026 gag Genes Proteins 0.000 description 2
- 101150098622 gag gene Proteins 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 238000001823 molecular biology technique Methods 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 108700004030 rev Genes Proteins 0.000 description 2
- 101150098213 rev gene Proteins 0.000 description 2
- 238000003153 stable transfection Methods 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 238000003146 transient transfection Methods 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- SATCOUWSAZBIJO-UHFFFAOYSA-N 1-methyladenine Natural products N=C1N(C)C=NC2=C1NC=N2 SATCOUWSAZBIJO-UHFFFAOYSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- HLYBTPMYFWWNJN-UHFFFAOYSA-N 2-(2,4-dioxo-1h-pyrimidin-5-yl)-2-hydroxyacetic acid Chemical compound OC(=O)C(O)C1=CNC(=O)NC1=O HLYBTPMYFWWNJN-UHFFFAOYSA-N 0.000 description 1
- SGAKLDIYNFXTCK-UHFFFAOYSA-N 2-[(2,4-dioxo-1h-pyrimidin-5-yl)methylamino]acetic acid Chemical compound OC(=O)CNCC1=CNC(=O)NC1=O SGAKLDIYNFXTCK-UHFFFAOYSA-N 0.000 description 1
- SVBOROZXXYRWJL-UHFFFAOYSA-N 2-[(4-oxo-2-sulfanylidene-1h-pyrimidin-5-yl)methylamino]acetic acid Chemical compound OC(=O)CNCC1=CNC(=S)NC1=O SVBOROZXXYRWJL-UHFFFAOYSA-N 0.000 description 1
- XMSMHKMPBNTBOD-UHFFFAOYSA-N 2-dimethylamino-6-hydroxypurine Chemical compound N1C(N(C)C)=NC(=O)C2=C1N=CN2 XMSMHKMPBNTBOD-UHFFFAOYSA-N 0.000 description 1
- SMADWRYCYBUIKH-UHFFFAOYSA-N 2-methyl-7h-purin-6-amine Chemical compound CC1=NC(N)=C2NC=NC2=N1 SMADWRYCYBUIKH-UHFFFAOYSA-N 0.000 description 1
- KOLPWZCZXAMXKS-UHFFFAOYSA-N 3-methylcytosine Chemical compound CN1C(N)=CC=NC1=O KOLPWZCZXAMXKS-UHFFFAOYSA-N 0.000 description 1
- GJAKJCICANKRFD-UHFFFAOYSA-N 4-acetyl-4-amino-1,3-dihydropyrimidin-2-one Chemical compound CC(=O)C1(N)NC(=O)NC=C1 GJAKJCICANKRFD-UHFFFAOYSA-N 0.000 description 1
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 1
- 101150017816 40 gene Proteins 0.000 description 1
- MQJSSLBGAQJNER-UHFFFAOYSA-N 5-(methylaminomethyl)-1h-pyrimidine-2,4-dione Chemical compound CNCC1=CNC(=O)NC1=O MQJSSLBGAQJNER-UHFFFAOYSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- KELXHQACBIUYSE-UHFFFAOYSA-N 5-methoxy-1h-pyrimidine-2,4-dione Chemical compound COC1=CNC(=O)NC1=O KELXHQACBIUYSE-UHFFFAOYSA-N 0.000 description 1
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- YYAYHWSNGRTDPU-UHFFFAOYSA-N 6-(2-diazohydrazinyl)-1h-pyrimidin-2-one Chemical compound [N-]=[N+]=NNC1=CC=NC(=O)N1 YYAYHWSNGRTDPU-UHFFFAOYSA-N 0.000 description 1
- UDZRZGNQQSUDNP-UHFFFAOYSA-N 6-(aminomethyl)-5-methoxy-2-sulfanylidene-1H-pyrimidin-4-one Chemical compound COC=1C(NC(NC=1CN)=S)=O UDZRZGNQQSUDNP-UHFFFAOYSA-N 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- SWJYOKZMYFJUOY-KQYNXXCUSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-6-(methylamino)-7h-purin-8-one Chemical compound OC1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SWJYOKZMYFJUOY-KQYNXXCUSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 101100524321 Adeno-associated virus 2 (isolate Srivastava/1982) Rep68 gene Proteins 0.000 description 1
- 101100524324 Adeno-associated virus 2 (isolate Srivastava/1982) Rep78 gene Proteins 0.000 description 1
- 208000010370 Adenoviridae Infections Diseases 0.000 description 1
- 108010024878 Adenovirus E1A Proteins Proteins 0.000 description 1
- 206010060931 Adenovirus infection Diseases 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 101710117545 C protein Proteins 0.000 description 1
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 102100025278 Coxsackievirus and adenovirus receptor Human genes 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 230000003682 DNA packaging effect Effects 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 201000011001 Ebola Hemorrhagic Fever Diseases 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 101710121417 Envelope glycoprotein Proteins 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 101150066002 GFP gene Proteins 0.000 description 1
- 101710168592 Gag-Pol polyprotein Proteins 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 241000713858 Harvey murine sarcoma virus Species 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 208000007514 Herpes zoster Diseases 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000961414 Homo sapiens Membrane cofactor protein Proteins 0.000 description 1
- 101000914484 Homo sapiens T-lymphocyte activation antigen CD80 Proteins 0.000 description 1
- 108010048209 Human Immunodeficiency Virus Proteins Proteins 0.000 description 1
- 241000598171 Human adenovirus sp. Species 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 241000701085 Human alphaherpesvirus 3 Species 0.000 description 1
- 241000701041 Human betaherpesvirus 7 Species 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 241001502974 Human gammaherpesvirus 8 Species 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 241000713326 Jaagsiekte sheep retrovirus Species 0.000 description 1
- ZQISRDCJNBUVMM-UHFFFAOYSA-N L-Histidinol Natural products OCC(N)CC1=CN=CN1 ZQISRDCJNBUVMM-UHFFFAOYSA-N 0.000 description 1
- ZQISRDCJNBUVMM-YFKPBYRVSA-N L-histidinol Chemical compound OC[C@@H](N)CC1=CNC=N1 ZQISRDCJNBUVMM-YFKPBYRVSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 208000032420 Latent Infection Diseases 0.000 description 1
- 101100385364 Listeria seeligeri serovar 1/2b (strain ATCC 35967 / DSM 20751 / CCM 3970 / CIP 100100 / NCTC 11856 / SLCC 3954 / 1120) cas13 gene Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 241000712899 Lymphocytic choriomeningitis mammarenavirus Species 0.000 description 1
- 102100039373 Membrane cofactor protein Human genes 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- SGSSKEDGVONRGC-UHFFFAOYSA-N N(2)-methylguanine Chemical compound O=C1NC(NC)=NC2=C1N=CN2 SGSSKEDGVONRGC-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 108090001074 Nucleocapsid Proteins Proteins 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 241000709664 Picornaviridae Species 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 101710150114 Protein rep Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 206010037742 Rabies Diseases 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 101710197208 Regulatory protein cro Proteins 0.000 description 1
- 101150051517 Rep68 gene Proteins 0.000 description 1
- 101150076399 Rep78 gene Proteins 0.000 description 1
- 241001068295 Replication defective viruses Species 0.000 description 1
- 101710152114 Replication protein Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108091081021 Sense strand Proteins 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 102100027222 T-lymphocyte activation antigen CD80 Human genes 0.000 description 1
- 101710120037 Toxin CcdB Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 101150037646 VP gene Proteins 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 208000011589 adenoviridae infectious disease Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 244000309743 astrovirus Species 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 101150059443 cas12a gene Proteins 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 208000037771 disease arising from reactivation of latent virus Diseases 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 238000009629 microbiological culture Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- XJVXMWNLQRTRGH-UHFFFAOYSA-N n-(3-methylbut-3-enyl)-2-methylsulfanyl-7h-purin-6-amine Chemical compound CSC1=NC(NCCC(C)=C)=C2NC=NC2=N1 XJVXMWNLQRTRGH-UHFFFAOYSA-N 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 230000012223 nuclear import Effects 0.000 description 1
- 238000001216 nucleic acid method Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000003950 pathogenic mechanism Effects 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000001566 pro-viral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 210000004777 protein coat Anatomy 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 241000712461 unidentified influenza virus Species 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000017613 viral reproduction Effects 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10343—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10341—Use of virus, viral particle or viral elements as a vector
- C12N2710/10344—Chimeric viral vector comprising heterologous viral elements for production of another viral vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/10011—Adenoviridae
- C12N2710/10311—Mastadenovirus, e.g. human or simian adenoviruses
- C12N2710/10351—Methods of production or purification of viral material
- C12N2710/10352—Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16041—Use of virus, viral particle or viral elements as a vector
- C12N2740/16043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16051—Methods of production or purification of viral material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14151—Methods of production or purification of viral material
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Virology (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
一种制备感染性重组病毒载体的方法,所述方法包括以下步骤:(a)用包含衣壳化缺陷型腺病毒(edAd)的第一病毒感染宿主细胞,所述edAd包含第一缺陷型病毒基因组;(b)将感染的宿主细胞在培养基中孵育足以产生感染性病毒颗粒的时间段;以及(c)回收分泌到培养上清液中的感染性病毒颗粒,其中所述edAd或所述宿主细胞包含经工程改造以表达感兴趣的靶基因的第二缺陷型病毒基因组,其中所述edAd或所述宿主细胞包含足以表达所述缺陷型病毒DNA复制所必须的腺病毒(Ad)辅助基因的核酸序列;并且其中所述edAd或所述宿主细胞包含核酸序列,所述核酸序列足以表达产生与所述第二病毒相对应的感染性复制缺陷型病毒颗粒所必须的辅助功能。
Description
相关申请的交叉引用
本申请要求于2018年10月9日提交的美国临时申请号62/743,362的优先权,其全部内容通过引用合并于此。
技术领域
本申请总体上涉及使用衣壳化缺陷型辅助病毒产生重组病毒载体的方法和组合物。
背景技术
当前的重组病毒产生方法通常利用腺病毒辅助功能来制备重组病毒载体以有效地递送基因。常规方法通常采用转染方法,导致低于最佳病毒效价且难以扩大规模。当使用辅助腺病毒时,重组载体制剂被辅助病毒污染。
因此,需要提供更有效的方法来产生高效价的病毒制剂,所述制剂不被衣壳化的辅助病毒污染或没有其他不期望的作用。
发明内容
本申请的一个方面涉及用于产生重组病毒载体的衣壳化缺陷型腺病毒(edAd)。edAd在其基因组中包含一个或多个突变,其导致(1)一种或多种衣壳化必需蛋白的显著降低的产生或不产生,和/或(2)一种或多种缺陷型衣壳化必需蛋白的产生。
本申请的另一方面涉及用于产生本申请的edAd的包装细胞系。包装细胞能够产生一种或多种基因产物,其允许在包装细胞内的edAd的衣壳化。
本申请的另一方面涉及产生重组病毒(RV)的方法。所述方法包括以下步骤:(a)用一种或多种edAd感染生产细胞以产生感染的生产细胞,(b)在允许产生具有RV基因组的RV的条件下孵育感染的生产细胞;以及(c)收获所述重组病毒,其中所述edAd或所述生产细胞包含所述RV基因组。
本申请的另一方面涉及用于产生重组病毒的生产细胞。所述生产细胞包含(a)所述重组病毒的基因组,或(b)编码产生所述重组病毒所需的产物的基因,或(a)和(b)两者。
附图说明
图1A和1B描绘了腺病毒颗粒及其结构组分。图1C显示了腺病毒转录单元,包括由其编码的多肽。晚期单元编码蛋白,所述蛋白构成突变靶标以产生衣壳化缺陷型Ad(edAd)。
图2是描述与用包装感受态Ad(pcAd)或edAd感染宿主细胞相关的功能结果的示意图。具体而言,pcAd会产生感染性的包装好的腺病毒颗粒;而edAd则不会。
图3是描绘wt(分图A)和突变Ad(edAd,分图B-E)基因组的示意图。分图B-E中的突变Ad包括pIIIa缺失,这使它们衣壳化有缺陷。edAd-dp3(分图B)具有野生型E1区,其允许在宿主细胞中进行DNA复制而无需E1a和E1b的表达。edAd-1g和edAd-2g(分图C和D)包括E1和E3中的缺失,并且只能在表达E1a和E1b蛋白的细胞系(例如293细胞)中复制其DNA。edAd-2g另外具有e4缺失,以进一步提高包装容量。edAd-2g病毒能够在具有pIIIa表达的911E4细胞系中生长。edAd-2g-E1(分图E)在E3、E4和pIIIa中具有另外缺失,但具有野生型E1区。
图4是描绘分图A-E中的几种不同的edAd的示意图,每种edAd均具有pIIIa缺失,使它们衣壳化有缺陷。此外,每种edAd均具有整合的AAV载体,用于产生表达期望靶基因的复制缺陷型AAV颗粒。AAV载体序列显示为替换Ad E3序列(分图A、B、D)或Ad E1序列(分图C、E)。分图C中的edAd1g-AAV-i1-cre在Ad E3区插入CMV-Cre表达单元,用于提供rAAV产生所必须的辅助基因功能的cre介导的激活。辅助基因功能的表达可通过cre介导的缺失或反转(inversion)终止序列而被激活。
图5是描绘了edAd的产生的示意图。在此,edAd中缺失的结构元件(例如pIIIa)由被稳定转化以反式表达缺失产物的宿主细胞提供。
图6是描绘在表达E1a和E1b辅助功能的宿主细胞(例如293细胞)中产生rAAV颗粒的常规三质粒转染方法的示意图。
图7是示意图,其描绘当以下情况时产生rAAV载体和pcAd或wt Ad:用含有具有AAVITR的缺陷型AAV基因组(其经工程改造以表达期望靶基因)的质粒和共表达Rep和Cap(以为rAAV产生提供辅助功能)的质粒共转染宿主细胞,以及还用wt Ad或pcAd(其为rAAV产生提供辅助功能)感染相同的宿主细胞。还产生wtAd和pcAd的副产物。
图8是描绘通过用edAd感染宿主细胞来产生rAAV载体的示意图。在这种情况下,宿主细胞(HeLa)用AAV rep和cap表达质粒以及带有AAV ITR的缺陷型AAV基因组稳定地转化,所述缺陷型AAV基因组经工程改造以表达期望的靶基因。尽管将具有E1区的感染性edAd-dp3施加于宿主细胞,但所得的rAAV不受腺病毒污染。
图9是描绘通过用edAd(例如图4的分图C中的edAd1g-AAV-i1-Cre)感染293细胞(其被稳定转化以表达E1a、E1b和可诱导型Rep-CapCap)来产生rAAV的示意图。在这种情况下,来自edAd的Cre的表达会切除构建入Rep表达单元中的内含子/聚A中的loxed片段,从而激活Rep表达。edAd还包含带有AAV ITR的缺陷型AAV基因组,所述基因组经工程改造以表达期望的靶基因。所得的rAAV不受Ad污染。Cre可以用其他表达诱导系统替代。
图10是描绘通过在Hela或A549宿主细胞中感染具有wt E1a/E1b区的edAd(edAd1g-AAV-E1)来产生rAAV的示意图。edAd还包含带有AAV ITR的缺陷型AAV基因组,所述基因组经工程改造以表达期望的靶基因。稳定转化Hela和A549宿主细胞以表达AAV Rep和Cap。所得的rAAV不受Ad污染。
图11是描绘在提供E1a/E1b、E2和E4辅助功能的293细胞中用具有E1a/E1b、E2、E3和E4缺失的edAd产生rAAV的示意图。具有cre基因的edAd2g-AAV-cre被设计用于去除构建入rep中的内含子中的loxed片段,从而激活rep表达。edAd2g-AAV/(Cre)还包含带有AAVITR的缺陷型AAV基因组,所述基因组经工程改造以表达期望的靶基因。所得的rAAV不受Ad污染。
图12是描绘产生第一代(分图A)、第二代(分图B)和第三代(分图C)慢病毒载体颗粒所必须的组分的示意图。
图13是描绘通过用所描绘的三种edAd感染宿主细胞(其被稳定转化以表达E1a和E1b)来产生第一代慢病毒颗粒的示意图。所得的慢病毒颗粒不受Ad污染。多种腺病毒编码的元件之一也可以整合到宿主细胞系中。可以通过以下来修改该示例:仅使用一种edAd,所述edAd带有用于产生载体的必要元件的组合,而其余元件整合到宿主细胞系中。
图14是描绘通过用所描绘的三种edAd感染宿主细胞(其被稳定转化以表达E1a和E1b)来产生第二代慢病毒颗粒的示意图。所得的慢病毒颗粒不受Ad污染。多种腺病毒编码的元件之一也可以整合到宿主细胞系中。可以通过以下来修改该示例:仅使用一种edAd,所述edAd带有用于产生载体的必要元件的组合,而其余元件整合到宿主细胞系中。
图15是描绘通过用经工程改造以表达慢病毒Env-Gag-Pol-Tat-Rev基因的edAd1g-gen2pl-env颗粒感染宿主细胞(其被稳定转化以表达E1a/E1b)来产生第二代慢病毒颗粒的示意图。在这种情况下,在宿主细胞中稳定转化经工程改造以表达期望的转基因的缺陷型慢病毒基因组。所得的慢病毒颗粒不受Ad污染。可以通过以下来修改该示例:仅使用一种edAd,所述edAd带有用于产生载体的必要元件的组合,而其余元件整合到宿主细胞系中。
图16是描绘用包含四种edAd的Tat非依赖性系统来产生第三代慢病毒颗粒的示意图。在这种情况下,用所示的四种edAd感染被稳定转化以表达E1a/E1b的宿主细胞。edAd1g-转基因颗粒包括缺陷型慢病毒自灭活(SIN)转移载体,其包含在所有慢病毒基因组中存在的聚嘌呤束(tract)顺式活性序列(cPPT)的中央拷贝(用于有效的核输入)、MSCV LTR启动子(MU3)(作为驱动转基因表达的内部启动子)、以及用于高水平转基因表达的WPRE(W)元件。其他三种edAd经工程改造以提供来自慢病毒gag-pol和rev蛋白以及来自水泡性口炎病毒(VSV)-G包膜糖蛋白的辅助功能。可以通过以下来修改该示例:仅使用一种edAd,所述edAd带有用于产生载体的必要元件的组合,而其余元件整合到宿主细胞系中。
图17是描绘用包含如先前在图16中所述的四种edAd(例外是edAd中的一种或多种包括E1a/E1b)的Tat非依赖性系统来产生第三代慢病毒颗粒的示意图。在这种情况下,宿主细胞(例如Hela或A549)不表达任何辅助功能;相反,辅助功能仅由所描绘的edAd(未描绘包含E1a/E1b序列)的组合提供。仅需要一种带有野生型E1区的腺病毒。可以通过以下来修改该示例:仅使用一种edAd,所述edAd带有用于产生载体的必要元件的组合,而其余元件整合到宿主宿主细胞系中。
图18是描绘通过用所描绘的两种edAd感染宿主细胞(其被稳定转化以表达E1a和E1b)来产生第一代慢病毒颗粒的示意图。慢病毒基因组现已整合到宿主染色体中。所得的慢病毒颗粒不受Ad污染。可以通过以下来修改该示例:仅使用一种edAd,所述edAd带有用于产生载体的必要元件的组合,而其余元件整合到宿主宿主细胞系中。
图19是描绘通过用所描绘的一种edAd感染宿主细胞(其被稳定转化以表达E1a、E1b、E4)来产生第三代慢病毒颗粒的示意图。慢病毒基因组现已整合到宿主染色体中。所得的慢病毒颗粒不受Ad污染。
尽管现在将详细描述本公开,并且结合说明性实施方式进行描述,但是本公开不受限于附图和所附权利要求中示出的特定实施方式。
具体实施方式
将详细参考本申请的某些方面和示例性实施方式,示出了所附结构和附图中的示例。将结合示例性实施方式,包括方法、材料和示例来描述本申请的各方面,这种描述是非限制性的,并且本申请的范围旨在涵盖通常已知的或并入此处的所有等同物、替代物和修改。除非另外定义,否则本文所用的全部技术术语和科学术语具有与本申请所属领域的普通技术人员通常所理解的相同意义。本领域的技术人员会认识到许多与此处描述的技术和材料相似或等同的技术和材料,其可以用于本申请的方面和实施方式的实践中。本申请的所描述的方面和实施方式不限于所描述的方法和材料。
除非上下文另外清楚地规定,否则在本说明书和所附权利要求中所使用时,不使用数量词限定和单数形式“一个(a)”、“一种(an)”和“所述(the)”包括复数个指示物。
在本文中范围可以表述为从“约”一个具体值,和/或至“约”其他具体值。当表述这样的范围时,另一个实施方式包括从一个具体值和/或到另一个具体值。类似地,当通过使用先行词“约”将值表示为近似值时,将理解所述特定值形成另一个实施方式。将进一步理解,每个范围的端点相关于另外的端点以及独立于另外的端点都是有意义的(significant)。还应当理解,本文公开了许多值,并且除了值本身之外,每个值在本文中也被公开为“约”该特定值。例如,如果公开了值“10”则也公开了“约10”。还应理解,如本领域技术人员适当理解的那样,当公开值时,“小于或等于“所述值”,大于或等于所述值”以及值之间的可能范围也被公开。例如,如果公开了值“10”,则还公开了“小于或等于10”以及“大于或等于10”。
除非另外定义,否则本文所用的全部技术和科学术语具有与本申请所属领域的普通技术人员通常所理解的相同的含义。通常,本文所用的命名法和下文所述的细胞培养、分子遗传学、核酸化学和杂交中的实验室程序是本领域众所周知的和常用的。标准技术用于重组核酸方法、多核苷酸合成以及微生物培养和转化(例如电穿孔、脂转染)。通常,酶促反应和纯化步骤根据制造商的说明书进行。技术和程序通常根据本领域的常规方法和各种一般参考文献进行(一般参见,Sambrook等人Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册],第2版(1989)Cold Spring Harbor Laboratory Press[冷泉港实验室出版社],Cold Spring Harbor[冷泉港],纽约(其通过引用并入本文),其贯穿本文档中提供。单位、前缀和符号可以用它们的SI接受形式表示。除非另有说明,否则核酸以5’至3’方向从左向右书写;氨基酸序列分别以氨基至羧基方向从左至右书写。数值范围包括定义范围的数字,并且包括定义范围内的每个整数。氨基酸在本文中可以用它们众所周知的三字母符号或IUPAC-IUB生化命名委员会推荐的单字母符号来表示。同样,核苷酸可以用它们通常被接受的单字母代码来指代。
定义
本文所用的术语“核酸”涵盖RNA和DNA两者,包括cDNA、基因组DNA和合成的(例如,化学合成的)DNA。核酸可以是双链或单链的。单链核酸可以是有义链或反义链。另外,核酸可以是环形或线性的。
“分离的核酸”是指与病毒基因组中存在的其他核酸分子(包括通常位于病毒基因组中核酸一侧或两侧的核酸)分开的核酸。本文关于核酸使用的术语“分离的”还包括任何非天然存在的核酸序列,因为这种非天然存在的序列在自然界中不存在并且在天然存在的基因组中不具有紧密连续的序列。
分离的核酸可以是例如DNA分子,条件是通常在天然存在的基因组中紧密侧接该DNA分子的核酸序列之一被去除或不存在。因此,分离的核酸包括但不限于作为独立于其他序列的单独分子(例如化学合成的核酸或cDNA或通过PCR或限制性内切核酸酶处理产生的基因组DNA片段)存在的DNA分子,以及掺入载体、自主复制质粒、病毒(例如任何副粘病毒、逆转录病毒、慢病毒、腺病毒或疱疹病毒)中或掺入原核生物或真核生物的基因组DNA中的DNA。另外,分离的核酸可以包括(经)工程改造的核酸,例如作为杂合或融合核酸的一部分的DNA分子。存在于例如cDNA文库或基因组文库或含有基因组DNA限制性消化物的凝胶切片中的数百至数百万其他核酸中的核酸不被认为是分离的核酸。
在一些实施方式中,核酸分子可以编码腺病毒的基因组,但所述基因组缺少至少一种腺病毒多肽编码序列的全部或一部分。可以使用任何适当的分子克隆技术(例如重组或定点诱变)来生成缺少纤维蛋白编码序列、V蛋白编码序列、六邻体(hexon)蛋白编码序列、五邻体基底(penton base)蛋白编码序列,VA RNA编码序列或pIII蛋白编码序列的全部或一部分的腺病毒核酸分子。同样,可以使用任何适当的分子克隆技术(例如,PCR、重组或限制性位点克隆)将核酸序列引入腺病毒的核酸分子中。可以通过标准技术将本文提供的核酸分子并入病毒中。例如,重组技术可用于将本文提供的核酸分子插入质粒或其他载体内的感染性病毒基因组或亚基因组中。在一些情况下,质粒或其他载体可以另外表达萤光素酶或其他报告基因。然后可以将病毒基因组转染到哺乳动物细胞中,以拯救经修饰的腺病毒。可替代地,可以将经修饰的亚基因组序列与其他亚基因组序列一起共转染到细胞中,从而使哺乳动物细胞将亚基因组重组为完整的基因组,从而产生新病毒。
“基因转移”或“基因递送”是指用于将外来(foreign)DNA插入宿主细胞的方法或系统。基因转移可导致非整合的转移的DNA的瞬时表达,转移的复制子(例如附加体)的染色体外复制和表达,或转移的遗传物质整合到宿主细胞的基因组DNA中。
“载体”是指任何遗传元件,例如质粒、噬菌体、转座子、粘粒、染色体、人工染色体、病毒、病毒粒子等,其当与适当的控制元件相关联时能够复制并且其能够在细胞之间转移基因序列。因此,所述术语包括克隆载体和表达载体,以及病毒载体。
“腺相关病毒反向末端重复序列”或“AAV ITR”是指在AAV基因组的每一端发现的本领域公认的区域,这些区域以顺式一起起作用,作为DNA复制的起点和病毒基因组的包装信号。AAV ITR与AAV rep编码区一起提供了两个侧翼ITR之间插入的核苷酸序列的有效切除和拯救,以及将其整合到哺乳动物细胞基因组中。
AAV ITR区的核苷酸序列是已知的。对于AAV-2序列,参见,例如,Kotin,R.M.(1994)Human Gene Therapy[人类基因疗法]5,793-801;Bems,K.I.“Parvoviridae andtheir Replication”in Fundamental Virology[基本病毒学中的“细小病毒科及其复制”],第2版(B.N.Fields和D.M.Knipe,编辑)。如本文所用,“AAV ITR”不必具有先前引用的参考文献中描述的野生型核苷酸序列,而是可以例如通过核苷酸的插入、缺失或取代而改变。此外,AAV ITR可以衍生自几种AAV血清型中的任何一种,包括但不限于AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-9、AAV-10、AAV-11、AAV-12和AAV-13。此外,在AAV载体中位于选定核苷酸序列侧翼的5’和3’ITR不必相同或衍生自相同的AAV血清型或分离株,只要它们按预期发挥功能即可,即允许从宿主细胞基因组或载体中切除和拯救感兴趣的序列,并且当细胞中存在AAV Rep基因产物时,允许将异源序列整合到接受体(recipient)细胞基因组中。
“AAV rep编码区”是指编码病毒的复制蛋白的AAV基因组的本领域公认区域,在潜伏感染期间,所述复制蛋白对于复制病毒基因组并将病毒基因组插入宿主基因组中是必需的。该术语还包括其功能同源物,例如人疱疹病毒6(HHV-6)rep基因,也已知其介导AAV-2DNA复制(Thomson等人(1994)Virology[病毒学]204,304-311)。有关AAV rep编码区的进一步说明,请参见例如,Muzyczka,N.(1992)Current Topics in Microbiol,and Immunol.[微生物和免疫学的最新主题]158,97-129;Kotin,R.M.(1994)Human Gene Therapy[人类基因疗法]5,793-801。如本文所用,rep编码区可以衍生自任何病毒血清型,例如上述的AAV血清型。所述区(域)不必包括所有野生型基因,但是可以例如通过核苷酸的插入、缺失或取代而被改变,只要存在的rep基因在合适的接受体细胞中表达时提供足够的整合功能即可。
术语“Rep的长形式”是指AAV rep编码区的Rep 78和Rep 68基因产物,包括其功能同源物。Rep的长形式通常在AAV p5启动子的指导下表达。
术语“Rep的短形式”是指AAV rep编码区的Rep 52和Rep 40基因产物,包括其功能同源物。Rep的短形式在AAV p19启动子的指导下表达。
“AAV cap编码区”是指AAV基因组的本领域公认的区域,其编码包装病毒基因组所需的病毒外壳蛋白。有关cap编码区的进一步说明,请参见例如,Muzyczka,N.(1992)Current Topics in Microbiol,and Immunol.[微生物和免疫学的最新主题]158,97-129;Kotin,R.M.(1994)Human Gene Therapy[人类基因疗法]5,793-801。如本文中所使用的,AAV cap编码区可以衍生自如上所述的任何AAV血清型。所述区(域)不必包括所有野生型cap基因,但可以例如通过核苷酸的插入、缺失或取代而被改变,只要所述基因与AAV载体一起存在于宿主细胞中时能提供足够的包装功能即可。
术语“AAV编码区”是指包括与AAV rep和cap编码区相对应的两个主要的AAV开放阅读框的核酸分子;例如,包含与野生型AAV基因组的碱基对310至4,440基本同源的核苷酸序列的核酸分子。因此,出于本申请的目的,AAV编码区不包括与AAV p5启动子区相对应的那些序列,并且不包括AAV ITR。
“AAV载体”是指衍生自腺相关病毒血清型的载体,包括但不限于AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-9、AAV-10、AAV-11、AAV-12和AAV-13。AAV载体可以具有一种或多种全部或部分缺失的AAV野生型基因,优选是rep和/或cap基因,但保留功能性侧翼ITR序列。功能性ITR序列是AAV病毒粒子的拯救、复制和包装所必须的。因此,本文将AAV载体定义为至少包括病毒的复制和包装所需的那些顺式序列(例如,功能性ITR)。ITR不必是野生型核苷酸序列,并且可以改变,例如通过核苷酸的插入、缺失或取代,只要所述序列提供功能性拯救、复制和包装即可。
“AAV辅助功能”是指AAV衍生的编码序列,所述编码序列可被表达以提供AAV基因产物,所述AAV基因产物反过来以反式方式起作用用于生产性AAV复制。因此,AAV辅助功能包括rep和cap区。rep表达产物已被证明具有许多功能,其中包括:AAV DNA复制起点的识别、结合和切刻(nicking);DNA解旋酶活性;以及来自AAV(或其他异源)启动子的转录的调节。cap表达产物提供必要的包装功能。本文使用AAV辅助功能来以反式补充AAV载体中缺失的AAV功能。
术语“AAV辅助构建体”一般是指包括提供从AAV载体中缺失的AAV功能的核苷酸序列的核酸分子,所述AAV载体将用于产生转导载体以递送感兴趣的核苷酸序列。AAV辅助构建体通常用于提供AAV rep和/或cap基因的瞬时表达,以补充裂解AAV复制所必要的缺失的AAV功能;然而,辅助构建体缺少AAV ITR,并且既不能复制也不能包装自身。AAV辅助构建体可以是质粒、噬菌体、转座子、粘粒、病毒或病毒粒子的形式。已经描述了许多AAV辅助构建体,例如常用的质粒pAAV/Ad和pIM29+45,它们编码Rep和Cap表达产物二者。参见,例如,Samulski等人(1989)J.Virology[病毒学杂志]63,3822-3828;McCarty等人(1991)J.Virology[病毒学杂志]65,2936-2945。已经描述了编码Rep和/或Cap表达产物的许多其他载体。参见例如美国专利号5,139,941。
术语“附属功能”是指非AAV衍生的病毒和/或细胞功能,AAV依赖其进行复制。因此,该术语囊括AAV复制所需的DNA、RNA和蛋白,包括参与AAV基因转录激活、阶段特异性AAVmRNA剪接、AAV DNA复制、Cap表达产物的合成和AAV衣壳装配的那些部分。基于病毒的附属功能可以衍生自任何已知的辅助病毒,例如腺病毒、疱疹病毒(除单纯疱疹病毒1型以外)和牛痘病毒。
例如,已经广泛研究了腺病毒衍生的附属功能,并且已经鉴定并部分表征了许多参与附属功能的腺病毒基因。具体来说,早期腺病毒E1A、E1B 55K、E2A、E4和VA RNA基因区域被认为参与了辅助过程。已经描述了疱疹病毒衍生的附属功能。参见,例如,Young等人(1979)Prog.Med.Virol.[医药病毒学进展]25,113。还已经描述了牛痘病毒衍生的附属功能。参见,例如,Carter,B.J.(1990),同上,Schlehofer等人(1986)Virology[病毒学]152,110-117。
术语“附属功能载体”通常是指包括提供附属功能的核苷酸序列的核酸分子。附属功能载体可以被转染到合适的宿主细胞中,其中所述载体然后能够支持宿主细胞中AAV病毒粒子的产生。该术语明确排除了自然界中存在的感染性病毒颗粒,例如腺病毒、疱疹病毒或牛痘病毒颗粒。因此,附属功能载体可以是质粒、噬菌体、转座子、粘粒或已从其天然存在形式修饰的病毒的形式。
“重组病毒”是指已被遗传改变的病毒,例如通过向所述颗粒中添加或插入异源核酸构建体。
“AAV病毒粒子”是指完整的病毒颗粒,例如野生型(wt)AAV病毒颗粒(包含与AAV衣壳蛋白外壳相关的线性、单链AAV核酸基因组)。就这一点而言,具有互补的有义(即“正义”)链或“反义”链的单链AAV核酸分子可被包装到任何一个AAV病毒粒子中,并且两条链具有同等的感染性。
“重组AAV病毒粒子”或“rAAV病毒粒子”在本文中定义为感染性的复制缺陷型病毒,其由以下构成:AAV蛋白壳,所述AAV蛋白壳包封了两侧翼有AAV ITR的感兴趣的异源核苷酸序列。在包含AAV载体、AAV附属功能和附属功能的合适宿主细胞中产生rAAV病毒粒子。以这种方式,使宿主细胞能够编码AAV多肽,所述多肽是以下所需的:将AAV载体(包含感兴趣的重组核苷酸序列)包装进入感染性重组病毒粒子颗粒以用于随后的基因递送。
术语“转染”用于指细胞摄取外来DNA。当将外源DNA引入细胞膜内部时,细胞已经被“转染”。许多转染技术在本领域中是公知的。参见,例如,Graham等人(1973)Virology[病毒学],52,456;Sambrook等人(1989)Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册],Cold Spring Harbor Laboratories[冷泉港实验室],纽约;Davis等人(1986)Basic Methods in Molecular Biology[分子生物学的基本方法],Elsevier[爱思唯尔];Chu等人(1981)Gene[基因]13,197。此类技术可用于将一个或多个外源DNA部分,例如核苷酸整合载体和其他核酸分子,引入合适的宿主细胞中。所述术语涵盖化学、电和病毒介导的转染程序。
术语“宿主细胞”表示例如微生物、酵母细胞、昆虫细胞和哺乳动物细胞,其可以或已经用作AAV辅助构建体、AAV载体质粒、附属功能载体或其它转移DNA的接受体。所述术语包括已被转染的原始细胞的后代。因此,本文所用的“宿主细胞”一般指已用外源DNA序列转染的细胞。可以理解,由于自然的、偶然的或故意的突变,单个亲代细胞的后代可能不一定在形态上或在基因组或总DNA互补序列方面与原始亲代完全相同。
如本文所用,术语“细胞系”是指能够在体外连续或延长生长和分裂的细胞群体。通常,细胞系是衍生自单个祖细胞的克隆群体。在本领域中还已知的是,在这样的克隆群体的储存或转移过程中,核型可以发生自发的或诱导的变化。因此,衍生自所述细胞系的细胞可能与祖先细胞或培养物不完全相同,并且所述细胞系包括这样的变体。
术语“异源”在涉及核酸序列(例如编码序列和控制序列)时表示通常不连接在一起和/或通常不与特定细胞相关的序列。因此,核酸构建体或载体的“异源”区域是在自然界中未发现与其他分子相关联的另一核酸分子内或附接至其的核酸区段。例如,核酸构建体的异源区域可以包括这样的编码序列,所述编码序列侧翼有在自然界中与所述编码序列不相关的序列。异源编码序列的另一个实例是这样的构建体,其中在自然界中未发现所述编码序列本身(例如,具有不同于天然基因的密码子的合成序列)。类似地,出于本申请的目的,用正常情况下不存在于细胞中的构建体转化的细胞将被认为是异源的。如本文所用,等位基因变异或自然发生的突变事件不会产生异源DNA。
“编码序列”或“编码”特定蛋白的序列是核酸序列,所述核酸序列当放置在适当的调控序列的控制下时在体外或体内被转录(在DNA情况下)和翻译(在mRNA情况下)成多肽。编码序列的边界由5’(氨基)末端的起始密码子和3’(羧基)末端的翻译终止密码子确定。编码序列可以包括但不限于来自原核或真核mRNA的cDNA、来自原核或真核DNA的基因组DNA序列、甚至是合成DNA序列。转录终止序列通常位于编码序列的3’。
“核酸”序列是指DNA或RNA序列。所述术语涵盖包括DNA和RNA的任何已知碱基类似物的序列,例如但不限于4-乙酰胞嘧啶、8-羟基-N6-甲基腺苷、叠氮基胞嘧啶、假异胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、肌苷、N6-异戊烯腺嘌呤、1-甲基腺嘌呤、1-甲基假尿嘧啶、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-甲基腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基-氨基甲基-2-硫尿嘧啶、β-D-甘露糖基Q核苷(beta-D-mannosylqueosine)、5’-甲氧基羰基甲基尿嘧啶、5-甲氧尿嘧啶、2-甲硫基-N6-异戊烯基腺嘌呤、尿嘧啶-5-氧乙酸甲酯、尿嘧啶-5-氧乙酸、氧丁氧苷(oxybutoxosine)、假尿嘧啶、queosine、2-硫胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、N-尿嘧啶-5-氧乙酸甲酯、尿嘧啶-5-氧乙酸、假尿嘧啶、2-硫胞嘧啶和2,6-二氨基嘌呤。
术语DNA“控制序列”统指启动子序列、聚腺苷酸化信号、转录终止序列、上游调节结构域、复制起点、内部核糖体进入位点(“IRES”)、增强子等,它们共同提供在接受体细胞中编码序列的复制、转录和翻译。只要选择的编码序列能够在合适的宿主细胞中复制、转录和翻译,并非总是需要存在所有这些控制序列。
术语“启动子区”在本文中以其一般意义使用,是指这样的DNA调节序列,RNA聚合酶与其结合,从而启动下游(3’方向)编码序列的转录。
短语“可操作地连接”是指元件的布置,其中如此描述的组分被配置为执行其通常的功能。因此,与编码序列可操作地连接的控制序列能够影响编码序列的表达。控制序列不必与编码序列邻接,只要它们具有指导其表达的功能即可。因此,例如,在启动子序列和编码序列之间可以存在中间的未翻译但被转录的序列,并且仍然可以认为所述启动子序列与所述编码序列“可操作地连接”。
当提及核苷酸序列时,“分离的”是指所指示的分子在基本上不存在相同类型的其他生物大分子的情况下存在。因此,“编码特定多肽的分离的核酸分子”是指基本上不含不编码主题多肽的其他核酸分子的核酸分子;然而,所述分子可以包括一些不会有害地影响组合物的基本特性的另外的碱基或部分。
为了描述整个本申请中特定核酸分子中核苷酸序列的相对位置,例如当特定核苷酸序列被描述为相对于另一序列位于“上游”、“下游”、“3’”或“5’”时,应当理解,如本领域中常规的那样,所指的是序列在DNA分子的“有义”或“编码”链中的位置。
“同源性”是指两个多核苷酸或两个多肽部分之间的同一性百分比。可以通过本领域已知的技术确定来自一个部分的序列与来自另一部分的序列之间的对应性。例如,可以通过比对序列信息并使用容易获得的计算机程序,通过直接比较两个多肽分子之间的序列信息来确定同源性。可替代地,可以通过以下来确定同源性:在允许在同源区域之间形成稳定的双链体的条件下杂交多核苷酸,然后用一种或多种单链特异性核酸酶消化,并确定消化片段的大小。如使用上述方法确定,当至少约80%,优选至少约90%,最优选至少约95%的核苷酸或氨基酸在分子的限定长度上匹配时,两个DNA或两个多肽序列彼此“基本上同源”。
给定多肽的“功能同源物”或“功能等同物”包括衍生自天然多肽序列的分子,以及重组产生或化学合成的多肽,其以类似于参考分子的方式起作用以实现期望的结果。因此,AAV Rep68或Rep78的功能同源物涵盖那些多肽的衍生物和类似物,包括具有在内部或在其氨基或羧基末端存在的任何单个或多个氨基酸添加、取代和/或缺失的衍生物和类似物,只要整合活性保留即可。
给定腺病毒核苷酸区域的“功能同源物”或“功能等同物”包括衍生自异源腺病毒血清型的相似区域,衍生自另一病毒或细胞来源的核苷酸区域,以及重组产生或化学合成的多核苷酸,其以类似于参考核苷酸区域的方式起作用以实现期望的结果。因此,腺病毒VARNA基因区域或腺病毒E2A基因区域的功能同源物涵盖这样的基因区域的衍生物和类似物-包括具有在所述区域内存在的任何单个或多个核苷酸碱基添加、取代和/或缺失的衍生物和类似物,只要同源物保留提供其固有的附属功能的能力,以在高于背景的可检测水平上支持AAV病毒粒子产生即可。
如本文所用,术语“野生型AAV”是指野生型和假(pseudo-)野生型AAV两者。“假野生型AAV”是具有复制能力的AAV病毒粒子,其通过携带ITR的AAV载体与携带rep和cap基因的AAV辅助载体之间的同源或非同源重组产生。假野生型AAV具有与野生型AAV序列不同的核酸序列。
术语“衣壳化必需基因产物”是指对于衣壳化腺病毒基因组以产生感染性腺病毒颗粒而言必需的腺病毒基因产物。衣壳化通常包括“晚期”腺病毒基因产物。示例性的衣壳化必需腺病毒基因产物包括衣壳蛋白IX、衣壳化蛋白IVa2、蛋白13.6、衣壳化蛋白52K、衣壳蛋白前体pIIIa、五邻体基底(衣壳蛋白III)、核心蛋白前体pVII、核心蛋白V、核心蛋白前体pX、衣壳蛋白前体pVI、六邻体(衣壳蛋白II)、蛋白酶、六邻体组装蛋白100K、蛋白33K、衣壳化蛋白22K、衣壳蛋白前体pVIII、蛋白UXP和纤维(衣壳蛋白IV)。
术语“衣壳化非必需基因产物”是指对于衣壳化腺病毒基因组以产生感染性腺病毒颗粒而言非必要的腺病毒基因产物。衣壳化非必需腺病毒基因产物通常从腺病毒E1、E2、E3和E4转录单元翻译而来。因此,衣壳化非必需腺病毒基因产物可以包括从腺病毒E1转录单元(例如,E1A、E1B-19K、E1B-55K)表达的基因产物;从腺病毒E2/E2A转录单元(例如Iva2、pol、pTP、DBP)表达的基因产物;从腺病毒E3转录单元(例如,E3 CR1α0、E3 gp19、E3 14.7K、E3 RID-β)表达的基因产物;从E4转录单元(例如E4 34K、E4 ORF1、E4 ORFB、E4 ORF3、E4ORF4、E4 ORF6/7)表达的基因产物;或其组合。
术语“edAd”是指在一种或多种衣壳化必需腺病毒基因产物中具有一个或多个突变的腺病毒突变体。
如本文所用,术语“异源”核酸序列是指源自外来物种的序列,或者如果来自相同物种,则其可以从原始形式被实质上修饰。可替代地,在细胞中通常不表达的未改变的核酸序列是异源核酸序列。优选地,异源序列与启动子可操作地连接,从而产生嵌合基因。异源核酸序列优选在病毒LTR启动子-增强子信号或内部启动子的控制下,并且逆转录病毒LTR内保留的信号仍然能够引起转基因的有效表达。
启动子序列可以与期望的基因序列同源或异源。可以使用广泛范围的启动子,包括病毒或哺乳动物启动子。细胞或组织特异性启动子可用于基因序列在特定细胞群体中的靶向表达。用于本申请的合适的哺乳动物和病毒启动子是本领域中可获得的。合适的启动子是可诱导型或条件型启动子。
任选地,在克隆阶段,具有包装信号和异源克隆位点的称为转移载体的核酸构建体还含有选择标记基因。标记基因用于测定载体的存在,从而确认感染和整合。标记基因的存在确保仅表达插入物的那些宿主细胞的选择和生长。典型的选择基因编码赋予对抗生素和其他有毒物质(例如,组氨醇、嘌呤霉素、潮霉素、新霉素、甲氨蝶呤等)有抗性的蛋白和细胞表面标记。
本申请的重组病毒能够将核酸序列转移到哺乳动物细胞中。术语“核酸序列”是指任何核酸分子,优选DNA,如本文中详细讨论的。核酸分子可以衍生自各种来源,包括DNA、cDNA、合成的DNA、RNA或其组合。这样的核酸序列可以包含基因组DNA,其可以包括或可以不包括天然存在的内含子。此外,这样的基因组DNA可以与启动子区域、聚A序列或其他相关序列一起获得。可以通过本领域众所周知的手段从合适的细胞中提取和纯化基因组DNA。可替代地,可以从细胞中分离信使RNA(mRNA),并通过逆转录或其他手段将其用于产生cDNA。
衣壳化缺陷型腺病毒(edAd)
本申请的一个方面涉及用于产生重组病毒载体的衣壳化缺陷型腺病毒(edAd)。在一些实施方式中,edAd在其基因组中包含一个或多个突变,其导致(1)一种或多种衣壳化必需蛋白的显著降低的产生或不产生,和/或(2)一种或多种缺陷型衣壳化必需蛋白的产生。这样的突变可包括相关基因中核苷酸的取代、插入或缺失。这样的突变还可包括相关基因的调节区域中核苷酸的取代、插入或缺失,其导致这些基因的转录下调或消除。
edAd还包括具有温度敏感性突变的腺病毒类型,其在允许温度(permissivetemperature)下能够包装其基因组,但在非允许温度(non-permissive temperature)下不能包装其基因组。因此,这类edAd的产生在允许温度下进行。因此,在不支持edAD包装但仍促进重组病毒载体产生的非允许温度下进行应用这些edAD来产生重组载体。
这里描述的腺病毒可以是任何腺病毒亚型或来自任何物种。在这里,为了清楚和方便起见,我们主要使用5型人腺病毒。
如下文进一步所述,本申请的edAd可用于产生其他重组病毒。
图1A和1B描绘了腺病毒颗粒及其结构组分。图1C显示了腺病毒转录单元,包括由其编码的多肽。晚期转录单元编码蛋白,所述蛋白是突变靶标以产生衣壳化缺陷型Ad(edAd)。如图2所示,用edAd感染宿主细胞能够允许腺病毒DNA复制,但不会导致包装的腺病毒病毒颗粒。
表1列出了产生衣壳化的病毒基因组所必要的许多腺病毒基因产物,以及它们相应的蛋白登录号。对应于这些蛋白的核酸登录号包括但不限于GenBank gi号209842、58478或2935210中列出的和/或GenBank登录号M73260、X17016或AF030154中注释的那些。
表1
蛋白名称 | 蛋白识别符 | 转录单元 |
衣壳蛋白IX | YP_068021.1 | IX |
衣壳化蛋白IVa2 | YP_068022.1 | IVa2 |
蛋白13.6K | YP_001661328.1 | L1 |
衣壳化蛋白52K | YP_068025.1 | L1 |
衣壳蛋白前体pIIIa | YP_068026.1 | L1 |
五邻体基底(衣壳蛋白III) | YP_068027.1 | L2 |
核心蛋白前体pVII | YP_068028.1 | L2 |
核心蛋白V | YP_068029.1 | L2 |
核心蛋白前体pX | YP_068030.1 | L2 |
衣壳蛋白前体pVI | YP_068031.1 | L3 |
六邻体(衣壳蛋白II) | YP_068032.1 | L3 |
蛋白酶 | YP_068033.1 | L3 |
六邻体组装蛋白100K | YP_068035.1 | L4 |
蛋白33K | YP_068036.1 | L4 |
衣壳化蛋白22K | YP_068037.1 | L4 |
衣壳蛋白前体pVIII | YP_068038.1 | L4 |
蛋白UXP | YP_068047.1 | U |
纤维(衣壳蛋白IV) | YP_068048.1 | L5 |
衣壳化所必要的基因产物的列表包括衣壳蛋白IX、衣壳化蛋白IVa2、蛋白13.6、衣壳化蛋白52K、衣壳蛋白前体pIIIa、五邻体基底(衣壳蛋白III)、核心蛋白前体pVII、核心蛋白V、核心蛋白前体pX、衣壳蛋白前体pVI、六邻体(衣壳蛋白II)、蛋白酶、六邻体组装蛋白100K、蛋白33K、衣壳化蛋白22K、衣壳蛋白前体pVIII、蛋白UXP和纤维(衣壳蛋白IV)。如本文所用,这些基因产物构成衣壳化必不可少的基因产物(或“衣壳化必需基因产物”),并且有别于不与衣壳化直接相关的其他腺病毒基因产物,如下文进一步描述。另外,本申请的edAd有别于在衣壳化所必要的顺式作用序列中包含突变的腺病毒基因组。除了参与腺病毒衣壳化的蛋白的功能丧失之外,这些蛋白的温度敏感性突变也可用于产生重组病毒载体。衣壳化缺陷型腺病毒具有三个主要特征以用于重组病毒载体产生:1.避免通过edAd感染进行转染。2.复制edAd基因组并增加基因的拷贝,这可帮助重组载体产生的产量。3.减少或消除生产宿主细胞中包装的腺病毒的生成。可以通过在edAd中保留必要的早期基因(例如(E1、E2、E4))来维持复制特性,或者在整合了这样的基因的宿主细胞系的情况下完成不具有这样的基因的edAd;例如edAd-1ag能够在293细胞中复制;edad-2g能够在911E4细胞系中复制,而edAd-dp3能够在adAd-dp3能够感染而不会产生包装的腺病毒的任何细胞系中复制。
在一个实施方式中,用于产生重组病毒载体的宿主细胞缺乏腺病毒的受体。腺病毒受体例如整联蛋白、CAR、CD46、Cd80、Cd86和其他腺病毒受体可以在宿主细胞中表达,以使其与腺病毒感染相容。
在一些实施方式中,本申请的edAd包含在一个或多个衣壳化必需基因中具有突变的病毒基因组,并且所述突变导致不产生衣壳化必需基因产物或产生缺陷型衣壳化必需基因产物。示例性的一个或多个突变包括编码任何一个或多个衣壳化必需腺病毒产物和/或衣壳化非必需腺病毒基因产物的一个或多个核酸序列中的一个或多个缺失、一个或多个插入、一个或多个序列替换和一个或多个取代。如本文所用,取代突变包括温度敏感性突变。
图3中的分图B-D显示了各种edAd,它们各自在腺病毒基因被缺失和/或被其他序列(包括例如转基因或缺陷型病毒基因组)替换的程度上不同。因此,edAd基因组可另外包含一个或多个突变,其阻止与衣壳化不直接相关的一种或多种腺病毒基因产物,即“衣壳化非必需”腺病毒基因产物的表达。Ad衣壳化非必需产物包括,例如,从腺病毒E1转录单元(例如,E1A、E1B-19K、E1B-55K)表达的蛋白;从腺病毒E2/E2A转录单元(例如Iva2、pol、pTP、DBP)表达的蛋白;从腺病毒E3转录单元(例如,E3 CR1α0、E3 gp19、E3 14.7K、E3 RID-β)表达的蛋白;以及从E4转录单元(例如E4 34K、E4 ORF1、E4 ORFB、E4 ORF3、E4 ORF4、E4 ORF6/7)表达的蛋白。
在一个实施方式中,edAd包含阻止Ad pIIIa表达的突变。在其他实施方式中,edAd包含阻止其他衣壳化必需蛋白表达的突变。
在一些实施方式中,edAd进一步包括阻止一个或多个Ad衣壳化非必需蛋白表达的一个或多个突变,包括但不限于仅在E1中的缺失或序列替换(图4,分图B、C、D、E);仅在E3中的缺失或序列替换(图4,分图A);E1和E3两者中的缺失或序列替换(图3,分图C、D和图4,分图B、C、D、E);以及E1、E2和E3中的缺失(图3,分图D和图4,分图D和E)。
在又另一个实施方式中,edAd包含阻止Ad六邻体装配蛋白100K表达的突变。在其他实施方式中,具有100k缺失的edAd包含阻止pIIIa的突变。在进一步的实施方式中,edAd包含阻止其他衣壳化必需蛋白表达的突变。edAd进一步包括阻止一个或多个Ad衣壳化非必需蛋白表达的一个或多个突变,包括但不限于仅在E1中的缺失或序列替换;仅在E3中的缺失或序列替换;E1和E3两者中的缺失或序列替换;以及E1、E3和E4中的缺失。
在一些实施方式中,如图4分图A-E所示,将某些腺病毒基因序列替换为经工程改造以表达期望的靶基因的缺陷型病毒基因组。在某些优选的实施方式中,缺陷型病毒基因组来自AAV或慢病毒,例如HIV-1、HIV-2或SIV。
可替代地或另外地,可以用表达盒替换腺病毒基因序列以表达例如重组酶,例如Cre(参见例如,图4,分图C)或Flp,以提供一个或多个辅助基因产物的激活,如下文进一步所述。在一些实施方式中,edAd中的Ad基因组被工程改造为包括用于重组的顺式作用DNA信号(例如loxP,FRT等),以便调节一种或多种辅助功能的表达。例如,可以修饰edAd中的Ad基因组以包括“loxed片段”,所述片段包含稳定整合到宿主细胞内的Rep-Cap表达单元中的内含子中的片段侧翼的loxP位点,使得loxed片段充当cre介导的切除的底物,从而导致AAVRep/Cap表达的激活。为了促进这种重组(和伴随的缺失),包装细胞可以用edAd基因组DNA转染,或者用edAd病毒颗粒感染的生产细胞可以进一步包含稳定或瞬时转染的重组酶基因,例如Cre重组酶(带有loxP)或Flp重组酶(带有FRT)。
在另一个实施方式中,edAd包含阻止Ad六邻体表达的突变。在又另一个实施方式中,edAd包含阻止Ad六邻体表达的突变。在进一步的实施方式中,edAd包含阻止Ad纤维蛋白表达的突变。在其他实施方式中,edAd包含阻止如表1所示的其他衣壳化必需蛋白表达的突变。
在一个实施方式中,edAd具有缺陷型衣壳化必需蛋白,其使完整的空衣壳形成,并且在包装腺病毒基因组方面缺陷。在另一个实施方式中,edAd具有缺陷型衣壳化必需蛋白,其使缺陷型空衣壳形成,并且在包装腺病毒基因组方面缺陷。在进一步的实施方式中,edAd具有不清空(empty)衣壳的缺陷型衣壳化必需蛋白。
产生edAd的方法
本申请的另一方面涉及用于产生本申请的edAd的方法。在一些实施方式中,所述方法包括以下步骤:(a)用edAd感染包装细胞以生成经感染的包装细胞,(b)在允许所述edAd繁殖的条件下孵育所述经感染的包装细胞,以及(c)收获所繁殖的edAd,其中所述包装细胞能够产生一种或多种基因产物,所述一种或多种基因产物允许在所述包装细胞内的edAd的衣壳化。
在一些实施方式中,所述方法包括:(a)将edAd基因组转染到包装细胞中以产生转染的包装细胞,所述edAd基因组包含阻止一种或多种腺病毒衣壳化必需基因产物表达或导致一种或多种缺陷型腺病毒衣壳化必需基因产物表达的一种或多种突变;(b)在允许产生感染性edAd颗粒的条件下培养转染的包装细胞;以及(c)收获所述感染性edAd颗粒,其中所述包装细胞能够产生一种或多种功能性腺病毒衣壳化必需基因产物,所述一种或多种功能性腺病毒衣壳化必需基因产物允许在所述包装细胞内的edAd的衣壳化。
可以用本领域众所周知的技术来生成edAd基因组。可以使用任何适当的分子生物学和生化方法(例如,核酸测序)来鉴定引入腺病毒核酸中的缺失的存在和位置。例如,可以使用凝胶电泳按大小将核酸分开,以确认相对于原始核酸的长度已去除了部分。在一些情况下,识别编码的多肽(例如,纤维多肽)上的各种表位的抗体能够用于检测靶向缺失的多肽的存在与否。
在一个实施方式中,使用标准分子生物学技术,例如同源重组、限制酶消化(包括cas9/gRNA)、cre介导的重组以在腺病毒基因组中产生期望的突变和插入,从选择的腺病毒质粒例如pFG140、pTG3602、pAdEasy-1、pAdEasy-2(来自addgene)产生edAd。例如,pIIIa基因通过同源重组被替换,如M Barry小组先前公开(Crosby CM,Barry MA.IIIa deletedadenovirus as a single-cycle genome replicating vector[IIIa缺失的腺病毒作为单周期基因组复制载体].Virology[病毒学].2014;462-463:158-165.doi:10.1016/j.virol.2014.05.030)。可替代地,通过使用设计的gRNA和cas9消化使六邻体基因部分缺失。通过连接或在适当的细菌中使用pshuttle载体和cre重组酶将AAV基因组和其他基因引入腺病毒基因组。在具有转染的质粒或整合的基因的宿主细胞中拯救所得的腺病毒质粒,所述宿主细胞提供对于腺病毒复制和包装必需的缺失元件。然后,使用相应的包装细胞系扩增拯救的edAd。
用于edAd的包装细胞系
在另一方面,本发明提供了用于产生感染性edAd的包装细胞系。在一些实施方式中,包装细胞能够提供一种或多种基因产物,所述基因产物允许在宿主包装细胞内edAd的复制和衣壳化。
可以通过瞬时或稳定的转染或感染来生成包装细胞,以产生一种或多种基因产物,所述基因产物允许在包装细胞内的edAd的衣壳化。包装细胞可以衍生自任何合适的细胞系。用于本文所述方法的示例性生产细胞系包括但不限于293、911E4、A549、PER.C6、Hela、BHK、COS和CHO。在一些实施方式中,包装细胞衍生自哺乳动物细胞。在一些实施方式中,包装细胞衍生自293细胞。在另一个实施方式中,包装细胞衍生自Hela细胞。在另一个实施方式中,包装细胞衍生自CHO细胞。
在一些实施方式中,包装细胞表达或能够表达在edAd基因组中缺少或有缺陷的必需衣壳化基因产物。在一些实施方式中,包装细胞表达或能够表达在edAd基因组中缺少或有缺陷的必需衣壳化基因产物和非必需衣壳化基因产物。
在又另一个实施方式中,具有温度敏感性突变的edAd能够在允许温度下生长。温度敏感性突变的实例包括但不限于如人腺病毒2型温度敏感性突变体的分离和表型表征(Isolation and phenotypic characterization of human adenovirus type2temperature-sensitive mutants)中所述的E3区中的缺失。Martin GR,Warocquier R,Cousin C,D'Halluin JC,Boulanger PA.J Gen Virol.[普通病毒学杂志]1978年11月;41(2):303-14。温度敏感性(ts)突变体可能无法在39”5℃下生长,但在33℃下正常发育。在限制性温度下双重感染的细胞培养物中的互补试验可用于鉴定它们。根据其可溶性衣壳抗原的产生在表型上对它们进行表征。它们可以在可溶性六邻体产生、总五邻体(五邻体基底+纤维)和其他阻止其包装病毒的基因方面存在缺陷。此特性能够补充edAd以进行AAV产生。
包装细胞可以通过转染或病毒感染产生。在一些实施方式中,用补充edAd基因组中一种或多种缺陷(即,影响衣壳化必需产物和衣壳化非必需产物的突变)的一种或多种腺病毒基因产物稳定地转化包装细胞系。
用edAd产生重组病毒的方法
本申请的另一方面涉及产生重组病毒(RV)的方法。所述方法包括以下步骤:(a)用一种或多种edAd感染宿主细胞以产生感染的宿主细胞,(b)在允许产生具有RV基因组的RV的条件下孵育感染的宿主细胞;以及(c)收获所述重组病毒,其中所述edAd或所述宿主细胞包含所述RV基因组。
RV可以是DNA病毒、RNA病毒、脊髓灰质炎病毒、痘病毒、逆转录病毒、辛德毕斯(Sindbis)病毒、α病毒、星状病毒、冠状病毒、正粘病毒、乳头瘤病毒、副粘病毒、细小病毒、细小核糖核酸病毒(picomavirus)、痘病毒、披膜病毒或任何其他病毒,包括其血清型,以及其假型。
在一些实施方式中,RV是重组自主细小病毒。重组细小病毒可以是自主细小病毒的任何成员。示例性细小病毒包括小鼠微小病毒(MVM)、H1、LuIII、B19、CPV、博卡(Boca)病毒、FPV以及其他。携带来自所选NS、VP基因、诱导基因(例如cre、tet-on、tet-off等)或载体基因组的元件中的至少一个的edAd可用于感染宿主细胞,所述宿主细胞将提供从edAd缺失的元件,以用于细小病毒的复制和包装。宿主细胞还将提供缺失的腺病毒早期基因,以用于腺病毒基因组的复制。
重组AAV载体的产生
在一些实施方式中,RV是重组AAV。重组AAV可以是任何血清型。示例性AAV血清型包括AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-9、AAV-10、AAV-11、AAV-12和AAV-13。携带来自所选aav-rep-cap、腺病毒E1、E2或E4;或诱导元件(例如cre、cas9/gRNA、tet-on、tet-off)或载体基因组的元件中的至少一个的edAd可用于感染宿主,所述宿主细胞将提供从edAd缺失的元件,以用于AAV复制和包装中。宿主细胞还将提供缺失的腺病毒早期基因,以用于腺病毒基因组的复制。
产生用于基因递送的复制缺陷型病毒颗粒的常规方法是进行质粒的双重或三重转染。举例来说,图6显示了在被稳定转化以表达E1a和E1b指定的辅助功能的细胞(例如293细胞)中产生感染性复制缺陷型rAAV的方法。一种质粒包含缺陷型病毒基因组,所述缺陷型病毒基因组包含用于复制的必需顺式作用序列,例如ITR或LTR,其中期望的感兴趣的转基因或靶基因插入侧翼ITR或侧翼LTR之间以进行其表达。设计其他质粒以表达产生rAAV所需的其他辅助功能,例如AAV Rep、AAV Cap、Ad E2a、VARNA和E4。图7显示当通过用wtAd(或具有包装能力的Ad,pcAd)感染宿主细胞来提供Ad辅助功能时,回收的病毒颗粒包括rAAV和wtAd。
在一些实施方式中,使用本申请的edAd产生重组AAV载体。编码edAd的核酸分子包括腺病毒(例如Ad5病毒)的所有天然存在的序列,但缺少以下腺病毒序列中至少一种的全部或一部分:纤维蛋白编码序列、V蛋白编码序列、六邻体编码序列、五邻体基底编码序列、pIII蛋白编码序列或其他早期或晚期基因产物编码序列。编码多肽的腺病毒核酸序列的实例包括但不限于在GenBank gi号209842、58478或2935210中列出和/或在GenBank登录号M73260、X17016或AF030154中注释的那些。
在一些实施方式中,将编码以下多肽中的一种或多种的核酸的全部或一部分的突变或缺失工程改造到编码腺病毒的核酸中:纤维蛋白编码序列、V蛋白编码序列、六邻体编码序列、五邻体基底编码序列、VA RNA编码序列、pIII蛋白编码序列或其他早期或晚期基因产物编码序列。这样的缺失可以是导致一种或多种编码的氨基酸缺失的任何长度。例如,可以去除腺病毒的核酸序列的部分,使得编码的多肽缺少5、6、7、8、9、10、15、20、25、30或更多个氨基酸残基)。可以从沿序列长度的任何位置去除要缺失的一个或多个部分。例如,可以在腺病毒核酸(例如纤维蛋白编码序列、V蛋白编码序列、六邻体编码序列、五邻体基底编码序列、VA RNA编码序列、pIII蛋白编码序列或其他早期或晚期基因产物编码序列)的5’端、3’端或内部区域去除腺病毒核酸序列的部分。
可以使用任何适当的分子生物学和生化方法(例如,核酸测序)来鉴定引入腺病毒核酸中的缺失的存在和位置。例如,可以使用凝胶电泳按大小将核酸分开,以确认相对于原始核酸的长度已去除了部分。在一些情况下,识别编码的多肽(例如,纤维多肽)上的各种表位的抗体能够用于检测靶向缺失的多肽的存在与否。
在一些实施方式中,使用腺病毒作为辅助物来产生AAV载体。当前,有两种使用腺病毒辅助来产生AAV的方法。一种是使用腺病毒DNA,其依赖于转染方法且不能扩展。另一种是野生型(wt)腺病毒或E1a/E1b区缺失的腺病毒。这导致腺病毒被衣壳化的DNA污染,衣壳化的DNA很难从AAV制剂中除去。
edAd为AAV产生提供了一种或多种必要的辅助功能,包括E1a、E1b、VA RNA、E2、E4和其他腺病毒基因。edAd补充了AAV复制和包装,而edAd本身不会在AAV生产宿主细胞中产生带有衣壳化的基因组的腺病毒。
在一些实施方式中,edAd被进一步修饰以具有能够在不同条件下补充AAV产生的更多特征。可以缺失E1/E1b或E3以产生edAd1g,这允许AAV载体基因组被携带在edAd1g和生产系统必需的其他因子中。例如,cre、FLP和crisper元件也可以由所述腺病毒携带。可以在腺病毒基因组中进行进一步的缺失,以容纳其他必需元件。那些对于AAV产生必需的元件可以整合到宿主细胞中。
在一些实施方式中,将AAV基因组构建到edAd中。在某些情况下这是期望的,并且当edAD进行大量复制时,AAV基因组拷贝将急剧增加。可以将对于诱导rep和cap表达重要的其他基因构建到edAd中。在一些实施方式中,将AAV基因组克隆到edAd中。在其他实施方式中,用于控制整合的宿主基因的基因也被构建到edAd中。这样的基因包括Cas9/gRNA或FLP重组酶、cre重组酶、crispr酶的其他变体和能够调节基因表达的其他蛋白。
在一些实施方式中,edAd用于AAV载体产生。AAV生产宿主细胞被edAd感染。对于AAV产生必需但不由edAd携带的元件通过转染以反式方式提供,或整合到生产宿主细胞中。AAV生产宿主细胞不具有恢复edAd包装的因子/元件,因此没有腺病毒基因组被包装到腺病毒衣壳中。
edAd病毒可以具有不同的配置。例如,在基于293细胞的宿主细胞中,可以使用edAd1g,因为当其在宿主细胞中提供时可以除去E1a和E1。相反,为了在基于CHO的宿主细胞中生产,edAD病毒中必须包括E1a和E1b区。
本文还提供了用于产生rAAV病毒粒子的宿主细胞。在某些实施方式中,本发明的宿主细胞包含编码AAV辅助功能的核酸。在宿主细胞中引入AAV载体并表达附属功能后,产生rAAV病毒粒子。在某些优选的实施方式中,本发明的宿主细胞还包括一种或多种附属功能。
本发明进一步提供了使用附属功能载体产生rAAV的方法和通过这种方法产生的rAAV病毒粒子。在某些实施方式中,本发明的方法包括以下步骤:(1)将AAV载体基因组引入合适的宿主细胞;(2)将本发明的AAV辅助病毒引入所述宿主细胞;(3)在所述宿主细胞中表达附属功能;以及(4)培养所述宿主细胞以产生rAAV病毒粒子。可以使用众所周知的技术将AAV载体和AAV辅助功能载体依次或同时转染到宿主细胞中。附属功能可以以几种方式中的任何方式表达,包括用合适的辅助病毒(例如腺病毒、疱疹病毒或牛痘病毒)感染宿主细胞,或通过将一种或多种附属功能载体转染到宿主细胞中。本领域还众所周知,某些细胞系,例如293细胞,固有地表达一种或多种附属功能。
利用本发明产生的rAAV病毒粒子可用于将遗传物质引入动物(包括人)或分离的动物细胞中,以用于各种研究和治疗用途。例如,使用本发明的方法产生的rAAV病毒粒子可以用于在动物中表达蛋白以收集临床前数据或筛选潜在的候选药物。可替代地,可以使用rAAV病毒粒子将遗传物质转移到人中以治愈遗传缺陷或实现期望的治疗。
使用edAd产生细小病毒载体的一般方法遵循如下程序:在已经用AAV rep&cap或AAV载体质粒转染的细胞中,edAd用于递送AAV产生所需的辅助功能。然后可以在不同时间在培养基或细胞中收获载体。rep&cap功能可以整合到宿主细胞中,也可以通过病毒或非病毒载体进行递送。AAV载体质粒也可以整合到宿主细胞系中或通过病毒载体递送。在一个特定的实施方式中,AAV载体序列在edAd的基因组中。如果需要的话,携带另外因子的多个edAd可以用于rAAV繁殖。
在一些实施方式中,感染性edAd病毒颗粒与用于在生产细胞系中复制AAV的一种或多种辅助功能(例如,AAV Rep和/或AAV Cap)共表达。为了促进AAV的复制,将生产细胞用包含必需的顺式活性序列例如AAV ITR的AAV载体构建体转染或以其他方式包括所述AAV载体构建体,以产生复制缺陷型AAV颗粒。AAV Rep和Cap基因可以稳定地整合到生产细胞系中,或者他们可以通过病毒或非病毒载体进行递送。AAV载体质粒也可以整合到生产细胞系中或通过病毒或非病毒载体递送。在一个特定的实施方式中,将AAV载体序列克隆到edAdDNA构建体中以产生adAd病毒颗粒。多个edAD可用于产生给定的rAAV或多个不同的rAAV。
在特定的实施方式中,产生rAAV的方法包括用edAd感染宿主细胞,其中所述宿主细胞被稳定转化以表达AAV Rep和Cap,并被缺陷型AAV基因组(其经工程改造以表达期望的靶基因)稳定转化,如图8所示。
在另一个实施方式中,产生rAAV的方法包括用edAd感染宿主细胞,其中edAd基因组包含经工程改造以表达期望的靶基因的缺陷型AAV基因组,并且其中所述宿主细胞(例如Hela或A549)被稳定转化以表达Ad E1a、Ad E1b、AAV Rep和AAV Cap蛋白,如图9所示。在一些实施方式中,edAd是edAd-100k。
在另一个实施方式中,产生rAAV的方法包括用edAd感染宿主细胞,其中edAd基因组包含经工程改造以表达Cre重组酶和期望的感兴趣的靶基因的缺陷型AAV基因组,并且其中所述宿主细胞被Ad E1、E2和E4基因稳定转化,并被稳定转化以表达AAV Rep和AAV Cap蛋白,如图11所示。在这种情况下,来自edAd的Cre重组酶的表达会切除构建入Rep-Cap表达单元中的内含子中的“loxed片段”,从而激活Rep-Cap蛋白的表达。loxed片段包含位于内含子中片段侧翼的loxP位点,所述片段充当cre介导的切除的底物,从而导致AAV Rep/Cap表达的激活。
本文提供的AAV病毒可在0.01到106的广泛MOI范围内使用。它可用于在用于产生病毒载体的其他元件的诱导之前或之后感染细胞。
其他重组病毒
在一些实施方式中,RV是重组慢病毒。在一些实施方式中,重组慢病毒是HIV-1、HIV-2或SIV。
在一个实施方式中,RV是重组逆转录病毒。在一些实施方式中,重组慢病毒是莫洛尼鼠(Moloney murine)白血病病毒。
在一些实施方式中,RV是重组牛痘病毒。
在一些实施方式中,RV是重组疱疹病毒。示例性疱疹病毒包括但不限于单纯疱疹病毒(HSV)-1、HSV-2、人疱疹病毒(HHV)-1、HHV-2、HHV-3、HHV-4、HHV-7、HHV-8和水痘带状疱疹、人巨细胞病毒(HCMV)。
为了产生原料(stock)感染性复制缺陷型重组病毒颗粒(也称为病毒载体),例如重组AAV(rAAV)、重组慢病毒等,将edAd与来自重组病毒(例如,AAV、慢病毒等)的结构元件组合使用,以产生与重组病毒相对应的感染性病毒颗粒。与涉及质粒的双重或三重转染的其他方法不同,用一种或多种edAd感染宿主细胞会显著提高转导效率,从而导致更高的效价和极少或没有污染。
在一些实施方式中,生产细胞经核酸稳定转化,所述核酸经工程改造以表达一种或多种Ad辅助功能、一种或多种AAV辅助功能或其组合。在特定的实施方式中,宿主细胞是293细胞。在其他实施方式中,宿主细胞是Hela细胞或A549细胞。
在一些实施方式中,生产细胞经核酸稳定转化,所述核酸经工程改造以表达AdE1a和Ad E1b。在其他实施方式中,生产细胞经核酸稳定转化,所述核酸经工程改造以表达AAV Rep和/或AAV Cap。在其他实施方式中,生产细胞经核酸稳定转化,所述核酸经工程改造以表达对于产生感染性慢病毒颗粒必需的一种或多种辅助功能。在其他实施方式中,生产细胞经缺陷型病毒基因组稳定转化,所述缺陷型病毒基因组经工程改造以表达感兴趣的靶基因。
在一些实施方式中,生产细胞被多种不同的edAd感染。在一个实施方式中,多种edAd中的每一种都表达一种或多种辅助功能。
在一个实施方式中,将生产细胞用第一edAd和第二edAd共感染,所述第一edAd经工程改造以表达Cre重组酶,所述第二edAd包含Rep-Cap表达单元,所述Rep-Cap表达单元包含内含子中的“loxed片段”,所述“loxed片段”充当cre介导的切除的底物,从而导致AAVRep/Cap表达的激活。
在另一个实施方式中,可使用成簇规则间隔短回文重复/Cas(CRISPR/Cas9)系统激活一种或多种辅助基因的表达。通过该系统,Cas9核酸酶可以由短RNA引导,以在DNA的特定位点诱导精确切割,并可以通过允许在单个CRISPR阵列中编码几个序列来编辑基因组中的多个位点。单个Cas酶可以通过短RNA分子(称为“指导”RNA)进行编程,以识别目标DNA。换句话说,可以使用短RNA分子作为指导RNA将Cas酶招募到特定的靶DNA,以提供CRISPR介导的核酸切割的特异性。本发明中还包括任何其他crispr系统,例如cpf1、cas13等。
CRISPR有三种类型,迄今为止,最常用于基因校正或破坏的类型是II型。例如,CRISPR RNA靶向序列是从CRISPR阵列中成簇的DNA序列转录而来。为了进行操作,转录CRISPR靶向RNA或前体crRNA(pre-crRNA),并根据与CRISPR重复序列具有序列互补性的反式激活CRISPR RNA(tracrRNA)的存在,对RNA进行加工以分离单独的RNA(crRNA)。当反式RNA与CRISPR重复序列杂交时,它会通过双链RNA特异性核糖核酸酶RNA酶III启动加工,形成串联tracrRNA:crRNA双链体,其可以被合成地制成单指导RNA(sgRNA),用于基因组工程改造目的。Cas9核酸酶,其被激活并通过切割而特异性响应与crRNA互补的DNA序列。靶序列必须在其3’端包含特定序列,所述序列被称为待切割DNA中的原间隔子相邻基序(PAM),其在识别靶序列的CRISPR RNA中不存在。
除了天然存在的指导RNA外,合成的指导RNA可与CRISPR载体融合。描述了使用生物信息学方法设计具有靶标识别序列和其他必需元件(例如发夹和支架序列)的指导RNA(参见例如Mali等人,Science[科学]339:823-826(2013))。
在一个实施方式中,将生产细胞用编码功能性II型CRISPR-Cas9蛋白的第一edAd和编码靶向一种或多种辅助基因的指导RNA序列的第二edAd共感染,以用于一种或多种辅助基因的CRISPR介导的激活,类似于上面的Cre/lox系统。
在上述方法的变型中,CRISPR-Cas9系统可以与本申请的edAd一起使用,以提供缺失宿主序列、用野生型宿主序列替换突变的宿主序列或靶向激活宿主基因的手段。在这种变型中,将宿主细胞用第一edAd和第二edAd共感染,所述第一edAd包含经工程改造以表达功能性II型CRISPR-Cas9蛋白的缺陷型病毒基因组,所述第二edAd包含靶向宿主基因的指导RNA序列,用于CRISPR介导的宿主序列缺失、突变的宿主序列被野生型宿主序列替换或宿主基因的靶向激活。
在一些实施方式中,本申请提供了产生能够感染非分裂细胞的重组慢病毒的方法,所述方法包括用携带由gag、pol和env、以及rev和tat编码的包装功能的一种或多种edAd感染合适的生产细胞。例如,第一edAd病毒可提供编码病毒gag和病毒pol的核酸,并且同一edAd或另一edAd可提供编码病毒env的核酸以产生生产细胞。将经工程改造以表达异源基因的缺陷型慢病毒载体(在此被鉴定为转移载体)引入该生产细胞,会产生释放携带外来感兴趣的基因的感染性病毒颗粒的生产细胞。
在一个实施方式中,edAd可用于产生重组疱疹载体。用于疱疹载体产生的必需基因可以使用edAd来携带并感染疱疹载体生产细胞以促进疱疹载体产生。
疱疹病毒(HSV)补充系统。当前基于HSV的设计通常包含两种复制缺陷型HSV菌株,这些菌株经过工程改造以分别包含Rep/Cap和AAV载体序列。本领域普通技术人员可以理解,衣壳化缺陷型疱疹可以类似地用于产生rAAV或慢病毒载体或其他重组载体。可以通过在疱疹结构基因中产生突变或缺失来制备衣壳化缺陷型和包装缺陷型疱疹病毒。衣壳化缺陷型和包装缺陷性疱疹病毒可用于产生本文公开的利用RV的方法,其可适用于基于HSV的系统。
鉴于上述,本申请提供了产生高效价重组病毒的组合物和方法。可以使用本领域已知的技术将病毒颗粒制剂用于感染靶细胞。因此,本申请将可用于体内基因疗法应用以及离体基因疗法应用两者中,其中,从宿主中移出靶细胞,并进行转化培养,然后返回宿主。
生产细胞系
本申请的另一方面涉及用于产生重组病毒的生产细胞。所述生产细胞包含(a)所述重组病毒的基因组,或(b)编码产生所述重组病毒所需的产物的基因,或(a)和(b)两者。
生产细胞可以通过瞬时或稳定的转染或感染来生成。在一些实施方式中,生产细胞系用以下进行稳定转化:(a)重组病毒的基因组,或(b)编码产生重组病毒所需的产物的基因,或(a)和(b)两者。
生产细胞可以衍生自任何合适的细胞系。用于本文所述方法的示例性生产细胞系包括但不限于293、911E4、Hela、COS、A549、CHO、PER.C6和BHK。在一些实施方式中,生产细胞衍生自哺乳动物细胞。在一些实施方式中,生产细胞衍生自293细胞。在另一个实施方式中,生产细胞衍生自Hela细胞。在另一个实施方式中,生产细胞衍生自CHO细胞。
生产细胞系与其相应的edAd结合用于病毒载体产生。通常,从edAd缺失的必需早期基因用生产细胞系中的整合拷贝补充,因此edAd能够复制腺病毒基因组,但由于衣壳化基因中的缺陷,仍不能包装腺病毒基因组。
与第二病毒相对应的一种或多种病毒基因产物,其是产生与第二病毒相对应的感染性的复制缺陷型病毒颗粒所必要的。更具体地,用edAd感染生产细胞系导致产生与第二病毒相对应的感染性的复制缺陷型病毒颗粒。假定生产细胞系用edAd病毒颗粒感染,则生产细胞系必须是允许腺病毒颗粒的进入和/或复制或经遗传修饰以支持腺病毒颗粒的进入和/或复制。产生包装细胞系的方法是本领域众所周知的,不需要进一步讨论。
通过以下实施例进一步说明本申请,不应将所述实施例视为限制。贯穿本申请引用的所有参考文献、专利和公开的专利申请的内容以及附图和表格通过引用并入本文。
实施例
实施例1:示例性edAd基因组
图3的分图B-D和图4的分图A-E显示了edAd基因组的几个示例。可以使用本领域众所周知的标准重组DNA技术来生成edAd基因组。基于edAd的起始腺病毒5质粒是pTG3602、pFG140、pAdeasy质粒。用设计的cas9/gRNA消化期望的要缺失的基因,例如pIIIa、六邻体、五邻体、纤维等,然后通过自身连接将得到的片段连接。在具有缺失的腺病毒衣壳化基因的相应宿主细胞中拯救获得的质粒。病毒载体的其他组分的进一步添加是通过在细菌或与拯救edAd相容的相应细胞系中使用穿梭载体通过同源重组或cre介导的重组来进行的。
实施例2:edAd的产生
图5显示了用于产生edAd的两种示例性方法。对于每种edAd,产生特定的生产细胞系,以便edAd中缺失或有缺陷的一种或多种基因在生产细胞系中表达。
edAd-d100k的生成
edAd-d100k如下产生:用BamHI消化pAdEasy-1,分离含有Ad5序列21696至35995的子片段,并亚克隆到pUC19中的BamHI处,得到pUC19-Ad-BamHI。通过从pUC19-Ad-BamHI中去除100K基因的NheI片段(Ad5序列24999至25686)来制备pUC19-Ad-BamHI/Δ100K。然后用BamHI从pUC19-Ad-BamHI/A100K质粒中释放出含有100k基因中的缺失的腺病毒片段,并连接回pAdEasy-1的大BamHI子片段,从而获得pAd-easy-d100。然后在细胞系293-100k中拯救腺病毒edAd-d100k。
293-100k细胞的生成
通过将化学合成的100k基因克隆到pcDNA3(pcDNA3-100k)中处于CMV启动子的控制下来生成细胞系293-100k。将两微克的pcDNA3-100K质粒用ClaI限制酶消化线性化,并通过阳离子脂质体(lipofectamine)转染到293细胞中。在具有600μg/ml G-418的DMEM培养基中选择转染的细胞。通过PCR和蛋白质印迹确认获得的克隆。证实了293-100k克隆在39℃的非允许温度下支持温度敏感性(ts)Ad5 100K突变体H5ts116(最初由H.Ginsberg制备)的生长的能力。
edAd-E1-d100k的生成
edAd-d100k用于感染表达100k的Hela细胞,所述细胞用Ad5的左臂片段(cla I片段)转染。选择噬菌斑以确认是否存在E1和100k缺失。
edAd-d100k-cre的生成
将包含cre基因的SalI片段连接到pShuttleCMV的SalI位点,生成pShuttleCMVcre。将携带cre的穿梭质粒用PmeI线性化,并与pAd-easy-d100共电穿孔到大肠杆菌BJ5183中。以这种方式,两个质粒之间的靶向重组在细菌质粒内生成了全长edAd-d100-cre载体基因组,其为E1-、E3-和100k-。类似地,将pShuttle-AAV-CMVlacZ质粒与pAdEasy-1共电穿孔,以生成含[E1-,E3-]Ad-AAV-CMV-lacZ-的质粒。然后将这些腺病毒从293-100k细胞中拯救。
实施例3:用edAd产生重组AAV载体
用于rAAV产生的IIIa衣壳化缺陷型腺病毒的生成
起始材料是pTG3602,其包含全长Ad5基因组(JOURNAL OF VIROLOGY[病毒学杂志],1996年7月,第4805-4810页CHARTIER等人)。通过使用典型的分子生物学技术去除E3或E1和E3区,以获得pAd-d3或pAd-d13。通过使用CRISPR核酸酶消化和质粒pAd-d3或pAd-d13的自连接,从质粒中去除IIIa区,以获得pdIIIa-d3(SEQ ID NO:1)和pdIIIa-d13(SEQ IDNO:2),因此从腺病毒中去除了IIIa功能。通过测序确认所得构建体,然后将其用于拯救293-IIIa中的感染性腺病毒。
为了反式提供IIIa,使用Ad5 IIIa cDNA生成293稳定细胞系(293-IIIa)。通过在293-IIIa细胞中转染并繁殖来拯救具有IIIa缺失的Ad5。
pdIIIa-d3和pdIIIa-d13中的IIIa缺失与Ad6-IIIa缺失相似,如Crosby CM和Barry MA在Virology[病毒学].2014年8月;462-463:158-65.doi:10.1016/j.virol.2014.05.030.(2014年7月2日电子发表)中所述。
使用Crosby CM和Barry MA(同上)描述的类似方法进行功能测试。
为了确认IIIa缺失的腺病毒有能力用于AAV产生,将带有侧翼有AAV ITR的GFP基因的AAV表达盒克隆到pIIIa-d3或pAd-d13中的E1区(可以使用E3或其他区域)中,并在293-IIIa细胞系中拯救感染性IIIa-d13-AAV-GFP(SEQ ID NO:3)和IIIa-d3-AAV-GFP。在以下条件下产生AAV载体。IIIa-d13-AAV-GFP病毒DNA在产生过程中被扩增了1E+5倍,而没有产生感染性腺病毒。
rAAV的一个限制是它们的基因组包装能力仅为~5kb。对于某些疾病,AAV的包装限制不允许通过单个AAV载体递送全长治疗性蛋白。考虑到由AAV的包装能力施加的限制,可以使用双重载体方法,其中转基因跨越两个单独的rAAV载体分开。然后,将细胞用这两种rAAV共感染会导致无法通过单个AAV载体编码(由于AAV的DNA包装限制)的组装mRNA的转录。普通技术人员将理解,当前公开的方法能够适于产生这样的双重载体,用于表达超过腺相关病毒衣壳的包装能力的转基因。用pAAV-CB-EGFP转染B50细胞系,并将具有可拯救的AAV-CB-EGFP的细胞克隆命名为B50-AAV-CB-EGFP,其具有AAV rep&cap序列和AAV基因组两者。然后使用edAd-E1-d100k以moi 1、5和10感染B50-AAV-CB-EGFP。
edAd-d100k-dp3的生成
为了在腺病毒中进行100k和pIIIa双重缺失,将pAd-easy-d100用cas9/gRNA消化,从而释放pIIIa基因片段。将所得的大片段自连接以获得pAd-easy-d100dp3。在293-100k-pIIIa细胞系中拯救并扩增edAd-d100k-dp3。
edAd-d100k-dp3-cre的生成
制备质粒pshuttle-CMV-Cre,并使用ad-easy试剂盒将其与pAd-easy-d100dp3重组。在293-100k-pIIIa细胞中拯救并扩增所得的腺病毒。
使用edAd-d100k-dp3-cre产生AAV
具有整合的AAV基因组以及cre可激活的rep和cap的细胞系293-dsGFP-12(由XiaoXiao提供)感染edAd-d100k-dp3-cre。
实施例4:使用edAd产生重组慢病毒载体
本申请还提供了产生能够感染非分裂细胞的重组慢病毒的方法以及制备所述重组慢病毒的方法和手段。所述病毒可用于核酸序列的体内和离体转移和表达。
慢病毒基因组和前病毒DNA具有在逆转录病毒中发现的三个基因;gag、pol和env,其侧翼有两个LTR序列。gag基因编码内部结构(基质、衣壳和核衣壳)蛋白;pot基因编码RNA指导的DNA聚合酶(逆转录酶)、蛋白酶和整合酶;并且env基因编码病毒包膜糖蛋白。5’和3’LTR用于促进病毒粒子RNA的转录和聚腺苷酸化。LTR包含病毒复制所需的所有其他顺式作用序列。慢病毒具有另外的基因,包括vif、vpr、tat、rev、vpu、nef和vpx(在HIV-1、HIV-2和/或SIV中)。
与5’LTR相邻的是基因组逆转录所必需的序列(tRNA引物结合位点)和有效将病毒RNA衣壳化到颗粒中所需的序列(Psi位点)。如果病毒基因组中缺少衣壳化(或将逆转录病毒RNA包装到感染性病毒粒子中)所需的序列,则顺式缺陷会阻止基因组RNA的衣壳化。但是,所得的突变体仍然能够指导所有病毒粒子蛋白的合成。
本申请提供了产生能够感染非分裂细胞的重组慢病毒的方法,所述方法包括用携带包装功能,即gag、pol和env,以及rev和tat的一种或多种edAd感染合适的宿主细胞。例如,第一edAd病毒能够提供编码病毒gag和病毒pol的核酸,并且同一edAd或另一edAd能够提供编码病毒env的核酸以产生包装细胞。将提供异源基因的载体(在此被鉴定为转移载体)引入该包装细胞,产生了释放携带外来感兴趣的基因的感染性病毒颗粒的生产细胞。
本文所述的慢病毒载体可以通过三种不重叠的表达构建体来包装,两种表达HIV蛋白,另一种表达不同病毒的包膜。此外,除了有助于HIV-1包装基序的茎环结构的gag基因的部分之外,构建体中没有已知对衣壳化和逆转录所需的所有HIV序列。
改善载体生物安全性的第二种策略利用了慢病毒基因组的复杂性。鉴定了生成有效载体所需的最小HIV-1基因集合,并从系统中消除了所有其他HIV阅读框。由于去除的基因的产物对于病毒生命周期的完成和致病机理很重要,因此没有重组体能够获取亲本病毒的致病特征。HIV的所有四个附属基因都能够从包装构建体中缺失,而不会影响基因转导。tat基因对于HIV复制至关重要。tat基因产物是已知最强大的转录激活因子之一,并且在表征HIV诱导的疾病的极高复制速率方面起着关键作用。
逆转录病毒衍生的env基因的示例包括但不限于莫洛尼鼠白血病病毒(MoMuLV或MMLV)、哈维(Harvey)鼠肉瘤病毒(HaMuSV或HSV)、鼠乳腺肿瘤病毒(MuMTV或MMTV)、长臂猿白血病病毒(GaLV或GALV)、人类免疫缺陷病毒(HIV)和劳斯(Rous)肉瘤病毒(RSV)。可以使用的其他env基因包括水泡性口炎病毒(VSV)蛋白G(VSV-G),以及肝炎和流感病毒的那些。
提供病毒env核酸序列的载体与调节序列,例如启动子或增强子可操作地相关联。调节序列可以是任何真核启动子或增强子,包括例如莫洛尼鼠白血病病毒启动子-增强子元件、人巨细胞病毒(HCMV)增强子或牛痘P7.5启动子。在一些情况下,例如莫洛尼鼠白血病病毒启动子-增强子元件,启动子-增强子元件位于LTR-序列内或附近。
优选地,调节序列是对于由其构建载体的慢病毒而言不是内源的序列。因此,如果载体是由SIV制成的,则在SIV LTR中发现的SIV调节序列将被不源自SIV的调节元件替换。
尽管VSV C蛋白是期望的env基因,因为VSV G赋予重组病毒广泛的宿主范围,但是VSV G对宿主细胞可能有害。因此,当使用基因,诸如VSV G的基因时,优选采用可诱导的启动子系统,使得当不需要表达VSV C时,能够调节VSV G的表达以最小化宿主毒性。
例如,当从转移细胞中撤出(withdrawn)四环素时,可以使用Gossen&Bujard(Proc.Natl.Acad.Sci.[美国国家科学院院刊](1992)89:5547-5551)的四环素可调节的基因表达系统来提供VSV G的可诱导表达。因此,tet/VP16反式激活子存在于第一载体上,并且VSV C编码序列被克隆到另一载体上由tet操纵子序列控制的启动子的下游。
可以将这种杂合启动子插入转移载体的LTR的3’U3区。由于通过使用这种转移载体产生的载体颗粒对靶细胞的转导,杂合启动子将在逆转录时被拷贝到5’U3区。在靶细胞中,只有在存在tTA的情况下,例如在转导表达tTA的合适包装细胞系后,才能激活基因的这种条件表达,以表达全长可包装载体转录物。
在生产细胞中使用这样的载体允许仅在需要时才以高水平“开启”可包装载体mRNA信息(message)的产生。相反,在不表达tTA的细胞的转导时,杂合启动子在转录上变得沉默。即使存在HIV Tat蛋白(已知能够上调异源启动子的基础转录活性),这种转录沉默也得以维持。即使转导的细胞被野生型HIV-1感染,启动子系统也显著降低了载体基因组活动化(mobilization)的机会。
另一种实施方式涉及基于慢病毒的逆转录病毒载体系统,其中消除了包装和转移载体构建体的编码序列之间的序列同源性(序列重叠)。重要的是,通过使用这种构建体产生的载体颗粒保留了高水平的转导潜力。预期在载体生产系统中使用这样的构建体将最显著降低重组事件的频率,这是与这样的载体系统相关的生物安全性的重大进步。
已知在整个gag-pol编码mRNA中,存在几个顺式作用抑制序列(CRS)。所述序列阻止了mRNA转运到细胞质,因此阻止了编码的蛋白表达。为了抑制CRS的作用,HIV-1mRNA含有称为RRE的抗抑制信号,Rev蛋白可与之结合。然后HIV-1mRNA-Rev复合物被有效地转运到细胞质中,在那里复合物解离,mRNA变得可用于翻译。
至少有两种方法可用于选择在表达Gag和Gag-Pol的包装载体中所需的最少量HIV序列。首先,仅能插入gag-pol基因。在那种情况下,所有或至少大多数CRS将需要被鉴定和突变而不影响编码的氨基酸序列。如果实现的话,则可以从载体系统中消除Rev基因。
第二,可以将最小的RRE元件引入gag-pol表达盒,以使其序列成为所得mRNA的一部分。在那种情况下,Gag和Gag-Pol多蛋白的表达将需要抗阻遏物Rev的存在。然而,Rev蛋白本身不需要是gag-pol表达载体的一部分,但是可以与gag-pol表达盒独立且优选不重叠地反式提供。
在不需要Rev蛋白以有效产生转移载体mRNA的系统中,可以将rev基因和RRE元件从载体系统中消除,作为进一步的生物安全措施。然而,在这样的系统中,如果由于同源或非同源重组事件将gag-pol基因整体或部分转移到载体接受体中,则可能发生表达。
相比之下,其中gag-pol基因表达依赖于Rev的载体系统可能是有价值的安全替代。因此,如果设计了利用Rev的载体系统,使得所有组分都不具有同源序列,则在不太可能的重组事件中,重组将导致gag-pol序列转移到载体接受体上,发生其表达的可能性要小得多,因为转移的重组体必须包含RRE元件和能够被表达的Rev编码序列二者。
鉴于对HIV衍生载体的主要兴趣在于其转导非分裂和缓慢分裂的细胞和组织的能力,因此检测了非重叠载体在细胞周期停滞细胞中的转导。与MoMLV载体相比,最小的HIV衍生载体在分裂和生长停滞的细胞中均保持了转导潜能。
此外,观察到:在一定条件下,包装载体gag-pol mRNA中存在的HIV-1RNA元件导致大量信使被特异性地衣壳化到释放的载体颗粒中。所述元件充当HIV-1主要剪接供体位点(SD),并且至少由核苷酸GACUGGUGAG(SEQ ID NO:1)构成。在没有转移载体表达的情况下,仅由pMDLg/pRRE包装构建体生成的载体颗粒没有可检测到的gag-pol RNA信使。从产生载体颗粒的细胞中提取的总RNA的分析表明,在所有情况下表达水平都相似。当比较所测试的包装载体的5’mRNA区时,显然上述指定序列是提供信使的特异性衣壳化的决定因素。
优选地,通过本申请的方法产生的重组慢病毒是人免疫缺陷病毒(HIV)的衍生物。但是,env优选衍生自HIV以外的病毒。
在一些实施方式中,本申请的方法提供了至少一种edAd和多达四种edAd病毒,它们提供了包装重组慢病毒病毒粒子所需的所有功能,例如gag、pol、env、tat和rev,如上文所讨论。参见图13-17。如本文所述,可以在功能上将其缺失以获得意想不到的益处。使用的载体的数量没有限制,只要所述载体用于转化并产生包装细胞系以产生重组慢病毒即可。
将edAd载体感染引入生产细胞系,同时将另外的元件整合到生产细胞中以避免转染。生产细胞系产生包含载体基因组的病毒颗粒。转染或感染的方法是本领域技术人员众所周知的。将edAd病毒感染或共感染生产细胞系后,从培养基中回收重组病毒,并通过本领域技术人员使用的标准方法进行滴定。
其中生产功能被配置为由合适的生产细胞表达的稳定细胞系是已知的。例如,参见美国专利号5,686,279;和Ory等人,Proc.Natl.Acad.Sci.[美国国家科学院院刊](1996)93:11400-11406,其描述了包装细胞。这种稳定的细胞系将与至少一种本申请的edAd一起使用。
Zufferey等人,同上,描述了一种慢病毒生产细胞,其中缺失了包括HIV-1env基因的pol的3’序列。构建体包含tat和rev序列,并且3’LTR被聚A序列替换。5’LTR和psi序列被另一种启动子替换,例如可诱导的启动子。例如,可以使用CMV启动子或其衍生物。
感兴趣的生产载体包含包装功能的另外改变,以增强慢病毒蛋白表达并增强安全性。例如,可以去除gag上游的所有HIV序列。同样,env下游的序列也可以去除。此外,可以采取措施来修饰载体以增强RNA的剪接和翻译。
为了提供具有甚至更遥远的生成具有复制能力的慢病毒的可能性的edAd,本申请的一个方面提供了慢病毒包装edAd,其中tat序列(其是通过转录机制促进病毒表达的调节蛋白)在功能上被缺失。因此,可以使tat基因部分或整体缺失,或者可以对tat序列进行各种点突变或其他突变以使所述基因无功能。技术人员可以实践已知的技术来使tat基因无功能。
因此,根据本申请,使慢病毒包装edAd包含启动子和由技术人员确定的其他任选或必需的调节序列(gag、pol、rev、env或其组合),以及tat的特定功能切除或实际切除,和任选的其他慢病毒附属基因。
可以通过用异源增强子/启动子代替U3区的部分或全部转录调节元件来修饰转移载体构建体的5’LTR。所述变化可以增强转移载体RNA在生产细胞中的表达;在没有HIV tat基因的情况下允许载体产生;并用于去除可与3’缺失版本重组以“拯救”上述SIN载体的HIVLTR的上游野生型拷贝。因此,在5’LTR处含有上述改变的载体(5’载体)可用作转移载体,因为所述序列增强表达并与不表达tat的包装细胞组合。
这样的5’载体还可以如上讨论在3’LTR处携带修饰以产生改善的转移载体,其不仅具有增强的表达并且可以用于不表达tat但也可以自灭活的包装细胞中。
从HIV LTR的转录高度依赖于tat蛋白的反式激活子功能。在通常由生产细胞中存在的核心包装构建体表达的tat的存在下,强烈刺激了从HIV LTR的载体转录。鉴于全长“病毒”RNA具有完整的包装信号互补,因此RNA被有效地衣壳化到载体颗粒中并转移至靶细胞。可用于包装在生产细胞中的载体RNA的量是感染性载体产生中的限速步骤。
5’LTR的增强子或增强子和启动子区可以分别被人巨细胞病毒(CMV)或劳斯肉瘤病毒(RSV)的增强子或增强子和启动子取代,参见图12,其为杂合载体的构建体和代号示意图。CCL和RRL载体的5’U3区被完全取代。
在用转移载体转染的生产细胞中,在有或没有提供tat反式激活子的包装构建体的情况下,比较了对照慢病毒载体HR2和5’杂合体组。在存在和不存在包装构建体的情况下,四种嵌合载体的转录水平均高于对照慢病毒载体的转录水平。所有嵌合载体均有效地将转基因转移至靶细胞中,并且RRL载体表现与对照HR2载体一样好。最后,通过在转导后的早期和晚期检查转导的细胞来确认载体在靶细胞中的整合。没有观察到转基因阳性细胞百分比的降低,这表明载体已经整合。
在没有包装构建体的情况下,在生产细胞中获得的5’LTR修饰的转移载体RNA的高水平表达表明,在没有功能性tat基因的情况下,生产载体是有功能的。如关于上文公开的包装质粒所指出的,鉴于与tat蛋白相关的致病活性的数目,tat基因的功能性缺失将赋予慢病毒载体系统更高水平的生物安全性。因此,具有显著改善的生物安全性的慢病毒载体是SIN转移载体,其在5’或3’端均不含d型拷贝的HIV LTR,与如本文所述的tat较少的包装载体结合使用。
可以使用标准技术收获病毒上清液,例如转染后48小时过滤上清液。病毒效价可以通过在8μg/ml聚凝胺(Sigma Chemical Co.,St.Louis,Mo.)存在下用适量的病毒上清液感染例如106NIH 3T3细胞或105HeLa细胞来确定。四十八小时后,可以测定转导效率。
为了说明的目的,本发明仅说明了vsv0G包膜的使用。假型慢病毒载体由带有衍生自其他包膜病毒的糖蛋白(GP)的载体颗粒构成。假型慢病毒载体的替代GP的列表在不断增加。这些GO已在Cronin的Curr Gene Ther.[当前基因疗法]2005年8月;5(4):387-398中进行了综述。其他GP包括但不限于LCMV、RRV、SeV F、Ebola、Marburg、HN、JSRV、Rabies、Mokola、RD 114、GALV等。由于GP通常具有毒性,因此edAd可以携带它进行高水平表达并补充慢病毒产生。
在图13-19中示出了生成每一代慢病毒载体的示例。
可能期望通过包膜蛋白与抗体或特定配体(用于靶向特定细胞类型的受体)的连接来靶向重组病毒。通过将感兴趣的序列(包括调节区)与例如编码特定靶细胞上受体的配体的另一个基因一起插入病毒载体,载体现在具有靶特异性。逆转录病毒载体可以通过插入例如糖脂或蛋白而成为靶特异性的。通常通过使用抗体或重组抗体型分子(例如单链抗体)的抗原结合部分靶向逆转录病毒载体来实现靶向。本领域技术人员将了解或可以容易地确定实现逆转录病毒载体向特定靶的递送的特定方法,而无需过度实验。实施例5,具有 蛋白V、六邻体、IVa2、L1-52/55K和L4-22K中的缺失的腺病毒
三种病毒核心蛋白(V、VII和mu)与病毒DNA相互作用并使病毒DNA凝缩,并介导核心与衣壳之间的相互作用。一系列次要衣壳组分IIIa、VI、VIII和IX有助于衣壳结构和稳定性。在体内和体外,L4-22K蛋白与包装A重复序列的TTTG基序结合,IVa2蛋白与CG基序结合。仅在体内发现L1-52/55K蛋白与包装结构域缔合,而在体外L1-52/55K蛋白与IVa2缔合。将Ad DNA包装到衣壳中需要IVa2和L1-52/55K蛋白。
利用遗传霉素选择后,分离出稳定表达Ad5 L1-52/55K蛋白的新293细胞系,如针对293-L1所述(J Virol.[病毒学杂志]2011年8月;85(15):7849-7855.doi:10.1128/JVI.00467-11)。
生成用于V、IVa2、六邻体和L4-22K表达的相似293细胞,并将其命名为293-V、293-Iva2、294-L4、293-六邻体。通过以下方法来制备在这些区中具有缺失的腺病毒:首先从pAd-d3和pAd-d13中缺失这些编码区,然后从相应的细胞系中拯救感染性病毒。
在293细胞中测试时,Ad-dV产生了报告基因产物,但从未受到困扰(plagued)。在相容的生产细胞系中作为AAV的辅助物感染后,缺失V的病毒基因组能够正常复制。但是,后代病毒粒子缺乏蛋白V,并且在初次感染后无法主动感染第二组细胞。
这些腺病毒支持AAV产生,与实施例I中所述类似。
实施例6.纤维缺失的腺病毒支持rAAV产生
纤维蛋白与细胞受体的结合是腺病毒转导的主要方式。因此,无纤维的Ad颗粒具有严重降低的感染性。
为了开发表达Ad5纤维的细胞系,对Ad5纤维序列进行密码子优化(co)并合成。密码子优化将改善蛋白表达水平,并显著降低体外同源重组的可能性。使用Polyfect(凯杰公司(Qiagen),巴伦西亚(Valencia),加利福尼亚州,美国),将具有Ad5-Fiber-co的表达片段转染到293细胞中。转染后二十四小时。添加遗传霉素(0.5mg/mL)。然后通过蛋白质印迹确认细胞系293-Fibr。
为了从pAd-d3和pAd-d13中缺失纤维,使用经过特殊设计的crisp核酸酶来释放纤维基因片段,然后通过DNA连接酶将所得的大片段重新环化以获得pdFibr-d3和pdFibr-d13。然后在293-Fibr细胞系中使用pdFibr-d3和pdFibr-d13来拯救病毒Ad-dFibr-d3和Ad-dFibr-d13。293-Fibr细胞系中Ad-dFibr-d3和Ad-dFibr-d13的产量正常。
具有AAV-GFP的Ad-dFibr-d3和Ad-dFibr-d13是通过以下方式获得的:将AAV-GFP克隆到pdFibr-d3和pdFibr-d13中,然后将其用于293-Fibr细胞系中的拯救。
测试结果为:
该结果表明纤维需要与另一种因子例如IIIa组合以获得不含腺病毒颗粒的AAV载体。
因此,本发明的组合物和方法的广度和范围不应受到任何上述示例性实施方式的限制,而应仅根据所附权利要求书及其等同物来限定。
上面的描述是为了教导本领域的普通技术人员如何实践本申请,并且不旨在详细描述本领域技术人员在阅读本说明书后将变得显然的所有那些明显的修改和变化。尽管上面已经描述了各种实施方式,但是应该理解,这样的公开仅以示例的方式给出,并且不是限制性的。此外,旨在所有明显的修改和变化都应包括在由所附权利要求书限定的本申请的范围之内。权利要求书旨在覆盖能够有效地实现所预期目标的任何顺序的步骤和组分,除非上下文特别指出相反。本发明的组合物和方法的广度和范围不应受到任何上述示例性实施方式的限制,而应仅根据所附权利要求书及其等同物来限定。
序列表
<110> 耐克基因有限责任公司(Nikegen, LLC)
<120> 用于制备病毒载体的组合物和方法
<130> D-CF210207
<160> 3
<170> SIPOSequenceListing 1.0
<210> 1
<211> 31046
<212> DNA
<213> 人工序列()
<400> 1
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg 360
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc 420
cgggtcaaag ttggcgtttt attattatag tcagctgacg tgtagtgtat ttatacccgg 480
tgagttcctc aagaggccac tcttgagtgc cagcgagtag agttttctcc tccgagccgc 540
tccgacaccg ggactgaaaa tgagacatat tatctgccac ggaggtgtta ttaccgaaga 600
aatggccgcc agtcttttgg accagctgat cgaagaggta ctggctgata atcttccacc 660
tcctagccat tttgaaccac ctacccttca cgaactgtat gatttagacg tgacggcccc 720
cgaagatccc aacgaggagg cggtttcgca gatttttccc gactctgtaa tgttggcggt 780
gcaggaaggg attgacttac tcacttttcc gccggcgccc ggttctccgg agccgcctca 840
cctttcccgg cagcccgagc agccggagca gagagccttg ggtccggttt ctatgccaaa 900
ccttgtaccg gaggtgatcg atcttacctg ccacgaggct ggctttccac ccagtgacga 960
cgaggatgaa gagggtgagg agtttgtgtt agattatgtg gagcaccccg ggcacggttg 1020
caggtcttgt cattatcacc ggaggaatac gggggaccca gatattatgt gttcgctttg 1080
ctatatgagg acctgtggca tgtttgtcta cagtaagtga aaattatggg cagtgggtga 1140
tagagtggtg ggtttggtgt ggtaattttt tttttaattt ttacagtttt gtggtttaaa 1200
gaattttgta ttgtgatttt tttaaaaggt cctgtgtctg aacctgagcc tgagcccgag 1260
ccagaaccgg agcctgcaag acctacccgc cgtcctaaaa tggcgcctgc tatcctgaga 1320
cgcccgacat cacctgtgtc tagagaatgc aatagtagta cggatagctg tgactccggt 1380
ccttctaaca cacctcctga gatacacccg gtggtcccgc tgtgccccat taaaccagtt 1440
gccgtgagag ttggtgggcg tcgccaggct gtggaatgta tcgaggactt gcttaacgag 1500
cctgggcaac ctttggactt gagctgtaaa cgccccaggc cataaggtgt aaacctgtga 1560
ttgcgtgtgt ggttaacgcc tttgtttgct gaatgagttg atgtaagttt aataaagggt 1620
gagataatgt ttaacttgca tggcgtgtta aatggggcgg ggcttaaagg gtatataatg 1680
cgccgtgggc taatcttggt tacatctgac ctcatggagg cttgggagtg tttggaagat 1740
ttttctgctg tgcgtaactt gctggaacag agctctaaca gtacctcttg gttttggagg 1800
tttctgtggg gctcatccca ggcaaagtta gtctgcagaa ttaaggagga ttacaagtgg 1860
gaatttgaag agcttttgaa atcctgtggt gagctgtttg attctttgaa tctgggtcac 1920
caggcgcttt tccaagagaa ggtcatcaag actttggatt tttccacacc ggggcgcgct 1980
gcggctgctg ttgctttttt gagttttata aaggataaat ggagcgaaga aacccatctg 2040
agcggggggt acctgctgga ttttctggcc atgcatctgt ggagagcggt tgtgagacac 2100
aagaatcgcc tgctactgtt gtcttccgtc cgcccggcga taataccgac ggaggagcag 2160
cagcagcagc aggaggaagc caggcggcgg cggcaggagc agagcccatg gaacccgaga 2220
gccggcctgg accctcggga atgaatgttg tacaggtggc tgaactgtat ccagaactga 2280
gacgcatttt gacaattaca gaggatgggc aggggctaaa gggggtaaag agggagcggg 2340
gggcttgtga ggctacagag gaggctagga atctagcttt tagcttaatg accagacacc 2400
gtcctgagtg tattactttt caacagatca aggataattg cgctaatgag cttgatctgc 2460
tggcgcagaa gtattccata gagcagctga ccacttactg gctgcagcca ggggatgatt 2520
ttgaggaggc tattagggta tatgcaaagg tggcacttag gccagattgc aagtacaaga 2580
tcagcaaact tgtaaatatc aggaattgtt gctacatttc tgggaacggg gccgaggtgg 2640
agatagatac ggaggatagg gtggccttta gatgtagcat gataaatatg tggccggggg 2700
tgcttggcat ggacggggtg gttattatga atgtaaggtt tactggcccc aattttagcg 2760
gtacggtttt cctggccaat accaacctta tcctacacgg tgtaagcttc tatgggttta 2820
acaatacctg tgtggaagcc tggaccgatg taagggttcg gggctgtgcc ttttactgct 2880
gctggaaggg ggtggtgtgt cgccccaaaa gcagggcttc aattaagaaa tgcctctttg 2940
aaaggtgtac cttgggtatc ctgtctgagg gtaactccag ggtgcgccac aatgtggcct 3000
ccgactgtgg ttgcttcatg ctagtgaaaa gcgtggctgt gattaagcat aacatggtat 3060
gtggcaactg cgaggacagg gcctctcaga tgctgacctg ctcggacggc aactgtcacc 3120
tgctgaagac cattcacgta gccagccact ctcgcaaggc ctggccagtg tttgagcata 3180
acatactgac ccgctgttcc ttgcatttgg gtaacaggag gggggtgttc ctaccttacc 3240
aatgcaattt gagtcacact aagatattgc ttgagcccga gagcatgtcc aaggtgaacc 3300
tgaacggggt gtttgacatg accatgaaga tctggaaggt gctgaggtac gatgagaccc 3360
gcaccaggtg cagaccctgc gagtgtggcg gtaaacatat taggaaccag cctgtgatgc 3420
tggatgtgac cgaggagctg aggcccgatc acttggtgct ggcctgcacc cgcgctgagt 3480
ttggctctag cgatgaagat acagattgag gtactgaaat gtgtgggcgt ggcttaaggg 3540
tgggaaagaa tatataaggt gggggtctta tgtagttttg tatctgtttt gcagcagccg 3600
ccgccgccat gagcaccaac tcgtttgatg gaagcattgt gagctcatat ttgacaacgc 3660
gcatgccccc atgggccggg gtgcgtcaga atgtgatggg ctccagcatt gatggtcgcc 3720
ccgtcctgcc cgcaaactct actaccttga cctacgagac cgtgtctgga acgccgttgg 3780
agactgcagc ctccgccgcc gcttcagccg ctgcagccac cgcccgcggg attgtgactg 3840
actttgcttt cctgagcccg cttgcaagca gtgcagcttc ccgttcatcc gcccgcgatg 3900
acaagttgac ggctcttttg gcacaattgg attctttgac ccgggaactt aatgtcgttt 3960
ctcagcagct gttggatctg cgccagcagg tttctgccct gaaggcttcc tcccctccca 4020
atgcggttta aaacataaat aaaaaaccag actctgtttg gatttggatc aagcaagtgt 4080
cttgctgtct ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt 4140
cgttgagggt cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat 4200
acatgggcat aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg 4260
gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt 4320
ctttcagtag caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt 4380
taagctggga tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt 4440
tggctatgtt cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag 4500
tgtatccggt gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact 4560
tggagacgcc cttgtgacct ccaagatttt ccatgcattc gtccataatg atggcaatgg 4620
gcccacgggc ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt 4680
ccaggatgag atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg 4740
gtataatggt tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg 4800
ctttgagttc agatgggggg atcatgtcta cctgcggggc gatgaagaaa acggtttccg 4860
gggtagggga gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc 4920
cggtgggccc gtaaatcaca cctattaccg ggtgcaactg gtagttaaga gagctgcagc 4980
tgccgtcatc cctgagcagg ggggccactt cgttaagcat gtccctgact cgcatgtttt 5040
ccctgaccaa atccgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag 5100
caaagttttt caacggtttg agaccgtccg ccgtaggcat gcttttgagc gtttgaccaa 5160
gcagttccag gcggtcccac agctcggtca cctgctctac ggcatctcga tccagcatat 5220
ctcctcgttt cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag 5280
acgggccagg gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac 5340
ggtgaagggg tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct 5400
ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt 5460
gtcatagtcc agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc 5520
gccgcacgag gggcagtgca gacttttgag ggcgtagagc ttgggcgcga gaaataccga 5580
ttccggggag taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca 5640
ggtgagctct ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt 5700
cttacctctg gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc 5760
cccgtataca gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag 5820
aaactcggac cactctgaga caaaggctcg cgtccaggcc agcacgaagg aggctaagtg 5880
ggaggggtag cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat 5940
gtcgccctct tcggcatcaa ggaaggtgat tggtttgtag gtgtaggcca cgtgaccggg 6000
tgttcctgaa ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc 6060
atcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctgaaaag cgggcatgac 6120
ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc 6180
ggtgatgcct ttgagggtgg ccgcatccat ctggtcagaa aagacaatct ttttgttgtc 6240
aagcttggtg gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag 6300
ggtttggttt ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc 6360
gcgcgcaacg caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac 6420
gcgccaaccg cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag 6480
gcgctcgttg gtccagcaga ggcggccgcc cttgcgcgag cagaatggcg gtagggggtc 6540
tagctgcgtc tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc 6600
gtcgaagtag tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc 6660
aagcgcgcgc tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga 6720
ggcgtacatg ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt 6780
agggtagcat cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg 6840
agcgaggagg tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg 6900
cctgaagatg gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc 6960
gtctgtgaga cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac 7020
cagctcggcg gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc 7080
atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc 7140
tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta 7200
gaactggttg acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg 7260
cgcggccttc cggagcgagg tgtgggtgag cgcaaaggtg tccctgacca tgactttgag 7320
gtactggtat ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt 7380
gcgctttttg gaacgcggat ttggcagggc gaaggtgaca tcgttgaaga gtatctttcc 7440
cgcgcgaggc ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt 7500
aattacctgg gcggcgagca cgatctcgtc aaagccgttg atgttgtggc ccacaatgta 7560
aagttccaag aagcgcggga tgcccttgat ggaaggcaat tttttaagtt cctcgtaggt 7620
gagctcttca ggggagctga gcccgtgctc tgaaagggcc cagtctgcaa gatgagggtt 7680
ggaagcgacg aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa 7740
ggtcctaaac tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg 7800
gtcttgttcc cagcggtccc atccaaggtt cgcggctagg tctcgcgcgg cagtcactag 7860
aggctcatct ccgccgaact tcatgaccag catgaagggc acgagctgct tcccaaaggc 7920
ccccatccaa gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg 7980
cgagccgatc gggaagaact ggatctcccg ccaccaattg gaggagtggc tattgatgtg 8040
gtgaaagtag aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc 8100
gcagtactgg cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg 8160
cacaaggaag cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc 8220
tacttcggct gcttgtcctt gaccgtctgg ctgctcgagg ggagttacgg tggatcggac 8280
caccacgccg cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac 8340
aacatcgcgc agatgggagc tgtccatggt ctggagctcc cgcggcgtca ggtcaggcgg 8400
gagctcctgc aggtttacct cgcatagacg ggtcagggcg cgggctagat ccaggtgata 8460
cctaatttcc aggggctggt tggtggcggc gtcgatggct tgcaagaggc cgcatccccg 8520
cggcgcgact acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc 8580
atctaaaagc ggtgacgcgg gcgagccccc ggaggtaggg ggggctccgg acccgccggg 8640
agagggggca ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcgtagg 8700
ttgctggcga acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag 8760
acgacgggcc cggtgagctt gaacctgaaa gagagttcga cagaatcaat ttcggtgtcg 8820
ttgacggcgg cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatc 8880
tcggccatga actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg 8940
gtggcggcga ggtcgttgga aatgcgggcc atgagctgcg agaaggcgtt gaggcctccc 9000
tcgttccaga cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc 9060
tgcgcgagat tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag 9120
aggtagttga gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc 9180
aacgtggatt cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc 9240
acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga 9300
cggatgagct cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct 9360
tcttcttcaa tctcctcttc cataagggcc tccccttctt cttcttctgg cggcggtggg 9420
ggagggggga cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc 9480
atctccccgc ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc 9540
agttggaaga cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccatgcggc 9600
agggatacgg cgctaacgat gcatctcaac aattgttgtg taggtactcc gccgccgagg 9660
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag 9720
tcacagtcgc aaggtaggct gagcaccgtg gcgggcggca gcgggcggcg gtcggggttg 9780
tttctggcgg aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg 9840
gtcgacagaa gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg 9900
ccccaggctt cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct 9960
accggcactt cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctgcggcg 10020
gcggcggagt ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc 10080
ctcatcggct gaagcagggc taggtcggcg acaacgcgct cggctaatat ggcctgctgc 10140
acctgcgtga gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg 10200
ttgatggtgt aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc 10260
gagagctcgg tgtacctgag acgcgagtaa gccctcgagt caaatacgta gtcgttgcaa 10320
gtccgcacca ggtactggta tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc 10380
cagcgtaggg tggccggggc tccgggggcg agatcttcca acataaggcg atgatatccg 10440
tagatgtacc tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg 10500
cggacgcggt tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg 10560
ccggtcaggc gcgcgcaatc gttgacgctc tagcgtgcaa aaggagagcc tgtaagcggg 10620
cactcttccg tggtctggtg gataaattcg caagggtatc atggcggacg accggggttc 10680
gagccccgta tccggccgtc cgccgtgatc catgcggtta ccgcccgcgt gtcgaaccca 10740
ggtgtgcgac gtcagacaac gggggagtgc tccttttggc ttccttccag gcgcggcggc 10800
tgctgcgcta gcttttttgg ccactggccg cgcgcagcgt aagcggttag gctggaaagc 10860
gaaagcatta agtggctcgc tccctgtagc cggagggtta ttttccaagg gttgagtcgc 10920
gggacccccg gttcgagtct cggaccggcc ggactgcggc gaacgggggt ttgcctcccc 10980
gtcatgcaag accccgcttg caaattcctc cggaaacagg gacgagcccc ttttttgctt 11040
ttcccagatg catccggtgc tgcggcagat gcgcccccct cctcagcagc ggcaagagca 11100
agagcagcgg cagacatgca gggcaccctc ccctcctcct accgcgtcag gaggggcgac 11160
atccgcggtt gacgcggcag cagatggtga ttacgaaccc ccgcggcgcc gggcccggca 11220
ctacctggac ttggaggagg gcgagggcct ggcgcggcta ggagcgccct ctcctgagcg 11280
gcacccaagg gtgcagctga agcgtgatac gcgtgaggcg tacgtgccgc ggcagaacct 11340
gtttcgcgac cgcgagggag aggagcccga ggagatgcgg gatcgaaagt tccacgcagg 11400
gcgcgagctg cggcatggcc tgaatcgcga gcggttgctg cgcgaggagg actttgagcc 11460
cgacgcgcga accgggatta gtcccgcgcg cgcacacgtg gcggccgccg acctggtaac 11520
cgcatacgag cagacggtga accaggagat taactttcaa aaaagcttta acaaccacgt 11580
gcgtacgctt gtggcgcgcg aggaggtggc tataggactg atgcatctgt gggactttgt 11640
aagcgcgctg gagcaaaacc caaatagcaa gccgctcatg gcgcagctgt tccttatagt 11700
gcagcacagc agggacaacg aggcattcag ggatgcgctg ctaaacatag tagagcccga 11760
gggccgctgg ctgctcgatt tgataaacat cctgcagagc atagtggtgc aggagcgcag 11820
cttgagcctg gctgacaagg tggccgccat caactattcc atgcttagcc tgggcaagtt 11880
ttacgcccgc aagatatacc atacccctta cgttcccata gacaaggagg taaagatcga 11940
ggggttctac atgcgcatgg cgctgaaggt gcttaccttg agcgacgacc tgggcgttta 12000
tcgcaacgag cgcatccaca aggccgtgag cgtgagccgg cggcgcgagc tcagcgaccg 12060
cgagctgatg cacagcctgc aaagggccct ggctggcacg ggcagcggcg atagagaggc 12120
cgagtcctac tttgacgcgg gcgctgacct gcgctgggcc ccaagccgac gcgccctgga 12180
ggcagctggg gccggacctg ggctggcggt ggcacccgcg cgcgctggca acgtcggcgg 12240
cgtggaggaa tatgacgagg acgatgagta cgagccagag gacggcgagt actaagcggt 12300
gatgtttctg atcaggcggc cggaaaaaaa aaaagcatga tgcaaaataa aaaactcacc 12360
aaggccatgg caccgagcgt tggttttctt gtattcccct tagtatgcgg cgcgcggcga 12420
tgtatgagga aggtcctcct ccctcctacg agagtgtggt gagcgcggcg ccagtggcgg 12480
cggcgctggg ttctcccttc gatgctcccc tggacccgcc gtttgtgcct ccgcggtacc 12540
tgcggcctac cggggggaga aacagcatcc gttactctga gttggcaccc ctattcgaca 12600
ccacccgtgt gtacctggtg gacaacaagt caacggatgt ggcatccctg aactaccaga 12660
acgaccacag caactttctg accacggtca ttcaaaacaa tgactacagc ccgggggagg 12720
caagcacaca gaccatcaat cttgacgacc ggtcgcactg gggcggcgac ctgaaaacca 12780
tcctgcatac caacatgcca aatgtgaacg agttcatgtt taccaataag tttaaggcgc 12840
gggtgatggt gtcgcgcttg cctactaagg acaatcaggt ggagctgaaa tacgagtggg 12900
tggagttcac gctgcccgag ggcaactact ccgagaccat gaccatagac cttatgaaca 12960
acgcgatcgt ggagcactac ttgaaagtgg gcagacagaa cggggttctg gaaagcgaca 13020
tcggggtaaa gtttgacacc cgcaacttca gactggggtt tgaccccgtc actggtcttg 13080
tcatgcctgg ggtatataca aacgaagcct tccatccaga catcattttg ctgccaggat 13140
gcggggtgga cttcacccac agccgcctga gcaacttgtt gggcatccgc aagcggcaac 13200
ccttccagga gggctttagg atcacctacg atgatctgga gggtggtaac attcccgcac 13260
tgttggatgt ggacgcctac caggcgagct tgaaagatga caccgaacag ggcgggggtg 13320
gcgcaggcgg cagcaacagc agtggcagcg gcgcggaaga gaactccaac gcggcagccg 13380
cggcaatgca gccggtggag gacatgaacg atcatgccat tcgcggcgac acctttgcca 13440
cacgggctga ggagaagcgc gctgaggccg aagcagcggc cgaagctgcc gcccccgctg 13500
cgcaacccga ggtcgagaag cctcagaaga aaccggtgat caaacccctg acagaggaca 13560
gcaagaaacg cagttacaac ctaataagca atgacagcac cttcacccag taccgcagct 13620
ggtaccttgc atacaactac ggcgaccctc agaccggaat ccgctcatgg accctgcttt 13680
gcactcctga cgtaacctgc ggctcggagc aggtctactg gtcgttgcca gacatgatgc 13740
aagaccccgt gaccttccgc tccacgcgcc agatcagcaa ctttccggtg gtgggcgccg 13800
agctgttgcc cgtgcactcc aagagcttct acaacgacca ggccgtctac tcccaactca 13860
tccgccagtt tacctctctg acccacgtgt tcaatcgctt tcccgagaac cagattttgg 13920
cgcgcccgcc agcccccacc atcaccaccg tcagtgaaaa cgttcctgct ctcacagatc 13980
acgggacgct accgctgcgc aacagcatcg gaggagtcca gcgagtgacc attactgacg 14040
ccagacgccg cacctgcccc tacgtttaca aggccctggg catagtctcg ccgcgcgtcc 14100
tatcgagccg cactttttga gcaagcatgt ccatccttat atcgcccagc aataacacag 14160
gctggggcct gcgcttccca agcaagatgt ttggcggggc caagaagcgc tccgaccaac 14220
acccagtgcg cgtgcgcggg cactaccgcg cgccctgggg cgcgcacaaa cgcggccgca 14280
ctgggcgcac caccgtcgat gacgccatcg acgcggtggt ggaggaggcg cgcaactaca 14340
cgcccacgcc gccaccagtg tccacagtgg acgcggccat tcagaccgtg gtgcgcggag 14400
cccggcgcta tgctaaaatg aagagacggc ggaggcgcgt agcacgtcgc caccgccgcc 14460
gacccggcac tgccgcccaa cgcgcggcgg cggccctgct taaccgcgca cgtcgcaccg 14520
gccgacgggc ggccatgcgg gccgctcgaa ggctggccgc gggtattgtc actgtgcccc 14580
ccaggtccag gcgacgagcg gccgccgcag cagccgcggc cattagtgct atgactcagg 14640
gtcgcagggg caacgtgtat tgggtgcgcg actcggttag cggcctgcgc gtgcccgtgc 14700
gcacccgccc cccgcgcaac tagattgcaa gaaaaaacta cttagactcg tactgttgta 14760
tgtatccagc ggcggcggcg cgcaacgaag ctatgtccaa gcgcaaaatc aaagaagaga 14820
tgctccaggt catcgcgccg gagatctatg gccccccgaa gaaggaagag caggattaca 14880
agccccgaaa gctaaagcgg gtcaaaaaga aaaagaaaga tgatgatgat gaacttgacg 14940
acgaggtgga actgctgcac gctaccgcgc ccaggcgacg ggtacagtgg aaaggtcgac 15000
gcgtaaaacg tgttttgcga cccggcacca ccgtagtctt tacgcccggt gagcgctcca 15060
cccgcaccta caagcgcgtg tatgatgagg tgtacggcga cgaggacctg cttgagcagg 15120
ccaacgagcg cctcggggag tttgcctacg gaaagcggca taaggacatg ctggcgttgc 15180
cgctggacga gggcaaccca acacctagcc taaagcccgt aacactgcag caggtgctgc 15240
ccgcgcttgc accgtccgaa gaaaagcgcg gcctaaagcg cgagtctggt gacttggcac 15300
ccaccgtgca gctgatggta cccaagcgcc agcgactgga agatgtcttg gaaaaaatga 15360
ccgtggaacc tgggctggag cccgaggtcc gcgtgcggcc aatcaagcag gtggcgccgg 15420
gactgggcgt gcagaccgtg gacgttcaga tacccactac cagtagcacc agtattgcca 15480
ccgccacaga gggcatggag acacaaacgt ccccggttgc ctcagcggtg gcggatgccg 15540
cggtgcaggc ggtcgctgcg gccgcgtcca agacctctac ggaggtgcaa acggacccgt 15600
ggatgtttcg cgtttcagcc ccccggcgcc cgcgccgttc gaggaagtac ggcgccgcca 15660
gcgcgctact gcccgaatat gccctacatc cttccattgc gcctaccccc ggctatcgtg 15720
gctacaccta ccgccccaga agacgagcaa ctacccgacg ccgaaccacc actggaaccc 15780
gccgccgccg tcgccgtcgc cagcccgtgc tggccccgat ttccgtgcgc agggtggctc 15840
gcgaaggagg caggaccctg gtgctgccaa cagcgcgcta ccaccccagc atcgtttaaa 15900
agccggtctt tgtggttctt gcagatatgg ccctcacctg ccgcctccgt ttcccggtgc 15960
cgggattccg aggaagaatg caccgtagga ggggcatggc cggccacggc ctgacgggcg 16020
gcatgcgtcg tgcgcaccac cggcggcggc gcgcgtcgca ccgtcgcatg cgcggcggta 16080
tcctgcccct ccttattcca ctgatcgccg cggcgattgg cgccgtgccc ggaattgcat 16140
ccgtggcctt gcaggcgcag agacactgat taaaaacaag ttgcatgtgg aaaaatcaaa 16200
ataaaaagtc tggactctca cgctcgcttg gtcctgtaac tattttgtag aatggaagac 16260
atcaactttg cgtctctggc cccgcgacac ggctcgcgcc cgttcatggg aaactggcaa 16320
gatatcggca ccagcaatat gagcggtggc gccttcagct ggggctcgct gtggagcggc 16380
attaaaaatt tcggttccac cgttaagaac tatggcagca aggcctggaa cagcagcaca 16440
ggccagatgc tgagggataa gttgaaagag caaaatttcc aacaaaaggt ggtagatggc 16500
ctggcctctg gcattagcgg ggtggtggac ctggccaacc aggcagtgca aaataagatt 16560
aacagtaagc ttgatccccg ccctcccgta gaggagcctc caccggccgt ggagacagtg 16620
tctccagagg ggcgtggcga aaagcgtccg cgccccgaca gggaagaaac tctggtgacg 16680
caaatagacg agcctccctc gtacgaggag gcactaaagc aaggcctgcc caccacccgt 16740
cccatcgcgc ccatggctac cggagtgctg ggccagcaca cacccgtaac gctggacctg 16800
cctccccccg ccgacaccca gcagaaacct gtgctgccag gcccgaccgc cgttgttgta 16860
acccgtccta gccgcgcgtc cctgcgccgc gccgccagcg gtccgcgatc gttgcggccc 16920
gtagccagtg gcaactggca aagcacactg aacagcatcg tgggtctggg ggtgcaatcc 16980
ctgaagcgcc gacgatgctt ctgatagcta acgtgtcgta tgtgtgtcat gtatgcgtcc 17040
atgtcgccgc cagaggagct gctgagccgc cgcgcgcccg ctttccaaga tggctacccc 17100
ttcgatgatg ccgcagtggt cttacatgca catctcgggc caggacgcct cggagtacct 17160
gagccccggg ctggtgcagt ttgcccgcgc caccgagacg tacttcagcc tgaataacaa 17220
gtttagaaac cccacggtgg cgcctacgca cgacgtgacc acagaccggt cccagcgttt 17280
gacgctgcgg ttcatccctg tggaccgtga ggatactgcg tactcgtaca aggcgcggtt 17340
caccctagct gtgggtgata accgtgtgct ggacatggct tccacgtact ttgacatccg 17400
cggcgtgctg gacaggggcc ctacttttaa gccctactct ggcactgcct acaacgccct 17460
ggctcccaag ggtgccccaa atccttgcga atgggatgaa gctgctactg ctcttgaaat 17520
aaacctagaa gaagaggacg atgacaacga agacgaagta gacgagcaag ctgagcagca 17580
aaaaactcac gtatttgggc aggcgcctta ttctggtata aatattacaa aggagggtat 17640
tcaaataggt gtcgaaggtc aaacacctaa atatgccgat aaaacatttc aacctgaacc 17700
tcaaatagga gaatctcagt ggtacgaaac agaaattaat catgcagctg ggagagtcct 17760
aaaaaagact accccaatga aaccatgtta cggttcatat gcaaaaccca caaatgaaaa 17820
tggagggcaa ggcattcttg taaagcaaca aaatggaaag ctagaaagtc aagtggaaat 17880
gcaatttttc tcaactactg aggcagccgc aggcaatggt gataacttga ctcctaaagt 17940
ggtattgtac agtgaagatg tagatataga aaccccagac actcatattt cttacatgcc 18000
cactattaag gaaggtaact cacgagaact aatgggccaa caatctatgc ccaacaggcc 18060
taattacatt gcttttaggg acaattttat tggtctaatg tattacaaca gcacgggtaa 18120
tatgggtgtt ctggcgggcc aagcatcgca gttgaatgct gttgtagatt tgcaagacag 18180
aaacacagag ctttcatacc agcttttgct tgattccatt ggtgatagaa ccaggtactt 18240
ttctatgtgg aatcaggctg ttgacagcta tgatccagat gttagaatta ttgaaaatca 18300
tggaactgaa gatgaacttc caaattactg ctttccactg ggaggtgtga ttaatacaga 18360
gactcttacc aaggtaaaac ctaaaacagg tcaggaaaat ggatgggaaa aagatgctac 18420
agaattttca gataaaaatg aaataagagt tggaaataat tttgccatgg aaatcaatct 18480
aaatgccaac ctgtggagaa atttcctgta ctccaacata gcgctgtatt tgcccgacaa 18540
gctaaagtac agtccttcca acgtaaaaat ttctgataac ccaaacacct acgactacat 18600
gaacaagcga gtggtggctc ccgggctagt ggactgctac attaaccttg gagcacgctg 18660
gtcccttgac tatatggaca acgtcaaccc atttaaccac caccgcaatg ctggcctgcg 18720
ctaccgctca atgttgctgg gcaatggtcg ctatgtgccc ttccacatcc aggtgcctca 18780
gaagttcttt gccattaaaa acctccttct cctgccgggc tcatacacct acgagtggaa 18840
cttcaggaag gatgttaaca tggttctgca gagctcccta ggaaatgacc taagggttga 18900
cggagccagc attaagtttg atagcatttg cctttacgcc accttcttcc ccatggccca 18960
caacaccgcc tccacgcttg aggccatgct tagaaacgac accaacgacc agtcctttaa 19020
cgactatctc tccgccgcca acatgctcta ccctataccc gccaacgcta ccaacgtgcc 19080
catatccatc ccctcccgca actgggcggc tttccgcggc tgggccttca cgcgccttaa 19140
gactaaggaa accccatcac tgggctcggg ctacgaccct tattacacct actctggctc 19200
tataccctac ctagatggaa ccttttacct caaccacacc tttaagaagg tggccattac 19260
ctttgactct tctgtcagct ggcctggcaa tgaccgcctg cttaccccca acgagtttga 19320
aattaagcgc tcagttgacg gggagggtta caacgttgcc cagtgtaaca tgaccaaaga 19380
ctggttcctg gtacaaatgc tagctaacta taacattggc taccagggct tctatatccc 19440
agagagctac aaggaccgca tgtactcctt ctttagaaac ttccagccca tgagccgtca 19500
ggtggtggat gatactaaat acaaggacta ccaacaggtg ggcatcctac accaacacaa 19560
caactctgga tttgttggct accttgcccc caccatgcgc gaaggacagg cctaccctgc 19620
taacttcccc tatccgctta taggcaagac cgcagttgac agcattaccc agaaaaagtt 19680
tctttgcgat cgcacccttt ggcgcatccc attctccagt aactttatgt ccatgggcgc 19740
actcacagac ctgggccaaa accttctcta cgccaactcc gcccacgcgc tagacatgac 19800
ttttgaggtg gatcccatgg acgagcccac ccttctttat gttttgtttg aagtctttga 19860
cgtggtccgt gtgcaccagc cgcaccgcgg cgtcatcgaa accgtgtacc tgcgcacgcc 19920
cttctcggcc ggcaacgcca caacataaag aagcaagcaa catcaacaac agctgccgcc 19980
atgggctcca gtgagcagga actgaaagcc attgtcaaag atcttggttg tgggccatat 20040
tttttgggca cctatgacaa gcgctttcca ggctttgttt ctccacacaa gctcgcctgc 20100
gccatagtca atacggccgg tcgcgagact gggggcgtac actggatggc ctttgcctgg 20160
aacccgcact caaaaacatg ctacctcttt gagccctttg gcttttctga ccagcgactc 20220
aagcaggttt accagtttga gtacgagtca ctcctgcgcc gtagcgccat tgcttcttcc 20280
cccgaccgct gtataacgct ggaaaagtcc acccaaagcg tacaggggcc caactcggcc 20340
gcctgtggac tattctgctg catgtttctc cacgcctttg ccaactggcc ccaaactccc 20400
atggatcaca accccaccat gaaccttatt accggggtac ccaactccat gctcaacagt 20460
ccccaggtac agcccaccct gcgtcgcaac caggaacagc tctacagctt cctggagcgc 20520
cactcgccct acttccgcag ccacagtgcg cagattagga gcgccacttc tttttgtcac 20580
ttgaaaaaca tgtaaaaata atgtactaga gacactttca ataaaggcaa atgcttttat 20640
ttgtacactc tcgggtgatt atttaccccc acccttgccg tctgcgccgt ttaaaaatca 20700
aaggggttct gccgcgcatc gctatgcgcc actggcaggg acacgttgcg atactggtgt 20760
ttagtgctcc acttaaactc aggcacaacc atccgcggca gctcggtgaa gttttcactc 20820
cacaggctgc gcaccatcac caacgcgttt agcaggtcgg gcgccgatat cttgaagtcg 20880
cagttggggc ctccgccctg cgcgcgcgag ttgcgataca cagggttgca gcactggaac 20940
actatcagcg ccgggtggtg cacgctggcc agcacgctct tgtcggagat cagatccgcg 21000
tccaggtcct ccgcgttgct cagggcgaac ggagtcaact ttggtagctg ccttcccaaa 21060
aagggcgcgt gcccaggctt tgagttgcac tcgcaccgta gtggcatcaa aaggtgaccg 21120
tgcccggtct gggcgttagg atacagcgcc tgcataaaag ccttgatctg cttaaaagcc 21180
acctgagcct ttgcgccttc agagaagaac atgccgcaag acttgccgga aaactgattg 21240
gccggacagg ccgcgtcgtg cacgcagcac cttgcgtcgg tgttggagat ctgcaccaca 21300
tttcggcccc accggttctt cacgatcttg gccttgctag actgctcctt cagcgcgcgc 21360
tgcccgtttt cgctcgtcac atccatttca atcacgtgct ccttatttat cataatgctt 21420
ccgtgtagac acttaagctc gccttcgatc tcagcgcagc ggtgcagcca caacgcgcag 21480
cccgtgggct cgtgatgctt gtaggtcacc tctgcaaacg actgcaggta cgcctgcagg 21540
aatcgcccca tcatcgtcac aaaggtcttg ttgctggtga aggtcagctg caacccgcgg 21600
tgctcctcgt tcagccaggt cttgcatacg gccgccagag cttccacttg gtcaggcagt 21660
agtttgaagt tcgcctttag atcgttatcc acgtggtact tgtccatcag cgcgcgcgca 21720
gcctccatgc ccttctccca cgcagacacg atcggcacac tcagcgggtt catcaccgta 21780
atttcacttt ccgcttcgct gggctcttcc tcttcctctt gcgtccgcat accacgcgcc 21840
actgggtcgt cttcattcag ccgccgcact gtgcgcttac ctcctttgcc atgcttgatt 21900
agcaccggtg ggttgctgaa acccaccatt tgtagcgcca catcttctct ttcttcctcg 21960
ctgtccacga ttacctctgg tgatggcggg cgctcgggct tgggagaagg gcgcttcttt 22020
ttcttcttgg gcgcaatggc caaatccgcc gccgaggtcg atggccgcgg gctgggtgtg 22080
cgcggcacca gcgcgtcttg tgatgagtct tcctcgtcct cggactcgat acgccgcctc 22140
atccgctttt ttgggggcgc ccggggaggc ggcggcgacg gggacgggga cgacacgtcc 22200
tccatggttg ggggacgtcg cgccgcaccg cgtccgcgct cgggggtggt ttcgcgctgc 22260
tcctcttccc gactggccat ttccttctcc tataggcaga aaaagatcat ggagtcagtc 22320
gagaagaagg acagcctaac cgccccctct gagttcgcca ccaccgcctc caccgatgcc 22380
gccaacgcgc ctaccacctt ccccgtcgag gcacccccgc ttgaggagga ggaagtgatt 22440
atcgagcagg acccaggttt tgtaagcgaa gacgacgagg accgctcagt accaacagag 22500
gataaaaagc aagaccagga caacgcagag gcaaacgagg aacaagtcgg gcggggggac 22560
gaaaggcatg gcgactacct agatgtggga gacgacgtgc tgttgaagca tctgcagcgc 22620
cagtgcgcca ttatctgcga cgcgttgcaa gagcgcagcg atgtgcccct cgccatagcg 22680
gatgtcagcc ttgcctacga acgccaccta ttctcaccgc gcgtaccccc caaacgccaa 22740
gaaaacggca catgcgagcc caacccgcgc ctcaacttct accccgtatt tgccgtgcca 22800
gaggtgcttg ccacctatca catctttttc caaaactgca agatacccct atcctgccgt 22860
gccaaccgca gccgagcgga caagcagctg gccttgcggc agggcgctgt catacctgat 22920
atcgcctcgc tcaacgaagt gccaaaaatc tttgagggtc ttggacgcga cgagaagcgc 22980
gcggcaaacg ctctgcaaca ggaaaacagc gaaaatgaaa gtcactctgg agtgttggtg 23040
gaactcgagg gtgacaacgc gcgcctagcc gtactaaaac gcagcatcga ggtcacccac 23100
tttgcctacc cggcacttaa cctacccccc aaggtcatga gcacagtcat gagtgagctg 23160
atcgtgcgcc gtgcgcagcc cctggagagg gatgcaaatt tgcaagaaca aacagaggag 23220
ggcctacccg cagttggcga cgagcagcta gcgcgctggc ttcaaacgcg cgagcctgcc 23280
gacttggagg agcgacgcaa actaatgatg gccgcagtgc tcgttaccgt ggagcttgag 23340
tgcatgcagc ggttctttgc tgacccggag atgcagcgca agctagagga aacattgcac 23400
tacacctttc gacagggcta cgtacgccag gcctgcaaga tctccaacgt ggagctctgc 23460
aacctggtct cctaccttgg aattttgcac gaaaaccgcc ttgggcaaaa cgtgcttcat 23520
tccacgctca agggcgaggc gcgccgcgac tacgtccgcg actgcgttta cttatttcta 23580
tgctacacct ggcagacggc catgggcgtt tggcagcagt gcttggagga gtgcaacctc 23640
aaggagctgc agaaactgct aaagcaaaac ttgaaggacc tatggacggc cttcaacgag 23700
cgctccgtgg ccgcgcacct ggcggacatc attttccccg aacgcctgct taaaaccctg 23760
caacagggtc tgccagactt caccagtcaa agcatgttgc agaactttag gaactttatc 23820
ctagagcgct caggaatctt gcccgccacc tgctgtgcac ttcctagcga ctttgtgccc 23880
attaagtacc gcgaatgccc tccgccgctt tggggccact gctaccttct gcagctagcc 23940
aactaccttg cctaccactc tgacataatg gaagacgtga gcggtgacgg tctactggag 24000
tgtcactgtc gctgcaacct atgcaccccg caccgctccc tggtttgcaa ttcgcagctg 24060
cttaacgaaa gtcaaattat cggtaccttt gagctgcagg gtccctcgcc tgacgaaaag 24120
tccgcggctc cggggttgaa actcactccg gggctgtgga cgtcggctta ccttcgcaaa 24180
tttgtacctg aggactacca cgcccacgag attaggttct acgaagacca atcccgcccg 24240
cctaatgcgg agcttaccgc ctgcgtcatt acccagggcc acattcttgg ccaattgcaa 24300
gccatcaaca aagcccgcca agagtttctg ctacgaaagg gacggggggt ttacttggac 24360
ccccagtccg gcgaggagct caacccaatc cccccgccgc cgcagcccta tcagcagcag 24420
ccgcgggccc ttgcttccca ggatggcacc caaaaagaag ctgcagctgc cgccgccacc 24480
cacggacgag gaggaatact gggacagtca ggcagaggag gttttggacg aggaggagga 24540
ggacatgatg gaagactggg agagcctaga cgaggaagct tccgaggtcg aagaggtgtc 24600
agacgaaaca ccgtcaccct cggtcgcatt cccctcgccg gcgccccaga aatcggcaac 24660
cggttccagc atggctacaa cctccgctcc tcaggcgccg ccggcactgc ccgttcgccg 24720
acccaaccgt agatgggaca ccactggaac cagggccggt aagtccaagc agccgccgcc 24780
gttagcccaa gagcaacaac agcgccaagg ctaccgctca tggcgcgggc acaagaacgc 24840
catagttgct tgcttgcaag actgtggggg caacatctcc ttcgcccgcc gctttcttct 24900
ctaccatcac ggcgtggcct tcccccgtaa catcctgcat tactaccgtc atctctacag 24960
cccatactgc accggcggca gcggcagcaa cagcagcggc cacacagaag caaaggcgac 25020
cggatagcaa gactctgaca aagcccaaga aatccacagc ggcggcagca gcaggaggag 25080
gagcgctgcg tctggcgccc aacgaacccg tatcgacccg cgagcttaga aacaggattt 25140
ttcccactct gtatgctata tttcaacaga gcaggggcca agaacaagag ctgaaaataa 25200
aaaacaggtc tctgcgatcc ctcacccgca gctgcctgta tcacaaaagc gaagatcagc 25260
ttcggcgcac gctggaagac gcggaggctc tcttcagtaa atactgcgcg ctgactctta 25320
aggactagtt tcgcgccctt tctcaaattt aagcgcgaaa actacgtcat ctccagcggc 25380
cacacccggc gccagcacct gttgtcagcg ccattatgag caaggaaatt cccacgccct 25440
acatgtggag ttaccagcca caaatgggac ttgcggctgg agctgcccaa gactactcaa 25500
cccgaataaa ctacatgagc gcgggacccc acatgatatc ccgggtcaac ggaatacgcg 25560
cccaccgaaa ccgaattctc ctggaacagg cggctattac caccacacct cgtaataacc 25620
ttaatccccg tagttggccc gctgccctgg tgtaccagga aagtcccgct cccaccactg 25680
tggtacttcc cagagacgcc caggccgaag ttcagatgac taactcaggg gcgcagcttg 25740
cgggcggctt tcgtcacagg gtgcggtcgc ccgggcaggg tataactcac ctgacaatca 25800
gagggcgagg tattcagctc aacgacgagt cggtgagctc ctcgcttggt ctccgtccgg 25860
acgggacatt tcagatcggc ggcgccggcc gctcttcatt cacgcctcgt caggcaatcc 25920
taactctgca gacctcgtcc tctgagccgc gctctggagg cattggaact ctgcaattta 25980
ttgaggagtt tgtgccatcg gtctacttta accccttctc gggacctccc ggccactatc 26040
cggatcaatt tattcctaac tttgacgcgg taaaggactc ggcggacggc tacgactgaa 26100
tgttataagt tcctgtccat ccgcacccac tatcttcatg ttgttgcaga tgaagcgcgc 26160
aagaccgtct gaagatacct tcaaccccgt gtatccatat gacacggaaa ccggtcctcc 26220
aactgtgcct tttcttactc ctccctttgt atcccccaat gggtttcaag agagtccccc 26280
tggggtactc tctttgcgcc tatccgaacc tctagttacc tccaatggca tgcttgcgct 26340
caaaatgggc aacggcctct ctctggacga ggccggcaac cttacctccc aaaatgtaac 26400
cactgtgagc ccacctctca aaaaaaccaa gtcaaacata aacctggaaa tatctgcacc 26460
cctcacagtt acctcagaag ccctaactgt ggctgccgcc gcacctctaa tggtcgcggg 26520
caacacactc accatgcaat cacaggcccc gctaaccgtg cacgactcca aacttagcat 26580
tgccacccaa ggacccctca cagtgtcaga aggaaagcta gccctgcaaa catcaggccc 26640
cctcaccacc accgatagca gtacccttac tatcactgcc tcaccccctc taactactgc 26700
cactggtagc ttgggcattg acttgaaaga gcccatttat acacaaaatg gaaaactagg 26760
actaaagtac ggggctcctt tgcatgtaac agacgaccta aacactttga ccgtagcaac 26820
tggtccaggt gtgactatta ataatacttc cttgcaaact aaagttactg gagccttggg 26880
ttttgattca caaggcaata tgcaacttaa tgtagcagga ggactaagga ttgattctca 26940
aaacagacgc cttatacttg atgttagtta tccgtttgat gctcaaaacc aactaaatct 27000
aagactagga cagggccctc tttttataaa ctcagcccac aacttggata ttaactacaa 27060
caaaggcctt tacttgttta cagcttcaaa caattccaaa aagcttgagg ttaacctaag 27120
cactgccaag gggttgatgt ttgacgctac agccatagcc attaatgcag gagatgggct 27180
tgaatttggt tcacctaatg caccaaacac aaatcccctc aaaacaaaaa ttggccatgg 27240
cctagaattt gattcaaaca aggctatggt tcctaaacta ggaactggcc ttagttttga 27300
cagcacaggt gccattacag taggaaacaa aaataatgat aagctaactt tgtggaccac 27360
accagctcca tctcctaact gtagactaaa tgcagagaaa gatgctaaac tcactttggt 27420
cttaacaaaa tgtggcagtc aaatacttgc tacagtttca gttttggctg ttaaaggcag 27480
tttggctcca atatctggaa cagttcaaag tgctcatctt attataagat ttgacgaaaa 27540
tggagtgcta ctaaacaatt ccttcctgga cccagaatat tggaacttta gaaatggaga 27600
tcttactgaa ggcacagcct atacaaacgc tgttggattt atgcctaacc tatcagctta 27660
tccaaaatct cacggtaaaa ctgccaaaag taacattgtc agtcaagttt acttaaacgg 27720
agacaaaact aaacctgtaa cactaaccat tacactaaac ggtacacagg aaacaggaga 27780
cacaactcca agtgcatact ctatgtcatt ttcatgggac tggtctggcc acaactacat 27840
taatgaaata tttgccacat cctcttacac tttttcatac attgcccaag aataaagaat 27900
cgtttgtgtt atgtttcaac gtgtttattt ttcaattgca gaaaatttca agtcattttt 27960
cattcagtag tatagcccca ccaccacata gcttatacag atcaccgtac cttaatcaaa 28020
ctcacagaac cctagtattc aacctgccac ctccctccca acacacagag tacacagtcc 28080
tttctccccg gctggcctta aaaagcatca tatcatgggt aacagacata ttcttaggtg 28140
ttatattcca cacggtttcc tgtcgagcca aacgctcatc agtgatatta ataaactccc 28200
cgggcagctc acttaagttc atgtcgctgt ccagctgctg agccacaggc tgctgtccaa 28260
cttgcggttg cttaacgggc ggcgaaggag aagtccacgc ctacatgggg gtagagtcat 28320
aatcgtgcat caggataggg cggtggtgct gcagcagcgc gcgaataaac tgctgccgcc 28380
gccgctccgt cctgcaggaa tacaacatgg cagtggtctc ctcagcgatg attcgcaccg 28440
cccgcagcat aaggcgcctt gtcctccggg cacagcagcg caccctgatc tcacttaaat 28500
cagcacagta actgcagcac agcaccacaa tattgttcaa aatcccacag tgcaaggcgc 28560
tgtatccaaa gctcatggcg gggaccacag aacccacgtg gccatcatac cacaagcgca 28620
ggtagattaa gtggcgaccc ctcataaaca cgctggacat aaacattacc tcttttggca 28680
tgttgtaatt caccacctcc cggtaccata taaacctctg attaaacatg gcgccatcca 28740
ccaccatcct aaaccagctg gccaaaacct gcccgccggc tatacactgc agggaaccgg 28800
gactggaaca atgacagtgg agagcccagg actcgtaacc atggatcatc atgctcgtca 28860
tgatatcaat gttggcacaa cacaggcaca cgtgcataca cttcctcagg attacaagct 28920
cctcccgcgt tagaaccata tcccagggaa caacccattc ctgaatcagc gtaaatccca 28980
cactgcaggg aagacctcgc acgtaactca cgttgtgcat tgtcaaagtg ttacattcgg 29040
gcagcagcgg atgatcctcc agtatggtag cgcgggtttc tgtctcaaaa ggaggtagac 29100
gatccctact gtacggagtg cgccgagaca accgagatcg tgttggtcgt agtgtcatgc 29160
caaatggaac gccggacgta gtcatatttc ctgaagcaaa accaggtgcg ggcgtgacaa 29220
acagatctgc gtctccggtc tcgccgctta gatcgctctg tgtagtagtt gtagtatatc 29280
cactctctca aagcatccag gcgccccctg gcttcgggtt ctatgtaaac tccttcatgc 29340
gccgctgccc tgataacatc caccaccgca gaataagcca cacccagcca acctacacat 29400
tcgttctgcg agtcacacac gggaggagcg ggaagagctg gaagaaccat gttttttttt 29460
ttattccaaa agattatcca aaacctcaaa atgaagatct attaagtgaa cgcgctcccc 29520
tccggtggcg tggtcaaact ctacagccaa agaacagata atggcatttg taagatgttg 29580
cacaatggct tccaaaaggc aaacggccct cacgtccaag tggacgtaaa ggctaaaccc 29640
ttcagggtga atctcctcta taaacattcc agcaccttca accatgccca aataattctc 29700
atctcgccac cttctcaata tatctctaag caaatcccga atattaagtc cggccattgt 29760
aaaaatctgc tccagagcgc cctccacctt cagcctcaag cagcgaatca tgattgcaaa 29820
aattcaggtt cctcacagac ctgtataaga ttcaaaagcg gaacattaac aaaaataccg 29880
cgatcccgta ggtcccttcg cagggccagc tgaacataat cgtgcaggtc tgcacggacc 29940
agcgcggcca cttccccgcc aggaaccatg acaaaagaac ccacactgat tatgacacgc 30000
atactcggag ctatgctaac cagcgtagcc ccgatgtaag cttgttgcat gggcggcgat 30060
ataaaatgca aggtgctgct caaaaaatca ggcaaagcct cgcgcaaaaa agaaagcaca 30120
tcgtagtcat gctcatgcag ataaaggcag gtaagctccg gaaccaccac agaaaaagac 30180
accatttttc tctcaaacat gtctgcgggt ttctgcataa acacaaaata aaataacaaa 30240
aaaacattta aacattagaa gcctgtctta caacaggaaa aacaaccctt ataagcataa 30300
gacggactac ggccatgccg gcgtgaccgt aaaaaaactg gtcaccgtga ttaaaaagca 30360
ccaccgacag ctcctcggtc atgtccggag tcataatgta agactcggta aacacatcag 30420
gttgattcac atcggtcagt gctaaaaagc gaccgaaata gcccggggga atacataccc 30480
gcaggcgtag agacaacatt acagccccca taggaggtat aacaaaatta ataggagaga 30540
aaaacacata aacacctgaa aaaccctcct gcctaggcaa aatagcaccc tcccgctcca 30600
gaacaacata cagcgcttcc acagcggcag ccataacagt cagccttacc agtaaaaaag 30660
aaaacctatt aaaaaaacac cactcgacac ggcaccagct caatcagtca cagtgtaaaa 30720
aagggccaag tgcagagcga gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc 30780
acaaaaaaca cccagaaaac cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc 30840
cacaacttcc tcaaatcgtc acttccgttt tcccacgtta cgtcacttcc cattttaaga 30900
aaactacaat tcccaacaca tacaagttac tccgccctaa aacctacgtc acccgccccg 30960
ttcccacgcc ccgcgccacg tcacaaactc caccccctca ttatcatatt ggcttcaatc 31020
caaaataagg tatattattg atgatg 31046
<210> 2
<211> 27962
<212> DNA
<213> 人工序列()
<400> 2
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tctctagcat cgtaactata 360
acggtcctaa gtggctcgag gtttaaacag atctccaggt gcggagaaag aggtaatgaa 420
atggcatcga ctcgaagatc tgggcgtggt taagggtggg aaagaatata taaggtgggg 480
gtcttatgta gttttgtatc tgttttgcag cagccgccgc cgccatgagc accaactcgt 540
ttgatggaag cattgtgagc tcatatttga caacgcgcat gcccccatgg gccggggtgc 600
gtcagaatgt gatgggctcc agcattgatg gtcgccccgt cctgcccgca aactctacta 660
ccttgaccta cgagaccgtg tctggaacgc cgttggagac tgcagcctcc gccgccgctt 720
cagccgctgc agccaccgcc cgcgggattg tgactgactt tgctttcctg agcccgcttg 780
caagcagtgc agcttcccgt tcatccgccc gcgatgacaa gttgacggct cttttggcac 840
aattggattc tttgacccgg gaacttaatg tcgtttctca gcagctgttg gatctgcgcc 900
agcaggtttc tgccctgaag gcttcctccc ctcccaatgc ggtttaaaac ataaataaaa 960
aaccagactc tgtttggatt tggatcaagc aagtgtcttg ctgtctttat ttaggggttt 1020
tgcgcgcgcg gtaggcccgg gaccagcggt ctcggtcgtt gagggtcctg tgtatttttt 1080
ccaggacgtg gtaaaggtga ctctggatgt tcagatacat gggcataagc ccgtctctgg 1140
ggtggaggta gcaccactgc agagcttcat gctgcggggt ggtgttgtag atgatccagt 1200
cgtagcagga gcgctgggcg tggtgcctaa aaatgtcttt cagtagcaag ctgattgcca 1260
ggggcaggcc cttggtgtaa gtgtttacaa agcggttaag ctgggatggg tgcatacgtg 1320
gggatatgag atgcatcttg gactgtattt ttaggttggc tatgttccca gccatatccc 1380
tccggggatt catgttgtgc agaaccacca gcacagtgta tccggtgcac ttgggaaatt 1440
tgtcatgtag cttagaagga aatgcgtgga agaacttgga gacgcccttg tgacctccaa 1500
gattttccat gcattcgtcc ataatgatgg caatgggccc acgggcggcg gcctgggcga 1560
agatatttct gggatcacta acgtcatagt tgtgttccag gatgagatcg tcataggcca 1620
tttttacaaa gcgcgggcgg agggtgccag actgcggtat aatggttcca tccggcccag 1680
gggcgtagtt accctcacag atttgcattt cccacgcttt gagttcagat ggggggatca 1740
tgtctacctg cggggcgatg aagaaaacgg tttccggggt aggggagatc agctgggaag 1800
aaagcaggtt cctgagcagc tgcgacttac cgcagccggt gggcccgtaa atcacaccta 1860
ttaccggctg caactggtag ttaagagagc tgcagctgcc gtcatccctg agcagggggg 1920
ccacttcgtt aagcatgtcc ctgactcgca tgttttccct gaccaaatcc gccagaaggc 1980
gctcgccgcc cagcgatagc agttcttgca aggaagcaaa gtttttcaac ggtttgagac 2040
cgtccgccgt aggcatgctt ttgagcgttt gaccaagcag ttccaggcgg tcccacagct 2100
cggtcacctg ctctacggca tctcgatcca gcatatctcc tcgtttcgcg ggttggggcg 2160
gctttcgctg tacggcagta gtcggtgctc gtccagacgg gccagggtca tgtctttcca 2220
cgggcgcagg gtcctcgtca gcgtagtctg ggtcacggtg aaggggtgcg ctccgggctg 2280
cgcgctggcc agggtgcgct tgaggctggt cctgctggtg ctgaagcgct gccggtcttc 2340
gccctgcgcg tcggccaggt agcatttgac catggtgtca tagtccagcc cctccgcggc 2400
gtggcccttg gcgcgcagct tgcccttgga ggaggcgccg cacgaggggc agtgcagact 2460
tttgagggcg tagagcttgg gcgcgagaaa taccgattcc ggggagtagg catccgcgcc 2520
gcaggccccg cagacggtct cgcattccac gagccaggtg agctctggcc gttcggggtc 2580
aaaaaccagg tttcccccat gctttttgat gcgtttctta cctctggttt ccatgagccg 2640
gtgtccacgc tcggtgacga aaaggctgtc cgtgtccccg tatacagact tgagaggcct 2700
gtcctcgagc ggtgttccgc ggtcctcctc gtatagaaac tcggaccact ctgagacaaa 2760
ggctcgcgtc caggccagca cgaaggaggc taagtgggag gggtagcggt cgttgtccac 2820
tagggggtcc actcgctcca gggtgtgaag acacatgtcg ccctcttcgg catcaaggaa 2880
ggtgattggt ttgtaggtgt aggccacgtg accgggtgtt cctgaagggg ggctataaaa 2940
gggggtgggg gcgcgttcgt cctcactctc ttccgcatcg ctgtctgcga gggccagctg 3000
ttggggtgag tactccctct gaaaagcggg catgacttct gcgctaagat tgtcagtttc 3060
caaaaacgag gaggatttga tattcacctg gcccgcggtg atgcctttga gggtggccgc 3120
atccatctgg tcagaaaaga caatcttttt gttgtcaagc ttggtggcaa acgacccgta 3180
gagggcgttg gacagcaact tggcgatgga gcgcagggtt tggtttttgt cgcgatcggc 3240
gcgctccttg gccgcgatgt ttagctgcac gtattcgcgc gcaacgcacc gccattcggg 3300
aaagacggtg gtgcgctcgt cgggcaccag gtgcacgcgc caaccgcggt tgtgcagggt 3360
gacaaggtca acgctggtgg ctacctctcc gcgtaggcgc tcgttggtcc agcagaggcg 3420
gccgcccttg cgcgagcaga atggcggtag ggggtctagc tgcgtctcgt ccggggggtc 3480
tgcgtccacg gtaaagaccc cgggcagcag gcgcgcgtcg aagtagtcta tcttgcatcc 3540
ttgcaagtct agcgcctgct gccatgcgcg ggcggcaagc gcgcgctcgt atgggttgag 3600
tgggggaccc catggcatgg ggtgggtgag cgcggaggcg tacatgccgc aaatgtcgta 3660
aacgtagagg ggctctctga gtattccaag atatgtaggg tagcatcttc caccgcggat 3720
gctggcgcgc acgtaatcgt atagttcgtg cgagggagcg aggaggtcgg gaccgaggtt 3780
gctacgggcg ggctgctctg ctcggaagac tatctgcctg aagatggcat gtgagttgga 3840
tgatatggtt ggacgctgga agacgttgaa gctggcgtct gtgagaccta ccgcgtcacg 3900
cacgaaggag gcgtaggagt cgcgcagctt gttgaccagc tcggcggtga cctgcacgtc 3960
tagggcgcag tagtccaggg tttccttgat gatgtcatac ttatcctgtc cctttttttt 4020
ccacagctcg cggttgagga caaactcttc gcggtctttc cagtactctt ggatcggaaa 4080
cccgtcggcc tccgaacggt aagagcctag catgtagaac tggttgacgg cctggtaggc 4140
gcagcatccc ttttctacgg gtagcgcgta tgcctgcgcg gccttccgga gcgaggtgtg 4200
ggtgagcgca aaggtgtccc tgaccatgac tttgaggtac tggtatttga agtcagtgtc 4260
gtcgcatccg ccctgctccc agagcaaaaa gtccgtgcgc tttttggaac gcggatttgg 4320
cagggcgaag gtgacatcgt tgaagagtat ctttcccgcg cgaggcataa agttgcgtgt 4380
gatgcggaag ggtcccggca cctcggaacg gttgttaatt acctgggcgg cgagcacgat 4440
ctcgtcaaag ccgttgatgt tgtggcccac aatgtaaagt tccaagaagc gcgggatgcc 4500
cttgatggaa ggcaattttt taagttcctc gtaggtgagc tcttcagggg agctgagccc 4560
gtgctctgaa agggcccagt ctgcaagatg agggttggaa gcgacgaatg agctccacag 4620
gtcacgggcc attagcattt gcaggtggtc gcgaaaggtc ctaaactggc gacctatggc 4680
cattttttct ggggtgatgc agtagaaggt aagcgggtct tgttcccagc ggtcccatcc 4740
aaggttcgcg gctaggtctc gcgcggcagt cactagaggc tcatctccgc cgaacttcat 4800
gaccagcatg aagggcacga gctgcttccc aaaggccccc atccaagtat aggtctctac 4860
atcgtaggtg acaaagagac gctcggtgcg aggatgcgag ccgatcggga agaactggat 4920
ctcccgccac caattggagg agtggctatt gatgtggtga aagtagaagt ccctgcgacg 4980
ggccgaacac tcgtgctggc ttttgtaaaa acgtgcgcag tactggcagc ggtgcacggg 5040
ctgtacatcc tgcacgaggt tgacctgacg accgcgcaca aggaagcaga gtgggaattt 5100
gagcccctcg cctggcgggt ttggctggtg gtcttctact tcggctgctt gtccttgacc 5160
gtctggctgc tcgaggggag ttacggtgga tcggaccacc acgccgcgcg agcccaaagt 5220
ccagatgtcc gcgcgcggcg gtcggagctt gatgacaaca tcgcgcagat gggagctgtc 5280
catggtctgg agctcccgcg gcgtcaggtc aggcgggagc tcctgcaggt ttacctcgca 5340
tagacgggtc agggcgcggg ctagatccag gtgataccta atttccaggg gctggttggt 5400
ggcggcgtcg atggcttgca agaggccgca tccccgcggc gcgactacgg taccgcgcgg 5460
cgggcggtgg gccgcggggg tgtccttgga tgatgcatct aaaagcggtg acgcgggcga 5520
gcccccggag gtaggggggg ctccggaccc gccgggagag ggggcagggg cacgtcggcg 5580
ccgcgcgcgg gcaggagctg gtgctgcgcg cgtaggttgc tggcgaacgc gacgacgcgg 5640
cggttgatct cctgaatctg gcgcctctgc gtgaagacga cgggcccggt gagcttgaac 5700
ctgaaagaga gttcgacaga atcaatttcg gtgtcgttga cggcggcctg gcgcaaaatc 5760
tcctgcacgt ctcctgagtt gtcttgatag gcgatctcgg ccatgaactg ctcgatctct 5820
tcctcctgga gatctccgcg tccggctcgc tccacggtgg cggcgaggtc gttggaaatg 5880
cgggccatga gctgcgagaa ggcgttgagg cctccctcgt tccagacgcg gctgtagacc 5940
acgccccctt cggcatcgcg ggcgcgcatg accacctgcg cgagattgag ctccacgtgc 6000
cgggcgaaga cggcgtagtt tcgcaggcgc tgaaagaggt agttgagggt ggtggcggtg 6060
tgttctgcca cgaagaagta cataacccag cgtcgcaacg tggattcgtt gatatccccc 6120
aaggcctcaa ggcgctccat ggcctcgtag aagtccacgg cgaagttgaa aaactgggag 6180
ttgcgcgccg acacggttaa ctcctcctcc agaagacgga tgagctcggc gacagtgtcg 6240
cgcacctcgc gctcaaaggc tacaggggcc tcttcttctt cttcaatctc ctcttccata 6300
agggcctccc cttcttcttc ttctggcggc ggtgggggag gggggacacg gcggcgacga 6360
cggcgcaccg ggaggcggtc gacaaagcgc tcgatcatct ccccgcggcg acggcgcatg 6420
gtctcggtga cggcgcggcc gttctcgcgg gggcgcagtt ggaagacgcc gcccgtcatg 6480
tcccggttat gggttggcgg ggggctgcca tgcggcaggg atacggcgct aacgatgcat 6540
ctcaacaatt gttgtgtagg tactccgccg ccgagggacc tgagcgagtc cgcatcgacc 6600
ggatcggaaa acctctcgag aaaggcgtct aaccagtcac agtcgcaagg taggctgagc 6660
accgtggcgg gcggcagcgg gcggcggtcg gggttgtttc tggcggaggt gctgctgatg 6720
atgtaattaa agtaggcggt cttgagacgg cggatggtcg acagaagcac catgtccttg 6780
ggtccggcct gctgaatgcg caggcggtcg gccatgcccc aggcttcgtt ttgacatcgg 6840
cgcaggtctt tgtagtagtc ttgcatgagc ctttctaccg gcacttcttc ttctccttcc 6900
tcttgtcctg catctcttgc atctatcgct gcggcggcgg cggagtttgg ccgtaggtgg 6960
cgccctcttc ctcccatgcg tgtgaccccg aagcccctca tcggctgaag cagggctagg 7020
tcggcgacaa cgcgctcggc taatatggcc tgctgcacct gcgtgagggt agactggaag 7080
tcatccatgt ccacaaagcg gtggtatgcg cccgtgttga tggtgtaagt gcagttggcc 7140
ataacggacc agttaacggt ctggtgaccc ggctgcgaga gctcggtgta cctgagacgc 7200
gagtaagccc tcgagtcaaa tacgtagtcg ttgcaagtcc gcaccaggta ctggtatccc 7260
accaaaaagt gcggcggcgg ctggcggtag aggggccagc gtagggtggc cggggctccg 7320
ggggcgagat cttccaacat aaggcgatga tatccgtaga tgtacctgga catccaggtg 7380
atgccggcgg cggtggtgga ggcgcgcgga aagtcgcgga cgcggttcca gatgttgcgc 7440
agcggcaaaa agtgctccat ggtcgggacg ctctggccgg tcaggcgcgc gcaatcgttg 7500
acgctctagc gtgcaaaagg agagcctgta agcgggcact cttccgtggt ctggtggata 7560
aattcgcaag ggtatcatgg cggacgaccg gggttcgagc cccgtatccg gccgtccgcc 7620
gtgatccatg cggttaccgc ccgcgtgtcg aacccaggtg tgcgacgtca gacaacgggg 7680
gagtgctcct tttggcttcc ttccaggcgc ggcggctgct gcgctagctt ttttggccac 7740
tggccgcgcg cagcgtaagc ggttaggctg gaaagcgaaa gcattaagtg gctcgctccc 7800
tgtagccgga gggttatttt ccaagggttg agtcgcggga cccccggttc gagtctcgga 7860
ccggccggac tgcggcgaac gggggtttgc ctccccgtca tgcaagaccc cgcttgcaaa 7920
ttcctccgga aacagggacg agcccctttt ttgcttttcc cagatgcatc cggtgctgcg 7980
gcagatgcgc ccccctcctc agcagcggca agagcaagag cagcggcaga catgcagggc 8040
accctcccct cctcctaccg cgtcaggagg ggcgacatcc gcggttgacg cggcagcaga 8100
tggtgattac gaacccccgc ggcgccgggc ccggcactac ctggacttgg aggagggcga 8160
gggcctggcg cggctaggag cgccctctcc tgagcggcac ccaagggtgc agctgaagcg 8220
tgatacgcgt gaggcgtacg tgccgcggca gaacctgttt cgcgaccgcg agggagagga 8280
gcccgaggag atgcgggatc gaaagttcca cgcagggcgc gagctgcggc atggcctgaa 8340
tcgcgagcgg ttgctgcgcg aggaggactt tgagcccgac gcgcgaaccg ggattagtcc 8400
cgcgcgcgca cacgtggcgg ccgccgacct ggtaaccgca tacgagcaga cggtgaacca 8460
ggagattaac tttcaaaaaa gctttaacaa ccacgtgcgt acgcttgtgg cgcgcgagga 8520
ggtggctata ggactgatgc atctgtggga ctttgtaagc gcgctggagc aaaacccaaa 8580
tagcaagccg ctcatggcgc agctgttcct tatagtgcag cacagcaggg acaacgaggc 8640
attcagggat gcgctgctaa acatagtaga gcccgagggc cgctggctgc tcgatttgat 8700
aaacatcctg cagagcatag tggtgcagga gcgcagcttg agcctggctg acaaggtggc 8760
cgccatcaac tattccatgc ttagcctggg caagttttac gcccgcaaga tataccatac 8820
cccttacgtt cccatagaca aggaggtaaa gatcgagggg ttctacatgc gcatggcgct 8880
gaaggtgctt accttgagcg acgacctggg cgtttatcgc aacgagcgca tccacaaggc 8940
cgtgagcgtg agccggcggc gcgagctcag cgaccgcgag ctgatgcaca gcctgcaaag 9000
ggccctggct ggcacgggca gcggcgatag agaggccgag tcctactttg acgcgggcgc 9060
tgacctgcgc tgggccccaa gccgacgcgc cctggaggca gctggggccg gacctgggct 9120
ggcggtggca cccgcgcgcg ctggcaacgt cggcggcgtg gaggaatatg acgaggacga 9180
tgagtacgag ccagaggacg gcgagtacta agcggtgatg tttctgatca ggcggccgga 9240
aaaaaaaaaa gcatgatgca aaataaaaaa ctcaccaagg ccatggcacc gagcgttggt 9300
tttcttgtat tccccttagt atgcggcgcg cggcgatgta tgaggaaggt cctcctccct 9360
cctacgagag tgtggtgagc gcggcgccag tggcggcggc gctgggttct cccttcgatg 9420
ctcccctgga cccgccgttt gtgcctccgc ggtacctgcg gcctaccggg gggagaaaca 9480
gcatccgtta ctctgagttg gcacccctat tcgacaccac ccgtgtgtac ctggtggaca 9540
acaagtcaac ggatgtggca tccctgaact accagaacga ccacagcaac tttctgacca 9600
cggtcattca aaacaatgac tacagcccgg gggaggcaag cacacagacc atcaatcttg 9660
acgaccggtc gcactggggc ggcgacctga aaaccatcct gcataccaac atgccaaatg 9720
tgaacgagtt catgtttacc aataagttta aggcgcgggt gatggtgtcg cgcttgccta 9780
ctaaggacaa tcaggtggag ctgaaatacg agtgggtgga gttcacgctg cccgagggca 9840
actactccga gaccatgacc atagacctta tgaacaacgc gatcgtggag cactacttga 9900
aagtgggcag acagaacggg gttctggaaa gcgacatcgg ggtaaagttt gacacccgca 9960
acttcagact ggggtttgac cccgtcactg gtcttgtcat gcctggggta tatacaaacg 10020
aagccttcca tccagacatc attttgctgc caggatgcgg ggtggacttc acccacagcc 10080
gcctgagcaa cttgttgggc atccgcaagc ggcaaccctt ccaggagggc tttaggatca 10140
cctacgatga tctggagggt ggtaacattc ccgcactgtt ggatgtggac gcctaccagg 10200
cgagcttgaa agatgacacc gaacagggcg ggggtggcgc aggcggcagc aacagcagtg 10260
gcagcggcgc ggaagagaac tccaacgcgg cagccgcggc aatgcagccg gtggaggaca 10320
tgaacgatca tgccattcgc ggcgacacct ttgccacacg ggctgaggag aagcgcgctg 10380
aggccgaagc agcggccgaa gctgccgccc ccgctgcgca acccgaggtc gagaagcctc 10440
agaagaaacc ggtgatcaaa cccctgacag aggacagcaa gaaacgcagt tacaacctaa 10500
taagcaatga cagcaccttc acccagtacc gcagctggta ccttgcatac aactacggcg 10560
accctcagac cggaatccgc tcatggaccc tgctttgcac tcctgacgta acctgcggct 10620
cggagcaggt ctactggtcg ttgccagaca tgatgcaaga ccccgtgacc ttccgctcca 10680
cgcgccagat cagcaacttt ccggtggtgg gcgccgagct gttgcccgtg cactccaaga 10740
gcttctacaa cgaccaggcc gtctactccc aactcatccg ccagtttacc tctctgaccc 10800
acgtgttcaa tcgctttccc gagaaccaga ttttggcgcg cccgccagcc cccaccatca 10860
ccaccgtcag tgaaaacgtt cctgctctca cagatcacgg gacgctaccg ctgcgcaaca 10920
gcatcggagg agtccagcga gtgaccatta ctgacgccag acgccgcacc tgcccctacg 10980
tttacaaggc cctgggcata gtctcgccgc gcgtcctatc gagccgcact ttttgagcaa 11040
gcatgtccat ccttatatcg cccagcaata acacaggctg gggcctgcgc ttcccaagca 11100
agatgtttgg cggggccaag aagcgctccg accaacaccc agtgcgcgtg cgcgggcact 11160
accgcgcgcc ctggggcgcg cacaaacgcg gccgcactgg gcgcaccacc gtcgatgacg 11220
ccatcgacgc ggtggtggag gaggcgcgca actacacgcc cacgccgcca ccagtgtcca 11280
cagtggacgc ggccattcag accgtggtgc gcggagcccg gcgctatgct aaaatgaaga 11340
gacggcggag gcgcgtagca cgtcgccacc gccgccgacc cggcactgcc gcccaacgcg 11400
cggcggcggc cctgcttaac cgcgcacgtc gcaccggccg acgggcggcc atgcgggccg 11460
ctcgaaggct ggccgcgggt attgtcactg tgccccccag gtccaggcga cgagcggccg 11520
ccgcagcagc cgcggccatt agtgctatga ctcagggtcg caggggcaac gtgtattggg 11580
tgcgcgactc ggttagcggc ctgcgcgtgc ccgtgcgcac ccgccccccg cgcaactaga 11640
ttgcaagaaa aaactactta gactcgtact gttgtatgta tccagcggcg gcggcgcgca 11700
acgaagctat gtccaagcgc aaaatcaaag aagagatgct ccaggtcatc gcgccggaga 11760
tctatggccc cccgaagaag gaagagcagg attacaagcc ccgaaagcta aagcgggtca 11820
aaaagaaaaa gaaagatgat gatgatgaac ttgacgacga ggtggaactg ctgcacgcta 11880
ccgcgcccag gcgacgggta cagtggaaag gtcgacgcgt aaaacgtgtt ttgcgacccg 11940
gcaccaccgt agtctttacg cccggtgagc gctccacccg cacctacaag cgcgtgtatg 12000
atgaggtgta cggcgacgag gacctgcttg agcaggccaa cgagcgcctc ggggagtttg 12060
cctacggaaa gcggcataag gacatgctgg cgttgccgct ggacgagggc aacccaacac 12120
ctagcctaaa gcccgtaaca ctgcagcagg tgctgcccgc gcttgcaccg tccgaagaaa 12180
agcgcggcct aaagcgcgag tctggtgact tggcacccac cgtgcagctg atggtaccca 12240
agcgccagcg actggaagat gtcttggaaa aaatgaccgt ggaacctggg ctggagcccg 12300
aggtccgcgt gcggccaatc aagcaggtgg cgccgggact gggcgtgcag accgtggacg 12360
ttcagatacc cactaccagt agcaccagta ttgccaccgc cacagagggc atggagacac 12420
aaacgtcccc ggttgcctca gcggtggcgg atgccgcggt gcaggcggtc gctgcggccg 12480
cgtccaagac ctctacggag gtgcaaacgg acccgtggat gtttcgcgtt tcagcccccc 12540
ggcgcccgcg ccgttcgagg aagtacggcg ccgccagcgc gctactgccc gaatatgccc 12600
tacatccttc cattgcgcct acccccggct atcgtggcta cacctaccgc cccagaagac 12660
gagcaactac ccgacgccga accaccactg gaacccgccg ccgccgtcgc cgtcgccagc 12720
ccgtgctggc cccgatttcc gtgcgcaggg tggctcgcga aggaggcagg accctggtgc 12780
tgccaacagc gcgctaccac cccagcatcg tttaaaagcc ggtctttgtg gttcttgcag 12840
atatggccct cacctgccgc ctccgtttcc cggtgccggg attccgagga agaatgcacc 12900
gtaggagggg catggccggc cacggcctga cgggcggcat gcgtcgtgcg caccaccggc 12960
ggcggcgcgc gtcgcaccgt cgcatgcgcg gcggtatcct gcccctcctt attccactga 13020
tcgccgcggc gattggcgcc gtgcccggaa ttgcatccgt ggccttgcag gcgcagagac 13080
actgattaaa aacaagttgc atgtggaaaa atcaaaataa aaagtctgga ctctcacgct 13140
cgcttggtcc tgtaactatt ttgtagaatg gaagacatca actttgcgtc tctggccccg 13200
cgacacggct cgcgcccgtt catgggaaac tggcaagata tcggcaccag caatatgagc 13260
ggtggcgcct tcagctgggg ctcgctgtgg agcggcatta aaaatttcgg ttccaccgtt 13320
aagaactatg gcagcaaggc ctggaacagc agcacaggcc agatgctgag ggataagttg 13380
aaagagcaaa atttccaaca aaaggtggta gatggcctgg cctctggcat tagcggggtg 13440
gtggacctgg ccaaccaggc agtgcaaaat aagattaaca gtaagcttga tccccgccct 13500
cccgtagagg agcctccacc ggccgtggag acagtgtctc cagaggggcg tggcgaaaag 13560
cgtccgcgcc ccgacaggga agaaactctg gtgacgcaaa tagacgagcc tccctcgtac 13620
gaggaggcac taaagcaagg cctgcccacc acccgtccca tcgcgcccat ggctaccgga 13680
gtgctgggcc agcacacacc cgtaacgctg gacctgcctc cccccgccga cacccagcag 13740
aaacctgtgc tgccaggccc gaccgccgtt gttgtaaccc gtcctagccg cgcgtccctg 13800
cgccgcgccg ccagcggtcc gcgatcgttg cggcccgtag ccagtggcaa ctggcaaagc 13860
acactgaaca gcatcgtggg tctgggggtg caatccctga agcgccgacg atgcttctga 13920
tagctaacgt gtcgtatgtg tgtcatgtat gcgtccatgt cgccgccaga ggagctgctg 13980
agccgccgcg cgcccgcttt ccaagatggc taccccttcg atgatgccgc agtggtctta 14040
catgcacatc tcgggccagg acgcctcgga gtacctgagc cccgggctgg tgcagtttgc 14100
ccgcgccacc gagacgtact tcagcctgaa taacaagttt agaaacccca cggtggcgcc 14160
tacgcacgac gtgaccacag accggtccca gcgtttgacg ctgcggttca tccctgtgga 14220
ccgtgaggat actgcgtact cgtacaaggc gcggttcacc ctagctgtgg gtgataaccg 14280
tgtgctggac atggcttcca cgtactttga catccgcggc gtgctggaca ggggccctac 14340
ttttaagccc tactctggca ctgcctacaa cgccctggct cccaagggtg ccccaaatcc 14400
ttgcgaatgg gatgaagctg ctactgctct tgaaataaac ctagaagaag aggacgatga 14460
caacgaagac gaagtagacg agcaagctga gcagcaaaaa actcacgtat ttgggcaggc 14520
gccttattct ggtataaata ttacaaagga gggtattcaa ataggtgtcg aaggtcaaac 14580
acctaaatat gccgataaaa catttcaacc tgaacctcaa ataggagaat ctcagtggta 14640
cgaaacagaa attaatcatg cagctgggag agtcctaaaa aagactaccc caatgaaacc 14700
atgttacggt tcatatgcaa aacccacaaa tgaaaatgga gggcaaggca ttcttgtaaa 14760
gcaacaaaat ggaaagctag aaagtcaagt ggaaatgcaa tttttctcaa ctactgaggc 14820
agccgcaggc aatggtgata acttgactcc taaagtggta ttgtacagtg aagatgtaga 14880
tatagaaacc ccagacactc atatttctta catgcccact attaaggaag gtaactcacg 14940
agaactaatg ggccaacaat ctatgcccaa caggcctaat tacattgctt ttagggacaa 15000
ttttattggt ctaatgtatt acaacagcac gggtaatatg ggtgttctgg cgggccaagc 15060
atcgcagttg aatgctgttg tagatttgca agacagaaac acagagcttt cataccagct 15120
tttgcttgat tccattggtg atagaaccag gtacttttct atgtggaatc aggctgttga 15180
cagctatgat ccagatgtta gaattattga aaatcatgga actgaagatg aacttccaaa 15240
ttactgcttt ccactgggag gtgtgattaa tacagagact cttaccaagg taaaacctaa 15300
aacaggtcag gaaaatggat gggaaaaaga tgctacagaa ttttcagata aaaatgaaat 15360
aagagttgga aataattttg ccatggaaat caatctaaat gccaacctgt ggagaaattt 15420
cctgtactcc aacatagcgc tgtatttgcc cgacaagcta aagtacagtc cttccaacgt 15480
aaaaatttct gataacccaa acacctacga ctacatgaac aagcgagtgg tggctcccgg 15540
gctagtggac tgctacatta accttggagc acgctggtcc cttgactata tggacaacgt 15600
caacccattt aaccaccacc gcaatgctgg cctgcgctac cgctcaatgt tgctgggcaa 15660
tggtcgctat gtgcccttcc acatccaggt gcctcagaag ttctttgcca ttaaaaacct 15720
ccttctcctg ccgggctcat acacctacga gtggaacttc aggaaggatg ttaacatggt 15780
tctgcagagc tccctaggaa atgacctaag ggttgacgga gccagcatta agtttgatag 15840
catttgcctt tacgccacct tcttccccat ggcccacaac accgcctcca cgcttgaggc 15900
catgcttaga aacgacacca acgaccagtc ctttaacgac tatctctccg ccgccaacat 15960
gctctaccct atacccgcca acgctaccaa cgtgcccata tccatcccct cccgcaactg 16020
ggcggctttc cgcggctggg ccttcacgcg ccttaagact aaggaaaccc catcactggg 16080
ctcgggctac gacccttatt acacctactc tggctctata ccctacctag atggaacctt 16140
ttacctcaac cacaccttta agaaggtggc cattaccttt gactcttctg tcagctggcc 16200
tggcaatgac cgcctgctta cccccaacga gtttgaaatt aagcgctcag ttgacgggga 16260
gggttacaac gttgcccagt gtaacatgac caaagactgg ttcctggtac aaatgctagc 16320
taactataac attggctacc agggcttcta tatcccagag agctacaagg accgcatgta 16380
ctccttcttt agaaacttcc agcccatgag ccgtcaggtg gtggatgata ctaaatacaa 16440
ggactaccaa caggtgggca tcctacacca acacaacaac tctggatttg ttggctacct 16500
tgcccccacc atgcgcgaag gacaggccta ccctgctaac ttcccctatc cgcttatagg 16560
caagaccgca gttgacagca ttacccagaa aaagtttctt tgcgatcgca ccctttggcg 16620
catcccattc tccagtaact ttatgtccat gggcgcactc acagacctgg gccaaaacct 16680
tctctacgcc aactccgccc acgcgctaga catgactttt gaggtggatc ccatggacga 16740
gcccaccctt ctttatgttt tgtttgaagt ctttgacgtg gtccgtgtgc accagccgca 16800
ccgcggcgtc atcgaaaccg tgtacctgcg cacgcccttc tcggccggca acgccacaac 16860
ataaagaagc aagcaacatc aacaacagct gccgccatgg gctccagtga gcaggaactg 16920
aaagccattg tcaaagatct tggttgtggg ccatattttt tgggcaccta tgacaagcgc 16980
tttccaggct ttgtttctcc acacaagctc gcctgcgcca tagtcaatac ggccggtcgc 17040
gagactgggg gcgtacactg gatggccttt gcctggaacc cgcactcaaa aacatgctac 17100
ctctttgagc cctttggctt ttctgaccag cgactcaagc aggtttacca gtttgagtac 17160
gagtcactcc tgcgccgtag cgccattgct tcttcccccg accgctgtat aacgctggaa 17220
aagtccaccc aaagcgtaca ggggcccaac tcggccgcct gtggactatt ctgctgcatg 17280
tttctccacg cctttgccaa ctggccccaa actcccatgg atcacaaccc caccatgaac 17340
cttattaccg gggtacccaa ctccatgctc aacagtcccc aggtacagcc caccctgcgt 17400
cgcaaccagg aacagctcta cagcttcctg gagcgccact cgccctactt ccgcagccac 17460
agtgcgcaga ttaggagcgc cacttctttt tgtcacttga aaaacatgta aaaataatgt 17520
actagagaca ctttcaataa aggcaaatgc ttttatttgt acactctcgg gtgattattt 17580
acccccaccc ttgccgtctg cgccgtttaa aaatcaaagg ggttctgccg cgcatcgcta 17640
tgcgccactg gcagggacac gttgcgatac tggtgtttag tgctccactt aaactcaggc 17700
acaaccatcc gcggcagctc ggtgaagttt tcactccaca ggctgcgcac catcaccaac 17760
gcgtttagca ggtcgggcgc cgatatcttg aagtcgcagt tggggcctcc gccctgcgcg 17820
cgcgagttgc gatacacagg gttgcagcac tggaacacta tcagcgccgg gtggtgcacg 17880
ctggccagca cgctcttgtc ggagatcaga tccgcgtcca ggtcctccgc gttgctcagg 17940
gcgaacggag tcaactttgg tagctgcctt cccaaaaagg gcgcgtgccc aggctttgag 18000
ttgcactcgc accgtagtgg catcaaaagg tgaccgtgcc cggtctgggc gttaggatac 18060
agcgcctgca taaaagcctt gatctgctta aaagccacct gagcctttgc gccttcagag 18120
aagaacatgc cgcaagactt gccggaaaac tgattggccg gacaggccgc gtcgtgcacg 18180
cagcaccttg cgtcggtgtt ggagatctgc accacatttc ggccccaccg gttcttcacg 18240
atcttggcct tgctagactg ctccttcagc gcgcgctgcc cgttttcgct cgtcacatcc 18300
atttcaatca cgtgctcctt atttatcata atgcttccgt gtagacactt aagctcgcct 18360
tcgatctcag cgcagcggtg cagccacaac gcgcagcccg tgggctcgtg atgcttgtag 18420
gtcacctctg caaacgactg caggtacgcc tgcaggaatc gccccatcat cgtcacaaag 18480
gtcttgttgc tggtgaaggt cagctgcaac ccgcggtgct cctcgttcag ccaggtcttg 18540
catacggccg ccagagcttc cacttggtca ggcagtagtt tgaagttcgc ctttagatcg 18600
ttatccacgt ggtacttgtc catcagcgcg cgcgcagcct ccatgccctt ctcccacgca 18660
gacacgatcg gcacactcag cgggttcatc accgtaattt cactttccgc ttcgctgggc 18720
tcttcctctt cctcttgcgt ccgcatacca cgcgccactg ggtcgtcttc attcagccgc 18780
cgcactgtgc gcttacctcc tttgccatgc ttgattagca ccggtgggtt gctgaaaccc 18840
accatttgta gcgccacatc ttctctttct tcctcgctgt ccacgattac ctctggtgat 18900
ggcgggcgct cgggcttggg agaagggcgc ttctttttct tcttgggcgc aatggccaaa 18960
tccgccgccg aggtcgatgg ccgcgggctg ggtgtgcgcg gcaccagcgc gtcttgtgat 19020
gagtcttcct cgtcctcgga ctcgatacgc cgcctcatcc gcttttttgg gggcgcccgg 19080
ggaggcggcg gcgacgggga cggggacgac acgtcctcca tggttggggg acgtcgcgcc 19140
gcaccgcgtc cgcgctcggg ggtggtttcg cgctgctcct cttcccgact ggccatttcc 19200
ttctcctata ggcagaaaaa gatcatggag tcagtcgaga agaaggacag cctaaccgcc 19260
ccctctgagt tcgccaccac cgcctccacc gatgccgcca acgcgcctac caccttcccc 19320
gtcgaggcac ccccgcttga ggaggaggaa gtgattatcg agcaggaccc aggttttgta 19380
agcgaagacg acgaggaccg ctcagtacca acagaggata aaaagcaaga ccaggacaac 19440
gcagaggcaa acgaggaaca agtcgggcgg ggggacgaaa ggcatggcga ctacctagat 19500
gtgggagacg acgtgctgtt gaagcatctg cagcgccagt gcgccattat ctgcgacgcg 19560
ttgcaagagc gcagcgatgt gcccctcgcc atagcggatg tcagccttgc ctacgaacgc 19620
cacctattct caccgcgcgt accccccaaa cgccaagaaa acggcacatg cgagcccaac 19680
ccgcgcctca acttctaccc cgtatttgcc gtgccagagg tgcttgccac ctatcacatc 19740
tttttccaaa actgcaagat acccctatcc tgccgtgcca accgcagccg agcggacaag 19800
cagctggcct tgcggcaggg cgctgtcata cctgatatcg cctcgctcaa cgaagtgcca 19860
aaaatctttg agggtcttgg acgcgacgag aagcgcgcgg caaacgctct gcaacaggaa 19920
aacagcgaaa atgaaagtca ctctggagtg ttggtggaac tcgagggtga caacgcgcgc 19980
ctagccgtac taaaacgcag catcgaggtc acccactttg cctacccggc acttaaccta 20040
ccccccaagg tcatgagcac agtcatgagt gagctgatcg tgcgccgtgc gcagcccctg 20100
gagagggatg caaatttgca agaacaaaca gaggagggcc tacccgcagt tggcgacgag 20160
cagctagcgc gctggcttca aacgcgcgag cctgccgact tggaggagcg acgcaaacta 20220
atgatggccg cagtgctcgt taccgtggag cttgagtgca tgcagcggtt ctttgctgac 20280
ccggagatgc agcgcaagct agaggaaaca ttgcactaca cctttcgaca gggctacgta 20340
cgccaggcct gcaagatctc caacgtggag ctctgcaacc tggtctccta ccttggaatt 20400
ttgcacgaaa accgccttgg gcaaaacgtg cttcattcca cgctcaaggg cgaggcgcgc 20460
cgcgactacg tccgcgactg cgtttactta tttctatgct acacctggca gacggccatg 20520
ggcgtttggc agcagtgctt ggaggagtgc aacctcaagg agctgcagaa actgctaaag 20580
caaaacttga aggacctatg gacggccttc aacgagcgct ccgtggccgc gcacctggcg 20640
gacatcattt tccccgaacg cctgcttaaa accctgcaac agggtctgcc agacttcacc 20700
agtcaaagca tgttgcagaa ctttaggaac tttatcctag agcgctcagg aatcttgccc 20760
gccacctgct gtgcacttcc tagcgacttt gtgcccatta agtaccgcga atgccctccg 20820
ccgctttggg gccactgcta ccttctgcag ctagccaact accttgccta ccactctgac 20880
ataatggaag acgtgagcgg tgacggtcta ctggagtgtc actgtcgctg caacctatgc 20940
accccgcacc gctccctggt ttgcaattcg cagctgctta acgaaagtca aattatcggt 21000
acctttgagc tgcagggtcc ctcgcctgac gaaaagtccg cggctccggg gttgaaactc 21060
actccggggc tgtggacgtc ggcttacctt cgcaaatttg tacctgagga ctaccacgcc 21120
cacgagatta ggttctacga agaccaatcc cgcccgccta atgcggagct taccgcctgc 21180
gtcattaccc agggccacat tcttggccaa ttgcaagcca tcaacaaagc ccgccaagag 21240
tttctgctac gaaagggacg gggggtttac ttggaccccc agtccggcga ggagctcaac 21300
ccaatccccc cgccgccgca gccctatcag cagcagccgc gggcccttgc ttcccaggat 21360
ggcacccaaa aagaagctgc agctgccgcc gccacccacg gacgaggagg aatactggga 21420
cagtcaggca gaggaggttt tggacgagga ggaggaggac atgatggaag actgggagag 21480
cctagacgag gaagcttccg aggtcgaaga ggtgtcagac gaaacaccgt caccctcggt 21540
cgcattcccc tcgccggcgc cccagaaatc ggcaaccggt tccagcatgg ctacaacctc 21600
cgctcctcag gcgccgccgg cactgcccgt tcgccgaccc aaccgtagat gggacaccac 21660
tggaaccagg gccggtaagt ccaagcagcc gccgccgtta gcccaagagc aacaacagcg 21720
ccaaggctac cgctcatggc gcgggcacaa gaacgccata gttgcttgct tgcaagactg 21780
tgggggcaac atctccttcg cccgccgctt tcttctctac catcacggcg tggccttccc 21840
ccgtaacatc ctgcattact accgtcatct ctacagccca tactgcaccg gcggcagcgg 21900
cagcaacagc agcggccaca cagaagcaaa ggcgaccgga tagcaagact ctgacaaagc 21960
ccaagaaatc cacagcggcg gcagcagcag gaggaggagc gctgcgtctg gcgcccaacg 22020
aacccgtatc gacccgcgag cttagaaaca ggatttttcc cactctgtat gctatatttc 22080
aacagagcag gggccaagaa caagagctga aaataaaaaa caggtctctg cgatccctca 22140
cccgcagctg cctgtatcac aaaagcgaag atcagcttcg gcgcacgctg gaagacgcgg 22200
aggctctctt cagtaaatac tgcgcgctga ctcttaagga ctagtttcgc gccctttctc 22260
aaatttaagc gcgaaaacta cgtcatctcc agcggccaca cccggcgcca gcacctgttg 22320
tcagcgccat tatgagcaag gaaattccca cgccctacat gtggagttac cagccacaaa 22380
tgggacttgc ggctggagct gcccaagact actcaacccg aataaactac atgagcgcgg 22440
gaccccacat gatatcccgg gtcaacggaa tacgcgccca ccgaaaccga attctcctgg 22500
aacaggcggc tattaccacc acacctcgta ataaccttaa tccccgtagt tggcccgctg 22560
ccctggtgta ccaggaaagt cccgctccca ccactgtggt acttcccaga gacgcccagg 22620
ccgaagttca gatgactaac tcaggggcgc agcttgcggg cggctttcgt cacagggtgc 22680
ggtcgcccgg gcagggtata actcacctga caatcagagg gcgaggtatt cagctcaacg 22740
acgagtcggt gagctcctcg cttggtctcc gtccggacgg gacatttcag atcggcggcg 22800
ccggccgctc ttcattcacg cctcgtcagg caatcctaac tctgcagacc tcgtcctctg 22860
agccgcgctc tggaggcatt ggaactctgc aatttattga ggagtttgtg ccatcggtct 22920
actttaaccc cttctcggga cctcccggcc actatccgga tcaatttatt cctaactttg 22980
acgcggtaaa ggactcggcg gacggctacg actgaatgtt ataagttcct gtccatccgc 23040
acccactatc ttcatgttgt tgcagatgaa gcgcgcaaga ccgtctgaag ataccttcaa 23100
ccccgtgtat ccatatgaca cggaaaccgg tcctccaact gtgccttttc ttactcctcc 23160
ctttgtatcc cccaatgggt ttcaagagag tccccctggg gtactctctt tgcgcctatc 23220
cgaacctcta gttacctcca atggcatgct tgcgctcaaa atgggcaacg gcctctctct 23280
ggacgaggcc ggcaacctta cctcccaaaa tgtaaccact gtgagcccac ctctcaaaaa 23340
aaccaagtca aacataaacc tggaaatatc tgcacccctc acagttacct cagaagccct 23400
aactgtggct gccgccgcac ctctaatggt cgcgggcaac acactcacca tgcaatcaca 23460
ggccccgcta accgtgcacg actccaaact tagcattgcc acccaaggac ccctcacagt 23520
gtcagaagga aagctagccc tgcaaacatc aggccccctc accaccaccg atagcagtac 23580
ccttactatc actgcctcac cccctctaac tactgccact ggtagcttgg gcattgactt 23640
gaaagagccc atttatacac aaaatggaaa actaggacta aagtacgggg ctcctttgca 23700
tgtaacagac gacctaaaca ctttgaccgt agcaactggt ccaggtgtga ctattaataa 23760
tacttccttg caaactaaag ttactggagc cttgggtttt gattcacaag gcaatatgca 23820
acttaatgta gcaggaggac taaggattga ttctcaaaac agacgcctta tacttgatgt 23880
tagttatccg tttgatgctc aaaaccaact aaatctaaga ctaggacagg gccctctttt 23940
tataaactca gcccacaact tggatattaa ctacaacaaa ggcctttact tgtttacagc 24000
ttcaaacaat tccaaaaagc ttgaggttaa cctaagcact gccaaggggt tgatgtttga 24060
cgctacagcc atagccatta atgcaggaga tgggcttgaa tttggttcac ctaatgcacc 24120
aaacacaaat cccctcaaaa caaaaattgg ccatggccta gaatttgatt caaacaaggc 24180
tatggttcct aaactaggaa ctggccttag ttttgacagc acaggtgcca ttacagtagg 24240
aaacaaaaat aatgataagc taactttgtg gaccacacca gctccatctc ctaactgtag 24300
actaaatgca gagaaagatg ctaaactcac tttggtctta acaaaatgtg gcagtcaaat 24360
acttgctaca gtttcagttt tggctgttaa aggcagtttg gctccaatat ctggaacagt 24420
tcaaagtgct catcttatta taagatttga cgaaaatgga gtgctactaa acaattcctt 24480
cctggaccca gaatattgga actttagaaa tggagatctt actgaaggca cagcctatac 24540
aaacgctgtt ggatttatgc ctaacctatc agcttatcca aaatctcacg gtaaaactgc 24600
caaaagtaac attgtcagtc aagtttactt aaacggagac aaaactaaac ctgtaacact 24660
aaccattaca ctaaacggta cacaggaaac aggagacaca actccaagtg catactctat 24720
gtcattttca tgggactggt ctggccacaa ctacattaat gaaatatttg ccacatcctc 24780
ttacactttt tcatacattg cccaagaata aagaatcgtt tgtgttatgt ttcaacgtgt 24840
ttatttttca attgcagaaa atttcaagtc atttttcatt cagtagtata gccccaccac 24900
cacatagctt atacagatca ccgtacctta atcaaactca cagaacccta gtattcaacc 24960
tgccacctcc ctcccaacac acagagtaca cagtcctttc tccccggctg gccttaaaaa 25020
gcatcatatc atgggtaaca gacatattct taggtgttat attccacacg gtttcctgtc 25080
gagccaaacg ctcatcagtg atattaataa actccccggg cagctcactt aagttcatgt 25140
cgctgtccag ctgctgagcc acaggctgct gtccaacttg cggttgctta acgggcggcg 25200
aaggagaagt ccacgcctac atgggggtag agtcataatc gtgcatcagg atagggcggt 25260
ggtgctgcag cagcgcgcga ataaactgct gccgccgccg ctccgtcctg caggaataca 25320
acatggcagt ggtctcctca gcgatgattc gcaccgcccg cagcataagg cgccttgtcc 25380
tccgggcaca gcagcgcacc ctgatctcac ttaaatcagc acagtaactg cagcacagca 25440
ccacaatatt gttcaaaatc ccacagtgca aggcgctgta tccaaagctc atggcgggga 25500
ccacagaacc cacgtggcca tcataccaca agcgcaggta gattaagtgg cgacccctca 25560
taaacacgct ggacataaac attacctctt ttggcatgtt gtaattcacc acctcccggt 25620
accatataaa cctctgatta aacatggcgc catccaccac catcctaaac cagctggcca 25680
aaacctgccc gccggctata cactgcaggg aaccgggact ggaacaatga cagtggagag 25740
cccaggactc gtaaccatgg atcatcatgc tcgtcatgat atcaatgttg gcacaacaca 25800
ggcacacgtg catacacttc ctcaggatta caagctcctc ccgcgttaga accatatccc 25860
agggaacaac ccattcctga atcagcgtaa atcccacact gcagggaaga cctcgcacgt 25920
aactcacgtt gtgcattgtc aaagtgttac attcgggcag cagcggatga tcctccagta 25980
tggtagcgcg ggtttctgtc tcaaaaggag gtagacgatc cctactgtac ggagtgcgcc 26040
gagacaaccg agatcgtgtt ggtcgtagtg tcatgccaaa tggaacgccg gacgtagtca 26100
tatttcctga agcaaaacca ggtgcgggcg tgacaaacag atctgcgtct ccggtctcgc 26160
cgcttagatc gctctgtgta gtagttgtag tatatccact ctctcaaagc atccaggcgc 26220
cccctggctt cgggttctat gtaaactcct tcatgcgccg ctgccctgat aacatccacc 26280
accgcagaat aagccacacc cagccaacct acacattcgt tctgcgagtc acacacggga 26340
ggagcgggaa gagctggaag aaccatgttt ttttttttat tccaaaagat tatccaaaac 26400
ctcaaaatga agatctatta agtgaacgcg ctcccctccg gtggcgtggt caaactctac 26460
agccaaagaa cagataatgg catttgtaag atgttgcaca atggcttcca aaaggcaaac 26520
ggccctcacg tccaagtgga cgtaaaggct aaacccttca gggtgaatct cctctataaa 26580
cattccagca ccttcaacca tgcccaaata attctcatct cgccaccttc tcaatatatc 26640
tctaagcaaa tcccgaatat taagtccggc cattgtaaaa atctgctcca gagcgccctc 26700
caccttcagc ctcaagcagc gaatcatgat tgcaaaaatt caggttcctc acagacctgt 26760
ataagattca aaagcggaac attaacaaaa ataccgcgat cccgtaggtc ccttcgcagg 26820
gccagctgaa cataatcgtg caggtctgca cggaccagcg cggccacttc cccgccagga 26880
accatgacaa aagaacccac actgattatg acacgcatac tcggagctat gctaaccagc 26940
gtagccccga tgtaagcttg ttgcatgggc ggcgatataa aatgcaaggt gctgctcaaa 27000
aaatcaggca aagcctcgcg caaaaaagaa agcacatcgt agtcatgctc atgcagataa 27060
aggcaggtaa gctccggaac caccacagaa aaagacacca tttttctctc aaacatgtct 27120
gcgggtttct gcataaacac aaaataaaat aacaaaaaaa catttaaaca ttagaagcct 27180
gtcttacaac aggaaaaaca acccttataa gcataagacg gactacggcc atgccggcgt 27240
gaccgtaaaa aaactggtca ccgtgattaa aaagcaccac cgacagctcc tcggtcatgt 27300
ccggagtcat aatgtaagac tcggtaaaca catcaggttg attcacatcg gtcagtgcta 27360
aaaagcgacc gaaatagccc gggggaatac atacccgcag gcgtagagac aacattacag 27420
cccccatagg aggtataaca aaattaatag gagagaaaaa cacataaaca cctgaaaaac 27480
cctcctgcct aggcaaaata gcaccctccc gctccagaac aacatacagc gcttccacag 27540
cggcagccat aacagtcagc cttaccagta aaaaagaaaa cctattaaaa aaacaccact 27600
cgacacggca ccagctcaat cagtcacagt gtaaaaaagg gccaagtgca gagcgagtat 27660
atataggact aaaaaatgac gtaacggtta aagtccacaa aaaacaccca gaaaaccgca 27720
cgcgaaccta cgcccagaaa cgaaagccaa aaaacccaca acttcctcaa atcgtcactt 27780
ccgttttccc acgttacgtc acttcccatt ttaagaaaac tacaattccc aacacataca 27840
agttactccg ccctaaaacc tacgtcaccc gccccgttcc cacgccccgc gccacgtcac 27900
aaactccacc ccctcattat catattggct tcaatccaaa ataaggtata ttattgatga 27960
tg 27962
<210> 3
<211> 31404
<212> DNA
<213> 人工序列()
<400> 3
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tctctagcat cgtaactata 360
acggtcctaa gtggctcgag gtttctgcag gggggggggg gggggggttg gccactccct 420
ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct 480
ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga gggagtggcc aactccatca 540
ctaggggttc ctagatctga attcggtacg tacctctggt cgttacataa cttacggtaa 600
atggcccgcc tggctgaccg cccaacgacc ccgcccattg acgtcaataa tgacgtatgt 660
tcccatagta acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta 720
aactgcccac ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt 780
caatgacggt aaatggcccg cctggcatta tgcccagtac atgaccttat gggactttcc 840
tacttggcag tacatctact cgaggccacg ttctgcttca ctctccccat ctcccccccc 900
tccccacccc caattttgta tttatttatt ttttaattat tttgtgcagc gatgggggcg 960
gggggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg 1020
ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt 1080
tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagc 1140
gggatcagcc accgcggtgg cggcctagag tcgacgagga actgaaaaac cagaaagtta 1200
actggtaagt ttagtctttt tgtcttttat ttcaggtccc ggatccggtg gtggtgcaaa 1260
tcaaagaact gctcctcagt ggatgttgcc tttacttcta ggcctgtacg gaagtgttac 1320
ttctgctcta aaagctgcgg aattgtaccc gcggccgatc caccggtcgc caccatggtg 1380
agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct ggacggcgac 1440
gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac ctacggcaag 1500
ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc caccctcgtg 1560
accaccctga cctacggcgt gcagtgcttc agccgctacc ccgaccacat gaagcagcac 1620
gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat cttcttcaag 1680
gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac cctggtgaac 1740
cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg gcacaagctg 1800
gagtacaact acaacagcca caacgtctat atcatggccg acaagcagaa gaacggcatc 1860
aaggtgaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct cgccgaccac 1920
taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa ccactacctg 1980
agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat ggtcctgctg 2040
gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa gtaaagcggc 2100
catcaagctg gccgcgggga tccagacatg ataagataca ttgatgagtt tggacaaacc 2160
acaactagaa tgcagtgaaa aaaatgcttt atttgtgaaa tttgtgatgc tattgcttta 2220
tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat tcattttatg 2280
tttcaggttc agggggaggt gtgggaggtt ttttagtcga cctcgagcag tgtggttttg 2340
caagaggaag caaaaagcct ctccacccag gcctggaatg tttccaccca agtcgaaggc 2400
agtgtggttt tgcaagagga agcaaaaagc ctctccaccc aggcctggaa tgtttccacc 2460
caatgtcgag caaccccgcc cagcgtcttg tcattggcga attcgaacac gcagatgcag 2520
tcggggcggc gcggtcccag gtccacttcg catattaagg tgacgcgtgt ggcctcgaac 2580
accgagcgac cctgcagcca atatgggatc ggccattgaa caagatggat tgcacgcagg 2640
ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac agacaatcgg 2700
ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc tttttgtcaa 2760
gaccgacctg tccggtgccc tgaatgaact gcaggacgag gcagcgcggc tatcgtggct 2820
ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga 2880
ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc ttgctcctgc 2940
cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg atccggctac 3000
ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc ggatggaagc 3060
cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc cagccgaact 3120
gttcgccagg ctcaaggcgc gcatgcccga cggcgaggat ctcgtcgtga cccatggcga 3180
tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca tcgactgtgg 3240
ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg atattgctga 3300
agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga 3360
ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgagggg atccgtcgac 3420
tagagctcgc tgatcagcct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc 3480
ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa 3540
tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg 3600
gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg agagatctag 3660
gaacccctag tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc 3720
gcccgggcaa agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt gagcgagcga 3780
gcgcgcagag agggagtggc caaccccccc cccccccccc ctgcagaaac agatctccag 3840
gtgcggagaa agaggtaatg aaatggcatc gactcgaaga tctgggcgtg gttaagggtg 3900
ggaaagaata tataaggtgg gggtcttatg tagttttgta tctgttttgc agcagccgcc 3960
gccgccatga gcaccaactc gtttgatgga agcattgtga gctcatattt gacaacgcgc 4020
atgcccccat gggccggggt gcgtcagaat gtgatgggct ccagcattga tggtcgcccc 4080
gtcctgcccg caaactctac taccttgacc tacgagaccg tgtctggaac gccgttggag 4140
actgcagcct ccgccgccgc ttcagccgct gcagccaccg cccgcgggat tgtgactgac 4200
tttgctttcc tgagcccgct tgcaagcagt gcagcttccc gttcatccgc ccgcgatgac 4260
aagttgacgg ctcttttggc acaattggat tctttgaccc gggaacttaa tgtcgtttct 4320
cagcagctgt tggatctgcg ccagcaggtt tctgccctga aggcttcctc ccctcccaat 4380
gcggtttaaa acataaataa aaaaccagac tctgtttgga tttggatcaa gcaagtgtct 4440
tgctgtcttt atttaggggt tttgcgcgcg cggtaggccc gggaccagcg gtctcggtcg 4500
ttgagggtcc tgtgtatttt ttccaggacg tggtaaaggt gactctggat gttcagatac 4560
atgggcataa gcccgtctct ggggtggagg tagcaccact gcagagcttc atgctgcggg 4620
gtggtgttgt agatgatcca gtcgtagcag gagcgctggg cgtggtgcct aaaaatgtct 4680
ttcagtagca agctgattgc caggggcagg cccttggtgt aagtgtttac aaagcggtta 4740
agctgggatg ggtgcatacg tggggatatg agatgcatct tggactgtat ttttaggttg 4800
gctatgttcc cagccatatc cctccgggga ttcatgttgt gcagaaccac cagcacagtg 4860
tatccggtgc acttgggaaa tttgtcatgt agcttagaag gaaatgcgtg gaagaacttg 4920
gagacgccct tgtgacctcc aagattttcc atgcattcgt ccataatgat ggcaatgggc 4980
ccacgggcgg cggcctgggc gaagatattt ctgggatcac taacgtcata gttgtgttcc 5040
aggatgagat cgtcataggc catttttaca aagcgcgggc ggagggtgcc agactgcggt 5100
ataatggttc catccggccc aggggcgtag ttaccctcac agatttgcat ttcccacgct 5160
ttgagttcag atggggggat catgtctacc tgcggggcga tgaagaaaac ggtttccggg 5220
gtaggggaga tcagctggga agaaagcagg ttcctgagca gctgcgactt accgcagccg 5280
gtgggcccgt aaatcacacc tattaccggc tgcaactggt agttaagaga gctgcagctg 5340
ccgtcatccc tgagcagggg ggccacttcg ttaagcatgt ccctgactcg catgttttcc 5400
ctgaccaaat ccgccagaag gcgctcgccg cccagcgata gcagttcttg caaggaagca 5460
aagtttttca acggtttgag accgtccgcc gtaggcatgc ttttgagcgt ttgaccaagc 5520
agttccaggc ggtcccacag ctcggtcacc tgctctacgg catctcgatc cagcatatct 5580
cctcgtttcg cgggttgggg cggctttcgc tgtacggcag tagtcggtgc tcgtccagac 5640
gggccagggt catgtctttc cacgggcgca gggtcctcgt cagcgtagtc tgggtcacgg 5700
tgaaggggtg cgctccgggc tgcgcgctgg ccagggtgcg cttgaggctg gtcctgctgg 5760
tgctgaagcg ctgccggtct tcgccctgcg cgtcggccag gtagcatttg accatggtgt 5820
catagtccag cccctccgcg gcgtggccct tggcgcgcag cttgcccttg gaggaggcgc 5880
cgcacgaggg gcagtgcaga cttttgaggg cgtagagctt gggcgcgaga aataccgatt 5940
ccggggagta ggcatccgcg ccgcaggccc cgcagacggt ctcgcattcc acgagccagg 6000
tgagctctgg ccgttcgggg tcaaaaacca ggtttccccc atgctttttg atgcgtttct 6060
tacctctggt ttccatgagc cggtgtccac gctcggtgac gaaaaggctg tccgtgtccc 6120
cgtatacaga cttgagaggc ctgtcctcga gcggtgttcc gcggtcctcc tcgtatagaa 6180
actcggacca ctctgagaca aaggctcgcg tccaggccag cacgaaggag gctaagtggg 6240
aggggtagcg gtcgttgtcc actagggggt ccactcgctc cagggtgtga agacacatgt 6300
cgccctcttc ggcatcaagg aaggtgattg gtttgtaggt gtaggccacg tgaccgggtg 6360
ttcctgaagg ggggctataa aagggggtgg gggcgcgttc gtcctcactc tcttccgcat 6420
cgctgtctgc gagggccagc tgttggggtg agtactccct ctgaaaagcg ggcatgactt 6480
ctgcgctaag attgtcagtt tccaaaaacg aggaggattt gatattcacc tggcccgcgg 6540
tgatgccttt gagggtggcc gcatccatct ggtcagaaaa gacaatcttt ttgttgtcaa 6600
gcttggtggc aaacgacccg tagagggcgt tggacagcaa cttggcgatg gagcgcaggg 6660
tttggttttt gtcgcgatcg gcgcgctcct tggccgcgat gtttagctgc acgtattcgc 6720
gcgcaacgca ccgccattcg ggaaagacgg tggtgcgctc gtcgggcacc aggtgcacgc 6780
gccaaccgcg gttgtgcagg gtgacaaggt caacgctggt ggctacctct ccgcgtaggc 6840
gctcgttggt ccagcagagg cggccgccct tgcgcgagca gaatggcggt agggggtcta 6900
gctgcgtctc gtccgggggg tctgcgtcca cggtaaagac cccgggcagc aggcgcgcgt 6960
cgaagtagtc tatcttgcat ccttgcaagt ctagcgcctg ctgccatgcg cgggcggcaa 7020
gcgcgcgctc gtatgggttg agtgggggac cccatggcat ggggtgggtg agcgcggagg 7080
cgtacatgcc gcaaatgtcg taaacgtaga ggggctctct gagtattcca agatatgtag 7140
ggtagcatct tccaccgcgg atgctggcgc gcacgtaatc gtatagttcg tgcgagggag 7200
cgaggaggtc gggaccgagg ttgctacggg cgggctgctc tgctcggaag actatctgcc 7260
tgaagatggc atgtgagttg gatgatatgg ttggacgctg gaagacgttg aagctggcgt 7320
ctgtgagacc taccgcgtca cgcacgaagg aggcgtagga gtcgcgcagc ttgttgacca 7380
gctcggcggt gacctgcacg tctagggcgc agtagtccag ggtttccttg atgatgtcat 7440
acttatcctg tccctttttt ttccacagct cgcggttgag gacaaactct tcgcggtctt 7500
tccagtactc ttggatcgga aacccgtcgg cctccgaacg gtaagagcct agcatgtaga 7560
actggttgac ggcctggtag gcgcagcatc ccttttctac gggtagcgcg tatgcctgcg 7620
cggccttccg gagcgaggtg tgggtgagcg caaaggtgtc cctgaccatg actttgaggt 7680
actggtattt gaagtcagtg tcgtcgcatc cgccctgctc ccagagcaaa aagtccgtgc 7740
gctttttgga acgcggattt ggcagggcga aggtgacatc gttgaagagt atctttcccg 7800
cgcgaggcat aaagttgcgt gtgatgcgga agggtcccgg cacctcggaa cggttgttaa 7860
ttacctgggc ggcgagcacg atctcgtcaa agccgttgat gttgtggccc acaatgtaaa 7920
gttccaagaa gcgcgggatg cccttgatgg aaggcaattt tttaagttcc tcgtaggtga 7980
gctcttcagg ggagctgagc ccgtgctctg aaagggccca gtctgcaaga tgagggttgg 8040
aagcgacgaa tgagctccac aggtcacggg ccattagcat ttgcaggtgg tcgcgaaagg 8100
tcctaaactg gcgacctatg gccatttttt ctggggtgat gcagtagaag gtaagcgggt 8160
cttgttccca gcggtcccat ccaaggttcg cggctaggtc tcgcgcggca gtcactagag 8220
gctcatctcc gccgaacttc atgaccagca tgaagggcac gagctgcttc ccaaaggccc 8280
ccatccaagt ataggtctct acatcgtagg tgacaaagag acgctcggtg cgaggatgcg 8340
agccgatcgg gaagaactgg atctcccgcc accaattgga ggagtggcta ttgatgtggt 8400
gaaagtagaa gtccctgcga cgggccgaac actcgtgctg gcttttgtaa aaacgtgcgc 8460
agtactggca gcggtgcacg ggctgtacat cctgcacgag gttgacctga cgaccgcgca 8520
caaggaagca gagtgggaat ttgagcccct cgcctggcgg gtttggctgg tggtcttcta 8580
cttcggctgc ttgtccttga ccgtctggct gctcgagggg agttacggtg gatcggacca 8640
ccacgccgcg cgagcccaaa gtccagatgt ccgcgcgcgg cggtcggagc ttgatgacaa 8700
catcgcgcag atgggagctg tccatggtct ggagctcccg cggcgtcagg tcaggcggga 8760
gctcctgcag gtttacctcg catagacggg tcagggcgcg ggctagatcc aggtgatacc 8820
taatttccag gggctggttg gtggcggcgt cgatggcttg caagaggccg catccccgcg 8880
gcgcgactac ggtaccgcgc ggcgggcggt gggccgcggg ggtgtccttg gatgatgcat 8940
ctaaaagcgg tgacgcgggc gagcccccgg aggtaggggg ggctccggac ccgccgggag 9000
agggggcagg ggcacgtcgg cgccgcgcgc gggcaggagc tggtgctgcg cgcgtaggtt 9060
gctggcgaac gcgacgacgc ggcggttgat ctcctgaatc tggcgcctct gcgtgaagac 9120
gacgggcccg gtgagcttga acctgaaaga gagttcgaca gaatcaattt cggtgtcgtt 9180
gacggcggcc tggcgcaaaa tctcctgcac gtctcctgag ttgtcttgat aggcgatctc 9240
ggccatgaac tgctcgatct cttcctcctg gagatctccg cgtccggctc gctccacggt 9300
ggcggcgagg tcgttggaaa tgcgggccat gagctgcgag aaggcgttga ggcctccctc 9360
gttccagacg cggctgtaga ccacgccccc ttcggcatcg cgggcgcgca tgaccacctg 9420
cgcgagattg agctccacgt gccgggcgaa gacggcgtag tttcgcaggc gctgaaagag 9480
gtagttgagg gtggtggcgg tgtgttctgc cacgaagaag tacataaccc agcgtcgcaa 9540
cgtggattcg ttgatatccc ccaaggcctc aaggcgctcc atggcctcgt agaagtccac 9600
ggcgaagttg aaaaactggg agttgcgcgc cgacacggtt aactcctcct ccagaagacg 9660
gatgagctcg gcgacagtgt cgcgcacctc gcgctcaaag gctacagggg cctcttcttc 9720
ttcttcaatc tcctcttcca taagggcctc cccttcttct tcttctggcg gcggtggggg 9780
aggggggaca cggcggcgac gacggcgcac cgggaggcgg tcgacaaagc gctcgatcat 9840
ctccccgcgg cgacggcgca tggtctcggt gacggcgcgg ccgttctcgc gggggcgcag 9900
ttggaagacg ccgcccgtca tgtcccggtt atgggttggc ggggggctgc catgcggcag 9960
ggatacggcg ctaacgatgc atctcaacaa ttgttgtgta ggtactccgc cgccgaggga 10020
cctgagcgag tccgcatcga ccggatcgga aaacctctcg agaaaggcgt ctaaccagtc 10080
acagtcgcaa ggtaggctga gcaccgtggc gggcggcagc gggcggcggt cggggttgtt 10140
tctggcggag gtgctgctga tgatgtaatt aaagtaggcg gtcttgagac ggcggatggt 10200
cgacagaagc accatgtcct tgggtccggc ctgctgaatg cgcaggcggt cggccatgcc 10260
ccaggcttcg ttttgacatc ggcgcaggtc tttgtagtag tcttgcatga gcctttctac 10320
cggcacttct tcttctcctt cctcttgtcc tgcatctctt gcatctatcg ctgcggcggc 10380
ggcggagttt ggccgtaggt ggcgccctct tcctcccatg cgtgtgaccc cgaagcccct 10440
catcggctga agcagggcta ggtcggcgac aacgcgctcg gctaatatgg cctgctgcac 10500
ctgcgtgagg gtagactgga agtcatccat gtccacaaag cggtggtatg cgcccgtgtt 10560
gatggtgtaa gtgcagttgg ccataacgga ccagttaacg gtctggtgac ccggctgcga 10620
gagctcggtg tacctgagac gcgagtaagc cctcgagtca aatacgtagt cgttgcaagt 10680
ccgcaccagg tactggtatc ccaccaaaaa gtgcggcggc ggctggcggt agaggggcca 10740
gcgtagggtg gccggggctc cgggggcgag atcttccaac ataaggcgat gatatccgta 10800
gatgtacctg gacatccagg tgatgccggc ggcggtggtg gaggcgcgcg gaaagtcgcg 10860
gacgcggttc cagatgttgc gcagcggcaa aaagtgctcc atggtcggga cgctctggcc 10920
ggtcaggcgc gcgcaatcgt tgacgctcta gcgtgcaaaa ggagagcctg taagcgggca 10980
ctcttccgtg gtctggtgga taaattcgca agggtatcat ggcggacgac cggggttcga 11040
gccccgtatc cggccgtccg ccgtgatcca tgcggttacc gcccgcgtgt cgaacccagg 11100
tgtgcgacgt cagacaacgg gggagtgctc cttttggctt ccttccaggc gcggcggctg 11160
ctgcgctagc ttttttggcc actggccgcg cgcagcgtaa gcggttaggc tggaaagcga 11220
aagcattaag tggctcgctc cctgtagccg gagggttatt ttccaagggt tgagtcgcgg 11280
gacccccggt tcgagtctcg gaccggccgg actgcggcga acgggggttt gcctccccgt 11340
catgcaagac cccgcttgca aattcctccg gaaacaggga cgagcccctt ttttgctttt 11400
cccagatgca tccggtgctg cggcagatgc gcccccctcc tcagcagcgg caagagcaag 11460
agcagcggca gacatgcagg gcaccctccc ctcctcctac cgcgtcagga ggggcgacat 11520
ccgcggttga cgcggcagca gatggtgatt acgaaccccc gcggcgccgg gcccggcact 11580
acctggactt ggaggagggc gagggcctgg cgcggctagg agcgccctct cctgagcggc 11640
acccaagggt gcagctgaag cgtgatacgc gtgaggcgta cgtgccgcgg cagaacctgt 11700
ttcgcgaccg cgagggagag gagcccgagg agatgcggga tcgaaagttc cacgcagggc 11760
gcgagctgcg gcatggcctg aatcgcgagc ggttgctgcg cgaggaggac tttgagcccg 11820
acgcgcgaac cgggattagt cccgcgcgcg cacacgtggc ggccgccgac ctggtaaccg 11880
catacgagca gacggtgaac caggagatta actttcaaaa aagctttaac aaccacgtgc 11940
gtacgcttgt ggcgcgcgag gaggtggcta taggactgat gcatctgtgg gactttgtaa 12000
gcgcgctgga gcaaaaccca aatagcaagc cgctcatggc gcagctgttc cttatagtgc 12060
agcacagcag ggacaacgag gcattcaggg atgcgctgct aaacatagta gagcccgagg 12120
gccgctggct gctcgatttg ataaacatcc tgcagagcat agtggtgcag gagcgcagct 12180
tgagcctggc tgacaaggtg gccgccatca actattccat gcttagcctg ggcaagtttt 12240
acgcccgcaa gatataccat accccttacg ttcccataga caaggaggta aagatcgagg 12300
ggttctacat gcgcatggcg ctgaaggtgc ttaccttgag cgacgacctg ggcgtttatc 12360
gcaacgagcg catccacaag gccgtgagcg tgagccggcg gcgcgagctc agcgaccgcg 12420
agctgatgca cagcctgcaa agggccctgg ctggcacggg cagcggcgat agagaggccg 12480
agtcctactt tgacgcgggc gctgacctgc gctgggcccc aagccgacgc gccctggagg 12540
cagctggggc cggacctggg ctggcggtgg cacccgcgcg cgctggcaac gtcggcggcg 12600
tggaggaata tgacgaggac gatgagtacg agccagagga cggcgagtac taagcggtga 12660
tgtttctgat caggcggccg gaaaaaaaaa aagcatgatg caaaataaaa aactcaccaa 12720
ggccatggca ccgagcgttg gttttcttgt attcccctta gtatgcggcg cgcggcgatg 12780
tatgaggaag gtcctcctcc ctcctacgag agtgtggtga gcgcggcgcc agtggcggcg 12840
gcgctgggtt ctcccttcga tgctcccctg gacccgccgt ttgtgcctcc gcggtacctg 12900
cggcctaccg gggggagaaa cagcatccgt tactctgagt tggcacccct attcgacacc 12960
acccgtgtgt acctggtgga caacaagtca acggatgtgg catccctgaa ctaccagaac 13020
gaccacagca actttctgac cacggtcatt caaaacaatg actacagccc gggggaggca 13080
agcacacaga ccatcaatct tgacgaccgg tcgcactggg gcggcgacct gaaaaccatc 13140
ctgcatacca acatgccaaa tgtgaacgag ttcatgttta ccaataagtt taaggcgcgg 13200
gtgatggtgt cgcgcttgcc tactaaggac aatcaggtgg agctgaaata cgagtgggtg 13260
gagttcacgc tgcccgaggg caactactcc gagaccatga ccatagacct tatgaacaac 13320
gcgatcgtgg agcactactt gaaagtgggc agacagaacg gggttctgga aagcgacatc 13380
ggggtaaagt ttgacacccg caacttcaga ctggggtttg accccgtcac tggtcttgtc 13440
atgcctgggg tatatacaaa cgaagccttc catccagaca tcattttgct gccaggatgc 13500
ggggtggact tcacccacag ccgcctgagc aacttgttgg gcatccgcaa gcggcaaccc 13560
ttccaggagg gctttaggat cacctacgat gatctggagg gtggtaacat tcccgcactg 13620
ttggatgtgg acgcctacca ggcgagcttg aaagatgaca ccgaacaggg cgggggtggc 13680
gcaggcggca gcaacagcag tggcagcggc gcggaagaga actccaacgc ggcagccgcg 13740
gcaatgcagc cggtggagga catgaacgat catgccattc gcggcgacac ctttgccaca 13800
cgggctgagg agaagcgcgc tgaggccgaa gcagcggccg aagctgccgc ccccgctgcg 13860
caacccgagg tcgagaagcc tcagaagaaa ccggtgatca aacccctgac agaggacagc 13920
aagaaacgca gttacaacct aataagcaat gacagcacct tcacccagta ccgcagctgg 13980
taccttgcat acaactacgg cgaccctcag accggaatcc gctcatggac cctgctttgc 14040
actcctgacg taacctgcgg ctcggagcag gtctactggt cgttgccaga catgatgcaa 14100
gaccccgtga ccttccgctc cacgcgccag atcagcaact ttccggtggt gggcgccgag 14160
ctgttgcccg tgcactccaa gagcttctac aacgaccagg ccgtctactc ccaactcatc 14220
cgccagttta cctctctgac ccacgtgttc aatcgctttc ccgagaacca gattttggcg 14280
cgcccgccag cccccaccat caccaccgtc agtgaaaacg ttcctgctct cacagatcac 14340
gggacgctac cgctgcgcaa cagcatcgga ggagtccagc gagtgaccat tactgacgcc 14400
agacgccgca cctgccccta cgtttacaag gccctgggca tagtctcgcc gcgcgtccta 14460
tcgagccgca ctttttgagc aagcatgtcc atccttatat cgcccagcaa taacacaggc 14520
tggggcctgc gcttcccaag caagatgttt ggcggggcca agaagcgctc cgaccaacac 14580
ccagtgcgcg tgcgcgggca ctaccgcgcg ccctggggcg cgcacaaacg cggccgcact 14640
gggcgcacca ccgtcgatga cgccatcgac gcggtggtgg aggaggcgcg caactacacg 14700
cccacgccgc caccagtgtc cacagtggac gcggccattc agaccgtggt gcgcggagcc 14760
cggcgctatg ctaaaatgaa gagacggcgg aggcgcgtag cacgtcgcca ccgccgccga 14820
cccggcactg ccgcccaacg cgcggcggcg gccctgctta accgcgcacg tcgcaccggc 14880
cgacgggcgg ccatgcgggc cgctcgaagg ctggccgcgg gtattgtcac tgtgcccccc 14940
aggtccaggc gacgagcggc cgccgcagca gccgcggcca ttagtgctat gactcagggt 15000
cgcaggggca acgtgtattg ggtgcgcgac tcggttagcg gcctgcgcgt gcccgtgcgc 15060
acccgccccc cgcgcaacta gattgcaaga aaaaactact tagactcgta ctgttgtatg 15120
tatccagcgg cggcggcgcg caacgaagct atgtccaagc gcaaaatcaa agaagagatg 15180
ctccaggtca tcgcgccgga gatctatggc cccccgaaga aggaagagca ggattacaag 15240
ccccgaaagc taaagcgggt caaaaagaaa aagaaagatg atgatgatga acttgacgac 15300
gaggtggaac tgctgcacgc taccgcgccc aggcgacggg tacagtggaa aggtcgacgc 15360
gtaaaacgtg ttttgcgacc cggcaccacc gtagtcttta cgcccggtga gcgctccacc 15420
cgcacctaca agcgcgtgta tgatgaggtg tacggcgacg aggacctgct tgagcaggcc 15480
aacgagcgcc tcggggagtt tgcctacgga aagcggcata aggacatgct ggcgttgccg 15540
ctggacgagg gcaacccaac acctagccta aagcccgtaa cactgcagca ggtgctgccc 15600
gcgcttgcac cgtccgaaga aaagcgcggc ctaaagcgcg agtctggtga cttggcaccc 15660
accgtgcagc tgatggtacc caagcgccag cgactggaag atgtcttgga aaaaatgacc 15720
gtggaacctg ggctggagcc cgaggtccgc gtgcggccaa tcaagcaggt ggcgccggga 15780
ctgggcgtgc agaccgtgga cgttcagata cccactacca gtagcaccag tattgccacc 15840
gccacagagg gcatggagac acaaacgtcc ccggttgcct cagcggtggc ggatgccgcg 15900
gtgcaggcgg tcgctgcggc cgcgtccaag acctctacgg aggtgcaaac ggacccgtgg 15960
atgtttcgcg tttcagcccc ccggcgcccg cgccgttcga ggaagtacgg cgccgccagc 16020
gcgctactgc ccgaatatgc cctacatcct tccattgcgc ctacccccgg ctatcgtggc 16080
tacacctacc gccccagaag acgagcaact acccgacgcc gaaccaccac tggaacccgc 16140
cgccgccgtc gccgtcgcca gcccgtgctg gccccgattt ccgtgcgcag ggtggctcgc 16200
gaaggaggca ggaccctggt gctgccaaca gcgcgctacc accccagcat cgtttaaaag 16260
ccggtctttg tggttcttgc agatatggcc ctcacctgcc gcctccgttt cccggtgccg 16320
ggattccgag gaagaatgca ccgtaggagg ggcatggccg gccacggcct gacgggcggc 16380
atgcgtcgtg cgcaccaccg gcggcggcgc gcgtcgcacc gtcgcatgcg cggcggtatc 16440
ctgcccctcc ttattccact gatcgccgcg gcgattggcg ccgtgcccgg aattgcatcc 16500
gtggccttgc aggcgcagag acactgatta aaaacaagtt gcatgtggaa aaatcaaaat 16560
aaaaagtctg gactctcacg ctcgcttggt cctgtaacta ttttgtagaa tggaagacat 16620
caactttgcg tctctggccc cgcgacacgg ctcgcgcccg ttcatgggaa actggcaaga 16680
tatcggcacc agcaatatga gcggtggcgc cttcagctgg ggctcgctgt ggagcggcat 16740
taaaaatttc ggttccaccg ttaagaacta tggcagcaag gcctggaaca gcagcacagg 16800
ccagatgctg agggataagt tgaaagagca aaatttccaa caaaaggtgg tagatggcct 16860
ggcctctggc attagcgggg tggtggacct ggccaaccag gcagtgcaaa ataagattaa 16920
cagtaagctt gatccccgcc ctcccgtaga ggagcctcca ccggccgtgg agacagtgtc 16980
tccagagggg cgtggcgaaa agcgtccgcg ccccgacagg gaagaaactc tggtgacgca 17040
aatagacgag cctccctcgt acgaggaggc actaaagcaa ggcctgccca ccacccgtcc 17100
catcgcgccc atggctaccg gagtgctggg ccagcacaca cccgtaacgc tggacctgcc 17160
tccccccgcc gacacccagc agaaacctgt gctgccaggc ccgaccgccg ttgttgtaac 17220
ccgtcctagc cgcgcgtccc tgcgccgcgc cgccagcggt ccgcgatcgt tgcggcccgt 17280
agccagtggc aactggcaaa gcacactgaa cagcatcgtg ggtctggggg tgcaatccct 17340
gaagcgccga cgatgcttct gatagctaac gtgtcgtatg tgtgtcatgt atgcgtccat 17400
gtcgccgcca gaggagctgc tgagccgccg cgcgcccgct ttccaagatg gctacccctt 17460
cgatgatgcc gcagtggtct tacatgcaca tctcgggcca ggacgcctcg gagtacctga 17520
gccccgggct ggtgcagttt gcccgcgcca ccgagacgta cttcagcctg aataacaagt 17580
ttagaaaccc cacggtggcg cctacgcacg acgtgaccac agaccggtcc cagcgtttga 17640
cgctgcggtt catccctgtg gaccgtgagg atactgcgta ctcgtacaag gcgcggttca 17700
ccctagctgt gggtgataac cgtgtgctgg acatggcttc cacgtacttt gacatccgcg 17760
gcgtgctgga caggggccct acttttaagc cctactctgg cactgcctac aacgccctgg 17820
ctcccaaggg tgccccaaat ccttgcgaat gggatgaagc tgctactgct cttgaaataa 17880
acctagaaga agaggacgat gacaacgaag acgaagtaga cgagcaagct gagcagcaaa 17940
aaactcacgt atttgggcag gcgccttatt ctggtataaa tattacaaag gagggtattc 18000
aaataggtgt cgaaggtcaa acacctaaat atgccgataa aacatttcaa cctgaacctc 18060
aaataggaga atctcagtgg tacgaaacag aaattaatca tgcagctggg agagtcctaa 18120
aaaagactac cccaatgaaa ccatgttacg gttcatatgc aaaacccaca aatgaaaatg 18180
gagggcaagg cattcttgta aagcaacaaa atggaaagct agaaagtcaa gtggaaatgc 18240
aatttttctc aactactgag gcagccgcag gcaatggtga taacttgact cctaaagtgg 18300
tattgtacag tgaagatgta gatatagaaa ccccagacac tcatatttct tacatgccca 18360
ctattaagga aggtaactca cgagaactaa tgggccaaca atctatgccc aacaggccta 18420
attacattgc ttttagggac aattttattg gtctaatgta ttacaacagc acgggtaata 18480
tgggtgttct ggcgggccaa gcatcgcagt tgaatgctgt tgtagatttg caagacagaa 18540
acacagagct ttcataccag cttttgcttg attccattgg tgatagaacc aggtactttt 18600
ctatgtggaa tcaggctgtt gacagctatg atccagatgt tagaattatt gaaaatcatg 18660
gaactgaaga tgaacttcca aattactgct ttccactggg aggtgtgatt aatacagaga 18720
ctcttaccaa ggtaaaacct aaaacaggtc aggaaaatgg atgggaaaaa gatgctacag 18780
aattttcaga taaaaatgaa ataagagttg gaaataattt tgccatggaa atcaatctaa 18840
atgccaacct gtggagaaat ttcctgtact ccaacatagc gctgtatttg cccgacaagc 18900
taaagtacag tccttccaac gtaaaaattt ctgataaccc aaacacctac gactacatga 18960
acaagcgagt ggtggctccc gggctagtgg actgctacat taaccttgga gcacgctggt 19020
cccttgacta tatggacaac gtcaacccat ttaaccacca ccgcaatgct ggcctgcgct 19080
accgctcaat gttgctgggc aatggtcgct atgtgccctt ccacatccag gtgcctcaga 19140
agttctttgc cattaaaaac ctccttctcc tgccgggctc atacacctac gagtggaact 19200
tcaggaagga tgttaacatg gttctgcaga gctccctagg aaatgaccta agggttgacg 19260
gagccagcat taagtttgat agcatttgcc tttacgccac cttcttcccc atggcccaca 19320
acaccgcctc cacgcttgag gccatgctta gaaacgacac caacgaccag tcctttaacg 19380
actatctctc cgccgccaac atgctctacc ctatacccgc caacgctacc aacgtgccca 19440
tatccatccc ctcccgcaac tgggcggctt tccgcggctg ggccttcacg cgccttaaga 19500
ctaaggaaac cccatcactg ggctcgggct acgaccctta ttacacctac tctggctcta 19560
taccctacct agatggaacc ttttacctca accacacctt taagaaggtg gccattacct 19620
ttgactcttc tgtcagctgg cctggcaatg accgcctgct tacccccaac gagtttgaaa 19680
ttaagcgctc agttgacggg gagggttaca acgttgccca gtgtaacatg accaaagact 19740
ggttcctggt acaaatgcta gctaactata acattggcta ccagggcttc tatatcccag 19800
agagctacaa ggaccgcatg tactccttct ttagaaactt ccagcccatg agccgtcagg 19860
tggtggatga tactaaatac aaggactacc aacaggtggg catcctacac caacacaaca 19920
actctggatt tgttggctac cttgccccca ccatgcgcga aggacaggcc taccctgcta 19980
acttccccta tccgcttata ggcaagaccg cagttgacag cattacccag aaaaagtttc 20040
tttgcgatcg caccctttgg cgcatcccat tctccagtaa ctttatgtcc atgggcgcac 20100
tcacagacct gggccaaaac cttctctacg ccaactccgc ccacgcgcta gacatgactt 20160
ttgaggtgga tcccatggac gagcccaccc ttctttatgt tttgtttgaa gtctttgacg 20220
tggtccgtgt gcaccagccg caccgcggcg tcatcgaaac cgtgtacctg cgcacgccct 20280
tctcggccgg caacgccaca acataaagaa gcaagcaaca tcaacaacag ctgccgccat 20340
gggctccagt gagcaggaac tgaaagccat tgtcaaagat cttggttgtg ggccatattt 20400
tttgggcacc tatgacaagc gctttccagg ctttgtttct ccacacaagc tcgcctgcgc 20460
catagtcaat acggccggtc gcgagactgg gggcgtacac tggatggcct ttgcctggaa 20520
cccgcactca aaaacatgct acctctttga gccctttggc ttttctgacc agcgactcaa 20580
gcaggtttac cagtttgagt acgagtcact cctgcgccgt agcgccattg cttcttcccc 20640
cgaccgctgt ataacgctgg aaaagtccac ccaaagcgta caggggccca actcggccgc 20700
ctgtggacta ttctgctgca tgtttctcca cgcctttgcc aactggcccc aaactcccat 20760
ggatcacaac cccaccatga accttattac cggggtaccc aactccatgc tcaacagtcc 20820
ccaggtacag cccaccctgc gtcgcaacca ggaacagctc tacagcttcc tggagcgcca 20880
ctcgccctac ttccgcagcc acagtgcgca gattaggagc gccacttctt tttgtcactt 20940
gaaaaacatg taaaaataat gtactagaga cactttcaat aaaggcaaat gcttttattt 21000
gtacactctc gggtgattat ttacccccac ccttgccgtc tgcgccgttt aaaaatcaaa 21060
ggggttctgc cgcgcatcgc tatgcgccac tggcagggac acgttgcgat actggtgttt 21120
agtgctccac ttaaactcag gcacaaccat ccgcggcagc tcggtgaagt tttcactcca 21180
caggctgcgc accatcacca acgcgtttag caggtcgggc gccgatatct tgaagtcgca 21240
gttggggcct ccgccctgcg cgcgcgagtt gcgatacaca gggttgcagc actggaacac 21300
tatcagcgcc gggtggtgca cgctggccag cacgctcttg tcggagatca gatccgcgtc 21360
caggtcctcc gcgttgctca gggcgaacgg agtcaacttt ggtagctgcc ttcccaaaaa 21420
gggcgcgtgc ccaggctttg agttgcactc gcaccgtagt ggcatcaaaa ggtgaccgtg 21480
cccggtctgg gcgttaggat acagcgcctg cataaaagcc ttgatctgct taaaagccac 21540
ctgagccttt gcgccttcag agaagaacat gccgcaagac ttgccggaaa actgattggc 21600
cggacaggcc gcgtcgtgca cgcagcacct tgcgtcggtg ttggagatct gcaccacatt 21660
tcggccccac cggttcttca cgatcttggc cttgctagac tgctccttca gcgcgcgctg 21720
cccgttttcg ctcgtcacat ccatttcaat cacgtgctcc ttatttatca taatgcttcc 21780
gtgtagacac ttaagctcgc cttcgatctc agcgcagcgg tgcagccaca acgcgcagcc 21840
cgtgggctcg tgatgcttgt aggtcacctc tgcaaacgac tgcaggtacg cctgcaggaa 21900
tcgccccatc atcgtcacaa aggtcttgtt gctggtgaag gtcagctgca acccgcggtg 21960
ctcctcgttc agccaggtct tgcatacggc cgccagagct tccacttggt caggcagtag 22020
tttgaagttc gcctttagat cgttatccac gtggtacttg tccatcagcg cgcgcgcagc 22080
ctccatgccc ttctcccacg cagacacgat cggcacactc agcgggttca tcaccgtaat 22140
ttcactttcc gcttcgctgg gctcttcctc ttcctcttgc gtccgcatac cacgcgccac 22200
tgggtcgtct tcattcagcc gccgcactgt gcgcttacct cctttgccat gcttgattag 22260
caccggtggg ttgctgaaac ccaccatttg tagcgccaca tcttctcttt cttcctcgct 22320
gtccacgatt acctctggtg atggcgggcg ctcgggcttg ggagaagggc gcttcttttt 22380
cttcttgggc gcaatggcca aatccgccgc cgaggtcgat ggccgcgggc tgggtgtgcg 22440
cggcaccagc gcgtcttgtg atgagtcttc ctcgtcctcg gactcgatac gccgcctcat 22500
ccgctttttt gggggcgccc ggggaggcgg cggcgacggg gacggggacg acacgtcctc 22560
catggttggg ggacgtcgcg ccgcaccgcg tccgcgctcg ggggtggttt cgcgctgctc 22620
ctcttcccga ctggccattt ccttctccta taggcagaaa aagatcatgg agtcagtcga 22680
gaagaaggac agcctaaccg ccccctctga gttcgccacc accgcctcca ccgatgccgc 22740
caacgcgcct accaccttcc ccgtcgaggc acccccgctt gaggaggagg aagtgattat 22800
cgagcaggac ccaggttttg taagcgaaga cgacgaggac cgctcagtac caacagagga 22860
taaaaagcaa gaccaggaca acgcagaggc aaacgaggaa caagtcgggc ggggggacga 22920
aaggcatggc gactacctag atgtgggaga cgacgtgctg ttgaagcatc tgcagcgcca 22980
gtgcgccatt atctgcgacg cgttgcaaga gcgcagcgat gtgcccctcg ccatagcgga 23040
tgtcagcctt gcctacgaac gccacctatt ctcaccgcgc gtacccccca aacgccaaga 23100
aaacggcaca tgcgagccca acccgcgcct caacttctac cccgtatttg ccgtgccaga 23160
ggtgcttgcc acctatcaca tctttttcca aaactgcaag atacccctat cctgccgtgc 23220
caaccgcagc cgagcggaca agcagctggc cttgcggcag ggcgctgtca tacctgatat 23280
cgcctcgctc aacgaagtgc caaaaatctt tgagggtctt ggacgcgacg agaagcgcgc 23340
ggcaaacgct ctgcaacagg aaaacagcga aaatgaaagt cactctggag tgttggtgga 23400
actcgagggt gacaacgcgc gcctagccgt actaaaacgc agcatcgagg tcacccactt 23460
tgcctacccg gcacttaacc taccccccaa ggtcatgagc acagtcatga gtgagctgat 23520
cgtgcgccgt gcgcagcccc tggagaggga tgcaaatttg caagaacaaa cagaggaggg 23580
cctacccgca gttggcgacg agcagctagc gcgctggctt caaacgcgcg agcctgccga 23640
cttggaggag cgacgcaaac taatgatggc cgcagtgctc gttaccgtgg agcttgagtg 23700
catgcagcgg ttctttgctg acccggagat gcagcgcaag ctagaggaaa cattgcacta 23760
cacctttcga cagggctacg tacgccaggc ctgcaagatc tccaacgtgg agctctgcaa 23820
cctggtctcc taccttggaa ttttgcacga aaaccgcctt gggcaaaacg tgcttcattc 23880
cacgctcaag ggcgaggcgc gccgcgacta cgtccgcgac tgcgtttact tatttctatg 23940
ctacacctgg cagacggcca tgggcgtttg gcagcagtgc ttggaggagt gcaacctcaa 24000
ggagctgcag aaactgctaa agcaaaactt gaaggaccta tggacggcct tcaacgagcg 24060
ctccgtggcc gcgcacctgg cggacatcat tttccccgaa cgcctgctta aaaccctgca 24120
acagggtctg ccagacttca ccagtcaaag catgttgcag aactttagga actttatcct 24180
agagcgctca ggaatcttgc ccgccacctg ctgtgcactt cctagcgact ttgtgcccat 24240
taagtaccgc gaatgccctc cgccgctttg gggccactgc taccttctgc agctagccaa 24300
ctaccttgcc taccactctg acataatgga agacgtgagc ggtgacggtc tactggagtg 24360
tcactgtcgc tgcaacctat gcaccccgca ccgctccctg gtttgcaatt cgcagctgct 24420
taacgaaagt caaattatcg gtacctttga gctgcagggt ccctcgcctg acgaaaagtc 24480
cgcggctccg gggttgaaac tcactccggg gctgtggacg tcggcttacc ttcgcaaatt 24540
tgtacctgag gactaccacg cccacgagat taggttctac gaagaccaat cccgcccgcc 24600
taatgcggag cttaccgcct gcgtcattac ccagggccac attcttggcc aattgcaagc 24660
catcaacaaa gcccgccaag agtttctgct acgaaaggga cggggggttt acttggaccc 24720
ccagtccggc gaggagctca acccaatccc cccgccgccg cagccctatc agcagcagcc 24780
gcgggccctt gcttcccagg atggcaccca aaaagaagct gcagctgccg ccgccaccca 24840
cggacgagga ggaatactgg gacagtcagg cagaggaggt tttggacgag gaggaggagg 24900
acatgatgga agactgggag agcctagacg aggaagcttc cgaggtcgaa gaggtgtcag 24960
acgaaacacc gtcaccctcg gtcgcattcc cctcgccggc gccccagaaa tcggcaaccg 25020
gttccagcat ggctacaacc tccgctcctc aggcgccgcc ggcactgccc gttcgccgac 25080
ccaaccgtag atgggacacc actggaacca gggccggtaa gtccaagcag ccgccgccgt 25140
tagcccaaga gcaacaacag cgccaaggct accgctcatg gcgcgggcac aagaacgcca 25200
tagttgcttg cttgcaagac tgtgggggca acatctcctt cgcccgccgc tttcttctct 25260
accatcacgg cgtggccttc ccccgtaaca tcctgcatta ctaccgtcat ctctacagcc 25320
catactgcac cggcggcagc ggcagcaaca gcagcggcca cacagaagca aaggcgaccg 25380
gatagcaaga ctctgacaaa gcccaagaaa tccacagcgg cggcagcagc aggaggagga 25440
gcgctgcgtc tggcgcccaa cgaacccgta tcgacccgcg agcttagaaa caggattttt 25500
cccactctgt atgctatatt tcaacagagc aggggccaag aacaagagct gaaaataaaa 25560
aacaggtctc tgcgatccct cacccgcagc tgcctgtatc acaaaagcga agatcagctt 25620
cggcgcacgc tggaagacgc ggaggctctc ttcagtaaat actgcgcgct gactcttaag 25680
gactagtttc gcgccctttc tcaaatttaa gcgcgaaaac tacgtcatct ccagcggcca 25740
cacccggcgc cagcacctgt tgtcagcgcc attatgagca aggaaattcc cacgccctac 25800
atgtggagtt accagccaca aatgggactt gcggctggag ctgcccaaga ctactcaacc 25860
cgaataaact acatgagcgc gggaccccac atgatatccc gggtcaacgg aatacgcgcc 25920
caccgaaacc gaattctcct ggaacaggcg gctattacca ccacacctcg taataacctt 25980
aatccccgta gttggcccgc tgccctggtg taccaggaaa gtcccgctcc caccactgtg 26040
gtacttccca gagacgccca ggccgaagtt cagatgacta actcaggggc gcagcttgcg 26100
ggcggctttc gtcacagggt gcggtcgccc gggcagggta taactcacct gacaatcaga 26160
gggcgaggta ttcagctcaa cgacgagtcg gtgagctcct cgcttggtct ccgtccggac 26220
gggacatttc agatcggcgg cgccggccgc tcttcattca cgcctcgtca ggcaatccta 26280
actctgcaga cctcgtcctc tgagccgcgc tctggaggca ttggaactct gcaatttatt 26340
gaggagtttg tgccatcggt ctactttaac cccttctcgg gacctcccgg ccactatccg 26400
gatcaattta ttcctaactt tgacgcggta aaggactcgg cggacggcta cgactgaatg 26460
ttataagttc ctgtccatcc gcacccacta tcttcatgtt gttgcagatg aagcgcgcaa 26520
gaccgtctga agataccttc aaccccgtgt atccatatga cacggaaacc ggtcctccaa 26580
ctgtgccttt tcttactcct ccctttgtat cccccaatgg gtttcaagag agtccccctg 26640
gggtactctc tttgcgccta tccgaacctc tagttacctc caatggcatg cttgcgctca 26700
aaatgggcaa cggcctctct ctggacgagg ccggcaacct tacctcccaa aatgtaacca 26760
ctgtgagccc acctctcaaa aaaaccaagt caaacataaa cctggaaata tctgcacccc 26820
tcacagttac ctcagaagcc ctaactgtgg ctgccgccgc acctctaatg gtcgcgggca 26880
acacactcac catgcaatca caggccccgc taaccgtgca cgactccaaa cttagcattg 26940
ccacccaagg acccctcaca gtgtcagaag gaaagctagc cctgcaaaca tcaggccccc 27000
tcaccaccac cgatagcagt acccttacta tcactgcctc accccctcta actactgcca 27060
ctggtagctt gggcattgac ttgaaagagc ccatttatac acaaaatgga aaactaggac 27120
taaagtacgg ggctcctttg catgtaacag acgacctaaa cactttgacc gtagcaactg 27180
gtccaggtgt gactattaat aatacttcct tgcaaactaa agttactgga gccttgggtt 27240
ttgattcaca aggcaatatg caacttaatg tagcaggagg actaaggatt gattctcaaa 27300
acagacgcct tatacttgat gttagttatc cgtttgatgc tcaaaaccaa ctaaatctaa 27360
gactaggaca gggccctctt tttataaact cagcccacaa cttggatatt aactacaaca 27420
aaggccttta cttgtttaca gcttcaaaca attccaaaaa gcttgaggtt aacctaagca 27480
ctgccaaggg gttgatgttt gacgctacag ccatagccat taatgcagga gatgggcttg 27540
aatttggttc acctaatgca ccaaacacaa atcccctcaa aacaaaaatt ggccatggcc 27600
tagaatttga ttcaaacaag gctatggttc ctaaactagg aactggcctt agttttgaca 27660
gcacaggtgc cattacagta ggaaacaaaa ataatgataa gctaactttg tggaccacac 27720
cagctccatc tcctaactgt agactaaatg cagagaaaga tgctaaactc actttggtct 27780
taacaaaatg tggcagtcaa atacttgcta cagtttcagt tttggctgtt aaaggcagtt 27840
tggctccaat atctggaaca gttcaaagtg ctcatcttat tataagattt gacgaaaatg 27900
gagtgctact aaacaattcc ttcctggacc cagaatattg gaactttaga aatggagatc 27960
ttactgaagg cacagcctat acaaacgctg ttggatttat gcctaaccta tcagcttatc 28020
caaaatctca cggtaaaact gccaaaagta acattgtcag tcaagtttac ttaaacggag 28080
acaaaactaa acctgtaaca ctaaccatta cactaaacgg tacacaggaa acaggagaca 28140
caactccaag tgcatactct atgtcatttt catgggactg gtctggccac aactacatta 28200
atgaaatatt tgccacatcc tcttacactt tttcatacat tgcccaagaa taaagaatcg 28260
tttgtgttat gtttcaacgt gtttattttt caattgcaga aaatttcaag tcatttttca 28320
ttcagtagta tagccccacc accacatagc ttatacagat caccgtacct taatcaaact 28380
cacagaaccc tagtattcaa cctgccacct ccctcccaac acacagagta cacagtcctt 28440
tctccccggc tggccttaaa aagcatcata tcatgggtaa cagacatatt cttaggtgtt 28500
atattccaca cggtttcctg tcgagccaaa cgctcatcag tgatattaat aaactccccg 28560
ggcagctcac ttaagttcat gtcgctgtcc agctgctgag ccacaggctg ctgtccaact 28620
tgcggttgct taacgggcgg cgaaggagaa gtccacgcct acatgggggt agagtcataa 28680
tcgtgcatca ggatagggcg gtggtgctgc agcagcgcgc gaataaactg ctgccgccgc 28740
cgctccgtcc tgcaggaata caacatggca gtggtctcct cagcgatgat tcgcaccgcc 28800
cgcagcataa ggcgccttgt cctccgggca cagcagcgca ccctgatctc acttaaatca 28860
gcacagtaac tgcagcacag caccacaata ttgttcaaaa tcccacagtg caaggcgctg 28920
tatccaaagc tcatggcggg gaccacagaa cccacgtggc catcatacca caagcgcagg 28980
tagattaagt ggcgacccct cataaacacg ctggacataa acattacctc ttttggcatg 29040
ttgtaattca ccacctcccg gtaccatata aacctctgat taaacatggc gccatccacc 29100
accatcctaa accagctggc caaaacctgc ccgccggcta tacactgcag ggaaccggga 29160
ctggaacaat gacagtggag agcccaggac tcgtaaccat ggatcatcat gctcgtcatg 29220
atatcaatgt tggcacaaca caggcacacg tgcatacact tcctcaggat tacaagctcc 29280
tcccgcgtta gaaccatatc ccagggaaca acccattcct gaatcagcgt aaatcccaca 29340
ctgcagggaa gacctcgcac gtaactcacg ttgtgcattg tcaaagtgtt acattcgggc 29400
agcagcggat gatcctccag tatggtagcg cgggtttctg tctcaaaagg aggtagacga 29460
tccctactgt acggagtgcg ccgagacaac cgagatcgtg ttggtcgtag tgtcatgcca 29520
aatggaacgc cggacgtagt catatttcct gaagcaaaac caggtgcggg cgtgacaaac 29580
agatctgcgt ctccggtctc gccgcttaga tcgctctgtg tagtagttgt agtatatcca 29640
ctctctcaaa gcatccaggc gccccctggc ttcgggttct atgtaaactc cttcatgcgc 29700
cgctgccctg ataacatcca ccaccgcaga ataagccaca cccagccaac ctacacattc 29760
gttctgcgag tcacacacgg gaggagcggg aagagctgga agaaccatgt tttttttttt 29820
attccaaaag attatccaaa acctcaaaat gaagatctat taagtgaacg cgctcccctc 29880
cggtggcgtg gtcaaactct acagccaaag aacagataat ggcatttgta agatgttgca 29940
caatggcttc caaaaggcaa acggccctca cgtccaagtg gacgtaaagg ctaaaccctt 30000
cagggtgaat ctcctctata aacattccag caccttcaac catgcccaaa taattctcat 30060
ctcgccacct tctcaatata tctctaagca aatcccgaat attaagtccg gccattgtaa 30120
aaatctgctc cagagcgccc tccaccttca gcctcaagca gcgaatcatg attgcaaaaa 30180
ttcaggttcc tcacagacct gtataagatt caaaagcgga acattaacaa aaataccgcg 30240
atcccgtagg tcccttcgca gggccagctg aacataatcg tgcaggtctg cacggaccag 30300
cgcggccact tccccgccag gaaccatgac aaaagaaccc acactgatta tgacacgcat 30360
actcggagct atgctaacca gcgtagcccc gatgtaagct tgttgcatgg gcggcgatat 30420
aaaatgcaag gtgctgctca aaaaatcagg caaagcctcg cgcaaaaaag aaagcacatc 30480
gtagtcatgc tcatgcagat aaaggcaggt aagctccgga accaccacag aaaaagacac 30540
catttttctc tcaaacatgt ctgcgggttt ctgcataaac acaaaataaa ataacaaaaa 30600
aacatttaaa cattagaagc ctgtcttaca acaggaaaaa caacccttat aagcataaga 30660
cggactacgg ccatgccggc gtgaccgtaa aaaaactggt caccgtgatt aaaaagcacc 30720
accgacagct cctcggtcat gtccggagtc ataatgtaag actcggtaaa cacatcaggt 30780
tgattcacat cggtcagtgc taaaaagcga ccgaaatagc ccgggggaat acatacccgc 30840
aggcgtagag acaacattac agcccccata ggaggtataa caaaattaat aggagagaaa 30900
aacacataaa cacctgaaaa accctcctgc ctaggcaaaa tagcaccctc ccgctccaga 30960
acaacataca gcgcttccac agcggcagcc ataacagtca gccttaccag taaaaaagaa 31020
aacctattaa aaaaacacca ctcgacacgg caccagctca atcagtcaca gtgtaaaaaa 31080
gggccaagtg cagagcgagt atatatagga ctaaaaaatg acgtaacggt taaagtccac 31140
aaaaaacacc cagaaaaccg cacgcgaacc tacgcccaga aacgaaagcc aaaaaaccca 31200
caacttcctc aaatcgtcac ttccgttttc ccacgttacg tcacttccca ttttaagaaa 31260
actacaattc ccaacacata caagttactc cgccctaaaa cctacgtcac ccgccccgtt 31320
cccacgcccc gcgccacgtc acaaactcca ccccctcatt atcatattgg cttcaatcca 31380
aaataaggta tattattgat gatg 31404
Claims (20)
1.一种用于产生重组病毒的衣壳化缺陷型腺病毒(edAd),所述edAd包含:
具有一个或多个突变的edAd基因组,所述一个或多个突变导致(1)一种或多种衣壳化必需蛋白的显著降低的产生或不产生,和/或(2)一种或多种缺陷型衣壳化必需蛋白的产生。
2.如权利要求1所述的edAd,其中所述一种或多种衣壳化必需蛋白选自由以下构成的组:衣壳蛋白IX、衣壳化蛋白IVa2、蛋白13.6、衣壳化蛋白52K、衣壳蛋白前体pIIIa、五邻体基底(衣壳蛋白III)、核心蛋白前体pVII、核心蛋白V、核心蛋白前体pX、衣壳蛋白前体pVI、六邻体(衣壳蛋白II)、蛋白酶、六邻体组装蛋白100K、蛋白33K、衣壳化蛋白22K、衣壳蛋白前体pVIII、蛋白UXP和纤维(衣壳蛋白IV)。
3.如权利要求1所述的edAd,其中所述一个或多个突变包含导致衣壳蛋白前体pIIIa不表达的突变。
4.如权利要求3所述的edAd,所述edAd进一步包含蛋白V、六邻体、Iva2、L1-52/55k和/或L4-22K中的一个或多个缺失。
5.如权利要求3所述的edAd,所述edAd进一步包含纤维蛋白中的缺失。
6.如权利要求1所述的edAd,其中所述一个或多个突变包含所述六邻体组装蛋白100K的缺失。
7.如权利要求1所述的edAd,所述edAd进一步包含腺病毒早期基因中的一个或多个缺失。
8.如权利要求7所述的edAd,所述edAd包含腺病毒早期基因E1中的缺失。
9.如权利要求7所述的edAd,所述edAd包含腺病毒早期基因E1和E3中的缺失。
10.如权利要求7所述的edAd,所述edAd包含腺病毒早期基因E1、E3和E4中的缺失。
11.如权利要求1所述的edAd,所述edAd进一步包含编码重组AAV的基因组的序列。
12.如权利要求11所述的edAd,其中所述重组AAV的基因组包含表达盒,所述表达盒包含与控制序列可操作地连接的靶基因,其中所述表达盒在每一端的侧翼带有AAV ITR。
13.如权利要求1所述的edAd,所述edAd进一步包含与控制序列可操作地连接的CRE的编码序列。
14.如权利要求1所述的edAd,所述edAd进一步包含慢病毒的gag和pol蛋白的编码序列。
15.如权利要求1所述的edAd,所述edAd进一步包含慢病毒的VSV-G蛋白的编码序列。
16.一种产生重组病毒(RV)的方法,所述方法包括以下步骤:
(a)用一种或多种edAd感染生产细胞以产生感染的生产细胞,其中所述一种或多种edAd能够在所述生产细胞中进行DNA复制,但不能进行病毒颗粒形成,并且其中所述一种或多种edAd或所述生产细胞包含RV基因组;
(b)在允许产生具有所述RV基因组的RV的条件下孵育所述感染的生产细胞;以及
(c)收获所述RV。
17.如权利要求16所述的方法,其中所述RV是AAV。
18.如权利要求17所述的方法,其中所述一种或多种edAd包含AAV基因组。
19.一种用于产生如权利要求1所述的edAd的包装细胞,其中所述包装细胞表达一种或多种基因产物,所述基因产物允许在所述包装细胞内的所述edAd的衣壳化。
20.如权利要求19所述的包装细胞,其中所述一种或多种基因产物包含腺病毒pIIIa基因产物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862743362P | 2018-10-09 | 2018-10-09 | |
US62/743,362 | 2018-10-09 | ||
PCT/US2019/055182 WO2020076820A2 (en) | 2018-10-09 | 2019-10-08 | Compositions and methods for preparing viral vectors |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112805387A true CN112805387A (zh) | 2021-05-14 |
Family
ID=70165196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980066189.5A Pending CN112805387A (zh) | 2018-10-09 | 2019-10-08 | 用于制备病毒载体的组合物和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210324415A1 (zh) |
EP (1) | EP3864159A4 (zh) |
JP (1) | JP7384457B2 (zh) |
CN (1) | CN112805387A (zh) |
WO (1) | WO2020076820A2 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2014236207B2 (en) | 2013-03-14 | 2019-05-23 | Salk Institute For Biological Studies | Oncolytic adenovirus compositions |
CA3013639A1 (en) | 2016-02-23 | 2017-08-31 | Salk Institute For Biological Studies | Exogenous gene expression in therapeutic adenovirus for minimal impact on viral kinetics |
WO2017147265A1 (en) | 2016-02-23 | 2017-08-31 | Salk Institute For Biological Studies | High throughput assay for measuring adenovirus replication kinetics |
CA3045892A1 (en) | 2016-12-12 | 2018-06-21 | Salk Institute For Biological Studies | Tumor-targeting synthetic adenoviruses and uses thereof |
GB2599212A (en) * | 2020-07-30 | 2022-03-30 | Shape Therapeutics Inc | Stable cell lines for inducible production of rAAV virions |
WO2022097647A1 (ja) * | 2020-11-04 | 2022-05-12 | 株式会社シンプロジェン | 統合型プラスミド |
IL302578A (en) * | 2020-11-04 | 2023-07-01 | Synplogen Co Ltd | Production of a virus vector plasmid in Bacillus Subtilis |
CN117897167A (zh) * | 2021-05-13 | 2024-04-16 | 福奇生物制品公司 | 腺病毒辅助质粒 |
CN117255975A (zh) * | 2021-05-28 | 2023-12-19 | 发那科株式会社 | 控制装置 |
WO2023250416A2 (en) * | 2022-06-22 | 2023-12-28 | Asklepios Biopharmaceutical, Inc. | Adenovirus-based nucleic acids and methods thereof |
WO2024107985A2 (en) * | 2022-11-16 | 2024-05-23 | Forge Biologics, Inc. | Adenoviral helper plasmid |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000042208A1 (en) * | 1999-01-14 | 2000-07-20 | The Scripps Research Institute | Adenovirus vectors, packaging cell lines, compositions, and methods for preparation and use |
US6251677B1 (en) * | 1997-08-25 | 2001-06-26 | The Trustees Of The University Of Pennsylvania | Hybrid adenovirus-AAV virus and methods of use thereof |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6120764A (en) * | 1993-06-24 | 2000-09-19 | Advec, Inc. | Adenoviruses for control of gene expression |
US5856152A (en) * | 1994-10-28 | 1999-01-05 | The Trustees Of The University Of Pennsylvania | Hybrid adenovirus-AAV vector and methods of use therefor |
US6946126B2 (en) * | 2001-06-04 | 2005-09-20 | Duke University | Replicating adenovirus vectors |
US20040166091A1 (en) * | 2003-02-24 | 2004-08-26 | Genvec, Inc. | Materials and methods for treating disorders of the ear |
US8574590B2 (en) * | 2003-07-30 | 2013-11-05 | Integral Molecular, Inc. | Lipoparticles comprising proteins, methods of making, and using the same |
-
2019
- 2019-10-08 EP EP19870316.7A patent/EP3864159A4/en active Pending
- 2019-10-08 WO PCT/US2019/055182 patent/WO2020076820A2/en unknown
- 2019-10-08 CN CN201980066189.5A patent/CN112805387A/zh active Pending
- 2019-10-08 JP JP2021545358A patent/JP7384457B2/ja active Active
- 2019-10-08 US US17/250,992 patent/US20210324415A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6251677B1 (en) * | 1997-08-25 | 2001-06-26 | The Trustees Of The University Of Pennsylvania | Hybrid adenovirus-AAV virus and methods of use thereof |
WO2000042208A1 (en) * | 1999-01-14 | 2000-07-20 | The Scripps Research Institute | Adenovirus vectors, packaging cell lines, compositions, and methods for preparation and use |
Non-Patent Citations (6)
Title |
---|
BOUDIN M L ET AL.: "Human adenovirus type 2 protein IIIa II. Maturation and Encapsidation", 《VIROLOGY》, vol. 101, no. 1, 23 February 2004 (2004-02-23), pages 144 - 156, XP023058809, DOI: 10.1016/0042-6822(80)90491-2 * |
CARAVOKYRI C ET AL.: "Constitutive episomal expression of polypeptide IX (pIX) in a 293-based cell line complements the deficiency of pIX mutant adenovirus type 5", 《JOURNAL OF VIROLOGY》, vol. 69, no. 11, pages 6631 * |
CROSBY C M ET AL.: "IIIa deleted adenovirus as a single-cycle genome replicating vector", 《VIROLOGY》, 2 July 2014 (2014-07-02), pages 159 * |
EL-ANDALOUSSI N ET AL.: "Efficient recombinant parvovirus production with the help of adenovirus-derived systems", 《JOURNAL OF VISUALIZED EXPERIMENTS》, no. 62, 23 April 2002 (2002-04-23), pages 3518 * |
EL-ANDALOUSSI N ET AL.: "Novel adenovirus-based helper system to support production of recombinant parvovirus", 《CANCER GENE THERAPY》, vol. 18, no. 4, 19 November 2010 (2010-11-19), pages 240 - 249, XP037761740, DOI: 10.1038/cgt.2010.73 * |
MORRISON M D ET AL.: "Generation of E3-deleted canine adenoviruses expressing canine parvovirus capsid by homologous recombination in bacteria", 《VIROLOGY》, vol. 293, no. 1, 25 May 2002 (2002-05-25), pages 26 - 30, XP004432820, DOI: 10.1006/viro.2001.1262 * |
Also Published As
Publication number | Publication date |
---|---|
EP3864159A2 (en) | 2021-08-18 |
JP2022513359A (ja) | 2022-02-07 |
EP3864159A4 (en) | 2022-11-02 |
WO2020076820A2 (en) | 2020-04-16 |
WO2020076820A3 (en) | 2020-07-09 |
US20210324415A1 (en) | 2021-10-21 |
JP7384457B2 (ja) | 2023-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112805387A (zh) | 用于制备病毒载体的组合物和方法 | |
US6733993B2 (en) | Enhanced first generation adenovirus vaccines expressing codon optimized HIV1-gag, pol, nef and modifications | |
AU2022203504A1 (en) | Oncolytic tumor viruses and methods of use | |
KR102471633B1 (ko) | 바이러스 동역학에 미치는 영향 최소화를 위한 치료용 아데노바이러스의 외인성 유전자 발현 | |
US20040161848A1 (en) | Adenoviral vector and related system and methods of making and use | |
AU2003271737A1 (en) | Means and methods for the production of adenovirus vectors | |
EP3472327B1 (en) | Potent and balanced bidirectional promoter | |
CN1993462A (zh) | 腺病毒载体组合物 | |
US20040002060A1 (en) | Fiber shaft modifications for efficient targeting | |
KR20120139672A (ko) | 원숭이 아데노바이러스 벡터의 증식 방법 | |
KR20200140848A (ko) | 복제 속성이 향상된 종양살상형 아데노바이러스 조성물 | |
CA2412637A1 (en) | Replication deficient adenoviral tnf vector | |
US20040185555A1 (en) | Adenovirus serotype 24 vectors, nucleic acids and virus produced thereby | |
CA2519680A1 (en) | Adenovirus particles with enhanced infectivity of dendritic cells and particles with decreased infectivity of hepatocytes | |
US20040191222A1 (en) | Adenovirus serotype 34 vectors, nucleic acids and virus produced thereby | |
KR20220027785A (ko) | 신규한 코로나바이러스 재조합 스파이크 단백질, 이를 코딩하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드를 포함하는 벡터 및 상기 벡터를 포함하는 코로나바이러스감염증 예방 또는 치료용 백신 | |
WO2006033999A2 (en) | Modified adenovirus containing a fiber replacement protein | |
US20040101957A1 (en) | Enhanced first generation adenovirus vaccines expressing codon optimized hiv1-gag, pol.nef and modifications | |
CN112011570B (zh) | 特异杀伤肿瘤细胞的溶瘤病毒系统及其应用 | |
JP2004519201A (ja) | キメラアデノウイルスベクター | |
AU2003283504B2 (en) | Recombinant adenoviral vectors and applications thereof | |
RU2816645C1 (ru) | Новый рекомбинантный шиповидный белок коронавируса, кодирующий его полинуклетид, вектор, содержащий полинуклетид, и вакцина для профилактики или лечения коронавирусной инфекции, содержащая вектор | |
RU2821989C1 (ru) | Новый аденовирусный вектор, не включающий компетентный по репликации аденовирус, и его применение | |
CN113774031B (zh) | 一种复制型人腺病毒及其应用 | |
KR102371663B1 (ko) | 아데노바이러스 벡터 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210517 Address after: Room 3a, 12 / F, Kai Cheng centre, 18 Sai Ying Pun Main Street, central and Western District, Hong Kong, China Applicant after: Nike gene Co.,Ltd. Address before: Pennsylvania, USA Applicant before: Nike gene Co.,Ltd. |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |