KR20240021906A - 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법 - Google Patents
발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법 Download PDFInfo
- Publication number
- KR20240021906A KR20240021906A KR1020247001300A KR20247001300A KR20240021906A KR 20240021906 A KR20240021906 A KR 20240021906A KR 1020247001300 A KR1020247001300 A KR 1020247001300A KR 20247001300 A KR20247001300 A KR 20247001300A KR 20240021906 A KR20240021906 A KR 20240021906A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- nucleic acid
- seq
- vector
- aspects
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims abstract description 303
- 239000013604 expression vector Substances 0.000 title claims abstract description 271
- 230000001580 bacterial effect Effects 0.000 title claims abstract description 174
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000004519 manufacturing process Methods 0.000 claims abstract description 41
- 239000000203 mixture Substances 0.000 claims abstract description 31
- 150000007523 nucleic acids Chemical group 0.000 claims description 417
- 230000014509 gene expression Effects 0.000 claims description 314
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 297
- 210000004027 cell Anatomy 0.000 claims description 199
- 102000018120 Recombinases Human genes 0.000 claims description 171
- 108010091086 Recombinases Proteins 0.000 claims description 171
- 239000003623 enhancer Substances 0.000 claims description 167
- 108010042407 Endonucleases Proteins 0.000 claims description 133
- 230000008488 polyadenylation Effects 0.000 claims description 115
- 238000011282 treatment Methods 0.000 claims description 109
- 241000701022 Cytomegalovirus Species 0.000 claims description 108
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 102
- 238000010362 genome editing Methods 0.000 claims description 77
- 108091033319 polynucleotide Proteins 0.000 claims description 77
- 102000040430 polynucleotide Human genes 0.000 claims description 77
- 239000002157 polynucleotide Substances 0.000 claims description 77
- 108020004414 DNA Proteins 0.000 claims description 76
- 102000039446 nucleic acids Human genes 0.000 claims description 63
- 108020004707 nucleic acids Proteins 0.000 claims description 63
- 108700028146 Genetic Enhancer Elements Proteins 0.000 claims description 41
- 239000012212 insulator Substances 0.000 claims description 39
- 108010077544 Chromatin Proteins 0.000 claims description 36
- 210000003483 chromatin Anatomy 0.000 claims description 36
- 241000251539 Vertebrata <Metazoa> Species 0.000 claims description 34
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 33
- 102000004533 Endonucleases Human genes 0.000 claims description 31
- 108091026890 Coding region Proteins 0.000 claims description 30
- 230000027455 binding Effects 0.000 claims description 29
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 claims description 26
- 101710163270 Nuclease Proteins 0.000 claims description 26
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 claims description 25
- 230000001939 inductive effect Effects 0.000 claims description 23
- 201000010099 disease Diseases 0.000 claims description 22
- 239000002773 nucleotide Substances 0.000 claims description 22
- 125000003729 nucleotide group Chemical group 0.000 claims description 22
- 108020005004 Guide RNA Proteins 0.000 claims description 19
- 238000003776 cleavage reaction Methods 0.000 claims description 17
- 230000007017 scission Effects 0.000 claims description 17
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical class N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 16
- 230000008685 targeting Effects 0.000 claims description 15
- 239000002105 nanoparticle Substances 0.000 claims description 14
- 239000008194 pharmaceutical composition Substances 0.000 claims description 14
- 208000035475 disorder Diseases 0.000 claims description 11
- 230000001105 regulatory effect Effects 0.000 claims description 11
- 108091033409 CRISPR Proteins 0.000 claims description 10
- 229940124447 delivery agent Drugs 0.000 claims description 10
- 239000003446 ligand Substances 0.000 claims description 7
- 101100162704 Emericella nidulans I-AniI gene Proteins 0.000 claims description 6
- 101000889905 Enterobacteria phage RB3 Intron-associated endonuclease 3 Proteins 0.000 claims description 6
- 101000889904 Enterobacteria phage T4 Defective intron-associated endonuclease 3 Proteins 0.000 claims description 6
- 101000889900 Enterobacteria phage T4 Intron-associated endonuclease 1 Proteins 0.000 claims description 6
- 101000889899 Enterobacteria phage T4 Intron-associated endonuclease 2 Proteins 0.000 claims description 6
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 claims description 6
- 230000001124 posttranscriptional effect Effects 0.000 claims description 6
- 241001492404 Woodchuck hepatitis virus Species 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000006780 non-homologous end joining Effects 0.000 claims description 4
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 3
- 101001035782 Gallus gallus Hemoglobin subunit beta Proteins 0.000 claims description 3
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims description 3
- 239000003937 drug carrier Substances 0.000 claims description 3
- 238000003306 harvesting Methods 0.000 claims description 3
- 108090000446 ribonuclease T(2) Proteins 0.000 claims description 3
- 241000894006 Bacteria Species 0.000 claims description 2
- 230000035939 shock Effects 0.000 claims description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 claims 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 claims 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 claims 1
- 102100031780 Endonuclease Human genes 0.000 description 102
- 108020005345 3' Untranslated Regions Proteins 0.000 description 76
- 206010028980 Neoplasm Diseases 0.000 description 73
- 239000005089 Luciferase Substances 0.000 description 70
- 108060001084 Luciferase Proteins 0.000 description 69
- 201000011510 cancer Diseases 0.000 description 67
- 241000699670 Mus sp. Species 0.000 description 49
- 108090000765 processed proteins & peptides Proteins 0.000 description 46
- 239000013612 plasmid Substances 0.000 description 44
- 108090000623 proteins and genes Proteins 0.000 description 40
- 239000005090 green fluorescent protein Substances 0.000 description 37
- 238000002347 injection Methods 0.000 description 37
- 239000007924 injection Substances 0.000 description 37
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 36
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 36
- 102000004196 processed proteins & peptides Human genes 0.000 description 34
- 229920001184 polypeptide Polymers 0.000 description 30
- 235000018102 proteins Nutrition 0.000 description 30
- 102000004169 proteins and genes Human genes 0.000 description 30
- 238000001890 transfection Methods 0.000 description 27
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 26
- 101150107399 UTR1 gene Proteins 0.000 description 24
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 21
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 20
- 108700019146 Transgenes Proteins 0.000 description 20
- 241000269368 Xenopus laevis Species 0.000 description 18
- 230000004048 modification Effects 0.000 description 17
- 238000012986 modification Methods 0.000 description 17
- 239000013642 negative control Substances 0.000 description 17
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 16
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 16
- 235000001014 amino acid Nutrition 0.000 description 14
- 150000001413 amino acids Chemical group 0.000 description 14
- 230000003234 polygenic effect Effects 0.000 description 14
- 230000000694 effects Effects 0.000 description 13
- 238000004520 electroporation Methods 0.000 description 13
- 238000000338 in vitro Methods 0.000 description 13
- 238000001990 intravenous administration Methods 0.000 description 13
- 239000013641 positive control Substances 0.000 description 13
- -1 VDM2 Proteins 0.000 description 12
- 210000000133 brain stem Anatomy 0.000 description 12
- 238000001727 in vivo Methods 0.000 description 12
- 239000000546 pharmaceutical excipient Substances 0.000 description 12
- 210000001103 thalamus Anatomy 0.000 description 12
- 210000003462 vein Anatomy 0.000 description 12
- 210000001638 cerebellum Anatomy 0.000 description 11
- 230000005782 double-strand break Effects 0.000 description 11
- 239000003814 drug Substances 0.000 description 11
- 238000003780 insertion Methods 0.000 description 11
- 230000037431 insertion Effects 0.000 description 11
- 239000004055 small Interfering RNA Substances 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- 108091036407 Polyadenylation Proteins 0.000 description 10
- 239000002609 medium Substances 0.000 description 10
- 206010008342 Cervix carcinoma Diseases 0.000 description 9
- 206010009944 Colon cancer Diseases 0.000 description 9
- 241000588724 Escherichia coli Species 0.000 description 9
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 9
- 201000010881 cervical cancer Diseases 0.000 description 9
- 238000000185 intracerebroventricular administration Methods 0.000 description 9
- 210000004185 liver Anatomy 0.000 description 9
- 101001092197 Homo sapiens RNA binding protein fox-1 homolog 3 Proteins 0.000 description 8
- 108091092195 Intron Proteins 0.000 description 8
- 102100035530 RNA binding protein fox-1 homolog 3 Human genes 0.000 description 8
- 230000001086 cytosolic effect Effects 0.000 description 8
- 230000001976 improved effect Effects 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 230000006798 recombination Effects 0.000 description 8
- 238000005215 recombination Methods 0.000 description 8
- 230000003612 virological effect Effects 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 7
- 238000010459 TALEN Methods 0.000 description 7
- 102100033178 Vascular endothelial growth factor receptor 1 Human genes 0.000 description 7
- 210000004556 brain Anatomy 0.000 description 7
- 229910052799 carbon Inorganic materials 0.000 description 7
- 239000012636 effector Substances 0.000 description 7
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 238000007619 statistical method Methods 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 102000004127 Cytokines Human genes 0.000 description 6
- 108090000695 Cytokines Proteins 0.000 description 6
- 206010033128 Ovarian cancer Diseases 0.000 description 6
- 206010061535 Ovarian neoplasm Diseases 0.000 description 6
- 206010060862 Prostate cancer Diseases 0.000 description 6
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 6
- 108091027967 Small hairpin RNA Proteins 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 208000029742 colonic neoplasm Diseases 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 230000001973 epigenetic effect Effects 0.000 description 6
- 208000005017 glioblastoma Diseases 0.000 description 6
- 201000007270 liver cancer Diseases 0.000 description 6
- 208000014018 liver neoplasm Diseases 0.000 description 6
- 201000001441 melanoma Diseases 0.000 description 6
- 229940124597 therapeutic agent Drugs 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 5
- 102000036364 Cullin Ring E3 Ligases Human genes 0.000 description 5
- 108060005986 Granzyme Proteins 0.000 description 5
- 102000001398 Granzyme Human genes 0.000 description 5
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 101100441075 Neosartorya fumigata (strain ATCC MYA-4609 / Af293 / CBS 101355 / FGSC A1100) crf2 gene Proteins 0.000 description 5
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- 108020004459 Small interfering RNA Proteins 0.000 description 5
- 101150058257 UTR2 gene Proteins 0.000 description 5
- 239000000427 antigen Substances 0.000 description 5
- 108091007433 antigens Proteins 0.000 description 5
- 102000036639 antigens Human genes 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 238000001415 gene therapy Methods 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 238000003384 imaging method Methods 0.000 description 5
- 238000007918 intramuscular administration Methods 0.000 description 5
- 238000007912 intraperitoneal administration Methods 0.000 description 5
- 238000007913 intrathecal administration Methods 0.000 description 5
- 150000002632 lipids Chemical class 0.000 description 5
- 238000010859 live-cell imaging Methods 0.000 description 5
- 201000005202 lung cancer Diseases 0.000 description 5
- 208000020816 lung neoplasm Diseases 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 238000007911 parenteral administration Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000007920 subcutaneous administration Methods 0.000 description 5
- 230000000699 topical effect Effects 0.000 description 5
- KBTLDMSFADPKFJ-UHFFFAOYSA-N 2-phenyl-1H-indole-3,4-dicarboximidamide Chemical compound N1C2=CC=CC(C(N)=N)=C2C(C(=N)N)=C1C1=CC=CC=C1 KBTLDMSFADPKFJ-UHFFFAOYSA-N 0.000 description 4
- 241001326189 Gyrodactylus prostae Species 0.000 description 4
- 101001009603 Homo sapiens Granzyme B Proteins 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 4
- 208000018737 Parkinson disease Diseases 0.000 description 4
- 108091034057 RNA (poly(A)) Proteins 0.000 description 4
- 108010083379 Sarcoglycans Proteins 0.000 description 4
- 102000006308 Sarcoglycans Human genes 0.000 description 4
- 238000000692 Student's t-test Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000030279 gene silencing Effects 0.000 description 4
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 4
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 4
- 238000001802 infusion Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000004020 luminiscence type Methods 0.000 description 4
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 4
- 238000001000 micrograph Methods 0.000 description 4
- 230000001537 neural effect Effects 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 201000002528 pancreatic cancer Diseases 0.000 description 4
- 208000008443 pancreatic carcinoma Diseases 0.000 description 4
- 230000002685 pulmonary effect Effects 0.000 description 4
- 239000004094 surface-active agent Substances 0.000 description 4
- 230000005030 transcription termination Effects 0.000 description 4
- 102100031162 Collagen alpha-1(XVIII) chain Human genes 0.000 description 3
- 230000008836 DNA modification Effects 0.000 description 3
- 238000002965 ELISA Methods 0.000 description 3
- 108010079505 Endostatins Proteins 0.000 description 3
- 108700036482 Francisella novicida Cas9 Proteins 0.000 description 3
- 201000010915 Glioblastoma multiforme Diseases 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- 101000853009 Homo sapiens Interleukin-24 Proteins 0.000 description 3
- 101100209954 Human papillomavirus type 16 L1 gene Proteins 0.000 description 3
- 102100036671 Interleukin-24 Human genes 0.000 description 3
- 241001529936 Murinae Species 0.000 description 3
- 108700008625 Reporter Genes Proteins 0.000 description 3
- 102100031176 Retinoid isomerohydrolase Human genes 0.000 description 3
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 3
- 210000001744 T-lymphocyte Anatomy 0.000 description 3
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 3
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 3
- 230000021736 acetylation Effects 0.000 description 3
- 238000006640 acetylation reaction Methods 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- 238000005415 bioluminescence Methods 0.000 description 3
- 230000029918 bioluminescence Effects 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 238000002659 cell therapy Methods 0.000 description 3
- 230000004064 dysfunction Effects 0.000 description 3
- 230000004049 epigenetic modification Effects 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 238000002073 fluorescence micrograph Methods 0.000 description 3
- 210000003494 hepatocyte Anatomy 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 210000005228 liver tissue Anatomy 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000001394 metastastic effect Effects 0.000 description 3
- 206010061289 metastatic neoplasm Diseases 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 210000000449 purkinje cell Anatomy 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 239000003381 stabilizer Substances 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 230000002459 sustained effect Effects 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- ULGJWNIHLSLQPZ-UHFFFAOYSA-N 7-[(6,8-dichloro-1,2,3,4-tetrahydroacridin-9-yl)amino]-n-[2-(1h-indol-3-yl)ethyl]heptanamide Chemical compound C1CCCC2=NC3=CC(Cl)=CC(Cl)=C3C(NCCCCCCC(=O)NCCC=3C4=CC=CC=C4NC=3)=C21 ULGJWNIHLSLQPZ-UHFFFAOYSA-N 0.000 description 2
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 2
- 108010082126 Alanine transaminase Proteins 0.000 description 2
- 102100034561 Alpha-N-acetylglucosaminidase Human genes 0.000 description 2
- 102100026277 Alpha-galactosidase A Human genes 0.000 description 2
- 102000012936 Angiostatins Human genes 0.000 description 2
- 108010079709 Angiostatins Proteins 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 102100038238 Aromatic-L-amino-acid decarboxylase Human genes 0.000 description 2
- 101710151768 Aromatic-L-amino-acid decarboxylase Proteins 0.000 description 2
- 102100022146 Arylsulfatase A Human genes 0.000 description 2
- 102100029822 B- and T-lymphocyte attenuator Human genes 0.000 description 2
- 208000004736 B-Cell Leukemia Diseases 0.000 description 2
- 208000003950 B-cell lymphoma Diseases 0.000 description 2
- 102000004506 Blood Proteins Human genes 0.000 description 2
- 108010017384 Blood Proteins Proteins 0.000 description 2
- 102100028989 C-X-C chemokine receptor type 2 Human genes 0.000 description 2
- 108010029697 CD40 Ligand Proteins 0.000 description 2
- 102100032937 CD40 ligand Human genes 0.000 description 2
- 201000009030 Carcinoma Diseases 0.000 description 2
- 108700004991 Cas12a Proteins 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 2
- 102100022641 Coagulation factor IX Human genes 0.000 description 2
- 101710136373 Cold shock-like protein CspC Proteins 0.000 description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 2
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 108010069621 Epstein-Barr virus EBV-associated membrane antigen Proteins 0.000 description 2
- 102100028875 Formylglycine-generating enzyme Human genes 0.000 description 2
- 102000034615 Glial cell line-derived neurotrophic factor Human genes 0.000 description 2
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 2
- 208000032612 Glial tumor Diseases 0.000 description 2
- 206010018338 Glioma Diseases 0.000 description 2
- 108091022930 Glutamate decarboxylase Proteins 0.000 description 2
- 102100035902 Glutamate decarboxylase 1 Human genes 0.000 description 2
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 2
- 102100038393 Granzyme H Human genes 0.000 description 2
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 2
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 2
- 102000003745 Hepatocyte Growth Factor Human genes 0.000 description 2
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000718525 Homo sapiens Alpha-galactosidase A Proteins 0.000 description 2
- 101000916059 Homo sapiens C-X-C chemokine receptor type 2 Proteins 0.000 description 2
- 101000801640 Homo sapiens Phospholipid-transporting ATPase ABCA3 Proteins 0.000 description 2
- 101001136981 Homo sapiens Proteasome subunit beta type-9 Proteins 0.000 description 2
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 2
- 101000801643 Homo sapiens Retinal-specific phospholipid-transporting ATPase ABCA4 Proteins 0.000 description 2
- 101000631760 Homo sapiens Sodium channel protein type 1 subunit alpha Proteins 0.000 description 2
- 101000767631 Human papillomavirus type 16 Protein E7 Proteins 0.000 description 2
- 108090000467 Interferon-beta Proteins 0.000 description 2
- 108010013563 Lipoprotein Lipase Proteins 0.000 description 2
- 102100022119 Lipoprotein lipase Human genes 0.000 description 2
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 2
- 102100034256 Mucin-1 Human genes 0.000 description 2
- 108010008707 Mucin-1 Proteins 0.000 description 2
- 102100027661 N-sulphoglucosamine sulphohydrolase Human genes 0.000 description 2
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 2
- 108010025020 Nerve Growth Factor Proteins 0.000 description 2
- 102000015336 Nerve Growth Factor Human genes 0.000 description 2
- 206010029260 Neuroblastoma Diseases 0.000 description 2
- 102100021584 Neurturin Human genes 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 102100033623 Phospholipid-transporting ATPase ABCA3 Human genes 0.000 description 2
- 206010035226 Plasma cell myeloma Diseases 0.000 description 2
- 102000013566 Plasminogen Human genes 0.000 description 2
- 108010051456 Plasminogen Proteins 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 102100035764 Proteasome subunit beta type-9 Human genes 0.000 description 2
- 102100032617 Pulmonary surfactant-associated protein B Human genes 0.000 description 2
- 102100040971 Pulmonary surfactant-associated protein C Human genes 0.000 description 2
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 2
- 102100022881 Rab proteins geranylgeranyltransferase component A 1 Human genes 0.000 description 2
- 102100033617 Retinal-specific phospholipid-transporting ATPase ABCA4 Human genes 0.000 description 2
- 102100028910 Sodium channel protein type 1 subunit alpha Human genes 0.000 description 2
- 102100038437 Sodium-dependent phosphate transport protein 2B Human genes 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 208000005718 Stomach Neoplasms Diseases 0.000 description 2
- 108010039203 Tripeptidyl-Peptidase 1 Proteins 0.000 description 2
- 102100034197 Tripeptidyl-peptidase 1 Human genes 0.000 description 2
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 description 2
- 102100024586 Tumor necrosis factor ligand superfamily member 14 Human genes 0.000 description 2
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 2
- 108010053096 Vascular Endothelial Growth Factor Receptor-1 Proteins 0.000 description 2
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 2
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000007488 abnormal function Effects 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 230000001464 adherent effect Effects 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 108010003977 aminoacylase I Proteins 0.000 description 2
- 230000006907 apoptotic process Effects 0.000 description 2
- 206010003246 arthritis Diseases 0.000 description 2
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 150000001721 carbon Chemical group 0.000 description 2
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 231100000135 cytotoxicity Toxicity 0.000 description 2
- 230000003013 cytotoxicity Effects 0.000 description 2
- 230000006196 deacetylation Effects 0.000 description 2
- 238000003381 deacetylation reaction Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000017858 demethylation Effects 0.000 description 2
- 238000010520 demethylation reaction Methods 0.000 description 2
- 230000030609 dephosphorylation Effects 0.000 description 2
- 238000006209 dephosphorylation reaction Methods 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 210000002889 endothelial cell Anatomy 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 206010017758 gastric cancer Diseases 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 238000002743 insertional mutagenesis Methods 0.000 description 2
- 102000003898 interleukin-24 Human genes 0.000 description 2
- 108090000237 interleukin-24 Proteins 0.000 description 2
- 238000001361 intraarterial administration Methods 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 208000005340 mucopolysaccharidosis III Diseases 0.000 description 2
- 208000011045 mucopolysaccharidosis type 3 Diseases 0.000 description 2
- 201000000050 myeloid neoplasm Diseases 0.000 description 2
- 239000002539 nanocarrier Substances 0.000 description 2
- 108700043045 nanoluc Proteins 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 125000004433 nitrogen atom Chemical group N* 0.000 description 2
- 210000000963 osteoblast Anatomy 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000008707 rearrangement Effects 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 108010054126 retinoid isomerohydrolase Proteins 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 201000011549 stomach cancer Diseases 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 230000002195 synergetic effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 102000055046 tissue-factor-pathway inhibitor 2 Human genes 0.000 description 2
- 108010016054 tissue-factor-pathway inhibitor 2 Proteins 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- 102000003298 tumor necrosis factor receptor Human genes 0.000 description 2
- 230000004906 unfolded protein response Effects 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- 208000005452 Acute intermittent porphyria Diseases 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 1
- 206010052747 Adenocarcinoma pancreas Diseases 0.000 description 1
- 101710106740 Alpha-N-acetylglucosaminidase Proteins 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 208000031277 Amaurotic familial idiocy Diseases 0.000 description 1
- 102100032187 Androgen receptor Human genes 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 102000010637 Aquaporins Human genes 0.000 description 1
- 108010063290 Aquaporins Proteins 0.000 description 1
- 102000003823 Aromatic-L-amino-acid decarboxylases Human genes 0.000 description 1
- 108090000121 Aromatic-L-amino-acid decarboxylases Proteins 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 102100032948 Aspartoacylase Human genes 0.000 description 1
- 108700023155 Aspartoacylases Proteins 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 101710144268 B- and T-lymphocyte attenuator Proteins 0.000 description 1
- 102100021663 Baculoviral IAP repeat-containing protein 5 Human genes 0.000 description 1
- 102220533217 Baculoviral IAP repeat-containing protein 5_C84A_mutation Human genes 0.000 description 1
- 102220533139 Baculoviral IAP repeat-containing protein 5_T34A_mutation Human genes 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 208000019838 Blood disease Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 102100036846 C-C motif chemokine 21 Human genes 0.000 description 1
- 238000011357 CAR T-cell therapy Methods 0.000 description 1
- 208000033528 CLN2 disease Diseases 0.000 description 1
- 101100297345 Caenorhabditis elegans pgl-2 gene Proteins 0.000 description 1
- 101710134161 Calcium-transporting ATPase sarcoplasmic/endoplasmic reticulum type Proteins 0.000 description 1
- 208000022526 Canavan disease Diseases 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 206010007559 Cardiac failure congestive Diseases 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108010036867 Cerebroside-Sulfatase Proteins 0.000 description 1
- 101710163595 Chaperone protein DnaK Proteins 0.000 description 1
- 102000006435 Chemokine CCL21 Human genes 0.000 description 1
- 108010083702 Chemokine CCL21 Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 208000033810 Choroidal dystrophy Diseases 0.000 description 1
- 208000037088 Chromosome Breakage Diseases 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 102100023419 Cystic fibrosis transmembrane conductance regulator Human genes 0.000 description 1
- 230000035131 DNA demethylation Effects 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 102100035784 Decorin Human genes 0.000 description 1
- 108090000738 Decorin Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 102000016607 Diphtheria Toxin Human genes 0.000 description 1
- 108010053187 Diphtheria Toxin Proteins 0.000 description 1
- 201000007547 Dravet syndrome Diseases 0.000 description 1
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 1
- 206010014561 Emphysema Diseases 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 102100021579 Enhancer of filamentation 1 Human genes 0.000 description 1
- 101000830030 Enterobacteria phage T4 Baseplate hub assembly protein gp26 Proteins 0.000 description 1
- 101000830031 Escherichia phage Mu Uncharacterized protein gp26 Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 102000008968 Eukaryotic translation initiation factor 4E-binding protein 1 Human genes 0.000 description 1
- 108050000946 Eukaryotic translation initiation factor 4E-binding protein 1 Proteins 0.000 description 1
- 108010046914 Exodeoxyribonuclease V Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 102100037091 Exonuclease V Human genes 0.000 description 1
- 208000024720 Fabry Disease Diseases 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 108010054218 Factor VIII Proteins 0.000 description 1
- 102000001690 Factor VIII Human genes 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 101710192607 Formylglycine-generating enzyme Proteins 0.000 description 1
- 101150014889 Gad1 gene Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 241000237858 Gastropoda Species 0.000 description 1
- 102000008214 Glutamate decarboxylase Human genes 0.000 description 1
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 1
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 101710178376 Heat shock 70 kDa protein Proteins 0.000 description 1
- 101710152018 Heat shock cognate 70 kDa protein Proteins 0.000 description 1
- 108010034791 Heterochromatin Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 108090000353 Histone deacetylase Proteins 0.000 description 1
- 102000003964 Histone deacetylase Human genes 0.000 description 1
- 101000864344 Homo sapiens B- and T-lymphocyte attenuator Proteins 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 101000941029 Homo sapiens Endoplasmic reticulum junction formation protein lunapark Proteins 0.000 description 1
- 101000898310 Homo sapiens Enhancer of filamentation 1 Proteins 0.000 description 1
- 101000648611 Homo sapiens Formylglycine-generating enzyme Proteins 0.000 description 1
- 101000898034 Homo sapiens Hepatocyte growth factor Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000651201 Homo sapiens N-sulphoglucosamine sulphohydrolase Proteins 0.000 description 1
- 101100241084 Homo sapiens NRTN gene Proteins 0.000 description 1
- 101000991410 Homo sapiens Nucleolar and spindle-associated protein 1 Proteins 0.000 description 1
- 101001086862 Homo sapiens Pulmonary surfactant-associated protein B Proteins 0.000 description 1
- 101000612671 Homo sapiens Pulmonary surfactant-associated protein C Proteins 0.000 description 1
- 101000729271 Homo sapiens Retinoid isomerohydrolase Proteins 0.000 description 1
- 101000617738 Homo sapiens Survival motor neuron protein Proteins 0.000 description 1
- 101000655352 Homo sapiens Telomerase reverse transcriptase Proteins 0.000 description 1
- 101000830594 Homo sapiens Tumor necrosis factor ligand superfamily member 14 Proteins 0.000 description 1
- 101000851007 Homo sapiens Vascular endothelial growth factor receptor 2 Proteins 0.000 description 1
- 101000851030 Homo sapiens Vascular endothelial growth factor receptor 3 Proteins 0.000 description 1
- 101000633054 Homo sapiens Zinc finger protein SNAI2 Proteins 0.000 description 1
- 241000341655 Human papillomavirus type 16 Species 0.000 description 1
- 101100484567 Human papillomavirus type 16 E5 gene Proteins 0.000 description 1
- 101100540311 Human papillomavirus type 16 E6 gene Proteins 0.000 description 1
- 108010056651 Hydroxymethylbilane synthase Proteins 0.000 description 1
- 208000001021 Hyperlipoproteinemia Type I Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 108091006081 Inositol-requiring enzyme-1 Proteins 0.000 description 1
- 102000012330 Integrases Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 102100026720 Interferon beta Human genes 0.000 description 1
- 102000006992 Interferon-alpha Human genes 0.000 description 1
- 108010047761 Interferon-alpha Proteins 0.000 description 1
- 102000003996 Interferon-beta Human genes 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 102000003812 Interleukin-15 Human genes 0.000 description 1
- 108090000172 Interleukin-15 Proteins 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- 101710192602 Latent membrane protein 1 Proteins 0.000 description 1
- 201000003533 Leber congenital amaurosis Diseases 0.000 description 1
- 206010024380 Leukoderma Diseases 0.000 description 1
- 208000006552 Lewis Lung Carcinoma Diseases 0.000 description 1
- 206010050017 Lung cancer metastatic Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 206010027458 Metastases to lung Diseases 0.000 description 1
- 206010027480 Metastatic malignant melanoma Diseases 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 208000037011 Microlithiasis Diseases 0.000 description 1
- 208000036572 Myoclonic epilepsy Diseases 0.000 description 1
- 108010006140 N-sulfoglucosamine sulfohydrolase Proteins 0.000 description 1
- 208000002454 Nasopharyngeal Carcinoma Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 208000002537 Neuronal Ceroid-Lipofuscinoses Diseases 0.000 description 1
- 108010015406 Neurturin Proteins 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 102100030991 Nucleolar and spindle-associated protein 1 Human genes 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 101710112083 Para-Rep C1 Proteins 0.000 description 1
- 241001483952 Peach chlorotic mottle virus Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102100035846 Pigment epithelium-derived factor Human genes 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- 102100034391 Porphobilinogen deaminase Human genes 0.000 description 1
- 206010036182 Porphyria acute Diseases 0.000 description 1
- 108010007131 Pulmonary Surfactant-Associated Protein B Proteins 0.000 description 1
- 108010007125 Pulmonary Surfactant-Associated Protein C Proteins 0.000 description 1
- 101710088575 Rab escort protein 1 Proteins 0.000 description 1
- 101710108890 Rab proteins geranylgeranyltransferase component A 1 Proteins 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 102100035174 SEC14-like protein 2 Human genes 0.000 description 1
- 101710188106 SEC14-like protein 2 Proteins 0.000 description 1
- 108010005173 SERPIN-B5 Proteins 0.000 description 1
- 108091006576 SLC34A2 Proteins 0.000 description 1
- 101100190847 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PMP3 gene Proteins 0.000 description 1
- 102100030333 Serpin B5 Human genes 0.000 description 1
- 206010073677 Severe myoclonic epilepsy of infancy Diseases 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108050003877 Sodium-dependent phosphate transport protein 2B Proteins 0.000 description 1
- 208000003954 Spinal Muscular Atrophies of Childhood Diseases 0.000 description 1
- 208000000102 Squamous Cell Carcinoma of Head and Neck Diseases 0.000 description 1
- 208000027073 Stargardt disease Diseases 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 102100021947 Survival motor neuron protein Human genes 0.000 description 1
- 108700024715 Survival of Motor Neuron 1 Proteins 0.000 description 1
- 102000047185 Survival of Motor Neuron 1 Human genes 0.000 description 1
- 108010002687 Survivin Proteins 0.000 description 1
- 241001648840 Thosea asigna virus Species 0.000 description 1
- 101710119887 Trans-acting factor B Proteins 0.000 description 1
- 102000004338 Transferrin Human genes 0.000 description 1
- 108090000901 Transferrin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 108010065158 Tumor Necrosis Factor Ligand Superfamily Member 14 Proteins 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 102000009520 Vascular Endothelial Growth Factor C Human genes 0.000 description 1
- 108010073923 Vascular Endothelial Growth Factor C Proteins 0.000 description 1
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 1
- 102100033179 Vascular endothelial growth factor receptor 3 Human genes 0.000 description 1
- 206010047741 Vulval cancer Diseases 0.000 description 1
- 208000026481 Werdnig-Hoffmann disease Diseases 0.000 description 1
- 201000001408 X-linked juvenile retinoschisis 1 Diseases 0.000 description 1
- 208000017441 X-linked retinoschisis Diseases 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 102100029570 Zinc finger protein SNAI2 Human genes 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 206010064930 age-related macular degeneration Diseases 0.000 description 1
- 208000030961 allergic reaction Diseases 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- 108010028144 alpha-Glucosidases Proteins 0.000 description 1
- 108010009380 alpha-N-acetyl-D-glucosaminidase Proteins 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 108010080146 androgen receptors Proteins 0.000 description 1
- 239000004037 angiogenesis inhibitor Substances 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000001772 anti-angiogenic effect Effects 0.000 description 1
- 210000000612 antigen-presenting cell Anatomy 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- CREXVNNSNOKDHW-UHFFFAOYSA-N azaniumylideneazanide Chemical group N[N] CREXVNNSNOKDHW-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229960000397 bevacizumab Drugs 0.000 description 1
- 201000000053 blastoma Diseases 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 108010006025 bovine growth hormone Proteins 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000021235 carbamoylation Effects 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 125000002843 carboxylic acid group Chemical group 0.000 description 1
- 108060001132 cathelicidin Proteins 0.000 description 1
- 102000014509 cathelicidin Human genes 0.000 description 1
- POIUWJQBRNEFGX-XAMSXPGMSA-N cathelicidin Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C)C1=CC=CC=C1 POIUWJQBRNEFGX-XAMSXPGMSA-N 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000007910 cell fusion Effects 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 208000003571 choroideremia Diseases 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 201000010989 colorectal carcinoma Diseases 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 239000002254 cytotoxic agent Substances 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 231100000599 cytotoxic agent Toxicity 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 201000008184 embryoma Diseases 0.000 description 1
- 239000003974 emollient agent Substances 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 208000030533 eye disease Diseases 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 229960000301 factor viii Drugs 0.000 description 1
- 201000011110 familial lipoprotein lipase deficiency Diseases 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 229940014144 folate Drugs 0.000 description 1
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 1
- 235000019152 folic acid Nutrition 0.000 description 1
- 239000011724 folic acid Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 231100000734 genotoxic potential Toxicity 0.000 description 1
- 201000004502 glycogen storage disease II Diseases 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 201000000459 head and neck squamous cell carcinoma Diseases 0.000 description 1
- 208000014951 hematologic disease Diseases 0.000 description 1
- 208000018706 hematopoietic system disease Diseases 0.000 description 1
- 208000009429 hemophilia B Diseases 0.000 description 1
- 231100000334 hepatotoxic Toxicity 0.000 description 1
- 230000003082 hepatotoxic effect Effects 0.000 description 1
- 231100000304 hepatotoxicity Toxicity 0.000 description 1
- 210000004458 heterochromatin Anatomy 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 230000006197 histone deacetylation Effects 0.000 description 1
- 102000044290 human GZMB Human genes 0.000 description 1
- 102000057308 human HGF Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 230000002519 immonomodulatory effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 229960003444 immunosuppressant agent Drugs 0.000 description 1
- 239000003018 immunosuppressive agent Substances 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000028709 inflammatory response Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 102000008371 intracellularly ATP-gated chloride channel activity proteins Human genes 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- 208000017476 juvenile neuronal ceroid lipofuscinosis Diseases 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000021633 leukocyte mediated immunity Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 230000003908 liver function Effects 0.000 description 1
- 230000007056 liver toxicity Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 201000005249 lung adenocarcinoma Diseases 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 208000002780 macular degeneration Diseases 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 208000021039 metastatic melanoma Diseases 0.000 description 1
- 108091061970 miR-26a stem-loop Proteins 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- OHDXDNUPVVYWOV-UHFFFAOYSA-N n-methyl-1-(2-naphthalen-1-ylsulfanylphenyl)methanamine Chemical compound CNCC1=CC=CC=C1SC1=CC=CC2=CC=CC=C12 OHDXDNUPVVYWOV-UHFFFAOYSA-N 0.000 description 1
- 201000011216 nasopharynx carcinoma Diseases 0.000 description 1
- 229940053128 nerve growth factor Drugs 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 201000007607 neuronal ceroid lipofuscinosis 3 Diseases 0.000 description 1
- 230000003472 neutralizing effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 201000002094 pancreatic adenocarcinoma Diseases 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 108090000102 pigment epithelium-derived factor Proteins 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 238000000751 protein extraction Methods 0.000 description 1
- 230000006337 proteolytic cleavage Effects 0.000 description 1
- 108700015048 receptor decoy activity proteins Proteins 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 201000007714 retinoschisis Diseases 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000011146 sterile filtration Methods 0.000 description 1
- 239000000021 stimulant Substances 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 206010067829 testicular microlithiasis Diseases 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 238000011200 topical administration Methods 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 239000012581 transferrin Substances 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 238000007492 two-way ANOVA Methods 0.000 description 1
- 208000032471 type 1 spinal muscular atrophy Diseases 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 201000004916 vulva carcinoma Diseases 0.000 description 1
- 208000013013 vulvar carcinoma Diseases 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16111—Cytomegalovirus, e.g. human herpesvirus 5
- C12N2710/16141—Use of virus, viral particle or viral elements as a vector
- C12N2710/16143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2710/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
- C12N2710/00011—Details
- C12N2710/16011—Herpesviridae
- C12N2710/16111—Cytomegalovirus, e.g. human herpesvirus 5
- C12N2710/16141—Use of virus, viral particle or viral elements as a vector
- C12N2710/16145—Special targeting system for viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/30—Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/15—Vector systems having a special element relevant for transcription chimeric enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/42—Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/46—Vector systems having a special element relevant for transcription elements influencing chromatin structure, e.g. scaffold/matrix attachment region, methylation free island
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/48—Vector systems having a special element relevant for transcription regulating transport or export of RNA, e.g. RRE, PRE, WPRE, CTE
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
본 개시내용은 발현 벡터, 박테리아 서열-무함유 벡터, 예컨대 미니스트링 DNA (msDNA), 및 벡터 생산 시스템을 사용하는 것을 포함하는, 박테리아 서열-무함유 벡터를 제조하는 방법을 제공한다. 본 개시내용은 또한 벡터를 포함하는 조성물, 및 벡터 및 조성물의 용도를 제공한다.
Description
서열 목록에 대한 참조
EFS-WEB을 통해 전자적으로 제출됨
전자적으로 제출된 서열 목록 (명칭: 4471_007PC03_Seqlisting_ST25.txt; 크기: 216,898 바이트; 및 생성 날짜: 2022년 6월 15일)의 내용은 그 전문이 본원에 참조로 포함된다.
개시내용의 분야
본 개시내용은 발현 벡터, 박테리아 서열-무함유 벡터, 박테리아 서열-무함유 벡터를 제조하기 위한 벡터 생산 시스템, 및 이의 용도를 제공한다.
유전자 요법은 상당한 치료 가능성을 가지고 있지만, 그 잠재성을 실현하는 데는 여전히 과제가 남아있다.
대부분의 임상 시험은 바이러스 전달 시스템, 예컨대 아데노바이러스 벡터, 렌티바이러스 벡터, 및 아데노-연관 바이러스 벡터를 활용해 왔다. 진전이 이루어졌지만, 바이러스 시스템은 형질도입 및 트랜스진 발현 효율이 다양하며, 바람직하지 않은 효과, 예컨대 염증 및 면역 반응 또는 삽입 돌연변이유발에 대한 우려가 여전히 남아있다. 더욱이, 바이러스 벡터의 생산, 정제 및 저장은 종종 비용이 많이 들고 가변성이 높으며 비효율적이다. 예를 들어, 문헌 [Lingelbach, D., Drug Development & Delivery 20(5): 50-54 (2020)]; [Wright, J.F., Gene Therapy 15:840-848 (2008)]을 참조한다.
비바이러스 벡터가 또한 유전자 요법 전달 시스템으로서 조사되어 왔다. 바이러스 대응물보다 안전하지만, 비바이러스 벡터의 유효성은 예를 들어 낮은 트랜스진 발현 수준 및 발현 내구성에 의해 제한될 수 있다. 예를 들어, 문헌 [Kay, M., Nature Reviews Genetics 12: 316-328 (2011)]을 참조한다.
본원에 기재된 것과 같은 개선된 벡터가 필요하다.
간단한 요약
본 개시내용은 하기를 포함하는 발현 벡터에 관한 것이다: (a) 백본 서열, (b) 하기를 포함하는 서열: (i) 관심 핵산 서열을 포함하는 발현 카세트, (ii) 발현 카세트의 5' 측면을 플랭킹하는 제1 레콤비나제에 대한 제1 표적 서열, (iii) 발현 카세트의 3' 측면을 플랭킹하는 제1 레콤비나제에 대한 제2 표적 서열, 및 (iv) 제1 레콤비나제에 대한 비-결합 영역 내 제1 및 제2 표적 서열 내에 통합된 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열, 및 (c) 하기 중 하나 이상: (i) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열, 여기서 엔도뉴클레아제 표적 서열은 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음, (ii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서, (iii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 사이토메갈로바이러스 (CMV) 인핸서, (iv) 인트론을 포함하는 5' 비번역 영역 (5'UTR), 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨, (v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터, (vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 우드척 간염 바이러스 전사후 조절 요소 (WPRE), (vii) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 스캐폴드/매트릭스 부착 영역 (S/MAR), 또는 (viii) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 DNA 핵 표적화 서열 (DTS), 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음.
일부 측면에서, 발현 벡터는 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열을 포함하고, 여기서 엔도뉴클레아제 표적 서열은 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제1 및 제2 표적 서열 내에 통합된다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 귀소 엔도뉴클레아제에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 I-SceI에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 PI-SceI에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 Cas 엔도뉴클레아제에 대한 것이다. 일부 측면에서, Cas 엔도뉴클레아제는 Cas9이다.
일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열의 다중 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 닭 β-액틴 프로모터의 5' 말단에 통합된다. 일부 측면에서, 서열식별번호: 47과 적어도 약 90% 동일한 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.
일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 CMV 인핸서를 포함한다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 프로모터는 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.
일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열과 관심 핵산 서열 사이에 통합된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함한다.
일부 측면에서, 발현 벡터는 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다. 일부 측면에서, 인트론은 서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 인트론 내에 통합된 비-코딩 서열을 추가로 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 1의 위치 25 내지 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된 비-코딩 서열을 포함한다. 일부 측면에서, 비-코딩 서열은 S/MAR이다. 일부 측면에서, S/MAR은 MAR-5이다. 일부 측면에서, 5'UTR은 서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 프로모터는 닭 β-액틴 프로모터이다. 일부 측면에서, 프로모터는 CMV 프로모터이다. 일부 측면에서, 프로모터는 CMV 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다.
일부 측면에서, 발현 벡터는 관심 핵산 서열의 3' 말단에 통합된 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.
일부 측면에서, 발현 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터를 포함한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 5'-HS4 닭-β-글로빈 인슐레이터 (cHS4)이다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.
일부 측면에서, 발현 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.
일부 측면에서, 발현 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR을 포함한다. 일부 측면에서, S/MAR은 MAR-5이다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.
일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 인핸서 서열을 포함한다. 일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열을 포함한다. 일부 측면에서, 인핸서 서열은 SV40 인핸서 서열이다.
일부 측면에서, 발현 벡터는 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 DTS를 포함하고, 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있다. 일부 측면에서, DTS는 SV40 인핸서 서열이다. 일부 측면에서, DTS는 세포-특이적이다.
일부 측면에서, 제1 및 제2 표적 서열 및 하나 이상의 추가 표적 서열은 PY54 pal 부위, N15 telRL 부위, loxP 부위, φK02 telRL 부위, FRT 부위, phiC31 attP 부위 및 λ attP 부위로 이루어진 군으로부터 선택된다. 일부 측면에서, 발현 벡터는 각각의 표적 서열을 포함한다. 일부 측면에서, 발현 벡터는 pal 부위 및 pal 부위 내에 통합된 telRL, loxP 및 FRT 레콤비나제 표적 결합 서열을 포함한다. 일부 측면에서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열은 각각 서열식별번호: 33의 핵산 서열을 포함한다.
일부 측면에서, 발현 벡터는 박테리아 서열-무함유 벡터를 생산하기 위한 것이다. 일부 측면에서, 박테리아 서열-무함유 벡터는 원형 공유 폐쇄형 벡터이다. 일부 측면에서, 박테리아 서열-무함유 벡터는 선형 공유 폐쇄형 벡터이다.
본 개시내용은 유도성 프로모터의 제어 하에 레콤비나제를 코딩하는 재조합 세포를 포함하는 벡터 생산 시스템에 관한 것이며, 여기서 재조합 세포는 임의의 상기 발현 벡터를 포함하고, 여기서 레콤비나제는 제1 레콤비나제에 대한 제1 및 제2 표적 서열 또는 발현 벡터 내 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열 중 하나를 표적화한다. 일부 측면에서, 레콤비나제는 TelN, Tel, Cre 또는 Flp이다.
일부 측면에서, 재조합 세포는 유도성 프로모터의 제어 하에 엔도뉴클레아제를 추가로 코딩하고, 여기서 엔도뉴클레아제는 엔도뉴클레아제 표적 서열을 포함하는 발현 벡터 내 엔도뉴클레아제 표적 서열을 표적화한다. 일부 측면에서, 엔도뉴클레아제는 귀소 엔도뉴클레아제이다. 일부 측면에서, 귀소 엔도뉴클레아제는 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I이다. 일부 측면에서, 엔도뉴클레아제는 I-SceI이다. 일부 측면에서, 엔도뉴클레아제는 PI-SceI이다. 일부 측면에서, 재조합 세포는 엔도뉴클레아제를 포함하는 뉴클레아제 게놈 편집 시스템을 코딩한다. 일부 측면에서, 뉴클레아제 게놈 편집 시스템은 가이드 RNA 및 Cas 엔도뉴클레아제를 포함하는 클러스터링된 규칙적 간격의 짧은 회문구조 반복부 (CRISPR) 뉴클레아제 시스템이다. 일부 측면에서, Cas 엔도뉴클레아제는 Cas9이다. 일부 측면에서, 유도성 프로모터는 열-조절성, 화학적-조절성, IPTG 조절성, 글루코스-조절성, 아라비노스 유도성, T7 폴리머라제 조절성, 저온-충격 유도성, pH 유도성, 또는 이들의 조합이다.
본 개시내용은 레콤비나제의 발현에 적합한 조건 하에 임의의 상기 벡터 생산 시스템을 인큐베이션하는 것을 포함하는, 박테리아 서열-무함유 벡터를 생산하는 방법에 관한 것이다. 일부 측면에서, 방법은 엔도뉴클레아제의 발현에 적합한 조건 하에 엔도뉴클레아제를 코딩하는 임의의 상기 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함한다. 일부 측면에서, 방법은 뉴클레아제 게놈 편집 시스템의 발현에 적합한 조건 하에 뉴클레아제 게놈 편집 시스템을 코딩하는 임의의 상기 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함한다. 일부 측면에서, 방법은 박테리아 서열-무함유 벡터를 수확하는 것을 추가로 포함한다.
본 개시내용은 박테리아 서열-무함유 벡터를 생산하는 임의의 상기 방법에 의해 생산된 박테리아 서열-무함유 벡터에 관한 것이다.
본 개시내용은 하기를 포함하는 박테리아 서열-무함유 벡터에 관한 것이다: (a) 관심 핵산 서열을 포함하는 발현 카세트, 및 (b) 하기 중 하나 이상: (i) 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서, (ii) 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서, (iii) 인트론을 포함하는 5'UTR, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨, (iv) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터, (v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE, (vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR, 또는 (vii) 발현 카세트에 대해 5'에 위치된 DTS.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열의 다중 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 닭 β-액틴 프로모터의 5' 말단에 통합된다. 일부 측면에서, 서열식별번호: 47과 적어도 약 90% 동일한 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서를 포함한다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 프로모터는 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.
일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산 서열에 대해 5'에 위치된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함한다.
일부 측면에서, 박테리아 서열-무함유 벡터는 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다. 일부 측면에서, 인트론은 서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 인트론 내에 통합된 비-코딩 서열을 추가로 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 1의 뉴클레오티드 위치 25 및 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된 비-코딩 서열을 추가로 포함한다. 일부 측면에서, 비-코딩 서열은 S/MAR이다. 일부 측면에서, S/MAR은 MAR-5이다. 일부 측면에서, 5'UTR은 서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함한다. 일부 측면에서, 프로모터는 닭 β-액틴 프로모터이다. 일부 측면에서, 프로모터는 CMV 프로모터이다. 일부 측면에서, 프로모터는 CMV 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다.
일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산 서열의 3' 말단에 통합된 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.
일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터를 포함한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 cHS4이다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.
일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함한다.
일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR을 포함한다. 일부 측면에서, S/MAR은 MAR-5이다.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트의 각 측면을 플랭킹하는 인핸서 서열을 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열을 포함한다. 일부 측면에서, 인핸서 서열은 SV40 인핸서 서열이다.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트에 대해 5'에 위치된 DTS를 포함한다. 일부 측면에서, DTS는 SV40 인핸서 서열이다. 일부 측면에서, DTS는 세포-특이적이다.
일부 측면에서, 박테리아 서열-무함유 벡터는 원형 공유 폐쇄형 벡터이다.
일부 측면에서, 박테리아 서열-무함유 벡터는 선형 공유 폐쇄형 벡터이다.
본 개시내용은 임의의 상기 발현 벡터 또는 임의의 상기 박테리아 서열-무함유 벡터를 포함하는 재조합 세포에 관한 것이다.
본 개시내용은 임의의 상기 발현 벡터 또는 임의의 상기 박테리아 서열-무함유 벡터를 포함하는 조성물에 관한 것이다. 일부 측면에서, 조성물은 전달제를 추가로 포함한다. 일부 측면에서, 전달제는 나노입자이다. 일부 측면에서, 전달제는 표적화 리간드를 포함한다. 일부 측면에서, 조성물은 제약상 허용되는 담체를 추가로 포함하는 제약 조성물이다.
본 개시내용은 임의의 상기 발현 벡터, 임의의 상기 박테리아 서열-무함유 벡터, 또는 상기 제약 조성물을 대상체에게 투여하는 것을 포함하는, 질환 또는 장애의 치료를 필요로 하는 대상체에서 질환 또는 장애를 치료하는 방법에 관한 것이다.
본 개시내용은 서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 2와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 13과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 14와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
일부 측면에서, 서열식별번호: 13-15 중 어느 하나와 적어도 약 90% 동일한 핵산 서열을 포함하는 임의의 상기 폴리뉴클레오티드는 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 추가로 포함한다.
본 개시내용은 서열식별번호: 16과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 17과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 18과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 35와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 36과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 37과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 38과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드에 관한 것이다.
본 개시내용은 임의의 상기 폴리뉴클레오티드를 포함하는 발현 벡터에 관한 것이다.
본 개시내용은 서열식별번호: 2, 3 또는 5 중 어느 하나와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드, 및 (i) 서열식별번호: 13-18 중 어느 하나와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드, 또는 (ii) 서열식별번호: 13-15 중 어느 하나와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드 및 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함하는 발현 벡터에 관한 것이다.
본 개시내용은 임의의 상기 발현 벡터, 임의의 박테리아 서열-무함유 벡터, 또는 임의의 상기 제약 조성물로부터의 관심 핵산 서열을 유전자 편집을 위한 표적 부위에 삽입하는 것을 포함하는 유전자 편집 방법에 관한 것이다. 일부 측면에서, 유전자 편집은 비-상동성 말단 연결에 의해 이루어진다. 일부 측면에서, 유전자 편집은 상동성-지정 복구에 의해 이루어진다.
도 1은 발현 벡터 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*의 벡터 맵을 보여준다.
도 2는 발현 벡터 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA의 벡터 맵을 보여준다.
도 3은 라이브 이미지화를 통해 HEK-293 세포 내 형광을 평가하는 현미경사진을 보여준다. (A)는 플라스미드 없이 리포펙타민에 노출된 음성 대조군 세포를 보여주고, (B)는 도 1의 발현 벡터로 형질감염된 세포를 보여주고, (C)는 도 2의 발현 벡터로 형질감염된 세포를 보여주고, (D)는 CAG 프로모터의 제어 하에 eGFP를 발현하는 부모 발현 벡터 pGL2-SS*-CAG-eGFP-BGpA-SS* (PP-CAG-GFP)로 형질감염된 양성 대조군 세포를 보여준다.
도 4는 도 3(A)-(D)에 따라 절개된 세포의 상대적 형광 강도의 막대 그래프를 보여준다. 도 4-5에서 "pGL2-SecNLuc-eGFP"는 도 1의 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* 발현 벡터로 형질감염된 세포를 나타낸다. 도 4-5에서 "pcDNA-SecNLuc-eGFP"는 도 2의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA 발현 벡터로 형질감염된 세포를 나타낸다.
도 5는 도 3(A)-(C)에 따라 형질감염된 세포의 배지 내 상대적 루시퍼라제 강도의 막대 그래프를 보여준다.
도 6은 발현 벡터 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 벡터 맵을 보여준다.
도 7은 발현 벡터 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 벡터 맵을 보여준다.
도 8은 발현 벡터 pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 벡터 맵을 보여준다.
도 9는 포유동물 발현 카세트가 결여된 puc57 플라스미드로 세포를 전기천공한 음성 대조군 (Neg. Ctl. (플라스미드 없음))과 비교하여 도 1 (pGL2-SecNLuc-eGFP), 도 6 (WPRE), 도 7 (5'UTR1+WPRE) 및 도 8 (5'UTR2+WPRE)의 발현 벡터로 세포를 전기천공한 후 2, 6, 10, 14, 17, 20, 27 및 34일차에 HEK-293 세포의 배지에서 상대적 루미노미터 단위 (상대적 빛 단위, RLU라고도 함)의 발광에 의해 표시된 바와 같은 장기간 루시퍼라제 활성의 선 그래프를 보여준다. * = p<0.05, ** = p<0.01, *** = p<0.001, 및 **** = p<0.0001.
도 10은 계대 번호 1, 2, 3 및 5에서 도 9에 기재된 바와 같이 형질감염된 및 음성 대조군 HEK-293 세포의 배지에서 RLU의 발광에 의해 표시된 바와 같은 루시퍼라제 활성의 막대 그래프를 보여준다.
도 11은 도 7의 발현 벡터 (2nd gen pDNA (CMV+U1+W)), 도 7의 발현 벡터로부터 생산된 msDNA (2nd gen msDNA (CMV+U1+W)), 또는 루시퍼라제 트랜스진 (통상적인 pcDNA)을 함유하는 도 2의 발현 벡터로 세포를 전기천공한 후 각각 8, 15, 24, 31, 38, 45 및 52일차에 상응하는 계대 번호 1, 2, 3, 4, 5, 6 및 7에서 HEK-293 세포 내 상대적 루시퍼라제 강도의 선 그래프를 보여준다. 통상적인 pcDNA 데이터세트와 비교하여 ** = p<0.01, *** = p<0.001, 및 **** = p<0.0001.
도 12는 도 9에 기재된 바와 같이 도 1 또는 도 7의 발현 벡터로 형질감염된 세포 내 형광을 보여준다. (A)는 계대 번호 1, 2, 3 및 5에서 라이브 이미지화를 통해 HEK-293 세포 내 형광을 평가하는 현미경사진을 보여준다. (B)는 각 계대 번호에서 3개의 라이브 형광 이미지로부터 관측 시야에서 관찰된 eGFP 양성 (GFP+) 세포의 선 그래프를 보여준다; 유의하지 않음 (ns) = p>0.05. (C)는 계대 번호 5에서 3개의 라이브 형광 이미지로부터 측정된 GFP+ 세포에 대한 평균 형광 강도 (MFI)를 도시하는 도트 플롯을 보여준다. 각 구축물에 대한 기본 막대 그래프는 모든 측정된 GFP+ 세포로부터의 평균 MFI 값을 보여준다. **** = p<0.0001.
도 13은 50 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, PSNLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (pCAGLuc), 또는 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (pGSNLuc-WPRE)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 14는 50 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, PSNLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (pCAGLuc), 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (pCAGLucWPRE)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 15는 5 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, pDNA CMV-U (SSeq 없음)), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (SSeq pDNA CAG), 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (SSeq pDNA CAG-W)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 16은 5 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, No-SSeq pDNA CMV-U), pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (2XSSeq pDNA CAG-W), 또는 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (2XSSeq msDNA CAG-W)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 17A-D는 벡터 주사 없는 음성 대조군 마우스 뿐만 아니라 도 16에 기재된 벡터 5 μg의 단일 유체역학적 꼬리 정맥 주사 후 56일차에 야생형 마우스로부터의 간에서 ELISA에 의해 결정된 바와 같은 GFP 발현의 막대 그래프를 보여준다. (A)는 GFP 농도 (μg/mL)를 보여준다. (B)는 총 단백질 μg로 정규화된 GFP μg을 보여준다. (C)는 총 조직 g으로 정규화된 GFP μg을 보여준다. (D)는 대조군에 비해 GFP의 발현 수준을 보여준다. *P<0.05, ** P<0.01, ***P<0.001, ****P<0.0001.
도 18은 벡터 주사 없는 음성 대조군 마우스 뿐만 아니라 도 16에 기재된 바와 같은 벡터 5 μg의 단일 유체역학적 꼬리 정맥 주사 후 56일차에 야생형 마우스로부터의 간에서 세포질성 GFP 단백질 농도 (pg/mL)의 막대 그래프를 보여준다.
도 19는 각 주사에 대해 왼쪽에서 오른쪽으로 막대 그래프에 의해 표시된 바와 같이 1, 3, 10, 30, 58, 92, 119 및 174일차에 지질 나노입자 (LNP) 담체 (비히클(대조군)) 또는 LNP 및 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-2G msDNA-CAG-SecretedNanoLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-2G ppDNA-CAG-SecretedNanoLuc), msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-2G msDNA-CMV-SecretedNanoLuc), pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-2G ppDNA-CMV-SecretedNanoLuc), 또는 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (LNP-Conv.pDNA-CMV-SecretedNanoLuc)의 리포플렉스를 사용하여 마우스에서 단일 정맥내 꼬리 정맥 주사 후 생체내 전신 생물발광 이미지화로부터 총 플럭스 (광자/초)의 막대 그래프를 보여준다. LNP-2G msDNA-CAG-SecretedNanoLuc 주사에 대한 막대 그래프는 해시선으로 묶여 있다.
도 20은 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 마우스로부터의 피질, 시상, 뇌간 및 소뇌로부터의 시상면 뇌 섹션에서 녹색 형광 단백질 (GFP) 발현의 현미경사진을 보여준다. 백색 화살표는 트랜스진 발현을 나타낸다. 핵은 디아미디노-2-페닐인돌 (DAPI)을 사용한 염색에 의해 표시된다.
도 21-22는 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 마우스로부터의 피질 및 시상 (도 21) 및 소뇌 및 뇌간 (도 22)으로부터의 시상면 뇌 섹션 내 GFP 발현의 현미경사진을 보여준다. 뉴런은 뉴런 마커 NeuN으로 표시된다.
도 23-24는 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 마우스로부터의 피질 및 시상 (도 23) 및 소뇌 및 뇌간 (도 24)으로부터의 시상면 뇌 섹션 내 GFP 발현의 현미경사진을 보여준다. 뉴런은 뉴런 마커 NeuN으로 표시된다.
도 25-26은 지질 나노입자 담체 (LNP) 및 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, LNP-Conv.pDNA-CMV-SecretedNLuc), pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-ppDNA-CMV-SecretedNLuc), msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-msDNA-CMV-SecretedNLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-ppDNA-CAG-SecretedNLuc), 또는 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-msDNA-CAG-SecretedNLuc)의 리포플렉스를 사용한 형질감염 후 3 및 5일에 인간 T 세포 (Pan-T(TA+) 세포, 도 25) 또는 간세포 (Huh7 세포, 도 26), PBS 대조군 또는 미처리 세포 내 루시퍼라제 발현과 연관된 발광의 막대 그래프를 보여준다.
도 27A-C, 도 28A-C 및 도 29A-B는 CRISPR 유전자 편집 시스템 및 통상적인 플라스미드 또는 5' 및 3' 상동성 아암에 의해 플랭킹된 GOI (HDR-GOI-HDR)를 운반하는 msDNA의 형질감염 후 3일 (도 27A-C), 7일 (도 28A-C) 및 15일 (도 29A-B)에 관심 유전자 (GOI)에 대한 녹인 (KI) 효율 (Q3)의 형광 활성화 세포 분류 (FACS) 산점도를 보여준다. 도 27 및 28의 (A)는 GOI의 임의의 HDR KI가 없는 대조군, 야생형 (WT) 유도 만능 줄기 세포 (iPSC)에 대한 FACS 산점도를 보여준다. 도 27-28의 (A) 및 도 29의 (B)는 통상적인 플라스미드 (플라스미드 DNA HDR-GOI-HDR)를 사용하여 GOI의 HDR KI에 따른 iPSC의 FACS 산점도를 보여준다. 도 27-28의 (C) 및 도 29의 (B)는 msDNA (msDNA HDR-GOI-HDR)를 사용하여 GOI의 HDR KI에 따른 iPSC의 FACS 산점도를 보여준다.
도 30은 발현 벡터 SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 31은 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 32는 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 33은 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 34는 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 35는 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 36은 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 37은 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 38은 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 39는 도 2 (통상적인 pDNA CMV-U), 도 30 (A: CMV-U1-3'UTR), 도 31 (B: E1-CMV-U1-3'UTR) 및 도 32 (C: E1-CMV-U1-WPRE-3'UTR)의 발현 벡터로 세포를 전기천공한 후 2, 3, 7, 10, 14, 21 및 28일차에 HEK-293 세포의 배지에서 RLU의 발광에 의해 표시된 바와 같은 루시퍼라제 활성의 선 그래프를 보여준다. * = p<0.05 및 ** = p<0.01.
도 40은 도 39에 기재된 발현 벡터로 0일차에 세포를 전기천공한 후 7일마다 계대 후 계대 번호 1, 2, 3, 4 및 5에서 HEK-293 세포 내 상대적 루시퍼라제 강도의 선 그래프를 보여준다. * = p<0.05 및 ** = p<0.01.
도 41은 발현 벡터 pGL2-CAG-SecNLuc-2A-eGFP-WPRE-b글로빈 폴리A의 벡터 맵을 보여준다.
도 42는 발현 벡터 4-1 pGL2-SS*-CAG [CMV 인핸서+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 43은 발현 벡터 4-2 pGL2-SS*-CAG [E1 X3+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 44는 발현 벡터 4-3 pGL2-SS*-CAG [E2(U100)+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 45는 발현 벡터 4-4 pGL2-SS*-CAG [E1 X3+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 46은 발현 벡터 4-5-pGL2-SS*-CAG [E2 (U100)+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR (108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 47은 발현 벡터 4-6-pGL2-SS*-CMV 인핸서-EF1-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 48은 도 41 (통상적인 SSeq pDNA CAG-W 없음) 및 도 42-47 (각각 4-1 내지 4-6)에 표시된 발현 벡터로 형질감염시킨 후 3 및 6일에 HEK-293 세포의 배지에서 RLU의 발광에 의해 표시된 바와 같은 루시퍼라제 활성의 막대 그래프를 보여준다.
도 49는 플랭킹 슈퍼 서열 (SSeq), 합성 인핸서 (E1), CMV 프로모터 (PCMV), tRNA-gRNA-PAM 삽입을 갖는 최적화된 내부 인트론을 함유하는 합성 5'UTR (UTR-tRNA-gRNA-PAM-1), Casβ2 유전자, 및 인간 베타-글로빈 폴리아데닐화 신호 및 gRNA-PAM 삽입을 함유하는 3'UTR (HBg3'UTR-gRNA-PAM)을 함유하는 자기-제한 CRISPR 유전자 편집 시스템에 대한 예시적인 서열의 다이어그램을 보여준다.
도 50은 상동성 아암에 의해 플랭킹된 치료용 GOI를 갖는 염색체 DNA의 상동성-지정 복구 (HDR) 동안 도 52의 서열로부터의 자기-제한 Cas 발현의 다이어그램을 보여준다.
도 51은 자기-제한 CRISPR 유전자 편집 시스템을 사용한 2개의 유전자-편집 시나리오에 대한 다이어그램을 보여준다. 시나리오 1에서, 인간 발현 카세트 (예를 들어, 치료용 GOI)를 함유하는 msDNA는 일시적 발현을 위해 먼저 형질감염된 후, HDR 녹인을 위해 도 42의 유전자 편집 시스템이 뒤따른다. 시나리오 2에서, HDR 녹인은 자기-제한 CRISPR 유전자 편집 시스템 및 상동성 아암에 의해 플랭킹된 인간 발현 카세트를 모두 함유하는 단일 msDNA에 의해 매개된다.
도 2는 발현 벡터 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA의 벡터 맵을 보여준다.
도 3은 라이브 이미지화를 통해 HEK-293 세포 내 형광을 평가하는 현미경사진을 보여준다. (A)는 플라스미드 없이 리포펙타민에 노출된 음성 대조군 세포를 보여주고, (B)는 도 1의 발현 벡터로 형질감염된 세포를 보여주고, (C)는 도 2의 발현 벡터로 형질감염된 세포를 보여주고, (D)는 CAG 프로모터의 제어 하에 eGFP를 발현하는 부모 발현 벡터 pGL2-SS*-CAG-eGFP-BGpA-SS* (PP-CAG-GFP)로 형질감염된 양성 대조군 세포를 보여준다.
도 4는 도 3(A)-(D)에 따라 절개된 세포의 상대적 형광 강도의 막대 그래프를 보여준다. 도 4-5에서 "pGL2-SecNLuc-eGFP"는 도 1의 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* 발현 벡터로 형질감염된 세포를 나타낸다. 도 4-5에서 "pcDNA-SecNLuc-eGFP"는 도 2의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA 발현 벡터로 형질감염된 세포를 나타낸다.
도 5는 도 3(A)-(C)에 따라 형질감염된 세포의 배지 내 상대적 루시퍼라제 강도의 막대 그래프를 보여준다.
도 6은 발현 벡터 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 벡터 맵을 보여준다.
도 7은 발현 벡터 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 벡터 맵을 보여준다.
도 8은 발현 벡터 pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 벡터 맵을 보여준다.
도 9는 포유동물 발현 카세트가 결여된 puc57 플라스미드로 세포를 전기천공한 음성 대조군 (Neg. Ctl. (플라스미드 없음))과 비교하여 도 1 (pGL2-SecNLuc-eGFP), 도 6 (WPRE), 도 7 (5'UTR1+WPRE) 및 도 8 (5'UTR2+WPRE)의 발현 벡터로 세포를 전기천공한 후 2, 6, 10, 14, 17, 20, 27 및 34일차에 HEK-293 세포의 배지에서 상대적 루미노미터 단위 (상대적 빛 단위, RLU라고도 함)의 발광에 의해 표시된 바와 같은 장기간 루시퍼라제 활성의 선 그래프를 보여준다. * = p<0.05, ** = p<0.01, *** = p<0.001, 및 **** = p<0.0001.
도 10은 계대 번호 1, 2, 3 및 5에서 도 9에 기재된 바와 같이 형질감염된 및 음성 대조군 HEK-293 세포의 배지에서 RLU의 발광에 의해 표시된 바와 같은 루시퍼라제 활성의 막대 그래프를 보여준다.
도 11은 도 7의 발현 벡터 (2nd gen pDNA (CMV+U1+W)), 도 7의 발현 벡터로부터 생산된 msDNA (2nd gen msDNA (CMV+U1+W)), 또는 루시퍼라제 트랜스진 (통상적인 pcDNA)을 함유하는 도 2의 발현 벡터로 세포를 전기천공한 후 각각 8, 15, 24, 31, 38, 45 및 52일차에 상응하는 계대 번호 1, 2, 3, 4, 5, 6 및 7에서 HEK-293 세포 내 상대적 루시퍼라제 강도의 선 그래프를 보여준다. 통상적인 pcDNA 데이터세트와 비교하여 ** = p<0.01, *** = p<0.001, 및 **** = p<0.0001.
도 12는 도 9에 기재된 바와 같이 도 1 또는 도 7의 발현 벡터로 형질감염된 세포 내 형광을 보여준다. (A)는 계대 번호 1, 2, 3 및 5에서 라이브 이미지화를 통해 HEK-293 세포 내 형광을 평가하는 현미경사진을 보여준다. (B)는 각 계대 번호에서 3개의 라이브 형광 이미지로부터 관측 시야에서 관찰된 eGFP 양성 (GFP+) 세포의 선 그래프를 보여준다; 유의하지 않음 (ns) = p>0.05. (C)는 계대 번호 5에서 3개의 라이브 형광 이미지로부터 측정된 GFP+ 세포에 대한 평균 형광 강도 (MFI)를 도시하는 도트 플롯을 보여준다. 각 구축물에 대한 기본 막대 그래프는 모든 측정된 GFP+ 세포로부터의 평균 MFI 값을 보여준다. **** = p<0.0001.
도 13은 50 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, PSNLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (pCAGLuc), 또는 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (pGSNLuc-WPRE)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 14는 50 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, PSNLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (pCAGLuc), 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (pCAGLucWPRE)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 15는 5 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, pDNA CMV-U (SSeq 없음)), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (SSeq pDNA CAG), 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (SSeq pDNA CAG-W)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 16은 5 μg의 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, No-SSeq pDNA CMV-U), pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (2XSSeq pDNA CAG-W), 또는 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (2XSSeq msDNA CAG-W)의 단일 유체역학적 꼬리 정맥 주사 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 야생형 마우스로부터 수집된 혈장 내 RLU/mg 단백질의 선 그래프를 보여준다.
도 17A-D는 벡터 주사 없는 음성 대조군 마우스 뿐만 아니라 도 16에 기재된 벡터 5 μg의 단일 유체역학적 꼬리 정맥 주사 후 56일차에 야생형 마우스로부터의 간에서 ELISA에 의해 결정된 바와 같은 GFP 발현의 막대 그래프를 보여준다. (A)는 GFP 농도 (μg/mL)를 보여준다. (B)는 총 단백질 μg로 정규화된 GFP μg을 보여준다. (C)는 총 조직 g으로 정규화된 GFP μg을 보여준다. (D)는 대조군에 비해 GFP의 발현 수준을 보여준다. *P<0.05, ** P<0.01, ***P<0.001, ****P<0.0001.
도 18은 벡터 주사 없는 음성 대조군 마우스 뿐만 아니라 도 16에 기재된 바와 같은 벡터 5 μg의 단일 유체역학적 꼬리 정맥 주사 후 56일차에 야생형 마우스로부터의 간에서 세포질성 GFP 단백질 농도 (pg/mL)의 막대 그래프를 보여준다.
도 19는 각 주사에 대해 왼쪽에서 오른쪽으로 막대 그래프에 의해 표시된 바와 같이 1, 3, 10, 30, 58, 92, 119 및 174일차에 지질 나노입자 (LNP) 담체 (비히클(대조군)) 또는 LNP 및 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-2G msDNA-CAG-SecretedNanoLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-2G ppDNA-CAG-SecretedNanoLuc), msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-2G msDNA-CMV-SecretedNanoLuc), pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-2G ppDNA-CMV-SecretedNanoLuc), 또는 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (LNP-Conv.pDNA-CMV-SecretedNanoLuc)의 리포플렉스를 사용하여 마우스에서 단일 정맥내 꼬리 정맥 주사 후 생체내 전신 생물발광 이미지화로부터 총 플럭스 (광자/초)의 막대 그래프를 보여준다. LNP-2G msDNA-CAG-SecretedNanoLuc 주사에 대한 막대 그래프는 해시선으로 묶여 있다.
도 20은 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 마우스로부터의 피질, 시상, 뇌간 및 소뇌로부터의 시상면 뇌 섹션에서 녹색 형광 단백질 (GFP) 발현의 현미경사진을 보여준다. 백색 화살표는 트랜스진 발현을 나타낸다. 핵은 디아미디노-2-페닐인돌 (DAPI)을 사용한 염색에 의해 표시된다.
도 21-22는 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 마우스로부터의 피질 및 시상 (도 21) 및 소뇌 및 뇌간 (도 22)으로부터의 시상면 뇌 섹션 내 GFP 발현의 현미경사진을 보여준다. 뉴런은 뉴런 마커 NeuN으로 표시된다.
도 23-24는 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 마우스로부터의 피질 및 시상 (도 23) 및 소뇌 및 뇌간 (도 24)으로부터의 시상면 뇌 섹션 내 GFP 발현의 현미경사진을 보여준다. 뉴런은 뉴런 마커 NeuN으로 표시된다.
도 25-26은 지질 나노입자 담체 (LNP) 및 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, LNP-Conv.pDNA-CMV-SecretedNLuc), pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-ppDNA-CMV-SecretedNLuc), msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-msDNA-CMV-SecretedNLuc), pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (LNP-ppDNA-CAG-SecretedNLuc), 또는 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (LNP-msDNA-CAG-SecretedNLuc)의 리포플렉스를 사용한 형질감염 후 3 및 5일에 인간 T 세포 (Pan-T(TA+) 세포, 도 25) 또는 간세포 (Huh7 세포, 도 26), PBS 대조군 또는 미처리 세포 내 루시퍼라제 발현과 연관된 발광의 막대 그래프를 보여준다.
도 27A-C, 도 28A-C 및 도 29A-B는 CRISPR 유전자 편집 시스템 및 통상적인 플라스미드 또는 5' 및 3' 상동성 아암에 의해 플랭킹된 GOI (HDR-GOI-HDR)를 운반하는 msDNA의 형질감염 후 3일 (도 27A-C), 7일 (도 28A-C) 및 15일 (도 29A-B)에 관심 유전자 (GOI)에 대한 녹인 (KI) 효율 (Q3)의 형광 활성화 세포 분류 (FACS) 산점도를 보여준다. 도 27 및 28의 (A)는 GOI의 임의의 HDR KI가 없는 대조군, 야생형 (WT) 유도 만능 줄기 세포 (iPSC)에 대한 FACS 산점도를 보여준다. 도 27-28의 (A) 및 도 29의 (B)는 통상적인 플라스미드 (플라스미드 DNA HDR-GOI-HDR)를 사용하여 GOI의 HDR KI에 따른 iPSC의 FACS 산점도를 보여준다. 도 27-28의 (C) 및 도 29의 (B)는 msDNA (msDNA HDR-GOI-HDR)를 사용하여 GOI의 HDR KI에 따른 iPSC의 FACS 산점도를 보여준다.
도 30은 발현 벡터 SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 31은 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 32는 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 33은 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 34는 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 35는 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 36은 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 37은 발현 벡터 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 38은 발현 벡터 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-WPRE-3'UTR[2hBGpA-A120]-SS*의 벡터 맵을 보여준다.
도 39는 도 2 (통상적인 pDNA CMV-U), 도 30 (A: CMV-U1-3'UTR), 도 31 (B: E1-CMV-U1-3'UTR) 및 도 32 (C: E1-CMV-U1-WPRE-3'UTR)의 발현 벡터로 세포를 전기천공한 후 2, 3, 7, 10, 14, 21 및 28일차에 HEK-293 세포의 배지에서 RLU의 발광에 의해 표시된 바와 같은 루시퍼라제 활성의 선 그래프를 보여준다. * = p<0.05 및 ** = p<0.01.
도 40은 도 39에 기재된 발현 벡터로 0일차에 세포를 전기천공한 후 7일마다 계대 후 계대 번호 1, 2, 3, 4 및 5에서 HEK-293 세포 내 상대적 루시퍼라제 강도의 선 그래프를 보여준다. * = p<0.05 및 ** = p<0.01.
도 41은 발현 벡터 pGL2-CAG-SecNLuc-2A-eGFP-WPRE-b글로빈 폴리A의 벡터 맵을 보여준다.
도 42는 발현 벡터 4-1 pGL2-SS*-CAG [CMV 인핸서+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 43은 발현 벡터 4-2 pGL2-SS*-CAG [E1 X3+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 44는 발현 벡터 4-3 pGL2-SS*-CAG [E2(U100)+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 45는 발현 벡터 4-4 pGL2-SS*-CAG [E1 X3+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 46은 발현 벡터 4-5-pGL2-SS*-CAG [E2 (U100)+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR (108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 47은 발현 벡터 4-6-pGL2-SS*-CMV 인핸서-EF1-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*의 벡터 맵을 보여준다.
도 48은 도 41 (통상적인 SSeq pDNA CAG-W 없음) 및 도 42-47 (각각 4-1 내지 4-6)에 표시된 발현 벡터로 형질감염시킨 후 3 및 6일에 HEK-293 세포의 배지에서 RLU의 발광에 의해 표시된 바와 같은 루시퍼라제 활성의 막대 그래프를 보여준다.
도 49는 플랭킹 슈퍼 서열 (SSeq), 합성 인핸서 (E1), CMV 프로모터 (PCMV), tRNA-gRNA-PAM 삽입을 갖는 최적화된 내부 인트론을 함유하는 합성 5'UTR (UTR-tRNA-gRNA-PAM-1), Casβ2 유전자, 및 인간 베타-글로빈 폴리아데닐화 신호 및 gRNA-PAM 삽입을 함유하는 3'UTR (HBg3'UTR-gRNA-PAM)을 함유하는 자기-제한 CRISPR 유전자 편집 시스템에 대한 예시적인 서열의 다이어그램을 보여준다.
도 50은 상동성 아암에 의해 플랭킹된 치료용 GOI를 갖는 염색체 DNA의 상동성-지정 복구 (HDR) 동안 도 52의 서열로부터의 자기-제한 Cas 발현의 다이어그램을 보여준다.
도 51은 자기-제한 CRISPR 유전자 편집 시스템을 사용한 2개의 유전자-편집 시나리오에 대한 다이어그램을 보여준다. 시나리오 1에서, 인간 발현 카세트 (예를 들어, 치료용 GOI)를 함유하는 msDNA는 일시적 발현을 위해 먼저 형질감염된 후, HDR 녹인을 위해 도 42의 유전자 편집 시스템이 뒤따른다. 시나리오 2에서, HDR 녹인은 자기-제한 CRISPR 유전자 편집 시스템 및 상동성 아암에 의해 플랭킹된 인간 발현 카세트를 모두 함유하는 단일 msDNA에 의해 매개된다.
상세한 설명
본 개시내용은 발현 벡터, 박테리아 서열-무함유 벡터 (예를 들어, 미니스트링 DNA (msDNA)), 벡터 생산 시스템, 박테리아 서열-무함유 벡터를 제조하는 방법, 조성물, 및 이의 용도를 제공한다.
본원에 인용된 모든 저널 기사, 도서, 매뉴얼, 특허 출원 및 특허를 제한 없이 포함하여 본원에 인용된 모든 간행물은 각각의 개별 간행물이 참조로 포함되도록 구체적이고 개별적으로 표시된 것과 동일한 정도로 그 전문이 본원에 참조로 포함된다.
I. 용어
본 개시내용을 보다 쉽게 이해할 수 있도록, 먼저 특정 용어를 정의한다. 본 출원에서 사용된 바와 같이, 본원에 달리 명시적으로 제공된 경우를 제외하고, 하기 용어는 각각 아래에 제시된 의미를 가질 수 있다. 추가적인 정의는 출원 전반에 걸쳐 제시된다.
용어 "a" 또는 "an" 실체는 해당 실체 중 하나 이상을 지칭한다는 점에 유의해야 하며; 예를 들어 "뉴클레오티드 서열"은 하나 이상의 뉴클레오티드 서열을 나타내는 것으로 이해된다. 이와 같이, 용어 "a" (또는 "an"), "하나 이상" 및 "적어도 하나"는 본원에서 상호교환적으로 사용될 수 있다.
본원에서 사용된 용어 "및/또는"은 서로의 유무에 관계없이 명시된 특색 또는 구성성분 각각의 특정 개시내용으로서 받아들여져야 한다. 그러므로, "A 및/또는 B"와 같은 문구에서 사용된 바와 같은 용어 "및/또는"은 "A 및 B", "A 또는 B", "A" (단독) 및 "B" (단독)를 포함하도록 의도된다. 마찬가지로, "A, B 및/또는 C"와 같은 문구에서 사용된 바와 같은 용어 "및/또는"은 하기 측면 각각을 포함하도록 의도된다: A, B 및 C; A, B 또는 C; A 또는 C; A 또는 B; B 또는 C; A 및 C; A 및 B; B 및 C; A (단독); B (단독); 및 C (단독).
본원에서 측면이 표현 "포함하는"으로 기재된 경우에는 "로 이루어진" 및/또는 "로 본질적으로 이루어진"의 용어로 기재된 달리 유사한 측면도 제공되는 것으로 이해되어야 한다.
용어 "약" 또는 "로 본질적으로 구성된"은 관련 기술분야의 통상의 기술자에 의해 결정된 바와 같이 특정 값 또는 조성에 대해 허용가능한 오차 범위 내에 있는 값 또는 조성을 지칭하며, 이는 부분적으로 값 또는 조성이 측정되거나 결정되는 방법, 즉 측정 시스템의 한계에 따라 달라질 것이다. 예를 들어, "약" 또는 "로 본질적으로 구성된"은 관련 기술분야의 실시에 따라 1 또는 1 초과의 표준 편차 이내를 의미할 수 있다. 대안적으로, "약" 또는 "로 본질적으로 구성된"은 최대 10% (즉, ±10%) 범위를 의미할 수 있다. 더욱이, 특히 생물학적 시스템 또는 프로세스와 관련하여, 이 용어는 값의 최대 10배 또는 최대 5배를 의미할 수 있다. 달리 언급되지 않는 한, 특정 값 또는 조성이 출원 및 청구범위에 제공되는 경우, "약" 또는 "로 본질적으로 구성된"의 의미는 해당 특정 값 또는 조성에 대해 허용가능한 오차 범위 내에 있는 것으로 가정되어야 한다.
본원에 기재된 바와 같이, 임의의 농도 범위, 백분율 범위, 비율 범위 또는 정수 범위는 달리 명시되지 않는 한 인용된 범위 내의 임의의 정수 값 및 적절한 경우 그 분수 (예컨대 정수의 10분의 1 및 100분의 1)를 포함하는 것으로 이해되어야 한다. 숫자 범위는 범위를 정의하는 숫자를 포함한다.
달리 정의되지 않는 한, 본원에서 사용된 모든 기술 및 과학 용어는 본 개시내용과 관련된 기술분야의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 예를 들어, 문헌 [the Concise Dictionary of Biomedicine and Molecular Biology, Juo, Pei-Show, 2nd ed., 2002, CRC Press]; [The Dictionary of Cell and Molecular Biology, 5th ed., 2013, Academic Press]; 및 [the Oxford Dictionary Of Biochemistry And Molecular Biology, 2006, Oxford University Press]은 본 개시내용에서 사용된 많은 용어의 일반 사전을 통상의 기술자에게 제공한다.
단위, 접두사 및 기호는 국제단위계 (SI) 승인 형태로 표시된다.
달리 명시되지 않는 한, 뉴클레오티드 서열은 5'에서 3' 방향으로 왼쪽에서 오른쪽으로 기록된다. 아미노산 서열은 아미노에서 카르복시 방향으로 왼쪽에서 오른쪽으로 기록된다.
본원에 제공된 표제는 전체로서 명세서를 참조하여 가질 수 있는 본 개시내용의 다양한 측면의 제한이 아니다. 따라서, 바로 아래에 정의된 용어들은 본 명세서 전체를 참조하여 보다 완전하게 정의된다.
"아미노산"은 중심 탄소 원자 (알파-탄소 원자)가 수소 원자, 카르복실산 기 (이의 탄소 원자는 본원에서 "카르복실 탄소 원자"로 지칭됨), 아미노 기 (이의 질소 원자는 본원에서 "아미노 질소 원자"로 지칭됨), 및 측쇄 기 R에 연결된 구조를 갖는 분자이다. 펩티드, 폴리펩티드 또는 단백질에 혼입되면, 아미노산은 하나의 아미노산을 또 다른 아미노산에 연결하는 탈수 반응에서 아미노산 카르복실 기의 하나 이상의 원자를 잃는다. 결과적으로, 단백질에 혼입되면, 아미노산은 "아미노산 잔기"로 지칭된다.
"단백질" 또는 "폴리펩티드"는 펩티드 결합을 통해 연결된 2개 이상의 개별 아미노산 (자연 발생 여부에 관계없이)의 임의의 중합체를 지칭하며, 하나의 아미노산 (또는 아미노산 잔기)의 알파-탄소에 결합된 카르복실산 기의 카르복실 탄소 원자가 인접한 아미노산의 비-알파-탄소에 결합된 아미노 기의 아미노 질소 원자에 공유결합적으로 결합될 때 발생한다. 용어 "단백질" 및 "폴리펩티드"는 본원에서 상호교환적으로 사용될 수 있다. 유사하게, 단백질 및 폴리펩티드의 단편은 또한 본 개시내용의 범위 내에 속하며, 본원에서 "단백질" 또는 "폴리펩티드"로 지칭될 수 있다. 본 개시내용의 한 측면에서, 폴리펩티드는 2개 이상의 부모 펩티드 세그먼트 또는 단백질의 키메라를 포함한다. 용어 "폴리펩티드"는 또한 제한 없이 디술피드 결합 형성, 글리코실화, 카르바밀화, 지질화, 아세틸화, 인산화, 아미드화, 공지된 보호기/차단기에 의한 유도체화, 단백질분해 절단, 비-자연 발생 아미노산에 의한 변형, 또는 임의의 다른 조작 또는 변형, 예컨대 라벨링 구성성분과의 접합을 포함하는 폴리펩티드의 번역후 변형 ("PTM")의 생성물을 지칭하고 포함하도록 의도된다. 폴리펩티드는 천연 생물학적 공급원으로부터 유래되거나 재조합 기술에 의해 생산될 수 있지만, 반드시 지정된 핵산 서열로부터 번역될 필요는 없다. 이는 화학적 합성을 포함하여 어떤 방식으로든 생성될 수 있다. "단리된" 폴리펩티드 또는 이의 단편, 변이체 또는 유도체는 자연 환경에 존재하지 않는 폴리펩티드를 지칭한다. 특정 수준의 정제가 필요하지 않는다. 예를 들어, 단리된 폴리펩티드는 천연 또는 자연 환경으로부터 간단히 제거될 수 있다. 숙주 세포에서 발현된 재조합적으로 생산된 폴리펩티드 및 단백질은 임의의 적합한 기술에 의해 분리되거나 분획화되거나 부분적으로 또는 실질적으로 정제된 천연 또는 재조합 폴리펩티드와 마찬가지로 본 개시내용의 목적을 위해 단리된 것으로 간주된다.
본원에 개시된 바와 같은 2개 이상의 단백질을 포함하는 재조합 폴리펩티드 (즉, 재조합 단백질)는 각 단백질을 코딩하는 폴리뉴클레오티드 서열을 포함하는 단일 코딩 서열에 의해 코딩될 수 있다. 달리 언급되지 않는 한, 각 단백질을 코딩하는 폴리뉴클레오티드 서열은 폴리뉴클레오티드 서열을 포함하는 단일 mRNA의 번역이 각 단백질을 포함하는 단일 폴리펩티드를 초래하도록 "프레임 내"에 있다. 전형적으로, 본원에 기재된 바와 같은 재조합 폴리펩티드 내의 단백질은 서로 직접 융합되거나 펩티드 링커에 의해 분리될 것이다. 펩티드 링커를 코딩하는 다양한 폴리뉴클레오티드 서열은 관련 기술분야에 공지되어 있으며, 예를 들어 자기-절단 펩티드를 포함한다.
본원에서 사용된 바와 같은 "폴리뉴클레오티드" 또는 "핵산"은 뉴클레오티드의 중합체 형태를 지칭한다. 일부 예에서, 폴리뉴클레오티드는 코딩 서열과 바로 옆에 인접하지 않거나 그로부터 유래된 유기체의 자연 발생 게놈 내 코딩 서열과 바로 옆에 인접한 (5' 말단 또는 3' 말단에서) 서열을 포함한다. 따라서 이 용어는 예를 들어 벡터, 자율 복제 플라스미드 또는 바이러스, 또는 원핵생물 또는 진핵생물의 게놈 DNA에 혼입되거나, 또는 다른 서열과 독립적으로 별도의 분자 (예를 들어, cDNA)로 존재하는 재조합 DNA를 포함한다. 본 개시내용의 뉴클레오티드는 리보뉴클레오티드, 데옥시리보뉴클레오티드, 또는 어느 하나의 뉴클레오티드의 변형된 형태일 수 있다. 본원에서 사용된 바와 같은 폴리뉴클레오티드는 특히 단일- 및 이중-가닥 DNA, 단일- 및 이중-가닥 영역의 혼합물인 DNA, 단일- 및 이중-가닥 RNA, 및 단일- 및 이중-가닥 영역의 혼합물인 RNA, 단일-가닥 또는 보다 전형적으로 이중-가닥 또는 단일- 및 이중-가닥 영역의 혼합물일 수 있는 DNA 및 RNA를 포함하는 하이브리드 분자를 지칭한다. 용어 폴리뉴클레오티드는 게놈 DNA 또는 RNA (유기체에 따라 다름, 즉, 바이러스의 RNA 게놈), 뿐만 아니라 게놈 DNA에 의해 코딩된 mRNA, 및 cDNA를 포함한다. 특정 측면에서, 폴리뉴클레오티드는 통상적인 포스포디에스테르 결합 또는 비-통상적인 결합 (예를 들어, 아미드 결합, 예컨대 펩티드 핵산 (PNA)에서 발견되는 것)을 포함한다. "단리된" 핵산 또는 폴리뉴클레오티드는 천연 환경으로부터 제거된 핵산 분자, 예를 들어 DNA 또는 RNA를 의미한다. 예를 들어, 벡터에 함유된 재조합 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 분자는 본 개시내용의 목적을 위해 "단리된" 것으로 간주된다. 단리된 폴리뉴클레오티드의 추가 예는 이종 숙주 세포에서 유지되거나 용액 내의 다른 폴리뉴클레오티드로부터 (부분적으로 또는 실질적으로) 정제된 재조합 폴리뉴클레오티드를 포함한다. 단리된 RNA 분자는 본 개시내용의 폴리뉴클레오티드의 생체내 또는 시험관내 RNA 전사체를 포함한다. 본 개시내용에 따른 단리된 폴리뉴클레오티드 또는 핵산은 합성적으로 생산된 폴리뉴클레오티드 및 핵산 (예를 들어, 핵산 분자)을 추가로 포함한다.
본원에서 사용된 바와 같은 "코딩 영역" 또는 "코딩 서열"은 아미노산으로 번역가능한 코돈으로 이루어진 폴리뉴클레오티드의 일부이다. "정지 코돈" (TAG, TGA 또는 TAA)은 전형적으로 아미노산으로 번역되지 않지만, 이는 코딩 영역의 일부로 간주될 수 있지만, 임의의 플랭킹 서열, 예를 들어 프로모터, 리보솜 결합 부위, 전사 종결자, 인트론 등은 코딩 영역의 일부가 아니다. 코딩 영역의 경계는 전형적으로 생성된 폴리펩티드의 아미노-말단을 코딩하는 5' 말단의 시작 코돈, 및 생성된 폴리펩티드의 카르복실-말단을 코딩하는 3' 말단의 번역 정지 코돈에 의해 결정된다.
본원에서 사용된 바와 같은 "발현 카세트"는 관심 핵산 서열 (예를 들어, 폴리펩티드, DNA 또는 RNA의 발현을 위한 핵산 서열) 및 발현 제어 영역을 포함한다.
본원에서 사용된 바와 같은 "트랜스진"은 "관심 유전자 (GOI)"와 상호교환적으로 사용될 수 있고, 아미노산으로 번역가능한 코돈을 함유하는 폴리뉴클레오티드의 일부를 지칭한다. "정지 코돈" (TAG, TGA 또는 TAA)은 전형적으로 아미노산으로 번역되지 않지만, 트랜스진의 일부로 간주될 수 있지만, 임의의 플랭킹 서열, 예를 들어 프로모터, 리보솜 결합 부위, 전사 종결자, 인트론 등은 트랜스진의 일부가 아니다. 트랜스진의 경계는 전형적으로 생성된 폴리펩티드의 아미노-말단을 코딩하는 5' 말단의 시작 코돈, 및 생성된 폴리펩티드의 카르복실-말단을 코딩하는 3' 말단의 번역 정지 코돈에 의해 결정된다.
본원에서 사용된 바와 같은 용어 "발현 제어 영역"은 코딩 영역에 의해 코딩된 생성물의 발현을 지시하거나 제어하기 위해 코딩 영역과 작동가능하게 연관된 전사 제어 요소를 지칭하며, 예를 들어 시스-조절성 모듈 (CRM), 프로모터 (예를 들어, 조직 특이적 프로모터 및/또는 유도성 프로모터), 인핸서, 오퍼레이터, 억제자, 리보솜 결합 부위, 번역 리더 서열, 인트론, 전사후 요소, 폴리아데닐화 인식 서열, RNA 프로세싱 부위, 이펙터 결합 부위, 스템-루프 구조, 및 전사 종결 신호, miRNA 결합 부위, 및 이들의 조합을 포함한다. 발현 제어 영역은 관심 핵산 서열의 상류 (5'), 내부 또는 하류 (3')에 위치된 뉴클레오티드 서열을 포함하며, 이는 연관 관심 핵산 서열의 전사, RNA 프로세싱, 안정성 또는 번역에 영향을 미친다. 트랜스진이 진핵 세포에서 발현되도록 의도된 경우, 폴리아데닐화 신호 및 전사 종결 서열은 일반적으로 트랜스진에 대해 3'에 위치될 것이다.
프로모터 기능의 유도가 생성물을 코딩하는 코딩 영역을 포함하는 mRNA의 전사를 초래하는 경우, 및 프로모터와 코딩 영역 사이의 연결의 성질이 코딩 영역에 의해 코딩된 생성물의 발현을 지시하는 프로모터의 능력을 방해하지 않거나 전사되는 DNA 주형의 능력을 방해하지 않는 경우, 코딩 영역 및 프로모터는 "작동가능하게 연관" (즉, "작동가능하게 연결")된다. 발현 제어 영역은 코딩 영역의 상류 (5' 비-코딩 서열), 내부 또는 하류 (3' 비-코딩 서열)에 위치된 뉴클레오티드 서열을 포함하며, 이는 연관된 코딩 영역의 전사, RNA 프로세싱, 안정성 또는 번역에 영향을 미친다. 코딩 영역이 진핵 세포에서 발현되도록 의도된 경우, 폴리아데닐화 신호 및 전사 종결 서열은 일반적으로 코딩 서열에 대해 3'에 위치될 것이다.
본원에서 사용된 바와 같은 용어 "숙주 세포" 및 "세포"는 상호교환적으로 사용될 수 있으며, 핵산 분자 (예를 들어, 재조합 핵산 분자)를 보유하거나 보유할 수 있는 임의의 유형의 세포 또는 세포 집단, 예를 들어 일차 세포, 배양 중인 세포, 또는 세포주로부터의 세포를 지칭할 수 있다. 숙주 세포는 원핵 세포일 수 있거나, 대안적으로 숙주 세포는 진핵 세포, 예를 들어 진균 세포, 예컨대 효모 세포, 및 다양한 동물 세포, 예컨대 곤충 세포 또는 포유동물 세포일 수 있다.
본원에서 사용된 바와 같은 "배양" "배양하다" 및 "배양하는"은 세포 성장 또는 분열을 허용하거나 세포를 살아있는 상태로 유지하는 시험관내 조건 하에 세포를 인큐베이션하는 것을 의미한다. 본원에서 사용된 바와 같은 "배양된 세포"는 시험관내에서 증식되는 세포를 의미한다.
"대상체"는 임의의 인간 또는 비인간 동물을 포함한다. 용어 "비인간 동물"은 척추동물, 예컨대 포유동물, 조류, 애완동물, 농장 동물, 비인간 영장류, 양, 소, 염소, 돼지, 닭, 개, 고양이, 및 설치류, 예컨대 마우스, 래트 및 기니피그를 포함하나 이에 제한되지는 않는다. 바람직한 측면에서, 대상체는 인간이다. 용어 "대상체" 및 "환자"는 본원에서 상호교환적으로 사용된다.
"투여하는"은 관련 기술분야의 통상의 기술자에게 공지된 임의의 다양한 방법 및 전달 시스템을 사용하여 대상체에게 치료제를 물리적으로 도입하는 것을 지칭한다.
본원에서 사용된 바와 같은 대상체의 용어 "치료하다", "치료하는", "치료" 또는 "요법"은 질환과 연관된 증상, 합병증, 병태 또는 생화학적 징후의 진행, 발달, 중증도 또는 재발을 역전, 경감, 호전, 억제 또는 둔화 또는 예방하거나 전반적 생존을 향상시키는 목적으로 대상체에게 수행되거나 활성제를 투여하는 임의의 유형의 중재 또는 프로세스를 지칭한다. 치료는 질환을 갖는 대상체 또는 질환을 갖지 않는 대상체에 대한 것일 수 있다 (예를 들어, 예방, 예컨대 백신접종).
용어 "유효 용량" "유효 투여량" 또는 "유효량"은 원하는 효과를 달성하거나 적어도 부분적으로 달성하기에 충분한 작용제의 양으로서 정의된다. 약물 또는 치료제의 "치료 유효량" 또는 "치료 유효 투여량"은 단독으로 또는 또 다른 치료제와 조합하여 사용되는 경우 질환 증상의 중증도의 감소, 질환 증상이 없는 기간의 빈도 및 지속시간의 증가, 전반적 생존 (질환 진단일 또는 질환 치료 시작일로부터 해당 질환으로 진단된 환자가 여전히 생존하는 시간의 길이)의 증가, 또는 질환 고통으로 인한 손상 또는 장애의 예방에 의해 입증되는 질환 퇴행을 촉진하는 약물의 임의의 양이다. 약물의 치료 유효량 또는 투여량은 "예방적 유효량" 또는 "예방적 유효 투여량"을 포함하며, 이는 질환이 발생할 위험이 있거나 질환이 재발할 위험이 있는 대상체에게 단독으로 또는 또 다른 치료제와 조합하여 투여될 때 질환의 발병 또는 재발을 억제하는 약물의 임의의 양이다. 질환 퇴행을 촉진하거나 질환의 발병 또는 재발을 억제하는 치료제의 능력은 숙련된 전문가에게 공지된 다양한 방법을 사용하여, 예컨대 임상 시험 동안 인간 대상체에서, 인간에서 효능을 예측하는 동물 모델 시스템에서, 또는 시험관내 검정에서 작용제의 활성을 검정함으로써 평가될 수 있다.
본 개시내용의 다양한 측면은 하기 하위섹션에서 더 자세히 설명된다.
II. 박테리아 서열-무함유 벡터를 생산하기 위한 발현 벡터 및 벡터 생산 시스템
박테리아 서열-무함유 벡터 및 이의 생산은 미국 특허 번호 9,290,778 및 9,862,954; 문헌 [Nafissi and Slavcev, Microbial Cell Factories 11:154 (2012)]; 및 [Nafissi et al., Nucleic Acids 3(6):e165 (2014)] (그 전문이 본원에 참조로 포함됨)에 기재되어 있다. 이들 박테리아 서열-무함유 벡터는 관심 핵산 서열(들)을 함유하는 발현 카세트의 각 측면 (즉, 5' 및 3' 측면)을 플랭킹하는 레콤비나제에 대한 표적 서열을 포함하는 특수화된 "슈퍼 서열" ("SS" 또는 대안적으로 "SSeq") 부위를 함유하는 발현 벡터 (예를 들어, 플라스미드)로부터 생산된다. 구체적으로, 각각의 SS는 제1 레콤비나제에 대한 표적 서열을 함유하며, 제1 레콤비나제에 대한 비-결합 영역 내에 통합된 하나 이상의 추가 레콤비나제에 대한 추가 표적 서열을 함유한다. 발현 벡터가 적절한 레콤비나제를 발현하는 재조합 세포에 존재하는 경우, 발현 카세트를 함유하는 박테리아 서열-무함유 벡터가 발현 벡터의 백본 DNA로부터 분리된다. 원형 공유 폐쇄형 (CCC) 박테리아 서열-무함유 벡터를 생산하기 위해, 발현 벡터는 예를 들어 SS의 표적 서열을 통해 작용하는 레콤비나제, 예컨대 Cre 또는 Flp를 발현하는 재조합 세포에 배치된다. 선형 공유 폐쇄형 (LCC) 박테리아 서열-무함유 벡터 (본원에서 미니스트링 DNA (msDNA)로도 지칭됨)를 생산하기 위해, 발현 벡터는 예를 들어 SS의 표적 서열을 통해 작용하는 레콤비나제, 예컨대 TelN 또는 Tel을 발현하는 재조합 세포에 배치된다. 그 후, 재조합으로부터 생성된 박테리아 서열-무함유 벡터는 세포로부터 정제되고 전달 벡터로서 직접 사용될 수 있다. 미국 특허 번호 9,290,778 및 9,862,954, 문헌 [Nafissi and Slavcev], 및 [Nafissi et al.]을 참조한다.
LCC 말단을 갖는 msDNA 벡터는 비틀림이 없으며 이. 콜라이에서 생산되는 동안 기라제-지정 음성 슈퍼코일링이 발생하지 않는다. 더욱이, 이중 가닥 LCC 토폴로지로 인해, msDNA의 세포의 염색체로의 통합은 염색체 파단을 야기하여, 이에 의해 집단으로부터 세포를 제거한다. 그러므로, msDNA는 삽입 돌연변이유발의 임의의 위험을 제거하여, msDNA를 투여받은 환자를 잠재적 유전독성 및 암으로부터 보호한다 (Nafissi et al.).
본 개시내용은 박테리아 서열-무함유 벡터의 개선된 생산 및 개선된 박테리아 서열-무함유 벡터를 제공한다. 일부 측면에서, 박테리아 서열-무함유 벡터의 생산은 오염성 발현 벡터 서열의 제거에 의해 개선된다. 일부 측면에서, 박테리아 서열-무함유 벡터는 세포 내 확립 능력 (즉, 형질감염 효율), 개선된 트랜스진 발현 (예를 들어, 향상된 전사 및 번역의 조합에 의해 매개됨), 및 세포 내 개선된 확장 (예를 들어, 벡터의 딸 세포로의 복제 및 분할)을 통해 개선된다.
일부 측면에서, 본원에 개시된 개선은 관련 기술분야에 공지된 다른 방법에 따라 생산된 CCC 또는 LCC 벡터에 적응될 수 있다.
A. 발현 벡터
하기를 포함하는 발현 벡터가 본원에 제공된다: (a) 백본 서열, (b) 하기를 포함하는 서열: (i) 관심 핵산 서열을 포함하는 발현 카세트, (ii) 발현 카세트의 5' 측면을 플랭킹하는 제1 레콤비나제에 대한 제1 표적 서열, (iii) 발현 카세트의 3' 측면을 플랭킹하는 제1 레콤비나제에 대한 제2 표적 서열, 및 (iv) 제1 레콤비나제에 대한 비-결합 영역 내 제1 및 제2 표적 서열 내에 통합된 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열, 및 (c) 하기 중 하나 이상: (i) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열, 여기서 엔도뉴클레아제 표적 서열은 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음, (ii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서, (iii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 사이토메갈로바이러스 (CMV) 인핸서, (iv) 인트론을 포함하는 5' 비번역 영역 (5'UTR), 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨, (v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터, (vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 우드척 간염 바이러스 전사후 조절 요소 (WPRE), (vii) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 스캐폴드/매트릭스 부착 영역 (S/MAR), 또는 (viii) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 DNA 핵 표적화 서열 (DTS), 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음.
본원에서 언급된 바와 같은 "백본" 서열은 발현 카세트의 서열 및 제1 레콤비나제의 제1 및 제2 표적 서열을 포함하는 플랭킹 SS 부위 외부의 발현 벡터의 서열이다. 백본 서열은 예를 들어 본원에 기재된 바와 같이 숙주 세포 (예를 들어, 이. 콜라이)에서 발현 벡터의 증폭 및 항생제 선택을 위한 서열을 포함할 수 있다.
레콤비나제에 대한 "비-결합" 영역은 본원에 기재된 바와 같은 레콤비나제에 의해 작용하지 않는 (예를 들어, 레콤비나제에 의해 결합 및/또는 절단되지 않는) 제1 레콤비나제에 대한 표적 서열 내의 영역이다.
레콤비나제에 대한 "절단 부위"는 레콤비나제가 재조합과 연관된 DNA에서 이중-가닥 파단 또는 단일-가닥 틈을 개시하는 부위이다.
일부 측면에서, 발현 벡터는 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열을 포함하고, 여기서 엔도뉴클레아제 표적 서열은 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제1 표적 서열 내에 통합된다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제2 표적 서열 내에 통합된다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제1 및 제2 표적 서열 내에 통합된다. 일부 측면에서, 동일한 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제1 및 제2 표적 서열 내에 통합된다. 일부 측면에서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열은 동일한 엔도뉴클레아제에 대한 것이다. 일부 측면에서, 제1 레콤비나제에 대한 제1 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열과 상이하다. 일부 측면에서, 제1 레콤비나제에 대한 제1 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열은 제1 레콤비나제에 대한 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열과 상이한 엔도뉴클레아제에 대한 것이다.
발현 벡터 내 백본 서열과 레콤비나제에 대한 절단 부위 사이의 엔도뉴클레아제 표적 서열의 위치는 본원에 기재된 바와 같은 재조합 후에 엔도뉴클레아제 표적 서열이 박테리아 서열-무함유 벡터가 아닌 백본 서열과 계속 연관되어 있음을 보장한다. 그러므로, 재조합 후에, 백본 서열 및 엔도뉴클레아제 표적 부위를 함유하는 서열은 엔도뉴클레아제에 노출시킴으로써 박테리아 서열-무함유 벡터를 함유하는 제제로부터 제거되어, 박테리아 서열-무함유 벡터를 생산하는 방법에서 백본 서열을 제거하기 위한 정제 단계의 필요성을 감소시키거나 회피할 수 있다. 일부 측면에서, 엔도뉴클레아제는 본원에 기재된 바와 같은 벡터 생산 시스템의 숙주 세포에서 재조합 후에 발현되며, 여기서 엔도뉴클레아제는 엔도뉴클레아제 표적 부위에서 DNA를 절단하고, 백본 서열 및 엔도뉴클레아제 표적 부위를 함유하는 서열은 엑소뉴클레아제 (예를 들어, 엑소뉴클레아제 V)에 의해 분해된다.
일부 측면에서, 발현 벡터는 귀소 엔도뉴클레아제에 대한 엔도뉴클레아제 표적 서열을 포함한다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 I-SceI에 대한 것이다. 일부 측면에서, 엔도뉴클레아제 표적 서열은 PI-SceI에 대한 것이다. 귀소 엔도뉴클레아제에 대한 표적 서열은 관련 기술분야에 널리 공지되어 있다.
일부 측면에서, 발현 벡터는 뉴클레아제 게놈 편집 시스템의 일부인 엔도뉴클레아제를 포함하여 게놈 편집에 사용되는 엔도뉴클레아제에 대한 엔도뉴클레아제 표적 서열을 포함한다. 일부 측면에서, 뉴클레아제 게놈 편집 시스템은 클러스터링된 규칙적 간격의 짧은 회문구조 반복부-Cas (CRISPR-Cas) 시스템, 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN) 시스템, 아연-핑거 뉴클레아제 (ZFN) 시스템, 또는 메가뉴클레아제 시스템이다.
일부 측면에서, 발현 벡터는 Cas 엔도뉴클레아제에 대한 엔도뉴클레아제 표적 서열을 포함한다. 일부 측면에서, Cas 엔도뉴클레아제는 Cas9 (예를 들어, 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) Cas 9 (SpCas9), 스타필로코쿠스 아우레우스(Staphylococcus aureus) Cas9 (SaCas9), 프란시셀라 노비시다(Francisella novicida) Cas9 (FnCas9), 또는 네이세리아 메닝기티디스(Neisseria meningitidis) Cas9 (NmCas9)), Cas9 변이체 (예를 들어, Cas9β2, xCas9, SpCas9-NG, SpCas9-NRRH, SpCas9-NRCH, SpCas9-NRTH, SpG, SpRY), Cas3, Cas12 (예를 들어, Cas12a, Cas12b, Cas12c, Cas12d, 또는 Cas12e), Cas13 (예를 들어, Cas13a, Cas13b, Cas13c 또는 Cas13d), 또는 Cas14이다. 일부 측면에서, 본원에서 사용된 바와 같은 Cas 엔도뉴클레아제에 대한 엔도뉴클레아제 표적 서열은 가이드 RNA (gRNA) 표적화 서열과 상동성이고, Cas 엔도뉴클레아제에 의해 인식되는 프로토스페이서 인접 모티프 (PAM)를 포함한다. PAM 부위를 갖는 gRNA 표적화 서열과 상동성인 서열은 널리 공지된 CRISPR 시스템에 기초하여 일상적으로 설계될 수 있다. gRNA는 표적화 RNA (crRNA) 서열 및 트랜스-활성화 RNA (tracrRNA) 서열의 융합체를 포함하며, 이는 Cas 엔도뉴클레아제를 엔도뉴클레아제 표적 부위로 지정하고 절단을 촉매작용하는 상호작용 및 기능을 한다.
일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 다중 인접 카피, 예컨대, 예를 들어 1, 2, 3, 4, 5개 이상의 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 3개 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46의 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 닭 β-액틴 프로모터의 5' 말단에 통합된다. 일부 측면에서, 서열식별번호: 47과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다. 일부 측면에서, 서열식별번호: 47의 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.
일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 CMV 인핸서를 포함한다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 다중 인접 카피의 3' 말단에, 예컨대, 예를 들어 합성 인핸서의 1, 2, 3, 4, 5개 이상의 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 3개 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46의 핵산 서열의 3' 말단에 통합된다. 일부 측면에서, CMV 프로모터는 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.
일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열과 관심 핵산 서열 사이에 통합된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 발현 벡터는 제1 레콤비나제에 대한 제1 표적 서열과 관심 핵산 서열 사이에 통합된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열을 포함한다. 일부 측면에서, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39, 또는 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열은 관심 핵산 서열에 대해 5'에 위치된 발현 카세트 내 모든 조절 요소를 포함한다.
일부 측면에서, 발현 벡터는 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR (즉, 인트론을 포함하는 5'UTR)은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다.
일부 측면에서, 5'UTR은 각각 5'UTR이 결여된 동일한 발현 벡터 또는 박테리아 서열-무함유 벡터와 비교하여 발현 벡터 또는 발현 벡터로부터 생산된 박테리아 서열-무함유 벡터로부터의 트랜스진 전사체 스플라이싱 및 번역을 개선하기 위한 것이다.
일부 측면에서, 인트론은 서열식별번호: 1과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 인트론은 서열식별번호: 1의 핵산 서열을 포함한다.
일부 측면에서, 5'UTR은 서열식별번호: 2와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하며, 이는 내부 최소 인트론을 갖는 최적화된 5'UTR (본원에서 "5'UTR1"로도 지칭됨)이다. 일부 측면에서, 5'UTR은 서열식별번호: 2의 핵산 서열을 포함한다.
일부 측면에서, 5'UTR은 서열식별번호: 4와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 4의 핵산 서열을 포함한다.
일부 측면에서, 5'UTR은 인트론 내에 통합된 비-코딩 서열을 추가로 포함한다.
일부 측면에서, 인트론은 서열식별번호: 1과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일하거나 서열식별번호: 1을 포함하고, 비-코딩 서열은 서열식별번호: 1의 위치 25 내지 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된다.
일부 측면에서, 비-코딩 서열은 비-원핵생물성 및 비-바이러스성이다. 일부 측면에서, 비-코딩 서열은 진핵생물 서열이다. 일부 측면에서, 비-코딩 서열은 인트론, 유비쿼터스 염색질 개방 요소 (UCOE), S/MAR, SV40 인핸서 서열 (예를 들어, 하나 또는 하나 초과의 SV40 인핸서 서열, 예컨대 2, 3, 4, 5개 이상의 SV40 인핸서 서열), 척추동물 염색질 인슐레이터 (예를 들어, cHS4), WPRE, 또는 이들의 임의의 조합을 포함한다.
일부 측면에서, 비-코딩 서열은 S/MAR을 포함한다. 일부 측면에서, S/MAR은 서열식별번호: 9로서 본원에 제공된 MAR-5이다.
일부 측면에서, 5'UTR은 서열식별번호: 3과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 3을 포함한다.
일부 측면에서, 5'UTR은 서열식별번호: 5와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 5를 포함한다.
일부 측면에서, 5'UTR은 닭 β-액틴 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다.
일부 측면에서, 5'UTR은 CMV 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다.
일부 측면에서, 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합되고, 여기서 프로모터는 CMV 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 다중 인접 카피의 3' 말단에, 예컨대, 예를 들어 합성 인핸서의 1, 2, 3, 4, 5개 이상의 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 3개 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46의 핵산 서열의 3' 말단에 통합된다.
일부 측면에서, 발현 벡터는 관심 핵산 서열의 3' 말단에 통합된 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 제노푸스 라에비스(Xenopus laevis) 베타-글로빈 폴리아데닐화 신호, 인간 베타-글로빈 폴리아데닐화 신호, 또는 하이브리드 제노푸스 라에비스 및 인간 베타-글로빈 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호, 인간 베타-글로빈 폴리아데닐화 신호, 또는 하이브리드 제노푸스 라에비스 및 인간 베타-글로빈 폴리아데닐화 신호의 다중 카피, 예컨대, 예를 들어 1, 2, 3, 4 또는 5개 카피를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15의 핵산 서열을 포함한다. 일부 측면에서, 폴리아데닐산 꼬리 (즉, 폴리(A) 꼬리는 폴리아데닐화 신호의 3' 말단에 위치된다. 일부 측면에서, 폴리(A) 꼬리는 길이가 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120개 이상의 잔기이다. 일부 측면에서, 폴리아데닐화 신호 및 폴리(A) 꼬리를 포함하는 서열은 서열식별번호: 16, 서열식별번호: 17 또는 서열식별번호: 18과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일하다. 일부 측면에서, 폴리아데닐화 신호 및 폴리(A) 꼬리를 포함하는 서열은 서열식별번호: 16, 서열식별번호: 17 또는 서열식별번호: 18을 포함한다.
일부 측면에서, 발현 벡터는 발현 카세트 내 척추동물 염색질 인슐레이터를 포함한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 5'-HS4 닭-β-글로빈 인슐레이터 (cHS4)이다. 예를 들어 문헌 [Benabdellah et al., PLoS ONE 9(1): e84268 (2014)]; [Lu et al., FEBS Open Bio 10: 644-656 (2020)]; [Hanawa et al., Mol. Ther. 17(4): 667-674 (2009)]; [Walters et al., Mol. Cell. Biol. 19(5): 3714-3726 (1999)]을 참조한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 본원에 기재된 바와 같은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, 척추동물 염색질 인슐레이터는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.
일부 측면에서, 척추동물 염색질 인슐레이터는 서열식별번호: 8과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 서열식별번호: 8을 포함한다.
일부 측면에서, 척추동물 염색질 인슐레이터는 각각 척추동물 염색질 인슐레이터 없이 동일한 발현 벡터 또는 박테리아 서열-무함유 벡터와 비교하여 발현 벡터 또는 발현 벡터로부터 생산된 박테리아 서열-무함유 벡터의 확립 (즉, 형질감염 효율)을 개선하기 위한 것이다.
일부 측면에서, 발현 벡터는 발현 카세트 내 WPRE를 포함한다. 예를 들어 문헌 [Higashimoto et al., Gene Therapy 14: 1298-1304 (2007)]을 참조한다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 S/MAR의 3' 말단 및 본원에 기재된 바와 같은 폴리아데닐화 신호의 5' 말단에서 발현 카세트에 통합된다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.
일부 측면에서, WPRE는 서열식별번호: 11과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, WPRE는 서열식별번호: 11을 포함한다.
일부 측면에서, WPRE는 각각 WPRE가 결여된 동일한 발현 벡터 또는 박테리아 서열-무함유 벡터와 비교하여 발현 벡터 또는 발현 벡터로부터 생산된 박테리아 서열-무함유 벡터로부터의 트랜스진의 발현을 개선한다.
일부 측면에서, 발현 벡터는 발현 카세트 내 S/MAR을 포함한다. 예를 들어 문헌 [Martens et al., Mol. Cell. Biol. 22(8): 2598-2606 (2002)]; [Narwade et al., Nucleic Acids Res. 47(14): 7247-7261 (2019)]을 참조한다. 일부 측면에서, S/MAR은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, S/MAR은 본원에 기재된 바와 같은 관심 핵산 서열의 3' 말단 및 WPRE의 5' 말단에서 발현 카세트에 통합된다. 일부 측면에서, S/MAR은 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.
일부 측면에서, S/MAR은 인간 베타-인터페론 MAR의 단편인 MAR-3, MAR-4 또는 MAR-5이다. 예를 들어 문헌 [Wang et al., Mol. Biol. Cell 30: 2761-2770 (2019)]을 참조한다. 일부 측면에서, S/MAR은 서열식별번호: 9와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, S/MAR은 서열식별번호: 9를 포함한다.
일부 측면에서, S/MAR은 인간 세포독성 세린 프로테아제-B (CSP-B) MAR 또는 CSP-C MAR이다. 예를 들어 문헌 [Hanson and Ley, Blood 79(3):610-618 (1992)]; [Klein et al., Tissue Antigens 35(5):220-228 (1990)]을 참조한다. 일부 측면에서, S/MAR은 서열식별번호: 10과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, S/MAR은 서열식별번호: 10을 포함한다.
일부 측면에서, S/MAR은 각각 S/MAR이 결여된 동일한 발현 벡터 또는 박테리아 서열-무함유 벡터와 비교하여 발현 벡터 또는 발현 벡터로부터 생산된 박테리아 서열-무함유 벡터의 발현 수준, 안정성 및/또는 내구성을 개선하기 위한 것이다 (예를 들어, 에피솜 유지 및 복제, 예컨대 딸 세포로의 벡터의 확장 및 분할에 의해, 및/또는 후성유전학적 침묵 방지에 의해).
일부 측면에서, 상기 기재된 바와 같은 (c)(i)-(c)(vii) 중 임의의 하나 이상을 포함하는 발현 벡터 (즉, DTS 없이)는 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 인핸서 서열을 추가로 포함한다. 일부 측면에서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 인핸서 서열은 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열이다. 일부 측면에서, 인핸서 서열은 SV40 인핸서 서열이다.
일부 측면에서, 발현 벡터는 DTS를 포함한다. 일부 측면에서, DTS는 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합되고, 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있다. 일부 측면에서, DTS는 SV40 인핸서 서열이다. 일부 측면에서, DTS는 세포-특이적이다. 일부 측면에서, DTS는 평활근 세포, 배아 줄기 세포, 유형 II 폐포세포, 내피 세포 또는 골모세포에 특이적이다.
발현 카세트와 발현 벡터 내 레콤비나제에 대한 절단 부위 사이의 DTS의 위치는 DTS가 본원에 기재된 바와 같은 재조합 후에 백본 서열이 아닌 박테리아 서열-무함유 벡터와 회합된 상태로 유지되도록 보장한다.
일부 측면에서, 발현 벡터는 발현 카세트 내 UCOE를 포함한다. 예를 들어 문헌 [Muller-Kuller et al., Nucleic Acids Res. 43(3): 1577-1592 (2015)]; [Skipper et al., BMC Biotechnol. 19:75 (2019)]; [Rudina et al., bioRxiv, doi.org/10.1101/626713 (2019)]; [Neville et al., Biotechnol. Adv. 35(5): 557-564 (2017)]을 참조한다. 일부 측면에서, UCOE는 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터 또는 임의의 인핸서의 5' 말단 사이에 위치된다. 일부 측면에서, UCOE는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.
일부 측면에서, UCOE는 A2UCOE이다. 일부 측면에서, UCOE는 서열식별번호: 6과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, UCOE는 서열식별번호: 6이다.
일부 측면에서, UCOE는 SRF-UCOE이다. 예를 들어 국제 공개 번호 WO2020223160을 참조한다. 일부 측면에서, UCOE는 서열식별번호: 7과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, UCOE는 서열식별번호: 7이다.
일부 측면에서, UCOE는 각각 UCOE가 결여된 동일한 발현 벡터 또는 박테리아 서열-무함유 벡터와 비교하여 발현 벡터 또는 발현 벡터로부터 생산된 박테리아 서열-무함유 벡터로부터의 트랜스진의 발현을 개선한다.
일부 측면에서, 발현 벡터는 발현 카세트 내 인핸서-1을 포함한다. 일부 측면에서, 인핸서-1은 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터 또는 임의의 다른 인핸서의 5' 말단 사이에 통합된다. 일부 측면에서, 인핸서-1은 UCOE의 3' 말단과 CMV 인핸서의 5' 말단 사이에 통합된다. 일부 측면에서, 인핸서-1은 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 인핸서-1은 서열식별번호: 12이다.
일부 측면에서, 발현 벡터는 발현 카세트 내 CMV, EF1, SV40, CAG, Rho, VDM2, HCR 또는 HLP 프로모터, 또는 이의 변이체를 포함한다. 일부 측면에서, 발현 벡터는 발현 카세트 내 CMV 프로모터 변이체를 포함한다. 예를 들어 국제 공개 번호 WO2012099540; 문헌 [Xu et al., Bioengineered 10(1): 548-560, DOI: 10.1080/21655979.2019.1684863 (2019)]을 참조한다.
일부 측면에서, 발현 벡터는 발현 카세트 내 EF1-알파 프로모터를 포함한다. 일부 측면에서, 발현 벡터는 발현 카세트 내 CMV 인핸서 및 EF1-알파 프로모터를 포함한다.
일부 측면에서, 발현 벡터는 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함하는 발현 카세트 내 3'UTR을 포함한다. 일부 측면에서, 3'UTR은 관심 핵산 서열과 제1 레콤비나제에 대한 제2 표적 서열의 5' 말단 사이에 통합된다.
일부 측면에서, 3'UTR은 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 13과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 13이다.
일부 측면에서, 3'UTR은 인간 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 14와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 14이다.
일부 측면에서, 3'UTR은 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호의 1개 카피 및 인간 베타-글로빈 폴리아데닐화 신호의 1개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 15와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 15이다.
일부 측면에서, 3'UTR은 100 내지 120개의 아데닌 뉴클레오티드, 즉, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119 또는 120개의 아데닌 뉴클레오티드를 포함하는 폴리(A) 꼬리를 추가로 포함한다 (즉, 3'UTR의 3' 말단에).
일부 측면에서, 3'UTR은 서열식별번호: 16과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 16이다.
일부 측면에서, 3'UTR은 서열식별번호: 17과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 17이다.
일부 측면에서, 3'UTR은 서열식별번호: 18과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 18이다.
발현 벡터는 본원에 기재된 바와 같은 제1 및/또는 제2 표적 서열 및/또는 발현 카세트에 대한 상기 변형의 임의의 조합을 함유할 수 있다. 일부 측면에서, 조합은 상승작용적 효과를 제공한다.
일부 측면에서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열 및 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열은 PY54 pal 부위, N15 telRL 부위, loxP 부위, φK02 telRL 부위, FRT 부위, phiC31 attP 부위 및 λ attP 부위로 이루어진 군으로부터 선택된다. 일부 측면에서, 발현 벡터는 각각의 표적 서열을 포함한다. 일부 측면에서, 발현 벡터는 pal 부위 및 pal 부위 내에 통합된 telRL, loxP 및 FRT 레콤비나제 표적 결합 서열을 포함한다. 일부 측면에서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열은 각각 서열식별번호: 33의 핵산 서열을 포함한다.
일부 측면에서, 본원에 기재된 임의의 발현 카세트 내 관심 핵산 서열은 하기를 코딩하는 서열을 포함한다: 폴리펩티드, RNA (메신저 RNA (mRNA), 마이크로-RNA (miRNA), 작은 간섭 RNA (siRNA), 작은 헤어핀 RNA (shRNA), 리보자임 또는 안티센스 RNA), 또는 비-코딩 DNA (예를 들어, 안티센스 올리고뉴클레오티드). 일부 측면에서, 관심 핵산 서열은 인트론 및/또는 엑손을 포함하는 게놈 DNA 서열이다. 일부 측면에서, 관심 핵산 서열은 하기를 코딩하는 서열을 포함한다: 항암제, 종양 서프레서, 아폽토시스 작용제, 항혈관신생제, 효소, 세포독성제, 자살 유전자, 시토카인, 인터페론, 인터루킨, 면역조정제, 면역자극제, 면역억제제, 케모카인, 항원-제시 세포 자극용 항원, 항체 (예를 들어, 항체의 중쇄 및/또는 경쇄, 예컨대 모노클로날, 키메라, 인간화 또는 인간 항체, 또는 이의 항원-결합 단편), 게놈 편집 시스템 또는 이의 일부 (예를 들어, CRISPR-Cas, TALEN, ZFN 또는 메가뉴클레아제 시스템 또는 이의 일부, 예컨대 Cas 엔도뉴클레아제 또는 gRNA), 또는 면역원성 작용제 (예를 들어, VLP 및/또는 백신으로서). 일부 측면에서, 관심 핵산 서열은 핵산 서열이 세포내에서 발현될 때 VLP를 형성할 수 있는 폴리펩티드를 코딩하는 서열을 포함한다.
예시적인 치료적 표적 및 적응증은 하기를 포함한다: 단일유전자 장애와 연관된 유전자, 예를 들어 간, 혈액 또는 눈 장애, 갈락토시다제 알파 (GLA, 예를 들어 파브리병 치료용), 나트륨 전압-개폐 채널 알파 서브유닛 1 (SCN1A, 예를 들어 드라베 증후군 치료용), ATP 결합 카세트 서브패밀리 A 구성원 4 (ABCA4, 예를 들어 스타가르트병 치료용), 계면활성제 단백질 B (SP-B, 예를 들어 계면활성제 기능장애 장애 치료용), 계면활성제 단백질 C (SP-C, 예를 들어 계면활성제 기능장애 장애 치료용), ATP-결합 카세트 서브패밀리 A 구성원 3 (ABCA3, 예를 들어 계면활성제 기능장애 장애 치료용), 용질 담체 패밀리 34 구성원 2 (SLC34A2, 예를 들어 폐포 미세결석증 및/또는 고환 미세결석증 치료용), 낭포성 섬유증 막횡단 전도도 조절제 (CFTR, 예를 들어 낭포성 섬유증 치료용), 글루타메이트 데카르복실라제 (GAD, 예를 들어 GAD65 또는 GAD67, 예를 들어 파킨슨병 치료용), 아스파르토아실라제 유전자 (ASPA, 아미노아실라제 (AAC)로도 공지됨, 예를 들어 카나반병 치료용), 방향족 L-아미노산 데카르복실라제 (AADC, 예를 들어 파킨슨병 치료용 및/또는 AADC 결핍증 치료용), 뉴르투린 (NRTN, 예를 들어 파킨슨병 치료용), 신경교세포주-유래 신경영양 인자 (GDNF, 예를 들어 파킨슨병 치료용), 신경 성장 인자 (NGF, 예를 들어 알츠하이머병 치료용), 트리펩티딜 펩티다제 I (TPP1, 세로이드 리포푸시노시스 뉴런-2 (CLN2)로도 공지됨, 예를 들어 바텐병, 예를 들어 CLN2 질환 치료용), 아릴술파타제 A (ARSA, 예를 들어 이염백색질장애 치료용), N-술포글루코사민 술포히드롤라제 (SGSH, 예를 들어 산필리포 증후군, 유형 A 치료용), 술파타제-변형 인자 1 (SUMF1, 예를 들어 산필리포 증후군, 유형 A 치료용), N-아세틸-알파-글루코사미니다제 (NAGLU, 예를 들어 산필리포 증후군, 유형 B 치료용), 운동 뉴런 1의 생존 (SMN1, 예를 들어 척수성 근위축증 1 치료용), 망막 색소 상피-특이적 65 kDa 단백질 (RPE65, 레티노이드 이소메로히드롤라제로도 공지됨, 예를 들어 레버 선천 흑내장증 치료용), Rab 에스코트 단백질 1 (REP1, 예를 들어 맥락막혈증 치료용), 레티노시신 1 (RS1, 예를 들어 X-연관 청소년 망막분리증 치료용), 알파-1 항트립신 (AAT, 예를 들어 유전성 폐기종 또는 AAT 결핍증 치료용), 미니디스트로핀 (예를 들어 뒤센 근이영양증 치료용), α-사르코글리칸 (αSG, 예를 들어 뒤센 근이영양증 또는 지대 근이영양증 유형 2 치료용), β-사르코글리칸 (βSG), γ-사르코글리칸 (γSG, 예를 들어 지대 근이영양증 유형 2 치료용), δ-사르코글리칸 (γSG), 이포단백질 리파제 (LPL, 예를 들어 가족성 LPL 결핍증 치료용), 산 알파-글루코시다제 (GAA, 예를 들어 폼페병 치료용), 종양 괴사 인자 수용체:Fc (TNFR:Fc, 예를 들어 관절염, 예를 들어 염증성 관절염 치료용), 근형질/소포체 Ca(2+)ATPase 2a (SERCA2a, 예를 들어 울혈성 심부전 치료용), 인자 VIII 또는 인자 IX (FVIII 또는 FIX, 예를 들어 혈우병 B 치료용), 포르포빌리노겐 데아미나제 유전자 (PBGD, 예를 들어 급성 간헐성 포르피린증 치료용), 가용성 fms-유사 티로신 키나제-1 (sFLT1, 예를 들어 연령-관련 황반 변성 또는 암, 예를 들어 난소암 치료용), VEGFR-1 및 VEGF-R2의 도메인을 포함하는 가용성 키메라 혈관 내피 성장 인자 (VEGF) 수용체 (예를 들어 암, 예를 들어 흑색종 또는 결장암 치료용), 가용성 VEGFR3 (예를 들어 암, 예를 들어 자궁내막암 치료용), 가용성 VEGF-C 미끼 수용체 (sVEGFR3-Fc, 예를 들어 암, 예를 들어 흑색종, 신장 세포 암종 또는 전립선암 치료용), 색소 상피-유래 성장 인자 (PEDF, 예를 들어 암, 예를 들어 루이스 폐암종 치료용), VEGFR2에 대한 중화 모노클로날 항체 (예를 들어, DC101, 예를 들어 암, 예를 들어 흑색종 또는 교모세포종 치료용), 엔도스타틴 (예를 들어 암, 예를 들어 방광암 또는 췌장암 치료용), 안지오스타틴 (예를 들어 암, 예를 들어 간암 치료용), 엔도스타틴 및 안지오스타틴 둘 모두 (즉, 바이시스트론 서열로서, 예를 들어 암, 예를 들어 난소암 또는 전립선암 치료용), 엔도스타틴 돌연변이체 (즉, P1254A-엔도스타틴, 예를 들어 암, 예를 들어 난소암 치료용), TSP-1의 항혈관신생 도메인 (3TSR, 예를 들어 암, 예를 들어 췌장암 치료용), 조직 인자 경로 억제제-2 (TFPI-2, 예를 들어 암, 예를 들어 교모세포종 치료용), 플라스미노겐의 단편 (예를 들어, 크링글 5, 예를 들어 암, 예를 들어 난소암 치료용), 플라스미노겐 크링글 1-5 (예를 들어 암, 예를 들어 흑색종 또는 폐암 치료용), 폴딩되지 않은 단백질 반응 단백질에 대한 siRNA (UPR; 예를 들어, IRE1α, XBP-1 또는 ATF6, 예를 들어 암, 예를 들어 유방암 치료용), 바소스타틴 (예를 들어 암, 예를 들어 폐암 치료용), 헤르페스 심플렉스 바이러스 유형 1 티미딘 키나제 (HSV-TK, 예를 들어 암, 예를 들어 유방암 치료용), sc39TK (예를 들어 암, 예를 들어 자궁경부암 치료용), 디프테리아 독소 A (DTA, 예를 들어 암, 예를 들어 자궁경부암 또는 골수종 치료용), 아폽토시스의 p53 상향조절된 조정제 (PUMA, 예를 들어 암, 예를 들어 자궁경부암 또는 골수종 치료용), 종양 괴사 인자 (TNF)-관련 아폽토시스-유도 리간드 (TRAIL, 예를 들어 암, 예를 들어 림프종, 간세포 암종, 두경부 편평 세포 암종 (즉, 두경부 암), 또는 교모세포종 치료용), 가용성 TRAIL (예를 들어 암, 예를 들어 간암 또는 폐 선암종 치료용), IFN-β (예를 들어 암, 예를 들어 결장직장암, 폐암, 신경모세포종, 또는 다형성 교모세포종 치료용), IFN-α (예를 들어 암, 예를 들어 전이성 흑색종 치료용), CD-40 리간드 (CD40L) 또는 CD40L 돌연변이체 (예를 들어 암, 예를 들어 폐암 치료용), 흑색종 분화-연관 유전자-7 및 인터루킨 24 (mda-7 및 IL24, 예를 들어 암, 예를 들어 에를리히 복수 종양 치료용), 아폽토틴 및 IL24 (예를 들어 암, 예를 들어 간암 치료용), IL24 (예를 들어 암, 예를 들어 혼합형-계통 백혈병 (MLL)/AF4 양성 급성 림프모구성 백혈병 (ALL) 치료용), IL15 (예를 들어 암, 예를 들어 전이성 간세포 암종 치료용), 이차 림프 조직 케모카인 (SLC, 예를 들어 암, 예를 들어 간암 치료용), Nk4 (간세포 성장 인자 (HGF)의 N-말단 헤어핀 및 후속 4개의 크링글 도메인, 예를 들어 암, 예를 들어 전이성 루이스 폐암종 치료용), 종양 괴사 인자 슈퍼패밀리 구성원 14 (TNFSF14, LIGHT로도 공지됨, 예를 들어 암, 예를 들어 자궁경부암 치료용), 과립구-대식세포 콜로니-자극 인자 (GM-CSF, 예를 들어 암 치료용), TNF-α (예를 들어 암, 예를 들어 신경교종 치료용), 서바이빈의 우성 음성 돌연변이체 (예를 들어, C84A 또는 T34A, 예를 들어 암, 예를 들어 결장암 또는 위암 치료용), 인간 텔로머라제 역전사효소의 C-말단 단편 (hTERTC27, 예를 들어 암, 예를 들어 다형성 교모세포종 치료용), 마스핀 (예를 들어 암, 예를 들어 전립선암 치료용), nm23H1 (예를 들어 암, 예를 들어 전이성 난소암 치료용), 인간 간세포 성장 인자의 크링글 1 도메인 (HGFK1, 예를 들어 암, 예를 들어 결장직장암종 치료용), 항-칼시토닌 리보자임 (예를 들어 암, 예를 들어 전립선암 치료용), 진핵생물 번역 개시 인자 4E-결합 단백질 1 (4EBP1, 예를 들어 암, 예를 들어 폐암 치료용), C-X-C 모티프 케모카인 수용체 2 (CXCR2) C-꼬리 서열 (예를 들어 암, 예를 들어 췌장암 치료용), 알파-토코페롤-연관 단백질 (TAP, 예를 들어 암, 예를 들어 전립선암 치료용), 트리코산틴 (예를 들어 암, 예를 들어 간세포 암종 치료용), 데코린 (예를 들어 암, 예를 들어 다형성 교모세포종 치료용), 카텔리시딘 (예를 들어 암, 예를 들어 결장암 치료용), 니만-피크 유형 C2 (NPC2, 예를 들어 암, 예를 들어 간세포 암종 치료용), 뮬러리안 억제 성분 (MIS, 예를 들어 암, 예를 들어 난소암 치료용), p53 (예를 들어 암, 예를 들어 기관지폐포암 치료용), 암 1에서 고도로 발현되는 shRNA (Hec1, 예를 들어 암, 예를 들어 신경교종 치료용), 엡스타인-바 바이러스 잠복막 단백질-1에 대한 shRNA (EBV LMP-1, 예를 들어 암, 예를 들어 비인두암 치료용), 인간 유두종 바이러스 16 E7 종양유전자에 대한 안티센스 RNA (HPV16-E7, 예를 들어 암, 예를 들어 자궁경부암 치료용), 안드로겐 수용체에 대한 shRNA (AR, 예를 들어 암, 예를 들어 전립선암 치료용), 달팽이에 대한 siRNA (SNA1로도 공지됨, 예를 들어 암, 예를 들어 췌장암 치료용), Slug에 대한 siRNA (즉, SNAI2의 단백질 생성물, 예를 들어 암, 예를 들어 담관암종 (간암) 치료용), 4.5 LIM-전용 단백질 2에 대한 shRNA (FHL2, 예를 들어 암, 예를 들어 결장암 치료용), miR-26a (예를 들어 암, 예를 들어 간세포 암종 치료용), HPV 16 구조적 단백질 L1 (HPV16-L1, 예를 들어 암, 예를 들어 자궁경부암 치료용), HPV 16 E5, E6, 및 E7 종양유전자 (HPV16 E5/E6/E7, 예를 들어 암, 예를 들어 자궁경부암 치료용), B-세포 백혈병/림프종 1 (BLC1) 이디오타입 (예를 들어 암, 예를 들어 B 세포 백혈병/림프종 1 치료용), 열 충격 단백질에 융합된 EBV LMP1 및 LMP2 (EBV LMP2/1-hsp, 예를 들어 암, 예를 들어 비인두 암종 치료용), 암종배아 항원 (CEA, 예를 들어 암, 예를 들어 결장암 치료용), 열 충격 단백질과 조합된 가용성 형태의 B 및 T 림프구 감쇠제 (BTLA 및 HSP70, 예를 들어 암, 예를 들어 흑색종 폐전이 치료용), HPV16-L1/E7 (예를 들어 암, 예를 들어 자궁경부암 치료용), HPV16-L1 (예를 들어 암, 예를 들어 자궁경부암 치료용), 항-EGFR 항체 (예를 들어, 14D1, 예를 들어 암, 예를 들어 외음부 암종 치료용), 항-사멸 수용체 5 (DR5) 항체 (예를 들어, 아드엑시맙(adximab), 예를 들어 암, 예를 들어 간암 또는 결장암 치료용), 항-에놀라제 1 (ENOI1) 항체 (예를 들어 암, 예를 들어 췌관 선암종 치료용), 항-VEGFA 항체 (예를 들어, 베바시주맙, 예를 들어 암, 예를 들어 전이성 폐암 또는 난소암 치료용), 뮤신 1 (MUC1) 항원 (예를 들어 암, 예를 들어 위암 치료용), 또는 아쿠아포린 (예를 들어, hAQP1, 예를 들어 방사선조사 유도 이하선 타액 기능저하, 즉, 구강건조증 치료용).
일부 측면에서, 관심 핵산 서열은 유전자 편집 (예를 들어, 유전적 결핍증, 장애 또는 질환의 치료를 포함하는 유전자 요법)에서 사용하기 위한 것이다.
일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위 (즉, 유전자 편집의 표적인 DNA 또는 RNA 서열 내의 부위)에 삽입하기 위한 것이다. 유전자 편집을 위한 표적 부위는 임의의 유전적 요소, 예컨대 임의의 시스 요소를 포함한다. 일부 측면에서, 유전자 편집을 위한 표적 부위는 유전자의 엑손, 유전자의 인트론, 또는 유전자의 조절 요소 내에 위치된다.
일부 측면에서, 유전자 편집은 엔도뉴클레아제를 포함한다. 일부 측면에서, 엔도뉴클레아제는 게놈 편집 시스템과 연관된다. 일부 측면에서, 엔도뉴클레아제는 예를 들어 귀소 엔도뉴클레아제, 부위-특이적 뉴클레아제, 구조-가이드 뉴클레아제, 또는 RNA-가이드 뉴클레아제 (예를 들어, 트랜스포존-코딩된 RNA-가이드 뉴클레아제)이다.
일부 측면에서, 유전자 편집은 유전자 편집을 위한 표적 부위 내에 이중-가닥 파단을 생성하는 게놈 편집 시스템을 포함한다. 일부 측면에서, 게놈 편집 시스템은 CRISPR-Cas, TALEN, ZFN 또는 메가뉴클레아제 유전자 편집 시스템이다.
일부 측면에서, 관심 핵산 서열은 이중-가닥 파단에서 비-상동성 말단 연결에 의해 유전자 편집을 위한 표적 부위에 삽입된다. 일부 측면에서, 이중-가닥 파단은 CRISPR-Cas 시스템에 의해 생성된다. 일부 측면에서, 본원에 기재된 바와 같은 발현 벡터는 제1 레콤비나제에 대한 제1 및 제2 표적 서열과 관심 핵산 서열 사이 (즉, 5' 슈퍼 서열과 관심 핵산 서열 사이 및 3' 슈퍼 서열과 관심 핵산 서열 사이)에 위치된 Cas 엔도뉴클레아제 표적 서열 (즉, gRNA 표적화 서열과 상동성인 서열)을 포함하며, 여기서 유전자 편집을 위한 표적 부위 (예를 들어, 염색체 내 표적 부위)는 동일한 Cas 엔도뉴클레아제 표적 서열을 포함한다. 예를 들어, 발현 벡터로부터 생성된 박테리아 서열-무함유 벡터 (예를 들어, msDNA) 내 핵산 서열을 플랭킹하는 Cas 엔도뉴클레아제 표적 서열의 프로세싱은 슈퍼 서열의 제거를 초래하며, 선형 공유 폐쇄형 박테리아 서열-무함유 벡터, 예컨대 msDNA를 대신 선형 및 개방형으로 만들고, 비-상동성 말단-연결 사건을 처리할 수 있는 반응성 말단이 갖도록 한다.
일부 측면에서, 관심 핵산 서열은 상동성-지정 복구에 의해 유전자 편집을 위한 표적 부위에 삽입되며, 이는 이중-가닥 파단을 플랭킹하는 서열과 관심 핵산 서열과 연관된 상동성 서열 사이의 재조합을 통해 발생한다.
일부 측면에서, 관심 핵산 서열은 상동성-지정 복구를 뒷받침하기 위해 이중-가닥 파단을 플랭킹하는 서열과 충분한 상동성을 갖는다.
일부 측면에서, 관심 핵산 서열은 5' 및 3' 상동성 아암 (즉, 상동성-지정 복구를 매개하기 위해 이중-가닥 파단을 플랭킹하는 서열과 충분한 상동성을 갖는 서열)에 의해 플랭킹된다.
일부 측면에서, 상동성-지정 복구를 매개하기에 충분한 상동성은 관심 핵산 서열과 이중-가닥 파단을 플랭킹하는 서열 사이 또는 관심 핵산 서열을 플랭킹하는 상동성 아암과 이중-가닥 파단을 플랭킹하는 서열 사이에 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95% 또는 약 100% 상동성을 포함한다. 일부 측면에서, 이중-가닥 파단을 플랭킹하는 서열은 이중-가닥 파단의 약 100개 염기, 약 90개 염기, 약 80개 염기, 약 70개 염기, 약 60개 염기, 약 50개 염기, 약 45개 염기, 약 40개 염기, 약 35개 염기, 약 30개 염기, 약 25개 염기, 약 20개 염기, 약 15개 염기, 약 10개 염기 또는 약 5개 염기 내에 있거나, 이중-가닥 파단을 바로 옆에 플랭킹한다.
일부 측면에서, 상동성-지정 복구는 CRISPR-Cas 시스템에 의해 이루어진다. 일부 측면에서, 본원에 기재된 바와 같은 발현 벡터는 CRISPR-Cas 시스템을 포함한다. 일부 측면에서, 발현 벡터는 Cas 엔도뉴클레아제 (예를 들어, 면역침묵된 Cas9-β2)를 코딩하는 서열의 각 측면을 플랭킹하는 tRNA-gRNA 폴리시스트론을 포함한다. 예시적인 측면은 도 49에 표시된다. 일부 측면에서, 발현 벡터는 인트론 내 tRNA-gRNA 폴리시스트론을 포함하는 본원에 기재된 바와 같은 5'UTR (예를 들어, 5'UTR1)을 포함한다. 일부 측면에서, 발현 벡터는 tRNA-gRNA 폴리시스트론을 포함하는 본원에 기재된 바와 같은 키메라 인트론을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 EF1-알파 프로모터는 고유 인트론에 tRNA-gRNA 폴리시스트론을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 폴리아데닐화 신호 또는 3'UTR은 tRNA-gRNA 폴리시스트론을 포함한다. 예를 들어, 플랭킹 tRNA-gRNA 폴리시스트론을 포함하는 벡터 (즉, 발현 벡터 또는 박테리아 서열-무함유 벡터 (예를 들어, msDNA))로부터 Cas 엔도뉴클레아제의 발현 시, gRNA는 유리 RNA로서 절개되고, 유전자 편집을 위한 표적 부위 (예를 들어, 염색체 내 표적 부위) 뿐만 아니라 벡터 상의 플랭킹 gRNA 부위로 Cas 엔도뉴클레아제를 표적화한다. 이는 벡터로부터 Cas 엔도뉴클레아제의 자기-제한을 초래하고, 이는 Cas 엔도뉴클레아제의 추가 발현을 제한한다. 이 프로세스의 개략도는 도 50에 나타냈으며, 이는 또한 별도의 벡터 상에 상동성 아암에 의해 플랭킹된 관심 핵산 (즉, 관심 유전자, GOI)을 사용한 상동성-지정 복구의 매개를 보여준다. 일부 측면에서, 본원에 기재된 바와 같은 발현 벡터는 예를 들어 도 51의 시나리오 1에 나타낸 바와 같이 상동성 아암에 의해 플랭킹된 관심 핵산 서열을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 관심 핵산 서열 및 자기-제한 CRISPR-Cas 시스템은 도 51의 시나리오 2에 나타낸 바와 같이 본원에 기재된 바와 같은 단일 발현 벡터에 위치된다. 후자의 측면에서, 자기-제한 CRISPR-Cas 시스템을 포함하는 서열은 상동성 아암에 의해 플랭킹된 관심 핵산 서열을 포함하는 서열에 대해 5'에 위치된다.
일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위와 상동성이고, 표적 부위와 비교하여 하나 이상의 뉴클레오티드 삽입, 결실, 역위 또는 재배열을 포함한다. 일부 측면에서, 관심 핵산은 게놈 서열, 코딩 영역, 엑손, 인트론, 또는 표적 부위에서 상동성 서열을 대체하는 이의 임의의 부분이다.
일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위와 비-상동성이다.
일부 측면에서, 관심 핵산 서열은 누락된 기능을 복원하거나, 비정상적인 기능을 수정하거나, 유전자 편집을 위한 표적 부위와 연관된 추가 기능을 제공한다.
일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위와 연관된 유전자 발현의 녹아웃을 위한 것이다 (즉, 유전자 침묵).
일부 측면에서, 관심 핵산 서열은 생체내 유전자 편집을 위한 것이다.
일부 측면에서, 관심 핵산 서열은 시험관내 유전자 편집을 위한 것이다.
일부 측면에서, 관심 핵산 서열은 생체외 유전자 편집을 위한 것이다 (예를 들어, 세포 요법, 예컨대 키메라 항원 수용체 (CAR) T 세포 요법).
일부 측면에서, 유전자 편집은 후성유전학적 변형을 포함하고, 본원에 기재된 바와 같은 발현 벡터는 관심 핵산으로서 후성유전학적 이펙터 분자를 포함한다. 일부 측면에서, 후성유전학적 이펙터 분자는 예를 들어 아세틸화 또는 탈아세틸화, 메틸화 또는 탈메틸화, 또는 인산화 또는 탈인산화를 매개한다. 일부 측면에서, 후성유전학적 이펙터 분자는 아세틸화 또는 탈아세틸화, 메틸화 또는 탈메틸화, 또는 인산화 또는 탈인산화를 억제한다. 일부 측면에서, 후성유전학적 변형은 히스톤 변형이다. 일부 측면에서, 히스톤 변형은 히스톤 아세틸화이고, 관심 핵산은 히스톤 아세틸트랜스퍼라제이다. 일부 측면에서, 히스톤 변형은 히스톤 탈아세틸화이고, 관심 핵산은 히스톤 데아세틸라제이다. 일부 측면에서, 후성유전학적 변형은 DNA 변형이다. 일부 측면에서, DNA 변형은 DNA 메틸화이고, 관심 핵산은 DNA 메틸라제이다. 일부 측면에서, DNA 변형은 DNA 탈메틸화이고, 관심 핵산은 DNA 탈메틸라제이다. 일부 측면에서, 후성유전학적 이펙터 분자는 염색체 상의 한 위치에 이펙터를 표적화하기 위해 표적화 분자, 예컨대 DNA-결합 분자에 융합된다.
일부 측면에서, 발현 카세트는 다유전자성이며, 즉, 발현 카세트는 각각 2개 이상의 폴리펩티드를 코딩하는 2개 이상의 관심 핵산 서열을 포함한다.
일부 측면에서, 발현 카세트는 폴리펩티드를 코딩하는 각 핵산 서열 사이에 자기-절단 펩티드를 코딩하는 핵산 서열을 포함하는 단일 오픈 리딩 프레임을 포함하여, 발현 카세트의 번역 생성물이 세포내에서 2개 이상의 폴리펩티드로 절단되도록 한다. 일부 측면에서, 자기-절단 펩티드는 2A 자기-절단 펩티드이다. 일부 측면에서, 2A 자기-절단 펩티드는 돼지 테스코바이러스-1로부터의 P2A이다. 일부 측면에서, 2A 자기-절단 펩티드는 토세아 아시그나(thosea asigna) 바이러스 2A로부터의 T2A이다. 일부 측면에서, 자기-절단 펩티드는 2A, P2A 및 T2A 중 임의의 하나 이상을 포함한다. 일부 측면에서, 자기-절단 펩티드는 P2A 및 T2A를 포함한다.
일부 측면에서, 발현 카세트는 유전자 발현에 대한 마커를 코딩하는 핵산 서열을 추가로 포함한다. 일부 측면에서, 유전자 발현에 대한 마커는 형광 리포터 유전자, 예컨대 녹색 형광 단백질 (GFP, 예를 들어 향상된 GFP (eGFP)), 적색 형광 단백질 (RFP), 황색 형광 단백질 (YFP), 또는 근적외선 형광 단백질 (iRFP); 생물발광 리포터 유전자, 예컨대 루시퍼라제 (예를 들어, 나노루시퍼라제, 즉, NanoLuc® (NLuc), England et al., Bioconjug. Chem. 27(5):1175-1187 (2016), 프로메가 코포레이션); 선택가능한 항생제 마커; 또는 LacZ이다. 일부 측면에서, 발현 카세트는 유전자 발현에 대한 마커를 코딩하는 핵산 서열과 폴리펩티드를 코딩하는 임의의 다른 핵산 서열 사이에 자기-절단 펩티드를 코딩하는 핵산 서열을 포함한다.
발현 카세트는 관심 핵산 서열(들)에 작동가능하게 연결된 관련 기술분야의 통상의 기술자에게 공지된 임의의 발현 제어 영역을 함유할 수 있다. 일부 측면에서, 발현 제어 영역은 프로모터, 인핸서, 오퍼레이터, 리프레서, 리보솜 결합 부위, 번역 리더 서열, 인트론, 폴리아데닐화 인식 서열, RNA 프로세싱 부위, 이펙터 결합 부위, 스템-루프 구조, 전사 종결 신호, 또는 이들의 조합이다.
일부 측면에서, 발현 벡터는 박테리아 서열-무함유 벡터를 생산하기 위한 것이다. 일부 측면에서, 박테리아 서열-무함유 벡터는 원형 공유 폐쇄형 벡터이다. 일부 측면에서, 박테리아 서열-무함유 벡터는 선형 공유 폐쇄형 벡터이다.
B. 벡터 생산 시스템
유도성 프로모터의 제어 하에 레콤비나제를 코딩하는 재조합 세포를 포함하는 벡터 생산 시스템이 본원에 제공되며, 여기서 재조합 세포는 제1 레콤비나제에 대한 제1 및 제2 표적 서열 및 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열을 함유하는 본원에 기재된 바와 같은 발현 벡터를 포함하고, 여기서 레콤비나제는 제1 레콤비나제에 대한 제1 및 제2 표적 서열 또는 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열 중 하나를 표적화한다.
벡터 생산 시스템에 사용하기에 적합한 숙주 세포는 미생물 세포, 예를 들어 박테리아 세포, 예컨대 이. 콜라이 세포, 및 효모 세포, 예컨대 에스. 세레비시아에(S. cerevisiae)를 포함한다. 차이니즈 햄스터 난소 (CHO) 세포 (예를 들어, K1 계통 (ATCC CCL 61) 또는 Pro5 변이체 (ATCC CRL 1281)); CV-1 계통 (ATCC CCL 70), COS-1 계통 (ATCC CRL 1650) 또는 COS-7 계통 (ATCC CRL 1651; 뮤린 L-세포; 뮤린 3T3 세포 (ATCC CRL 1658)의 SV40-형질전환된 아프리카 녹색 원숭이 신장으로부터 유래된 섬유모세포-유사 세포; 뮤린 C127 세포; 293 계통의 인간 배아 신장 세포 (ATCC CRL 1573); HeLa 계통의 것을 포함하는 인간 암종 세포 (ATCC CCL 2); 및 계통 IMR-32 (ATCC CCL 127), SK-N-MC (ATCC HTB 10) 또는 SK-N-SH (ATCC HTB 11)의 신경모세포종 세포를 포함하는 포유동물 숙주 세포가 또한 사용될 수 있다.
적합한 레콤비나제는 TelN, Tel, Tel (gp26 K02 파지), Cre, Flp, phiC31, Int, 및 다른 람도이드 파지 인테그라제, 예를 들어 phi 80, HK022 및 HP1 레콤비나제를 포함하나 이에 제한되지는 않는 본원에 기재된 바와 같은 레콤비나제에 대한 표적 서열에서 DNA 교환을 촉매작용한다. 일부 측면에서, 레콤비나제는 TelN, Tel, Cre 또는 Flp이다.
일부 측면에서, 재조합 세포는 유도성 프로모터의 제어 하에 엔도뉴클레아제를 추가로 코딩하고, 여기서 엔도뉴클레아제는 발현 벡터에서 엔도뉴클레아제 표적 서열을 표적화한다.
적합한 엔도뉴클레아제는 엔도뉴클레아제 표적 서열에서 폴리뉴클레오티드를 절단한다. 일부 측면에서, 엔도뉴클레아제는 귀소 엔도뉴클레아제이다. 일부 측면에서, 귀소 엔도뉴클레아제는 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I이다. 일부 측면에서, 엔도뉴클레아제는 I-SceI이다. 일부 측면에서, 엔도뉴클레아제는 PI-SceI이다. 일부 측면에서, 재조합 세포는 엔도뉴클레아제를 포함하는 뉴클레아제 게놈 편집 시스템을 코딩한다. 일부 측면에서, 게놈 편집 시스템은 CRISPR-Cas, TALEN, ZFN 또는 메가뉴클레아제 시스템이다. 일부 측면에서, 뉴클레아제 게놈 편집 시스템은 부류 1 또는 부류 2 CRISPR-Cas 시스템이다. 일부 측면에서, 뉴클레아제 게놈 편집 시스템은 유형 I, II, III, IV, V, 또는 VI CRISPR-Cas 시스템이다. 일부 측면에서, CRISPR-Cas 시스템 중 Cas 엔도뉴클레아제는 Cas9 (예를 들어, SpCas9, SaCas9, FnCas9 또는 NmCas9), Cas9 변이체 (예를 들어, Casβ9, xCas9, SpCas9-NG, SpCas9-NRRH, SpCas9-NRCH, SpCas9-NRTH, SpG, SpRY), Cas3, Cas12 (예를 들어, Cas12a, Cas12b, Cas12c, Cas12d 또는 Cas12e), Cas13 (예를 들어, Cas13a, Cas13b, Cas13c 또는 Cas13d), 또는 Cas14이다.
레콤비나제, 또는 레콤비나제 및 엔도뉴클레아제를 코딩하는 재조합 숙주 세포는 널리 공지된 기술을 사용하여 제조된다. 예를 들어, 선택된 레콤비나제 또는 엔도뉴클레아제를 코딩하는 핵산 서열은 세포 형질전환을 위한 적절한 조건 하에 적합한 벡터를 사용하여 세포에 도입된다. 재조합 숙주 세포는 발현 벡터를 통해, 또는 레콤비나제-코딩 및/또는 엔도뉴클레아제-코딩 핵산 서열의 숙주 세포 게놈으로의 통합에 의해 형질전환될 수 있다. 엔도뉴클레아제가 뉴클레아제 게놈 편집 시스템과 연관된 측면에서, 숙주 세포는 모든 구성성분을 포함하는 하나 이상의 발현 벡터를 사용한 숙주 세포의 형질전환, 모든 구성성분의 숙주 세포 게놈으로의 통합, 또는 구성성분의 형질전환 및 통합의 혼합물에 의해 뉴클레아제 게놈 편집 시스템의 모든 구성성분을 코딩하도록 설계될 수 있다. 일부 측면에서, 숙주 세포는 Cas 또는 Cas-유사 엔도뉴클레아제 및 gRNA를 코딩한다.
뉴클레아제 게놈 편집 시스템의 엔도뉴클레아제를 포함하는 레콤비나제 또는 엔도뉴클레아제의 발현은 유도성 프로모터, 즉 특정 물리적 또는 화학적 조건 또는 자극 하에 활성화되는 프로모터의 제어 하에 이루어진다. 일부 측면에서, 유도성 프로모터는 열-조절성, 화학적-조절성, IPTG 조절성, 글루코스-조절성, 아라비노스 유도성, T7 폴리머라제 조절성, 저온-충격 유도성, pH 유도성, 또는 이들의 조합이다.
제1 레콤비나제에 대한 제1 및 제2 표적 서열 및 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열을 함유하는 본원에 기재된 바와 같은 발현 벡터를 포함하는 재조합 세포가 본원에 제공된다. 일부 측면에서, 재조합 세포는 제1 레콤비나제 및/또는 본원에 기재된 바와 같은 하나 이상의 레콤비나제 중 하나 이상을 코딩한다. 일부 측면에서, 재조합 세포는 본원에 기재된 바와 같은 하나 이상의 엔도뉴클레아제를 코딩한다. 일부 측면에서, 재조합 세포는 본원에 기재된 바와 같은 뉴클레아제 게놈 편집 시스템을 코딩한다.
레콤비나제의 발현에 적합한 조건 하에 본원에 기재된 바와 같은 벡터 생산 시스템을 인큐베이션하는 것을 포함하는, 박테리아 서열-무함유 벡터를 생산하는 방법이 본원에 제공된다. 일부 측면에서, 방법은 재조합 세포에 의해 코딩된 엔도뉴클레아제의 발현에 적합한 조건 하에 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함한다. 일부 측면에서, 방법은 재조합 세포에 의해 코딩된 뉴클레아제 게놈 편집 시스템의 발현에 적합한 조건 하에 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함한다. 일부 측면에서, 방법은 박테리아 서열-무함유 벡터를 수확하는 것을 추가로 포함한다.
본원에 기재된 바와 같은 박테리아 서열-무함유 벡터를 생산하는 방법에 의해 생산된 박테리아 서열-무함유 벡터가 본원에 제공된다.
III. 박테리아 서열-무함유 벡터
하기를 포함하는 박테리아 서열-무함유 벡터가 본원에 제공된다: (a) 관심 핵산 서열을 포함하는 발현 카세트, 및 (b) 하기 중 하나 이상: (i) 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서, (ii) 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서, (iii) 인트론을 포함하는 5'UTR, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨, (iv) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터, (v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE, (vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR, 또는 (vii) 발현 카세트에 대해 5'에 위치된 DTS.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 다중 인접 카피, 예컨대, 예를 들어 1, 2, 3, 4, 5개 이상의 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 3개 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46의 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 닭 β-액틴 프로모터의 5' 말단에 통합된다. 일부 측면에서, 서열식별번호: 47과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다. 일부 측면에서, 서열식별번호: 47의 핵산 서열을 포함하는 키메라 인트론은 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서를 포함한다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 다중 인접 카피의 3' 말단에, 예컨대, 예를 들어 합성 인핸서의 1, 2, 3, 4, 5개 이상의 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 3개 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46의 핵산 서열의 3' 말단에 통합된다. 일부 측면에서, CMV 프로모터는 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합된다.
일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산 서열에 대해 5'에 위치된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산 서열에 대해 5'에 위치된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열을 포함한다. 일부 측면에서, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열, 또는 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열은 관심 핵산 서열에 대해 5'에 위치된 발현 카세트 내 모든 조절 요소를 포함한다.
일부 측면에서, 박테리아 서열-무함유 벡터는 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR (즉, 인트론을 포함하는 5'UTR)은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다.
일부 측면에서, 5'UTR은 5'UTR이 결여된 동일한 박테리아 서열-무함유 벡터와 비교하여 박테리아 서열-무함유 벡터로부터의 트랜스진 전사체 스플라이싱 및 번역을 개선하기 위한 것이다.
일부 측면에서, 인트론은 서열식별번호: 1과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 인트론은 서열식별번호: 1의 핵산 서열을 포함한다.
일부 측면에서, 5'UTR은 서열식별번호: 2와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 2의 핵산 서열을 포함한다.
일부 측면에서, 5'UTR은 서열식별번호: 4와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 4의 핵산 서열을 포함한다.
일부 측면에서, 5'UTR은 인트론 내에 통합된 비-코딩 서열을 추가로 포함한다.
일부 측면에서, 인트론은 서열식별번호: 1과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일하거나 서열식별번호: 1을 포함하고, 비-코딩 서열은 서열식별번호: 1의 위치 25 내지 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된다.
일부 측면에서, 비-코딩 서열은 비-원핵생물성 및 비-바이러스성이다. 일부 측면에서, 비-코딩 서열은 진핵생물이다. 일부 측면에서, 비-코딩 서열은 인트론, UCOE, S/MAR, SV40 인핸서 서열 (예를 들어, 하나 또는 하나 초과의 SV40 인핸서 서열, 예컨대 2, 3, 4, 5개 이상의 SV40 인핸서 서열), 척추동물 염색질 인슐레이터 (예를 들어, cHS4), WPRE, 또는 이들의 임의의 조합을 포함한다.
일부 측면에서, 비-코딩 서열은 S/MAR을 포함한다. 일부 측면에서, S/MAR은 서열식별번호: 9로서 본원에 제공된 MAR-5이다.
일부 측면에서, 5'UTR은 서열식별번호: 3과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 3을 포함한다.
일부 측면에서, 5'UTR은 서열식별번호: 5와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 5를 포함한다.
일부 측면에서, 5'UTR은 닭 β-액틴 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다.
일부 측면에서, 5'UTR은 CMV 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된다.
일부 측면에서, 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합되고, 여기서 프로모터는 CMV 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 다중 인접 카피의 3' 말단에, 예컨대, 예를 들어 합성 인핸서의 1, 2, 3, 4, 5개 이상의 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 합성 인핸서의 3개 인접 카피의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열의 3' 말단에 통합된다. 일부 측면에서, CMV 인핸서는 서열식별번호: 46의 핵산 서열의 3' 말단에 통합된다.
일부 측면에서, 박테리아 서열-무함유 벡터는 관심 핵산 서열의 3' 말단에 통합된 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호, 인간 베타-글로빈 폴리아데닐화 신호, 또는 하이브리드 제노푸스 라에비스 및 인간 베타-글로빈 폴리아데닐화 신호를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호, 인간 베타-글로빈 폴리아데닐화 신호, 또는 하이브리드 제노푸스 라에비스 및 인간 베타-글로빈 폴리아데닐화 신호의 다중 카피, 예컨대, 예를 들어 1, 2, 3, 4 또는 5개 카피를 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 폴리아데닐화 신호는 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15의 핵산 서열을 포함한다. 일부 측면에서, 폴리아데닐산 꼬리 (즉, 폴리(A) 꼬리는 폴리아데닐화 신호의 3' 말단에 위치된다. 일부 측면에서, 폴리(A) 꼬리는 길이가 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120개 이상의 잔기이다. 일부 측면에서, 폴리아데닐화 신호 및 폴리(A) 꼬리를 포함하는 서열은 서열식별번호: 16, 서열식별번호: 17 또는 서열식별번호: 18과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일하다. 일부 측면에서, 폴리아데닐화 신호 및 폴리(A) 꼬리를 포함하는 서열은 서열식별번호: 16, 서열식별번호: 17 또는 서열식별번호: 18을 포함한다.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 척추동물 염색질 인슐레이터를 포함한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 cHS4이다. 일부 측면에서, 척추동물 염색질 인슐레이터는 본원에 기재된 바와 같은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, 척추동물 염색질 인슐레이터는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.
일부 측면에서, 척추동물 염색질 인슐레이터는 서열식별번호: 8과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 척추동물 염색질 인슐레이터는 서열식별번호: 8을 포함한다.
일부 측면에서, 척추동물 염색질 인슐레이터는 척추동물 염색질 인슐레이터 없이 동일한 박테리아 서열-무함유 벡터와 비교하여 박테리아 서열-무함유 벡터의 확립 (즉, 형질감염 효율)을 개선하기 위한 것이다.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 WPRE를 포함한다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 S/MAR의 3' 말단 및 본원에 기재된 바와 같은 폴리아데닐화 신호의 5' 말단에서 발현 카세트에 통합된다. 일부 측면에서, WPRE는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.
일부 측면에서, WPRE는 서열식별번호: 11과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, WPRE는 서열식별번호: 11을 포함한다.
일부 측면에서, WPRE는 WPRE가 결여된 동일한 박테리아 서열-무함유 벡터와 비교하여 박테리아 서열-무함유 벡터로부터의 트랜스진의 발현을 개선한다.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 S/MAR을 포함한다. 일부 측면에서, S/MAR은 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된다. 일부 측면에서, S/MAR은 본원에 기재된 바와 같은 관심 핵산 서열의 3' 말단 및 WPRE의 5' 말단에서 발현 카세트에 통합된다. 일부 측면에서, S/MAR은 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.
일부 측면에서, S/MAR은 MAR-3, MAR-4 또는 MAR-5이다. 일부 측면에서, S/MAR은 서열식별번호: 9와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, S/MAR은 서열식별번호: 9를 포함한다.
일부 측면에서, S/MAR은 인간 CSP-B MAR 또는 CSP-C MAR이다. 일부 측면에서, S/MAR은 서열식별번호: 10과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, S/MAR은 서열식별번호: 10을 포함한다.
일부 측면에서, S/MAR은 S/MAR이 결여된 동일한 박테리아 서열-무함유 벡터와 비교하여 박테리아 서열-무함유 벡터의 발현 수준, 안정성 및/또는 내구성을 개선하기 위한 것이다 (예를 들어, 에피솜 유지 및 복제, 예컨대 딸 세포로의 벡터의 확장 및 분할에 의해, 및/또는 후성유전학적 침묵 방지에 의해).
일부 측면에서, 상기 기재된 바와 같은 (b)(i)-(b)(v) 중 임의의 하나 이상을 포함하는 박테리아 서열-무함유 벡터 (즉, DTS 없이)는 발현 카세트의 각 측면을 플랭킹하는 인핸서 서열을 추가로 포함한다. 일부 측면에서, 발현 카세트의 각 측면을 플랭킹하는 인핸서 서열은 발현 카세트의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열이다. 일부 측면에서, 인핸서 서열은 SV40 인핸서 서열이다.
일부 측면에서, 박테리아 서열-무함유 벡터는 DTS를 포함한다. 일부 측면에서, DTS는 발현 카세트에 대해 5'에 위치된다. 일부 측면에서, DTS는 SV40 인핸서 서열이다. 일부 측면에서, DTS는 세포-특이적이다. 일부 측면에서, DTS는 평활근 세포, 배아 줄기 세포, 유형 II 폐포세포, 내피 세포 또는 골모세포에 특이적이다.
일부 측면에서, 본원에 기재된 바와 같은 박테리아 서열-무함유 벡터는 발현 카세트 내 UCOE를 추가로 포함한다. 일부 측면에서, UCOE는 발현 카세트 내 프로모터 또는 임의의 인핸서에 대해 5'에 위치된다. 일부 측면에서, UCOE는 본원에 기재된 바와 같은 5'UTR의 인트론 내에 통합된다.
일부 측면에서, UCOE는 A2UCOE이다. 일부 측면에서, UCOE는 서열식별번호: 6과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, UCOE는 서열식별번호: 6이다.
일부 측면에서, UCOE는 SRF-UCOE이다. 일부 측면에서, UCOE는 서열식별번호: 7과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, UCOE는 서열식별번호: 7이다.
일부 측면에서, UCOE는 UCOE가 결여된 동일한 박테리아 서열-무함유 벡터와 비교하여 박테리아 서열-무함유 벡터로부터의 트랜스진의 발현을 개선한다.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 인핸서-1을 포함한다. 일부 측면에서, 인핸서-1은 발현 카세트 내 프로모터 또는 임의의 다른 인핸서에 대해 5'에 통합된다. 일부 측면에서, 인핸서-1은 UCOE의 3' 말단과 CMV 인핸서의 5' 말단 사이에 통합된다. 일부 측면에서, 인핸서-1은 서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 인핸서-1은 서열식별번호: 12이다.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 CMV, EF1, SV40, CAG, Rho, VDM2, HCR 또는 HLP 프로모터, 또는 이의 변이체를 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 CMV 프로모터 변이체를 포함한다.
일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 EF1-알파 프로모터를 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 발현 카세트 내 CMV 인핸서 및 EF1-알파 프로모터를 포함한다.
일부 측면에서, 박테리아 서열-무함유 벡터는 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함하는 발현 카세트 내 3'UTR을 포함한다. 일부 측면에서, 3'UTR은 관심 핵산 서열에 대해 3'에 통합된다.
일부 측면에서, 3'UTR은 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 13과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 13이다.
일부 측면에서, 3'UTR은 인간 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 14와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 14이다.
일부 측면에서, 3'UTR은 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호의 1개 카피 및 인간 베타-글로빈 폴리아데닐화 신호의 1개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 15와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 15이다.
일부 측면에서, 3'UTR은 100 내지 120개의 아데닌 뉴클레오티드, 즉, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119 또는 120개의 아데닌 뉴클레오티드를 포함하는 폴리(A) 꼬리를 추가로 포함한다.
일부 측면에서, 3'UTR은 서열식별번호: 16과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 16이다.
일부 측면에서, 3'UTR은 서열식별번호: 17과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 17이다.
일부 측면에서, 3'UTR은 서열식별번호: 18과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 18이다.
본원에 기재된 바와 같은 박테리아 서열-무함유 벡터의 관심 핵산 서열은 박테리아 서열-무함유 벡터를 생산하기 위한 발현 벡터와 관련하여 본원에 기재된 임의의 핵산 서열을 포함한다.
일부 측면에서, 본원에 기재된 바와 같은 박테리아 서열-무함유 벡터는 관심 핵산 서열에 대해 5' 및 3'에 위치된 Cas 엔도뉴클레아제 표적 서열 (즉, gRNA 표적화 서열과 상동성인 서열)을 포함하며, 여기서 유전자 편집을 위한 표적 부위 (예를 들어, 염색체 내 표적 부위)는 동일한 Cas 엔도뉴클레아제 표적 서열을 포함한다.
일부 측면에서, 본원에 기재된 바와 같은 박테리아 서열-무함유 벡터는 CRISPR-Cas 시스템을 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 Cas 엔도뉴클레아제 (예를 들어, 면역침묵된 Cas9-β2)를 코딩하는 서열의 각 측면을 플랭킹하는 tRNA-gRNA 폴리시스트론을 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 인트론 내 tRNA-gRNA 폴리시스트론을 포함하는 본원에 기재된 바와 같은 5'UTR (예를 들어, 5'UTR1)을 포함한다. 일부 측면에서, 박테리아 서열-무함유 벡터는 tRNA-gRNA 폴리시스트론을 포함하는 본원에 기재된 바와 같은 키메라 인트론을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 EF1-알파 프로모터는 고유 인트론에 tRNA-gRNA 폴리시스트론을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 폴리아데닐화 신호 또는 3'UTR은 tRNA-gRNA 폴리시스트론을 포함한다. 일부 측면에서, 본원에 기재된 바와 같은 관심 핵산 서열 및 자기-제한 CRISPR-Cas 시스템은 본원에 기재된 바와 같은 단일 박테리아 서열-무함유 벡터에 위치된다. 후자의 측면에서, 자기-제한 CRISPR-Cas 시스템을 포함하는 서열은 상동성 아암에 의해 플랭킹된 관심 핵산 서열을 포함하는 서열에 대해 5'에 위치된다.
본원에 기재된 바와 같은 박테리아 서열-무함유 벡터는 상기 변형의 임의의 조합을 함유할 수 있다. 일부 측면에서, 조합은 상승작용적 효과를 제공한다.
일부 측면에서, 박테리아 서열-무함유 벡터는 원형 공유 폐쇄형 벡터이다.
일부 측면에서, 박테리아 서열-무함유 벡터는 선형 공유 폐쇄형 벡터이다.
본원에 개시된 바와 같은 박테리아 서열-무함유 벡터를 포함하는 재조합 세포가 본원에 제공된다.
IV. 다른 발현 벡터
상기 기재된 개선 및 변형은 또한 다른 발현 벡터, 예컨대 박테리아 서열-무함유 벡터의 생산보다는 직접적인 유전자 발현을 위해 활용되는 발현 벡터 (그러나 이에 제한되지는 않음)에 적용될 수 있다. 일부 측면에서, 본원에 기재된 핵산 서열은 DNA 서열로서 제공되고, 발현 벡터는 DNA 발현 벡터이다. 일부 측면에서, 본원에 기재된 핵산 서열은 RNA 서열로서 제공되고, 발현 벡터는 RNA 발현 벡터이다. RNA 서열은 본원에 임의의 서열식별번호로서 제공된 DNA 서열에 상응할 수 있거나, 본원에 임의의 서열식별번호로서 제공된 DNA 서열에 상보적인 DNA 서열에 상응할 수 있다.
본원에 기재된 바와 같은 핵산 서열의 임의의 조합을 포함하는 폴리뉴클레오티드가 본원에 제공된다.
인트론, 인트론을 포함하는 5'UTR, 및/또는 본원에 기재된 바와 같은 3'UTR의 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에 제공된다.
서열식별번호: 1, 2, 3, 5, 13, 14, 15, 16, 17 또는 18 중 어느 하나와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드가 본원에 제공된다. 일부 측면에서, 폴리뉴클레오티드는 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 서열식별번호: 13, 14 또는 15 중 어느 하나와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열, 및 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 서열식별번호: 1, 2, 3, 5, 13, 14, 15, 16, 17 또는 18 중 어느 하나의 핵산 서열을 포함한다.
본원에 기재된 폴리뉴클레오티드 중 하나 이상을 포함하는 발현 벡터가 본원에 제공된다. 일부 측면에서, 발현 벡터는 서열식별번호: 1, 2, 3, 5, 13, 14, 15, 16, 17 또는 18 중 어느 하나와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함한다. 일부 측면에서, 폴리뉴클레오티드는 서열식별번호: 13, 14 또는 15 중 어느 하나와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열, 및 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함한다. 일부 측면에서, 발현 벡터는 서열식별번호: 1, 2, 3, 5, 13, 14, 15, 16, 17 또는 18 중 어느 하나의 핵산 서열을 포함하는 폴리뉴클레오티드를 포함한다. 일부 측면에서, 발현 벡터는 서열식별번호: 2, 3 또는 5 중 어느 하나의 핵산 서열을 포함하는 폴리뉴클레오티드, 및 (a) 서열식별번호: 13, 14, 15, 16, 17 또는 18 중 어느 하나의 핵산 서열을 포함하는 폴리뉴클레오티드, 또는 (b) 서열식별번호: 13, 14 또는 15 중 어느 하나의 핵산 서열을 포함하는 폴리뉴클레오티드 및 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 포함한다.
하기를 포함하는 발현 벡터가 본원에 제공된다: 인트론을 포함하는 5'UTR, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨, 및/또는 관심 핵산 서열에 대해 3'에 있는 발현 카세트에 통합된 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함하는 3'UTR.
일부 측면에서, 5'UTR은 서열식별번호: 2와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 2의 핵산 서열을 포함한다.
일부 측면에서, 5'UTR은 서열식별번호: 4와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 4의 핵산 서열을 포함한다.
일부 측면에서, 5'UTR은 인트론 내에 통합된 비-코딩 서열을 추가로 포함한다.
일부 측면에서, 인트론은 서열식별번호: 1과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일하거나 서열식별번호: 1을 포함하고, 비-코딩 서열은 서열식별번호: 1의 위치 25 내지 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된다.
일부 측면에서, 비-코딩 서열은 비-원핵생물성 및 비-바이러스성이다. 일부 측면에서, 비-코딩 서열은 진핵생물 서열이다. 일부 측면에서, 비-코딩 서열은 인트론, UCOE, S/MAR, SV40 인핸서 서열 (예를 들어, 하나 또는 하나 초과의 SV40 인핸서 서열, 예컨대 2, 3, 4, 5개 이상의 SV40 인핸서 서열), 척추동물 염색질 인슐레이터 (예를 들어, cHS4), WPRE, 또는 이들의 임의의 조합을 포함한다.
일부 측면에서, 비-코딩 서열은 S/MAR이다. 일부 측면에서, S/MAR은 서열식별번호: 9로서 본원에 제공된 MAR-5이다.
일부 측면에서, 5'UTR은 서열식별번호: 3과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 3을 포함한다.
일부 측면에서, 5'UTR은 서열식별번호: 5와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 5'UTR은 서열식별번호: 5를 포함한다.
일부 측면에서, 3'UTR은 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 13과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 13이다.
일부 측면에서, 3'UTR은 인간 베타-글로빈 폴리아데닐화 신호의 2개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 14와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 14이다.
일부 측면에서, 3'UTR은 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호의 1개 카피 및 인간 베타-글로빈 폴리아데닐화 신호의 1개 카피를 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 15와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 15이다.
일부 측면에서, 3'UTR은 100 내지 120개의 아데닌 뉴클레오티드, 즉, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119 또는 120개의 아데닌 뉴클레오티드를 포함하는 폴리(A) 꼬리를 추가로 포함한다.
일부 측면에서, 3'UTR은 서열식별번호: 16과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 16이다.
일부 측면에서, 3'UTR은 서열식별번호: 17과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 17이다.
일부 측면에서, 3'UTR은 서열식별번호: 18과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 3'UTR은 서열식별번호: 18이다.
서열식별번호: 12와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함하는 발현 벡터가 본원에 제공된다. 일부 측면에서, 발현 벡터는 서열식별번호: 12의 핵산 서열을 포함하는 합성 인핸서를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 다중 인접 카피, 예컨대, 예를 들어 1, 2, 3, 4, 5개 이상의 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 핵산 서열의 3개 인접 카피를 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46과 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함한다. 일부 측면에서, 합성 인핸서는 서열식별번호: 46의 핵산 서열을 포함한다.
서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열을 포함하는 발현 벡터가 본원에 제공된다. 일부 측면에서, 발현 벡터는 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열을 포함한다. 일부 측면에서, 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99% 동일한 핵산 서열, 또는 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39의 핵산 서열은 발현 벡터 내 관심 핵산 서열에 대해 5'에 위치된 발현 카세트 내 모든 조절 요소를 포함한다.
V. 조성물
본원에 기재된 바와 같은 발현 벡터 또는 박테리아 서열-무함유 벡터를 포함하는 조성물이 본원에 제공된다.
다양한 방법이 관련 기술분야에 공지되어 있으며, 핵산의 세포로의 도입에 적합하다. 예는 전기천공, 인산칼슘 매개 전달, 뉴클레오펙션, 초음파천공, 열 충격, 자기감염, 리포솜 매개 전달, 미세주사, 미세투사체 매개 전달 (나노입자), 양이온성 중합체 매개 전달 (DEAE-덱스트란, 폴리에틸렌이민, 폴리에틸렌 글리콜 (PEG) 등), 또는 세포 융합을 포함하나 이에 제한되지는 않는다.
나노입자 담체, 예컨대 리포솜, 미셀 및 중합체성 나노입자는 다양한 메커니즘, 예를 들어 향상된 투과성 및 체류 (EPR) 효과를 통해 치료제의 생체이용률 및 약동학적 특성을 개선하기 위해 조사되었다.
표적 세포로의 선택적 전달을 달성하기 위해 표적화 리간드의 나노입자로의 접합에 의해 추가 개선이 달성될 수 있다. 예를 들어, 수용체-표적화된 나노입자 전달은 시험관내 및 생체내 모두에서 치료 반응을 개선하는 것으로 나타났다. 조사된 표적화 리간드는 폴레이트, 트랜스페린, 항체, 펩티드 및 압타머를 포함한다. 추가적으로, 다중 기능성은 예를 들어 이미지화를 가능하게 하고 세포내 약물 방출을 촉발하기 위해 나노입자의 설계에 혼입될 수 있다.
일부 측면에서, 조성물은 전달제를 추가로 포함한다. 일부 측면에서, 전달제는 나노입자이다. 일부 측면에서, 전달제는 리포솜, 비-지질 중합체성 분자, 엔도솜 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된다.
일부 측면에서, 전달제 (예를 들어, 나노입자)는 표적화 리간드를 포함한다.
일부 측면에서, 조성물은 생리학적으로 허용되는 담체, 부형제 또는 안정화제를 추가로 포함한다. 예를 들어 문헌 [Remington: The Science and Practice of Pharmacy, 22nd ed. (2013)]을 참조한다. 허용가능한 담체, 부형제 또는 안정화제는 대상체에게 무독성인 것들을 포함할 수 있다. 일부 측면에서, 조성물 또는 조성물의 하나 이상의 구성성분은 멸균이다. 멸균 구성성분은 예를 들어 여과 (예를 들어, 멸균 여과막) 또는 방사선조사 (예를 들어, 감마 방사선조사)에 의해 제조될 수 있다.
일부 측면에서, 본원에 기재된 바와 같은 발현 벡터 또는 박테리아 서열-무함유 벡터를 포함하는 조성물은 제약상 허용되는 담체를 추가로 포함하는 제약 조성물이다.
본 발명의 부형제는 제약 조성물에 첨가될 때 "제약상 허용되는" 부형제로서 기재될 수 있으며, 이는 부형제가 건전한 의학적 판단의 범위 내에서 합리적 이익/위험 비율에 상응하는 원하는 접촉 지속시간에 걸쳐 과도한 독성, 자극, 알레르기 반응 또는 다른 문제가 되는 합병증 없이 인간 및 동물의 조직과의 접촉에 적합한 화합물, 물질, 조성물, 염 및/또는 투여 형태임을 의미한다. 일부 측면에서, 용어 "제약상 허용되는"은 연방 또는 주 정부의 규제 기관에 의해 승인되거나 미국 약전 또는 기타 일반적으로 인정되는 국제 약전에 동물, 더욱 특히 인간에 사용하기 위해 등재된 것을 의미한다. 다양한 부형제가 사용될 수 있다. 일부 측면에서, 부형제는 알칼리제, 안정화제, 항산화제, 접착제, 분리제, 코팅제, 외부 상 구성성분, 제어-방출 구성성분, 용매, 계면활성제, 습윤제, 완충제, 충전제, 연화제 또는 이들의 조합일 수 있지만 이에 제한되지는 않는다. 본원에 논의된 것 이외에 부형제는 문헌 [Remington: The Science and Practice of Pharmacy, 22nd ed. (2013)]에 나열된 부형제 (그러나 이에 제한되지는 않음)를 포함할 수 있다. 본원의 특정 분류에 부형제 (예를 들어, "용매")의 포함은 부형제의 역할을 제한하기보다는 예시하기 위한 것이다. 특정 부형제는 여러 분류에 속할 수 있다.
본 개시내용의 제약 조성물은 그의 의도된 투여 경로에 호환가능하도록 제형화된다. 예시적인 투여 경로는 장내, 국소, 비경구, 경구, 폐, 비강내, 정맥내, 표피, 경피, 피하, 근육내 또는 복강내 투여 또는 흡입을 포함한다. 본원에서 사용된 바와 같은 "비경구 투여"는 일반적으로 주사 또는 주입에 의한 장내 및 국소 투여 이외의 투여 방식을 의미하며, 제한 없이 정맥내, 근육내, 동맥내, 척수강내, 림프내, 병변내, 피막내, 안와내, 심장내, 피내, 복강내, 경기관, 피하, 표피하, 관절내, 피막하, 거미막하, 척수내, 경막외, 흉막내 및 흉골내 주사 및 주입, 뿐만 아니라 생체내 전기천공을 포함한다. 일부 측면에서, 제형은 비-비경구 경로를 통해, 일부 측면에서 경구로 투여된다. 다른 비-비경구 경로는 국소, 표피 또는 점막 투여 경로, 예를 들어 비강내, 질, 직장, 설하 또는 국소 경로를 포함한다.
일부 측면에서, 제약 조성물은 동결건조된다.
VI. 치료 용도 및 방법
본원에 기재된 바와 같은 발현 벡터, 박테리아 서열-무함유 벡터 또는 제약 조성물을 대상체에게 투여하는 것을 포함하는, 질환 또는 장애의 치료를 필요로 하는 대상체에서 질환 또는 장애를 치료하는 방법이 본원에 제공된다.
발현 벡터, 박테리아 서열-무함유 벡터 또는 조성물은 질환 또는 장애를 치료하는데 효과적인 임의의 투여 경로에 의해 대상체에게 투여될 수 있다.
일부 측면에서, 투여는 장내, 국소, 비경구, 경구, 폐, 비강내, 정맥내, 표피, 경피, 피하, 근육내, 척수강내 또는 복강내 투여, 흡입, 또는 뇌실내 (ICV) 주사, 거대 대조 투여 (ICM) 또는 요추 척수강내 천자 (LIT)를 통한 뇌척수액 (CSF)-기반 전달에 의해 이루어진다.
일부 측면에서, 투여는 비경구 또는 비-비경구 투여에 의해 이루어진다.
일부 측면에서, 비경구 투여는 주사 또는 주입에 의해 이루어진다.
일부 측면에서, 비경구 투여는 정맥내, 근육내, 동맥내, 척수강내, 림프내, 병변내, 피막내, 안와내, 심장내, 피내, 복강내, 경기관, 피하, 표피하, 관절내, 피막하, 안와뒤, 뇌실내, 거미막하, 척수내, 경막외, 흉막내 또는 흉골내 주사 또는 주입, 또는 생체내 전기천공, 뉴클레오펙션, 미세기포 또는 초음파에 의해 이루어진다.
일부 측면에서, 비-비경구 투여는 경구, 국소, 표피, 점막, 비강내, 질, 직장 또는 설하 투여이다.
일부 측면에서, 투여는 경구, 폐, 비강내, 정맥내, 표피, 경피, 피하, 근육내 또는 복강내 투여, 또는 흡입에 의해 이루어진다.
일부 측면에서, 투여는 경구, 비강 또는 폐 투여에 의해 이루어진다. 일부 측면에서, 투여는 비강 투여에 의해 이루어진다.
투여는 예를 들어 1회, 복수회 및/또는 1회 이상의 연장된 기간에 걸쳐 수행될 수 있다. 일부 측면에서, 투여는 1회, 2회 (예를 들어, 제1 투여 후 약 1주, 약 2주, 약 3주, 약 4주 또는 그 이상 후에 제2 투여), 약 1주마다 1회, 약 1개월마다 1회, 약 2개월마다 1회, 약 3개월마다 1회, 약 4개월마다 1회, 약 6개월마다 1회, 약 1년마다 1회 또는 약 10년마다 1회이다.
본원에 기재된 바와 같은 발현 벡터, 박테리아 서열-무함유 벡터 또는 제약 조성물로부터의 관심 핵산 서열을 유전자 편집을 위한 표적 부위에 삽입하는 것을 포함하는 유전자 편집 방법이 본원에 제공된다.
일부 측면에서, 삽입은 비-상동성 말단 연결에 의해 이루어진다.
일부 측면에서, 삽입은 상동성 지정 복구에 의해 이루어진다. 일부 측면에서, 관심 핵산 서열은 본원에 기재된 바와 같은 5' 및 3' 상동성 아암에 의해 플랭킹된다.
일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위와 상동성이고, 표적 부위와 비교하여 하나 이상의 뉴클레오티드 삽입, 결실, 역위 또는 재배열을 포함한다.
일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위와 비-상동성이다.
일부 측면에서, 관심 핵산 서열은 누락된 기능을 복원하거나, 비정상적인 기능을 수정하거나, 유전자 편집을 위한 표적 부위와 연관된 추가 기능을 제공한다.
일부 측면에서, 관심 핵산 서열은 유전자 편집을 위한 표적 부위와 연관된 유전자 발현의 녹아웃을 위한 것이다.
일부 측면에서, 유전자 편집 방법은 질환 또는 장애의 치료를 필요로 하는 대상체에서 질환 또는 장애를 치료하는 방법이다.
일부 측면에서, 관심 핵산 서열은 생체내 유전자 편집을 위한 것이다.
일부 측면에서, 관심 핵산 서열은 시험관내 유전자 편집을 위한 것이다.
일부 측면에서, 관심 핵산 서열은 생체외 유전자 편집을 위한 것이다 (예를 들어, 세포 요법, 예컨대 CAR T 세포 요법).
일부 측면에서, 방법은 시험관내 방법이다. 일부 측면에서, 시험관내 방법은 발현 벡터, 박테리아 서열-무함유 벡터 또는 제약 조성물을 세포에 투여하는 것을 추가로 포함한다 (예를 들어, 시험관내 또는 생체외 유전자 편집을 위해). 일부 측면에서, 시험관내 방법은 유전자 편집을 위한 엔도뉴클레아제, 또는 게놈 편집 시스템 또는 이의 구성성분 (예를 들어, CRISPR-Cas 시스템을 위한 Cas 엔도뉴클레아제 및 gRNA)을 세포에 투여하는 것을 추가로 포함한다. 일부 측면에서, 게놈 편집 시스템은 CRISPR-Cas, TALEN, ZFN 또는 메가뉴클레아제 유전자 편집 시스템이다.
일부 측면에서, 방법은 생체내 방법이다. 일부 측면에서, 생체내 방법은 발현 벡터, 박테리아 서열-무함유 벡터 또는 제약 조성물을 대상체에게 투여하는 것을 추가로 포함한다. 일부 측면에서, 생체내 방법은 유전자 편집을 위한 엔도뉴클레아제, 또는 게놈 편집 시스템 또는 이의 구성성분 (예를 들어, CRISPR-Cas 시스템을 위한 Cas 엔도뉴클레아제 및 gRNA)을 대상체에게 투여하는 것을 추가로 포함한다. 일부 측면에서, 게놈 편집 시스템은 CRISPR-Cas, TALEN, ZFN 또는 메가뉴클레아제 유전자 편집 시스템이다.
유전자 편집을 위한 엔도뉴클레아제, 또는 게놈 편집 시스템 또는 이의 구성성분은 전기천공 또는 투여에 적용가능한 벡터를 통한 방법을 포함하여 세포 또는 대상체에 핵산 서열 및/또는 폴리펩티드를 투여하기 위해 본원에 기재되거나 관련 기술분야에 공지된 바와 같은 임의의 방법에 의해 투여될 수 있다. 예를 들어, CRISPR-Cas 시스템을 포함하는 측면에서, Cas 및/또는 gRNA를 코딩하는 RNA가 투여될 수 있거나, Cas 및/또는 gRNA가 직접 투여될 수 있거나, Cas 및/또는 gRNA를 코딩하는 본원에 기재된 바와 같은 박테리아 서열-무함유 벡터 또는 발현 벡터가 투여될 수 있거나, 또는 Cas 및/또는 gRNA를 코딩하는 관련 기술분야에 공지된 임의의 다른 적합한 벡터가 투여될 수 있다.
일부 측면에서, 관심 핵산은 본원에 기재된 바와 같은 선형 공유 폐쇄형 박테리아 서열-무함유 벡터 (즉, msDNA)로 제공된다. 일부 측면에서, 유전자 편집에서 선형 공유 폐쇄형 박테리아 서열-무함유 벡터의 사용은 박테리아 서열-무함유 벡터의 말단이 폐쇄되고 이중 가닥 파단과 비-반응성이기 때문에 임의의 원치않는 비-상동성 말단 연결을 회피한다. 일부 측면에서, 유전자 편집에서 선형 공유 폐쇄형 박테리아 서열-무함유 벡터의 사용은 상동성-지정 복구를 향상시킨다. 일부 측면에서, 상동성-지정 복구를 위한 재조합 비율은 관심 핵산 서열이 원형 슈퍼코일링된 벡터에 의해 제공되는 경우보다 관심 핵산 서열이 본원에 기재된 바와 같은 선형 공유 폐쇄형 박테리아 서열-무함유 벡터에 의해 제공되는 경우 더 높다.
하기 실시예는 제한이 아닌 예시를 위해 제공된다.
실시예
실시예 1 - 키메라 인트론 또는 5'UTR을 함유하는 발현 벡터
A. 발현 벡터
부모 미니스트링 발현 벡터 (메디파지 바이오슈티칼스, 인크.(Mediphage Bioceuticals, Inc.), 캐나다 토론토, 미국 특허 번호 9,290,778 및 9,862,954)의 eGFP 코딩 서열인 pGL2-SS*-CAG-eGFP-BGpA-SS*를, 부모 벡터의 2개의 특수화된 슈퍼 서열 (SS*) 부위 사이의 향상된 녹색 형광 단백질 (eGFP) 및 세포외 발현을 위한 분비 서열로 변형된 NanoLuc® 루시퍼라제 리포터 (NLuc, 프로메가 코포레이션)를 코딩하는 발현 카세트로 대체함으로써 다유전자성 발현 벡터를 제조하였다.
부모 벡터 및 다유전자성 벡터의 발현 카세트는 CAG 프로모터를 함유하였으며, 이는 사이토메갈로바이러스 (CMV) 인핸서, 닭 β-액틴으로부터의 프로모터 및 키메라 인트론을 포함하는 합성 프로모터이다.
다유전자성 발현 벡터의 맵은 도 1에 표시되어 있으며 (pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*), 이는 CAG 프로모터를 함유하는 다유전자성 발현 카세트를 플랭킹하는 레콤비나제 표적 서열 (telL, FRT (minimal)(FRT (최소)) 및 loxP)을 갖는 특수화된 슈퍼 서열 부위 (SS*), P2A 및 T2A 자기-절단 펩티드에 의해 연결된 향상된 녹색 형광 단백질 (eGFP) 및 분비된 나노-루시퍼라제 (SecNLuc)를 코딩하는 서열 (SecNLuc-2A-eGFP), 및 토끼 베타-글로빈 폴리아데닐화 신호 (BGpA)를 함유한다. 벡터에 대한 핵산 서열은 서열식별번호: 19로서 제공된다.
5'UTR과 함께 동일한 eGFP 및 Nluc 서열을 pcDNA3.1 벡터 (써모피셔 사이언티픽)에 클로닝함으로써 제2 다유전자성 발현 벡터를 제조하였다. 발현 벡터의 맵은 도 2에 표시되어 있으며 (벡터 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA), 이는 CMV 인핸서/프로모터를 함유하는 다유전자성 발현 카세트, P2A 자기-절단 펩티드에 의해 연결된 eGFP 및 SecNLuc를 코딩하는 서열 (SecNLuc-P2A-eGFP), 및 소 성장 호르몬 폴리아데닐화 신호 (bGHpA)를 함유한다. 벡터에 대한 핵산 서열은 서열식별번호: 20으로서 제공된다.
B. HEK293 세포의 형질감염
접착성 인간 배아 신장 293 (HEK293) 세포를 1x105개 세포/웰로 24-웰 플레이트에 시딩하였다.
발현 벡터 (1 μg) 및 리포펙타민 (3 μL)의 복합체를 제조하고, (1) pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*, (2) pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA, 및 (3) pGL2-SS*-CAG-eGFP-BGpA-SS* 각각에 대한 표준 작업 절차를 사용하여 인큐베이션하였다.
3개의 복합체를 사용하여 개별 웰에서 전기천공을 통해 HEK293 세포를 별도로 형질감염시킨 후, 48시간 동안 인큐베이션하였다. 다른 웰의 HEK293 세포를 음성 대조군으로서 플라스미드를 함유하지 않는 3 μL 리포펙타민으로 처리하였다.
형질감염 48시간 후 세포질성 GFP 발현 및 루시퍼라제 발현에 대해 세포를 평가하였다.
C. 세포질성 GFP 발현
다유전자성 발현 벡터에 의한 형질감염 효율 및 유전자 발현 수준의 척도로서 세포질성 GFP 발현을 사용하였다. 형광 현미경검사에 의해 발현을 평가하고, 실험적 발현 벡터 (pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* 및 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA)의 평균 GFP 발현/강도를 음성 대조군 (플라스미드 없이 리포펙타민으로 처리된 세포) 및 양성 대조군 (pGL2-SS*-CAG-eGFP-BGpA-SS*) (본원에서 부모 플라스미드 CAG-GFP, 즉, PP-CAG-GFP로도 지칭됨)에 비해 측정하였다.
자동 노출 모드 하에 형광 세포의 라이브 이미지화는 실험적 발현 벡터가 유사한 발현을 갖는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*의 키메라 인트론 및 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA의 5'UTR과 함께 GFP를 생산하였음을 나타내었다. 도 3 및 4를 참조한다. 실험적 발현 벡터에 의한 다유전자성 발현은 양성 대조군과 비교하여 평균 상대적 형광 강도에 기초한 GFP 발현에 영향을 미치지 않았다. Id. 실험적 발현 벡터로 형질감염된 세포의 평균 형광 강도는 음성 대조군 세포보다 적어도 3배 더 높았다. 도 4를 참조한다.
D. 루시퍼라제 발현
제조업체 프로토콜에 따라 나노-글로(Nano-Glo)® 루시퍼라제 검정 시스템 (프로메가)을 사용하여 형질감염된 세포 및 음성 대조군 세포의 배지에서 분비된 루시퍼라제의 강도를 측정함으로써 루시퍼라제 발현을 평가하였다. 두 실험적 발현 벡터는 모두 루시퍼라제를 발현하였다. 도 5를 참조한다. 실험적 발현 벡터로 형질감염된 세포의 배지에서 평균 상대적 루시퍼라제 강도는 음성 대조군 세포의 배지에서보다 적어도 300배 더 높았다. Id.
실시예 2 - WPRE 및 조작된 5'UTR을 함유하는 발현 벡터
A. 발현 벡터
도 1의 발현 벡터에서 eGFP 및 BGpA를 코딩하는 서열 사이에 우드척 간염 바이러스 전사후 조절 요소 (WPRE)를 클로닝함으로써 다유전자성 발현 벡터를 제조하였다. 생성된 발현 벡터의 맵은 도 6에 표시되어 있다 (pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*). 벡터에 대한 핵산 서열은 서열식별번호: 21로서 제공된다.
도 6의 CAG 프로모터 대신 CMV 인핸서/프로모터 및 내부 최소 인트론 서열을 함유하는 조작된 5'UTR (즉, 5'UTR1, 서열식별번호: 2)을 함유하는 또 다른 다유전자성 발현 벡터를 제조하였다. 생성된 발현 벡터의 맵은 도 7에 표시되어 있다 (pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*). 벡터에 대한 핵산 서열은 서열식별번호: 22로서 제공된다.
도 6의 CAG 프로모터 대신 CMV 인핸서/프로모터 및 통합된 MAR-5를 갖는 인트론을 함유하는 조작된 5'UTR (즉, 5'UTR2, 서열식별번호: 5)을 함유하는 추가의 다유전자성 발현 벡터를 제조하였다. 생성된 발현 벡터의 맵은 도 8에 표시되어 있다 (pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*). 벡터에 대한 핵산 서열은 서열식별번호: 23으로서 제공된다.
B. 루시퍼라제 발현 수준 및 내구성
접착성 HEK293 세포를 분리하고, 전기천공 배지에서 분해하고, 1x106개 세포/튜브로 계수하였다.
발현 벡터 (1 μg)를 제조하고, (1) pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (실시예 1 참조), (2) pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, (3) pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, 및 (4) pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS* 각각에 대한 표준 작업 절차를 사용하여 세포와 함께 인큐베이션하였다.
포유동물 발현 카세트가 결여된 puc57 플라스미드로 전기천공된 HEK293 세포는 음성 대조군으로서 사용되었다.
전기천공 후, HEK293 세포를 시딩하고, 3x105개 세포/웰로 웰에 접착시켰다.
전기천공 후 2, 6, 10, 14, 17, 20, 27 및 34일차에, 제조업체 프로토콜에 따라 나노-글로® 루시퍼라제 검정 시스템 (프로메가)을 사용하여 4회의 형질감염 각각 및 음성 대조군에 대해 삼중으로 20 μL의 세포 배양 배지에서 분비된 루시퍼라제의 강도를 측정함으로써 루시퍼라제 발현을 평가하였다. 바이오텍(BioTek)® 플레이트 판독기를 사용하여 루시퍼라제 활성을 측정하고, 상대적 루미노미터 단위 (RLU)로 표시하였다. 루시퍼라제 활성의 통계적 분석을 스튜던트 T-테스트에 의해 수행하였다. 도 9를 참조하며, 이는 음성 대조군 (Neg. Ctl. (플라스미드 없음))과 비교하여 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (pGL2-SecNLuc-eGFP), pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (WPRE), pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (5'UTR1+WPRE), 또는 pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (5'UTR2+WPRE)로 형질감염된 세포로부터의 배지 내 발현 수준을 보여준다. * = p<0.05, ** = p<0.01, *** = p<0.001 및 **** = p<0.0001.
4개의 발현 벡터 중 임의의 것으로 형질감염된 세포로부터 실험 지속시간 내내 루시퍼라제 발현을 검출하였다. pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, 및 pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*는 모두 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*와 비교하여 유의하게 더 높은 루시퍼라제 발현을 나타내었으며, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*는 가장 높은 발현 향상을 나타내었다.
C. 딸 세포로의 벡터 확장 및 루시퍼라제 발현
본 실시예의 파트 B에 기재된 바와 같이 음성 대조군으로서 4개의 발현 벡터 또는 puc57 플라스미드로 HEK293 세포를 형질감염시켰다. 세포를 계대 동안 매주 5회 계대배양하였다. 세포 계대 시, 계대 번호 1-3의 경우 세포를 원래 세포 밀도의 1/6로, 계대 번호 4-5의 경우 원래 세포 밀도의 1/10로 재시딩하였다. 각 세포 계대에 대해, 분비된 루시퍼라제 발현을 본 실시예의 파트 B에 기재된 바와 같이 세포 재시딩 후 6-8일에 측정하였다. 도 10을 참조하며, 이는 각 계대 번호에서 음성 대조군과 비교하여 벡터로 형질감염된 세포로부터의 배지 내 발현 수준을 보여준다. 통계적 분석 및 p 값은 본 실시예의 파트 B에 언급된 바와 같다.
각 계대 번호에서 4개의 발현 벡터 중 임의의 것으로 형질감염된 세포로부터 루시퍼라제 발현을 검출하였으며, 이는 벡터가 루시퍼라제의 내구성 있는 발현을 갖는 딸 세포로 계대되었음을 보여준다. pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, 및 pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*는 모두 각 계대 번호에서 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*와 비교하여 유의하게 더 높은 루시퍼라제 발현을 나타내었으며, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*는 가장 높은 발현 향상을 나타내었다.
후속 연구에서, 루시퍼라제의 내구성 있는 발현을 갖는 딸 세포로의 msDNA 확장이 또한 관찰되었다.
간략하게, 본원 및 미국 특허 번호 9,290,778 및 9,862,954에 기재된 방법을 사용하여 유도성 이. 콜라이 벡터 생산 시스템에서 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*로부터 msDNA를 생산하였다. (1) msDNA (즉, msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA) (2) 부모 플라스미드 (즉, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*), 및 (3) 루시퍼라제 발현 카세트를 갖는 통상적인 플라스미드 (즉, pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA)를 사용하여 리포펙타민과의 별도의 복합체를 제조하였다. HEK293 세포를 총 0.25 pmol 벡터/웰에 대해 개별 웰에서 전기천공을 통해 벡터로 별도로 형질감염시켰다. 세포를 7회 계대배양하였으며, 각 계대마다 10배 세포 희석을 수행하였다. 상대적 루시퍼라제 강도를 계대 번호 1, 2, 3, 4, 5, 6 및 7에 대해 각각 8, 15, 24, 31, 38, 45 및 52일차에 결정하였다.
도 11에 나타낸 바와 같이, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (즉, pDNA (CMV+U1+W)) 및 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (즉, msDNA (CMV+U1+W)는 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (즉, 슈퍼서열을 함유하지 않는 통상적인 플라스미드 (통상적인 pcDNA))보다 모든 계대 번호에 걸쳐 훨씬 더 높은 수준에서 내구성 있는 트랜스진 발현을 나타내었다. 통상적인 플라스미드 데이터세트와 비교하여 ** = p<0.01, *** = p<0.001 및 **** = p<0.0001.
D. 딸 세포로의 벡터 확장 및 eGFP 발현
pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (pGL2-SecNLuc-eGFP) 또는 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (5'UTR1+WPRE)로 형질감염되고 본 실시예의 파트 C에 따라 계대된 세포를 eGFP 발현에 대해 분석하였다.
각 계대 번호에 대해 세포 계대 후 6 내지 8일에 이미지화를 수행하였다. 바이오텍® 사이테이션™ 5 플레이트 판독기를 사용하여 라이브 세포 이미지화를 수행하였다. 도 12A를 참조하며, 이는 계대 번호 1, 2, 3 및 5에서 HEK-293 세포 내 형광의 대표적인 현미경사진을 보여준다. 각 계대 번호에서 발현 벡터 중 하나로 형질감염된 세포로부터 eGFP 발현을 검출하였으며, 이는 벡터가 eGFP의 내구성 있는 발현을 갖는 딸 세포로 계대되었음을 보여준다. pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*와 비교하여 각 계대 번호에서 가장 강한 형광 신호를 나타내었으며, 이는 더 높은 형질감염 효율을 나타낸다.
각 발현 벡터에 대해 각 삼중 웰로부터 하나의 대표적인 이미지를 채취하고, 이미지제이(ImageJ) 컴퓨터 소프트웨어를 사용하여 수동 세포 계수에 의해 eGFP 발현 세포 (GFP+)를 정량화하였다. 스튜던트 t-테스트를 사용하여 GFP+ 세포의 통계적 분석을 수행하였다. 도 12B를 참조하며, 이는 각 계대 번호에서 삼중 라이브 형광 이미지로부터 관측 시야에서 관찰된 GFP+ 세포의 선 그래프를 보여준다 (삼중 이미지의 변동으로 인해 유의하지 않음 (ns) = p>0.05).
이미지제이 소프트웨어를 사용하여 각 GFP+ 세포를 수동으로 선택하고, 픽셀 강도에 기초하여 각 세포에 대한 평균 형광 강도 (MFI)를 측정하였다. 각 세포에 대한 최종 MFI 값을 계산하기 위해, 하기 공식을 사용하였다 (최종 MFI = 세포 MFI - 배경 MFI). 각 처리군에 대해 촬영된 3개의 이미지 각각으로부터 적어도 50개의 세포에 대해 MFI 측정을 수득하였다. 그 후, 모든 MFI 측정을 풀링하고, 도트 플롯을 생성하는데 사용하였다. 스튜던트 t-테스트를 사용하여 통계적 분석을 수행하였다. 도 12C를 참조하며, 이는 계대 번호 5에서 MFI의 도트 플롯을 보여준다 (pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*의 경우 n = 257 세포 및 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 경우 n = 414 세포, ****=p<0.0001). 도 12C의 기본 막대 그래프는 모든 측정된 GFP+ 세포에 대한 평균 MFI 값을 보여준다. pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 MFI는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*보다 약 3배 더 높은 것으로 측정되었다.
실시예 4 - 동물 모델에서 msDNA를 사용한 비바이러스 전달
msDNA의 간, 망막 및 뇌로의 표적화된 전달을 평가하기 위한 연구를 수행하였다. 각 표적 조직에 대해, 상이한 투여 경로 (ROA), 용량, 투약 요법 및 전달 기술을 평가하였다. 분비된 루시퍼라제 발현 동역학, 세포질성 eGFP 발현 수준, 및 형질감염 효율 (TE)을 평가하였다. 또한, 생리학적 평가, 조직 형태학 분석, 혈장 시토카인 검정 및 간 독성 분석에 의해 단일 또는 다중 주사 후 msDNA에 대한 관용성을 평가하였다.
모든 전달 기술에 걸쳐, msDNA는 각각 다중 뇌실내 (ICV) 또는 유체역학적 주사 (HDI) 및 정맥내 (IV) 주사를 통해 뇌 및 간 조직에서 강한 효능 및 관용성 프로파일을 나타내었다. msDNA로 처리된 성체 마우스는 단일 IV 주사 후 지속적인 분비된 루시퍼라제 수준 (>108 RLU/mg 단백질)을 나타내었다. msDNA는 단일 IV 주사 후 간 조직에서 내구성 있는 (>100일) 발현을 나타내었다. 심부 조직 영역에 대한 유의한 생체분포가 또한 입증되었으며, 뇌간, 소뇌, 피질 및 시상에서 80% 내지 97% TE가 있다. 나노담체-msDNA 복합체를 사용한 삼중 ICV 주사는 어떠한 부작용도 나타내지 않았다.
A. 간
1. 담체-무함유 네이키드 플라스미드의 단일 높은 용량, 2 mg/kg (50 μg), 유체역학적 주사로부터 루시퍼라제의 발현
C57BL/6J 수컷 야생형 성체 8-12주령 마우스는 꼬리 정맥을 통해 유체역학적 주사 (HDI)에 의해 2 mg/kg (50 μg)의 담체-무함유 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (슈퍼서열을 함유하지 않는 양성 대조군), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*의 단일 높은 용량을 투여받았다. 루시퍼라제 유전자 발현을 검사하기 위해 HDI 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 처리된 마우스의 혈장을 수집하였다. 벡터 투여 후 1일차에, 모든 마우스는 높은 수준의 루시퍼라제 발현을 나타내었다 (혈장 단백질 mg당 108 - 109 RLU). -7일차에, pCAGLuc 및 pCAGLuc-WPRE 처리된 마우스는 107 - 108 RLU/mg의 혈장 단백질을 생성하였지만, pGSNLuc-WPRE 처리된 마우스는 더 낮은 루시퍼라제 수준을 생성하였다 (~106 RLU/mg 단백질). 벡터 투여 후 8주 후에, 모든 마우스는 낮은 수준의 루시퍼라제 발현을 나타내었다 (약 105 RLU/mg 단백질). 루시퍼라제 수준의 급격한 감소는 플라스미드 처리된 마우스에서 유도된 체액성 또는 세포-매개 면역 반응으로부터 발생하였을 수 있다. 도 13-14를 참조한다.
2. 담체-무함유 네이키드 플라스미드의 단일 낮은 용량, 0.2 mg/kg (5 μg), 유체역학적 주사로부터 루시퍼라제의 발현
동물 모델에서 비바이러스 유전자 전달 후 플라스미드 DNA의 용량 반응을 테스트하기 위해, C57BL/6J 수컷 야생형 성체 8-12주령 마우스는 꼬리 정맥을 통해 HDI에 의해 0.2 mg/kg (5 μg)의 담체-무함유 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (슈퍼서열을 함유하지 않는 양성 대조군, 2마리 마우스), pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* (2마리 마우스), 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* (2마리 마우스)의 단일 낮은 용량을 투여받았다. 추가 2마리의 마우스는 주사받지 않았으며 음성 대조군으로서 사용되었다. 루시퍼라제 유전자 발현을 검사하기 위해 HDI 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 마우스의 혈장을 수집하였다. pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS* 및 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*로 처리된 마우스는 벡터 투여 후 8주 초과 동안 지속적인 높은 수준의 루시퍼라제 발현 (107 -108 RLU/mg 단백질)을 나타내었고, 동질유전자 발현 카세트를 갖지만 슈퍼서열 (SS)을 갖지 않는 통상적인 대조군 플라스미드보다 100배 이상 더 높은 발현을 나타내었다. 도 15를 참조한다.
벡터의 HDI 24시간 후 플루오로푸리마진 (FFz)의 1:5 희석액을 복강내로 주사함으로써 IVIS를 사용한 생체내 전신 생물발광 이미지화 (BLI)를 수행하였다. BLI는 혈장 샘플 내 루시퍼라제 수준과 상관관계가 있는 것으로 나타났다 (데이터는 표시되지 않음).
3. 담체-무함유 네이키드 msDNA의 단일 낮은 용량, 0.2 mg/kg (5 μg), 유체역학적 주사로부터 루시퍼라제의 발현
본원 및 미국 특허 번호 9,290,778 및 9,862,954에 기재된 방법을 사용하여 유도성 이. 콜라이 벡터 생산 시스템에서 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* 및 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*로부터 msDNA를 생산하였다.
C57BL/6J 수컷 야생형 성체 8-12주령 마우스는 꼬리 정맥을 통해 유체역학적 주사 (HDI)에 의해 0.2 mg/kg (5 μg)의 담체-무함유 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군, 5마리 마우스), msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (5마리 마우스), 또는 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (5마리 마우스)의 단일 낮은 용량을 투여받았다. 추가 2마리의 마우스는 주사받지 않았으며 음성 대조군으로서 사용되었다. 루시퍼라제 유전자 발현을 검사하기 위해 HDI 후 1, 3, 7, 10, 15, 22, 28, 42 및 56일차에 처리된 마우스의 혈장을 수집하였다.
플라스미드 처리된 마우스와 유사하게, msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA 처리된 마우스는 벡터 투여 후 8주 초과 동안 지속적인 높은 수준의 루시퍼라제 발현 (107 - 108 RLU/mg 단백질)을 생성한 반면, msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA 처리된 마우스의 루시퍼라제 발현은 1개월도 안되어 낮은 수준 (~106 RLU/mg 단백질)으로 떨어졌다. msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA 처리된 마우스에서 루시퍼라제 발현의 급격한 감소는 간세포에서 CMV 프로모터의 침묵으로 인한 것 같다.
IVIS를 사용한 전신 라이브 이미지화를 통해 루시퍼라제 유전자 발현을 확인하였다.
하기 표 1은 혈장 샘플 내 루시퍼라제 발현 (RLU/mg 단백질) 및 BLI (광자/초)에 의해 검출된 바와 같이 1, 7 및 28일차에 개별 마우스로부터의 데이터를 제공한다.
<표 1>
도 16에 나타낸 바와 같이, msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA로 처리된 마우스는 HDI 후 56일차에 부모 플라스미드, pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*와 비교하여 루시퍼라제 발현의 10배 증가를 나타내었다.
데이터는 마우스에서 msDNA를 사용한 비바이러스 전달이 고도로 효율적이었고 생성된 유전자 발현이 2개월 초과 동안 안정적이었음을 보여준다.
4. 담체-무함유 네이키드 msDNA의 단일 낮은 용량, 0.2 mg/kg (5 μg), 유체역학적 주사로부터의 eGFP의 발현
세포내 세포질성 eGFP 발현 수준을 ELISA에 의해 평가하였다. 간략하게, 파트 3에 기재된 바와 같이 0.2 mg/kg (5 μg)의 벡터의 단일 낮은 용량을 사용하여 HDI 후 56일에 마우스로부터 간 샘플을 수집하고, 단백질 추출을 위해 균질화하였다. 간 용해물로부터 총 단백질 농도를 결정하였다. 그 후, GFP 단백질 수준을 ELISA에 의해 분석하였다.
도 17의 데이터를 루시퍼라제에 대한 데이터와 비교함으로써 분명한 바와 같이, 세포질성 GFP 발현 수준은 동일한 구축물로부터의 루시퍼라제의 분비 수준과 직접적으로 상관관계가 있었다.
도 18에 나타낸 바와 같이, 5 μg의 담체-무함유 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BgpA의 단일 HDI 꼬리 정맥 주사는 HDI 후 최소 56일 동안 간 조직에서 강하고 내구성 있는 세포질성 eGFP 발현을 보여주었다.
5. 낮은 용량 단일 정맥내 주사 후 간에서의 msDNA 발현 및 관용성 프로파일
C57BL/6J 수컷 야생형 성체 8-12주령 마우스는 단일 정맥내 꼬리 정맥 주사를 통해 지질 나노입자 담체로 리포플렉스된 0.3 mg/kg pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (슈퍼서열을 함유하지 않는 양성 대조군), msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA, 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*를 투여받았다. 담체는 또한 음성 비히클 대조군으로서 사용되었다.
벡터의 단일 IV 주사 후 1, 3, 10, 30, 58, 92, 119 및 174일차에 상기 기재된 바와 같이 IVIS를 사용한 생체내 전신 생물발광 이미지화 (BLI)를 수행하였다. 도 19에 나타낸 바와 같이, msDNA 구축물은 전구체 및 통상적인 플라스미드보다 성능이 뛰어나며 높고 지속적인 루시퍼라제 분비를 보여준다.
혈청 알라닌 아미노트랜스퍼라제 (ALT) 수준, 간 세포독성 및 시토카인 반응을 또한 벡터 주사 후 평가하였다. CAG 프로모터를 함유하는 전구체 플라스미드 및 msDNA는 CMV 프로모터를 함유하는 구축물와 비교하여 더 높은 관용성 프로파일을 나타내었다. 그러나, CMV 프로모터를 함유하는 msDNA는 CMV 전구체 부모 및 통상적인 플라스미드와 비교하여 극적으로 더 낮은 시토카인 및 간 독성 반응을 나타내었다. 주사 후 4시간 및 14일에 간 기능 마커의 시토카인 농도 (pg/mL) 및 효소 농도 (U/L)를 보여주는 하기 표 2를 참조한다.
<표 2>
B. 뇌
본원 및 미국 특허 번호 9,290,778 및 9,862,954에 기재된 방법을 사용하여 유도성 이. 콜라이 벡터 생산 시스템에서 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS* 및 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*로부터 msDNA를 생산하였다.
성체 야생형 마우스는 이식 후 0, 14 및 28일차에 이식된 캐뉼라를 통해 각각 1 μg DNA의 3회 뇌실내 (ICV) 주사에 의해 나노담체로 제형화된 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA (3마리 마우스) 또는 나노담체로 제형화된 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA (3마리 마우스)를 투여받았다. 이식 후 42일차에 동물을 안락사시키고, 피질, 시상, 뇌간 및 소뇌로부터 시상면 뇌 섹션을 수집하였다.
도 20은 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 처리군의 마우스 #1로부터의 피질, 시상, 뇌간 및 소뇌 섹션을 보여준다. 섹션의 msDNA에 대한 형질감염 효율은 피질, 시상, 뇌간 및 소뇌 (푸르킨예 세포)에서 각각 81.9%, 73.0%, 69.2% 및 96.0%로 결정되었다. 형질감염 효율은 모든 DAPI-양성 세포 중 GFP 및 DAPI 모두에 양성인 세포의 백분율로서 계산되었다.
msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 처리군의 마우스 #1 및 대조군 플라스미드, pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA를 주사받은 마우스로부터의 피질, 시상 및 뇌간 섹션에서의 GFP 발현 간의 비교는 형질감염 효율 및 생성된 GFP 발현이 통상적인 플라스미드에 비해 msDNA에서 더 높았음을 나타내었다 (데이터는 표시되지 않음).
도 21은 피질 및 시상으로부터의 섹션을 보여주고, 도 22는 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 처리군의 마우스 #2로부터의 뇌간 및 소뇌로부터의 섹션을 보여준다. 뉴런은 뉴런 마커 NeuN으로 표시되었으며 형질감염된 세포는 GFP를 발현하는 것으로 나타났다. 형질감염 효율은 피질, 시상, 뇌간 및 소뇌 (푸르킨예 세포)에서 각각 99.6%, 98.8%, 98.5% 및 80.8%로 결정되었다. 형질감염 효율은 모든 NeuN-양성 세포 중 GFP 및 NeuN 모두에 대해 양성인 세포의 백분율로서 계산되었다.
도 23은 피질 및 시상으로부터의 섹션을 보여주고, 도 24는 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA를 주사받은 처리군의 마우스 #1로부터의 뇌간 및 소뇌로부터의 섹션을 보여준다. 뉴런은 뉴런 마커 NeuN으로 표시되었으며 형질감염된 세포는 GFP를 발현하는 것으로 나타났다. 형질감염 효율은 피질, 시상, 뇌간 및 소뇌 (푸르킨예 세포)에서 각각 91.1%, 88.8%, 73.7% 및 92.1%로 결정되었다. 형질감염 효율은 모든 NeuN-양성 세포 중 GFP 및 NeuN 모두에 대해 양성인 세포의 백분율로서 계산되었다.
하기 표 3은 msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA ("CAG-WPRE") 또는 msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA ("CMV-WPRE")를 주사받은 마우스에 대해 상기 논의된 형질감염 효율을 요약한다.
<표 3>
이식된 캐뉼라를 통한 반복된 ICV 주사는 세포독성 또는 신경변성의 징후 없이 우수한 전체 조직 무결성을 초래하였다.
데이터는 msDNA가 재투여 가능하고 형태학적 유해 효과 없이 다중 뇌 영역에서 높은 형질감염 효율, 생체분포 및 트랜스진 발현을 초래하였음을 보여준다.
실시예 5 - 인간 세포에서의 효능 및 안전성
pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (양성 대조군), msDNA-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA, pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*, msDNA-CAG-SecNLuc-2A-eGFP-WPRE-BGpA, 또는 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*를 각각 지질 나노입자 담체로 리포플렉스시켰다.
인간 T 세포 (Pan-T(TA+)) 및 간세포 (Huh7)를 0.3 μg/mL 또는 1 μg/mL 용량의 리포플렉스된 벡터에 의해 형질감염시켰다.
리포플렉스된 msDNA 벡터는 부모 및 통상적인 플라스미드와 비교하여 형질감염 후 3 및 5일차에 두 세포 유형 모두에서 높은 발현을 나타내었다. 도 25-26을 참조한다.
리포플렉스된 msDNA는 생체외 인간 말초 혈액 단핵 세포 (PBMC)에서도 잘 관용되었다. 특히, msDNA는 통상적인 플라스미드와 비교하여 인간 PBMC에서 유의하게 더 낮은 시토카인 프로파일 수준을 나타내었다 (데이터는 표시되지 않음).
실시예 6 - msDNA를 사용한 상동성 지정 복구
통상적인 플라스미드 DNA와 비교하여 msDNA에 의해 매개되는 상동성 지정 복구를 평가하기 위한 연구를 수행하였다.
5' 및 3' 상동성 아암에 의해 플랭킹된 관심 유전자 (GOI)를 함유하는 발현 카세트 (플라스미드 DNA HDR-GOI-HDR)를 사용하여 통상적인 플라스미드를 생산하였다.
2개의 슈퍼 서열 부위에 의해 플랭킹된 통상적인 플라스미드에서 사용된 바와 동일한 HDR-GOI-HDR 서열을 사용하여 msDNA 발현 벡터를 생산하였다. 그 후, 본원 및 미국 특허 번호 9,290,778 및 9,862,954에 기재된 방법을 사용하여 유도성 이. 콜라이 벡터 생산 시스템에서 HDR-GOI-HDR을 함유하는 msDNA (msDNA HDR-GOI-HDR)를 생산하였다.
GOI의 상동성 지정 복구 녹인 (HDR KI)을 매개하기 위해 CRISPR 유전자 편집 시스템과 함께 동일한 몰량의 플라스미드 DNA HDR-GOI-HDR 또는 msDNA HDR-GOI-HDR로 유도 만능 줄기 세포 (iPSC)를 형질감염시켰다.
GOI의 상동성 지정 복구 녹인 (HDR KI) 효율은 형질감염 후 3, 7 및 15일차에 형질감염된 세포의 총 수에 비해 표면에 GOI를 발현한 통합된 건강한 iPSC의 총 수를 계수함으로써 형광 활성화 세포 분류 (FACS)로 평가되었다. 도 27B, 28B 및 29A의 Q3에 나타낸 바와 같이, HDR KI 효율은 각각 형질감염 후 3, 7 및 15일에 통상적인 플라스미드에 대해 각각 8.60%, 7.76% 및 8.05%였다. 도 27C, 28C 및 29B의 Q3에 나타낸 바와 같이, 각각 15.4%, 15.4% 및 15.7%의 더 높은 HDR KI 효율이 각각 형질감염 후 3, 7 및 15일에 msDNA에 대해 관찰되었다.
실시예 7 - 조절 서열 변형을 함유하는 발현 벡터
A. 발현 벡터
실시예 1 및 2에 기재된 바와 같은 2개의 슈퍼 서열 부위, CMV 인핸서/프로모터, 내부 최소 인트론 서열을 함유하는 조작된 5'UTR, 및 eGFP 및 Nluc를 코딩하는 다유전자성 발현 카세트를 함유하는 발현 벡터는 또한 인간 베타-글로빈 폴리아데닐화 신호의 2개 카피 및 120개의 아데닌 뉴클레오티드 (즉, 2huBGpA-A120, 서열식별번호: 17) 및 하기 중 하나 이상을 함유하는 3'UTR을 함유하도록 설계되었다: (1) CMV 인핸서의 5' 말단에 위치된 합성 인핸서 (즉, 인핸서-1 (E1), 서열식별번호: 12), (2) 3'UTR의 5' 말단에 위치된 WPRE, (3) 5' 슈퍼 서열의 3' 말단에 위치된 SRF-UCOE; 및 (4) eGFP의 3' 말단에 위치된 인간 CSP-B MAR (huMAR). 설계된 벡터의 맵은 도 30-38에 표시되어 있다. 도 30은 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 24). 도 31은 E1 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 25). 도 32는 E1, WPRE 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 26). 도 33은 UCOE, E1, WPRE 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 27). 도 34는 E1, huMAR 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 28). 도 35는 UCOE, E1, huMAR 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 29). 도 36은 UCOE, E1, WPRE 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 30). 도 37은 E1, huMAR, WPRE 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-WPRE-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 31). 도 38은 UCOE, E1, huMAR, WPRE 및 3'UTR을 함유하는 발현 벡터의 맵을 보여준다 (SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-WPRE-3'UTR[2hBGpA-A120]-SS*, 서열식별번호: 32).
B. 루시퍼라제 발현 수준
HEK293 세포를 표준 작업 절차를 사용하여 (1) 도 2에 나타낸 바와 같은 통상적인 플라스미드, pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA, (2) SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*, (3) S*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS*, 및 (4) SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS*로 별도로 형질감염시켰다.
전기천공 후 2, 3, 7, 10, 14, 21 및 28일차에, 실시예 2B에 기재된 바와 같이 배양된 세포의 배지로부터 분비된 루시퍼라제의 강도를 측정함으로써 루시퍼라제 발현을 평가하였다. 도 39를 참조하며, 이는 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA (통상적인 pDNA CMV-U), SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS* (A: CMV-U1-3'UTR), SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2hBGpA-A120]-SS* (B: E1-CMV-U1-3'UTR), 및 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2hBGpA-A120]-SS* (C: E1-CMV-U1-WPRE-3'UTR)로 형질감염된 세포로부터의 배지 내 발현 수준을 보여준다.
도 39에 나타낸 바와 같이, 동일한 프로모터 및 다유전자성 발현 카세트를 갖는 통상적인 플라스미드와 비교하여 3'UTR을 함유하는 msDNA 발현 벡터에서 루시퍼라제 발현이 증가되고 내구성 있었다. msDNA 발현 벡터에 E1 (A 대 B) 및 WPRE (B 대 C) 유전적 요소의 첨가에 따라 발현이 더욱 증가되었으며, E1 및 WPRE 유전적 요소의 부가적 효과는 구축물 C와 연관된 가장 높은 루시퍼라제 발현을 초래하였다. t-테스트를 사용하여 통계적 분석을 수행하였다. * = p<0.05 및 ** = p<0.01.
C. 딸 세포로의 벡터 확장 및 루시퍼라제 발현
본 실시예의 파트 B에 기재된 4개의 발현 벡터로 HEK293 세포를 형질감염시켰다. 세포를 계대 동안 7일마다 5회 계대배양하였다. 세포 계대 시, 세포를 원래 세포 밀도의 1/10로 재시딩하였다. 각 세포 계대에 대해, 분비된 루시퍼라제 발현을 실시예 2B에 기재된 바와 같이 측정하였다. 도 40을 참조하며, 이는 통상적인 플라스미드와 비교하여 msDNA 발현 벡터로 형질감염된 세포로부터의 배지 내 발현 수준을 보여준다. 통계적 분석 및 p 값은 본 실시예의 파트 B에 언급된 바와 같다.
각 계대 번호에서 msDNA 발현 벡터 중 임의의 것으로 형질감염된 세포로부터 루시퍼라제 발현을 검출하였으며, 이는 벡터가 루시퍼라제의 내구성 있는 발현을 갖는 딸 세포로 계대되었음을 보여준다.
도 40에 나타낸 바와 같이, E1 및 WPRE 유전적 요소의 부가적 효과는 각 계대 번호에서 구축물 C와 연관된 가장 높은 루시퍼라제 발현을 초래하였으며, 다중 계대 후에 가장 내구성 있는 발현을 초래하였다.
실시예 8 - 합성 프로모터 서열을 함유하는 발현 벡터
A. 발현 벡터
5개의 합성 프로모터 서열을 생산하였다: (1) 합성 인핸서 E1의 3개 카피 (즉, 서열식별번호: 12의 3개 카피), 닭 β-액틴 프로모터 및 키메라 인트론을 함유하는 CAG [E1X3+CBA 프로모터+인트론] (서열식별번호: 35), (2) E2 (U100), 닭 β-액틴 프로모터 및 키메라 인트론을 함유하는 CAG [E2+CBA 프로모터+인트론] (서열식별번호: 36), (3) 합성 인핸서 E1의 3개 카피, 닭 β-액틴 프로모터 및 5'UTR1 (즉, 서열식별번호: 2)을 함유하는 CAG [E1X3+CBA 프로모터+UTR1] (서열식별번호: 37), (4) E2 (U100), 닭 β-액틴 프로모터 및 5'UTR1을 함유하는 CAG [E2 (U100)+CBA 프로모터+UTR1] (서열식별번호: 38), 및 (5) CMV 인핸서, EF1a 짧은 프로모터 및 5'UTR1을 함유하는 CMV 인핸서-EF1-UTR1 (서열식별번호: 39).
실시예 1 및 2에 기재된 바와 같은 CMV 인핸서, 닭 β-액틴 프로모터, 및 키메라 인트론 및 eGFP 및 Nluc를 코딩하는 다유전자성 발현 카세트를 함유하는 통상적인 플라스미드를 생산하였다. 통상적인 플라스미드의 맵은 도 41에 표시되어 있다 (pGL2-CAG-SecNLuc-2A-eGFP-WPRE-b글로빈 폴리A, 서열식별번호: 34).
2개의 슈퍼 서열 부위, CMV 인핸서, 닭 β-액틴 프로모터, 키메라 인트론, eGFP 및 Nluc를 코딩하는 다유전자성 발현 카세트, WPRE 및 3'UTR을 함유하는 msDNA 발현 벡터를 생산하였다. 벡터의 맵은 도 42에 표시되어 있다 (4-1 pGL2-SS*-CAG [CMV 인핸서+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*, 서열식별번호: 40).
상기 기재된 바와 같은 합성 프로모터 (1)-(5) 중 하나와 함께 2개의 슈퍼 서열 부위, eGFP 및 Nluc를 코딩하는 다유전자성 발현 카세트, WPRE 및 3'UTR을 함유하는 5개의 msDNA 발현 벡터를 생산하였으며, 각각의 벡터 맵은 도 43 (4-2 pGL2-SS*-CAG [E1 X3+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*, 서열식별번호: 41), 도 44 (4-3 pGL2-SS*-CAG [E2(U100)+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*, 서열식별번호: 42), 도 45 (4-4 pGL2-SS*-CAG [E1 X3+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*, 서열식별번호: 43), 도 46 (4-5-pGL2-SS*-CAG [E2 (U100)+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR (108 - 120 폴리A)-SS*, 서열식별번호: 44), 및 도 47 (4-6-pGL2-SS*-CMV 인핸서-EF1-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*, 서열식별번호: 45)에 표시되어 있다.
B. 루시퍼라제 발현 수준
HEK293 세포를 1x105개 세포/웰로 24-웰 플레이트에 시딩하고, 본 실시예의 파트 A에 기재된 벡터 및 리포펙타민의 복합체로 0.25 pmol DNA/웰로 별도로 형질감염시켰다. 형질감염 후 3 및 6일에 실시예 2B에 기재된 바와 같이 분비된 루시퍼라제 발현을 측정하였다. 도 48을 참조하며, 이는 통상적인 플라스미드와 비교하여 msDNA 발현 벡터로 형질감염된 세포로부터의 배지 내 발현 수준을 보여준다. 통상적인 플라스미드에 비해 이원 Anova 분석을 사용하여 통계적 분석을 수행하였다. * = p<0.05, ** = p<0.01, 및 ****= p<0.0001.
루시퍼라제 발현 수준은 통상적인 플라스미드와 비교하여 모든 msDNA 발현 벡터에 대해 더 높았다. 가장 높은 발현은 4-6-pGL2-SS*-CMV 인핸서-EF1-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A (4-6: CMV-EF1-UTR1-W-3'UTR)에서 관찰되었으며, 이는 CMV 인핸서 및 5'UTR1과 조합하여 EF-1 프로모터 요소를 함유한다.
실시예 9 - SS 및 발현 카세트 변형
본 개시내용에 기재된 바와 같은 발현 벡터의 슈퍼 서열 (SS) 및 발현 카세트에 대한 변형의 영향은 형질감염 효율, 관심 핵산 서열의 발현 (리포터 유전자, 예컨대 실시예 1 및 2에 기재된 바와 같은 다유전자성 GFP 및 루시퍼라제 발현 카세트 포함), 및 분열하는 세포에서 벡터의 내구성/확장 (신속 및 느린 분열 세포 포함) 측면에서 평가될 것이다. SS에 대한 변형은 또한 이들 부위에 대한 제한 효소 활성에 대해 평가될 것이다.
변형은 개별 변형 및 조합, 예컨대 벡터 백본과 레콤비나제에 대한 절단 부위 사이의 SS에서 레콤비나제에 대한 비-결합 영역에 통합된 엔도뉴클레아제 표적 서열, 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단 (즉, 5' SS의 3' 말단)과 발현 카세트 내 프로모터의 5' 사이에 통합된 CAG 프로모터, 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단 (즉, 5' SS의 3' 말단)과 발현 카세트 내 프로모터의 5' 사이에 통합된 CMV 인핸서, CMV 인핸서에 대해 5' 및/또는 UCOE, CMV, EF1, SV40, CAG, Rho, VDM2, HCR 또는 HLP 프로모터 또는 이의 변이체에 대해 3'에 위치된 인핸서-1 서열, CMV 프로모터 변이체, EF1-알파 프로모터, 합성 프로모터, 인트론 내에 통합된 비-코딩 서열을 갖는 또는 갖지 않는 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합된 인트론을 포함하는 5'UTR (예를 들어, 서열식별번호: 2-5 중 어느 하나의 핵산 서열을 포함하는 5'UTR), 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 우드척 간염 바이러스 전사후 조절 요소, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 스캐폴드/매트릭스 부착 영역, 발현 카세트 내 프로모터에 대해 5'에 위치된 유비쿼터스 염색질 개방 요소 (예를 들어, 5' SS의 3'에 및 발현 카세트 내 다른 서열 앞), 관심 핵산과 3' SS 사이에서 발현 카세트에 통합된 3'UTR (예컨대 정지 코돈 바로 후에) (예를 들어, 서열식별번호: 13-16 중 어느 하나의 핵산 서열을 포함하는 3'UTR), 및/또는 100 내지 120개의 아데닌 뉴클레오티드를 포함하는 폴리(A) 꼬리 (예를 들어, 3'UTR의 3' 말단으로서) (그러나 이에 제한되지는 않음)를 포함할 것이다.
서열
서열식별번호: 1 인공 인트론
서열식별번호: 2 5'UTR1
서열식별번호: 3 MAR-5 삽입을 갖는 5'UTR1
서열식별번호: 4 5'UTR
서열식별번호: 5 5'UTR2 (MAR-5 삽입을 갖는 서열식별번호: 4의 5'UTR)
서열식별번호: 6 A2UCOE 요소
서열식별번호: 7 SRF-UCOE
서열식별번호: 8 cHS4 인슐레이터
서열식별번호: 9 MAR-5
서열식별번호: 10 인간 CSP-B MAR (huMAR)
서열식별번호: 11 WPRE
서열식별번호: 12 인핸서-1
서열식별번호: 13 제노푸스 라에비스 베타-글로빈 폴리아데닐화 신호의 2개 카피 (2xlBGpA)
서열식별번호: 14 인간 베타-글로빈 폴리아데닐화 신호의 2개 카피 (2huBGpA)
서열식별번호: 15 하이브리드 제노푸스 라에비스 및 인간 베타-글로빈 폴리아데닐화 신호 (xlhuBGpA)
서열식별번호: 16 2xlBGpA-A120
서열식별번호: 17 2huBGpA-A120
서열식별번호: 18 xlhuBGpA-A120
서열식별번호: 19 pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*
서열식별번호: 20 pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA
서열식별번호: 21 pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*
서열식별번호: 22 pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*
서열식별번호: 23 pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*
서열식별번호: 24 SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2huBGpA-A120]-SS*
서열식별번호: 25 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2huBGpA-A120]-SS*
서열식별번호: 26 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS*
서열식별번호: 27 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS*
서열식별번호: 28 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2huBGpA-A120]-SS*
서열식별번호: 29 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2huBGpA-A120]-SS*
서열식별번호: 30 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS*
서열식별번호: 31 SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-MAR-WPRE-3'UTR[2huBGpA-A120]-SS*
서열식별번호: 32 SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-MAR-WPRE-3'UTR[2huBGpA-A120]-SS*
서열식별번호: 33 (슈퍼 서열, SS*)
서열식별번호: 34 pGL2-CAG-SecNLuc-2A-eGFP-WPRE-b글로빈 폴리A
서열식별번호: 35 CAG [E1X3+CBA 프로모터+인트론]
서열식별번호: 36 CAG [E2+CBA 프로모터+인트론]
서열식별번호: 37 CAG [E1X3+CBA 프로모터+UTR1]
서열식별번호: 38 CAG [E2 (U100)+CBA 프로모터+UTR1]
서열식별번호: 39 CMV 인핸서-EF1-UTR1
서열식별번호: 40 4-1 pGL2-SS*-CAG [CMV 인핸서+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*
서열식별번호: 41 4-2 pGL2-SS*-CAG [E1 X3+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*
서열식별번호: 42 4-3 pGL2-SS*-CAG [E2(U100)+CBA 프로모터+인트론]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*
서열식별번호: 43 4-4 pGL2-SS*-CAG [E1 X3+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*
서열식별번호: 44 4-5-pGL2-SS*-CAG [E2 (U100)+CBA 프로모터+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR (108 - 120 폴리A)-SS*
서열식별번호: 45 4-6-pGL2-SS*-CMV 인핸서-EF1-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR(108 - 120 폴리A)-SS*
서열식별번호: 46 인핸서-1의 3개 카피
서열식별번호: 47 키메라 인트론
* * *
본 개시내용은 본원에 기재된 특정 측면에 의해 범위가 제한되지 않아야 한다. 실제로, 설명된 것 외에 본 개시내용의 다양한 변형이 전술한 설명 및 첨부 도면으로부터 관련 기술분야의 통상의 기술자에게 명백해질 것이다. 이러한 변형은 첨부된 청구범위의 범위 내에 속하도록 의도된다.
다른 측면은 하기 청구범위 내에 있다.
SEQUENCE LISTING
<110> MEDIPHAGE BIOCEUTICALS, INC.
SLAVCEV, RODERICK
NAFISSI, NAFISEH
<120> EXPRESSION VECTORS, BACTERIAL SEQUENCE-FREE VECTORS, AND METHODS
OF MAKING AND USING THE SAME
<130> 4471.007PC03
<150> US 63/331,638
<151> 2022-04-15
<150> US 63/306,015
<151> 2022-02-02
<150> US 63/211,343
<151> 2021-06-16
<160> 47
<170> PatentIn version 3.5
<210> 1
<211> 144
<212> DNA
<213> Artificial Sequence
<220>
<223> Artificial intron
<400> 1
gtaagtcgac gggccgggcc tgggccgggt ccgggccggg tcgttggatc cccactacag 60
cccgatactc aagcttgacg aattcgagta tccaaggtag tggactagtg tgacgctgct 120
gacccctttc tttcccttct gcag 144
<210> 2
<211> 190
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'UTR1
<400> 2
ctgccttctc cctcctgtga gtttggtaag tcgacgggcc gggcctgggc cgggtccggg 60
ccgggtcgtt ggatccccac tacagcccga tactcaagct tgacgaattc gagtatccaa 120
ggtagtggac tagtgtgacg ctgctgaccc ctttctttcc cttctgcagg ttggtgtaca 180
gtagcttcca 190
<210> 3
<211> 771
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'UTR1 with MAR-5 insertion
<400> 3
ctgccttctc cctcctgtga gtttggtaag tcgacgggcc gggcctgggc cgggtccggg 60
ccgggtatcc atagctgatt ggtctaaaat gagatacatc aacgctcctc catgtttttt 120
gttttctttt taaatgaaaa actttatttt ttaagaggag tttcaggttc atagcaaaat 180
tgagaggaag gtacattcaa gctgaggaag ttttcctcta ttcctagttt actgagagat 240
tgcatcatga atgggtgtta aattttgtca aatgcttttt ctgtgtctat caatatgacc 300
atgtgatttt cttctttaac ctgttgatgg gacaaattac gttaattgat tttcaaacgt 360
tgaaccaccc ttacatatct ggaataaatt ctacttggtt gtggtgtata ttttttgata 420
cattcttgga ttctttttgc taatattttg ttgaaaatgt ttgtatcttt gttcatgaga 480
gatattggtc tgttgttttc ttttcttgta atgtcatttt ctagttccgg tattaaggta 540
atgctggcct agttgaatga tttaggaagt attccctctg cttctgtctt ctgaaagaga 600
ttgtagaaag ttgatacaat ttttttttct ttaaatatct tgatagtcgt tggatcccca 660
ctacagcccg atactcaagc ttgacgaatt cgagtatcca aggtagtgga ctagtgtgac 720
gctgctgacc cctttctttc ccttctgcag gttggtgtac agtagcttcc a 771
<210> 4
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'UTR
<400> 4
attgggatct tcacacagca ggtaaggttg cgggccgggc ctgggccggg tccgggccgg 60
gccgcactga cccctggtgt tgcttttttt ttttaggccg caagctgaag cgtgtcc 117
<210> 5
<211> 698
<212> DNA
<213> Artificial Sequence
<220>
<223> 5'UTR2 (5'UTR of SEQ ID NO:4 with MAR-5 insertion)
<400> 5
attgggatct tcacacagca ggtaaggttg cgggccgggc ctgggccggg tccgggccgg 60
gtatccatag ctgattggtc taaaatgaga tacatcaacg ctcctccatg ttttttgttt 120
tctttttaaa tgaaaaactt tattttttaa gaggagtttc aggttcatag caaaattgag 180
aggaaggtac attcaagctg aggaagtttt cctctattcc tagtttactg agagattgca 240
tcatgaatgg gtgttaaatt ttgtcaaatg ctttttctgt gtctatcaat atgaccatgt 300
gattttcttc tttaacctgt tgatgggaca aattacgtta attgattttc aaacgttgaa 360
ccacccttac atatctggaa taaattctac ttggttgtgg tgtatatttt ttgatacatt 420
cttggattct ttttgctaat attttgttga aaatgtttgt atctttgttc atgagagata 480
ttggtctgtt gttttctttt cttgtaatgt cattttctag ttccggtatt aaggtaatgc 540
tggcctagtt gaatgattta ggaagtattc cctctgcttc tgtcttctga aagagattgt 600
agaaagttga tacaattttt ttttctttaa atatcttgat agccgcactg acccctggtg 660
ttgctttttt tttttaggcc gcaagctgaa gcgtgtcc 698
<210> 6
<211> 1579
<212> DNA
<213> Artificial Sequence
<220>
<223> A2UCOE element
<400> 6
gcggccgcac gcgtggccct ccgcgcctac agctcaagcc acatccgaag ggggagggag 60
ccgggagctg cgcgcggggc cgccgggggg aggggtggca ccgcccacgc cgggcggcca 120
cgaagggcgg ggcagcgggc gcgcgcgcgg cggggggagg ggccggcgcc gcgcccgctg 180
ggaattgggg ccctaggggg agggcggagg cgccgacgac cgcggcactt accgttcgcg 240
gcgtggcgcc cggtggtccc caaggggagg gaagggggag gcggggcgag gacagtgacc 300
ggagtctcct cagcggtggc ttttctgctt ggcagcctca gcggctggcg ccaaaaccgg 360
actccgccca cttcctcgcc cgccggtgcg agggtgtgga atcctccaga cgctggggga 420
gggggagttg ggagcttaaa aactagtacc cctttgggac cactttcagc agcgaactct 480
cctgtacacc aggggtcagt tccacagacg cgggccaggg gtgggtcatt gcggcgtgaa 540
caataatttg actagaagtt gattcgggtg tttccggaag gggccgagtc aatccgccga 600
gttggggcac ggaaaacaaa aagggaaggc tactaagatt tttctggcgg gggttatcat 660
tggcgtaact gcagggacca cctcccgggt tgagggggct ggatctccag gctgcggatt 720
aagcccctcc cgtcggcgtt aatttcaaac tgcgcgacgt ttctcacctg ccttcgccaa 780
ggcaggggcc gggaccctat tccaagaggt agtaactagc aggactctag ccttccgcaa 840
ttcattgagc gcatttacgg aagtaacgtc gggtactgtc tctggccgca agggtgggag 900
gagtacgcat ttggcgtaag gtggggcgta gagccttccc gccattggcg gcggataggg 960
cgtttacgcg acggcctgac gtagcggaag acgccttagt gggggggaag gttctagaaa 1020
agcggcggca gcggctctag cggcagtagc agcagcgccg ggtcccgtgc ggaggtgctc 1080
ctcgcagagt tgtttctcca gcagcggcag ttctcactac agcgccagga cgagtccggt 1140
tcgtgttcgt ccgcggagat ctctctcatc tcgctcggct gcgggaaatc gggctgaagc 1200
gactgagtcc gcgatggagg taacgggttt gaaatcaatg agttattgaa aagggcatgg 1260
cgaggccgtt ggcgcctcag tggaagtcgg ccagccgcct ccgtgggaga gaggcaggaa 1320
atcggaccaa ttcagtagca gtggggctta aggtttatga acggggtctt gagcggaggc 1380
ctgagcgtac aaacagcttc cccaccctca gcctcccggc gccatttccc ttcactgggg 1440
gtgggggatg gggagctttc acatggcgga cgctgccccg ctggggtgaa agtggggcgc 1500
ggaggcggga cttcttattc cctttctaaa gcacgctgct tcgggggcca cggcgtctcc 1560
tcggacggcc gggcgcgcc 1579
<210> 7
<211> 761
<212> DNA
<213> Artificial Sequence
<220>
<223> SRF-UCOE
<400> 7
gcacacgacc acaattccac tgaaagcatt ttaatacgga acttgtcact cccagggagc 60
ctccgctcag ccggcagttg gttcatttca atccccacga caacccttca aagtgcaggg 120
cagacagcag gtggctctgc ccaggcgcct ggatcacagc ccggcctgca gccctcacct 180
gggcgcgggg agaccctgag gacgctcctc caggcggcgc tggccggggc ctgcggacac 240
ggacgggcgg gctgagctcc gggacccctc cccgcgcccc gcaccccgca ccccgcaccc 300
cgcaccccgc acccggcgct cacccgtccc agccccgccg cccgcagccc cagctgcaac 360
gcagccaccg ccgccatcgc acccggcccc gcgggcgctt ccgggacgca ggaggcatct 420
gcatccgggg cgccgctgag tcccgcccag agccccgccc ccggctccag gttctgcgag 480
cggcttccgc cgggctgctc cgcgggcgcg tcggccatga gcgagttgcc gggcgacgtg 540
cgggcgtttc tgcgggagca cccgagcctg cggctccaga cggacgcccg caaggttcgc 600
agcgcgggag gggaacggag tggcggagaa gggcgcagtt gggatgaggg gctgagggga 660
gggcagggga gaggagaggg caggggagag gggagagggg agagcaggag agaggggaag 720
gcaggggaga gggcgcggcg ggatcagggg aggagaggga a 761
<210> 8
<211> 478
<212> DNA
<213> Artificial Sequence
<220>
<223> cHS4 insulator
<400> 8
ggggagctca cggggacagc ccccccccaa agcccccagg gatgtaatta cgtccctccc 60
ccgctagggg gcagcagcga ccgcccgggg ctccgctccg gtccggcgct ccccccgcat 120
cccgagccgg cagcgtgcgg ggacagcccg ggcacgggga aggtggcacg ggatcgcttt 180
cctctgaacg cttctcgctg ctctttgagc ctgcagacac ctgggggata cggggaaaag 240
gggagctcac ggggacagcc cccccccaaa gcccccaggg atgtaattac gtccctcccc 300
cgctaggggg cagcagcgac cgcccggggc tccgctccgg tccggcgctc cccccgcatc 360
ccgagccggc agcgtgcggg gacagcccgg gcacggggaa ggtggcacgg gatcgctttc 420
ctctgaacgc ttctcgctgc tctttgagcc tgcagacacc tgggggatac ggggaaaa 478
<210> 9
<211> 581
<212> DNA
<213> Artificial Sequence
<220>
<223> MAR-5
<400> 9
tatccatagc tgattggtct aaaatgagat acatcaacgc tcctccatgt tttttgtttt 60
ctttttaaat gaaaaacttt attttttaag aggagtttca ggttcatagc aaaattgaga 120
ggaaggtaca ttcaagctga ggaagttttc ctctattcct agtttactga gagattgcat 180
catgaatggg tgttaaattt tgtcaaatgc tttttctgtg tctatcaata tgaccatgtg 240
attttcttct ttaacctgtt gatgggacaa attacgttaa ttgattttca aacgttgaac 300
cacccttaca tatctggaat aaattctact tggttgtggt gtatattttt tgatacattc 360
ttggattctt tttgctaata ttttgttgaa aatgtttgta tctttgttca tgagagatat 420
tggtctgttg ttttcttttc ttgtaatgtc attttctagt tccggtatta aggtaatgct 480
ggcctagttg aatgatttag gaagtattcc ctctgcttct gtcttctgaa agagattgta 540
gaaagttgat acaatttttt tttctttaaa tatcttgata g 581
<210> 10
<211> 1233
<212> DNA
<213> Artificial Sequence
<220>
<223> Human CSP-B MAR (huMAR)
<400> 10
ggatcccatt ctccttgatg tactaatttt tctttaaaag tgataataat agctcccatt 60
tagaattttt aaataacaca acaaatgtaa agtaactaat gtgtcctctg gatcatggta 120
agtaatgaat aaatttaact ccctttacct tctccctttg ctattttttc catgctagga 180
tttatacatt tttaaaaaac taaatctgct atcaaatgac agctttaaat ttacttttta 240
aaatttgtta ttgtatatat ttatggggta taaagtgatg ttatgatata tatatacaca 300
atgtacactg attaaatcaa gccaattaac attttatcat ctcaaatact taacattttt 360
tgtagtgaga acatttgaaa tttactttta gcaatttcaa aacatacatt attattatta 420
actatagtca ccatgatgta ccatagatct ttaaaaactt attcttcctg cctaactgaa 480
actttgtact ctttgactaa catcttttca ttcccccact tcccagcctc tggtaatcac 540
cattacacac tctgcttcta tgagttcaat tgctttagac tccacgtaat aaatgagatc 600
atgcagcatt tggctttctg tgcctggctt atccttgctt agcatggtgt cttacaggtt 660
catccatgtt gcaacaaata acagaatctc attctttgtt aaggctgaat actattccat 720
tgggtatata taccacattt tccttatcca ttaatccact gatggaccct taggttgttg 780
attccatata ttggctattg taaatagtgc agcaatgaac atgagagtgc aactatctct 840
tcaatgtact gatttcgaat ccttcggatc tatctcagaa gtgagattgc aggatcatat 900
aattctactt ttagtctttt gaggagctcc atacagcttt ccatatggcc atactaatta 960
cattctcatc aacagtgtac aatggtttcc ttttctccac atcctcacca acatttataa 1020
ttttttgtct ttttgataat agccatctga caggtgtaaa gtgatagctc attgcagttt 1080
taatttgcat tttttgatga ttagtaatgt tgagaatttt ttcatatatc tcttggccag 1140
ttgcatgtct tctttggaaa aatgtctatt cagttccttt gcccattttt taattgggat 1200
ttttggtttc ttgctattga gttgtttgaa ttc 1233
<210> 11
<211> 597
<212> DNA
<213> Artificial Sequence
<220>
<223> WPRE
<400> 11
tcgacaatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 60
ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 120
cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 180
agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 240
ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 300
tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 360
ggctgttggg cactgacaat tccgtggtgt tgtcggggaa gctgacgtcc tttccatggc 420
tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 480
ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 540
gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcctg 597
<210> 12
<211> 111
<212> DNA
<213> Artificial Sequence
<220>
<223> Enhancer-1
<400> 12
gggactttcc ggggcggggc acgtggtgca cgggactttc cgtgcacgtg cacgggactt 60
tccgggactt tccgggactt tccgtgcacc acgtggggac tttccgtgca c 111
<210> 13
<211> 252
<212> DNA
<213> Artificial Sequence
<220>
<223> 2 copies of Xenopus leavis beta-globin polyadenylation signal
(2xlBGpA)
<400> 13
aaccagcctc aagaacaccc gaatggagtc tctaagctac ataataccaa cttacacttt 60
acaaaatgtt gtcccccaaa atgtagccat tcgtatctgc tcctaataaa aagaaagttt 120
cttcacaacc agcctcaaga acacccgaat ggagtctcta agctacataa taccaactta 180
cactttacaa aatgttgtcc cccaaaatgt agccattcgt atctgctcct aataaaaaga 240
aagtttcttc ac 252
<210> 14
<211> 268
<212> DNA
<213> Artificial Sequence
<220>
<223> 2 copies of human beta-globin polyadenylation signal (2huBGpA)
<400> 14
gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60
taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120
tattttcatt gcaagctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc 180
ctaagtccaa ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc 240
taataaaaaa catttatttt cattgcaa 268
<210> 15
<211> 260
<212> DNA
<213> Artificial Sequence
<220>
<223> Hybrid Xenopus leavis and human beta-globin polyadenylation
signal (xlhuBGpA)
<400> 15
aaccagcctc aagaacaccc gaatggagtc tctaagctac ataataccaa cttacacttt 60
acaaaatgtt gtcccccaaa atgtagccat tcgtatctgc tcctaataaa aagaaagttt 120
cttcacgctc gctttcttgc tgtccaattt ctattaaagg ttcctttgtt ccctaagtcc 180
aactactaaa ctgggggata ttatgaaggg ccttgagcat ctggattctg cctaataaaa 240
aacatttatt ttcattgcaa 260
<210> 16
<211> 372
<212> DNA
<213> Artificial Sequence
<220>
<223> 2xlBGpA-A120
<400> 16
aaccagcctc aagaacaccc gaatggagtc tctaagctac ataataccaa cttacacttt 60
acaaaatgtt gtcccccaaa atgtagccat tcgtatctgc tcctaataaa aagaaagttt 120
cttcacaacc agcctcaaga acacccgaat ggagtctcta agctacataa taccaactta 180
cactttacaa aatgttgtcc cccaaaatgt agccattcgt atctgctcct aataaaaaga 240
aagtttcttc acaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 300
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360
aaaaaaaaaa aa 372
<210> 17
<211> 388
<212> DNA
<213> Artificial Sequence
<220>
<223> 2huBGpA-A120
<400> 17
gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60
taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120
tattttcatt gcaagctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc 180
ctaagtccaa ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc 240
taataaaaaa catttatttt cattgcaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 300
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 388
<210> 18
<211> 380
<212> DNA
<213> Artificial Sequence
<220>
<223> xlhuBGpA-A120
<400> 18
aaccagcctc aagaacaccc gaatggagtc tctaagctac ataataccaa cttacacttt 60
acaaaatgtt gtcccccaaa atgtagccat tcgtatctgc tcctaataaa aagaaagttt 120
cttcacgctc gctttcttgc tgtccaattt ctattaaagg ttcctttgtt ccctaagtcc 180
aactactaaa ctgggggata ttatgaaggg ccttgagcat ctggattctg cctaataaaa 240
aacatttatt ttcattgcaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 300
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360
aaaaaaaaaa aaaaaaaaaa 380
<210> 19
<211> 7011
<212> DNA
<213> Artificial Sequence
<220>
<223> pGL2-SS*-CAG-SecNLuc-2A-eGFP-BGpA-SS*
<400> 19
ccgggaggta ccgagctctt acgcgtgcta gaattaaagt aacccaatca gcacacaatt 60
gccattatac gcgcgtataa tggactattg tgtgctgata aacctatttc agcatactac 120
gcgcgtagta tgctgaaata ggtgactaga agttcctata ctttctagag aataggaact 180
tcataacttc gtataatgta tgctatacga agttatgggt tactttaatt tggttgctga 240
ctaattgaga tgcatgcttt gcatacttct gcctgctggg gagcctgggg actttccaca 300
cctggttgct gactaattga gatgcatgct ttgcatactt ctgcctgctg gggagcctgg 360
ggactttcca cacccctggg tcgacattga ttattgacta gttattaata gtaatcaatt 420
acggggtcat tagttcatag cccatatatg gagttccgcg ttacataact tacggtaaat 480
ggcccgcctg gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt 540
cccatagtaa cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa 600
actgcccact tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc 660
aatgacggta aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct 720
acttggcagt acatctacgt attagtcatc gctattacca tggtcgaggt gagccccacg 780
ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta tttatttatt 840
ttttaattat tttgtgcagc gatgggggcg gggggggggg gggcgcgcgc caggcggggc 900
ggggcggggc gaggggcggg gcggggcgag gcggaaaggt gcggcggcag ccaatcagag 960
cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa 1020
gcgaagcgcg cggcgggcgg gagtcgctgc gttgccttcg ccccgtgccc cgctccgcgc 1080
cgcctcgcgc cgcccgcccc ggctctgact gaccgcgtta ctcccacagg tgagcgggcg 1140
ggacggccct tctcctccgg gctgtaatta gcgcttggtt taatgacggc tcgtttcttt 1200
tctgtggctg cgtgaaagcc ttaaagggct ccgggagggc cctttgtgcg ggggggagcg 1260
gctcgggggg tgcgtgcgtg tgtgtgtgcg tggggagcgc cgcgtgcggc tccgcgctgc 1320
ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg 1380
aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag 1440
gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg gcggtcgggc 1500
tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc ttcgggtgcg 1560
gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg 1620
ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga ggggcgcggc 1680
ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg ccttttatgg 1740
taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga gccgaaatct 1800
gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg cgccggcagg 1860
aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct tctccctctc 1920
cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg cagggcgggg 1980
ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt tcatgccttc 2040
ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca tcattttggc 2100
aaagaattga ttaattcgag cgaacgcgtc gccaccatga actccttctc cacaagcgcc 2160
ttcggtccag ttgccttctc cctgggcctg ctcctggtgt tgcctgctgc cttccctgcc 2220
ccagtcttca cactcgaaga tttcgttggg gactggcgac agacagccgg ctacaacctg 2280
gaccaagtcc ttgaacaggg aggtgtgtcc agtttgtttc agaatctcgg ggtgtccgta 2340
actccgatcc aaaggattgt cctgagcggt gaaaatgggc tgaagatcga catccatgtc 2400
atcatcccgt atgaaggtct gagcggcgac caaatgggcc agatcgaaaa aatttttaag 2460
gtggtgtacc ctgtggatga tcatcacttt aaggtgatcc tgcactatgg cacactggta 2520
atcgacgggg ttacgccgaa catgatcgac tatttcggac ggccgtatga aggcatcgcc 2580
gtgttcgacg gcaaaaagat cactgtaaca gggaccctgt ggaacggcaa caaaattatc 2640
gacgagcgcc tgatcaaccc cgacggctcc ctgctgttcc gagtaaccat caacggagtg 2700
accggctggc ggctgtgcga acgcattctg gcggctagcg ctactaactt cagcctgctg 2760
aagcaggctg gagacgtgga ggagaaccct ggacctggaa gcggagaggg cagaggaagt 2820
ctgctaacat gcggtgacgt cgaggagaat cctggacctg gatccggaat ggtgagcaag 2880
ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 2940
ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc 3000
ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 3060
ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 3120
ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 3180
ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 3240
gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 3300
aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg catcaaggtg 3360
aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga ccactaccag 3420
cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagcacc 3480
cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 3540
gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaagc ggccgcactc 3600
ctcaggtgca ggctgcctat cagaaggtgg tggctggtgt ggccaatgcc ctggctcaca 3660
aataccactg agatcttttt ccctctgcca aaaattatgg ggacatcatg aagccccttg 3720
agcatctgac ttctggctaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt 3780
ttttgtgtct ctcactcgga aggacatggt gtggaaagtc cccaggctcc ccagcaggca 3840
gaagtatgca aagcatgcat ctcaattagt cagcaaccaa attaaagtaa cccataactt 3900
cgtatagcat acattatacg aagttatgaa gttcctattc tctagaaagt ataggaactt 3960
ctagtcacct atttcagcat actacgcgcg tagtatgctg aaataggttt atcagcacac 4020
aatagtccat tatacgcgcg tataatggca attgtgtgct gattgggtta ctttaattgg 4080
tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag 4140
tcagcaacca tggatccgtc gaccgatgcc cttgagagcc ttcaacccag tcagctcctt 4200
ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttct ttatcatgca 4260
actcgtagga caggtgccgg cagcgctctt ccgcttcctc gctcactgac tcgctgcgct 4320
cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca 4380
cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga 4440
accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 4500
acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 4560
cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 4620
acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 4680
atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 4740
agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 4800
acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 4860
gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg 4920
gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 4980
gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca 5040
gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 5100
acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga 5160
tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt 5220
ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt 5280
catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat 5340
ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag 5400
caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct 5460
ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt 5520
tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg 5580
cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca 5640
aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt 5700
tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat 5760
gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac 5820
cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa 5880
aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt 5940
tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt 6000
tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa 6060
gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt 6120
atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 6180
taggggttcc gcgcacattt ccccgaaaag tgccacctga cgcgccctgt agcggcgcat 6240
taagcgcggc gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag 6300
cgcccgctcc tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc 6360
aagctctaaa tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc 6420
ccaaaaaact tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt 6480
ttcgcccttt gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa 6540
caacactcaa ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg 6600
cctattggtt aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat 6660
taacgcttac aatttgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg 6720
tgcgggcctc ttcgctatta cgccagccca agctaccatg ataagtaagt aatattaagg 6780
tacgtggagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 6840
aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 6900
agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 6960
ttgtccaaac tcatcaatgt atcttatggt actgtaactg agctaacata a 7011
<210> 20
<211> 6991
<212> DNA
<213> Artificial Sequence
<220>
<223> pcDNA-CMV-5'UTR-SecNLuc-P2A-eGFP-bGHpA
<400> 20
gacggatcgg gagatctccc gatcccctat ggtgcactct cagtacaatc tgctctgatg 60
ccgcatagtt aagccagtat ctgctccctg cttgtgtgtt ggaggtcgct gagtagtgcg 120
cgagcaaaat ttaagctaca acaaggcaag gcttgaccga caattgcatg aagaatctgc 180
ttagggttag gcgttttgcg ctgcttcgcg atgtacgggc cagatatacg cgttgacatt 240
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata 300
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 360
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 420
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 480
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 540
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca 600
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg 660
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 720
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg 780
gtaggcgtgt acggtgggag gtctatataa gcagagctct ctggctaact agagaaccca 840
ctgcttactg gcttatcgaa attaatacga ctcactatag ggagacccaa gctggctagc 900
gtttaaactt aagcttggta ccgagctcgg atccctgcct tctccctcct gtgagtttgg 960
taagtcactg actgtctatg cctgggaaag ggtgggcagg agatggggca gtgcaggaaa 1020
agtggcacta tgaaccctgc agccctagga atgcatctag acaattgtac taaccttctt 1080
ctctttcctc tcctgacagg ttggtgtaca gtagcttcca ctcctgccac catgaactcc 1140
ttctccacaa gcgccttcgg tccagttgcc ttctccctgg gcctgctcct ggtgttgcct 1200
gctgccttcc ctgccccagt cttcacactc gaagatttcg ttggggactg gcgacagaca 1260
gccggctaca acctggacca agtccttgaa cagggaggtg tgtccagttt gtttcagaat 1320
ctcggggtgt ccgtaactcc gatccaaagg attgtcctga gcggtgaaaa tgggctgaag 1380
atcgacatcc atgtcatcat cccgtatgaa ggtctgagcg gcgaccaaat gggccagatc 1440
gaaaaaattt ttaaggtggt gtaccctgtg gatgatcatc actttaaggt gatcctgcac 1500
tatggcacac tggtaatcga cggggttacg ccgaacatga tcgactattt cggacggccg 1560
tatgaaggca tcgccgtgtt cgacggcaaa aagatcactg taacagggac cctgtggaac 1620
ggcaacaaaa ttatcgacga gcgcctgatc aaccccgacg gctccctgct gttccgagta 1680
accatcaacg gagtgaccgg ctggcggctg tgcgaacgca ttctggcgga attctgcaga 1740
tatccagcac agtggcggcc gctcgagtct agaggaagcg gagctactaa cttcagcctg 1800
ctgaagcagg ctggagacgt ggaggagaac cctggaccta tgagcaaggg cgaggagctg 1860
ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 1920
agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 1980
tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 2040
gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 2100
atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 2160
acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 2220
atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 2280
cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 2340
cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 2400
atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 2460
agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 2520
gggatcactc acggcatgga cgagctgtac aagtaagggc ccgtttaaac ccgctgatca 2580
gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 2640
ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 2700
cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 2760
gaggattggg aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag 2820
gcggaaagaa ccagctgggg ctctaggggg tatccccacg cgccctgtag cggcgcatta 2880
agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 2940
cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 3000
gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 3060
aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt 3120
cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 3180
acactcaacc ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc 3240
tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattaatt ctgtggaatg 3300
tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 3360
tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa 3420
gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta actccgccca 3480
tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt 3540
ttatttatgc agaggccgag gccgcctctg cctctgagct attccagaag tagtgaggag 3600
gcttttttgg aggcctaggc ttttgcaaaa agctcccggg agcttgtata tccattttcg 3660
gatctgatca agagacagga tgaggatcgt ttcgcatgat tgaacaagat ggattgcacg 3720
caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa 3780
tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg 3840
tcaagaccga cctgtccggt gccctgaatg aactgcagga cgaggcagcg cggctatcgt 3900
ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa 3960
gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc 4020
ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg 4080
ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg 4140
aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg 4200
aactgttcgc caggctcaag gcgcgcatgc ccgacggcga ggatctcgtc gtgacccatg 4260
gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact 4320
gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg 4380
ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc 4440
ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga gcgggactct 4500
ggggttcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt tcgattccac 4560
cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg gctggatgat 4620
cctccagcgc ggggatctca tgctggagtt cttcgcccac cccaacttgt ttattgcagc 4680
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 4740
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg tctgtatacc 4800
gtcgacctct agctagagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg 4860
ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg 4920
tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc 4980
gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt 5040
gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 5100
gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 5160
taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 5220
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 5280
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 5340
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 5400
tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 5460
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 5520
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 5580
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 5640
cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 5700
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 5760
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 5820
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 5880
ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 5940
aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 6000
atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 6060
ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 6120
tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 6180
agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 6240
taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 6300
tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 6360
cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 6420
ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 6480
tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 6540
tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 6600
cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 6660
tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 6720
gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 6780
tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 6840
atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 6900
tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 6960
cacatttccc cgaaaagtgc cacctgacgt c 6991
<210> 21
<211> 4555
<212> DNA
<213> Artificial Sequence
<220>
<223> pGL2-SS*-CAG-SecNLuc-2A-eGFP-WPRE-BGpA-SS*
<400> 21
taaagtaacc caatcagcac acaattgcca ttatacgcgc gtataatgga ctattgtgtg 60
ctgataaacc tatttcagca tactacgcgc gtagtatgct gaaataggtg actagaagtt 120
cctatacttt ctagagaata ggaacttcat aacttcgtat aatgtatgct atacgaagtt 180
atgggttact ttaatttggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 240
gctggggagc ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc 300
atacttctgc ctgctgggga gcctggggac tttccacacc cctgggtcga cattgattat 360
tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt 420
tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc 480
cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac 540
gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatcata 600
tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg cattatgccc 660
agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta gtcatcgcta 720
ttaccatggt cgaggtgagc cccacgttct gcttcactct ccccatctcc cccccctccc 780
cacccccaat tttgtattta tttatttttt aattattttg tgcagcgatg ggggcggggg 840
gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 900
aaaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 960
cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcgggagt cgctgcgttg 1020
ccttcgcccc gtgccccgct ccgcgccgcc tcgcgccgcc cgccccggct ctgactgacc 1080
gcgttactcc cacaggtgag cgggcgggac ggcccttctc ctccgggctg taattagcgc 1140
ttggtttaat gacggctcgt ttcttttctg tggctgcgtg aaagccttaa agggctccgg 1200
gagggccctt tgtgcggggg ggagcggctc ggggggtgcg tgcgtgtgtg tgtgcgtggg 1260
gagcgccgcg tgcggctccg cgctgcccgg cggctgtgag cgctgcgggc gcggcgcggg 1320
gctttgtgcg ctccgcagtg tgcgcgaggg gagcgcggcc gggggcggtg ccccgcggtg 1380
cggggggggc tgcgagggga acaaaggctg cgtgcggggt gtgtgcgtgg gggggtgagc 1440
agggggtgtg ggcgcggcgg tcgggctgta acccccccct gcacccccct ccccgagttg 1500
ctgagcacgg cccggcttcg ggtgcggggc tccgtacggg gcgtggcgcg gggctcgccg 1560
tgccgggcgg ggggtggcgg caggtggggg tgccgggcgg ggcggggccg cctcgggccg 1620
gggagggctc gggggagggg cgcggcggcc cccggagcgc cggcggctgt cgaggcgcgg 1680
cgagccgcag ccattgcctt ttatggtaat cgtgcgagag ggcgcaggga cttcctttgt 1740
cccaaatctg tgcggagccg aaatctggga ggcgccgccg caccccctct agcgggcgcg 1800
gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt cgtgcgtcgc 1860
cgcgccgccg tccccttctc cctctccagc ctcggggctg tccgcggggg gacggctgcc 1920
ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc ggctctagag 1980
cctctgctaa ccatgttcat gccttcttct ttttcctaca gctcctgggc aacgtgctgg 2040
ttattgtgct gtctcatcat tttggcaaag aattgattaa ttcgagcgaa cgcgtcgcca 2100
ccatgaactc cttctccaca agcgccttcg gtccagttgc cttctccctg ggcctgctcc 2160
tggtgttgcc tgctgccttc cctgccccag tcttcacact cgaagatttc gttggggact 2220
ggcgacagac agccggctac aacctggacc aagtccttga acagggaggt gtgtccagtt 2280
tgtttcagaa tctcggggtg tccgtaactc cgatccaaag gattgtcctg agcggtgaaa 2340
atgggctgaa gatcgacatc catgtcatca tcccgtatga aggtctgagc ggcgaccaaa 2400
tgggccagat cgaaaaaatt tttaaggtgg tgtaccctgt ggatgatcat cactttaagg 2460
tgatcctgca ctatggcaca ctggtaatcg acggggttac gccgaacatg atcgactatt 2520
tcggacggcc gtatgaaggc atcgccgtgt tcgacggcaa aaagatcact gtaacaggga 2580
ccctgtggaa cggcaacaaa attatcgacg agcgcctgat caaccccgac ggctccctgc 2640
tgttccgagt aaccatcaac ggagtgaccg gctggcggct gtgcgaacgc attctggcgg 2700
ctagcgctac taacttcagc ctgctgaagc aggctggaga cgtggaggag aaccctggac 2760
ctggaagcgg agagggcaga ggaagtctgc taacatgcgg tgacgtcgag gagaatcctg 2820
gacctggatc cggaatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc 2880
tggtcgagct ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg 2940
gcgatgccac ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg 3000
tgccctggcc caccctcgtg accaccctga cctacggcgt gcagtgcttc agccgctacc 3060
ccgaccacat gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg 3120
agcgcaccat cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg 3180
agggcgacac cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca 3240
acatcctggg gcacaagctg gagtacaact acaacagcca caacgtctat atcatggccg 3300
acaagcagaa gaacggcatc aaggtgaact tcaagatccg ccacaacatc gaggacggca 3360
gcgtgcagct cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc 3420
tgcccgacaa ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc 3480
gcgatcacat ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg 3540
agctgtacaa gtaaaatcaa cctctggatt acaaaatttg tgaaagattg actggtattc 3600
ttaactatgt tgctcctttt acgctatgtg gatacgctgc tttaatgcct ttgtatcatg 3660
ctattgcttc ccgtatggct ttcattttct cctccttgta taaatcctgg ttgctgtctc 3720
tttatgagga gttgtggccc gttgtcaggc aacgtggcgt ggtgtgcact gtgtttgctg 3780
acgcaacccc cactggttgg ggcattgcca ccacctgtca gctcctttcc gggactttcg 3840
ctttccccct ccctattgcc acggcggaac tcatcgccgc ctgccttgcc cgctgctgga 3900
caggggctcg gctgttgggc actgacaatt ccgtggtgtt gtcggggaaa tcatcgtcct 3960
ttccttggct gctcgcctgt gttgccacct ggattctgcg cgggacgtcc ttctgctacg 4020
tcccttcggc cctcaatcca gcggaccttc cttcccgcgg cctgctgccg gctctgcggc 4080
ctcttccgcg tcttcgcctt cgccctcaga cgagtcggat ctccctttgg gccgcctccc 4140
cgcaataaag gaaatttatt ttcattgcaa tagtgtgttg gaattttttg tgtctctcac 4200
tcggaaggac atggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 4260
tgcatctcaa ttagtcagca accaaattaa agtaacccat aacttcgtat agcatacatt 4320
atacgaagtt atgaagttcc tattctctag aaagtatagg aacttctagt cacctatttc 4380
agcatactac gcgcgtagta tgctgaaata ggtttatcag cacacaatag tccattatac 4440
gcgcgtataa tggcaattgt gtgctgattg ggttacttta attggtgtgg aaagtcccca 4500
ggctccccag caggcagaag tatgcaaagc atgcatctca attagtcagc aacca 4555
<210> 22
<211> 3610
<212> DNA
<213> Artificial Sequence
<220>
<223> pGL2-SS*-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-BGpA-SS*
<400> 22
taaagtaacc caatcagcac acaattgcca ttatacgcgc gtataatgga ctattgtgtg 60
ctgataaacc tatttcagca tactacgcgc gtagtatgct gaaataggtg actagaagtt 120
cctatacttt ctagagaata ggaacttcat aacttcgtat aatgtatgct atacgaagtt 180
atgggttact ttaatttggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 240
gctggggagc ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc 300
atacttctgc ctgctgggga gcctggggac tttccacacc cctgggtcga cgacattgat 360
tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 420
agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 480
gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 540
gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 600
atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 660
cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 720
ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 780
cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 840
atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 900
ggcgtgtacg gtgggaggtc tatataagca gagctctgcc ttctccctcc tgtgagtttg 960
gtaagtcgac gggccgggcc tgggccgggt ccgggccggg tcgttggatc cccactacag 1020
cccgatactc aagcttgacg aattcgagta tccaaggtag tggactagtg tgacgctgct 1080
gacccctttc tttcccttct gcaggttggt gtacagtagc ttccaaattg attaattcga 1140
gcgaacgcgt cgccaccatg aactccttct ccacaagcgc cttcggtcca gttgccttct 1200
ccctgggcct gctcctggtg ttgcctgctg ccttccctgc cccagtcttc acactcgaag 1260
atttcgttgg ggactggcga cagacagccg gctacaacct ggaccaagtc cttgaacagg 1320
gaggtgtgtc cagtttgttt cagaatctcg gggtgtccgt aactccgatc caaaggattg 1380
tcctgagcgg tgaaaatggg ctgaagatcg acatccatgt catcatcccg tatgaaggtc 1440
tgagcggcga ccaaatgggc cagatcgaaa aaatttttaa ggtggtgtac cctgtggatg 1500
atcatcactt taaggtgatc ctgcactatg gcacactggt aatcgacggg gttacgccga 1560
acatgatcga ctatttcgga cggccgtatg aaggcatcgc cgtgttcgac ggcaaaaaga 1620
tcactgtaac agggaccctg tggaacggca acaaaattat cgacgagcgc ctgatcaacc 1680
ccgacggctc cctgctgttc cgagtaacca tcaacggagt gaccggctgg cggctgtgcg 1740
aacgcattct ggcggctagc gctactaact tcagcctgct gaagcaggct ggagacgtgg 1800
aggagaaccc tggacctgga agcggagagg gcagaggaag tctgctaaca tgcggtgacg 1860
tcgaggagaa tcctggacct ggatccggaa tggtgagcaa gggcgaggag ctgttcaccg 1920
gggtggtgcc catcctggtc gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt 1980
ccggcgaggg cgagggcgat gccacctacg gcaagctgac cctgaagttc atctgcacca 2040
ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt 2100
gcttcagccg ctaccccgac cacatgaagc agcacgactt cttcaagtcc gccatgcccg 2160
aaggctacgt ccaggagcgc accatcttct tcaaggacga cggcaactac aagacccgcg 2220
ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat cgagctgaag ggcatcgact 2280
tcaaggagga cggcaacatc ctggggcaca agctggagta caactacaac agccacaacg 2340
tctatatcat ggccgacaag cagaagaacg gcatcaaggt gaacttcaag atccgccaca 2400
acatcgagga cggcagcgtg cagctcgccg accactacca gcagaacacc cccatcggcg 2460
acggccccgt gctgctgccc gacaaccact acctgagcac ccagtccgcc ctgagcaaag 2520
accccaacga gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc gccgggatca 2580
ctctcggcat ggacgagctg tacaagtaaa atcaacctct ggattacaaa atttgtgaaa 2640
gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 2700
tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 2760
cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt 2820
gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc tgtcagctcc 2880
tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc gccgcctgcc 2940
ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg gtgttgtcgg 3000
ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc cacctggatt ctgcgcggga 3060
cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc cgcggcctgc 3120
tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt cggatctccc 3180
tttgggccgc ctccccgcaa taaaggaaat ttattttcat tgcaatagtg tgttggaatt 3240
ttttgtgtct ctcactcgga aggacatggt gtggaaagtc cccaggctcc ccagcaggca 3300
gaagtatgca aagcatgcat ctcaattagt cagcaaccaa attaaagtaa cccataactt 3360
cgtatagcat acattatacg aagttatgaa gttcctattc tctagaaagt ataggaactt 3420
ctagtcacct atttcagcat actacgcgcg tagtatgctg aaataggttt atcagcacac 3480
aatagtccat tatacgcgcg tataatggca attgtgtgct gattgggtta ctttaattgg 3540
tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag 3600
tcagcaacca 3610
<210> 23
<211> 4092
<212> DNA
<213> Artificial Sequence
<220>
<223> pGL2-SS*-CMV-UTR2-SecNLuc-2A-eGFP-WPRE-BGpA-SS*
<400> 23
aattaaagta acccaatcag cacacaattg ccattatacg cgcgtataat ggactattgt 60
gtgctgataa acctatttca gcatactacg cgcgtagtat gctgaaatag gtgactagaa 120
gttcctatac tttctagaga ataggaactt cataacttcg tataatgtat gctatacgaa 180
gttatgggtt actttaattt ggttgctgac taattgagat gcatgctttg catacttctg 240
cctgctgggg agcctgggga ctttccacac ctggttgctg actaattgag atgcatgctt 300
tgcatacttc tgcctgctgg ggagcctggg gactttccac acccctgggt cgacattgat 360
tattgactag ttattaatag taatcaatta cggggtcatt agttcatagc ccatatatgg 420
agttccgcgt tacataactt acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc 480
gcccattgac gtcaataatg acgtatgttc ccatagtaac gccaataggg actttccatt 540
gacgtcaatg ggtggagtat ttacggtaaa ctgcccactt ggcagtacat caagtgtatc 600
atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg 660
cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg 720
ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact 780
cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa 840
atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta 900
ggcgtgtacg gtgggaggtc tatataagca gagctattgg gatcttcaca cagcaggtaa 960
ggttgcgggc cgggcctggg ccgggtccgg gccgggtatc catagctgat tggtctaaaa 1020
tgagatacat caacgctcct ccatgttttt tgttttcttt ttaaatgaaa aactttattt 1080
tttaagagga gtttcaggtt catagcaaaa ttgagaggaa ggtacattca agctgaggaa 1140
gttttcctct attcctagtt tactgagaga ttgcatcatg aatgggtgtt aaattttgtc 1200
aaatgctttt tctgtgtcta tcaatatgac catgtgattt tcttctttaa cctgttgatg 1260
ggacaaatta cgttaattga ttttcaaacg ttgaaccacc cttacatatc tggaataaat 1320
tctacttggt tgtggtgtat attttttgat acattcttgg attctttttg ctaatatttt 1380
gttgaaaatg tttgtatctt tgttcatgag agatattggt ctgttgtttt cttttcttgt 1440
aatgtcattt tctagttccg gtattaaggt aatgctggcc tagttgaatg atttaggaag 1500
tattccctct gcttctgtct tctgaaagag attgtagaaa gttgatacaa tttttttttc 1560
tttaaatatc ttgatagccg cactgacccc tggtgttgct tttttttttt aggccgcaag 1620
ctgaagcgtg tccgccacca tgaactcctt ctccacaagc gccttcggtc cagttgcctt 1680
ctccctgggc ctgctcctgg tgttgcctgc tgccttccct gccccagtct tcacactcga 1740
agatttcgtt ggggactggc gacagacagc cggctacaac ctggaccaag tccttgaaca 1800
gggaggtgtg tccagtttgt ttcagaatct cggggtgtcc gtaactccga tccaaaggat 1860
tgtcctgagc ggtgaaaatg ggctgaagat cgacatccat gtcatcatcc cgtatgaagg 1920
tctgagcggc gaccaaatgg gccagatcga aaaaattttt aaggtggtgt accctgtgga 1980
tgatcatcac tttaaggtga tcctgcacta tggcacactg gtaatcgacg gggttacgcc 2040
gaacatgatc gactatttcg gacggccgta tgaaggcatc gccgtgttcg acggcaaaaa 2100
gatcactgta acagggaccc tgtggaacgg caacaaaatt atcgacgagc gcctgatcaa 2160
ccccgacggc tccctgctgt tccgagtaac catcaacgga gtgaccggct ggcggctgtg 2220
cgaacgcatt ctggcggcta gcgctactaa cttcagcctg ctgaagcagg ctggagacgt 2280
ggaggagaac cctggacctg gaagcggaga gggcagagga agtctgctaa catgcggtga 2340
cgtcgaggag aatcctggac ctggatccgg aatggtgagc aagggcgagg agctgttcac 2400
cggggtggtg cccatcctgg tcgagctgga cggcgacgta aacggccaca agttcagcgt 2460
gtccggcgag ggcgagggcg atgccaccta cggcaagctg accctgaagt tcatctgcac 2520
caccggcaag ctgcccgtgc cctggcccac cctcgtgacc accctgacct acggcgtgca 2580
gtgcttcagc cgctaccccg accacatgaa gcagcacgac ttcttcaagt ccgccatgcc 2640
cgaaggctac gtccaggagc gcaccatctt cttcaaggac gacggcaact acaagacccg 2700
cgccgaggtg aagttcgagg gcgacaccct ggtgaaccgc atcgagctga agggcatcga 2760
cttcaaggag gacggcaaca tcctggggca caagctggag tacaactaca acagccacaa 2820
cgtctatatc atggccgaca agcagaagaa cggcatcaag gtgaacttca agatccgcca 2880
caacatcgag gacggcagcg tgcagctcgc cgaccactac cagcagaaca cccccatcgg 2940
cgacggcccc gtgctgctgc ccgacaacca ctacctgagc acccagtccg ccctgagcaa 3000
agaccccaac gagaagcgcg atcacatggt cctgctggag ttcgtgaccg ccgccgggat 3060
cactctcggc atggacgagc tgtacaagta aaatcaacct ctggattaca aaatttgtga 3120
aagattgact ggtattctta actatgttgc tccttttacg ctatgtggat acgctgcttt 3180
aatgcctttg tatcatgcta ttgcttcccg tatggctttc attttctcct ccttgtataa 3240
atcctggttg ctgtctcttt atgaggagtt gtggcccgtt gtcaggcaac gtggcgtggt 3300
gtgcactgtg tttgctgacg caacccccac tggttggggc attgccacca cctgtcagct 3360
cctttccggg actttcgctt tccccctccc tattgccacg gcggaactca tcgccgcctg 3420
ccttgcccgc tgctggacag gggctcggct gttgggcact gacaattccg tggtgttgtc 3480
ggggaaatca tcgtcctttc cttggctgct cgcctgtgtt gccacctgga ttctgcgcgg 3540
gacgtccttc tgctacgtcc cttcggccct caatccagcg gaccttcctt cccgcggcct 3600
gctgccggct ctgcggcctc ttccgcgtct tcgccttcgc cctcagacga gtcggatctc 3660
cctttgggcc gcctccccgc aataaaggaa atttattttc attgcaatag tgtgttggaa 3720
ttttttgtgt ctctcactcg gaaggacatg gtgtggaaag tccccaggct ccccagcagg 3780
cagaagtatg caaagcatgc atctcaatta gtcagcaacc aaattaaagt aacccataac 3840
ttcgtatagc atacattata cgaagttatg aagttcctat tctctagaaa gtataggaac 3900
ttctagtcac ctatttcagc atactacgcg cgtagtatgc tgaaataggt ttatcagcac 3960
acaatagtcc attatacgcg cgtataatgg caattgtgtg ctgattgggt tactttaatt 4020
ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 4080
agtcagcaac ca 4092
<210> 24
<211> 6249
<212> DNA
<213> Artificial Sequence
<220>
<223> SS*-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2huBGpA-A120]-SS*
<400> 24
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacgaca ttgattattg actagttatt aatagtaatc 420
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 480
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 540
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 600
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 660
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 720
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg 780
gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc 840
cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg 900
taacaactcc gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat 960
aagcagagct ctgccttctc cctcctgtga gtttggtaag tcgacgggcc gggcctgggc 1020
cgggtccggg ccgggtcgtt ggatccccac tacagcccga tactcaagct tgacgaattc 1080
gagtatccaa ggtagtggac tagtgtgacg ctgctgaccc ctttctttcc cttctgcagg 1140
ttggtgtaca gtagcttcca aattgattaa ttcgagcgaa cgcgtcgcca ccatgaactc 1200
cttctccaca agcgccttcg gtccagttgc cttctccctg ggcctgctcc tggtgttgcc 1260
tgctgccttc cctgccccag tcttcacact cgaagatttc gttggggact ggcgacagac 1320
agccggctac aacctggacc aagtccttga acagggaggt gtgtccagtt tgtttcagaa 1380
tctcggggtg tccgtaactc cgatccaaag gattgtcctg agcggtgaaa atgggctgaa 1440
gatcgacatc catgtcatca tcccgtatga aggtctgagc ggcgaccaaa tgggccagat 1500
cgaaaaaatt tttaaggtgg tgtaccctgt ggatgatcat cactttaagg tgatcctgca 1560
ctatggcaca ctggtaatcg acggggttac gccgaacatg atcgactatt tcggacggcc 1620
gtatgaaggc atcgccgtgt tcgacggcaa aaagatcact gtaacaggga ccctgtggaa 1680
cggcaacaaa attatcgacg agcgcctgat caaccccgac ggctccctgc tgttccgagt 1740
aaccatcaac ggagtgaccg gctggcggct gtgcgaacgc attctggcgg ctagcgctac 1800
taacttcagc ctgctgaagc aggctggaga cgtggaggag aaccctggac ctggaagcgg 1860
agagggcaga ggaagtctgc taacatgcgg tgacgtcgag gagaatcctg gacctggatc 1920
cggaatggtg agcaagggcg aggagctgtt caccggggtg gtgcccatcc tggtcgagct 1980
ggacggcgac gtaaacggcc acaagttcag cgtgtccggc gagggcgagg gcgatgccac 2040
ctacggcaag ctgaccctga agttcatctg caccaccggc aagctgcccg tgccctggcc 2100
caccctcgtg accaccctga cctacggcgt gcagtgcttc agccgctacc ccgaccacat 2160
gaagcagcac gacttcttca agtccgccat gcccgaaggc tacgtccagg agcgcaccat 2220
cttcttcaag gacgacggca actacaagac ccgcgccgag gtgaagttcg agggcgacac 2280
cctggtgaac cgcatcgagc tgaagggcat cgacttcaag gaggacggca acatcctggg 2340
gcacaagctg gagtacaact acaacagcca caacgtctat atcatggccg acaagcagaa 2400
gaacggcatc aaggtgaact tcaagatccg ccacaacatc gaggacggca gcgtgcagct 2460
cgccgaccac taccagcaga acacccccat cggcgacggc cccgtgctgc tgcccgacaa 2520
ccactacctg agcacccagt ccgccctgag caaagacccc aacgagaagc gcgatcacat 2580
ggtcctgctg gagttcgtga ccgccgccgg gatcactctc ggcatggacg agctgtacaa 2640
gtaagctcgc tttcttgctg tccaatttct attaaaggtt cctttgttcc ctaagtccaa 2700
ctactaaact gggggatatt atgaagggcc ttgagcatct ggattctgcc taataaaaaa 2760
catttatttt cattgcaagc tcgctttctt gctgtccaat ttctattaaa ggttcctttg 2820
ttccctaagt ccaactacta aactggggga tattatgaag ggccttgagc atctggattc 2880
tgcctaataa aaaacattta ttttcattgc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2940
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3000
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aactcggaag gacatggtgt ggaaagtccc 3060
caggctcccc agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt 3120
gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 3180
cagcaaccaa attaaagtaa cccataactt cgtatagcat acattatacg aagttatgaa 3240
gttcctattc tctagaaagt ataggaactt ctagtcacct atttcagcat actacgcgcg 3300
tagtatgctg aaataggttt atcagcacac aatagtccat tatacgcgcg tataatggca 3360
attgtgtgct gattgggtta ctttaatttg gatccgtcga ccgatgccct tgagagcctt 3420
caacccagtc agctccttcc ggtgggcgcg gggcatgact atcgtcgccg cacttatgac 3480
tgtcttcttt atcatgcaac tcgtaggaca ggtgccggca gcgctcttcc gcttcctcgc 3540
tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg 3600
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 3660
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 3720
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 3780
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 3840
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 3900
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 3960
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 4020
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 4080
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 4140
ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 4200
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 4260
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 4320
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 4380
aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 4440
tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 4500
cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 4560
tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac ccacgctcac 4620
cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 4680
ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 4740
gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 4800
gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 4860
gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 4920
gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 4980
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 5040
aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 5100
cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 5160
caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 5220
cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 5280
ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 5340
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 5400
tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg 5460
cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta 5520
cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt 5580
tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc cgatttagtg 5640
ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat 5700
cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt aatagtggac 5760
tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt gatttataag 5820
ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa aaatttaacg 5880
cgaattttaa caaaatatta acgcttacaa tttgccattc gccattcagg ctgcgcaact 5940
gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagcccaag ctaccatgat 6000
aagtaagtaa tattaaggta cgtggaggtt ttacttgctt taaaaaacct cccacacctc 6060
cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct 6120
tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 6180
ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatggtac tgtaactgag 6240
ctaacataa 6249
<210> 25
<211> 6360
<212> DNA
<213> Artificial Sequence
<220>
<223> SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-3'UTR[2huBGpA-A120]-SS*
<400> 25
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420
actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480
ggggactttc cgtgcacgac attgattatt gactagttat taatagtaat caattacggg 540
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 600
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 660
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 720
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 780
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 840
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 900
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 960
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 1020
cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1080
tctgccttct ccctcctgtg agtttggtaa gtcgacgggc cgggcctggg ccgggtccgg 1140
gccgggtcgt tggatcccca ctacagcccg atactcaagc ttgacgaatt cgagtatcca 1200
aggtagtgga ctagtgtgac gctgctgacc cctttctttc ccttctgcag gttggtgtac 1260
agtagcttcc aaattgatta attcgagcga acgcgtcgcc accatgaact ccttctccac 1320
aagcgccttc ggtccagttg ccttctccct gggcctgctc ctggtgttgc ctgctgcctt 1380
ccctgcccca gtcttcacac tcgaagattt cgttggggac tggcgacaga cagccggcta 1440
caacctggac caagtccttg aacagggagg tgtgtccagt ttgtttcaga atctcggggt 1500
gtccgtaact ccgatccaaa ggattgtcct gagcggtgaa aatgggctga agatcgacat 1560
ccatgtcatc atcccgtatg aaggtctgag cggcgaccaa atgggccaga tcgaaaaaat 1620
ttttaaggtg gtgtaccctg tggatgatca tcactttaag gtgatcctgc actatggcac 1680
actggtaatc gacggggtta cgccgaacat gatcgactat ttcggacggc cgtatgaagg 1740
catcgccgtg ttcgacggca aaaagatcac tgtaacaggg accctgtgga acggcaacaa 1800
aattatcgac gagcgcctga tcaaccccga cggctccctg ctgttccgag taaccatcaa 1860
cggagtgacc ggctggcggc tgtgcgaacg cattctggcg gctagcgcta ctaacttcag 1920
cctgctgaag caggctggag acgtggagga gaaccctgga cctggaagcg gagagggcag 1980
aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggacctggat ccggaatggt 2040
gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 2100
cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa 2160
gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 2220
gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca 2280
cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 2340
ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 2400
ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 2460
ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat 2520
caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 2580
ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 2640
gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 2700
ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtaagctcg 2760
ctttcttgct gtccaatttc tattaaaggt tcctttgttc cctaagtcca actactaaac 2820
tgggggatat tatgaagggc cttgagcatc tggattctgc ctaataaaaa acatttattt 2880
tcattgcaag ctcgctttct tgctgtccaa tttctattaa aggttccttt gttccctaag 2940
tccaactact aaactggggg atattatgaa gggccttgag catctggatt ctgcctaata 3000
aaaaacattt attttcattg caaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3060
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3120
aaaaaaaaaa aaaaaaaaaa aaactcggaa ggacatggtg tggaaagtcc ccaggctccc 3180
cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt 3240
ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca 3300
aattaaagta acccataact tcgtatagca tacattatac gaagttatga agttcctatt 3360
ctctagaaag tataggaact tctagtcacc tatttcagca tactacgcgc gtagtatgct 3420
gaaataggtt tatcagcaca caatagtcca ttatacgcgc gtataatggc aattgtgtgc 3480
tgattgggtt actttaattt ggatccgtcg accgatgccc ttgagagcct tcaacccagt 3540
cagctccttc cggtgggcgc ggggcatgac tatcgtcgcc gcacttatga ctgtcttctt 3600
tatcatgcaa ctcgtaggac aggtgccggc agcgctcttc cgcttcctcg ctcactgact 3660
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 3720
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 3780
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 3840
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 3900
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 3960
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 4020
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 4080
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 4140
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 4200
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa 4260
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 4320
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 4380
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 4440
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 4500
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 4560
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 4620
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 4680
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 4740
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 4800
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 4860
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 4920
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 4980
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 5040
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 5100
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 5160
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 5220
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 5280
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 5340
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 5400
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 5460
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 5520
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gcgccctgta 5580
gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 5640
gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 5700
ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 5760
acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca tcgccctgat 5820
agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 5880
aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa gggattttgc 5940
cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 6000
acaaaatatt aacgcttaca atttgccatt cgccattcag gctgcgcaac tgttgggaag 6060
ggcgatcggt gcgggcctct tcgctattac gccagcccaa gctaccatga taagtaagta 6120
atattaaggt acgtggaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac 6180
ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt 6240
tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct 6300
agttgtggtt tgtccaaact catcaatgta tcttatggta ctgtaactga gctaacataa 6360
<210> 26
<211> 6949
<212> DNA
<213> Artificial Sequence
<220>
<223> SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS*
<400> 26
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420
actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480
ggggactttc cgtgcacgac attgattatt gactagttat taatagtaat caattacggg 540
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 600
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 660
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 720
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 780
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 840
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 900
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 960
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 1020
cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1080
tctgccttct ccctcctgtg agtttggtaa gtcgacgggc cgggcctggg ccgggtccgg 1140
gccgggtcgt tggatcccca ctacagcccg atactcaagc ttgacgaatt cgagtatcca 1200
aggtagtgga ctagtgtgac gctgctgacc cctttctttc ccttctgcag gttggtgtac 1260
agtagcttcc aaattgatta attcgagcga acgcgtcgcc accatgaact ccttctccac 1320
aagcgccttc ggtccagttg ccttctccct gggcctgctc ctggtgttgc ctgctgcctt 1380
ccctgcccca gtcttcacac tcgaagattt cgttggggac tggcgacaga cagccggcta 1440
caacctggac caagtccttg aacagggagg tgtgtccagt ttgtttcaga atctcggggt 1500
gtccgtaact ccgatccaaa ggattgtcct gagcggtgaa aatgggctga agatcgacat 1560
ccatgtcatc atcccgtatg aaggtctgag cggcgaccaa atgggccaga tcgaaaaaat 1620
ttttaaggtg gtgtaccctg tggatgatca tcactttaag gtgatcctgc actatggcac 1680
actggtaatc gacggggtta cgccgaacat gatcgactat ttcggacggc cgtatgaagg 1740
catcgccgtg ttcgacggca aaaagatcac tgtaacaggg accctgtgga acggcaacaa 1800
aattatcgac gagcgcctga tcaaccccga cggctccctg ctgttccgag taaccatcaa 1860
cggagtgacc ggctggcggc tgtgcgaacg cattctggcg gctagcgcta ctaacttcag 1920
cctgctgaag caggctggag acgtggagga gaaccctgga cctggaagcg gagagggcag 1980
aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggacctggat ccggaatggt 2040
gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 2100
cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa 2160
gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 2220
gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca 2280
cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 2340
ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 2400
ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 2460
ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat 2520
caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 2580
ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 2640
gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 2700
ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtaaaatca 2760
acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt 2820
tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc 2880
tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc 2940
cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg 3000
gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc 3060
cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg 3120
cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg 3180
tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc 3240
agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct 3300
tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcgctcgc tttcttgctg 3360
tccaatttct attaaaggtt cctttgttcc ctaagtccaa ctactaaact gggggatatt 3420
atgaagggcc ttgagcatct ggattctgcc taataaaaaa catttatttt cattgcaagc 3480
tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt ccaactacta 3540
aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa aaaacattta 3600
ttttcattgc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3660
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3720
aaaaaaaaaa aactcggaag gacatggtgt ggaaagtccc caggctcccc agcaggcaga 3780
agtatgcaaa gcatgcatct caattagtca gcaaccaggt gtggaaagtc cccaggctcc 3840
ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccaa attaaagtaa 3900
cccataactt cgtatagcat acattatacg aagttatgaa gttcctattc tctagaaagt 3960
ataggaactt ctagtcacct atttcagcat actacgcgcg tagtatgctg aaataggttt 4020
atcagcacac aatagtccat tatacgcgcg tataatggca attgtgtgct gattgggtta 4080
ctttaatttg gatccgtcga ccgatgccct tgagagcctt caacccagtc agctccttcc 4140
ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt atcatgcaac 4200
tcgtaggaca ggtgccggca gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 4260
gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 4320
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 4380
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 4440
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 4500
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 4560
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 4620
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 4680
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 4740
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 4800
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt 4860
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 4920
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 4980
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 5040
gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 5100
cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 5160
gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 5220
tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 5280
ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 5340
ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 5400
atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 5460
cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 5520
tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 5580
aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 5640
tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 5700
ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 5760
agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 5820
gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 5880
agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 5940
accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 6000
gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 6060
cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 6120
ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg cgccctgtag cggcgcatta 6180
agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg 6240
cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa 6300
gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc 6360
aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt 6420
cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca 6480
acactcaacc ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc 6540
tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta 6600
acgcttacaa tttgccattc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg 6660
cgggcctctt cgctattacg ccagcccaag ctaccatgat aagtaagtaa tattaaggta 6720
cgtggaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc tgaaacataa 6780
aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt acaaataaag 6840
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 6900
gtccaaactc atcaatgtat cttatggtac tgtaactgag ctaacataa 6949
<210> 27
<211> 7121
<212> DNA
<213> Artificial Sequence
<220>
<223> SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS*
<400> 27
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacgcac acgaccacaa ttccactgaa agcattttaa 420
tacggaactt gtcactccca gggagcctcc gctcagccgg cagttggttc atttcaatcc 480
ccacgacaac ccttcaaagt gcagggcaga cagcaggtgg ctctgcccag gcgcctggat 540
cacagcccgg cctgcagccc tcacctgggc gcggggagac cctgaggacg ctcctccagg 600
cggcgctggc cggggcctgc ggacacggac gggcgggctg agctccggga cccctccccg 660
cgccccgcac cccgcacccc gcaccccgca ccccgcaccc ggcgctcacc cgtcccagcc 720
ccgccgcccg cagccccagc tgcaacgcag ccaccgccgc catcgcaccc ggccccgcgg 780
gcgcttccgg gacgcaggag gcatctgcat ccggggcgcc gctgagtccc gcccagagcc 840
ccgcccccgg ctccaggttc tgcgagcggc ttccgccggg ctgctccgcg ggcgcgtcgg 900
ccatgagcga gttgccgggc gacgtgcggg cgtttctgcg ggagcacccg agcctgcggc 960
tccagacgga cgcccgcaag gttcgcagcg cgggagggga acggagtggc ggagaagggc 1020
gcagttggga tgaggggctg aggggagggc aggggagagg agagggcagg ggagagggga 1080
gaggggagag caggagagag gggaaggcag gggagagggc gcggcgggat caggggagga 1140
gagggaaggg actttccggg gcggggcacg tggtgcacgg gactttccgt gcacgtgcac 1200
gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt ccgtgcacga 1260
cattgattat tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca 1320
tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac 1380
gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact 1440
ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa 1500
gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg 1560
cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta 1620
gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg 1680
tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg 1740
caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg 1800
ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctctgccttc tccctcctgt 1860
gagtttggta agtcgacggg ccgggcctgg gccgggtccg ggccgggtcg ttggatcccc 1920
actacagccc gatactcaag cttgacgaat tcgagtatcc aaggtagtgg actagtgtga 1980
cgctgctgac ccctttcttt cccttctgca ggttggtgta cagtagcttc caaattgatt 2040
aattcgagcg aacgcgtcgc caccatgaac tccttctcca caagcgcctt cggtccagtt 2100
gccttctccc tgggcctgct cctggtgttg cctgctgcct tccctgcccc agtcttcaca 2160
ctcgaagatt tcgttgggga ctggcgacag acagccggct acaacctgga ccaagtcctt 2220
gaacagggag gtgtgtccag tttgtttcag aatctcgggg tgtccgtaac tccgatccaa 2280
aggattgtcc tgagcggtga aaatgggctg aagatcgaca tccatgtcat catcccgtat 2340
gaaggtctga gcggcgacca aatgggccag atcgaaaaaa tttttaaggt ggtgtaccct 2400
gtggatgatc atcactttaa ggtgatcctg cactatggca cactggtaat cgacggggtt 2460
acgccgaaca tgatcgacta tttcggacgg ccgtatgaag gcatcgccgt gttcgacggc 2520
aaaaagatca ctgtaacagg gaccctgtgg aacggcaaca aaattatcga cgagcgcctg 2580
atcaaccccg acggctccct gctgttccga gtaaccatca acggagtgac cggctggcgg 2640
ctgtgcgaac gcattctggc ggctagcgct actaacttca gcctgctgaa gcaggctgga 2700
gacgtggagg agaaccctgg acctggaagc ggagagggca gaggaagtct gctaacatgc 2760
ggtgacgtcg aggagaatcc tggacctgga tccggaatgg tgagcaaggg cgaggagctg 2820
ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 2880
agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 2940
tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 3000
gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 3060
atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 3120
acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 3180
atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 3240
cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 3300
cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 3360
atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 3420
agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 3480
gggatcactc tcggcatgga cgagctgtac aagtaagctc gctttcttgc tgtccaattt 3540
ctattaaagg ttcctttgtt ccctaagtcc aactactaaa ctgggggata ttatgaaggg 3600
ccttgagcat ctggattctg cctaataaaa aacatttatt ttcattgcaa gctcgctttc 3660
ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac taaactgggg 3720
gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt tattttcatt 3780
gcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3840
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3900
aaaactcgga aggacatggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca 3960
aagcatgcat ctcaattagt cagcaaccag gtgtggaaag tccccaggct ccccagcagg 4020
cagaagtatg caaagcatgc atctcaatta gtcagcaacc aaattaaagt aacccataac 4080
ttcgtatagc atacattata cgaagttatg aagttcctat tctctagaaa gtataggaac 4140
ttctagtcac ctatttcagc atactacgcg cgtagtatgc tgaaataggt ttatcagcac 4200
acaatagtcc attatacgcg cgtataatgg caattgtgtg ctgattgggt tactttaatt 4260
tggatccgtc gaccgatgcc cttgagagcc ttcaacccag tcagctcctt ccggtgggcg 4320
cggggcatga ctatcgtcgc cgcacttatg actgtcttct ttatcatgca actcgtagga 4380
caggtgccgg cagcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 4440
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 4500
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 4560
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 4620
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 4680
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 4740
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 4800
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 4860
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 4920
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 4980
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 5040
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 5100
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 5160
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 5220
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 5280
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 5340
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 5400
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 5460
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 5520
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 5580
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 5640
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 5700
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 5760
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 5820
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 5880
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 5940
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 6000
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 6060
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 6120
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 6180
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 6240
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 6300
gcgcacattt ccccgaaaag tgccacctga cgcgccctgt agcggcgcat taagcgcggc 6360
gggtgtggtg gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc 6420
tttcgctttc ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa 6480
tcgggggctc cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact 6540
tgattagggt gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt 6600
gacgttggag tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa 6660
ccctatctcg gtctattctt ttgatttata agggattttg ccgatttcgg cctattggtt 6720
aaaaaatgag ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat taacgcttac 6780
aatttgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc 6840
ttcgctatta cgccagccca agctaccatg ataagtaagt aatattaagg tacgtggagg 6900
ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg 6960
caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 7020
tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 7080
tcatcaatgt atcttatggt actgtaactg agctaacata a 7121
<210> 28
<211> 7593
<212> DNA
<213> Artificial Sequence
<220>
<223> SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2huBGpA-A120]-SS*
<400> 28
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420
actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480
ggggactttc cgtgcacgac attgattatt gactagttat taatagtaat caattacggg 540
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 600
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 660
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 720
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 780
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 840
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 900
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 960
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 1020
cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1080
tctgccttct ccctcctgtg agtttggtaa gtcgacgggc cgggcctggg ccgggtccgg 1140
gccgggtcgt tggatcccca ctacagcccg atactcaagc ttgacgaatt cgagtatcca 1200
aggtagtgga ctagtgtgac gctgctgacc cctttctttc ccttctgcag gttggtgtac 1260
agtagcttcc aaattgatta attcgagcga acgcgtcgcc accatgaact ccttctccac 1320
aagcgccttc ggtccagttg ccttctccct gggcctgctc ctggtgttgc ctgctgcctt 1380
ccctgcccca gtcttcacac tcgaagattt cgttggggac tggcgacaga cagccggcta 1440
caacctggac caagtccttg aacagggagg tgtgtccagt ttgtttcaga atctcggggt 1500
gtccgtaact ccgatccaaa ggattgtcct gagcggtgaa aatgggctga agatcgacat 1560
ccatgtcatc atcccgtatg aaggtctgag cggcgaccaa atgggccaga tcgaaaaaat 1620
ttttaaggtg gtgtaccctg tggatgatca tcactttaag gtgatcctgc actatggcac 1680
actggtaatc gacggggtta cgccgaacat gatcgactat ttcggacggc cgtatgaagg 1740
catcgccgtg ttcgacggca aaaagatcac tgtaacaggg accctgtgga acggcaacaa 1800
aattatcgac gagcgcctga tcaaccccga cggctccctg ctgttccgag taaccatcaa 1860
cggagtgacc ggctggcggc tgtgcgaacg cattctggcg gctagcgcta ctaacttcag 1920
cctgctgaag caggctggag acgtggagga gaaccctgga cctggaagcg gagagggcag 1980
aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggacctggat ccggaatggt 2040
gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 2100
cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa 2160
gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 2220
gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca 2280
cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 2340
ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 2400
ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 2460
ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat 2520
caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 2580
ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 2640
gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 2700
ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtaaggatc 2760
ccattctcct tgatgtacta atttttcttt aaaagtgata ataatagctc ccatttagaa 2820
tttttaaata acacaacaaa tgtaaagtaa ctaatgtgtc ctctggatca tggtaagtaa 2880
tgaataaatt taactccctt taccttctcc ctttgctatt ttttccatgc taggatttat 2940
acatttttaa aaaactaaat ctgctatcaa atgacagctt taaatttact ttttaaaatt 3000
tgttattgta tatatttatg gggtataaag tgatgttatg atatatatat acacaatgta 3060
cactgattaa atcaagccaa ttaacatttt atcatctcaa atacttaaca ttttttgtag 3120
tgagaacatt tgaaatttac ttttagcaat ttcaaaacat acattattat tattaactat 3180
agtcaccatg atgtaccata gatctttaaa aacttattct tcctgcctaa ctgaaacttt 3240
gtactctttg actaacatct tttcattccc ccacttccca gcctctggta atcaccatta 3300
cacactctgc ttctatgagt tcaattgctt tagactccac gtaataaatg agatcatgca 3360
gcatttggct ttctgtgcct ggcttatcct tgcttagcat ggtgtcttac aggttcatcc 3420
atgttgcaac aaataacaga atctcattct ttgttaaggc tgaatactat tccattgggt 3480
atatatacca cattttcctt atccattaat ccactgatgg acccttaggt tgttgattcc 3540
atatattggc tattgtaaat agtgcagcaa tgaacatgag agtgcaacta tctcttcaat 3600
gtactgattt cgaatccttc ggatctatct cagaagtgag attgcaggat catataattc 3660
tacttttagt cttttgagga gctccataca gctttccata tggccatact aattacattc 3720
tcatcaacag tgtacaatgg tttccttttc tccacatcct caccaacatt tataattttt 3780
tgtctttttg ataatagcca tctgacaggt gtaaagtgat agctcattgc agttttaatt 3840
tgcatttttt gatgattagt aatgttgaga attttttcat atatctcttg gccagttgca 3900
tgtcttcttt ggaaaaatgt ctattcagtt cctttgccca ttttttaatt gggatttttg 3960
gtttcttgct attgagttgt ttgaattcgc tcgctttctt gctgtccaat ttctattaaa 4020
ggttcctttg ttccctaagt ccaactacta aactggggga tattatgaag ggccttgagc 4080
atctggattc tgcctaataa aaaacattta ttttcattgc aagctcgctt tcttgctgtc 4140
caatttctat taaaggttcc tttgttccct aagtccaact actaaactgg gggatattat 4200
gaagggcctt gagcatctgg attctgccta ataaaaaaca tttattttca ttgcaaaaaa 4260
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4320
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaactcg 4380
gaaggacatg gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 4440
atctcaatta gtcagcaacc aggtgtggaa agtccccagg ctccccagca ggcagaagta 4500
tgcaaagcat gcatctcaat tagtcagcaa ccaaattaaa gtaacccata acttcgtata 4560
gcatacatta tacgaagtta tgaagttcct attctctaga aagtatagga acttctagtc 4620
acctatttca gcatactacg cgcgtagtat gctgaaatag gtttatcagc acacaatagt 4680
ccattatacg cgcgtataat ggcaattgtg tgctgattgg gttactttaa tttggatccg 4740
tcgaccgatg cccttgagag ccttcaaccc agtcagctcc ttccggtggg cgcggggcat 4800
gactatcgtc gccgcactta tgactgtctt ctttatcatg caactcgtag gacaggtgcc 4860
ggcagcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4920
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4980
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 5040
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 5100
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 5160
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 5220
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 5280
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 5340
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 5400
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 5460
agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 5520
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5580
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5640
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5700
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5760
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5820
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5880
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5940
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 6000
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 6060
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 6120
ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 6180
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 6240
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 6300
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 6360
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 6420
cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 6480
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6540
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6600
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6660
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6720
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6780
ttccccgaaa agtgccacct gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg 6840
tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct cctttcgctt 6900
tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta aatcgggggc 6960
tccctttagg gttccgattt agtgctttac ggcacctcga ccccaaaaaa cttgattagg 7020
gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttgg 7080
agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc aaccctatct 7140
cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg ttaaaaaatg 7200
agctgattta acaaaaattt aacgcgaatt ttaacaaaat attaacgctt acaatttgcc 7260
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 7320
tacgccagcc caagctacca tgataagtaa gtaatattaa ggtacgtgga ggttttactt 7380
gctttaaaaa acctcccaca cctccccctg aacctgaaac ataaaatgaa tgcaattgtt 7440
gttgttaact tgtttattgc agcttataat ggttacaaat aaagcaatag catcacaaat 7500
ttcacaaata aagcattttt ttcactgcat tctagttgtg gtttgtccaa actcatcaat 7560
gtatcttatg gtactgtaac tgagctaaca taa 7593
<210> 29
<211> 8354
<212> DNA
<213> Artificial Sequence
<220>
<223> SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-huMAR-3'UTR[2huBGpA-A120]-SS
*
<400> 29
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacgcac acgaccacaa ttccactgaa agcattttaa 420
tacggaactt gtcactccca gggagcctcc gctcagccgg cagttggttc atttcaatcc 480
ccacgacaac ccttcaaagt gcagggcaga cagcaggtgg ctctgcccag gcgcctggat 540
cacagcccgg cctgcagccc tcacctgggc gcggggagac cctgaggacg ctcctccagg 600
cggcgctggc cggggcctgc ggacacggac gggcgggctg agctccggga cccctccccg 660
cgccccgcac cccgcacccc gcaccccgca ccccgcaccc ggcgctcacc cgtcccagcc 720
ccgccgcccg cagccccagc tgcaacgcag ccaccgccgc catcgcaccc ggccccgcgg 780
gcgcttccgg gacgcaggag gcatctgcat ccggggcgcc gctgagtccc gcccagagcc 840
ccgcccccgg ctccaggttc tgcgagcggc ttccgccggg ctgctccgcg ggcgcgtcgg 900
ccatgagcga gttgccgggc gacgtgcggg cgtttctgcg ggagcacccg agcctgcggc 960
tccagacgga cgcccgcaag gttcgcagcg cgggagggga acggagtggc ggagaagggc 1020
gcagttggga tgaggggctg aggggagggc aggggagagg agagggcagg ggagagggga 1080
gaggggagag caggagagag gggaaggcag gggagagggc gcggcgggat caggggagga 1140
gagggaaggg actttccggg gcggggcacg tggtgcacgg gactttccgt gcacgtgcac 1200
gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt ccgtgcacga 1260
cattgattat tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca 1320
tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac 1380
gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact 1440
ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa 1500
gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg 1560
cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta 1620
gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg 1680
tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg 1740
caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg 1800
ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctctgccttc tccctcctgt 1860
gagtttggta agtcgacggg ccgggcctgg gccgggtccg ggccgggtcg ttggatcccc 1920
actacagccc gatactcaag cttgacgaat tcgagtatcc aaggtagtgg actagtgtga 1980
cgctgctgac ccctttcttt cccttctgca ggttggtgta cagtagcttc caaattgatt 2040
aattcgagcg aacgcgtcgc caccatgaac tccttctcca caagcgcctt cggtccagtt 2100
gccttctccc tgggcctgct cctggtgttg cctgctgcct tccctgcccc agtcttcaca 2160
ctcgaagatt tcgttgggga ctggcgacag acagccggct acaacctgga ccaagtcctt 2220
gaacagggag gtgtgtccag tttgtttcag aatctcgggg tgtccgtaac tccgatccaa 2280
aggattgtcc tgagcggtga aaatgggctg aagatcgaca tccatgtcat catcccgtat 2340
gaaggtctga gcggcgacca aatgggccag atcgaaaaaa tttttaaggt ggtgtaccct 2400
gtggatgatc atcactttaa ggtgatcctg cactatggca cactggtaat cgacggggtt 2460
acgccgaaca tgatcgacta tttcggacgg ccgtatgaag gcatcgccgt gttcgacggc 2520
aaaaagatca ctgtaacagg gaccctgtgg aacggcaaca aaattatcga cgagcgcctg 2580
atcaaccccg acggctccct gctgttccga gtaaccatca acggagtgac cggctggcgg 2640
ctgtgcgaac gcattctggc ggctagcgct actaacttca gcctgctgaa gcaggctgga 2700
gacgtggagg agaaccctgg acctggaagc ggagagggca gaggaagtct gctaacatgc 2760
ggtgacgtcg aggagaatcc tggacctgga tccggaatgg tgagcaaggg cgaggagctg 2820
ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 2880
agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 2940
tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 3000
gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 3060
atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 3120
acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 3180
atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 3240
cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 3300
cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 3360
atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 3420
agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 3480
gggatcactc tcggcatgga cgagctgtac aagtaaggat cccattctcc ttgatgtact 3540
aatttttctt taaaagtgat aataatagct cccatttaga atttttaaat aacacaacaa 3600
atgtaaagta actaatgtgt cctctggatc atggtaagta atgaataaat ttaactccct 3660
ttaccttctc cctttgctat tttttccatg ctaggattta tacattttta aaaaactaaa 3720
tctgctatca aatgacagct ttaaatttac tttttaaaat ttgttattgt atatatttat 3780
ggggtataaa gtgatgttat gatatatata tacacaatgt acactgatta aatcaagcca 3840
attaacattt tatcatctca aatacttaac attttttgta gtgagaacat ttgaaattta 3900
cttttagcaa tttcaaaaca tacattatta ttattaacta tagtcaccat gatgtaccat 3960
agatctttaa aaacttattc ttcctgccta actgaaactt tgtactcttt gactaacatc 4020
ttttcattcc cccacttccc agcctctggt aatcaccatt acacactctg cttctatgag 4080
ttcaattgct ttagactcca cgtaataaat gagatcatgc agcatttggc tttctgtgcc 4140
tggcttatcc ttgcttagca tggtgtctta caggttcatc catgttgcaa caaataacag 4200
aatctcattc tttgttaagg ctgaatacta ttccattggg tatatatacc acattttcct 4260
tatccattaa tccactgatg gacccttagg ttgttgattc catatattgg ctattgtaaa 4320
tagtgcagca atgaacatga gagtgcaact atctcttcaa tgtactgatt tcgaatcctt 4380
cggatctatc tcagaagtga gattgcagga tcatataatt ctacttttag tcttttgagg 4440
agctccatac agctttccat atggccatac taattacatt ctcatcaaca gtgtacaatg 4500
gtttcctttt ctccacatcc tcaccaacat ttataatttt ttgtcttttt gataatagcc 4560
atctgacagg tgtaaagtga tagctcattg cagttttaat ttgcattttt tgatgattag 4620
taatgttgag aattttttca tatatctctt ggccagttgc atgtcttctt tggaaaaatg 4680
tctattcagt tcctttgccc attttttaat tgggattttt ggtttcttgc tattgagttg 4740
tttgaattcg ctcgctttct tgctgtccaa tttctattaa aggttccttt gttccctaag 4800
tccaactact aaactggggg atattatgaa gggccttgag catctggatt ctgcctaata 4860
aaaaacattt attttcattg caagctcgct ttcttgctgt ccaatttcta ttaaaggttc 4920
ctttgttccc taagtccaac tactaaactg ggggatatta tgaagggcct tgagcatctg 4980
gattctgcct aataaaaaac atttattttc attgcaaaaa aaaaaaaaaa aaaaaaaaaa 5040
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5100
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaactc ggaaggacat ggtgtggaaa 5160
gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac 5220
caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca tgcatctcaa 5280
ttagtcagca accaaattaa agtaacccat aacttcgtat agcatacatt atacgaagtt 5340
atgaagttcc tattctctag aaagtatagg aacttctagt cacctatttc agcatactac 5400
gcgcgtagta tgctgaaata ggtttatcag cacacaatag tccattatac gcgcgtataa 5460
tggcaattgt gtgctgattg ggttacttta atttggatcc gtcgaccgat gcccttgaga 5520
gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt cgccgcactt 5580
atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct cttccgcttc 5640
ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc 5700
aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc 5760
aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag 5820
gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc 5880
gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt 5940
tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct 6000
ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg 6060
ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct 6120
tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat 6180
tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg 6240
ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa 6300
aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt 6360
ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 6420
tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt 6480
atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta 6540
aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat 6600
ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 6660
tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 6720
ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 6780
tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 6840
aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt 6900
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 6960
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 7020
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 7080
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 7140
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac 7200
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 7260
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 7320
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 7380
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 7440
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 7500
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 7560
tgacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac 7620
cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc 7680
cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt 7740
tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg 7800
gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag 7860
tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt 7920
ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt 7980
taacgcgaat tttaacaaaa tattaacgct tacaatttgc cattcgccat tcaggctgcg 8040
caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc ccaagctacc 8100
atgataagta agtaatatta aggtacgtgg aggttttact tgctttaaaa aacctcccac 8160
acctccccct gaacctgaaa cataaaatga atgcaattgt tgttgttaac ttgtttattg 8220
cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat aaagcatttt 8280
tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat ggtactgtaa 8340
ctgagctaac ataa 8354
<210> 30
<211> 7710
<212> DNA
<213> Artificial Sequence
<220>
<223> SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR[2huBGpA-A120]-SS*
<400> 30
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacgcac acgaccacaa ttccactgaa agcattttaa 420
tacggaactt gtcactccca gggagcctcc gctcagccgg cagttggttc atttcaatcc 480
ccacgacaac ccttcaaagt gcagggcaga cagcaggtgg ctctgcccag gcgcctggat 540
cacagcccgg cctgcagccc tcacctgggc gcggggagac cctgaggacg ctcctccagg 600
cggcgctggc cggggcctgc ggacacggac gggcgggctg agctccggga cccctccccg 660
cgccccgcac cccgcacccc gcaccccgca ccccgcaccc ggcgctcacc cgtcccagcc 720
ccgccgcccg cagccccagc tgcaacgcag ccaccgccgc catcgcaccc ggccccgcgg 780
gcgcttccgg gacgcaggag gcatctgcat ccggggcgcc gctgagtccc gcccagagcc 840
ccgcccccgg ctccaggttc tgcgagcggc ttccgccggg ctgctccgcg ggcgcgtcgg 900
ccatgagcga gttgccgggc gacgtgcggg cgtttctgcg ggagcacccg agcctgcggc 960
tccagacgga cgcccgcaag gttcgcagcg cgggagggga acggagtggc ggagaagggc 1020
gcagttggga tgaggggctg aggggagggc aggggagagg agagggcagg ggagagggga 1080
gaggggagag caggagagag gggaaggcag gggagagggc gcggcgggat caggggagga 1140
gagggaaggg actttccggg gcggggcacg tggtgcacgg gactttccgt gcacgtgcac 1200
gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt ccgtgcacga 1260
cattgattat tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca 1320
tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac 1380
gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact 1440
ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa 1500
gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg 1560
cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta 1620
gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg 1680
tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg 1740
caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg 1800
ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctctgccttc tccctcctgt 1860
gagtttggta agtcgacggg ccgggcctgg gccgggtccg ggccgggtcg ttggatcccc 1920
actacagccc gatactcaag cttgacgaat tcgagtatcc aaggtagtgg actagtgtga 1980
cgctgctgac ccctttcttt cccttctgca ggttggtgta cagtagcttc caaattgatt 2040
aattcgagcg aacgcgtcgc caccatgaac tccttctcca caagcgcctt cggtccagtt 2100
gccttctccc tgggcctgct cctggtgttg cctgctgcct tccctgcccc agtcttcaca 2160
ctcgaagatt tcgttgggga ctggcgacag acagccggct acaacctgga ccaagtcctt 2220
gaacagggag gtgtgtccag tttgtttcag aatctcgggg tgtccgtaac tccgatccaa 2280
aggattgtcc tgagcggtga aaatgggctg aagatcgaca tccatgtcat catcccgtat 2340
gaaggtctga gcggcgacca aatgggccag atcgaaaaaa tttttaaggt ggtgtaccct 2400
gtggatgatc atcactttaa ggtgatcctg cactatggca cactggtaat cgacggggtt 2460
acgccgaaca tgatcgacta tttcggacgg ccgtatgaag gcatcgccgt gttcgacggc 2520
aaaaagatca ctgtaacagg gaccctgtgg aacggcaaca aaattatcga cgagcgcctg 2580
atcaaccccg acggctccct gctgttccga gtaaccatca acggagtgac cggctggcgg 2640
ctgtgcgaac gcattctggc ggctagcgct actaacttca gcctgctgaa gcaggctgga 2700
gacgtggagg agaaccctgg acctggaagc ggagagggca gaggaagtct gctaacatgc 2760
ggtgacgtcg aggagaatcc tggacctgga tccggaatgg tgagcaaggg cgaggagctg 2820
ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 2880
agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 2940
tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 3000
gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 3060
atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 3120
acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 3180
atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 3240
cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 3300
cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 3360
atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 3420
agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 3480
gggatcactc tcggcatgga cgagctgtac aagtaaaatc aacctctgga ttacaaaatt 3540
tgtgaaagat tgactggtat tcttaactat gttgctcctt ttacgctatg tggatacgct 3600
gctttaatgc ctttgtatca tgctattgct tcccgtatgg ctttcatttt ctcctccttg 3660
tataaatcct ggttgctgtc tctttatgag gagttgtggc ccgttgtcag gcaacgtggc 3720
gtggtgtgca ctgtgtttgc tgacgcaacc cccactggtt ggggcattgc caccacctgt 3780
cagctccttt ccgggacttt cgctttcccc ctccctattg ccacggcgga actcatcgcc 3840
gcctgccttg cccgctgctg gacaggggct cggctgttgg gcactgacaa ttccgtggtg 3900
ttgtcgggga aatcatcgtc ctttccttgg ctgctcgcct gtgttgccac ctggattctg 3960
cgcgggacgt ccttctgcta cgtcccttcg gccctcaatc cagcggacct tccttcccgc 4020
ggcctgctgc cggctctgcg gcctcttccg cgtcttcgcc ttcgccctca gacgagtcgg 4080
atctcccttt gggccgcctc cccgcgctcg ctttcttgct gtccaatttc tattaaaggt 4140
tcctttgttc cctaagtcca actactaaac tgggggatat tatgaagggc cttgagcatc 4200
tggattctgc ctaataaaaa acatttattt tcattgcaag ctcgctttct tgctgtccaa 4260
tttctattaa aggttccttt gttccctaag tccaactact aaactggggg atattatgaa 4320
gggccttgag catctggatt ctgcctaata aaaaacattt attttcattg caaaaaaaaa 4380
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaactcggaa 4500
ggacatggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc 4560
tcaattagtc agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc 4620
aaagcatgca tctcaattag tcagcaacca aattaaagta acccataact tcgtatagca 4680
tacattatac gaagttatga agttcctatt ctctagaaag tataggaact tctagtcacc 4740
tatttcagca tactacgcgc gtagtatgct gaaataggtt tatcagcaca caatagtcca 4800
ttatacgcgc gtataatggc aattgtgtgc tgattgggtt actttaattt ggatccgtcg 4860
accgatgccc ttgagagcct tcaacccagt cagctccttc cggtgggcgc ggggcatgac 4920
tatcgtcgcc gcacttatga ctgtcttctt tatcatgcaa ctcgtaggac aggtgccggc 4980
agcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag 5040
cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag 5100
gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 5160
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 5220
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 5280
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 5340
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 5400
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 5460
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 5520
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 5580
ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc 5640
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 5700
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 5760
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 5820
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 5880
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa 5940
tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc 6000
ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga 6060
taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa 6120
gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt 6180
gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg 6240
ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc 6300
aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg 6360
gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag 6420
cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt 6480
actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt 6540
caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac 6600
gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac 6660
ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag 6720
caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa 6780
tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga 6840
gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc 6900
cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg 6960
ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct 7020
tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc 7080
ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg 7140
atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt 7200
ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg 7260
tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc 7320
tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttgccatt 7380
cgccattcag gctgcgcaac tgttgggaag ggcgatcggt gcgggcctct tcgctattac 7440
gccagcccaa gctaccatga taagtaagta atattaaggt acgtggaggt tttacttgct 7500
ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc aattgttgtt 7560
gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 7620
acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 7680
tcttatggta ctgtaactga gctaacataa 7710
<210> 31
<211> 8182
<212> DNA
<213> Artificial Sequence
<220>
<223> SS*-E1-CMV-UTR1-SecNLuc-2A-eGFP-MAR-WPRE-3'UTR[2huBGpA-A120]-SS*
<400> 31
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420
actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480
ggggactttc cgtgcacgac attgattatt gactagttat taatagtaat caattacggg 540
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc 600
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 660
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 720
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 780
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 840
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 900
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 960
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 1020
cgccccattg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc 1080
tctgccttct ccctcctgtg agtttggtaa gtcgacgggc cgggcctggg ccgggtccgg 1140
gccgggtcgt tggatcccca ctacagcccg atactcaagc ttgacgaatt cgagtatcca 1200
aggtagtgga ctagtgtgac gctgctgacc cctttctttc ccttctgcag gttggtgtac 1260
agtagcttcc aaattgatta attcgagcga acgcgtcgcc accatgaact ccttctccac 1320
aagcgccttc ggtccagttg ccttctccct gggcctgctc ctggtgttgc ctgctgcctt 1380
ccctgcccca gtcttcacac tcgaagattt cgttggggac tggcgacaga cagccggcta 1440
caacctggac caagtccttg aacagggagg tgtgtccagt ttgtttcaga atctcggggt 1500
gtccgtaact ccgatccaaa ggattgtcct gagcggtgaa aatgggctga agatcgacat 1560
ccatgtcatc atcccgtatg aaggtctgag cggcgaccaa atgggccaga tcgaaaaaat 1620
ttttaaggtg gtgtaccctg tggatgatca tcactttaag gtgatcctgc actatggcac 1680
actggtaatc gacggggtta cgccgaacat gatcgactat ttcggacggc cgtatgaagg 1740
catcgccgtg ttcgacggca aaaagatcac tgtaacaggg accctgtgga acggcaacaa 1800
aattatcgac gagcgcctga tcaaccccga cggctccctg ctgttccgag taaccatcaa 1860
cggagtgacc ggctggcggc tgtgcgaacg cattctggcg gctagcgcta ctaacttcag 1920
cctgctgaag caggctggag acgtggagga gaaccctgga cctggaagcg gagagggcag 1980
aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggacctggat ccggaatggt 2040
gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc tggacggcga 2100
cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca cctacggcaa 2160
gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc ccaccctcgt 2220
gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca tgaagcagca 2280
cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca tcttcttcaa 2340
ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca ccctggtgaa 2400
ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg ggcacaagct 2460
ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga agaacggcat 2520
caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc tcgccgacca 2580
ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca accactacct 2640
gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca tggtcctgct 2700
ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca agtaaggatc 2760
ccattctcct tgatgtacta atttttcttt aaaagtgata ataatagctc ccatttagaa 2820
tttttaaata acacaacaaa tgtaaagtaa ctaatgtgtc ctctggatca tggtaagtaa 2880
tgaataaatt taactccctt taccttctcc ctttgctatt ttttccatgc taggatttat 2940
acatttttaa aaaactaaat ctgctatcaa atgacagctt taaatttact ttttaaaatt 3000
tgttattgta tatatttatg gggtataaag tgatgttatg atatatatat acacaatgta 3060
cactgattaa atcaagccaa ttaacatttt atcatctcaa atacttaaca ttttttgtag 3120
tgagaacatt tgaaatttac ttttagcaat ttcaaaacat acattattat tattaactat 3180
agtcaccatg atgtaccata gatctttaaa aacttattct tcctgcctaa ctgaaacttt 3240
gtactctttg actaacatct tttcattccc ccacttccca gcctctggta atcaccatta 3300
cacactctgc ttctatgagt tcaattgctt tagactccac gtaataaatg agatcatgca 3360
gcatttggct ttctgtgcct ggcttatcct tgcttagcat ggtgtcttac aggttcatcc 3420
atgttgcaac aaataacaga atctcattct ttgttaaggc tgaatactat tccattgggt 3480
atatatacca cattttcctt atccattaat ccactgatgg acccttaggt tgttgattcc 3540
atatattggc tattgtaaat agtgcagcaa tgaacatgag agtgcaacta tctcttcaat 3600
gtactgattt cgaatccttc ggatctatct cagaagtgag attgcaggat catataattc 3660
tacttttagt cttttgagga gctccataca gctttccata tggccatact aattacattc 3720
tcatcaacag tgtacaatgg tttccttttc tccacatcct caccaacatt tataattttt 3780
tgtctttttg ataatagcca tctgacaggt gtaaagtgat agctcattgc agttttaatt 3840
tgcatttttt gatgattagt aatgttgaga attttttcat atatctcttg gccagttgca 3900
tgtcttcttt ggaaaaatgt ctattcagtt cctttgccca ttttttaatt gggatttttg 3960
gtttcttgct attgagttgt ttgaattcaa tcaacctctg gattacaaaa tttgtgaaag 4020
attgactggt attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat 4080
gcctttgtat catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc 4140
ctggttgctg tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg 4200
cactgtgttt gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct 4260
ttccgggact ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct 4320
tgcccgctgc tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg 4380
gaaatcatcg tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac 4440
gtccttctgc tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct 4500
gccggctctg cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct 4560
ttgggccgcc tccccgcgct cgctttcttg ctgtccaatt tctattaaag gttcctttgt 4620
tccctaagtc caactactaa actgggggat attatgaagg gccttgagca tctggattct 4680
gcctaataaa aaacatttat tttcattgca agctcgcttt cttgctgtcc aatttctatt 4740
aaaggttcct ttgttcccta agtccaacta ctaaactggg ggatattatg aagggccttg 4800
agcatctgga ttctgcctaa taaaaaacat ttattttcat tgcaaaaaaa aaaaaaaaaa 4860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4920
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaactcgg aaggacatgg 4980
tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag 5040
tcagcaacca ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg 5100
catctcaatt agtcagcaac caaattaaag taacccataa cttcgtatag catacattat 5160
acgaagttat gaagttccta ttctctagaa agtataggaa cttctagtca cctatttcag 5220
catactacgc gcgtagtatg ctgaaatagg tttatcagca cacaatagtc cattatacgc 5280
gcgtataatg gcaattgtgt gctgattggg ttactttaat ttggatccgt cgaccgatgc 5340
ccttgagagc cttcaaccca gtcagctcct tccggtgggc gcggggcatg actatcgtcg 5400
ccgcacttat gactgtcttc tttatcatgc aactcgtagg acaggtgccg gcagcgctct 5460
tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 5520
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 5580
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 5640
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 5700
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 5760
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 5820
gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 5880
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 5940
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 6000
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 6060
aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc 6120
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 6180
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 6240
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 6300
atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 6360
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 6420
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 6480
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 6540
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 6600
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 6660
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 6720
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 6780
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 6840
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 6900
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 6960
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 7020
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 7080
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 7140
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 7200
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 7260
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 7320
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 7380
gtgccacctg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc 7440
agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc 7500
tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg 7560
ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca 7620
cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc 7680
tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc ggtctattct 7740
tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa 7800
caaaaattta acgcgaattt taacaaaata ttaacgctta caatttgcca ttcgccattc 7860
aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagccc 7920
aagctaccat gataagtaag taatattaag gtacgtggag gttttacttg ctttaaaaaa 7980
cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg ttgttaactt 8040
gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt tcacaaataa 8100
agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg tatcttatgg 8160
tactgtaact gagctaacat aa 8182
<210> 32
<211> 8943
<212> DNA
<213> Artificial Sequence
<220>
<223> SS*-UCOE-E1-CMV-UTR1-SecNLuc-2A-eGFP-MAR-WPRE-3'UTR[2huBGpA-A120]
-SS*
<400> 32
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacgcac acgaccacaa ttccactgaa agcattttaa 420
tacggaactt gtcactccca gggagcctcc gctcagccgg cagttggttc atttcaatcc 480
ccacgacaac ccttcaaagt gcagggcaga cagcaggtgg ctctgcccag gcgcctggat 540
cacagcccgg cctgcagccc tcacctgggc gcggggagac cctgaggacg ctcctccagg 600
cggcgctggc cggggcctgc ggacacggac gggcgggctg agctccggga cccctccccg 660
cgccccgcac cccgcacccc gcaccccgca ccccgcaccc ggcgctcacc cgtcccagcc 720
ccgccgcccg cagccccagc tgcaacgcag ccaccgccgc catcgcaccc ggccccgcgg 780
gcgcttccgg gacgcaggag gcatctgcat ccggggcgcc gctgagtccc gcccagagcc 840
ccgcccccgg ctccaggttc tgcgagcggc ttccgccggg ctgctccgcg ggcgcgtcgg 900
ccatgagcga gttgccgggc gacgtgcggg cgtttctgcg ggagcacccg agcctgcggc 960
tccagacgga cgcccgcaag gttcgcagcg cgggagggga acggagtggc ggagaagggc 1020
gcagttggga tgaggggctg aggggagggc aggggagagg agagggcagg ggagagggga 1080
gaggggagag caggagagag gggaaggcag gggagagggc gcggcgggat caggggagga 1140
gagggaaggg actttccggg gcggggcacg tggtgcacgg gactttccgt gcacgtgcac 1200
gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt ccgtgcacga 1260
cattgattat tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca 1320
tatatggagt tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac 1380
gacccccgcc cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact 1440
ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa 1500
gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg gcccgcctgg 1560
cattatgccc agtacatgac cttatgggac tttcctactt ggcagtacat ctacgtatta 1620
gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg tggatagcgg 1680
tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag tttgttttgg 1740
caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt gacgcaaatg 1800
ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctctgccttc tccctcctgt 1860
gagtttggta agtcgacggg ccgggcctgg gccgggtccg ggccgggtcg ttggatcccc 1920
actacagccc gatactcaag cttgacgaat tcgagtatcc aaggtagtgg actagtgtga 1980
cgctgctgac ccctttcttt cccttctgca ggttggtgta cagtagcttc caaattgatt 2040
aattcgagcg aacgcgtcgc caccatgaac tccttctcca caagcgcctt cggtccagtt 2100
gccttctccc tgggcctgct cctggtgttg cctgctgcct tccctgcccc agtcttcaca 2160
ctcgaagatt tcgttgggga ctggcgacag acagccggct acaacctgga ccaagtcctt 2220
gaacagggag gtgtgtccag tttgtttcag aatctcgggg tgtccgtaac tccgatccaa 2280
aggattgtcc tgagcggtga aaatgggctg aagatcgaca tccatgtcat catcccgtat 2340
gaaggtctga gcggcgacca aatgggccag atcgaaaaaa tttttaaggt ggtgtaccct 2400
gtggatgatc atcactttaa ggtgatcctg cactatggca cactggtaat cgacggggtt 2460
acgccgaaca tgatcgacta tttcggacgg ccgtatgaag gcatcgccgt gttcgacggc 2520
aaaaagatca ctgtaacagg gaccctgtgg aacggcaaca aaattatcga cgagcgcctg 2580
atcaaccccg acggctccct gctgttccga gtaaccatca acggagtgac cggctggcgg 2640
ctgtgcgaac gcattctggc ggctagcgct actaacttca gcctgctgaa gcaggctgga 2700
gacgtggagg agaaccctgg acctggaagc ggagagggca gaggaagtct gctaacatgc 2760
ggtgacgtcg aggagaatcc tggacctgga tccggaatgg tgagcaaggg cgaggagctg 2820
ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc 2880
agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct gaagttcatc 2940
tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc 3000
gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt caagtccgcc 3060
atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg caactacaag 3120
acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc 3180
atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa ctacaacagc 3240
cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa cttcaagatc 3300
cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca gaacaccccc 3360
atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca gtccgccctg 3420
agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt gaccgccgcc 3480
gggatcactc tcggcatgga cgagctgtac aagtaaggat cccattctcc ttgatgtact 3540
aatttttctt taaaagtgat aataatagct cccatttaga atttttaaat aacacaacaa 3600
atgtaaagta actaatgtgt cctctggatc atggtaagta atgaataaat ttaactccct 3660
ttaccttctc cctttgctat tttttccatg ctaggattta tacattttta aaaaactaaa 3720
tctgctatca aatgacagct ttaaatttac tttttaaaat ttgttattgt atatatttat 3780
ggggtataaa gtgatgttat gatatatata tacacaatgt acactgatta aatcaagcca 3840
attaacattt tatcatctca aatacttaac attttttgta gtgagaacat ttgaaattta 3900
cttttagcaa tttcaaaaca tacattatta ttattaacta tagtcaccat gatgtaccat 3960
agatctttaa aaacttattc ttcctgccta actgaaactt tgtactcttt gactaacatc 4020
ttttcattcc cccacttccc agcctctggt aatcaccatt acacactctg cttctatgag 4080
ttcaattgct ttagactcca cgtaataaat gagatcatgc agcatttggc tttctgtgcc 4140
tggcttatcc ttgcttagca tggtgtctta caggttcatc catgttgcaa caaataacag 4200
aatctcattc tttgttaagg ctgaatacta ttccattggg tatatatacc acattttcct 4260
tatccattaa tccactgatg gacccttagg ttgttgattc catatattgg ctattgtaaa 4320
tagtgcagca atgaacatga gagtgcaact atctcttcaa tgtactgatt tcgaatcctt 4380
cggatctatc tcagaagtga gattgcagga tcatataatt ctacttttag tcttttgagg 4440
agctccatac agctttccat atggccatac taattacatt ctcatcaaca gtgtacaatg 4500
gtttcctttt ctccacatcc tcaccaacat ttataatttt ttgtcttttt gataatagcc 4560
atctgacagg tgtaaagtga tagctcattg cagttttaat ttgcattttt tgatgattag 4620
taatgttgag aattttttca tatatctctt ggccagttgc atgtcttctt tggaaaaatg 4680
tctattcagt tcctttgccc attttttaat tgggattttt ggtttcttgc tattgagttg 4740
tttgaattca atcaacctct ggattacaaa atttgtgaaa gattgactgg tattcttaac 4800
tatgttgctc cttttacgct atgtggatac gctgctttaa tgcctttgta tcatgctatt 4860
gcttcccgta tggctttcat tttctcctcc ttgtataaat cctggttgct gtctctttat 4920
gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca 4980
acccccactg gttggggcat tgccaccacc tgtcagctcc tttccgggac tttcgctttc 5040
cccctcccta ttgccacggc ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg 5100
gctcggctgt tgggcactga caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct 5160
tggctgctcg cctgtgttgc cacctggatt ctgcgcggga cgtccttctg ctacgtccct 5220
tcggccctca atccagcgga ccttccttcc cgcggcctgc tgccggctct gcggcctctt 5280
ccgcgtcttc gccttcgccc tcagacgagt cggatctccc tttgggccgc ctccccgcgc 5340
tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt ccaactacta 5400
aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa aaaacattta 5460
ttttcattgc aagctcgctt tcttgctgtc caatttctat taaaggttcc tttgttccct 5520
aagtccaact actaaactgg gggatattat gaagggcctt gagcatctgg attctgccta 5580
ataaaaaaca tttattttca ttgcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5640
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5700
aaaaaaaaaa aaaaaaaaaa aaaaaactcg gaaggacatg gtgtggaaag tccccaggct 5760
ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 5820
agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 5880
ccaaattaaa gtaacccata acttcgtata gcatacatta tacgaagtta tgaagttcct 5940
attctctaga aagtatagga acttctagtc acctatttca gcatactacg cgcgtagtat 6000
gctgaaatag gtttatcagc acacaatagt ccattatacg cgcgtataat ggcaattgtg 6060
tgctgattgg gttactttaa tttggatccg tcgaccgatg cccttgagag ccttcaaccc 6120
agtcagctcc ttccggtggg cgcggggcat gactatcgtc gccgcactta tgactgtctt 6180
ctttatcatg caactcgtag gacaggtgcc ggcagcgctc ttccgcttcc tcgctcactg 6240
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 6300
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 6360
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 6420
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 6480
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 6540
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 6600
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 6660
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 6720
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 6780
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 6840
gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 6900
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 6960
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 7020
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 7080
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 7140
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 7200
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 7260
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 7320
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 7380
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 7440
cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 7500
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 7560
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 7620
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 7680
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 7740
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 7800
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 7860
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 7920
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 7980
aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 8040
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 8100
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgcgccct 8160
gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 8220
ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 8280
gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 8340
ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 8400
gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 8460
tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 8520
tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 8580
ttaacaaaat attaacgctt acaatttgcc attcgccatt caggctgcgc aactgttggg 8640
aagggcgatc ggtgcgggcc tcttcgctat tacgccagcc caagctacca tgataagtaa 8700
gtaatattaa ggtacgtgga ggttttactt gctttaaaaa acctcccaca cctccccctg 8760
aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat 8820
ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 8880
tctagttgtg gtttgtccaa actcatcaat gtatcttatg gtactgtaac tgagctaaca 8940
taa 8943
<210> 33
<211> 340
<212> DNA
<213> Artificial Sequence
<220>
<223> Super Sequence, SS*
<400> 33
taaagtaacc caatcagcac acaattgcca ttatacgcgc gtataatgga ctattgtgtg 60
ctgataaacc tatttcagca tactacgcgc gtagtatgct gaaataggtg actagaagtt 120
cctatacttt ctagagaata ggaacttcat aacttcgtat aatgtatgct atacgaagtt 180
atgggttact ttaatttggt tgctgactaa ttgagatgca tgctttgcat acttctgcct 240
gctggggagc ctggggactt tccacacctg gttgctgact aattgagatg catgctttgc 300
atacttctgc ctgctgggga gcctggggac tttccacacc 340
<210> 34
<211> 6326
<212> DNA
<213> Artificial Sequence
<220>
<223> pGL2-CAG-SecNLuc-2A-eGFP-WPRE-bGlobin polyA
<400> 34
cccgggaggt accgagctct tacgcgtgct agcctgggtc gacattgatt attgactagt 60
tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga gttccgcgtt 120
acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg cccattgacg 180
tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg acgtcaatgg 240
gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca tatgccaagt 300
acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc ccagtacatg 360
accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg 420
gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc cccaccccca 480
attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg gggggggggg 540
gcgcgcgcca ggcggggcgg ggcggggcga ggggcggggc ggggcgaggc ggaaaggtgc 600
ggcggcagcc aatcagagcg gcgcgctccg aaagtttcct tttatggcga ggcggcggcg 660
gcggcggccc tataaaaagc gaagcgcgcg gcgggcggga gtcgctgcgt tgccttcgcc 720
ccgtgccccg ctccgcgccg cctcgcgccg cccgccccgg ctctgactga ccgcgttact 780
cccacaggtg agcgggcggg acggcccttc tcctccgggc tgtaattagc gcttggttta 840
atgacggctc gtttcttttc tgtggctgcg tgaaagcctt aaagggctcc gggagggccc 900
tttgtgcggg ggggagcggc tcggggggtg cgtgcgtgtg tgtgtgcgtg gggagcgccg 960
cgtgcggctc cgcgctgccc ggcggctgtg agcgctgcgg gcgcggcgcg gggctttgtg 1020
cgctccgcag tgtgcgcgag gggagcgcgg ccgggggcgg tgccccgcgg tgcggggggg 1080
gctgcgaggg gaacaaaggc tgcgtgcggg gtgtgtgcgt gggggggtga gcagggggtg 1140
tgggcgcggc ggtcgggctg taaccccccc ctgcaccccc ctccccgagt tgctgagcac 1200
ggcccggctt cgggtgcggg gctccgtacg gggcgtggcg cggggctcgc cgtgccgggc 1260
ggggggtggc ggcaggtggg ggtgccgggc ggggcggggc cgcctcgggc cggggagggc 1320
tcgggggagg ggcgcggcgg cccccggagc gccggcggct gtcgaggcgc ggcgagccgc 1380
agccattgcc ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc 1440
tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cggggcgaag 1500
cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 1560
cgtccccttc tccctctcca gcctcggggc tgtccgcggg gggacggctg ccttcggggg 1620
ggacggggca gggcggggtt cggcttctgg cgtgtgaccg gcggctctag agcctctgct 1680
aaccatgttc atgccttctt ctttttccta cagctcctgg gcaacgtgct ggttattgtg 1740
ctgtctcatc attttggcaa agaattgatt aattcgagcg aacgcgtcgc caccatgaac 1800
tccttctcca caagcgcctt cggtccagtt gccttctccc tgggcctgct cctggtgttg 1860
cctgctgcct tccctgcccc agtcttcaca ctcgaagatt tcgttgggga ctggcgacag 1920
acagccggct acaacctgga ccaagtcctt gaacagggag gtgtgtccag tttgtttcag 1980
aatctcgggg tgtccgtaac tccgatccaa aggattgtcc tgagcggtga aaatgggctg 2040
aagatcgaca tccatgtcat catcccgtat gaaggtctga gcggcgacca aatgggccag 2100
atcgaaaaaa tttttaaggt ggtgtaccct gtggatgatc atcactttaa ggtgatcctg 2160
cactatggca cactggtaat cgacggggtt acgccgaaca tgatcgacta tttcggacgg 2220
ccgtatgaag gcatcgccgt gttcgacggc aaaaagatca ctgtaacagg gaccctgtgg 2280
aacggcaaca aaattatcga cgagcgcctg atcaaccccg acggctccct gctgttccga 2340
gtaaccatca acggagtgac cggctggcgg ctgtgcgaac gcattctggc ggctagcgct 2400
actaacttca gcctgctgaa gcaggctgga gacgtggagg agaaccctgg acctggaagc 2460
ggagagggca gaggaagtct gctaacatgc ggtgacgtcg aggagaatcc tggacctgga 2520
tccggaatgg tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag 2580
ctggacggcg acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc 2640
acctacggca agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg 2700
cccaccctcg tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac 2760
atgaagcagc acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc 2820
atcttcttca aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac 2880
accctggtga accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg 2940
gggcacaagc tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag 3000
aagaacggca tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag 3060
ctcgccgacc actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac 3120
aaccactacc tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac 3180
atggtcctgc tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctgtac 3240
aagtaagcgg ccgcactcct caggtgcagg ctgcctatca gaaggtggtg gctggtgtgg 3300
ccaatgccct ggctcacaaa taccactgag atctttttcc ctctgccaaa aattatgggg 3360
acatcatgaa gccccttgag catctgactt ctggctaata aaggaaattt attttcattg 3420
caatagtgtg ttggaatttt ttgtgtctct cactcggaag gacattggat ccgtcgaccg 3480
atgcccttga gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc 3540
gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg 3600
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 3660
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 3720
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 3780
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 3840
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 3900
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 3960
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 4020
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 4080
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 4140
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 4200
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 4260
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 4320
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 4380
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 4440
ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt 4500
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 4560
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 4620
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 4680
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 4740
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 4800
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 4860
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 4920
atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 4980
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 5040
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 5100
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 5160
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 5220
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 5280
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 5340
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 5400
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 5460
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 5520
aaaagtgcca cctgacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 5580
gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 5640
ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 5700
agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg 5760
ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 5820
gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta 5880
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 5940
ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt gccattcgcc 6000
attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 6060
gcccaagcta ccatgataag taagtaatat taaggtacgt ggaggtttta cttgctttaa 6120
aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt gttgttgtta 6180
acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa 6240
ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt 6300
atggtactgt aactgagcta acataa 6326
<210> 35
<211> 1626
<212> DNA
<213> Artificial Sequence
<220>
<223> CAG [E1X3+CBA promoter+intron]
<400> 35
gggactttcc ggggcggggc acgtggtgca cgggactttc cgtgcacgtg cacgggactt 60
tccgggactt tccgggactt tccgtgcacc acgtggggac tttccgtgca cgggactttc 120
cggggcgggg cacgtggtgc acgggacttt ccgtgcacgt gcacgggact ttccgggact 180
ttccgggact ttccgtgcac cacgtgggga ctttccgtgc acgggacttt ccggggcggg 240
gcacgtggtg cacgggactt tccgtgcacg tgcacgggac tttccgggac tttccgggac 300
tttccgtgca ccacgtgggg actttccgtg cacgtcgagg tgagccccac gttctgcttc 360
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 420
ttttgtgcag cgatgggggc gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 480
cgaggggcgg ggcggggcga ggcggaaagg tgcggcggca gccaatcaga gcggcgcgct 540
ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 600
gcggcgggcg ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg 660
ccgcccgccc cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc 720
ttctcctccg ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct 780
gcgtgaaagc cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg 840
gtgcgtgcgt gtgtgtgtgc gtggggagcg ccgcgtgcgg ctccgcgctg cccggcggct 900
gtgagcgctg cgggcgcggc gcggggcttt gtgcgctccg cagtgtgcgc gaggggagcg 960
cggccggggg cggtgccccg cggtgcgggg ggggctgcga ggggaacaaa ggctgcgtgc 1020
ggggtgtgtg cgtggggggg tgagcagggg gtgtgggcgc ggcggtcggg ctgtaacccc 1080
cccctgcacc cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt 1140
acggggcgtg gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg 1200
ggcggggcgg ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg 1260
agcgccggcg gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc 1320
gagagggcgc agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc 1380
cgccgcaccc cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg 1440
ggcggggagg gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg 1500
ggctgtccgc ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc 1560
tggcgtgtga ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc 1620
ctacag 1626
<210> 36
<211> 1559
<212> DNA
<213> Artificial Sequence
<220>
<223> CAG [E2+CBA promoter+intron]
<400> 36
tgggactttc cactagacat gacacagcaa tctgatatgc ttgcgtgaga agaggattca 60
tatcctggga ctttccacag attttaccgg aagttgttag atgcttgcgt gagaagatct 120
aacatgacac agcaatcctt agtgggactt tccaagtatg tggggcgggg agtatacatg 180
acacagcaat tgatcattac cggaagttta taggtgggac tttccagacc tatgcttgcg 240
tgagaagaaa ggtctgggac tttccagtcg aggtgagccc cacgttctgc ttcactctcc 300
ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 360
cagcgatggg ggcggggggg gggggggcgc gcgccaggcg gggcggggcg gggcgagggg 420
cggggcgggg cgaggcggaa aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 480
tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 540
gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc gcgccgcctc gcgccgcccg 600
ccccggctct gactgaccgc gttactccca caggtgagcg ggcgggacgg cccttctcct 660
ccgggctgta attagcgctt ggtttaatga cggctcgttt cttttctgtg gctgcgtgaa 720
agccttaaag ggctccggga gggccctttg tgcggggggg agcggctcgg ggggtgcgtg 780
cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg 840
ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg 900
gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt 960
gtgcgtgggg gggtgagcag ggggtgtggg cgcggcggtc gggctgtaac ccccccctgc 1020
acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc cgtacggggc 1080
gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg ccgggcgggg 1140
cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc cggagcgccg 1200
gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg tgcgagaggg 1260
cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg cgccgccgca 1320
ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa atgggcgggg 1380
agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct cggggctgtc 1440
cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc ttctggcgtg 1500
tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt ttcctacag 1559
<210> 37
<211> 826
<212> DNA
<213> Artificial Sequence
<220>
<223> CAG [E1X3+CBA promoter+UTR1]
<400> 37
gggactttcc ggggcggggc acgtggtgca cgggactttc cgtgcacgtg cacgggactt 60
tccgggactt tccgggactt tccgtgcacc acgtggggac tttccgtgca cgggactttc 120
cggggcgggg cacgtggtgc acgggacttt ccgtgcacgt gcacgggact ttccgggact 180
ttccgggact ttccgtgcac cacgtgggga ctttccgtgc acgggacttt ccggggcggg 240
gcacgtggtg cacgggactt tccgtgcacg tgcacgggac tttccgggac tttccgggac 300
tttccgtgca ccacgtgggg actttccgtg cacgtcgagg tgagccccac gttctgcttc 360
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 420
ttttgtgcag cgatgggggc gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 480
cgaggggcgg ggcggggcga ggcggaaagg tgcggcggca gccaatcaga gcggcgcgct 540
ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 600
gcggcgggcg ctgccttctc cctcctgtga gtttggtaag tcgacgggcc gggcctgggc 660
cgggtccggg ccgggtcgtt ggatccccac tacagcccga tactcaagct tgacgaattc 720
gagtatccaa ggtagtggac tagtgtgacg ctgctgaccc ctttctttcc cttctgcagg 780
ttggtgtaca gtagcttcca aattgattaa ttcgagcgaa cgcgtc 826
<210> 38
<211> 759
<212> DNA
<213> Artificial Sequence
<220>
<223> CAG [E2 (U100)+CBA promoter+UTR1]
<400> 38
tgggactttc cactagacat gacacagcaa tctgatatgc ttgcgtgaga agaggattca 60
tatcctggga ctttccacag attttaccgg aagttgttag atgcttgcgt gagaagatct 120
aacatgacac agcaatcctt agtgggactt tccaagtatg tggggcgggg agtatacatg 180
acacagcaat tgatcattac cggaagttta taggtgggac tttccagacc tatgcttgcg 240
tgagaagaaa ggtctgggac tttccagtcg aggtgagccc cacgttctgc ttcactctcc 300
ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 360
cagcgatggg ggcggggggg gggggggcgc gcgccaggcg gggcggggcg gggcgagggg 420
cggggcgggg cgaggcggaa aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 480
tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 540
gcgctgcctt ctccctcctg tgagtttggt aagtcgacgg gccgggcctg ggccgggtcc 600
gggccgggtc gttggatccc cactacagcc cgatactcaa gcttgacgaa ttcgagtatc 660
caaggtagtg gactagtgtg acgctgctga cccctttctt tcccttctgc aggttggtgt 720
acagtagctt ccaaattgat taattcgagc gaacgcgtc 759
<210> 39
<211> 808
<212> DNA
<213> Artificial Sequence
<220>
<223> CMV enhancer-EF1-UTR1
<400> 39
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gggcagagcg cacatcgccc acagtccccg agaagttggg 420
gggaggggtc ggcaattgaa ccggtgccta gagaaggtgg cgcggggtaa actgggaaag 480
tgatgtcgtg tactggctcc gcctttttcc cgagggtggg ggagaaccgt atataagtgc 540
agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc gccagaacac agctgccttc 600
tccctcctgt gagtttggta agtcgacggg ccgggcctgg gccgggtccg ggccgggtcg 660
ttggatcccc actacagccc gatactcaag cttgacgaat tcgagtatcc aaggtagtgg 720
actagtgtga cgctgctgac ccctttcttt cccttctgca ggttggtgta cagtagcttc 780
caaattgatt aattcgagcg aacgcgtc 808
<210> 40
<211> 7772
<212> DNA
<213> Artificial Sequence
<220>
<223> 40 4-1 pGL2-SS*-CAG [CMV enhancer+CBA
Promoter+intron]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 to 120 polyA)-SS*
<400> 40
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacgaca ttgattattg actagttatt aatagtaatc 420
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 480
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 540
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 600
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 660
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 720
tcctacttgg cagtacatct acgtattagt catcgctatt accatggtcg aggtgagccc 780
cacgttctgc ttcactctcc ccatctcccc cccctcccca cccccaattt tgtatttatt 840
tattttttaa ttattttgtg cagcgatggg ggcggggggg gggggggcgc gcgccaggcg 900
gggcggggcg gggcgagggg cggggcgggg cgaggcggaa aggtgcggcg gcagccaatc 960
agagcggcgc gctccgaaag tttcctttta tggcgaggcg gcggcggcgg cggccctata 1020
aaaagcgaag cgcgcggcgg gcgggagtcg ctgcgttgcc ttcgccccgt gccccgctcc 1080
gcgccgcctc gcgccgcccg ccccggctct gactgaccgc gttactccca caggtgagcg 1140
ggcgggacgg cccttctcct ccgggctgta attagcgctt ggtttaatga cggctcgttt 1200
cttttctgtg gctgcgtgaa agccttaaag ggctccggga gggccctttg tgcggggggg 1260
agcggctcgg ggggtgcgtg cgtgtgtgtg tgcgtgggga gcgccgcgtg cggctccgcg 1320
ctgcccggcg gctgtgagcg ctgcgggcgc ggcgcggggc tttgtgcgct ccgcagtgtg 1380
cgcgagggga gcgcggccgg gggcggtgcc ccgcggtgcg gggggggctg cgaggggaac 1440
aaaggctgcg tgcggggtgt gtgcgtgggg gggtgagcag ggggtgtggg cgcggcggtc 1500
gggctgtaac ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg 1560
tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca 1620
ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg 1680
cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt 1740
atggtaatcg tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa 1800
atctgggagg cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg 1860
caggaaggaa atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc 1920
tctccagcct cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc 1980
ggggttcggc ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc 2040
cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt 2100
tggcaaagaa ttgattaatt cgagcgaacg cgtcgccacc atgaactcct tctccacaag 2160
cgccttcggt ccagttgcct tctccctggg cctgctcctg gtgttgcctg ctgccttccc 2220
tgccccagtc ttcacactcg aagatttcgt tggggactgg cgacagacag ccggctacaa 2280
cctggaccaa gtccttgaac agggaggtgt gtccagtttg tttcagaatc tcggggtgtc 2340
cgtaactccg atccaaagga ttgtcctgag cggtgaaaat gggctgaaga tcgacatcca 2400
tgtcatcatc ccgtatgaag gtctgagcgg cgaccaaatg ggccagatcg aaaaaatttt 2460
taaggtggtg taccctgtgg atgatcatca ctttaaggtg atcctgcact atggcacact 2520
ggtaatcgac ggggttacgc cgaacatgat cgactatttc ggacggccgt atgaaggcat 2580
cgccgtgttc gacggcaaaa agatcactgt aacagggacc ctgtggaacg gcaacaaaat 2640
tatcgacgag cgcctgatca accccgacgg ctccctgctg ttccgagtaa ccatcaacgg 2700
agtgaccggc tggcggctgt gcgaacgcat tctggcggct agcgctacta acttcagcct 2760
gctgaagcag gctggagacg tggaggagaa ccctggacct ggaagcggag agggcagagg 2820
aagtctgcta acatgcggtg acgtcgagga gaatcctgga cctggatccg gaatggtgag 2880
caagggcgag gagctgttca ccggggtggt gcccatcctg gtcgagctgg acggcgacgt 2940
aaacggccac aagttcagcg tgtccggcga gggcgagggc gatgccacct acggcaagct 3000
gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg ccctggccca ccctcgtgac 3060
caccctgacc tacggcgtgc agtgcttcag ccgctacccc gaccacatga agcagcacga 3120
cttcttcaag tccgccatgc ccgaaggcta cgtccaggag cgcaccatct tcttcaagga 3180
cgacggcaac tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg 3240
catcgagctg aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga 3300
gtacaactac aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa 3360
ggtgaacttc aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta 3420
ccagcagaac acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag 3480
cacccagtcc gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga 3540
gttcgtgacc gccgccggga tcactctcgg catggacgag ctgtacaagt aaaatcaacc 3600
tctggattac aaaatttgtg aaagattgac tggtattctt aactatgttg ctccttttac 3660
gctatgtgga tacgctgctt taatgccttt gtatcatgct attgcttccc gtatggcttt 3720
cattttctcc tccttgtata aatcctggtt gctgtctctt tatgaggagt tgtggcccgt 3780
tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac gcaaccccca ctggttgggg 3840
cattgccacc acctgtcagc tcctttccgg gactttcgct ttccccctcc ctattgccac 3900
ggcggaactc atcgccgcct gccttgcccg ctgctggaca ggggctcggc tgttgggcac 3960
tgacaattcc gtggtgttgt cggggaaatc atcgtccttt ccttggctgc tcgcctgtgt 4020
tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc ccttcggccc tcaatccagc 4080
ggaccttcct tcccgcggcc tgctgccggc tctgcggcct cttccgcgtc ttcgccttcg 4140
ccctcagacg agtcggatct ccctttgggc cgcctccccg cgctcgcttt cttgctgtcc 4200
aatttctatt aaaggttcct ttgttcccta agtccaacta ctaaactggg ggatattatg 4260
aagggccttg agcatctgga ttctgcctaa taaaaaacat ttattttcat tgcaagctcg 4320
ctttcttgct gtccaatttc tattaaaggt tcctttgttc cctaagtcca actactaaac 4380
tgggggatat tatgaagggc cttgagcatc tggattctgc ctaataaaaa acatttattt 4440
tcattgcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaactcgg 4560
aaggacatgg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 4620
tctcaattag tcagcaacca ggtgtggaaa gtccccaggc tccccagcag gcagaagtat 4680
gcaaagcatg catctcaatt agtcagcaac caaattaaag taacccataa cttcgtatag 4740
catacattat acgaagttat gaagttccta ttctctagaa agtataggaa cttctagtca 4800
cctatttcag catactacgc gcgtagtatg ctgaaatagg tttatcagca cacaatagtc 4860
cattatacgc gcgtataatg gcaattgtgt gctgattggg ttactttaat ttggatccgt 4920
cgaccgatgc ccttgagagc cttcaaccca gtcagctcct tccggtgggc gcggggcatg 4980
actatcgtcg ccgcacttat gactgtcttc tttatcatgc aactcgtagg acaggtgccg 5040
gcagcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 5100
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 5160
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 5220
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 5280
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 5340
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 5400
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 5460
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 5520
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 5580
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 5640
gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 5700
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 5760
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 5820
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 5880
gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg 5940
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 6000
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 6060
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 6120
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 6180
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 6240
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 6300
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 6360
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 6420
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 6480
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 6540
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 6600
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 6660
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 6720
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 6780
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 6840
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 6900
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 6960
tccccgaaaa gtgccacctg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt 7020
ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt 7080
cttcccttcc tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct 7140
ccctttaggg ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg 7200
tgatggttca cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga 7260
gtccacgttc tttaatagtg gactcttgtt ccaaactgga acaacactca accctatctc 7320
ggtctattct tttgatttat aagggatttt gccgatttcg gcctattggt taaaaaatga 7380
gctgatttaa caaaaattta acgcgaattt taacaaaata ttaacgctta caatttgcca 7440
ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 7500
acgccagccc aagctaccat gataagtaag taatattaag gtacgtggag gttttacttg 7560
ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg 7620
ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 7680
tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 7740
tatcttatgg tactgtaact gagctaacat aa 7772
<210> 41
<211> 7725
<212> DNA
<213> Artificial Sequence
<220>
<223> 4-2 pGL2-SS*-CAG [E1 X3+CBA
promoter+introne]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 to 120
polyA)-SS*
<400> 41
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420
actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480
ggggactttc cgtgcacggg actttccggg gcggggcacg tggtgcacgg gactttccgt 540
gcacgtgcac gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt 600
ccgtgcacgg gactttccgg ggcggggcac gtggtgcacg ggactttccg tgcacgtgca 660
cgggactttc cgggactttc cgggactttc cgtgcaccac gtggggactt tccgtgcacg 720
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 780
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 840
cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg gaaaggtgcg 900
gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag gcggcggcgg 960
cggcggccct ataaaaagcg aagcgcgcgg cgggcgggag tcgctgcgtt gccttcgccc 1020
cgtgccccgc tccgcgccgc ctcgcgccgc ccgccccggc tctgactgac cgcgttactc 1080
ccacaggtga gcgggcggga cggcccttct cctccgggct gtaattagcg cttggtttaa 1140
tgacggctcg tttcttttct gtggctgcgt gaaagcctta aagggctccg ggagggccct 1200
ttgtgcgggg gggagcggct cggggggtgc gtgcgtgtgt gtgtgcgtgg ggagcgccgc 1260
gtgcggctcc gcgctgcccg gcggctgtga gcgctgcggg cgcggcgcgg ggctttgtgc 1320
gctccgcagt gtgcgcgagg ggagcgcggc cgggggcggt gccccgcggt gcgggggggg 1380
ctgcgagggg aacaaaggct gcgtgcgggg tgtgtgcgtg ggggggtgag cagggggtgt 1440
gggcgcggcg gtcgggctgt aacccccccc tgcacccccc tccccgagtt gctgagcacg 1500
gcccggcttc gggtgcgggg ctccgtacgg ggcgtggcgc ggggctcgcc gtgccgggcg 1560
gggggtggcg gcaggtgggg gtgccgggcg gggcggggcc gcctcgggcc ggggagggct 1620
cgggggaggg gcgcggcggc ccccggagcg ccggcggctg tcgaggcgcg gcgagccgca 1680
gccattgcct tttatggtaa tcgtgcgaga gggcgcaggg acttcctttg tcccaaatct 1740
gtgcggagcc gaaatctggg aggcgccgcc gcaccccctc tagcgggcgc ggggcgaagc 1800
ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct tcgtgcgtcg ccgcgccgcc 1860
gtccccttct ccctctccag cctcggggct gtccgcgggg ggacggctgc cttcgggggg 1920
gacggggcag ggcggggttc ggcttctggc gtgtgaccgg cggctctaga gcctctgcta 1980
accatgttca tgccttcttc tttttcctac agctcctggg caacgtgctg gttattgtgc 2040
tgtctcatca ttttggcaaa gaattgatta attcgagcga acgcgtcgcc accatgaact 2100
ccttctccac aagcgccttc ggtccagttg ccttctccct gggcctgctc ctggtgttgc 2160
ctgctgcctt ccctgcccca gtcttcacac tcgaagattt cgttggggac tggcgacaga 2220
cagccggcta caacctggac caagtccttg aacagggagg tgtgtccagt ttgtttcaga 2280
atctcggggt gtccgtaact ccgatccaaa ggattgtcct gagcggtgaa aatgggctga 2340
agatcgacat ccatgtcatc atcccgtatg aaggtctgag cggcgaccaa atgggccaga 2400
tcgaaaaaat ttttaaggtg gtgtaccctg tggatgatca tcactttaag gtgatcctgc 2460
actatggcac actggtaatc gacggggtta cgccgaacat gatcgactat ttcggacggc 2520
cgtatgaagg catcgccgtg ttcgacggca aaaagatcac tgtaacaggg accctgtgga 2580
acggcaacaa aattatcgac gagcgcctga tcaaccccga cggctccctg ctgttccgag 2640
taaccatcaa cggagtgacc ggctggcggc tgtgcgaacg cattctggcg gctagcgcta 2700
ctaacttcag cctgctgaag caggctggag acgtggagga gaaccctgga cctggaagcg 2760
gagagggcag aggaagtctg ctaacatgcg gtgacgtcga ggagaatcct ggacctggat 2820
ccggaatggt gagcaagggc gaggagctgt tcaccggggt ggtgcccatc ctggtcgagc 2880
tggacggcga cgtaaacggc cacaagttca gcgtgtccgg cgagggcgag ggcgatgcca 2940
cctacggcaa gctgaccctg aagttcatct gcaccaccgg caagctgccc gtgccctggc 3000
ccaccctcgt gaccaccctg acctacggcg tgcagtgctt cagccgctac cccgaccaca 3060
tgaagcagca cgacttcttc aagtccgcca tgcccgaagg ctacgtccag gagcgcacca 3120
tcttcttcaa ggacgacggc aactacaaga cccgcgccga ggtgaagttc gagggcgaca 3180
ccctggtgaa ccgcatcgag ctgaagggca tcgacttcaa ggaggacggc aacatcctgg 3240
ggcacaagct ggagtacaac tacaacagcc acaacgtcta tatcatggcc gacaagcaga 3300
agaacggcat caaggtgaac ttcaagatcc gccacaacat cgaggacggc agcgtgcagc 3360
tcgccgacca ctaccagcag aacaccccca tcggcgacgg ccccgtgctg ctgcccgaca 3420
accactacct gagcacccag tccgccctga gcaaagaccc caacgagaag cgcgatcaca 3480
tggtcctgct ggagttcgtg accgccgccg ggatcactct cggcatggac gagctgtaca 3540
agtaaaatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 3600
ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 3660
cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 3720
agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 3780
ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 3840
tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 3900
ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 3960
tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 4020
ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 4080
gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcgctcgc 4140
tttcttgctg tccaatttct attaaaggtt cctttgttcc ctaagtccaa ctactaaact 4200
gggggatatt atgaagggcc ttgagcatct ggattctgcc taataaaaaa catttatttt 4260
cattgcaagc tcgctttctt gctgtccaat ttctattaaa ggttcctttg ttccctaagt 4320
ccaactacta aactggggga tattatgaag ggccttgagc atctggattc tgcctaataa 4380
aaaacattta ttttcattgc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4500
aaaaaaaact cggaaggaca tggtgtggaa agtccccagg ctccccagca ggcagaagta 4560
tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag 4620
caggcagaag tatgcaaagc atgcatctca attagtcagc aaccaaatta aagtaaccca 4680
taacttcgta tagcatacat tatacgaagt tatgaagttc ctattctcta gaaagtatag 4740
gaacttctag tcacctattt cagcatacta cgcgcgtagt atgctgaaat aggtttatca 4800
gcacacaata gtccattata cgcgcgtata atggcaattg tgtgctgatt gggttacttt 4860
aatttggatc cgtcgaccga tgcccttgag agccttcaac ccagtcagct ccttccggtg 4920
ggcgcggggc atgactatcg tcgccgcact tatgactgtc ttctttatca tgcaactcgt 4980
aggacaggtg ccggcagcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 5040
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 5100
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 5160
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 5220
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 5280
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 5340
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 5400
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 5460
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 5520
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 5580
cagagttctt gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct 5640
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 5700
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 5760
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 5820
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 5880
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 5940
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 6000
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 6060
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 6120
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 6180
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 6240
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 6300
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 6360
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 6420
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 6480
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 6540
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 6600
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 6660
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 6720
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 6780
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 6840
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 6900
ttccgcgcac atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg 6960
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 7020
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 7080
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 7140
aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 7200
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 7260
tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 7320
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc 7380
ttacaatttg ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg 7440
cctcttcgct attacgccag cccaagctac catgataagt aagtaatatt aaggtacgtg 7500
gaggttttac ttgctttaaa aaacctccca cacctccccc tgaacctgaa acataaaatg 7560
aatgcaattg ttgttgttaa cttgtttatt gcagcttata atggttacaa ataaagcaat 7620
agcatcacaa atttcacaaa taaagcattt ttttcactgc attctagttg tggtttgtcc 7680
aaactcatca atgtatctta tggtactgta actgagctaa cataa 7725
<210> 42
<211> 7658
<212> DNA
<213> Artificial Sequence
<220>
<223> 4-3 pGL2-SS*-CAG [E2(U100)+CBA
promoter+introne]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 to 120
polyA)-SS*
<400> 42
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgactggg actttccact agacatgaca cagcaatctg 420
atatgcttgc gtgagaagag gattcatatc ctgggacttt ccacagattt taccggaagt 480
tgttagatgc ttgcgtgaga agatctaaca tgacacagca atccttagtg ggactttcca 540
agtatgtggg gcggggagta tacatgacac agcaattgat cattaccgga agtttatagg 600
tgggactttc cagacctatg cttgcgtgag aagaaaggtc tgggactttc cagtcgaggt 660
gagccccacg ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta 720
tttatttatt ttttaattat tttgtgcagc gatgggggcg gggggggggg gggcgcgcgc 780
caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggaaaggt gcggcggcag 840
ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc 900
cctataaaaa gcgaagcgcg cggcgggcgg gagtcgctgc gttgccttcg ccccgtgccc 960
cgctccgcgc cgcctcgcgc cgcccgcccc ggctctgact gaccgcgtta ctcccacagg 1020
tgagcgggcg ggacggccct tctcctccgg gctgtaatta gcgcttggtt taatgacggc 1080
tcgtttcttt tctgtggctg cgtgaaagcc ttaaagggct ccgggagggc cctttgtgcg 1140
ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg tggggagcgc cgcgtgcggc 1200
tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg cggggctttg tgcgctccgc 1260
agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc ggtgcggggg gggctgcgag 1320
gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt gagcaggggg tgtgggcgcg 1380
gcggtcgggc tgtaaccccc ccctgcaccc ccctccccga gttgctgagc acggcccggc 1440
ttcgggtgcg gggctccgta cggggcgtgg cgcggggctc gccgtgccgg gcggggggtg 1500
gcggcaggtg ggggtgccgg gcggggcggg gccgcctcgg gccggggagg gctcggggga 1560
ggggcgcggc ggcccccgga gcgccggcgg ctgtcgaggc gcggcgagcc gcagccattg 1620
ccttttatgg taatcgtgcg agagggcgca gggacttcct ttgtcccaaa tctgtgcgga 1680
gccgaaatct gggaggcgcc gccgcacccc ctctagcggg cgcggggcga agcggtgcgg 1740
cgccggcagg aaggaaatgg gcggggaggg ccttcgtgcg tcgccgcgcc gccgtcccct 1800
tctccctctc cagcctcggg gctgtccgcg gggggacggc tgccttcggg ggggacgggg 1860
cagggcgggg ttcggcttct ggcgtgtgac cggcggctct agagcctctg ctaaccatgt 1920
tcatgccttc ttctttttcc tacagctcct gggcaacgtg ctggttattg tgctgtctca 1980
tcattttggc aaagaattga ttaattcgag cgaacgcgtc gccaccatga actccttctc 2040
cacaagcgcc ttcggtccag ttgccttctc cctgggcctg ctcctggtgt tgcctgctgc 2100
cttccctgcc ccagtcttca cactcgaaga tttcgttggg gactggcgac agacagccgg 2160
ctacaacctg gaccaagtcc ttgaacaggg aggtgtgtcc agtttgtttc agaatctcgg 2220
ggtgtccgta actccgatcc aaaggattgt cctgagcggt gaaaatgggc tgaagatcga 2280
catccatgtc atcatcccgt atgaaggtct gagcggcgac caaatgggcc agatcgaaaa 2340
aatttttaag gtggtgtacc ctgtggatga tcatcacttt aaggtgatcc tgcactatgg 2400
cacactggta atcgacgggg ttacgccgaa catgatcgac tatttcggac ggccgtatga 2460
aggcatcgcc gtgttcgacg gcaaaaagat cactgtaaca gggaccctgt ggaacggcaa 2520
caaaattatc gacgagcgcc tgatcaaccc cgacggctcc ctgctgttcc gagtaaccat 2580
caacggagtg accggctggc ggctgtgcga acgcattctg gcggctagcg ctactaactt 2640
cagcctgctg aagcaggctg gagacgtgga ggagaaccct ggacctggaa gcggagaggg 2700
cagaggaagt ctgctaacat gcggtgacgt cgaggagaat cctggacctg gatccggaat 2760
ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg 2820
cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg 2880
caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct 2940
cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca 3000
gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt 3060
caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt 3120
gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa 3180
gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg 3240
catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga 3300
ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta 3360
cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct 3420
gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaaaa 3480
tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc 3540
ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat 3600
ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg 3660
gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg 3720
ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat 3780
tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 3840
gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc 3900
ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa 3960
tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg 4020
ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcgct cgctttcttg 4080
ctgtccaatt tctattaaag gttcctttgt tccctaagtc caactactaa actgggggat 4140
attatgaagg gccttgagca tctggattct gcctaataaa aaacatttat tttcattgca 4200
agctcgcttt cttgctgtcc aatttctatt aaaggttcct ttgttcccta agtccaacta 4260
ctaaactggg ggatattatg aagggccttg agcatctgga ttctgcctaa taaaaaacat 4320
ttattttcat tgcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4380
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440
actcggaagg acatggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 4500
catgcatctc aattagtcag caaccaggtg tggaaagtcc ccaggctccc cagcaggcag 4560
aagtatgcaa agcatgcatc tcaattagtc agcaaccaaa ttaaagtaac ccataacttc 4620
gtatagcata cattatacga agttatgaag ttcctattct ctagaaagta taggaacttc 4680
tagtcaccta tttcagcata ctacgcgcgt agtatgctga aataggttta tcagcacaca 4740
atagtccatt atacgcgcgt ataatggcaa ttgtgtgctg attgggttac tttaatttgg 4800
atccgtcgac cgatgccctt gagagccttc aacccagtca gctccttccg gtgggcgcgg 4860
ggcatgacta tcgtcgccgc acttatgact gtcttcttta tcatgcaact cgtaggacag 4920
gtgccggcag cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct 4980
gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga 5040
taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc 5100
cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg 5160
ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg 5220
aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt 5280
tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt 5340
gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg 5400
cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact 5460
ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt 5520
cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta tctgcgctct 5580
gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac 5640
cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc 5700
tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg 5760
ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta 5820
aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca 5880
atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc 5940
ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc 6000
tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc 6060
agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat 6120
taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt 6180
tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc 6240
cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag 6300
ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt 6360
tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac 6420
tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg 6480
cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat 6540
tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc 6600
gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc 6660
tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa 6720
atgttgaata ctcatactct tcctttttca atattattga agcatttatc agggttattg 6780
tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 6840
cacatttccc cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg 6900
tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt 6960
cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg 7020
ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga 7080
ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac 7140
gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc 7200
tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct attggttaaa 7260
aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat 7320
ttgccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 7380
gctattacgc cagcccaagc taccatgata agtaagtaat attaaggtac gtggaggttt 7440
tacttgcttt aaaaaacctc ccacacctcc ccctgaacct gaaacataaa atgaatgcaa 7500
ttgttgttgt taacttgttt attgcagctt ataatggtta caaataaagc aatagcatca 7560
caaatttcac aaataaagca tttttttcac tgcattctag ttgtggtttg tccaaactca 7620
tcaatgtatc ttatggtact gtaactgagc taacataa 7658
<210> 43
<211> 6850
<212> DNA
<213> Artificial Sequence
<220>
<223> 4-4 pGL2-SS*-CAG [E1 X3+CBA
promoter+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR(108 to 120 polyA)-SS*
<400> 43
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacggga ctttccgggg cggggcacgt ggtgcacggg 420
actttccgtg cacgtgcacg ggactttccg ggactttccg ggactttccg tgcaccacgt 480
ggggactttc cgtgcacggg actttccggg gcggggcacg tggtgcacgg gactttccgt 540
gcacgtgcac gggactttcc gggactttcc gggactttcc gtgcaccacg tggggacttt 600
ccgtgcacgg gactttccgg ggcggggcac gtggtgcacg ggactttccg tgcacgtgca 660
cgggactttc cgggactttc cgggactttc cgtgcaccac gtggggactt tccgtgcacg 720
tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 780
ttttgtattt atttattttt taattatttt gtgcagcgat gggggcgggg gggggggggg 840
cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg gaaaggtgcg 900
gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag gcggcggcgg 960
cggcggccct ataaaaagcg aagcgcgcgg cgggcgctgc cttctccctc ctgtgagttt 1020
ggtaagtcga cgggccgggc ctgggccggg tccgggccgg gtcgttggat ccccactaca 1080
gcccgatact caagcttgac gaattcgagt atccaaggta gtggactagt gtgacgctgc 1140
tgaccccttt ctttcccttc tgcaggttgg tgtacagtag cttccaaatt gattaattcg 1200
agcgaacgcg tcgccaccat gaactccttc tccacaagcg ccttcggtcc agttgccttc 1260
tccctgggcc tgctcctggt gttgcctgct gccttccctg ccccagtctt cacactcgaa 1320
gatttcgttg gggactggcg acagacagcc ggctacaacc tggaccaagt ccttgaacag 1380
ggaggtgtgt ccagtttgtt tcagaatctc ggggtgtccg taactccgat ccaaaggatt 1440
gtcctgagcg gtgaaaatgg gctgaagatc gacatccatg tcatcatccc gtatgaaggt 1500
ctgagcggcg accaaatggg ccagatcgaa aaaattttta aggtggtgta ccctgtggat 1560
gatcatcact ttaaggtgat cctgcactat ggcacactgg taatcgacgg ggttacgccg 1620
aacatgatcg actatttcgg acggccgtat gaaggcatcg ccgtgttcga cggcaaaaag 1680
atcactgtaa cagggaccct gtggaacggc aacaaaatta tcgacgagcg cctgatcaac 1740
cccgacggct ccctgctgtt ccgagtaacc atcaacggag tgaccggctg gcggctgtgc 1800
gaacgcattc tggcggctag cgctactaac ttcagcctgc tgaagcaggc tggagacgtg 1860
gaggagaacc ctggacctgg aagcggagag ggcagaggaa gtctgctaac atgcggtgac 1920
gtcgaggaga atcctggacc tggatccgga atggtgagca agggcgagga gctgttcacc 1980
ggggtggtgc ccatcctggt cgagctggac ggcgacgtaa acggccacaa gttcagcgtg 2040
tccggcgagg gcgagggcga tgccacctac ggcaagctga ccctgaagtt catctgcacc 2100
accggcaagc tgcccgtgcc ctggcccacc ctcgtgacca ccctgaccta cggcgtgcag 2160
tgcttcagcc gctaccccga ccacatgaag cagcacgact tcttcaagtc cgccatgccc 2220
gaaggctacg tccaggagcg caccatcttc ttcaaggacg acggcaacta caagacccgc 2280
gccgaggtga agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa gggcatcgac 2340
ttcaaggagg acggcaacat cctggggcac aagctggagt acaactacaa cagccacaac 2400
gtctatatca tggccgacaa gcagaagaac ggcatcaagg tgaacttcaa gatccgccac 2460
aacatcgagg acggcagcgt gcagctcgcc gaccactacc agcagaacac ccccatcggc 2520
gacggccccg tgctgctgcc cgacaaccac tacctgagca cccagtccgc cctgagcaaa 2580
gaccccaacg agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc cgccgggatc 2640
actctcggca tggacgagct gtacaagtaa aatcaacctc tggattacaa aatttgtgaa 2700
agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata cgctgcttta 2760
atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc cttgtataaa 2820
tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg tggcgtggtg 2880
tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac ctgtcagctc 2940
ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat cgccgcctgc 3000
cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt ggtgttgtcg 3060
gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg ccacctggat tctgcgcggg 3120
acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc ccgcggcctg 3180
ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag tcggatctcc 3240
ctttgggccg cctccccgcg ctcgctttct tgctgtccaa tttctattaa aggttccttt 3300
gttccctaag tccaactact aaactggggg atattatgaa gggccttgag catctggatt 3360
ctgcctaata aaaaacattt attttcattg caagctcgct ttcttgctgt ccaatttcta 3420
ttaaaggttc ctttgttccc taagtccaac tactaaactg ggggatatta tgaagggcct 3480
tgagcatctg gattctgcct aataaaaaac atttattttc attgcaaaaa aaaaaaaaaa 3540
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3600
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaactcggaa ggacatggtg tggaaagtcc 3660
ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccagg 3720
tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag 3780
tcagcaacca aattaaagta acccataact tcgtatagca tacattatac gaagttatga 3840
agttcctatt ctctagaaag tataggaact tctagtcacc tatttcagca tactacgcgc 3900
gtagtatgct gaaataggtt tatcagcaca caatagtcca ttatacgcgc gtataatggc 3960
aattgtgtgc tgattgggtt actttaattt ggatccgtcg accgatgccc ttgagagcct 4020
tcaacccagt cagctccttc cggtgggcgc ggggcatgac tatcgtcgcc gcacttatga 4080
ctgtcttctt tatcatgcaa ctcgtaggac aggtgccggc agcgctcttc cgcttcctcg 4140
ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag 4200
gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 4260
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 4320
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 4380
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 4440
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 4500
catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 4560
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 4620
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 4680
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 4740
actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 4800
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 4860
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 4920
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca 4980
aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt 5040
atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca 5100
gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg 5160
atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca 5220
ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt 5280
cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt 5340
agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca 5400
cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca 5460
tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga 5520
agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact 5580
gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga 5640
gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg 5700
ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc 5760
tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga 5820
tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat 5880
gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt 5940
caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt 6000
atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac 6060
gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct 6120
acacttgcca gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg 6180
ttcgccggct ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt 6240
gctttacggc acctcgaccc caaaaaactt gattagggtg atggttcacg tagtgggcca 6300
tcgccctgat agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga 6360
ctcttgttcc aaactggaac aacactcaac cctatctcgg tctattcttt tgatttataa 6420
gggattttgc cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac 6480
gcgaatttta acaaaatatt aacgcttaca atttgccatt cgccattcag gctgcgcaac 6540
tgttgggaag ggcgatcggt gcgggcctct tcgctattac gccagcccaa gctaccatga 6600
taagtaagta atattaaggt acgtggaggt tttacttgct ttaaaaaacc tcccacacct 6660
ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt ttattgcagc 6720
ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag catttttttc 6780
actgcattct agttgtggtt tgtccaaact catcaatgta tcttatggta ctgtaactga 6840
gctaacataa 6850
<210> 44
<211> 6783
<212> DNA
<213> Artificial Sequence
<220>
<223> 4-5-pGL2-SS*-CAG [E2 (U100)+CBA
promoter+UTR1]-SecNLuc-2A-eGFP-WPRE-3'UTR (108 to 120 polyA)-SS*
<400> 44
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgactggg actttccact agacatgaca cagcaatctg 420
atatgcttgc gtgagaagag gattcatatc ctgggacttt ccacagattt taccggaagt 480
tgttagatgc ttgcgtgaga agatctaaca tgacacagca atccttagtg ggactttcca 540
agtatgtggg gcggggagta tacatgacac agcaattgat cattaccgga agtttatagg 600
tgggactttc cagacctatg cttgcgtgag aagaaaggtc tgggactttc cagtcgaggt 660
gagccccacg ttctgcttca ctctccccat ctcccccccc tccccacccc caattttgta 720
tttatttatt ttttaattat tttgtgcagc gatgggggcg gggggggggg gggcgcgcgc 780
caggcggggc ggggcggggc gaggggcggg gcggggcgag gcggaaaggt gcggcggcag 840
ccaatcagag cggcgcgctc cgaaagtttc cttttatggc gaggcggcgg cggcggcggc 900
cctataaaaa gcgaagcgcg cggcgggcgc tgccttctcc ctcctgtgag tttggtaagt 960
cgacgggccg ggcctgggcc gggtccgggc cgggtcgttg gatccccact acagcccgat 1020
actcaagctt gacgaattcg agtatccaag gtagtggact agtgtgacgc tgctgacccc 1080
tttctttccc ttctgcaggt tggtgtacag tagcttccaa attgattaat tcgagcgaac 1140
gcgtcgccac catgaactcc ttctccacaa gcgccttcgg tccagttgcc ttctccctgg 1200
gcctgctcct ggtgttgcct gctgccttcc ctgccccagt cttcacactc gaagatttcg 1260
ttggggactg gcgacagaca gccggctaca acctggacca agtccttgaa cagggaggtg 1320
tgtccagttt gtttcagaat ctcggggtgt ccgtaactcc gatccaaagg attgtcctga 1380
gcggtgaaaa tgggctgaag atcgacatcc atgtcatcat cccgtatgaa ggtctgagcg 1440
gcgaccaaat gggccagatc gaaaaaattt ttaaggtggt gtaccctgtg gatgatcatc 1500
actttaaggt gatcctgcac tatggcacac tggtaatcga cggggttacg ccgaacatga 1560
tcgactattt cggacggccg tatgaaggca tcgccgtgtt cgacggcaaa aagatcactg 1620
taacagggac cctgtggaac ggcaacaaaa ttatcgacga gcgcctgatc aaccccgacg 1680
gctccctgct gttccgagta accatcaacg gagtgaccgg ctggcggctg tgcgaacgca 1740
ttctggcggc tagcgctact aacttcagcc tgctgaagca ggctggagac gtggaggaga 1800
accctggacc tggaagcgga gagggcagag gaagtctgct aacatgcggt gacgtcgagg 1860
agaatcctgg acctggatcc ggaatggtga gcaagggcga ggagctgttc accggggtgg 1920
tgcccatcct ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg 1980
agggcgaggg cgatgccacc tacggcaagc tgaccctgaa gttcatctgc accaccggca 2040
agctgcccgt gccctggccc accctcgtga ccaccctgac ctacggcgtg cagtgcttca 2100
gccgctaccc cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct 2160
acgtccagga gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg 2220
tgaagttcga gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg 2280
aggacggcaa catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata 2340
tcatggccga caagcagaag aacggcatca aggtgaactt caagatccgc cacaacatcg 2400
aggacggcag cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc 2460
ccgtgctgct gcccgacaac cactacctga gcacccagtc cgccctgagc aaagacccca 2520
acgagaagcg cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg 2580
gcatggacga gctgtacaag taaaatcaac ctctggatta caaaatttgt gaaagattga 2640
ctggtattct taactatgtt gctcctttta cgctatgtgg atacgctgct ttaatgcctt 2700
tgtatcatgc tattgcttcc cgtatggctt tcattttctc ctccttgtat aaatcctggt 2760
tgctgtctct ttatgaggag ttgtggcccg ttgtcaggca acgtggcgtg gtgtgcactg 2820
tgtttgctga cgcaaccccc actggttggg gcattgccac cacctgtcag ctcctttccg 2880
ggactttcgc tttccccctc cctattgcca cggcggaact catcgccgcc tgccttgccc 2940
gctgctggac aggggctcgg ctgttgggca ctgacaattc cgtggtgttg tcggggaaat 3000
catcgtcctt tccttggctg ctcgcctgtg ttgccacctg gattctgcgc gggacgtcct 3060
tctgctacgt cccttcggcc ctcaatccag cggaccttcc ttcccgcggc ctgctgccgg 3120
ctctgcggcc tcttccgcgt cttcgccttc gccctcagac gagtcggatc tccctttggg 3180
ccgcctcccc gcgctcgctt tcttgctgtc caatttctat taaaggttcc tttgttccct 3240
aagtccaact actaaactgg gggatattat gaagggcctt gagcatctgg attctgccta 3300
ataaaaaaca tttattttca ttgcaagctc gctttcttgc tgtccaattt ctattaaagg 3360
ttcctttgtt ccctaagtcc aactactaaa ctgggggata ttatgaaggg ccttgagcat 3420
ctggattctg cctaataaaa aacatttatt ttcattgcaa aaaaaaaaaa aaaaaaaaaa 3480
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3540
aaaaaaaaaa aaaaaaaaaa aaaaaactcg gaaggacatg gtgtggaaag tccccaggct 3600
ccccagcagg cagaagtatg caaagcatgc atctcaatta gtcagcaacc aggtgtggaa 3660
agtccccagg ctccccagca ggcagaagta tgcaaagcat gcatctcaat tagtcagcaa 3720
ccaaattaaa gtaacccata acttcgtata gcatacatta tacgaagtta tgaagttcct 3780
attctctaga aagtatagga acttctagtc acctatttca gcatactacg cgcgtagtat 3840
gctgaaatag gtttatcagc acacaatagt ccattatacg cgcgtataat ggcaattgtg 3900
tgctgattgg gttactttaa tttggatccg tcgaccgatg cccttgagag ccttcaaccc 3960
agtcagctcc ttccggtggg cgcggggcat gactatcgtc gccgcactta tgactgtctt 4020
ctttatcatg caactcgtag gacaggtgcc ggcagcgctc ttccgcttcc tcgctcactg 4080
actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 4140
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 4200
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 4260
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 4320
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 4380
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 4440
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 4500
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 4560
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 4620
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 4680
gaacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 4740
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 4800
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 4860
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga 4920
tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg 4980
agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct 5040
gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg 5100
agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc 5160
cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa 5220
ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc 5280
cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt 5340
cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc 5400
ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt 5460
tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc 5520
catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt 5580
gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata 5640
gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga 5700
tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag 5760
catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa 5820
aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt 5880
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 5940
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgcgccct 6000
gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg 6060
ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg 6120
gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac 6180
ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct 6240
gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt 6300
tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta taagggattt 6360
tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt 6420
ttaacaaaat attaacgctt acaatttgcc attcgccatt caggctgcgc aactgttggg 6480
aagggcgatc ggtgcgggcc tcttcgctat tacgccagcc caagctacca tgataagtaa 6540
gtaatattaa ggtacgtgga ggttttactt gctttaaaaa acctcccaca cctccccctg 6600
aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat 6660
ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 6720
tctagttgtg gtttgtccaa actcatcaat gtatcttatg gtactgtaac tgagctaaca 6780
taa 6783
<210> 45
<211> 6832
<212> DNA
<213> Artificial Sequence
<220>
<223> 4-6-pGL2-SS*-CMV enhancer-EF1-UTR1-SecNLuc-2A-eGFP-WPRE-3'UTR(108
to 120 polyA)-SS*
<400> 45
cccgggaggt accgagctct tacgcgtgct agaattaaag taacccaatc agcacacaat 60
tgccattata cgcgcgtata atggactatt gtgtgctgat aaacctattt cagcatacta 120
cgcgcgtagt atgctgaaat aggtgactag aagttcctat actttctaga gaataggaac 180
ttcataactt cgtataatgt atgctatacg aagttatggg ttactttaat ttggttgctg 240
actaattgag atgcatgctt tgcatacttc tgcctgctgg ggagcctggg gactttccac 300
acctggttgc tgactaattg agatgcatgc tttgcatact tctgcctgct ggggagcctg 360
gggactttcc acacccctgg gtcgacgaca ttgattattg actagttatt aatagtaatc 420
aattacgggg tcattagttc atagcccata tatggagttc cgcgttacat aacttacggt 480
aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta 540
tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg 600
gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga 660
cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt 720
tcctacttgg cagtacatct acgtattagt catcgctatt accatggggc agagcgcaca 780
tcgcccacag tccccgagaa gttgggggga ggggtcggca attgaaccgg tgcctagaga 840
aggtggcgcg gggtaaactg ggaaagtgat gtcgtgtact ggctccgcct ttttcccgag 900
ggtgggggag aaccgtatat aagtgcagta gtcgccgtga acgttctttt tcgcaacggg 960
tttgccgcca gaacacagct gccttctccc tcctgtgagt ttggtaagtc gacgggccgg 1020
gcctgggccg ggtccgggcc gggtcgttgg atccccacta cagcccgata ctcaagcttg 1080
acgaattcga gtatccaagg tagtggacta gtgtgacgct gctgacccct ttctttccct 1140
tctgcaggtt ggtgtacagt agcttccaaa ttgattaatt cgagcgaacg cgtcgccacc 1200
atgaactcct tctccacaag cgccttcggt ccagttgcct tctccctggg cctgctcctg 1260
gtgttgcctg ctgccttccc tgccccagtc ttcacactcg aagatttcgt tggggactgg 1320
cgacagacag ccggctacaa cctggaccaa gtccttgaac agggaggtgt gtccagtttg 1380
tttcagaatc tcggggtgtc cgtaactccg atccaaagga ttgtcctgag cggtgaaaat 1440
gggctgaaga tcgacatcca tgtcatcatc ccgtatgaag gtctgagcgg cgaccaaatg 1500
ggccagatcg aaaaaatttt taaggtggtg taccctgtgg atgatcatca ctttaaggtg 1560
atcctgcact atggcacact ggtaatcgac ggggttacgc cgaacatgat cgactatttc 1620
ggacggccgt atgaaggcat cgccgtgttc gacggcaaaa agatcactgt aacagggacc 1680
ctgtggaacg gcaacaaaat tatcgacgag cgcctgatca accccgacgg ctccctgctg 1740
ttccgagtaa ccatcaacgg agtgaccggc tggcggctgt gcgaacgcat tctggcggct 1800
agcgctacta acttcagcct gctgaagcag gctggagacg tggaggagaa ccctggacct 1860
ggaagcggag agggcagagg aagtctgcta acatgcggtg acgtcgagga gaatcctgga 1920
cctggatccg gaatggtgag caagggcgag gagctgttca ccggggtggt gcccatcctg 1980
gtcgagctgg acggcgacgt aaacggccac aagttcagcg tgtccggcga gggcgagggc 2040
gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa gctgcccgtg 2100
ccctggccca ccctcgtgac caccctgacc tacggcgtgc agtgcttcag ccgctacccc 2160
gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta cgtccaggag 2220
cgcaccatct tcttcaagga cgacggcaac tacaagaccc gcgccgaggt gaagttcgag 2280
ggcgacaccc tggtgaaccg catcgagctg aagggcatcg acttcaagga ggacggcaac 2340
atcctggggc acaagctgga gtacaactac aacagccaca acgtctatat catggccgac 2400
aagcagaaga acggcatcaa ggtgaacttc aagatccgcc acaacatcga ggacggcagc 2460
gtgcagctcg ccgaccacta ccagcagaac acccccatcg gcgacggccc cgtgctgctg 2520
cccgacaacc actacctgag cacccagtcc gccctgagca aagaccccaa cgagaagcgc 2580
gatcacatgg tcctgctgga gttcgtgacc gccgccggga tcactctcgg catggacgag 2640
ctgtacaagt aaaatcaacc tctggattac aaaatttgtg aaagattgac tggtattctt 2700
aactatgttg ctccttttac gctatgtgga tacgctgctt taatgccttt gtatcatgct 2760
attgcttccc gtatggcttt cattttctcc tccttgtata aatcctggtt gctgtctctt 2820
tatgaggagt tgtggcccgt tgtcaggcaa cgtggcgtgg tgtgcactgt gtttgctgac 2880
gcaaccccca ctggttgggg cattgccacc acctgtcagc tcctttccgg gactttcgct 2940
ttccccctcc ctattgccac ggcggaactc atcgccgcct gccttgcccg ctgctggaca 3000
ggggctcggc tgttgggcac tgacaattcc gtggtgttgt cggggaaatc atcgtccttt 3060
ccttggctgc tcgcctgtgt tgccacctgg attctgcgcg ggacgtcctt ctgctacgtc 3120
ccttcggccc tcaatccagc ggaccttcct tcccgcggcc tgctgccggc tctgcggcct 3180
cttccgcgtc ttcgccttcg ccctcagacg agtcggatct ccctttgggc cgcctccccg 3240
cgctcgcttt cttgctgtcc aatttctatt aaaggttcct ttgttcccta agtccaacta 3300
ctaaactggg ggatattatg aagggccttg agcatctgga ttctgcctaa taaaaaacat 3360
ttattttcat tgcaagctcg ctttcttgct gtccaatttc tattaaaggt tcctttgttc 3420
cctaagtcca actactaaac tgggggatat tatgaagggc cttgagcatc tggattctgc 3480
ctaataaaaa acatttattt tcattgcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3540
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3600
aaaaaaaaaa aaaaactcgg aaggacatgg tgtggaaagt ccccaggctc cccagcaggc 3660
agaagtatgc aaagcatgca tctcaattag tcagcaacca ggtgtggaaa gtccccaggc 3720
tccccagcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac caaattaaag 3780
taacccataa cttcgtatag catacattat acgaagttat gaagttccta ttctctagaa 3840
agtataggaa cttctagtca cctatttcag catactacgc gcgtagtatg ctgaaatagg 3900
tttatcagca cacaatagtc cattatacgc gcgtataatg gcaattgtgt gctgattggg 3960
ttactttaat ttggatccgt cgaccgatgc ccttgagagc cttcaaccca gtcagctcct 4020
tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc tttatcatgc 4080
aactcgtagg acaggtgccg gcagcgctct tccgcttcct cgctcactga ctcgctgcgc 4140
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 4200
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 4260
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 4320
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 4380
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 4440
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 4500
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 4560
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 4620
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 4680
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag aacagtattt 4740
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 4800
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 4860
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 4920
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 4980
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 5040
tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 5100
tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 5160
tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 5220
gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 5280
tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 5340
ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 5400
gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 5460
aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 5520
ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 5580
tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 5640
ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 5700
aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 5760
ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 5820
ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 5880
agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 5940
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 6000
ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgcgccctg tagcggcgca 6060
ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg ctacacttgc cagcgcccta 6120
gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca cgttcgccgg ctttccccgt 6180
caagctctaa atcgggggct ccctttaggg ttccgattta gtgctttacg gcacctcgac 6240
cccaaaaaac ttgattaggg tgatggttca cgtagtgggc catcgccctg atagacggtt 6300
tttcgccctt tgacgttgga gtccacgttc tttaatagtg gactcttgtt ccaaactgga 6360
acaacactca accctatctc ggtctattct tttgatttat aagggatttt gccgatttcg 6420
gcctattggt taaaaaatga gctgatttaa caaaaattta acgcgaattt taacaaaata 6480
ttaacgctta caatttgcca ttcgccattc aggctgcgca actgttggga agggcgatcg 6540
gtgcgggcct cttcgctatt acgccagccc aagctaccat gataagtaag taatattaag 6600
gtacgtggag gttttacttg ctttaaaaaa cctcccacac ctccccctga acctgaaaca 6660
taaaatgaat gcaattgttg ttgttaactt gtttattgca gcttataatg gttacaaata 6720
aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt ctagttgtgg 6780
tttgtccaaa ctcatcaatg tatcttatgg tactgtaact gagctaacat aa 6832
<210> 46
<211> 333
<212> DNA
<213> Artificial Sequence
<220>
<223> 3 copies of Enhancer-1
<400> 46
gggactttcc ggggcggggc acgtggtgca cgggactttc cgtgcacgtg cacgggactt 60
tccgggactt tccgggactt tccgtgcacc acgtggggac tttccgtgca cgggactttc 120
cggggcgggg cacgtggtgc acgggacttt ccgtgcacgt gcacgggact ttccgggact 180
ttccgggact ttccgtgcac cacgtgggga ctttccgtgc acgggacttt ccggggcggg 240
gcacgtggtg cacgggactt tccgtgcacg tgcacgggac tttccgggac tttccgggac 300
tttccgtgca ccacgtgggg actttccgtg cac 333
<210> 47
<211> 1016
<212> DNA
<213> Artificial Sequence
<220>
<223> chimeric intron
<400> 47
ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg ccgcccgccc 60
cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg 120
ggctgtaatt agcgcttggt ttaatgacgg ctcgtttctt ttctgtggct gcgtgaaagc 180
cttaaagggc tccgggaggg ccctttgtgc gggggggagc ggctcggggg gtgcgtgcgt 240
gtgtgtgtgc gtggggagcg ccgcgtgcgg ctccgcgctg cccggcggct gtgagcgctg 300
cgggcgcggc gcggggcttt gtgcgctccg cagtgtgcgc gaggggagcg cggccggggg 360
cggtgccccg cggtgcgggg ggggctgcga ggggaacaaa ggctgcgtgc ggggtgtgtg 420
cgtggggggg tgagcagggg gtgtgggcgc ggcggtcggg ctgtaacccc cccctgcacc 480
cccctccccg agttgctgag cacggcccgg cttcgggtgc ggggctccgt acggggcgtg 540
gcgcggggct cgccgtgccg ggcggggggt ggcggcaggt gggggtgccg ggcggggcgg 600
ggccgcctcg ggccggggag ggctcggggg aggggcgcgg cggcccccgg agcgccggcg 660
gctgtcgagg cgcggcgagc cgcagccatt gccttttatg gtaatcgtgc gagagggcgc 720
agggacttcc tttgtcccaa atctgtgcgg agccgaaatc tgggaggcgc cgccgcaccc 780
cctctagcgg gcgcggggcg aagcggtgcg gcgccggcag gaaggaaatg ggcggggagg 840
gccttcgtgc gtcgccgcgc cgccgtcccc ttctccctct ccagcctcgg ggctgtccgc 900
ggggggacgg ctgccttcgg gggggacggg gcagggcggg gttcggcttc tggcgtgtga 960
ccggcggctc tagagcctct gctaaccatg ttcatgcctt cttctttttc ctacag 1016
Claims (135)
- 하기를 포함하는 발현 벡터:
(a) 백본 서열,
(b) 하기를 포함하는 서열:
(i) 관심 핵산 서열을 포함하는 발현 카세트,
(ii) 발현 카세트의 5' 측면을 플랭킹하는 제1 레콤비나제에 대한 제1 표적 서열,
(iii) 발현 카세트의 3' 측면을 플랭킹하는 제1 레콤비나제에 대한 제2 표적 서열, 및
(iv) 제1 레콤비나제에 대한 비-결합 영역 내 제1 및 제2 표적 서열 내에 통합된 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열, 및
(c) 하기 중 하나 이상:
(i) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열, 여기서 엔도뉴클레아제 표적 서열은 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음,
(ii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서,
(iii) 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 사이토메갈로바이러스 (CMV) 인핸서,
(iv) 인트론을 포함하는 5' 비번역 영역 (5'UTR), 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨,
(v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터,
(vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 우드척 간염 바이러스 전사후 조절 요소 (WPRE),
(vii) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 스캐폴드/매트릭스 부착 영역 (S/MAR), 또는
(viii) 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 DNA 핵 표적화 서열 (DTS), 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있음. - 제1항에 있어서, 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열을 포함하고, 여기서 엔도뉴클레아제 표적 서열이 백본 서열과 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있는 것인 발현 벡터.
- 제1항 또는 제2항에 있어서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열 내에 통합된 엔도뉴클레아제 표적 서열을 포함하는 발현 벡터.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 엔도뉴클레아제 표적 서열이 귀소 엔도뉴클레아제에 대한 것인 발현 벡터.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 엔도뉴클레아제 표적 서열이 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I에 대한 것인 발현 벡터.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 엔도뉴클레아제 표적 서열이 I-SceI에 대한 것인 발현 벡터.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 엔도뉴클레아제 표적 서열이 PI-SceI에 대한 것인 발현 벡터.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 엔도뉴클레아제 표적 서열이 Cas 엔도뉴클레아제에 대한 것인 발현 벡터.
- 제8항에 있어서, Cas 엔도뉴클레아제가 Cas9인 발현 벡터.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 또 다른 인핸서 또는 프로모터의 5' 말단 사이에 통합된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함하는 발현 벡터.
- 제10항에 있어서, 합성 인핸서가 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열의 다중 인접 카피를 포함하는 것인 발현 벡터.
- 제11항에 있어서, 합성 인핸서가 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
- 제10항 내지 제12항 중 어느 한 항에 있어서, 합성 인핸서가 닭 β-액틴 프로모터의 5' 말단에 통합되는 것인 발현 벡터.
- 제13항에 있어서, 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된 서열식별번호: 47과 적어도 약 90% 동일한 핵산 서열을 포함하는 키메라 인트론을 포함하는 발현 벡터.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 제1 레콤비나제에 대한 제1 표적 서열의 3' 말단과 발현 카세트 내 프로모터의 5' 말단 사이에 통합된 CMV 인핸서를 포함하는 발현 벡터.
- 제15항에 있어서, CMV 인핸서가 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합되는 것인 발현 벡터.
- 제15항 또는 제16항에 있어서, CMV 프로모터가 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합되는 것인 발현 벡터.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 제1 레콤비나제에 대한 제1 표적 서열과 관심 핵산 서열 사이에 통합된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함하는 발현 벡터.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR이 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합되는 것인 발현 벡터.
- 제19항에 있어서, 인트론이 서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
- 제19항 또는 제20항에 있어서, 인트론 내에 통합된 비-코딩 서열을 추가로 포함하는 발현 벡터.
- 제20항에 있어서, 서열식별번호: 1의 위치 25 내지 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된 비-코딩 서열을 추가로 포함하는 발현 벡터.
- 제21항 또는 제22항에 있어서, 비-코딩 서열이 S/MAR인 발현 벡터.
- 제23항에 있어서, S/MAR이 MAR-5인 발현 벡터.
- 제19항에 있어서, 5'UTR이 서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
- 제19항에 있어서, 5'UTR이 서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
- 제19항 내지 제26항 중 어느 한 항에 있어서, 프로모터가 닭 β-액틴 프로모터인 발현 벡터.
- 제19항 내지 제26항 중 어느 한 항에 있어서, 프로모터가 CMV 프로모터인 발현 벡터.
- 제19항 내지 제28항 중 어느 한 항에 있어서, 프로모터가 CMV 인핸서의 3' 말단에 통합되는 것인 발현 벡터.
- 제29항에 있어서, CMV 인핸서가 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합되는 것인 발현 벡터.
- 제1항 내지 제30항 중 어느 한 항에 있어서, 폴리아데닐화 신호가 관심 핵산 서열의 3' 말단에 통합되는 것인 발현 벡터.
- 제31항에 있어서, 폴리아데닐화 신호가 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
- 제1항 내지 제30항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터를 포함하는 발현 벡터.
- 제33항에 있어서, 척추동물 염색질 인슐레이터가 5'-HS4 닭-β-글로빈 인슐레이터 (cHS4)인 발현 벡터.
- 제1항 내지 제30항, 제33항 및 제34항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE를 포함하는 발현 벡터.
- 제1항 내지 제30항 및 제33항 내지 제35항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR을 포함하는 발현 벡터.
- 제36항에 있어서, S/MAR이 MAR-5인 발현 벡터.
- 제33항 내지 제37항 중 어느 한 항에 있어서, 폴리아데닐화 신호가 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 발현 벡터.
- 제2항 내지 제38항 중 어느 한 항에 있어서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 인핸서 서열을 추가로 포함하는 발현 벡터.
- 제39항에 있어서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열을 포함하는 발현 벡터.
- 제39항 또는 제40항에 있어서, 인핸서 서열이 SV40 인핸서 서열인 발현 벡터.
- 제1항 내지 제38항 중 어느 한 항에 있어서, 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 비-결합 영역 내 제1 레콤비나제에 대한 제1 및/또는 제2 표적 서열 내에 통합된 DTS를 포함하고, 여기서 DTS는 발현 카세트와 제1 레콤비나제 및 하나 이상의 추가 레콤비나제에 대한 절단 부위 사이에 있는 것인 발현 벡터.
- 제42항에 있어서, DTS가 SV40 인핸서 서열인 발현 벡터.
- 제42항에 있어서, DTS가 세포-특이적인 발현 벡터.
- 제1항 내지 제44항 중 어느 한 항에 있어서, 제1 및 제2 표적 서열 및 하나 이상의 추가 표적 서열이 PY54 pal 부위, N15 telRL 부위, loxP 부위, φK02 telRL 부위, FRT 부위, phiC31 attP 부위 및 λ attP 부위로 이루어진 군으로부터 선택되는 것인 발현 벡터.
- 제45항에 있어서, 각각의 표적 서열을 포함하는 발현 벡터.
- 제45항 또는 제46항에 있어서, pal 부위 및 pal 부위 내에 통합된 telRL, loxP 및 FRT 레콤비나제 표적 결합 서열을 포함하는 발현 벡터.
- 제1항 내지 제47항 중 어느 한 항에 있어서, 제1 레콤비나제에 대한 제1 및 제2 표적 서열이 각각 서열식별번호: 33의 핵산 서열을 포함하는 것인 발현 벡터.
- 제1항 내지 제48항 중 어느 한 항에 있어서, 박테리아 서열-무함유 벡터를 생산하기 위한 발현 벡터.
- 제49항에 있어서, 박테리아 서열-무함유 벡터가 원형 공유 폐쇄형 벡터인 발현 벡터.
- 제49항에 있어서, 박테리아 서열-무함유 벡터가 선형 공유 폐쇄형 벡터인 발현 벡터.
- 유도성 프로모터의 제어 하에 레콤비나제를 코딩하는 재조합 세포를 포함하는 벡터 생산 시스템으로서, 재조합 세포는 제1항 내지 제51항 중 어느 한 항의 발현 벡터를 포함하고, 여기서 레콤비나제는 제1 레콤비나제에 대한 제1 및 제2 표적 서열 또는 발현 벡터 내 하나 이상의 추가 레콤비나제에 대한 하나 이상의 추가 표적 서열 중 하나를 표적화하는 것인 벡터 생산 시스템.
- 제52항에 있어서, 레콤비나제가 TelN, Tel, Cre 또는 Flp인 벡터 생산 시스템.
- 제52항 또는 제53항에 있어서, 재조합 세포가 유도성 프로모터의 제어 하에 엔도뉴클레아제를 추가로 코딩하고, 여기서 엔도뉴클레아제가 엔도뉴클레아제 표적 서열을 포함하는 발현 벡터 내 엔도뉴클레아제 표적 서열을 표적화하는 것인 벡터 생산 시스템.
- 제54항에 있어서, 엔도뉴클레아제가 귀소 엔도뉴클레아제인 벡터 생산 시스템.
- 제55항에 있어서, 귀소 엔도뉴클레아제가 I-AniI, I-CeuI, I-ChuI, I-CpaI, I-CpaII, I-CreI, I-DmoI, H-DreI, I-HmuI, I-HmuII, I-LlaI, I-MsoI, PI-PfuI, PI-PkoII, I-PorI, I-PpoI, PI-PspI, I-ScaI, I-SceI, PI-SceI, I-SceII, I-SecIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-Ssp6803I, I-TevI, I-TevII, I-TevIII, PI-TliI, PI-TliII, I-Tsp061I 또는 I-Vdi141I인 벡터 생산 시스템.
- 제54항 내지 제56항 중 어느 한 항에 있어서, 엔도뉴클레아제가 I-SceI인 벡터 생산 시스템.
- 제54항 내지 제56항 중 어느 한 항에 있어서, 엔도뉴클레아제가 PI-SceI인 벡터 생산 시스템.
- 제54항에 있어서, 재조합 세포가 엔도뉴클레아제를 포함하는 뉴클레아제 게놈 편집 시스템을 코딩하는 것인 벡터 생산 시스템.
- 제59항에 있어서, 뉴클레아제 게놈 편집 시스템이 가이드 RNA 및 Cas 엔도뉴클레아제를 포함하는 클러스터링된 규칙적 간격의 짧은 회문구조 반복부 (CRISPR) 뉴클레아제 시스템인 벡터 생산 시스템.
- 제60항에 있어서, Cas 엔도뉴클레아제가 Cas9인 벡터 생산 시스템.
- 제52항 내지 제61항 중 어느 한 항에 있어서, 유도성 프로모터가 열-조절성, 화학적-조절성, IPTG 조절성, 글루코스-조절성, 아라비노스 유도성, T7 폴리머라제 조절성, 저온-충격 유도성, pH 유도성, 또는 이들의 조합인 벡터 생산 시스템.
- 레콤비나제의 발현에 적합한 조건 하에 제52항 내지 제62항 중 어느 한 항의 벡터 생산 시스템을 인큐베이션하는 것을 포함하는, 박테리아 서열-무함유 벡터를 생산하는 방법.
- 제63항에 있어서, 엔도뉴클레아제의 발현에 적합한 조건 하에 제38항 내지 제46항 중 어느 한 항의 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함하는 방법.
- 제63항 또는 제64항에 있어서, 뉴클레아제 게놈 편집 시스템의 발현에 적합한 조건 하에 제59항 내지 제62항 중 어느 한 항의 벡터 생산 시스템을 인큐베이션하는 것을 추가로 포함하는 방법.
- 제63항 내지 제65항 중 어느 한 항에 있어서, 박테리아 서열-무함유 벡터를 수확하는 것을 추가로 포함하는 방법.
- 제63항 내지 제66항 중 어느 한 항의 방법에 의해 생산된 박테리아 서열-무함유 벡터.
- 하기를 포함하는 박테리아 서열-무함유 벡터:
(a) 관심 핵산 서열을 포함하는 발현 카세트, 및
(b) 하기 중 하나 이상:
(i) 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서,
(ii) 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서,
(iii) 인트론을 포함하는 5'UTR, 여기서 5'UTR은 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합됨,
(iv) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터,
(v) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE,
(vi) 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR, 또는
(vii) 발현 카세트에 대해 5'에 위치된 DTS. - 제68항에 있어서, 발현 카세트 내 또 다른 인핸서 또는 프로모터에 대해 5'에 위치된 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서를 포함하는 박테리아 서열-무함유 벡터.
- 제69항에 있어서, 합성 인핸서가 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열의 다중 인접 카피를 포함하는 것인 박테리아 서열-무함유 벡터.
- 제70항에 있어서, 합성 인핸서가 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
- 제69항 내지 제71항 중 어느 한 항에 있어서, 합성 인핸서가 닭 β-액틴 프로모터의 5' 말단에 통합되는 것인 박테리아 서열-무함유 벡터.
- 제72항에 있어서, 닭 β-액틴 프로모터의 3' 말단 및 관심 핵산 서열의 5'에 통합된 서열식별번호: 47과 적어도 약 90% 동일한 핵산 서열을 포함하는 키메라 인트론을 포함하는 박테리아 서열-무함유 벡터.
- 제68항에 있어서, 발현 카세트 내 프로모터에 대해 5'에 위치된 CMV 인핸서를 포함하는 박테리아 서열-무함유 벡터.
- 제74항에 있어서, CMV 인핸서가 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합되는 것인 박테리아 서열-무함유 벡터.
- 제74항 또는 제75항에 있어서, CMV 프로모터가 CMV 인핸서의 3' 말단 및 관심 핵산 서열의 5'에 통합되는 것인 박테리아 서열-무함유 벡터.
- 제68항에 있어서, 관심 핵산 서열에 대해 5'에 위치된 서열식별번호: 35, 서열식별번호: 36, 서열식별번호: 37, 서열식별번호: 38 또는 서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함하는 박테리아 서열-무함유 벡터.
- 제68항에 있어서, 인트론을 포함하는 5'UTR을 포함하고, 여기서 5'UTR이 프로모터와 관심 핵산 서열 사이에서 발현 카세트에 통합되는 것인 박테리아 서열-무함유 벡터.
- 제78항에 있어서, 인트론이 서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
- 제78항 또는 제79항에 있어서, 인트론 내에 통합된 비-코딩 서열을 추가로 포함하는 박테리아 서열-무함유 벡터.
- 제79항에 있어서, 서열식별번호: 1의 뉴클레오티드 위치 25 및 55로부터의 임의의 2개의 뉴클레오티드에 상응하는 인트론 내 2개의 뉴클레오티드 사이에 통합된 비-코딩 서열을 추가로 포함하는 박테리아 서열-무함유 벡터.
- 제80항 또는 제81항에 있어서, 비-코딩 서열이 S/MAR인 박테리아 서열-무함유 벡터.
- 제82항에 있어서, S/MAR이 MAR-5인 박테리아 서열-무함유 벡터.
- 제78항에 있어서, 5'UTR이 서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
- 제78항에 있어서, 5'UTR이 서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
- 제78항 내지 제85항 중 어느 한 항에 있어서, 프로모터가 닭 β-액틴 프로모터인 박테리아 서열-무함유 벡터.
- 제78항 내지 제85항 중 어느 한 항에 있어서, 프로모터가 CMV 프로모터인 박테리아 서열-무함유 벡터.
- 제78항 내지 제87항 중 어느 한 항에 있어서, 프로모터가 CMV 인핸서의 3' 말단에 통합되는 것인 박테리아 서열-무함유 벡터.
- 제88항에 있어서, CMV 인핸서가 서열식별번호: 12 또는 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 합성 인핸서의 3' 말단에 통합되는 것인 박테리아 서열-무함유 벡터.
- 제68항 내지 제89항 중 어느 한 항에 있어서, 폴리아데닐화 신호가 관심 핵산 서열의 3' 말단에 통합되는 것인 박테리아 서열-무함유 벡터.
- 제90항에 있어서, 폴리아데닐화 신호가 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
- 제68항 내지 제89항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 척추동물 염색질 인슐레이터를 포함하는 박테리아 서열-무함유 벡터.
- 제92항에 있어서, 척추동물 염색질 인슐레이터가 cHS4인 박테리아 서열-무함유 벡터.
- 제68항 내지 제89항, 제92항 및 제93항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 WPRE를 포함하는 박테리아 서열-무함유 벡터.
- 제68항 내지 제89항 및 제92항 내지 제94항 중 어느 한 항에 있어서, 관심 핵산과 폴리아데닐화 신호 사이에서 발현 카세트에 통합된 S/MAR을 포함하는 박테리아 서열-무함유 벡터.
- 제95항에 있어서, S/MAR이 MAR-5인 박테리아 서열-무함유 벡터.
- 제92항 내지 제96항 중 어느 한 항에 있어서, 폴리아데닐화 신호가 서열식별번호: 13, 서열식별번호: 14 또는 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 것인 박테리아 서열-무함유 벡터.
- 제68항 내지 제97항 중 어느 한 항에 있어서, 발현 카세트의 각 측면을 플랭킹하는 인핸서 서열을 추가로 포함하는 박테리아 서열-무함유 벡터.
- 제98항에 있어서, 발현 카세트의 각 측면을 플랭킹하는 적어도 2개의 인핸서 서열을 포함하는 박테리아 서열-무함유 벡터.
- 제98항 또는 제99항에 있어서, 인핸서 서열이 SV40 인핸서 서열인 박테리아 서열-무함유 벡터.
- 제68항 내지 제97항 중 어느 한 항에 있어서, 발현 카세트에 대해 5'에 위치된 DTS를 포함하는 박테리아 서열-무함유 벡터.
- 제101항에 있어서, DTS가 SV40 인핸서 서열인 박테리아 서열-무함유 벡터.
- 제101항에 있어서, DTS가 세포-특이적인 박테리아 서열-무함유 벡터.
- 제68항 내지 제103항 중 어느 한 항에 있어서, 원형 공유 폐쇄형 벡터인 박테리아 서열-무함유 벡터.
- 제68항 내지 제103항 중 어느 한 항에 있어서, 선형 공유 폐쇄형 벡터인 박테리아 서열-무함유 벡터.
- 제1항 내지 제51항 중 어느 한 항의 발현 벡터 또는 제67항 내지 제105항 중 어느 한 항의 박테리아 서열-무함유 벡터를 포함하는 재조합 세포.
- 제1항 내지 제51항 중 어느 한 항의 발현 벡터 또는 제67항 내지 제105항 중 어느 한 항의 박테리아 서열-무함유 벡터를 포함하는 조성물.
- 제107항에 있어서, 전달제를 추가로 포함하는 조성물.
- 제108항에 있어서, 전달제가 나노입자인 조성물.
- 제108항 또는 제109항에 있어서, 전달제가 표적화 리간드를 포함하는 것인 조성물.
- 제107항 내지 제110항 중 어느 한 항에 있어서, 제약상 허용되는 담체를 추가로 포함하는 제약 조성물인 조성물.
- 제1항 내지 제51항 중 어느 한 항의 발현 벡터, 제67항 내지 제105항 중 어느 한 항의 박테리아 서열-무함유 벡터, 또는 제111항의 제약 조성물을 질환 또는 장애의 치료를 필요로 하는 대상체에게 투여하는 것을 포함하는, 상기 대상체에서 질환 또는 장애를 치료하는 방법.
- 서열식별번호: 1과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 2와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 3과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 5와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 12와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 46과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 13과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 14와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 15와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 제86항 내지 제88항 중 어느 한 항에 있어서, 핵산 서열의 3' 말단에 100 내지 120개의 아데닌 뉴클레오티드를 추가로 포함하는 폴리뉴클레오티드.
- 서열식별번호: 16과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 17과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 18과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 35와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 36과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 37과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 38과 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 서열식별번호: 39와 적어도 약 90% 동일한 핵산 서열을 포함하는 폴리뉴클레오티드.
- 제113항 내지 제130항 중 어느 한 항의 폴리뉴클레오티드를 포함하는 발현 벡터.
- 제114항 내지 제116항 중 어느 한 항의 폴리뉴클레오티드 및 제119항 내지 제125항 중 어느 한 항의 폴리뉴클레오티드를 포함하는 발현 벡터.
- 제1항 내지 제51항 중 어느 한 항의 발현 벡터, 제67항 내지 제105항 중 어느 한 항의 박테리아 서열-무함유 벡터, 또는 제107항 내지 제111항 중 어느 한 항의 제약 조성물로부터의 관심 핵산 서열을 유전자 편집을 위한 표적 부위에 삽입하는 것을 포함하는 유전자 편집 방법.
- 제133항에 있어서, 유전자 편집이 비-상동성 말단 연결에 의한 것인 방법.
- 제133항에 있어서, 유전자 편집이 상동성-지정 복구에 의한 것인 방법.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163211343P | 2021-06-16 | 2021-06-16 | |
US63/211,343 | 2021-06-16 | ||
US202263306015P | 2022-02-02 | 2022-02-02 | |
US63/306,015 | 2022-02-02 | ||
US202263331638P | 2022-04-15 | 2022-04-15 | |
US63/331,638 | 2022-04-15 | ||
PCT/IB2022/055620 WO2022264095A1 (en) | 2021-06-16 | 2022-06-16 | Expression vectors, bacterial sequence-free vectors, and methods of making and using the same |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240021906A true KR20240021906A (ko) | 2024-02-19 |
Family
ID=84527300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247001300A KR20240021906A (ko) | 2021-06-16 | 2022-06-16 | 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20240229071A1 (ko) |
EP (1) | EP4355883A1 (ko) |
JP (1) | JP2024523343A (ko) |
KR (1) | KR20240021906A (ko) |
AU (1) | AU2022292197A1 (ko) |
BR (1) | BR112023026176A2 (ko) |
CA (1) | CA3222578A1 (ko) |
MX (1) | MX2023014628A (ko) |
WO (1) | WO2022264095A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024058155A1 (ja) * | 2022-09-12 | 2024-03-21 | 株式会社カネカ | 二本鎖環状dnaベクター、直鎖状共有結合閉鎖dnaの作製方法、並びにプロテロメラーゼ及びエンドヌクレアーゼを含む融合ポリペプチド |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9862954B2 (en) * | 2012-11-22 | 2018-01-09 | Mediphage Bioceuticals, Inc. | DNA vector production system |
-
2022
- 2022-06-16 EP EP22824423.2A patent/EP4355883A1/en active Pending
- 2022-06-16 WO PCT/IB2022/055620 patent/WO2022264095A1/en active Application Filing
- 2022-06-16 CA CA3222578A patent/CA3222578A1/en active Pending
- 2022-06-16 AU AU2022292197A patent/AU2022292197A1/en active Pending
- 2022-06-16 JP JP2023577551A patent/JP2024523343A/ja active Pending
- 2022-06-16 MX MX2023014628A patent/MX2023014628A/es unknown
- 2022-06-16 KR KR1020247001300A patent/KR20240021906A/ko unknown
- 2022-06-16 BR BR112023026176A patent/BR112023026176A2/pt unknown
-
2023
- 2023-12-15 US US18/541,459 patent/US20240229071A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
MX2023014628A (es) | 2024-02-28 |
WO2022264095A1 (en) | 2022-12-22 |
EP4355883A1 (en) | 2024-04-24 |
CA3222578A1 (en) | 2022-12-22 |
BR112023026176A2 (pt) | 2024-03-05 |
JP2024523343A (ja) | 2024-06-28 |
AU2022292197A1 (en) | 2023-12-21 |
US20240229071A1 (en) | 2024-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019203955C1 (en) | Multipartite signaling proteins and uses thereof | |
CN111295449B (zh) | 腺病毒载体及其用途 | |
KR102319845B1 (ko) | 조류 숙주 세포에 대한 crispr-cas 시스템 | |
ES2819976T5 (es) | Composiciones y usos médicos para la reprogramación de TCR con proteínas de fusión | |
KR101666228B1 (ko) | 생물치료학적 분자를 발현시키기 위한 치료학적 유전자-스위치 작제물 및 생물반응기, 및 이의 용도 | |
US20030119104A1 (en) | Chromosome-based platforms | |
KR20210108423A (ko) | 아데노 관련 바이러스 (aav) 생산자 세포주 및 관련 방법 | |
KR20180048743A (ko) | 2a 펩타이드를 포함하는 재조합 벡터 | |
JP2003534775A (ja) | タンパク質を不安定化する方法とその使用 | |
KR20210105382A (ko) | 단백질을 코딩하는 rna | |
KR20220121844A (ko) | 유전자의 발현을 동시에 조절하기 위한 조성물 및 방법 | |
AU2016378480A1 (en) | Endothelium-specific nucleic acid regulatory elements and methods and use thereof | |
KR20230019063A (ko) | C9orf72 연관 질환의 치료를 위한 삼중 기능 아데노-연관 바이러스 (aav) 벡터 | |
CN115927299A (zh) | 增加双链rna产生的方法和组合物 | |
KR20240037185A (ko) | 키메라 공동자극 수용체, 케모카인 수용체, 및 세포 면역치료에서의 이의 용도 | |
KR20230054840A (ko) | rAAV 비리온의 유도 생산을 위한 안정화된 세포주 | |
KR20220016485A (ko) | 미엘린 단백질 제로 프로모터를 갖는 aav 벡터, 및 샤르코-마리-투스 질환과 같은 슈반 세포-관련 질환을 치료하기 위한 이의 용도 | |
KR20240021906A (ko) | 발현 벡터, 박테리아 서열-무함유 벡터, 및 이를 제조하고 사용하는 방법 | |
CN117881788A (zh) | 表达载体、无细菌序列载体及其制备和使用方法 | |
KR20070114761A (ko) | Sivpedf 벡터를 사용한 안조직 세포에 있어서의아포토시스 변성을 동반하는 질환의 치료제 | |
CN114807140B (zh) | 一种肌源性细胞血糖响应型表达sia的启动子、重组载体及其构建方法和应用 | |
KR20240022571A (ko) | Rna-가이드된 이펙터 동원을 위한 시스템, 방법 및 성분 | |
KR20230117327A (ko) | 가용성 알칼리성 포스파타제 작제물 및 가용성 알칼리성 포스파타제 작제물을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터 | |
US11814412B2 (en) | Artificial proteins and compositions and methods thereof | |
CA2522166C (en) | Lambda integrase mutein for use in recombination |