CN113383081A - 基质附着区和促进基因表达的用途 - Google Patents
基质附着区和促进基因表达的用途 Download PDFInfo
- Publication number
- CN113383081A CN113383081A CN201980091439.0A CN201980091439A CN113383081A CN 113383081 A CN113383081 A CN 113383081A CN 201980091439 A CN201980091439 A CN 201980091439A CN 113383081 A CN113383081 A CN 113383081A
- Authority
- CN
- China
- Prior art keywords
- mar
- seq
- nos
- core
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 15
- 230000014509 gene expression Effects 0.000 title abstract description 19
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 18
- 108091026890 Coding region Proteins 0.000 claims abstract description 16
- 239000002773 nucleotide Substances 0.000 claims abstract description 15
- 210000004027 cell Anatomy 0.000 claims description 61
- 108020005029 5' Flanking Region Proteins 0.000 claims description 31
- 102000040430 polynucleotide Human genes 0.000 claims description 30
- 108091033319 polynucleotide Proteins 0.000 claims description 30
- 239000002157 polynucleotide Substances 0.000 claims description 30
- 108020005065 3' Flanking Region Proteins 0.000 claims description 29
- 238000000034 method Methods 0.000 claims description 29
- 150000007523 nucleic acids Chemical group 0.000 claims description 27
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 claims description 16
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 claims description 16
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 15
- 210000000299 nuclear matrix Anatomy 0.000 claims description 15
- 238000013518 transcription Methods 0.000 claims description 11
- 230000035897 transcription Effects 0.000 claims description 11
- 210000004962 mammalian cell Anatomy 0.000 claims description 9
- 230000000977 initiatory effect Effects 0.000 claims description 3
- 108090000623 proteins and genes Proteins 0.000 abstract description 20
- 102000004169 proteins and genes Human genes 0.000 abstract description 8
- 108020004414 DNA Proteins 0.000 description 43
- 239000013598 vector Substances 0.000 description 20
- 230000008488 polyadenylation Effects 0.000 description 14
- 241000252212 Danio rerio Species 0.000 description 11
- SXTAYKAGBXMACB-UHFFFAOYSA-N methionine sulfoximine Chemical compound CS(=N)(=O)CCC(N)C(O)=O SXTAYKAGBXMACB-UHFFFAOYSA-N 0.000 description 10
- 239000003550 marker Substances 0.000 description 9
- 108091023040 Transcription factor Proteins 0.000 description 8
- 102000040945 Transcription factor Human genes 0.000 description 8
- 239000003623 enhancer Substances 0.000 description 7
- 108020004999 messenger RNA Proteins 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 108090000765 processed proteins & peptides Proteins 0.000 description 7
- 241000701022 Cytomegalovirus Species 0.000 description 6
- 210000003527 eukaryotic cell Anatomy 0.000 description 6
- 108010077544 Chromatin Proteins 0.000 description 5
- 108700019146 Transgenes Proteins 0.000 description 5
- 210000003483 chromatin Anatomy 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 241000206602 Eukaryota Species 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 210000001236 prokaryotic cell Anatomy 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 108090000204 Dipeptidase 1 Proteins 0.000 description 3
- 101000655234 Homo sapiens DNA-binding protein SATB1 Proteins 0.000 description 3
- 102000006635 beta-lactamase Human genes 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 210000001671 embryonic stem cell Anatomy 0.000 description 3
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 230000001124 posttranscriptional effect Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 230000002103 transcriptional effect Effects 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 241000252233 Cyprinus carpio Species 0.000 description 2
- 102000003844 DNA helicases Human genes 0.000 description 2
- 108090000133 DNA helicases Proteins 0.000 description 2
- 102100032881 DNA-binding protein SATB1 Human genes 0.000 description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- SXTAYKAGBXMACB-DPVSGNNYSA-N L-methionine sulfoximine Chemical compound CS(=N)(=O)CC[C@H](N)C(O)=O SXTAYKAGBXMACB-DPVSGNNYSA-N 0.000 description 2
- 108091092878 Microsatellite Proteins 0.000 description 2
- 229930193140 Neomycin Natural products 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 101100271190 Plasmodium falciparum (isolate 3D7) ATAT gene Proteins 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 2
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 2
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 108010006025 bovine growth hormone Proteins 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 102000005396 glutamine synthetase Human genes 0.000 description 2
- 108020002326 glutamine synthetase Proteins 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 229940065638 intron a Drugs 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 229960004927 neomycin Drugs 0.000 description 2
- 108010055527 nuclear matrix protein 2 Proteins 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 229960004641 rituximab Drugs 0.000 description 2
- 229940081969 saccharomyces cerevisiae Drugs 0.000 description 2
- 239000004017 serum-free culture medium Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 101800000263 Acidic protein Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 101710106492 Acyl-CoA-binding protein Proteins 0.000 description 1
- 102100035785 Acyl-CoA-binding protein Human genes 0.000 description 1
- 101710169323 Acyl-CoA-binding protein homolog Proteins 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101001073212 Arabidopsis thaliana Peroxidase 33 Proteins 0.000 description 1
- 102000015081 Blood Coagulation Factors Human genes 0.000 description 1
- 108010039209 Blood Coagulation Factors Proteins 0.000 description 1
- 101710186200 CCAAT/enhancer-binding protein Proteins 0.000 description 1
- 102100034808 CCAAT/enhancer-binding protein alpha Human genes 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 101100507655 Canis lupus familiaris HSPA1 gene Proteins 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 101150099612 Esrrb gene Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108010051696 Growth Hormone Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 101000945515 Homo sapiens CCAAT/enhancer-binding protein alpha Proteins 0.000 description 1
- 101001123325 Homo sapiens Peroxisome proliferator-activated receptor gamma coactivator 1-beta Proteins 0.000 description 1
- 101000964718 Homo sapiens Zinc finger protein 384 Proteins 0.000 description 1
- GRRNUXAQVGOGFE-UHFFFAOYSA-N Hygromycin-B Natural products OC1C(NC)CC(N)C(O)C1OC1C2OC3(C(C(O)C(O)C(C(N)CO)O3)O)OC2C(O)C(CO)O1 GRRNUXAQVGOGFE-UHFFFAOYSA-N 0.000 description 1
- 102000015696 Interleukins Human genes 0.000 description 1
- 108010063738 Interleukins Proteins 0.000 description 1
- ZSBXGIUJOOQZMP-UHFFFAOYSA-N Isomatrine Natural products C1CCC2CN3C(=O)CCCC3C3C2N1CCC3 ZSBXGIUJOOQZMP-UHFFFAOYSA-N 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- 108700021430 Kruppel-Like Factor 4 Proteins 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 102100030417 Matrilysin Human genes 0.000 description 1
- 108090000855 Matrilysin Proteins 0.000 description 1
- NLSTZAFFNDSJGQ-UHFFFAOYSA-N Matrin Natural products O=C1CCCN2CC3CCNC4CCCC(C34)C12 NLSTZAFFNDSJGQ-UHFFFAOYSA-N 0.000 description 1
- 102100038645 Matrin-3 Human genes 0.000 description 1
- 101710146614 Matrin-3 Proteins 0.000 description 1
- 101710143111 Mothers against decapentaplegic homolog 3 Proteins 0.000 description 1
- 102100025748 Mothers against decapentaplegic homolog 3 Human genes 0.000 description 1
- 101100293199 Mus musculus Myc gene Proteins 0.000 description 1
- 101100313364 Mus musculus Tfcp2l1 gene Proteins 0.000 description 1
- -1 Nanog Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 101150054854 POU1F1 gene Proteins 0.000 description 1
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- 102100028961 Peroxisome proliferator-activated receptor gamma coactivator 1-beta Human genes 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 102100037935 Polyubiquitin-C Human genes 0.000 description 1
- 101710113369 Putative acyl-CoA-binding protein Proteins 0.000 description 1
- 101100346194 Rattus norvegicus Mpc1 gene Proteins 0.000 description 1
- 101100247004 Rattus norvegicus Qsox1 gene Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101150032199 Rplp0 gene Proteins 0.000 description 1
- 101150099493 STAT3 gene Proteins 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 102100038803 Somatotropin Human genes 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 108010056354 Ubiquitin C Proteins 0.000 description 1
- 102100040731 Zinc finger protein 384 Human genes 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 239000003782 beta lactam antibiotic agent Substances 0.000 description 1
- 239000003114 blood coagulation factor Substances 0.000 description 1
- 229940019700 blood coagulation factors Drugs 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 210000000692 cap cell Anatomy 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 108020001096 dihydrofolate reductase Proteins 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000018146 globin Human genes 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 239000000122 growth hormone Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 102000054093 human SATB1 Human genes 0.000 description 1
- GRRNUXAQVGOGFE-NZSRVPFOSA-N hygromycin B Chemical compound O[C@@H]1[C@@H](NC)C[C@@H](N)[C@H](O)[C@H]1O[C@H]1[C@H]2O[C@@]3([C@@H]([C@@H](O)[C@@H](O)[C@@H](C(N)CO)O3)O)O[C@H]2[C@@H](O)[C@@H](CO)O1 GRRNUXAQVGOGFE-NZSRVPFOSA-N 0.000 description 1
- 229940097277 hygromycin b Drugs 0.000 description 1
- 229940127121 immunoconjugate Drugs 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229940047122 interleukins Drugs 0.000 description 1
- 210000003125 jurkat cell Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013332 literature search Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910052754 neon Inorganic materials 0.000 description 1
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 108010045647 puromycin N-acetyltransferase Proteins 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 239000012679 serum free medium Substances 0.000 description 1
- 101150056399 slc20a1 gene Proteins 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 239000002132 β-lactam antibiotic Substances 0.000 description 1
- 229940124586 β-lactam antibiotics Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/64—General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/46—Vector systems having a special element relevant for transcription elements influencing chromatin structure, e.g. scaffold/matrix attachment region, methylation free island
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Wood Science & Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明涉及新鉴定的基质附着区(MAR)和嵌合序列。本发明还公开了核苷酸构建体,所述核苷酸构建体在相对于蛋白质编码序列的合适的位置包含MAR,以用于蛋白质的最佳表达。
Description
相关申请的交叉引用
本申请根据35 U.S.C. §119(e)要求2018年12月7日提交的美国临时申请序列号62/776,643的利益,其全部内容通过引用并入本文。
背景技术
基因序列的转录(即mRNA的生成)在许多不同的水平受到控制。转录起始位点或启动子具有不同的强度,并且给定基因的转录起始频率也可以通过增强子序列增加。转录过程中的暂停可以影响转录速率,从而影响在给定时间段内产生的转录物的量。前体mRNA剪接、聚腺苷酸化和切割的速率也可以影响由转录单位产生的mRNA的水平。此外,mRNA分子内的序列可以调节其从细胞核到细胞质的转运、以及其转换率(即其细胞质稳定性)。
体外的多肽(例如治疗性抗体、生长因子)的表达对于制药工业而言是重要的,并且使蛋白表达最大化的方法是有需要的。
概述
本发明描述了一种用于评估基质附着区(MAR)的强度的新技术,并且表明了该技术可用于鉴定以前未知的新的MAR序列。本发明还描述了嵌合MAR序列。
本发明还描述了核苷酸构建体,所述核苷酸构建体包括顺式MAR位置(placement)和相关的其他序列,以用于感兴趣的基因(GOI)的最佳表达。
因此,根据本发明的一个实施方案,提供了一种重组多核苷酸,其包含:编码序列;启动子,其被配置为启动编码序列的转录;以及基质附着区(MAR)核心,其选自SEQ ID NO:1、5、9和13和与SEQ ID NO: 1、5、9和13中任何一个具有至少75%序列同一性(sequenceidentity)的核酸序列,其中MAR核心能够附着到哺乳动物细胞核基质。
另一个实施方案提供了一种将编码序列转染到细胞的方法,其包含:在用于将第一和第二多核苷酸转染到细胞中的条件下,将细胞与包含编码序列和用于启动编码序列的转录的启动子的第一多核苷酸和包含选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少75%序列同一性的核酸序列的基质附着区(MAR)核心的不连接的(unlinked)第二多核苷酸接触,其中MAR核心能够附着到哺乳动物细胞核基质。
本发明还提供了嵌合基质附着区(MAR),其包含:(a)MAR核心,其选自SEQ ID NO:1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少75%序列同一性的核酸序列,其中MAR核心能够附着到哺乳动物细胞核基质;(b)5’侧翼区,其选自SEQ ID NO: 2、6、10、14、18、22、26、30和34和与SEQ ID NO: 2、6、10、14、18、22、26、30和34中的任何一个具有至少75%序列同一性的核酸序列;以及(c)3’侧翼区,其选自SEQ ID NO: 3、7、11、15、19、23、27、31和35和与SEQ ID NO: 3、7、11、15、19、23、27、31和35中的任何一个具有至少75%序列同一性的核酸序列,其中MAR核心、5’侧翼区和3’侧翼区不是来自相同的天然MAR。
附图说明
图1比较了两种MAR序列(作为对照的MAR X29(一种已知的MAR),以及通过本发明的技术鉴定的MAR斑马鱼(Zebrafish))的强度。
图2展示了使用不包含任何MAR序列的构建体作为对照,MAR斑马鱼核心的强度。
图3是实施例2中所描述的含有MAR核心的构建体的载体图。
图4是如实施例2中所描述的不包含MAR核心元件的对照构建体的载体图。
详细描述
I. 定义
所有的数字标示(包括范围),例如pH、温度、时间、浓度和分子质量,都是近似值,其通过0.1的增量变化(+)或(-)。应当理解的是,尽管并非总是明确地表明,但术语“约”位于所有的数字标示之前。还应当理解的是,尽管并非总是明确地表明,但本文所述的试剂仅是示例性的,并且其等效物是本领域已知的。
如说明书和权利要求书中所使用的,除非上下文中明确地规定,否则单数形式“一个”、“一种”、“所述”包含复数形式。例如术语“一种/一个多核苷酸”包括多种多核苷酸,包括其混合物。
术语“多核苷酸”和“寡核苷酸”被可互换地使用,并且是指任何长度的核苷酸的聚合形式,无论是脱氧核糖核苷酸还是核糖核苷酸还是其类似物。多核苷酸可以包括被修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。如果存在,则可以在组装多核苷酸之前或之后赋予对核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分打断。在聚合之后可以进一步修饰多核苷酸,例如通过与标记组分偶联。该术语也指双链和单链分子。除非另有说明或要求,否则本发明的多核苷酸的任何实施方案包括双链形式和已知或预测构成双链形式的两种互补单链形式中的每一种。
II. 新的基质附着区(MAR)序列
本发明描述了一种经由电脑(in silico)量化MAR元件的强度的方法,以及使用该方法量化从序列数据库中鉴定的新的MAR序列的强度。
通过序列比较和结构-活性分析,本发明人发现MAR元件可以由中央富含AT的核心区和含有转录因子结合基序的5'和3'侧翼区组成。
核心区可以富含(ATAT)n微卫星。结合基序可以靶向SATB1、NMP4、CEBP、Fast和Hox转录因子。MAR可以结合的其他细胞核基质蛋白包括:ARBP蛋白(附着区结合蛋白),其识别MAR中的共有序列ATTTCAC/GTTGTAAAA;NMP-2蛋白,仅定位于细胞核基质中;Sp1、ATF、CCAAT、C/EBP和AP-1转录因子;酵母ACBP蛋白(ARS共有结合蛋白),其与ARS元件相互作用;组织特异性人SATB1蛋白,其主要在胸腺中表达,其与特殊的一类一条链上有A、T或C,但没有G的富含AT的MAR的小沟结合;Matrin 3蛋白(一种人和大鼠细胞的内部细胞核基质网络的酸性蛋白),matrin F/G;转录蛋白因子RFP。
分析结果帮助发明人寻找新的MAR序列,从而发现了与阳性对照MAR X29相比在促进基因表达方面高效的四个新的MAR序列(Arope et al. (2013) PLoS ONE 8(11):e79262)。
本发明进一步证明,这些新鉴定的MAR序列的核心可以与来自其他MAR的5’和3’侧翼区形成功能性MAR,提供另外的有用的嵌合MAR序列。
因此,根据本发明的一个实施方案,提供了一种重组多核苷酸,其包含:编码序列;启动子,其被配置为启动编码序列的转录;以及本文所述的基质附着区(MAR)核心及其变体。这种新的MAR核心的实施例列于表1中。参见,例如,SEQ ID NO: 1、5、9和13。
基质附着区或MAR是真核生物的染色体的DNA中细胞核基质附着的序列。作为将真核生物的基因组在细胞核内组织成功能单元的结构DNA组件,MAR可以在细胞核内介导染色质的结构组织。这些元件构成染色质支架的DNA的锚点,并且用于将染色质组织成结构域。由MAR元件介导的染色质的动态和复杂组织在基因表达的调节中起着重要作用。
MAR核心的变体是与参考MAR核心(例如,SEQ ID NO: 1、5、9和13)具有一定序列同一性(例如,至少75%、80%、85%、90%、95%、97%、98%或99%)并具有预期的MAR功能(例如,附着到哺乳动物核基质的能力)的核酸序列。
在一些实施方案中,MAR核心的变体富含AT,例如在序列中具有至少75%、80%、85%、90%或95%的A或T。
MAR核心能够与MAR的5’侧翼区(例如SEQ ID NO: 2、6、10、14和18中的任何一个或其变体(与SEQ ID NO: 2、6、10、14和18中的任何一个具有至少75%、80%、85%、90%、95%、97%、98%或99%序列同一性的核酸序列))一起存在。在一些实施方案中,5’侧翼区位于MAR核心的5’侧,并距离MAR核心100个核苷酸之内。
在一些实施方案中,MAR核心能够与MAR的3’侧翼区(例如SEQ ID NO: 3、7、11、15和19中的任何一个或其变体(与SEQ ID NO: 3、7、11、15和19中的任何一个具有至少75%、80%、85%、90%、95%、97%、98%或99%序列同一性的核酸序列))一起存在。在一些实施方案中,3’侧翼区位于MAR核心的3’侧,并距离MAR核心100个核苷酸之内。
包括MAR核心、5’侧翼区和3’侧翼区的非限制性MAR序列包括SEQ ID NO: 4、8、12和16和与SEQ ID NO: 4、8、12和16中的任何一个具有至少75%、80%、85%、90%、95%、97%、98%或99%序列同一性的核酸序列,其中MAR核心能够附着到哺乳动物细胞核基质。
III. 嵌合MAR序列
正如所提供的,这些新鉴定的MAR序列的核心能够与来自其他MAR的5’和3’侧翼区形成功能性MAR,提供另外的有用的嵌合MAR序列。
在一个实施方案中,本发明的嵌合MAR包括如本文所公开的MAR核心,其在5’侧具有5’侧翼区。在一个实施方案中,本发明的嵌合MAR包括如本文所公开的MAR核心,其在3’侧具有3’侧翼区。在一个实施方案中,本发明的嵌合MAR包括如本文所公开的MAR核心,其在5’侧具有5’侧翼区且在3’侧具有3’侧翼区。
5’侧翼区能够选自本领域已知的或本文公开的任何5’侧翼区或3’侧翼区。在一些实施方案中,5’侧翼区能够选自本领域已知的或本文公开的任何5’侧翼区。
3’侧翼区能够选自本领域已知的或本文公开的任何5’侧翼区或3’侧翼区。在一些实施方案中,5’侧翼区能够选自本领域已知的或本文公开的任何3’侧翼区。
MAR核心、MAR 5’侧翼区和MAR 3’侧翼区中的每一个也能够被核酸变体(例如,与参考序列具有至少75%、80%、85%、90%、95%、97%、98%或99%的序列同一性)取代。
本文公开的MAR核心包括SEQ ID NO:1、5、9和13。本文公开的5’侧翼区包括SEQ IDNO:2、6、10、14、18、22、26、30和34。本文公开的3’侧翼区包括SEQ ID NO:3、7、11、15、19、23、27、31和35。
在一些实施方案中,本文新鉴定的MAR侧翼序列也能够与本文新发现的或已知的其他核心序列融合以产生新的嵌合MAR序列。在一些实施方案中,嵌合MAR序列包括表1的MAR核心区中的任何一个、表1的MAR 5’侧翼序列中的任何一个、以及表1的MAR 3’侧翼序列中的任何一个。
IV. 基因表达
本文公开的MAR序列和构建体能够被用于促进细胞中的基因表达。当感兴趣的基因被包含在含有MAR(单独的或具有5’和/或3’侧翼区的MAR)的构建体中时,可以将构建体导入宿主细胞中以表达感兴趣的基因。
本文公开的MAR序列还能够作为反式作用元件被用于以反式来促进基因表达。例如,可以将包含本文公开的任何MAR序列(单独的或具有5’和/或3’侧翼区的野生型或嵌合型MAR)的构建体导入到用包含感兴趣基因(GOI,或转基因)的构建体进一步转染(或已转染)的细胞中,使得MAR序列能够帮助GOI的表达。
因此,根据本文公开的一个实施方案,提供了一种将编码序列转染至细胞的方法,其包含:在用于将第一和第二多核苷酸转染到细胞中的条件下,将细胞与包含编码序列和用于启动编码序列的转录的启动子的第一多核苷酸和包含如本文所公开的基质附着区(MAR)核心的不连接的第二多核苷酸接触。在一些实施方案中,MAR核心选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少75%序列同一性的核酸序列,其中MAR核心能够附着到哺乳动物细胞核基质。
在一些实施方案中,第二多核苷酸进一步包含5’侧翼区,所述5’侧翼区选自SEQID NO: 2、6、10、14和18和与SEQ ID NO: 2、6、10、14和18中的任何一个具有至少75%序列同一性的核酸序列。在一些实施方案中,5’侧翼区位于MAR核心的5’侧,并距离MAR核心100个核苷酸之内。
在一些实施方案中,第二多核苷酸进一步包含3’侧翼区,所述3’侧翼区选自SEQID NO: 3、7、11、15和19和与SEQ ID NO: 3、7、11、15和19中的任何一个具有至少75%序列同一性的核酸序列。在一些实施方案中,3’侧翼区位于MAR核心的3’侧,并距离MAR核心100个核苷酸之内。
在一些实施方案中,完整的MAR序列选自SEQ ID NO: 4、8、12和16和与SEQ ID NO:4、8、12和16中的任何一个具有至少75%序列同一性的核酸序列,其中MAR能够附着到哺乳动物细胞核基质。
本发明还提供了通过本发明公开的方法制备的转染细胞。
在本发明公开的任何构建体或载体中,能够包括另外的转录调控序列和/或转录后调控序列。转录调控序列能够包括例如启动子、增强子和聚腺苷酸化信号。转录后调控序列包括例如内含子和PRE。
在某些实施方案中,在载体中存在多克隆位点(MCS)(也被称为“多接头(polylinker)”),以便于插入异源序列。例如,可以将MCS置于启动子和聚腺苷酸化信号之间,以促进转基因序列的插入。在含有转基因序列的载体中,含有启动子、转基因序列、聚腺苷酸化信号的载体的部分被称为“表达盒(expression cassette)”。
在真核生物的细胞中有活性的启动子是本领域已知的。示例性的真核生物的启动子包括例如SV40早期启动子、SV40晚期启动子、巨细胞病毒(CMV)启动子、巨细胞病毒主要立即早期(CMV-MIE)启动子、EF1-α(翻译延长因子-1α子单元)启动子、Ubc(泛素C)启动子、PGK(磷酸甘油酸激酶)启动子、肌动蛋白启动子等。还可参见Boshart et al., GenBankAccession No.K03104; Uetsuki et al. (1989) J. Biol. Chem.264:5791-5798;Schorpp et al. (1996) Nucleic Acids Res.24:1787-1788; Hamaguchi et al. (2000)J. Virology74:10778-10784; Dreos et al. (2013) Nucleic Acids Res.41(D1):D157-D164以及http://epd.vital-it.ch(在2014年7月16日登入)的真核生物的启动子数据库。
载体上还可以包含增强子。非限制性实施例包括在CMV启动子和内含子A序列中的增强子。先前显示五种胚胎干细胞(ESC)转录因子占据了超增强子(Oct4、Sox2、Nanog、Klf4和Esrrb),并且还有许多另外的转录因子有助于ESC的控制。另外的六种转录因子(Nr5a2、Prdm14、Tcfcp2l1、Smad3、Stat3和Tcf3)占据了典型的增强子和超级增强子,并且所有这些都富含超级增强子。这些中的任一种或本领域中进一步已知的都可以在本发明中使用。
在真核生物的细胞中有活性的聚腺苷酸化信号是本领域已知的,包括但不限于SV40聚腺苷酸化信号、牛生长激素(BGH)聚腺苷酸化信号和单纯疱疹病毒胸苷激酶基因聚腺苷酸化信号。聚腺苷酸化信号指导前体mRNA的3’末端切割、在切割位点处前体mRNA的聚腺苷酸化、和聚腺苷酸化信号下游的转录终止。核心序列AAUAAA通常存在于聚腺苷酸化信号中。还可参见Cole et al. (1985) Mol. Cell. Biol. 5:2104-2113。
可以被用在本发明的载体中的示例性的内含子包括人类/小鼠/大鼠/其他物种巨细胞病毒主要立即早期(MIE)基因的β-珠蛋白(globin)内含子和第一内含子(也称为“内含子A”)。
可以被包括在本发明的载体中的另外的转录后调控元件包括但不限于CMV MIE的5’-非翻译区、人Hsp70基因、来自血管内皮生长因子(VEGF)基因的SP163序列、以及与腺病毒晚期mRNA相关的三联前导序列。参见例如Mariati et al. (2010) Protein Expression and Purification69:9-15。
在某些实施方案中,本文公开的载体含有编码在真核生物的细胞中起作用的选择标记物(即真核生物的选择标记物)的核苷酸序列,使得当施加适当的选择时,不含有该选择标记物的细胞死亡或者比含有该选择标记物的细胞明显慢得多地生长。在真核生物的细胞中起作用的示例性的选择标记物是谷氨酰胺合成酶(GS)基因;通过在缺乏谷氨酰胺的培养基中培养细胞、或者用L-蛋氨酸亚砜亚胺(L-Methioniene Sulfoximine)进行选择、或同时使用上述两者来施加选择。在真核生物的细胞中起作用的另一个示例性的选择标记物是编码对新霉素(neo)的抗性的基因;通过在含有新霉素、遗传霉素或G418的培养基中培养细胞而施加选择。另外的选择标记物包括二氢叶酸还原酶(DHFR,赋予对氨甲喋呤的抗性)、嘌呤霉素-N-乙酰转移酶(提供对嘌呤霉素的抗性)和潮霉素激酶(提供对潮霉素B的抗性)。在真核生物的细胞中起作用的另外的选择标记物是在本领域已知的。
编码上述选择标记物的序列被可操作地连接至启动子和聚腺苷酸化信号。如上所述,在真核生物的细胞中起作用的启动子和聚腺苷酸化信号是在本领域已知的。
在某些实施方案中,本文公开的载体可以含有两个或更多个表达盒。例如,含有两个表达盒(其中一个编码抗体重链,另一个编码抗体轻链)的载体可以被用于产生功能性抗体分子。
本文公开的载体还含有在原核细胞中起作用的复制起点(即原核复制起点)。在原核细胞中起作用的复制起点在本领域中是已知的,并且包括但不限于大肠杆菌的oriC起点;质粒起点,例如pSC101起点、pBR322起点(rep)和pUC起点;以及病毒(即噬菌体)复制起点。用于鉴定原核复制起点的方法被提供在例如Sernova & Gelfand (2008) Brief. Bioinformatics9(5):376-391。
本文公开的载体还含有在原核细胞中起作用的选择标记物(即原核选择标记物)。在原核细胞中起作用的选择标记物是在本领域中已知的,并且包括例如编码赋予对氨苄青霉素、卡那霉素、氯霉素或四环素中的任何一种的抗性的多肽的序列。赋予对氨苄青霉素(和其他β-内酰胺抗生素)的抗性的多肽的实施例是β-内酰胺酶(bla)酶。卡那霉素抗性可以由新霉素磷酸转移酶基因的活性产生;而氯霉素抗性是由氯霉素乙酰转移酶介导的。
示例性的转基因包括任何重组蛋白或例如激素(例如生长激素)、促红细胞生成素、抗体、多克隆、单克隆抗体(例如利妥昔单抗)、抗体缀合物、融合蛋白(例如IgG-融合蛋白)、白细胞介素、CD蛋白、MHC蛋白、酶和凝血因子。抗体重链和抗体轻链可以由单独的载体或由含有两个表达盒的相同载体表达。
本发明提供了用于在细胞中表达重组多肽的方法。所述方法包括将如本文所述的载体导入细胞中,并在其中载体被瞬时地或稳定地保持在细胞中的条件下培养细胞。细胞可以是原核生物的或真核生物的,例如通过与CRISP/Cas9的靶向整合而产生的稳定细胞系。可以被用于表达重组多肽的经培养的真核生物的细胞是在本领域中已知的。这样的细胞包括真菌细胞(例如酵母)、昆虫细胞、植物细胞和哺乳动物细胞。相应地,本发明提供了包含如本文所述的载体的细胞。
示例性的酵母细胞包括但不限于木霉属菌种(Trichoderma sp.)、巴斯德毕赤酵母(Pichiapastoris)、粟酒裂殖酵母(Schizosaccharomyces pombae)和酿酒酵母(Saccharomycescerevisiae)。示例性的昆虫细胞系包括但不限于Sf9、Sf21和果蝇(Drosophila)S2细胞。示例性的植物细胞包括但不限于拟南芥(Arabidopsis)细胞和烟草BY2细胞。
可用于表达重组多肽的经培养的哺乳动物细胞系包括中国仓鼠卵巢(CHO)细胞、人胚胎肾(HEK)细胞、病毒转化的HEK细胞(例如HEK293细胞)、NS0细胞、SP20细胞、CV-1细胞、幼仓鼠肾(BHK)细胞、3T3细胞、Jurkat细胞、HeLa细胞、COS细胞、PERC.6细胞、CAP®细胞和CAP-T®细胞(后两种细胞系可从德国科隆的Cevec Pharmaceuticals公司商业地获得)。CHO细胞的许多衍生物也是可用的,例如CHO-DXB11、CHO-DG-44、CHO-K1、CHO-S或工程化的CHO细胞,例如CHO-M、CK1 SV CHO和CHOZN。也可以使用哺乳动物原代细胞。
在某些实施方案中,在无血清培养基中培养细胞。例如,为了制造施用于患者的治疗性蛋白,表达细胞必须在无血清培养基中生长。在另外的实施方案中,在用于多肽表达之前,细胞已经预先适应无血清培养基中的生长。
可以使用本领域已知的方法将如本文所述的载体引入上述细胞中的任一个中。这样的方法包括但不限于聚乙二醇(PEG)介导的方法、电穿孔、生物射弹输送(即粒子轰击)、原生质体融合、DEAE-葡聚糖介导的方法、以及磷酸钙共沉淀。还可参见Sambrook et al.“Molecular Cloning: A Laboratory Manual,” 第三版, Cold Spring HarborLaboratory Press, 2001;以及Ausubel et al., “Current Protocols in MolecularBiology,” John Wiley & Sons, New York, 1987以及定期的更新。
用于细胞培养的标准方法在本领域中是已知的。参见例如R. I. Freshney“Culture of Animal Cells: A Manual of Basic Technique,” 第五版, Wiley, NewYork, 2005。
实施例
通过参考以下实施例进一步理解本发明,这些实施例旨在纯粹是本发明的示例。本发明的范围不受限于示例性的实施例,其仅意图作为本发明的单个方面的说明。任何功能上等同的方法都在本发明的范围内。根据前面的描述和附图,除本文所述的那些之外,本发明的各种修改对于本领域技术人员而言将变得显而易见。这些修改落入所附权利要求的范围内。
实施例1.寻找新的MAR
该实施例开发了一种经由电脑量化基质附着区(MAR)元件的强度的方法,以及使用该方法量化一些示例性MAR序列的强度。
基于基序的MAR鉴定
进行文献检索以识别与MAR鉴定相关的所有基序,特别是寻找MAR特异性转录因子、染色质结合域、DNA弯曲和DNA解旋序列。总结了潜在有用的特征并用于进一步的MAR评估。
MAR元件可以由中央富含AT的核心区和含有转录因子结合基序的5’和3’侧翼区组成。核心区可能富含(ATAT)n微卫星。
MAR可以包含“MAR识别特征”并通常通过包含“MAR识别特征”进行分类。二重(bipartite)元件由两个不同的序列AATAAYAA和AWRTAANNWWGNNNC组成。其他MAR指示序列由各种转录因子和DNA结构基序组成。示例性序列包括DNA解旋基序、AP-1、A-box和T-box、NMP-2、SATB1、Hox4D、TEF、Pit1和Fast。
通过检索鉴定出4个新的MAR元件,分别命名为MAR斑马鱼、MAR鲤鱼(CyprinusCarpio)、MAR 12-RP13和MAR 17XX_fos。它们以及一些已知元件(MAR 1-68、MAR S4、MARX29、小鼠c-myc 5MAR和SPR2A-MAR)的完整序列、核心以及核心的5’和3’侧翼区列于表1中。
表1. MAR序列
注意:在全长序列中,核心区用粗体和下划线表示,侧翼区用下划线表示。
实施例2. MAR斑马鱼的测试
对鉴定的MAR元件中的一个(MAR斑马鱼)进行实验测试,并与来自文献的最强的已知的MAR进行比较,其示出高两倍的效力。
体外比较MAR斑马鱼(新鉴定的MAR元件)与MAR X29(对照,参考Arope et al.(2013) PLoS ONE 8(11): e79262)。
然后对不包括全长MAR斑马鱼的侧翼区的MAR斑马鱼核心进行实验测试,与不包含任何MAR序列的构建体进行比较。
材料与方法
Neon 转染是用CT MCB细胞进行的。使用BalanCD + 4 mM Gln 培养基用于转染。通过Bio-Rad(Gene Pulser II设置为900 uF,300 v,电阻0)进行的瞬时转染。细胞在转染的24小时前分裂。第0天生存力和VCD以百万个细胞/ml表示。使用5 μg重链和轻链DNA进行转染。10 μg GFP DNA被用作外部对照以检查转染效率。通过将甲硫氨酸亚砜亚胺(MSX)在导致有利于表达感兴趣的重组蛋白(利妥昔单抗轻链)的细胞生长的选择性压力的水平维持14天产生稳定的库(pool)。在14天补料分批(fed batch)定量分析中比较所得的重组库。通过生物层干涉仪或ELISA分析在收获当天和整个培养过程中的滴度。使用仅一种浓度的MSX(80 mM)重复上述库生成的实验方法以生成用于测试MAR斑马鱼核心的库。
结果
MAR X29和MAR斑马鱼的体外比较结果如图1所示。在两种选择标记物浓度(80 mM和100 mM的甲硫氨酸亚砜亚胺(MSX))下,MAR斑马鱼的表现均明显优于MAR X29。因此,该实施例验证了实施例1中开发的检索和经由电脑的方法。
在进一步的实验中,与没有任何MAR元件的构建体相比,测试了单独的MAR核心序列的效力。如图2所示,MAR斑马鱼核心序列比无MAR对照产生显著更高的滴度。
应该理解的是,虽然已经结合上述实施方案描述了本发明,但是前面的描述和实施例旨在进行说明而不是限制本发明的范围。本发明范围内的其他方面、优点和修改对于本发明所属领域的技术人员来说将是显而易见的。
序列表
<110> 赛尔希恩公司
<120> 基质附着区和促进基因表达的用途
<130> 21F-1869-CNP
<150> 62/776643
<151> 2018-12-07
<160> 36
<170> PatentIn version 3.5
<210> 1
<211> 186
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 1
aaataattaa ttagcaaata atttatatat ttatatattt atatatatat atatatatat 60
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 120
atatatatat atatatatat atatatatat aaatatataa atatatatat atatatatat 180
attggt 186
<210> 2
<211> 185
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 2
aaatatttca aaaattaagc aaagaaactt tcacagtatg actaataata ttttttcttc 60
tggagaaagt cttatttgtc ttatttcggc tagaataaaa acagttttta attttttaaa 120
caccatttta cggacaaaat tattagcccc tttaagctat atttattttc aatagtctac 180
agaac 185
<210> 3
<211> 98
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 3
gggagaagca gtccaatgtg gctgtatata tatattatta tttttttttt tttaaataca 60
aacaattaag ctgtcgaact gttgtataaa cacaatat 98
<210> 4
<211> 1879
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 4
atgcaaagga ctctttctgt aaaatatctg ctgtaaaaat ctaaaggatt tgagggttgc 60
actcccaaag gctcctgaga gcttgtgtaa aataagcctt cctaactgct gctttctcac 120
tttagtcaat tttggccttt tttatattca tatacagtaa atgttgctct aatcaatgtg 180
gatgatcatt atcagtatat gactcgaaaa atattttaaa cttctctttg cttctagacc 240
aggatttgaa ggaatattct atttttaatg acactgcttt gcaatattta tgattcttaa 300
agtcaaacag agtgaaacag aagtaaacat gtcatgatgt acactcacat gaaacaatct 360
ctgaaatgaa gaatgaatga agaaagttgt gttgctaaca aaatggagga agactcacga 420
atagacaaaa gcagggcaga aacgagacac gcacccgtgt acatatatac agttgaagtc 480
agacttatta gccccccttt gatttttttt tcttttttta aatatttcaa aaattaagca 540
aagaaacttt cacagtatga ctaataatat tttttcttct ggagaaagtc ttatttgtct 600
tatttcggct agaataaaaa cagtttttaa ttttttaaac accattttac ggacaaaatt 660
attagcccct ttaagctata tttattttca atagtctaca gaacaaataa ttaattagca 720
aataatttat atatttatat atttatatat atatatatat atatatatat atatatatat 780
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 840
atatatatat atataaatat ataaatatat atatatatat atatattggt gggagaagca 900
gtccaatgtg gctgtatata tatattatta tttttttttt tttaaataca aacaattaag 960
ctgtcgaact gttgtataaa cacaatatca ctcgagttgc agtccgatgt gactatatat 1020
tggcactggt gggagatttg cattcattgt gacaatatac agccacattg cattgctacg 1080
agtgtgatat tatgtttata caccagttca acagcataat cgtgtgtaat aaaaagataa 1140
tcaaacacgg aagaggaact actttcttcc gccattcatt cacatctgca gcttacgtca 1200
gaacagcaga agctgttgct cattcatata tataatatat ataaatttgt atacttacag 1260
acgacacagt ggctcagtgg ttagcactgt ctcctcacag caagaaggtc actgtttcaa 1320
gtccaggctg ggtccgccgg catttgtgtg tggagtttgc ttgtttttcc cgtgttaatg 1380
tgtatggatg tttcccagta ctgggttgca gctggaaggg catccgctgt gtaaaactta 1440
tgctggataa gttggcagtt cattccgctg tgtcaacccc tgatgaataa agggattaag 1500
ccaaatgaaa atgaatgaat gatttaatac tcttgtttaa gtcttagtgc cgattatata 1560
tagatatgtg gtgttagatc aaaccagtgt tcattttgac agcaaaattt gatttagttt 1620
tagtcatttt ttagtcttcc atattcgtta tagcatcagt ctatatacag tcaactaaat 1680
taaacatgat tttagtcaac ttcatgcatt ttcacatgga caaggtcatt aaaattctac 1740
aggatcaggt tgtaccaact ctatctcatg gaaatttgta actttttgat tgtggctaat 1800
tcgtatgaat ttgtatgatc tcatttgtac aatttagtat tatttgctca tcccccagtg 1860
atggttggat ttagggttg 1879
<210> 5
<211> 225
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 5
tatccaaata tatatatata tatatatata tatatactat atatatatat atatatatat 60
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 120
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 180
atatatatat atatatatat tttttttttt ttttttaaga aaaca 225
<210> 6
<211> 106
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 6
caaatttgct atacaaaaac ctaaatgtaa taaagttaca tccataaaag tgacttttta 60
ttacttttga aacacaacag atttatgccc tgtctatatc cagttc 106
<210> 7
<211> 109
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 7
gttataataa ttttataatc tctcacaata ttgctgtttt actgattttt gaataaatgc 60
agccttggtg agcataagag actttttcta aaaactttga aaagtctta 109
<210> 8
<211> 2679
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 8
tgttacatta ggctgaaaac acactgtgta tgtgcatatt ttcccttaaa tacataaaga 60
agtaatgggt ggcgtacctg tattggttat agactccagg gcagtataac atggctgtga 120
atagactctg ttgtggacat acactccata acaccaaact gatcccgtag aacgatgtca 180
ccaggaaaag aaggagcgtc aaaatgaact gcctgtgatt ggcttgacct acacagctgt 240
ttatcctgtc atggaaagtc acatacatac aagacacaaa taataagcaa cacatttaca 300
gatattttca ttcaaacaat ttagaacaat tatactattt tctctcttgt caatgtagct 360
ttaatgagaa ttatgtggct catggcatgt tcatatttat atttgtgcct gtgtgtgtgt 420
tgaagtagca tggagacaga ttggcctggt gagagctccc tttactgtgc tgaaaactgt 480
gttcctgttg cctttgcaca tgtctcacca gcctgcctgc tccagtgacg tcttttggga 540
atcagcttga acatatgtgt gtgtctgatg gggtagggaa cacatgcata caagtgtgaa 600
gagatcagaa aatgaatcaa atcattggca tgaccactaa tttaaacaat tcattttgga 660
attgttcagc tacttctgta gtaaggattt gcaataagcc agatatctta gaaggaaagg 720
cacaaatatc aacattaaaa ttaatatttg aaataacaga aaatatattc ggttgactga 780
ttatccaaca aacacaagtg taaagtgata tttttaatga acatctaaaa ttacaatgca 840
acggtaagtc tgtgaagctg agatgattaa aatgtgatct ttatgaatga aagcagatgg 900
ccacaatgct ctctctcctt ttattgttta taaatcataa atcatcaatt catatagtaa 960
cttttttaga ttttgaatat ttatttatgt aaagttttaa atattattga atagtaaata 1020
atttaatatg ataatcattt ataaaagtgt atatttgtaa atacaattat ttttaaaata 1080
tataaatgat gaaaaaaatt taaatataag aataaacact tttataaata atacaaggca 1140
aatttgctat acaaaaacct aaatgtaata aagttacatc cataaaagtg actttttatt 1200
acttttgaaa cacaacagat ttatgccctg tctatatcca gttctatcca aatatatata 1260
tatatatata tatatatata ctatatatat atatatatat atatatatat atatatatat 1320
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 1380
atatatatat atatatatat atatatatat atatatatat atatatatat atatatatat 1440
atattttttt tttttttttt aagaaaacag ttataataat tttataatct ctcacaatat 1500
tgctgtttta ctgatttttg aataaatgca gccttggtga gcataagaga ctttttctaa 1560
aaactttgaa aagtcttacc gacaacatat tattgaatgg cagtgtaaat atagatcgtt 1620
ttgtcattta gagaatattt aattaatgtt taatacactt cacactagga atgaagtgct 1680
cgtactcaat ttttaaagaa gaaggaatga gaaacccacc aaacacagtg gtggtccatt 1740
cgaaggacac atgccccaca gatcctgcag tgccctgccc ttggtgggcg cacctgtcgg 1800
cacacagggc ataacttctt ctttccttcg ttttccccat ttgactgact gattcctttg 1860
cagggggcgg agtctccagg tatgtttgtg ctctgattgg ttgtacagat actgttaatt 1920
ccctgagcta atgactggga tttgacaaag cctggtcctt gtttggtgcg cacaagggag 1980
ataagggtca acatcatgcc tgtcgtcaca gtaaccagct gcagattact gacgtctcct 2040
ctgggaacga tctcagtaag gaaaagatag tacatgtagg caagggagaa aagtgccaag 2100
ctaaggaaaa acaatgtgcg tcttttcctt ctgtgagtca catagtaata ccaaagcacc 2160
agtcctggta gggcagttag gacaacaact cccaacatac agttaattgc tgctactcgc 2220
aacagaccag gaattaatac catgggaggt aagacagaga tttccaatcg aaggggtcct 2280
acggcacaac atggcaaacc caaacgatca gccatacaag agacgaaacg agagaagatg 2340
tctggcttgt cttgctctcc tctgactaac ctattgagaa agagtgacaa attcaccatt 2400
catcatttac acactattat gttatcagtt ttatgtatgg aaatgacaag gtgcaaacgg 2460
acaaaattat ttaattcaac tacacttttt aaagtgtaaa aatgtaaagt gtcaaaagtt 2520
tatatcaata aatgtaatgt aaaaccatct ctgcatgcca tgatcttaac tggttgacct 2580
ctgacctttc acaggcatca tctagttctt cacagtcaca gcagcagtac tctctttgct 2640
ggtcgatgtc tccacagcag cacagagggt catctggtt 2679
<210> 9
<211> 350
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 9
atatatatat gttagtgata tatatataaa atatatatca ctcttattat atattatata 60
tattatataa tatataatat attatattat ataatatatt atatattata taatatatat 120
aatatattat atattatata atataatata ttatatatta tataataata taatatatta 180
tatattatat aataatatat aatatattat ataataatat ataataatat ataatatatt 240
attatataat atataataat atataataat ataataatgt gattatatta tatataatat 300
gtaatataat aatgtatata tattatatat gcattatata taatgatttt 350
<210> 10
<211> 186
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 10
aattgcataa gccaatccct tgcaataaat aaaatagatc gagatgtaga tagacagaga 60
tccagatcct actggttcca ttttcctggc agaaccatga tggatatgat atatgtccca 120
taaagagcct cccagtggtg tctttttgtt ttgtaaagat ggttttaatc cacagattta 180
agagtg 186
<210> 11
<211> 153
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 11
ctatcaaatg tatatttaaa tctacctact tgtgttatat atttatatat gtgtgtgtga 60
tatgtataat tttaaaatat atctgtatag ctacttaatt tgtatttcca gcccaattca 120
gtctagtgac agaaaatata actcatcaag tct 153
<210> 12
<211> 4061
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 12
tacccagtaa ttcttaaact acttactcca gcacttggcc catggcaaat ttcctggtag 60
ccatatgtac atatacacat gcttttaaat acataaacgt atgtacatat acttttaatt 120
tactactaag attttataca ttttccagta gtttgtatga tgaacatgta tatacctccc 180
tttaaagtta aacaataaaa aaatcttaat ttttctacct taaaatctcc tctcatcacg 240
tcatccaatg atagccgctg ttaacatcat gttcctattt acttctgctt gtttctctga 300
agatgtacgt gagtgggtaa acacgatgta atttgacatt gcggttttta atagcatatc 360
acaaatattt tcctgttata atttcattca caaacatggt tctgatagtt acataatatt 420
acaccatatg atcatttcct agtttactta gctatttcct atggttggat attcttggct 480
tgtttccaat atttttctat tctaattcat ctccaacaaa agtcatcatc tgtgaatctt 540
tctctgcatc tctaagtatt tccttagaat aaactcctag agtgaatctg ttagcacatt 600
tgtttctctc ttttaattaa caactggaaa atgattattg cagacacatt ctcttcaagt 660
gaatatttct tctcggctga actttgcttt actgagtatt tttccctccc ttggctgcat 720
tttcattctt cttttgctgt tttgcgtttc actcccacct acaaaatatc caagttccct 780
ctcccaaaat aaaacccctc ttggttcatg gcagagtcaa ctttgttcag ctgtctttac 840
cctgcaggtc caaaggtcta ttgcccagag tatttgctga ggggataaga ggtgccaggt 900
cctcatcaga gtaatctttg catcttccat tttagatgat gaggctgagg ctaaataact 960
ttttgtgact tgaacaaaat cacgcccgtc attttggagc agagattgga cccagaccat 1020
ctgactgcag tgcacttggt tactacacaa cagccctgga agctgcaacc tgaggacctc 1080
cagcctcaca tgaatcatct tcatccacca accttctccc atctgggttc ccacactcct 1140
cccatcaccc agcatggggg gcctcatggt ggtggttgac ccttcctcta tctccacctg 1200
catatggggc acattctccc caaacctcac tccagtccaa tctcacctca accccactgt 1260
ctcgctcata gggttgagga aagacagaat aaaccctggc tgggaaaagt cactttagtc 1320
aatgtacggt cagttttacg tgtcagcttg gccaggctag agtccccagt catccaaacg 1380
cccagttgac tgtaagcaaa gactatccta gataatttgg tcggcctgag acattcagtt 1440
aaaagaccat aagagcagaa ctgaaaacag aaaattctgc ctgtggactg cagcgccagc 1500
tcctgcctga gagtttccag cctgaccttc ctaaacttgc ctactaatcc cccacaattg 1560
cataagccaa tcccttgcaa taaataaaat agatcgagat gtagatagac agagatccag 1620
atcctactgg ttccattttc ctggcagaac catgatggat atgatatatg tcccataaag 1680
agcctcccag tggtgtcttt ttgttttgta aagatggttt taatccacag atttaagagt 1740
gatatatata tgttagtgat atatatataa aatatatatc actcttatta tatattatat 1800
atattatata atatataata tattatatta tataatatat tatatattat ataatatata 1860
taatatatta tatattatat aatataatat attatatatt atataataat ataatatatt 1920
atatattata taataatata taatatatta tataataata tataataata tataatatat 1980
tattatataa tatataataa tatataataa tataataatg tgattatatt atatataata 2040
tgtaatataa taatgtatat atattatata tgcattatat ataatgattt tctatcaaat 2100
gtatatttaa atctacctac ttgtgttata tatttatata tgtgtgtgtg atatgtataa 2160
ttttaaaata tatctgtata gctacttaat ttgtatttcc agcccaattc agtctagtga 2220
cagaaaatat aactcatcaa gtctgggtaa tctcaaataa ttcggctaaa ttcctcaatt 2280
catcaatttc tccctcctcc agcctccgca taattgattc taactttcag ggagttgaag 2340
cagcactgcc ctggggggct ctcttccagc tctcagcccc tccctgcaca gctctggtgc 2400
ccacggggat gcgcccacgg ggatgcaagg ccctgtatga ccatcagacc tcctgtcctc 2460
acttgagatg tttatttcta gtccccagtc ctgccccaac cacaggatgt aacccagacc 2520
ctggtctcta ttccaagatt catccttgtc aagcggttct cagcagcatg cctctgccac 2580
gcccagtcac agaggacgat attggctccc ctctttatgg ggggaggata aaaaggatca 2640
tatcccagac ccctgggctt aaggcttcca tgttcccatc tctactcttt aatgccagga 2700
tgacataggg tactttctgc aggcatagac aaccaggcag gaagaggggc ccatgttcct 2760
tgtaatctca gatcacaagt accctctggg gatctatcac cccaagcttg gtgcatggac 2820
aaggggtacc ttattctctt cctttcttct aagactatgc actgcctctc ccccaggcaa 2880
atggaatctt gtcaattcca agtgagtttg gaaaaactca ttctttttta cttattgttt 2940
agatcggaac ctaaaatcga aagttccagg aagctcaagt tcttataact aaaaaggctt 3000
ttctctctca agagcattgg ctctgtcttt tccatgttct actttgaaac acaaaagctg 3060
agctcgacat tgatttaatt gctttttatt tgaatgattg ctataagtga caccttttgg 3120
ggcagtatgt cctagctggt tgaattagag ttgggaaaca cattgcaaga aagggtagaa 3180
agaggcatac tttattgaat cttttggagt aacttttgtg cctgttacca caagcttatt 3240
tttgataaga tgcttcctaa ctttcctcgc tcacccctac ctcatctcag ggccaagcac 3300
gaaagttgtt ttatacatgc taggtttggc tgatttcaat gtgacttccc cagggcagaa 3360
gagacagtgg ttgaaggatg aagaatcaac ctacccgggg gaatcaaaga ttgatcccag 3420
ggaatggagc agatataatt aaataagttt tttctttccc cagtgtatct aatattcatt 3480
tttgtattta cttggagcaa atgaatttaa atgaattttt agttagagtt aaatcaactc 3540
attaaaacac attgaaggaa ttagaaatgt aaaatcattt cctgctgcaa ttcattcatc 3600
tctaagtcta taactgactt gaatctaggt aaaggtcatt gcttaaaggg gacagtggcc 3660
cttattcttg caacctacaa acttttacag tttgcatgga gttttcacat ccatgaactc 3720
aagcaagact gaataggcct gtatggtgaa caaacaggag taaatgcctc cactattcag 3780
gggaggaaag tgagctcaaa aaagtttaat attgttgcct aaggatactc aaccagcaaa 3840
tggcaatatc gagacaggag caggtcttca gtccaaaccc acagagcaga gcttgcccag 3900
gaagctgatc attcttgtac caccttctcc atcactggac ctacaccctg cccttcttta 3960
cccagctctg acctctcaga tgctgaacct ggggtgccct tgtcattgaa cttcgagttg 4020
cattattttc ccattgtttt acctacaatt aacttgccgt c 4061
<210> 13
<211> 1700
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 13
agactctgtc tcaaatatat atatatttat atatatatat tttatattta atatatataa 60
tatatattat atataaattt attatatata atatatatta tatataaatt tattatatat 120
aatatatatt atatatatta tatgttatat atatttatta catataatat ataatatata 180
tttattatat ataatatata tttattatat attatatatt atatatttta tattttatat 240
atattatata attttatatt ttatatatat tatataatta atatttaata tatattatat 300
atatatatat aatatatatt tattatatat aatatatatt tattatatat tatatattat 360
atatttatat tttatatata ttatatattt atattttata tatattatat atttatattt 420
tatatatatt atatataata tatatattat atattttata tataatatat atttattata 480
catattttat attatatata atatatattt attatatatt tttatatata ttatatataa 540
tatatatata tttatatata tatattttat atttaatata tataatatat attatatata 600
aatttattat atataatata tattatatat aaatttatta tatataatat atattatata 660
tattatatgt tatatatatt tattacatat aatatataat atatatttat tatatataat 720
atatatttat tatatattat atattatata tttatatttt atatatatta tatatttata 780
ttttatatat attatatatt tatattttat atatattata tataatatat atattatatc 840
ttttatatat aatatatatt tattatacat attttatatt atatataata tatatattat 900
atatatatat atatatatat ttatatatat atatatttat atattttata tatatataat 960
atatattaat tatatataat atatatatta tatatatatt atatataata cgtaatatat 1020
atttattata tatattttgt atatattata tattatatat ttattatata tattttatat 1080
atattatgta tattttatat acaatacata atatatattt tatatacaat atataatata 1140
tattttatat acaatatata atatatattt tatataatat atttttatat aatatatatt 1200
ttatattata tataatatat attttatata ttatatataa tatatatttt atattatata 1260
taatatatat tttatactat atataatata tattttatac attatataat atatatttta 1320
tactatatat aatatatatt ttatacatta tataatatat attttatata ttatataata 1380
tatattttat gttatataat atatatttta tgtattatat aacatatatt ttatgtatta 1440
tataacgtat attttatata ttatgtaacg tatattttat atattatgta acgtatattt 1500
tatatattat gtaacgtata ttttatatat tatgtaatat atattttata tattatatat 1560
tttgtatatt atatattttg tatatgatat attatatatt ttatatatta tatattatat 1620
attttgtata ttatatatta tatattttat atataatata tcatatatat tttatatata 1680
tataaagcat cagtaaacaa 1700
<210> 14
<211> 177
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 14
taacatggtg aaatatcatc tctactaaaa atacaaaaaa ttagccaggc gtggtggcgg 60
gcgcctgtgg tcccagctac ttgggaggct gagggaggag aatggcgtga acccaggagg 120
catagcttgc agtgagccga gattgcacca ctgcactcca gcctgggcaa cagagca 177
<210> 15
<211> 249
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 15
ctctagagcc aggcaccgtg actcactcct gtgatcccag cttttcgaaa ggctgaggca 60
ggaggatcgc ttgaggccag gagttcaaga ccagccttgg caacatagtg agactctccc 120
gtctctaaaa caacaacaac aaaaggttaa ttaaaaatta aaagaaaaga aaactccaca 180
gccaccttct ccaggaaaat aagtcccaaa gccacttgcc actgatgcag aggtgcgcag 240
agcccgagg 249
<210> 16
<211> 5274
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 16
gacagatggg attattcatt tttataaaat atttaaccca acaaatccaa aatatcattt 60
cagcatgtaa ataatacaga tggtccccaa tttaaccatg gttccattaa aggatttttt 120
ttgactttaa taatggattt atcagaatat aacctcatca taagttgagg aacatctgta 180
taaaaatata ttaatgagat accctacatt cattatcctt tgtataccaa gtcttaccat 240
gtggattttg cacttcccac acatctcaat atggaccagc catatcacgt gccccctgcc 300
agatgcatct agtggctttc acatcggaca gctccacact agaatgacag taaggcacag 360
aaccagacag tccccccgct tccagctcct gatcaaccac ttgtagccat gggagctttg 420
gagactgcct taatagttat gaatctaagc taggtgtcat ggctcacacc tgtaatccca 480
actctttggg acgccaagat ggatggatag cttgaggctt tttttttttt tttttttttt 540
tttagacaag agtctcgctc tgttgccagg ctggagtgca gtggcacgat cttggctcac 600
tgcaacctcc gcctcccagg ttcaagggat tctcctgcct cagcctcccc ctgagtagct 660
gagactacag gtgcgcacca ccacgcccag ctaatttttg tatttttagt agagacagag 720
tttcaccatg ttggccagaa tggtctcgat cacttgacct catgatccac ccacctcagc 780
ctcacaaagt gctgggatta caggcgtgag ccaccgcgcc cggccagctt gacgcttgag 840
tccaggaatt caagaccagc ctgggcaaca tggtcgaaac cctgtctcta ctgaaaaaaa 900
aaaaaaaaaa ttatccgggc atggtgacac acgcctacag tcccagctac cccagaggct 960
gaggtgggag gatcattgaa cccctaaaag tcaaggctga agtgatccaa gattgcatca 1020
ctgaactcca gtctgggtga tgggagtgag accctgtctc aaaaaaaaaa aaaaatagaa 1080
aagctctgaa tctatgggtt ctagccctgg gaaattctgg ataacatgga gttaacagtt 1140
cacctgcctc aggtgagata atgtaaaact agaaaggtcc ataccattgt gatgtctaat 1200
tgaatctatt tatcaaaaca gtacccaaat gcagtatgtt cagaaacctt atactgttag 1260
gtaataataa ccataaacaa gataaaaaat atgggctggg tgtggtggct cccactgtta 1320
tcctagcatt ttgggaggcg aaggcaggag gatcacttga ggctgggagt ttgagaacaa 1380
cctgggcaac atagcaagac cccatctcta taaaaaaaca tataaatata atataaagat 1440
atatatattt tatatatata catatatttg tacctgttaa cgtggggtga ggggtgcagg 1500
gagggtggaa aggagaaagt cataatatta agcatcagta ggccgggcgc agtggctcat 1560
gcctgtaatc ccagcacttt gggaggctga ggcgggcaga tcacaaggtc aggagattga 1620
gatcatcctg gctaacatgg tgaaatatca tctctactaa aaatacaaaa aattagccag 1680
gcgtggtggc gggcgcctgt ggtcccagct acttgggagg ctgagggagg agaatggcgt 1740
gaacccagga ggcatagctt gcagtgagcc gagattgcac cactgcactc cagcctgggc 1800
aacagagcaa gactctgtct caaatatata tatatttata tatatatatt ttatatttaa 1860
tatatataat atatattata tataaattta ttatatataa tatatattat atataaattt 1920
attatatata atatatatta tatatattat atgttatata tatttattac atataatata 1980
taatatatat ttattatata taatatatat ttattatata ttatatatta tatattttat 2040
attttatata tattatataa ttttatattt tatatatatt atataattaa tatttaatat 2100
atattatata tatatatata atatatattt attatatata atatatattt attatatatt 2160
atatattata tatttatatt ttatatatat tatatattta tattttatat atattatata 2220
tttatatttt atatatatta tatataatat atatattata tattttatat ataatatata 2280
tttattatac atattttata ttatatataa tatatattta ttatatattt ttatatatat 2340
tatatataat atatatatat ttatatatat atattttata tttaatatat ataatatata 2400
ttatatataa atttattata tataatatat attatatata aatttattat atataatata 2460
tattatatat attatatgtt atatatattt attacatata atatataata tatatttatt 2520
atatataata tatatttatt atatattata tattatatat ttatatttta tatatattat 2580
atatttatat tttatatata ttatatattt atattttata tatattatat ataatatata 2640
tattatatct tttatatata atatatattt attatacata ttttatatta tatataatat 2700
atatattata tatatatata tatatatatt tatatatata tatatttata tattttatat 2760
atatataata tatattaatt atatataata tatatattat atatatatta tatataatac 2820
gtaatatata tttattatat atattttgta tatattatat attatatatt tattatatat 2880
attttatata tattatgtat attttatata caatacataa tatatatttt atatacaata 2940
tataatatat attttatata caatatataa tatatatttt atataatata tttttatata 3000
atatatattt tatattatat ataatatata ttttatatat tatatataat atatatttta 3060
tattatatat aatatatatt ttatactata tataatatat attttataca ttatataata 3120
tatattttat actatatata atatatattt tatacattat ataatatata ttttatatat 3180
tatataatat atattttatg ttatataata tatattttat gtattatata acatatattt 3240
tatgtattat ataacgtata ttttatatat tatgtaacgt atattttata tattatgtaa 3300
cgtatatttt atatattatg taacgtatat tttatatatt atgtaatata tattttatat 3360
attatatatt ttgtatatta tatattttgt atatgatata ttatatattt tatatattat 3420
atattatata ttttgtatat tatatattat atattttata tataatatat catatatatt 3480
ttatatatat ataaagcatc agtaaacaac tctagagcca ggcaccgtga ctcactcctg 3540
tgatcccagc ttttcgaaag gctgaggcag gaggatcgct tgaggccagg agttcaagac 3600
cagccttggc aacatagtga gactctcccg tctctaaaac aacaacaaca aaaggttaat 3660
taaaaattaa aagaaaagaa aactccacag ccaccttctc caggaaaata agtcccaaag 3720
ccacttgcca ctgatgcaga ggtgcgcaga gcccgaggaa cacggagtca tagcagctct 3780
gcaaattgat tttattccag gctaaaagat gctatttctc aaaaaaagga gctgggagcg 3840
tctctgttca tgaattcatt tttcaggggt ggggtgattt caagagtcca ggctgtttcc 3900
tgaccatgca cactgttccg gcctggaagc ctcagacccc agccaggctg accacgagcc 3960
agacccggag taagcttcgt cccatgcttc ctgtcggtcc gggcagcctg agtttcctgg 4020
tgacccttcc ctgcacccag ccaattcaaa ggtctggcaa ggcctggtgc cagccaagaa 4080
aatctgaggc agccaggttt gttatttcaa atctctaaac cttcagacct ctgtgcttgg 4140
cttacatatg tgaaagttaa aacaaggatg tgtgtcgcag tggtgattat aattcaagta 4200
agcaaagatc cctgcatgac cagccttcga atgtcagccc atgctgaagt taacacattt 4260
aactcataga acaaaatagt taaaatgagg agtggatgca aaatggtact gccattctag 4320
aaaacagttg gcagtttctt ataaagttaa acgtacgctt accacaagac ccagcaatca 4380
ccctcccaga gaaatgaaaa tttatgttca tataaaatat tgtacacaaa taattataac 4440
agctttattt gtaatagtca tgtatcaatc aggattctcc aaggaaacag gaccaataga 4500
agagagatat atacataata aatcatatat ataaatgata tatataagaa gttatatata 4560
tatacacaaa cacatacata tattgtgata acctaccttg ttttaacctg agtgactctc 4620
tcctagcaga gagagccaga cagactccat tttagtttct tcattcacag ccccctttat 4680
cccccttaag ggaataacta gtgcaagctg actctaagca catccagtaa tgcacctgct 4740
gataagatat tgaggcaggc tgtaccagca gctcctggga atgtgctcgg tggaaggtat 4800
ctaaaagccc ctgcatttat ctcttagtga tagtttaagc ccctgcacct ggaactgttt 4860
atcttttaca actgcttcta taaccaatta attttttaac tttttgcctg ttctgcttct 4920
gtaaaactgc ttcagttaaa ctccccctcc cctatttaga ccatagtata aaagagaatc 4980
tagccccttc ttcggggctg agagaatttt gagtgctagc tgtctctcag tcgccggcta 5040
ataaaggact ccataatttg tctcaaagtg tggcgtttct ctataactcg cttggttaca 5100
acactatctc tcagggatct ccaaagaaat agaacctata ggatatatct atctataata 5160
aatcattgcc aggcatggtg gctcacccag tactttggga ggccaagtca ggaggatcac 5220
ttgagcccag gagtttgagg ccacctgagc aacatagtga gaccctgtct ctac 5274
<210> 17
<211> 965
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 17
ccagctactc gggaggctga ggcaggagaa cggcttgaac ccaggaggtg gaggttgcag 60
tgagctgaga tcgcgccact gcactccagc ctgggcgaca gagcgagact ctgtctcaaa 120
aaaaaaatat atatatatat atatatacac atatatatat aaaatatata tatatacaca 180
catatatata taaaatatat atatatacac acatatatat aaaatatata tatatacaca 240
catatatata aaatatatat atacacacat atatataaaa tatatatata cacacatata 300
tataaaatat atatatacac acatatatat aaaatatata tatacacaca tatatataaa 360
atatatatat acacacatat atataaaata tatatataca cacatatata taaaatatat 420
atatacacac atatatataa aatatatata tacacacata tatataaaat atatatatac 480
acacatatat ataaaatata tatatacaca catatataaa atatatatat acacacatat 540
ataaaatata tatatacaca tatatataaa atatatatat acacatatat ataaaatata 600
tatacacaca tatatataaa atatatatat acacacatat atataaaata tatatataca 660
catatatata aaatatatat atacacatat atataaaata tatatatata cacatatata 720
taaaatatat atacacacat atatataaag tatatatata cacacatata tataaaatat 780
atatatacac atatatataa aatatatata tacacatata tataaaatat atatatacac 840
atatatataa aaatatatat atatattttt taaaatattc caattgtctc actttgtgga 900
tgagaaaaag aagtagttag aggtcaagta acttggccta catcttttct caagattgta 960
aactc 965
<210> 18
<211> 256
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 18
ctgtgctccc ttaacatcct attttatctg tatatatata tattcttcca aatatccatg 60
ggaaaaaaaa tctgatcata aaaatatttt aggctgggag tggtggctca cgcctgtaat 120
cccagcactt tgggaggctg aggtgggcgg atcatgaggt caagagatcg agaccatcct 180
gaccaatatg gtgaaacccc atctctacta aagatacaaa actattagct ggacgtggtg 240
gcacgtgcct gtagtc 256
<210> 19
<211> 240
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 19
ctagtgagca ataaccacat cttcattttc tttgtataaa acaagaaagt ttagcatgaa 60
aaaggtactc aattacaaat gtgttggatt gaattgaaga cccttggaag gggattttgt 120
acctgaggat ctctttcttt tggccatatt gttcaatgga caaaatttag ccttcgaagg 180
caggccgatt tgaggttaat actaccttta ccacttgata gctatgtgac cttggccatg 240
<210> 20
<211> 3612
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 20
gactctagat tataccaacc tcataaaata agagcatata taaaagcaaa tgctcttatc 60
ttgcagatcc ctgaactgag gaggcaagat cagtttggca gttgaagcag ctggaatctg 120
caattcagag aatctaagaa aagacaaccc tgaagagaga gacccagaaa cctagcagga 180
gtttctccaa acattcaagg ctgagggata aatgttacat gcacagggtg agcctccaga 240
ggcttgtcca ttagcaactg ctacagtttc attatctcag ggatcacaga ttgtgctacc 300
tattgcctac catctgaaaa cagttgcttc ctatatttca tccagtttaa tatttattta 360
aaccaagaag gttaatctgg caccagctat tccgttgtga gtggatgtga aagtaccaat 420
tccattctgt tttactatta actatccttt gccttaatat gtatcagtag gtggcttgtt 480
gctaggaaat attaaatgaa tggcatgttt cataggttgt gtttaaagtt gttttttgag 540
ttaaatcttt ctttaataat actttctgat gtcaaaaaca cttagaagtc atggtgttga 600
acatctatat agggttggat ctaaaatagc ttcttaacct ttcctaacca ctgtttttgt 660
ttgtttgttt ttaactaagc atccagtttg ggaaattctg aattagggga atcataaaag 720
gtttcatttt agctgggcca cataaggaaa gtaagatatc aaattgtaaa aatcgttaag 780
aacttctatc ccatctgaag tgtgggttag gtgcctcttc tctgtgctcc cttaacatcc 840
tattttatct gtatatatat atattcttcc aaatatccat gggaaaaaaa atctgatcat 900
aaaaatattt taggctggga gtggtggctc acgcctgtaa tcccagcact ttgggaggct 960
gaggtgggcg gatcatgagg tcaagagatc gagaccatcc tgaccaatat ggtgaaaccc 1020
catctctact aaagatacaa aactattagc tggacgtggt ggcacgtgcc tgtagtccca 1080
gctactcggg aggctgaggc aggagaacgg cttgaaccca ggaggtggag gttgcagtga 1140
gctgagatcg cgccactgca ctccagcctg ggcgacagag cgagactctg tctcaaaaaa 1200
aaaatatata tatatatata tatacacata tatatataaa atatatatat atacacacat 1260
atatatataa aatatatata tatacacaca tatatataaa atatatatat atacacacat 1320
atatataaaa tatatatata cacacatata tataaaatat atatatacac acatatatat 1380
aaaatatata tatacacaca tatatataaa atatatatat acacacatat atataaaata 1440
tatatataca cacatatata taaaatatat atatacacac atatatataa aatatatata 1500
tacacacata tatataaaat atatatatac acacatatat ataaaatata tatatacaca 1560
catatatata aaatatatat atacacacat atataaaata tatatataca cacatatata 1620
aaatatatat atacacatat atataaaata tatatataca catatatata aaatatatat 1680
acacacatat atataaaata tatatataca cacatatata taaaatatat atatacacat 1740
atatataaaa tatatatata cacatatata taaaatatat atatatacac atatatataa 1800
aatatatata cacacatata tataaagtat atatatacac acatatatat aaaatatata 1860
tatacacata tatataaaat atatatatac acatatatat aaaatatata tatacacata 1920
tatataaaaa tatatatata tattttttaa aatattccaa ttgtctcact ttgtggatga 1980
gaaaaagaag tagttagagg tcaagtaact tggcctacat cttttctcaa gattgtaaac 2040
tcctagtgag caataaccac atcttcattt tctttgtata aaacaagaaa gtttagcatg 2100
aaaaaggtac tcaattacaa atgtgttgga ttgaattgaa gacccttgga aggggatttt 2160
gtacctgagg atctctttct tttggccata ttgttcaatg gacaaaattt agccttcgaa 2220
ggcaggccga tttgaggtta atactacctt taccacttga tagctatgtg accttggcca 2280
tgtggtttca acagtctgaa cctcattttc tctgtgtatg tgtggtcctc cttacaagtt 2340
tgtgaaaaat gtgaagtcct tagccatgat agcccaatat aacaggctaa atgataatag 2400
gtttatgttc ttttccttta tattctcaga taagcactgt ccaagtttga ggtgttttga 2460
ggtctcgcct gatttggatt gtttgagttt atgctattct ttgaattctt tgagctgttc 2520
tgaagcagtg tatcatgaac aaaaacatcc ccagttcagt ccaaacccct ggttacatat 2580
cattcttatg ccatgttata accagtttga gagtgttccc tctgttattg catttaagtt 2640
tcagcctcac acagaaattc agcagccaat ttctaagccc taagcataaa atctggggtg 2700
gggggggggg atggcctgaa gagcagcatt atgaatagca ccattataat taatgatctc 2760
tcaggaagat ttacaatcac aggtagcaga taaaacaaat agtactgctt ctgcacttcc 2820
cctcctttta ttcgctatga aattttatgg gaaatcagtc cagtgaaaaa tgtaagctct 2880
taatctttcc cagaaatcct acctcatttg atgaatactt tgagggaatg aattagagca 2940
tttttttctt ttatagtcta cttcgcattt acgaagtgag gacggtagct taggctgcct 3000
ggccaactga tgagaaggtc agaggcattt ttagagacct ctgttgtctt tcattcatgt 3060
tcattttcca caaggcaagt aatttccaac aaatcagtgt cttcattagt aataagatta 3120
ttaacaacaa taatagtcat agtaactatt cagtgagagt ccattatata tcaggcattc 3180
tacaaggtac tttatataca tctgagtaaa cctcacacaa ttctacaggg aggtatttct 3240
atccccattt aacaaataag gaaacgaagt ccaagtaaat taacttgccc aaggtcacac 3300
agatagtacc tggcagaaca ggaatttaaa cctaaatttg tccaactcca aaagcagcct 3360
tctatttgtt ataaatgctg cctctcatta tcacatattt tattattaac aacaacaaac 3420
ataccaatta gcttaagata caatacaacc agataatcat gatgacaaca gtaattgtta 3480
tactattata ataaaataga tgttttgtat gttactataa tcttgaattt gaatagaaat 3540
ttgcatttct gaaagcatgt tcctgtcatc taatatgatt ctgtatctat taaaatagta 3600
ctacatctag ag 3612
<210> 21
<211> 599
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 21
atatgtatat atgtatatat gtatatatgt atatatgtat atatgtatat atgtatatat 60
gtatatatgt atatatgtat atatgtatat atgtatatat gtatatatgt atatatgtat 120
atatgtatat atgtatatat gtatatatgt atatatgtat atatgtatat atgtatatat 180
gtatatatgt atatatgtat atatgtatat atgtatatat gtatatatgt atatatgtat 240
atatgtatat atgtatatac gtatatatgc atatacgtat atatgtatat atgtatatat 300
gtatatatgt atatatgtat atatgtatat atgtatatat gtatatatgt atgtatgtat 360
gtatgtatgt atatatgtat atatgtatgt atgtatgtat gtatgtatgt atgtatatat 420
gtatatatat atgtatgtat gtatgtatgt atgtatgtat atgtgtatat gtgtatatgt 480
gtatatgtgt atatgtgtat atatgtatat atgtatatat gtatatatgt atatgtgtat 540
atgtgtatat gtgtatatat gtatatatgt atatatgtat atatgtatat atataacat 599
<210> 22
<211> 205
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 22
gctctttcct ttagttaagc ttatgaaata gtgtttctct catgtttcct ctatattctc 60
tcttttgcct tcctgtttct tcctgttgat tccatcccat tggagtgaaa tcttatgatc 120
ttttggcatc aacaaagtga tctgcatcca aataattcca catctcattc catgttgact 180
gtggatctat atatatatat atgta 205
<210> 23
<211> 352
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 23
agtattaaat tatatataca tatataagtg aaatgtcaca atcttctaga acttgctctg 60
tatgtccact taacatggta gagtgagcta tgtcagcatt ttctatttcc tgtgaatcat 120
tctgtgtgtt gccaagaaga aatatgatat attctgaggt tatgaaatga tattttggtc 180
atcatgtttc tcatcctatt ttcatattac ctaaatactt ttgcttttaa aattattatt 240
attaataata atataattat ttatacaata atatttaaat aatatattta tttaatataa 300
ttattatatt tcacataaaa gcaatagttc cagtgttaca aattgtaggc aa 352
<210> 24
<211> 5460
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 24
ctcgaggtct caagataaga atgactgctg taactcaaat ccaccaaagc tatttgtgtt 60
agaatgcttt cctttggtaa taacataata ccacagagtg agtgaatgta tcaagcaaag 120
tactcactca taatctctcc acccaaatga ctttgtcttc taaaattaaa cccttcccag 180
aggcctctcc ccttaatacc atattgggct cttcacactt cttccaacat cgccttccat 240
cctggccctt ccaacctccc ttctgtttgt gctaggaaca gctcaaggcc tcctatctac 300
cacagagtta catggcttgc cccttgccaa ccccccagta ccacacagtg agtgcaaaat 360
ctcaccacat tcagaaccca gtcactattc aaatcatatt ttaacctttg cagtactgac 420
tacttttgat tcatctaaac attactgaac tttattctag aaaacattta agaaatttgt 480
agttaggttc atcctttgag accttacatt taatttcttt ctatgtaaac ggaaagcatt 540
gttcagtccc acgctcatta tggcaaccca cttccaagta cttcgtttac tacgtgggct 600
ggaatcatac agttttctgt tgtgcttgtg ggagcagatc cccctaacct ctgctgattt 660
ttctcaccac ttatcataca tttattacat gcatgcactg ctgtgtgagt ttctaaatac 720
ttgggtagca attctctact attactttaa ttttcctact tgtctgcaaa tacgaaaagt 780
agcttgaaag aacttcagat ctttgttgtt atctgttgca aacactccat ttttctgttg 840
tagcaaaaaa aaaaaaaaag acatccatag ttgtcaatga gaatgcaaga tacatacatt 900
ctgcacctgt gtgctaacat aagtggctgc cctgtgactc agagattgct tgtccttctc 960
ctaagcctat ccttttttgt tactttggat acttttgttc aatgaatcca gaaaaagtgt 1020
ttttcagatt caccatgtga ccctcattta aaacctgtaa tccccctatg gttaagttcc 1080
tgcttttgtt tctgttttct ttctttcagt aaaaggaatt gaacccagtc cttccactta 1140
ctatctgagc atatggctct tttagattat gatgttggtg gtgttcattg gtctcaccaa 1200
aatgctaaag aagccttcat cttctacttg tgggtagtct ttacattcat tactgcaagt 1260
ttagtttatg tggtagtacc agatcctttg cttcttttga cttcatgcct acctaacagc 1320
gctctttcct ttagttaagc ttatgaaata gtgtttctct catgtttcct ctatattctc 1380
tcttttgcct tcctgtttct tcctgttgat tccatcccat tggagtgaaa tcttatgatc 1440
ttttggcatc aacaaagtga tctgcatcca aataattcca catctcattc catgttgact 1500
gtggatctat atatatatat atgtaatatg tatatatgta tatatgtata tatgtatata 1560
tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta 1620
tatatgtata tatgtatata tgtatatatg tatatatgta tatatgtata tatgtatata 1680
tgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta 1740
tatatgtata tatgtatata tgtatatatg tatatatgta tatacgtata tatgcatata 1800
cgtatatatg tatatatgta tatatgtata tatgtatata tgtatatatg tatatatgta 1860
tatatgtata tatgtatgta tgtatgtatg tatgtatata tgtatatatg tatgtatgta 1920
tgtatgtatg tatgtatgta tatatgtata tatatatgta tgtatgtatg tatgtatgta 1980
tgtatatgtg tatatgtgta tatgtgtata tgtgtatatg tgtatatatg tatatatgta 2040
tatatgtata tatgtatatg tgtatatgtg tatatgtgta tatatgtata tatgtatata 2100
tgtatatatg tatatatata acatagtatt aaattatata tacatatata agtgaaatgt 2160
cacaatcttc tagaacttgc tctgtatgtc cacttaacat ggtagagtga gctatgtcag 2220
cattttctat ttcctgtgaa tcattctgtg tgttgccaag aagaaatatg atatattctg 2280
aggttatgaa atgatatttt ggtcatcatg tttctcatcc tattttcata ttacctaaat 2340
acttttgctt ttaaaattat tattattaat aataatataa ttatttatac aataatattt 2400
aaataatata tttatttaat ataattatta tatttcacat aaaagcaata gttccagtgt 2460
tacaaattgt aggcaatggg ctgttctgat tatctaagtt gggcccagga tatgtgctga 2520
atagttaaag cacatgccca gcatgtatga gggtaaaagg atgggtggat gtagtgaccc 2580
atttgtaatt taagccttag caggcagagg tgtgacccat agtgcaaagt acatagtcat 2640
tataaggtca tctatatcac aatctctgga ttagattgat tgaacctgct cagtgaccaa 2700
tgtgttagca atatacagga ggatgataac atcaacgtca gaagacacat tgaagggctt 2760
acaaatagtg cccatttact ttaatacaga aaaattcaat gtaccctcta ggcaatttca 2820
acttttagtc tcttggtagg atagtctaca tttagaatgg ctaattcata aattagaaag 2880
cttcttcacc ccctactttt ctggttattt ctctatgaat gtggtaggca tgagttagta 2940
cacatgtttc catgtacatg tgtttctatg tgtctgcatg catatggtag aatgtactca 3000
tattctatgt acagttagaa caatatttat attgtcaaag aaatcaaaag gagtattata 3060
agcttcagaa ataaggataa gtttgaaata ttcattgttt tattttttac agtatttttt 3120
cctttgagaa ttctatgtaa agtactttga acatatttgc cttcaactcc tccctcactt 3180
tcaccctctc ttcattcctc cctttccttt ccactcaaag ttgagattcc tttatttatt 3240
tatttatcct tcaaatatca ctggtactat ccacatgatc tcaggattga ggtctgctct 3300
gacgtgtcat cctgctttca tgcaatggcc ttataggtgg aacaacatta tgaactaacc 3360
agtaccccgg agctcttgac tctagctgca tatatatcaa aagatggcct agtcggccat 3420
cactggaaag agaggctcat tggacttgca aactttatat gccccagtac aggggaacac 3480
cagggccaaa aagggggagt gggtgggcag gggagtgggg gtgggtggat atgggggact 3540
tttggtatag cattggaaat gtaaatgagt taaataccta ataaaaaatg gaaaaaaaaa 3600
gtttctaatg tgtgtttcta gaaacttcct ctcttaaagc aacaacatgt ccatgagcaa 3660
tatagaattg aagatcacca tcaaatcctc tttattcctc attgtttcca tcatgtacta 3720
ccagacctct ttaaagtgta gtacagtgtg ttaggaaatg agcagattat cctgggtatg 3780
tgctaaatta gctactgagt caaaatacat tttttgctga acattaagtg tttggtcatt 3840
tctgggcaaa agaaagaaag aaagaaagaa aagaaagaaa gaaaggaagg aaggaaggaa 3900
ggaaggaagg aaggaaggaa agaaggaagg aaagaaaaaa tggatgtaaa ttgttctgac 3960
agcatctgtc tgagtcaggc agtggaatga aggaggaatc ctagagaatg cacaggaaag 4020
cagcccaagg agagtgtggg ctgaaaggca tcatgttaga aacatgcact cgatgacaga 4080
accttgagaa aaaggaactc aagcaaaagc acttatttaa aattgtaaaa cgcactttat 4140
tcatagccat gggggatgtc aatattccaa gcataagaat gatcagtttc caatcactgt 4200
gaacccccaa aacacaaagt gaaaacccac tactttattt gatgagattt ggggttgctc 4260
tattaattta taaaatcaga gtaagacacg atataaatga aacgattgta gttctaaagc 4320
agcggcactt ccctgaacag tgtcattttg acaagtaact gctaacatct tcaggtcaca 4380
gcgactgaag aaaaagtagg gaaagaaggc tggctgtgct gtttgacatt ttcttttctt 4440
atctggtgac atgaagagaa gctctgggtc cccctactct tgttcatata tctgttgctt 4500
ttatgctgca tcctgaggtt tgaagaaatg catttggcac tgagaaaaga tgaggagaga 4560
atgccttgga catggtccta acatgctttg gtactgagaa aagagagcag aggagatgac 4620
atagaatagg agagataatt tggcctattt tggccttcat ctgagtgata gattttactt 4680
aacaaataga aacaaagttt tacttataaa cagaaccaat gacctgtgtc atctctgata 4740
tattgagctt tgaattcagt gaaattatga actaaatata tcactccata attttctaag 4800
agggctattt gtatagtttc agtgatagtg tgacaaagtg taatctaaat ttctaaaaag 4860
taaaataagt agataaaata gtaggtagaa tagtataata atagaataag tataggtatg 4920
gactagaata aatagacaaa atagtagata aaatgctaat gattttgttg acagggtaat 4980
catgaatatt tttattattt agctaaagaa ccaatgttca tgtactcaag aagtgtattg 5040
aggaacttag gaaattagtc tgaacaggtg agagggtgcg ccagagaacc tgacagcttc 5100
tggaacaggc ggaagcacag aggcactgag gcagcaccct gtgtgggccg gggacagccg 5160
gccaccttcc ggaccggagg acaggtgccc gcccggctgg ggaggcgacc taagccacag 5220
cagcagcggt cgccatcttg gtccgggacc cgccgaactt aggaaattag tctgaacagg 5280
tgagagggtg cgccagagaa cctgacagct tctggaacag gcagaagcac agaggcgctg 5340
aggcagcacc ctgtgtgggc cggggacagc cggccacctt ccggaccgga ggacaggtgc 5400
ccacccggct ggggaggcgg cctaagccac agcagcagcg gtcgccatct tggtcccggg 5460
<210> 25
<211> 220
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 25
taggcaacag agtgagatca tgtgtcatat atatatatat atatatatat atatatatat 60
atatatacac acacacacac atatatatat acacatatat atacgtatat atatatatgt 120
atatatatac atatatatac atatatatat atacgtatat atatacgtat atatatatca 180
atgtaaatta tttgggaaat ttggtatgaa tagtcttccc 220
<210> 26
<211> 134
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 26
aaatacaaaa attagccagg tgtggtggca tgtgcctgta gtcctaccta ctcgggaggc 60
tgaggcacaa gaatcgcttg aatgtgggag gtggaggttg cagtgacctg agatcgtgcc 120
actgcactcc agcc 134
<210> 27
<211> 246
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 27
tgtgaacaca gatcataaaa tcatatatca agcagacaaa taagtagtag tcacttatat 60
gcttatactt gtaacttaaa gtaaaagaat tacaaaagca tatgacaaag actaatttta 120
agatatccta atttaaattg ttttctaaaa gtgtgtatac cattttacct atcatatgaa 180
taatttagaa acatgtttat aaaattaatg tccaaatcca ttcaaaagtt ttgtaatgca 240
gatcac 246
<210> 28
<211> 3361
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 28
agcgccgaat tcgatccctt tataaaacca caatataatg gagtgctata atttcaaaca 60
gtgtttggtc tgctggcaga gtggtcattc taacagcagt cacagtagag tagaaataag 120
actgcagtat atctaaggca aaaagctgag gtttcaggag cttgaaggta aagaggaaga 180
aagaaatggg aatgggaatt ggaaagacaa atatcgttaa gagaaaattg cttttaggag 240
aggggaaaga atctatgtgt acttaagact atggaatcaa tcccatttaa gctgggaaac 300
tagtttcata tataactaat aaattttatt tacagaatat ctatttacct gatctaggct 360
tcaagccaaa gggactgtgt gaaaaaccat cagttctgtc atattcctaa aaaaaaatta 420
aaaagttaaa aataaataaa taataaaact tcttttcttt caaaataatc aaggtgctta 480
ttcacatcca ttccaatttg gggaaatact tattttccta tgattagcga agagaaaagt 540
aacttgcatt tcaattcaag ttgatacatg tcacttttaa gaggtcaact aatatttgct 600
agttgagcta accatatagg ctttaaatac tttcatagta gaaagaaaat gaaaatcatt 660
agtgaactgt ataaaataga tcatactttt tgaaagaatc agactgaagt ttccgaaaaa 720
aagaagtaag cttcaatgaa aaggtaagtg aatttagcat ttactcagca tctactatgg 780
acttaacacc taacagtaga taatctgaag gcaaacatat ttgtataggg actgcagaat 840
gatagatgat aaatatcatc tcttctattt gaatgaatat tttttcaaat ctttcacaca 900
cagtggtttg ctatggaaag atttgtagta cattaaacaa atctgaagat ggagttagaa 960
agcttaggct atgttttgag cacaacatat aatttctctg tgattgtttc ttcatctttc 1020
aaatgaggtt actgtgaaga ttaaatgaga taactaaatg atgataaaat aatgtaatct 1080
tagcagcacc ttatttaatc tgtgcaacaa ctctgtgaag tgagtagggc tcagcttcag 1140
tcacttctct gccatttatt aactaagata gtttggaaag ttacccatct cttcagctgt 1200
aaaatgatga ggatcatacc tattttatgg ggctgctttt aggtacaaat atacaggcaa 1260
gcactttgtt aatactaaag cattacacca attagtttta ctcttttcca ttcacacatg 1320
aaattaatgt aatcagaatt ctgtagatta cctaaatctt ctgttaacac gtgatatgca 1380
gttcaggtta aatgtcagtt gagttaccaa agcacataca tactcaccac cctatccaaa 1440
tctacaagcc tcccagtttg tcttcactat tttggttaaa ttaatatgaa ttcctagatg 1500
aaaatttcac tgatccaaat gaaataaaaa atatattaca aaactcacac ctgtaatctc 1560
aacattttgg gaggccaagg caggtagatc acttgaggcc aggagttcaa gaccagcctg 1620
atcaacatgg tgaaaccctg tctctactaa aatacaaaaa ttagccaggt gtggtggcat 1680
gtgcctgtag tcctacctac tcgggaggct gaggcacaag aatcgcttga atgtgggagg 1740
tggaggttgc agtgacctga gatcgtgcca ctgcactcca gcctaggcaa cagagtgaga 1800
tcatgtgtca tatatatata tatatatata tatatatata tatatatata cacacacaca 1860
cacatatata tatacacata tatatacgta tatatatata tgtatatata tacatatata 1920
tacatatata tatatacgta tatatatacg tatatatata tcaatgtaaa ttatttggga 1980
aatttggtat gaatagtctt ccctgtgaac acagatcata aaatcatata tcaagcagac 2040
aaataagtag tagtcactta tatgcttata cttgtaactt aaagtaaaag aattacaaaa 2100
gcatatgaca aagactaatt ttaagatatc ctaatttaaa ttgttttcta aaagtgtgta 2160
taccatttta cctatcatat gaataattta gaaacatgtt tataaaatta atgtccaaat 2220
ccattcaaaa gttttgtaat gcagatcacc cacaacaaca aagaatccta gcctattaaa 2280
aaagcaacac cacctacata taatgaaata ttagcagcat ctatgtaacc aaagttacac 2340
agtgaatttg ggccatccaa cactttgagc aaagtgttga attcatcaaa tgaatgtgta 2400
atcatttact tactaatgcc aatacacttt aaggtaatct taagtagaag agatagagtt 2460
tagaattttt taaatttatc tcttgttgta aagcaataga cttgaataaa taaattagaa 2520
gaatcagtca ttcaagccac cagagtattt gatcgagatt tcacaaactc taactttctg 2580
atacccattc tcccaaaaac gtgtaacctc ctgtcgatag gaacaaccca ctgcagggat 2640
gtttctcgtg gaaaaaggaa atttcttttg cattggtttc agacctaact ggttacaaga 2700
aaaaccaaag gccattgcac aatgctgaag tacttttttc aaatttaaaa tttgaaagtt 2760
gttcttaaaa tctatcattt attttaaaat acggatgaat gagaaagcat agatttgata 2820
aagtgaattc ttttctgcaa tctacagaca cttccaaaaa tcactacaga cactacagac 2880
actacagaaa atcataaata aacaagtgct agtatcaata tttttaccaa aaaatggcat 2940
tcttagaatt ttttataggc tagaaggttt gtacaaacta atctgccacg gattttaaaa 3000
tatgagtgaa taaattatat tgcaaaaaaa atcaggttac agagaactgg caaggaagac 3060
tcttatgtaa aacacagaaa acatacaaaa cgtattttta agacaaataa aaacagaact 3120
tgtacctcag atgatactgg agattgtgtt gacatattag cattatcact gtcttgctaa 3180
aacataaaaa taaaaagatg gaagatgaaa ttacaataca aatgatgatt taaacatata 3240
aaaggaaaat aaaaattgtt ctgaccaact actaaaggaa gacctactaa agatatgcca 3300
tccagcacat tgccactcta catgtggtct gtaaaccagc agcataggcg gccgcattag 3360
c 3361
<210> 29
<211> 143
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 29
attcaacagc tgaatcctaa attgcaaact cagtggctaa taacaacttt gaacaatgag 60
caccttatac acgctactgt attttctttt ctttcttttt tttttttttt ttttttttta 120
aaccgggtag cagtgagaga ggt 143
<210> 30
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 30
tgtagtcatt ttgcaatcct taaagctgaa ttgtgcaatg agctcgatga aggaagatac 60
tatc 64
<210> 31
<211> 73
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 31
ttctttaagt gccttggggc gaggagtccg gaataagaag acttctttgg gttttaaagt 60
gtaggataag caa 73
<210> 32
<211> 1697
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 32
agccctgccc ccatccgacc tccgccctcg ttggcttcgc aacgctgtgg tctctgtggc 60
cagtagaggg cacacttact ttactttcac aaatccgaga gccacaaccc gggtggtggg 120
gggtgagggg gcggggaaag agtctctgca gcaaaacgca gactagggat tggtggctct 180
tggtgtttga ggcaaaatcc tagaggctgt agtcattttg caatccttaa agctgaattg 240
tgcaatgagc tcgatgaagg aagatactat cattcaacag ctgaatccta aattgcaaac 300
tcagtggcta ataacaactt tgaacaatga gcaccttata cacgctactg tattttcttt 360
tctttctttt tttttttttt tttttttttt aaaccgggta gcagtgagag aggtttcttt 420
aagtgccttg gggcgaggag tccggaataa gaagacttct ttgggtttta aagtgtagga 480
taagcaaatc ccgagggaat atgcattata taataaatct agaaccaatg cacagagcaa 540
aagactcatg tttctggttg gttaataagc tagattatcg tgtatatata aagtgtgtat 600
gtatacgttt ggggattgta cagaatgcac agcgtagtat tcaggaaaaa ggaaactggg 660
aaattaatgt ataaattaaa atcagctttt aattagctta acacacacat acgaaggcaa 720
aaatgtaacg ttactttgat ctgatcaggg ccgacttttt tttttaagtg cataattacg 780
attccagtaa taaaagggga aagcttgggt ttgtcctggg aggaaggggt taacggtttt 840
ctttattcta gggtctctgc aggctcccca gatctgggtt ggcaattcac tcctccccct 900
ttctgggaag tccgggtttt ccccaacccc ccaattcatg gcatattctc gcgtctagcg 960
ccttgatttt ccccacccca gctcctaaac cagagtctgc tgcaaactgg ctccacaggg 1020
gcaaagagga tttgcctctt gtgaaaaccg actgtggccc tggaactgtg tggaggtgta 1080
tggggtgtag accggcagag actcctcccg gaggagccgg gtagagcgca cccgccgcca 1140
ctttactgga ctgcgcaggg agacctacag gggaaagagc cgcctccaca ccacccgccg 1200
ggtggaagtc cgaaccggag gtgctggagt gtgtgtgtgg gggggggggg gaatctgcct 1260
tttggcagca aattgggggg gggggtcgtt ctggaaagaa tgtgcccagt caacataact 1320
gtacgaccaa aggcaaaata cacaatgcct tccccgcgag atggagtggc tgtttatccc 1380
taagtggctc tccaagtata cgtggcagtg agttgctgag caattttaat aaaattccag 1440
acatcgtttt tcctgcatag acctcatctg cggttgatca ccctctatca ctccacacac 1500
tgagcggggg ctcctagata actcattcgt tcgtccttcc ccctttctaa attctgtttt 1560
ccccagcctt agagagacgc ctggccgccc gggacgtgcg tgacgcggtc cagggtacat 1620
ggcgtattgt gtggagcgag gcagctgttc cacctgcggt gactgatata cgcagggcaa 1680
gaacacagtt cagccga 1697
<210> 33
<211> 146
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 33
tcacagacac tacagaatgt tttggagatt atgtaatatt taaaatattc aaattatact 60
aaaaatgtat gtaaaatgta ttgaacatag gcaagtttca atacatagat tttgagtgaa 120
tgcttgcaac tttggttcca ttctct 146
<210> 34
<211> 77
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 34
tctgactctg cactctgcaa cctactctaa tattacatat gataacatga gtctatgcag 60
ctgttctcta tagatat 77
<210> 35
<211> 110
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 35
ctacttcctt aaggtggtgt ccaagagtac atttttataa ataaaaagtt atagtacact 60
cctaagggca gcaagtagaa aacgtgctag ggagactcga tctcactttg 110
<210> 36
<211> 2195
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 36
aagcttcctt ggaattaatg gtcagataag gagctctagc aatatcactt taaatgctta 60
atatacaata tttagaaaac cttatgattg taaagagctt aaaaaagatg tgaaagaaca 120
atcactaaag cattgacaac atatgtgtgt tagtgaacaa tatgtaccaa aatggacaga 180
tgagaggtgt acattggggt gtgagttgat aatccagcag actgtgggac tagagggtct 240
acgaaaaaca aaggaagaac atacaaacaa attttaaaac actgtctttc aacactaaaa 300
ctgttggaat agagagcaag aatacatatt ggattcacat tcagtttatt tctcagattc 360
agactagtgc tctgactctg cactctgcaa cctactctaa tattacatat gataacatga 420
gtctatgcag ctgttctcta tagatattca cagacactac agaatgtttt ggagattatg 480
taatatttaa aatattcaaa ttatactaaa aatgtatgta aaatgtattg aacataggca 540
agtttcaata catagatttt gagtgaatgc ttgcaacttt ggttccattc tctctacttc 600
cttaaggtgg tgtccaagag tacattttta taaataaaaa gttatagtac actcctaagg 660
gcagcaagta gaaaacgtgc tagggagact cgatctcact ttggaatcta tcctgggaga 720
caaatgcctc tacaaatgga ttagagaaga cagttttaaa gaggaagata atcaggtaaa 780
atctggggtt ttatgagaga aagaaagagg tagaagaaaa aatttcaagc tcgaacatcg 840
gatcaggtgg cacaatgcgg tcaatgcctg caaactcagg gtaagtatta ttctccctgt 900
ttacagttcc gtggaggaga agtgacttgc ctgtggtcat acaacagagc aaagaaaagg 960
cttgagctag aactcaggcc tttgttaggt ctccccttcc tcctagcaca ttggcaaatt 1020
gcatgaggaa agtagaggta cagttgagtt catgtacaac aataaggcat tcaggtaaag 1080
tgaatgaggg cagaagtttt atgatttagg gaaggtgtaa gacaggaaaa tatctttgtt 1140
cccaattaag aaagagatcc cttgaccatc agttagagat tcccccaagt ccctctttgc 1200
cataagtcac tgaaactgag atccaaggca tggcttctgt gagtcaggag agcttaaccc 1260
agaggagaga tttcagaaca ggatatttcc tattttgagt atcctgctca tgccagtcat 1320
ggataaattt gcatctggct taagaaatta ctggatcagc attgttttgg gtagtttcac 1380
ttcctgctgg gtggggtagc aggctctata aagagatcct ctgctgcacg actcttaaac 1440
ccctggtacc tgagcactga tctgccttgg agaacctggt gagtcggctt ccttgagttc 1500
ctctgttctt tgtgccctga aatgttgagt ttaatctgaa tatggcaagt ttggtggatc 1560
caatcctatg aaaattgact tgatgctact tagtggatga aaatttaaga ttagagcaca 1620
attatatgct attttagctt tcttttgtta tacaggtagg tatccatatg gacagagaag 1680
ttaaggggta acctttgata tgaagaagaa aaaagaacaa agtatttttc tttattctct 1740
tgctttctag tgtcctttac aaaggtttgt gtcttagcag gtgtgaaaga ctacaattct 1800
ccctgagcag ccctttgctc tatgcccaag tcagcccact tggactttat aacagataat 1860
gatgatagga atagcatatt agattgccca gggtgtctga acttgtgact gcctttcttg 1920
aattggttat tttcagggaa ataagatgct tgattcttta taacagagat aatttatttg 1980
gaaaaattgt atgagaaaac acaggatttc ctagggacaa tgaagcaatt tgttaaagtg 2040
gaagggagaa accagaaagt cttgaaaagg taattaagaa tttaaataat ttcttggaga 2100
ttggagaaat aatatgccat ggtattacac aagctttggc ttctctctct ggaggattcc 2160
cttcccacga acactgttgt atcatttctt tcaga 2195
Claims (15)
1.一种重组多核苷酸,其包含:编码序列;启动子,其被配置为启动所述编码序列的转录;以及基质附着区(MAR)核心,其选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中任何一个具有至少90%序列同一性的核酸序列,其中MAR核心能够附着到哺乳动物细胞核基质。
2.根据权利要求1所述的多核苷酸,其进一步包含5’侧翼区,所述5’侧翼区选自SEQ IDNO: 2、6、10和14和与SEQ ID NO: 2、6、10和14中的任何一个具有至少75%序列同一性的核酸序列。
3.根据权利要求2所述的多核苷酸,其中所述5’侧翼区位于MAR核心的5’侧,并距离所述MAR核心100个核苷酸之内。
4.根据权利要求1至3中的任一项所述的多核苷酸,其进一步包含3’侧翼区,所述3’侧翼区选自SEQ ID NO: 3、7、11和15和与SEQ ID NO: 3、7、11和15中的任何一个具有至少75%序列同一性的核酸序列。
5.根据权利要求4所述的多核苷酸,其中所述3’侧翼区位于MAR核心的3’侧,并距离所述MAR核心100个核苷酸之内。
6.根据权利要求1所述的多核苷酸,其包含MAR,所述MAR选自SEQ ID NO: 4、8、12和16和与SEQ ID NO: 4、8、12和16中的任何一个具有至少75%序列同一性的核酸序列,其中所述MAR能够附着到哺乳动物细胞核基质。
7.一种包含如权利要求1至6中的任一项所述的多核苷酸的细胞。
8.一种将编码序列转染到细胞的方法,其包含:在用于将第一和第二多核苷酸转染到细胞中的条件下,将所述细胞与包含所述编码序列和用于启动所述编码序列的转录的启动子的第一多核苷酸和包含选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中的任何一个具有至少90%序列同一性的核酸序列的基质附着区(MAR)核心的不连接的第二多核苷酸接触,其中MAR核心能够附着到哺乳动物细胞核基质。
9.根据权利要求8所述的方法,其中所述第二多核苷酸进一步包含5’侧翼区,所述5’侧翼区选自SEQ ID NO: 2、6、10和14和与SEQ ID NO: 2、6、10和14中的任何一个具有至少75%序列同一性的核酸序列。
10.根据权利要求9所述的方法,其中所述5’侧翼区位于所述MAR核心的5’侧,并距离所述MAR核心100个核苷酸之内。
11.根据权利要求8至10中的任一项所述的方法,其中所述第二多核苷酸进一步包含3’侧翼区,所述3’侧翼区选自SEQ ID NO: 3、7、11和15和与SEQ ID NO: 3、7、11和15中的任何一个具有至少75%序列同一性的核酸序列。
12.根据权利要求11所述的方法,其中所述3’侧翼区位于所述MAR核心的3’侧,并距离所述MAR核心100个核苷酸之内。
13.根据权利要求8所述的方法,其中所述第二多核苷酸进一步包含MAR,所述MAR选自SEQ ID NO: 4、8、12和16和与SEQ ID NO: 4、8、12和16中的任何一个具有至少75%序列同一性的核酸序列,其中所述MAR能够附着到哺乳动物细胞核基质。
14.一种通过权利要求8至13中的任一项所述的方法制备的转染细胞。
15.一种嵌合基质附着区(MAR),其包含:
(a)MAR核心,其选自SEQ ID NO: 1、5、9和13和与SEQ ID NO: 1、5、9和13中任何一个具有至少75%序列同一性的核酸序列,其中所述MAR核心能够附着到哺乳动物细胞核基质,
(b)5’侧翼区,其选自SEQ ID NO: 2、6、10、14、18、22、26、30和34和与SEQ ID NO: 2、6、10、14、18、22、26、30和34中的任何一个具有至少75%序列同一性的核酸序列,以及
(c)3’侧翼区,其选自SEQ ID NO: 3、7、11、15、19、23、27、31和35和与SEQ ID NO: 3、7、11、15、19、23、27、31和35中的任何一个具有至少75%序列同一性的核酸序列,
其中所述MAR核心、所述5’侧翼区和所述3’侧翼区不是来自相同的天然MAR。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862776643P | 2018-12-07 | 2018-12-07 | |
US62/776,643 | 2018-12-07 | ||
PCT/US2019/064910 WO2020118169A1 (en) | 2018-12-07 | 2019-12-06 | Matrix attachment regions and uses in promoting gene expression |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113383081A true CN113383081A (zh) | 2021-09-10 |
Family
ID=70974440
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980091439.0A Pending CN113383081A (zh) | 2018-12-07 | 2019-12-06 | 基质附着区和促进基因表达的用途 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20220017916A1 (zh) |
EP (1) | EP3891288A4 (zh) |
JP (1) | JP2022511077A (zh) |
KR (1) | KR20210113222A (zh) |
CN (1) | CN113383081A (zh) |
AU (1) | AU2019395023A1 (zh) |
CA (1) | CA3161115A1 (zh) |
WO (1) | WO2020118169A1 (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1863913A (zh) * | 2003-10-24 | 2006-11-15 | 思兰克斯有限公司 | 通过mar序列的多次转染过程在哺乳动物细胞中实现高效基因转移和表达 |
WO2007107578A1 (en) * | 2006-03-20 | 2007-09-27 | Chromagenics B.V. | Expression augmenting dna fragments, use thereof, and methods for finding thereof |
CN101541959A (zh) * | 2006-08-23 | 2009-09-23 | 思兰克斯有限公司 | 用于增加转录的基质附着区(mar)及其应用 |
US20170114363A1 (en) * | 2015-10-27 | 2017-04-27 | Celltheon Corporation | Chimeric post-transcriptional regulatory element |
CN107868781A (zh) * | 2017-11-15 | 2018-04-03 | 新乡医学院 | 人工合成mar片段、表达载体、表达系统及其应用 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080125583A1 (en) * | 2005-02-11 | 2008-05-29 | International Business Machines Corporation | Ribonucleic acid interference molecules |
EP3293263A1 (en) * | 2016-09-07 | 2018-03-14 | Steinbeis Innovation gGmbH | Inducible gene expression by linear at-rich dna fragments in mammalian cells and methods relating thereto |
-
2019
- 2019-12-06 AU AU2019395023A patent/AU2019395023A1/en active Pending
- 2019-12-06 WO PCT/US2019/064910 patent/WO2020118169A1/en unknown
- 2019-12-06 CN CN201980091439.0A patent/CN113383081A/zh active Pending
- 2019-12-06 US US17/311,306 patent/US20220017916A1/en active Pending
- 2019-12-06 CA CA3161115A patent/CA3161115A1/en active Pending
- 2019-12-06 JP JP2021532047A patent/JP2022511077A/ja active Pending
- 2019-12-06 KR KR1020217021295A patent/KR20210113222A/ko unknown
- 2019-12-06 EP EP19892450.8A patent/EP3891288A4/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1863913A (zh) * | 2003-10-24 | 2006-11-15 | 思兰克斯有限公司 | 通过mar序列的多次转染过程在哺乳动物细胞中实现高效基因转移和表达 |
US20180187229A1 (en) * | 2003-10-24 | 2018-07-05 | Selexis S.A. | High efficiency gene transfer and expression in mammalian cells by a multiple transfection procedure of mar sequences |
WO2007107578A1 (en) * | 2006-03-20 | 2007-09-27 | Chromagenics B.V. | Expression augmenting dna fragments, use thereof, and methods for finding thereof |
CN101541959A (zh) * | 2006-08-23 | 2009-09-23 | 思兰克斯有限公司 | 用于增加转录的基质附着区(mar)及其应用 |
US20170114363A1 (en) * | 2015-10-27 | 2017-04-27 | Celltheon Corporation | Chimeric post-transcriptional regulatory element |
CN107868781A (zh) * | 2017-11-15 | 2018-04-03 | 新乡医学院 | 人工合成mar片段、表达载体、表达系统及其应用 |
Non-Patent Citations (2)
Title |
---|
CHUN-PENG ZHAO ET AL.: "Matrix attachment region combinations increase transgene expression in transfected Chinese hamster ovary cells", SCI REP, vol. 7, pages 1 - 7 * |
李琴 等: "不同启动子和MAR组合对重组CHO细胞转基因表达的影响", 四川大学学报(医学版), vol. 49, no. 1, pages 18 - 23 * |
Also Published As
Publication number | Publication date |
---|---|
EP3891288A1 (en) | 2021-10-13 |
US20220017916A1 (en) | 2022-01-20 |
CA3161115A1 (en) | 2020-06-11 |
JP2022511077A (ja) | 2022-01-28 |
AU2019395023A1 (en) | 2021-07-29 |
EP3891288A4 (en) | 2022-09-28 |
WO2020118169A1 (en) | 2020-06-11 |
KR20210113222A (ko) | 2021-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019250224B2 (en) | Enhanced transgene expression and processing | |
CA2658595C (en) | Regulatory nucleic acid elements | |
Willis | RNA polymerase III: genes, factors and transcriptional specificity | |
KR100880371B1 (ko) | Cns 장애의 치료를 위한 tgf-r 시그널화 억제제 | |
KR20090053893A (ko) | 전사를 증가시키기 위한 기질부착부위(mars) 및 그의 용도 | |
WO2015160893A1 (en) | Codon optimized nucleic acid encoding a retinitis pigmentosa gtpase regulator (rpgr) | |
AU2016203681B2 (en) | DNA element having the activity of enhancing foreign gene expression | |
EP3368672A2 (en) | Chimeric post-transcriptional regulatory element | |
KR102553990B1 (ko) | Hspa5 유전자의 프로모터 | |
AU2012344855B2 (en) | Promoter derived from human gene | |
CN113383081A (zh) | 基质附着区和促进基因表达的用途 | |
KR20210042084A (ko) | Hspa8 유전자의 프로모터 | |
CN116234904A (zh) | 用于治疗糖尿病的经修饰的胰岛素和葡萄糖激酶核酸 | |
KR20230009388A (ko) | 인간 게놈 유래 폴리뉴클레오타이드 및 이를 이용한 목적 폴리펩타이드의 생산 방법 | |
CN1287861C (zh) | 人源基因引导序列、基因载体及基因表达方法 | |
US20230287460A1 (en) | Mammalian cells comprising integrated cas9 genes to produce stable integration sites, and mammalian cells comprising stable integration sites and other sites | |
US20230193312A1 (en) | Eukaryotic cells comprising adenovirus-associated virus polynucleotides | |
US6492155B2 (en) | Isolated human kinase proteins, nucleic acid molecules encoding human kinase proteins, and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |