CN116529381A - 利用孤儿基序和CpG密度的组合来控制异源转基因的表达 - Google Patents
利用孤儿基序和CpG密度的组合来控制异源转基因的表达 Download PDFInfo
- Publication number
- CN116529381A CN116529381A CN202180080972.4A CN202180080972A CN116529381A CN 116529381 A CN116529381 A CN 116529381A CN 202180080972 A CN202180080972 A CN 202180080972A CN 116529381 A CN116529381 A CN 116529381A
- Authority
- CN
- China
- Prior art keywords
- seq
- sequence
- vector
- nucleic acid
- isolated nucleic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 title claims description 54
- 108700019146 Transgenes Proteins 0.000 title claims description 42
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 96
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 77
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 77
- 239000013598 vector Substances 0.000 claims description 81
- 108020004414 DNA Proteins 0.000 claims description 56
- 239000000203 mixture Substances 0.000 claims description 33
- 238000000034 method Methods 0.000 claims description 30
- 230000000694 effects Effects 0.000 claims description 26
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 25
- 239000013603 viral vector Substances 0.000 claims description 20
- 239000013612 plasmid Substances 0.000 claims description 18
- 102100021567 Protein BANP Human genes 0.000 claims description 17
- 101710149001 Protein BANP Proteins 0.000 claims description 10
- 239000012634 fragment Substances 0.000 claims description 10
- 108700008625 Reporter Genes Proteins 0.000 claims description 8
- 230000001177 retroviral effect Effects 0.000 claims description 8
- 230000001939 inductive effect Effects 0.000 claims description 6
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 claims description 3
- 238000012341 Quantitative reverse-transcriptase PCR Methods 0.000 claims description 3
- 238000003559 RNA-seq method Methods 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- 238000011331 genomic analysis Methods 0.000 claims description 3
- 210000004027 cell Anatomy 0.000 description 104
- 108090000623 proteins and genes Proteins 0.000 description 75
- 108090000765 processed proteins & peptides Proteins 0.000 description 44
- 102000004196 processed proteins & peptides Human genes 0.000 description 42
- 229920001184 polypeptide Polymers 0.000 description 41
- 102000004169 proteins and genes Human genes 0.000 description 31
- 241000700605 Viruses Species 0.000 description 29
- 235000018102 proteins Nutrition 0.000 description 26
- 230000001105 regulatory effect Effects 0.000 description 24
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 21
- 102000040430 polynucleotide Human genes 0.000 description 19
- 108091033319 polynucleotide Proteins 0.000 description 19
- 239000002157 polynucleotide Substances 0.000 description 19
- 239000013607 AAV vector Substances 0.000 description 18
- 241000282414 Homo sapiens Species 0.000 description 15
- 241001465754 Metazoa Species 0.000 description 15
- 230000002068 genetic effect Effects 0.000 description 13
- 230000003612 virological effect Effects 0.000 description 13
- 108091026890 Coding region Proteins 0.000 description 12
- 125000003275 alpha amino acid group Chemical group 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 238000000338 in vitro Methods 0.000 description 11
- 125000003729 nucleotide group Chemical group 0.000 description 11
- 241000702421 Dependoparvovirus Species 0.000 description 10
- 239000005090 green fluorescent protein Substances 0.000 description 10
- 239000002773 nucleotide Substances 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- 210000002845 virion Anatomy 0.000 description 10
- 108090000331 Firefly luciferases Proteins 0.000 description 9
- 235000001014 amino acid Nutrition 0.000 description 9
- 150000001413 amino acids Chemical class 0.000 description 9
- 210000000234 capsid Anatomy 0.000 description 9
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 9
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 210000002569 neuron Anatomy 0.000 description 9
- 230000010076 replication Effects 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 238000001415 gene therapy Methods 0.000 description 8
- 238000001727 in vivo Methods 0.000 description 8
- 230000008488 polyadenylation Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 101000971151 Homo sapiens Protein BANP Proteins 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 239000003153 chemical reaction reagent Substances 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 238000004806 packaging method and process Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 102000053602 DNA Human genes 0.000 description 6
- 241000242583 Scyphozoa Species 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 208000035475 disorder Diseases 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- 238000002360 preparation method Methods 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 241000701161 unidentified adenovirus Species 0.000 description 6
- 108700026244 Open Reading Frames Proteins 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 238000009472 formulation Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 230000001124 posttranscriptional effect Effects 0.000 description 5
- -1 silencers Substances 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 108091027967 Small hairpin RNA Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000005755 formation reaction Methods 0.000 description 4
- 210000004602 germ cell Anatomy 0.000 description 4
- 238000002873 global sequence alignment Methods 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 239000003981 vehicle Substances 0.000 description 4
- 241000972773 Aulopiformes Species 0.000 description 3
- 108091029430 CpG site Proteins 0.000 description 3
- 230000004543 DNA replication Effects 0.000 description 3
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 3
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- 241000713666 Lentivirus Species 0.000 description 3
- 239000005089 Luciferase Substances 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 108010052090 Renilla Luciferases Proteins 0.000 description 3
- 239000004480 active ingredient Substances 0.000 description 3
- 101150112779 banp gene Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 239000000839 emulsion Substances 0.000 description 3
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 238000013508 migration Methods 0.000 description 3
- 230000005012 migration Effects 0.000 description 3
- 230000001323 posttranslational effect Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 235000019515 salmon Nutrition 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 210000000225 synapse Anatomy 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000003146 transient transfection Methods 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- 108090000565 Capsid Proteins Proteins 0.000 description 2
- 102100023321 Ceruloplasmin Human genes 0.000 description 2
- 108091062157 Cis-regulatory element Proteins 0.000 description 2
- 108091029523 CpG island Proteins 0.000 description 2
- 101100058679 Dictyostelium discoideum btg gene Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 102000053171 Glial Fibrillary Acidic Human genes 0.000 description 2
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical class C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 108020005004 Guide RNA Proteins 0.000 description 2
- 101001040800 Homo sapiens Integral membrane protein GPR180 Proteins 0.000 description 2
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 102000011931 Nucleoproteins Human genes 0.000 description 2
- 108010061100 Nucleoproteins Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241000701945 Parvoviridae Species 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 2
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 2
- 241000701093 Suid alphaherpesvirus 1 Species 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 208000036142 Viral infection Diseases 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000002552 dosage form Substances 0.000 description 2
- 239000003937 drug carrier Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000011888 foil Substances 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 2
- 208000006454 hepatitis Diseases 0.000 description 2
- 231100000283 hepatitis Toxicity 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 231100000252 nontoxic Toxicity 0.000 description 2
- 230000003000 nontoxic effect Effects 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 230000001242 postsynaptic effect Effects 0.000 description 2
- 210000005215 presynaptic neuron Anatomy 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000010798 ubiquitination Methods 0.000 description 2
- 230000034512 ubiquitination Effects 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241000243290 Aequorea Species 0.000 description 1
- 241000426851 Aequorea aequorea Species 0.000 description 1
- 241000242764 Aequorea victoria Species 0.000 description 1
- 241001447918 Baoris Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 241000345998 Calamus manan Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102220566687 GDNF family receptor alpha-1_F64L_mutation Human genes 0.000 description 1
- 102220566469 GDNF family receptor alpha-1_S65T_mutation Human genes 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 101100246753 Halobacterium salinarum (strain ATCC 700922 / JCM 11081 / NRC-1) pyrF gene Proteins 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000958664 Homo sapiens Nucleus accumbens-associated protein 1 Proteins 0.000 description 1
- 101000958669 Homo sapiens Nucleus accumbens-associated protein 2 Proteins 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 241000243320 Hydrozoa Species 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 241000283923 Marmota monax Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 102100038141 Nucleus accumbens-associated protein 1 Human genes 0.000 description 1
- 102100038140 Nucleus accumbens-associated protein 2 Human genes 0.000 description 1
- 108091081548 Palindromic sequence Proteins 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 102100037632 Progranulin Human genes 0.000 description 1
- 101710114165 Progranulin Proteins 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- ODHCTXKNWHHXJC-GSVOUGTGSA-N Pyroglutamic acid Natural products OC(=O)[C@H]1CCC(=O)N1 ODHCTXKNWHHXJC-GSVOUGTGSA-N 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 241000711798 Rabies lyssavirus Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000242739 Renilla Species 0.000 description 1
- 241000242743 Renilla reniformis Species 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 241001068295 Replication defective viruses Species 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- AUNGANRZJHBGPY-SCRDCRAPSA-N Riboflavin Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O AUNGANRZJHBGPY-SCRDCRAPSA-N 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108010056079 Subtilisins Proteins 0.000 description 1
- 102000005158 Subtilisins Human genes 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- 101150050575 URA3 gene Proteins 0.000 description 1
- 108020004417 Untranslated RNA Proteins 0.000 description 1
- 102000039634 Untranslated RNA Human genes 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- ODHCTXKNWHHXJC-UHFFFAOYSA-N acide pyroglutamique Natural products OC(=O)C1CCC(=O)N1 ODHCTXKNWHHXJC-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003125 aqueous solvent Substances 0.000 description 1
- 239000008135 aqueous vehicle Substances 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 230000006287 biotinylation Effects 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 210000002459 blastocyst Anatomy 0.000 description 1
- 210000000625 blastula Anatomy 0.000 description 1
- 239000002981 blocking agent Substances 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000008366 buffered solution Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 208000015114 central nervous system disease Diseases 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 150000001945 cysteines Chemical class 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229960000633 dextran sulfate Drugs 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000010864 dual luciferase reporter gene assay Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 230000006251 gamma-carboxylation Effects 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 230000004077 genetic alteration Effects 0.000 description 1
- 231100000118 genetic alteration Toxicity 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 150000003278 haem Chemical group 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 239000012456 homogeneous solution Substances 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000037451 immune surveillance Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000007972 injectable composition Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002743 insertional mutagenesis Methods 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 230000026045 iodination Effects 0.000 description 1
- 238000006192 iodination reaction Methods 0.000 description 1
- 239000003456 ion exchange resin Substances 0.000 description 1
- 229920003303 ion-exchange polymer Polymers 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000006210 lotion Substances 0.000 description 1
- 238000003468 luciferase reporter gene assay Methods 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 210000000472 morula Anatomy 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 210000001087 myotubule Anatomy 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 239000002736 nonionic surfactant Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000006508 oncogene activation Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- 150000003905 phosphatidylinositols Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 210000004777 protein coat Anatomy 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000006340 racemization Effects 0.000 description 1
- 235000012950 rattan cane Nutrition 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 239000012453 solvate Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010036927 trypsin-like serine protease Proteins 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 238000001429 visible spectrum Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1138—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against receptors or cell surface proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
- C07K14/4703—Inhibitors; Suppressors
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70503—Immunoglobulin superfamily
- C07K14/7051—T-cell receptor (TcR)-CD3 complex
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明提供了分离的核酸,其包含超过220bp,选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列,和在所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的N个碱基对(bp)和/或之后的N个bp中的大于0.6的CpG观察值与估计值比率(O/E比率),其中该CpG O/E比率通过以下确定:对选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的至少一个或多个拷贝的序列周围的N个bp长序列中的CpG二核苷酸的数量进行计数,并通过将CpG二核苷酸的计数数量乘以N并将结果除以该N个bp中存在的C数量和G数量的乘积来计算该O/E比率(N*CpG/(C*G)),其中N在50和1000之间并且是紧接在所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前或紧跟其后的序列的长度,以bp计。
Description
技术领域
本发明涉及核酸序列,该核酸序列导致与其可操作地连接的异源转基因的受控表达。
背景技术
将遗传物质(例如,异源核酸)递送至靶细胞以增加所希望的基因产物表达的基因疗法方法支持治疗目的。病毒已经进化到能够高效地将核酸递送到特定的细胞类型,同时避免受感染宿主的免疫监视(Robbins等人,(1998)Pharmacol.Ther.[药物学与治疗学],80(1):35-47)。这些特性使病毒作为用于基因疗法的递送媒介物或载体具有吸引力。几种类型的病毒(包括逆转录病毒、腺病毒、腺相关病毒(AAV)和单纯疱疹病毒)已在实验室中进行了修饰以用于基因疗法应用(Lunstrom等人,(2018)Diseases[疾病],6(2):42)。特别地,衍生自腺相关病毒(AAV)的载体可以有效地递送遗传物质,因为(i)它们能够感染(转导)包括肌纤维和神经元在内的多种非分裂和分裂细胞类型;(ii)它们缺乏病毒结构基因,从而消除了天然宿主细胞对病毒感染的应答,例如干扰素介导的应答;(iii)野生型病毒从未与人类的任何病理相关;(iv)与能够整合到宿主细胞基因组中的野生型AAV相比,复制缺陷型AAV载体通常作为附加体持续存在,从而限制了插入诱变或癌基因激活的风险;并且(v)与其他载体系统相比,AAV载体不触发显著的免疫应答,从而允许例如一种或多种治疗性异源核酸的长期表达(Wold等人,(2013)Curr.Gene Ther.[当前基因疗法],13(6):421-33;Lee等人,(2017)Genes Dis.[基因与疾病],4(2):43–63)。
AAV为细小病毒科(parvoviridae)家族的成员。AAV基因组包含线性单链DNA分子,该线性单链DNA分子典型地含有约4.7千碱基(kb)和编码非结构性Rep(复制)及结构性Cap(衣壳)蛋白的两个主要开放阅读框。两个顺式作用反向末端重复(ITR)序列与AAV编码区侧接,这些反向末端重复序列的长度典型地为约145个核苷酸,并具有间杂的回文序列,这些回文序列可折叠成发夹结构,其在DNA复制的起始期间充当引物。除他们在DNA复制中的作用以外,已证实ITR序列有助于病毒整合、自宿主基因组的拯救及病毒核酸衣壳化成为成熟病毒粒子(Muzyczka等人,(1992)Curr.Top.Micro.Immunol.[微生物学和免疫学当前主题],158:97-129)。
虽然AAV因其转导多种细胞类型并将异源核酸递送至多种靶组织类型的能力而令人满意,但是将异源核酸递送至不需要异源核酸表达的组织以及在需要的地方高表达转基因仍然是一个挑战。仔细校准所需组织中的基因表达可以提供治疗益处。含有CAG启动子的AAV载体已用于许多基因疗法的临床试验,例如用于CNS疾病(Hoequemiller等人,(2016)Hum.Gene Ther.[人类基因疗法],27(7):478-96)。
仍然需要开发在特定组织中获得异源核酸高表达的方法。因此,需要改善治疗性蛋白(例如抗体或功能性结合片段、酶等)和核酸(例如用于CRISPR的shRNA、siRNA、gRNA等)的组织特异性表达。
更广泛地使用病毒载体进行基因递送的另一个障碍是载体的包装能力。例如,AAV载体基因组典型地限于单链(ssAAV)的约4.7kb和自互补(scAAV)载体的2.4kb,这限制了可以递送的遗传有效载荷的大小(Wu等人,(2010)Mol.Ther.[分子疗法],18(1):80-86)。由于遗传有效载载包括调节元件(例如启动子、终止信号等),这进一步限制了可被包装的异源核酸的大小。因此,需要提供长度缩短的调节元件,以允许插入编码更大蛋白质的异源核酸序列,例如,插入用于基因疗法的AAV衍生载体中。
发明内容
本发明人先前已经发现哺乳动物中迄今的孤儿调节基序当被蛋白质BANP结合时充当强转录激活剂,也是CpG岛启动子的激活剂。当超过一个拷贝的基序存在于异源转基因前面时,这种强激活效协同增强。
经过进一步研究,本发明人发现孤儿调节基序附近CpG位点的数量影响该基序的活性。可利用这种效应调节与所述基序可操作地连接的基因的表达。例如,一个表达载体可以包含多于一个异源转基因,每个都受其各自的BANP基序的控制,但这些基序中的每个周围都有不同的CpG密度。这将导致每个转基因的不同的、受控的表达,尽管它们在相同的载体上并且由相同的转录因子结合的相同基序控制。
本发明的另一个优点是,富含CpG的基序通常受细胞高度控制,并且如果构建体意外掺入宿主细胞的基因组,将导致转基因表达的关闭。
因此,本发明提供了分离的核酸分子,其包含超过220bp,选自SEQ ID NO:1、SEQID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列,和在所述选自SEQ ID NO:1、SEQ IDNO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的N个碱基对(bp)和/或之后的N个bp中的大于0.6的CpG观察值与估计值比率(O/E比率),其中该CpG O/E比率通过以下确定:对选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的至少一个或多个拷贝的序列周围的N个bp长序列中的CpG二核苷酸的数量进行计数,并通过将CpG二核苷酸的计数数量乘以N并将结果除以该N个bp中存在的C数量和G数量的乘积来计算该O/E比率(N*CpG/(C*G)),其中N在50和1000之间并且是紧接在所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前或紧跟其后的序列的长度,以bp计。为了清楚起见,声明技术人员熟知C代表胞嘧啶核苷酸,G代表鸟苷核苷酸并且CpG(或CG)代表5'—C—磷酸—G—3',即胞嘧啶和鸟嘌呤仅被一个磷酸基团隔开(磷酸将DNA中的任意两个核苷连接在一起)。
在一些实施例中,CpG存在于紧接选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的50-1000bp中,并且异源转基因直接或不直接位于所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之后。
在一些实施例中,CpG存在于紧接选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之后的50-1000bp中。
在一些实施例中,CpG存在于紧接选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的50-1000bp中且在该一个或多个拷贝的序列之后的50-1000bp中。
在一些实施例中,N为约50。在一些实施例中,N为约100。在一些实施例中,N为约150。在一些实施例中,N为约200。在一些实施例中,N为约250。在一些实施例中,N为约500。在一些实施例中,N为约800。在一些实施例中,N为约1000。
本发明的序列的核酸序列为:
SEQ ID NO:1BMYCGCGRBV
SEQ ID NO:2YMYCGCGRKV
SEQ ID NO:3TCTCGCGAGA
在一些实施例中,本发明的分离的核酸进一步包含编码蛋白质BANP或其活性片段或变体的另一个序列,该序列可操作地连接至组成型启动子或诱导型启动子。
在一些实施例中,本发明的分离的核酸的异源转基因是嵌合抗原受体。
本发明还提供了载体,该载体包含本发明的分离的核酸。在一些实施例中,该载体是质粒、DNA载体、RNA载体、病毒载体、腺病毒载体、腺相关病毒载体、慢病毒载体、逆转录病毒载体、γ逆转录病毒载体或HSV载体。在一些实施例中,本发明的分离的核酸小于8Kb。在一些实施例中,本发明的分离的核酸小于5Kb。
本发明还提供了试剂盒或组合物,该试剂盒或组合物包含本发明的分离的核酸和第二分离的核酸分子,该第二分离的核酸分子包含编码蛋白质BANP或其活性片段或变体的序列,该序列可操作地连接至组成型启动子或诱导型启动子。在这样的试剂盒中,本发明的分离的核酸可以在同一载体内或在不同载体内。
本发明还提供了本发明的分离的核酸、本发明的载体或本发明的试剂盒或本发明的组合物用于优选在细胞中瞬时体外、离体或体内表达异源转基因的用途。在一些实施例中,与在相同条件下与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的单拷贝可操作地连接时的异源转基因的表达相比,该用途使异源转基因的表达增加大于二的倍数。在一些实施例中,异源转基因的表达通过报道基因活性、报道基因荧光、定量逆转录酶PCR或基因组学方法例如RNA测序来测量。
本发明进一步提供了体外、离体或体内在细胞中产生异源转基因的方法,该方法为将本发明的任何分离的核酸或权利要求书中本发明的载体引入细胞,培养该细胞(或细胞群),并纯化重组表达的异源转基因。在一些实施例中,细胞是干细胞。
本发明还提供了分离的细胞,其包含本发明的分离的核酸。在该细胞或多个细胞中,包含选自SEQ ID NO:1、SEQ ID NO:2和/或SEQ ID NO:3的组的至少两个拷贝的序列的分离的核酸序列和异源转基因可以稳定地整合到所述细胞的基因组中。
附图说明
图1:可以通过调整人工Banp启动子的CpG密度来调整荧光素酶报道基因的活性
A)克隆在萤火虫荧光素酶报道基因上游的一个或多个Banp基序指示周围人工启动子序列中的CpG二核苷酸及其突变为ApG二核苷酸以降低O/E CpG密度。
B)在瞬时转染到mESC中后,具有降低的O/E CpG密度的人工Banp启动子相对于乱序基序对照对萤火虫荧光素酶活性的倍数诱导。在稳定的基因组整合后,可以将用灰色星号突出显示的启动子的活性与图2中同一启动子的活性进行比较。显示的是至少一个克隆的三个生物学重复的平均值,含标准偏差在内。数字0到100表示突变为ApG的CpG的百分比。
图2:在CpG密度降低50%的人工Banp启动子的稳定基因组整合后,荧光素酶报道基因活性受到抑制
A)具有三个包含不同CpG密度的完整或乱序基序的人工Banp启动子稳定地整合到mESC的β-珠蛋白基因座中。
B)稳定整合的启动子的萤火虫荧光素酶报道基因活性。在瞬时转染后,可以将用灰色星号突出显示的启动子的活性与图1中同一启动子的活性进行比较。数字0到100表示突变为ApG的CpG的百分比。绘制的是四个生物学重复的平均值。误差条表示标准偏差。
具体实施方式
本发明人先前已经发现哺乳动物中迄今的孤儿调节基序当被蛋白质BANP结合时充当强转录激活剂,也是CpG岛启动子的激活剂。当超过一个拷贝的基序存在于异源转基因前面时,这种强激活效协同增强。
经过进一步研究,本发明人发现孤儿调节基序附近CpG位点的数量影响该基序的活性。可利用这种效应调节与所述基序可操作地连接的基因的表达。例如,一个表达载体可以包含多于一个异源转基因,每个都受其各自的BANP基序的控制,但这些基序中的每个周围都有不同的CpG密度。这将导致每个转基因的不同的、受控的表达,尽管它们在相同的载体上并且由相同的转录因子结合的相同基序控制。
本发明的另一个优点是,富含CpG的基序通常受细胞高度控制,并且如果构建体意外掺入宿主细胞的基因组,将导致转基因表达的关闭。
因此,本发明提供了分离的核酸分子,其包含超过220bp,选自SEQ ID NO:1、SEQID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列,和在所述选自SEQ ID NO:1、SEQ IDNO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的N个碱基对(bp)和/或之后的N个bp中的大于0.6的CpG观察值与估计值比率(O/E比率),其中该CpG O/E比率通过以下确定:对选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的至少一个或多个拷贝的序列周围的N个bp长序列中的CpG二核苷酸的数量进行计数,并通过将CpG二核苷酸的计数数量乘以N并将结果除以该N个bp中存在的C数量和G数量的乘积来计算该O/E比率(N*CpG/(C*G)),其中N在50和1000之间并且是紧接在所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前或紧跟其后的序列的长度,以bp计。为了清楚起见,声明技术人员熟知C代表胞嘧啶核苷酸,G代表鸟苷核苷酸并且CpG(或CG)代表5'—C—磷酸—G—3',即胞嘧啶和鸟嘌呤仅被一个磷酸基团隔开(磷酸将DNA中的任意两个核苷连接在一起)。
在一些实施例中,CpG存在于紧接选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的50-1000bp中,并且异源转基因直接或不直接位于所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之后。
在一些实施例中,CpG存在于紧接选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之后的50-1000bp中。
在一些实施例中,CpG存在于紧接选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的50-1000bp中且在该一个或多个拷贝的序列之后的50-1000bp中。
在一些实施例中,N为约50。在一些实施例中,N为约100。在一些实施例中,N为约150。在一些实施例中,N为约200。在一些实施例中,N为约250。在一些实施例中,N为约500。在一些实施例中,N为约800。在一些实施例中,N为约1000。
本发明的序列的核酸序列为:
SEQ ID NO:1BMYCGCGRBV
SEQ ID NO:2YMYCGCGRKV
SEQ ID NO:3TCTCGCGAGA
在一些实施例中,本发明的分离的核酸进一步包含编码蛋白质BANP或其活性片段或变体的另一个序列,该序列可操作地连接至组成型启动子或诱导型启动子。
在一些实施例中,本发明的分离的核酸的异源转基因是嵌合抗原受体。
本发明还提供了载体,该载体包含本发明的分离的核酸。在一些实施例中,该载体是质粒、DNA载体、RNA载体、病毒载体、腺病毒载体、腺相关病毒载体、慢病毒载体、逆转录病毒载体、γ逆转录病毒载体或HSV载体。在一些实施例中,本发明的分离的核酸小于8Kb。在一些实施例中,本发明的分离的核酸小于5Kb。
本发明还提供了试剂盒或组合物,该试剂盒或组合物包含本发明的分离的核酸和第二分离的核酸分子,该第二分离的核酸分子包含编码蛋白质BANP或其活性片段或变体的序列,该序列可操作地连接至组成型启动子或诱导型启动子。在这样的试剂盒中,本发明的分离的核酸可以在同一载体内或在不同载体内。
本发明还提供了本发明的分离的核酸、本发明的载体或本发明的试剂盒或本发明的组合物用于优选在细胞中瞬时体外、离体或体内表达异源转基因的用途。在一些实施例中,与在相同条件下与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的单拷贝可操作地连接时的异源转基因的表达相比,该用途使异源转基因的表达增加大于二的倍数。在一些实施例中,异源转基因的表达通过报道基因活性、报道基因荧光、定量逆转录酶PCR或基因组学方法例如RNA测序来测量。
本发明进一步提供了体外、离体或体内在细胞中产生异源转基因的方法,该方法为将本发明的任何分离的核酸或权利要求书中本发明的载体引入细胞,培养该细胞(或细胞群),并纯化重组表达的异源转基因。在一些实施例中,细胞是干细胞。
本发明还提供了分离的细胞,其包含本发明的分离的核酸。在该细胞或多个细胞中,包含选自SEQ ID NO:1、SEQ ID NO:2和/或SEQ ID NO:3的组的至少两个拷贝的序列的分离的核酸序列和异源转基因可以稳定地整合到所述细胞的基因组中。
如本文所用,术语“启动子”是指任何顺式调控元件,包括增强子、沉默子、绝缘子和启动子。启动子是DNA的通常位于需要转录的基因上游(朝向5'区域)的区域。启动子容许正确激活或抑制其控制的基因。在本发明的上下文中,启动子导致与它们可操作地连接的基因在表达胶质原纤维酸性蛋白的细胞中的特异性表达。外源基因的“特异性表达”,也称为“仅在某种类型的细胞中表达”意指至少超过75%,优选地超过85%、超过90%或超过95%的表达目的外源基因的细胞具有指定的类型,即在本案中为表达胶质原纤维酸性蛋白的细胞。
典型地将表达盒引入载体中,该载体有助于表达盒进入宿主细胞并在宿主细胞中维持表达盒。此类载体是常用的并且是本领域技术人员熟知的。许多此类载体可例如从英杰公司(Invitrogen)、斯特吉公司(Stratagene)、宝日医公司(Clontech)等商购获得,并且在许多指南中有描述,例如Ausubel、Guthrie、Strathem或Berger,全部同上。此类载体典型地包括启动子、多腺苷酸化信号等,连同多个克隆位点,以及其他元件,例如复制起点、选择性标记基因(例如LEU2、URA3、TRP 1、HIS3、GFP)、着丝粒序列等。为了清楚起见,对于技术人员而言显而易见的是,本发明还包括具有与权利要求中定义的序列互补的序列的分离的核酸。
适于本发明的病毒载体是本领域熟知的。例如,AAV、PRV或慢病毒适于将基因靶向并递送至细胞。
如本文所用,术语“动物”在本文中用于包括所有动物。在本发明的一些实施例中,非人动物为脊椎动物。动物的实例为人、小鼠、大鼠、牛、猪、马、鸡、鸭、鹅、猫、狗等。术语“动物”还包括处于所有发育期(包括胚胎和胎儿期)的个体动物。“经遗传修饰的动物”是含有一种或多种下述细胞的任何动物,这些细胞带有通过在亚细胞水平上的有意遗传操作,例如通过靶向重组、显微注射或重组病毒感染而直接或间接改变或接收的遗传信息。术语“经遗传修饰的动物”无意涵盖经典杂交或体外受精,而是意在涵盖其中一种或多种细胞被重组DNA分子改变或接收该重组DNA分子的动物。该重组DNA分子可以特异性地靶向限定的遗传基因座,可以随机整合到染色体内,或者可以是染色体外复制DNA。术语“种系经遗传修饰的动物”是指其中将遗传改变或遗传信息引入种系细胞中,从而赋予将遗传信息传递给其后代的能力的经遗传修饰的动物。如果这样的后代实际上具有该改变或遗传信息中的一些或全部,则它们也是经遗传修饰的动物。
该改变或遗传信息对于受者所属的动物物种可能是外来的,或者仅对于特定的个体受者是外来的,或者可以是受者已经具有的遗传信息。在最后一种情况下,该改变或引入的基因可以与天然基因不同地表达,或者根本不表达。
用于改变靶基因的基因可以通过多种技术获得,这些技术包括但不限于从基因组来源分离、由分离的mRNA模板制备cDNA、直接合成或其组合。
用于引入转基因的一类靶细胞是ES细胞。ES细胞可以从体外培养的植入前胚胎获得并与胚胎融合(Evans等人(1981),Nature[自然]292:154-156;Bradley等人(1984),Nature[自然]309:255-258;Gossler等人(1986),Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]83:9065-9069;Robertson等人(1986),Nature[自然]322:445-448;Wood等人(1993),Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]90:4582-4584)。可以通过标准技术例如使用电穿孔进行DNA转染或通过逆转录病毒介导的转导,将转基因有效地引入ES细胞中。之后可以通过聚集将得到的转化ES细胞与桑椹胚组合或注射到来自非人动物的囊胚中。之后所引入的ES细胞定殖于胚胎并产生所得嵌合动物的种系(Jaenisch(1988),Science[科学]240:1468-1474)。基因靶向的ES细胞在产生基因靶向遗传修饰小鼠中的用途在1987年进行了描述(Thomas等人(1987),Cell[细胞]51:503-512)并且在其他地方进行了综述(Frohman等人(1989),Cell[细胞]56:145-147;Capecchi(1989),Trends in Genet.[遗传学趋势]5:70-76;Baribault等人(1989),Mol.Biol.Med.[分子生物学与医学]6:481-492;Wagner(1990),EMBO J.[欧洲分子生物学学会杂志]9:3025-3032;Bradley等人(1992),Bio/Technology[生物技术]10:534-539)。
有技术可用于通过使用靶向同源重组将特定变化插入染色体等位基因中,而使任何遗传区失活或改变成任何所需的突变。
如本文所用,“靶向基因”是通过人为干预(包括但不限于本文所述的方法)引入非人动物种系中的DNA序列。本发明的靶向基因包括被设计成特异性改变同源内源性等位基因的DNA序列。
在本发明中,“分离的”是指从其原始环境(例如,如果它是天然存在的,则为天然环境)中移出的材料,并因此“通过人工”从其天然状态改变。例如,分离的多核苷酸可以是载体或物质组合物的一部分,或者可以包含在细胞内,并且仍然是“分离的”,因为该载体、物质组合物或特定细胞不是多核苷酸的原始环境。术语“分离的”不是指基因组或cDNA文库、全细胞总体或mRNA制剂、基因组DNA制剂(包括通过电泳分离并转移到印迹上的那些)、剪切的全细胞基因组DNA制剂或其中本领域并未显示出本发明的多核苷酸/序列的区别性特征的其他组合物。分离的DNA分子的进一步实例包括保持在异源宿主细胞中的重组DNA分子或溶液中的纯化(部分或基本上)DNA分子。分离的RNA分子包括本发明的DNA分子的体内或体外RNA转录物。然而,出于本发明的目的,作为某文库(例如,基因组或cDNA文库)的成员但尚未与该文库的其他成员分离(例如,呈含有克隆和该文库的其他成员的均一溶液的形式)的克隆中所含的核酸,或从细胞或细胞裂解液中移出的染色体(例如,“染色体分散”,如在核型中),或随机剪切的基因组DNA的制剂,或经一种或多种限制酶切割的基因组DNA的制剂不是“分离的”。如本文进一步讨论的,根据本发明的分离的核酸分子可以是以天然、重组或合成方式产生的。
“多核苷酸”可以由单链和双链DNA、作为单链和双链区混合物的DNA、单链和双链RNA、以及作为单链和双链区混合物的RNA、包含可为单链或更典型地为双链的或为单链和双链区混合物的DNA和RNA的杂交分子组成。另外,多核苷酸可由包含RNA或DNA或者RNA和DNA两者的三链区组成。多核苷酸还可以含有一个或多个经修饰的碱基或出于稳定性或其他原因而修饰的DNA或RNA主链。“经修饰的”碱基包括例如三苯甲基化碱基和稀有碱基,如肌苷。可以对DNA和RNA进行多种修饰;因此,“多核苷酸”包括以化学、酶促或代谢方式修饰的形式。
表述“编码多肽的多核苷酸”涵盖仅包括该多肽的编码序列的多核苷酸以及包括另外的编码序列和/或非编码序列的多核苷酸。
“严格杂交条件”是指在42℃下在包含50%甲酰胺、5x SSC(750mM NaCl、75mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5x邓哈特氏溶液(Denhardt's solution)、10%硫酸葡聚糖和20μg/ml变性的剪切鲑精DNA的溶液中过夜孵育,然后在约50℃下在0.1x SSC中洗涤过滤器。杂交和信号检测严格性的改变主要通过控制甲酰胺浓度(较低的甲酰胺百分比导致严格性降低);盐条件或温度实现。例如,中等高严格性条件包括于37℃下在包含6X SSPE(20XSSPE=3M NaCl;0.2MNaH2PO4;0.02M EDTA,pH 7.4)、0.5% SDS、30%甲酰胺、100μg/ml阻断DNA的鲑精的溶液中过夜孵育;之后用1XSSPE,0.1% SDS于50℃下洗涤。另外,为了达到甚至更低的严格性,严格杂交后进行的洗涤可以在更高的盐浓度(例如5X SSC)下进行。上述条件的变化可以通过包含和/或替换用于抑制杂交实验中的背景的替代性阻断试剂来实现。典型的阻断试剂包括邓哈特氏试剂(Denhardt's reagent)、BLOTTO、肝素、变性鲑精DNA和可商购获得专利配制品。由于相容性问题,包含特定的阻断试剂可能需要修改上述杂交条件。
当涉及多肽时,术语“片段”、“衍生物”和“类似物”意指保留与此类多肽基本上相同的生物学功能或活性的多肽。类似物包括前蛋白(pro-protein),它可以通过裂解前蛋白部分而激活以产生活性成熟多肽。
术语“基因”意指参与产生多肽链的DNA区段;它包括编码区之前和之后的区域“前导区和尾区”以及各个编码区段(外显子)之间的间插序列(内含子)。
多肽可以由通过肽键或修饰的肽键彼此连接的氨基酸组成,即肽等排体,并且可以含有除20种基因编码的氨基酸之外的氨基酸。多肽可以通过天然过程(如翻译后加工)或通过本领域熟知的化学修饰技术进行修饰。此类修饰在基础教科书和更详细的专著以及大量研究文献中有充分描述。修饰可以发生在多肽中的任何地方,包括肽主链、氨基酸侧链和氨基末端或羧基末端。应当认识到,相同类型的修饰可以在给定多肽中的几个位点以相同或不同的程度存在。而且,给定多肽可以含有许多类型的修饰。例如,多肽可以例如由于泛素化而分支,并且它们可以是环状的,有或没有分支。环状、分支和分支环状多肽可以由翻译后的天然过程产生,或者可以通过合成方法制备。修饰包括但不限于乙酰化、酰化、生物素化、ADP-核糖基化、酰胺化、黄素的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇的共价连接、交联、环化、通过已知的保护/阻断基团衍生化、二硫键形成、去甲基化、共价交联的形成、半胱氨酸的形成、焦谷氨酸的形成、甲酰化、γ-羧化、糖基化、GPI锚形成、羟基化、碘化、与抗体分子或其他分子配体连接、甲基化、豆蔻酰化、氧化、聚乙二醇化、蛋白水解加工(例如,裂解)、磷酸化、异戊烯化、外消旋化、硒化、硫酸化、转运RNA介导的向蛋白质添加氨基酸(如精氨酸化)和泛素化。(参见,例如,PROTEINS-STRUCTURE AND MOLECULAR PROPERTIES[蛋白质-结构和分子特性],第2版,T.E.Creighton,W.H.Freeman and Company,New York[纽约W.H.弗里曼公司](1993);POSTTRANSLATIONAL COVALENT MODIFICATION OF PROTEINS[蛋白质翻译后共价修饰],B.C.Johnson编,Academic Press[学术出版社],纽约,第I-12页(1983);Seifter等人,Meth Enzymol[酶学方法]182:626-646(1990);Rattan等人,Ann NY Acad Sci[纽约科学院年鉴]663:48-62(1992))。
“具有生物活性”的多肽片段是指表现出与原始多肽(包括成熟形式)的活性相似但不一定相同的活性的多肽,如在特定生物学测定法中所测量的,具有或不具有剂量依赖性。在确实存在剂量依赖性的情况下,它不需要与该多肽的剂量依赖性相同,而是与原始多肽相比与给定活性中的剂量依赖性基本上相似(即,相对于原始多肽,候选多肽将表现出更强的活性或低不超过约25倍且在一些实施例中,低不超过约十倍的活性,或低不超过约三倍的活性。)
可以通过以下方式分离和鉴定物种同源物:由本文提供的序列制备合适的探针或引物,以及针对所需同源物对合适的核酸来源进行筛选。
“变体”是指与原始多核苷酸或多肽不同但保留其基本特性的多核苷酸或多肽。通常,变体与原始多核苷酸或多肽总体上非常相似,并且在许多区域中,与原始多核苷酸或多肽相同。
实际上,可以使用已知的计算机程序以常规方式测定任何特定核酸分子或多肽是否与本发明的核苷酸序列具有至少80%、85%、90%、92%、95%、96%、97%、98%、99%或100%同一性。用于测定查询序列(本发明的序列)与目标序列之间的最佳总体匹配的优选方法,也称为全局序列比对,可以使用基于Brutlag等人(Comp.App.Blosci.[计算机生物科学应用](1990)6:237-245)的算法的FASTDB计算机程序来确定。在序列比对中,查询序列和目标序列都是DNA序列。可以通过将U转换为T来比较RNA序列。所述全局序列比对的结果是百分比同一性。用于DNA序列的FASTDB比对以计算百分比同一性的优选参数是:矩阵(Matrix)=酉(Unitary),k-元组(k-tuple)=4,错配罚分(Mismatch Penalty)--1,连接罚分(Joining Penalty)--30,随机分组长度(Randomization Group Length)=0,截止得分(Cutoff Score)=l,空位罚分(Gap Penalty)--5,空位大小罚分(Gap Size Penalty)0.05,窗口大小(Window Size)=500或目标核苷酸序列的长度(以较短者为准)。如果目标序列由于5'或3'缺失,而不是因为内部缺失而比查询序列短,则必须对结果进行人工校正。这是因为FASTDB程序在计算百分比同一性时不考虑目标序列的5'和3'截短。对于相对于查询序列在5'或3'末端截短的目标序列,通过计算查询序列中在目标序列5'和3'而未匹配/对齐的碱基数占查询序列总碱基数的百分比来校正百分比同一性。通过FASTDB序列比对的结果确定核苷酸是否匹配/对齐。然后从上述FASTDB程序使用指定参数计算的百分比同一性中减去该百分比,以得出最终的百分比同一性得分。该校正后的得分是用于本发明目的的得分。为了人工调整百分比同一性得分,仅计算目标序列5'和3'碱基外(如通过FASTDB比对展示的)未与查询序列匹配/对齐的碱基。例如,将90个碱基的目标序列与100个碱基的查询序列比对以确定百分比同一性。缺失发生在目标序列的5'末端,因此,FASTDB比对未显示5'末端前10个碱基的匹配/对齐。这10个受损碱基占序列的10%(5'和3'末端未匹配的碱基数/查询序列中的碱基总数),所以从通过FASTDB程序计算的百分比同一性得分中减去10%。如果剩余的90个碱基完全匹配,则最终的百分比同一性为90%。在另一个实例中,将90个碱基的目标序列与100个碱基的查询序列进行比较。这次缺失是内部缺失,所以在目标序列的5'或3'上没有与查询序列不匹配/对齐的碱基。在这种情况下,通过FASTDB计算的百分比同一性不进行人工校正。再次,仅人工校正目标序列5'和3'处与查询序列不匹配/对齐的碱基。
所谓具有与本发明的查询氨基酸序列具有至少(例如)95%“同一性”的氨基酸序列的多肽,旨在表示除了以下方面外,目标多肽的氨基酸序列与查询序列相同:目标多肽序列可以在查询氨基酸序列的每100个氨基酸中包括最多五个氨基酸改变。换言之,为了获得具有与查询氨基酸序列具有至少95%同一性的氨基酸序列的多肽,目标序列中最多5%的氨基酸残基可以插入、缺失或用另一种氨基酸取代。参考序列的这些改变可以发生在参考氨基酸序列的氨基或羧基末端位置或那些末端位置之间的任何位置,单独散布在参考序列中的残基之间或参考序列内的一个或多个连续组中。
实际上,可以使用已知的计算机程序以常规方式测定任何特定多肽是否与例如序列中所示的氨基酸序列或与保藏DNA克隆所编码的氨基酸序列具有至少80%、85%、90%、92%、95%、96%、97%、98%、99%或100%同一性。用于测定查询序列(本发明的序列)与目标序列之间的最佳总体匹配的优选方法,也称为全局序列比对,可以使用基于Brutlag等人(Comp.App.Biosci.[计算机生物科学应用](1990)6:237-245)的算法的FASTDB计算机程序来确定。在序列比对中,查询序列和目标序列均为核苷酸序列或均为氨基酸序列。所述全局序列比对的结果是百分比同一性。用于FASTDB氨基酸比对的优选参数是:矩阵=PAM 0,k-元组=2,错配罚分--I,连接罚分=20,随机分组长度=0,截止得分=I,窗口大小=序列长度,空位罚分--5,空位大小罚分--0.05,窗口大小=500或目标氨基酸序列的长度(以较短者为准)。如果目标序列由于N-或C-端缺失,而不是因为内部缺失而比查询序列短,则必须对结果进行人工校正。这是因为FASTDB程序在计算全局百分比同一性时不考虑目标序列的N-和C-端截短。对于相对于查询序列在N-和C-端截短的目标序列,通过计算查询序列中在目标序列N-和C-端而未与相应目标残基匹配/对齐的残基数占查询序列总碱基数的百分比来校正百分比同一性。通过FASTDB序列比对的结果确定残基是否匹配/对齐。然后从上述FASTDB程序使用指定参数计算的百分比同一性中减去该百分比,以得出最终的百分比同一性得分。该最终百分比同一性得分是用于本发明目的的得分。为了人工调整百分比同一性得分,仅考虑目标序列N-和C-端未与查询序列匹配/对齐的碱基。也就是说,仅查询位于目标序列的最远N-和C-端残基外的残基位置。仅人工校正目标序列N-端和C-端外(如FASTDB比对中所展示的)与查询序列不匹配/对齐的残基位置。出于本发明的目的,不需要进行其他人工校正。
天然存在的蛋白质变体称为“等位基因变体”,并且是指占据生物体染色体上的给定基因座的基因的几种替代性形式之一。(Genes[基因]11,Lewin,B.编,John Wiley&Sons,New York[纽约约翰威利国际出版公司](1985))。这些等位基因变体可以在多核苷酸和/或多肽水平上变化。替代性地,非天然存在的变体可以通过诱变技术或通过直接合成而产生。
如本文所用,包含“异源核酸序列”或“异源转基因”的分离的核酸是指包含在天然背景下发现通常不与分离的核酸的其余部分可操作地连接的部分(即,异源核酸部分)的分离的核酸。例如,异源核酸可以包含最初未在天然衍生出分离的核酸的其他组分(例如,启动子)的细胞、细菌细胞、病毒、或生物体中发现的核酸序列,或其中未发现分离的核酸的其他组分(例如,启动子)与细胞、细菌细胞、病毒、或生物体中的异源核酸天然地可操作地连接的核酸序列。在一些实施例中,异源核酸序列编码人蛋白。在一些实施例中,异源核酸序列编码RNA序列,例如shRNA。
“编码”特定RNA的DNA序列或DNA多核苷酸序列是能够转录为RNA的DNA的序列。DNA多核苷酸可以编码翻译成蛋白质的RNA(mRNA),或者DNA多核苷酸可以编码不翻译成蛋白质的RNA(例如,tRNA、rRNA、或指导RNA;也称为“非编码”RNA或“ncRNA”)。DNA序列或DNA多核苷酸序列也可以“编码”特定的多肽或蛋白序列,其中,例如,DNA直接编码可翻译成多肽或蛋白序列的mRNA。“蛋白质编码序列”或编码特定蛋白质或多肽的序列是当置于适当的调节序列的控制下时能够在体外或体内转录为mRNA(在DNA的情况下)和翻译(在mRNA的情况下)成多肽的核酸序列。编码序列的边界可以由5’端(N-端)处的起始密码子和3’端(C-端)处的翻译终止无义密码子确定。编码序列可以包括但不限于来自原核或真核生物mRNA的cDNA、来自原核或真核生物DNA的基因组DNA序列、以及合成核酸。转录终止序列将通常位于编码序列的3’。
在本文中可互换使用的术语“DNA调节序列”、“控制元件”和“调节元件”是指提供和/或调节非编码序列(例如,短发夹RNA)或编码序列(例如,PGRN)的转录和/或调节编码多肽的翻译的转录和翻译控制序列,如启动子、增强子、多腺苷酸化信号、终止子、蛋白降解信号等。
术语“多腺苷酸化(polyA)信号序列”和“多腺苷酸化序列”是指为转录终止和向RNA转录物的3’末端添加腺苷均聚链提供信号的调节元件。多腺苷酸化信号可以包含终止信号(例如,AAUAAA序列或其他非经典序列)和任选地侧接的辅助元件(例如,富含GU的元件)和/或与有效切割和多腺苷酸化相关的其他元件。多腺苷酸化序列可以包含一系列通过多腺苷酸化附接到mRNA的3’末端的腺苷。特定的polyA信号序列可以包括表1的poly(A)信号(SEQ ID NO:5)。在一些实施例中,DNA调节序列或控制元件是组织特异性调节序列。
术语“转录后调节元件”(“PRE”)是指当转录为mRNA时,在mRNA转录水平调节基因表达的一个或多个调节元件。此类转录后调节元件的实例可以包括编码微小RNA结合位点、RNA结合蛋白结合位点等的序列。可与本文披露的病毒载体一起使用的转录后调节元件的实例包括土拨鼠肝炎转录后调节元件(WPRE)、肝炎转录后调节元件(HPRE)。
术语“内含子”是指一个或多个核酸序列,例如在开放阅读框中的那些,该一个或多个核酸序列不编码从核酸表达的蛋白质的一个或多个氨基酸。内含子序列可以从DNA转录为RNA,但可以例如通过剪接在蛋白质表达之前被去除。在一些实施例中,将内含子序列添加到异源核酸序列以增加基因表达的总体效率和输出。可与本文披露的病毒载体一起使用的内含子的实例包括SV40内含子、β珠蛋白内含子、鸡β-肌动蛋白内含子等。
如本文所用,“体外”进行的过程是指在正常生物环境之外进行的过程,例如在试管、烧瓶、培养皿、人工培养基中进行的研究。“体内”进行的过程是指在活生物体或细胞内进行的过程,例如,在细胞培养物或小鼠中进行的研究。“离体”进行的过程是指在外部环境(例如,具有对自然条件的最小改变)中在来自生物体的组织中或对来自生物体的组织进行的过程,例如,允许在比体内实验更受控的条件下操作生物体的细胞或组织。
如本文所用,如应用于例如核酸、多肽、细胞、或生物体的术语“天然存在”或“未修饰”,是自然界中发现的核酸、多肽、细胞、或生物体。例如,存在于生物体(如病毒)中的多肽或多核苷酸序列是天然存在的,无论是存在于该生物体中还是从该生物体的一种或多种组分中分离的。
在一些实施例中,“载体”是任何遗传元件(例如,DNA、RNA、或其混合物),该遗传元件含有能够在宿主细胞中表达的目的核酸,例如,在适用于递送至细胞、组织和/或生物体的较大核酸序列或结构中的目的核酸,如质粒、噬菌体、转座子、粘粒、染色体、病毒、病毒粒子等。例如,载体可以包含插入物(例如,编码待表达的基因或该基因的开放阅读框的异源核酸)以及一个或多个另外的元件,例如适用于递送或控制该插入物的表达的元件。例如当与适当的控制元件相关时,载体可以能够复制和/或表达,并且其可以能够在细胞之间转移遗传信息。在一些实施例中,载体可以是适用于在宿主细胞中表达的载体,例如AAV载体。在一些实施例中,载体可以是适用于例如在细胞或生物反应器中表达和/或复制的质粒。在一些实施例中,特别地设计用于在靶细胞中表达异源核酸序列(例如,编码目的蛋白、shRNA等的异源核酸)的载体可以称为表达载体,并且通常具有驱动该异源核酸序列表达的启动子序列。在其他实施例中,载体(例如,转录载体)可以能够被转录但不能被翻译:他们可以在靶细胞中复制但不能表达。转录载体可以用于扩增他们的插入物。
术语“表达载体”是指包含多核苷酸的载体,该多核苷酸包含与待表达的核苷酸序列可操作地连接的表达控制序列。单独或与宿主细胞提供的或在体外表达系统中的其他用于表达的元件组合,表达载体可以包含足够的用于表达的顺式作用元件。表达载体包括例如掺入重组多核苷酸的粘粒、质粒(例如,裸露的或包含在脂质体中)和病毒(例如,慢病毒、逆转录病毒、腺病毒和腺相关病毒)。
术语“质粒”是指包含完整“复制子”的非染色体(并且典型地为双链)DNA序列,使得质粒在宿主细胞中复制。质粒可以是环状核酸。当将质粒放置在单细胞生物体内时,该质粒的DNA导致该生物体的特征发生改变或转化。例如,携带四环素抗性(TcR)基因的质粒将先前对四环素敏感的细胞转化为对其具有抗性的细胞。
如本文所用,术语“重组病毒”旨在意指包含基因或其他异源核酸的非野生型和/或人工产生的重组病毒(例如,细小病毒、腺病毒、慢病毒或腺相关病毒等)。重组病毒可以包含包装在病毒(例如:AAV)衣壳内的重组病毒基因组(例如,包含编码目的基因的核酸)。重组病毒的特定类型可以是“重组腺相关病毒”或“rAAV”。包装在病毒衣壳中的重组病毒基因组可以是病毒载体。在一些实施例中,本文披露的重组病毒包含病毒载体。病毒载体的实例包括但不限于腺相关病毒(AAV)载体、嵌合AAV载体、腺病毒载体、逆转录病毒载体、慢病毒载体、DNA病毒载体、单纯疱疹病毒载体、杆状病毒载体、或其任何突变体或衍生物。
在另一实施例中,术语“转染”用以指细胞对外来DNA的摄取,使得一旦已将外源DNA引入细胞膜内侧,这些细胞就已被“转染”了。参见例如,Graham等人,(1973)Virology[病毒学],52:456;Sambrook等人,(1989)Molecular Cloning,a laboratory manual[分子克隆:实验室手册],Cold Spring Harbor Laboratories[冷泉港实验室],纽约;Davis等人,(1986)Basic Methods in Molecular Biology[分子生物学基本方法],Elsevier[爱思唯尔];Chu等人,(1981)Gene[基因],13:197。此类技术可用于将一个或多个外源DNA部分引入适合的宿主细胞中。在一些实施例中,术语“转导”用以指细胞对外来DNA的摄取,其中该外来DNA由病毒或病毒载体提供。因此,当已将外源DNA引入细胞膜内侧时,细胞就已被“转导”。在一些实施例中,术语“转化”用以指细菌细胞对外来DNA的摄取。
如本文所用,术语“细胞系”是指能够在体外继续或延长生长和分裂的细胞群。在某些情况下,在储存或转移此类克隆群期间,核型可能发生自发或诱导的变化。因此,衍生自所指细胞系的细胞可能与祖先细胞或培养物不完全相同,并且所指细胞系包括此类变体。
术语“可操作地连接”是指两个或更多个多核苷酸(例如,DNA)区段之间的功能性关系。典型地,该术语是指转录调节序列与待转录序列的功能性关系。例如,如果启动子或增强子序列例如在适当的宿主细胞或其他表达系统中刺激或调节编码序列的转录,则启动子或增强子序列与编码序列可操作地连接。通常,与序列可操作地连接的启动子转录调节序列与该序列邻接或由短间隔子序列分开,即他们是顺式作用的。然而,一些转录调节序列例如增强子不需要在物理上邻接或位于极为接近这些转录调节序列增强其转录的编码序列的位置。
如本文所用,术语“AAV载体”是指衍生自或包含腺相关病毒血清型的一个或多个核酸序列的载体,包括但不限于AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8或AAV-9病毒载体。AAV载体可具有一个或多个AAV野生型基因的整体或部分缺失,例如rep和/或cap基因,同时保留例如功能性侧接反向末端重复(“ITR”)序列。在一些实施例中,AAV载体可以包装在例如包含一个或多个AAV衣壳蛋白的蛋白壳或衣壳中,该外壳或衣壳可提供用于将载体核酸递送至靶细胞的细胞核的媒介物。在一些实施例中,AAV载体包含一个或多个AAV ITR序列(例如,AAV2 ITR序列)。在一些实施例中,AAV载体包含一个或多个AAV ITR序列(例如,AAV2 ITR序列),但不含有任何另外的病毒核酸序列。这些载体构建体的实施例提供于例如WO/2019/094253(PCT/US2018/058744)中,将其通过引用以其全文并入本文。
在一些实施例中,“scAAV”是自互补的腺相关病毒(scAAV)。scAAV被称为“自互补”,因为scAAV的载体的至少一部分(例如,编码区的至少一部分)形成分子内双链DNA。在一些实施例中,rAAV是scAAV。在一些实施例中,病毒载体从天然存在的腺相关病毒(AAV)工程化以提供用于基因疗法的scAAV。这些载体构建体的实施例以及其制备和纯化方法提供于例如WO/2019/094253(PCT/US2018/058744)中,将其通过引用以其全文并入本文。
如本文所用,“病毒”或“病毒粒子”指示包含病毒载体(例如,单独或与一种或多种另外的组分(如一种或多种病毒衣壳)组合)的病毒颗粒。例如,AAV病毒可以包含例如与AAV衣壳蛋白外壳相关的线性单链AAV核酸基因组。
在一些实施例中,术语如“病毒”、“病毒粒子”、“AAV病毒”、“重组AAV病毒粒子”、“rAAV病毒粒子”、“AAV载体颗粒”、“完全衣壳”及“完全颗粒”等是指感染性、复制缺陷型病毒,例如包含AAV蛋白壳的那些,该AAV蛋白壳包裹例如在一侧或两侧上由AAV ITR侧接的病毒载体中的目的异源核苷酸序列。rAAV病毒粒子可以在适合的宿主细胞中产生,该适合的宿主细胞包含单独或与编码AAV辅助功能和附带功能(如cap基因)的核酸组合(例如在相同或另外的质粒上)的指定AAV载体的序列(例如一个或多个质粒)。在一些实施例中,使得宿主细胞能够编码AAV多肽,这些多肽用于实现将AAV载体(含有目的重组核苷酸序列)包装至感染性重组病毒粒子颗粒中以用于后续基因递送。
术语“反向末端重复”或“ITR”是指可以例如在腺相关病毒(AAV)和/或重组腺相关病毒载体(rAAV)中形成T形回文结构的一段核苷酸序列。Muzyczka等人,(2001)FieldsVirology[费氏病毒学],第29章,Lippincott Williams&Wilkins[利平科特、威廉姆斯和威尔金斯出版社]。在重组AAV载体中,这些序列在基因组包装和第二链合成中发挥功能性作用。
术语“宿主细胞”表示包含目的外源核酸的细胞,例如,一种或多种微生物、酵母细胞、昆虫细胞、或哺乳动物细胞。例如,宿主细胞可以包含AAV辅助构建体、AAV载体质粒、附带功能载体、和/或其他转移DNA。该术语包括已转染的原始细胞的子代。由于自然的、偶然的或故意的突变,单个亲本细胞的子代在形态或基因组或总DNA互补方面不一定与原始亲本完全相同。
术语“AAV辅助功能”是指可被表达以提供AAV基因产物的AAV衍生的编码序列,例如反式发挥功能以用于生产性AAV复制的那些。例如,AAV辅助功能可以包括两种主要的AAV开放阅读框(ORF):rep和cap。已证明Rep表达产物具有许多功能,其中包括:AAV的DNA复制起点的识别、结合和切断;DNA解旋酶活性;以及来自AAV(或其他异源)启动子的转录的调节。Cap表达产物提供必要的包装功能。在本文中,AAV辅助功能可用于以反式补充AAV载体中缺失的AAV功能。
术语“AAV辅助构建体”一般是指包括提供或编码以下蛋白质或核酸的核苷酸序列的核酸分子,这些蛋白质或核酸提供从AAV载体中缺失的AAV功能,例如,用于将目的核苷酸序列递送至靶细胞或组织的载体。AAV辅助构建体通常用于提供AAV rep和/或cap基因的瞬时表达,以补充AAV复制所缺失的AAV功能。典型地,辅助构建体缺乏AAV ITR,并且既不能复制也不能包装自己。AAV辅助构建体可以是质粒、噬菌体、转座子、粘粒、病毒、或病毒粒子的形式。已经披露了许多AAV辅助构建体,如编码Rep和Cap表达产物的常用质粒pAAV/Ad和plM29+45。参见例如,Samulski等人,(1989)J.Virol.[病毒学杂志],63:3822-3828;McCarty等人,(1991)J.Virol.[病毒学杂志],65:2936-2945。已经披露了许多其他编码Rep和/或Cap表达产物的载体。参见例如,美国专利号5,139,941和6,376,237。这些载体构建体的实施例以及其制备和纯化方法提供于例如WO/2019/094253(PCT/US2018/058744)中,将其通过引用以其全文并入本文。
“标记”是指能够直接地或通过与信号产生系统的一个或多个另外成员相互作用而提供可检测信号的药剂。可直接检测并且可用于本发明的标记包括荧光标记。特定的荧光团包括荧光素、若丹明、BODIPY、花青染料等。
“荧光标记”是指当被另一波长的光激发时能够发射某一波长的光的任何标记。
“荧光”是指任何可检测的荧光信号特征,包括强度、光谱、波长、胞内分布等。
“检测”荧光是指使用定性或定量方法评估细胞的荧光。在本发明的一些实施例中,将以定性方式检测荧光。换言之,是否存在荧光标记,表明重组融合蛋白是否表达。对于其他情况,可以使用定量手段测定荧光,例如,测量荧光强度、光谱或胞内分布,从而允许对不同条件下获得的值进行统计比较。该水平还可以使用定性方法来测定,例如视觉分析和人为对多个样品进行比较,例如,使用荧光显微镜或其他光学检测器(例如,图像分析系统等)检测样品。荧光的“改变”或“调制”是指在特定条件下与另一条件相比,荧光的强度、胞内分布、光谱、波长或其他方面的任何可检测的差异。例如,以定量方式检测“改变”或“调制”,并且差异是统计学上显著的差异。荧光的任何“改变”或“调制”可以使用标准仪器,如荧光显微镜、CCD或任何其他荧光检测器来检测,并且可以使用自动化系统(如集成系统)来检测,或者可以通过人类观察者来反映对改变的主观检测。
“绿色荧光蛋白”(GFP)是一种由238个氨基酸组成的蛋白质(26.9kDa),该蛋白质最初从水母维多利亚多管发光水母(Aequorea victoria)/水螅水母(Aequoreaaequorea)/肋骨水母(Aequorea forskalea)分离,当暴露于蓝光时发出绿色荧光。来自维多利亚多管发光水母的GFP具有在395nm的波长下的主要激发峰和在475nm处的次要激发峰。其发射峰在509nm处,这处于可见光谱的绿色下部。来自海肾(Renilla reniformis)的GFP具有在498nm处的单个主要激发峰。由于广泛使用的潜力和研究人员不断变化的需求,已经对许多不同的GFP突变体进行工程化。第一个主要的改进是1995年由Roger Tsien在Nature[自然]上报道的单点突变(S65T)。这种突变显著改善了GFP的光谱特征,导致增强的荧光、光稳定性和主要激发峰迀移至488nm而发射峰保持在509nm。将37℃折叠效率(F64L)点突变添加至这个支架产生了增强的GFP(EGFP)。EGFP的消光系数(表示为ε),也称为其光学截面,为9.13×10-21m2/分子,也作为55,000L/(mol·cm)引述。2006年报道了超级折叠GFP,这是一系列允许GFP即使在与弱折叠肽融合时也快速折叠和成熟的突变。
“黄色荧光蛋白”(YFP)是衍生自维多利亚多管发光水母的绿色荧光蛋白的遗传突变体。其激发峰为514nm且发射峰为527nm。
如本文所用,除非上下文另外明确指出,否则单数形式“一个/种(a/an)”和“该/所述”也包括复数指示物。
“病毒”是不能在宿主细胞外生长或繁殖的亚微观感染因子。每种病毒颗粒或病毒粒子由在称为衣壳的保护性蛋白外壳内的遗传物质DNA或RNA组成。衣壳形状从简单的螺旋和二十面体(多面体或近球形)形式到更复杂的具有尾部或包膜的结构变化。病毒感染细胞生命形式并且根据感染的宿主类型,分为动物、植物和细菌类型。
如本文所用的术语“跨突触病毒”是指能够通过突触从一个神经元迁移到另一个相连神经元的病毒。此类跨突触病毒的实例是弹状病毒,例如狂犬病病毒和α疱疹病毒,例如假狂犬病病毒或单纯疱疹病毒。如本文所用的术语“跨突触病毒”还涵盖自身具有通过突触从一个神经元迁移到另一个相连神经元的能力的病毒亚单位和包含此类亚单位并展示出通过突触从一个神经元迁移到另一个相连神经元的能力的生物载体(如经修饰的病毒)。
跨突触迁移可以是顺行的或逆行的。在逆行迁移期间,病毒将从突触后神经元移动到突触前神经元。因此,在顺行迁移期间,病毒将从突触前神经元移动到突触后神经元。
同源物是指具有共同祖先的蛋白质。类似物没有共同的祖先,但具有一些功能(而非结构)相似性,使得将它们包括在一个类别中(例如胰蛋白酶样丝氨酸蛋白酶和枯草杆菌蛋白酶明显不相关-它们在活性位点外的结构完全不同,但它们具有几何学上几乎相同的活性位点,并因此被认为是趋同进化为类似物的实例)。
同源物有两个亚类-直系同源物和旁系同源物。直系同源物是不同物种中的相同基因(例如细胞色素‘c’)。相同生物体中的两个基因不可能是直系同源物。旁系同源物是基因复制的结果(例如血红蛋白β和δ)。如果两种基因/蛋白质是同源的并且在相同的生物体中,则它们是旁系同源物。
如本文所用,术语“障碍”是指小病、疾病、病痛、临床病症或病理病症。
如本文所用,术语“药学上可接受的载剂”是指不干扰活性成分的生物活性的有效性、是化学惰性的并且对所施用的患者无毒的载剂介质。
如本文所用,术语“药学上可接受的衍生物”是指例如使用本发明的筛选方法鉴定的、对受试者相对无毒的药剂的任何同源物、类似物或片段。
术语“治疗剂”是指有助于预防或治疗障碍或障碍的并发症的任何分子、化合物或治疗。
可以制备配制在相容性药物载剂中的包含这样的药剂的组合物、包装并贴标签以用于治疗。
如果复合物是水溶性的,则可以将其配制在合适的缓冲液中,例如磷酸盐缓冲盐水或其他生理上相容的溶液。
替代性地,如果所得的复合物在水性溶剂中的溶解性差,则可以用非离子表面活性剂如Tween或聚乙二醇配制。因此,组合物及其生理上可接受的溶剂化物可以被配制成通过以下方式施用:吸入或吹入(通过口或鼻)或口服、含服、肠胃外、直肠施用,或者在肿瘤的情况下,直接注射到实体瘤中。
组合物可以被配制成通过注射,例如通过推注或连续输注而进行肠胃外施用。注射用配制品可以以单位剂型呈现,例如,在添加了防腐剂的安瓿中或多剂量容器中。
该组合物可以采取例如处于油性媒介物或水性媒介物的悬浮液、溶液或乳液的形式,并且可以含有配制剂(例如助悬剂、稳定剂和/或分散剂)。替代性地,活性成分可以呈粉末形式,以在使用前用合适的媒介物(例如无菌无热原水)复原。
组合物也可以配制成供局部应用,如霜剂或洗剂。
除了前述配制品之外,组合物还可以被配制为贮库制剂。此类长效型配制品可以通过植入(例如,眼内、皮下或肌内)或通过眼内注射而施用。
因此,例如,组合物可以与合适的聚合物或疏水性材料(例如,作为在可接受的油中的乳液)或离子交换树脂一起配制,或被配制成微溶性衍生物,例如被配制成微溶性盐。脂质体和乳液是用于亲水性药物的递送媒介物或载剂的熟知实例。
如果需要,组合物可以呈现于包装或分配装置中,该包装或分配装置可以含有一个或多个包含活性成分的单位剂型。该包装例如可以包含金属箔或塑料箔,例如泡罩包装。该包装或分配装置可以附有施用说明。
本发明还提供了用于实施本发明的治疗方案的试剂盒。此类试剂盒在一个或多个容器中包含治疗或预防有效量的药学上可接受形式的组合物。
试剂盒的小瓶中的组合物可以呈药学上可接受的溶液的形式,例如与无菌盐水、葡萄糖溶液或缓冲溶液或其他药学上可接受的无菌流体组合。替代性地,复合物可以冻干或脱水;在这种情况下,试剂盒任选地进一步在容器中包含优选地为无菌的药学上可接受的溶液(例如,盐水、葡萄糖溶液等),以将复合物复原以形成用于注射目的的溶液。
在另一实施例中,试剂盒进一步包含优选地以无菌形式包装以用于注射复合物的针或注射器,和/或包装好的酒精垫。任选地包括供临床医生或患者施用组合物的说明书。
蛋白质BANP,也称为BTG3相关核蛋白、支架/基质相关区域-1-结合蛋白、含BEN结构域的蛋白1、蛋白质BANP、BEND1、SMAR1、Btg3相关核蛋白、含BEN结构域的1蛋白或SMARBP1,是一种在人类中由BANP基因编码的蛋白质(HGNC:13450Entrez基因:54971Ensembl:ENSG00000172530 OMIM:611564UniProtKB:Q8N9N5)。它是人类基因家族“包含BEN结构域的蛋白(BEN-domain containing)”的成员,其中包括其他八个基因:BEND2、BEND3、BEND4、BEND5、BEND6、BEND7、NACC1(BEND8)、和NACC2(BEND9)。
除非另外定义,否则本文所用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。虽然与本文所述的那些方法和材料类似或等同的方法和材料可以用于本发明的实践或测试,但是以下描述合适的方法和材料。在冲突存在的情况下,则以包括定义在内的本说明书为准。此外,材料、方法和实例仅是说明性的而不旨在限制。
实例
瞬时转染后双荧光素酶报道基因测定
将嵌入具有不同CpG二核苷酸密度(0%、25%、50%、75%、或100%突变CpG)的人工启动子序列中的三个Banp基序和乱序对照克隆到萤火虫荧光素酶基因的上游。使用Lipofectamine-2000(赛默飞世尔科技公司(Thermo Fisher Scientific),L3000008)将萤火虫荧光素酶质粒与海肾荧光素酶对照报道基因质粒(10:1)共转染到24孔板中的小鼠胚胎干细胞(mESC)中。24小时后,执行荧光素酶测定系统(普洛麦格公司(Promega)E1500)。细胞用PBS洗涤一次,并在室温下用被动裂解缓冲液(PLB,100ul)轻轻搅拌裂解15min。将荧光素酶测定试剂II(LAR II,100ul)分配到96孔光度计板中适当数量的孔中。照度计编程为执行2秒的预测量延迟,然后是每个报道基因测定的10秒测量周期。小心地将20μl细胞裂解液转移到含有LAR II的光度计板中,上下移液3次混合,然后测量萤火虫荧光素酶活性。从光度计上取下样品板,加入Stop&Glo试剂(100μl)并短暂涡旋混合。更换光度计中的样品,并测量海肾荧光素酶活性。萤火虫荧光素酶活性标准化为海肾荧光素酶活性,然后相对于含乱序对照基序的构建体来确定含Banp基序的构建体的萤火虫荧光素酶活性的倍数增加。
Banp启动子的稳定基因组整合和荧光素酶报道基因测定
将具有三个完整或乱序的Banp基序的人工Banp启动子-荧光素酶构建体稳定整合到mESC的β-珠蛋白基因座中。选择含有这些Banp启动子中每一个的四个单独的克隆,并在执行荧光素酶测定系统(普洛麦格公司E1500)之前24小时铺板250,000个细胞。简而言之,细胞在250μl1x PLB中裂解,振荡孵育10min,然后转移到冰上管中。将细胞涡旋1秒,在室温下旋转沉降15秒,并将上清液转移到冰上的新管中。将细胞裂解液(20μl)一式两份等分到96孔板中,每孔加入100μl荧光素酶测定试剂,并将混合物上下移液三次。用光度计测量萤火虫荧光素酶信号,每孔1s,没有延迟。
序列表
<110> 弗里德里克-米谢尔生物医学研究所(Friedrich Miescher Institute forBiomedical Research)
<120> 利用孤儿基序和CpG密度的组合来控制异源转基因的表达
<130> PAT059014
<160> 3
<170> PatentIn 3.5版
<210> 1
<211> 10
<212> DNA
<213> 智人(Homo sapiens)
<400> 1
bmycgcgrbv 10
<210> 2
<211> 10
<212> DNA
<213> 智人(Homo sapiens)
<400> 2
ymycgcgrkv 10
<210> 3
<211> 10
<212> DNA
<213> 智人(Homo sapiens)
<400> 3
tctcgcgaga 10
Claims (15)
1.一种分离的核酸分子,其包含:
a.超过220bp,
b.选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列,和
c.在所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前的N个碱基对(bp)和/或之后的N个bp中的大于0.6的CpG观察值与估计值比率(O/E比率),
其中所述CpG O/E比率通过以下确定:对选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的至少一个或多个拷贝的序列周围的N个bp长序列中的CpG二核苷酸的数量进行计数,并通过将CpG二核苷酸的计数数量乘以N并将结果除以所述N个bp中存在的C数量和G数量的乘积来计算所述O/E比率(N*CpG/(C*G)),其中N在50和1000之间并且是紧接在所述选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的组的一个或多个拷贝的序列之前或紧跟其后的序列的长度,以bp计。
2.如权利要求1所述的分离的核酸,其进一步包含异源转基因。
3.如权利要求1或2所述的分离的核酸,其进一步包含编码蛋白质BANP或其活性片段或变体的另一个序列,所述序列可操作地连接至组成型启动子或诱导型启动子。
4.如前述权利要求中任一项所述的分离的核酸,其中所述异源转基因是嵌合抗原受体。
5.一种载体,其包含如前述权利要求中任一项所述的分离的核酸。
6.如权利要求5所述的载体,其中所述载体是质粒、DNA载体、RNA载体、病毒载体、腺病毒载体、腺相关病毒载体、慢病毒载体、逆转录病毒载体、γ逆转录病毒载体或HSV载体。
7.一种试剂盒或组合物,所述试剂盒或组合物包含如权利要求1-4中任一项所述的分离的核酸和第二分离的核酸分子,所述第二分离的核酸分子包含编码蛋白质BANP或其活性片段或变体的序列,所述序列可操作地连接至组成型启动子或诱导型启动子。
8.如权利要求7所述的试剂盒或组合物,其中两个分离的核酸均在同一载体内。
9.如权利要求7所述的试剂盒或组合物,所述试剂盒或组合物包含至少两个载体,其中两个分离的核酸在不同的载体内。
10.如权利要求1-4中任一项所述的分离的核酸或如权利要求5-6中任一项所述的载体或如权利要求7-9中任一项所述的试剂盒或组合物用于在细胞中表达所述异源转基因的用途。
11.如权利要求10所述的用途,其中与在相同条件下与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:3的单拷贝可操作地连接时的异源转基因的表达相比,所述异源转基因的表达增加大于二的倍数。
12.如权利要求10-11所述的用途,其中所述表达通过报道基因活性、报道基因荧光、定量逆转录酶PCR或基因组学方法例如RNA测序来测量。
13.一种在细胞中产生异源转基因的方法,所述方法为将如权利要求1-4中任一项所述的分离的核酸或如权利要求5-6中任一项所述的载体引入所述细胞中、培养所述细胞、并纯化重组表达的异源转基因。
14.一种分离的细胞,其包含如权利要求1-4中任一项所述的分离的核酸。
15.如权利要求14所述的细胞,其中包含选自SEQ ID NO:1、SEQ ID NO:2和/或SEQ IDNO:3的组的至少两个拷贝的序列的分离的核酸序列和所述异源转基因稳定地整合到所述细胞的基因组中。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20211437.7 | 2020-12-03 | ||
EP20211437 | 2020-12-03 | ||
PCT/IB2021/061228 WO2022118237A1 (en) | 2020-12-03 | 2021-12-02 | Use of a combination of an orphan motif and cpg density to control expression of a heterologous transgene |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116529381A true CN116529381A (zh) | 2023-08-01 |
Family
ID=73698572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180080972.4A Pending CN116529381A (zh) | 2020-12-03 | 2021-12-02 | 利用孤儿基序和CpG密度的组合来控制异源转基因的表达 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20240035034A1 (zh) |
EP (1) | EP4256058A1 (zh) |
JP (1) | JP2023552535A (zh) |
CN (1) | CN116529381A (zh) |
WO (1) | WO2022118237A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116949092A (zh) * | 2022-09-21 | 2023-10-27 | 上海吉量医药工程有限公司 | 一种转座子系统及其应用 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5139941A (en) | 1985-10-31 | 1992-08-18 | University Of Florida Research Foundation, Inc. | AAV transduction vectors |
US6376196B1 (en) * | 1996-05-10 | 2002-04-23 | The Regents Of The University Of California | Recombinant neospora antigens and their uses |
US6001650A (en) | 1995-08-03 | 1999-12-14 | Avigen, Inc. | High-efficiency wild-type-free AAV helper functions |
US6485907B1 (en) * | 2000-01-11 | 2002-11-26 | Syngenta Participations Ag | PCR-based detection of Rhizoctonia cerealis |
US8927269B2 (en) * | 2003-05-19 | 2015-01-06 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Avian adenoassociated virus and uses thereof |
US20070298026A1 (en) * | 2003-08-29 | 2007-12-27 | Mount Sinai School Of Medicine Office Of Industrial Liaison | Methods for Identifying Treatment and Inducing Infertility Using Smc1-Beta |
AU2018365677A1 (en) | 2017-11-08 | 2020-05-14 | Novartis Ag | Means and method for preparing viral vectors and uses of same |
-
2021
- 2021-12-02 EP EP21819983.4A patent/EP4256058A1/en active Pending
- 2021-12-02 JP JP2023533295A patent/JP2023552535A/ja active Pending
- 2021-12-02 CN CN202180080972.4A patent/CN116529381A/zh active Pending
- 2021-12-02 US US18/255,296 patent/US20240035034A1/en active Pending
- 2021-12-02 WO PCT/IB2021/061228 patent/WO2022118237A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20240035034A1 (en) | 2024-02-01 |
WO2022118237A1 (en) | 2022-06-09 |
EP4256058A1 (en) | 2023-10-11 |
JP2023552535A (ja) | 2023-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210388385A1 (en) | Synp27 (prob12), a promoter for the specific expression of genes in protoplasmic astrocytes | |
JP2022092057A (ja) | 遺伝子発現増強のための組成物および方法 | |
US20220090062A1 (en) | Synp66 (proa21), a promoter for the specific expression of genes in retinal ganglion cells | |
US20220119841A1 (en) | Synp5 (proa9), a promoter for the specific expression of genes in retinal ganglion cells | |
US20210353773A1 (en) | Synp194 (prob15), a promoter for the specific expression of genes in retinal ganglion cells | |
US20210388387A1 (en) | Synp151 (proc29), a promoter for the specific expression of genes in retinal ganglion cells | |
US20210388386A1 (en) | Synp57 (proa14), a promoter for the specific expression of genes in photoreceptors | |
US20210355505A1 (en) | Synp78 (proa27), a promoter for the specific expression of genes in retinal ganglion cells | |
US20210395750A1 (en) | Synp17 (prob1), a promoter for the specific expression of genes in retinal ganglion cells | |
EP3548093A1 (en) | Synp107, a promoter for the specific expression of genes in interneurons | |
WO2020152624A1 (en) | Synp35 (proc8), a promoter for the specific expression of genes in retinal ganglion cells | |
WO2018099975A1 (en) | Synpi, a promoter for the specific expression of genes in interneurons | |
US20220411789A1 (en) | Promoter for the specific expression of genes in agmat-positive cells in layer 2/3 of mouse cortex | |
CN113710805A (zh) | 用于诊断和治疗视网膜病变的组合物和方法 | |
US20240035034A1 (en) | Use of a combination of an orphan motif and cpg density to control expression of a heterologous transgene | |
CN117545842A (zh) | SMN1和miR-23a在治疗脊髓性肌萎缩中的协同效应 | |
CN113710693A (zh) | Dna结合结构域反式激活因子及其用途 | |
US20230220402A1 (en) | Use of an orphan motif to increase expression of a heterologous transgene | |
WO2023138617A1 (zh) | 工程化的CasX核酸酶、效应蛋白及其用途 | |
CN117836420A (zh) | 重组tert编码病毒基因组和运载体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |