CN116949012B - 一种融合蛋白及其应用 - Google Patents
一种融合蛋白及其应用 Download PDFInfo
- Publication number
- CN116949012B CN116949012B CN202311212915.4A CN202311212915A CN116949012B CN 116949012 B CN116949012 B CN 116949012B CN 202311212915 A CN202311212915 A CN 202311212915A CN 116949012 B CN116949012 B CN 116949012B
- Authority
- CN
- China
- Prior art keywords
- fusion protein
- sequence
- polynucleotide
- nucleic acid
- target nucleic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 133
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 133
- 108091033409 CRISPR Proteins 0.000 claims abstract description 57
- 238000010362 genome editing Methods 0.000 claims abstract description 46
- 125000000539 amino acid group Chemical group 0.000 claims abstract description 36
- 101710163270 Nuclease Proteins 0.000 claims abstract description 20
- 230000000694 effects Effects 0.000 claims abstract description 18
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract 5
- 230000002779 inactivation Effects 0.000 claims abstract 2
- 108091033319 polynucleotide Proteins 0.000 claims description 136
- 102000040430 polynucleotide Human genes 0.000 claims description 136
- 239000002157 polynucleotide Substances 0.000 claims description 136
- 150000007523 nucleic acids Chemical class 0.000 claims description 86
- 239000002773 nucleotide Substances 0.000 claims description 85
- 125000003729 nucleotide group Chemical group 0.000 claims description 85
- 102000039446 nucleic acids Human genes 0.000 claims description 83
- 108020004707 nucleic acids Proteins 0.000 claims description 83
- 230000014509 gene expression Effects 0.000 claims description 37
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 35
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 35
- 108020004414 DNA Proteins 0.000 claims description 32
- 108090000623 proteins and genes Proteins 0.000 claims description 28
- 239000000203 mixture Substances 0.000 claims description 23
- 239000013604 expression vector Substances 0.000 claims description 22
- 238000003259 recombinant expression Methods 0.000 claims description 19
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 17
- 238000000034 method Methods 0.000 claims description 17
- 239000008194 pharmaceutical composition Substances 0.000 claims description 15
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 claims description 10
- 108091026890 Coding region Proteins 0.000 claims description 9
- 230000035772 mutation Effects 0.000 claims description 9
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 claims description 7
- 230000007018 DNA scission Effects 0.000 claims description 7
- 108010042407 Endonucleases Proteins 0.000 claims description 7
- 102000004533 Endonucleases Human genes 0.000 claims description 7
- 108091023040 Transcription factor Proteins 0.000 claims description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 7
- 239000003623 enhancer Substances 0.000 claims description 7
- 230000009870 specific binding Effects 0.000 claims description 7
- 201000010099 disease Diseases 0.000 claims description 6
- 230000000415 inactivating effect Effects 0.000 claims description 6
- 108091062157 Cis-regulatory element Proteins 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- 238000013518 transcription Methods 0.000 claims description 4
- 230000035897 transcription Effects 0.000 claims description 4
- 241001465754 Metazoa Species 0.000 claims description 3
- 102000040945 Transcription factor Human genes 0.000 claims description 3
- 241000196324 Embryophyta Species 0.000 claims description 2
- 239000002671 adjuvant Substances 0.000 claims description 2
- 239000003937 drug carrier Substances 0.000 claims description 2
- 238000000338 in vitro Methods 0.000 claims description 2
- 230000030648 nucleus localization Effects 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- 230000003584 silencer Effects 0.000 claims description 2
- 102000037983 regulatory factors Human genes 0.000 claims 1
- 108091008025 regulatory factors Proteins 0.000 claims 1
- 239000003981 vehicle Substances 0.000 claims 1
- 210000004027 cell Anatomy 0.000 description 60
- 239000013612 plasmid Substances 0.000 description 37
- 150000001413 amino acids Chemical group 0.000 description 36
- 239000013598 vector Substances 0.000 description 27
- 102000004169 proteins and genes Human genes 0.000 description 15
- 108020005004 Guide RNA Proteins 0.000 description 14
- 235000018102 proteins Nutrition 0.000 description 14
- 125000006850 spacer group Chemical group 0.000 description 14
- 150000002632 lipids Chemical class 0.000 description 13
- 238000010354 CRISPR gene editing Methods 0.000 description 12
- 238000002347 injection Methods 0.000 description 12
- 239000007924 injection Substances 0.000 description 12
- 238000003776 cleavage reaction Methods 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- 230000001105 regulatory effect Effects 0.000 description 9
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 238000006471 dimerization reaction Methods 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- 238000001890 transfection Methods 0.000 description 7
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 6
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 239000000539 dimer Substances 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 239000013607 AAV vector Substances 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 5
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 5
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 5
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 5
- 210000002569 neuron Anatomy 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 101000608935 Homo sapiens Leukosialin Proteins 0.000 description 4
- 102100039564 Leukosialin Human genes 0.000 description 4
- 241000714474 Rous sarcoma virus Species 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 210000001772 blood platelet Anatomy 0.000 description 4
- 210000000234 capsid Anatomy 0.000 description 4
- 101150038500 cas9 gene Proteins 0.000 description 4
- 235000012000 cholesterol Nutrition 0.000 description 4
- 230000005782 double-strand break Effects 0.000 description 4
- 210000000265 leukocyte Anatomy 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 210000003205 muscle Anatomy 0.000 description 4
- 239000002105 nanoparticle Substances 0.000 description 4
- 239000013642 negative control Substances 0.000 description 4
- 230000002746 orthostatic effect Effects 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 230000004960 subcellular localization Effects 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 3
- 241000702421 Dependoparvovirus Species 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- 235000001014 amino acid Nutrition 0.000 description 3
- 229940024606 amino acid Drugs 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 125000002091 cationic group Chemical group 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 230000011088 chloroplast localization Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- 230000025608 mitochondrion localization Effects 0.000 description 3
- 238000009126 molecular therapy Methods 0.000 description 3
- 230000009437 off-target effect Effects 0.000 description 3
- 239000013600 plasmid vector Substances 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 108010052875 Adenine deaminase Proteins 0.000 description 2
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 2
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 108010080611 Cytosine Deaminase Proteins 0.000 description 2
- 102000000311 Cytosine Deaminase Human genes 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 2
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 102100036912 Desmin Human genes 0.000 description 2
- 108010044052 Desmin Proteins 0.000 description 2
- 101710091045 Envelope protein Proteins 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 101710177291 Gag polyprotein Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 2
- 102100034349 Integrase Human genes 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 101710125418 Major capsid protein Proteins 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 2
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 2
- 108010066154 Nuclear Export Signals Proteins 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 101710188315 Protein X Proteins 0.000 description 2
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- 108091027544 Subgenomic mRNA Proteins 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- 241000711975 Vesicular stomatitis virus Species 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 210000001130 astrocyte Anatomy 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 210000000601 blood cell Anatomy 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 2
- 210000002798 bone marrow cell Anatomy 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000017858 demethylation Effects 0.000 description 2
- 238000010520 demethylation reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 210000005045 desmin Anatomy 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006197 histone deacetylation Effects 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000000441 neoplastic stem cell Anatomy 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- RVHYPUORVDKRTM-UHFFFAOYSA-N 1-[2-[bis(2-hydroxydodecyl)amino]ethyl-[2-[4-[2-[bis(2-hydroxydodecyl)amino]ethyl]piperazin-1-yl]ethyl]amino]dodecan-2-ol Chemical compound CCCCCCCCCCC(O)CN(CC(O)CCCCCCCCCC)CCN(CC(O)CCCCCCCCCC)CCN1CCN(CCN(CC(O)CCCCCCCCCC)CC(O)CCCCCCCCCC)CC1 RVHYPUORVDKRTM-UHFFFAOYSA-N 0.000 description 1
- LRFJOIPOPUJUMI-KWXKLSQISA-N 2-[2,2-bis[(9z,12z)-octadeca-9,12-dienyl]-1,3-dioxolan-4-yl]-n,n-dimethylethanamine Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC1(CCCCCCCC\C=C/C\C=C/CCCCC)OCC(CCN(C)C)O1 LRFJOIPOPUJUMI-KWXKLSQISA-N 0.000 description 1
- ZISVTYVLWSZJAL-UHFFFAOYSA-N 3,6-bis[4-[bis(2-hydroxydodecyl)amino]butyl]piperazine-2,5-dione Chemical compound CCCCCCCCCCC(O)CN(CC(O)CCCCCCCCCC)CCCCC1NC(=O)C(CCCCN(CC(O)CCCCCCCCCC)CC(O)CCCCCCCCCC)NC1=O ZISVTYVLWSZJAL-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- QGWBEETXHOVFQS-UHFFFAOYSA-N 6-[6-(2-hexyldecanoyloxy)hexyl-(4-hydroxybutyl)amino]hexyl 2-hexyldecanoate Chemical compound CCCCCCCCC(CCCCCC)C(=O)OCCCCCCN(CCCCO)CCCCCCOC(=O)C(CCCCCC)CCCCCCCC QGWBEETXHOVFQS-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 1
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000713686 Bovine lentivirus group Species 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 102100035371 Chymotrypsin-like elastase family member 1 Human genes 0.000 description 1
- 101710138848 Chymotrypsin-like elastase family member 1 Proteins 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 101710099240 Elastase-1 Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 102100039289 Glial fibrillary acidic protein Human genes 0.000 description 1
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 101710114810 Glycoprotein Proteins 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 101000934372 Homo sapiens Macrosialin Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101000829506 Homo sapiens Rhodopsin kinase GRK1 Proteins 0.000 description 1
- 101000821100 Homo sapiens Synapsin-1 Proteins 0.000 description 1
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 1
- 241000714260 Human T-lymphotropic virus 1 Species 0.000 description 1
- 102100037872 Intercellular adhesion molecule 2 Human genes 0.000 description 1
- 101710148794 Intercellular adhesion molecule 2 Proteins 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108010059343 MM Form Creatine Kinase Proteins 0.000 description 1
- 102100025136 Macrosialin Human genes 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 102100030856 Myoglobin Human genes 0.000 description 1
- 108010062374 Myoglobin Proteins 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 108010019160 Pancreatin Proteins 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 101000852966 Rattus norvegicus Interleukin-1 receptor-like 1 Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102100023742 Rhodopsin kinase GRK1 Human genes 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 101710167605 Spike glycoprotein Proteins 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 102100021905 Synapsin-1 Human genes 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108091093126 WHP Posttrascriptional Response Element Proteins 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- NRLNQCOGCKAESA-KWXKLSQISA-N [(6z,9z,28z,31z)-heptatriaconta-6,9,28,31-tetraen-19-yl] 4-(dimethylamino)butanoate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC(OC(=O)CCCN(C)C)CCCCCCCC\C=C/C\C=C/CCCCC NRLNQCOGCKAESA-KWXKLSQISA-N 0.000 description 1
- YWYMLVACUCXAEC-UHFFFAOYSA-N [3-[3-(2-methoxyethoxy)propylcarbamoyloxy]-2-tetradecanoyloxypropyl] tetradecanoate Chemical compound CCCCCCCCCCCCCC(=O)OCC(COC(=O)NCCCOCCOC)OC(=O)CCCCCCCCCCCCC YWYMLVACUCXAEC-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 239000003570 air Substances 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 238000007622 bioinformatic analysis Methods 0.000 description 1
- 238000010170 biological method Methods 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 230000035605 chemotaxis Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000000447 dimerizing effect Effects 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000000799 fusogenic effect Effects 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- IIRDTKBZINWQAW-UHFFFAOYSA-N hexaethylene glycol Chemical group OCCOCCOCCOCCOCCOCCO IIRDTKBZINWQAW-UHFFFAOYSA-N 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000007124 immune defense Effects 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 239000007928 intraperitoneal injection Substances 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 230000002601 intratumoral effect Effects 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 238000007914 intraventricular administration Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 230000001071 malnutrition Effects 0.000 description 1
- 235000000824 malnutrition Nutrition 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000002025 microglial effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 231100000956 nontoxicity Toxicity 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 208000015380 nutritional deficiency disease Diseases 0.000 description 1
- 210000004416 odontoblast Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 229940055695 pancreatin Drugs 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 210000001428 peripheral nervous system Anatomy 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 210000000608 photoreceptor cell Anatomy 0.000 description 1
- 108091008695 photoreceptors Proteins 0.000 description 1
- 210000000557 podocyte Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000018883 protein targeting Effects 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 210000003289 regulatory T cell Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 210000003994 retinal ganglion cell Anatomy 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 210000002536 stromal cell Anatomy 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 231100001274 therapeutic index Toxicity 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000005100 tissue tropism Effects 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 210000003171 tumor-infiltrating lymphocyte Anatomy 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
- A61K48/005—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Abstract
本发明公开了一种融合蛋白及其应用。所述融合蛋白通过将氨基酸序列如SEQ ID NO:1所示的Cas9蛋白的核酸酶活性失活突变体的第943‑952位氨基酸残基替换为功能结构域而得到。本发明的融合蛋白用于基因编辑,可实现高特异性切割、高编辑效率,脱靶风险低。
Description
技术领域
本发明属于生物技术领域,具体涉及一种融合蛋白及其应用。
背景技术
CRISPR-Cas9是细菌和古细菌在长期演化过程中形成的一种适应性免疫防御,可用来对抗入侵的病毒及外源DNA。来源于酿脓链球菌的CRISPR/Cas9系统的SpCas9由于操作简单且高效被广泛运用于基因工程。CRISPR-Cas9系统由Cas9,crRNA和tracrRNA组成,其中Cas9蛋白是一种DNA内切酶,很多细菌都可以表达该蛋白,Cas9内切酶必须在gRNA(crRNA和tracrRNA的复合物)分子引导下对DNA进行切割;Cas9、crRNA及tracrRNA首先结合形成复合物,识别并结合crRNA的互补靶序列,随后Cas9蛋白的HNH核酸酶结构域活性位点剪切crRNA的互补DNA链,Ruvc核酸酶结构域活性位点剪切非互补链,使DNA双链断裂,通过NHEJ或者HDR实现对特定DNA的编辑效应。
CRISPR/Cas9基因编辑技术已经显示巨大的应用价值,但是其在编辑效率及脱靶效应等方面尚有很多问题需要解决。
发明内容
本发明所要解决的技术问题是现有技术缺少高编辑效率及低脱靶效应的基因编辑工具的缺陷,提供了一种融合蛋白及其应用。本发明的融合蛋白用于基因编辑,可实现高特异性切割、高编辑效率,脱靶风险低。
为了提高DNA切割特异性,我们生成了无催化活性的Cas9和FokI核酸酶的融合体,并对FokI在融合蛋白中的位置做了设计、筛选和测试,最终获得一个新融合蛋白,其编辑活性优于目前已知的末端融合FokI的Cas9。
在许多情况下,本发明的dCas9-FokI联合一对gRNA的indel效率甚至高于野生型SpCas9。
且本领域技术人员应知晓,本发明的dCas9-FokI联合一对gRNA在互补的DNA双链上产生两个单链断裂,即可形成一个双链断裂。相对于野生型SpCas9直接引入双链断裂而言,预期本发明的dCas9-FokI可降低脱靶活性,例如参见Maryam Saifaldeen, et al.,CRISPR FokI Dead Cas9 System: Principles and Applications in GenomeEngineering, Cells, 2020, 9, 2518。
本发明通过以下技术方案解决上述技术问题。
本发明的第一方面提供一种融合蛋白,所述融合蛋白通过将dCas9的无规则卷曲(无规卷曲,random coil)结构的连续氨基酸残基替换为功能结构域而得到,所述dCas9为无核酸酶活性的Cas9蛋白;
可选地,所述功能结构域任选自脱氨酶域(包括但不限于胞嘧啶脱氨酶结构域、腺嘌呤脱氨酶结构域)、UGI域、UDG域、甲基化结构域、去甲基化结构域、亚细胞定位信号(包括但不限于核定位信号、核输出信号、线粒体定位信号、叶绿体定位信号)、转录激活域、转录抑制域、核酸酶域(包括但不限于FokI域)、组蛋白脱乙酰化结构域、DNA连接结构域;进一步地,所述功能结构域为核酸酶域;再进一步地,所述功能结构域为FokI域;
可选地,所述无规则卷曲结构位于dCas9的REC1-A和/或REC1-B结构域;
可选地,所述无规则卷曲结构位于dCas9的RuvC、环L2结构域和/或HNH结构域;或所述无规则卷曲结构位于dCas9的RuvC结构域;或所述无规则卷曲结构位于dCas9的RuvC-Ⅲ结构域。
本发明的第二方面提供一种融合蛋白,所述融合蛋白包括dCas9和功能结构域,所述dCas9中无规则卷曲中的连续氨基酸残基替换为功能结构域;所述dCas9为无核酸酶活性的Cas9蛋白;
可选地,所述功能结构域任选自脱氨酶域(包括但不限于胞嘧啶脱氨酶结构域、腺嘌呤脱氨酶结构域)、UGI域、UDG域、甲基化结构域、去甲基化结构域、亚细胞定位信号(包括但不限于核定位信号、核输出信号、线粒体定位信号、叶绿体定位信号)、转录激活域、转录抑制域、核酸酶域(包括但不限于FokI域)、组蛋白脱乙酰化结构域、DNA连接结构域;进一步地,所述功能结构域为核酸酶域;再进一步地,所述功能结构域为FokI域;
可选地,所述无规则卷曲结构位于dCas9的REC1-A和/或REC1-B结构域;
可选地,所述无规则卷曲结构位于dCas9的RuvC、环L2结构域和/或HNH结构域;或所述无规则卷曲结构位于dCas9的RuvC结构域;或所述无规则卷曲结构位于dCas9的RuvC-Ⅲ结构域。
本发明一些实施方案中,所述融合蛋白能够在指导多核苷酸的指导下特异性地结合至靶核酸。
本发明一些实施方案中,所述融合蛋白能够在指导多核苷酸的指导下序列特异性地结合至靶核酸,所述指导多核苷酸包含指导序列,所述指导序列与所述靶核酸杂交。
本发明一些实施方案中,所述融合蛋白能够与指导多核苷酸形成复合物,所述指导多核苷酸包含指导序列,所述指导序列被工程化以指导所述复合物序列特异性地结合至靶核酸。
本发明一些具体实施方案中,所述功能结构域为FokI域,所述融合蛋白能够在指导多核苷酸的指导下识别双链靶核酸并对所述靶核酸进行切刻;或所述融合蛋白能够与指导多核苷酸形成复合物,所述指导多核苷酸包含指导序列,所述指导序列被工程化以指导所述复合物序列特异性结合至双链靶核酸并对所述靶核酸进行切刻。
本发明一些较佳实施方案中,所述指导多核苷酸还包含骨架序列;进一步地,所述骨架序列与所述融合蛋白的dCas9部分相互作用,或所述骨架序列使所述指导多核苷酸与所述融合蛋白形成复合物。
本发明一些实施方案中,所述Cas9蛋白选自SpCas9、SaCas9、NmeCas9、StCas9和CjCas9。
本发明一些较佳实施方案中,所述Cas9蛋白为SpCas9(化脓链球菌Cas9)或SaCas9(金黄色葡萄球菌Cas9)。
本发明一些具体实施方案中,所述SpCas9的氨基酸序列如SEQ ID NO: 1所示。
本发明一些实施方案中,所述Cas9蛋白的氨基酸序列与如SEQ ID NO: 1所示的氨基酸序列具有≥80%、≥85%、≥90%、≥95%、≥96%、≥97%、≥98%、≥99%或≥99.5%的序列同一性。
本发明一些具体实施方案中,所述dCas9的氨基酸序列如SEQ ID NO: 2所示或与如SEQ ID NO: 2所示的氨基酸序列具有≥80%、≥85%、≥90%、≥95%、≥96%、≥97%、≥98%、≥99%或≥99.5%的序列同一性。
本发明一些实施方案中,所述dCas9为Cas9蛋白的RuvC结构域和/或HNH结构域上发生突变例如点突变,使Cas9蛋白无核酸酶活性。
本发明一些较佳实施方案中,所述dCas9为在SpCas9的D10和N863对应位置突变为A的Cas9;或所述dCas9为在SpCas9的D10和H840对应位置突变为A的Cas9。所述对应位置可通过所述Cas9与SpCas9的序列比对而确定。
本发明一些较佳实施方案中,所述dCas9为存在D10A和N863A突变的SpCas9、存在D10A和H840A突变的SpCas9。
本发明一些较佳实施方案中,所述dCas9为存在D10A和H557A突变的SaCas9。
本发明一些实施方案中,所述功能结构域直接或通过连接子与dCas9融合。本发明一些实施方案中,所述功能结构域直接与dCas9融合(即功能结构域的N末端残基直接与dCas9裂分的N末端残基通过肽键共价连接,功能结构域的C末端残基直接与dCas9裂分的C末端残基通过肽键共价连接),或所述功能结构域通过氨基酸序列与dCas9融合。本发明一些实施方案中,所述功能结构域直接与dCas9融合,或所述功能结构域通过长度为1-50个、1-40个、1-30个、1-20个、5-16、1-10个、10-20个、3-8个或15-20个氨基酸残基的连接子序列与dCas9融合。
本发明一些具体实施方案中,所述连接子为氨基酸残基序列GGSGS(SEQ ID NO:50)或SGSETPGTSESATPES(SEQ ID NO: 51)。
本发明一些实施方案中,所述融合蛋白通过将dCas9的无规则卷曲结构的1-20个连续氨基酸残基替换为功能结构域而得到。
本发明一些实施方案中,所述融合蛋白通过将dCas9的无规则卷曲结构的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个连续氨基酸残基替换为功能结构域而得到。
本发明一些实施方案中,所述融合蛋白通过将dCas9的无规则卷曲结构的1-15个、3-11个、3-10个或9-11个连续氨基酸残基替换为功能结构域而得到。
本发明一些实施方案中,替换的无规则卷曲结构的长度为1-15个氨基酸残基。
本发明一些具体实施方案中,替换的无规则卷曲结构的长度为3-11个氨基酸残基。
本发明另一些具体实施方案中,替换的无规则卷曲结构的长度为3-10个氨基酸残基。
本发明另一些具体实施方案中,替换的无规则卷曲结构的长度为9-11个氨基酸残基。
本发明另一些具体实施方案中,替换的无规则卷曲结构的长度为3个氨基酸残基。
本发明一些实施方案中,所述无规则卷曲结构对应于SEQ ID NO: 2所示序列的第37-41位、第107-113位、第147-149位、第169-172位、第308-314位、第792-799位、第864-871位、第906-908位、第943-952位和/或第1015-1017位。
本发明一些较佳实施方案中,当所述dCas9的氨基酸序列如SEQ ID NO: 2所示时,所述替换发生在第37-41位、第107-113位、第147-149位、第169-172位、第308-314位、第792-799位、第864-871位、第906-908位、第943-952位或第1015-1017位。
本发明中,所述无规则卷曲结构的位置可通过与SEQ ID NO: 2所示序列的序列比对而确定。
本发明一些实施方案中,所述功能结构域通过替换所述dCas9的被替换序列后直接或通过连接子与dCas9融合。
本发明一些具体实施方案中,被替换序列的长度为1-15个氨基酸残基。
本发明另一些具体实施方案中,被替换序列的长度为3-11个氨基酸残基。
本发明另一些具体实施方案中,被替换序列的长度为3-10个氨基酸残基。
本发明另一些具体实施方案中,被替换序列的长度为9-11个氨基酸残基。
本发明另一些具体实施方案中,被替换序列的长度为3个氨基酸残基。
本发明一些具体实施方案中:
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第37-41位时,被替换序列的长度为5个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第107-113位时,被替换序列的长度为7个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第147-149位时,被替换序列的长度为3个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第169-172位时,被替换序列的长度为4个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第308-314位时,被替换序列的长度为7个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第792-799位时,被替换序列的长度为8个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第864-871位时,被替换序列的长度为8个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第906-908位时,被替换序列的长度为3个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第943-952位时,被替换序列的长度为10个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第1015-1017位时,被替换序列的长度为3个氨基酸残基。
本发明的一些实施方案中,所述FokI域包括FokI核酸内切酶的DNA结合结构域和切割结构域。
本发明的一些实施方案中,所述FokI域包括或为FokI核酸内切酶的DNA切割结构域。
本发明中,所述FokI域可以以单体或二聚体形式存在。例如FokI域可以在溶液中以单体形式存在。
本发明的一些实施方案中,所述FokI域具有核酸酶活性。
本发明的一个示例中,第一所述融合蛋白可与第一指导多核苷酸一起结合至双链靶核酸的其中一条单链,第二所述融合蛋白可与第二指导多核苷酸一起结合至所述靶核酸的另外一条单链;
第一所述融合蛋白和第二所述融合蛋白的FokI域在双链靶核酸上存在间隔序列且可形成二聚体,所述间隔序列的长度为1-100bp,所述二聚体在第一所述融合蛋白、第一指导多核苷酸、第二所述融合蛋白及第二指导多核苷酸与靶核酸结合时可对所述双链靶核酸进行切割。
本发明的一个示例中,所述FokI域可在dCas9与双链靶DNA结合后二聚化以通过其核酸酶活性实现对双链靶DNA的切割。当所述FokI域二聚化时,两个FokI域在双链靶DNA上存在间隔序列以对双链靶DNA进行切割。此处间隔序列并不是指CRISPR系统中的CRISPR阵列(CRISPR array)的spacer序列。
本发明中,所述间隔序列的长度可为1-100bp、1-90bp、1-80bp、1-70bp、1-60bp、1-50bp、1-40bp、1-30bp、1-20bp、1-10bp、1-5bp、2-100bp、2-90bp、2-80bp、2-70bp、2-60bp、2-50bp、2-40bp、2-30bp、2-20bp、2-10bp、2-5bp、3-100bp、3-90bp、3-80bp、3-70bp、3-60bp、3-50bp、3-40bp、3-30bp、3-20bp、3-10bp、3-5bp、4-100bp、4-90bp、4-80bp、4-70bp、4-60bp、4-50bp、4-40bp、4-30bp、4-20bp、4-10bp、4-5bp、5-100bp、5-90bp、5-80bp、5-70bp、5-60bp、5-50bp、5-40bp、5-30bp、5-20bp、5-10bp、10-100bp、10-90bp、10-80bp、10-70bp、10-60bp、10-50bp、10-40bp、10-30bp、10-20bp、15-100bp、15-90bp、15-80bp、15-70bp、15-60bp、15-50bp、15-40bp、15-30bp、15-20bp、20-100bp、20-90bp、20-80bp、20-70bp、20-60bp、20-50bp、20-40bp、20-30bp或20-25bp。本发明一些实施方案中,所述间隔序列的长度为4-30bp。本发明一些实施方案中,所述间隔序列的长度为6-20bp。本发明一些实施方案中,所述间隔序列的长度为1 bp、2 bp、3 bp、4 bp、5 bp、6 bp、7 bp、8 bp、9 bp、10 bp、11 bp、12bp、13 bp、14 bp、15 bp、16 bp、17 bp、18 bp、19 bp、20 bp、21 bp、22 bp、23 bp、24 bp、25bp、26 bp、27 bp、28 bp、29 bp、30 bp、31 bp、32 bp、33 bp、34 bp、35 bp、36 bp、37 bp、38bp、39 bp或40 bp。所述间隔序列的长度例如为4 bp、5 bp、6 bp、7 bp、8 bp、9 bp、10 bp、11 bp、12 bp、13 bp、14 bp、15 bp、16 bp、17 bp、18 bp、19 bp、20 bp、21 bp、22 bp、23bp、24 bp、25 bp、26 bp、27 bp、28 bp、29 bp或30 bp。
本发明一些实施方案中,所述FokI域的氨基酸序列与SEQ ID NO: 4所示序列的第6位-第201位氨基酸残基序列具有≥50%、≥60%、≥70%、≥80%、≥90%、≥95%、≥98%或≥99%的序列同一性。
本发明一些实施方案中,所述FokI域包含SEQ ID NO: 4所示序列的第6位-第201位氨基酸残基序列。
本发明一些实施方案中,所述FokI域由SEQ ID NO: 4所示序列的第6位-第201位氨基酸残基序列组成。
本发明一些实施方案中,所述FokI域的氨基酸序列如SEQ ID NO: 52所示或与如SEQ ID NO: 52所示的氨基酸序列具有≥50%、≥60%、≥70%、≥80%、≥90%、≥95%、≥98%或≥99%的序列同一性。
本发明一些实施方案中,所述指导多核苷酸为单分子指导多核苷酸或双分子指导多核苷酸。非限制性示例例如,所述指导多核苷酸由CRISPR-Cas9系统中的crRNA和tracrRNA嵌合形成单分子指导多核苷酸(sgRNA)。再例如,所述指导多核苷酸是由CRISPR-Cas9系统中的crRNA和tracrRNA这2个分离的分子组成的组,即为所述的双分子。
本发明一些实施方案中,所述融合蛋白还包含以下的任一种或更多种:亚细胞定位信号、DNA结合域、转录激活域、转录抑制域、核酸酶域、脱氨酶结构域、UDG域、UGI域、甲基化酶、去甲基化酶、组蛋白脱乙酰酶、DNA连接酶、表位标签和报告蛋白;
可选地,所述亚细胞定位信号任选自:核定位信号、核输出信号、线粒体定位信号、叶绿体定位信号。
本发明中,所述融合蛋白优选地为通过将氨基酸序列如SEQ ID NO: 1所示的Cas9蛋白的核酸酶活性失活突变体的第943-952位氨基酸残基替换为功能结构域而得到的融合蛋白;
可选地,所述失活突变体相对SEQ ID NO: 1具有D10A和N863A突变,或者,D10A和H840A突变;
可选地,所述功能结构域为FokI域;进一步地,所述FokI域为FokI核酸内切酶的DNA切割结构域;再进一步地,所述FokI域的氨基酸序列如SEQ ID NO: 52所示;
可选地,所述功能结构域通过连接子序列分别与Cas9失活突变体的N-端和C-端连接;进一步地,所述功能结构域通过氨基酸序列如SEQ ID NO: 50和SEQ ID NO: 51所示的连接子分别与Cas9失活突变体的N-端和C-端连接;
可选地,所述融合蛋白的N-末端和/或C-末端融合至少1个核定位序列;
可选地,所述融合蛋白能够与指导多核苷酸形成复合物,所述指导多核苷酸包含指导序列,所述指导序列被工程化以指导所述复合物序列特异性结合至双链靶DNA并对所述靶DNA进行切刻;进一步地,所述指导多核苷酸为单分子指导多核苷酸或双分子指导多核苷酸;进一步地,所述指导多核苷酸由CRISPR-Cas9系统中的crRNA和tracrRNA嵌合形成单分子指导多核苷酸或者所述指导多核苷酸是由CRISPR-Cas9系统中的crRNA和tracrRNA这2个分离的分子组成的组,所述crRNA由指导序列和同向重复序列组成。
本发明一些实施方案中,所述融合蛋白包含如SEQ ID NO: 3所示的氨基酸序列。
本发明一些具体实施方案中,所述融合蛋白的氨基酸序列如SEQ ID NO: 3所示。
本发明的第二方面提供一种核糖核蛋白复合物(RNP复合物),所述RNP复合物包括指导多核苷酸和如第一方面所述的融合蛋白。
本发明一些实施方案中,所述指导多核苷酸指导所述核糖核蛋白复合物序列特异性结合靶核酸。
本发明一些实施方案中,所述指导多核苷酸包含指导序列,所述指导序列通过工程化以指导所述核糖核蛋白复合物序列特异性结合靶核酸。
本发明一些较佳实施方案中,所述指导多核苷酸还包含骨架序列;所述骨架序列与所述融合蛋白的dCas9部分相互作用,或所述骨架序列使所述指导多核苷酸与所述融合蛋白形成复合物。
本发明一些实施方案中,所述指导多核苷酸为单分子指导多核苷酸或双分子指导多核苷酸。
本发明的第三方面提供一种基因编辑系统,所述基因编辑系统包括:
(1)如第一方面所述的融合蛋白,或编码其的核酸;和/或,
(2)指导多核苷酸,或编码其的核酸。
本发明一些实施方案中,所述指导多核苷酸指导所述融合蛋白序列特异性结合靶核酸。
本发明一些实施方案中,所述指导多核苷酸包含指导序列,所述指导序列通过工程化以指导所述核糖核蛋白复合物序列特异性结合靶核酸。
本发明一些较佳实施方案中,所述指导多核苷酸还包含骨架序列;所述骨架序列使所述指导多核苷酸与所述融合蛋白形成复合物。
本发明一些实施方案中,所述基因编辑系统包含1种、2种、3种、4种、5种、6种、7种、8种、9种、10种或更多种不同的融合蛋白。本发明一些实施方案中,所述基因编辑系统包含1个融合蛋白。
本发明一些实施方案中,所述基因编辑系统包含至少2种不同的指导多核苷酸。
本发明一些实施方案中,所述基因编辑系统包含1种、2种、3种、4种、5种、6种、7种、8种、9种、10种或更多种不同的指导多核苷酸。本发明一些实施方案中,所述基因编辑系统包含2种不同的指导多核苷酸。
本发明一些实施方案中,所述不同的指导多核苷酸之间指导序列不同,骨架序列相同。本发明一些实施方案中,所述不同的指导多核苷酸之间指导序列不同,骨架序列不同。
本发明一些实施方案中,所述指导多核苷酸为单分子指导多核苷酸或双分子指导多核苷酸。本发明一些实施方案中,所述指导多核苷酸为crRNA与tracrRNA嵌合得到的单分子指导多核苷酸。本发明一些实施方案中,所述指导多核苷酸为crRNA与tracrRNA通过核苷酸序列嵌合得到的单分子指导多核苷酸。本发明一些实施方案中,所述指导多核苷酸为crRNA分子与tracrRNA分子组成的双分子指导多核苷酸。
本发明的第四方面提供一种多核苷酸,所述多核苷酸编码如第一方面所述的融合蛋白或者如第二方面所述的核糖核蛋白复合物。
本发明一些实施方案中,编码所述核糖核蛋白复合物的多核苷酸中,编码指导多核苷酸的多核苷酸与编码所述融合蛋白的多核苷酸在相同或不同的核酸链上。
本发明的第五方面提供一种表达盒,所述表达盒包含启动子以及如第四方面所述的多核苷酸;所述启动子序列调控所述编码序列的表达。
本发明的第六方面提供一种重组表达载体,所述重组表达载体包含如第四方面所述的多核苷酸,以及可选的顺式作用元件和/或反式作用因子编码基因。
本发明一些实施方案中,所述顺式作用元件选自启动子、增强子和沉默子。
本发明一些实施方案中,所述反式作用因子编码基因选自编码聚合酶、转录因子和/或转录调控因子的核苷酸。
本发明的第七方面提供一种组合物,所述组合物包括递送载体,以及如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒和/或如第六方面所述的重组表达载体。
本发明的第八方面提供一种重组细胞,所述重组细胞包含如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体和/或第七方面所述的组合物。
本发明的第九方面提供一种药物组合物,所述药物组合物包含如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物和/或如第八方面所述的重组细胞,以及任选地药学上可接受的载体和/或辅料。
本发明的第十方面提供一种试剂盒,所述试剂盒包含如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物、如第八方面所述的重组细胞和/或如第九方面所述的药物组合物。
本发明的第十一方面提供一种如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物、如第八方面所述的重组细胞、如第九方面所述的药物组合物和/或如第十方面所述的试剂盒在制备诊断、预防和/或治疗与靶核酸相关的疾病或病症的药物中的应用。
本发明的第十二方面提供一种诊断、预防和/或治疗与靶核酸相关的疾病或病症的方法,所述方法包括向有需要的患者施用如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物、如第八方面所述的重组细胞、如第九方面所述的药物组合物和/或如第十方面所述的试剂盒。
本发明的第十三方面提供一种如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物、如第八方面所述的重组细胞、如第九方面所述的药物组合物和/或如第十方面所述的试剂盒,所述融合蛋白、核糖核蛋白复合物、基因编辑系统、多核苷酸、表达盒、重组表达载体、组合物、重组细胞、药物组合物或试剂盒用于诊断、预防和/或治疗与靶核酸相关的疾病或病症。
本发明的第十四方面提供一种体外、离体或体内编辑靶核酸的方法,所述方法包括将如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物、如第八方面所述的重组细胞、如第九方面所述的药物组合物和/或如第十方面所述的试剂盒与靶核酸接触的步骤,使所述靶核酸的序列发生变化或改变所述靶核酸的表达水平。
本发明的一个示例中,所述方法包括将如本发明所述的第一融合蛋白、第二融合蛋白、第一指导多核苷酸及第二指导多核苷酸与双链靶核酸接触的步骤,使所述靶核酸的序列发生变化或改变所述靶核酸的表达水平;
其中,第一所述融合蛋白可与第一指导多核苷酸一起结合至双链靶核酸的其中一条单链,第二所述融合蛋白可与第二指导多核苷酸一起结合至所述靶核酸的另外一条单链;
第一所述融合蛋白和第二所述融合蛋白的FokI域在双链靶核酸上存在间隔序列且可形成二聚体,所述间隔序列的长度为1-100bp,所述二聚体在第一所述融合蛋白、第一指导多核苷酸、第二所述融合蛋白及第二指导多核苷酸与靶核酸结合时可对所述双链靶核酸进行切割。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明所用试剂和原料均市售可得。
本发明的积极进步效果在于:
含本发明的融合蛋白的基因编辑系统的编辑效率高,脱靶风险低。
附图说明
图1为在dCas9蛋白内部替换入具有单链核酸切刻能力的FokI结构域示意图。
图2为双gRNA引导dCas9-FokI靶向切割两条单链,进而形成双链断裂的示意图;
图中的核苷酸序列如SEQ ID NO: 32所示,氨基酸序列如SEQ ID NO: 33所示。
图3为dCas9-FokI融合蛋白编辑后的流式检测结果示意图。
图4为不同重组蛋白靶向报告系统的编辑效率示意图。
图5为不同重组蛋白靶向内源基因的编辑效率示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
术语
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的分子遗传学、核酸化学、化学、分子生物学、生物化学、细胞培养、微生物学、细胞生物学、基因组学和重组DNA等操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
在本发明中,氨基酸序列中的字母表示本领域公知的氨基酸的单字母缩写,例如J. Biol. Chem, 243, p3558(1968)中所述:丙氨酸:Ala-A、精氨酸:Arg-R、天冬氨酸:Asp-D、半胱氨酸:Cys-C、谷氨酰胺:Gln-Q、谷氨酸:Glu-E、组氨酸:His-H、甘氨酸:Gly-G、天冬酰胺:Asn-N、酪氨酸:Tyr-Y、脯氨酸:Pro-P、丝氨酸:Ser-S、甲硫氨酸:Met-M、赖氨酸:Lys-K、缬氨酸:Val-V、异亮氨酸:Ile-I、苯丙氨酸:Phe-F、亮氨酸:Leu-L、色氨酸:Trp-W、苏氨酸:Thr-T。
在本发明中,以SpCas9蛋白为例,位点所表示的数字指的是对应到野生型SpCas9蛋白氨基酸序列SEQ ID NO: 1上的氨基酸残基的位置。在本发明中,位点前的字母表示原氨基酸残基,位点后的字母表示取代后的氨基酸残基。
在本发明中,术语“同一性”(identity或percent identity)用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子中的每一个的某个位置都被腺嘌呤占据,或两个多肽中的每一个的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分比序列同一性”(percent identity)是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100%的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的序列同一性。通常,在将两个序列比对以产生最大序列同一性时进行比较。这样的比对可通过使用已公开和可商购的比对算法和程序,诸如但不限于Clustal Ω、MAFFT、Probcons、T-Coffee、Probalign、BLAST,本领域的普通技术人员可合理选择使用。本领域技术人员能确定用于比对序列的适宜参数,例如包括对所比较序列全长实现较优比对或最佳对比所需要的任何算法,以及对所比较序列的局部实现较优比对或最佳对比所需要的任何算法。
本发明中,序列的比较和两个序列之间的百分比同一性的测定可使用数学算法来实现。在一些情况下,两个氨基酸序列之间的百分比同一性使用Needleman和Wunsch((1970) J .Mol .Biol .48:444-453)算法,使用Blossum 62评分矩阵,利用为12的缺口罚分、为4的缺口延伸罚分和为5的移码缺口罚分来测定,该算法已被整合进GCG软件包中的GAP程序。
Cas9蛋白与基因编辑
Cas9蛋白是CRISPR II型系统中常见的Cas蛋白,一些野生型的Cas9已检测到核酸酶活性,能够切割核酸或核酸链。Cas9蛋白通常能够与指导多核苷酸形成RNP复合物并被指导多核苷酸牵引至切割位点。
许多物种的Cas9分子可用于本文所述的融合蛋白。虽然化脓性链球菌和金黄色葡萄球菌Cas9分子是本文中的许多公开内容的主题,但同样地可使用本文中所列的其它物种的Cas9分子、来源于或基于所述物种的Cas9蛋白的Cas9分子。换句话说,虽然本文中的许多描述使用化脓性链球菌和金黄色葡萄球菌Cas9分子,但来自其它物种的Cas9分子可替代它们。
基因编辑是基于多种基因编辑工具实现的对单个碱基或核酸链进行的编辑,从而在分子水平上改变原始的核酸。因此,基因编辑包括了单碱基编辑,也包括核酸链的编辑。如本文所用,术语“单碱基”是指核酸序列内的一个且仅一个核苷酸。当在单碱基编辑的上下文中使用时,其是指用不同的碱基替代核酸序列内特定位置的碱基。这样的替代可以通过许多机制发生,包括但不限于取代或修饰。
如本文所使用,术语“切刻(nicking)”是指在核酸链上断开链间或核苷酸间的键,从而在单链或双链核酸上产生缺口。术语“切割”是指在双链核酸上至少断开链间的键,或者至少断开单链核酸上核苷酸间的键,从而在切割位点上下游的核酸链完全分开。
FokI域
FokI是包括DNA识别结构域和催化(内切核酸酶)结构域的II型限制性内切核酸酶。本文所述的融合蛋白可包括完整的FokI,或仅仅包括FokI的核酸酶结构域,例如,基因库登录号AAA24927 .1的氨基酸388-583或408-583,例如,如Li等,Nucleic Acids Res .39(1):359–372(2011);Cathomen和Joung ,Mol .Ther .16:1200–1207(2008)中描述的,或如Miller等Nat Biotechnol 25:778–785(2007) ;Szczepek等,Nat Biotechnol 25:786–793(2007) ;或Bitinaite等,Proc .Natl .Acad .Sci .USA .95:10570–10575(1998)中描述的FokI的突变形式。
所述FokI域可以是野生型FokI核酸内切酶的DNA切割结构域;所述FokI域可以是野生型FokI核酸内切酶的DNA切割结构域的突变体,包括但不限于单点突变体及多点突变体。在一些实施方案中,2个所述FokI域之间可形成二聚体。在一些实施方案中,2个所述FokI域之间无法形成二聚体。在一些实施方案中,2个所述FokI域之间二聚化之后才具备核酸酶活性。在一些实施方案中,2个所述FokI域之间二聚化之后才能切割靶核酸。在一些实施方案中,所述FokI域不需二聚化即可切割靶核酸。在一些实施方案中,所述FokI域不需二聚化即具备核酸酶活性。
指导多核苷酸
如本文中所使用的,术语“指导多核苷酸”用于指CRISPR-Cas系统中与Cas蛋白形成CRISPR复合物并将CRISPR复合物引导至靶核酸的分子。通常情况下,指导多核苷酸包含与指导序列连接的骨架序列,指导序列可以与靶核酸序列杂交。骨架序列通常包含同向重复序列,有时还可包含tracrRNA序列。所述同向重复序列与指导序列组成crRNA。
在一些实施方案中,所述指导多核苷酸是指导RNA。在一些实施方案中,所述指导多核苷酸是指导DNA。在一些实施方案中,所述指导多核苷酸的至少1个碱基为DNA碱基。在一些实施方案中,所述指导多核苷酸是化学修饰的指导多核苷酸。在一些实施方案中,所述指导多核苷酸包含至少一个化学修饰的核苷酸。
在一些实施方案中,所述指导多核苷酸包含与至少一个同向重复序列(directrepeat,DR)连接的至少一个指导序列(guide sequence,也称为间隔序列spacersequence)。在一些实施方案中,所述指导序列位于骨架序列的3'端。在一些实施方案中,所述指导序列位于骨架序列的5'端。
在一些实施方案中,所述同向重复序列包含至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个或至少60个核苷酸。在一些实施方案中,所述同向重复序列包含不超过70个核苷酸、不超过60个核苷酸、不超过55个核苷酸、不超过50个核苷酸、不超过45个核苷酸、不超过40个核苷酸、不超过35个核苷酸、不超过30个核苷酸、不超过25个核苷酸、不超过20个核苷酸或不超过15个核苷酸。在一些实施方案中,所述同向重复序列包含5-70个核苷酸、5-50个核苷酸、5-30个核苷酸、5-20个核苷酸、5-15个核苷酸、10-40个核苷酸、10-30个核苷酸、10-20个核苷酸或10-15个核苷酸。
在一些实施方案中,所述tracrRNA序列包含至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个或至少80个核苷酸。在一些实施方案中,所述tracrRNA序列包含不超过120个核苷酸、不超过110个核苷酸、不超过100个核苷酸、不超过90个核苷酸、不超过80个核苷酸、不超过70个核苷酸、不超过60个核苷酸、不超过55个核苷酸、不超过50个核苷酸、不超过45个核苷酸、不超过40个核苷酸、不超过35个核苷酸、不超过30个核苷酸、不超过25个核苷酸、不超过20个核苷酸或不超过15个核苷酸。在一些实施方案中,所述同向重复序列包含10-120个核苷酸、20-100个核苷酸、30-90个核苷酸、40-80个核苷酸、40-70个核苷酸、50-70个核苷酸或60-70个核苷酸。
在一些实施方案中,所述指导序列包含至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少21个核苷酸、至少22个核苷酸、至少23个核苷酸、至少24个核苷酸、至少25个核苷酸、至少26个核苷酸、至少27个核苷酸、至少28个核苷酸、至少29个核苷酸、或至少30个核苷酸。在一些实施方案中,所述指导序列包含不超过60个核苷酸、不超过55个核苷酸、不超过50个核苷酸、不超过45个核苷酸、不超过40个核苷酸、不超过35个核苷酸、不超过30个核苷酸、不超过25个核苷酸或不超过20个核苷酸。在一些实施方案中,所述指导序列包含15-60个核苷酸、15-40个核苷酸、15-30个核苷酸、15-25个核苷酸或17-25个核苷酸。
在一些实施方案中,所述指导序列与所述靶核酸具有足够的互补性以与所述靶核酸杂交并指导本发明的融合蛋白与所述靶核酸的序列特异性结合。在一些实施方案中,所述指导序列与所述靶核酸具有100%的互补性,但所述指导序列可以与所述靶核酸DNA具有小于100%的互补性,例如至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的互补性。
在一些实施方案中,所述指导序列被工程化以与所述靶核酸杂交,错配不超过两个核苷酸。在一些实施方案中,所述指导序列被工程化以与所述靶核酸杂交,且错配不超过一个核苷酸。在一些实施方案中,所述指导序列被工程化以与所述靶核酸杂交,有或没有错配。
所述指导多核苷酸可以是单分子或双分子。指导多核苷酸序列可以是RNA序列、DNA序列或其组合(RNA-DNA组合序列)。任选地,指导多核苷酸可以包含至少一种核苷酸、磷酸二酯键或连接修饰,例如但不限于锁核酸(LNA)、5-甲基dC、2,6-二氨基嘌呤、2′-氟代A、2′-氟代U、2′-O-甲基RNA、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18(六乙二醇链)分子的连接、或导致环化的5′至3′共价连接。
所述指导多核苷酸可以为单分子指导多核苷酸或双分子指导多核苷酸。非限制性示例例如,所述指导多核苷酸由CRISPR-Cas9系统中的crRNA和tracrRNA嵌合(例如通过GAAA序列连接)形成单分子指导多核苷酸(sgRNA)。再例如,所述指导多核苷酸是由CRISPR-Cas9系统中的crRNA和tracrRNA这2个分离的分子组成的组,即为所述的双分子。
指导多核苷酸指导核糖核蛋白复合物与靶DNA的序列特异性结合的能力可以通过任何合适的测定来评估。例如,可以将足以形成核糖核蛋白复合物的CRISPR系统的组分,包括待测试的指导多核苷酸,提供给具有相应靶核酸DNA分子的宿主细胞,例如通过编码核糖核蛋白复合物的组分的载体的转染,然后评估靶序列内的优先切割。类似地,可以在试管中评估靶核酸DNA序列的切割,方法是提供靶核酸DNA、核糖核蛋白复合物的组分,包括待测试的指导多核苷酸和不同于测试指导多核苷酸的对照指导多核苷酸,并比较待测试和对照指导多核苷酸之间结合靶核酸DNA的能力或切割靶DNA的速率。核糖核蛋白复合物切割靶核酸或靶DNA的能力也可以通过上述的测定来评估。
基因编辑系统
本披露所述的基因编辑系统包括但不限于用于以下用途的系统:用于切割靶核酸,用于在靶核酸上引入碱基转换,抑制或降低靶核酸上特定基因的表达,激活或提高靶核酸上特定基因的表达,可视化或检测靶核酸,掩蔽靶核酸上的特定基因,沉默靶核酸上的特定基因。
载体系统
本披露的另一方面涉及包含本文所述的融合蛋白的载体系统,所述载体系统包含一个或多个载体(表达载体),所述载体包含编码所述融合蛋白的多核苷酸序列和编码所述指导多核苷酸的多核苷酸序列。或者,所述载体包含编码所述融合蛋白的多核苷酸序列。
在一些实施方案中,所述载体系统包含至少一个质粒或病毒载体(例如,逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒)。在一些实施方案中,所述编码融合蛋白的多核苷酸序列和所述编码指导多核苷酸的多核苷酸序列位于同一载体上。在一些实施方案中,所述编码融合蛋白的多核苷酸序列和所述编码指导多核苷酸的多核苷酸序列位于2个或更多个载体上。
在一些实施方案中,所述编码融合蛋白的多核苷酸序列和/或所述编码指导多核苷酸的多核苷酸序列可操作地连接至调节元件。调节元件包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如,转录终止信号,如多腺苷酸化信号和poly-U序列)。调节元件包括使核苷酸序列在许多类型的宿主细胞中组成型表达的调节元件,以及使核苷酸序列仅在某些宿主细胞中表达的调节元件(例如,组织特异性调节序列)。组织特异性启动子可以主要在所需的感兴趣组织中直接表达,例如肌肉、神经元、骨、皮肤、血液、特定器官(例如肝脏、胰腺)、或特定的细胞类型(例如淋巴细胞)。调节元件还可以以时间依赖性方式指导表达,例如以细胞周期依赖性或发育阶段依赖性方式,其也可能是或可能不是组织或细胞类型特异性的。在一些实施例中,所述调节元件是增强子元件,例如WPRE、CMV增强子、HTLV-1的LTR中的R-U5区段、SV40增强子、或兔β-珠蛋白外显子2和3之间的内含子序列。
在一些实施方案中,所述载体包含pol III启动子(例如,U6和H1启动子)、pol II启动子(例如,逆转录病毒Rous肉瘤病毒(RSV)LTR启动子(任选地带有RSV增强子)、巨细胞病毒(CMV)启动子(任选地带有CMV增强子)、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、或EF1α启动子),或pol III启动子和pol II启动子。
在一些实施方案中,所述启动子是组成型启动子,其是连续活性的并且不受外部信号或分子的调节。合适的组成型启动子包括但不限于CMV、RSV、SV40、EF1α、CAG和β-肌动蛋白启动子。在一些实施方案中,所述启动子是受外部信号或分子(例如,转录因子)调节的诱导型启动子。
在一些实施方案中,所述启动子是组织特异性启动子,其可用于驱动融合蛋白的组织特异性表达。合适的肌肉特异性启动子包括但不限于CK8、MHCK7、肌红蛋白启动子(Mb)、结蛋白(Desmin)启动子、肌肉肌酸激酶启动子(MCK)及其变体,以及SPc5-12合成启动子。合适的免疫细胞特异性启动子包括但不限于B29启动子(B细胞)、CD14启动子(单核细胞)、CD43启动子(白细胞和血小板)、CD68(巨噬细胞)和SV40/CD43启动子(白细胞和血小板)。合适的血细胞特异性启动子包括但不限于CD43启动子(白细胞和血小板)、CD45启动子(造血细胞)、INF-β(造血细胞)、WASP启动子(造血细胞)、SV40/CD43启动子(白细胞和血小板),和SV40/CD45启动子(造血细胞)。合适的胰腺特异性启动子包括但不限于弹性蛋白酶-1启动子。合适的内皮细胞特异性启动子包括但不限于Fit-1启动子和ICAM-2启动子。合适的神经元组织/细胞特异性启动子包括但不限于GFAP启动子(星形胶质细胞)、SYN1启动子(神经元)和NSE/RU5'(成熟神经元)。合适的肾特异性启动子包括但不限于NphsI启动子(足细胞)。合适的骨特异性启动子包括但不限于OG-2启动子(成骨细胞、成牙本质细胞)。合适的肺特异性启动子包括但不限于SP-B启动子(肺)。合适的肝脏特异性启动子包括但不限于SV40/Alb启动子。合适的心脏特异性启动子包括但不限于α-MHC。
AAV载体
本披露的另一方面涉及包含本文所述的融合蛋白或基因编辑系统的腺相关病毒(AAV)载体,其中所述腺相关病毒(AAV)载体包含编码本文所述的融合蛋白和指导多核苷酸的DNA。
通过AAV载体递送CRISPR-Cas系统在Maeder et al., Nature Medicine 25:229-233 (2019) 中进行了描述,经临床证明视网膜下递送AAV安全性和有效性,通过视网膜下注射的局部递送、AAV5对光感受器细胞的自然嗜性以及光感受体特异性GRK1启动子的使用都用于将CRISPR/Cas系统的表达仅限于治疗靶组织和细胞类型,其通过引用整体并入本文。在一些实施方案中,所述AAV载体包含ssDNA基因组,该基因组包含侧接ITR的融合蛋白和指导多核苷酸的编码序列。
在一些实施方案中,本文所述的融合蛋白或基因编辑系统被包装在AAV载体中,例如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9和AAVrh74。在一些实施方案中,本文所述的融合蛋白或基因编辑系统被包装在AAV载体中,该AAV载体包含具有组织嗜性的工程化衣壳,例如工程化肌肉嗜性衣壳。Tabebordbar et al., Cell 184:4919-4938 (2021)中描述了通过定向进化对具有组织趋向性的AAV衣壳进行工程改造,鉴定了一类含RGD基序的衣壳,全身注射MyoAAV可高效转导灵长类动物肌肉,该文献通过引用整体并入本文。
脂质纳米粒
本披露的另一方面涉及脂质纳米粒(LNP),其包含本文所述的基因编辑系统,其中所述LNP包含本文所述的指导多核苷酸和编码本文所述的融合蛋白的mRNA。
Gillmore et al., N. Engl. J. Med., 385:493-502 (2021)中描述了CRISPR-Cas系统的LNP递送,脂质纳米颗粒(LNP)由4种脂质组成,所述4种脂质包括专有的可离子化脂质LP000001;DSPC;胆固醇和DMG-PEG2k,LNP悬浮液配制在Tris、NaCl和蔗糖的水性缓冲液中,pH 7.4,其全文以引用方式并入本文。在一些实施方案中,除了RNA有效负载(mRNA和指导多核苷酸)之外,脂质纳米粒(LNP)还包含四种组分:阳离子或可电离脂质、胆固醇、辅助脂质和PEG-脂质。在一些实施方案中,所述阳离子或可电离脂质包括 cKK-E12、C12-200、ALC-0315、DLin-MC3-DMA、DLin-KC2-DMA、FTT5、Moderna SM-102和Intellia LP01。在一些实施方案中,所述PEG-脂质包含PEG-2000-C-DMG、PEG-2000-DMG或ALC-0159。在一些实施方案中,所述辅助脂质包括DSPC。LNP的组分在Paunovska et al., Nature ReviewsGenetics 23:265-280 (2022)中进行了描述,FDA批准的LNP含有四种基本成分的变体:阳离子或可电离脂质、胆固醇、辅助脂质和聚乙二醇(PEG)脂质,该文献通过引用整体并入本文。
慢病毒载体
本披露的另一方面涉及包含本文所述基因编辑系统的慢病毒载体,其中所述慢病毒载体包含本文所述的指导多核苷酸和编码本文所述的融合蛋白的mRNA。在一些实施方案中,所述慢病毒载体是用同源或异源包膜蛋白如VSV-G假型化的。在一些实施方案中,所述编码融合蛋白的mRNA与适体序列连接。
RNP复合物
本披露的另一方面涉及包含本文所述的核糖核蛋白复合物,其中所述核糖核蛋白复合物由本文所述的指导多核苷酸和融合蛋白形成。在一些实施方案中,可以通过显微注射或电穿孔将所述核糖核蛋白复合物递送至真核细胞、哺乳动物细胞或人类细胞。在一些实施方案中,所述核糖核蛋白复合物可以包装在病毒样颗粒中并在体内递送至哺乳动物或人类受试者。
病毒样颗粒
本披露的另一方面涉及包含本文所述的基因编辑系统的病毒样颗粒(VLP),其中所述病毒样颗粒包含本文所述的指导多核苷酸和融合蛋白或由所述指导多核苷酸和融合蛋白组成的核糖核蛋白复合物。
Banskota et al. Cell 185(2):250-265 (2022)报道了高效包装和递送碱基编辑器或Cas9核糖核蛋白的无DNA病毒样颗粒(eVLPs)的开发和应用;Mangeot et al.,Nature Communications 10(1):1-15 (2019)使用负载Cas9-sgRNA核糖核蛋白的经过工程改造的小鼠白血病病毒样颗粒(Nanoblades)在细胞系和原代细胞(包括人诱导多能干细胞、人造血干细胞和小鼠骨髓细胞)中诱导高效的基因组编辑;Campbell, et al.,Molecular Therapy 27:151-163 (2019)利用一种被称为“gesicle”的特化细胞外囊泡,以核糖核蛋白形式有效但短暂地递送靶向HIV长末端重复序列(LTR)的Cas9,Gesicles是通过表达水疱性口炎病毒糖蛋白和包装蛋白(作为其货物)来产生,因此无需进行转基因递送,从而可以更精细地控制Cas9表达和Mangeot et al. Molecular Therapy, 19(9):1656-1666 (2011)报道了水泡性口腔炎病毒(VSV-G)的刺突糖蛋白在人类细胞中的过表达诱导了名为gesicles的融合性小泡的释放,生物化学和功能研究表明,神经胶质细胞结合了来自生产细胞的蛋白质,并可以将其输送到受体细胞,这种蛋白质转导方法允许靶细胞中细胞质、细胞核或表面蛋白质的直接转运。这些文献均描述了工程化VLP,其全文以引用方式并入本文。
在一些实施方案中,工程化的病毒样颗粒(VLP)是用同源或异源包膜蛋白例如VSV-G假型化的。在一些实施方案中,所述融合蛋白通过可切割连接子与gag蛋白(例如MLVgag)融合,其中靶细胞中接头的切割暴露了位于连接子和融合蛋白之间的NLS。在一些实施方案中,所述融合蛋白或缀合物包含(例如,从5'到3')gag蛋白(例如,MLVgag)、一种或多种NES、可切割连接子、一种或多种NLS、和Cas12,如Banskota et al. Cell 185(2):250-265(2022)所述。
在一些实施方案中,所述融合蛋白与第一二聚化结构域融合,所述第一二聚化结构域能够与融合至膜蛋白的第二二聚化结构域二聚化或异二聚化,其中配体的存在促进所述二聚化并富集Cas12蛋白或融合蛋白或缀合物至VLP中,如Campbell, et al.,Molecular Therapy 27:151-163 (2019)中所述。
细胞
本披露的另一方面涉及包含本文所述的融合蛋白及含其的基因编辑系统的细胞。细胞(例如,其可用于产生无细胞系统)可以是真核或原核的。此类细胞的实例包括但不限于细菌、古细菌、植物、真菌、酵母、昆虫和哺乳动物细胞,例如乳杆菌、乳球菌、芽孢杆菌(例如枯草芽孢杆菌)、埃希氏菌属(例如大肠杆菌)、梭菌属、酵母菌属或毕赤酵母属(如酿酒酵母或巴斯德毕赤酵母),乳酸克鲁维酵母、鼠伤寒沙门氏菌、果蝇细胞、秀丽隐杆线虫细胞、非洲爪蟾细胞、SF9细胞、C129细胞、293细胞、脉孢菌和永生化哺乳动物细胞系(例如,Hela细胞、骨髓细胞系和淋巴样细胞系)。
在一些实施方案中,所述细胞是原核细胞,例如细菌细胞,例如大肠杆菌。在一些实施方案中,细胞是真核细胞,例如哺乳动物细胞或人类细胞。在一些实施方案中,细胞是原代真核细胞、干细胞、肿瘤/癌细胞、循环肿瘤细胞(CTC)、血细胞(例如,T细胞、B细胞、NK细胞、Tregs等)、造血干细胞、特化免疫细胞(如肿瘤浸润淋巴细胞或肿瘤抑制淋巴细胞)、肿瘤微环境中的基质细胞(如癌症相关成纤维细胞等)。在一些实施方案中,细胞是中枢或外周神经系统的脑或神经元细胞(例如,神经元、星形胶质细胞、小胶质细胞、视网膜神经节细胞、视杆/视锥细胞等)。
靶核酸或靶DNA
本文所述的融合蛋白及含其的基因编辑系统可用于靶向一种或多种靶核酸,例如靶DNA分子,例如存在于生物样品、环境样品(例如土壤、空气或水样品)等中的靶DNA分子。
在一些实施方案中,所述靶核酸为疾病相关基因或信号传导生化途径相关基因,或所述靶核酸为报告基因。此类靶核酸的非限制性实例,包括分别提交于2012年12月12日和2013年1月2日的美国临时专利申请61/736,527和61/748,427、提交于2013年12月12日的国际申请PCT/US2013/074667中所列举的那些,其全部通过引用并入本文。
治疗应用
本发明公开了包含所述融合蛋白或基因编辑系统的组合物和药物组合物。在一些实施方案中,将药物组合物体内递送至人类受试者。所述药物组合物可以通过任何有效途径递送。示例性给药途径包括但不限于静脉内输注、静脉内注射、腹膜内注射、肌肉内注射、瘤内注射、皮下注射、皮内注射、心室内注射、血管内注射、小脑内注射、眼内注射、视网膜下注射、玻璃体内注射、前房内注射、鼓室内注射、鼻内给药和吸入。
如本文所用,术语“有效量”是指包含达到临床有益结果(即,例如,减轻症状)的治疗剂的药物组合物的特定量。这样的组合物的毒性和治疗功效可通过细胞培养或实验动物中的标准药学程序来确定,例如用于确定LD50(使群体的50%死亡的剂量)和ED50(在50%的群体中治疗有效的剂量)。毒性和治疗效果之间的剂量比是治疗指数,并且其可以表示为比率LD50/ED50。表现出高治疗指数的化合物是优选的。从这些细胞培养测定和其他动物研究中获得的数据可用于配制用于人类使用的一系列剂量。这样的化合物的剂量优选在包括几乎没有或没有毒性的ED50的循环浓度的范围内。取决于所采用的剂型、患者的敏感性和施用途径,剂量在此范围内变化。
如本文所用,术语“疾病”或“病症”是指活动物体或植物体或其部分之一的正常状态的任何中断或改变重要功能的执行的损害。通常表现为明显的体征和症状,其通常是针对以下的反应:i)环境因素(如营养不良、工业危害或气候);ii)特定的传染物(如蠕虫、细菌或病毒);iii)有机体的固有缺陷(如遗传异常);和/或iv)这些因素的组合。
如本文所用,术语“施用”或“给药”是指向患者提供组合物以使该组合物对患者具有预期作用的任何方法。示例性的施用方法是通过直接机制例如局部组织施用(即,例如血管外放置)、口服、透皮贴剂、局部、吸入、栓剂等。
如本文所用,术语“患者”或“受试者”是人或动物,并且不需要是住院的。例如,门诊患者、疗养院中的人是“患者”。患者可以包括任何年龄的人类或非人类动物,因此包括成年和未成年人(即儿童)。术语“患者”并不意味着需要医学治疗,因此,患者可以自愿或非自愿地参与实验,无论是临床的还是支持基础科学研究。
实施例1:不同dCas9-FokI融合蛋白的设计及载体质粒构建
为将FokI核酸酶结构域插入到dCas9蛋白内部,通过生物信息学分析以及AI手段预测和模拟dCas9蛋白可能的不同插入位点,在预测可能不影响dCas9结合DNA能力的前提下插入或替换入具有单链核酸切刻能力的FokI结构域。具体而言,在PyMOL上标记SpCas9的无规则卷曲,将标记无规则卷曲区域大于3aa位置进行统计,然后再标记对应的结构域。将dSpCas9的无规则卷曲序列替换为FokI域。第一优先级考虑在RuvC区域内将氨基酸序列替换为FokI域;第二优先级考虑无规则卷曲的长度越长时,插入的FokI域对于SpCas9的整体结构的潜在影响可能越小,因此优先级越高。据此设计得到dCas9-FokI-S1-S10融合蛋白。
如图1和表1所示。利用分子生物学方法构建不同dCas9-FokI融合蛋白的载体质粒。
本实施例基于SpCas9(SEQ ID NO: 1)确定dCas9的氨基酸序列,如SEQ ID NO: 2所示。
* 表示在所述位置替换入带linker的FokI结构域(SEQ ID NO: 4),SEQ ID NO :4
所示序列的第6位-第201位氨基酸序列为FokI结构域(SEQ ID NO: 52)。
** SpCas9(SEQ ID NO: 1)的结构域划分参考文章Zhu, X., et al. Cryo-EMstructures reveal coordinated domain motions that govern DNA cleavage byCas9. Nat Struct Mol Biol 26, 679–685 (2019). https://doi.org/10.1038/s41594-019-0258-2。
表达载体pCDNA3.1(+)(淼灵生物,P0157)质粒经Acc65I和EcoRI双酶切后,琼脂糖凝胶电泳切胶回收线性化的载体。
以FokI-dCas9(淼灵生物,P5109)为模板,使用表2中FokI-PF1和FokI-PR1引物对进行PCR扩增,获得FokI编码序列(SEQ ID NO: 5),该序列编码所述带linker的FokI结构域。
以pCDNA3.1-dCas9(淼灵生物,P15213)为模板,以表3中不同融合蛋白编码序列片段的扩增引物组合(引物序列如表2所示)进行PCR扩增,获得不同的片段。
将不同的融合蛋白编码序列、FokI编码序列以及线性化的载体利用GibsonAssembly® Master Mix(NEB)进行同源重组,将融合蛋白编码序列整合到载体pCDNA3.1(+)的克隆区,构建得到编码表1中不同结构融合蛋白(dCas9-FokI-S1至dCas9-FokI-S10)的重组载体。比如pCDNA3.1(+)线性化载体+片段S1-F2+FokI编码序列+片段S1-F1同源重组构建得到dCas9-FokI-S1载体。
反应液转化Stbl3感受态,涂布氨苄青霉素抗性的LB平板,37℃过夜培养后,挑取克隆测序鉴定,分别获得融合蛋白dCas9-FokI-S1至dCas9-FokI-S10的质粒载体。
dCas9-FokI-S9融合蛋白的氨基酸序列为:
MKRPAATKKAGQAKKKKDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKARGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKGGSGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFSGSETPGTSESATPESVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSAGGGGSGGGGSGGGGSGPKKKRKVAAAGS(SEQ ID NO:3)
dCas9-FokI-S1至dCas9-FokI-S8,和dCas9-FokI-S10的氨基酸序列仅是在表1所示的不同位置替换入带linker的FokI结构域,因此可类推得到。
实施例2:pCDH-CMV-EGFP-Reporter3-EF1a-Puro细胞系构建
a. 用于GFP报告系统的慢病毒表达质粒pCDH-CMV-EGFP-Reporter3-EF1a-Puro的构建
基因合成包含检测系统的EGFP编码序列,利用XbaI+NotI酶切合成片段,然后与pCDH-CMV-MCS-EF1-Puro(优宝生物,VT1480)XbaI+NotI酶切的载体利用T4 DNA连接酶(Thermo Scientific™,EL0012)进行连接,转化Stbl3,涂布含氨苄青霉素的平板,37℃过夜培养后,挑取克隆测序鉴定,获得pCDH-CMV-EGFP-Reporter3-EF1a-Puro载体(SEQ IDNO: 30)。
合成的EGFP编码序列如下:
Tctagagcgagaaaagccttgtttgccaccatggaacggctcggagatcatcattgcgtcgcgaggtg agcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccaagctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtaagcggccgc(SEQ ID NO: 31)
划线部分即为两个gRNA的靶向位点。
b. 慢病毒包装
测序鉴定的pCDH-CMV-EGFP-Reporter3-EF1a-Puro质粒与病毒包装辅助质粒pMD2.G(淼灵生物,P0262)以及psPAX2(淼灵生物,P0261)按照1:1:1的摩尔比混合,利用PEI转染293T细胞。转染48h,取培养上清,0.45µm滤膜过滤后获得pCDH-CMV-EGFP-Reporter3-EF1a-Puro粗病毒。
c. 病毒感染293T细胞构建检测细胞系
向培养基中添加1/4体积的pCDH-CMV-EGFP-Reporter3-EF1a-Puro粗病毒对293T细胞进行感染,感染48h后换液,添加2ug/ml的Puromycin进行筛选。筛选后的细胞利用有限稀释进行单克隆筛选,筛选到的单克隆即为检测用细胞系。
实施例3:不同结构dCas9-FokI融合蛋白编辑效率测试
由于FokI只能针对DNA单链进行切刻,发明人利用双gRNA指导dCas9与FokI的融合蛋白针对DNA双链进行切割。切割后的DNA在细胞内发生NHEJ修复,从而导致部分细胞GFP基因产生正常的读码框(如图2所示),从而发出荧光,通过流式细胞仪检测发出绿色荧光的细胞比例即可表征不同dCas9与FokI的融合蛋白的编辑效率。
gRNA载体构建
通过酶切-连接酶连接的方法,引入指导序列编码序列,获得gRNA1-SpCas9-pUC57Kan(SEQ ID NO: 34)以及gRNA2-SpCas9-pUC57Kan(SEQ ID NO: 35)2个gRNA表达载体,可由U6启动子驱动表达gRNA1或gRNA2。所述gRNA包含靶向EGFP的指导序列,以及SpCas9对应的gRNA骨架序列。
取实施例1的dCas9-FokI-S1至S9重组质粒载体各250ng,分别与gRNA1-SpCas9-pUC57Kan质粒125ng以及gRNA2-SpCas9-pUC57Kan质粒125ng一起与100µl opti-MEM(Gibco)混合,然后添加1.5µl PEI(YEASEN)混合均匀,静置20min。然后添加至实施例2构建的检测细胞系中进行细胞转染,转染72h后收集细胞,进行流式检测。
阴性对照(NC)组为实施例2的检测细胞系,不转染CRISPR系统相关质粒。
结果如图3和表4所示。
流式结果显示,dCas9-FokI-S9编辑效率远高于dCas9-FokI-S1至dCas9-FokI-S8,以及dCas9-FokI-S10。
实施例4:dCas9-FokI-S9对照质粒以及PAMless质粒构建
采用与实施例1类似的方法构建得到dCas9-FokI-953-01质粒(SEQ ID NO: 36)、dCas9-FOKI-953-02质粒(SEQ ID NO: 37),均用于表达在dSpCas9内部融合FokI的融合蛋白。两者区别在于,dCas9-FOKI-953-01质粒表达的重组蛋白是直接在953aa-954aa之间插入FokI域;dCas9-FOKI-953-02质粒表达的重组蛋白是在953aa-954aa之间插入FokI域且FokI域末端带有连接序列,用于与Cas9序列连接。
采用与实施例1类似的方法构建得到dCas9PAMless-FokI-S9质粒(SEQ ID NO:38),用于表达在dead PAMless Cas9(SpRY变体)的内部插入FokI域的重组蛋白。
实施例5:不同结构dCas9-FokI融合蛋白编辑报告系统
将Cas9与FokI融合后得到不同的融合蛋白,按照实施例3中描述的实验方案,在报告系统上初步验证编辑效果。不同融合蛋白与gRNA组合后编辑EGFP基因,产生indel后恢复可产生荧光的EGFP的表达。通过检测eGFP的比例,从而判断融合蛋白编辑效果。
dCas9-FokI阳性对照组转染dCas9-FokI质粒(淼灵生物P5109,表达N-端融合FokI的dCas9)250ng,及gRNA1质粒和gRNA2质粒各125ng。
Cas9 nickase阳性对照组转染Cas9 nickase质粒(SEQ ID NO: 39,表达Cas9nickase)250ng,及gRNA1质粒和gRNA2质粒各125ng。
dCas9-FokI-S9组、dCas9PAMless-FokI-S9实验组、dCas9-FokI-953-01组、dCas9-FokI-953-02组转染对应的重组蛋白质粒250ng,及gRNA1质粒和gRNA2质粒各125ng。
SpCas9-gRNA1+2对照组转染pX459 V2.0质粒(表达野生型SpCas9)250ng,及gRNA1质粒和gRNA2质粒各125ng。
SpCas9-gRNA1对照组转染pX459 V2.0质粒(表达野生型SpCas9)250ng,及gRNA1质粒250ng。
SpCas9-gRNA2对照组转染pX459 V2.0质粒(表达野生型SpCas9)250ng,及gRNA2质粒250ng。
阴性对照(NC)组为实施例2的检测细胞系,不转染CRISPR系统相关质粒。
分别使用PEI、EndoFectin、Lipo2000三种转染试剂进行测试。
具体结果如表5和图4所示。可以看出,dCas9-FokI-S9融合蛋白对此报告系统的编辑效率与Cas9 nickase相当,甚至优于SpCas9,也远高于953aa位置插入或替换入FokI的融合蛋白,并优于dCas9末端融合FokI域的融合蛋白。
实施例6:dCas9-FokI-S9内源基因编辑效率测试
分别构建表达靶向HBB基因和VEGFA基因的gRNA(含SpCas9对应的gRNA骨架序列,即SEQ ID NO: 40)的质粒,U6启动子驱动表达。
gRNA的指导序列如表6所示。
取前述实施例的重组蛋白质粒250ng和本实施例的gRNA质粒250ng(使用一种gRNA质粒时用量250ng,使用两种gRNA质粒时用量各约125ng)混合好后添加1.5µl PEI,转染293T细胞。
转染72h后PBS清洗细胞一次,利用胰酶消化细胞,300 rcf离心5min收集细胞,500µl PBS重悬。取重悬的细胞50µl,添加48ul DirectPCR Lysis Reagent(Cell)以及2ul蛋白酶K进行处理,处理完的裂解液取1ul进行PCR扩增,扩增引物序列见表7。
扩增的产物进行Sanger测序,测序结果进行TIDE分析,确认编辑效率,结果见表8、图5。
TIDE分析结果显示dCas9-FokI-S9针对内源基因有较好的编辑效果,编辑效率与SpCas9相当(部分情况略优),明显优于末端融合FokI的dCas9-FokI、953aa位置插入或替换入FokI的dCas9-FokI-953-01和dCas9-FokI-953-02、以及PAMless Cas9,优于Cas9nickase。
Claims (23)
1.一种融合蛋白,其特征在于,所述融合蛋白通过将氨基酸序列如SEQ ID NO: 1所示的Cas9蛋白的核酸酶活性失活突变体的第943-952位氨基酸残基替换为功能结构域而得到;所述功能结构域为FokI域;
所述失活突变体相对SEQ ID NO: 1具有D10A和N863A突变,或D10A和H840A突变;
所述FokI域为FokI核酸内切酶的DNA切割结构域。
2.如权利要求1所述的融合蛋白,其特征在于,所述FokI域的氨基酸序列如SEQ ID NO:52所示。
3.如权利要求1所述的融合蛋白,其特征在于,所述功能结构域通过连接子序列分别与Cas9失活突变体的N-端和C-端连接。
4. 如权利要求3所述的融合蛋白,其特征在于,所述功能结构域通过氨基酸序列如SEQID NO: 50和SEQ ID NO: 51所示的连接子分别与Cas9失活突变体的N-端和C-端连接。
5.如权利要求4所述的融合蛋白,其特征在于,所述融合蛋白的N-末端和/或C-末端融合至少1个核定位序列。
6.如权利要求5所述的融合蛋白,其特征在于,所述融合蛋白能够与指导多核苷酸形成复合物,所述指导多核苷酸包含指导序列,所述指导序列被工程化以指导所述复合物序列特异性结合至双链靶DNA并对所述靶DNA进行切刻。
7.如权利要求6所述的融合蛋白,其特征在于,所述指导多核苷酸为单分子指导多核苷酸或双分子指导多核苷酸。
8.如权利要求7所述的融合蛋白,其特征在于,所述指导多核苷酸由CRISPR-Cas9系统中的crRNA和tracrRNA嵌合形成单分子指导多核苷酸或者所述指导多核苷酸是由CRISPR-Cas9系统中的crRNA和tracrRNA这2个分离的分子组成的组,所述crRNA由指导序列和同向重复序列组成。
9. 一种融合蛋白,其特征在于,所述融合蛋白的氨基酸序列如SEQ ID NO: 3所示。
10.一种核糖核蛋白复合物,其特征在于,所述核糖核蛋白复合物包括指导多核苷酸和如权利要求1~9任一项所述的融合蛋白。
11.一种基因编辑系统,其特征在于,所述基因编辑系统包括:
(1)如权利要求1~9任一项所述的融合蛋白,或编码其的核酸;和,
(2)指导多核苷酸。
12.一种多核苷酸,其特征在于,所述多核苷酸编码如权利要求1~9任一项所述的融合蛋白或者如权利要求10所述的核糖核蛋白复合物。
13.一种表达盒,其特征在于,所述表达盒包含启动子以及如权利要求12所述的多核苷酸;所述启动子调控编码序列的表达。
14.一种重组表达载体,其特征在于,所述重组表达载体包含如权利要求12所述的多核苷酸。
15.如权利要求14所述的重组表达载体,其特征在于,所述重组表达载体还包含顺式作用元件和/或反式作用因子的编码基因。
16.如权利要求15所述的重组表达载体,其特征在于,所述顺式作用元件选自启动子、增强子和沉默子;
和/或,所述反式作用因子的编码基因选自编码聚合酶、转录因子和/或转录调控因子的核苷酸。
17.一种组合物,其特征在于,所述组合物包括递送载体,以及如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒或如权利要求14~16任一项所述的重组表达载体。
18.一种重组细胞,其特征在于,所述重组细胞包含如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体或如权利要求17所述的组合物;
所述重组细胞为非动物品种或非植物品种细胞。
19.一种药物组合物,其特征在于,所述药物组合物包含如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体或如权利要求18所述的重组细胞,以及药学上可接受的载体和/或辅料。
20.一种试剂盒,其特征在于,所述试剂盒包含如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体、如权利要求17所述的组合物、如权利要求18所述的重组细胞或如权利要求19所述的药物组合物。
21.一种如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体、如权利要求17所述的组合物、如权利要求18所述的重组细胞、如权利要求19所述的药物组合物或者如权利要求20所述的试剂盒在制备诊断、预防或治疗与靶核酸相关的疾病的药物中的应用。
22.一种体外编辑靶核酸的方法,所述方法包括将如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体、如权利要求17所述的组合物、如权利要求18所述的重组细胞、如权利要求19所述的药物组合物或者如权利要求20所述的试剂盒与靶核酸接触的步骤,使所述靶核酸的序列发生变化或改变所述靶核酸的表达水平。
23.一种离体编辑靶核酸的方法,所述方法包括将如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体、如权利要求17所述的组合物、如权利要求18所述的重组细胞、如权利要求19所述的药物组合物或者如权利要求20所述的试剂盒与靶核酸接触的步骤,使所述靶核酸的序列发生变化或改变所述靶核酸的表达水平。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311212915.4A CN116949012B (zh) | 2023-09-20 | 2023-09-20 | 一种融合蛋白及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311212915.4A CN116949012B (zh) | 2023-09-20 | 2023-09-20 | 一种融合蛋白及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116949012A CN116949012A (zh) | 2023-10-27 |
CN116949012B true CN116949012B (zh) | 2024-01-02 |
Family
ID=88460525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311212915.4A Active CN116949012B (zh) | 2023-09-20 | 2023-09-20 | 一种融合蛋白及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116949012B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114934031A (zh) * | 2022-05-25 | 2022-08-23 | 广州瑞风生物科技有限公司 | 新型Cas效应蛋白、基因编辑系统及用途 |
WO2022182959A1 (en) * | 2021-02-26 | 2022-09-01 | Vertex Pharmaceuticals Incorporated | Compositions and methods for treatment of myotonic dystrophy type 1 with crispr/slucas9 |
CN116004716A (zh) * | 2022-09-09 | 2023-04-25 | 华中农业大学 | 一种复制型dCas9-FokI系统进行高效基因编辑的方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9322037B2 (en) * | 2013-09-06 | 2016-04-26 | President And Fellows Of Harvard College | Cas9-FokI fusion proteins and uses thereof |
JP7423520B2 (ja) * | 2017-11-16 | 2024-01-29 | アストラゼネカ・アクチエボラーグ | Cas9ベースノックイン方針の効力を改善するための組成物及び方法 |
-
2023
- 2023-09-20 CN CN202311212915.4A patent/CN116949012B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022182959A1 (en) * | 2021-02-26 | 2022-09-01 | Vertex Pharmaceuticals Incorporated | Compositions and methods for treatment of myotonic dystrophy type 1 with crispr/slucas9 |
CN114934031A (zh) * | 2022-05-25 | 2022-08-23 | 广州瑞风生物科技有限公司 | 新型Cas效应蛋白、基因编辑系统及用途 |
CN116004716A (zh) * | 2022-09-09 | 2023-04-25 | 华中农业大学 | 一种复制型dCas9-FokI系统进行高效基因编辑的方法 |
Non-Patent Citations (3)
Title |
---|
CRISPR/Cas技术在核酸检测中的应用进展;史铠 等;《分析测试学报》;第37卷(第10期);1217-1220 * |
Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification;John P Guilinger et al.;《nature biotechnology》;第32卷(第6期);577-582 * |
Paving the way towards precise and safe CRISPR genome editing;Pawel Sledzinski et al.;《Biotechnology Advances》;第49卷;1-20 * |
Also Published As
Publication number | Publication date |
---|---|
CN116949012A (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11608503B2 (en) | RNA targeting of mutations via suppressor tRNAs and deaminases | |
US11208652B2 (en) | Mitochondrial genome editing and regulation | |
WO2021158999A1 (en) | Gene editing methods for treating spinal muscular atrophy | |
KR20160089530A (ko) | Hbv 및 바이러스 질병 및 질환을 위한 crisprcas 시스템 및 조성물의 전달,용도 및 치료적 적용 | |
AU2022349627A1 (en) | Engineered casx repressor systems | |
TW202028461A (zh) | 核酸構築體及使用方法 | |
KR20230002401A (ko) | C9orf72의 표적화를 위한 조성물 및 방법 | |
US11649444B1 (en) | CRISPR-CAS12i systems | |
JP2022516647A (ja) | 非毒性cas9酵素およびその用途 | |
JP2021512649A (ja) | 転写調節要素及びその使用 | |
KR20230129230A (ko) | Bcl11a의 표적화를 위한 조성물 및 방법 | |
WO2020214613A1 (en) | Crispr/cas-based genome editing composition for restoring dystrophin function | |
US20220298495A1 (en) | Novel genome editing tool | |
CA3116452A1 (en) | Genome editing methods and constructs | |
US20230059368A1 (en) | Polynucleotide editors and methods of using the same | |
KR20210129108A (ko) | 글리코겐 저장 질환 1a형을 치료하기 위한 조성물 및 방법 | |
WO2021230385A1 (en) | Method for treating muscular dystrophy by targeting utrophin gene | |
CN116949012B (zh) | 一种融合蛋白及其应用 | |
AU2022245243A1 (en) | Novel crispr enzymes, methods, systems and uses thereof | |
CN117230043B (zh) | Cas13蛋白及其应用 | |
WO2024041653A1 (zh) | 一种CRISPR-Cas13系统及其应用 | |
US20230279398A1 (en) | Treating human t-cell leukemia virus by gene editing | |
WO2020187268A1 (zh) | 一种增强基因编辑的融合蛋白及其应用 | |
WO2023220649A2 (en) | Effector protein compositions and methods of use thereof | |
CA3218209A1 (en) | Multiplex crispr/cas9-mediated target gene activation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |