CN118127011A - gRNA支架及CRISPR-Cas系统及其应用 - Google Patents
gRNA支架及CRISPR-Cas系统及其应用 Download PDFInfo
- Publication number
- CN118127011A CN118127011A CN202410179080.5A CN202410179080A CN118127011A CN 118127011 A CN118127011 A CN 118127011A CN 202410179080 A CN202410179080 A CN 202410179080A CN 118127011 A CN118127011 A CN 118127011A
- Authority
- CN
- China
- Prior art keywords
- cas12f
- seq
- polypeptide
- activity
- amino acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108020005004 Guide RNA Proteins 0.000 title claims abstract description 128
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 239
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 233
- 229920001184 polypeptide Polymers 0.000 claims abstract description 232
- 239000013598 vector Substances 0.000 claims abstract description 160
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 108
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 104
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 104
- 230000004927 fusion Effects 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 34
- 239000000203 mixture Substances 0.000 claims abstract description 7
- 230000000694 effects Effects 0.000 claims description 163
- 108090000623 proteins and genes Proteins 0.000 claims description 101
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 94
- 208000009869 Neu-Laxova syndrome Diseases 0.000 claims description 90
- 125000003729 nucleotide group Chemical group 0.000 claims description 87
- 238000006467 substitution reaction Methods 0.000 claims description 87
- 239000002773 nucleotide Substances 0.000 claims description 85
- 102000004169 proteins and genes Human genes 0.000 claims description 85
- 238000003776 cleavage reaction Methods 0.000 claims description 77
- 230000007017 scission Effects 0.000 claims description 77
- 210000004027 cell Anatomy 0.000 claims description 74
- 230000008685 targeting Effects 0.000 claims description 73
- 238000013518 transcription Methods 0.000 claims description 35
- 230000035897 transcription Effects 0.000 claims description 35
- 230000027455 binding Effects 0.000 claims description 30
- 108020004414 DNA Proteins 0.000 claims description 22
- 108060002716 Exonuclease Proteins 0.000 claims description 19
- 102000013165 exonuclease Human genes 0.000 claims description 19
- 230000000295 complement effect Effects 0.000 claims description 18
- 230000004048 modification Effects 0.000 claims description 16
- 238000012986 modification Methods 0.000 claims description 16
- 239000013603 viral vector Substances 0.000 claims description 16
- 238000010362 genome editing Methods 0.000 claims description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 9
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 9
- 238000003780 insertion Methods 0.000 claims description 9
- 230000037431 insertion Effects 0.000 claims description 9
- 102220489582 Acetyl-CoA acetyltransferase, cytosolic_H66G_mutation Human genes 0.000 claims description 7
- 108060004795 Methyltransferase Proteins 0.000 claims description 7
- 102220575633 Outer dense fiber protein 4_W34R_mutation Human genes 0.000 claims description 7
- 102000040430 polynucleotide Human genes 0.000 claims description 7
- 108091033319 polynucleotide Proteins 0.000 claims description 7
- 239000002157 polynucleotide Substances 0.000 claims description 7
- 102200036732 rs774010006 Human genes 0.000 claims description 7
- 102220067415 rs78219242 Human genes 0.000 claims description 7
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 claims description 6
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 claims description 6
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 6
- 102000016397 Methyltransferase Human genes 0.000 claims description 5
- 238000007385 chemical modification Methods 0.000 claims description 5
- 230000001973 epigenetic effect Effects 0.000 claims description 5
- 210000005260 human cell Anatomy 0.000 claims description 5
- 239000013612 plasmid Substances 0.000 claims description 5
- 241000701161 unidentified adenovirus Species 0.000 claims description 5
- 108020004705 Codon Proteins 0.000 claims description 4
- 102000004190 Enzymes Human genes 0.000 claims description 4
- 108090000790 Enzymes Proteins 0.000 claims description 4
- 208000009889 Herpes Simplex Diseases 0.000 claims description 4
- 102100034343 Integrase Human genes 0.000 claims description 4
- 102000005421 acetyltransferase Human genes 0.000 claims description 4
- 108020002494 acetyltransferase Proteins 0.000 claims description 4
- 230000004913 activation Effects 0.000 claims description 4
- 230000022811 deglycosylation Effects 0.000 claims description 4
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 230000002255 enzymatic effect Effects 0.000 claims description 4
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Substances [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 claims description 4
- 230000002829 reductive effect Effects 0.000 claims description 4
- 241001430294 unidentified retrovirus Species 0.000 claims description 4
- 229930024421 Adenine Natural products 0.000 claims description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 3
- 229960000643 adenine Drugs 0.000 claims description 3
- 239000001506 calcium phosphate Substances 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 229940104302 cytosine Drugs 0.000 claims description 3
- 239000003937 drug carrier Substances 0.000 claims description 3
- 239000004120 green S Substances 0.000 claims description 3
- 230000005778 DNA damage Effects 0.000 claims description 2
- 231100000277 DNA damage Toxicity 0.000 claims description 2
- 230000033616 DNA repair Effects 0.000 claims description 2
- 108010046331 Deoxyribodipyrimidine photo-lyase Proteins 0.000 claims description 2
- 108010061833 Integrases Proteins 0.000 claims description 2
- 102000003960 Ligases Human genes 0.000 claims description 2
- 108090000364 Ligases Proteins 0.000 claims description 2
- 101710163270 Nuclease Proteins 0.000 claims description 2
- 108010077991 O-GlcNAc transferase Proteins 0.000 claims description 2
- 102000005520 O-GlcNAc transferase Human genes 0.000 claims description 2
- 230000010718 Oxidation Activity Effects 0.000 claims description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 claims description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 claims description 2
- 108091000080 Phosphotransferase Proteins 0.000 claims description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 claims description 2
- 108091093078 Pyrimidine dimer Proteins 0.000 claims description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 2
- 102000018120 Recombinases Human genes 0.000 claims description 2
- 108010091086 Recombinases Proteins 0.000 claims description 2
- 102000008579 Transposases Human genes 0.000 claims description 2
- 108010020764 Transposases Proteins 0.000 claims description 2
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 claims description 2
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 claims description 2
- 230000006154 adenylylation Effects 0.000 claims description 2
- 230000029936 alkylation Effects 0.000 claims description 2
- 238000005804 alkylation reaction Methods 0.000 claims description 2
- 239000006227 byproduct Substances 0.000 claims description 2
- 230000009615 deamination Effects 0.000 claims description 2
- 238000006481 deamination reaction Methods 0.000 claims description 2
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 230000006114 demyristoylation Effects 0.000 claims description 2
- 230000027832 depurination Effects 0.000 claims description 2
- 230000029180 desumoylation Effects 0.000 claims description 2
- 230000009504 deubiquitination Effects 0.000 claims description 2
- 238000007323 disproportionation reaction Methods 0.000 claims description 2
- 230000001747 exhibiting effect Effects 0.000 claims description 2
- 210000001808 exosome Anatomy 0.000 claims description 2
- 230000013595 glycosylation Effects 0.000 claims description 2
- 238000006206 glycosylation reaction Methods 0.000 claims description 2
- 230000006872 improvement Effects 0.000 claims description 2
- 239000002502 liposome Substances 0.000 claims description 2
- 108020004999 messenger RNA Proteins 0.000 claims description 2
- 230000007498 myristoylation Effects 0.000 claims description 2
- 239000002105 nanoparticle Substances 0.000 claims description 2
- 102000020233 phosphotransferase Human genes 0.000 claims description 2
- 239000013600 plasmid vector Substances 0.000 claims description 2
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 2
- 239000013635 pyrimidine dimer Substances 0.000 claims description 2
- 230000010741 sumoylation Effects 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 39
- 102220065594 rs786205288 Human genes 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 81
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 76
- 150000001413 amino acids Chemical group 0.000 description 73
- 235000001014 amino acid Nutrition 0.000 description 50
- 230000035772 mutation Effects 0.000 description 42
- 230000003197 catalytic effect Effects 0.000 description 32
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 30
- 102000055025 Adenosine deaminases Human genes 0.000 description 30
- 108020001507 fusion proteins Proteins 0.000 description 28
- 102000037865 fusion proteins Human genes 0.000 description 28
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 24
- 239000013641 positive control Substances 0.000 description 21
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 18
- 238000012258 culturing Methods 0.000 description 16
- 108091023040 Transcription factor Proteins 0.000 description 13
- 102000040945 Transcription factor Human genes 0.000 description 13
- 201000010099 disease Diseases 0.000 description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 12
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 12
- 102100026846 Cytidine deaminase Human genes 0.000 description 11
- 108010031325 Cytidine deaminase Proteins 0.000 description 11
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 10
- 239000012636 effector Substances 0.000 description 10
- 239000013642 negative control Substances 0.000 description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 9
- 230000009466 transformation Effects 0.000 description 9
- 229940035893 uracil Drugs 0.000 description 9
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 101150091380 TTR gene Proteins 0.000 description 7
- 108091006106 transcriptional activators Proteins 0.000 description 7
- 241000132389 Andraca Species 0.000 description 6
- 102220620011 Solute carrier family 2, facilitated glucose transporter member 4_T78S_mutation Human genes 0.000 description 6
- 230000009975 flexible effect Effects 0.000 description 6
- 238000012165 high-throughput sequencing Methods 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 108010021466 Mutant Proteins Proteins 0.000 description 4
- 102000008300 Mutant Proteins Human genes 0.000 description 4
- 108091027544 Subgenomic mRNA Proteins 0.000 description 4
- 238000012761 co-transfection Methods 0.000 description 4
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 4
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 230000000754 repressing effect Effects 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 102100027314 Beta-2-microglobulin Human genes 0.000 description 3
- 108010075254 C-Peptide Proteins 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 101000937544 Homo sapiens Beta-2-microglobulin Proteins 0.000 description 3
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 3
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 3
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 3
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 3
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 3
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 210000003763 chloroplast Anatomy 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000037426 transcriptional repression Effects 0.000 description 3
- OSXFATOLZGZLSK-UHFFFAOYSA-N 6,7-dimethoxy-2-(4-methyl-1,4-diazepan-1-yl)-N-[1-(phenylmethyl)-4-piperidinyl]-4-quinazolinamine Chemical compound C=12C=C(OC)C(OC)=CC2=NC(N2CCN(C)CCC2)=NC=1NC(CC1)CCN1CC1=CC=CC=C1 OSXFATOLZGZLSK-UHFFFAOYSA-N 0.000 description 2
- 108091023037 Aptamer Proteins 0.000 description 2
- 102100032919 Chromobox protein homolog 1 Human genes 0.000 description 2
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 2
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 2
- 102100037964 E3 ubiquitin-protein ligase RING2 Human genes 0.000 description 2
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 108091027305 Heteroduplex Proteins 0.000 description 2
- 108010074870 Histone Demethylases Proteins 0.000 description 2
- 102000008157 Histone Demethylases Human genes 0.000 description 2
- 108010016918 Histone-Lysine N-Methyltransferase Proteins 0.000 description 2
- 102000000581 Histone-lysine N-methyltransferase Human genes 0.000 description 2
- 101001095815 Homo sapiens E3 ubiquitin-protein ligase RING2 Proteins 0.000 description 2
- 101001098868 Homo sapiens Proprotein convertase subtilisin/kexin type 9 Proteins 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 2
- 208000010038 Ischemic Optic Neuropathy Diseases 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 102100025169 Max-binding protein MNT Human genes 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 206010030924 Optic ischaemic neuropathy Diseases 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 102100038955 Proprotein convertase subtilisin/kexin type 9 Human genes 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000000536 complexating effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 208000016361 genetic disease Diseases 0.000 description 2
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 2
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 230000004960 subcellular localization Effects 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108091006107 transcriptional repressors Proteins 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- KUHSEZKIEJYEHN-BXRBKJIMSA-N (2s)-2-amino-3-hydroxypropanoic acid;(2s)-2-aminopropanoic acid Chemical compound C[C@H](N)C(O)=O.OC[C@H](N)C(O)=O KUHSEZKIEJYEHN-BXRBKJIMSA-N 0.000 description 1
- 102100023990 60S ribosomal protein L17 Human genes 0.000 description 1
- 101710095342 Apolipoprotein B Proteins 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 101100334009 Caenorhabditis elegans rib-2 gene Proteins 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108700014420 Chromobox Protein Homolog 5 Proteins 0.000 description 1
- 101710173115 Chromobox protein homolog 1 Proteins 0.000 description 1
- 102100032918 Chromobox protein homolog 5 Human genes 0.000 description 1
- 102100026681 Chromobox protein homolog 8 Human genes 0.000 description 1
- 102100031665 Chromodomain Y-like protein 2 Human genes 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 1
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 1
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 description 1
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 description 1
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000588914 Enterobacter Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108091092566 Extrachromosomal DNA Proteins 0.000 description 1
- 208000037149 Facioscapulohumeral dystrophy Diseases 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 241000626621 Geobacillus Species 0.000 description 1
- 241001494297 Geobacter sulfurreducens Species 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102100027377 HBS1-like protein Human genes 0.000 description 1
- 241000025244 Haemophilus influenzae F3031 Species 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102100021453 Histone deacetylase 5 Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000910841 Homo sapiens Chromobox protein homolog 8 Proteins 0.000 description 1
- 101000777787 Homo sapiens Chromodomain Y-like protein 2 Proteins 0.000 description 1
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 1
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 1
- 101001009070 Homo sapiens HBS1-like protein Proteins 0.000 description 1
- 101000899255 Homo sapiens Histone deacetylase 5 Proteins 0.000 description 1
- 101001093152 Homo sapiens Polycomb protein SCMH1 Proteins 0.000 description 1
- 101000679548 Homo sapiens TOX high mobility group box family member 3 Proteins 0.000 description 1
- 101000762938 Homo sapiens TOX high mobility group box family member 4 Proteins 0.000 description 1
- 101000791652 Homo sapiens YY1-associated factor 2 Proteins 0.000 description 1
- 101000818633 Homo sapiens Zinc finger imprinted 3 Proteins 0.000 description 1
- 101000818735 Homo sapiens Zinc finger protein 10 Proteins 0.000 description 1
- 208000031226 Hyperlipidaemia Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 201000004458 Myoma Diseases 0.000 description 1
- 229940122426 Nuclease inhibitor Drugs 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- 102100036294 Polycomb protein SCMH1 Human genes 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 102000007508 Retinoblastoma-Binding Protein 4 Human genes 0.000 description 1
- 108010071034 Retinoblastoma-Binding Protein 4 Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 101800001707 Spacer peptide Proteins 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 102100022608 TOX high mobility group box family member 3 Human genes 0.000 description 1
- 102100026749 TOX high mobility group box family member 4 Human genes 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 102100027644 YY1-associated factor 2 Human genes 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 102100021115 Zinc finger imprinted 3 Human genes 0.000 description 1
- 102100021112 Zinc finger protein 10 Human genes 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- 201000007058 anterior ischemic optic neuropathy Diseases 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 208000015114 central nervous system disease Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000011088 chloroplast localization Effects 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 208000019425 cirrhosis of liver Diseases 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 208000016097 disease of metabolism Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 208000008570 facioscapulohumeral muscular dystrophy Diseases 0.000 description 1
- 230000004761 fibrosis Effects 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 108700032552 influenza virus INS1 Proteins 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000017156 mRNA modification Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000025608 mitochondrion localization Effects 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 102220098259 rs190382829 Human genes 0.000 description 1
- 102200079914 rs193302884 Human genes 0.000 description 1
- 102200029472 rs587781918 Human genes 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本文公开了向导RNAscaffold及其在CRISPR‑Cas系统中的应用。本文具体公开了向导RNA(gRNA)scaffold、CRISPR‑Cas系统、工程化的Cas12f多肽、Cas12f融合多肽、工程化的Cas12f多肽或融合多肽与gRNA形成的复合物、核酸、载体、载体系统、递送系统、试剂盒、组合物、以及利用上述组分修饰核酸的方法。
Description
技术领域
本发明涉及核酸编辑领域,特别是规律成簇的间隔短回文重复(CRISPR)技术领域。具体而言,本发明涉及gRNAscaffold和CRISPR-Cas系统及其应用,包含gRNAscaffold和Cas12f多肽,以及编码它们的核酸分子。本发明还涉及用于核酸编辑(例如,基因或基因组编辑)的复合物和组合物,其包含本发明的gRNA scaffold和Cas12f多肽,或编码它们的核酸分子。本发明还涉及用于核酸编辑(例如,基因或基因组编辑)的方法,其使用包含本发明的gRNAscaffold和Cas12f多肽。
背景技术
在大约一半的细菌和几乎所有古核生物中,CRISPR(Clustered regularlyinterspaced short palindromic repeats,CRISPR)和CRISPR-Cas相关蛋白(CRISPRassociated proteins,CRISPR-Cas)构成针对噬菌体和外源质粒入侵的适应性免疫系统,称为CRISPR-Cas系统。因其具有准确识别和切割特定DNA和RNA序列的能力,如今已应用于基因编辑。CRISPR-Cas系统是当今世界上最为流行的基因编辑工具。要想修正哺乳动物的基因缺陷,就必须把一套基因编辑工具精确送到特定的组织或细胞内,这个过程需要用到一种能通往细胞内部的运输载体-腺相关病毒(AAV),这种病毒是目前最可靠的载体之一。但AAV的缺点在于装载容量很有限,目前主流的由Cas9和Cas12a主导的基因编辑工具尺寸普遍太大,普遍都超过了单个AAV的装载极限,限制了它在哺乳动物上的应用。
因此,开发一种尺寸小、在哺乳动物细胞中的基因编辑能力强的新型CRISPR/Cas系统对生物技术的发展具有重要意义。
发明内容
本发明的一个方面提供向导RNA(gRNA)scaffold,其中所述gRNAscaffold包含与SEQ ID NO.3至17、19至92、95至107任一项所示的核苷酸序列相比具有至少80%序列同一性的核苷酸序列;优选地,其中所述gRNA scaffold为SEQ ID NO.3至17、SEQ ID NO.19至92、SEQ ID NO.95至107任一项所示的核苷酸序列。
具体的,向导RNA(gRNA)包含两个片段:靶向序列和蛋白质结合序列。gRNA的靶向序列包括与靶核酸序列(例如,靶ssRNA、靶ssDNA、双链靶DNA的链等)内的特定序列(靶位点)互补(并且因此与之杂交)的核苷酸序列(可互换地称为向导序列、间隔区、靶向子或靶向序列)。gRNA的靶向序列能够与靶核酸序列和调控元件结合,该靶核酸序列包括编码序列、编码序列的互补序列、非编码序列。蛋白质结合序列与作为复合物的Cas12f多肽相互作用(例如,结合),形成RNP。蛋白质结合序列在本文中也称为“支架”、“gRNAscaffold”或“gRNA支架”,这些术语在本文可互换使用。即在gRNA上除了靶向序列区域之外,gRNA的其余区域在本文中被称为“支架”、“gRNA scaffold”或“gRNA支架”。
在优选的实施方式中,所述gRNAscaffold包含或为与SEQ ID NO.3至17、19至92、95至107任一项所示的核苷酸序列相比具有至少90%序列同一性核苷酸序列。例如,所述gRNAscaffold包含或为与SEQ ID NO.3至17、19至92、95至107任一项所示的核苷酸序列相比具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核苷酸序列。
在另一些实施方式中,所述gRNAscaffold包含一个或多个修饰,所述一个或多个修饰导致所述gRNAscaffold展现一种或多种改善特征;优选地,所述一种或多种改善特征选自由以下组成的组:改善gRNA稳定性;改善所述gRNA的转录;增加所述gRNA的折叠速率;折叠期间减少副产物形成;折叠期间减少脱靶折叠中间体形成;增加生产性折叠;增加与Cas12f蛋白的结合亲和力;当与所述Cas12f蛋白复合时,改善与靶核酸的结合亲和力;当与所述Cas12f蛋白复合时,改善基因编辑;或当与所述Cas12f蛋白复合时,改善编辑特异性。
在一些实施方式中,所述一个或多个修饰包含:(i)一个或多个区域中的所述gRNAscaffold的1至40个连续或非连续核苷酸的取代;(ii)一个或多个区域中的所述gRNAscaffold的1至40个连续或非连续核苷酸的缺失;(iii)一个或多个区域中的所述gRNAscaffold的1至40个连续或非连续核苷酸的插入;(iv)一个或多个区域中的所述gRNAscaffold的1至10个连续或非连续核苷酸的化学修饰;(v)所述gRNA scaffold具有异源RNA序列取代;或(vi)(i)-(v)的任何组合。
在一些实施方式中,本发明提供的gRNAscaffold的修饰方法包括:截短不同茎环区,增加或删除茎环,增加或删除假结茎,调整tracrRNA与crRNA互补区长度,增加终止子,取代特定位置的核苷酸,对特定位置的核苷酸的糖和磷酸二酯键进行化学修饰,在gRNAscaffold的5’和3’端连接异源RNA序列。优选地,所述化学修饰为针对gRNA的常规化学修饰,合适的化学修饰包括但不限于:2'-O甲基修饰的核苷酸、2'-氟修饰的核苷酸、锁核酸(LNA)修饰的核苷酸、肽核酸(PNA)修饰的核苷酸、具有硫代磷酸酯键的核苷酸和5'帽(例如,7-甲基鸟苷酸帽(m7G));优选地,所述异源RNA序列为适配子,适配子是一种结合特异性靶分子的合成寡核苷酸,例如,已经通过重复数轮的体外选择或SELEX(指数富集配体系统进化法)被工程化为结合不同分子的核苷酸分子靶向诸如小分子、蛋白质、核酸以及甚至细胞、组织和生物体。适配子可提供类似抗体的分子识别特性,且其在治疗性应用中几乎不引发免疫原性;优选地,所述异源RNA序列为能够结合蛋白质、RNA结构、DNA序列或小分子MS2、Qβ、U1发夹II、Uvsx或PP7茎环序列。
在优选的实施方式中,其中所述gRNAscaffold为SEQ ID NO.3、12、13、14、15、16、17、19、20、21、23、24、25、26、27、29、30、31、32、33、34、35、36、37、38、39、40、42、43、44、45、46、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、95、97、98、99、100、103、104、105或106任一项所示的核苷酸序列。
在一些实施方式中所述gRNAscaffold可包括可以形成Stem茎和茎环结构的回文区。在一些实施方式中,所述回文区包括由5至15个碱基对(bp)形成的茎结构,例如8至12个bp或10至15个bp,例如7、8、9、10、11、12、13、14或15个bp。在一些实施方式中,并非茎结构中的所有核苷酸都是配对的,因此茎结构可包含凸起。本文中的术语“凸起”用于意指一段核苷酸(其可以是一个核苷酸),这段核苷酸对茎结构没有贡献,但是在5'端和3'端被有贡献的核苷酸围绕,因此凸起被认为是茎结构的一部分。在一些实施方式中,茎结构包含1个或更多个凸起(例如,2个或更多个、3个或更多个、4个或更多个凸起)。在一些实施方式中,茎结构包含2个或更多个凸起(例如,3个或更多个、4个或更多个凸起)。在一些实施方式中,茎结构包含1-5个凸起(例如,1-4个、1-3个、2-5个、2-4个或2-3个凸起)。
具体的,本发明提供的gRNAscaffold的修饰方法具体为:
对SEQ ID NO.3的不同区域截短至少一个核苷酸得到SEQ ID NO.4至15任一项所示的核苷酸序列;对SEQ ID NO.3的不同区域的一个或多个核苷酸进行取代得到SEQ IDNO.16至17、SEQ ID NO.19至28任一项所示的核苷酸序列;SEQ ID NO.18的核苷酸序列从5’到3’方向为SEQ ID NO.3、靶核酸互补的靶向序列(N)n和U6终止子;对SEQ ID NO.3的Stem4区域截短至少一个核苷酸得到SEQ ID NO.29至41任一项所示的核苷酸序列;对SEQ IDNO.3的Stem3区域截短至少一个核苷酸或对一个或多个核苷酸进行取代得到SEQ ID NO.42至63任一项所示的核苷酸序列;对SEQ ID NO.3的Stem4区域的一个或多个核苷酸进行取代得到SEQ ID NO.64至78任一项所示的核苷酸序列;对SEQ ID NO.3的Stem4区域截短至少一个核苷酸得到SEQ ID NO.79至85任一项所示的核苷酸序列;对SEQ ID NO.3的Stem3区域和Stem4区域截短至少一个核苷酸或对一个或多个核苷酸进行取代得到SEQ ID NO.86至92任一项所示的核苷酸序列;对SEQ ID NO.93的不同区域截短至少一个核苷酸以及在不同区域增加多个核苷酸得到SEQ ID NO.95所示的核苷酸序列;对SEQ ID NO.94的不同区域截短至少一个核苷酸得到SEQ ID NO.96所示的核苷酸序列;对SEQ ID NO.95的不同区域截短至少一个核苷酸、在不同区域的一个或多个核苷酸进行取代以及在不同区域增加多个核苷酸得到SEQ ID NO.97至107任一项所示的核苷酸序列。
在优选的实施方式中,对所述gRNAscaffold修饰导致其与所述Cas12f多肽结合活性增强,例如与SEQ ID NO.3相比,所述gRNAscaffold与所述Cas12f多肽的核酸结合活性增强至少10%,例如10%至500%,10%至100%、10%至200%、10%至300%、10%至50%、10%至30%、10%至20%、50%至100%、50%至200%、50%至300%、100%至200%、或200%至300%;导致其与所述Cas12f多肽复合后所述Cas12f多肽的核酸切割活性增强,例如与SEQ ID NO.3相比,所述Cas12f多肽复合后所述Cas12f多肽的核酸切割活性增强至少10%,例如10%至500%,10%至100%、10%至200%、10%至300%、10%至50%、10%至30%、10%至20%、50%至100%、50%至200%、50%至300%、100%至200%、或200%至300%。
在本发明的另一个方面提供一种CRISPR-Cas系统,其包含:
(i)Cas12f多肽,所述Cas12f多肽包含与SEQ ID NO.1所示的氨基酸序列相比具有至少80%序列同一性的氨基酸序列;以及(ii)gRNA,所述gRNA包含所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列,所述gRNA与所述Cas12f多肽复合以引导所述Cas12f多肽结合至所述靶核酸。
在另一些实施方式中,CRISPR-Cas系统,其包含:(i)Cas12f多肽,所述Cas12f多肽包含与SEQ ID NO.1所示的氨基酸序列相比具有至少90%序列同一性的氨基酸序列;以及(ii)gRNA,所述gRNA包含所述的gRNA scaffold和在所述gRNA scaffold的3’末端与靶核酸互补的靶向序列,所述gRNA与所述Cas12f多肽复合以引导所述Cas12f多肽结合至所述靶核酸;其中,所述gRNAscaffold包含与SEQ ID NO.3至17、19至92、95至107任一项所示的核苷酸序列相比具有至少80%序列同一性的核苷酸序列;优选地,其中所述gRNAscaffold为SEQID NO.3至17、SEQ ID NO.19至92、SEQ ID NO.95至107任一项所示的核苷酸序列。
在另一些实施方式中,CRISPR-Cas系统,其包含:(i)Cas12f多肽,所述Cas12f多肽包含与SEQ ID NO.1所示的氨基酸序列相比具有至少90%序列同一性的氨基酸序列;以及(ii)gRNA,所述gRNA包含所述的gRNAscaffold和在所述gRNA scaffold的3’末端与靶核酸互补的靶向序列,所述gRNA与所述Cas12f多肽复合以引导所述Cas12f多肽结合至所述靶核酸;其中,所述Cas12f多肽被突变以使其具有以下一个或多个特征:核酸切割活性增强或核酸结合活性增强;所述Cas12f多肽:(i)根据SEQ ID NO.1所示的序列编号,在A11、W34、A38、H66、T78、G80、K88、G90、C98、Q103、T104、K110、N111、S112、S114、E115R、T120R、S128、N129、Q130、N136、E142、Y143、C171、Q191、G194、N203、V214、A216、N223、H238、I241、E261、L271、S272、I285、I285、V289、T291、R302、S336、E341、I369、Y371、D373、S377、V399、L401、Q415和S428中的一个或多个位置处具有氨基酸取代;或(ii)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽具有一个或多个选自A11R、W34R、A38R、H66G、T78S、G80H、K88R、G90R、C98L、Q103K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、S128R、N129D、Q130H、N136K、E142R、Y143R、C171K、Q191G、G194K、N203K、V214K、A216R、N223R、H238K、I241A、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R和S428K的氨基酸取代。
在另一些实施方式中,CRISPR-Cas系统,其包含:(i)Cas12f多肽,所述Cas12f多肽包含与SEQ ID NO.1所示的氨基酸序列相比具有至少90%序列同一性的氨基酸序列;以及(ii)gRNA,所述gRNA包含所述的gRNA scaffold和在所述gRNA scaffold的3’末端与靶核酸互补的靶向序列,所述gRNA与所述Cas12f多肽复合以引导所述Cas12f多肽结合至所述靶核酸;其中,
在本发明中,这些Cas12f多肽及其突变体也称为“RaCas12f1多肽”、“RaCas12f1蛋白”、“RaCas12f1效应蛋白”、“Cas12f多肽”、“Cas12f效应蛋白”、“Cas12f1多肽”、“Cas12f1效应蛋白”,这些术语在本文可互换使用。
在优选的实施方式中,所述Cas12f多肽包含或为与SEQ ID NO.1所示的氨基酸序列相比具有至少95%序列同一性氨基酸序列。例如,所述Cas12f多肽包含或为与SEQ IDNO.1所示的氨基酸序列相比具有至少95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。
在一些实施方式中,其中所述Cas12f多肽被突变以使其具有以下一个或多个特征:核酸切割活性增强或核酸结合活性增强;所述Cas12f多肽的氨基酸序列不是SEQ IDNO.1所示的氨基酸序列。
在一些实施方式中,其中所述Cas12f多肽:(i)根据SEQ ID NO.1所示的序列编号,在A11、W34、A38、H66、T78、G80、K88、G90、C98、Q103、T104、K110、N111、S112、S114、E115R、T120R、S128、N129、Q130、N136、E142、Y143、C171、Q191、G194、N203、V214、A216、N223、H238、I241、E261、L271、S272、I285、I285、V289、T291、R302、S336、E341、I369、Y371、D373、S377、V399、L401、Q415和S428中的一个或多个位置处具有氨基酸取代;或(ii)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽具有一个或多个选自A11R、W34R、A38R、H66G、T78S、G80H、K88R、G90R、C98L、Q103K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、S128R、N129D、Q130H、N136K、E142R、Y143R、C171K、Q191G、G194K、N203K、V214K、A216R、N223R、H238K、I241A、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R和S428K的氨基酸取代。
在优选实施方式中,其中所述Cas12f多肽为:根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽具有A11R、W34R、A38R、H66G、T78S、G80H、K88R、G90R、C98L、Q103K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、S128R、N129D、N136K、E142R、Y143R、C171K、Q191G、G194K、V214K、N223R、H238K、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R或S428K的单一氨基酸取代。
在更优选实施方式中,其中所述Cas12f多肽为:根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽具有A38R、S114K、S128R、N129D、E142R、C171K、G194K、N223R、E261K、L271R、E341K、Y371K、V399K或S428K的单一氨基酸取代。
在一些实施方式中,其中所述Cas12f多肽:
(1)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和S428K位置处具有氨基酸取代;(2)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在E142R和S428K位置处具有氨基酸取代;(3)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在C171K和S428K位置处具有氨基酸取代;(4)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在G194K和S428K位置处具有氨基酸取代;(5)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N223R和S428K位置处具有氨基酸取代;(6)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在E261K和S428K位置处具有氨基酸取代;(7)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在E341K和S428K位置处具有氨基酸取代;(8)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S428K和V399K位置处具有氨基酸取代;(9)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在A38R和N129D位置处具有氨基酸取代;(10)根据SEQ IDNO.1所示的序列编号,所述Cas12f多肽在S114K和N129D位置处具有氨基酸取代;(11)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S128R和N129D位置处具有氨基酸取代;(12)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和C171K位置处具有氨基酸取代;(13)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和G194K位置处具有氨基酸取代;(14)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和N223R位置处具有氨基酸取代;(15)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和Y371K位置处具有氨基酸取代;(16)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和V399K位置处具有氨基酸取代;(17)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在A38R位置处具有氨基酸取代;(18)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S114K位置处具有氨基酸取代;(19)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S128R位置处具有氨基酸取代;(20)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D位置处具有氨基酸取代;(21)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在G194K位置处具有氨基酸取代;(22)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在Y371K位置处具有氨基酸取代;(23)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在A38R、S128R和N129D位置处具有氨基酸取代;(24)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S114K、S128R和N129D位置处具有氨基酸取代;(25)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S128R、N129D和G194K位置处具有氨基酸取代;(26)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S128R、N129D和Y371K位置处具有氨基酸取代;(27)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在A38R、S128R、N129D和Y371K位置处具有氨基酸取代;(28)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S114K、S128R、N129D和Y371K位置处具有氨基酸取代;(29)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S128R、N129D、G194K和Y371K位置处具有氨基酸取代;(30)根据SEQID NO.1所示的序列编号,所述Cas12f多肽在A38R、S114K、S128R、N129D和Y371K位置处具有氨基酸取代;(31)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在A38R、S128R、N129D、Y371K和G194K位置处具有氨基酸取代;或(32)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在Q130H、N203K、A216R和I241A位置处具有氨基酸取代。
在一些实施方式中,所述Cas12f多肽在Q130H、N203K、A216R和I241A位置处具有氨基酸取代后的氨基酸序列是SEQ ID NO.2所示的氨基酸序列。
在一些实施方式中,其中所述Cas12f多肽被突变以使其核酸切割活性部分或完全失活;所述Cas12f多肽的氨基酸序列不是SEQ ID NO.1所示的氨基酸序列,核酸切割活性部分或完全失活,所述取代导致与亲本Cas12f多肽相比,核酸切割活性降低至少10%,例如10%至500%,10%至100%、10%至200%、10%至300%、10%至50%、10%至30%、10%至20%、50%至100%、50%至200%、50%至300%、100%至200%、或200%至300%、或完全丧失。
在一些实施方式中,根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在D234位置处具有氨基酸取代,以使所述Cas12f多肽的核酸切割活性部分或完全失活;优选的,根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽具有D234A的氨基酸取代,以使所述Cas12f多肽的核酸切割活性部分或完全失活。
在一些实施方式中,所述突变导致所述Cas12f多肽的核酸结合活性、与引导RNA结合活性和/或核酸切割活性基本不变,例如与亲本Cas12f多肽相比,核酸结合活性、与gRNA结合活性和/或核酸切割活性增加或降低约10%以下,例如1%至约10%。任何在所述gRNAscaffold至少一个核苷酸替换、缺失和/或插入后仍保留Cas12f多肽结合活性的核苷酸序列均在本发明的范围之内。
在一些实施方式中,所述突变导致所述Cas12f多肽的核酸结合活性增强,例如与亲本Cas12f多肽(SEQ ID NO.1)相比,核酸结合活性增强至少10%,例如10%至500%,10%至100%、10%至200%、10%至300%、10%至50%、10%至30%、10%至20%、50%至100%、50%至200%、50%至300%、100%至200%、或200%至300%;所述Cas12f多肽的与gRNA结合活性增强,例如与亲本Cas12f多肽(SEQ ID NO.1)相比,与gRNA结合活性增强至少10%,例如10%至500%,10%至100%、10%至200%、10%至300%、10%至50%、10%至30%、10%至20%、50%至100%、50%至200%、50%至300%、100%至200%、或200%至300%;所述Cas12f多肽的核酸切割活性增强,例如与亲本Cas12f多肽(SEQ ID NO.1)相比,核酸切割活性增强至少10%,例如10%至500%,10%至100%、10%至200%、10%至300%、10%至50%、10%至30%、10%至20%、50%至100%、50%至200%、50%至300%、100%至200%、或200%至300%;并且所述Cas12f多肽(SEQ ID NO.1)的核酸切割活性降低,例如与亲本Cas12f多肽相比,核酸切割活性降低至少10%,例如10%至500%,10%至100%、10%至200%、10%至300%、10%至50%、10%至30%、10%至20%、50%至100%、50%至200%、50%至300%、100%至200%、或200%至300%、或完全丧失。
具体的,所述Cas12f多肽在特定位置被特定氨基酸取代的突变多肽名称根据人类基因组变异协会(HGVS:Human Genome Variation Society)的突变命名规则命名,例如:“所述Cas12f多肽在Q130H、N203K、A216R和I241A位置处具有氨基酸取代”中“Q130H”表示在Cas12f多肽的130位置发生了H替换原来的Q,“Q130H、N203K、A216R和I241A”表示Cas12f多肽在第130位、第203位、第216位和第241位的四个位置同时发生对应氨基酸取代。
具体的,在本发明提供的CRISPR-Cas系统中,所述Cas12f多肽为任何一个在下文描述的RaCas12f1;在Q130H、N203K、A216R和I241A位置处具有氨基酸取代的所述Cas12f多肽为任何一个在下文描述的RaCas12f1-HKRA;在本发明提供的CRISPR-Cas系统中,所述gRNA为任何一个在上文“引导RNA(gRNA)”,这些术语在本文可互换使用。
在一些实施方式中,所述CRISPR-Cas系统的靶向序列具有10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。优选地,所述靶向序列具有18、19或20个核苷酸。
具体的,在CRISPR-Cas系统中,所述Cas12f蛋白与Cas12f的gRNA形成复合物,并且gRNA通过靶向序列为RNP复合物提供序列特异性。换言之,Cas12f蛋白借助于其与引导RNA缔合而被引导至靶核酸序列(例如染色体序列或染色体外序列,例如游离型序列、微环序列、线粒体序列、叶绿体序列等)内的靶位点(例如在靶位点处稳定)。
在一些实施方式中,所述gRNAscaffold的靶向序列与靶核酸的靶位点之间的互补性百分比为60%或更高(例如,65%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些实施方式中,所述靶向序列与靶核酸的靶位点之间的互补性百分比为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些实施方式中,所述靶向序列与靶核酸的靶位点之间的互补性百分比为90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些实施方式中,所述靶向序列与靶核酸的靶位点之间的互补性百分比为100%。在一些实施方式中,所述靶向序列与靶核酸的靶位点之间的互补性百分比在靶核酸的靶位点最3'端的七个连续核苷酸上为100%。
在一些实施方案中,所述gRNAscaffold的靶向序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为60%或更高(例如,70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些实施方式中,所述gRNA scaffold的靶向序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为80%或更高(例如,85%或更高、90%或更高、95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些实施方式中,所述gRNAscaffold的靶向序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为90%或更高(例如,95%或更高、97%或更高、98%或更高、99%或更高或者100%)。在一些实施方式中,所述gRNAscaffold的靶向序列与靶核酸的靶位点之间的互补性百分比在17-25个连续核苷酸上为100%。
在一些实施方式中,所述gRNAscaffold的靶向序列具有在17-30个核苷酸(nt)(例如,17-25个、17-22个、17-20个、18-28个、18-26个、18-24个、18-22个、18-21个、18-20个、18-19个、19-30个、19-25个、19-22个、19-20个、20-30个、20-25个或20-22个nt)的范围内的长度。在一些实施方式中,所述gRNA scaffold的靶向序列具有在17-25个核苷酸(nt)(例如,17-22个、17-20个、19-25个、19-22个、19-20个、20-25个或20-22个nt)的范围内的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有17或更多个nt(例如,18个或更多个、19个或更多个、20个或更多个、21个或更多个或者22个或更多个nt;19个nt、20个nt、21个nt、22个nt、23个nt、24个nt、25个nt等)的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有19个或更多个nt(例如,20个或更多个、21个或更多个或者22个或更多个nt;19个nt、20个nt、21个nt、22个nt、23个nt、24个nt、25个nt等)的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有17个nt的长度。在一些实施方式中,所述gRNA scaffold的靶向序列具有18个nt的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有19个nt的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有20个nt的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有21个nt的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有22个nt的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有23个nt的长度。在一些实施方式中,所述gRNA scaffold的靶向序列具有24个nt的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有25个nt的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有26个nt的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有27个nt的长度。在一些实施方式中,所述gRNA scaffold的靶向序列具有28个nt的长度。在一些实施方式中,所述gRNAscaffold的靶向序列具有15至50个核苷酸的长度(例如,15个核苷酸(nt)至20nt、20nt至25nt、25nt至30nt、30nt至35nt、35nt至40nt、40nt至45nt或45nt至50nt)。
在一些实施方式中,其中所述靶向序列的3’端连接有终止子。优选地,所述终止子为U6终止子。优选地,所述U6终止子为SEQ ID NO.108至125任一项所示的核苷酸序列。
本发明的CRISPR-Cas系统的Cas12f多肽识别并结合靶核酸的过程需要靶序列上/下游的一段短保守序列,即前间区序列临近基序(protospacer adjacent motif,PAM)的参与。gRNA介导Cas12f蛋白识别靶点序列5’端PAM,当PAM出现特定的碱基组成特征时,催化该靶点序列附近的DNA双链解链,gRNA的靶向序列通过碱基互补配对与DNA双链中的靶向链杂交形成RNA-DNA异源双链复合体,进而与靶核酸链结合。经过实验测试发现,本发明的Cas12f多肽及其突变体的PAM序列为5’-TTN(N=A、T、C或G),优选为5’-TTA或5’-TTC,PAM序列也可以为5’-TTCT、5’-TTTC或5’-TTTT。
本发明的另一个方面提供一种融合多肽,其包含与一个或多个异源多肽融合的Cas12f多肽,所述Cas12f多肽选自所述CRISPR-Cas系统的Cas12f多肽;优选地,其中所述一个或多个异源多肽独立地为表位标签、核定位信号或具有以下一种或多种酶促活性:外切核酸酶活性、逆转录酶活性、核酸酶活性、甲基转移酶活性、脱甲基化酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性、脱豆蔻酰化活性、糖基化活性(例如来自O-GlcNAc转移酶)和脱糖基化活性、DNA修复活性、DNA损伤活性、脱氨酶活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂合酶活性和糖基化酶活;更优选地,所述酶促活性结构域具有以下一种或多种酶促活性:脱氨酶活性、甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性和脱乙酰酶活性;优选地,所述一个或多个异源多肽独立地为转录阻遏结构域、转录激活结构域、脱氨酶结构域或5’-3’外切核酸酶功能域。
在一些实施方式中,所述异源多肽选自表位标签(epitope tag)。这类表位标签为现有常规的标签,包括但不限于His、V5、FLAG、HA、Myc、VSV-G、Trx等,并且本领域技术人员已知如何根据期望目的(例如,纯化、检测或示踪)选择合适的表位标签。
在一些实施方式中,所述异源多肽选自报告基因序列,这类报告基因是本领域技术人员熟知的,其实例包括但不限于GST、HRP、CAT、GFP、HcRed、DsRed、CFP、YFP、BFP等。
在一些实施方式中,所述异源多肽选自能够与DNA分子或细胞内分子结合的结构域,例如麦芽糖结合蛋白(MBP)、LexA的DNA结合结构域(DBD)、GAL4的DBD等。
在一些实施方式中,所述异源多肽还可以是可检测信号的酶、放射性同位素、特异性结合对的成员、荧光团、荧光蛋白、量子点等。
在一些实施方式中,所述异源多肽提供亚细胞定位,即异源多肽含有亚细胞定位序列(例如,用于靶向细胞核的核定位信号(NLS)、用于将融合蛋白保持在细胞核外的序列(例如核输出序列(NES))、用于将融合蛋白保留在细胞质中的序列、用于靶向线粒体的线粒体定位信号、用于靶向叶绿体的叶绿体定位信号、ER保留信号等)。在一些实施方案中,Cas12f融合多肽不包括NLS,使得蛋白质不靶向细胞核(这可能是有利的,例如,当靶核酸是存在于胞质溶胶中的RNA时)。
在优选的实施方式中,所述转录抑制结构域可以包括DNA甲基转移酶(例如DNMT1、DNMT3A、DNMT3B、DNMT3L或其任何功能变体或片段)、RYBP(RING1 andYY1 bindingprotein)催化结构域及其同源物、YAF2催化结构域及其同源物、KRAB催化结构域、MBD2催化结构域及其同源物、MeCP2催化结构域及其同源物、RBBP4催化结构域及其同源物、CDYL2催化结构域及其同源物、HP1α催化结构域及其同源物、HP1β(CBX1)催化结构域及其同源物、TOX催化结构域及其同源物、TOX3催化结构域及其同源物、TOX4催化结构域及其同源物、SCMH1催化结构域及其同源物、SCMH2催化结构域及其同源物、CBX8催化结构域及其同源物、HDAC5催化结构域及其同源物、I2BP1催化结构域及其同源物、EZH2催化结构域及其同源物、SUZ12催化结构域及其同源物、SIN3A催化结构域及其同源物、RING2催化结构域及其同源物、SetDB1催化结构域及其同源物。
在一些实施方式中,本发明提供的Cas12f融合多肽包含:i)本发明提供的Cas12f多肽;和ii)转录因子。转录因子可以包括:i)DNA结合结构域;和ii)转录激活因子。转录因子可以包括:i)DNA结合结构域;和ii)转录阻遏子。合适的转录因子包括包含转录激活因子或转录抑制子结构域的多肽(例如,Krüppel相关框(KRAB或SKD));MadmSIN3相互作用结构域(SID);ERF阻遏结构域(ERD)等);基于锌指的人工转录因子;基于TALE的人工转录因子;等等。在一些实施方式中,转录因子包括VP64多肽(转录激活)。在某些情况下,转录因子包含Krüppel相关盒(KRAB)多肽(转录抑制)。在一些实施方式中,转录因子包括MadmSIN3相互作用结构域(SID)多肽(转录阻遏)。在一些实施方式中,转录因子包括ERF阻遏子结构域(ERD)多肽(转录阻遏)。在一些实施方式中,转录因子包括DNMT3A-DNMT3L(转录阻遏)。在一些实施方式中,转录因子是转录激活因子,其中转录激活因子是GAL4-VP16。在一些实施方式中,转录因子是转录激活因子,其中转录激活因子是VP64;P65;RTA;截短的P65;截短的RTA;或它们各自或之间的一个或多个的融合形式。
在一些实施方式中,在本发明提供的融合多肽中,所述一个或多个异源多肽独立地为转录阻遏结构域、转录激活结构域或脱氨酶结构域时,所述Cas12f多肽为dCas12f多肽,“dCas12f”是指核酸酶无活性的Cas12f或核酸酶死亡的Cas12f,任何使本发明的Cas12f多肽的核酸内切酶失活的合适突变都可以用于形成dCas12f,例如氨基酸序列为SEQ IDNO.1或2中D234A的突变,所述“dCas12f”为下文描述的“dRaCas12f1”、“dRaCas12f1-HKRA”或“dRaCas12f1-D234A”,这些术语在本文可互换使用。在一些实施方式中,在本发明提供的融合多肽中,所述一个或多个异源多肽独立地为5’-3’外切核酸酶功能域时,所述Cas12f多肽为有核酸酶活性的Cas12f。
在一些实施方式中,其中所述5’-3’外切核酸酶功能域为SEQ ID NO.126任一项所示的核苷酸序列。
在一些实施方式中,Cas12f融合多肽包含(融合有)核定位信号(NLS)(例如,在一些实施方式中,2个或更多、3个或更多、4个或更多、或5个或更多个NLS)。在一些实施方式中,一个或多个NLS(2个或更多个、3个或更多个、4个或更多个或者5个或更多个NLS)定位在N末端和/或C末端处或附近(例如,在50个氨基酸内)。Cas12f融合多肽包含(融合有)1至10个NLS(例如,1-9、1-8、1-7、1-6、1-5、2-10、2-9、2-8、2-7、2-6或2-5个NLS)。在一些实施方式中,Cas12f融合多肽包含(融合有)2至5个NLS(例如,2-4个或2-3个NLS)。具体地,核定位信号(NLS)连接顺序可以为:NH2-[Cas12f]-[NLS]-COOH;NH2-[NLS]-[Cas12f]-COOH;其中]-[表示可任选地存在的根据下文定义的连接肽(下同)。
在优选的实施方式中,所述融合多肽中的所述核定位信号来源于SV40病毒大T抗原的NLS、核质蛋白二分NLS、c-myc NLS、hRNPA1 M9 NLS、输入蛋白-α的IBB结构域NLS、肌瘤T蛋白NLS、人p53 NLS、小鼠c-abl IV的NLS、流感病毒NS1的NLS、肝炎病毒δ抗原的NLS、小鼠Mx1蛋白的NLS、人聚(ADP-核糖)聚合酶的NLS或类固醇激素受体(人)糖皮质激素的NLS。
在优选的实施方式中,所述融合多肽中的所述转录激活结构域包含选自以下的酶形成的结构域:转录激活因子、组蛋白赖氨酸甲基转移酶、组蛋白赖氨酸脱甲基酶、组蛋白乙酰转移酶以及DNA脱甲基酶;优选地,所述转录阻遏结构域包含选自以下的结构域:转录阻遏物、ZIM3结构域、KOX1阻遏结构域、MadmSIN3相互作用结构域(SID)、ERF阻遏物结构域(ERD)、SRDX阻遏结构域、组蛋白赖氨酸甲基转移酶、组蛋白赖氨酸脱甲基酶、组蛋白赖氨酸脱乙酰酶、DNA甲基化酶以及外周募集元件。在优选的实施方式中,所述转录激活结构域包含VP64;P65;RTA;截短的P65;截短的RTA;或它们各自或之间的一个或多个的融合形式。在优选的实施方式中,所述转录阻遏结构域选自KRAB催化结构域、DNA甲基转移酶或其组合。
在一些实施方式中,所述转录抑制结构域的数量可为两个以上,这些转录抑制结构域通过连接肽串联后连接在Cas12f(如dRaCas12f1-HKRA或dRaCas12f1)蛋白的N端或/和C端;所述转录激活结构域的数量可为两个以上,这些转录激活结构域通过连接肽串联后连接在Cas12f(如dRaCas12f1-HKRA或dRaCas12f1)蛋白的N端或/和C端。
在优选的实施方式中,所述融合多肽的结构选自:NH2-[Cas12f]-[转录调控结构域]-COOH;NH2-[转录调控结构域]-[Cas12f]-COOH;NH2-[Cas12f]-[转录激活结构域]-COOH;NH2-[转录激活结构域]-[Cas12f]-COOH;NH2-[NLS]-[Cas12f]-[转录激活结构域]-COOH;NH2-[Cas12f]-[转录激活结构域]-[NLS]-COOH;NH2-[NLS]-[Cas12f]-[转录激活结构域]-[NLS]-COOH;NH2-[NLS]-[转录激活结构域]-[Cas12f]-COOH;NH2-[转录激活结构域]-[Cas12f]-[NLS]-COOH;NH2-[NLS]-[转录激活结构域]-[Cas12f]-[NLS]-COOH;NH2-[Cas12f]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-COOH;NH2-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[Cas12f]-COOH;NH2-[NLS]-[Cas12f]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-COOH;NH2-[Cas12f]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[NLS]-COOH;NH2-[NLS]-[Cas12f]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[NLS]-COOH;
NH2-[NLS]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[Cas12f]-COOH;NH2-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[Cas12f]-[NLS]-COOH;NH2-[NLS]-[Cas12f]-[VP64-P65-RTA融合蛋白及其截短的融合蛋白]-[NLS]-COOH;NH2-[Cas12f]-[转录抑制结构域]-COOH;NH2-[转录抑制结构域]-[Cas12f]-COOH;NH2-[NLS]-[Cas12f]-[转录抑制结构域]-COOH;NH2-[Cas12f]-[转录抑制结构域]-[NLS]-COOH;
NH2-[NLS]-[Cas12f]-[转录抑制结构域]-[NLS]-COOH;NH2-[NLS]-[转录抑制结构域]-[Cas12f]-COOH;
NH2-[转录抑制结构域]-[Cas12f]-[NLS]-COOH;NH2-[NLS]-[转录抑制结构域]-[Cas12f]-[NLS]-COOH;
NH2-[Cas12f]-[第一转录抑制结构域]-[第二转录抑制结构域]-COOH;NH2-[Cas12f]-[第二转录抑制结构域]-[第一转录抑制结构域]-COOH;NH2-[第一转录抑制结构域]-[第二转录抑制结构域]-[Cas12f]-COOH;NH2-[第二转录抑制结构域]-[第一转录抑制结构域]-[Cas12f]-COOH;NH2-[第一转录抑制结构域]-[Cas12f]-[第二转录抑制结构域]-COOH;NH2-[第二转录抑制结构域]-[Cas12f]-[第一转录抑制结构域]-COOH;NH2-[NLS]-[Cas12f]-[KRAB催化结构域]-[DNMT3A-DNMT3L]-COOH;NH2-[Cas12f]-[KRAB催化结构域]-[DNMT3A-DNMT3L]-[NLS]-COOH;NH2-[NLS]-[Cas12f]-[KRAB催化结构
域]-[DNMT3A-DNMT3L]-[NLS]-COOH;NH2-[NLS]-[KRAB催化结构
域]-[DNMT3A-DNMT3L]-[Cas12f]-COOH;NH2-[KRAB催化结构
域]-[DNMT3A-DNMT3L]-[Cas12f]-[NLS]-COOH;NH2-[NLS]-[KRAB催化结构
域]-[DNMT3A-DNMT3L]-[Cas12f]-[NLS]-COOH;NH2-[NLS]-[KRAB催化结构
域]-[Cas12f]-[DNMT3A-DNMT3L]-COOH;NH2-[KRAB催化结构
域]-[Cas12f]-[DNMT3A-DNMT3L]-[NLS]-COOH;NH2-[NLS]-[KRAB催化结构
域]-[Cas12f]-[DNMT3A-DNMT3L]-[NLS]-COOH;NH2-[NLS]-[DNMT3A-DNMT3L]-[Cas12f]-[KRAB催化结构域]-COOH;NH2-[DNMT3A-DNMT3L]-[Cas12f]-[KRAB催化结构域]-[NLS]-COOH;和
NH2-[NLS]-[DNMT3A-DNMT3L]-[Cas12f]-[KRAB催化结构域]-[NLS]-COOH。
在一些实施方式中,所述融合多肽中的所述脱氨酶结构域包括腺苷脱氨酶结构域、胞苷脱氨酶结构域或其组合。
本发明提供的碱基编辑器包括腺嘌呤碱基编辑器(ABEs)和胞嘧啶碱基编辑器(CBEs)。在ABEs中,将腺苷脱氨酶结构域与Cas12f蛋白融合,可实现A·T碱基对转化为G·C碱基对。在一些实施方式中,本发明提供的碱基编辑器包括第一腺苷脱氨酶结构域与第二腺苷脱氨酶结构域,它们可以是相同的腺苷脱氨酶结构域,也可以是不同的腺苷脱氨酶结构域。在CBEs中,胞苷脱氨酶结构域APOBEC/AID与Cas12f蛋白融合,并与一个或多个尿嘧啶糖基化酶抑制剂(UGI)融合,以提高CBEs碱基编辑的准确性和效率,将C·G碱基对转化为T·A碱基对。
在优选的实施方式中,所述融合多肽中的所述腺苷脱氨酶结构域可以来源于γ-变形菌腺苷脱氨酶、肠杆菌腺苷脱氨酶、金黄色葡萄球菌TadA、枯草杆菌TadA、鼠伤寒沙门菌(Sal monellatyphimurium)TadA、腐败希瓦菌TadA、流感嗜血杆菌F3031 TadA、新月柄杆菌TadA或硫还原地杆菌(Geobactersulfurreducens)TadA。
在优选的实施方式中,所述胞苷脱氨酶选自活化诱导的胞苷脱氨酶(AID)、载脂蛋白B mRNA编辑复合物(APOBEC)和PmCDA1。在优选的实施方式中,所述腺苷脱氨酶结构域是TadA、ecTadA、saTadA、ecTadA7.10、TadA-8e、TadA8.17、TadA8.20、TadA9或其组合。
在优选的实施方式中,所述融合多肽的结构选自:
NH2-[腺苷脱氨酶结构域]-[Cas12f]-COOH;NH2-[Cas12f]-[腺苷脱氨酶结构域]-COOH;NH2-[第一腺苷脱氨酶结构域]-[第二腺苷脱氨酶结构域]-[Cas12f]-COOH;NH2-[第一腺苷脱氨酶结构域]-[Cas12f]-[第二腺苷脱氨酶结构域]-COOH;NH2-[Cas12f]-[第一腺苷脱氨酶结构域]-[第二腺苷脱氨酶结构域]-COOH;
NH2-[第二腺苷脱氨酶结构域]-[第一腺苷脱氨酶结构域]-[Cas12f]-COOH;NH2-[第二腺苷脱氨酶结构域]-[Cas12f]-[第一腺苷脱氨酶结构域]-COOH;NH2-[Cas12f]-[第二腺苷脱氨酶结构域]-[第一腺苷脱氨酶结构域]-COOH;NH2-[腺苷脱氨酶结构域]-[Cas12f]-[NLS]-COOH;NH2-[Cas12f]-[腺苷脱氨酶结构域]-[NLS]-COOH;NH2-[NLS]-[腺苷脱氨酶结构域]-[Cas12f]-COOH;NH2-[NLS]-[Cas12f]-[腺苷脱氨酶结构域]-COOH;NH2-[NLS]-[腺苷脱氨酶结构域]-[Cas12f]-[NLS]-COOH;NH2-[NLS]-[Cas12f]-[腺苷脱氨酶结构域]-[NLS]-COOH;NH2-[胞苷脱氨酶结构域]-[Cas12f]-[尿嘧啶糖基化酶抑制剂(UGI)]-COOH;NH2-[尿嘧啶糖基化酶抑制剂(UGI)]-[Cas12f]-[胞苷脱氨酶结构域]-COOH;NH2-[NLS]-[胞苷脱氨酶结构域]-[Cas12f]-[尿嘧啶糖基化酶抑制剂(UGI)]-COOH;NH2-[NLS]-[尿嘧啶糖基化酶抑制剂(UGI)]-[Cas12f]-[胞苷脱氨酶结构域]-COOH;NH2-[胞苷脱氨酶结构域]-[Cas12f]-[尿嘧啶糖基化酶抑制剂(UGI)]-[NLS]-COOH;NH2-[尿嘧啶糖基化酶抑制剂(UGI)]-[Cas12f]-[胞苷脱氨酶结构域]-[NLS]-COOH;NH2-[NLS]-[胞苷脱氨酶结构域]-[Cas12f]-[尿嘧啶糖基化酶抑制剂(UGI)]-[NLS]-COOH;和NH2-[NLS]-[尿嘧啶糖基化酶抑制剂(UGI)]-[Cas12f]-[胞苷脱氨酶结构域]-[NLS]-COOH。
在优选的实施方式中,所述5’-3’外切核酸酶功能域来自T5噬菌体;所述融合多肽的结构选自:NH2-[5’-3’外切核酸酶功能域]-[Cas12f]-COOH;NH2-[Cas12f]-[5’-3’外切核酸酶功能域]-COOH;
NH2-[NLS]-[5’-3’外切核酸酶功能域]-[Cas12f]-COOH;NH2-[NLS]-[Cas12f]-[5’-3’外切核酸酶功能域]-COOH;NH2-[5’-3’外切核酸酶功能域]-[Cas12f]-[NLS]-COOH;NH2-[Cas12f]-[5’-3’外切核酸酶功能域]-[NLS]-COOH;NH2-[NLS]-[5’-3’外切核酸酶功能域]-[Cas12f]-[NLS]-COOH;和NH2-[NLS]-[Cas12f]-[5’-3’外切核酸酶功能域]-[NLS]-COOH。
本发明的另一个方面提供一种复合物,其包含所述的融合多肽以及gRNA,所述gRNA包含所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列,所述gRNA与所述融合多肽复合以引导所述融合多肽结合至靶核酸;优选地,所述的融合多肽包含Cas12f多肽和融合在所述Cas12f多肽C端的5’-3’外切核酸酶功能域,所述融合多肽包含SEQ ID NO.127所示的氨基酸序列;优选地,所述复合物是表观遗传编辑器,所述融合多肽包含SEQ ID NO.129至131任一个所示的氨基酸序列;优选地,所述复合物是碱基编辑器,所述融合多肽包含SEQ ID NO.132或133所示的氨基酸序列。
在优选的实施方式中,所述复合物是表观遗传编辑器。在优选的实施方式中,所述复合物是碱基编辑器。在优选的实施方式中,所述复合物是基因敲除编辑器。
具体地,本发明提供的dCas12f(如dRaCas12f1、dRaCas12f1-HKRA)蛋白的gRNA的靶向序列可作用于靶核酸的转录起始位点(TSS)上游3000bp,优选为200-500bp之间,使得该表观遗传编辑器作用于目的基因的启动子、增强子、沉默子等调控元件。
在一些实施方案中,所述Cas12f多肽可经由一个或多个接头多肽(或称连接肽)与异源多肽融合。接头多肽可具有多种氨基酸序列中的任一种。蛋白质可通过间隔肽连接,间隔肽通常具有柔性性质,但不排除其他化学键。合适的接头包括长度在4至40个氨基酸之间或者长度在4至25个氨基酸之间的多肽。这些接头可通过使用合成的编码接头的寡核苷酸来产生以偶联蛋白质,或者可由编码融合蛋白的核酸序列编码。可使用具有一定程度柔性的肽接头。连接肽实际上可具有任何氨基酸序列,应记住优选的接头将具有产生总体上柔性的肽的序列。小氨基酸(诸如甘氨酸和丙氨酸)的用途用于产生柔性肽。对于本领域技术人员来说,产生此类序列是常规的。多种不同的接头是可商购获得的并且被认为是适合使用的。
接头多肽的实例包括甘氨酸聚合物(G)n、甘氨酸-丝氨酸聚合物、甘氨酸-丙氨酸聚合物、丙氨酸-丝氨酸聚合物。连接肽还可以是各种XTEN linker等,XTEN linker的长度约为16-80个氨基酸,XTEN linker可以为XTEN16 linker、XTEN18 linker、XTEN32 linker、XTEN80 linker。本领域技术人员将认识到,与任何所需元件缀合的肽的设计可包括全部或部分柔性的接头,使得接头可包括柔性接头以及赋予较少柔性结构的一个或多个部分。
本发明的另一个方面提供一种核酸,其包含编码gRNA的核苷酸序列,所述gRNA包含所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列;优选地,所述核酸是DNA或mRNA。
本发明的另一个方面提供一种核酸,包含编码所述的CRISPR-Cas系统的Cas12f多肽或所述的融合多肽的多核苷酸;优选地,所述多核苷酸被密码子优化以在原核或真核细胞中表达;优选地,所述多核苷酸包含或为如SEQ ID NO.1至2任一个所示的核苷酸序列。
本发明的另一个方面提供一种载体,其包含本发明提供的任何一种核酸。在优选的实施方式中,所述载体是质粒或病毒载体。在优选的实施方式中,所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。
本发明的另一个方面提供一种载体系统,其包括第一载体和与第一载体不同的第二载体,所述第一载体包含编码本发明提供的任何一种CRISPR-Cas系统的Cas12f多肽或所述的融合多肽的多核苷酸;所述第二载体包含gRNA或编码所述gRNA的核苷酸序列。在优选的实施方式中,所述第一载体和第二载体独立地是质粒或病毒载体。在优选的实施方式中,所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。
本发明的另一个方面提供一种递送系统,包含本发明提供的任一CRISPR-Cas系统、本发明提供的任一融合多肽、本发明提供的任一复合物、本发明提供的任一核酸、本发明提供的任一载体、或本发明提供的任一载体系统。在优选的实施方式中,所述递送系统包括脂质体、纳米颗粒或外泌体。
本发明的另一个方面提供一种细胞,其包含本发明提供的任一CRISPR-Cas系统、本发明提供的任一融合多肽、本发明提供的任一复合物、本发明提供的任一核酸、本发明提供的任一载体、本发明提供的任一载体系统、或本发明提供的任一递送系统。在优选的实施方式中,所述细胞是真核细胞。在优选的实施方式中,所述细胞是人细胞。
本发明的另一个方面提供组合物或试剂盒,其包含本发明提供的任一CRISPR-Cas系统、本发明提供的任一融合多肽、本发明提供的任一复合物、本发明提供的任一核酸、本发明提供的任一载体、本发明提供的任一载体系统、本发明提供的任一递送系统、或本发明提供的任一细胞;以及药学上可接受的载体。
本发明的组合物或试剂盒可进一步包括药学上可接受的载体,例如一种或多种另外的试剂,例如,i)缓冲剂;ii)蛋白酶抑制剂;iii)核酸酶抑制剂;iv)显影或可视化可检测标记所需的试剂;v)阳性和/或阴性对照靶DNA;vi)阳性和/或阴性对照Cas12f引导RNA等。本发明的组合物或试剂盒可包括:a)如上所述的本发明的Cas12f系统的组分,或者可包含本发明的Cas12f系统;和b)治疗剂。
本发明的另一个方面提供修饰靶核酸的方法,所述方法包括使靶核酸与本发明提供的任一CRISPR-Cas系统、本发明提供的任一复合物、本发明提供的任一载体系统、或本发明提供的任一递送系统接触,所述接触导致所述靶核酸被修饰。在优选的实施方式中,所述修饰包括增加或减少所述靶核酸中的靶序列的表达。在优选的实施方式中,所述修饰包括对所述靶核酸中的靶腺嘌呤或靶胞嘧啶进行脱氨基以实现碱基对转换。
具体的,当与Cas12f引导RNA结合时,本发明的Cas12f多肽或本发明的Cas12f融合多肽可结合靶核酸,并且在一些实施方式中,可结合并修饰靶核酸。靶核酸可以是任何核酸(例如,DNA、RNA),可以是双链或单链的,可以是任何类型的核酸(例如,染色体(基因组DNA)、衍生自染色体、染色体DNA、质粒、病毒、细胞外、细胞内、线粒体、叶绿体、线性、环状等)并且可来自任何生物体(例如,只要Cas12f引导RNA包含与靶核酸中的靶序列杂交的核苷酸序列,使得靶核酸可被靶向即可)。靶核酸可以是DNA或RNA。靶核酸可以是双链的(例如,dsDNA、dsRNA)或单链的(例如,ssRNA、ssDNA)。
在优选的实施方式中,其中所述靶核酸选自:双链DNA、单链DNA、RNA、基因组DNA和染色体外DNA。在优选的实施方式中,其中所述接触在体外在细胞外部发生、在培养的细胞内部发生或在体内细胞内部发生。在优选的实施方式中,所述细胞是真核细胞,更优选为人细胞。
本发明的另一个方面提供了用于治疗被诊断患有与点突变相关或由点突变引起的疾病的受试者的方法,所述点突变可以通过本文提供的碱基编辑器来校正。例如,在一些实施例中,提供了一种方法,包括向患有这种疾病的受试者(例如,与如上所述的点突变相关联的癌症)施用有效量的表观遗传编辑器、碱基编辑器或基因敲除编辑器,该编辑器纠正点突变、敲除疾病相关基因、激活/抑制疾病相关基因或将失活突变引入疾病相关基因。在一些实施方案中,该疾病是增殖性疾病。在一些实施方案中,该疾病是遗传性疾病。在一些实施方案中,该疾病是肿瘤性疾病。在一些实施方案中,该疾病是一种代谢性疾病。
具体地,本文提供的融合蛋白可用于治疗各种罕见病、肿瘤、癌症、炎症、病毒感染疾病、遗传疾病、中枢神经系统疾病、衰老和多种自身免疫性疾病以及常见和慢性疾病。更具体地,治疗的疾病可以为高血压、高脂血症、特发性纤维化(IPF)、肝纤维化、乙型肝炎病毒(HBV)、肝细胞癌(HCC)、肩肱型肌营养不良症(FSHD)、杂合子家族性高胆固醇血症(HeFH)、α-1抗胰蛋白酶缺乏症(A1AD)、非动脉性前部缺血性视神经病变(NAION)、视网膜色素变性(RP)或杜氏肌营养不良(DMD)。
附图说明
图1显示本发明的GFxxFP的报告系统验证原理的示意图。
图2显示本发明的构建GFxxFP的报告细胞的第一种载体的结构图。
图3显示本发明的构建GFxxFP的报告细胞的第二种载体的结构图。
图4显示本发明的RaCas12f1效应蛋白与不同gRNA scaffold在报告细胞中的切割效率。
图5显示本发明的不同RaCas12f1突变蛋白体在报告细胞中的切割效率。
图6显示本发明的载体A至载体C的重组载体图。
图7通过一代测序结果展示本发明的RaCas12f1突变蛋白体以及与T5 exo融合蛋白在真核细胞的TTR基因的切割活性。
图8通过高通量测序结果展示本发明的RaCas12f1突变蛋白体以及与T5 exo融合蛋白在真核细胞的TTR基因的插入缺失率(Indel%)。
图9通过高通量测序结果展示本发明的RaCas12f1突变蛋白体以及与T5 exo融合蛋白在真核细胞的其他基因的插入缺失率(Indel%)。
具体实施方式
序列表
/>
/>
/>
/>
/>
/>
/>
/>
实施例
实施例1.构建GFxxFP的报告系统
为了灵敏地检测本申请CRISPR/RaCas12f1系统与不同gRNAscaffold的切割活性,构建含有编码RaCas12f1序列、gRNA和编码TagBFP序列的第一载体,以及含有编码mCherry序列、P2A和编码GFxxFP序列的第二载体。第一种载体的结构图如图2:将编码RaCas12f1的序列(SEQ ID NO.1)、编码gRNA的序列和编码TagBFP蓝色荧光蛋白的序列构建至转染载体上,命名为pCMV-RaCas12f1-gRNA-VEGFA2-TagBFP;其中,gRNA包括gRNA scaffold和在该gRNAscaffold的3’末端与靶核酸互补的靶向序列(VEGFA2 Target),VEGFA2 Target的核苷酸序列为SEQ ID NO.134,gRNA scaffold的核苷酸序列为SEQ ID NO.3;RaCas12f1蛋白通过CMV启动子表达,且RaCas12f1的序列两端连接SV40 NLS序列,gRNA通过U6启动子转录,TagBFP通过hPGK启动子启动表达,通过TagBFP蛋白的蓝色荧光指示该载体成功转染宿主细胞。第二种载体的结构图如图3:将编码mCherry蛋白的序列、自剪切多肽P2A和编码GFxxFP序列依次构建至慢病毒表达载体上,命名为pLenti-EF1a-mCherry-P2A-GFxxFP-VEGA2;其中,编码mCherry蛋白的序列、自剪切多肽P2A和编码GFxxFP序列通过EF-1a启动子启动表达,GFxxFP中d1EGFP和d2EGFP序列为两个同源臂,d1EGFP和d2EGFP序列分别是编码绿色荧光蛋白基因EGFP的N端的199aa序列和C端的199aa序列,这两段序列共有160aa的重叠,d1EGFP和d2EGFP序列之间有插入片段,插入片段的5’端至3”端依次含有终止密码子TGA、TTC PAM序列(SEQ ID NO.135)、靶向序列(VEGFA2 Target,SEQ ID NO.134)和NGG PAM序列(SEQ ID NO.136),即插入片段的序列为:TTC-SEQ ID NO.134-GGG,VEGFA2 Target靶向序列的5’端为TTC PAM,其3’端为GGG PAM使其同时适用于以下的CRISPR/RaCas12f1系统和CRISPR/SpCas9系统,通过mCherry蛋白的红色荧光指示该载体成功转染宿主细胞。
同样的,参照上述方法,在gRNA的3’末端构建U6终止子,具体包括:在SEQ ID NO.3的3’末端与VEGFA2 Target连接后再连接U6终止子-14(SEQ ID NO.121),该gRNA的结构为SEQ ID NO.18。
同样的,将SpCas9的密码子优化的核苷酸编码序列替换上述第一载体的RaCas12f1,形成pCMV-SpCas9-gRNA-VEGFA2-TagBFP阳性对照载体,其中,该阳性对照载体的gRNA是VEGFA2 Target(SEQ ID NO.134)的3’末端连接SpCas9 gRNAscaffold(SEQ IDNO.136),通过TagBFP蓝色荧光指示阳性对照载体成功转染宿主细胞。
同样的,参照上述方法,构建相应的转录各自gRNA scaffold(SEQ ID NO.4至SEQID NO.107)的第一种载体,即将其余gRNA scaffold(SEQ ID NO.4至SEQ ID NO.107)各自替换上述SEQ ID NO.3序列,通过TagBFP蓝色荧光指示第一种载体成功转染宿主细胞。
同样的,参照上述方法,于pCMV-RaCas12f1-gRNA-VEGFA2-TagBFP载体上构建不含有gRNA scaffold的空白对照载体,通过TagBFP蓝色荧光指示空白对照载体成功转染宿主细胞。
实施例2.利用荧光报告系统比较不同gRNAscaffold的切割活性
GFxxFP的报告系统验证原理如图1所示,将上述构建的第一载体和第二载体共转染至人类细胞系HEK293细胞中,通过TagBFP蛋白和mCherry蛋白的荧光指示两种载体成功转染宿主细胞,宿主细胞中的d1EGFP和d2EGFP之间含有终止密码子TGA,宿主细胞无法表达正常EGFP;第一载体在宿主细胞中表达RaCas12f1或SpCas9蛋白和对应的转录gRNA,该gRNA与对应的Cas蛋白结合形成RNP复合物后,RNP复合物识别GFxxFP中PAM,gRNA的靶向序列(VEGFA2 Target)引导RNP复合物至宿主细胞GFxxFP上的靶向序列,CRISPR/RaCas12f1切割GFxxFP上的靶向序列,产生DSB,然后GFxxFP利用SSA修复机制产生正确的EGFP编码框,表达正常EGFP,使宿主细胞由无绿色荧光变为有绿色荧光,如图1底部结果(该结果为假设结果),当gRNA只有gRNAscaffold无靶向序列时,宿主细胞无绿色荧光;当gRNA含有gRNAscaffold和靶向序列时,宿主细胞产生绿色荧光。
用电转染法分别将上述表达RaCas12f1或SpCas9蛋白和转录不同gRNA的第一载体pCMV-RaCas12f1-gRNA-VEGFA2-TagBFP、阳性对照载体或空白对照载体(蓝色荧光)和转录pLenti-EF1a-mCherry-P2A-GFxxFP-VEGA2的第二载体(红色荧光)转至HEK293细胞系中。在培养48小时后,通过流式细胞仪分选得到转染双阳性(红色和蓝色荧光两者)的细胞。在同时发红光(mCherry+)和发蓝光(BFP+)阳性细胞中检测绿色荧光(GFP+)细胞的绿色荧光强度以筛选适用于RaCas12f1及其突变体的gRNAscaffold。结果如图4和图5,图4至图6横坐标为gRNA scaffold,横坐标的名称与序列表的名称列一一对应,图4A至C、图4G至I横坐标的NT表示第一载体的gRNA不含有gRNAscaffold(转染空白对照载体的实验组),图4A至C横坐标的“WT”和图4H横坐标的“RasgWT”均表示gRNAscaffold序列为SEQ ID NO.3(转染含有SEQID NO.3第一载体的实验组),图4和图5的“%ofGFP+cells/mCherry+BFP+cells”表示GFP阳性细胞/mCherry和BFP阳性细胞(%)。
图4A为第一轮改造的结果,图4A横坐标名称为MS1-MS24依次为SEQ ID NO.4-SEQID NO.27,将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性,绿色荧光强度越高其切割活性越高,其中SEQ IDNO.12-SEQ ID NO.21和SEQ ID NO.23-SEQ ID NO.27的gRNA scaffold具有较高的切割活性(较高绿色荧光强度),SEQ ID NO.12-SEQ ID NO.16、SEQ ID NO.23-SEQ ID NO.27的gRNAscaffold显著强于SEQ ID NO.3的gRNAscaffold。
进过第一轮改造,挑选切割活性最高的SEQ ID NO.12和SEQ ID NO.13进行第二轮改造。图4B为第二轮改造的结果,图4B横坐标从左列到右列依次为SEQ ID NO.12-13、SEQID NO.29-41,将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性,绿色荧光强度越高其切割活性越高,其中SEQ IDNO.29-40的gRNAscaffold具有较高的切割活性(显著强于SEQ ID NO.3),SEQ ID NO.29-38的gRNAscaffold显著强于SEQ ID NO.12或SEQ ID NO.13,其中,SEQ ID NO.29、30、33和36的gRNAscaffold切割活性较高。
同样的,挑选切割活性较高的SEQ ID NO.23和SEQ ID NO.24进行第二轮改造。图4C为第二轮改造的结果,图4C横坐标从左列到右列依次为SEQ ID NO.23-24、SEQ IDNO.42-53,将含有这些gRNA scaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性,绿色荧光强度越高其切割活性越高,其中SEQ IDNO.42-46的gRNA scaffold具有较高的切割活性分别强于SEQ ID NO.3、23和24,其中,SEQID NO.42、43和46的gRNAscaffold切割活性较高。
接着,参照图4C中第二轮改造后切割活性较高的SEQ ID NO.23、24、42、43和46的突变方式,在SEQ ID NO.3基础上进行第三轮组合突变改造,图4D为第三轮改造的结果,图4D纵坐标表示gRNA scaffold,横坐标为红色和蓝色荧光细胞中绿色荧光强度,其中,图4D纵坐标从底行到顶行的序列依次为SEQ ID NO.3、23、24、43、46、42、54、55、56、57、58、59、60、61、62和63,将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性,绿色荧光强度越高其切割活性越高,其中SEQ IDNO.54-63的gRNAscaffold具有较高的切割活性分别强于SEQ ID NO.23、24、42、43和46,其中,SEQ ID NO.58、61和63的gRNAscaffold切割活性较高。
同样的,挑选图4B中第二轮改造后切割活性较高的SEQ ID NO.36进行第三轮改造。图4E为第三轮改造的结果,图4E纵坐标表示gRNA scaffold,横坐标为红色和蓝色荧光细胞中绿色荧光强度,其中,图4E纵坐标从底行到顶行的序列依次为SEQ ID NO.36、64至78,将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNA scaffold的切割活性,绿色荧光强度越高其切割活性越高,其中SEQ ID NO.64至78的gRNA scaffold具有切割活性,但与SEQ ID NO.36相比没有显著提高。
接着,参照图4A中第一轮和图4B中第二轮改造后切割活性较高的SEQ ID NO.25、26和29,以及SEQ ID NO.28的突变形式,在SEQ ID NO.3基础上进行第四轮组合突变改造,图4F为第四轮改造的结果,图4F纵坐标表示gRNA scaffold,横坐标为红色和蓝色荧光细胞中绿色荧光强度,其中,图4F纵坐标从底行到顶行的序列依次为SEQ ID NO.3、29、25、26、28、79、80、81、82、83、84和85,将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性,绿色荧光强度越高其切割活性越高,其中SEQ ID NO.79-85的gRNAscaffold具有较高的切割活性分别强于SEQ ID NO.3、25、26和28。
接着,参照图4A中第一轮、图4D中第三轮和图4E中第三轮改造后切割活性较高的SEQ ID NO.16、27、36和63,在SEQ ID NO.3基础上进行第五轮组合突变改造;图4G为第五轮改造的结果,图4G横坐标表示gRNAscaffold,纵坐标为红色和蓝色荧光细胞中绿色荧光强度,其中图4G横坐标从左列到右列的序列依次为SEQ ID NO.3、16、27、63、36、86、87、88、89、90、91和92,将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,纵坐标为红色和蓝色荧光细胞中绿色荧光强度;同时设置阳性对照组,即将pCMV-SpCas9-gRNA-VEGFA2-TagBFP阳性对照载体和上述第二载体,共转染HEK293按照上述方法培养后检测绿色荧光强度,结果如图4G最右列的SpCas9为该阳性对照组结果。绿色荧光强度可表征这些gRNAscaffold的切割活性,绿色荧光强度越高其切割活性越高,其中SEQ ID NO.63、36、86至92的gRNAscaffold具有较高的切割活性分别强于SEQID NO.3、16和27,且SEQ ID NO.36、88、90、91和92的切割活性均强于SpCas9的切割活性,最后筛选得到适合RaCas12f1蛋白的gRNAscaffold(SEQ ID NO.92),将SEQ ID NO.92命名为Rasgmax,后续实施例采用Rasgmax筛选RaCas12f1蛋白的有效突变位点。
进一步地,对现有gRNA scaffold进行改造,SEQ ID NO.95至102是对现有的gRNAscaffold(SEQ ID NO.93和94)进行截短或/和插入茎环改造后得到,分别将含有这些gRNAscaffold(SEQ ID NO.95至102)的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,绿色荧光强度可表征这些gRNA scaffold的切割活性,绿色荧光强度越高其切割活性越高,结果如图4H,图4H横坐标表示gRNA scaffold,纵坐标为红色和蓝色荧光细胞中绿色荧光强度,其中图4H横坐标从左列到右列的序列依次为SEQ ID NO.97、98、99、100、101、102、95、96、94、93和3,其中SEQ ID NO.97-100和95的gRNAscaffold具有较高的切割活性,分别强于SEQ ID NO.3、93和94。
接着,挑选图4H中改造后切割活性较高的SEQ ID NO.99进行优化。图4I为优化结果,图4I横坐标表示gRNA scaffold,纵坐标为红色和蓝色荧光细胞中绿色荧光强度,其中,图4I横坐标从左列到右列的序列依次为SEQ ID NO.99、103、104、105、106、107和95,将含有这些gRNAscaffold的第一载体和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些gRNAscaffold的切割活性,绿色荧光强度越高其切割活性越高,其中SEQ ID NO.103、104、105和106的gRNA scaffold具有切割活性,且SEQ ID NO.103、104和105强于SEQ ID NO.99。
实施例3.利用荧光报告系统比较不同RaCas12f1蛋白的点突变的切割活性
按照实施例1和2的方法检测不同点突变RaCas12f1蛋白系统的切割活性,以RaCas12f1蛋白(SEQ ID NO.1)为基础,分别构建RaCas12f1单一位点突变库,单一点突变位点分别为A11R、W34R、A38R、S55R、H66G、T78S、G80H、N84K、K88R、G90R、C98L、Q103K、T104K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、I124R、S128R、N129D、D133R、N136K、E142R、Y143R、C171K、Q191G、G194K、V214K、N223R、H238K、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、T339K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R和S428K,将含有这些RaCas12f1点突变的第一载体(第一载体gRNA的gRNAscaffold为实施例2的Rasgmax,其靶向序列为SEQ ID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些点突变蛋白的切割活性,绿色荧光强度越高其切割活性越高。
同时设置RaCas12f1蛋白不作突变的WT阴性对照组、SpCas9阳性对照组和NT空白对照组;WT阴性对照组和NT空白对照组载体上gRNA的gRNAscaffold为实施例2的Rasgmax,其靶向序列为SEQ ID NO.134,SpCas9阳性对照载体上gRNA是VEGFA2 Target(SEQ IDNO.134)的3’末端连接SpCas9 gRNA scaffold(SEQ ID NO.136);WT阴性对照组为将第一载体(含有SEQ ID NO.1的不作点突变RaCas12f1蛋白)和上述第二载体,共转染HEK293按照上述方法培养后检测绿色荧光强度,SpCas9阳性对照组为将pCMV-SpCas9-gRNA-VEGFA2-TagBFP阳性对照载体和上述第二载体,共转染HEK293按照上述方法培养后检测绿色荧光强度,NT空白对照组为将第一载体(不含有RaCas12f1序列)和上述第二载体,共转染HEK293按照上述方法培养后检测绿色荧光强度,结果如图5A,图5A横坐标标记为WT、SpCas9和NT分别为WT阴性对照组、SpCas9阳性对照组和NT空白对照组,纵坐标为红色和蓝色荧光细胞中绿色荧光强度,其中图5A横坐标从左列到右列的点突变蛋白依次为A11R、W34R、A38R、S55R、H66G、T78S、G80H、N84K、K88R、G90R、C98L、Q103K、T104K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、I124R、S128R、N129D、D133R、N136K、E142R、Y143R、C171K、Q191G、G194K、V214K、N223R、H238K、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、T339K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R和S428K,结果显示A11R、W34R、A38R、H66G、T78S、G80H、K88R、G90R、C98L、Q103K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、S128R、N129D、N136K、E142R、Y143R、C171K、Q191G、G194K、V214K、N223R、H238K、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R或S428K的RaCas12f1点突变蛋白具有一定的切割活性,说明这些点突变为有效突变,A38R、S114K、S128R、N129D、E142R、C171K、G194K、N223R、E261K、L271R、E341K、Y371K、V399K和S428K的RaCas12f1点突变蛋白强于SpCas9蛋白。
实施例4.利用荧光报告系统比较不同点突变组合的RaCas12f1蛋白的切割活性
按照实施例1和2的方法检测不同点突变组合的RaCas12f1蛋白系统的切割活性,挑选实施例3切割活性高的单一突变位点进行两两组合,以RaCas12f1蛋白(SEQ ID NO.1)为基础,构建RaCas12f1双位点突变库,双突变位点组合为:(N129D和S428K)组合1、(E142R和S428K)组合2、(C171K和S428K)组合3、(G194K和S428K)组合4、(N223R和S428K)组合5、(E261K和S428K)组合6、(E341K和S428K)组合7、(S428K和V399K)组合8、(A38R和N129D)组合9、(S128R和N129D)组合10、(N129D和C171K)组合11、(N129D和G194K)组合12、(N129D和N223R)组合13、(N129D和Y371K)组合14和(N129D和V399K)组合15。将含有这些RaCas12f1双突变位点组合的第一载体(第一载体gRNA的gRNAscaffold为实施例2的Rasgmax,其靶向序列为SEQ ID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些点突变组合蛋白的切割活性,绿色荧光强度越高其切割活性越高。
同时设置RaCas12f1蛋白不作突变的WT阴性对照组、SpCas9阳性对照组和NT空白对照组;WT阴性对照组和NT空白对照组载体上gRNA的gRNAscaffold为实施例2的Rasgmax,其靶向序列为SEQ ID NO.134,SpCas9阳性对照载体上gRNA是VEGFA2 Target(SEQ IDNO.134)的3’末端连接SpCas9 gRNA scaffold(SEQ ID NO.136);WT阴性对照组为将第一载体(含有SEQ ID NO.1的不作点突变RaCas12f1蛋白)和上述第二载体,共转染HEK293按照上述方法培养后检测绿色荧光强度,SpCas9阳性对照组为将pCMV-SpCas9-gRNA-VEGFA2-TagBFP阳性对照载体和上述第二载体,共转染HEK293按照上述方法培养后检测绿色荧光强度,NT空白对照组为将第一载体(不含有RaCas12f1序列)和上述第二载体,共转染HEK293按照上述方法培养后检测绿色荧光强度,结果如图5B,图5B横坐标标记为WT、SpCas9和NT分别为WT阴性对照组、SpCas9阳性对照组和NT空白对照组,纵坐标为红色和蓝色荧光细胞中绿色荧光强度。其中图5B左图横坐标从左列到右列的点突变蛋白依次为(N129D和S428K)组合1、(E142R和S428K)组合2、(C171K和S428K)组合3、(G194K和S428K)组合4、(N223R和S428K)组合5、(E261K和S428K)组合6、(E341K和S428K)组合7、(V399K和S428K)组合8和RaCas12f1-S428K(实施例3的单一点突变);图5B右图横坐标从左列到右列的点突变蛋白依次为(A38R和N129D)组合9、(S128R和N129D)组合10、(C171K和N129D)组合11、(G194K和N129D)组合12、(N223R和N129D)组合13、(Y371K和N129D)组合14、(V399K和N129D)组合15和RaCas12f1-N129D(实施例3的单一点突变)。图5B结果说明RaCas12f1蛋白进行组合1至组合15的双点突变后均能保持高效的切割活性,组合1至组合8、组合9、组合10、组合12、组合14和组合16的双点突变后蛋白的切割活性均强于SpCas9蛋白。
此外,挑选实施例3切割活性高的单一突变位点进行双位点、三位点、四位点和五位点组合对RaCas12f1蛋白进行改造,以RaCas12f1蛋白(SEQ ID NO.1)为基础,构建RaCas12f1多位点突变库,突变位点为:A38R、S114K、S128R、N129D、G194K、Y371K、(A38R和N129D)组合、(S114K和N129D)组合、(S128R和N129D)组合、(G194K和N129D)组合、(Y371K和N129D)组合、(A38R、S128R和N129D)组合、(S114K、S128R和N129D)组合、(G194K、S128R和N129D)组合、(Y371K、S128R和N129D)组合、(A38R、S128R、N129D和Y371K)组合、(S114K、S128R、N129D和Y371K)组合、(G194K、S128R、N129D和Y371K)组合、(S114K、A38R、S128R、N129D和Y371K)组合和(G194K、A38R、S128R、N129D和Y371K)组合。将含有这些双位点、三位点、四位点和五位点的RaCas12f1的第一载体(第一载体gRNA的gRNA scaffold为实施例2的Rasgmax,其靶向序列为SEQ ID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度,纵坐标为红色和蓝色荧光细胞中绿色荧光强度。绿色荧光强度可表征这些点突变组合蛋白的切割活性,绿色荧光强度越高其切割活性越高。
同时设置WT对照组和NT空白对照组,WT对照组为将第一载体(含有SEQ ID NO.1的RaCas12f1蛋白)和上述第二载体,共转染HEK293按照上述方法培养后检测绿色荧光强度,NT空白对照组为将第一载体(不含有RaCas12f1蛋白)和上述第二载体,共转染HEK293按照上述方法培养后检测绿色荧光强度,结果如图5C,图5C最左列为WT对照组结果,图5C最右列为NT空白对照组结果。图5C横坐标表示RaCas12f1蛋白点突变种类,纵坐标为红色和蓝色荧光细胞中绿色荧光强度,其中图5C左图横坐标从左列到右列的V1.1、V1.2、V1.3、V1.4、V1.5、V1.6、V2.1、V2.2、V2.3、V2.4、V2.5、V3.1、V3.2、V3.3、V3.4、V4.1、V4.2、V4.3、V5.1、V5.2的突变位点对应为A38R、S114K、S128R、N129D、G194K、Y371K、(A38R和N129D)组合、(S114K和N129D)组合、(S128R和N129D)组合、(G194K和N129D)组合、(Y371K和N129D)组合、(A38R、S128R和N129D)组合、(S114K、S128R和N129D)组合、(G194K、S128R和N129D)组合、(Y371K、S128R和N129D)组合、(A38R、S128R、N129D和Y371K)组合、(S114K、S128R、N129D和Y371K)组合、(G194K、S128R、N129D和Y371K)组合、(S114K、A38R、S128R、N129D和Y371K)组合和(G194K、A38R、S128R、N129D和Y371K)组合。图5C结果说明进行单一点突变的RaCas12f1蛋白(V1.1至V1.6)均能维持其切割活性,双位点组合突变的RaCas12f1蛋白(V2.1至V2.5)的切割活性均有一定的提高,三位点和四位点和五位点突变的RaCas12f1蛋白(V3.1至V3.4、V4.1至V4.3、V5.1至V5.2)的切割活性均有较高的提升,可见,上述突变位点均为有效突变。
最后,利用上述荧光报告系统比较不同CRISPR-RaCas12f1系统的切割效率,按照实施例1和2的方法构建第一载体和第二载体,设置三个实验组,分别为Ra-sgWT组、Ra-sgmax组和Ra_v5.1-sgmax组。Ra-sgWT组包括:含有无突变的RaCas12f1蛋白(SEQ ID NO.1)的第一载体(第一载体gRNA的gRNA scaffold为RasgWT(SEQ ID NO.3),其靶向序列为SEQID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度;Ra-sgmax组包括:含有无突变的RaCas12f1蛋白(SEQ ID NO.1)的第一载体(第一载体gRNA的gRNAscaffold为实施例2的Rasgmax(SEQ ID NO.92),其靶向序列为SEQ ID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度;Ra_v5.1-sgmax组包括:含有五位点突变的RaCas12f1蛋白(SEQ ID NO.1上有S114K、A38R、S128R、N129D和Y371K位点突变,命名为Ra_v5.1)的第一载体(第一载体gRNA的gRNAscaffold为实施例2的Rasgmax(SEQ IDNO.92),其靶向序列为SEQ ID NO.134)和第二载体共转染HEK293按照上述方法培养后检测绿色荧光强度。同时设置NT空白对照组,NT空白对照组为将第一载体(不含有RaCas12f1蛋白)和上述第二载体,共转染HEK293按照上述方法培养后检测绿色荧光强度,结果如图5D,图5D从左列到右列依次为NT空白对照组、Ra-sgWT组、Ra-sgmax组和Ra_v5.1-sgmax组,图5D结果显示,RaCas12f1蛋白与RasgWT、RaCas12f1蛋白与Rasgmax、和Ra_v5.1蛋白与Rasgmax均有一定的切割活性,其中Ra_v5.1蛋白与Rasgmax组成的CRISPR-RaCas12f1系统具有最优的切割活性。
实施例5.不同RaCas12f1蛋白在人类细胞系中内源靶点切割活性验证
进一步证实不同RaCas12f1蛋白在哺乳动物细胞中对内源靶点的dsDNA切割活性,本实验采用测序方式进行验证,如表1所示载体结构,分别将经过真核生物密码子优化的编码RaCas12f1-HKRA/RaCas12f1-HKRA-T5 exo的核苷酸与靶向TTR基因的sgRNA构建真核生物表达载体pX330中,该sgRNA由U6启动子启动表达;该RaCas12f1-HKRA/RaCas12f1-HKRA-T5 exo蛋白由chickenβ-actin promoter启动子启动表达;在RaCas12f1-HKRA/RaCas12f1-HKRA-T5 exo核苷酸下游(C端)通过自剪切多肽2A(P2A)连接eGFP基因(用于进行细胞分选),形成重组载体,分别标记为:pX330-RaCas12f1-HKRA-Rasgmax-TTR-eGFP(载体A)、pX330-RaCas12f1-HKRA-T5exo-Rasgmax-TTR-eGFP(载体B)。具体的,载体A中效应蛋白为RaCas12f1-HKRA(SEQ ID NO.2);载体B中效应蛋白为RaCas12f1-HKRA-T5 exo(RaCas12f1-HKRA的C端通过linker与5’-3’外切核酸酶T5exo连接,其序列为SEQ ID NO.127);载体A和B的sgRNA(5’→3’)依次包括:gRNAscaffold和靶向序列,其gRNAscaffold为Rasgmax(SEQ IDNO.92),其靶向序列为TTR-Target gRNA(SEQ ID NO.138)。
同样的,构建SpCas9阳性对照组,参照上述方法,将编码SpCas9的核苷酸与靶向TTR基因的sgRNA构建真核生物表达载体pX330中,该sgRNA由U6启动子启动表达;该SpCas9蛋白由chickenβ-actin promoter启动子启动表达;在SpCas9核苷酸下游(C端)通过自剪切多肽2A(P2A)连接eGFP基因(用于进行细胞分选),形成重组载体,分别标记为:pX330-SpCas9-TTR-eGFP(载体C)。载体C的sgRNA(5’→3’)依次包括:靶向序列和gRNAscaffold,其靶向序列为TTR-Target gRNA(SpCas9)(SEQ ID NO.139),其gRNAscaffold为SpCas9 gRNAscaffold(SEQ ID NO.137)。
表1用于敲除TTR基因的各种载体(图6显示对应的质粒图谱)
/>
分别将上述载体(载体A至载体C)转染人HEK293T细胞。在37℃、5%二氧化碳浓度下培养,转染72h后,通过荧光活化细胞分选(FACS)收集eGFP阳性细胞,细胞分选后继续培养48小时,随后提取分选的细胞基因组,对TTR基因靶位点进行PCR扩增然后进行一代和高通量测序。
一代测序结果如图7所示,测序结果可知,图7A至7C的箭头区为对应效应蛋白的TTR靶点序列,在TTR靶点序列下游(箭头方向),也即阅读框下游存在连续稳定的套峰,说明本申请的RaCas12f1-HKRA蛋白和RaCas12f1-HKRA-T5 exo融合蛋白能在TTR靶点上进行切割,导致TTR靶点下游(箭头方向)的阅读框下游序列发生移码突变,引起阅读框架变化,导致其位点下游出现连续稳定的套峰,说明本发明的RaCas12f1效应蛋白及其突变体具有在真核细胞的内源靶点切割活性。
高通量测序展示两个效应蛋白在HEK293T细胞系的TTR基因的插入缺失率(Indel%)结果,如图8所示,本申请的RaCas12f1-HKRA和RaCas12f1-HKRA-T5 exo融合蛋白在人HEK293T细胞系的TTR基因处的插入缺失率分别为89.35%和93.55%,阳性对照的SpCas9蛋白在该TTR基因处的插入缺失率为57.44%。
参照上述方法验证RaCas12f1-HKRA蛋白和RaCas12f1-HKRA-T5 exo融合蛋白在HEK293T细胞系的其他基因(分别为RNF2、PCSK9、B2M、TRAC和PD-1)敲除效率,具体包括:如表2所示载体结构构建一系列载体。分别将这些载体转染人HEK293T细胞。在37℃、5%二氧化碳浓度下培养,转染72h后,通过荧光活化细胞分选(FACS)收集eGFP阳性细胞,细胞分选后继续培养48小时,随后提取分选的细胞基因组,对对应基因靶位点进行PCR扩增然后进行高通量测序。高通量测序展示RaCas12f1-HKRA蛋白和RaCas12f1-HKRA-T5 exo融合蛋白在HEK293T细胞系的不同基因的插入缺失率(Indel%)结果,如图9所示,本申请的RaCas12f1-HKRA和RaCas12f1-HKRA-T5 exo融合蛋白在人HEK293T细胞系的RNF2、PCSK9、B2M、TRAC和PD-1基因处具有较高的敲除活性,尤其是RNF2、B2M、TRAC和PD-1基因,此外,5’-3’外切核酸酶连接在RaCas12f1及其变体的C端可显著提高RaCas12f1蛋白的切割效率。
表2用于敲除不同基因的各种载体
/>
上述实施例结果说明本申请的CRISPR-RaCas12f1及一系列gRNAscaffold具有稳健的编辑活性,是哺乳动物细胞中基因组编辑、碱基编辑和表观遗传编辑的多功能平台,并且未来可以用于体内或离体治疗性应用。
Claims (16)
1.向导RNA(gRNA)scaffold,其中所述gRNAscaffold包含与SEQ ID NO.3至17、19至92、95至107任一项所示的核苷酸序列相比具有至少80%序列同一性的核苷酸序列;优选地,其中所述gRNAscaffold为SEQ ID NO.3至17、SEQ ID NO.19至92、SEQ ID NO.95至107任一项所示的核苷酸序列。
2.根据权利要求1所述的gRNAscaffold,其中所述gRNAscaffold包含一个或多个修饰,所述一个或多个修饰导致所述gRNAscaffold展现一种或多种改善特征;
优选地,所述一种或多种改善特征选自由以下组成的组:
改善gRNA稳定性;
改善所述gRNA的转录;
增加所述gRNA的折叠速率;
折叠期间减少副产物形成;
折叠期间减少脱靶折叠中间体形成;
增加生产性折叠;
增加与Cas12f蛋白的结合亲和力;
当与所述Cas12f蛋白复合时,改善与靶核酸的结合亲和力;
当与所述Cas12f蛋白复合时,改善基因编辑;或
当与所述Cas12f蛋白复合时,改善编辑特异性。
3.根据权利要求2所述的gRNAscaffold,所述一个或多个修饰包含:
(i)一个或多个区域中的所述gRNA scaffold的1至40个连续或非连续核苷酸的取代;
(ii)一个或多个区域中的所述gRNAscaffold的1至40个连续或非连续核苷酸的缺失;
(iii)一个或多个区域中的所述gRNA scaffold的1至40个连续或非连续核苷酸的插入;
(iv)一个或多个区域中的所述gRNAscaffold的1至10个连续或非连续核苷酸的化学修饰;
(v)所述gRNAscaffold具有异源RNA序列取代;或
(vi)(i)-(v)的任何组合。
4.一种CRISPR-Cas系统,其包含:
(i)Cas12f多肽,所述Cas12f多肽包含与SEQ ID NO.1所示的氨基酸序列相比具有至少80%序列同一性的氨基酸序列;以及
(ii)gRNA,所述gRNA包含权利要求1至3中任一项所述的gRNA scaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列,所述gRNA与所述Cas12f多肽复合以引导所述Cas12f多肽结合至所述靶核酸。
5.根据权利要求4所述的CRISPR-Cas系统,其中所述Cas12f多肽被突变以使其具有以下一个或多个特征:核酸切割活性增强或核酸结合活性增强;
所述Cas12f多肽:(i)根据SEQ ID NO.1所示的序列编号,在A11、W34、A38、H66、T78、G80、K88、G90、C98、Q103、T104、K110、N111、S112、S114、E115R、T120R、S128、N129、Q130、N136、E142、Y143、C171、Q191、G194、N203、V214、A216、N223、H238、I241、E261、L271、S272、I285、I285、V289、T291、R302、S336、E341、I369、Y371、D373、S377、V399、L401、Q415和S428中的一个或多个位置处具有氨基酸取代;或
(ii)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽具有一个或多个选自A11R、W34R、A38R、H66G、T78S、G80H、K88R、G90R、C98L、Q103K、T104R、K110R、N111R、S112R、S114K、E115R、T120R、S128R、N129D、Q130H、N136K、E142R、Y143R、C171K、Q191G、G194K、N203K、V214K、A216R、N223R、H238K、I241A、E261K、L271R、S272R、I285K、I285R、V289R、T291K、R302K、S336K、E341K、I369V、Y371K、D373K、S377T、V399K、L401K、Q415R和S428K的氨基酸取代。
6.根据权利要求5所述的CRISPR-Cas系统,其中所述Cas12f多肽:
(1)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和S428K位置处具有氨基酸取代;
(2)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在E142R和S428K位置处具有氨基酸取代;
(3)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在C171K和S428K位置处具有氨基酸取代;
(4)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在G194K和S428K位置处具有氨基酸取代;
(5)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N223R和S428K位置处具有氨基酸取代;
(6)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在E261K和S428K位置处具有氨基酸取代;
(7)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在E341K和S428K位置处具有氨基酸取代;
(8)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S428K和V399K位置处具有氨基酸取代;
(9)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在A38R和N129D位置处具有氨基酸取代;
(10)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S114K和N129D位置处具有氨基酸取代;
(11)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S128R和N129D位置处具有氨基酸取代;
(12)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和C171K位置处具有氨基酸取代;
(13)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和G194K位置处具有氨基酸取代;
(14)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和N223R位置处具有氨基酸取代;
(15)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和Y371K位置处具有氨基酸取代;
(16)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D和V399K位置处具有氨基酸取代;
(17)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在A38R位置处具有氨基酸取代;
(18)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S114K位置处具有氨基酸取代;
(19)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S128R位置处具有氨基酸取代;
(20)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在N129D位置处具有氨基酸取代;
(21)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在G194K位置处具有氨基酸取代;
(22)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在Y371K位置处具有氨基酸取代;
(23)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在A38R、S128R和N129D位置处具有氨基酸取代;
(24)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S114K、S128R和N129D位置处具有氨基酸取代;
(25)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S128R、N129D和G194K位置处具有氨基酸取代;
(26)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S128R、N129D和Y371K位置处具有氨基酸取代;
(27)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在A38R、S128R、N129D和Y371K位置处具有氨基酸取代;
(28)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S114K、S128R、N129D和Y371K位置处具有氨基酸取代;
(29)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在S128R、N129D、G194K和Y371K位置处具有氨基酸取代;
(30)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在A38R、S114K、S128R、N129D和Y371K位置处具有氨基酸取代;
(31)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在A38R、S128R、N129D、Y371K和G194K位置处具有氨基酸取代;或
(32)根据SEQ ID NO.1所示的序列编号,所述Cas12f多肽在Q130H、N203K、A216R和I241A位置处具有氨基酸取代。
7.一种融合多肽,其包含与一个或多个异源多肽融合的Cas12f多肽,所述Cas12f多肽选自权利要求4至6任一项所述CRISPR-Cas系统的Cas12f多肽;优选地,其中所述一个或多个异源多肽独立地为表位标签、核定位信号或具有以下一种或多种酶促活性:外切核酸酶活性、逆转录酶活性、核酸酶活性、甲基转移酶活性、脱甲基化酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性、脱豆蔻酰化活性、糖基化活性(例如来自O-GlcNAc转移酶)和脱糖基化活性、DNA修复活性、DNA损伤活性、脱氨酶活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光裂合酶活性和糖基化酶活;更优选地,所述酶促活性结构域具有以下一种或多种酶促活性:脱氨酶活性、甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性和脱乙酰酶活性;优选地,所述一个或多个异源多肽独立地为转录阻遏结构域、转录激活结构域、脱氨酶结构域或5’-3’外切核酸酶功能域。
8.一种复合物,其包含权利要求7所述的融合多肽以及gRNA,所述gRNA包含权利要求1至3中任一项所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列,所述gRNA与所述融合多肽复合以引导所述融合多肽结合至靶核酸;
优选地,所述的融合多肽包含Cas12f多肽和融合在所述Cas12f多肽C端的5’-3’外切核酸酶功能域,所述融合多肽包含SEQ ID NO.127所示的氨基酸序列;
优选地,所述复合物是表观遗传编辑器,所述融合多肽包含SEQ ID NO.129至131任一个所示的氨基酸序列;
优选地,所述复合物是碱基编辑器,所述融合多肽包含SEQ ID NO.132或133所示的氨基酸序列。
9.一种核酸,其包含:
编码gRNA的核苷酸序列,所述gRNA包含权利要求1至3中任一项所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列;优选地,所述核酸是DNA或mRNA。
10.一种核酸,其包含:
编码如权利要求4至6任一项所述的CRISPR-Cas系统的Cas12f多肽或权利要求7所述的融合多肽的多核苷酸;优选地,所述多核苷酸被密码子优化以在原核或真核细胞中表达;优选地,所述多核苷酸包含或为如SEQ ID NO.1至2任一个所示的核苷酸序列。
11.一种载体,其包含权利要求9或10所述的核酸;优选地,所述载体是质粒或病毒载体;优选地,所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。
12.一种载体系统,其包括第一载体和与第一载体不同的第二载体,所述第一载体包含权利要求9所述的核酸;所述第二载体包含权利要求10所述的核酸;优选地,所述第一载体和第二载体独立地是质粒或病毒载体;优选地,所述病毒载体是腺相关病毒载体、腺病毒载体、逆转录病毒载体、慢病毒载体或单纯疱疹病毒载体。
13.一种递送系统,其包含gRNA、权利要求4至6任一项所述的CRISPR-Cas系统、权利要求7所述的融合多肽、权利要求8所述的复合物、权利要求9或10所述的核酸、权利要求11所述的载体、或权利要求12所述的载体系统;优选地,所述递送系统包括脂质体、纳米颗粒或外泌体;其中,所述gRNA包含权利要求1至3中任一项所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列。
14.一种细胞,其包含gRNA、权利要求4至6任一项所述的CRISPR-Cas系统、权利要求7所述的融合多肽、权利要求8所述的复合物、权利要求9或10所述的核酸、权利要求11所述的载体、或权利要求12所述的载体系统、或权利要求13所述的递送系统;其中,所述gRNA包含权利要求1至3中任一项所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列;优选地,所述细胞是真核细胞;更优选地,所述细胞是人细胞。
15.一种组合物或试剂盒,其包含gRNA、权利要求4至6任一项所述的CRISPR-Cas系统、权利要求7所述的融合多肽、权利要求8所述的复合物、权利要求9或10所述的核酸、权利要求11所述的载体、或权利要求12所述的载体系统、或权利要求13所述的递送系统或权利要求14所述的细胞;以及药学上可接受的载体;其中,所述gRNA包含权利要求1至3中任一项所述的gRNAscaffold和在所述gRNAscaffold的3’末端与靶核酸互补的靶向序列。
16.一种修饰靶核酸的方法,所述方法包括使靶核酸与权利要求4至6任一项所述的CRISPR-Cas系统、权利要求7所述的融合多肽、权利要求8所述的复合物、权利要求9或10所述的核酸、权利要求11所述的载体、或权利要求12所述的载体系统、或权利要求13所述的递送系统接触,所述接触导致所述靶核酸被修饰;优选地,所述修饰包括增加或减少所述靶核酸中的靶序列的表达,或所述修饰包括对所述靶核酸中的靶腺嘌呤或靶胞嘧啶进行脱氨基以实现碱基对转换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410179080.5A CN118127011A (zh) | 2024-02-08 | 2024-02-08 | gRNA支架及CRISPR-Cas系统及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410179080.5A CN118127011A (zh) | 2024-02-08 | 2024-02-08 | gRNA支架及CRISPR-Cas系统及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118127011A true CN118127011A (zh) | 2024-06-04 |
Family
ID=91229302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410179080.5A Pending CN118127011A (zh) | 2024-02-08 | 2024-02-08 | gRNA支架及CRISPR-Cas系统及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118127011A (zh) |
-
2024
- 2024-02-08 CN CN202410179080.5A patent/CN118127011A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6500293B2 (ja) | Dnaメチル化編集用キットおよびdnaメチル化編集方法 | |
US10093910B2 (en) | Engineered CRISPR-Cas9 nucleases | |
KR102168489B1 (ko) | CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도 | |
US10519454B2 (en) | Genome editing using Campylobacter jejuni CRISPR/CAS system-derived RGEN | |
US11788088B2 (en) | CRISPR/Cas system and method for genome editing and modulating transcription | |
US20200362346A1 (en) | Genome editing using crispr in corynebacterium | |
WO2015089486A2 (en) | Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems | |
GB2617658A (en) | Class II, type V CRISPR systems | |
JP2020503899A (ja) | 遺伝子編集技術を用いたインビトロ部位特異的変異導入のための方法 | |
WO2020018918A1 (en) | Methods for exon skipping and gene knockout using base editors | |
KR20240023081A (ko) | CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 | |
WO2022240858A1 (en) | Effector proteins and methods of use | |
CN114144519A (zh) | 单碱基置换蛋白以及包含其的组合物 | |
KR102151064B1 (ko) | 매칭된 5' 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법 | |
CN118127011A (zh) | gRNA支架及CRISPR-Cas系统及其应用 | |
KR20190122596A (ko) | 염기 교정용 유전자 구조체, 이를 포함하는 벡터 및 이를 이용한 염기 교정 방법 | |
CA3219187A1 (en) | Class ii, type v crispr systems | |
WO2022204268A2 (en) | Novel crispr enzymes, methods, systems and uses thereof | |
CN115968301A (zh) | 优化的蛋白融合和接头 | |
KR102638799B1 (ko) | CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 | |
WO2023220654A2 (en) | Effector protein compositions and methods of use thereof | |
US20220017896A1 (en) | Dna cutting means based on cas9 protein from defluviimonas sp. | |
KR20230166041A (ko) | 확장된 표적 범위를 갖는 엔지니어링된 Cas12f 단백질 및 이의 용도 | |
EP4323384A2 (en) | Evolved double-stranded dna deaminase base editors and methods of use | |
CN116568806A (zh) | 用于增加crispr/cas12f1(cas14a1)系统的效率的经工程化的引导rna及其用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |