CN116601292A - 包含靶向bcl11a的rna指导物的组合物及其用途 - Google Patents
包含靶向bcl11a的rna指导物的组合物及其用途 Download PDFInfo
- Publication number
- CN116601292A CN116601292A CN202180080699.5A CN202180080699A CN116601292A CN 116601292 A CN116601292 A CN 116601292A CN 202180080699 A CN202180080699 A CN 202180080699A CN 116601292 A CN116601292 A CN 116601292A
- Authority
- CN
- China
- Prior art keywords
- nucleotide
- seq
- sequence
- identity
- nos
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000203 mixture Substances 0.000 title claims abstract description 137
- 102100022976 B-cell lymphoma/leukemia 11A Human genes 0.000 title claims abstract description 54
- 101000903703 Homo sapiens B-cell lymphoma/leukemia 11A Proteins 0.000 title claims abstract description 54
- 230000008685 targeting Effects 0.000 title claims description 15
- 238000000034 method Methods 0.000 claims abstract description 146
- 125000003729 nucleotide group Chemical group 0.000 claims description 2394
- 239000002773 nucleotide Substances 0.000 claims description 2388
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 213
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 213
- 229920001184 polypeptide Polymers 0.000 claims description 209
- 238000012217 deletion Methods 0.000 claims description 188
- 230000037430 deletion Effects 0.000 claims description 188
- 210000004027 cell Anatomy 0.000 claims description 180
- 125000006850 spacer group Chemical group 0.000 claims description 97
- 230000002746 orthostatic effect Effects 0.000 claims description 96
- 230000000295 complement effect Effects 0.000 claims description 93
- 150000007523 nucleic acids Chemical class 0.000 claims description 76
- 102000039446 nucleic acids Human genes 0.000 claims description 58
- 108020004707 nucleic acids Proteins 0.000 claims description 58
- 239000013598 vector Substances 0.000 claims description 55
- 101100493741 Homo sapiens BCL11A gene Proteins 0.000 claims description 51
- 230000002441 reversible effect Effects 0.000 claims description 36
- 239000003623 enhancer Substances 0.000 claims description 29
- 238000003780 insertion Methods 0.000 claims description 12
- 230000037431 insertion Effects 0.000 claims description 12
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 10
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 10
- GDPJWJXLKPPEKK-SJAYXVESSA-N dT4 Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)CO)[C@@H](O)C1 GDPJWJXLKPPEKK-SJAYXVESSA-N 0.000 claims description 10
- 239000013604 expression vector Substances 0.000 claims description 8
- 210000004962 mammalian cell Anatomy 0.000 claims description 7
- 210000000130 stem cell Anatomy 0.000 claims description 7
- 210000004102 animal cell Anatomy 0.000 claims description 5
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 4
- 210000005260 human cell Anatomy 0.000 claims description 4
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 3
- 108700028369 Alleles Proteins 0.000 claims description 2
- 230000035772 mutation Effects 0.000 claims description 2
- 229920002477 rna polymer Polymers 0.000 description 221
- 150000001413 amino acids Chemical class 0.000 description 43
- 102000009331 Homeodomain Proteins Human genes 0.000 description 29
- 108010048671 Homeodomain Proteins Proteins 0.000 description 29
- 230000004048 modification Effects 0.000 description 26
- 238000012986 modification Methods 0.000 description 26
- 125000003275 alpha amino acid group Chemical group 0.000 description 25
- 102000053602 DNA Human genes 0.000 description 24
- 108020004414 DNA Proteins 0.000 description 24
- 239000000872 buffer Substances 0.000 description 22
- 108090000623 proteins and genes Proteins 0.000 description 21
- 108091028043 Nucleic acid sequence Proteins 0.000 description 18
- 230000000694 effects Effects 0.000 description 15
- 101710163270 Nuclease Proteins 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 11
- 102000040430 polynucleotide Human genes 0.000 description 10
- 108091033319 polynucleotide Proteins 0.000 description 10
- 230000002255 enzymatic effect Effects 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 239000002777 nucleoside Substances 0.000 description 9
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- 239000012636 effector Substances 0.000 description 8
- 238000004520 electroporation Methods 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 230000026279 RNA modification Effects 0.000 description 7
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 7
- 238000007481 next generation sequencing Methods 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 102100031780 Endonuclease Human genes 0.000 description 6
- 108010042407 Endonucleases Proteins 0.000 description 6
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- -1 aminoalkyl phosphoramidates Chemical class 0.000 description 6
- 230000000536 complexating effect Effects 0.000 description 6
- 230000000925 erythroid effect Effects 0.000 description 6
- 210000002865 immune cell Anatomy 0.000 description 6
- 150000003833 nucleoside derivatives Chemical class 0.000 description 6
- 150000004713 phosphodiesters Chemical class 0.000 description 6
- 238000002864 sequence alignment Methods 0.000 description 6
- 229910019142 PO4 Inorganic materials 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 235000021317 phosphate Nutrition 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 239000010452 phosphate Substances 0.000 description 4
- 125000004437 phosphorous atom Chemical group 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 229940096913 pseudoisocytidine Drugs 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- 230000035899 viability Effects 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- UHDGCWIWMRVCDJ-CCXZUQQUSA-N Cytarabine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-CCXZUQQUSA-N 0.000 description 3
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 101001105486 Homo sapiens Proteasome subunit alpha type-7 Proteins 0.000 description 3
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 3
- 229930010555 Inosine Natural products 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 108010066154 Nuclear Export Signals Proteins 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- 102100021201 Proteasome subunit alpha type-7 Human genes 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 229910000389 calcium phosphate Inorganic materials 0.000 description 3
- 239000001506 calcium phosphate Substances 0.000 description 3
- 235000011010 calcium phosphates Nutrition 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 231100000433 cytotoxic Toxicity 0.000 description 3
- 230000001472 cytotoxic effect Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 229960003786 inosine Drugs 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 230000001124 posttranscriptional effect Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 3
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 2
- NMUSYJAQQFHJEW-UHFFFAOYSA-N 5-Azacytidine Natural products O=C1N=C(N)N=CN1C1C(O)C(O)C(CO)O1 NMUSYJAQQFHJEW-UHFFFAOYSA-N 0.000 description 2
- NMUSYJAQQFHJEW-KVTDHHQDSA-N 5-azacytidine Chemical compound O=C1N=C(N)N=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NMUSYJAQQFHJEW-KVTDHHQDSA-N 0.000 description 2
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 5-hydroxyuridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- 239000013607 AAV vector Substances 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108091033409 CRISPR Proteins 0.000 description 2
- 241000244203 Caenorhabditis elegans Species 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 108091093094 Glycol nucleic acid Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 2
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 2
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 229930185560 Pseudouridine Natural products 0.000 description 2
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 2
- 238000010357 RNA editing Methods 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 108091046915 Threose nucleic acid Proteins 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 241000269368 Xenopus laevis Species 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 210000001789 adipocyte Anatomy 0.000 description 2
- 229960002756 azacitidine Drugs 0.000 description 2
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 2
- 210000002449 bone cell Anatomy 0.000 description 2
- 229920006317 cationic polymer Polymers 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 229960000684 cytarabine Drugs 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 239000000412 dendrimer Substances 0.000 description 2
- 229920000736 dendritic polymer Polymers 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- 238000001125 extrusion Methods 0.000 description 2
- GIUYCYHIANZCFB-FJFJXFQQSA-N fludarabine phosphate Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O GIUYCYHIANZCFB-FJFJXFQQSA-N 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000011005 laboratory method Methods 0.000 description 2
- 125000005647 linker group Chemical group 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 210000000663 muscle cell Anatomy 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 210000000440 neutrophil Anatomy 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 150000008298 phosphoramidates Chemical class 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 208000007056 sickle cell anemia Diseases 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000012536 storage buffer Substances 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 125000003396 thiol group Chemical class [H]S* 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 210000003171 tumor-infiltrating lymphocyte Anatomy 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- YZSZLBRBVWAXFW-LNYQSQCFSA-N (2R,3R,4S,5R)-2-(2-amino-6-hydroxy-6-methoxy-3H-purin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1(O)NC(N)=NC2=C1N=CN2[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O YZSZLBRBVWAXFW-LNYQSQCFSA-N 0.000 description 1
- UHLXKKURVBBPRP-IOSLPCCCSA-N (2R,3R,4S,5R)-2-(6-amino-7-methylpurin-9-ium-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound Cn1c[n+]([C@@H]2O[C@H](CO)[C@@H](O)[C@H]2O)c2ncnc(N)c12 UHLXKKURVBBPRP-IOSLPCCCSA-N 0.000 description 1
- ZLVITLNPCSHOGL-CKTDUXNWSA-N (2s,3r)-2-amino-n-[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]-3-hydroxybutanamide Chemical compound C1=NC=2C(NC(=O)[C@@H](N)[C@H](O)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZLVITLNPCSHOGL-CKTDUXNWSA-N 0.000 description 1
- MYUOTPIQBPUQQU-CKTDUXNWSA-N (2s,3r)-2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-methylsulfanylpurin-6-yl]carbamoyl]-3-hydroxybutanamide Chemical compound C12=NC(SC)=NC(NC(=O)NC(=O)[C@@H](N)[C@@H](C)O)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O MYUOTPIQBPUQQU-CKTDUXNWSA-N 0.000 description 1
- MIXBUOXRHTZHKR-XUTVFYLZSA-N 1-Methylpseudoisocytidine Chemical compound CN1C=C(C(=O)N=C1N)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O MIXBUOXRHTZHKR-XUTVFYLZSA-N 0.000 description 1
- KYEKLQMDNZPEFU-KVTDHHQDSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,3,5-triazine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)N=C1 KYEKLQMDNZPEFU-KVTDHHQDSA-N 0.000 description 1
- UTQUILVPBZEHTK-ZOQUXTDFSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UTQUILVPBZEHTK-ZOQUXTDFSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- HQHQCEKUGWOYPS-URBBEOKESA-N 1-[(2r,3s,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(octadecylamino)pyrimidin-2-one Chemical compound O=C1N=C(NCCCCCCCCCCCCCCCCCC)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](CO)O1 HQHQCEKUGWOYPS-URBBEOKESA-N 0.000 description 1
- PZNPLUBHRSSFHT-RRHRGVEJSA-N 1-hexadecanoyl-2-octadecanoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)O[C@@H](COP([O-])(=O)OCC[N+](C)(C)C)COC(=O)CCCCCCCCCCCCCCC PZNPLUBHRSSFHT-RRHRGVEJSA-N 0.000 description 1
- GUNOEKASBVILNS-UHFFFAOYSA-N 1-methyl-1-deaza-pseudoisocytidine Chemical compound CC(C=C1C(C2O)OC(CO)C2O)=C(N)NC1=O GUNOEKASBVILNS-UHFFFAOYSA-N 0.000 description 1
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 description 1
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- UVBYMVOUBXYSFV-UHFFFAOYSA-N 1-methylpseudouridine Natural products O=C1NC(=O)N(C)C=C1C1C(O)C(O)C(CO)O1 UVBYMVOUBXYSFV-UHFFFAOYSA-N 0.000 description 1
- BVLGKOVALHRKNM-XUTVFYLZSA-N 2-Thio-1-methylpseudouridine Chemical compound CN1C=C(C(=O)NC1=S)[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O BVLGKOVALHRKNM-XUTVFYLZSA-N 0.000 description 1
- NUBJGTNGKODGGX-YYNOVJQHSA-N 2-[5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-1-yl]acetic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CN(CC(O)=O)C(=O)NC1=O NUBJGTNGKODGGX-YYNOVJQHSA-N 0.000 description 1
- VJKJOPUEUOTEBX-TURQNECASA-N 2-[[1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-5-yl]methylamino]ethanesulfonic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CNCCS(O)(=O)=O)=C1 VJKJOPUEUOTEBX-TURQNECASA-N 0.000 description 1
- LCKIHCRZXREOJU-KYXWUPHJSA-N 2-[[5-[(2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2,4-dioxopyrimidin-1-yl]methylamino]ethanesulfonic acid Chemical compound C(NCCS(=O)(=O)O)N1C=C([C@H]2[C@H](O)[C@H](O)[C@@H](CO)O2)C(NC1=O)=O LCKIHCRZXREOJU-KYXWUPHJSA-N 0.000 description 1
- MPDKOGQMQLSNOF-GBNDHIKLSA-N 2-amino-5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrimidin-6-one Chemical compound O=C1NC(N)=NC=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 MPDKOGQMQLSNOF-GBNDHIKLSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- IBKZHHCJWDWGAJ-FJGDRVTGSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-methylpurine-6-thione Chemical compound C1=NC=2C(=S)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IBKZHHCJWDWGAJ-FJGDRVTGSA-N 0.000 description 1
- HPKQEMIXSLRGJU-UUOKFMHZSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7-methyl-3h-purine-6,8-dione Chemical compound O=C1N(C)C(C(NC(N)=N2)=O)=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HPKQEMIXSLRGJU-UUOKFMHZSA-N 0.000 description 1
- PBFLIOAJBULBHI-JJNLEZRASA-N 2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]carbamoyl]acetamide Chemical compound C1=NC=2C(NC(=O)NC(=O)CN)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PBFLIOAJBULBHI-JJNLEZRASA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- RLZMYTZDQAVNIN-ZOQUXTDFSA-N 2-methoxy-4-thio-uridine Chemical compound COC1=NC(=S)C=CN1[C@H]2[C@@H]([C@@H]([C@H](O2)CO)O)O RLZMYTZDQAVNIN-ZOQUXTDFSA-N 0.000 description 1
- QCPQCJVQJKOKMS-VLSMUFELSA-N 2-methoxy-5-methyl-cytidine Chemical compound CC(C(N)=N1)=CN([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C1OC QCPQCJVQJKOKMS-VLSMUFELSA-N 0.000 description 1
- TUDKBZAMOFJOSO-UHFFFAOYSA-N 2-methoxy-7h-purin-6-amine Chemical compound COC1=NC(N)=C2NC=NC2=N1 TUDKBZAMOFJOSO-UHFFFAOYSA-N 0.000 description 1
- STISOQJGVFEOFJ-MEVVYUPBSA-N 2-methoxy-cytidine Chemical compound COC(N([C@@H]([C@@H]1O)O[C@H](CO)[C@H]1O)C=C1)N=C1N STISOQJGVFEOFJ-MEVVYUPBSA-N 0.000 description 1
- FXGXEFXCWDTSQK-UHFFFAOYSA-N 2-methylsulfanyl-7h-purin-6-amine Chemical compound CSC1=NC(N)=C2NC=NC2=N1 FXGXEFXCWDTSQK-UHFFFAOYSA-N 0.000 description 1
- QEWSGVMSLPHELX-UHFFFAOYSA-N 2-methylthio-N6-(cis-hydroxyisopentenyl) adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)CO)=C2N=CN1C1OC(CO)C(O)C1O QEWSGVMSLPHELX-UHFFFAOYSA-N 0.000 description 1
- RDPUKVRQKWBSPK-UHFFFAOYSA-N 3-Methylcytidine Natural products O=C1N(C)C(=N)C=CN1C1C(O)C(O)C(CO)O1 RDPUKVRQKWBSPK-UHFFFAOYSA-N 0.000 description 1
- UTQUILVPBZEHTK-UHFFFAOYSA-N 3-Methyluridine Natural products O=C1N(C)C(=O)C=CN1C1C(O)C(O)C(CO)O1 UTQUILVPBZEHTK-UHFFFAOYSA-N 0.000 description 1
- RDPUKVRQKWBSPK-ZOQUXTDFSA-N 3-methylcytidine Chemical compound O=C1N(C)C(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RDPUKVRQKWBSPK-ZOQUXTDFSA-N 0.000 description 1
- VTGBLFNEDHVUQA-XUTVFYLZSA-N 4-Thio-1-methyl-pseudouridine Chemical compound S=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 VTGBLFNEDHVUQA-XUTVFYLZSA-N 0.000 description 1
- DUJGMZAICVPCBJ-VDAHYXPESA-N 4-amino-1-[(1r,4r,5s)-4,5-dihydroxy-3-(hydroxymethyl)cyclopent-2-en-1-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)C(CO)=C1 DUJGMZAICVPCBJ-VDAHYXPESA-N 0.000 description 1
- OCMSXKMNYAHJMU-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound C1=C(C=O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OCMSXKMNYAHJMU-JXOAFFINSA-N 0.000 description 1
- OZHIJZYBTCTDQC-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2-thione Chemical compound S=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OZHIJZYBTCTDQC-JXOAFFINSA-N 0.000 description 1
- PULHLIOPJXPGJN-BWVDBABLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)-3-methylideneoxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1C(=C)[C@H](O)[C@@H](CO)O1 PULHLIOPJXPGJN-BWVDBABLSA-N 0.000 description 1
- LOICBOXHPCURMU-UHFFFAOYSA-N 4-methoxy-pseudoisocytidine Chemical compound COC1NC(N)=NC=C1C(C1O)OC(CO)C1O LOICBOXHPCURMU-UHFFFAOYSA-N 0.000 description 1
- SJVVKUMXGIKAAI-UHFFFAOYSA-N 4-thio-pseudoisocytidine Chemical compound NC(N1)=NC=C(C(C2O)OC(CO)C2O)C1=S SJVVKUMXGIKAAI-UHFFFAOYSA-N 0.000 description 1
- FAWQJBLSWXIJLA-VPCXQMTMSA-N 5-(carboxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(O)=O)=C1 FAWQJBLSWXIJLA-VPCXQMTMSA-N 0.000 description 1
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 1
- ITGWEVGJUSMCEA-KYXWUPHJSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)N(C#CC)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ITGWEVGJUSMCEA-KYXWUPHJSA-N 0.000 description 1
- DDHOXEOVAJVODV-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=S)NC1=O DDHOXEOVAJVODV-GBNDHIKLSA-N 0.000 description 1
- BNAWMJKJLNJZFU-GBNDHIKLSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-sulfanylidene-1h-pyrimidin-2-one Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=S BNAWMJKJLNJZFU-GBNDHIKLSA-N 0.000 description 1
- XAUDJQYHKZQPEU-KVQBGUIXSA-N 5-aza-2'-deoxycytidine Chemical compound O=C1N=C(N)N=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 XAUDJQYHKZQPEU-KVQBGUIXSA-N 0.000 description 1
- DHMYGZIEILLVNR-UHFFFAOYSA-N 5-fluoro-1-(oxolan-2-yl)pyrimidine-2,4-dione;1h-pyrimidine-2,4-dione Chemical compound O=C1C=CNC(=O)N1.O=C1NC(=O)C(F)=CN1C1OCCC1 DHMYGZIEILLVNR-UHFFFAOYSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- USVMJSALORZVDV-UHFFFAOYSA-N 6-(gamma,gamma-dimethylallylamino)purine riboside Natural products C1=NC=2C(NCC=C(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O USVMJSALORZVDV-UHFFFAOYSA-N 0.000 description 1
- OZTOEARQSSIFOG-MWKIOEHESA-N 6-Thio-7-deaza-8-azaguanosine Chemical compound Nc1nc(=S)c2cnn([C@@H]3O[C@H](CO)[C@@H](O)[C@H]3O)c2[nH]1 OZTOEARQSSIFOG-MWKIOEHESA-N 0.000 description 1
- RFHIWBUKNJIBSE-KQYNXXCUSA-O 6-thio-7-methyl-guanosine Chemical compound C1=2NC(N)=NC(=S)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RFHIWBUKNJIBSE-KQYNXXCUSA-O 0.000 description 1
- MJJUWOIBPREHRU-MWKIOEHESA-N 7-Deaza-8-azaguanosine Chemical compound NC=1NC(C2=C(N=1)N(N=C2)[C@H]1[C@H](O)[C@H](O)[C@H](O1)CO)=O MJJUWOIBPREHRU-MWKIOEHESA-N 0.000 description 1
- ISSMDAFGDCTNDV-UHFFFAOYSA-N 7-deaza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NC=CC2=N1 ISSMDAFGDCTNDV-UHFFFAOYSA-N 0.000 description 1
- YVVMIGRXQRPSIY-UHFFFAOYSA-N 7-deaza-2-aminopurine Chemical compound N1C(N)=NC=C2C=CN=C21 YVVMIGRXQRPSIY-UHFFFAOYSA-N 0.000 description 1
- ZTAWTRPFJHKMRU-UHFFFAOYSA-N 7-deaza-8-aza-2,6-diaminopurine Chemical compound NC1=NC(N)=C2NN=CC2=N1 ZTAWTRPFJHKMRU-UHFFFAOYSA-N 0.000 description 1
- SMXRCJBCWRHDJE-UHFFFAOYSA-N 7-deaza-8-aza-2-aminopurine Chemical compound NC1=NC=C2C=NNC2=N1 SMXRCJBCWRHDJE-UHFFFAOYSA-N 0.000 description 1
- LHCPRYRLDOSKHK-UHFFFAOYSA-N 7-deaza-8-aza-adenine Chemical compound NC1=NC=NC2=C1C=NN2 LHCPRYRLDOSKHK-UHFFFAOYSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- VJNXUFOTKNTNPG-IOSLPCCCSA-O 7-methylinosine Chemical compound C1=2NC=NC(=O)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VJNXUFOTKNTNPG-IOSLPCCCSA-O 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- ABXGJJVKZAAEDH-IOSLPCCCSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(dimethylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ABXGJJVKZAAEDH-IOSLPCCCSA-N 0.000 description 1
- ADPMAYFIIFNDMT-KQYNXXCUSA-N 9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-(methylamino)-3h-purine-6-thione Chemical compound C1=NC=2C(=S)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ADPMAYFIIFNDMT-KQYNXXCUSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 239000000592 Artificial Cell Substances 0.000 description 1
- 101710145992 B-cell lymphoma/leukemia 11A Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- PTOAARAWEBMLNO-KVQBGUIXSA-N Cladribine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 PTOAARAWEBMLNO-KVQBGUIXSA-N 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- GZDFHIJNHHMENY-UHFFFAOYSA-N Dimethyl dicarbonate Chemical compound COC(=O)OC(=O)OC GZDFHIJNHHMENY-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- RSPURTUNRHNVGF-IOSLPCCCSA-N N(2),N(2)-dimethylguanosine Chemical compound C1=NC=2C(=O)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RSPURTUNRHNVGF-IOSLPCCCSA-N 0.000 description 1
- NIDVTARKFBZMOT-PEBGCTIMSA-N N(4)-acetylcytidine Chemical compound O=C1N=C(NC(=O)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NIDVTARKFBZMOT-PEBGCTIMSA-N 0.000 description 1
- WVGPGNPCZPYCLK-WOUKDFQISA-N N(6),N(6)-dimethyladenosine Chemical compound C1=NC=2C(N(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WVGPGNPCZPYCLK-WOUKDFQISA-N 0.000 description 1
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 1
- WVGPGNPCZPYCLK-UHFFFAOYSA-N N-Dimethyladenosine Natural products C1=NC=2C(N(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O WVGPGNPCZPYCLK-UHFFFAOYSA-N 0.000 description 1
- LZCNWAXLJWBRJE-ZOQUXTDFSA-N N4-Methylcytidine Chemical compound O=C1N=C(NC)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZCNWAXLJWBRJE-ZOQUXTDFSA-N 0.000 description 1
- GOSWTRUMMSCNCW-UHFFFAOYSA-N N6-(cis-hydroxyisopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1OC(CO)C(O)C1O GOSWTRUMMSCNCW-UHFFFAOYSA-N 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- XMIFBEZRFMTGRL-TURQNECASA-N OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1cc(CNCCS(O)(=O)=O)c(=O)[nH]c1=S Chemical compound OC[C@H]1O[C@H]([C@H](O)[C@@H]1O)n1cc(CNCCS(O)(=O)=O)c(=O)[nH]c1=S XMIFBEZRFMTGRL-TURQNECASA-N 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 208000018020 Sickle cell-beta-thalassemia disease syndrome Diseases 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 description 1
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 1
- WFWLQNSHRPWKFK-UHFFFAOYSA-N Tegafur Chemical compound O=C1NC(=O)C(F)=CN1C1OCCC1 WFWLQNSHRPWKFK-UHFFFAOYSA-N 0.000 description 1
- 206010043391 Thalassaemia beta Diseases 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- DPKHZNPWBDQZCN-UHFFFAOYSA-N acridine orange free base Chemical compound C1=CC(N(C)C)=CC2=NC3=CC(N(C)C)=CC=C3C=C21 DPKHZNPWBDQZCN-UHFFFAOYSA-N 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 125000004103 aminoalkyl group Chemical group 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 150000008209 arabinosides Chemical class 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- DZBUGLKDJFMEHC-UHFFFAOYSA-N benzoquinolinylidene Natural products C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 1
- 208000005980 beta thalassemia Diseases 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 229910000085 borane Inorganic materials 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 229960002436 cladribine Drugs 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- WDDPHFBMKLOVOX-AYQXTPAHSA-N clofarabine Chemical compound C1=NC=2C(N)=NC(Cl)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@@H]1F WDDPHFBMKLOVOX-AYQXTPAHSA-N 0.000 description 1
- 229960000928 clofarabine Drugs 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 238000010668 complexation reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 229960003603 decitabine Drugs 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 235000010300 dimethyl dicarbonate Nutrition 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 239000011536 extraction buffer Substances 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229960000390 fludarabine Drugs 0.000 description 1
- 229960005304 fludarabine phosphate Drugs 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 238000001641 gel filtration chromatography Methods 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 230000003394 haemopoietic effect Effects 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 102000052096 human BCL11A Human genes 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 125000003473 lipid group Chemical group 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229960001428 mercaptopurine Drugs 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 210000002894 multi-fate stem cell Anatomy 0.000 description 1
- 210000003061 neural cell Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000009635 nitrosylation Effects 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 210000002997 osteoclast Anatomy 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- XRBCRPZXSCBRTK-UHFFFAOYSA-N phosphonous acid Chemical class OPO XRBCRPZXSCBRTK-UHFFFAOYSA-N 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 1
- 150000008299 phosphorodiamidates Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- XJMOSONTPMZWPB-UHFFFAOYSA-M propidium iodide Chemical compound [I-].[I-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CCC[N+](C)(CC)CC)=C1C1=CC=CC=C1 XJMOSONTPMZWPB-UHFFFAOYSA-M 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 210000002363 skeletal muscle cell Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 229960001674 tegafur Drugs 0.000 description 1
- WFWLQNSHRPWKFK-ZCFIWIBFSA-N tegafur Chemical compound O=C1NC(=O)C(F)=CN1[C@@H]1OCCC1 WFWLQNSHRPWKFK-ZCFIWIBFSA-N 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 239000005450 thionucleoside Substances 0.000 description 1
- 210000003014 totipotent stem cell Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- UORVGPXVDQYIDP-UHFFFAOYSA-N trihydridoboron Substances B UORVGPXVDQYIDP-UHFFFAOYSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- RXRGZNYSEHTMHC-BQBZGAKWSA-N troxacitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1O[C@@H](CO)OC1 RXRGZNYSEHTMHC-BQBZGAKWSA-N 0.000 description 1
- 229950010147 troxacitabine Drugs 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- 210000002444 unipotent stem cell Anatomy 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- RPQZTTQVRYEKCR-WCTZXXKLSA-N zebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=CC=C1 RPQZTTQVRYEKCR-WCTZXXKLSA-N 0.000 description 1
Landscapes
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
本发明涉及包含靶向BCL11A的RNA指导物的组合物、表征这些组合物的方法、包含这些组合物的细胞以及使用这些组合物的方法。
Description
序列表
本申请含有已以ASCII格式以电子方式提交且特此通过援引以其全文并入的序列表。所述ASCII副本创建于2021年10月28日,名为51451-017WO3_Sequence_Listing_10_28_21_ST25,并且大小为682,314字节。
背景技术
成簇规律间隔短回文重复序列(CRISPR)和CRISPR相关(Cas)基因(统称为CRISPR-Cas或CRISPR/Cas系统)是古细菌和细菌中针对外来遗传元件而防御特定物种的适应性免疫系统。
发明内容
正是在上述背景下,本发明提供了优于现有技术的某些优点和进步。尽管本文披露的本发明不限于特定优点或功能,但本发明提供了包含RNA指导物的组合物,其中该RNA指导物包含(i)与BCL11A基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列;其中该靶序列与包含序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻。
在组合物的一方面,靶序列在BCL11A基因的外显子1、外显子2、外显子3、外显子4或增强子区内。
在组合物的另一方面,BCL11A基因包含SEQ ID NO:2635的序列、SEQ ID NO:2635的反向互补序列、SEQ ID NO:2635的变体、或SEQ ID NO:2635的变体的反向互补序列。
在组合物的另一方面,间隔子序列包含:a.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;b.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;c.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;d.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;e.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;f.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;g.与SEQ IDNO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;h.与SEQID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;i.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;j.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;k.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;l.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;m.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;n.与SEQ ID NO:1322-1425和1427-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或o.与SEQ ID NO:1322-1425和1427-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在组合物的另一方面,间隔子序列包含:a.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸16;b.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸17;c.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸18;d.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸19;e.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸20;f.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸21;g.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸22;h.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸23;i.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸24;j.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸25;k.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸26;l.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸27;m.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸28;n.SEQID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸29;或o.SEQ ID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸30。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;s.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;z.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;o.SEQ ID NO:9的核苷酸1至核苷酸34;p.SEQ ID NO:9的核苷酸2至核苷酸34;q.SEQ ID NO:9的核苷酸3至核苷酸34;r.SEQ IDNO:9的核苷酸4至核苷酸34;s.SEQ ID NO:9的核苷酸5至核苷酸34;t.SEQ ID NO:9的核苷酸6至核苷酸34;u.SEQ ID NO:9的核苷酸7至核苷酸34;v.SEQ ID NO:9的核苷酸8至核苷酸34;w.SEQ ID NO:9的核苷酸9至核苷酸34;x.SEQ ID NO:9的核苷酸10至核苷酸34;y.SEQID NO:9的核苷酸11至核苷酸34;z.SEQ ID NO:9的核苷酸12至核苷酸34;或aa.SEQ ID NO:10或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ IDNO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ ID NO:2670的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:2652-2669中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:2652-2669中任一个的核苷酸2至核苷酸36;c.SEQ IDNO:2652-2669中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:2652-2669中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:2652-2669中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:2652-2669中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:2652-2669中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:2652-2669中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:2652-2669中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:2652-2669中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:2652-2669中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:2652-2669中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:2652-2669中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:2652-2669中任一个的核苷酸14至核苷酸36;或o.SEQ ID NO:2670或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ IDNO:2671具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQID NO:2671具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ ID NO:2672或SEQ ID NO:2673的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:2671的核苷酸1至核苷酸36;b.SEQ ID NO:2671的核苷酸2至核苷酸36;c.SEQ ID NO:2671的核苷酸3至核苷酸36;d.SEQ ID NO:2671的核苷酸4至核苷酸36;e.SEQ ID NO:2671的核苷酸5至核苷酸36;f.SEQID NO:2671的核苷酸6至核苷酸36;g.SEQ ID NO:2671的核苷酸7至核苷酸36;h.SEQ IDNO:2671的核苷酸8至核苷酸36;i.SEQ ID NO:2671的核苷酸9至核苷酸36;j.SEQ ID NO:2671的核苷酸10至核苷酸36;k.SEQ ID NO:2671的核苷酸11至核苷酸36;l.SEQ ID NO:2671的核苷酸12至核苷酸36;m.SEQ ID NO:2671的核苷酸13至核苷酸36;n.SEQ ID NO:2671的核苷酸14至核苷酸36;或o.SEQ ID NO:2672或SEQ ID NO:2673或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:2674或SEQID NO:2675的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ IDNO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或p.与SEQ ID NO:2676的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸1至核苷酸36;b.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸2至核苷酸36;c.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸3至核苷酸36;d.SEQ ID NO:2674或SEQ IDNO:2675的核苷酸4至核苷酸36;e.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸5至核苷酸36;f.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸6至核苷酸36;g.SEQ ID NO:2674或SEQID NO:2675的核苷酸7至核苷酸36;h.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸8至核苷酸36;i.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸9至核苷酸36;j.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸10至核苷酸36;k.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸11至核苷酸36;l.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸12至核苷酸36;m.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸13至核苷酸36;n.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸14至核苷酸36;o.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸15至核苷酸36;或p.SEQID NO:2676或其一部分。
在组合物的另一方面,间隔子序列与SEQ ID NO:11-1321中任一个的序列的互补序列基本上互补。
在组合物的另一方面,PAM包含序列:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在组合物的另一方面,靶序列紧邻PAM序列。
在组合物的另一方面,组合物还包含Cas12i多肽。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含与SEQ ID NO:2634、SEQ ID NO:2641、SEQ ID NO:2642、SEQ ID NO:2643、SEQ ID NO:2644、或SEQ ID NO:2645的序列具有至少90%同一性的序列;b.Cas12i4多肽,其包含与SEQ ID NO:2647、SEQ IDNO:2648、或SEQ ID NO:2649的序列具有至少90%同一性的序列;c.Cas12i1多肽,其包含与SEQ ID NO:2650的序列具有至少90%同一性的序列;或d.Cas12i3多肽,其包含与SEQ IDNO:2651的序列具有至少90%同一性的序列。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含SEQ ID NO:2634、SEQ ID NO:2641、SEQ ID NO:2642、SEQ ID NO:2643、SEQ ID NO:2644、或SEQ ID NO:2645的序列;b.Cas12i4多肽,其包含SEQ ID NO:2647、SEQ ID NO:2648、或SEQ ID NO:2649的序列;c.Cas12i1多肽,其包含SEQ ID NO:2650的序列;或d.Cas12i3多肽,其包含SEQ ID NO:2651的序列。
在组合物的另一方面,RNA指导物和Cas12i多肽形成核糖核蛋白复合物。
在组合物的另一方面,核糖核蛋白复合物结合靶核酸。
在组合物的另一方面,组合物存在于细胞内。
在组合物的另一方面,RNA指导物和Cas12i多肽被编码在载体(例如,表达载体)中。在组合物的另一方面,RNA指导物和Cas12i多肽被编码在单一载体中,或者该RNA指导物被编码在第一载体中并且该Cas12i多肽被编码在第二载体中。
本发明还提供了一种载体系统,该载体系统包含一个或多个编码本文披露的RNA指导物和Cas12i多肽的载体。在实施例中,载体系统包含编码本文披露的RNA指导物的第一载体以及编码Cas12i多肽的第二载体。载体可以是表达载体。
本发明进一步提供包含RNA指导物和Cas12i多肽的组合物,其中所述RNA指导物包含(i)与BCL11A基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列。
在组合物的一方面,靶序列在BCL11A基因的外显子1、外显子2、外显子3、外显子4或增强子区内。
在组合物的另一方面,BCL11A基因包含SEQ ID NO:2635的序列、SEQ ID NO:2635的反向互补序列、SEQ ID NO:2635的变体、或SEQ ID NO:2635的变体的反向互补序列。
在组合物的另一方面,间隔子序列包含:a.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;b.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;c.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;d.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;e.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;f.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;g.与SEQ IDNO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;h.与SEQID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;i.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;j.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;k.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;l.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;m.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;n.与SEQ ID NO:1322-1425和1427-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或o.与SEQ ID NO:1322-1425和1427-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在组合物的另一方面,间隔子序列包含:a.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸16;b.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸17;c.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸18;d.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸19;e.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸20;f.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸21;g.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸22;h.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸23;i.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸24;j.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸25;k.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸26;l.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸27;m.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸28;n.SEQID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸29;或o.SEQ ID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸30。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;s.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;z.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;o.SEQ ID NO:9的核苷酸1至核苷酸34;p.SEQ ID NO:9的核苷酸2至核苷酸34;q.SEQ ID NO:9的核苷酸3至核苷酸34;r.SEQ IDNO:9的核苷酸4至核苷酸34;s.SEQ ID NO:9的核苷酸5至核苷酸34;t.SEQ ID NO:9的核苷酸6至核苷酸34;u.SEQ ID NO:9的核苷酸7至核苷酸34;v.SEQ ID NO:9的核苷酸8至核苷酸34;w.SEQ ID NO:9的核苷酸9至核苷酸34;x.SEQ ID NO:9的核苷酸10至核苷酸34;y.SEQID NO:9的核苷酸11至核苷酸34;z.SEQ ID NO:9的核苷酸12至核苷酸34;或aa.SEQ ID NO:10或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ IDNO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ ID NO:2670的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:2652-2669中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:2652-2669中任一个的核苷酸2至核苷酸36;c.SEQ IDNO:2652-2669中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:2652-2669中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:2652-2669中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:2652-2669中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:2652-2669中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:2652-2669中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:2652-2669中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:2652-2669中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:2652-2669中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:2652-2669中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:2652-2669中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:2652-2669中任一个的核苷酸14至核苷酸36;或o.SEQ ID NO:2670或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ IDNO:2671具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ IDNO:2671具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQID NO:2671具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ ID NO:2672或SEQ ID NO:2673的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:2671的核苷酸1至核苷酸36;b.SEQ ID NO:2671的核苷酸2至核苷酸36;c.SEQ ID NO:2671的核苷酸3至核苷酸36;d.SEQ ID NO:2671的核苷酸4至核苷酸36;e.SEQ ID NO:2671的核苷酸5至核苷酸36;f.SEQID NO:2671的核苷酸6至核苷酸36;g.SEQ ID NO:2671的核苷酸7至核苷酸36;h.SEQ IDNO:2671的核苷酸8至核苷酸36;i.SEQ ID NO:2671的核苷酸9至核苷酸36;j.SEQ ID NO:2671的核苷酸10至核苷酸36;k.SEQ ID NO:2671的核苷酸11至核苷酸36;l.SEQ ID NO:2671的核苷酸12至核苷酸36;m.SEQ ID NO:2671的核苷酸13至核苷酸36;n.SEQ ID NO:2671的核苷酸14至核苷酸36;或o.SEQ ID NO:2672或SEQ ID NO:2673或其一部分。
在该组合物的另一方面,同向重复序列包含:a.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:2674或SEQID NO:2675的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ IDNO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或p.与SEQ ID NO:2676的序列或其一部分具有至少90%同一性的序列。
在该组合物的另一方面,同向重复序列包含:a.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸1至核苷酸36;b.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸2至核苷酸36;c.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸3至核苷酸36;d.SEQ ID NO:2674或SEQ IDNO:2675的核苷酸4至核苷酸36;e.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸5至核苷酸36;f.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸6至核苷酸36;g.SEQ ID NO:2674或SEQID NO:2675的核苷酸7至核苷酸36;h.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸8至核苷酸36;i.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸9至核苷酸36;j.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸10至核苷酸36;k.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸11至核苷酸36;l.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸12至核苷酸36;m.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸13至核苷酸36;n.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸14至核苷酸36;o.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸15至核苷酸36;或p.SEQID NO:2676或其一部分。
在组合物的另一方面,间隔子序列与SEQ ID NO:11-1321中任一个的序列的互补序列基本上互补。
在组合物的另一方面,该靶序列与包含序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻。
在组合物的另一方面,PAM包含序列:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在组合物的另一方面,靶序列紧邻PAM序列。
在组合物的另一方面,靶序列在PAM序列的1、2、3、4或5个核苷酸内。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含与SEQ ID NO:2634、SEQ ID NO:2641、SEQ ID NO:2642、SEQ ID NO:2643、SEQ ID NO:2644、或SEQ ID NO:2645的序列具有至少90%同一性的序列;b.Cas12i4多肽,其包含与SEQ ID NO:2647、SEQ IDNO:2648、或SEQ ID NO:2649的序列具有至少90%同一性的序列;c.Cas12i1多肽,其包含与SEQ ID NO:2650的序列具有至少90%同一性的序列;或d.Cas12i3多肽,其包含与SEQ IDNO:2651的序列具有至少90%同一性的序列。
在组合物的另一方面,Cas12i多肽是:a.Cas12i2多肽,其包含SEQ ID NO:2634、SEQ ID NO:2641、SEQ ID NO:2642、SEQ ID NO:2643、SEQ ID NO:2644、或SEQ ID NO:2645的序列;b.Cas12i4多肽,其包含SEQ ID NO:2647、SEQ ID NO:2648、或SEQ ID NO:2649的序列;c.Cas12i1多肽,其包含SEQ ID NO:2650的序列;或d.Cas12i3多肽,其包含SEQ ID NO:2651的序列。
在组合物的另一方面,RNA指导物和Cas12i多肽形成核糖核蛋白复合物。
在组合物的另一方面,核糖核蛋白复合物结合靶核酸。
在组合物的另一方面,组合物存在于细胞内。
在组合物的另一方面,RNA指导物和Cas12i多肽被编码在载体(例如,表达载体)中。在组合物的另一方面,RNA指导物和Cas12i多肽被编码在单一载体中,或者该RNA指导物被编码在第一载体中并且该Cas12i多肽被编码在第二载体中。
本发明还提供了一种载体系统,该载体系统包含一个或多个编码本文披露的RNA指导物和Cas12i多肽的载体。在实施例中,载体系统包含编码本文披露的RNA指导物的第一载体以及编码Cas12i多肽的第二载体。载体可以是表达载体。
本发明还进一步提供了一种RNA指导物,其包含(i)基本上与BCL11A基因内的靶序列互补的间隔子序列和(ii)同向重复序列。
在RNA指导物的一方面,靶序列在BCL11A基因的外显子1、外显子2、外显子3、外显子4或增强子区内。
在RNA指导物的另一方面,BCL11A基因包含SEQ ID NO:2635的序列、SEQ ID NO:2635的反向互补序列、SEQ ID NO:2635的变体、或SEQ ID NO:2635的变体的反向互补序列。
在RNA指导物的另一方面,间隔子序列包含:a.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;b.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;c.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;d.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;e.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;f.与SEQ IDNO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;g.与SEQID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;h.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;i.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;j.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;k.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;l.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;m.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;n.与SEQ ID NO:1322-1425和1427-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或o.与SEQ ID NO:1322-1425和1427-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
在组合物的另一方面,间隔子序列包含:a.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸16;b.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸17;c.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸18;d.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸19;e.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸20;f.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸21;g.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸22;h.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸23;i.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸24;j.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸25;k.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸26;l.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸27;m.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸28;n.SEQID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸29;或o.SEQ ID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸30。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;s.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;z.与SEQID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;e.SEQ IDNO:1-8中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;o.SEQ ID NO:9的核苷酸1至核苷酸34;p.SEQ ID NO:9的核苷酸2至核苷酸34;q.SEQ ID NO:9的核苷酸3至核苷酸34;r.SEQ IDNO:9的核苷酸4至核苷酸34;s.SEQ ID NO:9的核苷酸5至核苷酸34;t.SEQ ID NO:9的核苷酸6至核苷酸34;u.SEQ ID NO:9的核苷酸7至核苷酸34;v.SEQ ID NO:9的核苷酸8至核苷酸34;w.SEQ ID NO:9的核苷酸9至核苷酸34;x.SEQ ID NO:9的核苷酸10至核苷酸34;y.SEQID NO:9的核苷酸11至核苷酸34;z.SEQ ID NO:9的核苷酸12至核苷酸34;或aa.SEQ ID NO:10或其一部分。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ IDNO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ ID NO:2670的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:2652-2669中任一个的核苷酸1至核苷酸36;b.SEQ ID NO:2652-2669中任一个的核苷酸2至核苷酸36;c.SEQ IDNO:2652-2669中任一个的核苷酸3至核苷酸36;d.SEQ ID NO:2652-2669中任一个的核苷酸4至核苷酸36;e.SEQ ID NO:2652-2669中任一个的核苷酸5至核苷酸36;f.SEQ ID NO:2652-2669中任一个的核苷酸6至核苷酸36;g.SEQ ID NO:2652-2669中任一个的核苷酸7至核苷酸36;h.SEQ ID NO:2652-2669中任一个的核苷酸8至核苷酸36;i.SEQ ID NO:2652-2669中任一个的核苷酸9至核苷酸36;j.SEQ ID NO:2652-2669中任一个的核苷酸10至核苷酸36;k.SEQ ID NO:2652-2669中任一个的核苷酸11至核苷酸36;l.SEQ ID NO:2652-2669中任一个的核苷酸12至核苷酸36;m.SEQ ID NO:2652-2669中任一个的核苷酸13至核苷酸36;n.SEQ ID NO:2652-2669中任一个的核苷酸14至核苷酸36;或o.SEQ ID NO:2670或其一部分。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ IDNO:2671具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQID NO:2671具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸14至核苷酸36;或o.与SEQ IDNO:2672或SEQ ID NO:2673的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:2671的核苷酸1至核苷酸36;b.SEQ ID NO:2671的核苷酸2至核苷酸36;c.SEQ ID NO:2671的核苷酸3至核苷酸36;d.SEQ ID NO:2671的核苷酸4至核苷酸36;e.SEQ ID NO:2671的核苷酸5至核苷酸36;f.SEQ ID NO:2671的核苷酸6至核苷酸36;g.SEQ ID NO:2671的核苷酸7至核苷酸36;h.SEQID NO:2671的核苷酸8至核苷酸36;i.SEQ ID NO:2671的核苷酸9至核苷酸36;j.SEQ IDNO:2671的核苷酸10至核苷酸36;k.SEQ ID NO:2671的核苷酸11至核苷酸36;l.SEQ ID NO:2671的核苷酸12至核苷酸36;m.SEQ ID NO:2671的核苷酸13至核苷酸36;n.SEQ ID NO:2671的核苷酸14至核苷酸36;或o.SEQ ID NO:2672或SEQ ID NO:2673或其一部分。
在RNA指导物的另一方面,同向重复序列包含:a.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;b.与SEQ ID NO:2674或SEQID NO:2675的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;c.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;d.与SEQID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;e.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;f.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;g.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;h.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;i.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;j.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;k.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;l.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;m.与SEQ IDNO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;n.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;o.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或p.与SEQ ID NO:2676的序列或其一部分具有至少90%同一性的序列。
在RNA指导物的另一方面,同向重复序列包含:a.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸1至核苷酸36;b.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸2至核苷酸36;c.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸3至核苷酸36;d.SEQ ID NO:2674或SEQ IDNO:2675的核苷酸4至核苷酸36;e.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸5至核苷酸36;f.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸6至核苷酸36;g.SEQ ID NO:2674或SEQID NO:2675的核苷酸7至核苷酸36;h.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸8至核苷酸36;i.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸9至核苷酸36;j.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸10至核苷酸36;k.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸11至核苷酸36;l.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸12至核苷酸36;m.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸13至核苷酸36;n.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸14至核苷酸36;o.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸15至核苷酸36;或p.SEQID NO:2676或其一部分。
在RNA指导物的另一方面,间隔子序列与SEQ ID NO:11-1321中任一个的序列的互补序列基本上互补。
在RNA指导物的另一方面,靶序列与包含序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻,其中N是任何核苷酸。
在RNA指导物的另一方面,PAM包含序列:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在RNA指导物的另一方面,靶序列紧邻PAM序列。
在RNA指导物的另一方面,靶序列在PAM序列的1、2、3、4或5个核苷酸内。
本发明还进一步提供了编码如本文所述的RNA指导物的核酸。
本发明还进一步提供了包含本文所述的此类RNA指导物的载体。
本发明还进一步提供了包含如本文所述的组合物、RNA指导物、核酸或载体的细胞。
在细胞的一个方面,细胞是真核细胞、动物细胞、哺乳动物细胞、人细胞、原代细胞、细胞系、干细胞或T细胞。
本发明还进一步提供了包含如本文所述的组合物、RNA指导物、核酸或载体的试剂盒。
本发明还进一步提供了一种编辑BCL11A序列的方法,该方法包括使BCL11A序列与本文所述的组合物或RNA指导物接触。在实施例中,该方法在体外进行。在实施例中,该方法离体进行。
在该方法的一方面,BCL11A序列在细胞中。
在该方法的一方面,组合物或RNA指导物诱导BCL11A序列的缺失。
在该方法的一方面,缺失与5'-NTTN-3'序列相邻,其中N是任何核苷酸。
在该方法的一方面,缺失是在5'-NTTN-3'序列的下游。
在该方法的一方面,缺失长度多达约40个核苷酸。
在该方法的一方面,缺失长度为约4个核苷酸至40个核苷酸。
在该方法的一方面,缺失长度为约4个核苷酸至25个核苷酸。
在该方法的一方面,缺失长度为约10个核苷酸至25个核苷酸。
在该方法的一方面,缺失长度为约10个核苷酸至15个核苷酸。
在该方法的一方面,缺失在5'-NTTN-3'序列的约5个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的约5个核苷酸至约10个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3′序列的约10个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始。
在该方法的一方面,缺失在5'-NTTN-3'序列的约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
在该方法的一方面,缺失在5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
在该方法的一方面,5'-NTTN-3'序列是5'-CTTT-3'、5′-CTTC-3′、5'-GTTT-3'、5'-GTTC-3'、5'-TTTC-3'、5'-GTTA-3'或5'-GTTG-3'。
在该方法的一方面,缺失与基因中的突变重叠。
在该方法的一方面,缺失与基因中的插入重叠。
在该方法的一方面,缺失去除了基因或其一部分的重复扩展。
在该方法的一方面,缺失破坏了基因的一个或两个等位基因。
在该方法的一方面,缺失破坏了BCL11A基因增强子区的GATAA基序。
在本文所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法的一方面,组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法破坏BCL11A基因的增强子区的GATAA基序。
在本文所述的组合物、细胞、试剂盒或方法的一方面,组合物、细胞、试剂盒或方法包含至少两个靶向BCL11A基因的增强子区的GATAA基序的RNA指导物。
在本文所述的组合物、细胞、试剂盒或方法的一方面,至少两个RNA指导物与以下具有至少90%同一性:AGAAAUCCGUCUUUCAUUGACGGGAAGCUAGUCUAGUGCAAGC
(SEQ ID NO:2677);
AGAAAUCCGUCUUUCAUUGACGGCUGGAGCCUGUGAUAAAAGC
(SEQ ID NO:2678);和/或
AGAAAUCCGUCUUUCAUUGACGGUACCCCACCCACGCCCCCAC
(SEQ ID NO:66)。
在本文所述的组合物、细胞、试剂盒或方法的一方面,至少两个RNA指导物与以下具有至少95%同一性:AGAAAUCCGUCUUUCAUUGACGGGAAGCUAGUCUAGUGCAAGC
(SEQ ID NO:2677);
AGAAAUCCGUCUUUCAUUGACGGCUGGAGCCUGUGAUAAAAGC
(SEQ ID NO:2678);和/或
AGAAAUCCGUCUUUCAUUGACGGUACCCCACCCACGCCCCCAC
(SEQ ID NO:2679)。
在本文所述的组合物、细胞、试剂盒或方法的一方面,至少两个RNA指导物包含以下中的至少两个序列:AGAAAUCCGUCUUUCAUUGACGGGAAGCUAGUCUAGUGCAAGC(SEQ ID NO:2677);
AGAAAUCCGUCUUUCAUUGACGGCUGGAGCCUGUGAUAAAAGC(SEQ ID NO:2678);以及
AGAAAUCCGUCUUUCAUUGACGGUACCCCACCCACGCCCCCAC(SEQ ID NO:2679)。
在本文所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法的一方面,RNA指导物由以下序列组成:AGAAAUCCGUCUUUCAUUGACGGGAAGCUAGUCUAGUGCAAGC(SEQ ID NO:2677);
AGAAAUCCGUCUUUCAUUGACGGCUGGAGCCUGUGAUAAAAGC(SEQ ID NO:2678);或
AGAAAUCCGUCUUUCAUUGACGGUACCCCACCCACGCCCCCAC(SEQ ID NO:2679)。
在本文所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法的一方面,RNA指导物不由以下序列组成:AGAAAUCCGUCUUUCAUUGACGGGAAGCUAGUCUAGUGCAAGC(SEQ ID NO:2677);
AGAAAUCCGUCUUUCAUUGACGGCUGGAGCCUGUGAUAAAAGC(SEQ ID NO:2678);或
AGAAAUCCGUCUUUCAUUGACGGUACCCCACCCACGCCCCCAC(SEQ ID NO:2679)。
定义
本发明将相对于具体实施例来说明,但本发明并不受限于此而只受权利要求限制。除非另有说明,否则下文阐述的术语通常应以其常见意义来理解。
如本文所用,术语“活性”是指生物活性。在一些实施例中,活性包括酶活性,例如效应子的催化能力。例如,活性可以包括核酸酶活性。
如本文所用,术语“BCL11A”是指“B细胞淋巴瘤/白血病11A”。BCL11A在造血发育中发挥作用,也可能作为白血病疾病基因发挥作用。如本文所阐述的SEQ ID NO:2635提供了BCL11A基因序列的实例。应当理解,本文所述的间隔子序列可以靶向SEQ ID NO:2635或其反向互补序列,这取决于它们是如表5中所列的“+”还是“-”所示。表5中列出的靶序列位于BCL11A基因的非靶链上。
如本文所用,术语“Cas12i多肽”(本文也称为Cas12i)是指与RNA指导物指定的靶核酸上的靶序列结合的多肽,其中该多肽与野生型Cas12i多肽具有至少一些氨基酸序列同源性。在一些实施例中,Cas12i多肽与美国专利号10,808,245的SEQ ID NO:1-5和11-18中任一个包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性,其通过引用整体并入本文。在一些实施例中,Cas12i多肽与美国专利号10,808,245的SEQ ID NO:3(Cas12i1)、SEQ ID NO:5(Cas12i2)、SEQ ID NO:14(Cas12i3)或SEQ ID NO:16(Cas12i4)(对应于本申请的SEQ ID NO:2650、2634、2651和2647)中任一个包含至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一些实施例中,本披露的Cas12i多肽是如PCT/US 2021/025257中所述的Cas12i1多肽或Cas12i2多肽。在一些实施例中,Cas12i多肽切割靶核酸(例如,作为切口或双链断裂)。
如本文所用,术语“复合物”是指两个或更多个分子的群化。在一些实施例中,复合物包含彼此相互作用(例如,结合、接触、粘附)的多肽和核酸分子。如本文所用,术语“复合物”可以指RNA指导物和多肽(例如,Cas12i多肽)的组化。如本文所用,术语“复合物”可指RNA指导物、多肽和靶序列的组化。如本文所用,术语“复合物”可以指靶向BCL11A的RNA指导物和Cas12i多肽的组化。
如本文所用,术语“原型间隔子相邻基序”或“PAM”是指与靶序列(例如,BCL11A靶序列)相邻的DNA序列,包含RNA指导物(例如,靶向BCL11A的RNA指导物)和Cas12i多肽的复合物与该靶序列结合。在双链靶标的情况下,RNA指导物结合靶标的第一链(例如,靶链或间隔子互补链),并且如本文所述的PAM序列存在于第二互补链中(例如,非靶链或非间隔子互补链)。如本文所用,术语“相邻”包括其中包含RNA指导物和Cas12i多肽的复合物的RNA指导物与紧邻PAM的靶序列特异性结合、相互作用或缔合的情况。在此类情况下,在靶序列与PAM之间没有核苷酸。术语“相邻”还包括在与RNA指导物结合的靶序列与PAM之间存在少数(例如,1、2、3、4或5个)核苷酸的情况。在一些实施例中,如本文所述的PAM序列存在于非靶链(例如,非间隔子互补链)中。术语“相邻”包括本文所述的PAM序列,其与非靶链中的序列直接相邻(或在非靶链中的序列的少量,例如1、2、3、4或5个核苷酸内)。
如本文所用,术语“RNA指导物”是指促进本文所述的多肽(例如,Cas12i多肽)靶向靶序列(例如,BCL11A基因的序列)的任何RNA分子。RNA指导物可以被设计成包括与特定的核酸序列(例如,BCL11A核酸序列)互补的序列的分子。RNA指导物可以包含靶向DNA的序列(即,间隔子序列)和同向重复(DR)序列。术语“crRNA”在本文中也用于指RNA指导物。
在一些实施例中,间隔子序列与靶序列互补。如本文所用,术语“互补”是指第一核酸分子(例如RNA指导物)的核碱基与第二核酸分子(例如靶序列)的核碱基碱基配对的能力。两个互补的核酸分子能够在适当的温度和溶液离子强度条件下非共价结合。在一些实施例中,第一核酸分子(例如,RNA指导物的间隔子序列)包含与第二核酸(例如,靶序列)的100%互补性。在一些实施例中,如果第一核酸分子包含与第二核酸至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的互补性,则第一核酸分子(例如RNA指导物的间隔子序列)与第二核酸分子(例如靶序列)互补。如本文所用,术语“基本上互补”是指与靶序列具有一定水平互补性的多核苷酸(例如,RNA指导物的间隔子序列)。在一些实施例中,互补性水平使得多核苷酸可以以足够的亲和力与靶序列杂交,以允许与多核苷酸复合的效应多肽(例如,Cas12i)作用于(例如,切割)靶序列。在一些实施例中,与靶序列基本上互补的间隔子序列与靶序列具有小于100%的互补性。在一些实施例中,与靶序列基本上互补的间隔子序列与靶序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%互补性。在一些实施例中,具有与靶序列基本互补的间隔子序列的RNA指导物与靶序列具有100%互补性。
如本文所用,术语“靶标”和“靶序列”是指RNA指导物特异性结合的核酸序列。在一些实施例中,RNA指导物的DNA靶向序列(例如,间隔子)结合靶序列。在双链靶标的情况下,RNA指导物结合靶标的第一链(即,靶链或间隔子互补链),并且如本文所述的PAM序列存在于第二互补链中(即,非靶链或非间隔子互补链)。在一些实施例中,靶链(即,间隔子互补链)包含5'-NAAN-3'序列。在一些实施例中,靶序列是BCL11A基因序列内的序列,包括但不限于SEQ ID NO:2635或其反向互补序列。
如本文所用,术语“上游”和“下游”是指核酸分子中单个核酸(例如,DNA)序列内的相对位置。“上游”和“下游”分别涉及发生RNA转录的5'至3'方向。当第一序列的3'端出现在第二序列的5'端之前时,第一序列在第二序列的上游。当第一序列的5'端出现在第二序列的3'端之后时,第一序列在第二序列的下游。在一些实施例中,5'-NTTN-3'序列在本文所述的插入缺失的上游,并且Cas12i诱导的插入缺失在5'-NTTN-3'序列的下游。
附图说明
图1显示了在各种RNP浓度下,用与SEQ ID NO:2642的变体Cas12i2复合的不同个体和多重crRNA靶向BCL11A内含子红系增强子后,CD34+HSPC细胞中的插入缺失活性。误差条代表两个生物学重复(两个个体供体)的平均值的标准偏差。
图2显示了在原代CD34+HSPC中靶向BCL11A内含子红系增强子后72小时,经修饰的CD34+HSPC细胞的活力。测试了不同浓度的BCL11A内含子红系增强子靶向型RNP(其包括SEQID NO:2642的变体Cas12i2和crRNA)。crRNA被单独和多重配置测试。误差条代表两个生物学重复(两个个体供体)的平均值的标准偏差。
具体实施方式
本披露涉及能够结合BCL11A的RNA指导物及其使用方法。在一些方面,本文描述了一种包含具有一个或多个特性的RNA指导物的组合物。在一些方面,描述了产生RNA指导物的方法。在一些方面,描述了一种递送包含RNA指导物的组合物的方法。
组合物
在一些方面,本文所述的发明包括包含靶向BCL11A基因或BCL11A基因的一部分的RNA指导物的组合物。在一些实施例中,RNA指导物由同向重复组分和间隔子组分组成。在一些实施例中,RNA指导物与Cas12i多肽结合。在一些实施例中,间隔子组分与BCL11A靶序列基本上互补,其中BCL11A靶序列与本文所述的5'-NTTN-3'PAM序列相邻。在双链靶标的情况下,RNA指导物结合靶标的第一链(即,靶链或间隔子互补链),并且如本文所述的PAM序列存在于第二互补链中(即,非靶链或非间隔子互补链)。
在一些实施例中,本文所述的发明包含含有复合物的组合物,其中该复合物包含靶向BCL11A的RNA指导物。在一些实施例中,本发明包含一种复合物,该复合物包含RNA指导物和Cas12i多肽。在一些实施例中,RNA指导物和Cas12i多肽以约1:1的摩尔比彼此结合。在一些实施例中,包含RNA指导物和Cas12i多肽的复合物与BCL11A靶序列结合。在一些实施例中,包含靶向BCL11A的RNA指导物和Cas12i多肽的复合物与BCL11A靶序列以约1:1的摩尔比结合。在一些实施例中,复合物包含可以切割BCL11A靶序列的酶活性,如核酸酶活性。RNA指导物、Cas12i多肽、和BCL11A靶序列(无论是单独还是一起)不是天然存在的。
本文披露的组合物的使用具有优于其他已知的核酸酶系统的那些的优点。Cas12i多肽比其他核酸酶小。例如,Cas12i2的长度为1,054个氨基酸,而化脓性链球菌(S.pyogenes)Cas9(SpCas9)的长度为1,368个氨基酸,嗜热链球菌(S.thermophilus)Cas9(StCas9)的长度为1,128个氨基酸,FnCpf1的长度为1,300个氨基酸,AsCpf1的长度为1,307个氨基酸,并且LbCpf1的长度为1,246个氨基酸。不需要反式激活的CRISPR RNA(tracrRNA)的Cas12i RNA指导物也比Cas9 RNA指导物小。较小的Cas12i多肽和RNA指导物大小有利于递送。与包含SpCas9多肽的组合物相比,包含Cas12i多肽的组合物还表现出降低的脱靶活性。参见PCT/US 2021/025257,将该文献通过援引以其全文并入。此外,由包含Cas12i多肽的组合物诱导的插入缺失不同于由包含SpCas9多肽的组合物诱导的插入缺失。例如,SpCas9多肽主要诱导长度为1个核苷酸的插入和缺失。然而,Cas12i多肽诱导较大的缺失,这可有利于破坏基因(如BCL11A)的较大部分。
RNA指导物
在一些实施例中,本文所述的组合物包含靶向BCL11A的RNA指导物。在一些实施例中,本文所述的组合物包含两个或更多个(例如,2、3、4、5、6、7、8、9、或更多个)靶向BCL11A的RNA指导物。
RNA指导物可将本文所述的Cas12i多肽引导至BCL11A靶序列。两个或更多个RNA指导物可以将两个或更多个如本文所述的单独的Cas12i多肽(例如,具有相同或不同序列的Cas12i多肽)靶向至两个或更多个(例如,2、3、4、5、6、7、8、9、或更多个)BCL11A靶序列。
阅读以下特定种类的RNA指导物的实例的本领域技术人员将理解,在一些实施例中,RNA指导物具有BCL11A靶特异性。也就是说,在一些实施例中,RNA指导物与一个或多个BCL11A靶序列(例如,在细胞内)特异性结合,并且不与非靶向的序列(例如,相同细胞内的非特异性DNA或随机序列)结合。
在一些实施例中,RNA指导物包含间隔子序列、随后是同向重复序列,指的是从5'至3'方向的序列。在一些实施例中,RNA指导物包含第一同向重复序列、随后是间隔子序列、和第二同向重复序列,指的是从5'至3′方向的序列。在一些实施例中,这种RNA指导物的第一同向重复序列和第二同向重复序列相同。在一些实施例中,这种RNA指导物的第一同向重复序列和第二同向重复序列不同。
在一些实施例中,RNA指导物的间隔子序列和一个或多个同向重复序列存在于相同的RNA分子内。在一些实施例中,间隔子序列和同向重复序列彼此直接连接。在一些实施例中,在间隔子序列和同向重复序列之间存在短接头,例如长度为1、2、或3个核苷酸的RNA接头。在一些实施例中,RNA指导物的间隔子序列和一个或多个同向重复序列存在于单独的分子中,它们通过碱基配对相互作用彼此连接。
关于RNA指导物的示例性同向重复组分和间隔子组分的额外信息提供如下。
同向重复序列
在一些实施例中,RNA指导物包含同向重复序列。在一些实施例中,RNA指导物的同向重复序列的长度介于12-100、13-75、14-50、或15-40个核苷酸之间(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、或40个核苷酸)。
在一些实施例中,同向重复序列是或包含表1的序列或表1的序列的一部分。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸1至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸2至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸3至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸4至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸5至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸6至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸7至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸8至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸9至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸10至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸11至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸12至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸13至核苷酸36。同向重复序列可以包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸14至核苷酸36。同向重复序列可以包含SEQ ID NO:9的核苷酸1至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸2至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸3至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸4至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸5至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸6至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸7至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸8至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸9至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸10至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸11至核苷酸34。同向重复序列可以包含SEQ ID NO:9的核苷酸12至核苷酸34。在一些实施例中,同向重复序列在SEQ ID NO:10中阐述。在一些实施例中,同向重复序列包含在SEQ ID NO:10中阐述的序列的一部分。
在一些实施例中,同向重复序列具有或包含序列,该序列与表1的序列或表1的序列的一部分包含至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。同向重复序列可以具有或包含序列,该序列与包含SEQ IDNO:1、2、3、4、5、6、7、或8中任一个的核苷酸1至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸2至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸3至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸4至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸5至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸6至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸7至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸8至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ IDNO:1、2、3、4、5、6、7、或8中任一个的核苷酸9至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸10至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸11至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸12至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸13至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:1、2、3、4、5、6、7、或8中任一个的核苷酸14至核苷酸36的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸1至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸2至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸3至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸4至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQID NO:9的核苷酸5至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸6至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸7至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸8至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸9至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸10至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸11至核苷酸34的序列具有至少90%的同一性。同向重复序列可以具有或包含序列,该序列与包含SEQ ID NO:9的核苷酸12至核苷酸34的序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:10具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与在SEQ ID NO:10中阐述的序列的一部分具有至少90%的同一性。
在一些实施例中,包含Cas12i2多肽和RNA指导物的组合物能够将插入缺失引入BCL11A靶序列中,该RNA指导物包含SEQ ID NO:10的同向重复序列和20个核苷酸长度的间隔子。参见实例1。
在一些实施例中,同向重复序列是或包含序列,该序列与SEQ ID NO:1-10中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列是或包含SEQID NO:1-10中任一个的反向互补序列。
表1.同向重复序列
序列标识符 | 同向重复序列 |
SEQ ID NO:1 | GUUGCAAAACCCAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:2 | AAUAGCGGCCCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:3 | AUUGGAACUGGCGAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:4 | CCAGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:5 | CGGCGCUCGAAUAGGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:6 | GUGGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:7 | GUUGCAACACCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:8 | GUUGCAAUGCCUAAGAAAUCCGUCUUUCAUUGACGG |
SEQ ID NO:9 | GCAACACCUAAGAAAUCCGUCUUUCAUUGACGGG |
SEQ ID NO:10 | AGAAAUCCGUCUUUCAUUGACGG |
在一些实施例中,同向重复序列是表2的序列或表2的序列的一部分。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸1至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸2至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸3至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸4至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸5至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸6至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸7至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸8至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸9至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸10至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸11至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸12至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸13至核苷酸36。同向重复序列可以包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸14至核苷酸36。
在一些实施例中,同向重复序列与表2的序列或表2的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸1至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸2至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸3至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸4至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸5至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸6至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸7至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸8至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸9至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸10至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸11至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸12至核苷酸36的序列具有至少95%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸13至核苷酸36的序列具有至少95%的同一性。
在一些实施例中,同向重复序列与表2的序列或表2的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸1至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸2至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸3至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸4至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸5至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸6至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸7至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸8至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸9至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸10至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸11至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸12至核苷酸36的序列具有至少90%的同一性。同向重复序列可以与包含SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的核苷酸13至核苷酸36的序列具有至少90%的同一性。
在一些实施例中,同向重复序列与SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的反向互补序列具有至少95%的同一性。在一些实施例中,同向重复序列是SEQ ID NO:2652、2653、2654、2655、2656、2657、2658、2659、2660、2661、2662、2663、2664、2665、2666、2667、2668、或2669中任一个的反向互补序列。
在一些实施例中,同向重复序列与SEQ ID NO:2670或SEQ ID NO:2670的一部分具有至少90%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:2670或SEQ ID NO:2670的一部分具有至少95%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:2670或SEQ ID NO:2670的一部分具有100%的同一性。
表2.Cas12i4同向重复序列。
序列标识符 | 同向重复序列 |
SEQ ID NO:2652 | UCUCAACGAUAGUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO:2653 | UUUUAACAACACUCAGGCAUGUGUCCACAGUGACAC |
SEQ ID NO:2654 | UUGAACGGAUACUCAGACAUGUGUUUCCAGUGACAC |
SEQ ID NO:2655 | UGCCCUCAAUAGUCAGAUGUGUGUCCACAGUGACAC |
SEQ ID NO:2656 | UCUCAAUGAUACUUAGAUACGUGUCCUCAGUGACAC |
SEQ ID NO:2657 | UCUCAAUGAUACUCAGACAUGUGUCCCCAGUGACAC |
SEQ ID NO:2658 | UCUCAAUGAUACUAAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO:2659 | UCUCAACUAUACUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO:2660 | UCUCAACGAUACUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO:2661 | UCUCAACGAUACUAAGAUAUGUGUCCUCAGCGACAC |
SEQ ID NO:2662 | UCUCAACGAUACUAAGAUAUGUGUCCCCAGUGACAC |
SEQ ID NO:2663 | UCUCAACGAUACUAAGAUAUGUGUCCACAGUGACAC |
SEQ ID NO:2664 | UCUCAACAAUACUCAGACAUGUGUCCCCAGUGACAC |
SEQ ID NO:2665 | UCUCAACAAUACUAAGGCAUGUGUCCCCAGUGACCC |
SEQ ID NO:2666 | UCUCAAAGAUACUCAGACACGUGUCCCCAGUGACAC |
SEQ ID NO:2667 | UCUCAAAAAUACUCAGACAUGUGUCCUCAGUGACAC |
SEQ ID NO:2668 | GCGAAACAACAGUCAGACAUGUGUCCCCAGUGACAC |
SEQ ID NO:2669 | CCUCAACGAUAUUAAGACAUGUGUCCGCAGUGACAC |
SEQ ID NO:2670 | AGACAUGUGUCCUCAGUGACAC |
在一些实施例中,同向重复序列是表3的序列或表3的序列的一部分。在一些实施例中,同向重复序列与表3的序列或表3的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与表3的序列或表3的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与SEQ ID NO:2671-2673中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:2671-2673中任一个的反向互补序列具有至少95%的同一性。在一些实施例中,同向重复序列是SEQ ID NO:2671-2673中任一个的反向互补序列。
表3.Cas12i1同向重复序列。
序列标识符 | 同向重复序列 |
SEQ ID NO:2671 | GUUGGAAUGACUAAUUUUUGUGCCCACCGUUGGCAC |
SEQ ID NO:2672 | AAUUUUUGUGCCCAUCGUUGGCAC |
SEQ ID NO:2673 | AUUUUUGUGCCCAUCGUUGGCAC |
在一些实施例中,同向重复序列是表4的序列或表4的序列的一部分。在一些实施例中,同向重复序列与表4的序列或表4的序列的一部分具有至少95%的同一性(例如,至少95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与表4的序列或表4的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。在一些实施例中,同向重复序列与SEQ ID NO:2674-2676中任一个的反向互补序列具有至少90%的同一性。在一些实施例中,同向重复序列与SEQ ID NO:2674-2676中任一个的反向互补序列具有至少95%的同一性。在一些实施例中,同向重复序列是SEQ ID NO:2674-2676中任一个的反向互补序列。
表4.Cas12i3同向重复序列。
序列标识符 | 同向重复序列 |
SEQ ID NO:2674 | CUAGCAAUGACCUAAUAGUGUGUCCUUAGUUGACAU |
SEQ ID NO:2675 | CCUACAAUACCUAAGAAAUCCGUCCUAAGUUGACGG |
SEQ ID NO:2676 | AUAGUGUGUCCUUAGUUGACAU |
在一些实施例中,本文所述的同向重复序列包含尿嘧啶(U)。在一些实施例中,本文所述的同向重复序列包含胸腺嘧啶(T)。在一些实施例中,根据表1-4的同向重复序列包含这样的序列,该序列在表1-4中指示为尿嘧啶的一个或多个位置中包含胸腺嘧啶。
间隔子
在一些实施例中,RNA指导物包含靶向DNA的间隔子序列。在一些实施例中,RNA指导物的间隔子序列的长度介于12-100、13-75、14-50、或15-30个核苷酸之间(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸)并且与特定靶序列互补。在一些实施例中,间隔子序列被设计为与例如基因组基因座的特定DNA链互补。
在一些实施例中,RNA指导物间隔子序列与靶序列的互补链基本上相同。在一些实施例中,RNA指导物包含与参考核酸序列(例如靶序列)的互补链具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。
在一些实施例中,RNA指导物包含间隔子序列,该间隔子序列的长度介于12-100、13-75、14-50、或15-30个核苷酸之间(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个核苷酸),并且该间隔子序列与靶序列具有至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%的互补性。在一些实施例中,RNA指导物包含与靶DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含与靶基因组序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含长度为至多50并且与靶序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列(例如,RNA序列)。在一些实施例中,RNA指导物包含与靶DNA序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。在一些实施例中,RNA指导物包含与靶基因组序列至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%互补的序列。
在一些实施例中,间隔子序列是或包含表5的序列或表5的序列的一部分。表5中列出的靶序列位于BCL11A序列的非靶链上。应该理解的是,SEQ ID NO:1322-2632的指示应该被认为等同于SEQ ID NO:1322-2632的列表,其中每一个介于中间的编号都出现在列表中,即1322、1323、1324、1325、1326、1327、1328、1329、1330、1331、1332、1333、1334、1335、1336、1337、1338、1339、1340、1341、1342、1343、1344、1345、1346、1347、1348、1349、1350、1351、1352、1353、1354、1355、1356、1357、1358、1359、1360、1361、1362、1363、1364、1365、1366、1367、1368、1369、1370、1371、1372、1373、1374、1375、1376、1377、1378、1379、1380、1381、1382、1383、1384、1385、1386、1387、1388、1389、1390、1391、1392、1393、1394、1395、1396、1397、1398、1399、1400、1401、1402、1403、1404、1405、1406、1407、1408、1409、1410、1411、1412、1413、1414、1415、1416、1417、1418、1419、1420、1421、1422、1423、1424、1425、1426、1427、1428、1429、1430、1431、1432、1433、1434、1435、1436、1437、1438、1439、1440、1441、1442、1443、1444、1445、1446、1447、1448、1449、1450、1451、1452、1453、1454、1455、1456、1457、1458、1459、1460、1461、1462、1463、1464、1465、1466、1467、1468、1469、1470、1471、1472、1473、1474、1475、1476、1477、1478、1479、1480、1481、1482、1483、1484、1485、1486、1487、1488、1489、1490、1491、1492、1493、1494、1495、1496、1497、1498、1499、1500、1501、1502、1503、1504、1505、1506、1507、1508、1509、1510、1511、1512、1513、1514、1515、1516、1517、1518、1519、1520、1521、1522、1523、1524、1525、1526、1527、1528、1529、1530、1531、1532、1533、1534、1535、1536、1537、1538、1539、1540、1541、1542、1543、1544、1545、1546、1547、1548、1549、1550、1551、1552、1553、1554、1555、1556、1557、1558、1559、1560、1561、1562、1563、1564、1565、1566、1567、1568、1569、1570、1571、1572、1573、1574、1575、1576、1577、1578、1579、1580、1581、1582、1583、1584、1585、1586、1587、1588、1589、1590、1591、1592、1593、1594、1595、1596、1597、1598、1599、1600、1601、1602、1603、1604、1605、1606、1607、1608、1609、1610、1611、1612、1613、1614、1615、1616、1617、1618、1619、1620、1621、1622、1623、1624、1625、1626、1627、1628、1629、1630、1631、1632、1633、1634、1635、1636、1637、1638、1639、1640、1641、1642、1643、1644、1645、1646、1647、1648、1649、1650、1651、1652、1653、1654、1655、1656、1657、1658、1659、1660、1661、1662、1663、1664、1665、1666、1667、1668、1669、1670、1671、1672、1673、1674、1675、1676、1677、1678、1679、1680、1681、1682、1683、1684、1685、1686、1687、1688、1689、1690、1691、1692、1693、1694、1695、1696、1697、1698、1699、1700、1701、1702、1703、1704、1705、1706、1707、1708、1709、1710、1711、1712、1713、1714、1715、1716、1717、1718、1719、1720、1721、1722、1723、1724、1725、1726、1727、1728、1729、1730、1731、1732、1733、1734、1735、1736、1737、1738、1739、1740、1741、1742、1743、1744、1745、1746、1747、1748、1749、1750、1751、1752、1753、1754、1755、1756、1757、1758、1759、1760、1761、1762、1763、1764、1765、1766、1767、1768、1769、1770、1771、1772、1773、1774、1775、1776、1777、1778、1779、1780、1781、1782、1783、1784、1785、1786、1787、1788、1789、1790、1791、1792、1793、1794、1795、1796、1797、1798、1799、1800、1801、1802、1803、1804、1805、1806、1807、1808、1809、1810、1811、1812、1813、1814、1815、1816、1817、1818、1819、1820、1821、1822、1823、1824、1825、1826、1827、1828、1829、1830、1831、1832、1833、1834、1835、1836、1837、1838、1839、1840、1841、1842、1843、1844、1845、1846、1847、1848、1849、1850、1851、1852、1853、1854、1855、1856、1857、1858、1859、1860、1861、1862、1863、1864、1865、1866、1867、1868、1869、1870、1871、1872、1873、1874、1875、1876、1877、1878、1879、1880、1881、1882、1883、1884、1885、1886、1887、1888、1889、1890、1891、1892、1893、1894、1895、1896、1897、1898、1899、1900、1901、1902、1903、1904、1905、1906、1907、1908、1909、1910、1911、1912、1913、1914、1915、1916、1917、1918、1919、1920、1921、1922、1923、1924、1925、1926、1927、1928、1929、1930、1931、1932、1933、1934、1935、1936、1937、1938、1939、1940、1941、1942、1943、1944、1945、1946、1947、1948、1949、1950、1951、1952、1953、1954、1955、1956、1957、1958、1959、1960、1961、1962、1963、1964、1965、1966、1967、1968、1969、1970、1971、1972、1973、1974、1975、1976、1977、1978、1979、1980、1981、1982、1983、1984、1985、1986、1987、1988、1989、1990、1991、1992、1993、1994、1995、1996、1997、1998、1999、2000、2001、2002、2003、2004、2005、2006、2007、2008、2009、2010、2011、2012、2013、2014、2015、2016、2017、2018、2019、2020、2021、2022、2023、2024、2025、2026、2027、2028、2029、2030、2031、2032、2033、2034、2035、2036、2037、2038、2039、2040、2041、2042、2043、2044、2045、2046、2047、2048、2049、2050、2051、2052、2053、2054、2055、2056、2057、2058、2059、2060、2061、2062、2063、2064、2065、2066、2067、2068、2069、2070、2071、2072、2073、2074、2075、2076、2077、2078、2079、2080、2081、2082、2083、2084、2085、2086、2087、2088、2089、2090、2091、2092、2093、2094、2095、2096、2097、2098、2099、2100、2101、2102、2103、2104、2105、2106、2107、2108、2109、2110、2111、2112、2113、2114、2115、2116、2117、2118、2119、2120、2121、2122、2123、2124、2125、2126、2127、2128、2129、2130、2131、2132、2133、2134、2135、2136、2137、2138、2139、2140、2141、2142、2143、2144、2145、2146、2147、2148、2149、2150、2151、2152、2153、2154、2155、2156、2157、2158、2159、2160、2161、2162、2163、2164、2165、2166、2167、2168、2169、2170、2171、2172、2173、2174、2175、2176、2177、2178、2179、2180、2181、2182、2183、2184、2185、2186、2187、2188、2189、2190、2191、2192、2193、2194、2195、2196、2197、2198、2199、2200、2201、2202、2203、2204、2205、2206、2207、2208、2209、2210、2211、2212、2213、2214、2215、2216、2217、2218、2219、2220、2221、2222、2223、2224、2225、2226、2227、2228、2229、2230、2231、2232、2233、2234、2235、2236、2237、2238、2239、2240、2241、2242、2243、2244、2245、2246、2247、2248、2249、2250、2251、2252、2253、2254、2255、2256、2257、2258、2259、2260、2261、2262、2263、2264、2265、2266、2267、2268、2269、2270、2271、2272、2273、2274、2275、2276、2277、2278、2279、2280、2281、2282、2283、2284、2285、2286、2287、2288、2289、2290、2291、2292、2293、2294、2295、2296、2297、2298、2299、2300、2301、2302、2303、2304、2305、2306、2307、2308、2309、2310、2311、2312、2313、2314、2315、2316、2317、2318、2319、2320、2321、2322、2323、2324、2325、2326、2327、2328、2329、2330、2331、2332、2333、2334、2335、2336、2337、2338、2339、2340、2341、2342、2343、2344、2345、2346、2347、2348、2349、2350、2351、2352、2353、2354、2355、2356、2357、2358、2359、2360、2361、2362、2363、2364、2365、2366、2367、2368、2369、2370、2371、2372、2373、2374、2375、2376、2377、2378、2379、2380、2381、2382、2383、2384、2385、2386、2387、2388、2389、2390、2391、2392、2393、2394、2395、2396、2397、2398、2399、2400、2401、2402、2403、2404、2405、2406、2407、2408、2409、2410、2411、2412、2413、2414、2415、2416、2417、2418、2419、2420、2421、2422、2423、2424、2425、2426、2427、2428、2429、2430、2431、2432、2433、2434、2435、2436、2437、2438、2439、2440、2441、2442、2443、2444、2445、2446、2447、2448、2449、2450、2451、2452、2453、2454、2455、2456、2457、2458、2459、2460、2461、2462、2463、2464、2465、2466、2467、2468、2469、2470、2471、2472、2473、2474、2475、2476、2477、2478、2479、2480、2481、2482、2483、2484、2485、2486、2487、2488、2489、2490、2491、2492、2493、2494、2495、2496、2497、2498、2499、2500、2501、2502、2503、2504、2505、2506、2507、2508、2509、2510、2511、2512、2513、2514、2515、2516、2517、2518、2519、2520、2521、2522、2523、2524、2525、2526、2527、2528、2529、2530、2531、2532、2533、2534、2535、2536、2537、2538、2539、2540、2541、2542、2543、2544、2545、2546、2547、2548、2549、2550、2551、2552、2553、2554、2555、2556、2557、2558、2559、2560、2561、2562、2563、2564、2565、2566、2567、2568、2569、2570、2571、2572、2573、2574、2575、2576、2577、2578、2579、2580、2581、2582、2583、2584、2585、2586、2587、2588、2589、2590、2591、2592、2593、2594、2595、2596、2597、2598、2599、2600、2601、2602、2603、2604、2605、2606、2607、2608、2609、2610、2611、2612、2613、2614、2615、2616、2617、2618、2619、2620、2621、2622、2623、2624、2625、2626、2627、2628、2629、2630、2631和2632。
间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸16。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸17。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸18。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸19。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸20。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸21。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸22。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸23。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸24。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸25。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸26。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸27。间隔子序列可以包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸28。间隔子序列可以包含SEQ ID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸29。间隔子序列可以包含SEQ ID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸30。
在一些实施例中,间隔子序列具有或包含序列,该序列与表5的序列或表5的序列的一部分具有至少90%的同一性(例如,至少90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸16的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸17的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸18的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸19的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸20的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸21的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸22的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸23的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸24的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸25的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸26的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸27的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸28的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸29的序列具有至少90%的同一性。间隔子序列可以具有或包含序列,该序列与包含SEQ ID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸30的序列具有至少90%的同一性。
表5.靶序列和间隔子序列
本发明包括与本文披露内容一致的、以上列出的同向重复序列和间隔子的所有组合。
在一些实施例中,一个或多个RNA指导物破坏BCL11A基因的增强子区的GATAA基序。在一些实施例中,两个RNA指导物破坏BCL11A基因的增强子区的GATAA基序。例如,在一些实施例中,SEQ ID NO:2677的RNA指导物(或与SEQ ID NO:2677具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的RNA指导物)和SEQ ID NO:2678的RNA指导物(或与SEQ ID NO:2678具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的RNA指导物)破坏GATAA基序。在其他实施例中,SEQ ID NO:2677的RNA指导物(或与SEQ ID NO:2677具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的RNA指导物)和SEQ ID NO:2679的RNA指导物(或与SEQ ID NO:2679具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的RNA指导物)破坏GATAA基序。在其他实施例中,SEQID NO:2678的RNA指导物(或与SEQ ID NO:2678具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的RNA指导物)和SEQ ID NO:2679的RNA指导物(或与SEQ ID NO:2679具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的RNA指导物)破坏GATAA基序。
在实施例中,RNA指导物不由以下序列组成:AGAAAUCCGUCUUUCAUUGACGGGAAGCUAGUCUAGUGCAAGC
(SEQ ID NO:2677);
AGAAAUCCGUCUUUCAUUGACGGCUGGAGCCUGUGAUAAAAGC
(SEQ ID NO:2678);或
AGAAAUCCGUCUUUCAUUGACGGUACCCCACCCACGCCCCCAC
(SEQ ID NO:2679)。
在一些实施例中,本文所述的间隔子序列包含尿嘧啶(U)。在一些实施例中,本文所述的间隔子序列包含胸腺嘧啶(T)。在一些实施例中,根据表5的间隔子序列包含这样的序列,该序列在表5中指示为尿嘧啶的一个或多个位置中包含胸腺嘧啶。
修饰
RNA指导物可以包括相对于参考序列、特别是亲本多核糖核苷酸的一个或多个共价修饰,该一个或多个共价修饰包括在本发明的范围内。
示例性修饰可以包括对糖、核碱基、核苷间键(例如,对连接性磷酸盐/磷酸二酯键/磷酸二酯主链)以及任何组合的任何修饰。下面详细描述了本文提供的一些示例性修饰。
RNA指导物可以包括如对糖、核碱基、或核苷间键(例如,对连接性磷酸酯/对磷酸二酯键/对磷酸二酯主链)的任何有用的修饰。嘧啶核碱基的一个或多个原子可被任选取代的氨基、任选取代的硫醇、任选取代的烷基(例如,甲基或乙基)或卤基(例如,氯或氟)替代或取代。在某些实施例中,修饰(例如,一个或多个修饰)存在于糖和核苷间键的每一者中。修饰可以是对核糖核酸(RNA)到脱氧核糖核酸(DNA)、苏糖核酸(TNA)、乙二醇核酸(GNA)、肽核酸(PNA)、锁核酸(LNA)或它们的杂交体的修饰。本文描述了另外的修饰。
在一些实施例中,修饰可包括化学或细胞诱导的修饰。例如,细胞内RNA修饰的一些非限制性实例由Lewis和Pan在“RNA modifications and structures cooperate toguide RNA-protein interactions[RNA修饰和结构协作指导RNA-蛋白质相互作用]”,NatReviews Mol Cell Biol[自然评论:分子细胞生物学],2017,18:202-210中所描述。
不同的糖修饰、核苷酸修饰和/或核苷间键(例如,主链结构)可存在于序列中的不同位置处。本领域普通技术人员将理解,核苷酸类似物或其他修饰可位于序列的任何位置处,使得序列的功能基本上不降低。序列可包括约1%至约100%的经修饰的核苷酸(相对于总核苷酸含量,或相对于一种或多种类型的核苷酸,即A、G、U或C中的任一种或多种)或任何插入百分比(例如,1%至20%、1%至25%、1%至50%、1%至60%、1%至70%、1%至80%、1%至90%、1%至95%、10%至20%、10%至25%、10%至50%、10%至60%、10%至70%、10%至80%、10%至90%、10%至95%、10%至100%、20%至25%、20%至50%、20%至60%、20%至70%、20%至80%、20%至90%、20%至95%、20%至100%、50%至60%、50%至70%、50%至80%、50%至90%、50%至95%、50%至100%、70%至80%、70%至90%、70%至95%、70%至100%、80%至90%、80%至95%、80%至100%、90%至95%、90%至100%和95%至100%)。
在一些实施例中,糖修饰(例如,2'位置或4'位置处)或序列的一个或多个核糖核苷酸处的糖替代以及主链修饰可包括磷酸二酯键的修饰或替代。序列的特定实例包括但不限于包括经修饰的主链或非天然核苷间键(例如核苷间修饰,包括磷酸二酯键的修饰或替代)的序列。具有经修饰的主链的序列尤其包括在主链中不具有磷原子的那些。出于本申请的目的,并且如本领域中有时提及的,在其核苷间主链中不具有磷原子的经修饰的RNA也可以被认为是寡核苷。在特定的实施例中,序列将包括在其核苷间主链中具有磷原子的核糖核苷酸。
经修饰的序列主链可包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯(诸如3'-亚烷基膦酸酯和手性膦酸酯)、亚膦酸酯、氨基磷酸酯(诸如3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯)、硫羰氨基磷酸酯(thionophosphoramidate)、硫羰烷基膦酸酯、硫羰烷基磷酸三酯和具有正常3'-5'连接的硼烷磷酸酯、这些酯的2'-5'连接的类似物,以及具有相反极性的那些,其中相邻的核苷单元对3'-5'连接至5'-3'或2'-5'连接至5'-2'。也包括各种盐、混合盐和游离酸形式。在一些实施例中,序列可带负电荷或带正电荷。
可掺入序列中的经修饰的核苷酸可以在核苷间键(例如,主链)上被修饰。在本文中,在多核苷酸主链的上下文中,短语“磷酸酯”和“磷酸二酯”可互换地使用。可以通过用不同的取代基替代一个或多个氧原子来修饰主链磷酸酯基团。此外,经修饰的核苷和核苷酸可以包括用如本文所述的另一核苷间键对未经修饰的磷酸酯部分进行整体替代。经修饰的磷酸酯基团的实例包括但不限于硫代磷酸酯、亚磷酸硒酸酯、硼酸磷酸酯(boranophosphate)、硼酸磷酸酯(boranophosphate ester)、氢膦酸酯、氨基磷酸酯、二氨基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。二硫代磷酸酯的两个非连接氧都被硫替代。也可以通过用氮(桥连的氨基磷酸酯)、硫(桥连的硫代磷酸酯)和碳(桥连的亚甲基膦酸酯)替代连接氧来修饰磷酸酯接头。
提供α-硫代取代的磷酸酯部分以通过非天然硫代磷酸酯主链连接赋予RNA和DNA聚合物稳定性。硫代磷酸酯DNA和RNA具有增强的核酸酶抗性,并因此在细胞环境中具有更长的半衰期。
在特定的实施例中,经修饰的核苷包括α-硫代-核苷(例如5'-O-(1-硫代磷酸)-腺苷、5′-O-(1-硫代磷酸)-胞苷(a-硫代胞苷)、5'-O-(1-硫代磷酸)-鸟苷、5′-O-(1-硫代磷酸)-尿苷或5'-O-(1-硫代磷酸)-假尿苷)。
本文描述了可根据本发明使用的其他核苷间键,包括不含磷原子的核苷间键。
在一些实施例中,序列可包括一个或多个细胞毒性核苷。例如,可将细胞毒性核苷掺入序列中,诸如双功能修饰。细胞毒性核苷可包括但不限于阿糖腺苷、5-氮杂胞苷、4'-硫代阿糖胞苷、环戊烯基胞嘧啶、克拉屈滨、氯法拉滨、阿糖胞苷、胞嘧啶阿拉伯糖苷、1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)-胞嘧啶、地西他滨、5-氟尿嘧啶、氟达拉滨、氟尿苷、吉西他滨、替加氟和尿嘧啶的组合、替加氟((RS)-5-氟-1-(四氢呋喃-2-基)嘧啶-2,4(1H,3H)-二酮)、曲沙他滨、替扎西他滨、2'-脱氧-2'-亚甲基胞苷(DMDC)和6-巯基嘌呤。其他实例包括氟达拉滨磷酸酯、N4-山嵛酰基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-十八烷基-1-β-D-阿拉伯戊呋喃糖基胞嘧啶、N4-棕榈酰基-1-(2-C-氰基-2-脱氧-β-D-阿拉伯-戊呋喃糖基)胞嘧啶和P-4055(阿糖胞苷5'-反油酸酯)。
在一些实施例中,序列包括一个或多个转录后修饰(例如,加帽、切割、聚腺苷酸化、剪接、聚A序列、甲基化、酰化、磷酸化、赖氨酸和精氨酸残基的甲基化、乙酰化、以及硫醇基团和酪氨酸残基的亚硝基化等)。该一个或多个转录后修饰可以是任何转录后修饰,如已经在RNA中鉴定出的多于一百种不同的核苷修饰中的任一种(Rozenski,J,Crain,P,和McCloskey,J.(1999).The RNA Modification Database:1999update[RNA修饰数据库:1999年更新].Nucl Acids Res[核酸研究]27:196-197)。在一些实施例中,第一分离的核酸包含信使RNA(mRNA)。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:吡啶-4-酮核糖核苷、5-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫尿苷、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基尿苷、3-甲基尿苷、5-羧基甲基-尿苷、1-羧基甲基-假尿苷、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸基甲基尿苷、1-牛磺酸基甲基-假尿苷、5-牛磺酸基甲基-2-硫代-尿苷、1-牛磺酸基甲基-4-硫代-尿苷、5-甲基-尿苷、1-甲基-假尿苷、4-硫代-1-甲基-假尿苷、2-硫代-1-甲基-假尿苷、1-甲基-1-去氮-假尿苷、2-硫代-1-甲基-1-去氮-假尿苷、二氢尿苷、二氢假尿苷、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷和4-甲氧基-2-硫代-假尿苷。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:5-氮杂-胞苷、假异胞苷、3-甲基-胞苷、N4-乙酰基胞苷、5-甲酰基胞苷、N4-甲基胞苷、5-羟基甲基胞苷、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-去氮-假异胞苷、1-甲基-1-去氮-假异胞苷、折布拉林(zebularine)、5-氮杂-折布拉林、5-甲基-折布拉林、5-氮杂-2-硫代-折布拉林、2-硫代-折布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷和4-甲氧基-1-甲基-假异胞苷。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:2-氨基嘌呤、2,6-二氨基嘌呤、7-去氮-腺嘌呤、7-去氮-8-氮杂-腺嘌呤、7-去氮-2-氨基嘌呤、7-去氮-8-氮杂-2-氨基嘌呤、7-去氮-2,6-二氨基嘌呤、7-去氮-8-氮杂-2,6-二氨基嘌呤、1-甲基腺苷、N6-甲基腺苷、N6-异戊烯基腺苷、N6-(顺式-羟基异戊烯基)腺苷、2-甲基硫代-N6-(顺式-羟基异戊烯基)腺苷、N6-甘氨酰氨甲酰基腺苷、N6-苏氨酰氨甲酰基腺苷、2-甲基硫代-N6-苏氨酰氨甲酰基腺苷、N6,N6-二甲基腺苷、7-甲基腺嘌呤、2-甲基硫代-腺嘌呤和2-甲氧基-腺嘌呤。在一些实施例中,mRNA包含至少一种选自下组的核苷,该组由以下组成:肌苷、1-甲基-肌苷、怀俄苷、怀丁苷、7-去氮-鸟苷、7-去氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-去氮-鸟苷、6-硫代-7-去氮-8-氮杂-鸟苷、7-甲基-鸟苷、6-硫代-7-甲基-鸟苷、7-甲基肌苷、6-甲氧基-鸟苷、1-甲基鸟苷、N2-甲基鸟苷、N2,N2-二甲基鸟苷、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷、和N2,N2-二甲基-6-硫代-鸟苷。
序列沿着分子的整个长度可以被或者可以不被均一地修饰。例如,一种或多种或所有类型的核苷酸(例如,天然存在的核苷酸嘌呤或嘧啶,或者A、G、U、C、I、pU中的任一种或多种或所有)可或可不在序列中或其给定的预定序列区域中被均匀修饰。在一些实施例中,序列包括假尿苷。在一些实施例中,序列包括肌苷,该肌苷可以帮助免疫系统将序列相对于病毒RNA表征为内源性。肌苷的掺入还可以介导改善的RNA稳定性/减少降解。参见例如,Yu,Z.等人(2015)RNA editing by ADAR1 marks dsRNA as“self”[ADAR1进行的RNA编辑将dsRNA标记为“自我”].Cell Res[细胞研究].25,1283-1284,将该文献通过援引以其全文并入。
Cas12i多肽
在一些实施例中,本发明的组合物包含如PCT/US 2019/022375中所述的Cas12i多肽。
在一些实施例中,本发明的组合物包括本文所述的Cas12i2多肽(例如,包含SEQID NO:2634和/或由SEQ ID NO:2633编码的多肽)。在一些实施例中,Cas12i2多肽包含至少一个RuvC结构域。
编码本文所述的Cas12i2多肽的核酸序列可以与参考核酸序列(例如SEQ ID NO:2633)基本上相同。在一些实施例中,Cas12i2多肽由核酸编码,该核酸包含与参考核酸序列(例如,SEQ ID NO:2633)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是核酸分子在温度和离子强度的严格条件下(例如,在中至高严格度的范围内)与另一核酸分子的互补序列杂交。参见例如,Tijssen,“Hybridization withNucleic Acid Probes.Part I.Theory and Nucleic Acid Preparation[与核酸探针杂交.第I部分.理论和核酸制备]”(Laboratory Techniques in Biochemistry andMolecular Biology[生物化学和分子生物学实验室技术],第24卷)。
在一些实施例中,Cas12i2多肽由核酸序列编码,该核酸序列与参考核酸序列(例如,SEQ ID NO:2633)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或更高的序列同一性,但不具有100%的序列同一性。
在一些实施例中,本发明的Cas12i2多肽包含与SEQ ID NO:2634具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i2多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:2634的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i2多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:2634的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,Cas12i2多肽包含具有SEQ ID NO:2641、SEQ ID NO:2642、SEQID NO:2643、SEQ ID NO:2644、或SEQ ID NO:2645的序列的多肽。
在一些实施例中,本发明的Cas12i2多肽包含与SEQ ID NO:2641、SEQ ID NO:2642、SEQ ID NO:2643、SEQ ID NO:2644、或SEQ ID NO:2645具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。在一些实施例中,与SEQ ID NO:2641、SEQ ID NO:2642、SEQ ID NO:2643、SEQ ID NO:2644、或SEQ ID NO:2645具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的Cas12i2多肽保持将该多肽与其相应的亲本/参考序列区分开的氨基酸变化(或这些变化中的至少1、2、3个等)。
在一些实施例中,本发明描述了Cas12i2多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:2641、SEQ ID NO:2642、SEQ ID NO:2643、SEQ ID NO:2644、或SEQ ID NO:2645的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i2多肽,该Cas12i2多肽具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:2641、SEQID NO:2642、SEQ ID NO:2643、SEQ ID NO:2644、或SEQ ID NO:2645的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,本发明的组合物包括本文所述的Cas12i4多肽(例如,包含SEQID NO:2647和/或由SEQ ID NO:2646编码的多肽)。在一些实施例中,Cas12i4多肽包含至少一个RuvC结构域。
编码本文所述的Cas12i4多肽的核酸序列可以与参考核酸序列(例如SEQ ID NO:2646)基本上相同。在一些实施例中,Cas12i4多肽由核酸编码,该核酸包含与参考核酸序列(例如,SEQ ID NO:2646)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约99.5%序列同一性的序列。可以通过检查两个最佳比对的核酸序列或通过使用软件程序或算法(例如,BLAST、ALIGN、CLUSTAL)使用标准参数人工确定两个此类核酸之间的同一性百分比。两个核酸序列基本上相同的一个指示是核酸分子在温度和离子强度的严格条件下(例如,在中至高严格度的范围内)与另一核酸分子的互补序列杂交。
在一些实施例中,Cas12i4多肽由核酸序列编码,该核酸序列与参考核酸序列(例如,SEQ ID NO:2646)具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或更高的序列同一性,但不具有100%的序列同一性。
在一些实施例中,本发明的Cas12i4多肽包含与SEQ ID NO:2647具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i4多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:2647的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i4多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:2647的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,Cas12i4多肽包含具有SEQ ID NO:2648或SEQ ID NO:2649的序列的多肽。
在一些实施例中,本发明的Cas12i4多肽包含与SEQ ID NO:2648或SEQ ID NO:2649具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。在一些实施例中,与SEQ ID NO:2648或SEQ ID NO:2649具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的Cas12i4多肽保持将该多肽与其相应的亲本/参考序列区分开的氨基酸变化(或这些变化中的至少1、2、3个等)。
在一些实施例中,本发明描述了Cas12i4多肽,该Cas12i4多肽与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:2648或SEQ ID NO:2649的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i4多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:2648或SEQ ID NO:2649的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,本发明的组合物包括本文所述的Cas12i1多肽(例如,包含SEQID NO:2650的多肽)。在一些实施例中,Cas12i4多肽包含至少一个RuvC结构域。
在一些实施例中,本发明的Cas12i1多肽包含与SEQ ID NO:2650具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i1多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:2650的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i1多肽,该Cas12i1多肽具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:2650的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
在一些实施例中,本发明的组合物包括本文所述的Cas12i3多肽(例如,包含SEQID NO:2651的多肽)。在一些实施例中,Cas12i4多肽包含至少一个RuvC结构域。
在一些实施例中,本发明的Cas12i3多肽包含与SEQ ID NO:2651具有至少50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性的多肽序列。
在一些实施例中,本发明描述了Cas12i3多肽,其与一个或多个参考多肽具有指定程度的氨基酸序列同一性,例如,与SEQ ID NO:2651的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%,至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%但不是100%的序列同一性。同源性或同一性可以例如使用如本文所述的程序(诸如BLAST、ALIGN或CLUSTAL)通过氨基酸序列比对来确定。
还提供了本发明的Cas12i3多肽,其具有酶活性(例如,核酸酶或内切核酸酶活性),并且当使用任何先前描述的比对方法比对时,包含与SEQ ID NO:2651的氨基酸序列差异50、40、35、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1、或0个氨基酸残基的氨基酸序列。
尽管本文所述的变化可以是一个或多个氨基酸的变化,但Cas12i多肽的变化也可以是实质性的,例如作为氨基和/或羧基末端延伸的多肽融合。例如,Cas12i多肽可以含有额外的肽,例如,一个或多个肽。另外的肽的实例可包括用于标记的表位肽,诸如多组氨酸标签(His标签)、Myc和FLAG。在一些实施例中,本文所述的Cas12i多肽可以融合到可检测部分,诸如荧光蛋白(例如,绿色荧光蛋白(GFP)或黄色荧光蛋白(YFP))。
在一些实施例中,Cas12i多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)核定位信号(NLS)。在一些实施例中,Cas12i多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多个)核输出信号(NES)。在一些实施例中,Cas12i多肽包含至少一个(例如,两个、三个、四个、五个、六个或更多)NLS和至少一个(例如,两个、三个、四个、五个、六个或更多个)NES。
在一些实施例中,本文所述的Cas12i多肽可以是自我灭活的。参见Epstein等人,“Engineering a Self-Inactivating CRISPR System for AAV Vectors[工程化用于AAV载体的自我灭活的CRISPR系统],”Mol.Ther.[分子疗法],24(2016):S50,将该文献通过援引以其全文并入。
在一些实施例中,编码本文所述的Cas12i多肽的核苷酸序列可以经密码子优化以用于特定的宿主细胞或生物。例如,核酸可以经密码子优化以用于任何非人真核生物,包括小鼠、大鼠、兔、狗、家畜或非人灵长类动物。密码子使用表是易于获得的,例如在www.kazusa.orjp/codon/上可获得的“密码子使用数据库(Codon Usage Database)”中,并且这些表可以按多种方式进行改编。参见Nakamura等人Nucl.Acids Res.[核酸研究]28:292(2000),将其通过援引以其全文并入本文。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可获得的,诸如基因制造(Gene Forge)(Aptagen公司;宾夕法尼亚州雅各布斯(Jacobus,PA))。
靶序列
在一些实施例中,靶序列在BCL11A基因或BCL11A基因的基因座内。在一些实施例中,BCL11A基因是哺乳动物基因。在一些实施例中,BCL11A基因是人类基因。例如,在一些实施例中,靶序列在SEQ ID NO:2635或其反向互补序列内。在一些实施例中,靶序列在SEQ IDNO:2635(或其反向互补序列)阐述的BCL11A基因的外显子或增强子区内,例如,在SEQ IDNO:2636、2637、2638、2639、或2640的序列(或其反向互补序列)内。表5列出了SEQ ID NO:2635的BCL11A基因外显子或增强子区内的靶序列(及其反向互补序列)。在一些实施例中,靶序列在SEQ ID NO:2635(或其反向互补序列)阐述的BCL11A基因的内含子内。在一些实施例中,靶序列在SEQ ID NO:2635阐述的BCL11A基因序列或其反向互补序列的变体(例如,多态性变体)内。在一些实施例中,BCL11A基因序列是在SEQ ID NO:2635阐述的序列或其反向互补序列的同源物。例如,在一些实施例中,BCL11A基因序列是非人BCL11A序列。
在一些实施例中,靶序列与5'-NTTN-3'PAM序列相邻,其中N是任何核苷酸。5'-NTTN-3'序列可以紧邻靶序列,或者例如在靶序列的少量(例如,1、2、3、4、或5个)核苷酸内。在一些实施例中,5'-NTTN-3'序列是5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR’3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’,其中Y是C或T,B是除A之外的任何核苷酸,D是除C之外的任何核苷酸,并且R是A或G。在一些实施例中,5'-NTTN-3'序列是5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。
在一些实施例中,靶序列是单链的(例如,单链DNA)。在一些实施例中,靶序列是双链的(例如,双链DNA)。在一些实施例中,靶序列包含单链区和双链区两者。在一些实施例中,靶序列是线性的。在一些实施例中,靶序列是环状的。在一些实施例中,靶序列包含一个或多个经修饰的核苷酸,如甲基化的核苷酸、受损的核苷酸、或核苷酸类似物。在一些实施例中,靶序列未经修饰。在一些实施例中,RNA指导物与双链靶序列的第一链(例如,靶链或间隔子互补链)结合,并且5'-NTTN-3'PAM序列存在于第二互补链(例如,非靶链或非间隔子互补链)。在一些实施例中,RNA指导物在靶链(例如,间隔子互补链)上的5'-NAAN-3'序列附近结合。
在一些实施例中,靶序列存在于细胞中。在一些实施例中,靶序列存在于细胞核中。在一些实施例中,靶序列对细胞是内源的。在一些实施例中,靶序列是基因组DNA。在一些实施例中,靶序列是染色体DNA。在一些实施例中,靶序列是编码蛋白质的基因或其功能区如编码区、或调节元件,如启动子、增强子、5'或3'非翻译区等。在一些在实施例中,靶序列是质粒。
在一些实施例中,靶序列存在于靶序列的易于接近的区域中。在一些实施例中,靶序列是靶基因的外显子。在一些实施例中,靶序列跨靶基因的外显子-内含子接点。在一些实施例中,靶序列存在于非编码区(如基因的调节区)中。在一些实施例中,其中靶序列对细胞是外源的,靶序列包含在细胞的基因组中未发现的序列。
在一些实施例中,靶序列对于细胞是外源的。在一些实施例中,靶序列是水平转移的质粒。在一些实施例中,靶序列整合在细胞的基因组中。在一些实施例中,靶序列不整合在细胞的基因组中。在一些实施例中,靶序列是细胞中的质粒。在一些实施例中,靶序列存在于染色体外阵列中。
在一些实施例中,靶序列是分离的核酸,诸如分离的DNA或分离的RNA。在一些实施例中,靶序列存在于无细胞环境中。在一些实施例中,靶序列是分离的载体,诸如质粒。在一些实施例中,靶序列是超纯质粒。
靶序列是与RNA指导物杂交的BCL11A基因的基因座。在一些实施例中,细胞仅具有靶序列的一个拷贝。在一些实施例中,细胞具有靶序列的多于一个拷贝,如至少约2、3、4、5、10、100或更多个拷贝中的任一个。
在一些实施例中,选择BCL11A靶序列以由Cas12i多肽和RNA指导物使用以下标准中的一项或多项进行编辑。首先,在一些实施例中,选择靠近BCL11A编码序列的5'端的靶序列。例如,在一些实施例中,RNA指导物被设计成靶向外显子1(SEQ ID NO:2636)、外显子2(SEQ ID NO:2637)或增强子区(SEQ ID NO:2640)中的序列。其次,在一些实施例中,选择与5'-CTTY-3'PAM序列相邻的靶序列。例如,在一些实施例中,RNA指导物被设计成靶向与5'-CTTT-3'或5'-CTTC-3'序列相邻的序列。第三,在一些实施例中,选择与其他基因组序列具有低序列相似性的靶序列。例如,对于每个靶序列,通过搜索与PAM序列相邻的其他基因组序列并计算靶序列与PAM相邻序列之间的莱文斯坦距离来鉴定潜在非靶位点。莱文斯坦距离(例如,编辑距离)对应于将一个序列改变为另一个序列(例如,将潜在非靶基因座的序列改变为在靶基因座的序列)所需的编辑(例如,插入、缺失或取代)的最小次数。按照此分析,RNA指导物是为靶序列设计的,这些靶序列不具有Levenshtein距离为0或1的潜在脱靶序列。
生产
本发明包括用于产生RNA指导物的方法、用于产生Cas12i多肽的方法以及用于复合RNA指导物和Cas12i多肽的方法。
RNA指导物
在一些实施例中,RNA指导物是通过DNA模板的体外转录制成的。因此,例如,在一些实施例中,通过使用上游启动子序列(例如,T7聚合酶启动子序列)在体外转录编码RNA指导物的DNA模板来产生RNA指导物。在一些实施例中,DNA模板编码多个RNA指导物,或者体外转录反应包括多个不同的DNA模板,每个DNA模板编码不同的RNA指导物。在一些实施例中,使用化学合成方法制备RNA指导物。在一些实施例中,通过在用包括编码RNA指导物的序列的质粒转染的细胞中表达RNA指导物序列来制备RNA指导物。在一些实施例中,质粒编码多个不同的RNA指导物。在一些实施例中,将各自编码不同的RNA指导物的多个不同的质粒转染到细胞中。在一些实施例中,从编码RNA指导物并且还编码Cas12i多肽的质粒表达该RNA指导物。在一些实施例中,从表达RNA指导物但不表达Cas12i多肽的质粒表达该RNA指导物。在一些实施例中,RNA指导物从商业供应商购买。在一些实施例中,使用一个或多个经修饰的核苷酸(例如,如上所述)合成RNA指导物。
Cas12i多肽
在一些实施例中,本发明的Cas12i多肽可以通过以下制备:(a)培养产生本发明的Cas12i多肽的细菌,分离该Cas12i多肽,任选地纯化该Cas12i多肽,并将该Cas12i多肽与RNA指导物复合。Cas12i多肽还可以通过(b)已知的基因工程技术来制备,具体地,通过以下过程制备:从细菌中分离编码本发明的Cas12i多肽的基因,构建重组表达载体,然后将该载体转移到表达RNA指导物的合适宿主细胞中以在宿主细胞中表达与RNA指导物复合的重组蛋白。替代性地,Cas12i多肽可以通过(c)体外偶联的转录-翻译系统然后与RNA指导物复合来制备。
在一些实施例中,宿主细胞用于表达Cas12i多肽。宿主细胞没有特别限制,并且可以优选地使用各种已知的细胞。宿主细胞的具体实例包括细菌,诸如大肠杆菌、酵母(芽殖酵母酿酒酵母(Saccharomyces cerevisiae)和裂殖酵母粟酒裂殖酵母(Schizosaccharomyces pombe))、线虫(秀丽隐杆线虫(Caenorhabditis elegans))、爪蟾(Xenopus laevis)卵母细胞和动物细胞(例如,CHO细胞、COS细胞和HEK293细胞)。用于将上述表达载体转移到宿主细胞中的方法(即转化法)没有特别限制,并且可以使用已知的方法,诸如电穿孔、磷酸钙法、脂质体法和DEAE葡聚糖法。
在用表达载体转化宿主后,可以培养、培育或繁殖宿主细胞以产生Cas12i多肽。在Cas12i多肽表达后,可以根据常规方法(例如,过滤、离心、细胞破坏、凝胶过滤色谱、离子交换色谱等)收集宿主细胞并从培养物中纯化Cas12i多肽等。
在一些实施例中,用于Cas12i多肽表达的方法包括翻译该Cas12i多肽的至少5个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸、至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸、至少250个氨基酸、至少300个氨基酸、至少400个氨基酸、至少500个氨基酸、至少600个氨基酸、至少700个氨基酸、至少800个氨基酸、至少900个氨基酸、或至少1000个氨基酸。在一些实施例中,用于蛋白质表达的方法包括翻译Cas12i多肽的约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约50个氨基酸、约100个氨基酸、约150个氨基酸、约200个氨基酸、约250个氨基酸、约300个氨基酸、约400个氨基酸、约500个氨基酸、约600个氨基酸、约700个氨基酸、约800个氨基酸、约900个氨基酸、约1000个氨基酸或更多。
多种方法可以用于确定宿主细胞中成熟Cas12i多肽的产生水平。此类方法包括但不限于例如利用对Cas12i多肽具有特异性的多克隆或单克隆抗体或如本文别处所述的标记标签的方法。示例性方法包括但不限于酶联免疫吸附测定(ELISA)、放射免疫测定(MA)、荧光免疫测定(FIA)和荧光激活细胞分选(FACS)。这些和其他测定是本领域熟知的(参见例如Maddox等人,J.Exp.Med.[实验医学杂志]158:1211[1983])。
本披露内容提供了在细胞中体内表达Cas12i多肽的方法,这些方法包括向宿主细胞提供编码该Cas12i多肽的多核糖核苷酸(其中该多核糖核苷酸编码该Cas12i多肽);在该细胞中表达该Cas12i多肽;以及从该细胞中获得该Cas12i多肽。
复合
在一些实施例中,靶向BCL11A的RNA指导物与Cas12i多肽复合以形成核糖核蛋白。在一些实施例中,RNA指导物和Cas12i多肽的复合发生在低于约以下中任一个的温度下:20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、50℃、或55℃。在一些实施例中,在约37C下在至少约以下中的任一个的孵育时间段内,RNA指导物不会从Cas12i多肽解离:10min、15min、20min、25min、30min、35min、40min、45min、50min、55min、1hr、2hr、3hr、4hr、或更多个小时。
在一些实施例中,RNA指导物和Cas12i多肽在复合缓冲液中复合。在一些实施例中,将Cas12i多肽储存在被复合缓冲液替代的缓冲液中以与RNA指导物形成复合物。在一些实施例中,将Cas12i多肽储存在复合缓冲液中。
在一些实施例中,复合缓冲液的pH范围为约7.3至8.6。在一个实施例中,复合缓冲液的pH为约7.3。在一个实施例中,复合缓冲液的pH为约7.4。在一个实施例中,复合缓冲液的pH为约7.5。在一个实施例中,复合缓冲液的pH为约7.6。在一个实施例中,复合缓冲液的pH为约7.7。在一个实施例中,复合缓冲液的pH为约7.8。在一个实施例中,复合缓冲液的pH为约7.9。在一个实施例中,复合缓冲液的pH为约8.0。在一个实施例中,复合缓冲液的pH为约8.1。在一个实施例中,复合缓冲液的pH为约8.2。在一个实施例中,复合缓冲液的pH为约8.3。在一个实施例中,复合缓冲液的pH为约8.4。在一个实施例中,复合缓冲液的pH为约8.5。在一个实施例中,复合缓冲液的pH为约8.6。
在一些实施例中,在如本文所述纯化之前,可以使Cas12i多肽在宿主细胞中过表达并与RNA指导物复合。在一些实施例中,编码Cas12i多肽的mRNA或DNA被引入细胞中,使得Cas12i多肽在细胞中表达。在一些实施例中,RNA指导物也从单个mRNA或DNA构建体同时、分别或依次引入细胞,使得核糖核蛋白复合物在细胞中形成。
递送
可将本文所述的组合物或复合物配制成例如包括载剂(诸如载剂和/或聚合物载剂,例如脂质体),并且通过已知方法递送到细胞(例如,原核细胞、真核细胞、植物细胞、哺乳动物细胞等)。此类方法包括但不限于转染(例如,脂质介导、阳离子聚合物、磷酸钙、树枝状大分子);电穿孔或其他破坏膜的方法(例如,核转染)、病毒递送(例如,慢病毒、逆转录病毒、腺病毒、AAV)、显微注射、微粒轰击(“基因枪”)、fugene、直接声波加载、细胞挤压、光转染、原生质体融合、刺穿感染、磁转染、外来体介导的转移、脂质纳米颗粒介导的转移以及它们的任何组合。
在一些实施例中,该方法包括将一种或多种核酸(例如,编码Cas12i多肽、RNA指导物、供体DNA等的核酸)、其一种或多种转录物、和/或预形成的RNA指导物/Cas12i多肽复合物递送至细胞,在该细胞中形成三元复合物。示例性细胞内递送方法包括但不限于:病毒或病毒样药剂;基于化学的转染方法,诸如使用磷酸钙、树枝状大分子、脂质体或阳离子聚合物(例如,DEAE-葡聚糖或聚乙烯亚胺)的转染方法;非化学方法,诸如显微注射、电穿孔、细胞挤压、声孔效应、光转染、刺穿感染、原生质体融合、细菌缀合、质粒或转座子的递送;基于粒子的方法,诸如使用基因枪、磁转染或磁辅助转染、粒子轰击;以及混合方法,诸如核转染。在一些实施例中,本申请进一步提供了通过此类方法产生的细胞,以及包含此类细胞的或由此类细胞产生的生物体(例如,动物、植物或真菌)。
在一些实施例中,将Cas12i组分和RNA指导物组分一起递送。例如,在一些实施例中,将Cas12i组分和RNA指导物组分一起包装在单个AAV颗粒中。在另一个实例中,在一些实施例中,将Cas12i组分和RNA指导物组分经由脂质纳米颗粒(LNP)一起递送。在一些实施例中,将Cas12i组分和RNA指导物组分分开递送。例如,在一些实施例中,将Cas12i组分和RNA指导物组分包装在分开的AAV颗粒中。在另一个例子中,在一些实施例中,将Cas12i组分通过第一递送机制递送,并将RNA指导物组分通过第二递送机制递送。
细胞
可将本文所述的组合物或复合物递送到多种细胞。在一些实施例中,细胞是分离的细胞。在一些实施例中,细胞在细胞培养物中或在两种或更多种细胞类型的共培养物中。在一些实施例中,细胞是离体的。在一些实施例中,细胞获自活的生物并维持在细胞培养物中。在一些实施例中,细胞是单细胞生物体。
在一些实施例中,细胞是原核细胞。在一些实施例中,细胞是细菌细胞或来源于细菌细胞。在一些实施例中,细胞是古细菌细胞或来源于古细菌细胞。
在一些实施例中,细胞是真核细胞。在一些实施例中,细胞是植物细胞或来源于植物细胞。在一些实施例中,细胞是真菌细胞或来源于真菌细胞。在一些实施例中,细胞是动物细胞或来源于动物细胞。在一些实施例中,细胞是无脊椎动物细胞或来源于无脊椎动物细胞。在一些实施例中,细胞是脊椎动物细胞或来源于脊椎动物细胞。在一些实施例中,细胞是哺乳动物细胞或来源于哺乳动物细胞。在一些实施例中,细胞是人细胞。在一些实施例中,细胞是斑马鱼细胞。在一些实施例中,细胞是啮齿动物细胞。在一些实施例中,细胞是合成制成的,有时称为人工细胞。
在一些实施例中,细胞来源于细胞系。用于组织培养的多种多样的细胞系是本领域已知的。细胞系的实例包括但不限于293T、MF7、K562、HeLa、CHO、及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(例如,参见美国典型培养物保藏中心(ATCC)(弗吉尼亚州马纳萨斯(Manassas,Va.)))。在一些实施例中,细胞是永生或永生化细胞。
在一些实施例中,细胞是原代细胞。在一些实施例中,细胞是干细胞,例如全能干细胞(例如,全能的)、多能干细胞、专能干细胞、寡能干细胞或单能干细胞。在一些实施例中,细胞是诱导性多能干细胞(iPSC)或来源于iPSC。在一些实施例中,细胞是分化细胞。例如,在一些实施例中,分化细胞是肌肉细胞(例如,肌细胞)、脂肪细胞(例如,脂细胞)、骨的细胞(例如,成骨细胞、骨细胞、破骨细胞)、血细胞(例如,单核细胞、淋巴细胞、中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞、巨噬细胞、红细胞或血小板)、神经细胞(例如,神经元)、上皮细胞、免疫细胞(例如,淋巴细胞、嗜中性粒细胞、单核细胞或巨噬细胞)、肝脏细胞(例如肝细胞)、成纤维细胞或性细胞。在一些实施例中,细胞是终末分化细胞。例如,在一些实施例中,终末分化细胞是神经元细胞、脂肪细胞、心肌细胞、骨骼肌细胞、表皮细胞或肠细胞。在一些实施例中,细胞是免疫细胞。在一些实施例中,免疫细胞是T细胞。在一些实施例中,免疫细胞是B细胞。在一些实施例中,免疫细胞是自然杀伤(NK)细胞。在一些实施例中,免疫细胞是肿瘤浸润淋巴细胞(TIL)。在一些实施例中,细胞是哺乳动物细胞,例如人细胞或鼠细胞。在一些实施例中,鼠细胞来源于野生型小鼠、免疫抑制小鼠或疾病特异性小鼠模型。在一些实施例中,细胞是活组织、器官、或生物内的细胞。
方法
本披露还提供了修饰BCL11A基因内的靶序列的方法。在一些实施例中,该方法包括将靶向BCL11A的RNA指导物和Cas12i多肽引入细胞中。可以将靶向BCL11A的RNA指导物和Cas12i多肽作为核糖核蛋白复合物引入细胞中。可以将靶向BCL11A的RNA指导物和Cas12i多肽引入到核酸载体上。可以将Cas12i多肽作为mRNA引入。可以将RNA指导物直接引入细胞中。
在一些实施例中,BCL11A基因的序列在SEQ ID NO:2635或其反向互补序列中列出。在一些实施例中,靶序列位于BCL11A基因的外显子中,例如具有SEQ ID NO:2636、SEQID NO:2637、SEQ ID NO:2638或SEQ ID NO:2639中任一个中所示序列的外显子或其反向互补序列,或位于BCL11A基因的增强子区中,例如具有SEQ ID NO:2640中所示序列的增强子区或其反向互补序列。在一些实施例中,靶序列位于BCL11A基因的内含子中(例如,SEQ IDNO:2635或其反向互补序列中所示序列的内含子)。在其他实施例中,BCL11A基因的序列是SEQ ID NO:2635中所示序列的变体(或其反向互补序列)或SEQ ID NO:2635中所示序列的同源序列(或其反向互补序列)。例如,在一些实施例中,靶序列是SEQ ID NO:2635(或其反向互补序列)中所示的BCL11A序列的多态变体或BCL11A基因的非人形式。
在一些实施例中,如本文披露的RNA指导物被设计成与靶序列互补,该靶序列与5'-NTTN-3'PAM序列相邻。5'-NTTN-3'序列可以紧邻靶序列,或者例如在靶序列的少量(例如,1、2、3、4、或5个)核苷酸内。在一些实施例中,5'-NTTN-3'序列是5’-NTTY-3’、5’-NTTC-3’、5’-NTTT-3’、5’-NTTA-3’、5’-NTTB-3’、5’-NTTG-3’、5’-CTTY-3’、5’-DTTR’3’、5’-CTTR-3’、5’-DTTT-3’、5’-ATTN-3’、或5’-GTTN-3’,其中Y是C或T,B是除A之外的任何核苷酸,D是除C之外的任何核苷酸,并且R是A或G。在一些实施例中,5'-NTTN-3'序列是5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,RNA指导物被设计成与双链靶序列的第一链(例如,靶链或间隔子互补链)结合,并且5'-NTTN-3'PAM序列存在于第二互补链(例如,非靶链或非间隔子互补链)。在一些实施例中,RNA指导物在靶链(例如,间隔子互补链)上的5'-NAAN-3'序列附近结合。
在一些实施例中,Cas12i多肽具有酶活性(例如,核酸酶活性)。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA双链断裂。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA单链断裂。在一些实施例中,Cas12i多肽在细胞中诱导一个或多个DNA切口。在一些实施例中,DNA断裂和/或切口导致形成一个或多个插入缺失(例如,一个或多个缺失)。
在一些实施例中,本文披露的RNA指导物与Cas12i多肽形成复合物并将该Cas12i多肽引导至与5'-NTTN-3'序列相邻的靶序列。在一些实施例中,该复合物诱导与5'-NTTN-3'序列相邻的缺失(例如,核苷酸缺失或DNA缺失)。在一些实施例中,该复合物诱导与以下序列相邻的缺失:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,该复合物诱导与富含T/C的序列相邻的缺失。
在一些实施例中,缺失在5'-NTTN-3'序列的下游。在一些实施例中,缺失在以下序列的下游:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游。
在一些实施例中,缺失改变BCL11A基因的表达。在一些实施例中,缺失改变BCL11A基因的功能。在一些实施例中,缺失使BCL11A基因失活。在一些实施例中,缺失是移码缺失。在一些实施例中,缺失是非移码缺失。在一些实施例中,缺失导致细胞毒性或细胞死亡(例如,凋亡)。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失始于以下序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始。
在一些实施例中,缺失在5'-NTTN-3'序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失终于以下序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始,并且在该序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约15个核苷酸(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内,并且终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内,并且终于该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-NTTN-3′序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失在富含T/C的序列的约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在5'-NTTN-3′序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11、或12个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约5至约10个核苷酸(例如,约3、4、5、6、7、8、9、10、11或12个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约20至约30个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27、或28个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约20至约25个核苷酸(例如,约17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内,并且终于以下序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失在5'-NTTN-3'序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在5'-NTTN-3'序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。在一些实施例中,缺失始于以下序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16、或17个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’,并且终于以下序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32、或33个核苷酸)内:5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’、或5’-CTTC-3’。在一些实施例中,缺失在富含T/C的序列的下游约10至约15个核苷酸(例如,约8、9、10、11、12、13、14、15、16或17个核苷酸)内开始,并且在该序列的下游约25至约30个核苷酸(例如,约22、23、24、25、26、27、28、29、30、31、32或33个核苷酸)内结束。
在一些实施例中,缺失的长度多达约50个核苷酸(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸)。在一些实施例中,缺失的长度多达约40个核苷酸(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些实施例中,缺失的长度介于约4个核苷酸与约40个核苷酸之间(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45个核苷酸)。在一些实施例中,缺失的长度介于约4个核苷酸与约25个核苷酸之间(例如,约3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)。在一些实施例中,缺失的长度介于约10个核苷酸与约25个核苷酸之间(例如,约7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸)。在一些实施例中,缺失的长度介于约10个核苷酸与约15个核苷酸之间(例如,约7、8、9、10、11、12、13、14、15、16或17个核苷酸)。
在一些实施例中,本文所述的方法用于工程化在BCL11A基因中包含如本文所述的缺失的细胞。
本文披露的组合物、载体、核酸、RNA指导物和细胞可用于疗法中。本文披露的组合物、载体、核酸、RNA指导物和细胞可用于治疗受试者的疾病或病症的方法中。本领域已知的任何合适的递送或施用方法可用于递送本文披露的组合物、载体、核酸、RNA指导物和细胞。这样的方法可以涉及使靶序列与本文披露的组合物、载体、核酸或RNA指导物接触。这样的方法可以涉及编辑如本文披露的BCL11A序列的方法。在一些实施例中,使用本文披露的RNA指导物工程化的细胞用于离体基因疗法。在一些实施例中,本文披露的组合物、载体、核酸、RNA指导物和细胞用于治疗镰状细胞性贫血。在一些实施例中,本文披露的组合物、载体、核酸、RNA指导物和细胞用于治疗β-地中海贫血。在一些实施例中,其中一个或多个RNA指导物靶向BCL11A的增强子区(SEQ ID NO:2640),一个或多个RNA指导物用于治疗镰状细胞性贫血或β-地中海贫血。
试剂盒
本发明还提供了可以用于例如实施本文所述的方法的试剂盒或系统。在一些实施例中,试剂盒或系统包括RNA指导物和Cas12i多肽。在一些实施例中,试剂盒或系统包括编码这种Cas12i多肽的多核苷酸,并且任选地,该多核苷酸被包含在例如如本文所述的载体内。在一些实施例中,试剂盒或系统包括编码本文披露的RNA指导物的多核苷酸。可以将Cas12i多肽和RNA指导物(例如,作为核糖核蛋白)包装在试剂盒或系统内的相同容器或其他容器内,或者可以包装在内容物可以在使用前混合的分开的小瓶或其他容器中。任选地,试剂盒或系统还可以额外地包括缓冲液和/或RNA指导物和Cas12i多肽的使用说明。
本文引用的所有参考文献和出版物特此通过援引并入。
实例
提供以下实例以进一步说明本发明的一些实施例但并非旨在限制本发明的范围;通过它们的示例性性质将理解,可替代性地使用本领域技术人员已知的其他程序、方法或技术。
实例1–哺乳动物细胞中的BCL11A的编辑
本实例描述了使用变体Cas12i2生成经修饰的CD34+造血干细胞/祖细胞(HSPC)。对于这项研究,用BCL11A内含子红系增强子靶向性RNP转染人原代CD34+HSPC,RNP包含SEQID NO:2642的变体Cas12i2和RNA指导物。在BCL11A内含子红系增强子靶标处,通过FACS染色和插入缺失评估来分析经修饰的CD34+HSPC。
解冻每个细胞批次的两个冷冻人骨髓CD34+细胞小瓶(第0天),洗涤并使用细胞计数器通过吖啶橙/碘化丙锭(AO/PI)染色来评估细胞数量和活力。将CD34+细胞在含有适当补充剂的无血清扩增培养基(来自干细胞技术公司(StemCell Technologies))中培养约48小时。
RNP络合反应:通过将SEQ ID NO:2642(400μM)的纯化的变体Cas12i2与不同的RNA指导物(在250mM NaCl中1mM)以1:1Cas12i2效应子:RNA指导物体积比(对应于2.5:1RNA指导物:Cas12i2效应子摩尔比)混合,制备变体Cas12i2 RNP复合物。通过将纯化的SpCas9(62μM)与单指导RNA(sgRNA)(水中1mM)以6.45:1SpCas9效应子:sgRNA体积比(对应于2.5:1sgRNA:SpCas9效应子摩尔比)混合,制备SpCas9 RNP复合物。SpCas9蛋白购自Aldevron公司。RNA指导物和sgRNA的序列显示在表6中。
表6.用于RNP复合物的BCL11A内含子红系增强子靶向性RNA指导物(用于变体Cas12i2)和sgRNA(用于SpCas9)的序列
*-硫代磷酸化
m-2’O-甲基
对于只有效应子的对照,分别以与RNA指导物或sgRNA相同的体积比将变体Cas12i2或SpCas9与蛋白质储存缓冲液(25mM Tris(pH7.5)、250mM NaCl、1mM TCEP、50%甘油)混合。将复合物在37℃下孵育30-60分钟。孵育后,将RNP稀释至18.75μM、50μM、100μM或160μM效应子浓度(对于变体Cas12i2)和18.75μM或50μM(对于SpCas9)。对于多重化,在电穿孔之前将单独的RNP混合在一起。
在第2天,收集和计数了约1e5个细胞/电穿孔反应,外加20%的另外细胞。细胞用PBS清洗一次,然后重悬于缓冲液+补充剂(来自Lonza#VXP-3032)+1mM转染增强剂寡核苷酸(使P3缓冲液中的浓度达到4.28μM)。重悬的细胞的浓度约为5,555个细胞/μL。
将18μL重悬的细胞(约1e5个细胞)与2μL的单个或多重化的RNP复合物混合,使变体Cas12i2 RNP的最终浓度达到1.875μM、5μM、10μM或16μM。SpCas9 RNP的最终浓度为1.875μM或5μM。设置以下对照:仅未电穿孔的细胞,仅在蛋白质储存缓冲液中的细胞。使用电穿孔装置对板进行电穿孔,不包括未电穿孔条件。将每个电穿孔反应转移到含有预热无血清培养基和适当补充剂的24孔培养板孔中。将培养物在37摄氏度、5% CO2下培养3天。
在电穿孔后24、48和72小时收集来自每个测试条件的一部分细胞样品(约20μL)。在细胞计数器上使用AO/PI染色评估活力。
第3天,从活力测试后剩余的细胞制备细胞沉淀。从每个样品中收集约5e4个细胞并转移到微量离心管中。细胞以1500rpm沉淀5分钟。去除上清液并将沉淀物冷冻在-80℃下。
对于基因组DNA提取,将沉淀解冻至室温并重悬于适当体积的DNA提取缓冲液(来自鲁西基公司(Lucigen))中,得到1000个细胞/μL的最终浓度。然后将样品在PCR机器中在65℃下循环15分钟,在68℃下循环15分钟,在98℃下循环10分钟。然后将样品冷冻在-20℃下。
通过多轮PCR制备用于下一代测序(NGS)的样品。第一轮(PCR I)用于扩增靶位点侧翼的基因组区域并添加NGS衔接子。第二轮(PCR II)用于添加NGS index。然后将反应液合并,通过柱纯化进行纯化,并在荧光计(量子比特公司(Qubit))上定量。使用300或150循环NGS仪器(NextSeq v2.5)中或高输出试剂盒完成测序运行,并在NGS仪器(NextSeq 550)上运行。
对于NGS分析,插入缺失映射功能使用样品的fastq文件、扩增子参考序列、和正向引物序列。对于每个读段,使用kmer扫描算法来计算读段与参考序列之间的编辑操作(匹配、错配、插入、缺失)。为了去除一些样品中存在的少量引物二聚体,每个读段的前30个核苷酸需要与参考匹配,并且超过一半的映射核苷酸为错配的读段也被滤除。通过这些过滤器的多达50,000个读段用于分析,并且如果读段含有插入或缺失,则将其计为插入缺失读数。将插入缺失%计算为含有插入缺失的读段数目除以分析的读段数目(通过过滤器的读段多达50,000个)。通过过滤器的最小读段数目的QC标准是10,000。通过在每个插入缺失中搜索TTATC(GATAA序列的反向互补序列,在正向链上)序列,针对GATAA基序序列的破坏进一步评估插入缺失。
图1和图2展示了本实例的结果。如图1所示,包含变体Cas12i2和RNA指导物的BCL11A内含子红系增强子靶向性RNP复合物导致原代CD34+HSPC中的插入缺失活性。数据显示,变体Cas12i2诱导的插入缺失的至少50%部分地或完全地破坏了BCL11A内含子红系增强子区的GATAA基序。
图2说明用BCL11A内含子红细胞增强子的变体Cas12i2编辑生成的经修饰的CD34+HSPC在用变体Cas12i2 RNP复合物处理原代CD34+HSPC后至少72小时是有活力的。
本实例表明,Cas12i2与测试的RNA指导物复合,具有稳健的插入缺失活性。靶向被靶向的BCL11A内含子红系增强子区的变体Cas12i2RNP用于生成经修饰的CD34+HSPC,并导致经修饰的细胞中至少约50%的GATAA基序部分地或完全地破坏。结果还表明,多于一个RNA指导物(例如,多重化的RNA指导物)可用于将插入缺失引入BCL11A。
Claims (92)
1.一种包含RNA指导物的组合物,其中该RNA指导物包含(i)与BCL11A基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列;其中该靶序列与包含序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻。
2.如权利要求1所述的组合物,其中该靶序列在该BCL11A基因的外显子1、外显子2、外显子3、外显子4或增强子区内。
3.如权利要求1或2所述的组合物,其中该BCL11A基因包含SEQ ID NO:2635的序列、SEQID NO:2635的反向互补序列、SEQ ID NO:2635的变体、或SEQ ID NO:2635的变体的反向互补序列。
4.如权利要求1至3中任一项所述的组合物,其中该间隔子序列包含:
a.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;
b.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;
c.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;
d.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;
e.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;
f.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;
g.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;
h.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;
i.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;
j.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;
k.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;
l.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;
m.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;
n.与SEQ ID NO:1322-1425和1427-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或
o.与SEQ ID NO:1322-1425和1427-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
5.如权利要求1至4中任一项所述的组合物,其中该间隔子序列包含:
a.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸16;
b.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸17;
c.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸18;
d.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸19;
e.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸20;
f.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸21;
g.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸22;
h.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸23;
i.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸24;
j.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸25;
k.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸26;
l.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸27;
m.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸28;
n.SEQ ID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸29;或
o.SEQ ID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸30。
6.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;
p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;
q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;
r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;
s.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;
t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;
u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;
v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;
w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;
x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;
y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;
z.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或
aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
7.如权利要求1至6中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;
o.SEQ ID NO:9的核苷酸1至核苷酸34;
p.SEQ ID NO:9的核苷酸2至核苷酸34;
q.SEQ ID NO:9的核苷酸3至核苷酸34;
r.SEQ ID NO:9的核苷酸4至核苷酸34;
s.SEQ ID NO:9的核苷酸5至核苷酸34;
t.SEQ ID NO:9的核苷酸6至核苷酸34;
u.SEQ ID NO:9的核苷酸7至核苷酸34;
v.SEQ ID NO:9的核苷酸8至核苷酸34;
w.SEQ ID NO:9的核苷酸9至核苷酸34;
x.SEQ ID NO:9的核苷酸10至核苷酸34;
y.SEQ ID NO:9的核苷酸11至核苷酸34;
z.SEQ ID NO:9的核苷酸12至核苷酸34;或
aa.SEQ ID NO:10或其一部分。
8.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:2670的序列或其一部分具有至少90%同一性的序列。
9.如权利要求1至5或8中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:2652-2669中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:2652-2669中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:2652-2669中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:2652-2669中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:2652-2669中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:2652-2669中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:2652-2669中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:2652-2669中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:2652-2669中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:2652-2669中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:2652-2669中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:2652-2669中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:2652-2669中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:2652-2669中任一个的核苷酸14至核苷酸36;或
o.SEQ ID NO:2670或其一部分。
10.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:2672或SEQ ID NO:2673的序列或其一部分具有至少90%同一性的序列。
11.如权利要求1至5或10中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:2671的核苷酸1至核苷酸36;
b.SEQ ID NO:2671的核苷酸2至核苷酸36;
c.SEQ ID NO:2671的核苷酸3至核苷酸36;
d.SEQ ID NO:2671的核苷酸4至核苷酸36;
e.SEQ ID NO:2671的核苷酸5至核苷酸36;
f.SEQ ID NO:2671的核苷酸6至核苷酸36;
g.SEQ ID NO:2671的核苷酸7至核苷酸36;
h.SEQ ID NO:2671的核苷酸8至核苷酸36;
i.SEQ ID NO:2671的核苷酸9至核苷酸36;
j.SEQ ID NO:2671的核苷酸10至核苷酸36;
k.SEQ ID NO:2671的核苷酸11至核苷酸36;
l.SEQ ID NO:2671的核苷酸12至核苷酸36;
m.SEQ ID NO:2671的核苷酸13至核苷酸36;
n.SEQ ID NO:2671的核苷酸14至核苷酸36;或
o.SEQ ID NO:2672或SEQ ID NO:2673或其一部分。
12.如权利要求1至5中任一项所述的组合物,其中该同向重复序列包含:
a.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或
p.与SEQ ID NO:2676的序列或其一部分具有至少90%同一性的序列。
13.如权利要求1至5或12中任一项所述的组合物,其中该同向重复序列包含:
a.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸1至核苷酸36;
b.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸2至核苷酸36;
c.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸3至核苷酸36;
d.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸4至核苷酸36;
e.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸5至核苷酸36;
f.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸6至核苷酸36;
g.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸7至核苷酸36;
h.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸8至核苷酸36;
i.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸9至核苷酸36;
j.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸10至核苷酸36;
k.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸11至核苷酸36;
l.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸12至核苷酸36;
m.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸13至核苷酸36;
n.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸14至核苷酸36;
o.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸15至核苷酸36;或
p.SEQ ID NO:2676或其一部分。
14.如权利要求1至13中任一项所述的组合物,其中该间隔子序列与SEQ ID NO:11-1321中任一个的序列的互补序列基本上互补。
15.如权利要求1所述的组合物,其中该PAM包含序列5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’或5’-CTTC-3’。
16.如权利要求1或15所述的组合物,其中该靶序列紧邻该PAM序列。
17.如权利要求1至16中任一项所述的组合物,其中该组合物进一步包含Cas12i多肽。
18.如权利要求17所述的组合物,其中该Cas12i多肽是:
a.Cas12i2多肽,其包含与SEQ ID NO:2634、SEQ ID NO:2641、SEQ ID NO:2642、SEQ IDNO:2643、SEQ ID NO:2644、或SEQ ID NO:2645的序列具有至少90%同一性的序列;
b.Cas12i4多肽,其包含与SEQ ID NO:2647、SEQ ID NO:2648、或SEQ ID NO:2649的序列具有至少90%同一性的序列;
c.Cas12i1多肽,其包含与SEQ ID NO:2650的序列具有至少90%同一性的序列;或
d.Cas12i3多肽,其包含与SEQ ID NO:2651的序列具有至少90%同一性的序列。
19.如权利要求18所述的组合物,其中该Cas12i多肽是:
a.Cas12i2多肽,其包含SEQ ID NO:2634、SEQ ID NO:2641、SEQ ID NO:2642、SEQ IDNO:2643、SEQ ID NO:2644、或SEQ ID NO:2645的序列;
b.Cas12i4多肽,其包含SEQ ID NO:2647、SEQ ID NO:2648、或SEQ ID NO:2649的序列;
c.Cas12i1多肽,其包含SEQ ID NO:2650的序列;或
d.Cas12i3多肽,其包含SEQ ID NO:2651的序列。
20.如权利要求17至19中任一项所述的组合物,其中该RNA指导物和该Cas12i多肽形成核糖核蛋白复合物。
21.如权利要求20所述的组合物,其中该核糖核蛋白复合物与靶核酸结合。
22.如权利要求20或21所述的组合物,其中该组合物存在于细胞内。
23.如权利要求17至22中任一项所述的组合物,其中该RNA指导物和该Cas12i多肽被编码在载体中,例如表达载体中。
24.如权利要求23所述的组合物,其中该RNA指导物和该Cas12i多肽被编码在单一载体中,或者该RNA指导物被编码在第一载体中并且该Cas12i多肽被编码在第二载体中。
25.一种RNA指导物,其包含(i)与BCL11A基因内的靶序列基本上互补的间隔子序列和(ii)同向重复序列。
26.如权利要求25所述的RNA指导物,其中该靶序列在该BCL11A基因的外显子1、外显子2、外显子3、外显子4或增强子区内。
27.如权利要求25或26所述的RNA指导物,其中该BCL11A基因包含SEQ ID NO:2635的序列、SEQ ID NO:2635的反向互补序列、SEQ ID NO:2635的变体、或SEQ ID NO:2635的反向互补序列。
28.如权利要求25至27中任一项所述的RNA指导物,其中该间隔子序列包含:
a.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸16;
b.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸17;
c.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸18;
d.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸19;
e.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸20;
f.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸21;
g.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸22;
h.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸23;
i.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸24;
j.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸25;
k.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸26;
l.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸27;
m.与SEQ ID NO:1322-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸28;
n.与SEQ ID NO:1322-1425和1427-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸29;或
o.与SEQ ID NO:1322-1425和1427-2632中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸30。
29.如权利要求25至28中任一项所述的RNA指导物,其中该间隔子序列包含:
a.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸16;
b.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸17;
c.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸18;
d.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸19;
e.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸20;
f.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸21;
g.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸22;
h.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸23;
i.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸24;
j.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸25;
k.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸26;
l.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸27;
m.SEQ ID NO:1322-2632中任一个的核苷酸1至核苷酸28;
n.SEQ ID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸29;或
o.SEQ ID NO:1322-1425和1427-2632中任一个的核苷酸1至核苷酸30。
30.如权利要求25至29中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:1-8中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸1至核苷酸34;
p.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸2至核苷酸34;
q.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸3至核苷酸34;
r.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸4至核苷酸34;
s.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸5至核苷酸34;
t.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸6至核苷酸34;
u.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸7至核苷酸34;
v.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸8至核苷酸34;
w.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸9至核苷酸34;
x.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸10至核苷酸34;
y.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸11至核苷酸34;
z.与SEQ ID NO:9的序列具有至少90%同一性的序列的核苷酸12至核苷酸34;或
aa.与SEQ ID NO:10的序列或其一部分具有至少90%同一性的序列。
31.如权利要求25至30中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:1-8中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:1-8中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:1-8中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:1-8中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:1-8中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:1-8中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:1-8中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:1-8中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:1-8中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:1-8中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:1-8中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:1-8中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:1-8中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:1-8中任一个的核苷酸14至核苷酸36;
o.SEQ ID NO:9的核苷酸1至核苷酸34;
p.SEQ ID NO:9的核苷酸2至核苷酸34;
q.SEQ ID NO:9的核苷酸3至核苷酸34;
r.SEQ ID NO:9的核苷酸4至核苷酸34;
s.SEQ ID NO:9的核苷酸5至核苷酸34;
t.SEQ ID NO:9的核苷酸6至核苷酸34;
u.SEQ ID NO:9的核苷酸7至核苷酸34;
v.SEQ ID NO:9的核苷酸8至核苷酸34;
w.SEQ ID NO:9的核苷酸9至核苷酸34;
x.SEQ ID NO:9的核苷酸10至核苷酸34;
y.SEQ ID NO:9的核苷酸11至核苷酸34;
z.SEQ ID NO:9的核苷酸12至核苷酸34;或
aa.SEQ ID NO:10或其一部分。
32.如权利要求25至31中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:2652-2669中任一个的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:2670的序列或其一部分具有至少90%同一性的序列。
33.如权利要求25至29或32中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:2652-2669中任一个的核苷酸1至核苷酸36;
b.SEQ ID NO:2652-2669中任一个的核苷酸2至核苷酸36;
c.SEQ ID NO:2652-2669中任一个的核苷酸3至核苷酸36;
d.SEQ ID NO:2652-2669中任一个的核苷酸4至核苷酸36;
e.SEQ ID NO:2652-2669中任一个的核苷酸5至核苷酸36;
f.SEQ ID NO:2652-2669中任一个的核苷酸6至核苷酸36;
g.SEQ ID NO:2652-2669中任一个的核苷酸7至核苷酸36;
h.SEQ ID NO:2652-2669中任一个的核苷酸8至核苷酸36;
i.SEQ ID NO:2652-2669中任一个的核苷酸9至核苷酸36;
j.SEQ ID NO:2652-2669中任一个的核苷酸10至核苷酸36;
k.SEQ ID NO:2652-2669中任一个的核苷酸11至核苷酸36;
l.SEQ ID NO:2652-2669中任一个的核苷酸12至核苷酸36;
m.SEQ ID NO:2652-2669中任一个的核苷酸13至核苷酸36;
n.SEQ ID NO:2652-2669中任一个的核苷酸14至核苷酸36;或
o.SEQ ID NO:2670或其一部分。
34.如权利要求25至29中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:2671具有至少90%同一性的序列的核苷酸14至核苷酸36;或
o.与SEQ ID NO:2672或SEQ ID NO:2673的序列或其一部分具有至少90%同一性的序列。
35.如权利要求25至29或34中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:2671的核苷酸1至核苷酸36;
b.SEQ ID NO:2671的核苷酸2至核苷酸36;
c.SEQ ID NO:2671的核苷酸3至核苷酸36;
d.SEQ ID NO:2671的核苷酸4至核苷酸36;
e.SEQ ID NO:2671的核苷酸5至核苷酸36;
f.SEQ ID NO:2671的核苷酸6至核苷酸36;
g.SEQ ID NO:2671的核苷酸7至核苷酸36;
h.SEQ ID NO:2671的核苷酸8至核苷酸36;
i.SEQ ID NO:2671的核苷酸9至核苷酸36;
j.SEQ ID NO:2671的核苷酸10至核苷酸36;
k.SEQ ID NO:2671的核苷酸11至核苷酸36;
l.SEQ ID NO:2671的核苷酸12至核苷酸36;
m.SEQ ID NO:2671的核苷酸13至核苷酸36;
n.SEQ ID NO:2671的核苷酸14至核苷酸36;或
o.SEQ ID NO:2672或SEQ ID NO:2673或其一部分。
36.如权利要求25至29中任一项所述的RNA指导物,其中该同向重复序列包含:
a.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸1至核苷酸36;
b.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸2至核苷酸36;
c.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸3至核苷酸36;
d.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸4至核苷酸36;
e.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸5至核苷酸36;
f.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸6至核苷酸36;
g.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸7至核苷酸36;
h.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸8至核苷酸36;
i.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸9至核苷酸36;
j.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸10至核苷酸36;
k.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸11至核苷酸36;
l.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸12至核苷酸36;
m.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸13至核苷酸36;
n.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸14至核苷酸36;
o.与SEQ ID NO:2674或SEQ ID NO:2675的序列具有至少90%同一性的序列的核苷酸15至核苷酸36;或
p.与SEQ ID NO:2676的序列或其一部分具有至少90%同一性的序列。
37.如权利要求25至29或36中任一项所述的RNA指导物,其中该同向重复序列包含:
a.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸1至核苷酸36;
b.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸2至核苷酸36;
c.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸3至核苷酸36;
d.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸4至核苷酸36;
e.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸5至核苷酸36;
f.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸6至核苷酸36;
g.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸7至核苷酸36;
h.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸8至核苷酸36;
i.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸9至核苷酸36;
j.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸10至核苷酸36;
k.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸11至核苷酸36;
l.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸12至核苷酸36;
m.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸13至核苷酸36;
n.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸14至核苷酸36;
o.SEQ ID NO:2674或SEQ ID NO:2675的核苷酸15至核苷酸36;或
p.SEQ ID NO:2676或其一部分。
38.如权利要求25至37中任一项所述的RNA指导物,其中该间隔子序列与SEQ ID NO:11-1321中任一个的序列的互补序列基本上互补。
39.如权利要求25至38中任一项所述的RNA指导物,其中该靶序列与包含该序列5'-NTTN-3'的原型间隔子相邻基序(PAM)相邻,其中N是任何核苷酸。
40.如权利要求39所述的RNA指导物,其中该PAM包含序列5’-ATTA-3’、5’-ATTT-3’、5’-ATTG-3’、5’-ATTC-3’、5’-TTTA-3’、5’-TTTT-3’、5’-TTTG-3’、5’-TTTC-3’、5’-GTTA-3’、5’-GTTT-3’、5’-GTTG-3’、5’-GTTC-3’、5’-CTTA-3’、5’-CTTT-3’、5’-CTTG-3’或5’-CTTC-3’。
41.如权利要求39或40所述的RNA指导物,其中该靶序列紧邻该PAM序列。
42.一种核酸,其编码如权利要求25至41中任一项所述的RNA指导物。
43.一种载体,其包含如权利要求42所述的核酸。
44.一种载体系统,其包含一个或多个编码(i)如权利要求1至41中任一项所定义的RNA指导物和(ii)Cas12i多肽的载体,任选地其中该载体系统包含编码该RNA指导物的第一载体以及编码该Cas12i多肽的第二载体。
45.一种细胞,其包含如权利要求1至24中任一项所述的组合物、如权利要求25至41中任一项所述的RNA指导物、如权利要求42所述的核酸、如权利要求43所述的载体或如权利要求44所述的载体系统。
46.如权利要求45所述的细胞,其中该细胞是真核细胞、动物细胞、哺乳动物细胞、人细胞、原代细胞、细胞系、干细胞、或T细胞。
47.一种试剂盒,其包含如权利要求1至24中任一项所述的组合物、如权利要求25至41中任一项所述的RNA指导物、如权利要求42所述的核酸、如权利要求43所述的载体或如权利要求44所述的载体系统。
48.一种编辑BCL11A序列的方法,该方法包括使BCL11A序列与如权利要求1至24中任一项所述的组合物或如权利要求25至41中任一项所述的RNA指导物接触。
49.如权利要求48所述的方法,其中该BCL11A序列在细胞中。
50.如权利要求48或49所述的方法,其中该组合物或该RNA指导物诱导该BCL11A序列中的缺失。
51.如权利要求50所述的方法,其中该缺失与5'-NTTN-3'序列相邻,其中N是任何核苷酸。
52.如权利要求50或51所述的方法,其中该缺失在该5'-NTTN-3'序列的下游。
53.如权利要求50至52中任一项所述的方法,其中该缺失的长度多达约50个核苷酸。
54.如权利要求50至53中任一项所述的方法,其中该缺失的长度多达约40个核苷酸。
55.如权利要求50至54中任一项所述的方法,其中该缺失的长度为约4个核苷酸至40个核苷酸。
56.如权利要求50至55中任一项所述的方法,其中该缺失的长度为约4个核苷酸至25个核苷酸。
57.如权利要求50至56中任一项所述的方法,其中该缺失的长度为约10个核苷酸至25个核苷酸。
58.如权利要求50至57中任一项所述的方法,其中该缺失的长度为约10个核苷酸至15个核苷酸。
59.如权利要求50至58中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约5个核苷酸至约15个核苷酸内开始。
60.如权利要求50至59中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约5个核苷酸至约10个核苷酸内开始。
61.如权利要求50至60中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约10个核苷酸至约15个核苷酸内开始。
62.如权利要求50至61中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始。
63.如权利要求50至62中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始。
64.如权利要求50至63中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始。
65.如权利要求50至64中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约20个核苷酸至约30个核苷酸内结束。
66.如权利要求50至65中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约20个核苷酸至约25个核苷酸内结束。
67.如权利要求50至66中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的约25个核苷酸至约30个核苷酸内结束。
68.如权利要求50至67中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
69.如权利要求50至68中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
70.如权利要求50至69中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
71.如权利要求50至70中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
72.如权利要求50至71中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
73.如权利要求50至72中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
74.如权利要求50至73中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
75.如权利要求50至74中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
76.如权利要求50至75中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约5个核苷酸至约10个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
77.如权利要求50至76中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约30个核苷酸内结束。
78.如权利要求50至77中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约20个核苷酸至约25个核苷酸内结束。
79.如权利要求50至78中任一项所述的方法,其中该缺失在该5'-NTTN-3'序列的下游约10个核苷酸至约15个核苷酸内开始,并且在该5'-NTTN-3'序列的下游约25个核苷酸至约30个核苷酸内结束。
80.如权利要求50至79中任一项所述的方法,其中该5'-NTTN-3'序列是5'-CTTT-3'、5'-CTTC-3'、5'-GTTT-3'、5'-GTTC-3'、5'-TTTC-3'、5'-GTTA-3'或5'-GTTG-3'。
81.如权利要求50至80中任一项所述的方法,其中该缺失与该BCL11A序列中的突变重叠。
82.如权利要求50至81中任一项所述的方法,其中该缺失与该BCL11A序列中的插入重叠。
83.如权利要求50至82中任一项所述的方法,其中该缺失去除该BCL11A序列或其一部分的重复扩展。
84.如权利要求50至83中任一项所述的方法,其中该缺失破坏该BCL11A序列的一个或两个等位基因。
85.如权利要求50至84中任一项所述的方法,其中该缺失破坏该BCL11A基因的增强子区的GATAA基序。
86.如前述权利要求中任一项所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法,其中该组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法破坏该BCL11A基因的增强子区的GATAA基序。
87.如前述权利要求中任一项所述的组合物、细胞、试剂盒或方法,其中该组合物、细胞、试剂盒或方法包含至少两个靶向该BCL11A基因的增强子区的GATAA基序的RNA指导物。
88.如权利要求87所述的组合物、细胞、试剂盒或方法,其中该至少两个RNA指导物与以下具有至少90%同一性:
AGAAAUCCGUCUUUCAUUGACGGGAAGCUAGUCUAGUGCAAGC(SEQ ID NO:2677);
AGAAAUCCGUCUUUCAUUGACGGCUGGAGCCUGUGAUAAAAGC(SEQ ID NO:2678);和/或
AGAAAUCCGUCUUUCAUUGACGGUACCCCACCCACGCCCCCAC(SEQ ID NO:2679)。
89.如权利要求88所述的组合物、细胞、试剂盒或方法,其中该至少两个RNA指导物与以下具有至少95%同一性:
AGAAAUCCGUCUUUCAUUGACGGGAAGCUAGUCUAGUGCAAGC(SEQ ID NO:2677);
AGAAAUCCGUCUUUCAUUGACGGCUGGAGCCUGUGAUAAAAGC(SEQ ID NO:2678);和/或
AGAAAUCCGUCUUUCAUUGACGGUACCCCACCCACGCCCCCAC(SEQ ID NO:2679)。
90.如权利要求89所述的组合物、细胞、试剂盒或方法,其中该至少两个RNA指导物包含以下中的至少两个序列:AGAAAUCCGUCUUUCAUUGACGGGAAGCUAGUCUAGUGCAAGC(SEQ ID NO:2677);
AGAAAUCCGUCUUUCAUUGACGGCUGGAGCCUGUGAUAAAAGC(SEQ ID NO:2678);以及
AGAAAUCCGUCUUUCAUUGACGGUACCCCACCCACGCCCCCAC(SEQ ID NO:2679)。
91.如前述权利要求中任一项所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法,其中该RNA指导物由以下序列组成:
AGAAAUCCGUCUUUCAUUGACGGGAAGCUAGUCUAGUGCAAGC(SEQ ID NO:2677);
AGAAAUCCGUCUUUCAUUGACGGCUGGAGCCUGUGAUAAAAGC(SEQ ID NO:2678);或
AGAAAUCCGUCUUUCAUUGACGGUACCCCACCCACGCCCCCAC(SEQ ID NO:2679)。
92.如前述权利要求中任一项所述的组合物、RNA指导物、核酸、载体、细胞、试剂盒或方法,其中该RNA指导物不由以下序列组成:
AGAAAUCCGUCUUUCAUUGACGGGAAGCUAGUCUAGUGCAAGC(SEQ ID NO:2677);
AGAAAUCCGUCUUUCAUUGACGGCUGGAGCCUGUGAUAAAAGC(SEQ ID NO:2678);或
AGAAAUCCGUCUUUCAUUGACGGUACCCCACCCACGCCCCCAC(SEQ ID NO:2679)。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/108,110 | 2020-10-30 | ||
US202163252832P | 2021-10-06 | 2021-10-06 | |
US63/252,832 | 2021-10-06 | ||
PCT/US2021/057426 WO2022094323A1 (en) | 2020-10-30 | 2021-10-29 | Compositions comprising an rna guide targeting bcl11a and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116601292A true CN116601292A (zh) | 2023-08-15 |
Family
ID=87601319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180080699.5A Pending CN116601292A (zh) | 2020-10-30 | 2021-10-29 | 包含靶向bcl11a的rna指导物的组合物及其用途 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116601292A (zh) |
-
2021
- 2021-10-29 CN CN202180080699.5A patent/CN116601292A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230203539A1 (en) | Gene editing systems comprising an rna guide targeting stathmin 2 (stmn2) and uses thereof | |
US20230407343A1 (en) | Compositions comprising an rna guide targeting pdcd1 and uses thereof | |
WO2023018856A1 (en) | Gene editing systems comprising an rna guide targeting polypyrimidine tract binding protein 1 (ptbp1) and uses thereof | |
CN116601292A (zh) | 包含靶向bcl11a的rna指导物的组合物及其用途 | |
US20230416732A1 (en) | Compositions comprising an rna guide targeting bcl11a and uses thereof | |
US20230399639A1 (en) | Compositions comprising an rna guide targeting b2m and uses thereof | |
CN116867898A (zh) | 包含靶向trac的rna指导物的组合物及其用途 | |
CN116670275A (zh) | 包含靶向pdcd1的rna指导物的组合物及其用途 | |
AU2021368740A1 (en) | Compositions comprising an rna guide targeting trac and uses thereof | |
CN116648505A (zh) | 包含靶向b2m的rna指导物的组合物及其用途 | |
WO2022140343A1 (en) | Compositions comprising an rna guide targeting dmpk and uses thereof | |
CN117813382A (zh) | 包括靶向stathmin 2(stmn2)的rna向导的基因编辑系统和其用途 | |
WO2023137451A1 (en) | Compositions comprising an rna guide targeting cd38 and uses thereof | |
WO2023081377A2 (en) | Compositions comprising an rna guide targeting ciita and uses thereof | |
WO2022140340A1 (en) | Compositions comprising an rna guide targeting dmd and uses thereof | |
CN117136233A (zh) | 包含变体Cas12i4多肽的组合物及其用途 | |
CN117897485A (zh) | 包括靶向羟基酸氧化酶1(hao1)的rna向导的基因编辑系统和其用途 | |
CN118019846A (zh) | 包含crispr核酸酶的组合物及其用途 | |
EP4158020A2 (en) | Compositions comprising a cas12i2 polypeptide and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |