CN117916375A - 用于基因编辑的包含内部接头的修饰的引导rna - Google Patents
用于基因编辑的包含内部接头的修饰的引导rna Download PDFInfo
- Publication number
- CN117916375A CN117916375A CN202280055508.4A CN202280055508A CN117916375A CN 117916375 A CN117916375 A CN 117916375A CN 202280055508 A CN202280055508 A CN 202280055508A CN 117916375 A CN117916375 A CN 117916375A
- Authority
- CN
- China
- Prior art keywords
- grna
- nucleotides
- region
- hairpin
- internal linker
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108020005004 Guide RNA Proteins 0.000 title claims abstract description 379
- 238000010362 genome editing Methods 0.000 title abstract description 16
- 238000000034 method Methods 0.000 claims abstract description 76
- 125000003729 nucleotide group Chemical group 0.000 claims description 1681
- 239000002773 nucleotide Substances 0.000 claims description 1497
- 230000004048 modification Effects 0.000 claims description 492
- 238000012986 modification Methods 0.000 claims description 492
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 168
- 125000004429 atom Chemical group 0.000 claims description 163
- 239000000203 mixture Substances 0.000 claims description 138
- 108091033409 CRISPR Proteins 0.000 claims description 122
- 101710163270 Nuclease Proteins 0.000 claims description 103
- 150000002632 lipids Chemical class 0.000 claims description 100
- -1 heterocyclic hydrocarbons Chemical class 0.000 claims description 91
- 108090000623 proteins and genes Proteins 0.000 claims description 71
- 150000007523 nucleic acids Chemical class 0.000 claims description 68
- 102000039446 nucleic acids Human genes 0.000 claims description 67
- 108020004707 nucleic acids Proteins 0.000 claims description 67
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 claims description 65
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 claims description 57
- 238000006467 substitution reaction Methods 0.000 claims description 56
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 52
- 108020004999 messenger RNA Proteins 0.000 claims description 48
- 102000004169 proteins and genes Human genes 0.000 claims description 46
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 42
- 125000001931 aliphatic group Chemical group 0.000 claims description 35
- 108020004414 DNA Proteins 0.000 claims description 34
- 238000012217 deletion Methods 0.000 claims description 24
- 230000037430 deletion Effects 0.000 claims description 24
- 239000008194 pharmaceutical composition Substances 0.000 claims description 24
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 claims description 21
- 230000015572 biosynthetic process Effects 0.000 claims description 20
- 229940035893 uracil Drugs 0.000 claims description 19
- 229930024421 Adenine Natural products 0.000 claims description 16
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 16
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 16
- 229960000643 adenine Drugs 0.000 claims description 16
- 238000003780 insertion Methods 0.000 claims description 15
- 230000037431 insertion Effects 0.000 claims description 15
- 102100023917 Histone H1.10 Human genes 0.000 claims description 14
- 102100027368 Histone H1.3 Human genes 0.000 claims description 14
- 101000905024 Homo sapiens Histone H1.10 Proteins 0.000 claims description 14
- 101001009450 Homo sapiens Histone H1.3 Proteins 0.000 claims description 14
- 102000004317 Lyases Human genes 0.000 claims description 14
- 108090000856 Lyases Proteins 0.000 claims description 14
- 102100039856 Histone H1.1 Human genes 0.000 claims description 13
- 101001035402 Homo sapiens Histone H1.1 Proteins 0.000 claims description 13
- 238000005859 coupling reaction Methods 0.000 claims description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 12
- 239000002105 nanoparticle Substances 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 12
- 102000004190 Enzymes Human genes 0.000 claims description 11
- 108090000790 Enzymes Proteins 0.000 claims description 11
- 102100039855 Histone H1.2 Human genes 0.000 claims description 11
- 102100027369 Histone H1.4 Human genes 0.000 claims description 11
- 101001035375 Homo sapiens Histone H1.2 Proteins 0.000 claims description 11
- 101001009443 Homo sapiens Histone H1.4 Proteins 0.000 claims description 11
- 101000897979 Homo sapiens Putative spermatid-specific linker histone H1-like protein Proteins 0.000 claims description 11
- 102100021861 Putative spermatid-specific linker histone H1-like protein Human genes 0.000 claims description 11
- 230000005782 double-strand break Effects 0.000 claims description 11
- 229910052739 hydrogen Inorganic materials 0.000 claims description 11
- 125000001424 substituent group Chemical group 0.000 claims description 11
- 229910019142 PO4 Inorganic materials 0.000 claims description 10
- 229930195733 hydrocarbon Natural products 0.000 claims description 10
- 239000001257 hydrogen Substances 0.000 claims description 10
- 239000010452 phosphate Substances 0.000 claims description 10
- 230000027455 binding Effects 0.000 claims description 9
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 9
- 150000008300 phosphoramidites Chemical class 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 102100022653 Histone H1.5 Human genes 0.000 claims description 7
- 101000899879 Homo sapiens Histone H1.5 Proteins 0.000 claims description 7
- 125000004122 cyclic group Chemical group 0.000 claims description 7
- 230000002194 synthesizing effect Effects 0.000 claims description 7
- 201000010099 disease Diseases 0.000 claims description 6
- 208000035475 disorder Diseases 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 6
- 125000001921 locked nucleotide group Chemical group 0.000 claims description 6
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 6
- 239000007787 solid Substances 0.000 claims description 6
- 239000005977 Ethylene Substances 0.000 claims description 5
- 102100033558 Histone H1.8 Human genes 0.000 claims description 5
- 102100023920 Histone H1t Human genes 0.000 claims description 5
- 101000872218 Homo sapiens Histone H1.8 Proteins 0.000 claims description 5
- 101000905044 Homo sapiens Histone H1t Proteins 0.000 claims description 5
- 108700026244 Open Reading Frames Proteins 0.000 claims description 5
- QOSMNYMQXIVWKY-UHFFFAOYSA-N Propyl levulinate Chemical compound CCCOC(=O)CCC(C)=O QOSMNYMQXIVWKY-UHFFFAOYSA-N 0.000 claims description 5
- 108020001507 fusion proteins Proteins 0.000 claims description 5
- 102000037865 fusion proteins Human genes 0.000 claims description 5
- 230000005783 single-strand break Effects 0.000 claims description 5
- 108091026890 Coding region Proteins 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 4
- 101150065592 NME2 gene Proteins 0.000 claims description 3
- 239000002253 acid Substances 0.000 claims description 3
- 239000003937 drug carrier Substances 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 239000013604 expression vector Substances 0.000 claims description 2
- 239000013603 viral vector Substances 0.000 claims description 2
- WWZKQHOCKIZLMA-UHFFFAOYSA-N octanoic acid Chemical compound CCCCCCCC(O)=O WWZKQHOCKIZLMA-UHFFFAOYSA-N 0.000 claims 2
- OBETXYAYXDNJHR-UHFFFAOYSA-N alpha-ethylcaproic acid Natural products CCCCC(CC)C(O)=O OBETXYAYXDNJHR-UHFFFAOYSA-N 0.000 claims 1
- 230000007812 deficiency Effects 0.000 claims 1
- 238000001727 in vivo Methods 0.000 abstract description 16
- 238000000338 in vitro Methods 0.000 abstract description 10
- 125000005647 linker group Chemical group 0.000 description 958
- 230000004568 DNA-binding Effects 0.000 description 58
- 239000011230 binding agent Substances 0.000 description 56
- 229920001223 polyethylene glycol Polymers 0.000 description 56
- 239000002202 Polyethylene glycol Substances 0.000 description 51
- 208000035657 Abasia Diseases 0.000 description 45
- 230000000694 effects Effects 0.000 description 32
- 238000011191 terminal modification Methods 0.000 description 31
- 108091028043 Nucleic acid sequence Proteins 0.000 description 30
- 210000004027 cell Anatomy 0.000 description 29
- 108091028113 Trans-activating crRNA Proteins 0.000 description 25
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 24
- 230000000295 complement effect Effects 0.000 description 23
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 18
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 18
- 238000009472 formulation Methods 0.000 description 17
- 235000000346 sugar Nutrition 0.000 description 15
- 108010078791 Carrier Proteins Proteins 0.000 description 14
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 14
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 14
- 229910052799 carbon Inorganic materials 0.000 description 14
- 230000001681 protective effect Effects 0.000 description 14
- 238000003776 cleavage reaction Methods 0.000 description 12
- 230000007017 scission Effects 0.000 description 12
- 125000006850 spacer group Chemical group 0.000 description 12
- 238000012384 transportation and delivery Methods 0.000 description 12
- 230000002441 reversible effect Effects 0.000 description 11
- KJIOQYGWTQBHNH-UHFFFAOYSA-N undecanol Chemical compound CCCCCCCCCCCO KJIOQYGWTQBHNH-UHFFFAOYSA-N 0.000 description 11
- 125000004200 2-methoxyethyl group Chemical group [H]C([H])([H])OC([H])([H])C([H])([H])* 0.000 description 10
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 10
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 10
- DHKHKXVYLBGOIT-UHFFFAOYSA-N acetaldehyde Diethyl Acetal Natural products CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 description 10
- 230000000712 assembly Effects 0.000 description 10
- 238000000429 assembly Methods 0.000 description 10
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 description 9
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 9
- 108091033319 polynucleotide Proteins 0.000 description 9
- 102000040430 polynucleotide Human genes 0.000 description 9
- 239000002157 polynucleotide Substances 0.000 description 9
- 210000002966 serum Anatomy 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- 238000010354 CRISPR gene editing Methods 0.000 description 8
- 241000699666 Mus <mouse, genus> Species 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 125000004450 alkenylene group Chemical group 0.000 description 8
- 125000002947 alkylene group Chemical group 0.000 description 8
- HMFHBZSHGGEWLO-UHFFFAOYSA-N pentofuranose Chemical group OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 8
- WTJKGGKOPKCXLL-RRHRGVEJSA-N phosphatidylcholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCC=CCCCCCCCC WTJKGGKOPKCXLL-RRHRGVEJSA-N 0.000 description 8
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 7
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 7
- 102000004533 Endonucleases Human genes 0.000 description 7
- 108010042407 Endonucleases Proteins 0.000 description 7
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 7
- 150000001241 acetals Chemical class 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 229910052757 nitrogen Inorganic materials 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 230000008685 targeting Effects 0.000 description 7
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 6
- JZNWSCPGTDBMEW-UHFFFAOYSA-N Glycerophosphorylethanolamin Natural products NCCOP(O)(=O)OCC(O)CO JZNWSCPGTDBMEW-UHFFFAOYSA-N 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 125000000217 alkyl group Chemical group 0.000 description 6
- 101150038500 cas9 gene Proteins 0.000 description 6
- 239000005547 deoxyribonucleotide Substances 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 210000004185 liver Anatomy 0.000 description 6
- 230000007935 neutral effect Effects 0.000 description 6
- CITHEXJVPOWHKC-UUWRZZSWSA-N 1,2-di-O-myristoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCC CITHEXJVPOWHKC-UUWRZZSWSA-N 0.000 description 5
- 125000001731 2-cyanoethyl group Chemical group [H]C([H])(*)C([H])([H])C#N 0.000 description 5
- 241000589875 Campylobacter jejuni Species 0.000 description 5
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 5
- 241000588650 Neisseria meningitidis Species 0.000 description 5
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 description 5
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 5
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 5
- 125000003275 alpha amino acid group Chemical group 0.000 description 5
- 210000004369 blood Anatomy 0.000 description 5
- 239000008280 blood Substances 0.000 description 5
- 125000004432 carbon atom Chemical group C* 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 5
- 229960003724 dimyristoylphosphatidylcholine Drugs 0.000 description 5
- 238000012239 gene modification Methods 0.000 description 5
- 230000005017 genetic modification Effects 0.000 description 5
- 235000013617 genetically modified food Nutrition 0.000 description 5
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 239000002777 nucleoside Substances 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 150000004713 phosphodiesters Chemical class 0.000 description 5
- 229920001184 polypeptide Polymers 0.000 description 5
- 102000004196 processed proteins & peptides Human genes 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 229920006395 saturated elastomer Polymers 0.000 description 5
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 4
- 102000004127 Cytokines Human genes 0.000 description 4
- 108090000695 Cytokines Proteins 0.000 description 4
- 229930185560 Pseudouridine Natural products 0.000 description 4
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 4
- 108091028664 Ribonucleotide Proteins 0.000 description 4
- 108091027544 Subgenomic mRNA Proteins 0.000 description 4
- 238000002835 absorbance Methods 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 230000000692 anti-sense effect Effects 0.000 description 4
- 239000007864 aqueous solution Substances 0.000 description 4
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 4
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 4
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 4
- 101150090505 cas10 gene Proteins 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- FPUGCISOLXNPPC-IOSLPCCCSA-N cordysinin B Chemical group CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(N)=C2N=C1 FPUGCISOLXNPPC-IOSLPCCCSA-N 0.000 description 4
- 239000003085 diluting agent Substances 0.000 description 4
- 210000003494 hepatocyte Anatomy 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000001638 lipofection Methods 0.000 description 4
- 239000000546 pharmaceutical excipient Substances 0.000 description 4
- 150000008104 phosphatidylethanolamines Chemical class 0.000 description 4
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 4
- 239000002336 ribonucleotide Substances 0.000 description 4
- 229940104230 thymidine Drugs 0.000 description 4
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 4
- 229940045145 uridine Drugs 0.000 description 4
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 3
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 3
- 108091079001 CRISPR RNA Proteins 0.000 description 3
- 238000010453 CRISPR/Cas method Methods 0.000 description 3
- 241000186394 Eubacterium Species 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000692870 Inachis io Species 0.000 description 3
- 229930010555 Inosine Natural products 0.000 description 3
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 241000190950 Rhodopseudomonas palustris Species 0.000 description 3
- 241000190984 Rhodospirillum rubrum Species 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 3
- 229960005305 adenosine Drugs 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 125000000753 cycloalkyl group Chemical group 0.000 description 3
- 231100000673 dose–response relationship Toxicity 0.000 description 3
- 239000000839 emulsion Substances 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 229960003786 inosine Drugs 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 150000003904 phospholipids Chemical class 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 125000002652 ribonucleotide group Chemical group 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- FPUGCISOLXNPPC-UHFFFAOYSA-N 2'-O-Methyladenosine Natural products COC1C(O)C(CO)OC1N1C2=NC=NC(N)=C2N=C1 FPUGCISOLXNPPC-UHFFFAOYSA-N 0.000 description 2
- IJFVSSZAOYLHEE-UHFFFAOYSA-N 2,3-di(dodecanoyloxy)propyl 2-(trimethylazaniumyl)ethyl phosphate Chemical compound CCCCCCCCCCCC(=O)OCC(COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCC IJFVSSZAOYLHEE-UHFFFAOYSA-N 0.000 description 2
- XLGVHAQDCFITCH-UHFFFAOYSA-N 2,3-dihydroxypropanamide Chemical compound NC(=O)C(O)CO XLGVHAQDCFITCH-UHFFFAOYSA-N 0.000 description 2
- NEZDNQCXEZDCBI-UHFFFAOYSA-N 2-azaniumylethyl 2,3-di(tetradecanoyloxy)propyl phosphate Chemical compound CCCCCCCCCCCCCC(=O)OCC(COP(O)(=O)OCCN)OC(=O)CCCCCCCCCCCCC NEZDNQCXEZDCBI-UHFFFAOYSA-N 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- BBGNINPPDHJETF-UHFFFAOYSA-N 5-heptadecylresorcinol Chemical compound CCCCCCCCCCCCCCCCCC1=CC(O)=CC(O)=C1 BBGNINPPDHJETF-UHFFFAOYSA-N 0.000 description 2
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 2
- 241001408449 Asca Species 0.000 description 2
- 101710155857 C-C motif chemokine 2 Proteins 0.000 description 2
- 239000004215 Carbon black (E152) Substances 0.000 description 2
- 108700004991 Cas12a Proteins 0.000 description 2
- 102000000018 Chemokine CCL2 Human genes 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 241001478240 Coccus Species 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- 102100026846 Cytidine deaminase Human genes 0.000 description 2
- 108010031325 Cytidine deaminase Proteins 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 101100005249 Escherichia coli (strain K12) ygcB gene Proteins 0.000 description 2
- YLQBMQCUIZJEEH-UHFFFAOYSA-N Furan Chemical group C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 102000006992 Interferon-alpha Human genes 0.000 description 2
- 108010047761 Interferon-alpha Proteins 0.000 description 2
- 102000004889 Interleukin-6 Human genes 0.000 description 2
- 108090001005 Interleukin-6 Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- OYHQOLUKZRVURQ-HZJYTTRNSA-N Linoleic acid Chemical compound CCCCC\C=C/C\C=C/CCCCCCCC(O)=O OYHQOLUKZRVURQ-HZJYTTRNSA-N 0.000 description 2
- 239000000232 Lipid Bilayer Substances 0.000 description 2
- 108060001084 Luciferase Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 101100154776 Mus musculus Ttr gene Proteins 0.000 description 2
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 2
- 101100059152 Thermococcus onnurineus (strain NA1) csm1 gene Proteins 0.000 description 2
- 108090001109 Thermolysin Proteins 0.000 description 2
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 2
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- 239000010441 alabaster Substances 0.000 description 2
- 125000003545 alkoxy group Chemical group 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000037429 base substitution Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- OSGAYBCDTDRGGQ-UHFFFAOYSA-L calcium sulfate Chemical compound [Ca+2].[O-]S([O-])(=O)=O OSGAYBCDTDRGGQ-UHFFFAOYSA-L 0.000 description 2
- 101150055191 cas3 gene Proteins 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- WLNARFZDISHUGS-MIXBDBMTSA-N cholesteryl hemisuccinate Chemical compound C1C=C2C[C@@H](OC(=O)CCC(O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 WLNARFZDISHUGS-MIXBDBMTSA-N 0.000 description 2
- 238000011260 co-administration Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000009615 deamination Effects 0.000 description 2
- 238000006481 deamination reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 150000001985 dialkylglycerols Chemical class 0.000 description 2
- 230000001036 exonucleolytic effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 229940100601 interleukin-6 Drugs 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 235000020778 linoleic acid Nutrition 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 239000004005 microsphere Substances 0.000 description 2
- 235000013557 nattō Nutrition 0.000 description 2
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 2
- 238000002515 oligonucleotide synthesis Methods 0.000 description 2
- SXADIBFZNXBEGI-UHFFFAOYSA-N phosphoramidous acid Chemical group NP(O)O SXADIBFZNXBEGI-UHFFFAOYSA-N 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- GHMLBKRAJCXXBS-UHFFFAOYSA-N resorcinol Chemical compound OC1=CC=CC(O)=C1 GHMLBKRAJCXXBS-UHFFFAOYSA-N 0.000 description 2
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000000087 stabilizing effect Effects 0.000 description 2
- 125000000547 substituted alkyl group Chemical group 0.000 description 2
- 229910052717 sulfur Inorganic materials 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 238000010189 synthetic method Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- IQGPMZRCLCCXAG-UHFFFAOYSA-N (3-hydroxy-2-octadecanoyloxypropyl) 2-(trimethylazaniumyl)ethyl phosphate Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC(CO)COP([O-])(=O)OCC[N+](C)(C)C IQGPMZRCLCCXAG-UHFFFAOYSA-N 0.000 description 1
- SNKAWJBJQDLSFF-NVKMUCNASA-N 1,2-dioleoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC SNKAWJBJQDLSFF-NVKMUCNASA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- IMSODMZESSGVBE-UHFFFAOYSA-N 2-Oxazoline Chemical compound C1CN=CO1 IMSODMZESSGVBE-UHFFFAOYSA-N 0.000 description 1
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 1
- OYHQOLUKZRVURQ-UHFFFAOYSA-N 9,12-Octadecadienoic Acid Chemical compound CCCCCC=CCC=CCCCCCCCC(O)=O OYHQOLUKZRVURQ-UHFFFAOYSA-N 0.000 description 1
- 241000093740 Acidaminococcus sp. Species 0.000 description 1
- 241001134630 Acidothermus cellulolyticus Species 0.000 description 1
- 241000186361 Actinobacteria <class> Species 0.000 description 1
- 241000186046 Actinomyces Species 0.000 description 1
- 241000186045 Actinomyces naeslundii Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 108010052875 Adenine deaminase Proteins 0.000 description 1
- 229930188104 Alkylresorcinol Natural products 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- NLZUEZXRPGMBCV-UHFFFAOYSA-N Butylhydroxytoluene Chemical compound CC1=CC(C(C)(C)C)=C(O)C(C(C)(C)C)=C1 NLZUEZXRPGMBCV-UHFFFAOYSA-N 0.000 description 1
- WQBSSUPHAAAVSW-HHHXNRCGSA-N CCCCCCCCCCCCCCCCCCCC(O[C@H](CO)COP([O-])(OCC[N+](C)(C)C)=O)=O Chemical compound CCCCCCCCCCCCCCCCCCCC(O[C@H](CO)COP([O-])(OCC[N+](C)(C)C)=O)=O WQBSSUPHAAAVSW-HHHXNRCGSA-N 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- KXDHJXZQYSOELW-UHFFFAOYSA-M Carbamate Chemical compound NC([O-])=O KXDHJXZQYSOELW-UHFFFAOYSA-M 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000227752 Chaetoceros Species 0.000 description 1
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 1
- XDTMQSROBMDMFD-UHFFFAOYSA-N Cyclohexane Chemical compound C1CCCCC1 XDTMQSROBMDMFD-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 1
- 102220605872 Cytosolic arginine sensor for mTORC1 subunit 2_D16A_mutation Human genes 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 102100021601 Ephrin type-A receptor 8 Human genes 0.000 description 1
- IAYPIBMASNFSPL-UHFFFAOYSA-N Ethylene oxide Chemical compound C1CO1 IAYPIBMASNFSPL-UHFFFAOYSA-N 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 241000589989 Helicobacter Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000898676 Homo sapiens Ephrin type-A receptor 8 Proteins 0.000 description 1
- 101000823778 Homo sapiens Y-box-binding protein 2 Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 101710105047 Lipoprotein B Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- 102100021867 Natural resistance-associated macrophage protein 2 Human genes 0.000 description 1
- 101710171645 Natural resistance-associated macrophage protein 2 Proteins 0.000 description 1
- 238000011887 Necropsy Methods 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101150001372 Nme1 gene Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- WSDRAZIPGVLSNP-UHFFFAOYSA-N O.P(=O)(O)(O)O.O.O.P(=O)(O)(O)O Chemical compound O.P(=O)(O)(O)O.O.O.P(=O)(O)(O)O WSDRAZIPGVLSNP-UHFFFAOYSA-N 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000192001 Pediococcus Species 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 229930182558 Sterol Natural products 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 241000223230 Trichosporon Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- CWRILEGKIAOYKP-SSDOTTSWSA-M [(2r)-3-acetyloxy-2-hydroxypropyl] 2-aminoethyl phosphate Chemical compound CC(=O)OC[C@@H](O)COP([O-])(=O)OCCN CWRILEGKIAOYKP-SSDOTTSWSA-M 0.000 description 1
- 241001531189 [Eubacterium] siraeum Species 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000003368 amide group Chemical group 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 230000000689 aminoacylating effect Effects 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 150000004945 aromatic hydrocarbons Chemical class 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 125000002619 bicyclic group Chemical group 0.000 description 1
- 238000010256 biochemical assay Methods 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 125000001369 canonical nucleoside group Chemical group 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 101150059443 cas12a gene Proteins 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 239000007979 citrate buffer Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000002274 desiccant Substances 0.000 description 1
- 150000001982 diacylglycerols Chemical class 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 125000004356 hydroxy functional group Chemical group O* 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000006317 isomerization reaction Methods 0.000 description 1
- 210000004731 jugular vein Anatomy 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- GZQKNULLWNGMCW-PWQABINMSA-N lipid A (E. coli) Chemical compound O1[C@H](CO)[C@@H](OP(O)(O)=O)[C@H](OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)[C@@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@@H]1OC[C@@H]1[C@@H](O)[C@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OP(O)(O)=O)O1 GZQKNULLWNGMCW-PWQABINMSA-N 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 231100000053 low toxicity Toxicity 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 125000001570 methylene group Chemical group [H]C([H])([*:1])[*:2] 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 101150010534 moeA gene Proteins 0.000 description 1
- 101150021137 moeA1 gene Proteins 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 230000006780 non-homologous end joining Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 229940127073 nucleoside analogue Drugs 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- YHHSONZFOIEMCP-UHFFFAOYSA-O phosphocholine Chemical compound C[N+](C)(C)CCOP(O)(O)=O YHHSONZFOIEMCP-UHFFFAOYSA-O 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 229920000191 poly(N-vinyl pyrrolidone) Polymers 0.000 description 1
- 229920001308 poly(aminoacid) Polymers 0.000 description 1
- 229920002187 poly[N-2-(hydroxypropyl) methacrylamide] polymer Polymers 0.000 description 1
- 229920001281 polyalkylene Polymers 0.000 description 1
- 229920000223 polyglycerol Polymers 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 235000003702 sterols Nutrition 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 125000001273 sulfonato group Chemical group [O-]S(*)(=O)=O 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000012385 systemic delivery Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 150000003568 thioethers Chemical class 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 238000000870 ultraviolet spectroscopy Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Landscapes
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
本公开涉及修饰的引导RNA,其包含内部接头并用于体外和体内基因编辑方法中。
Description
本申请要求2021年6月10日提交的美国临时申请号63/209,273和2021年11月3日申请的美国临时申请号63/275,427的优先权益,所述申请各自的内容以全文引用的方式并入。
本申请含有序列表,所述序列表已以电子形式以ASCII格式提交并以全文引用的方式并入。所述ASCII副本创建于2022年6月8日,名为2022-06-08_01155-0047-00PCT_ST25.txt并且大小为501,605字节。
技术领域
本公开涉及使用CRISPR/Cas系统(识别并切割外源基因元件的原核免疫系统的一部分)进行基因编辑的领域。
背景技术
原核CRISPR/Cas系统依赖于具有RNA和DNA结合活性的核酸酶,或此类复合物的DNA结合亚基,其中DNA结合活性为序列特异性的并取决于RNA的序列。通常被称为RNA引导的DNA结合剂的此类复合物包含多种RNA引导的DNA结合剂,包括Cas裂解酶/切口酶。Cas裂解酶和Cas切口酶包括第III型CRISPR系统的Csm或Cmr复合物、其Cas10、Csm1或Cmr2亚基、第I型CRISPR系统的级联(Cascade)复合物、其Cas3亚基和第2类Cas核酸酶。示例性单体核酸酶,诸如Cas9(被称为CRISPR相关蛋白9(Cas9)),诱导DNA中的位点特异性断裂。引导RNA通常通过体外寡核苷酸合成来制备。考虑到寡核苷酸合成的环状性质和不完全产率,用非核酸内部接头取代gRNA的部分同时保留或甚至提高其活性将为合乎需要的,例如使得gRNA可以更高产率获得(例如,归因于核苷酸添加的较少循环),或使得包含gRNA的组合物具有较高同质性或较少不完全或不正确产物。另外,尤其对于治疗应用,需要用于防止此类降解、改善gRNA的稳定性并提高基因编辑效率的改善方法和组合物。
发明内容
在一些实施方案中,提供基因组编辑工具,其包含含有如本文所描述的内部接头的引导RNA(gRNA)。本申请源自非核酸接头可置换引导RNA中与Cas核酸酶具有非必需接触的某些内部部分的发现。本文所描述的取代可有助于以更高产率或均质性合成gRNA;或可改善gRNA和其对应核酸酶(例如gRNA/Cas复合物)的稳定性并提高Cas9(例如SauCas9、SpyCas9、CdiCas9、St1Cas9、SthCas9、AceCas9、CjeCas9、RpaCas9、RruCas9、AnaCas9、NmeCas9)、Cas12(例如AsCas12a、LbCpf1)或Cas13(例如EsCas13d)的活性以修饰靶DNA。
在一些实施方案中,提供具有一个或多个取代以包含一个或多个如本文所描述的内部接头的单引导RNA(sgRNA)。
在一些实施方案中,提供具有一个或多个取代以包含一个或多个如本文所描述的内部接头的crisprRNA(crRNA)或tracrRNA(trRNA)。在一些实施方案中,修饰的crRNA或修饰的trRNA包含双引导RNA(dgRNA)。在一些实施方案中,修饰的crRNA或修饰的trRNA包含单引导RNA(sgRNA)。用一个或多个如本文所描述的内部接头进行取代可有助于以更高产率或均质性合成gRNA;或可改善gRNA和其对应核酸酶(例如gRNA/Cas复合物,例如gRNA/Cas9复合物)的稳定性并提高核酸酶(例如Cas9核酸酶(例如SauCas9、SpyCas9))的活性例如以使靶DNA裂解或切口。与包含所有核苷酸的引导物,例如100聚体Spy Cas 9sgRNA或其他短引导Spy Cas9 RNA相比,本公开所公开的引导RNA的合成可增加引导RNA的粗产率。类似地,以全长产物的比例测量的gRNA样品纯度(例如粗纯度)可增加。gRNA可以较高产率获得,或包含gRNA的组合物可具有较高同质性或较少不完全或不正确产物。引导RNA纯度可使用离子对反相高效液相色谱法(IP-RP-HPLC)和离子交换HPLC方法评定,例如与Kanavarioti等人,Sci Rep 9,1019(2019)(doi:10.1038/s41598-018-37642-z)中相同。使用260nm波长下的UV光谱分析,可通过色谱图中主峰的吸收度与所有峰的累积吸光度的比率来测定粗纯度和最终纯度。合成产率是以最终样品在260nm下的吸光度与输入材料的理论吸光度的比率确定。
涵盖以下实施方案。
在一些实施方案中,提供一种引导RNA(gRNA),其包含内部接头。在一些实施方案中,内部接头取代gRNA的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸。在一些实施方案中,内部接头具有约3至30个、任选地12至21个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头具有约6至18个原子、任选地约6至12个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头取代2至12个核苷酸。
在一些实施方案中,内部接头位于gRNA的重复反重复区(repeat-anti-repeatregion)中。在一些实施方案中,内部接头取代gRNA的重复反重复区的至少4个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的多至28个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的2、3、4、5、6、7、8、9、10、11或12个核苷酸。
在一些实施方案中,内部接头位于gRNA的发夹区中。在一些实施方案中,内部接头取代gRNA的发夹区的至少2个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的至多22个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的1、2、3、4、5、6、7、8或9个碱基对。
在一些实施方案中,内部接头位于gRNA的连结点区(nexus region)中。在一些实施方案中,内部接头取代gRNA的连结点区的1或2个核苷酸。
在一些实施方案中,内部接头位于gRNA的第一部分与gRNA的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。在一些实施方案中,内部接头桥接双链体的第一部分与双链体的第二部分,其中所述双链体包含2至10个碱基对。
在一些实施方案中,gRNA包含两个内部接头。在一些实施方案中,gRNA包含三个内部接头。
在一些实施方案中,提供一种单引导RNA(sgRNA),所述sgRNA包含引导区和所述引导区的3'的保守部分,其中所述保守部分包含重复反重复区、连结点区、发夹1区和发夹2区,并且包含以下中的至少一者:
1)第一内部接头,其取代所述重复反重复区的上茎区的至少2个核苷酸;
2)第二内部接头,其取代所述连结点区的1或2个核苷酸;和
3)第三内部接头,其取代所述发夹1的至少2个核苷酸。
在一些实施方案中,提供一种单引导RNA(sgRNA),所述sgRNA包含引导区和所述引导区的3'的保守部分,其中保守部分包含重复反重复区、发夹1区和发夹2区,并且还包含以下中的至少一者:
1)第一内部接头,其取代所述sgRNA的所述重复反重复区的上茎区的至少2个核苷酸;
2)第二内部接头,其取代所述sgRNA的所述发夹1的1或2个核苷酸;或
3)第三内部接头,其取代所述sgRNA的所述发夹2的至少2个核苷酸。
在一些实施方案中,提供一种引导RNA(gRNA),所述gRNA包含引导区和所述引导区的3'的保守部分,其中所述保守部分包含重复反重复区、发夹1区和发夹2区,并且包含取代所述重复反重复区的至少2个核苷酸的第一内部接头和取代所述发夹2的至少2个核苷酸的第二内部接头。
在一些实施方案中,提供一种引导RNA(gRNA),所述gRNA包含引导区和所述引导区的3'的保守部分,其中所述保守部分包含重复反重复区和发夹区,并且包含取代所述重复反重复区的至少2个核苷酸的内部接头。
在一些实施方案中,提供一种引导RNA(gRNA),所述gRNA包含重复反重复区和取代所述重复反重复区的至少2个核苷酸的内部接头。
在一些实施方案中,内部接头包含至少两个彼此共价连接的乙二醇亚基。
以下为本文所提供的实施方案的非详尽列表。
实施方案1为一种引导RNA(gRNA),其包含内部接头。
实施方案2为如实施方案1所述的gRNA,其中所述内部接头取代所述gRNA的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸。
实施方案3为如实施方案1或2所述的gRNA,其中所述内部接头具有约3至30个原子、任选地12至21个原子的桥接长度,并且所述接头取代所述gRNA的至少2个核苷酸。
实施方案4为如实施方案1至3中任一项所述的gRNA,其中所述内部接头具有约6至18个原子、任选地约6至12个原子的桥接长度,并且所述接头取代所述gRNA的至少2个核苷酸。
实施方案5为如实施方案1至4中任一项所述的gRNA,其中所述内部接头取代2至12个核苷酸。
实施方案6为如实施方案1至5中任一项所述的gRNA,其中所述内部接头位于所述gRNA的重复反重复区中。
实施方案7为如实施方案1至6中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述重复反重复区的至少4个核苷酸。
实施方案8为如实施方案1至7中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述重复反重复区的多至28个核苷酸。
实施方案9为如实施方案1至8中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述重复反重复区的2、3、4、5、6、7、8、9、10、11或12个核苷酸。
实施方案10为如实施方案1至9中任一项所述的gRNA,其中所述内部接头位于所述gRNA的发夹区中。
实施方案11为如实施方案1至10中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述发夹区的至少2个核苷酸。
实施方案12为如实施方案1至11中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述发夹区的至多22个核苷酸。
实施方案13为如实施方案1至12中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述发夹区的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22个核苷酸。
实施方案14为如实施方案1至13中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述发夹区的1、2、3、4、5、6、7、8或9个碱基对。
实施方案15为如实施方案1至14中任一项所述的gRNA,其中所述内部接头位于所述gRNA的连结点区中。
实施方案16为如实施方案1至15中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述连结点区的1或2个核苷酸。
实施方案17为如实施方案1至16中任一项所述的gRNA,其中所述内部接头位于所述gRNA的第一部分与所述gRNA的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
实施方案18为如实施方案1至17中任一项所述的gRNA,其中所述内部接头桥接双链体的第一部分与双链体的第二部分,其中所述双链体包含2至10个碱基对。
实施方案19为如实施方案1至18中任一项所述的gRNA,其中所述gRNA包含两个内部接头。
实施方案20为如实施方案1至18中任一项所述的gRNA,其中所述gRNA包含三个内部接头。
实施方案21为如实施方案1至20中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头位于所述重复反重复区的第一部分与第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
实施方案22为如实施方案21所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸。
实施方案23为如实施方案21至22中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的至少4个核苷酸。
实施方案24为如实施方案21至23中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的至多28个核苷酸。
实施方案25为如实施方案21至24中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的4至20个核苷酸。
实施方案26为如实施方案21至25中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的4至14个核苷酸。
实施方案27为如实施方案21至26中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的4至6个核苷酸。
实施方案28为如实施方案21至27中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的环或其部分。
实施方案29为如实施方案21至28中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和茎或其部分。
实施方案30为如实施方案21至27中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环的2、3或4个核苷酸。
实施方案31为如实施方案21至27中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的至少1个核苷酸。
实施方案32为如实施方案21至31中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24个核苷酸。
实施方案33为如实施方案21至32中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的至少2个核苷酸。
实施方案34为如实施方案21至32中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的1、2、3、4、5、6、7或8个核苷酸。
实施方案35为如实施方案21至32中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的1、2、3、4、5、6、7、8、9、10、11或12个碱基对。
实施方案36为如实施方案21至32中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代构成所述发夹的所述环的所有核苷酸。
实施方案37为如实施方案21至32中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代构成所述发夹的所述环和茎的所有核苷酸。
实施方案38为如实施方案1至37中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述连结点区的1或2个核苷酸。
实施方案39为如实施方案1至38中任一项所述的gRNA,其中所述内部接头取代所述gRNA的发夹。
实施方案40为如实施方案39所述的gRNA,其中所述内部接头取代所述发夹的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22个核苷酸。
实施方案41为如实施方案39至40中任一项所述的gRNA,其中所述内部接头取代所述发夹的2至22个核苷酸。
实施方案42为如实施方案39至41中任一项所述的gRNA,其中所述内部接头取代所述发夹的2至12个核苷酸。
实施方案43为如实施方案39至42中任一项所述的gRNA,其中所述内部接头取代所述发夹的2至6个核苷酸。
实施方案44为如实施方案39至43中任一项所述的gRNA,其中所述内部接头取代所述发夹的2至4个核苷酸。
实施方案45为如实施方案39至44中任一项所述的gRNA,其中所述内部接头取代所述发夹的环或其部分。
实施方案46为如实施方案39至45中任一项所述的gRNA,其中所述内部接头取代所述发夹的所述环和茎或其部分。
实施方案47为如实施方案39至46中任一项所述的gRNA,其中所述内部接头取代所述发夹的所述环的2、3、4或5个核苷酸。
实施方案48为如实施方案39至47中任一项所述的gRNA,其中所述内部接头取代所述发夹的所述环和所述发夹的茎的至少1个核苷酸。
实施方案49为如实施方案39至48中任一项所述的gRNA,其中所述内部接头取代所述发夹的所述环和所述发夹的茎的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个核苷酸。
实施方案50为如实施方案39至49中任一项所述的gRNA,其中所述内部接头取代所述发夹的所述环和所述发夹的茎的至少2个核苷酸。
实施方案51为如实施方案39至50中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的至多18个核苷酸。
实施方案52为如实施方案39至51中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的1、2、3、4、5、6、7、8或9个碱基对。
实施方案53为如实施方案39至52中任一项所述的gRNA,其中所述内部接头取代构成所述发夹的所述环的所有核苷酸。
实施方案54为如实施方案39至53中任一项所述的gRNA,其中所述内部接头取代构成所述发夹的所述环和茎的所有核苷酸。
实施方案55为如实施方案39至54中任一项所述的gRNA,其中所述发夹为发夹1。
实施方案56为如实施方案39至54中任一项所述的gRNA,其中所述发夹为发夹2。
实施方案57为如实施方案39至54中任一项所述的gRNA,其中所述发夹为发夹1,并且所述内部接头取代所述发夹1。
实施方案58为如实施方案57所述的gRNA,其中所述gRNA还包含所述发夹1的3'的发夹2。
实施方案59为如实施方案58所述的gRNA,其中所述内部接头取代所述发夹2的环的至少2个核苷酸。
实施方案60为如实施方案58或59所述的gRNA,其中所述内部接头不取代所述发夹2。
实施方案61为如实施方案1至60中任一项所述的gRNA,其还包含引导区。
实施方案62为如实施方案61所述的gRNA,其中所述引导区的长度为17、18、19或20个核苷酸。
实施方案63为如实施方案1至62中任一项所述的gRNA,其中所述gRNA为单引导RNA(sgRNA)。
实施方案64为如实施方案1至62中任一项所述的gRNA,其中所述gRNA包含tracrRNA(trRNA)。
实施方案65为一种引导RNA(gRNA),其中所述gRNA为单引导RNA(sgRNA),其包含引导区和所述引导区的3'的保守部分,其中所述保守部分包含重复反重复区、连结点区、发夹1区和发夹2区,并且包含以下中的至少一者:
1)第一内部接头,其取代所述重复反重复区的上茎区的至少2个核苷酸;
2)第二内部接头,其取代所述连结点区的1或2个核苷酸;和
3)第三内部接头,其取代所述发夹1的至少2个核苷酸。
实施方案66为如实施方案65所述的gRNA,其中所述sgRNA包含所述第一内部接头和所述第二内部接头。
实施方案67为如实施方案65所述的gRNA,其中所述sgRNA包含所述第一内部接头和所述第三内部接头。
实施方案68为如实施方案65所述的gRNA,其中所述sgRNA包含所述第二内部接头和所述第三内部接头。
实施方案69为如实施方案65所述的gRNA,其中所述sgRNA包含所述第一内部接头、所述第二内部接头和所述第三内部接头。
实施方案70为如实施方案65至69中任一项所述的gRNA,其中所述第一内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。
实施方案71为如实施方案65至70中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的2、3、4、5、6、7、8、9、10、11或12个核苷酸。
实施方案72为如实施方案65至71中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的环或其部分。
实施方案73为如实施方案65至72中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和茎或其部分。
实施方案74为如实施方案65至73中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环的2、3或4个核苷酸。
实施方案75为如实施方案65至74中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和所述上茎区的茎的至少2、3、4、5、6、7或8个核苷酸。
实施方案76为如实施方案65至75中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和所述上茎区的茎的1、2、3或4个碱基对。
实施方案77为如实施方案65至76中任一项所述的gRNA,其中所述第一内部接头取代构成所述上茎区的所述环的所有核苷酸。
实施方案78为如实施方案65至77中任一项所述的gRNA,其中所述第一内部接头取代构成所述上茎区的所述环和茎的所有核苷酸。
实施方案79为如实施方案65至78中任一项所述的gRNA,其中所述第二内部接头具有约6至18个原子、任选地约6至12个原子的桥接长度。
实施方案80为如实施方案65至79中任一项所述的gRNA,其中所述第二内部接头取代所述sgRNA的所述连结点区的2个核苷酸。
实施方案81为如实施方案65至80中任一项所述的gRNA,其中所述第二内部接头取代所述sgRNA的所述连结点区的环的2个核苷酸。
实施方案82为如实施方案65至81中任一项所述的gRNA,其中所述第三内部接头具有约9至30个、任选地约12至21个原子的桥接长度。
实施方案83为如实施方案65至82中任一项所述的gRNA,其中所述第三内部接头取代所述gRNA的所述发夹1的2、3、4、5、6、7、8、9、10、11或12个核苷酸。
实施方案84为如实施方案65至83中任一项所述的gRNA,其中所述第三接头取代所述gRNA的所述发夹1的1、2、3、4或5个碱基对。
实施方案85为如实施方案65至84中任一项所述的gRNA,其中所述第三内部接头取代所述发夹1的环或其部分。
实施方案86为如实施方案65至85中任一项所述的gRNA,其中所述第三内部接头取代所述发夹1的所述环和茎或其部分。
实施方案87为如实施方案65至86中任一项所述的gRNA,其中所述第三内部接头取代所述发夹1的所述环的2、3或4个核苷酸。
实施方案88为如实施方案65至87中任一项所述的gRNA,其中所述第三内部接头取代所述发夹的所述环和所述发夹1的茎的至少1个核苷酸。
实施方案89为如实施方案65至88中任一项所述的gRNA,其中所述第三内部接头取代所述发夹的所述环和所述发夹1的茎的2、4或6个核苷酸。
实施方案90为如实施方案65至89中任一项所述的gRNA,其中所述重复反重复区中的所述第三内部接头取代所述发夹的所述环和所述发夹1的茎的1、2或3个碱基对。
实施方案91为如实施方案65至90中任一项所述的gRNA,其中所述第三内部接头取代构成所述发夹1的所述环的所有核苷酸。
实施方案92为如实施方案65至91中任一项所述的gRNA,其中所述第三内部接头取代构成所述发夹1的所述环和茎的所有核苷酸。
实施方案93为如实施方案65至92中任一项所述的gRNA,其中所述sgRNA的所述发夹2区不含有任何内部接头。
实施方案94为如实施方案65至93中任一项所述的gRNA,其中所述sgRNA为化脓链球菌(S.pyogenes)Cas9 sgRNA。
实施方案95为如实施方案65至94中任一项所述的gRNA,其中所述sgRNA包含含有SEQ ID NO:400的序列的保守部分。
实施方案96为如实施方案95所述的gRNA,其中相对于SEQ ID NO:400,核苷酸13至16(所述上茎区的US5至US8)中的2、3或4者被所述第一内部接头取代。
实施方案97为如实施方案95至96中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸12至17(所述上茎区的US4至US9)被所述第一内部接头取代。
实施方案98为如实施方案95至97中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸11至18(所述上茎区的US3至US10)被所述第一内部接头取代。
实施方案99为如实施方案95至98中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸10至19(所述上茎区的US2至US11)被所述第一内部接头取代。
实施方案100为如实施方案95至99中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸9至20(所述上茎区的US1至US12)被所述第一内部接头取代。
实施方案101为如实施方案95至100中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸36至37(所述连结点区的N6至N7)被所述第二内部接头取代。
实施方案102为如实施方案95至101中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸53至56(所述发夹1的H1-5至H1-8)中的2、3或4者被所述第三内部接头取代。
实施方案103为如实施方案95至102中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸52至57(所述发夹1的H1-4至H1-9)被所述第三内部接头取代。
实施方案104为如实施方案95至103中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸51至58(所述发夹1的H1-3至H1-10)被所述第三内部接头取代。
实施方案105为如实施方案95至104中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸50至59(所述发夹1的H1-1至H1-12)被所述第三内部接头取代。
实施方案106为如实施方案95至105中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸77至80缺失。
实施方案107为如实施方案65至94中任一项所述的gRNA,其中所述sgRNA包含SEQID NO:201的序列。
实施方案108为如实施方案107所述的gRNA,其中相对于SEQ ID NO:201,核苷酸33至36中的2、3或4者被所述第一内部接头取代。
实施方案109为如实施方案107至108中任一项所述的gRNA,其中相对于SEQ IDNO:201,核苷酸32至37被所述第一内部接头取代。
实施方案110为如实施方案107至109中任一项所述的gRNA,其中相对于SEQ IDNO:201,核苷酸31至38被所述第一内部接头取代。
实施方案111为如实施方案107至110中任一项所述的gRNA,其中相对于SEQ IDNO:201,核苷酸30至39被所述第一内部接头取代。
实施方案112为如实施方案107至111中任一项所述的gRNA,其中相对于SEQ IDNO:201,核苷酸29至40被所述第一内部接头取代。
实施方案113为如实施方案107至112中任一项所述的gRNA,其中相对于SEQ IDNO:201,核苷酸55至56被所述第二内部接头取代。
实施方案114为如实施方案107至113中任一项所述的gRNA,其中相对于核苷酸50至53中的2、3或4者SEQ ID NO:201被所述第三内部接头取代。
实施方案115为如实施方案107至114中任一项所述的gRNA,其中相对于SEQ IDNO:201,核苷酸49至54被所述第三内部接头取代。
实施方案116为如实施方案107至115中任一项所述的gRNA,其中相对于SEQ IDNO:201,核苷酸77至80缺失。
实施方案117为一种引导RNA(gRNA),其中所述gRNA为单引导RNA(sgRNA),其包含引导区和所述引导区的3'的保守部分,其中保守部分包含重复反重复区、发夹1区和发夹2区,并且还包含以下中的至少一者:
1)第一内部接头,其取代所述sgRNA的所述重复反重复区的上茎区的至少2个核苷酸;
2)第二内部接头,其取代所述sgRNA的所述发夹1的1或2个核苷酸;或
3)第三内部接头,其取代所述sgRNA的所述发夹2的至少2个核苷酸。
实施方案118为如实施方案117所述的gRNA,其中所述sgRNA包含所述第一内部接头和所述第二内部接头。
实施方案119为如实施方案117所述的gRNA,其中所述sgRNA包含所述第一内部接头和所述第三内部接头。
实施方案120为如实施方案117所述的gRNA,其中所述sgRNA包含所述第二内部接头和所述第三内部接头。
实施方案121为如实施方案117所述的gRNA,其中所述sgRNA包含所述第一内部接头、所述第二内部接头和所述第三内部接头。
实施方案122为如实施方案117至121中任一项所述的gRNA,其中所述第一内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。
实施方案123为如实施方案117至122中任一项所述的gRNA,其中所述第一内部接头位于所述sgRNA的第一部分与所述sgRNA的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
实施方案124为如实施方案117至123中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的2、3、4、5、6、7、8、9、10、11或12个核苷酸。
实施方案125为如实施方案117至124中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的环或其部分。
实施方案126为如实施方案117至125中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和茎或其部分。
实施方案127为如实施方案117至126中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环的2、3或4个核苷酸。
实施方案128为如实施方案117至127中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和所述上茎区的茎的至少2、4、6或8个核苷酸。
实施方案129为如实施方案117至128中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和所述上茎区的茎的1、2、3或4个碱基对。
实施方案130为如实施方案117至129中任一项所述的gRNA,其中所述第一内部接头取代构成所述上茎区的所述环的所有核苷酸。
实施方案131为如实施方案117至130中任一项所述的gRNA,其中所述第一内部接头取代构成所述上茎区的所述环和茎的所有核苷酸。
实施方案132为如实施方案117至131中任一项所述的gRNA,其中所述第二内部接头具有约6至18个原子、任选地约6至12个原子的桥接长度。
实施方案133为如实施方案117至132中任一项所述的gRNA,其中所述第二内部接头取代所述sgRNA的所述发夹1的2个核苷酸。
实施方案134为如实施方案117至133中任一项所述的gRNA,其中所述第二内部接头取代所述sgRNA的所述连结点区的茎区的2个核苷酸。
实施方案135为如实施方案117至134中任一项所述的gRNA,其中所述第三内部接头具有约9至30个、任选地约12至21个原子的桥接长度。
实施方案136为如实施方案117至135中任一项所述的gRNA,其中所述第三内部接头取代所述gRNA的所述发夹2的4、6、8、10或12个核苷酸。
实施方案137为如实施方案117至136中任一项所述的gRNA,其中所述第三接头取代所述gRNA的所述发夹2的1、2、3、4或5个碱基对。
实施方案138为如实施方案117至137中任一项所述的gRNA,其中所述第三内部接头取代所述发夹2的环或其部分。
实施方案139为如实施方案117至138中任一项所述的gRNA,其中所述第三内部接头取代所述发夹2的所述环和茎或其部分。
实施方案140为如实施方案117至139中任一项所述的gRNA,其中所述第三内部接头取代所述发夹2的所述环的2、3或4个核苷酸。
实施方案141为如实施方案117至140中任一项所述的gRNA,其中所述第三内部接头取代所述发夹的所述环和所述发夹2的茎的至少1个核苷酸。
实施方案142为如实施方案117至141中任一项所述的gRNA,其中所述第三内部接头取代所述发夹的所述环和所述发夹2的茎的2、4或6个核苷酸。
实施方案143为如实施方案117至142中任一项所述的gRNA,其中所述重复反重复区中的所述第三内部接头取代所述发夹的所述环和所述发夹2的茎的1、2或3个碱基对。
实施方案144为如实施方案117至143中任一项所述的gRNA,其中所述第三内部接头取代构成所述发夹2的所述环的所有核苷酸。
实施方案145为如实施方案117至144中任一项所述的gRNA,其中所述第三内部接头位于所述sgRNA的第一部分与所述sgRNA的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
实施方案146为如实施方案117至145中任一项所述的gRNA,其中所述gRNA为金黄色葡萄球菌(S.aureus)Cas9(SauCas9)引导RNA,并且不包含所述第三内部接头。
实施方案147为如实施方案117至146中任一项所述的gRNA,其中所述gRNA为白喉棒状杆菌(C.diphtheriae)Cas9(CdiCas9)引导RNA、嗜热链球菌(S.thermophilus)Cas9(St1Cas9)引导RNA或解纤维热酸菌(Acidothermus cellulolyticus)Cas9(AceCas9)引导RNA。
实施方案148为如实施方案117至147中任一项所述的gRNA,其中所述sgRNA包含SEQ ID NO:202的序列。
实施方案149为如实施方案148所述的gRNA,其中相对于SEQ ID NO:202,核苷酸35至38中的2、3或4者被所述第一内部接头取代。
实施方案150为如实施方案148至149中任一项所述的gRNA,其中相对于SEQ IDNO:202,核苷酸34至39被所述第一内部接头取代。
实施方案151为如实施方案148至150中任一项所述的gRNA,其中相对于SEQ IDNO:202,核苷酸33至40被所述第一内部接头取代。
实施方案152为如实施方案148至151中任一项所述的gRNA,其中相对于SEQ IDNO:202,核苷酸32至41被所述第一内部接头取代。
实施方案153为如实施方案148至152中任一项所述的gRNA,其中相对于SEQ IDNO:202,核苷酸31至42被所述第一内部接头取代。
实施方案154为如实施方案148至153中任一项所述的gRNA,其中相对于SEQ IDNO:202,核苷酸61至62被所述第二内部接头取代。
实施方案155为如实施方案148至154中任一项所述的gRNA,其中相对于SEQ IDNO:202,核苷酸84至87中的2、3或4者被所述第三内部接头取代。
实施方案156为如实施方案148至155中任一项所述的gRNA,其中相对于SEQ IDNO:202,核苷酸83至88被所述第三内部接头取代。
实施方案157为如实施方案148至156中任一项所述的gRNA,其中相对于SEQ IDNO:202,核苷酸82至89被所述第三内部接头取代。
实施方案158为如实施方案148至157中任一项所述的gRNA,其中相对于SEQ IDNO:202,核苷酸81至90被所述第三内部接头取代。
实施方案159为如实施方案148至158中任一项所述的gRNA,其中相对于SEQ IDNO:202,核苷酸97至100缺失。
实施方案160为一种引导RNA(gRNA),其包含引导区和所述引导区的3'的保守部分,其中所述保守部分包含重复反重复区、发夹1区和发夹2区,并且包含取代所述重复反重复区的至少2个核苷酸的第一内部接头和取代所述发夹2的至少2个核苷酸的第二内部接头。
实施方案161为如实施方案160所述的gRNA,其中所述第一内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。
实施方案162为如实施方案160至161中任一项所述的gRNA,其中所述第一内部接头取代所述gRNA的所述重复反重复区的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个核苷酸。
实施方案163为如实施方案160至162中任一项所述的gRNA,其中所述第一内部接头位于sgRNA的第一部分与所述重复反重复区的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
实施方案164为如实施方案160至163中任一项所述的gRNA,其中所述第一内部接头取代所述重复反重复区的所述发夹的环或其部分。
实施方案165为如实施方案160至164中任一项所述的gRNA,其中所述第一内部接头取代所述重复反重复区的所述发夹的所述环和茎或其部分。
实施方案166为如实施方案160至165中任一项所述的gRNA,其中所述第一内部接头取代所述重复反重复区的所述发夹的所述环的1、2、3或4个核苷酸。
实施方案167为如实施方案160至166中任一项所述的gRNA,其中所述第一内部接头取代所述发夹的所述环和所述重复反重复区的所述发夹的上茎的至少1、2、3、4、5、6、7、8、9、10、11、12、13或14个核苷酸。
实施方案168为如实施方案160至167中任一项所述的gRNA,其中所述第一内部接头取代所述发夹的所述环和所述重复反重复区的所述发夹的上茎的1、2、3、4、5、6或7个碱基对。
实施方案169为如实施方案160至168中任一项所述的gRNA,其中所述第一内部接头取代构成所述重复反重复区的所述发夹的所述环的所有核苷酸。
实施方案170为如实施方案160至169中任一项所述的gRNA,其中所述第一内部接头取代构成所述重复反重复区的所述发夹的所述环和上茎的所有核苷酸。
实施方案171为如实施方案160至169中任一项所述的gRNA,其中所述第一内部接头取代构成所述重复反重复区的所述环的所有核苷酸;并且所述重复反重复区的所述发夹的上茎包含至少一个碱基对,或不超过一个、两个或三个碱基对。
实施方案172为如实施方案160至171中任一项所述的gRNA,其中所述第二内部接头具有约9至30个、任选地约12至21个原子的桥接长度。
实施方案173为如实施方案160至172中任一项所述的gRNA,其中所述第二内部接头取代所述gRNA的所述发夹2的2、3、4、5、6、7、8、9或10个核苷酸。
实施方案174为如实施方案160至173中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的环区。
实施方案175为如实施方案160至174中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的环区和茎区的部分。
实施方案176为如实施方案160至175中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的环或其部分。
实施方案177为如实施方案160至176中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的所述环和茎或其部分。
实施方案178为如实施方案160至177中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的所述环的2、3或4个核苷酸。
实施方案179为如实施方案160至178中任一项所述的gRNA,其中所述第二内部接头取代构成所述发夹2的所述环的所有核苷酸。
实施方案180为如实施方案160至179中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的所述环和所述发夹2的茎的至少1、2、3、4、5或6个核苷酸。
实施方案181为如实施方案160至180中任一项所述的gRNA,其中所述第二内部接头取代所述发夹的所述环和所述发夹2的茎的1、2或3个碱基对。
实施方案182为如实施方案160至181中任一项所述的gRNA,其中所述gRNA为St1Cas9引导RNA。
实施方案183为如实施方案160至182中任一项所述的gRNA,其中所述sgRNA包含SEQ ID NO:204的序列。
实施方案184为如实施方案183所述的gRNA,其中相对于SEQ ID NO:204,核苷酸41至44被所述第一内部接头取代。
实施方案185为如实施方案183至184中任一项所述的gRNA,其中相对于SEQ IDNO:204,核苷酸101至103被所述第二内部接头取代。
实施方案186为如实施方案183至185中任一项所述的gRNA,其中相对于SEQ IDNO:204,核苷酸100至104被所述第二内部接头取代。
实施方案187为如实施方案183至186中任一项所述的gRNA,其中相对于SEQ IDNO:204,核苷酸99至105被所述第二内部接头取代。
实施方案188为如实施方案183至187中任一项所述的gRNA,其中相对于SEQ IDNO:204,核苷酸98至106被所述第二内部接头取代。
实施方案189为如实施方案183至188中任一项所述的gRNA,其中相对于SEQ IDNO:204,核苷酸94至111内的2至18个核苷酸被取代。
实施方案190为一种引导RNA(gRNA),其包含引导区和所述引导区的3'的保守部分,其中所述保守部分包含重复反重复区和发夹区,并且包含取代所述重复反重复区的至少2个核苷酸的内部接头。
实施方案191为如实施方案190所述的gRNA,其中第一内部接头具有约9至30个原子、任选地约12至21个原子的桥接长度。
实施方案192为如实施方案190或191中任一项所述的gRNA,其中所述第一内部接头取代所述gRNA的所述重复反重复区的2、3、4、5、6、7、8、9、10、11或12个核苷酸。
实施方案193为如实施方案190至192中任一项所述的gRNA,其中所述第一内部接头位于sgRNA的第一部分与所述重复反重复区的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
实施方案194为如实施方案190至193中任一项所述的gRNA,其中所述gRNA为空肠弯曲杆菌(C.jejuni)Cas9(CjeCas9)引导RNA。
实施方案195为如实施方案190至194中任一项所述的gRNA,其中所述gRNA为CjeCas9引导RNA,并且所述内部接头仅存在于所述gRNA的所述重复反重复区中。
实施方案196为如实施方案190至195中任一项所述的gRNA,其中所述sgRNA包含SEQ ID NO:207的序列。
实施方案197为如实施方案196所述的gRNA,其中相对于SEQ ID NO:207,核苷酸33至36被所述内部接头取代。
实施方案198为如实施方案196至197中任一项所述的gRNA,其中相对于SEQ IDNO:207,核苷酸27至32和37至42中的1、2、3、4、5或6个碱基对被所述内部接头取代。
实施方案199为如实施方案190至193中任一项所述的gRNA,其中所述gRNA为新凶手弗朗西斯氏菌(Francisella novicida)Cas9(FnoCas9)引导RNA。
实施方案200为如实施方案199所述的gRNA,其中所述sgRNA包含SEQ ID NO:208的序列。
实施方案201为如实施方案200所述的gRNA,其中相对于SEQ ID NO:208,核苷酸40至43中的2、3或4者被所述内部接头取代。
实施方案202为如实施方案200至201中任一项所述的gRNA,其中相对于SEQ IDNO:208,核苷酸39至44被所述内部接头取代。
实施方案203为一种引导RNA(gRNA),其包含重复反重复区和取代所述重复反重复区的至少2个核苷酸的内部接头。
实施方案204为如实施方案203所述的gRNA,其中所述内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。
实施方案205为如实施方案203至204中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述重复反重复区的2、3、4、5或6个核苷酸。
实施方案206为如实施方案203至205中任一项所述的组合物,其中所述gRNA为Cpf1引导RNA。
实施方案207为如实施方案206所述的组合物,其中所述Cpf1引导RNA为毛螺菌(Lachnospiraceae bacterium)Cpf1(LbCpf1)引导RNA或氨基酸球菌属(Acidaminococcussp.)Cpf1(AsCpf1)引导RNA。
实施方案208为如实施方案203至207中任一项所述的gRNA,其中sgRNA包含SEQ IDNO:209的序列,并且相对于SEQ ID NO:209,核苷酸11至14、或12至15、或任选地12至14被所述内部接头取代。
实施方案209为如实施方案203至205中任一项所述的组合物,其中所述引导RNA为惰性真杆菌(Eubacterium siraeum)(EsCas13d)引导RNA。
实施方案210为如实施方案203至205和209中任一项所述的gRNA,其中所述sgRNA包含SEQ ID NO:210的序列,并且相对于SEQ ID NO:210,核苷酸9至16、或任选地10至15、或其至少2个核苷酸被所述内部接头取代。
实施方案211为如实施方案1所述的gRNA,其中所述内部接头为第一内部接头、第二内部接头或第三内部接头;并且所述gRNA包含引导区和保守区,所述保守区包含以下中的一者或多者:
(a)缩短的重复/反重复区,其中所述缩短的重复/反重复区缺乏2至24个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸37至64中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸36通过以下连接至核苷酸65:(i)第一内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;或
(b)缩短的发夹1区,其中所述缩短的发夹1缺乏2至10个、任选地2至8个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸82至95中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸81通过以下连接至核苷酸96:(i)第二内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;或
(c)缩短的发夹2区,其中所述缩短的发夹2缺乏2至18个、任选地2至16个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸113至134中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸112通过以下连接至核苷酸135:(i)第三内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;
其中与SEQ ID NO:500相比,核苷酸144至145中的一者或两者任选地缺失。
实施方案212为一种引导RNA(gRNA),其包含引导区和保守区,所述保守区包含以下中的一者或多者:
(a)缩短的重复/反重复区,其中所述缩短的重复/反重复区缺乏2至24个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸37至64中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸36通过以下连接至核苷酸65:(i)第一内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;或
(b)缩短的发夹1区,其中所述缩短的发夹1缺乏2至10个、任选地2至8个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸82至95中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸81通过以下连接至核苷酸96:(i)第二内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;或
(c)缩短的发夹2区,其中所述缩短的发夹2缺乏2至18个、任选地2至16个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸113至134中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸112通过以下连接至核苷酸135:(i)第三内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;
其中与SEQ ID NO:500相比,核苷酸144至145中的一者或两者任选地缺失;
其中所述gRNA包含所述第一内部接头、所述第二内部接头和所述第三内部接头中的至少一者。
实施方案213为如实施方案211或212所述的gRNA,其中所述gRNA包含所述第一内部接头、所述第二内部接头和所述第三内部接头中的至少两者。
实施方案214为如实施方案211至213中任一项所述的gRNA,其中所述gRNA包含所述第一内部接头、所述第二内部接头和所述第三内部接头。
实施方案215为如实施方案211至214中任一项所述的gRNA,其中至少10个核苷酸为修饰的核苷酸。
实施方案216为如实施方案211至215中任一项所述的gRNA,其中所述引导区具有:(i)相对于SEQ ID NO:500,位置1至24内一个核苷酸的插入或1至4个核苷酸的缺失;或(ii)24个核苷酸的长度。
实施方案217为如实施方案211至216中任一项所述的gRNA,其中所述引导区具有25、24、23、22、21或20个核苷酸的长度,任选地其中所述引导区具有SEQ ID NO:500的位置1至24处的25、24、23或22个核苷酸的长度。
实施方案218为如实施方案217所述的gRNA,其中所述引导区具有SEQ ID NO:500的位置1至24处的23或24个核苷酸的长度。
实施方案219为如实施方案211至218中任一项所述的gRNA,其中所述gRNA还包含3'尾。
实施方案220为如实施方案219所述的gRNA,其中所述3'尾包含1、2、3、4、5、6、7、8、9或10个核苷酸。
实施方案221为如实施方案220所述的gRNA,其中所述3'尾包含1、2、3、4或5个核苷酸。
实施方案222为如实施方案219至221中任一项所述的gRNA,其中所述3'尾以包含尿嘧啶或修饰的尿嘧啶的核苷酸终止。
实施方案223为如实施方案219至222中任一项所述的gRNA,其中所述3'尾的长度为1个核苷酸。
实施方案224为如实施方案219至223中任一项所述的gRNA,其中所述3'尾由包含尿嘧啶或修饰的尿嘧啶的核苷酸组成。
实施方案225为如实施方案219至224中任一项所述的gRNA,其中所述3'尾包含存在于所述3'尾中的核苷酸中的任一者或多者的修饰。
实施方案226为如实施方案219至225中任一项所述的gRNA,其中所述3'尾的所述修饰为2'-O-甲基(2'-OMe)修饰的核苷酸和核苷酸之间的硫代磷酸酯(PS)键联中的一者或多者。
实施方案227为如前述实施方案219至226中任一项所述的gRNA,其中所述3'尾被完全修饰。
实施方案228为如实施方案211至227中任一项所述的gRNA,其中所述gRNA的3'核苷酸为包含尿嘧啶或修饰的尿嘧啶的核苷酸。
实施方案229为如实施方案211至228中任一项所述的gRNA,其中相对于SEQ IDNO:500,核苷酸144和145中的一者或多者缺失。
实施方案230为如实施方案211至229中任一项所述的gRNA,其中相对于SEQ IDNO:500,核苷酸144和145均缺失。
实施方案231为如实施方案211至218中任一项所述的gRNA,其中所述gRNA不包含3'尾。
实施方案232为如实施方案211至231中任一项所述的gRNA,其中所述缩短的重复/反重复区缺乏2至28个核苷酸。
实施方案233为如实施方案211至232中任一项所述的gRNA,其中所述缩短的重复/反重复区具有24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸的长度。
实施方案234为如实施方案211至233中任一项所述的gRNA,其中所述缩短的重复/反重复区缺乏12至28个、任选地18至24个核苷酸。
实施方案235为如实施方案211至234中任一项所述的gRNA,其中所述缩短的重复/反重复区具有24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个核苷酸的长度。
实施方案236为如实施方案211至235中任一项所述的gRNA,其中所述缩短的重复/反重复区具有24、25、26、27、28、29、30、31、32、33或34个核苷酸的长度。
实施方案237为如实施方案211至236中任一项所述的gRNA,其中SEQ ID NO:500的核苷酸37至64形成上茎,并且所述缩短的重复/反重复区的上茎的一个或多个碱基对缺失。
实施方案238为如实施方案211至237中任一项所述的gRNA,其中所述缩短的重复/反重复区的上茎包含不超过一个、两个、三个或四个碱基对。
实施方案239为如实施方案211至238中任一项所述的gRNA,其中所述缩短的重复/反重复区的上茎的位置39至48中的所有和位置53至62中的所有缺失,并且任选地核苷酸38或63被取代。
实施方案240为如实施方案211至239中任一项所述的gRNA,其中所述缩短的重复/反重复区的上茎的位置38至63中的所有缺失,并且任选地核苷酸37或64被取代。
实施方案241为如实施方案211至240中任一项所述的gRNA,其中所述缩短的重复/反重复区的上茎的核苷酸37至64中的所有缺失,并且任选地核苷酸36或65被取代。
实施方案242为如实施方案211至241中任一项所述的gRNA,其中所述缩短的重复/反重复区具有长度为11个碱基配对核苷酸的双链体部分。
实施方案243为如实施方案211至242中任一项所述的gRNA,其中所述缩短的重复/反重复区具有单一双链体部分。
实施方案244为如实施方案211至243中任一项所述的gRNA,其中相对于SEQ IDNO:500,所述缩短的重复/反重复区的上茎包含一个或多个取代。
实施方案245为如实施方案211至244中任一项所述的gRNA,其中所述第一内部接头取代核苷酸49至52中的至少一部分或所有。
实施方案246为如实施方案211至245中任一项所述的gRNA,其中核苷酸37至64中的所有缺失,并且所述第一接头将核苷酸36直接连接至核苷酸65。
实施方案247为如实施方案211至245中任一项所述的gRNA,其中核苷酸38至63中的所有缺失,并且所述第一接头将核苷酸37直接连接至核苷酸64。
实施方案248为如实施方案211至245中任一项所述的gRNA,其中核苷酸39至62中的所有缺失,并且所述第一接头将核苷酸38直接连接至核苷酸63。
实施方案249为如实施方案211至248中任一项所述的gRNA,其中所述缩短的重复/反重复区具有8至22个修饰的核苷酸。
实施方案250为如实施方案211至249中任一项所述的gRNA,其中所述缩短的发夹1区缺乏2至10个、任选地2至8个、或2至4个核苷酸。
实施方案251为如实施方案211至250中任一项所述的gRNA,其中所述缩短的发夹1区具有9、10、11、12、13、14、15、16、17、18、19、20或21个核苷酸的长度。
实施方案252为如实施方案211至251中任一项所述的gRNA,其中所述缩短的发夹1区具有长度为4至8个、任选地7至8个碱基配对核苷酸的双链体部分。
实施方案253为如实施方案211至252中任一项所述的gRNA,其中所述缩短的发夹1区具有单一双链体部分。
实施方案254为如实施方案211至253中任一项所述的gRNA,其中所述缩短的发夹1区的一个或两个碱基对缺失。
实施方案255为如实施方案211至254中任一项所述的gRNA,其中所述缩短的发夹1区的茎的长度为七个或八个碱基配对核苷酸。
实施方案256为如实施方案211至255中任一项所述的gRNA,其中所述缩短的发夹1区的位置85至86中的一者或多者和核苷酸91至92中的一者或多者缺失。
实施方案257为如实施方案211至256中任一项所述的gRNA,其中所述缩短的发夹1区的核苷酸86和91缺失。
实施方案258为如实施方案211至257中任一项所述的gRNA,其中相对于SEQ IDNO:500,所述缩短的发夹1区的核苷酸82至95中的一者或多者被取代。
实施方案259为如实施方案211至258中任一项所述的gRNA,其中所述第二内部接头取代核苷酸87至90中的至少一部分或所有。
实施方案260为如实施方案211至259中任一项所述的gRNA,其中所述第二内部接头取代核苷酸81至95中的至少一部分或所有。
实施方案261为如实施方案211至260中任一项所述的gRNA,其中所述缩短的发夹1区具有2至15个修饰的核苷酸。
实施方案262为如实施方案211至261中任一项所述的gRNA,其中所述缩短的发夹2区缺乏2至18个、任选地2至16个核苷酸。
实施方案263为如实施方案211至262中任一项所述的gRNA,其中所述缩短的发夹2区具有22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个核苷酸的长度。
实施方案264为如实施方案211至263中任一项所述的gRNA,其中所述缩短的发夹2区具有24、25、26、27、28、29、30、31、32、33或34个核苷酸的长度。
实施方案265为如实施方案211至264中任一项所述的gRNA,其中所述缩短的发夹2区的位置113至121中的一者或多者和核苷酸126至134中的一者或多者缺失。
实施方案266为如实施方案211至265中任一项所述的gRNA,其中所述缩短的发夹2区包含不成对区。
实施方案267为如实施方案211至266中任一项所述的gRNA,其中所述缩短的发夹2区具有两个双链体部分。
实施方案268为如实施方案267所述的gRNA,其中所述缩短的发夹2区具有长度为4个碱基配对核苷酸的双链体部分。
实施方案269为如实施方案267至268所述的gRNA,其中所述缩短的发夹2区具有长度为4至8个碱基配对核苷酸的双链体部分。
实施方案270为如实施方案267至269所述的gRNA,其中所述缩短的发夹2区具有长度为4至6个碱基配对核苷酸的双链体部分。
实施方案271为如实施方案211至270中任一项所述的gRNA,其中所述缩短的发夹2区的上茎包含一个、两个、三个或四个碱基对。
实施方案272为如实施方案211至271中任一项所述的gRNA,其中核苷酸113与134、核苷酸114与133、核苷酸115与132、核苷酸116与131、核苷酸117与130、核苷酸118与129、核苷酸119与128、核苷酸120与127和核苷酸121与126中的至少一对缺失。
实施方案273为如实施方案211至272中任一项所述的gRNA,其中所述缩短的发夹2区的位置113至121和126至134中的所有缺失。
实施方案274为如实施方案211至273中任一项所述的gRNA,其中相对于SEQ IDNO:500,所述缩短的发夹2区的核苷酸113至134中的一者或多者被取代。
实施方案275为如实施方案211至274中任一项所述的gRNA,其中所述第三内部接头取代核苷酸122至125中的至少一部分或所有。
实施方案276为如实施方案211至275中任一项所述的gRNA,其中所述第三内部接头取代核苷酸112至135中的至少一部分或所有。
实施方案277为如实施方案211至276中任一项所述的gRNA,其中所述缩短的发夹2区具有2至15个修饰的核苷酸。
实施方案278为如实施方案1至277中任一项所述的gRNA,其中所述gRNA的所述引导区包含至少两个修饰的核苷酸、任选地至少四个修饰的核苷酸。
实施方案279为如实施方案1至277中任一项所述的gRNA,其中所述gRNA的所述引导区包含1、2、3、4、5、6、7、8、9、10、11或12个修饰的核苷酸,任选地1、2或3个修饰的核苷酸。
实施方案280为如实施方案1至279中任一项所述的gRNA,其中所述gRNA的所述引导区包含4、5、6、7、8、9、10、11或12个修饰的核苷酸。
实施方案281为如实施方案1至280中任一项所述的gRNA,其中所述gRNA的所述引导区包含6、7、8、9、10、11或12个修饰的核苷酸。
实施方案282为如实施方案1至281中任一项所述的gRNA,其中所述gRNA包含5'端修饰。
实施方案283为如实施方案1至282中任一项所述的gRNA,其中所述gRNA包含5'端修饰和3'端修饰。
实施方案284为如实施方案1至283中任一项所述的gRNA,其中所述引导区在所述引导区的前三个核苷酸的3'不包含修饰的核苷酸。
实施方案285为如实施方案211至277中任一项所述的gRNA,其中所述引导区不包含修饰的核苷酸。
实施方案286为如实施方案1至285中任一项所述的gRNA,其中所述gRNA包含3'端修饰。
实施方案287为如实施方案1至286中任一项所述的gRNA,其包含所述重复/反重复区的所述上茎区中的修饰。
实施方案288为如实施方案1至287中任一项所述的gRNA,其包含所述发夹1区中的修饰。
实施方案289为如实施方案1至288中任一项所述的gRNA,其包含所述发夹2区中的修饰。
实施方案290为如实施方案1至289中任一项所述的gRNA,其包含3'端修饰,并且包含所述重复/反重复区的所述上茎区中的修饰。
实施方案291为如实施方案1至290中任一项所述的gRNA,其包含3'端修饰和所述发夹1区中的修饰。
实施方案292为如实施方案1至291中任一项所述的gRNA,其包含3'端修饰和所述发夹2区中的修饰。
实施方案293为如实施方案1至292中任一项所述的gRNA,其包含5'端修饰,并且包含所述重复/反重复区的所述上茎区中的修饰。
实施方案294为如实施方案1至293中任一项所述的gRNA,其包含5'端修饰和所述发夹1区中的修饰。
实施方案295为如实施方案1至294中任一项所述的gRNA,其包含5'端修饰和所述发夹2区中的修饰。
实施方案296为如实施方案1至295中任一项所述的gRNA,其包含5'端修饰、所述重复/反重复区的所述上茎区中的修饰和3'端修饰。
实施方案297为如实施方案1至296中任一项所述的gRNA,其包含5'端修饰、所述发夹1区中的修饰和3'端修饰。
实施方案298为如实施方案1至297中任一项所述的gRNA,其包含5'端修饰、所述发夹1区中的修饰、所述发夹2区中的修饰和3'端修饰。
实施方案299为如实施方案1至298中任一项所述的gRNA,其包含5'端修饰、所述重复/反重复区中的修饰、所述发夹1区中的修饰、所述发夹2区中的修饰和3'端修饰。
实施方案300为如实施方案282至299中任一项所述的gRNA,其中所述5'端修饰包含选自以下的修饰的核苷酸:2'-O-甲基(2'-OMe)修饰的核苷酸、2'-O-(2-甲氧基乙基)(2'-O-moe)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联、反向无碱基修饰的核苷酸或其组合。
实施方案301为如实施方案283至300中任一项所述的gRNA,其中所述3'端修饰包含选自以下的修饰的核苷酸:2'-O-甲基(2'-OMe)修饰的核苷酸、2'-O-(2-甲氧基乙基)(2'-O-moe)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联、反向无碱基修饰的核苷酸或其组合。
实施方案302为如实施方案282至301中任一项所述的gRNA,其中所述5'端修饰包含以下中的任一者:
i.前1、2、3或4个核苷酸中的任一者或多者的修饰;
ii.一个修饰的核苷酸;
iii.两个修饰的核苷酸;
iv.三个修饰的核苷酸;和
v.四个修饰的核苷酸。
实施方案303为如实施方案282至302中任一项所述的gRNA,其中所述5'端修饰包含以下中的一者或多者:
i.核苷酸之间的硫代磷酸酯(PS)键联;
ii.2'-OMe修饰的核苷酸;
iii.2'-O-moe修饰的核苷酸;
iv.2'-F修饰的核苷酸;和
v.反向无碱基修饰的核苷酸。
实施方案304为如实施方案283至303中任一项所述的gRNA,其中所述3'端修饰包含以下中的任一者:
i.最后4、3、2或1个核苷酸中的任一者或多者的修饰;
ii.一个修饰的核苷酸;
iii.两个修饰的核苷酸;
iv.三个修饰的核苷酸;和
v.四个修饰的核苷酸。
实施方案305为如实施方案283至304中任一项所述的gRNA,其中所述3'端修饰包含以下中的一者或多者:
i.核苷酸之间的硫代磷酸酯(PS)键联;
ii.2'-OMe修饰的核苷酸;
iii.2'-O-moe修饰的核苷酸;
iv.2'-F修饰的核苷酸;和
v.反向无碱基修饰的核苷酸。
实施方案306为如实施方案282至305中任一项所述的gRNA,其中所述5'端修饰包含至少一个PS键联,并且其中存在以下中的一者或多者:
i.存在一个PS键联,并且所述键联介于第一个核苷酸与第二个核苷酸之间;
ii.前三个核苷酸之间存在两个PS键联;
iii.前四个核苷酸中的任一者或多者之间存在PS键联;和
iv.前五个核苷酸中的任一者或多者之间存在PS键联。
实施方案307为如实施方案306所述的gRNA,其中所述5'端修饰还包含至少一个2'-OMe、2'-O-moe、反向无碱基或2'-F修饰的核苷酸。
实施方案308为如实施方案282至307中任一项所述的gRNA,其中所述5'端修饰包含:
i.前1至4个核苷酸中的一者或多者的修饰,其中所述修饰为PS键联、反向无碱基核苷酸、2'-OMe、2'-O-moe、2'-F或其组合;
ii.2'-OMe、2'-O-moe、2'-F或其组合对第一个核苷酸的修饰,和任选地存在的连至所述3'尾的下一核苷酸或第一个核苷酸的一个或两个PS键联;
iii.2'-OMe、2'-O-moe、2'-F或其组合对第一个或第二个核苷酸的修饰,和任选地存在的一个或多个PS键联;
iv.2'-OMe、2'-O-moe、2'-F或其组合对第一个、第二个或第三个核苷酸的修饰,和任选地存在的一个或多个PS键联;或
v.2'-OMe、2'-O-moe、2'-F或其组合对第一个、第二个、第三个或第四个核苷酸的修饰,和任选地存在的一个或多个PS键联。
实施方案309为如实施方案283至307中任一项所述的gRNA,其中所述3'端修饰包含至少一个PS键联,并且其中存在以下中的一者或多者:
i.存在一个PS键联,并且所述键联介于最后一个核苷酸与倒数第二个核苷酸之间;
ii.最后三个核苷酸之间存在两个PS键联;和
iii.最后四个核苷酸中的任一者或多者之间存在PS键联。
实施方案310为如实施方案309所述的gRNA,其中所述3'端修饰还包含至少一个2'-OMe、2'-O-moe、反向无碱基或2'-F修饰的核苷酸。
实施方案311为如实施方案283至310中任一项所述的gRNA,其中所述3'端修饰包含:
最后1至4个核苷酸中的一者或多者的修饰,其中所述修饰为PS键联、反向无碱基核苷酸、2'-OMe、2'-O-moe、2'-F或其组合;
2'-OMe、2'-O-moe、2'-F或其组合对最后一个核苷酸的修饰,和任选地存在的连至所述3'尾的下一核苷酸或第一个核苷酸的一个或两个PS键联;
2'-OMe、2'-O-moe、2'-F或其组合对最后一个或倒数第二个核苷酸的修饰,和任选地存在的一个或多个PS键联;
2'-OMe、2'-O-moe、2'-F或其组合对最后一个、倒数第二个或倒数第三个核苷酸的修饰,和任选地存在的一个或多个PS键联;或
2'-OMe、2'-O-moe、2'-F或其组合对最后一个、倒数第二个、倒数第三个或倒数第四个核苷酸的修饰,和任选地存在的一个或多个PS键联。
实施方案312为如实施方案287至311中任一项所述的gRNA,其中所述重复/反重复区、所述发夹1区或所述发夹2区中的修饰包含选自以下的修饰的核苷酸:2'-O-甲基(2'-OMe)修饰的核苷酸、2'-O-(2-甲氧基乙基)(2'-O-moe)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联或其组合。
实施方案313为如实施方案287至312中任一项所述的gRNA,其中所述重复/反重复区、所述发夹1区或所述发夹2区中的修饰包含选自以下的修饰的核苷酸:2'-O-甲基(2'-OMe)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联或其组合。
实施方案314为如实施方案287至313中任一项所述的gRNA,其中所述重复/反重复区、所述发夹1区或所述发夹2区中的修饰包含选自以下的修饰的核苷酸:2'-O-甲基(2'-OMe)修饰的核苷酸和核苷酸之间的硫代磷酸酯(PS)键联或其组合。
实施方案315为如实施方案1至314中任一项所述的gRNA,其中所述引导区的核苷酸1至3修饰的,并且所述引导区中除核苷酸1至3以外的核苷酸未被修饰。
实施方案316为如实施方案1至315中任一项所述的gRNA,其中核苷酸144的3'尾存在于所述gRNA中,并且包含核苷酸141至144处的2'-O-Me修饰的核苷酸和分别在核苷酸141至142和142至143之间的两个PS键联。
实施方案317为一种单引导RNA(sgRNA),其包含如表4A中所示的SEQ ID NO:1001-1012或任何其他序列中的任一者。
实施方案318为如实施方案1至317中任一项所述的gRNA,其包含与如表4A中所示的SEQ ID No:1001-1012或任何其他序列中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列。
实施方案319为如实施方案1至317中任一项所述的gRNA,其包含与如表4A至4B中所示的SEQ ID No:1001-1002和710-759中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列,其中与表4A中的参考序列标识符的核苷酸对应的所述gRNA的各核苷酸处的修饰与表4B中的参考序列标识符中所示的修饰相同或等同。
实施方案320为如实施方案1至319中任一项所述的gRNA,其包含与如表4A至4B中所示的SEQ ID No:1001-1002和710-759中任一者的核苷酸序列的X至3'端的序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%或90%同一性的核苷酸序列,其中X为保守区的第一个核苷酸。
实施方案321为如实施方案1至230和232至320中任一项所述的gRNA,其还包含含有2'-O-Me修饰的核苷酸的3'尾。
实施方案322为如实施方案1至321中任一项所述的gRNA,其中所述gRNA将核酸酶引导至靶序列以进行结合。
实施方案323为如实施方案1至322中任一项所述的gRNA,其中所述gRNA将核酸酶引导至靶序列以在所述靶序列内诱导双链断裂。
实施方案324为如实施方案1至323中任一项所述的gRNA,其中所述gRNA将核酸酶引导至靶序列以在所述靶序列内诱导单链断裂。
实施方案325为如实施方案322至324中任一项所述的gRNA,其中所述核酸酶为NmeCas9。
实施方案326为如实施方案325所述的组合物,其中所述Nme Cas9为Nme1Cas9、Nme2 Cas9或Nme3 Cas9。
实施方案327为如前述实施方案中任一项所述的gRNA,其中所述gRNA包含保守取代,例如以保持碱基配对。
实施方案328为如实施方案1至327中任一项所述的gRNA,其中所述内部接头具有约6埃(Angstrom)至37埃的桥接长度。
实施方案329为如实施方案1至328中任一项所述的gRNA,其中所述内部接头包含1至10个彼此共价连接的乙二醇亚基。
实施方案330为如实施方案1至329中任一项所述的gRNA,其中所述内部接头包含至少两个彼此共价连接的乙二醇亚基。
实施方案331为如实施方案1至330中任一项所述的gRNA,其中所述内部接头包含3至10个彼此共价连接的乙二醇亚基。
实施方案332为如实施方案1至331中任一项所述的gRNA,其中所述内部接头包含3至6个彼此共价连接的乙二醇亚基。
实施方案333为如实施方案1至332中任一项所述的gRNA,其中所述内部接头包含3个彼此共价连接的乙二醇亚基。
实施方案334为如实施方案1至333中任一项所述的gRNA,其中所述内部接头包含6个彼此共价连接的乙二醇亚基。
实施方案335为如实施方案1至334中任一项所述的gRNA,其中所述内部接头包含式(I)的结构:
~-L0-L1-L2-#
(I)
其中:
~指示连至前一核苷酸的3'取代基的键;
#指示连至后一核苷酸的5'取代基的键;
L0为空值或C1-3脂族基;
L1为-[E1-(R1)]m-,其中
各R1独立地为任选地被1或2个E2取代的C1-5脂族基团,
各E1和E2独立地为氢键受体,或各自独立地选自环烃和杂环烃,并且
各m为1、2、3、4、5、6、7、8、9或10;并且
L2为空值、C1-3脂族基,或为氢键受体。
实施方案336为如实施方案335所述的gRNA,其中m为6、7、8、9或10。
实施方案337为如实施方案335至336中任一项所述的gRNA,其中m为1、2、3、4或5。
实施方案338为如实施方案335至337中任一项所述的gRNA,其中m为1、2或3。
实施方案339为如实施方案335至338中任一项所述的gRNA,其中L0为空值。
实施方案340为如实施方案335至338中任一项所述的gRNA,其中L0为-CH2-或-CH2CH2-。
实施方案341为如实施方案335至340中任一项所述的gRNA,其中L2为空值。
实施方案342为如实施方案335至340中任一项所述的gRNA,其中L2为-O-、-S-、-CH2-或-CH2CH2-。
实施方案343为如实施方案335至342中任一项所述的gRNA,其中所述式(I)结构中~至#的路径上的最短原子链中的原子数目为30或更小、27或更小、24或更小、21或更小,或为18或更小,或为15或更小,或为12或更小,或为10或更小。
实施方案344为如实施方案335至343中任一项所述的gRNA,其中所述式(I)结构中~至#的路径上的最短原子链中的原子数目为6至30、任选地9至30、任选地9至21。
实施方案345为如实施方案335至344中任一项所述的gRNA,其中所述式(I)结构中~至#的路径上的最短原子链中的原子数目为9。
实施方案346为如实施方案335至344中任一项所述的gRNA,其中所述式(I)结构中~至#的路径上的最短原子链中的原子数目为18。
实施方案347为如实施方案335至346中任一项所述的gRNA,其中各C1-3脂族基团和C1-5脂族基团为饱和的。
实施方案348为如实施方案335至346中任一项所述的gRNA,其中至少一个C1-5脂族基团为C1-4亚烷基,或其中至少两个C1-5脂族基团为C1-4亚烷基,或其中至少三个C1-5脂族基团为C1-4亚烷基。
实施方案349为如实施方案335至348中任一项所述的gRNA,其中至少一个R1选自-CH2-、-CH2CH2-、-CH2CH2CH2-或-CH2CH2CH2CH2-。
实施方案350为如实施方案335至348中任一项所述的gRNA,其中各R1独立地选自-CH2-、-CH2CH2-、-CH2CH2CH2-或-CH2CH2CH2CH2-。
实施方案351为如实施方案335至350中任一项所述的gRNA,其中各R1为-CH2CH2-。
实施方案352为如实施方案335至351中任一项所述的gRNA,其中至少一个C1-5脂族基团为C1-4亚烯基,或其中至少两个C1-5脂族基团为C1-4亚烯基,或其中至少三个C1-5脂族基团为C1-4亚烯基。
实施方案353为如实施方案335至352中任一项所述的gRNA,其中至少一个R1选自-CHCH-、-CHCHCH2-或-CH2CHCHCH2-。
实施方案354为如实施方案335至353中任一项所述的gRNA,其中各E1独立地选自-O-、-S-、-NH-、-NR-、-C(O)-O-、-OC(O)O-、-C(O)-NR-、-OC(O)-NR-、-NC(O)-NR-、-P(O)2O-、-OP(O)2O-、-OP(R)(O)O-、-OP(O)(S)O-、-S(O)2-、环烃和杂环烃。
实施方案355为如实施方案335至354中任一项所述的gRNA,其中各E1独立地选自-O-、-S-、-NH-、-NR-、-C(O)-O-、-OC(O)O-、-P(O)2O-、-OP(O)2O-和-OP(R)(O)O。
实施方案356为如实施方案335至355中任一项所述的gRNA,其中各E1为-O-。
实施方案357为如实施方案335至355中任一项所述的gRNA,其中各E1为-S-。
实施方案358为如实施方案335至357中任一项所述的gRNA,其中R1中的至少一个C1-5脂族基团任选地被一个E2取代。
实施方案359为如实施方案335至358中任一项所述的gRNA,其中各E2独立地选自-OH、-OR、-ROR、-SH、-SR、-C(O)-R、-C(O)-OR、-OC(O)-OR、-C(O)-H、-C(O)-OH、-OPO3、-PO3、-RPO3、-S(O)2-R、-S(O)2-OR、-RS(O)2-R、-RS(O)2-OR、-SO3、环烃和杂环烃。
实施方案360为如实施方案335至359中任一项所述的gRNA,其中各E2独立地选自-OH、-OR、-SH、-SR、-C(O)-R、-C(O)-OR、-OC(O)-OR、-OPO3、-PO3、-RPO3和-SO3。
实施方案361为如实施方案335至360中任一项所述的gRNA,其中各E2为-OH或-OR。
实施方案362为如实施方案335至360中任一项所述的gRNA,其中各E2为-SH或-SR。
实施方案363为如实施方案335至362中任一项所述的gRNA,其中所述内部接头包含PEG-接头。
实施方案364为如实施方案335至363中任一项所述的gRNA,其中所述内部接头包含具有1至10个乙二醇单元的PEG-接头。
实施方案365为如实施方案335至364中任一项所述的gRNA,其中所述内部接头包含具有3至6个乙二醇单元的PEG-接头。
实施方案366为如实施方案335至365中任一项所述的gRNA,其中所述内部接头包含具有3个乙二醇单元的PEG-接头。
实施方案367为如实施方案335至365中任一项所述的gRNA,其中所述内部接头包含具有6个乙二醇单元的PEG-接头。
实施方案368为如实施方案1至367中任一项所述的gRNA,其中所述gRNA为包含缩短的保守部分的短引导RNA,并且所述内部接头取代至少2、3、4、5、6、7、8、9、10、11或12个核苷酸。
实施方案369为如实施方案1至210或278至368中任一项所述的gRNA,其中所述gRNA为包含sgRNA的保守部分的短单引导RNA(短sgRNA),所述保守部分包含发夹区,其中所述发夹区缺乏至少5至10个核苷酸。
实施方案370为如实施方案369所述的gRNA,其中所述至少5至10个所缺乏核苷酸为连续的。
实施方案371为如实施方案369至370中任一项所述的gRNA,其中所述至少5至10个所缺乏核苷酸
i.位于发夹1内;
ii.位于发夹1内和相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;
iii.位于发夹1内和紧邻发夹1的3'的两个核苷酸;
iv.包含发夹1的至少一部分;
v.位于发夹2内;
vi.包含发夹2的至少一部分;
vii.位于发夹1和发夹2内;
viii.包含发夹1的至少一部分并且包含相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;
ix.包含发夹2的至少一部分并且包含相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;
x.包含发夹1的至少一部分,包含相对于SEQ ID NO:400的发夹1与发夹2之间的“N”,并且包含发夹2的至少一部分;
xi.位于发夹1或发夹2内,任选地包含相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;
xii.为连续的;
xiii.为连续的并且包含相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;
xiv.为连续的并且跨越发夹1的至少一部分和发夹2的一部分;
xv.为连续的并且跨越发夹1的至少一部分和相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;或
xvi.为连续的并且跨越发夹1的至少一部分和紧邻发夹1的3'的两个核苷酸。
实施方案372为如实施方案1至210或278至371中任一项所述的gRNA,其中所述gRNA为包含sgRNA的保守部分的短单引导RNA(短sgRNA),所述保守部分包含发夹区,其中所述发夹区缺乏至少5至10个核苷酸,并且其中所述短sgRNA包含5'端修饰或3'端修饰。
实施方案373为如实施方案1至210或278至372中任一项所述的gRNA,其中所述至少5至10个核苷酸包含SEQ ID NO:400的核苷酸54至61、SEQ ID NO:400的核苷酸53至60;或SEQ ID NO:400的核苷酸54至58,任选地其中所述短sgRNA包含至少H1-1至H1-5和H2-1至H2-12的修饰。
实施方案374为如实施方案1至210或278至373中任一项所述的gRNA,其包含缩短的发夹1区或取代且任选地缩短的发夹1区,其中
(i)以下核苷酸对中的至少一者在所述取代且任选地缩短的发夹1中被沃森-克里克(Watson-Crick)配对核苷酸取代:H1-1与H1-12、H1-2与H1-11、H1-3与H1-10或H1-4与H1-9,并且所述发夹1区任选地缺乏
(aa)H1-5至H1-8中的任一者或两者,
(bb)以下核苷酸对中的一者、两者或三者:H1-1与H1-12、H1-2与H1-11、H1-3与H1-10或H1-4与H1-9,或
(cc)所述发夹1区的1至8个核苷酸;或
(ii)所述缩短的发夹1区缺乏6至8个核苷酸,优选地6个核苷酸;并且
(aa)位置H1-1、H1-2或H1-3中的一者或多者相对于SEQ ID NO:400缺失或被取代,或
(bb)位置H1-6至H1-10中的一者或多者相对于SEQ ID NO:400被取代;或
(iii)相对于SEQ ID NO:400,所述缩短的发夹1区缺乏5至10个核苷酸、优选地5至6个核苷酸,并且位置N18、H1-12或n中的一者或多者被取代。
实施方案375为如实施方案1至210或278至374中任一项所述的gRNA,其包含缩短的上茎区,其中相对于SEQ ID NO:400,所述缩短的上茎区缺乏1至6个核苷酸,并且其中所述缩短的上茎区的6、7、8、9、10或11个核苷酸包含少于或等于4个取代。
实施方案376为如实施方案1至210或278至375中任一项所述的gRNA,其在LS6、LS7、US3、US10、B3、N7、N15、N17、H2-2和H2-14中的任一者或多者处包含相对于SEQ ID NO:400的取代,其中所述取代核苷酸既不为后接腺嘌呤的嘧啶,也不为前接嘧啶的腺嘌呤。
实施方案377为如实施方案374所述的gRNA,其中所述缩短且取代的发夹1缺乏1至4个核苷酸,并且核苷酸H1-4至H1-9被内部接头取代。
实施方案378为如实施方案374所述的gRNA,其中所述缩短且取代的发夹1缺乏以下核苷酸对中的一者或两者:H1-1和H1-12、H1-2和H1-11或H1-3和H1-10;并且核苷酸H1-4至H1-9被内部接头取代。
实施方案379为如实施方案1至210或278至378中任一项所述的gRNA,其包含上茎区,其中上茎修饰包含所述上茎区中的US1至US12中的任一者或多者的修饰。
实施方案380为如实施方案1至210或278至379中任一项所述的gRNA,其包含缩短的上茎区,其中所述缩短的上茎区缺乏1至6个核苷酸。
实施方案381为如实施方案1至210或278至379中任一项所述的gRNA,其包含缩短的上茎区,其中所述缩短的上茎区缺乏7至10个核苷酸,并且2个核苷酸被内部接头取代。
实施方案382为如实施方案381所述的gRNA,其中茎不包含上茎双链体部分。
实施方案383为如实施方案381或382所述的gRNA,其中所述内部接头具有约3至30个原子、任选地12至21个原子、6至18个原子或6至12个原子的桥接长度。
实施方案384为如前述实施方案中任一项所述的gRNA,其中所述gRNA包含修饰。
实施方案385为如实施方案384所述的引导RNA,其中所述修饰包含2'-O-甲基(2'-O-Me)修饰的核苷酸、2'-F修饰的核苷酸、2'-H修饰的核苷酸(DNA)、2'-O,4'-C-亚乙基修饰的核苷酸(ENA)、锁定核苷酸(LNA)或非锁定核苷酸(UNA)。
实施方案386为如实施方案384或385所述的引导RNA,其中所述修饰包含核苷酸之间的硫代磷酸酯(PS)键。
实施方案387为如实施方案384至386中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的5'端处的五个核苷酸中的一者或多者处的修饰。
实施方案388为如实施方案384至387中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的3'端处的五个核苷酸中的一者或多者处的修饰。
实施方案389为如实施方案384至388中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的5'端处的四个核苷酸中的每一者之间的PS键。
实施方案390为如实施方案384至389中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的3'端处的四个核苷酸中的每一者之间的PS键。
实施方案391为如实施方案384至389中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的5'端处的前三个核苷酸中的每一者处的2'-O-Me修饰的核苷酸。
实施方案392为如实施方案384至390中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的3'端处的最后三个核苷酸中的每一者处的2'-O-Me修饰的核苷酸。
实施方案393为如前述实施方案中任一项所述的gRNA,其中所述gRNA的3'核苷酸为具有尿嘧啶碱基的核苷酸。
实施方案394为如前述实施方案中任一项所述的gRNA,其中所述gRNA包含3'尾。
实施方案395为如实施方案394所述的gRNA,其中所述3'尾包含至少1至10个核苷酸。
实施方案396为如实施方案394至395中任一项所述的gRNA,其中所述3'尾以具有尿嘧啶碱基的核苷酸终止。
实施方案397为如实施方案394至396中任一项所述的gRNA,其中所述3'尾的长度为1个核苷酸并且为具有尿嘧啶碱基的核苷酸。
实施方案398为如实施方案394至397中任一项所述的gRNA,其中所述3'尾包含存在于所述3'尾中的核苷酸中的任一者或多者的修饰。
实施方案399为如实施方案393至398所述的gRNA,其中所述3'尾被完全修饰。
实施方案400为如实施方案1至393中任一项所述的gRNA,其中所述gRNA不包含3'尾。
实施方案401为如前述实施方案中任一项所述的gRNA,其中所述gRNA包含3'端修饰或5'端修饰。
实施方案402为如前述实施方案中任一项所述的gRNA,其中所述gRNA包含5'端修饰和3'端修饰。
实施方案403为如实施方案401至402中任一项所述的gRNA,其中所述3'或5'端修饰包含保护性末端修饰,任选地为选自以下的修饰的核苷酸:2'-O-甲基(2'-OMe)修饰的核苷酸、2'-O-(2-甲氧基乙基)(2'-O-moe)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联、反向无碱基修饰的核苷酸或其组合。
实施方案404为如实施方案401至403中任一项所述的gRNA,其中所述3'或5'端修饰包含或还包含2'-O-甲基(2'-Ome)修饰的核苷酸。
实施方案405为如实施方案401至404中任一项所述的gRNA,其中所述3'或5'端修饰包含或还包含2'-氟(2'-F)修饰的核苷酸。
实施方案406为如实施方案401至405中任一项所述的gRNA,其中所述3'或5'端修饰包含或还包含核苷酸之间的硫代磷酸酯(PS)键联。
实施方案407为如实施方案401至406中任一项所述的gRNA,其中所述3'或5'端修饰包含或还包含反向无碱基修饰的核苷酸。
实施方案408为如前述实施方案中任一项所述的gRNA,其包含发夹区或所述发夹区中的修饰。
实施方案409为如实施方案408所述的gRNA,其包含所述发夹区中的修饰,其中所述发夹区中的所述修饰包含选自以下的修饰的核苷酸:2'-O-甲基(2'-Ome)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联或其组合。
实施方案410为如实施方案408或409所述的gRNA,其还包含3'端修饰。
实施方案411为如实施方案408或409所述的gRNA,其还包含3'端修饰和5'端修饰。
实施方案412为如实施方案408或409所述的gRNA,其还包含5'端修饰。
实施方案413为如实施方案408至412中任一项所述的gRNA,其中所述发夹区中的所述修饰包含或还包含2'-O-甲基(2'-Ome)修饰的核苷酸。
实施方案414为如实施方案408至413中任一项所述的gRNA,其中所述发夹区中的所述修饰包含或还包含2'-氟(2'-F)修饰的核苷酸。
实施方案415为如前述实施方案中任一项所述的gRNA,其包含上茎区或所述上茎区中的修饰。
实施方案416为如实施方案415所述的gRNA,其中上茎修饰包含以下中的任一者或多者:
i.所述上茎区中的US1至US12(对应于SEQ ID NO:400的核苷酸9至20)中的任一者或多者的修饰;和
ii.所述上茎区中的至少1、2、3、4、5、6、7、8、9、10、11或所有12个核苷酸的修饰。
实施方案417为如实施方案415或416所述的gRNA,其中所述上茎修饰包含以下中的一者或多者:
i.2'-OMe修饰的核苷酸;
ii.2'-O-moe修饰的核苷酸;
iii.2'-F修饰的核苷酸;
iv.2'-H修饰的核苷酸(DNA);
v.2'-O,4'-C-亚乙基修饰的核苷酸(ENA);
vi.锁定核苷酸(LNA);
vii.非锁定核苷酸(UNA);和
viii.(i.)至(vii.)中的一者或多者的组合。
实施方案418为如前述实施方案中任一项所述的gRNA,其中所述修饰包含YA修饰。
实施方案419为如前述实施方案中任一项所述的gRNA,其包含一个或多个引导区YA位点的YA修饰。
实施方案420为如实施方案418至419中任一项所述的gRNA,其中所述YA修饰包含YA位点的嘧啶被非嘧啶的取代。
实施方案421为如实施方案418至419中任一项所述的gRNA,其中所述YA修饰包含YA位点的腺嘌呤被非腺嘌呤的取代。
实施方案422为如实施方案418至421中任一项所述的gRNA,其包含YA修饰,其中所述修饰包含2'-氟、2'-H、2'-OMe、ENA、UNA、肌苷或PS修饰。
实施方案423为如前述实施方案中任一项所述的gRNA,其包含一个或多个保守区YA位点的YA修饰。
实施方案424为如前述实施方案中任一项所述的gRNA,其中所述YA修饰包含
(i)2'-OMe修饰,任选地属于所述YA位点的嘧啶;
(ii)2'-氟修饰,任选地属于所述YA位点的嘧啶;或
(iii)PS修饰,任选地属于所述YA位点的嘧啶。
实施方案425为如实施方案61至210或278至424中任一项所述的gRNA,其包含与SEQ ID NO:1-8、20-75、77-84、101-108、120-175和177-184中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列。
实施方案426为如实施方案61至210或278至425中任一项所述的gRNA,其包含与SEQ ID No:1-8、20-75、77-92、101-108和120-175和177-184中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列,其中与表2A中的参考序列标识符的核苷酸对应的所述gRNA的各核苷酸处的修饰与表2B中的参考序列标识符中所示的修饰相同或等同。
实施方案427为一种引导RNA(gRNA),其包含SEQ ID NO:1-8和20-75和77-84中的任一者。
实施方案428为如前述实施方案中任一项所述的gRNA,其包含针对表2A或表2B中的引导RNA所阐述的修饰。
实施方案429为一种引导RNA(gRNA),其包含SEQ ID NO:101-108和120-175和177-184中的任一者,包含表2A或表2B的修饰。
实施方案430为一种单引导RNA(sgRNA),其包含如表2A至2C中所示的SEQ ID NO:211-230或任何其他序列中的任一者。
实施方案431为如前述实施方案中任一项所述的gRNA,其包含与如表2A至2C中所示的SEQ ID No:211-230或任何其他序列中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列。
实施方案432为如前述实施方案中任一项所述的gRNA,其包含与如表2A至2C中所示的SEQ ID NO:101-108、120-175、177-184、211-230中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列,其中与表2C中的参考序列标识符的核苷酸对应的所述gRNA的各核苷酸处的修饰与表2A或2B中的参考序列标识符中所示的修饰相同或等同。
实施方案433为如前述实施方案中任一项所述的gRNA,其包含与如表2A至2C中所示的SEQ ID NO:101-108、120-175、177-184和211-230中任一者的核苷酸序列的X至3'端的序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%或90%同一性的核苷酸序列,其中X为保守区的第一个核苷酸。
实施方案434为如前述实施方案中任一项所述的gRNA,其中所述gRNA与脂质纳米颗粒(LNP)缔合。
实施方案435为一种组合物,其包含如前述实施方案中任一项所述的gRNA。
实施方案436为一种组合物,其包含如实施方案1至434中任一项所述的gRNA,与脂质纳米颗粒(LNP)缔合。
实施方案437为一种组合物,其包含如实施方案1至434中任一项所述的gRNA,或如实施方案435至436中任一项所述的组合物,其还包含核酸酶或编码所述核酸酶的mRNA。
实施方案438为一种LNP组合物,其包含如实施方案1至434中任一项所述的gRNA。
实施方案439为一种LNP组合物,其包含如实施方案63至116和278至433中任一项所述的gRNA和编码SpyCas9的mRNA。
实施方案440为一种LNP组合物,其包含如实施方案117至159和278至433中任一项所述的gRNA和编码SauCas9的mRNA。
实施方案441为一种LNP组合物,其包含如实施方案160至189和278至433中任一项所述的gRNA和编码St1Cas9的mRNA。
实施方案442为一种LNP组合物,其包含如实施方案190至202和278至433中任一项所述的gRNA和编码CjeCas9或FnoCas9的mRNA。
实施方案443为一种LNP组合物,其包含如实施方案203至210和278至433中任一项所述的gRNA和编码AsCpf1、LbCpf1或EsCas13d的mRNA。
实施方案444为如实施方案438至443中任一项所述的LNP组合物,其中所述LNP包含十八碳-9,12-二烯酸(9z,12z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯或8-((7,7-双(辛氧基)庚基)(2-羟乙基)氨基)辛酸壬酯。
实施方案445为如实施方案438至444中任一项所述的组合物,其中所述LNP包含摩尔比为约4.5至6.5的阳离子脂质胺与RNA磷酸酯(N:P),任选地约6.0的N:P。
实施方案446为如实施方案438至445所述的组合物,其中所述核酸酶包含蛋白质或编码所述核酸酶的核酸。
实施方案447为如实施方案446所述的组合物,其中所述核酸酶为Cas核酸酶。
实施方案448为如实施方案447所述的组合物,其中所述Cas核酸酶为Cas9。
实施方案449为如实施方案448所述的组合物,其中所述Cas9为化脓链球菌Cas9(SpyCas9)。
实施方案450为如实施方案448所述的组合物,其中所述Cas9为金黄色葡萄球菌Cas9(SauCas9)。
实施方案451为如实施方案448所述的组合物,其中所述Cas9为白喉棒状杆菌Cas9(CdiCas9)。
实施方案452为如实施方案448所述的组合物,其中所述Cas9为嗜热链球菌Cas9(St1Cas9)。
实施方案453为如实施方案448所述的组合物,其中所述Cas9为解纤维热酸菌Cas9(AceCas9)。
实施方案454为如实施方案448所述的组合物,其中所述Cas9为空肠弯曲杆菌Cas9(CjeCas9)。
实施方案455为如实施方案448所述的组合物,其中所述Cas9为沼泽红假单胞菌(R.palustris)Cas9(RpaCas9)。
实施方案456为如实施方案448所述的组合物,其中所述Cas9为深红红螺菌(R.rubrum)Cas9(RruCas9)。
实施方案457为如实施方案448所述的组合物,其中所述Cas9为纳士放线菌(A.naeslundii)Cas9(AnaCas9)。
实施方案458为如实施方案448所述的组合物,其中所述Cas9为新凶手弗朗西斯氏菌Cas9(FnoCas9)。
实施方案459为如实施方案448所述的组合物,其中所述Cas核酸酶为Cpf1。
实施方案460为如实施方案459所述的组合物,其中所述Cpf1为毛螺菌Cpf1(LbCpf1),或所述Cpf1为氨基酸球菌属Cpf1(AsCpf1)。
实施方案461为如实施方案448所述的组合物,其中Cas蛋白为惰性真杆菌Cas13d(EsCas13d)。
实施方案462为如实施方案448所述的组合物,其中所述Cas9为Nme Cas9。
实施方案463为如实施方案462所述的组合物,其中所述Cas9为Nme1 Cas9、Nme2Cas9或Nme3 Cas9。
实施方案464为如实施方案439至463中任一项所述的组合物,其中所述核酸酶为裂解酶、切口酶或无催化活性的核酸酶,或为包含脱氨酶的融合蛋白。
实施方案465为如实施方案439至464中任一项所述的组合物,其中所述核酸酶修饰的。
实施方案466为如前一实施方案所述的组合物,其中所述修饰的核酸酶包含核定位信号(NLS)。
实施方案467为如实施方案439至466所述的组合物,其中编码所述核酸酶的所述核酸选自:
a.DNA编码序列;
b.具有开放阅读框架(ORF)的mRNA;
c.表达载体中的编码序列;
d.病毒载体中的编码序列。
实施方案468为如前一实施方案所述的组合物,其中所述mRNA包含SEQ ID NO:321-323、361、363-372和374-382中任一项所述的序列。
实施方案469为一种药物制剂,其包含如实施方案1至434中任一项所述的gRNA或如实施方案435至468中任一项所述的组合物和药学上可接受的载剂。
实施方案470为一种修饰靶DNA的方法,其包括将以下中的任一者或多者递送至细胞:i.如实施方案1至434中任一项所述的gRNA;ii.如实施方案435至468中任一项所述的组合物;和iii.如实施方案469所述的药物制剂。
实施方案471为如实施方案470所述的方法,其中所述gRNA包含不超过110、115、110、105、100、95、90、85、80、75、70、65、60、55、50、45或40个核苷酸。
实施方案472为如实施方案470或471所述的方法,其中所述方法引起基因的插入或缺失。
实施方案473为如实施方案472所述的方法,其中所述方法引起碱基编辑的插入或缺失。
实施方案474为如实施方案470至473中任一项所述的方法,其还包含将模板递送至所述细胞,其中所述模板的至少一部分在Cas蛋白所诱导的双链断裂位点处或附近并入至靶DNA中。
实施方案475为如实施方案1至434中任一项所述的gRNA、如实施方案435至468所述的组合物或如实施方案469所述的药物制剂,其用于制备供治疗疾病或病症所用的药剂。
实施方案476为如实施方案1至427中任一项所述的gRNA、如实施方案435至468的组合物或如实施方案469的药物制剂用于制造治疗疾病或病症的药剂的用途。
实施方案477为一种化学合成的gRNA,其包含内部接头。
实施方案478为一种组合物,其包含如实施方案1至434中任一项所述的gRNA,其中所述组合物不包含所述gRNA的非连接部分。
实施方案479为一种固体载体,其共价连接至如实施方案1至434中任一项所述的gRNA的接头。
实施方案480为一种合成包含内部接头的gRNA的方法,其中所述方法为单合成过程。
实施方案481为一种合成gRNA的方法,其中内部接头在合成期间在线并入。
实施方案482为一种合成gRNA的方法,其使用一系列连续偶合反应,其中所述反应包括:
a)用于第一核苷酸与第二核苷酸的共价连接的偶合反应;
b)用于内部接头与所述第二核苷酸的共价连接的偶合反应;和
c)用于第三核苷酸与所述内部接头的共价连接的偶合反应,
其中用于所述共价连接的偶合反应全部相同。
实施方案483为如实施方案482所述的方法,其中使用亚磷酰胺化学方法进行共价连接。
实施方案484为如前述实施方案中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述gRNA为化学合成的。
实施方案485为如前述实施方案中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述内部接头在所述gRNA的化学合成期间经由偶合反应并入所述gRNA中。
实施方案486为如前述实施方案中任一项所述的gRNA、组合物、制剂、方法或用途,其通过包括添加所述内部接头的过程,通过使包含亚磷酰胺部分的接头与核苷残基反应来制备。
实施方案487为如前一实施方案所述的gRNA、组合物、制剂、方法或用途,其中所述过程还包括使包含亚磷酰胺部分的核苷酸与所述接头反应。
实施方案488为如前述实施方案中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述内部接头通过磷酸二酯或硫代磷酸酯键共价接合至相邻核苷酸。
实施方案489为如前述实施方案中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述内部接头中不存在尿素。
实施方案490为如前述实施方案中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述内部接头不位于所述gRNA的所述重复反重复区中。
实施方案491为如前述实施方案中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述gRNA包含不位于所述引导物的重复反重复中的内部接头。
实施方案492为如前述实施方案中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述gRNA为sgRNA。
实施方案493为如前述实施方案中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述内部接头桥接双链体区并取代2至12个核苷酸。
实施方案494为如前述实施方案中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述gRNA在单合成中制得。
附图说明
图1A至图1C示出在(A)原代小鼠肝细胞(PMH)、(B)原代食蟹猴肝细胞(PCH)和(C)原代人类肝细胞(PHH)中,具有使用脂质体转染体外递送的内部接头的指定引导物的编辑%。
图2A和图2B示出实验的(A)组1和(B)组2的编辑%结果的剂量反应曲线,其中使用脂质体转染将具有内部接头的引导物体外递送至PCH。
图3A和图3B示出实验的编辑%结果的剂量反应曲线,其中使用脂质体转染将具有内部接头的引导物体外递送至(A)PMH和(B)PCH。
图4A至图4C示出实验的编辑%结果的剂量反应曲线,其中使用脂质体转染将具有内部接头的引导物体外递送至(A)PMH、(B)PCH和(C)PRH。
图5A和图5B示出体内小鼠研究的结果,其提供以0.1mg/kg的总RNA的剂量施用的具有内部接头的指定引导物的(A)编辑%和(B)血清TTR浓度(ug/ml)。
图6示出体内小鼠研究的结果,其提供以0.1mg/kg或0.03mg/kg的总RNA的剂量施用的具有内部接头的指定引导物的编辑%。
图7示出体内小鼠研究的结果,其提供以0.1mg/kg或0.03mg/kg的总RNA的剂量施用的具有内部接头的指定引导物的编辑%。
图8A和图8B示出体内大鼠研究的结果,其提供以0.1mg/kg或0.03mg/kg的总RNA的剂量施用的具有内部接头的指定引导物的(A)编辑%和(B)血清TTR浓度(ug/ml)。
图9示出与先前附图中所呈现的研究结果匹配的具有内部接头的各种Spy Cas9引导物的图示。
图10A至图10E示出(A)Spy Cas9、(B)Sau Cas9、(C)AsCas12A(AsCpf1)、(D)EsCas13D和(E)NmeCas9的示例性引导物结构(接头未示出),其指示靶向区(具有虚线轮廓的灰色填充,不适合内部接头取代)、不适合内部接头取代的碱基(具有实线轮廓的灰色填充)、适合单一或成对缺失的碱基(空心圆)、适合被长接头取代的碱基(具有实线轮廓的格子图案填充)和适合被短接头取代的碱基(具有实线轮廓的交叉影线填充)。
图11示出示例性sgRNA(SEQ ID NO:300,甲基化未示出)的可能二级结构,其中标记标识sgRNA的保守区的个别核苷酸,包括下茎、隆突、上茎、连结点(其核苷酸依5'至3'方向分别可称作N1至N18)和发夹区,所述发夹区包括发夹1区和发夹2区。发夹1与发夹2之间的核苷酸标记为n。引导区可存在于sgRNA上并且在此图中指示为sgRNA的保守区之前的“(N)x”。
图12A示出使用不同比率的sgRNA和Nme2Cas9 mRNA时PMH中的TTR基因座处的平均编辑百分比。
图12B示出使用不同比率的pgRNA和Nme2Cas9 mRNA时PMH中的TTR基因座处的平均编辑百分比。
图13示出针对pgRNA与Nme2Cas9 mRNA,PMH中的TTR基因座处的平均编辑百分比。
图14A示出针对在引导序列中具有2'-OMe修饰的pgRNA与Nme2Cas9mRNA,PMH中的TTR外显子1处的平均编辑百分比。
图14B示出针对在引导序列中具有2'-OMe修饰的pgRNA与Nme2Cas9mRNA,PMH中的TTR外显子3处的平均编辑百分比。
图14C示出针对在引导序列中具有轻链2'-OMe修饰的pgRNA与Nme2Cas9mRNA,PMH中的TTR外显子1处的平均编辑百分比。
图14D示出针对在引导序列中具有轻链2'-OMe修饰的pgRNA与Nme2Cas9mRNA,PMH中的TTR外显子3处的平均编辑百分比。
图15示出用设计成具有1或2个核定位序列的NmeCas9构建体处理的PMH细胞中的小鼠TTR基因座处的平均编辑百分比。
图16示出用pgRNA和各种Nme2Cas9 mRNA处理的PMH细胞中的小鼠TTR基因座处的平均编辑百分比。
图17A示出用pgRNA和Nme2Cas9处理后小鼠肝脏中的TTR基因座处的平均编辑百分比。
图17B示出用pgRNA和Nme2Cas9处理后的平均血清TTR蛋白质。
图17C示出用pgRNA和Nme2Cas9处理后的平均TTR阻断百分比。
图17D示出用pgRNA和各种Nme2Cas9处理后小鼠肝脏中的TTR基因座处的平均编辑百分比。
图17E示出用pgRNA和各种Nme2Cas9处理后的血清TTR蛋白质阻断。
图18示出用pgRNA和各种Nme2Cas9处理后小鼠肝脏中的平均编辑百分比。
图19示出用各种碱基编辑器处理后小鼠肝脏中的平均编辑百分比。
图20示出用各种修饰的pgRNA和SpyCas9 mRNA处理后人类肝细胞瘤(Huh7)中的HEK3基因座处的平均编辑百分比。
具体实施方式
本文提供用于基因编辑方法中的包含内部接头的引导RNA(gRNA)。工程化并测试的gRNA的序列的实例示出于表2A至2B中。
本文所提供的某些gRNA为用于基因编辑方法中的包含内部接头的双引导RNA(dgRNA)。
本文所提供的某些gRNA为用于基因编辑方法中的包含内部接头的单引导RNA(sgRNA)。
本公开进一步提供这些gRNA(例如sgRNA、dgRNA或crRNA)用于体外(例如在体外培养的细胞,其用于离体疗法,或基因编辑细胞的其他用途)或在受试者(诸如人类)的细胞中(例如用于体内疗法)改变靶核酸的基因组的用途。
sgRNA名称有时用紧接着G之后的一个或多个前置零提供。此不影响名称的含义。因此,举例而言,G000282、G0282、G00282和G282是指相同sgRNA。类似地,crRNA和或trRNA名称有时分别用紧接着CR或TR之后的一个或多个前置零提供,其不影响名称的含义。因此,举例而言,CR000100、CR00100、CR0100和CR100是指相同crRNA,并且TR000200、TR00200、TR0200和TR200是指相同trRNA。
I.定义
冠词“一个/种(a/an)”在本文中用以指代冠词的一个或多过一个(即,至少一个)文法对象。举例而言,“一个要素”意指一个要素或多于一个要素,例如多个要素。
术语“包括”在本文中用于意指短语“包括但不限于”并且可与其互换使用。
除非上下文另外明确指示,否则术语“或”在本文中用于意指术语“和/或”并且可与其互换使用。举例而言,“有义链或反义链”应理解为“有义链或反义链或有义链和反义链”。
术语“约”在本文中用于意指在本领域中的许可差的典型范围内。举例而言,“约”可理解为与平均值差约2个标准差。在某些实施方案中,约意指±10%。在某些实施方案中,约意指+5%、+2%或+1%。当约存在于一系列数或范围之前时,应理解,“约”可修饰所述系列或范围中的数中的每一者。至少,并且不试图将均等论的应用限于权利要求书的范围,各数值参数至少应根据所报导的有效数位的个数并通过应用普通舍入技术来解释。
一个数或一系列数前的术语“至少”应理解为包括与术语“至少”相邻的数和可逻辑地包括在内的所有后续数或整数,如上下文所明示。举例而言,核酸分子中的核苷酸数目必须为整数。举例而言,“20个核苷酸的核酸分子的至少17个核苷酸”意指17、18、19或20个核苷酸具有指定特性。当至少存在于一系列数或范围之前时,应理解,“至少”可修饰所述系列或范围中的数中的每一者。
如本文所用,“不超过”或“小于”应理解为与短语相邻的值,和上下文逻辑所示的合理较低值或整数至零。举例而言,“不超过2个核苷酸碱基对”的双链体区具有2、1或0个核苷酸碱基对。当“不超过”或“小于”存在于一系列数或范围之前时,应理解,所述系列或范围中的数中的每一者被修饰。
如本文所用,范围包括上限和下限两者。
如本文所用,应理解,当值的最大量由100%(例如100%抑制)表示时,所述值受检测方法限制。举例而言,100%抑制应理解为抑制至低于分析的检测水平的水平。
如本文所用,“编辑效率”或“编辑百分比(editing percentage/percentediting)”为通过Cas RNP裂解或切口之后,所关注的靶区中具有核苷酸的插入、缺失或碱基变化的序列读段总数目相对于序列读段总数目的比率。
如本文所用,“区”描述核酸的部分。区也可称为“模块”或“结构域”。sgRNA的区可执行特定功能,例如引导RNP的核酸内切酶活性,例如如Briner AE等人,Molecular Cell56:333-339(2014)中所描述;或具有预测结构。sgRNA的示例性区描述于表3中。
如本文所用,“发夹”或“发夹结构”描述当核酸链折叠并与同一链的另一段形成碱基对时所产生的核酸双链体。发夹可形成包含环或U形的结构。在一些实施方案中,发夹可包含RNA环。发夹可经由单一核酸分子中的两个互补序列结合在一起、在分子折叠或褶皱的情况下形成。在一些实施方案中,发夹包含茎或茎环结构。在一些实施方案中,发夹包含环和茎。如本文所用,当两个发夹存在于gRNA中时,“发夹区”可指sgRNA的保守部分的发夹1和发夹2以及发夹1与发夹2之间的插入序列(例如“n”)。
如本文所用,“形成双链体部分”应理解为能够形成不间断的双链体部分或预测形成不间断的双链体部分,例如通过碱基配对。双链体部分可包含两个互补序列,例如第一发夹茎区和与所述第一发夹茎区互补的第二发夹茎区。如本文所用,双链体部分具有至少2个碱基对的长度。双链体部分任选地包含2至10个碱基对,并且形成所述双链体部分的两个链可例如通过核苷酸环接合。双链体中的碱基配对可包括沃森-克里克碱基配对,任选地与碱基层叠组合。如本文所用,双链体部分可包括一链上的单核苷酸不连续部分,其中一链上的各邻接核苷酸与互补链上的核苷酸碱基配对,所述互补链可具有一个非碱基配对的核苷酸的不连续部分,例如如发夹1中的SEQ ID NO:500的核苷酸96中,其中所述不连续部分直接侧接具有沃森-克里克碱基对的5'和3'。此不同于重复反重复区中的不成对核苷酸36和65,和发夹2中的不成对核苷酸106至108和139,所述不成对核苷酸构成产生如本文所定义的两个双链体部分的不连续部分。RNA结构为本领域中熟知的,并且工具可用于RNA的结构预测(参见例如Sato等人,Nature Comm.12:941(2021);rna.urmc.rochester.edu/RNAstructureWeb/Servers/Predict1/Predict1.html处的RNAstructure和rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi处的RNAfold WebServer)。准许折叠并形成环以允许核碱基充分接近而成为碱基对所需的桥接长度和结构可挠性为本领域中熟知的。
如本文所用,“RNA引导的DNA结合剂(RNA-guided DNA binding agent)”意指具有RNA和DNA结合活性的多肽或多肽复合物,或此类复合物的DNA结合亚基,其中DNA结合活性具有序列特异性并且依赖于RNA的序列。示例性RNA引导的DNA结合剂包括Cas裂解酶(其具有双链裂解活性)、Cas切口酶(其具有单链裂解活性)和其不活化形式(“dCas DNA结合剂”)。如本文所用,“Cas核酸酶”涵盖Cas裂解酶、Cas切口酶和dCas DNA结合剂。dCas DNA结合剂可为包含非功能性核酸酶结构域(RuvC或HNH结构域)的死核酸酶。在一些实施方案中,Cas裂解酶或Cas切口酶涵盖被修饰以准许例如经由与FokI结构域融合而进行DNA裂解的dCas DNA结合剂。在一些实施方案中,RNA引导的DNA结合剂具有核酸酶活性,例如裂解酶或切口酶活性。
如本文所用,“核糖核蛋白”(RNP)或“RNP复合物”描述例如结合核酸酶(诸如Cas蛋白)的sgRNA。在一些实施方案中,RNP包含Cas9和gRNA(例如sgRNA、dgRNA或crRNA)。在一些实施方案中,引导RNA将核酸酶(诸如Cas9)引导至靶序列,并且引导RNA与靶序列杂合并且所述结合剂结合至靶序列;在核酸酶或Cas蛋白为裂解酶或切口酶的情况下,结合之后可进行裂解或切口。
如本文所用,“茎环”描述核苷酸的二级结构,其形成碱基配对的“茎”,所述“茎”终止于不成对核酸的环。当同一核酸链的两个区在以相反方向读取时在序列上至少部分地互补时,可形成茎。如本文所用,“环”描述碱基不成对(即,不互补)、可以将茎封端的核苷酸区。“四环”描述4个核苷酸的环。如本文所用,sgRNA的上茎可包含四环。
如本文中关于多核苷酸所使用的,“取代的”或“取代”是指核碱基的改变(例如核苷酸取代),其改变其用于沃森-克里克配对的优选地碱基。当引导RNA的某一区如本文所用“未取代”时(例如,如表1A中所示的SEQ ID NO:200-210和500-501),所述区的序列可与例如spyCas9 sgRNA(SEQ ID NO:400)或任何其他gRNA(例如SEQ ID NO:200-210和500-501的部分)的对应保守部分的序列比对,仅具有空位和匹配(即无错配),其中碱基在具有用于沃森-克里克配对的相同优选的标准搭配碱基(A、C、G或T/U)或可通过碱基层叠形成双链体时被视为匹配。
如本文所用,关于多核苷酸的“保守取代”是指核碱基改变,其意指交换碱基配对的核苷酸的位置,使得可维持碱基配对。举例而言,G-C对变成C-G对,A-U对变成U-A对,或其他天然或修饰的碱基配对。
如本文所用,关于不成对核苷酸,例如重复/反重复区、发夹1区或发夹2区的环(即分别为SEQ ID NO:500中的核苷酸49至52、87至90和122至125)或其他不成对核苷酸的“取代”等为用另一核苷酸置换核苷酸序列的一个或多个核苷酸(例如1、2、3或4个核苷酸),所述另一核苷酸不会由于所述不成对核苷酸(例如隆突、环)而干扰结构的形成以准许例如在重复/反重复区、发夹1区或发夹2区中形成一个或多个双链体部分。
如本文所用,关于内部接头的“取代”等为用内部接头置换至少1个、优选地至少2个核苷酸。在某些实施方案中,内部接头具有与接头所置换的核苷酸数目大致相同的预测桥接长度。在某些实施方案中,内部接头比接头所置换的核苷酸数目的预测桥接长度更短。在某些实施方案中,内部接头比接头所置换的核苷酸数目的预测桥接长度更长。在某些实施方案中,内部接头进一步取代gRNA的重复/反重复部分的双链体部分的一部分。在某些实施方案中,内部接头取代gRNA中的茎环的环部分的一部分。在某些实施方案中,内部接头取代gRNA中的茎环的双链体部分的一部分。
如本文所用,关于包含内部接头的gRNA的“gRNA的非连接部分”为仅在接头的一侧或另一侧上包含核苷酸并任选地包含接头本身或其一部分的分子。其也可在核苷酸序列、接头或其部分末端包含反应性部分或所述反应性部分的淬灭形式。
“引导RNA”、“gRNA”和“引导物”在本文中互换使用以指crRNA(也称为CRISPRRNA),或crRNA与trRNA(也称为tracrRNA)的组合。crRNA和trRNA可以单一RNA分子(单引导RNA,sgRNA)或以两个独立RNA分子(双引导RNA,dgRNA)形式缔合。“引导RNA”或“gRNA”是指各类型。trRNA可为天然存在的序列或与天然存在的序列相比具有修饰或变异的trRNA序列。引导RNA可包括如本文所描述的修饰的RNA。除非自上下文另外显而易见,否则如本文所用,引导RNA包含至少一个内部接头。
如本文所用,“内部接头”描述接合引导RNA内的两个核苷酸的非核苷酸区段。如果gRNA含有间隔区,则内部接头位于间隔区外部(例如,gRNA的骨架或保守区中)。对于V型引导物,应理解,最后一个发夹为结构中的唯一发夹,即重复反重复区。如本文所用,接头为非核苷酸接头。
如本文所用,术语“脂族基”是指饱和或不饱和的非芳族烃化合物,其中组成性碳原子可为直链、环状或支链的。在某些实施方案中,脂族基也包括杂环烃。环烃和杂环烃是指其中组成性碳原子以及杂环基团中的任何杂原子形成环的环结构。环烃和杂环烃也可含有单键、双键或三键。C1-x脂族基是指具有1至x个组成性碳原子的脂族基团。脂族基团可经由其组成性碳原子中的任一者与其他部分形成一个或多个化学键。脂族基团可为单价或二价的,根据使用所述术语的上下文判定。
如本文所用,术语“亚烷基”是指饱和二价脂族链,其可为直链或支链的。典型亚烷基包括但不限于:亚甲基(CH2)、1,2-乙基(CH2CH2)、1,3-丙基(CH2CH2CH2)、1,4-丁基(CH2CH2CH2CH2)等。
如本文所用,术语“亚烯基”是指至少部分不饱和(例如含有至少一个双键)的二价脂族链,其可为直链或支链的。典型亚烯基包括但不限于:1,2-亚乙基(CH=CH)。
如本文所用,术语“氢键受体”是指包含能够形成氢键的杂原子的取代基。H键受体可为单价或二价的,根据使用所述术语的上下文判定。H键受体包括:包含氧、硫或磷的取代基;或包含羟基、烷氧基、硫醇基、醚基、硫醚基、羰基、酰氨基、碳酸根、氨基甲酸根、磷酸根、硫代磷酸根、膦酸根、硫酸根或磺酸根的取代基;或例如-O-、-OH、-OR、-ROR、-S-、-SH、-SR、-NH-、-NR-、-C(O)-R、-C(O)-O-、-OC(O)O-、-C(O)-OR、-OC(O)-OR、-C(O)-H、-C(O)-OH、-C(O)-NR-、-OC(O)-NR-、-NC(O)-NR-、-OPO3、-PO3、-RPO3、-P(O)2O-、-OP(O)2O-、-OP(R)(O)O-、-OP(O)(S)O-、-S(O)2-R、-S(O)2-OR、-RS(O)2-R、-RS(O)2-OR、-S(O)2-、-SO3。
如本文所用,内部接头的“桥接长度”是指接头的第一个原子(其与前一核苷酸的3'取代基(诸如氧或磷酸根)结合)至接头的最后一个原子(其与后一核苷酸的5'取代基(诸如氧或磷酸根)结合)(例如下文所描述的式(I)结构中~至#)的路径上的最短原子链中的距离或原子数目。各种接头的大致预测桥接长度提供于下表中。
在一些实施方案中,gRNA(例如sgRNA)包含“引导区”,其有时称为“间隔子”或“间隔区”,例如Briner AE等人,Molecular Cell 56:333-339(2014)中关于sgRNA所提及(但在本文中适用于所有引导RNA)。引导区或间隔区有时也称作“可变区”、“引导结构域”或“靶向结构域”。在一些实施方案中,“引导区”在其5'端处紧接在“sgRNA的保守部分”之前,并且在一些实施方案中,sgRNA缩短。示例性“sgRNA的保守部分”示出于表3A至3B中。在一些实施方案中,“引导区”包含位于crRNA的5'端处的一系列核苷酸
如本文所用,“重复反重复区”应理解为对应于由引导RNA中的crRNA和trRNA序列形成的一个或多个双链体的引导物部分。在单引导RNA中,trRNA和crRNA序列任选地在共价键联前被截短。截短的准确位置可变化。共价键联通常为短RNA序列以允许形成发夹,通常为茎环结构。
除非指定另一参考点,否则引导RNA中的数字位置或范围是指由5'端测定的位置;举例而言,引导RNA中的“核苷酸5”为从5'端起第5个核苷酸;或“核苷酸5至8”是指以从5'端起第5个核苷酸开始并以朝向3'端的第8个核苷酸结束的4个核苷酸。
在一些实施方案中,gRNA包含与本文所描述的gRNA的对应或指定核苷酸处的“修饰模式匹配”的核苷酸。此意指与修饰模式匹配的核苷酸具有与本文所描述的gRNA的对应位置处的核苷酸相同的修饰(例如硫代磷酸酯、2'-氟、2'-OMe等),不论那些位置处的核碱基是否匹配。举例而言,如果在第一gRNA中,核苷酸5和6分别具有2'-OMe和硫代磷酸酯修饰,则此gRNA在核苷酸5和6处具有与第二gRNA相同的修饰模式,所述第二gRNA也在核苷酸5和6处分别具有2'-OMe和硫代磷酸酯修饰,不论第一gRNA和第二gRNA中的位置5和6处的核碱基相同或不同。然而,核苷酸6而非核苷酸7处的2'-OMe修饰在核苷酸6和7处的修饰模式与核苷酸7而非核苷酸6处的2'-OMe修饰不相同。类似地,与本文所描述的gRNA的修饰模式至少75%匹配的修饰模式意指至少75%核苷酸与本文所描述的gRNA的对应位置具有相同修饰。对应位置可通过逐对或结构比对来测定。
化脓链球菌Cas9(“spyCas9”(也称为“spCas9”))sgRNA的“保守区”示出于表3A至3B中。第一列示出核苷酸的编号;第二列示出序列(例如SEQ ID NO:400);并且第三列示出所述区。
如本文所用,gRNA中的“缩短”区为gRNA的保守部分中与未修饰的gRNA的保守部分(参见例如图11(SEQ ID NO:400)或表3A至3B)中的对应区相比缺乏至少1个核苷酸的区。“缩短”在任何情况下均不暗示对产生gRNA的过程或方式的任何特定限制。在一些实施方案中,gRNA包含缩短的发夹1区,其中(i)缩短的发夹1区缺乏6至8个核苷酸;和(A)位置H1-1、H1-2或H1-3中的一者或多者相对于SEQ ID NO:400缺失或取代,或(B)位置H1-6至H1-10中的一者或多者相对于SEQ ID NO:400取代;或(ii)缩短的发夹1区缺乏9至10个核苷酸,包括H1-1或H1-12;或(iii)相对于SEQ ID NO:400(参见表3A),缩短的发夹1区缺乏5至10个核苷酸并且位置N18、H1-12或N中的一者或多者取代。在一些实施方案中,非spyCas9 gRNA包含缩短的发夹1区,其缺乏6至8个核苷酸,并且其中例如通过逐对或结构比对测定的与SEQ IDNO:400中的H1-1、H1-2或H1-3对应的一个或多个位置缺失或取代,例如通过逐对或结构比对测定的与SEQ ID NO:400中的H1-6至H1-10对应的一个或多个位置取代。在一些实施方案中,非spyCas9 gRNA包含缩短的发夹1区,其缺乏9至10个核苷酸,包括例如通过逐对或结构比对测定的与SEQ ID NO:400中的H1-1或H1-12对应的核苷酸。在一些实施方案中,非spyCas9 gRNA包含缩短的发夹1区,其缺乏5至10个核苷酸,并且例如通过逐对或结构比对测定的与SEQ ID NO:400中的N18、H1-12或N对应的一个或多个位置取代。在一些实施方案中,gRNA包含缩短的上茎区,其中所述缩短的上茎区缺乏1至6个核苷酸。
如本文所用,“YA位点”是指5'-嘧啶-腺嘌呤-3'二核苷酸。为了清楚起见,通过修饰碱基而改变的原始序列中的“YA位点”仍被视为所得序列中的(修饰的)YA位点,不论字面上缺乏YA二核苷酸。“保守区YA位点”存在于sgRNA的保守区中。“引导区YA位点”存在于sgRNA的引导区中。sgRNA中的未修饰的YA位点可易被RNA酶-A样核酸内切酶(例如RNA酶A)裂解。在某些实施方案中,YA位点被修饰,以通过2'糖修饰(例如2'OMe、2'F)或主链修饰(例如硫代磷酸酯键联)降低对RNA酶A的敏感性。在某些实施方案中,YA位点通过修饰碱基使得YA序列不再存在而被修饰。
如本文所论述,与关于spyCas9 gRNA所描述的核苷酸对应的核苷酸在另一gRNA中的位置可通过逐对或结构比对以序列或结构相似性鉴别。结构比对在分子共享类似结构(尽管存在相当大的序列变化)时为有用的。举例而言,spyCas9与金黄色葡萄球菌Cas9(“SauCas9”)具有相异的序列,但具有显著的结构比对。参见例如Nishimasu等人,Cell 162(5):1113-1126(2015)的图2(F)。结构比对可用于鉴别SauCas9或其他sgRNA中对应于特定位置的核苷酸,所述位置诸如spyCas9 sgRNA的保守部分(例如SEQ ID NO:400)(参见表3A)的位置H1-1、H1-2或H1-3、位置H1-6至H1-10、位置H1-12或位置N18或N)。
结构比对涉及通过以下鉴别两个(或更多个)序列上的对应残基:(i)使用第二序列的已知结构,对第一序列的结构模型化或(ii)比较均已知的第一序列和第二序列的结构,并且鉴别第一序列中与第二序列中的所关注残基最相似地定位的残基。在一些算法中,基于重叠结构中的给定位置(例如,多核苷酸的戊糖环的核碱基位置1或1'碳,或多肽的α碳)的距离最小化,鉴别出对应残基(例如,哪一组成对位置为比对提供最小化均方根偏差)。当鉴别非spyCas9 gRNA中与关于spyCas9 gRNA所描述的位置对应的位置时,spyCas9gRNA可为“第二”序列。在所关注的非spyCas9 gRNA不具有可获得的已知结构、但与具有已知结构的另一种非spyCas9 gRNA更密切相关的情况下,最有效的可以为使用紧密相关的非spyCas9 gRNA的已知结构将所关注的非spyCas9 gRNA模型化,并且接着比较所述模型与spyCas9 gRNA结构以鉴别出所关注的非spyCas9 gRNA中的所需对应残基。关于蛋白质的结构模型化和比对,存在大量的文献;代表性公开包括US 6859736;US 8738343;和Aslam等人,Electronic Journal of Biotechnology 20(2016)9-13中所引用的那些文献。关于基于一种或多种已知相关结构将结构模型化的论述,参见例如Bordoli等人,NatureProtocols 4(2009)1-13,和其中所引用的参考文献。关于核酸比对,也参见Nishimasu等人,Cell 162(5):1113-1126(2015)的图2(F)。此外,已对Cas核酸酶与其引导RNA的复合物进行大量结构研究,参见例如Jiang等人,Science.2015年6月26日;348(6242):1477-81;Anders等人,Nature.2014年9月25日;513(7519):569-73;Zhu等人,Nat Struct MolBiol.2019年8月;26(8):679-685;Nishimasu等人,Cell.2014年2月27日;156(5):935-49;Nishimasu等人,Cell.2015年8月27日;162(5):1113-26;Hirano等人,Nat Commun.2019年4月29日;10(1):1968;Fuchsbauer等人,Mol Cell.2019年12月19日;76(6):922-937;Zhang等人,Nat Catal 3,813-823(2020);Yamada等人,Mol Cell.2017年3月16日;65(6):1109-1121;Hirano等人,Cell.2016年2月25日;164(5):950-61;Gao等人,Cell Res.2016年8月;26(8):901-13;和Stella等人,Nature.2017年6月22日;546(7659):559-563。勘误表于:Nature.2017年7月27日;547(7664):476;Qiao等人,Biotechnol Bioeng.2021年5月8日(doi:10.1002/bit.27813刊载之前的电子版)中。提供这些协同结构,可容易地确定核酸酶与其引导物之间的双链体区、发夹和接触点的位置。
如本文所用,“靶序列”是指引导区向其引导核酸酶以进行裂解的核酸序列。在一些实施方案中,spyCas9蛋白可通过引导区、通过存在于引导区中的核苷酸引导至靶序列。
如本文所用,“5'端”是指gRNA(包括dgRNA(通常为dgRNA的crRNA的5'端)、sgRNA)的第一个核苷酸,其中5'位置不连接至另一核苷酸。
如本文所用,“5'端修饰”是指包含在其5'端处具有一(1)至约七(7)个核苷酸中的一者或多者的修饰的引导区的gRNA,任选地其中gRNA的第一个核苷酸(从5'端起)被修饰。
如本文所用,“3'端”是指gRNA的末端核苷酸,其中3'位置不连接至另一核苷酸。在一些实施方案中,3'端处于3'尾中。在一些实施方案中,3'端处于gRNA的保守部分中。
如本文所用,“3'端修饰”是指在其3'端处具有一(1)至约七(7)个核苷酸中的一者或多者的修饰的gRNA,任选地其中gRNA的最后一个核苷酸(即,最为3'的核苷酸)被修饰。如果存在3'尾,则3'尾内可存在1至约7个核苷酸。如果不存在3'尾,则sgRNA的保守部分内可存在1至约7个核苷酸。
“最后一个”、“倒数第二个”、“倒数第三个”核苷酸等分别指指测序列中的最为3'、第二个最为3'、第三个最为3'的核苷酸等。举例而言,在序列5'-AAACTG-3'中,最后一个、倒数第二个和倒数第三个核苷酸分别为G、T和C。短语“最后3个核苷酸”是指最后一个、倒数第二个和倒数第三个核苷酸;更一般而言,“最后N个核苷酸”是指最后一个至倒数第N个核苷酸(包括端点)。“从3'末端的3'端起第三个核苷酸”等效于“倒数第三个核苷酸”。类似地,“从5'末端的5'端起第三个核苷酸”等效于“5'末端的第三个核苷酸”。
如本文所用,“保护性末端修饰”(诸如保护性5'端修饰或保护性3'端修饰)是指sgRNA的末端的七个核苷酸内的一个或多个核苷酸的修饰,其减少sgRNA降解,诸如核酸外切降解。在一些实施方案中,保护性末端修饰包含sgRNA的末端的七个核苷酸内的至少两个或至少三个核苷酸的修饰。在一些实施方案中,修饰包含硫代磷酸酯键联、2'修饰(诸如2'-OMe或2'-氟)、2'-H(DNA)、ENA、UNA或其组合。在一些实施方案中,修饰包含硫代磷酸酯键联和2'-OMe修饰。在一些实施方案中,至少三个末端核苷酸被修饰,例如被以下修饰:硫代磷酸酯键联,或硫代磷酸酯键联与2'-OMe修饰的组合。涵盖本领域技术人员已知的减少核酸外切降解的修饰。
在一些实施方案中,包含1至20个核苷酸、任选地1至7个核苷酸、或1个核苷酸的“3'尾”在其3'端处跟随sgRNA的保守部分。在某些实施方案中,末端碱基为尿嘧啶。在某些实施方案中,尾为一个核苷酸,并且末端碱基为尿嘧啶。
如本文所用,“Cas核酸酶”(也称作“Cas蛋白”)涵盖Cas裂解酶、Cas切口酶和dCasDNA结合剂。Cas裂解酶/切口酶和dCas DNA结合剂包括:III型CRISPR系统的Csm或Cmr复合物、其Cas10、Csm1或Cmr2亚基,I型CRISPR系统的级联复合物、其Cas3亚基,和2类Cas核酸酶;V型CRISPR系统,包括Cas12或其亚基,诸如Cas12a(Cpf1)或Cas12e(CasX);和VI型CRISPR系统,包括Cas13d。如本文所用,“2类Cas核酸酶”为具有RNA引导的DNA结合活性的单链多肽,诸如Cas9核酸酶或Cpf1核酸酶。2类Cas核酸酶包括2类Cas裂解酶和2类Cas切口酶(例如H840A、D10A或N863A变体),其进一步具有RNA引导的DNA裂解酶或切口酶活性,和2类dCas DNA结合剂,其中裂解酶/切口酶活性未活化。2类Cas核酸酶包括例如Cas9、Cpf1、C2c1、C2c2、C2c3、HF Cas9(例如N497A、R661A、Q695A、Q926A变体)、HypaCas9(例如N692A、M694A、Q695A、H698A变体)、eSPCas9(1.0)(例如K810A、K1003A、R1060A变体)和eSPCas9(1.1)(例如K848A、K1003A、R1060A变体)蛋白质和其变异体(modification)。Cpf1蛋白(Zetsche等人,Cell,163:1-13(2015))与Cas9同源并含有RuvC样核酸酶结构域。Zetsche的Cpf1序列以全文引用的方式并入。参见例如Zetsche,表S1和S3。“Cas9”涵盖Spy Cas9、本文所列的Cas9的变体和其等效物。参见例如Makarova等人,Nat Rev Microbiol,13(11):722-36(2015);Shmakov等人,Molecular Cell,60:385-397(2015)。
2类CRISPR系统的特征为具有单体核酸内切酶,而非多聚体核酸酶。2类CRISPR系统包括II型和V型系统。
II型系统包括相对较大的Cas9核酸内切酶,其具有RNA识别结构域、两个核酸酶结构域、通过富含精氨酸的螺旋桥连接至RuvC结构域的HNH结构域以及原间隔相邻基序(PAM)相互作用结构域。引导RNA往往相对较长,即,单引导RNA通常为约100个核苷酸长或更长,并且已由多个功能性研究证实在间隔子(靶向结构域区)的3'包括多个双链体区和发夹,包括重复反重复区和第二发夹区,其通常含有一种或两种预测发夹结构。
II型Cas9核酸内切酶包括:II-A型Cas9核酸内切酶,例如化脓链球菌(Spy Cas9);和II-C型Cas9核酸内切酶,例如空肠弯曲杆菌(Cje)、沼泽红假单胞菌(Rpa)、深红红螺菌(Rru)、纳士放线菌(Ana)和白喉棒状杆菌(Cdi)。
V型系统的特征为相对较小的核酸酶和引导物。核酸酶具有单一DNA识别瓣叶(REC)和单一核酸酶(NUC)瓣叶。引导物以约40至45个核苷酸长的单一RNA形式天然存在,并且包括约20个核苷酸长的单一发夹重复反重复区,接着为23至25个核苷酸之间隔区。V型系统包括新凶手弗朗西斯氏菌Cpf1(FnCpf1)、毛螺菌Cpf1(LbCpf1)和氨基酸球菌属Cpf1(AsCpf1/Cas 12a)。
如本文所用,如果第一序列与第二序列的比对显示整个第二序列的X%或更多位置与第一序列匹配,则第一序列被视为“包含与第二序列具有至少X%同一性的序列”。举例而言,序列AAGA包含与序列AAG具有100%同一性的序列,这是因为第二序列的全部三个位置均存在匹配,因此比对将得到100%同一性。RNA与DNA之间的差异(一般而言,尿苷交换为胸苷或反之亦然)和核苷类似物(诸如修饰的尿苷)的存在不会造成多核苷酸之间同一性或互补性的差异,只要相关核苷酸(诸如胸苷、尿苷或修饰的尿苷)具有相同补体(例如对于胸苷、尿苷或修饰的尿苷全体而言,为腺苷;另一实例为胞嘧啶和5-甲基胞嘧啶,两者具有鸟苷或修饰的鸟苷作为补体)。因此,举例而言,序列5'-AXG(其中X为任何修饰的尿苷,诸如假尿苷、N1-甲基假尿苷或5-甲氧基尿苷)被视为与AUG 100%同一,因为两者与同一序列(5'-CAU)完全互补。示例性比对算法为本领域中熟知的史密斯-沃特曼(Smith-Waterman)和尼德曼-翁施(Needleman-Wunsch)算法。本领域技术人员应理解对于待比对的给测序列对,选择何种算法和参数设置为适合的;对于具有一般类似长度和针对氨基酸的>50%预期同一性或针对核苷酸的>75%预期同一性的序列而言,由EBI于www.ebi.ac.uk网站服务器提供的尼德曼-翁施算法界面的具有默认设置的尼德曼-翁施算法通常为适合的。
“mRNA”在本文中用于指一种多核苷酸,其为RNA或修饰的RNA并且包含可转译成多肽的开放阅读框架(即,可充当受质供核糖体和氨基酰基化tRNA转译)。mRNA可包含磷酸酯-糖主链,其包括核糖残基或其类似物,例如2'-甲氧基核糖残基。在一些实施方案中,核酸磷酸酯-糖主链中的糖类基本上由核糖残基、2'-甲氧基核糖残基或其组合组成。一般而言,mRNA不含大量胸苷残基(例如0个残基或少于30、20、10、5、4、3或2个胸苷残基;或少于10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.2%或0.1%的胸苷含量)。mRNA可在其一些或全部尿苷位置处含有修饰的尿苷。在一些实施方案中,修饰的mRNA包含至少一个其中磷酸酯、糖或核碱基中的一者或多者与标准腺苷、胞苷、鸟苷或尿苷核苷酸不同的核苷酸。
如本文所用,“受试者”是指动物界的任何成员。在一些实施方案中,“受试者”是指人类。在一些实施方案中,“受试者”是指非人类动物。在一些实施方案中,“受试者”是指灵长类动物。在一些实施方案中,“受试者”是指非人类灵长类动物。在一些实施方案中,受试者包括但不限于哺乳动物、鸟类、爬行动物、两栖动物、鱼类、昆虫或蠕虫。在某些实施方案中,非人类受试者为哺乳动物(例如啮齿动物、小鼠、大鼠、兔、猴、犬、猫、绵羊、牛、灵长类动物或猪)。在一些实施方案中,受试者可为转基因动物、基因工程化的动物或克隆。在本发明的某些实施方案中,受试者为成人、青少年或婴儿。在一些实施方案中,使用术语“个体(individual)”或“患者”,并且其意欲与“受试者(subject)”互换,其中受试者为人类受试者。
如本文所用,“递送”和“施用”可互换地使用,并且包括离体和体内应用。
如本文所用,共同施用意指多种物质在时间上足够接近地一起施用,以使得药剂一起起作用。共同施用涵盖在单个制剂中一起施用物质和在单独制剂中在时间上足够接近地施用物质以使得药剂一起起作用。
如本文所用,短语“药学上可接受的”意指适用于制备药物组合物,所述药物组合物通常无毒且在生物学上并非不合需要并且在其他方面对于药物用途并非不可接受的。药学上可接受的物质通常是指非热解物质。药学上可接受可指无菌物质,尤其对于注射或输注用的药物物质。
II.包含内部接头的引导RNA
本文提供用于基因编辑方法中的包含内部接头的引导RNA(gRNA)。
A.内部接头的位置/数目
在一些实施方案中,内部接头取代至少1个核苷酸。在一些实施方案中,内部接头取代至少2个核苷酸。在一些实施方案中,内部接头取代至少3个核苷酸。在一些实施方案中,内部接头取代至少4个核苷酸。在一些实施方案中,内部接头取代至少5个核苷酸。在一些实施方案中,内部接头取代至少6个核苷酸。在一些实施方案中,内部接头取代至少7个核苷酸。在一些实施方案中,内部接头取代至少8个核苷酸。在一些实施方案中,内部接头取代至少9个核苷酸。在一些实施方案中,内部接头取代至少10个核苷酸。在一些实施方案中,内部接头取代至少11个核苷酸。在一些实施方案中,内部接头取代至少12个核苷酸。在一些实施方案中,内部接头取代gRNA的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸。在一些实施方案中,内部接头取代gRNA的至少28个核苷酸。在一些实施方案中,内部接头取代gRNA的至少22个核苷酸。在一些实施方案中,接头取代至少2至6个核苷酸。在一些实施方案中,接头取代至少2至4个核苷酸。
在一些实施方案中,内部接头取代gRNA的至多28个核苷酸。在一些实施方案中,内部接头取代gRNA的至多22个核苷酸。在一些实施方案中,内部接头取代gRNA的至多12个核苷酸。
在一些实施方案中,内部接头取代2个核苷酸。在一些实施方案中,内部接头取代3个核苷酸。在一些实施方案中,内部接头取代4个核苷酸。在一些实施方案中,内部接头取代5个核苷酸。在一些实施方案中,内部接头取代6个核苷酸。在一些实施方案中,内部接头取代7个核苷酸。在一些实施方案中,内部接头取代8个核苷酸。在一些实施方案中,内部接头取代9个核苷酸。在一些实施方案中,内部接头取代10个核苷酸。在一些实施方案中,内部接头取代11个核苷酸。在一些实施方案中,内部接头取代12个核苷酸。在一些实施方案中,接头取代2至28个核苷酸。在一些实施方案中,接头取代2至22个核苷酸。在一些实施方案中,接头取代2至12个核苷酸。在一些实施方案中,接头取代2至6个核苷酸。在一些实施方案中,接头取代2至4个核苷酸。
在一些实施方案中,内部接头具有约3至30个原子的桥接长度。在一些实施方案中,内部接头具有约6至30个原子的桥接长度。在一些实施方案中,内部接头具有约9至30个原子的桥接长度。在一些实施方案中,内部接头具有约12至30个原子的桥接长度。在一些实施方案中,内部接头具有约15至30个原子的桥接长度。在一些实施方案中,内部接头具有约18至30个原子的桥接长度。在一些实施方案中,内部接头具有约21至30个原子的桥接长度。在一些实施方案中,内部接头具有约12至21个原子的桥接长度。在一些实施方案中,内部接头具有约9至21个原子的桥接长度。在一些实施方案中,内部接头具有约6至12个原子的桥接长度。
在一些实施方案中,内部接头具有约3至30个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约12至30个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约12至24个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约12至21个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约16至20个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约15至18个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。
在一些实施方案中,内部接头具有约15个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约16个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约17个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约18个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约19个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约20个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约21个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约22个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约23个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约24个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约25个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约26个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约27个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约28个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约29个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。在一些实施方案中,内部接头具有约30个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。
在一些实施方案中,内部接头具有约21个原子的桥接长度,并且接头取代gRNA的4个核苷酸。在一些实施方案中,内部接头具有约21个原子的桥接长度,并且接头取代gRNA的6个核苷酸。在一些实施方案中,内部接头具有约21个原子的桥接长度,并且接头取代gRNA的8个核苷酸。在一些实施方案中,内部接头具有约21个原子的桥接长度,并且接头取代gRNA的4个核苷酸。在一些实施方案中,内部接头具有约21个原子的桥接长度,并且接头取代gRNA的10个核苷酸。在一些实施方案中,内部接头具有约21个原子的桥接长度,并且接头取代gRNA的12个核苷酸。
在一些实施方案中,内部接头具有约18个原子的桥接长度,并且接头取代gRNA的4个核苷酸。在一些实施方案中,内部接头具有约18个原子的桥接长度,并且接头取代gRNA的6个核苷酸。在一些实施方案中,内部接头具有约18个原子的桥接长度,并且接头取代gRNA的8个核苷酸。在一些实施方案中,内部接头具有约18个原子的桥接长度,并且接头取代gRNA的4个核苷酸。在一些实施方案中,内部接头具有约18个原子的桥接长度,并且接头取代gRNA的10个核苷酸。在一些实施方案中,内部接头具有约18个原子的桥接长度,并且接头取代gRNA的12个核苷酸。
在一些实施方案中,内部接头具有约6至18个原子、任选地约6至12个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头具有约9至12个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头具有约8至10个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。
在一些实施方案中,内部接头具有约6个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头具有约7个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头具有约8个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头具有约9个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头具有约10个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头具有约11个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。在一些实施方案中,内部接头具有约12个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。
在一些实施方案中,内部接头具有约9个原子的桥接长度,并且接头取代gRNA的2个核苷酸。
在一些实施方案中,内部接头位于gRNA的重复反重复区中。在一些实施方案中,内部接头取代gRNA的重复反重复区的至少3个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的至少3、4、5、6、7、8、9、10、11或12个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的3个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的4个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的5个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的6个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的7个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的8个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的9个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的10个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的11个核苷酸。在一些实施方案中,内部接头取代gRNA的重复反重复区的12个核苷酸。在一些实施方案中,内部接头取代重复反重复区中的至多28个核苷酸。在一些实施方案中,内部接头取代重复反重复区中的至多20个核苷酸。在一些实施方案中,内部接头侧接形成至少2个碱基对长的双链体区的核苷酸。在某些实施方案中,内部接头不存在于重复反重复区中的隆突中。
在一些实施方案中,内部接头位于gRNA的发夹区中。在一些实施方案中,内部接头取代gRNA的发夹区的至少2个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的至少2、3、4、5、6、7、8、9、10、11或12个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的至多22个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的至多12个核苷酸。
在一些实施方案中,内部接头取代gRNA的发夹区的至少2个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的至少4个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的6个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的8个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹的10个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的12个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的14个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的16个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的18个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的20个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹的22个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的至多22个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的2至6个核苷酸。在一些实施方案中,内部接头取代gRNA的发夹区的2至4个核苷酸。在一些实施方案中,内部接头侧接形成至少2个碱基对长的双链体区的核苷酸。在一些实施方案中,内部接头取代发夹区中的整个发夹结构,即,双链体不由侧接内部接头的核苷酸形成。
在一些实施方案中,内部接头取代gRNA的发夹区的1、2、3、4、5或6个碱基对。在一些实施方案中,内部接头取代gRNA的发夹区的1个碱基对,即取代预测形成发夹结构中的碱基对的核苷酸,使得1个碱基对缺失引起两个核苷酸的缺失以及发夹结构中的碱基对数目减一。在一些实施方案中,内部接头取代gRNA的发夹区的2个碱基对。在一些实施方案中,内部接头取代gRNA的发夹区的3个碱基对。在一些实施方案中,内部接头取代gRNA的发夹区的4个碱基对。在一些实施方案中,内部接头取代gRNA的发夹的5个碱基对。在一些实施方案中,内部接头取代gRNA的发夹区的6个碱基对。在一些实施方案中,内部接头取代gRNA的发夹区的1至12个碱基对。在一些实施方案中,内部接头取代gRNA的发夹区的1至6个碱基对。在一些实施方案中,内部接头取代gRNA的发夹区的1至4个碱基对。在一些实施方案中,内部接头取代gRNA的发夹区的至多12个碱基对。
在一些实施方案中,内部接头位于gRNA的连结点区中。在一些实施方案中,内部接头取代gRNA的连结点区的至少2个核苷酸。在一些实施方案中,内部接头取代gRNA的连结点区的1或2个核苷酸。
在一些实施方案中,内部接头位于gRNA的第一部分与gRNA的第二部分之间的发夹结构中,其中第一部分和第二部分一起形成双链体部分。
在一些实施方案中,gRNA包含三个内部接头。在一些实施方案中,gRNA包含两个内部接头。在一些实施方案中,gRNA包含一个内部接头。
重复反重复区的上茎
在一些实施方案中,重复反重复区中的内部接头位于重复反重复区的第一部分与第二部分之间的发夹结构中,其中第一部分和第二部分一起形成双链体部分。
在一些实施方案中,重复反重复区中的内部接头取代发夹结构的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸。在一些实施方案中,内部接头取代重复反重复区中的至多28个核苷酸。在一些实施方案中,内部接头取代重复反重复区中的至多20个核苷酸。在一些实施方案中,内部接头取代重复反重复区中的至多12个核苷酸。在一些实施方案中,内部接头取代重复反重复区中的至少4个核苷酸。在一些实施方案中,内部接头取代重复反重复区中的4至20个核苷酸。在一些实施方案中,内部接头取代重复反重复区中的4至14个核苷酸。在一些实施方案中,内部接头取代重复反重复区中的4至6个核苷酸。
在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环或其部分。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和茎或其部分。在一些实施方案中,内部接头不取代重复反重复区的隆突部分。
在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环的2、3或4个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环的2个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环的3个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环的4个核苷酸。
在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹的茎的至少1个核苷酸。在一些实施方案中,其中重复反重复区中的内部接头取代发夹的环和发夹的茎的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹的环和发夹的茎的至少2个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹的环和发夹的茎的2至24个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹的环和发夹的茎的2至18个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹的环和发夹的茎的2至8个核苷酸。
在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的2、4、6、8、10、12、14、16、18、20、22或24个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的2、4、6、8、10、12或14个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的2、4、6或8个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的2个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的4个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的6个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的8个核苷酸。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的10个核苷酸。
在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的1、2、3、4、5、6、7、8、9、10、11或12个碱基对。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的1、2、3、4、5、6、7或8个碱基对。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的1、2、3或4个碱基对。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的1个碱基对。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的2个碱基对。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的3个碱基对。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的4个碱基对。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的5个碱基对。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的6个碱基对。在一些实施方案中,重复反重复区中的内部接头取代发夹结构的环和发夹结构的茎的7个碱基对。
在一些实施方案中,重复反重复区中的内部接头取代构成发夹结构的环的所有核苷酸。
在一些实施方案中,重复反重复区中的内部接头取代构成发夹结构的环和上茎的所有核苷酸。
连结点区
在一些实施方案中,内部接头取代gRNA的连结点区的环的1或2个核苷酸。在一些实施方案中,内部接头具有约6至18个原子的桥接长度。在一些实施方案中,内部接头具有约6至12个原子的桥接长度。
发夹区
在一些实施方案中,内部接头取代gRNA的发夹区中的发夹结构。
在一些实施方案中,发夹区等效于可通过用内部接头取代gRNA(例如表1A中所示的gRNA中的任一者,或SEQ ID NO:200-210和500-501中的任一者)的发夹结构的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22个核苷酸获得的发夹区。
在一些实施方案中,内部接头取代发夹结构的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22个核苷酸。在一些实施方案中,内部接头取代发夹结构的2至22个核苷酸。在一些实施方案中,内部接头取代发夹结构的2至12个核苷酸。在一些实施方案中,内部接头取代发夹结构的2至6个核苷酸。在一些实施方案中,内部接头取代发夹结构的2至4个核苷酸。在发夹区中包含内部接头的gRNA可在发夹区中形成双链体部分。发夹区中的内部接头可取代环,并且gRNA可在发夹区中形成双链体部分。发夹区中的内部接头可取代环和茎区中的一个或多个碱基对,并且gRNA可在发夹区中形成双链体部分。
在一些实施方案中,内部接头取代发夹区中的发夹结构的环或其部分。在一些实施方案中,内部接头取代发夹区中的发夹结构的环和茎或其部分。
在一些实施方案中,内部接头取代发夹结构的环的2、3、4或5个核苷酸。在一些实施方案中,内部接头取代发夹结构的环的2个核苷酸。在一些实施方案中,内部接头取代发夹结构的环的3个核苷酸。在一些实施方案中,内部接头取代发夹结构的环的4个核苷酸。在一些实施方案中,内部接头取代发夹结构的环的5个核苷酸。在一些实施方案中,内部接头取代发夹结构的环的2至5个核苷酸。
在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的至少1个核苷酸。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的1、2、3、4、5、6、7或8个核苷酸。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的至少2个核苷酸。
在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的2、4、6、8、10、12、14、16、18、20、22或24个核苷酸。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的2、4、6、8、10、12或14个核苷酸。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的2、4、6或8个核苷酸。在一些实施方案中,内部接头取代发夹的环和发夹结构的茎的2个核苷酸。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的4个核苷酸。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的6个核苷酸。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的8个核苷酸。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的至多24个核苷酸。
在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的1、2、3、4、5、6、7、8、9、10、11或12个碱基对。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的1、2、3、4、5或6个碱基对。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的1、2、3或4个碱基对。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的1个碱基对。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的2个碱基对。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的3个碱基对。在一些实施方案中,内部接头取代发夹结构的环和发夹结构的茎的4个碱基对。
在一些实施方案中,内部接头取代构成发夹结构的环的所有核苷酸。
在一些实施方案中,内部接头取代构成发夹结构的环和茎的所有核苷酸。
在一些实施方案中,发夹为发夹1,并且内部接头取代发夹1。在一些实施方案中,gRNA为SpyCas9 gRNA,并且内部接头取代发夹1。
在其他实施方案中,gRNA还包含发夹1的3'处的发夹2。在一些实施方案中,内部接头取代发夹2的环的至少2个核苷酸。
在一些实施方案中,发夹2不包含任何内部接头取代。在一些实施方案中,gRNA为Spy Cas9 gRNA,并且发夹2不包括任何内部接头取代。
在一些实施方案中,gRNA还包含引导区。在其他实施方案中,引导区的长度为17、18、19、20或21个核苷酸。在一些实施方案中,gRNA不包含引导区。
在一些实施方案中,gRNA为单引导RNA(sgRNA)。
在一些实施方案中,gRNA包含tracrRNA(trRNA)。
B.内部接头结构-物理性质、化学性质
本文所公开的gRNA包含内部接头。一般而言,可使用与gRNA的功能兼容的任何内部接头。可能需要接头具有一定程度的可挠性。在一些实施方案中,内部接头包含至少两个、三个、四个、五个、六个或更多个路径上单键。如果键为5'和3'位置连接至接头的两个核苷酸之间的最短键路径的一部分,则其为路径上键。
在一些实施方案中,内部接头具有约6至40埃的桥接长度。在一些实施方案中,内部接头具有约8至25埃的桥接长度。在一些实施方案中,内部接头具有约8至15埃的桥接长度。在一些实施方案中,内部接头具有约10至40埃的桥接长度。在一些实施方案中,内部接头具有约10至35埃的桥接长度。在一些实施方案中,内部接头具有约10至30埃的桥接长度。在一些实施方案中,内部接头具有约10至25埃的桥接长度。在一些实施方案中,内部接头具有约15至40埃的桥接长度。在一些实施方案中,内部接头具有约15至35埃的桥接长度。在一些实施方案中,内部接头具有约15至25埃的桥接长度。在一些实施方案中,接头的长度可至少部分地基于接头相对于不含内部接头的对应gRNA取代的核苷酸数目来选择。举例而言,如果接头代替两个核苷酸,则可使用长度约8至15埃的接头,诸如涵盖在约8至15埃的范围内的本文别处所描述的实施方案中的任一者。如果接头代替多于两个核苷酸,则可使用长度约10至25埃的接头,诸如涵盖在约10至25埃的范围内的本文别处所描述的实施方案中的任一者。
根据原子数目、乙二醇单元数目、以埃为单位的大致接头长度(假设乙二醇单体为约3.7埃)和取代发夹结构的至少整个环部分的适合位置的示例性预测接头长度提供于下表中。取代两个核苷酸需要至少约11埃的接头长度。取代至少3个核苷酸需要至少约16埃的接头长度。
表1
在一些实施方案中,内部接头包含式(I)的结构:
~-L0-L1-L2-#
(I)
其中:
~指示连至前一核苷酸的3'取代基的键;
#指示连至后一核苷酸的5'取代基的键;
L0为空值或C1-3脂族基;
L1为-[E1-(R1)]m-,其中
各R1独立地为任选地被1或2个E2取代的C1-5脂族基团,
各E1和E2独立地为氢键受体,或各自独立地选自环烃和杂环烃,并且
各m为1、2、3、4、5、6、7、8、9或10;并且
L2为空值、C1-3脂族基,或为氢键受体。
在一些实施方案中,L1包含一个或多个-CH2CH2O-、-CH2OCH2-或-OCH2CH2-单元(“乙二醇亚基”)。在一些实施方案中,-CH2CH2O-、-CH2OCH2-或-OCH2CH2-单元的数目介于1、2、3、4、5、6、7、8、9或10的范围内。
在一些实施方案中,m为1、2、3、4或5。在一些实施方案中,m为1、2或3。在一些实施方案中,m为6、7、8、9或10。
在一些实施方案中,L0为空值。在一些实施方案中,L0为-CH2-或-CH2CH2-。
在一些实施方案中,L2为空值。在一些实施方案中,L2为-O-、-S-或C1-3脂族基。在一些实施方案中,L2为-O-。在一些实施方案中,L2为-S-。在一些实施方案中,L2为-CH2-或-CH2CH2-。
式I中的部分和变量的身分和值可被选择以提供具有本文所描述的桥接长度中任一者的内部接头。在一些实施方案中,式(I)结构中~至#的路径上的最短原子链中的原子数目为30或更小、或27或更小、或24或更小、或21或更小,或为18或更小,或为15或更小,或为12或更小,或为10或更小。
在一些实施方案中,式(I)结构中~至#的路径上的最短原子链中的原子数目为6至30,或为9至30,或为9至21。在一些实施方案中,式(I)结构中~至#的路径上的最短原子链中的原子数目为9。在一些实施方案中,式(I)结构中~至#的路径上的最短原子链中的原子数目为18。
在一些实施方案中,各C1-3脂族基团和C1-5脂族基团为饱和的。在一些实施方案中,至少一个C1-5脂族基团为C1-4亚烷基,或其中至少两个C1-5脂族基团为C1-4亚烷基,或其中至少三个C1-5脂族基团为C1-4亚烷基。在一些实施方案中,至少一个R1选自-CH2-、-CH2CH2-、-CH2CH2CH2-或-CH2CH2CH2CH2-。在一些实施方案中,各R1独立地选自-CH2-、-CH2CH2-、-CH2CH2CH2-或-CH2CH2CH2CH2-。在一些实施方案中,各R1为-CH2CH2-。
在一些实施方案中,至少一个C1-5脂族基团为C1-4亚烯基,或其中至少两个C1-5脂族基团为C1-4亚烯基,或其中至少三个C1-5脂族基团为C1-4亚烯基。在一些实施方案中,至少一个R1选自-CHCH-、-CHCHCH2-或-CH2CHCHCH2-。
在一些实施方案中,各E1独立地选自-O-、-S-、-NH-、-NR-、-C(O)-O-、-OC(O)O-、-C(O)-NR-、-OC(O)-NR-、-NC(O)-NR-、-P(O)2O-、-OP(O)2O-、-OP(R)(O)O-、-OP(O)(S)O-、-S(O)2-和环烃以及杂环烃。在一些实施方案中,各E1独立地选自-O-、-S-、-NH-、-NR-、-C(O)-O-、-OC(O)O-、-P(O)2O-、-OP(O)2O-和-OP(R)(O)O。
在一些实施方案中,各E1为-O-。
在一些实施方案中,各E1为-S-。
在一些实施方案中,R1中的至少一个C1-5脂族基团任选地被一个E2取代。
在一些实施方案中,各E2独立地选自-OH、-OR、-ROR、-SH、-SR、-C(O)-R、-C(O)-OR、-OC(O)-OR、-C(O)-H、-C(O)-OH、-OPO3、-PO3、-RPO3、-S(O)2-R、-S(O)2-OR、-RS(O)2-R、-RS(O)2-OR、-SO3和环烃以及杂环烃。在一些实施方案中,各E2独立地选自-OH、-OR、-SH、-SR、-C(O)-R、-C(O)-OR、-OC(O)-OR、-OPO3、-PO3、-RPO3和-SO3。
在一些实施方案中,各E2为-OH或-OR。
在一些实施方案中,各E2为-SH或-SR。
在一些实施方案中,内部接头包含至少两个、三个、四个、五个或六个彼此共价连接的乙二醇亚基。在一些实施方案中,内部接头包含具有1至10个乙二醇单元的接头。在一些实施方案中,内部接头包含具有2至7个乙二醇单元的接头。在一些实施方案中,内部接头包含具有3至6个乙二醇单元的接头。在一些实施方案中,内部接头包含具有3个乙二醇单元的接头。在一些实施方案中,内部接头包含具有6个乙二醇单元的接头。
在一些实施方案中,内部接头包含PEG-接头。在一些实施方案中,内部接头包含具有1至9个乙二醇单元的PEG-接头。在一些实施方案中,内部接头包含具有3至6个乙二醇单元的PEG-接头。在一些实施方案中,内部接头包含具有3个乙二醇单元的PEG-接头。在一些实施方案中,内部接头包含具有6个乙二醇单元的PEG-接头。
在一些实施方案中,内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度,并且接头取代gRNA的至少4个核苷酸。为简洁起见,具有约15至21个原子的桥接长度的内部接头在本文别处被称为“接头1”。具有约9至30个原子、任选地约15至21个原子的桥接长度的内部接头可选自本文所描述的任何此类实施方案。具有约9至30个原子、任选地约15至21个原子的桥接长度的内部接头可具有本文针对内部接头所描述的任何兼容特征。
在一些实施方案中,接头包含多个聚乙二醇亚基,诸如至少2、3、4、5、6、7、8、9或10个聚乙二醇亚基。在一些实施方案中,接头包含至少5、6或7个聚乙二醇亚基。在一些实施方案中,接头由至少5、6或7个聚乙二醇亚基组成。
在一些实施方案中,内部接头具有约6至18个原子、任选地约6至12个原子的桥接长度,并且接头取代gRNA的至少2个核苷酸。为简洁起见,具有约6至18个原子、任选地约6至12个原子的桥接长度的内部接头在本文别处被称为“接头2”。具有约6至18个原子、任选地约6至12个原子的桥接长度的内部接头可选自本文所描述的任何此类实施方案。具有约6至12个原子的桥接长度的内部接头可具有本文针对内部接头所描述的任何兼容特征。在一些实施方案中,接头2包含多个聚乙二醇(PEG)亚基,诸如至少2、3或4个聚乙二醇亚基。在一些实施方案中,接头1包含至少2、3或4个聚乙二醇亚基。在一些实施方案中,接头1由至少2、3或4个聚乙二醇亚基组成。
含有接头的示例性PEG包括以下:
用于本文所提供的组合物和方法中的接头为本领域中已知的,并且可购自各种来源,包括但不限于Biosearch Technologies(例如Spacer-CE亚磷酰胺C2,2-(4,4'-二甲氧基三苯甲基氧基)乙基-1-[(2-氰基乙基)-(N,N-二异丙基)]-亚磷酰胺;和C6 Spacer亚氨酸酯(DMT-1,6-己二醇));Glen Research(Spacer亚磷酰胺C3,3-(4,4'-二甲氧基三苯甲基氧基)丙基-1-[(2-氰基乙基)-(N,N-二异丙基)]-亚磷酰胺;Spacer亚磷酰胺9,9-O-二甲氧基三苯甲基-三乙二醇,1-[(2-氰基乙基)-(N,N-二异丙基)]-亚磷酰胺;Spacer C12 CE亚磷酰胺,12-(4,4'-二甲氧基三苯甲基氧基)十二烷基-1-[(2-氰基乙基)-(N,N-二异丙基)]-亚磷酰胺;和Spacer亚磷酰胺18,18-O-二甲氧基三苯甲基六乙二醇,1-[(2-氰基乙基)-(N,N-二异丙基)]-亚磷酰胺)。
C.制备方法
提供合成包含本文所公开的内部接头的gRNA的方法。适合的前体(例如接头)可通过在单合成过程中在sgRNA制备方法中使用对应的亚磷酰胺建构嵌段而引入sgRNA寡核苷酸中。此类建构嵌段为可商购获得的或可通过已知方法制备。
合成方法包括一系列依序偶合反应,包括将第一核苷酸共价连接至第二核苷酸;将内部接头共价连接至第二核苷酸;和将第三核苷酸共价连接至内部接头。在某些实施方案中,这些连接为使用亚磷酰胺化学方法进行。在某些实施方案中,所述方法包括在共价连接第三核苷酸之前将第二接头共价连接至第一接头。
在一些实施方案中,提供共价连接至本文所公开的gRNA的接头的固体载体。
本文所提供的具有内部接头的gRNA在单合成过程中制得,使得通过合成方法产生全长gRNA链(sgRNA、crRNA或trRNA)。在dgRNA的情况下,crRNA和trRNA单独合成并粘接。即,当gRNA以dgRNA的形式制备时,单独合成的部分不需要共价连接以形成稳定gRNA。在某些实施方案中,含有如本文所提供的内部接头的dgRNA的crRNA和trRNA不包括crRNA与trRNA之间的共价连接。
在优选地实施方案中,gRNA不使用点击化学法制备。
D.引导RNA的类型
在一些实施方案中,引导RNA为单引导RNA。
在一些实施方案中,引导RNA包含tracrRNA(trRNA)。
示例性gRNA的序列示出于下表1A中。在一些实施方案中,引导RNA包含SEQ ID NO:200-210和500-501中任一者的核酸序列,其中内部接头取代一个或多个核苷酸。在一些实施方案中,表1A中以粗体示出的至少一个核苷酸被内部接头置换。在一些实施方案中,表1中以粗体示出的至少两个连续核苷酸被内部接头置换。在一些实施方案中,表1A中以粗体示出的至少三个连续核苷酸被内部接头置换。在一些实施方案中,表1A中以粗体示出的至少四个连续核苷酸被内部接头置换。在一些实施方案中,表1A中以粗体示出的至少两个非连续核苷酸被内部接头置换。在一些实施方案中,表1A中以粗体示出的至少第一两个或更多个连续核苷酸和至少第二两个或更多个连续核苷酸被内部接头置换,其中第一两个或更多个连续核苷酸与第二两个或更多个连续核苷酸不连续。在一些实施方案中,表1A中以粗体示出的至少第一三个或更多个连续核苷酸和至少第二三个或更多个连续核苷酸被内部接头置换,其中第一三个或更多个连续核苷酸与第二三个或更多个连续核苷酸不连续。在一些实施方案中,表1A中以粗体示出的至少第一四个或更多个连续核苷酸和至少第二两个或更多个连续核苷酸被内部接头置换,其中第一四个或更多个连续核苷酸与第二两个或更多个连续核苷酸不连续。在一些实施方案中,表1A中以粗体示出的至少第一四个或更多个连续核苷酸和至少第二四个或更多个连续核苷酸被内部接头置换,其中第一四个或更多个连续核苷酸与第二四个或更多个连续核苷酸不连续。
/>
在一些实施方案中,引导RNA包含有包含本文别处所公开的修饰的SEQ ID NO:200-210和500中任一者的核酸序列。示例性sgRNA示出于图10A至图10E中,其中示出引导区(靶结合区)和可被内部接头取代的核苷酸。表1B示出具有可能的内部接头数目和位置的gRNA结构和物种的各种实施方案。
表1B.
a.SpyCas9引导RNA
在一些实施方案中,引导RNA为化脓链球菌Cas9(“SpyCas9”)引导RNA。如本文所用,SpyCas9引导RNA意指其对SpyCas9具有功能性。上述情况也适用于本文所公开的不同Cas9物种的其他gRNA。
在一些实施方案中,引导RNA包含SEQ ID NO:200或201的核酸序列。在一些实施方案中,引导RNA为修饰的SpyCas9引导RNA。在一些实施方案中,引导RNA包含有包含本文别处所公开的修饰的SEQ ID NO:200或201的核酸序列。
在一些实施方案中,sgRNA包含引导区和引导区的3'的保守部分,其中保守部分包含重复反重复区、连结点区、发夹1区和发夹2区,并且包含以下中的至少一者:
第一内部接头,其取代重复反重复区的上茎区的至少2个核苷酸、任选地至少4个核苷酸;
第二内部接头,其取代连结点区的1或2个核苷酸;和
第三内部接头,其取代发夹1的至少2个核苷酸。
示例性SpyCas9 sgRNA示出于图10A中,其中示出引导区(靶结合区),以及可被重复反重复区中的第一接头、连结点区中的第二接头和发夹1区中的第三接头取代的核苷酸。
在一些实施方案中,sgRNA包含第一内部接头和第二内部接头。在一些实施方案中,sgRNA包含第一内部接头和第三内部接头。在一些实施方案中,sgRNA包含第二内部接头和第三内部接头。在一些实施方案中,sgRNA包含第一内部接头、第二内部接头和第三内部接头。
在一些实施方案中,第一内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。
在一些实施方案中,第一内部接头取代上茎区的2、3、4、5、6、7、8、9、10、11或12个核苷酸。在一些实施方案中,第一内部接头取代上茎区的环或其部分。在一些实施方案中,第一内部接头取代上茎区的环和茎或其部分。
在一些实施方案中,第一内部接头取代上茎区的环的2、3或4个核苷酸。在一些实施方案中,第一内部接头取代上茎区的环的4个核苷酸。
在一些实施方案中,第一内部接头取代上茎区的环和上茎区的茎的至少2、4、6或8个核苷酸。在一些实施方案中,第一内部接头取代上茎区的环和上茎区的茎的1、2、3或4个碱基对。在一些实施方案中,第一内部接头取代上茎区的环和上茎区的茎的1个碱基对。在一些实施方案中,第一内部接头取代上茎区的环和上茎区的茎的2个碱基对。在一些实施方案中,第一内部接头取代上茎区的环和上茎区的茎的3个碱基对。在一些实施方案中,第一内部接头取代上茎区的环和上茎区的茎的4个碱基对。
在一些实施方案中,第一内部接头取代构成上茎区(即,隆突上方的茎的部分)的环的所有核苷酸。在一些实施方案中,第一内部接头取代构成上茎区的环和茎的所有核苷酸。
在一些实施方案中,重复反重复区中的隆突不含有接头。在一些实施方案中,重复反重复区中的下茎部分不含有接头。
在一些实施方案中,第二内部接头具有约6至18个原子、任选地9至18个原子的桥接长度。在一些实施方案中,第二内部接头取代sgRNA的连结点区的2个核苷酸。
在一些实施方案中,第三内部接头具有约9至30个原子、任选地15至21个原子的桥接长度。
在一些实施方案中,第三内部接头取代gRNA的发夹1的2、4、6、8或10个核苷酸。在一些实施方案中,第三接头取代gRNA的发夹1的1、2、3、4或5个碱基对。在一些实施方案中,第三接头取代gRNA的发夹1的1个碱基对。在一些实施方案中,第三接头取代gRNA的发夹1的2个碱基对。在一些实施方案中,第三接头取代gRNA的发夹1的3个碱基对。在一些实施方案中,第三接头取代gRNA的发夹1的4个碱基对。在一些实施方案中,第三接头取代gRNA的发夹1的5个碱基对。
在一些实施方案中,第三内部接头取代发夹1的环或其部分。在一些实施方案中,第三内部接头取代发夹1的环和茎或其部分。
在一些实施方案中,第三内部接头取代发夹1的环的2、3或4个核苷酸。在一些实施方案中,第一内部接头取代发夹1的环的2个核苷酸。在一些实施方案中,第一内部接头取代发夹1的环的3个核苷酸。在一些实施方案中,第一内部接头取代发夹1的环的4个核苷酸。
在一些实施方案中,第三内部接头取代发夹的环和发夹的茎的至少1个核苷酸。在一些实施方案中,第三内部接头取代发夹的环和发夹的茎的2、4或6个核苷酸。在一些实施方案中,重复反重复区中的第三内部接头取代发夹的环和发夹的茎的1、2或3个碱基对。
在一些实施方案中,第三内部接头取代构成发夹的环的所有核苷酸。在一些实施方案中,第三内部接头取代构成发夹的环和茎的所有核苷酸。
在一些实施方案中,sgRNA的发夹2区不含有任何内部接头。
在一些实施方案中,第二内部接头取代sgRNA的连结点区的环的2个核苷酸。
在一些实施方案中,sgRNA包含含有SEQ ID NO:200的序列的保守部分。在一些实施方案中,核苷酸33至36中的2、3或4者相对于SEQ ID NO:200被第一内部接头取代。在一些实施方案中,核苷酸32至37相对于SEQ ID NO:200被第一内部接头取代。在一些实施方案中,核苷酸31至38相对于SEQ ID NO:200被第一内部接头取代。在一些实施方案中,核苷酸30至39相对于SEQ ID NO:200被第一内部接头取代。在一些实施方案中,核苷酸29至40相对于SEQ ID NO:200被第一内部接头取代。在一些实施方案中,核苷酸55至56相对于SEQ IDNO:200被第二内部接头取代。在一些实施方案中,核苷酸73至76中的2、3或4者相对于SEQID NO:200被第三内部接头取代。在一些实施方案中,核苷酸72至77相对于SEQ ID NO:200被第三内部接头取代。在一些实施方案中,核苷酸71至78相对于SEQ ID NO:200被第三内部接头取代。在一些实施方案中,核苷酸70至79相对于SEQ ID NO:200被第三内部接头取代。在一些实施方案中,核苷酸97至100相对于SEQ ID NO:200缺失。
在一些实施方案中,sgRNA包含SEQ ID NO:201的序列。在一些实施方案中,相对于SEQ ID NO:201,核苷酸33至36中的2、3或4者被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:201,核苷酸32至37被第一内部接头取代。在一些实施方案中,相对于SEQID NO:201,核苷酸31至38被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:201,核苷酸30至39被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:201,核苷酸29至40被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:201,核苷酸55至56被第二内部接头取代。在一些实施方案中,相对于SEQ ID NO:201,核苷酸50至53中的2、3或4者被第三内部接头取代。在一些实施方案中,相对于SEQ ID NO:201,核苷酸49至54被第三内部接头取代。在一些实施方案中,相对于SEQ ID NO:201,核苷酸77至80缺失。
b.额外引导RNA
在一些实施方案中,sgRNA不来自化脓链球菌Cas9(“非spyCas9”)。
在一些实施方案中,引导RNA为金黄色葡萄球菌Cas9(“SauCas9”)引导RNA。示例性SauCas9 sgRNA示出于图10B中。在一些实施方案中,引导RNA为修饰的SauCas引导RNA。
在一些实施方案中,sgRNA包含引导区和引导区的3'的保守部分,其中保守部分包含重复反重复区、发夹1区和发夹2区,并且还包含以下中的至少一者:
1)第一内部接头,其取代sgRNA的重复反重复区的上茎区的至少2个核苷酸、任选地至少4个核苷酸;
2)第二内部接头,其取代sgRNA的发夹1的1或2个核苷酸;或
3)第三内部接头,其取代sgRNA的发夹2的至少2个核苷酸、任选地至少4个核苷酸。
在一些实施方案中,sgRNA包含第一内部接头和第二内部接头。在一些实施方案中,sgRNA包含第一内部接头和第三内部接头。在一些实施方案中,sgRNA包含第二内部接头和第三内部接头。在一些实施方案中,sgRNA包含第一内部接头、第二内部接头和第三内部接头。
在一些实施方案中,第一内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。在一些实施方案中,第一内部接头位于sgRNA的第一部分与sgRNA的第二部分之间的发夹中,其中第一部分和第二部分一起形成双链体部分。在一些实施方案中,第一内部接头取代上茎区的2、3、4、5、6、7、8、9、10、11或12个核苷酸。在一些实施方案中,第一内部接头取代上茎区的环或其部分。在一些实施方案中,第一内部接头取代上茎区的环和茎或其部分。在一些实施方案中,第一内部接头取代上茎区的环的2、3或4个核苷酸。
在一些实施方案中,第一内部接头取代上茎区的环和上茎区的茎的至少2、4、6或8个核苷酸。在一些实施方案中,第一内部接头取代上茎区的环和上茎区的茎的1、2、3或4个碱基对。在一些实施方案中,第一内部接头取代构成上茎区的环的所有核苷酸。
在一些实施方案中,第二内部接头具有约9至18个原子的桥接长度。在一些实施方案中,第二内部接头取代sgRNA的发夹1的2个核苷酸。在一些实施方案中,第二内部接头取代sgRNA的连结点区的茎区的2个核苷酸。
在一些实施方案中,第三内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。在一些实施方案中,第三内部接头取代gRNA的发夹2的4、5、6、7、8、9、10、11或12个核苷酸。在一些实施方案中,第三接头取代gRNA的发夹2的1、2、3、4或5个碱基对。在一些实施方案中,内部接头取代发夹2的2至6个核苷酸。在一些实施方案中,内部接头取代发夹2的2至4个核苷酸。
在一些实施方案中,第三内部接头取代发夹2的环或其部分。在一些实施方案中,第三内部接头取代发夹2的环和茎或其部分。
在一些实施方案中,第三内部接头取代发夹2的环的2、3或4个核苷酸。在一些实施方案中,第三内部接头取代发夹的环和发夹2的茎的至少1个核苷酸。在一些实施方案中,第三内部接头取代发夹的环和发夹2的茎的2、3、4、5或6个核苷酸。在一些实施方案中,重复反重复区中的第三内部接头取代发夹的环和发夹2的茎的1、2或3个碱基对。在一些实施方案中,第三内部接头取代构成发夹2的环的所有核苷酸。在一些实施方案中,第三内部接头位于sgRNA的第一部分与sgRNA的第二部分之间的发夹中,其中第一部分和第二部分一起形成双链体部分。
在一些实施方案中,引导RNA包含SEQ ID NO:202的核酸序列。在一些实施方案中,引导RNA包含有包含本文别处所公开的修饰的SEQ ID NO:202的核酸序列。
在一些实施方案中,相对于SEQ ID NO:202,核苷酸35至38中的2、3或4者被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:202,核苷酸34至39被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:202,核苷酸33至40被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:202,核苷酸32至41被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:202,核苷酸31至42被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:202,核苷酸61至62被第二内部接头取代。在一些实施方案中,相对于SEQ IDNO:202,核苷酸84至87中的2、3或4者被第三内部接头取代。在一些实施方案中,相对于SEQID NO:202,核苷酸83至88被第三内部接头取代。在一些实施方案中,相对于SEQ ID NO:202,核苷酸82至89被第三内部接头取代。在一些实施方案中,相对于SEQ ID NO:202,核苷酸81至90被第三内部接头取代。在一些实施方案中,相对于SEQ ID NO:202,核苷酸97至100缺失。
在一些实施方案中,其中gRNA为SauCas9引导RNA,并且不包含第三内部接头。
在一些实施方案中,引导RNA为白喉棒状杆菌Cas9(“CdiCas9”)引导RNA。在一些实施方案中,引导RNA为修饰的CdiCas9引导RNA。在一些实施方案中,引导RNA包含SEQ ID NO:203的核酸序列。在一些实施方案中,引导RNA包含有包含本文别处所公开的修饰的SEQ IDNO:203的核酸序列。
在一些实施方案中,gRNA为白喉棒状杆菌Cas9(CdiCas9)引导RNA、嗜热链球菌Cas9(SthCas9)引导RNA或解纤维热酸菌Cas9(AceCas9)引导RNA。
在一些实施方案中,引导RNA为嗜热链球菌Cas9(“St1Cas9”或“SthCas9”)引导RNA。在一些实施方案中,引导RNA为修饰的St1Cas9引导RNA。在一些实施方案中,引导RNA包含SEQ ID NO:204或205的核酸序列。在一些实施方案中,引导RNA包含有包含本文别处所公开的修饰的SEQ ID NO:204或205的核酸序列。
在一些实施方案中,sgRNA包含引导区和引导区的3'的保守部分,其中保守部分包含重复反重复区、发夹1区和发夹2区,并且包含取代重复反重复区的至少4个核苷酸的第一内部接头和取代发夹2的至少3个核苷酸的第二内部接头。
在一些实施方案中,第一内部接头具有约15至21个原子的桥接长度。在一些实施方案中,第一内部接头取代gRNA的重复反重复区的4、5、6、7、8、9、10、11或12个核苷酸。在一些实施方案中,第一内部接头位于sgRNA的第一部分与重复反重复区的第二部分之间的发夹中,其中第一部分和第二部分一起形成双链体部分。
在一些实施方案中,第一内部接头取代重复反重复区的发夹的环或其部分。在一些实施方案中,第一内部接头取代重复反重复区的发夹的环和茎或其部分。
在一些实施方案中,第一内部接头取代重复反重复区的发夹结构的环的2、3或4个核苷酸。在一些实施方案中,第一内部接头取代发夹结构的环和重复反重复区的发夹结构的茎的至少2、4、6、8、10或12个核苷酸。在一些实施方案中,第一内部接头取代发夹结构的环和重复反重复区的发夹结构的茎的1、2、3、4、5或6个碱基对。在一些实施方案中,第一内部接头取代构成重复反重复区的发夹结构的环的所有核苷酸。在一些实施方案中,第一内部接头取代构成重复反重复区的上茎区(即,隆突上方的重复反重复区的部分)的发夹结构的环和茎的所有核苷酸。在一些实施方案中,第二内部接头具有约9至30个、任选地约15至21个原子的桥接长度。在一些实施方案中,第二内部接头取代gRNA的发夹2的3、4、5、6、7、8、9、10、11、12、13、14或15个核苷酸。在一些实施方案中,第二内部接头取代发夹2的环区。在一些实施方案中,第二内部接头取代发夹2的环区和茎区的部分。在一些实施方案中,第二内部接头取代发夹2的环或其部分。在一些实施方案中,第二内部接头取代发夹2的环和茎或其部分。在一些实施方案中,第二内部接头取代发夹2的环的2、3或4个核苷酸。在一些实施方案中,第二内部接头取代构成发夹2的环的所有核苷酸。在一些实施方案中,第二内部接头取代发夹2的环和发夹2的茎的至少1、2、3、4、5或6个核苷酸。在一些实施方案中,第二内部接头取代发夹的环和发夹2的茎的1、2或3个碱基对。
在一些实施方案中,sgRNA包含SEQ ID NO:204的序列。在一些实施方案中,相对于SEQ ID NO:204,核苷酸41至44被第一内部接头取代。在一些实施方案中,相对于SEQ IDNO:204,核苷酸101至103被第二内部接头取代。在一些实施方案中,相对于SEQ ID NO:204,核苷酸94至111内的2至18个核苷酸被取代。
在一些实施方案中,引导RNA为解纤维热酸菌Cas9(“AceCas9”)引导RNA。在一些实施方案中,引导RNA为修饰的AceCas9引导RNA。在一些实施方案中,引导RNA包含SEQ ID NO:206的核酸序列。在一些实施方案中,引导RNA包含有包含本文别处所公开的修饰的SEQ IDNO:206的核酸序列。
在一些实施方案中,引导RNA为空肠弯曲杆菌Cas9(“CjeCas9”)引导RNA。在一些实施方案中,引导RNA为修饰的CjeCas9引导RNA。
在一些实施方案中,gRNA包含引导区和引导区的3'的保守部分,其中保守部分包含重复反重复区和发夹区,并且包含取代重复反重复区的至少4个核苷酸的内部接头。在一些实施方案中,第一内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。在一些实施方案中,第一内部接头取代gRNA的重复反重复区的4、5、6、7、8、9、10、11或12个核苷酸。在一些实施方案中,第一内部接头位于sgRNA的第一部分与重复反重复区的第二部分之间的发夹结构中,其中第一部分和第二部分一起形成双链体部分。
在一些实施方案中,引导RNA包含SEQ ID NO:207的核酸序列。在一些实施方案中,引导RNA包含有包含本文别处所公开的修饰的SEQ ID NO:207的核酸序列。在一些实施方案中,其中相对于SEQ ID NO:207,核苷酸33至36被内部接头取代。在一些实施方案中,相对于SEQ ID NO:207,核苷酸27至32和37至42的1、2、3、4、5或6个碱基对被内部接头取代。
在一些实施方案中,Cpf1引导RNA为新凶手弗朗西斯氏菌Cas9(“FnoCas9”)引导RNA。在一些实施方案中,引导RNA为修饰的FnoCas9引导RNA。
在一些实施方案中,gRNA包含重复反重复区和取代重复反重复区的至少4个核苷酸的内部接头。在一些实施方案中,内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。在一些实施方案中,内部接头取代gRNA的重复反重复区的3、4、5或6个核苷酸。
在一些实施方案中,引导RNA包含SEQ ID NO:208的核酸序列。在一些实施方案中,引导RNA包含有包含本文别处所公开的修饰的SEQ ID NO:208的核酸序列。在一些实施方案中,相对于SEQ ID NO:208,核苷酸40至43中的2、3或4者被内部接头取代。在一些实施方案中,其中相对于SEQ ID NO:208,核苷酸39至44被内部接头取代。
VI型Cpf1引导RNA
在一些实施方案中,gRNA为Cpf1引导RNA。在一些实施方案中,引导RNA为AsCpf1/Cas12a引导RNA。示例性AsCpf1/Cas12a sgRNA示于图10C中。在一些实施方案中,引导RNA为修饰的AsCpf1/Cas12a引导RNA。在一些实施方案中,引导RNA包含SEQ ID NO:209的核酸序列。在一些实施方案中,引导RNA包含有包含本文别处所公开的修饰的SEQ ID NO:209的核酸序列。在一些实施方案中,gRNA包含SEQ ID NO:209的序列,并且相对于SEQ ID NO:209,核苷酸11至14、12至15或任选地12至14被内部接头取代。
在一些实施方案中,引导RNA为惰性真杆菌(Es)Cas13d(EsCas13d)引导RNA。示例性EsCas13d sgRNA示于图10D中。在一些实施方案中,引导RNA包含SEQ ID NO:210的核酸序列。在一些实施方案中,引导RNA包含有包含本文别处所公开的修饰的SEQ ID NO:210的核酸序列。在一些实施方案中,gRNA包含SEQ ID NO:210的序列,并且相对于SEQ ID NO:210,核苷酸9至16或任选地10至15或其至少2个核苷酸被内部接头取代。
示例性Nme sgRNA示出于图10E中,并且下文提供各种实施方案。
包含至少一个内部接头的各种示例性sgRNA提供于表2A至2B中。核苷酸修饰在表2A至2B中如下指示:m:2'-OMe;*:PS键联。因此,举例而言,mA表示2'-O-甲基腺苷。
当提供未修饰的核苷酸序列时,A、C、G和U独立地为未修饰的或修饰的RNA核苷酸。在某些实施方案中,当提供修饰的核苷酸序列时,A、C、G和U为未修饰的RNA核苷酸。在某些实施方案中,当提供修饰的核苷酸序列时,A、C、G和U独立地为未修饰的或修饰的RNA核苷酸。
在本文中的表中,L1和L2任选地分别为如下C9和C18:
sgRNA名称有时用紧接着G之后的一个或多个前置零提供。此不影响名称的含义。因此,举例而言,G000282、G0282、G00282和G282是指相同sgRNA。类似地,crRNA和或trRNA名称有时分别用紧接着CR或TR之后的一个或多个前置零提供,其不影响名称的含义。因此,举例而言,CR000100、CR00100、CR0100和CR100是指相同crRNA,并且TR000200、TR00200、TR0200和TR200是指相同trRNA。
包含内部接头的示例性SpyCas9引导RNA提供于表2A至2C中。如本文所用,“接头1”或“L1”是指具有约15至21个原子的桥接长度的内部接头。如本文所用,“接头2”或“L2”是指具有约6至12个原子(例如约9个原子)的桥接长度的内部接头;“接头3”或“L3”是指具有约6个原子的桥接长度的内部接头;“接头4”或“L4”是指具有约3个原子的桥接长度的内部接头;“dS”是指无碱基核苷
表2A.示例性gRNA序列的表
/>
/>
表2B.额外示例性gRNA序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
表2C.包含接头的示例性SpyCas9引导RNA
/>
核苷酸修饰在表2A至2C中如下指示:m:2'-OMe;和*:PS键联。如本文所用,“N”可为任何天然或非天然核苷酸。举例而言,本文涵盖表2C中的SEQ ID NO:230,其中N'被本文所公开的引导序列中的任一者置换。尽管引导物的核苷酸用N'取代,但所述修饰保持如SEQID NO:230中所示。即,尽管引导物的核苷酸置换“N'”,但前三个核苷酸仍为被2'-O-Me修饰的,并且在第一核苷酸与第二核苷酸、第二核苷酸与第三核苷酸和第三核苷酸与第四核苷酸之间存在硫代磷酸酯键联。
E.本文所描述的化学修饰类型
本文公开在不同位置包含修饰的引导RNA(例如sgRNA、dgRNA和crRNA)。在一些实施方案中,包含修饰的gRNA的位置被修饰而具有以下修饰类型中的任一者或多者。
2'-O-甲基修饰
据信修饰的糖类控制核苷酸糖环的褶皱,一种影响寡核苷酸对于互补链的结合亲和力、双链体形成和与核酸酶的相互作用的物理性质。糖环上的取代因此可改变这些糖类的构形和褶皱。举例而言,2'-O-甲基(2'-OMe)修饰可增加寡核苷酸的结合亲和力和核酸酶稳定性,但如实施例中所示,寡核苷酸中的指定位置处的任何修饰的影响需要凭经验确定。
术语“mA”、“mC”、“mU”或“mG”可用于表示已被2'-OMe修饰的核苷酸。
核糖核苷酸和修饰的2'-O-甲基核糖核苷酸可如下描绘:
2'-O-(2-甲氧基乙基)修饰
在一些实施方案中,修饰可为2'-O-(2-甲氧基乙基)(2'-O-moe)。修饰的2'-O-moe核糖核苷酸可如下描绘:
术语“moeA”、“moeC”、“moeU”或“moeG”可用于表示已被2'-O-moe修饰的核苷酸。
2'-氟修饰
已展示可影响核苷酸糖环的另一化学修饰为卤素取代。举例而言,核苷酸糖环上的2'-氟(2'-F)取代可增加寡核苷酸结合亲和力和核酸酶稳定性。
在本申请中,术语“fA”、“fC”、“fU”或“fG”可用于表示已被2'-F取代的核苷酸。
不具有和具有2'-F取代的核糖核苷酸可如下描绘:
硫代磷酸酯修饰
硫代磷酸酯(PS)键联或键是指一键,其中硫取代磷酸二酯键联(例如核苷酸之间的磷酸二酯键联)中的一个非桥接磷酸酯氧。当硫代磷酸酯用于产生寡核苷酸时,修饰的寡核苷酸也可被称作S-寡核苷酸。
“*”可用于描绘PS修饰。在本申请中,术语A*、C*、U*或G*可用于表示由PS键连接至下一(例如3')核苷酸的核苷酸。在通篇本申请中,PS修饰为根据其3'碳键结至硫代磷酸酯的核苷酸分组;因此,指示PS修饰位于位置1处意指硫代磷酸酯键结至核苷酸1的3'碳和核苷酸2的5'碳。因此,在YA位点指示为“被PS修饰”等的情况下,PS键联介于Y与A之间或介于A与下一核苷酸之间。
在本申请中,术语“mA*”、“mC*”、“mU*”或“mG*”可用于表示已被2'-OMe取代并且经由PS键联(其有时可称为“PS键”)连接至下一(例如3')核苷酸的核苷酸。类似地,术语“fA*”、“fC*”、“fU*”或“fG*”可用于表示已被2'-F取代并且经由PS键联连接至下一(例如3')核苷酸的核苷酸。本文所描述的实施方案涵盖PS键联或键的等效物。
下图示出用S-取代非桥接磷酸酯氧,从而产生PS键联替代磷酸二酯键联:
/>
反向无碱基修饰
无碱基核苷酸是指缺乏含氮碱基的那些核苷酸。由于无碱基核苷酸无法形成碱基对,因此其不会由于不成对的核苷酸(例如隆突、环)而破坏结构的形成。下图描绘一种寡核苷酸,其具有缺乏碱基的无碱基位点(在此情况下,示出为无嘌呤核酸;无碱基位点也可为无嘧啶核酸位点,其中无碱基位点的描述通常参考沃森-克里克碱基配对,例如无嘌呤位点是指缺乏含氮碱基并且通常将与嘧啶核酸位点存在碱基配对的位点),其中碱基可在呋喃环的1'位置被另一部分取代(例如羟基,如下文所示,以形成核糖或脱氧核糖位点,如下文所示,或氢):
反向碱基是指键联相对于正常5'至3'键联呈反向(即,5'至5'键联或3'至3'键联)的那些碱基。举例而言:
无碱基核苷酸可经由反向键联连接。举例而言,无碱基核苷酸可经由5'至5'键联连接至末端5'核苷酸,或无碱基核苷酸可经由3'至3'键联连接至末端3'核苷酸。末端5'抑或3'核苷酸处的反向无碱基核苷酸也可称为反向无碱基端帽。在本申请中,术语“invd”指示反向无碱基核苷酸键联。
脱氧核糖核苷酸
在gRNA的情形下,脱氧核糖核苷酸(其中糖包含2'-脱氧位置)视为一种修饰,原因在于相对于标准RNA,核苷酸因质子取代2'位置的羟基而被修饰。除非另外指明,否则未修饰的RNA中的存在于位置U处的脱氧核糖核苷酸修饰也可包含T置换U核碱基。
双环核糖类似物
示例性双环核糖类似物包括锁定核酸(LNA)、ENA、桥接的核酸(BNA),或其他LNA样修饰。在一些情况下,双环核糖类似物的2'和4'位置经由接头连接。接头可具有式-X-(CH2)n-,其中n为1或2;X为O、NR或S;并且R为H或C1-3烷基,例如甲基。双环核糖类似物的实例包括LNA,其包含2'-O-CH2-4'双环结构(氧基-LNA)(参见WO 98/39352和WO 99/14226);2'-NH-CH2-4'或2'-N(CH3)-CH2-4'(氨基-LNA)(Singh等人,J.Org.Chem.63:10035-10039(1998);Singh等人,J.Org.Chem.63:6078-6079(1998));和2'-S-CH2-4'(硫基-LNA)(Singh等人,J.Org.Chem.63:6078-6079(1998);Kumar等人,Biorg.Med.Chem.Lett.8:2219-2222(1998))。
ENA
ENA修饰是指包含2'-O,4'-C-亚乙基修饰的核苷酸。ENA核苷酸的示例性结构示出如下,其中波浪线指示与相邻核苷酸的连接(或任选地可为末端位置,应理解如果3'末端核苷酸为ENA核苷酸,则3'位置可包含羟基而非磷酸酯)。关于ENA核苷酸的进一步论述,参见例如Koizumi等人,Nucleic Acids Res.31:3267-3273(2003)。
UNA
UNA或非锁定核酸修饰是指一种包含2',3'-seco-RNA修饰的核苷酸,其中2'碳与3'碳彼此不直接键结。UNA核苷酸的示例性结构示出如下,其中波浪线指示与相邻磷酸酯的连接或置换磷酸酯的修饰(或任选地可为末端位置)。关于UNA核苷酸的进一步论述,参见例如Snead等人,Molecular Therapy 2:e103,doi:10.1038/mtna.2013.36(2013)。
碱基修饰
碱基修饰为改变核碱基结构或其连至主链的键的任何修饰,包括异构化(如假尿苷)。在一些实施方案中,碱基修饰包括肌苷。在一些实施方案中,修饰包含降低RNA核酸内切酶活性的碱基修饰,其例如通过干扰RNA酶对裂解位点的识别或通过使RNA结构(例如二级结构)稳定,从而减少RNA酶对裂解位点的可及性。可使RNA结构稳定的示例性碱基修饰为假尿苷和5-甲基胞嘧啶。参见Peacock等人,J Org Chem.76:7295-7300(2011)。在一些实施方案中,碱基修饰可如下提高或降低核酸的解链温度(Tm),例如通过增强沃森-克里克碱基对的氢键结、形成非典型碱基对,或形成错配的碱基对。
以上修饰和其等效物包括在本文所描述的实施方案的范围内。
YA修饰
YA位点处的修饰(也称为YA修饰)可为核苷间键联的修饰、碱基(嘧啶或腺嘌呤)的修饰(例如通过化学修饰、取代或以其他方式达成),或糖的修饰(例如在2'位置,诸如2'-O-烷基、2'-F、2'-moe、2'-F阿拉伯糖、2'-H(脱氧核糖)等)。在一些实施方案中,“YA修饰”为改变二核苷酸模体结构以降低RNA核酸内切酶活性的任何修饰,其例如通过干扰RNA酶对YA位点的识别或裂解或通过使RNA结构(例如二级结构)稳定,从而减少RNA酶对裂解位点的可及性。参见Peacock等人,J Org Chem.76:7295-7300(2011);Behlke,Oligonucleotides 18:305-320(2008);Ku等人,Adv.Drug Delivery Reviews 104:16-28(2016);Ghidini等人,Chem.Commun.,2013,49,9036。Peacock等人、Belhke,Ku和Ghidini提供适用作YA修饰的示例性修饰。涵盖本领域技术人员已知的减少核酸内切降解的修饰。影响涉及RNA酶裂解的2'羟基的示例性2'核糖修饰为2'-H和2'-O-烷基,包括2'-O-Me。YA位点处的残基的修饰(诸如双环核糖类似物、UNA和修饰的核苷间键联)可为YA修饰。可使RNA结构稳定的示例性碱基修饰为假尿苷和5-甲基胞嘧啶。在一些实施方案中,YA位点的至少一个核苷酸被修饰。在一些实施方案中,YA位点的嘧啶(也称为“嘧啶位置”)包含修饰(包括改变紧接嘧啶的糖的3'的核苷间键联的修饰、嘧啶碱基的修饰,和核糖的修饰,例如在其2'位置)。在一些实施方案中,YA位点的腺嘌呤(也称为“腺嘌呤位置”)包含修饰(包括改变紧接嘧啶的糖的3'的核苷间键联的修饰、嘧啶碱基的修饰,和核糖的修饰,例如在其2'位置)。在一些实施方案中,YA位点的嘧啶和腺嘌呤包含修饰。在一些实施方案中,YA修饰降低RNA核酸内切酶活性。
以上修饰和其等效物包括在本文所描述的实施方案的范围内。
引导区或YA位点的修饰
在一些实施方案中,gRNA包含在1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或更多个YA位点处的修饰。在一些实施方案中,YA位点的嘧啶包含修饰(包括改变紧接嘧啶的糖的3'的核苷间键联的修饰)。在一些实施方案中,YA位点的腺嘌呤包含修饰(包括改变紧接腺嘌呤的糖的3'的核苷间键联的修饰)。在一些实施方案中,YA位点的嘧啶和腺嘌呤包含修饰,诸如糖、碱基或核苷间键联修饰。YA修饰可为本文所阐述的任何类型的修饰。在一些实施方案中,YA修饰包含硫代磷酸酯、2'-OMe或2'-氟中的一者或多者。在一些实施方案中,YA修饰包含嘧啶修饰,包含硫代磷酸酯、2'-OMe、2'-H、肌苷或2'-氟中的一者或多者。在一些实施方案中,YA修饰在含有一个或多个YA位点的RNA双链体区内包含双环核糖类似物(例如,LNA、BNA或ENA)。在一些实施方案中,YA修饰在含有YA位点的RNA双链体区内包含双环核糖类似物(例如,LNA、BNA或ENA),其中YA修饰位于YA位点远端。
gRNA的引导区可根据任何实施方案修饰,其包含本文所阐述的修饰的引导区。在一些实施方案中,引导区包含1、2、3、4、5或更多个可包含YA修饰的YA位点(“引导区YA位点”)。在一些实施方案中,修饰的引导区YA位点包含如上文针对YA位点所描述的修饰。引导区修饰(包括引导区YA位点修饰)的额外实施方案阐述于本文别处。在可行的情况下,本公开在别处阐述的任何实施方案可与前述实施方案中的任一者组合。
对末端核苷酸的修饰
在一些实施方案中,gRNA的5'或3'末端区被修饰。
3'末端区修饰
在一些实施方案中,3'末端区中的末端(即,最后)1、2、3、4、5、6或7个核苷酸被修饰。在全篇中,此修饰可被称为“3'端修饰”。在一些实施方案中,3'末端区中的末端(即,最后)1、2、3、4、5、6或7个核苷酸包含超过一个修饰。在一些实施方案中,3'末端区中的末端(即,最后)1、2、3、4、5、6或7个核苷酸中的至少一者被修饰。在一些实施方案中,3'末端区中的末端(即最后)1、2、3、4、5、6或7个核苷酸中的至少两者被修饰。在一些实施方案中,3'末端区中的末端(即最后)1、2、3、4、5、6或7个核苷酸中的至少三者被修饰。在一些实施方案中,修饰包含PS键联。在一些实施方案中,对3'末端区的修饰为3'保护性末端修饰。在一些实施方案中,3'端修饰包含3'保护性末端修饰。
在一些实施方案中,3'端修饰包含选自以下的修饰的核苷酸:2'-O-甲基(2'-O-Me)修饰的核苷酸、2'-O-(2-甲氧基乙基)(2'-O-moe)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联、反向无碱基修饰的核苷酸或其组合。
在一些实施方案中,3'端修饰包含或还包含2'-O-甲基(2'-O-Me)修饰的核苷酸。
在一些实施方案中,3'端修饰包含或还包含2'-氟(2'-F)修饰的核苷酸。
在一些实施方案中,3'端修饰包含或还包含核苷酸之间的硫代磷酸酯(PS)键联。
在一些实施方案中,3'端修饰包含或还包含反向无碱基修饰的核苷酸。
在一些实施方案中,3'端修饰包含或还包含最后7、6、5、4、3、2或1个核苷酸中的任一者或多者的修饰。在一些实施方案中,3'端修饰包含或还包含一个修饰的核苷酸。在一些实施方案中,3'端修饰包含或还包含两个修饰的核苷酸。在一些实施方案中,3'端修饰包含或还包含三个修饰的核苷酸。在一些实施方案中,3'端修饰包含或还包含四个修饰的核苷酸。在一些实施方案中,3'端修饰包含或还包含五个修饰的核苷酸。在一些实施方案中,3'端修饰包含或还包含六个修饰的核苷酸。在一些实施方案中,3'端修饰包含或还包含七个修饰的核苷酸。
在一些实施方案中,3'端修饰包含或还包含1至7个或1至5个核苷酸的修饰。
在一些实施方案中,3'端修饰包含或还包含gRNA的3'端处的1、2、3、4、5、6或7个核苷酸的修饰。
在一些实施方案中,3'端修饰包含或还包含gRNA的3'端处的约1至3、1至5、1至6或1至7个核苷酸的修饰。
在一些实施方案中,3'端修饰包含或还包含以下中的任一者或多者:核苷酸之间的硫代磷酸酯(PS)键联、2'-O-Me修饰的核苷酸、2'-O-moe修饰的核苷酸、2'-F修饰的核苷酸、反向无碱基修饰的核苷酸和其组合。
在一些实施方案中,3'端修饰包含或还包含核苷酸之间的1、2、3、4、5、6或7个PS键联。
在一些实施方案中,3'端修饰包含或还包含至少一个2'-O-Me、2'-O-moe、反向无碱基或2'-F修饰的核苷酸。在一些实施方案中,3'端修饰包含或还包含一个PS键联,其中所述键联介于最后一个核苷酸与倒数第二个核苷酸之间。在一些实施方案中,3'端修饰包含或还包含最后三个核苷酸之间的两个PS键联。在一些实施方案中,3'端修饰包含或还包含最后四个核苷酸之间的四个PS键联。
在一些实施方案中,3'端修饰包含或还包含最后四个核苷酸中的任一者或多者之间的PS键联。在一些实施方案中,3'端修饰包含或还包含最后五个核苷酸中的任一者或多者之间的PS键联。在一些实施方案中,3'端修饰包含或还包含最后2、3、4、5、6或7个核苷酸中的任一者或多者之间的PS键联。
在一些实施方案中,3'端修饰包含或还包含最后1至7个核苷酸中的一者或多者的修饰,其中所述修饰为PS键联、反向无碱基核苷酸、2'-OMe、2'-O-moe、2'-F或其组合。
在一些实施方案中,3'端修饰包含或还包含2'-OMe、2'-O-moe、2'-F或其组合对最后一个核苷酸的修饰,和任选地存在的连至3'尾的下一核苷酸或第一个核苷酸的一个或两个PS键联。
在一些实施方案中,3'端修饰包含或还包含2'-OMe、2'-O-moe、2'-F或其组合对最后一个或倒数第二个核苷酸的修饰,和任选地存在的一个或多个PS键联。
在一些实施方案中,3'端修饰包含或还包含2'-OMe、2'-O-moe、2'-F或其组合对最后一个、倒数第二个或倒数第三个核苷酸的修饰,和任选地存在的一个或多个PS键联。
在一些实施方案中,3'端修饰包含或还包含2'-OMe、2'-O-moe、2'-F或其组合对最后一个、倒数第二个、倒数第三个或倒数第四个核苷酸的修饰,和任选地存在的一个或多个PS键联。
在一些实施方案中,3'端修饰包含或还包含2'-OMe、2'-O-moe、2'-F或其组合对最后一个、倒数第二个、倒数第三个、倒数第四个或倒数第五个核苷酸的修饰,和任选地存在的一个或多个PS键联。
在某些实施方案中,3'端修饰包含2'-O-Me修饰和PS修饰。在一些实施方案中,3'端修饰包含相同数目的2'-O-Me修饰和PS修饰。在一些实施方案中,3'端修饰所包含的2'-O-Me修饰比PS修饰多一个。在一些实施方案中,3'端修饰所包含的2'-O-Me修饰比PS修饰少一个。在某些实施方案中,3'端修饰包含4个2'-O-Me修饰。在某些实施方案中,3'端修饰包含3个2'-O-Me修饰。
在一些实施方案中,包含3'端修饰的gRNA包含或还包含3'尾,其中所述3'尾包含存在于3'尾中的核苷酸中的任一者或多者的修饰。在一些实施方案中,3'尾被完全修饰。在一些实施方案中,3'尾包含1、2、3、4、5、6、7、8、9、10、1至2个、1至3个、1至4个、1至5个、1至6个、1至7个、1至8个、1至9个或1至10个核苷酸,任选地其中这些核苷酸中的任一者或多者被修饰。
3'尾
在一些实施方案中,gRNA包含3'末端,其包含3'尾,所述3'尾在后面并且为gRNA的保守部分的3'。在一些实施方案中,3'尾包含1至约20个核苷酸、1至约15个核苷酸、1至约10个核苷酸、1至约5个核苷酸、1至约4个核苷酸、1至约3个核苷酸,和1至约2个核苷酸。在一些实施方案中,3'尾包含约1、2、3、4、5、6、7、8、9或10个核苷酸。在一些实施方案中,3'尾包含1、2、3、4、5、6、7、8、9或10个核苷酸。在一些实施方案中,3'尾包含1个核苷酸。在一些实施方案中,3'尾包含2个核苷酸。在一些实施方案中,3'尾包含3个核苷酸。在一些实施方案中,3'尾包含4个核苷酸。在一些实施方案中,3'尾包含约1至2个、1至3个、1至4个、1至5个、1至7个、1至10个、至少1至5个、至少1至3个、至少1至4个、至少1至5个、至少1至5个、至少1至7个或至少1至10个核苷酸。在一些实施方案中,尾以包含尿嘧啶或修饰的尿嘧啶的核苷酸终止。在一些实施方案中,3'尾的长度为1个核苷酸并且为包含尿嘧啶或修饰的尿嘧啶的核苷酸。在一些实施方案中,gRNA的3'核苷酸为包含尿嘧啶或修饰的尿嘧啶的核苷酸。
在一些实施方案中,3'尾包含1至20个核苷酸并且位于gRNA的保守部分的3'端之后。
在一些实施方案中,3'尾包含或还包含以下中的一者或多者:保护性末端修饰、核苷酸之间的硫代磷酸酯(PS)键联、2'-OMe修饰的核苷酸、2'-O-moe修饰的核苷酸、2'-F修饰的核苷酸、反向无碱基修饰的核苷酸和其组合。
在一些实施方案中,3'尾包含或还包含核苷酸之间的一个或多个硫代磷酸酯(PS)键联。在一些实施方案中,3'尾包含或还包含一个或多个2'-OMe修饰的核苷酸。在一些实施方案中,3'尾包含或还包含一个或多个2'-O-moe修饰的核苷酸。在一些实施方案中,3'尾包含或还包含一个或多个2'-F修饰的核苷酸。在一些实施方案中,3'尾包含或还包含一个或多个反向无碱基修饰的核苷酸。在一些实施方案中,3'尾包含或还包含一个或多个保护性末端修饰。在一些实施方案中,3'尾包含或还包含以下中的一者或多者的组合:核苷酸之间的硫代磷酸酯(PS)键联、2'-OMe修饰的核苷酸、2'-O-moe修饰的核苷酸、2'-F修饰的核苷酸和反向无碱基修饰的核苷酸。
在一些实施方案中,gRNA不包含3'尾。
5'末端区修饰
在一些实施方案中,5'末端区被修饰,例如gRNA的前1、2、3、4、5、6或7个核苷酸被修饰。在全篇中,此修饰可称为“5'端修饰”。在一些实施方案中,5'末端区的前1、2、3、4、5、6或7个核苷酸包含超过一个修饰。在一些实施方案中,5'端的末端(即,前)1、2、3、4、5、6或7个核苷酸中的至少一者被修饰。在一些实施方案中,5'末端区处的末端1、2、3、4、5、6或7个核苷酸中的至少两者被修饰。在一些实施方案中,5'末端区处的末端1、2、3、4、5、6或7个核苷酸中的至少三者被修饰。在一些实施方案中,5'端修饰为5'保护性末端修饰。
在一些实施方案中,gRNA的5'和3'末端区(例如,端)两者均被修饰。在一些实施方案中,仅gRNA的5'末端区被修饰。在一些实施方案中,仅gRNA的保守部分的3'末端区(加或减3'尾)被修饰。
在一些实施方案中,gRNA包含gRNA的5'末端区处的前7个核苷酸中的1、2、3、4、5、6或7者处的修饰。在一些实施方案中,gRNA包含3'末端区处的7个末端核苷酸中的1、2、3、4、5、6或7者处的修饰。在一些实施方案中,5'末端区处的前4个核苷酸中的2、3或4者,或3'末端区处的末端4个核苷酸中的2、3或4者被修饰。在一些实施方案中,5'末端区处的前4个核苷酸中的2、3或4者经由硫代磷酸酯(PS)键连接。
在一些实施方案中,对5'末端或3'末端的修饰包含2'-O-甲基(2'-O-Me)或2'-O-(2-甲氧基乙基)(2'-O-moe)修饰。在一些实施方案中,修饰包含对核苷酸的2'-氟(2'-F)修饰。在一些实施方案中,修饰包含核苷酸之间的硫代磷酸酯(PS)键联。在一些实施方案中,修饰包含反向无碱基核苷酸。在一些实施方案中,修饰包含保护性末端修饰。在一些实施方案中,修饰包含超过一个选自以下的修饰:保护性末端修饰、2'-O-Me、2'-O-moe、2'-氟(2'-F)、核苷酸之间的硫代磷酸酯(PS)键联和反向无碱基核苷酸。在一些实施方案中,涵盖等效修饰。
在一些实施方案中,gRNA包含5'末端处的前一个、两个、三个、四个、五个、六个或七个核苷酸之间的一个或多个硫代磷酸酯(PS)键联。在一些实施方案中,gRNA包含3'末端处的最后一个、两个、三个、四个、五个、六个或七个核苷酸之间的一个或多个PS键联。在一些实施方案中,gRNA包含3'末端处的最后一个、两个、三个、四个、五个、六个或七个核苷酸与5'末端的5'端的前一个、两个、三个、四个、五个、六个或七个核苷酸之间的一个或多个PS键联。在一些实施方案中,除PS键联的外,5'和3'末端核苷酸也可包含2'-O-Me、2'-O-moe或2'-F修饰的核苷酸。
在一些实施方案中,gRNA包含5'端修饰,例如其中引导区的第一个核苷酸被修饰。在一些实施方案中,gRNA包含5'端修饰,其中引导区的第一个核苷酸包含5'保护性末端修饰。
在一些实施方案中,5'端修饰包含选自以下的修饰的核苷酸:2'-O-甲基(2'-O-Me)修饰的核苷酸、2'-O-(2-甲氧基乙基)(2'-O-moe)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联、反向无碱基修饰的核苷酸或其组合。
在一些实施方案中,5'端修饰包含或还包含2'-O-甲基(2'-O-Me)修饰的核苷酸。
在一些实施方案中,5'端修饰包含或还包含2'-氟(2'-F)修饰的核苷酸。
在一些实施方案中,5'端修饰包含或还包含核苷酸之间的硫代磷酸酯(PS)键联。
在一些实施方案中,5'端修饰包含或还包含反向无碱基修饰的核苷酸。
在一些实施方案中,5'端修饰包含或还包含gRNA的引导区的核苷酸1至7中的任一者或多者的修饰。在一些实施方案中,5'端修饰包含或还包含一个修饰的核苷酸。在一些实施方案中,5'端修饰包含或还包含两个修饰的核苷酸。在一些实施方案中,5'端修饰包含或还包含三个修饰的核苷酸。在一些实施方案中,5'端修饰包含或还包含四个修饰的核苷酸。在一些实施方案中,5'端修饰包含或还包含五个修饰的核苷酸。在一些实施方案中,5'端修饰包含或还包含六个修饰的核苷酸。在一些实施方案中,5'端修饰包含或还包含七个修饰的核苷酸。
在一些实施方案中,5'端修饰包含或还包含1至7个、1至5个、1至4个、1至3个或1至2个核苷酸的修饰。
在一些实施方案中,5'端修饰包含或还包含从5'端起1、2、3、4、5、6或7个核苷酸的修饰。在一些实施方案中,5'端修饰包含或还包含从5'端起约1至3个、1至4个、1至5个、1至6个或1至7个核苷酸的修饰。
在一些实施方案中,5'端修饰包含或还包含gRNA的5'端处的第一个核苷酸处的修饰。在一些实施方案中,5'端修饰包含或还包含从gRNA的5'端起第一个和第二个核苷酸处的修饰。在一些实施方案中,5'端修饰包含或还包含从gRNA的5'端起第一个、第二个和第三个核苷酸处的修饰。在一些实施方案中,5'端修饰包含或还包含从gRNA的5'端起第一个、第二个、第三个和第四个核苷酸处的修饰。在一些实施方案中,5'端修饰包含或还包含从gRNA的5'端起第一个、第二个、第三个、第四个和第五个核苷酸处的修饰。在一些实施方案中,5'端修饰包含或还包含从gRNA的5'端起第一个、第二个、第三个、第四个、第五个和第六个核苷酸处的修饰。在一些实施方案中,5'端修饰包含或还包含从gRNA的5'端起第一个、第二个、第三个、第四个、第五个、第六个和第七个核苷酸处的修饰。
在一些实施方案中,5'端修饰包含或还包含核苷酸之间的硫代磷酸酯(PS)键联、或2'-O-Me修饰的核苷酸、或2'-O-moe修饰的核苷酸、或2'-F修饰的核苷酸、或反向无碱基修饰的核苷酸、或其组合。
在一些实施方案中,5'端修饰包含或还包含核苷酸之间的1、2、3、4、5、6或7个PS键联。在一些实施方案中,5'端修饰包含或还包含核苷酸之间的约1至2个、1至3个、1至4个、1至5个、1至6个或1至7个PS键联。
在一些实施方案中,5'端修饰包含或还包含至少一个PS键联,其中如果存在一个PS键联,则所述键联介于引导区的核苷酸1与2之间。
在一些实施方案中,5'端修饰包含或还包含至少两个PS键联,并且所述键联介于引导区的核苷酸1与2和2与3之间。
在一些实施方案中,5'端修饰包含或还包含引导区的核苷酸1与2、2与3和3与4中的任一者或多者之间的PS键联。
在一些实施方案中,5'端修饰包含或还包含引导区的核苷酸1与2、2与3、3与4和4与5中的任一者或多者之间的PS键联。
在一些实施方案中,5'端修饰包含或还包含引导区的核苷酸1与2、2与3、3与4、4与5和5与6中的任一者或多者之间的PS键联。
在一些实施方案中,5'端修饰包含或还包含引导区的核苷酸1与2、2与3、3与4、4与5、5与6和7与8中的任一者或多者之间的PS键联。
在一些实施方案中,5'端修饰包含或还包含引导区的核苷酸1至7中的一者或多者的修饰,其中所述修饰为PS键联、反向无碱基核苷酸、2'-O-Me、2'-O-moe、2'-F或其组合。
在一些实施方案中,5'端修饰包含或还包含2'-O-Me、2'-O-moe、2'-F或其组合对引导区的第一个核苷酸的修饰,和任选地存在的连至下一核苷酸的PS键联。
在一些实施方案中,5'端修饰包含或还包含2'-O-Me、2'-O-moe、2'-F或其组合对引导区的第一个或第二个核苷酸的修饰,和任选地存在的第一个与第二个核苷酸之间或第二个与第三个核苷酸之间的一个或多个PS键联。
在一些实施方案中,5'端修饰包含或还包含2'-O-Me、2'-O-moe、2'-F或其组合对可变区的第一个、第二个或第三个核苷酸的修饰,和任选地存在的第一个与第二核苷酸之间、第二个与第三个核苷酸之间或第三个与第四个核苷酸之间的一个或多个PS键联。
在一些实施方案中,5'端修饰包含或还包含2'-O-Me、2'-O-moe、2'-F或其组合对可变区的第一个、第二个、第三个或第四个核苷酸的修饰,和任选地存在的第一个与第二个核苷酸之间、第二个与第三个核苷酸之间、第三个与第四个核苷酸之间或第四个与第五个核苷酸之间的一个或多个PS键联。
在一些实施方案中,5'端修饰包含或还包含2'-O-Me、2'-O-moe、2'-F或其组合对可变区的第一个、第二个、第三个、第四个或第五个核苷酸的修饰,和任选地存在的第一个与第二个核苷酸之间、第二个与第三个核苷酸之间、第三个与第四个核苷酸之间、第四个与第五个核苷酸之间或第五个与第六个核苷酸之间的一个或多个PS键联。
重复反重复区修饰
在一些实施方案中,提供包含重复反重复区修饰的gRNA,其中所述重复反重复区修饰包含重复反重复区中的至少1、2、3、4、5、6、7、8、9、10、11或所有12个核苷酸的修饰。
在一些实施方案中,提供包含重复反重复区修饰的gRNA,其中所述重复反重复区修饰包含重复反重复区中的约1至2、1至3、1至4、1至5、1至6、1至7、1至8、1至9、1至10或1至12个核苷酸的修饰。
在一些实施方案中,提供包含重复反重复区修饰的gRNA,其中上茎修饰包含2'-OMe修饰的核苷酸。在一些实施方案中,提供包含重复反重复区修饰的gRNA,其中上茎修饰包含2'-O-moe修饰的核苷酸。在一些实施方案中,提供包含重复反重复区修饰的gRNA,其中上茎修饰包含2'-F修饰的核苷酸。
在一些实施方案中,提供包含重复反重复区修饰的gRNA,其中所述重复反重复区修饰包含2'-OMe修饰的核苷酸、2'-O-moe修饰的核苷酸、2'-F修饰的核苷酸或其组合。
在一些实施方案中,gRNA包含5'端修饰和重复反重复区修饰。在一些实施方案中,gRNA包含3'端修饰和重复反重复区修饰。在一些实施方案中,gRNA包含5'端修饰、3'端修饰和上茎修饰。
发夹修饰
在一些实施方案中,gRNA包含发夹区中的修饰。在一些实施方案中,发夹区修饰包含至少一个选自以下的修饰的核苷酸:2'-O-甲基(2'-OMe)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸或其组合。
在一些实施方案中,发夹区修饰位于发夹1区中。在一些实施方案中,发夹区修饰位于发夹2区中。在一些实施方案中,修饰位于发夹1区和发夹2区内,任选地其中发夹1与2之间的“n”也被修饰。
在一些实施方案中,发夹修饰包含或还包含2'-O-甲基(2'-OMe)修饰的核苷酸。
在一些实施方案中,发夹修饰包含或还包含2'-氟(2'-F)修饰的核苷酸。
在一些实施方案中,发夹区修饰包含至少一个选自以下的修饰的核苷酸:2'H修饰的核苷酸(DNA)、PS修饰的核苷酸、YA修饰、2'-O-甲基(2'-O-Me)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸或其组合。
在一些实施方案中,gRNA包含3'端修饰和发夹区中的修饰。
在一些实施方案中,gRNA包含5'端修饰和发夹区中的修饰。
在一些实施方案中,gRNA包含上茎修饰和发夹区中的修饰。
在一些实施方案中,gRNA包含3'端修饰、发夹区中的修饰、上茎修饰和5'端修饰。
F.示例性修饰的引导RNA
涵盖修饰的gRNA,其包含如上文所描述的5'端修饰、3'端修饰、上茎修饰、发夹修饰和3'末端修饰的组合。下文描述示例性修饰的gRNA。
sgRNA;其结构域/区
在一些实施方案中,本文提供的gRNA为sgRNA。Briner AE等人,Molecular Cell56:333-339(2014)描述sgRNA的功能结构域,在本文中称为“结构域”,包括负责靶向的“间隔”结构域、“下茎”、“隆突”、“上茎”(其可包括四环)、“连接”以及“发夹1”和“发夹2”结构域。参见Briner等人,第334页,图1A。如本文中别处详细描述,一个或多个结构域(例如发夹1或上茎)在本文所描述的sgRNA中可被缩短。
在一些实施方案中,sgRNA包含引导区和引导区的3'的保守部分,其中保守部分包含重复反重复区、连结点、发夹1区和发夹2区。重复反重复区包含上茎区和下茎区。表3B提供如本文所用的sgRNA的结构域的示意图。在表3B中,区之间的“n”表示核苷酸的可变数目,例如0至1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更大。在一些实施方案中,n等于0。在一些实施方案中,n等于1。
在一些实施方案中,sgRNA包含以下中的至少一者:第一内部接头,其取代上茎区的至少4个核苷酸;第二内部接头,其取代连结点区的2个核苷酸;和第三内部接头,其取代发夹1的至少2个核苷酸。
在一些实施方案中,sgRNA包含第一内部接头和第二内部接头。在一些实施方案中,sgRNA包含第一内部接头和第三内部接头。在一些实施方案中,sgRNA包含第二内部接头和第三内部接头。在一些实施方案中,sgRNA包含第一内部接头、第二内部接头和第三内部接头。
在一些实施方案中,第一内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。在一些实施方案中,第一内部接头取代gRNA的重复反重复区的4、5、6、7、8、9、10、11或12个核苷酸。
在一些实施方案中,第二内部接头具有约9至15个原子的桥接长度。在一些实施方案中,第二内部接头取代sgRNA的连结点区的发夹区。在一些实施方案中,第二内部接头取代sgRNA的连结点区的茎区的2个核苷酸。
在一些实施方案中,第三内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。在一些实施方案中,第三内部接头取代gRNA的发夹1的4、5、6、7、8、9、10、11或12个核苷酸。
在一些实施方案中,第一内部接头位于第一部分与第二部分之间的发夹中,并且第一部分和第二部分一起形成双链体部分。
在一些实施方案中,第三内部接头位于sgRNA的第一部分与sgRNA的第二部分之间的发夹中,并且第一部分和第二部分一起形成双链体部分。
在一些实施方案中,sgRNA的发夹2区不含有任何内部接头。在一些实施方案中,发夹2区位于SpyCas9 gRNA中。
5'末端区
在一些实施方案中,sgRNA包含如表3A至3B中所示的位于5'端处的核苷酸。在一些实施方案中,sgRNA的5'末端包含间隔子或引导区,其功能为将Cas蛋白(例如Cas9蛋白)引导至靶核苷酸序列。在一些实施方案中,5'末端不包含引导区。在一些实施方案中,5'末端包含间隔子和功能不为将Cas蛋白引导至靶核苷酸区的其他核苷酸。
下茎
在一些实施方案中,sgRNA包含当线性地查看时,由隆突区和上茎区分离的下茎(LS)区。参见表3A至3B。
在一些实施方案中,下茎区包含1至12个核苷酸,例如在一个实施方案中,下茎区包含LS1至LS12。在一些实施方案中,下茎区包含比表3中所示更少的核苷酸。在一些实施方案中,下茎区包含比表3A至3B中所示更多的核苷酸。当下茎区包含比表3的示意图中所示更少或更多的核苷酸时,应维持如本领域技术人员将显而易见的修饰模式。
在一些实施方案中,下茎区具有当以相反方向读取时在核酸序列上互补的核苷酸。在一些实施方案中,下茎的核酸序列中的互补性产生sgRNA中的茎的二级结构(例如所述区可彼此碱基配对)。在一些实施方案中,当以相反方向读取时,下茎区彼此可以不完全互补。
隆突
在一些实施方案中,sgRNA包含隆突区,其包含六个核苷酸B1至B6。当线性地查看时,隆突区分为两个区。参见表3。在一些实施方案中,隆突区包含六个核苷酸,其中前两个核苷酸之后为上茎区,接着为隆突的后四个核苷酸。在一些实施方案中,隆突区包含比表3A至3B中所示更少的核苷酸。在一些实施方案中,隆突区包含比表3A至3B中所示更多的核苷酸。当隆突区包含比表3A至3B的示意图中所示更少或更多的核苷酸时,应维持如本领域技术人员将显而易见的修饰模式。
在一些实施方案中,隆突的存在导致sgRNA中的上茎模块与下茎模块之间的定向扭结。
上茎
在一些实施方案中,上茎区为缩短的上茎区,诸如本文别处描述的缩短的上茎区中的任一者。
在其他实施方案中,sgRNA包含含有12个核苷酸的上茎区。在一些实施方案中,上茎区包含环序列。在一些情况下,环为四环(由四个核苷酸组成的环)。在一些实施方案中,上茎区包含比表3B中所示更多的核苷酸。
当上茎区包含比表3A至3B的示意图中所示更少或更多的核苷酸时,应维持如本领域技术人员将显而易见的修饰模式。
在一些实施方案中,上茎区具有当以相反方向读取时在核酸序列上互补的核苷酸。在一些实施方案中,上茎区的核酸序列中的互补性产生sgRNA中的茎的二级结构(例如所述区可彼此碱基配对)。在一些实施方案中,当以相反方向读取时,上茎区彼此可以不完全互补。
在一些实施方案中,上茎区包含比图10A中所示更少的核苷酸,并且有时不存在。在某些实施方案中,隆突核苷酸B2和B3(对应于SEQ ID:400的核苷酸8和21;参见表3A)通过内部接头直接接合(即,使得不存在插入核苷酸)。在某些实施方案中,B2和B3通过一个或多个,例如1、2、3或4个无碱基核苷直接接合。在某些实施方案中,B2和B3通过内部接头或一个或多个,例如1、2、3或4个无碱基核苷接合,其中所存在的额外核苷酸不在隆突上方形成双链体部分。在某些实施方案中,B2和B3通过内部接头或一个或多个,例如1、2、3或4个无碱基核苷接合,其中所存在的额外核苷酸不在隆突上方形成比3个核苷酸更长的双链体部分。
连结点
在一些实施方案中,sgRNA包含位于下茎区与发夹1区之间的连结点区。在一些实施方案中,连结点包含18个核苷酸。在一些实施方案中,连结点区包含如表3A至3B中所示的核苷酸N1至N18。在一些实施方案中,连结点区包含取代(例如在位置N18处)或缺乏核苷酸,诸如本文别处详细描述的具有取代或缺乏核苷酸的连结点区中的任一者。
在一些实施方案中,连结点区包含比表3A至3B中所示更少的核苷酸。在一些实施方案中,连结点区包含比表3A至3B中所示更多的核苷酸。当连结点区包含比表3A至3B的示意图中所示更少或更多的核苷酸时,应维持如本领域技术人员将显而易见的修饰模式。
在一些实施方案中,连结点区具有当以相反方向读取时在核酸序列上互补的核苷酸。在一些实施方案中,核酸序列中的互补性产生sgRNA中的茎或茎环的二级结构(例如连结点区中的某些核苷酸可彼此碱基配对)。在一些实施方案中,当以相反方向读取时,连结点区彼此可以不完全互补。
发夹
在一些实施方案中,sgRNA包含发夹区内的一个或多个发夹结构。发夹区位于重复反重复区下游(例如其3')。在一些实施方案中,发夹区位于连结点区(如果存在)下游。在一些实施方案中,紧接连结点区下游的核苷酸区被称为“发夹1”或“H1”。在一些实施方案中,发夹1的3'的核苷酸区被称为“发夹2”或“H2”。在一些实施方案中,发夹区包含发夹1和发夹2两者。在一些实施方案中,sgRNA包含发夹1或发夹2。
在一些实施方案中,发夹1区为缩短的发夹1区,诸如本文别处描述的缩短的发夹1区中的任一者。
在其他实施方案中,发夹1区包含12个紧邻连结点区下游的核苷酸。在一些实施方案中,发夹1区包含如表3B中所示的核苷酸H1-1至H1-12。
在一些实施方案中,发夹2区包含15个在发夹1区下游的核苷酸。在一些实施方案中,发夹2区包含如表3B中所示的核苷酸H2-1至H2-15。
在一些实施方案中,一个或多个核苷酸存在于发夹1区与发夹2区之间。发夹1区与发夹2区之间的一个或多个核苷酸可被修饰或未被修饰。在一些实施方案中,发夹1与发夹2通过一个核苷酸隔开。在一些实施方案中,发夹区包含比表3B中所示更少的核苷酸。在一些实施方案中,发夹区包含比表3B中所示更多的核苷酸。当发夹区包含比表3B的示意图中所示更少或更多的核苷酸时,应维持如本领域技术人员将显而易见的修饰模式。
在一些实施方案中,发夹区具有当以相反方向读取时在核酸序列上互补的核苷酸。在一些实施方案中,当以相反方向读取时,发夹区彼此可不完全互补(例如发夹的顶部或环包含不成对核苷酸)。
3'末端
sgRNA具有3'端,其为sgRNA的最后一个核苷酸。3'末端区包含3'端的最后1至7个核苷酸。在一些实施方案中,3'端为发夹2的末端。在一些实施方案中,sgRNA包含发夹区之后的核苷酸。在一些实施方案中,sgRNA包含3'尾区,在此情况下,3'尾的最后一个核苷酸为3'末端。在一些实施方案中,3'尾包含1、2、3、4、5、6、7、8、9、10、15或20或更多个例如与发夹的二级结构不相关的核苷酸。在一些实施方案中,3'尾区包含1、2、3或4个与发夹的二级结构不相关的核苷酸。在一些实施方案中,3'尾区包含4个与发夹的二级结构不相关的核苷酸。在一些实施方案中,3'尾区包含1、2或3个与发夹的二级结构不相关的核苷酸。
在一些实施方案中,gRNA之间隔子或靶向区存在于gRNA的3'端处。
/>
在一些实施方案中,sgRNA包含含有SEQ ID NO:400的序列的保守部分。
在一些实施方案中,相对于SEQ ID NO:400,核苷酸13至16(上茎区的US5至US8)中的2、3或4者被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:400,核苷酸12至17(上茎区的US4至US9)被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:400,核苷酸11至18(上茎区的US3至US10)被第一内部接头取代。在一些实施方案中,相对于SEQID NO:400,核苷酸10至19(上茎区的US2至US11)被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:400,核苷酸9至20(上茎区的US1至US10)被第一内部接头取代。在一些实施方案中,相对于SEQ ID NO:400,核苷酸36至37(连结点区的N6至N7)被第二内部接头取代。在一些实施方案中,相对于SEQ ID NO:400,核苷酸53至56(发夹1的H1-5至H1-8)中的2、3或4者被第三内部接头取代。在一些实施方案中,相对于SEQ ID NO:400,核苷酸52至57(发夹1的H1-4至H1-9)被第三内部接头取代。在一些实施方案中,相对于SEQ ID NO:400,核苷酸51至58(发夹1的H1-3至H1-10)被第三内部接头取代。在一些实施方案中,相对于SEQ IDNO:400,核苷酸50至59(发夹1的H1-1至H1-12)被第三内部接头取代。在一些实施方案中,相对于SEQ ID NO:400,核苷酸77至80缺失。在一些实施方案中,相对于SEQ ID NO:400,上茎的所有核苷酸(US1至US12)被第一内部接头取代。在一些实施方案中,相对于sgRNA中的SEQID NO:400,上茎的所有核苷酸(US1至US12)被无碱基核苷取代,其中sgRNA的另一部分中的核苷酸被内部接头取代,所述另一部分例如如上文所提供的连结点区或优选地发夹1区。
G.包含内部接头的具有一个或多个缩短的区的NmeCas9引导RNA
本文提供包含一个或多个缩短的区和一个或多个内部接头的引导RNA(gRNA)。
在一些实施方案中,本文所提供的gRNA(例如sgRNA、dgRNA或crRNA)包含保守区,其包含重复/反重复区、发夹1区和发夹2区,其中重复/反重复区、发夹1区和发夹2区中的一者或多者被缩短。在一些实施方案中,gRNA为脑膜炎双球菌(N.meningitidis)Cas9(NmeCas9)gRNA。
在一些实施方案中,gRNA的保守区包含:
缩短的重复/反重复区,其中所述缩短的重复/反重复区缺乏2至24个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸37至64中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸36通过以下连接至核苷酸65:(i)第一内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸。
在一些实施方案中,gRNA的保守区包含:
缩短的发夹1区,其中所述缩短的发夹1缺乏2至10个、任选地2至8个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸82至95中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸81通过以下连接至核苷酸96:(i)第二内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸。
在一些实施方案中,gRNA的保守区包含:
缩短的发夹2区,其中所述缩短的发夹2缺乏2至18个、任选地2至16个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸113至134中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸112通过以下连接至核苷酸135:(i)第三内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸。
在一些实施方案中,gRNA的保守区包含:
(a)缩短的重复/反重复区,其中所述缩短的重复/反重复区缺乏2至24个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸37至64中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸36通过以下连接至核苷酸65:(i)第一内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;和
(b)缩短的发夹1区,其中所述缩短的发夹1缺乏2至10个、任选地2至8个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸82至95中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸81通过以下连接至核苷酸96:(i)第二内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸。
在一些实施方案中,gRNA的保守区包含:
(a)缩短的重复/反重复区,其中所述缩短的重复/反重复区缺乏2至24个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸37至64中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸36通过以下连接至核苷酸65:(i)第一内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;和
(b)缩短的发夹2区,其中所述缩短的发夹2缺乏2至18个、任选地2至16个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸113至134中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸112通过以下连接至核苷酸135:(i)第三内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸。
在一些实施方案中,gRNA的保守区包含:
(a)缩短的发夹1区,其中所述缩短的发夹1缺乏2至10个、任选地2至8个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸82至95中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸81通过以下连接至核苷酸96:(i)第二内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;和
(b)缩短的发夹2区,其中所述缩短的发夹2缺乏2至18个、任选地2至16个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸113至134中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸112通过以下连接至核苷酸135:(i)第三内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸。
在一些实施方案中,gRNA的保守区包含:
(a)缩短的重复/反重复区,其中所述缩短的重复/反重复区缺乏2至24个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸37至64中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸36通过以下连接至核苷酸65:(i)第一内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;
(b)缩短的发夹1区,其中所述缩短的发夹1缺乏2至10个、任选地2至8个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸82至95中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸81通过以下连接至核苷酸96:(i)第二内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;和
(c)缩短的发夹2区,其中所述缩短的发夹2缺乏2至18个、任选地2至16个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸113至134中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸112通过以下连接至核苷酸135:(i)第三内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸。
此章节(包括下文子章节A至E)中的核苷酸位置根据提供示例性Nme sgRNA的图10E进行编号。
在一些实施方案中,与SEQ ID NO:500相比,核苷酸144至145中的一者或两者任选地缺失。
在一些实施方案中,gRNA包含第一内部接头、第二内部接头和第三内部接头中的至少一者。
在一些实施方案中,gRNA包含第一内部接头、第二内部接头和第三内部接头中的至少两者。
在一些实施方案中,gRNA包含第一内部接头、第二内部接头和第三内部接头。
在一些实施方案中,引导区具有:(i)相对于SEQ ID NO:500,位置1至24内一个核苷酸的插入或1至4个核苷酸的缺失;或(ii)24个核苷酸的长度。
在一些实施方案中,引导区具有25、24、23、22、21或20个核苷酸的长度,任选地其中引导区具有SEQ ID NO:500的位置1至24处的25、24、23或22个核苷酸的长度。
在一些实施方案中,引导区具有SEQ ID NO:500的位置1至24处的23或24个核苷酸的长度。
在一些实施方案中,保守部分的至少10个核苷酸为修饰的核苷酸。
在一些实施方案中,双链体部分中的取代为保守取代。
在重复/反重复区、发夹1区和发夹2区中的每一者内,双链体部分中的每一者的链通过内部接头接合,所述内部接头单独或与核苷酸组合取代4个核苷酸或至少4个核苷酸。本文提供具有各种桥接长度以准许本领域技术人员将双链体部分的链与内部接头或核苷酸或其组合接合的内部接头。
在一些实施方案中,gRNA的重复/反重复区为缺乏2至24个核苷酸的缩短的重复/反重复区,例如上文编号实施方案或表1至2中所指示或本文别处所描述的重复/反重复区中的任一者,其可与本文所描述的缩短的发夹1区或发夹2区中的任一者组合,包括但不限于上文编号实施方案中所指示并且在表1至2的序列中呈现或本文别处所描述的组合。
在一些实施方案中,第一接头取代位置49至52,并且第二内部接头取代位置87至90。
在一些实施方案中,第二内部接头取代位置87至90,并且第三内部接头取代位置122至125。
在一些实施方案中,第一接头取代位置49至52,并且第三内部接头取代位置122至125。
在一些实施方案中,第一接头取代49至52,第二内部接头取代位置87至90,并且第三内部接头取代位置122至125。
缩短的重复/反重复区
在一些实施方案中,本文所描述的gRNA的保守部分包含缩短的重复/反重复区。在一些实施方案中,重复反重复区包含重复反重复区的第一部分与第二部分之间的发夹结构,其中第一部分和第二部分一起形成双链体部分。
在一些实施方案中,本文所描述的gRNA的保守部分包含重复/反重复区的缩短的上茎区。在一些实施方案中,重复/反重复区包含环(例如四环)。
在一些实施方案中,缩短的重复/反重复区缺乏2至28个核苷酸。在一些实施方案中,(i)核苷酸37至64中的一者或多者相对于SEQ ID NO:1缺失且任选地被取代;和(ii)核苷酸36通过第一内部接头连接至核苷酸65。
在一些实施方案中,缩短的重复/反重复区缺乏2至28个核苷酸。
在一些实施方案中,缩短的重复/反重复区具有24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸的长度。
在一些实施方案中,缩短的重复/反重复区缺乏12至28个核苷酸、任选地18至24个核苷酸。在一些实施方案中,缩短的重复/反重复区具有24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个核苷酸的长度。在一些实施方案中,缩短的重复/反重复区具有24、25、26、27、28、29、30、31、32、33或34个核苷酸的长度。在一些实施方案中,缩短的重复/反重复区具有34个核苷酸的长度。在一些实施方案中,缩短的重复/反重复区具有35个核苷酸的长度。在一些实施方案中,缩短的重复/反重复区具有36个核苷酸的长度。在一些实施方案中,缩短的重复/反重复区具有37个核苷酸的长度。在一些实施方案中,缩短的重复/反重复区具有38个核苷酸的长度。
在一些实施方案中,缩短的重复/反重复区的上茎的一个或多个碱基对缺失。在一些实施方案中,缩短的重复/反重复区的上茎包含不超过一个、两个、三个或四个碱基对。如本文所用,“碱基对”或“碱基配对的核苷酸”或“沃森-克里克配对核苷酸”包括能够形成沃森-克里克碱基对的任何对,包括A-T、A-U、T-A、U-A、C-G和G-C对,和具有相同碱基配对偏好的包括前述核苷酸中任一者的修饰形式的对。在一些实施方案中,碱基对或碱基配对的核苷酸也包括通过碱基层叠产生的碱基对,例如重复/反重复区中的核苷酸25与76、33与68、34与67和37与64;和发夹1区中的核苷酸78与100和83与94。
在一些实施方案中,第一内部接头取代缩短的重复/反重复区的上茎的核苷酸38至63,并且将核苷酸37连接至核苷酸64。在一些实施方案中,第一内部接头取代缩短的重复/反重复区的上茎的核苷酸37至64,并且将核苷酸36连接至核苷酸65。
在一些实施方案中,缩短的重复/反重复区具有长度为11个碱基配对核苷酸的双链体部分。在一些实施方案中,缩短的重复/反重复区具有单一双链体部分。在一些实施方案中,位置25与76、位置33与68、位置34与67和位置48与53具有碱基层叠相互作用,并且不构成双链体部分中的不连续部分。
在一些实施方案中,重复/反重复区中的碱基配对核苷酸中的一者或多者缺失。在一些实施方案中,碱基配对核苷酸中的一者或多者选自位置37与53、位置38与54、位置39与55、位置40与56、位置41与57、位置43与58、位置43与59、位置44与60、位置45与61、位置46与62、位置47与63和位置48与64。
在一些实施方案中,重复/反重复区的上茎区包含1至5个碱基对。
在一些实施方案中,相对于SEQ ID NO:500,缩短的重复/反重复区的上茎包含一个或多个取代。
在一些实施方案中,一个或多个取代通过交换碱基配对核苷酸的位置使得可维持碱基配对而被视为保守取代。举例而言,G-C对变成C-G对,A-U对变成U-A对,或其他天然或修饰的碱基配对。
在一些实施方案中,相对于SEQ ID NO:500,第一内部接头取代核苷酸49至52。
在一些实施方案中,缩短的重复/反重复区具有8至22个修饰的核苷酸。
缩短的发夹1区
在一些实施方案中,本文所描述的gRNA的保守部分包含缩短的发夹1区。在一些实施方案中,发夹1区包含发夹1区的第一部分与第二部分之间的发夹结构,其中第一部分和第二部分一起形成双链体部分。
在一些实施方案中,本文所描述的gRNA的保守部分包含发夹1区的缩短的上茎区。在一些实施方案中,发夹1包含环(例如四环)。
在一些实施方案中,缩短的发夹1缺乏2至10个核苷酸。在一些实施方案中,(i)相对于SEQ ID NO:500,核苷酸82至95中的一者或多者缺失且任选地被取代;和(ii)核苷酸81通过第二内部接头连接至核苷酸96。
在一些实施方案中,其中缩短的发夹1区缺乏2至10个核苷酸。在一些实施方案中,其中缩短的发夹1区具有13、14、15、16、17、18、19、20或21个核苷酸的长度。在一些实施方案中,其中缩短的发夹1区具有长度为4至8个碱基配对核苷酸的双链体部分。在一些实施方案中,其中缩短的发夹1区具有长度为7至8个碱基配对核苷酸的双链体部分。
在一些实施方案中,其中缩短的发夹1区具有单一双链体部分。在一些实施方案中,在缩短的发夹1区中,位置78与100和位置83与94具有碱基层叠相互作用,并且不构成双链体部分中的不连续部分。
在一些实施方案中,缩短的发夹1区的一个或两个碱基对缺失。在一些实施方案中,缩短的发夹1区的茎包含一个、两个、三个、四个、五个、六个、七个或八个碱基对。在一些实施方案中,缩短的发夹1区的茎的长度为七个或八个碱基配对核苷酸。
在一些实施方案中,缩短的发夹1区的位置85至86中的一者或多者和核苷酸91至92中的一者或多者缺失。在一些实施方案中,缩短的发夹1区的核苷酸86和91缺失。在一些实施方案中,相对于SEQ ID NO:500,缩短的发夹1区的核苷酸82至95中的一者或多者被取代。
在一些实施方案中,相对于SEQ ID NO:500,第二内部接头取代核苷酸87至91。
在一些实施方案中,其中缩短的发夹1区具有2至15个修饰的核苷酸。
缩短的发夹2区
在一些实施方案中,本文所描述的gRNA的保守部分包含缩短的发夹2区。在一些实施方案中,缩短的发夹2区包含发夹2区的第一部分与第二部分之间的发夹结构,其中第一部分和第二部分一起形成双链体部分。
在一些实施方案中,缩短的发夹2区缺乏2至18个核苷酸。在一些实施方案中,缩短的发夹2区缺乏2至16个核苷酸。在一些实施方案中,(i)相对于SEQ ID NO:500,核苷酸113至121和126至134中的一者或多者缺失且任选地被取代;和(ii)核苷酸112通过第三内部接头连接至核苷酸135。
在一些实施方案中,本文所描述的gRNA的保守部分包含发夹2区的缩短的上茎区。在一些实施方案中,发夹1包含环(例如四环)。在一些实施方案中,缩短的发夹2区缺乏2至16个核苷酸。在一些实施方案中,缩短的发夹2区具有22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个核苷酸的长度。在一些实施方案中,缩短的发夹2区具有24、25、26、27、28、29、30、31、32、33或34个核苷酸的长度。在一些实施方案中,缩短的发夹2区的核苷酸113至121中的一者或多者和核苷酸126至134中的一者或多者缺失。
在一些实施方案中,缩短的发夹2区包含不成对区。
在一些实施方案中,缩短的发夹2区具有两个双链体部分。在一些实施方案中,缩短的发夹2区具有长度为4个碱基配对核苷酸的双链体部分。在一些实施方案中,缩短的发夹2区具有长度为4至8个碱基配对核苷酸的双链体部分。在一些实施方案中,缩短的发夹2区具有长度为4至6个碱基配对核苷酸的双链体部分。在一些实施方案中,缩短的发夹2区的上茎包含一个、两个、三个或四个碱基对。在一些实施方案中,核苷酸113与134、核苷酸114与133、核苷酸115与132、核苷酸116与131、核苷酸117与130、核苷酸118与129、核苷酸119与128、核苷酸120与127和核苷酸121与126中的至少一对缺失。在一些实施方案中,缩短的发夹2区的位置113至121和126至134中的所有缺失。
在一些实施方案中,其中相对于SEQ ID NO:500,缩短的发夹2区的核苷酸113至134中的一者或多者被取代。在一些实施方案中,相对于SEQ ID NO:500,第三内部接头取代核苷酸122至125。
在一些实施方案中,缩短的发夹2区具有2至15个修饰的核苷酸。
3'尾
在一些实施方案中,gRNA包含3'尾。在一些实施方案中,3'尾的长度为1至20个核苷酸,并且通过磷酸二酯或硫代磷酸酯键联连接至gRNA的保守区的3'端。在一些实施方案中,3'尾包含1、2、3、4、5、6、7、8、9或10个核苷酸。在一些实施方案中,3'尾包含1、2、3、4或5个核苷酸。在一些实施方案中,3'尾包含1或2个核苷酸。
在一些实施方案中,3'尾具有1至10个核苷酸、1至5个核苷酸、1至4个核苷酸、1至3个核苷酸和1至2个核苷酸的长度。在一些实施方案中,3'尾包含约1、2、3、4、5、6、7、8、9或10个核苷酸。在一些实施方案中,3'尾具有1个核苷酸的长度。在一些实施方案中,3'尾具有2个核苷酸的长度。在一些实施方案中,3'尾具有3个核苷酸的长度。在一些实施方案中,3'尾具有4个核苷酸的长度。在一些实施方案中,3'尾具有1至2个核苷酸的长度。
在一些实施方案中,3'尾以包含尿嘧啶或修饰的尿嘧啶的核苷酸终止。在一些实施方案中,3'尾的长度为1个核苷酸。在一些实施方案中,3'尾由包含尿嘧啶或修饰的尿嘧啶的核苷酸组成。在一些实施方案中,其中3'尾包含存在于3'尾中的核苷酸中的任一者或多者的修饰。在其他实施方案中,其中3'尾的修饰为2'-O-甲基(2'-OMe)修饰的核苷酸和核苷酸之间的硫代磷酸酯(PS)键联中的一者或多者。
在一些实施方案中,其中3'尾被完全修饰。
在一些实施方案中,其中gRNA的3'核苷酸为包含尿嘧啶或修饰的尿嘧啶的核苷酸。
在一些实施方案中,相对于SEQ ID NO:500,核苷酸144和145中的一者或多者缺失。在一些实施方案中,相对于SEQ ID NO:500,核苷酸144和145两者缺失。
在一些实施方案中,gRNA不包含3'尾。
在一些实施方案中,不包含3'尾的引导物的3'端以包含尿嘧啶或修饰的尿嘧啶的核苷酸终止。在一些实施方案中,3'尾由包含尿嘧啶或修饰的尿嘧啶的核苷酸组成。在一些实施方案中,3'末端核苷酸为修饰的核苷酸。在一些实施方案中,3'端的修饰为2'-O-甲基(2'-OMe)修饰的核苷酸和核苷酸末端核苷酸与倒数第二核苷酸之间的硫代磷酸酯(PS)键联中的一者或多者。
在一些实施方案中,3'端(即,不进一步具有尾部的发夹2的端部或3'尾的端部)包含或还包含一个或多个修饰,例如核苷酸之间的硫代磷酸酯(PS)键联、2'-OMe修饰的核苷酸、2'-O-moe修饰的核苷酸、2'-F修饰的核苷酸或反向无碱基修饰的核苷酸,任选地其中3'端包含至少两个独立地选自以下的修饰:核苷酸之间的硫代磷酸酯(PS)键联、2'-OMe修饰的核苷酸、2'-O-moe修饰的核苷酸、2'-F修饰的核苷酸和反向无碱基修饰的核苷酸。在一些实施方案中,3'端包含或还包含一个或多个修饰,例如核苷酸之间的硫代磷酸酯(PS)键联、2'-OMe修饰的核苷酸、2'-F修饰的核苷酸,任选地其中3'端包含至少两个独立地选自以下的修饰:核苷酸之间的硫代磷酸酯(PS)键联、2'-OMe修饰的核苷酸和2'-F修饰的核苷酸。在一些实施方案中,3'端包含核苷酸141与142和142与143之间的硫代磷酸酯(PS)键联;位置142和143中的每一者处的2'-OMe修饰的核苷酸。
在一些实施方案中,3'端(即,不进一步具有尾部的发夹2的端部或3'尾的端部)包含或还包含核苷酸之间的一个或多个硫代磷酸酯(PS)键联。在一些实施方案中,3'端包含或还包含一个或多个2'-OMe修饰的核苷酸。在一些实施方案中,3'端包含或还包含一个或多个2'-O-moe修饰的核苷酸。在一些实施方案中,3'端包含或还包含一个或多个2'-F修饰的核苷酸。在一些实施方案中,3'端包含或还包含一个或多个反向无碱基修饰的核苷酸。在一些实施方案中,3'端包含或还包含一个或多个保护性末端修饰。在一些实施方案中,3'端包含或还包含以下中的一者或多者的组合:核苷酸之间的硫代磷酸酯(PS)键联、2'-OMe修饰的核苷酸、2'-O-moe修饰的核苷酸、2'-F修饰的核苷酸和反向无碱基修饰的核苷酸。
引导区
在一些实施方案中,gRNA还包含引导序列。在一些实施方案中,引导序列包含重复/反重复区的最5'核苷酸的5'的20、21、22、23、24或25个核苷酸,任选地22、23、24或25个核苷酸。在一些实施方案中,引导序列包含22、23、24、25或更多个核苷酸。在一些实施方案中,引导序列具有24个核苷酸的长度。在一些实施方案中,引导序列具有23个核苷酸的长度。在一些实施方案中,引导序列具有22个核苷酸的长度。在一些实施方案中,引导序列具有21个核苷酸的长度。在一些实施方案中,引导序列具有20个核苷酸的长度。
在一些实施方案中,引导区具有:(i)相对于SEQ ID NO:500,位置1至24内一个核苷酸的插入或1至4个核苷酸的缺失;或(ii)24个核苷酸的长度。
在一些实施方案中,引导序列的选择基于用于编辑的所关注基因内的靶序列而确定。举例而言,在一些实施方案中,gRNA包含与所关注基因的靶序列互补的引导序列。
在一些实施方案中,所关注基因中的靶序列可与gRNA的引导序列互补。在一些实施方案中,gRNA的引导序列与所关注基因中的其对应靶序列之间的互补性或同一性程度可为约90%、95%或100%。在一些实施方案中,gRNA的引导区与所关注基因的靶区可100%互补或同一。在其他实施方案中,gRNA的引导序列和所关注基因的靶序列可含有至少一个错配。举例而言,gRNA的引导序列和所关注基因的靶序列可包含1个、任选地2个或3个错配,其中靶序列的总长度为至少约22、23、24或更多个核苷酸。在一些实施方案中,gRNA的引导序列和所关注基因的靶区可包含1个、任选地2个或3个错配,其中引导序列包含约24个核苷酸。在某些实施方案中,引导序列不含有错配,即与靶序列完全互补。5'末端可包含不视为引导区(即,功能不为将cas9蛋白质引导至靶核酸)的核苷酸。
在一些实施方案中,缩短的引导RNA的引导区包含至少一个修饰的核苷酸。
在一些实施方案中,gRNA的引导区包含至少两个修饰的核苷酸、任选地至少四个修饰的核苷酸,其中各修饰独立地任选地包含选自以下的修饰的核苷酸:2'-O-甲基(2'-OMe)修饰的核苷酸、2'-O-(2-甲氧基乙基)(2'-O-moe)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联、反向无碱基修饰的核苷酸或其组合。
包含内部接头的示例性缩短的引导RNA提供于表4A至4B中。如本文所用,“接头1”或“L1”是指具有约15至21个原子的桥接长度的内部接头。如本文所用,“接头2”或“L2”是指具有约6至12个原子的桥接长度的内部接头。
核苷酸修饰在表4A至4B中如下指示:m:2'-OMe;*:PS键联;f:2'-氟;(invd):反向无碱基;moe:2'-moe;e:ENA;d:脱氧核糖核苷酸(也请注意,T始终为脱氧核糖核苷酸);x:UNA。在某些实施方案中,在sgRNA修饰的序列中,各A、C、G、U和N独立地为核糖(2'-OH)。在某些实施方案中,各A、C、G、U和N为核糖(2'-OH)。因此,举例而言,mA表示2'-O-甲基腺苷;xA表示具有腺嘌呤核碱基的UNA核苷酸;eA表示具有腺嘌呤核碱基的ENA核苷酸;并且dA表示腺苷脱氧核糖核苷酸。
如本文所用,“N”可为任何天然或非天然核苷酸。举例而言,本文涵盖表4A中的SEQID NO:1001,其中N'被本文所公开的引导序列中的任一者置换。尽管引导物的核苷酸用N'取代,但所述修饰保持如SEQ ID NO:1001中所示。即,尽管引导物的核苷酸置换“N'”,但前三个核苷酸仍为被2'-O-Me修饰的,并且在第一核苷酸与第二核苷酸、第二核苷酸与第三核苷酸和第三核苷酸与第四核苷酸之间存在硫代磷酸酯键联。
sgRNA名称有时用紧接着G之后的一个或多个前置零提供。此不影响名称的含义。因此,举例而言,G000282、G0282、G00282和G282是指相同sgRNA。
表4A.包含接头的示例性NmeCas9引导RNA
/>
表4B.示例性NmeCas9 gRNA序列
/>
/>
/>
/>
/>
/>
/>
/>
III.组合物和试剂盒
涵盖包含本文所描述的gRNA(例如sgRNA、dgRNA或crRNA)中的任一者和载剂、赋形剂、稀释剂等的组合物。在一些情况下,赋形剂或稀释剂为惰性的。在一些情况下,赋形剂或稀释剂并非惰性的。在一些实施方案中,提供一种药物制剂,其包含本文所描述的gRNA(例如sgRNA、dgRNA或crRNA)中的任一者和药学上可接受的载剂、赋形剂、稀释剂等。在一些实施方案中,药物制剂还包含LNP。在一些实施方案中,药物制剂还包含Cas9蛋白或编码Cas9蛋白的mRNA。在一些实施方案中,药物制剂包含gRNA(例如sgRNA、dgRNA或crRNA)、LNP和Cas蛋白或编码Cas蛋白的mRNA中的任一者或多者。在一些实施方案中,Cas蛋白为单体Cas蛋白,例如Cas9蛋白。在一些实施方案中,Cas蛋白包含多个亚基。
还提供包含本文所描述的一种或多种gRNA(例如sgRNA、dgRNA或crRNA)、组合物或药物制剂的试剂盒。在一些实施方案中,试剂盒还包含溶剂、溶液、缓冲液(各自与组合物或药物制剂分开)、说明书或干燥剂中的一者或多者。
包含RNA引导的DNA结合剂或编码RNA引导的DNA结合剂的核酸的组合物
在一些实施方案中,提供组合物或药物制剂,其包含本文所描述的至少一种gRNA(例如sgRNA、dgRNA或crRNA)和RNA引导的DNA结合剂或编码RNA引导的DNA结合剂的核酸(例如mRNA)。在一些实施方案中,RNA引导的DNA结合剂为Cas蛋白。在一些实施方案中,gRNA连同Cas蛋白或编码Cas蛋白的核酸(例如mRNA)被称为Cas RNP。在一些实施方案中,RNA引导的DNA结合剂为与gRNA一起起作用以将RNA引导的DNA结合剂引导至靶核酸序列的结合剂。在一些实施方案中,RNA引导的DNA结合剂为来自II型CRISPR/Cas系统的Cas蛋白。在一些实施方案中,Cas蛋白为Cas9。在一些实施方案中,Cas9蛋白为野生型Cas9。在一些实施方案中,Cas9蛋白来源于化脓链球菌Cas9蛋白,例如化脓链球菌Cas9(SpyCas9)。在一些实施方案中,提供包含至少一种gRNA和核酸酶或编码spyCas9的mRNA的组合物。在一些实施方案中,Cas9蛋白不来源于化脓链球菌,但以与化脓链球菌Cas9相同的方式发挥功能,使得对化脓链球菌Cas9具有特异性的gRNA将非化脓链球菌Cas9引导至其靶位点。在一些实施方案中,Cas9蛋白来源于金黄色葡萄球菌Cas9蛋白,例如SauCas9。在一些实施方案中,提供包含至少一种gRNA和核酸酶或编码SauCas9的mRNA的组合物。在一些实施方案中,Cas9蛋白来源于脑膜炎双球菌Cas9(NmeCas9)。在一些实施方案中,提供包含至少一种gRNA和核酸酶或编码NmeCas9的mRNA的组合物。在一些实施方案中,Cas9蛋白不来源于脑膜炎双球菌。在一些实施方案中,提供包含至少一种gRNA和核酸酶或编码NmeCas9的mRNA的组合物。在一些实施方案中,Cas诱导靶DNA中的双链断裂。本文所描述的实施方案涵盖本文所公开的SpyCas9、SauCas9、NmeCas9和其他Cas蛋白的等效物。
RNA引导的DNA结合剂(包括Cas9)涵盖修饰的结合剂和其变体。具有一个非活性催化结构域(RuvC或HNH)的修饰形式被称为“切口酶”。切口酶仅切割靶DNA上的一个链,从而产生单链断裂。单链断裂也可称为“切口”。在一些实施方案中,组合物和方法包含切口酶。在一些实施方案中,组合物和方法包含切口酶RNA引导的DNA结合剂,诸如切口酶Cas,例如切口酶Cas9,其诱导靶DNA出现切口,而非双链断裂。
在一些实施方案中,核酸酶(例如RNA引导的DNA结合剂)可被修饰以仅含有一个功能性核酸酶结构域。举例而言,RNA引导的DNA结合剂可被修饰以使得核酸酶结构域中的一者发生突变或完全或部分缺失以降低其核酸裂解活性。在一些实施方案中,使用具有活性降低的RuvC结构域的切口酶Cas。在一些实施方案中,使用具有非活性RuvC结构域的切口酶Cas。在一些实施方案中,使用具有活性降低的HNH结构域的切口酶Cas。在一些实施方案中,使用具有非活性HNH结构域的切口酶Cas。
在一些实施方案中,RNA引导的DNA结合剂核酸酶结构域内的保守氨基酸被取代以降低或改变核酸酶活性。在一些实施方案中,Cas蛋白可包含RuvC或RuvC样核酸酶结构域中的氨基酸取代。RuvC或RuvC样核酸酶结构域中的示例性氨基酸取代包括D10A(基于化脓链球菌Cas9蛋白)或H588A(基于脑膜炎双球菌Cas9蛋白)。在一些实施方案中,Cas蛋白可包含HNH或HNH样核酸酶结构域中的氨基酸取代。HNH或HNH样核酸酶结构域中的示例性氨基酸取代包括E762A、H840A、N863A、H983A和D986A(基于SpyCas9蛋白)或D16A(基于NmeCas9蛋白)。
在一些实施方案中,本文所描述的RNP复合物包含切口酶或编码切口酶的mRNA和与靶序列的有义链和反义链分别互补的一对gRNA(其中的一者或两者可为sgRNA)。在此实施方案中,gRNA(例如sgRNA)将切口酶引导至靶序列并且通过在靶序列的对置链上产生切口(即,双重切口)来引入双链断裂(DSB)。在一些实施方案中,使用双重切口可改善特异性并且减少脱靶效应。在一些实施方案中,切口酶RNA引导的DNA结合剂连同被选择以紧密接近的两个个别gRNA(例如sgRNA)一起使用,以在靶DNA中产生双重切口。
在一些实施方案中,使用嵌合Cas蛋白,其中蛋白质的一个结构域或区被另一蛋白质的一部分置换。在一些实施方案中,Cas核酸酶结构域可被来自诸如Fok1的另一核酸酶的结构域置换。在一些实施方案中,Cas蛋白可为修饰的核酸酶。
在一些实施方案中,核酸酶(例如RNA引导的DNA结合剂)可被修饰以诱导点突变或碱基变化,例如去胺作用。
在一些实施方案中,Cas蛋白包含融合蛋白,其包含连接至异源功能结构域的Cas核酸酶(例如Cas9),所述Cas核酸酶为切口酶或为无催化活性的。在一些实施方案中,Cas蛋白包含融合蛋白,其包含连接至异源功能结构域的无催化活性Cas核酸酶(例如Cas9)(参见例如WO2014152432)。在一些实施方案中,无催化活性Cas9来自化脓链球菌。在一些实施方案中,无催化活性Cas9来自脑膜炎双球菌。在一些实施方案中,无催化活性Cas包含使Cas不活化的突变。在一些实施方案中,异源功能结构域为调节基因表达、组蛋白或DNA的结构域。在一些实施方案中,异源功能结构域为转录活化结构域或转录抑制结构域。在一些实施方案中,核酸酶为无催化活性Cas核酸酶,诸如dCas9。
在一些实施方案中,异源功能结构域为脱氨酶,诸如胞苷脱氨酶或腺嘌呤脱氨酶。在某些实施方案中,异源功能结构域为C至T碱基转换器(胞苷脱氨酶),诸如脂蛋白元BmRNA编辑酶(APOBEC)脱氨酶。诸如脱氨酶的异源功能结构域可为含有具有切口酶活性的Cas核酸酶或无催化活性的Cas核酸酶的融合蛋白的一部分。
在一些实施方案中,靶序列可邻近于PAM。在一些实施方案中,PAM可邻近于或在靶序列的3'端的1、2、3或4个核苷酸内。PAM的长度和序列可视所用Cas蛋白而定。举例而言,PAM可选自特定Cas9蛋白或Cas9直系同源物的共有或特定PAM序列,包括Ran等人,Nature520:186-191(2015)的图1中所公开的那些。在一些实施方案中,PAM可包含2、3、4、5、6、7、8、9或10个核苷酸长度。非限制性示例性PAM序列包括NCC、NGG、NAG、NGA、NGAG、NGCG、NNGRRT、TTN、NGGNG、NG、NAAAAN、NNAAAAW、NNNNACA、GNNNCNNA和NNNNGATT(其中N定义为任何核苷酸,并且W定义为A或T,并且R定义为A或G)。在一些实施方案中,PAM序列可为NGG。在一些实施方案中,PAM序列可为NGGNG。在一些实施方案中,PAM序列可为NNAAAAW。
举例而言,PAM可选自特定Nme Cas9蛋白或Nme Cas9直系同源物的共有或特定PAM序列(Edraki等人,Mol.Cell 73:714-726,2019)。在一些实施方案中,PAM可包含2、3、4、5、6、7、8、9或10个核苷酸长度。非限制性示例性PAM序列包括NCC、N4GAYW、N4GYTT、N4GTCT、NNNNCC(a)、NNNNCAAA(其中N定义为任何核苷酸,W定义为A或T,并且R定义为A或G;并且第二个C之后的(a)优选地(但非必需)为A)。在一些实施方案中,PAM序列可为NCC。
在一些实施方案中,异源功能结构域可促进将RNA引导的DNA结合剂输送至细胞核中。举例而言,异源功能结构域可为核定位信号(NLS)。在一些实施方案中,RNA引导的DNA结合剂可与1至10个NLS融合。在一些实施方案中,RNA引导的DNA结合剂可与1至5个NLS融合。在一些实施方案中,RNA引导的DNA结合剂可与一个NLS融合。在使用一个NLS的情况下,NLS可在RNA引导的DNA结合剂序列的N末端或C末端处融合。其也可插入RNA引导的DNA结合剂序列内。在其他实施方案中,RNA引导的DNA结合剂可与多于一个NLS融合。在一些实施方案中,RNA引导的DNA结合剂可与2、3、4或5个NLS融合。在一些实施方案中,RNA引导的DNA结合剂可与两个NLS融合。在一些实施方案中,NLS可与RNA引导的DNA结合剂序列的N末端融合。在一些实施方案中,NLS可仅与RNA引导的DNA结合剂序列的N末端融合。在一些实施方案中,RNA引导的DNA结合剂可不具有插入RNA引导的DNA结合剂序列内的NLS。在某些实施方案中,RNA引导的DNA结合剂序列的C末端可不具有NLS。
在一些实施方案中,RNA引导的DNA结合剂可与两个NLS融合。在某些情况下,两个NLS可相同(例如,两个SV40 NLS)或不同。在一些实施方案中,RNA引导的DNA结合剂与羧基末端处的两个NLS序列(例如SV40)融合。在一些实施方案中,RNA引导的DNA结合剂可与两个NLS融合,一个NLS在N末端处并且一个在C末端处。在一些实施方案中,RNA引导的DNA结合剂可与3个NLS融合。在一些实施方案中,RNA引导的DNA结合剂可不与NLS融合。在一些实施方案中,NLS可为单联(monopartite)序列,诸如SV40 NLS、PKKKRKV(SEQ ID NO:16)或PKKKRRV(SEQ ID NO:17)。在一些实施方案中,NLS可为双联序列,诸如核质蛋白的NLS、KRPAATKKAGQAKKKK(SEQ ID NO:18)。在特定实施方案中,单一PKKKRKV(SEQ ID NO:19)NLS可在RNA引导的DNA结合剂的C末端处融合。一个或多个接头任选地包括在融合位点处。
在一些实施方案中,RNA引导的DNA结合剂包含与SEQ ID NO:301-313(如表5中所示)中的任一者具有至少90%、93%、95%、96%、97%、98%、99%、99.5%或100%同一性的氨基酸序列。在一些实施方案中,RNA引导的DNA结合剂包含与SEQ ID NO:301-313、350和352-360中的任一者具有至少90%、93%、95%、96%、97%、98%、99%或100%同一性的序列。在一些实施方案中,前述同一性水平中的任一者为至少95%、至少98%、至少99%或100%。
在一些实施方案中,编码RNA引导的DNA结合剂的mRNA包含与如表5中所示的SEQID NO:321-323、361、363-372和374-382中的任一者具有至少90%、93%、95%、96%、97%、98%、99%或100%同一性的序列。
IV.使用方法
在一些实施方案中,本文所描述的gRNA(例如sgRNA、dgRNA或crRNA)、组合物或药物制剂中的任一者或多者为用于制备供治疗或预防受试者的疾病或病症的药剂。
在一些实施方案中,本发明包括一种治疗或预防受试者的疾病或病症的方法,其包括施用本文所描述的gRNA(例如sgRNA、dgRNA或crRNA)、组合物或药物制剂中的任一者或多者。
在一些实施方案中,本发明包括一种修饰靶DNA的方法或用途,其包括施用或递送本文所描述的gRNA(例如sgRNA、dgRNA或crRNA)、组合物或药物制剂中的任一者或多者。
在一些实施方案中,本发明包括一种调节靶基因的方法或用途,其包括施用或递送本文所描述的gRNA(例如sgRNA、dgRNA或crRNA)、组合物或药物制剂中的任一者或多者。在一些实施方案中,调节为编辑靶基因。在一些实施方案中,调节为改变靶基因所编码的蛋白质的表达。如本文所用,“基因编辑”或“基因修饰”为例如通过gRNA/Cas复合物诱导的DNA层级的改变。基因编辑或基因修饰可包含通常在已确测序列或基因组基因座内的插入、缺失或取代(碱基取代,例如C至T,或点突变)。基因修饰改变DNA的核酸序列。基因修饰可处于单一核苷酸位置处。基因修饰可处于多个核苷酸,例如2、3、4、5或更多个核苷酸处,所述核苷酸通常彼此非常接近,例如连续核苷酸。
在一些实施方案中,所述方法或用途引起基因编辑。在一些实施方案中,所述方法或用途引起靶基因内的双链断裂。在一些实施方案中,所述方法或用途引起在DSB的非同源端接合期间形成插入缺失突变。在一些实施方案中,所述方法或用途引起靶基因中的核苷酸插入或缺失。在一些实施方案中,靶基因中的核苷酸插入或缺失引起移码突变或提前终止密码子,其产生非功能蛋白质。在一些实施方案中,靶基因中的核苷酸插入或缺失引起靶基因表达的阻断或消除。在一些实施方案中,所述方法或用途包括DSB的同源定向修复。在一些实施方案中,所述方法或用途还包括将模板递送至细胞,其中模板的至少一部分在核酸酶所诱导的双链断裂位点处或附近并入至靶DNA中。在一些实施方案中,所述方法或用途引起靶基因内的单链断裂。在一些实施方案中,所述方法或用途引起靶基因内的碱基变化,例如通过去胺作用。基因编辑通常发生在靶基因中与间隔序列形成双链体的部分内或附近。
在一些实施方案中,所述方法或用途引起基因调节。在一些实施方案中,基因调节为基因表达的增加或减少、DNA的甲基化状态变化,或组蛋白亚基的修饰。在一些实施方案中,所述方法或用途引起靶基因所编码的蛋白质的表达增加或减少。
可在体外和体内测试gRNA(例如sgRNA、dgRNA或crRNA)的功效。在一些实施方案中,本发明包括本文所描述的gRNA(例如sgRNA、dgRNA或crRNA)、组合物或药物制剂中的一者或多者,其中gRNA在与Cas核酸酶(例如Cas9)或编码Cas9的mRNA一起提供至细胞时会引起基因调节。在一些实施方案中,可在体外或体内测量gRNA的功效。
在一些实施方案中,对包含gRNA的Cas RNP的活性与包含未修饰的sgRNA或参考sgRNA的Cas RNP的活性进行比较,所述参考sgRNA缺乏存在于sgRNA中的修饰,诸如一个或多个内部接头、缩短的区或YA位点取代。
在一些实施方案中,gRNA增加或减少靶蛋白表达的效率通过测量靶蛋白的测量定。
在一些实施方案中,递送Cas核酸酶和gRNA之后,通过存在于基因组中的靶位置处的编辑来测定利用特定gRNA进行编辑的效率。在一些实施方案中,通过下一代测序来测量利用特定gRNA进行编辑的效率。在一些实施方案中,测定所关注的靶区的编辑百分比。在一些实施方案中,在递送gRNA和Cas核酸酶之后,测量具有序列改变(例如所关注的靶区中具有核苷酸的插入或缺失(插入缺失)或不具有插入或缺失的碱基变化)的序列读段总数目相对于序列读段总数目的比率。
在一些实施方案中,通过成功基因编辑引入的序列改变(例如核苷酸的插入或缺失,或碱基取代,或点突变)的存在来测量利用特定gRNA进行编辑的效率。在一些实施方案中,在生物化学分析中测试Cas核酸酶和gRNA的活性。在一些实施方案中,在无细胞裂解分析中测试Cas核酸酶和gRNA的活性。在一些实施方案中,在Neuro2A细胞中测试Cas核酸酶和gRNA的活性。在一些实施方案中,在原代细胞(例如原代肝细胞)中测试Cas核酸酶和gRNA的活性。
在一些实施方案中,体内给予包含修饰的gRNA和Cas蛋白或编码Cas蛋白的mRNA的LNP之后,测量修饰的gRNA的活性。
在一些实施方案中,本文提供的gRNA或组合物的体内功效通过在施用gRNA和Cas核酸酶之后在从组织(例如肝脏组织)提取的DNA中测量的编辑功效来测定。
在一些实施方案中,受试者免疫反应的活化通过在体内给予sgRNA以及Cas核酸酶mRNA或蛋白质(例如配制于LNP中)之后细胞因子的血清浓度来测量。在一些实施方案中,细胞因子为干扰素-α(IFN-α)、介白素6(IL-6)、单核细胞趋化蛋白1(MCP-1)或肿瘤坏死因子α(TNF-α)。
在一些实施方案中,与施用未修饰的sgRNA相比,一起施用Cas RNP或Cas核酸酶mRNA与修饰的gRNA(例如sgRNA或dgRNA)会引起免疫细胞因子的血清浓度降低。在一些实施方案中,本发明包括有包括向受试者施用本文所公开的gRNA中的任一者的方法,其中所述gRNA与未被类似修饰的对照gRNA相比引发受试者血清中免疫细胞因子的浓度降低。
V.引导RNA的递送
在一些实施方案中,单独或编码于一种或多种载体上的本文所公开的gRNA组合物、组合物或药物制剂配制于脂质纳米颗粒中或经由脂质纳米颗粒施用;参见例如WO2017/173054,其内容特此以全文引用的方式并入。
脂质;制剂;递送
本文公开使用包含本文中所描述的核酸或组合物的脂质核酸组装组合物的各种实施方案。在一些实施方案中,脂质核酸组装组合物包含本文所描述的核酸(例如,包含内部接头的gRNA)。
如本文所用,“脂质核酸组装组合物”是指基于脂质的递送组合物,包括脂质纳米颗粒(LNP)和脂质复合体。LNP是指<100nM的脂质纳米颗粒。LNP通过将脂质组分(例如于乙醇中)与水性核酸组分精确混合而形成,并且LNP的大小均一。脂质复合体为通过使脂质与核酸组分大量混合而形成的颗粒并且大小在约100nm与1微米之间。在某些实施方案中,脂质核酸组装体为LNP。如本文所用,“脂质核酸组装体”包含多个(即超过一个)通过分子间力以物理方式彼此缔合的脂质分子。脂质核酸组装体可包含pKa值为<7.5或<7的生物可用脂质。脂质核酸组装体通过混合含核酸水溶液与基于有机溶剂的脂质溶液(例如100%乙醇)形成。适合溶液或溶剂包括或可含有:水、PBS、Tris缓冲液、NaCl、柠檬酸盐缓冲液、乙醇、氯仿、二乙醚、环己烷、四氢呋喃、甲醇、异丙醇。药学上可接受的缓冲液可任选地包含于包含脂质核酸组装体的药物制剂中,例如用于离体疗法。在一些实施方案中,水溶液包含本文所描述的gRNA。在一些实施方案中,水溶液还包含编码RNA引导的DNA结合剂(诸如Cas9)的mRNA。
如本文所用,脂质纳米颗粒(LNP)是指包含多个(即,超过一个)通过分子间力以物理方式彼此缔合的脂质分子的颗粒。LNP可例如为微球体(包括单层和多层囊泡,例如“脂质体”,在一些实施方案中为大体上球形的层状相脂质双层,并且在更特定实施方案中可包含水性核心,例如包含大部分RNA分子)、乳液中的分散相、微胞或悬浮液中的内相。乳液、微胞和悬浮液可为用于局部和/或表面递送的适合组合物。也参见例如WO2017173054A1,其内容特此以全文引用的方式并入。本领域技术人员已知能够将核苷酸递送至受试者的任何LNP可与本文所描述的引导RNA一起使用。
在一些实施方案中,水溶液包含本文所描述的gRNA。包含脂质核酸组装组合物的药物制剂可任选地包含药学上可接受的缓冲液。
在一些实施方案中,脂质核酸组装组合物包含“胺脂质”(在本文中或别处有时描述为“可离子化脂质”或“可生物降解脂质”),以及任选地存在的“辅助脂质”、“中性脂质”和隐形脂质,诸如PEG脂质。在一些实施方案中,取决于pH,胺脂质或可离子化脂质为阳离子型的。
胺脂质
在一些实施方案中,脂质核酸组装组合物包含“胺脂质”,其为例如可离子化脂质,诸如脂质A或其等效物,包括脂质A的缩醛类似物。
在一些实施方案中,胺脂质为脂质A,其为十八碳-9,12-二烯酸(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯,也称作(9Z,12Z)-十八碳-9,12-二烯酸3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯。脂质A可描绘为:
可根据WO2015/095340(例如第84至86页)合成脂质A。在一些实施方案中,胺脂质为脂质A的等效物。
在一些实施方案中,胺脂质为脂质A的类似物。在一些实施方案中,脂质A类似物为脂质A的缩醛类似物。在特定脂质核酸组装组合物中,缩醛类似物为C4-C12缩醛类似物。在一些实施方案中,缩醛类似物为C5-C12缩醛类似物。在额外实施方案中,缩醛类似物为C5-C10缩醛类似物。在其他实施方案中,缩醛类似物选自C4、C5、C6、C7、C9、C10、C11和C12缩醛类似物。
适用于本文所描述的脂质核酸组装体的胺脂质和其他“可生物降解脂质”为体内或离体可生物降解的。胺脂质具有低毒性(例如,以大于或等于10mg/kg的量在动物模型中得到耐受而不具有不良作用)。在一些实施方案中,包含胺脂质的脂质核酸组装体包括其中在8、10、12、24或48小时或3、4、5、6、7或10天内从血浆或工程化细胞清除至少75%的胺脂质的脂质核酸组装体。在一些实施方案中,包含胺脂质的脂质核酸组装体包括其中在8、10、12、24或48小时或3、4、5、6、7或10天内从血浆清除至少50%的核酸(例如mRNA或gRNA)的脂质核酸组装体。在一些实施方案中,包含胺脂质的脂质核酸组装体包括其中在8、10、12、24或48小时或3、4、5、6、7或10天内从血浆清除至少50%的脂质核酸组装体的脂质核酸组装体,例如通过测量脂质(例如,胺脂质)、核酸(例如,RNA/mRNA)或其他组分。在一些实施方案中,测量脂质核酸组装体的脂质囊封相对于游离脂质、RNA或核酸组分。
可生物降解脂质包括例如WO/2020/219876、WO/2020/118041、WO/2020/072605、WO/2019/067992、WO/2017/173054、WO2015/095340和WO2014/136086的可生物降解脂质,并且LNP包括其中所描述的LNP组合物,其脂质和组合物特此以引用的方式并入。
脂质清除率可如文献中所描述来测量。参见Maier,M.A.等人BiodegradableLipids Enabling Rapidly Eliminated Lipid Nanoparticles for Systemic Deliveryof RNAi Therapeutics.Mol.Ther.2013,21(8),1570-78(“Maier”)。举例而言,在Maier中,以0.3mg/kg通过静脉内弹丸注射经由外侧尾部静脉向六至八周龄雄性C57Bl/6小鼠施用含有靶向荧光素酶的siRNA的LNP-siRNA系统。在给药后0.083、0.25、0.5、1、2、4、8、24、48、96和168小时收集血液、肝脏和脾脏样品。在收集组织之前向小鼠灌注生理盐水并且处理血液样品以获得血浆。处理并通过LC-MS分析所有样品。此外,Maier描述了一种用于评定施用LNP-siRNA制剂之后的毒性的程序。举例而言,以0、1、3、5和10mg/kg(5只动物/组)经由单一静脉内弹丸注射以5mL/kg的剂量体积向雄性斯普拉-道来氏大鼠(Sprague-Dawley rat)施用靶向荧光素酶的siRNA。24小时之后,从清醒的动物的颈静脉获得约1mL血液并分离血清。在给药后72小时,将所有动物安乐死以用于尸体剖检。进行临床症状、体重、血清化学、器官重量和组织病理学的评定。尽管Maier描述了用于评定siRNA-LNP制剂的方法,但这些方法可适用于评定本公开的脂质核酸组装组合物的施用的清除率、药代动力学和毒性。
本领域中已知用于核酸的LNP递送的可离子化和生物可用脂质为适合的。脂质可取决于其所存在的介质的pH而离子化。举例而言,在弱酸性介质中,脂质,诸如胺脂质可被质子化并因此带有正电荷。相反地,在弱碱性介质,诸如其中pH为大约7.35的血液中,脂质,诸如胺脂质可不被质子化并因此不带电荷。
脂质携带电荷的能力与其固有pKa有关。在一些实施方案中,本公开的胺脂质可各自独立地具有在约5.1至约7.4范围内的pKa。在一些实施方案中,本公开的生物可用脂质可各自独立地具有在约5.1至约7.4,诸如约5.5至约6.6、约5.6至约6.4、约5.8至约6.2或约5.8至约6.5范围内的pKa。举例而言,本公开的胺脂质可各自独立地具有在约5.8至约6.5范围内的pKa。pKa在约5.1至约7.4范围内的脂质有效用于将负荷体内递送至例如肝脏。另外,已发现,pKa在约5.3至约6.4范围内的脂质有效用于体内递送至例如肿瘤。参见例如WO2014/136086。
额外脂质
适用于本公开的脂质核酸组装组合物中的“中性脂质”包括例如多种中性、不带电荷或两性离子型脂质。适用于本公开的中性磷脂的实例包括但不限于:5-十七基苯-1,3-二醇(间苯二酚)、二软脂酰基磷脂酰胆碱(DPPC)、二硬脂酰基磷脂酰胆碱(DSPC)、磷酸胆碱(DOPC)、二肉豆蔻酰基磷脂酰胆碱(DMPC)、磷脂酰胆碱(PLPC)、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(DAPC)、磷脂酰乙醇胺(PE)、卵磷脂酰胆碱(EPC)、二月桂酰基磷脂酰胆碱(DLPC)、二肉豆蔻酰基磷脂酰胆碱(DMPC)、1-肉豆蔻酰基-2-软脂酰基磷脂酰胆碱(MPPC)、1-软脂酰基-2-肉豆蔻酰基磷脂酰胆碱(PMPC)、1-软脂酰基-2-硬脂酰基磷脂酰胆碱(PSPC)、1,2-二花生酰基-sn-甘油-3-磷酸胆碱(DBPC)、1-硬脂酰基-2-软脂酰基磷脂酰胆碱(SPPC)、1,2-二十碳烯酰基-sn-甘油-3-磷酸胆碱(DEPC)、软脂酰油酰基磷脂酰胆碱(POPC)、溶血磷脂酰基胆碱、二油酰基磷脂酰乙醇胺(DOPE)、二亚油酰基磷脂酰胆碱二硬脂酰基磷脂酰乙醇胺(DSPE)、二肉豆蔻酰基磷脂酰乙醇胺(DMPE)、二软脂酰基磷脂酰乙醇胺(DPPE)、软脂酰油酰基磷脂酰乙醇胺(POPE)、溶血磷脂酰乙醇胺和其组合。在一个实施方案中,中性磷脂可选自由以下组成的组:二硬脂酰基磷脂酰胆碱(DSPC)和二肉豆蔻酰基磷脂酰乙醇胺(DMPE)。在另一实施方案中,中性磷脂可为二硬脂酰基磷脂酰胆碱(DSPC)。
“辅助脂质”包括类固醇、固醇和烷基间苯二酚。适用于本公开中的辅助脂质包括但不限于胆固醇、5-十七烷基间苯二酚和胆固醇半丁二酸酯。在一个实施方案中,辅助脂质可为胆固醇。在一个实施方案中,辅助脂质可为胆固醇半丁二酸酯。
“隐形脂质(Stealth lipid)”为改变纳米颗粒可在体内(例如血液中)存在的时长的脂质。隐形脂质可通过例如减少颗粒聚集并控制粒度来辅助配制过程。本文使所用的隐形脂质可调节脂质核酸组装体的药代动力学特性或有助于纳米颗粒离体稳定性。适用于本公开的脂质核酸组装组合物的隐形脂质包括但不限于具有连接至脂质部分的亲水性头基的隐形脂质。适用于本公开的脂质核酸组装组合物的隐形脂质和关于此类脂质的生物化学的信息可见于Romberg等人,Pharmaceutical Research,第25卷,第1期,2008,第55至71页和Hoekstra等人,Biochimica et Biophysica Acta 1660(2004)41-52中。额外适合PEG脂质公开于例如WO 2006/007712中。
在一个实施方案中,隐形脂质的亲水性头基包含选自基于PEG的聚合物的聚合物部分。隐形脂质可包含脂质部分。在一些实施方案中,隐形脂质为PEG脂质。
在一个实施方案中,隐形脂质包含选自基于以下的聚合物的聚合物部分:PEG(有时称作聚(环氧乙烷))、聚(唑啉)、聚(乙烯醇)、聚(甘油)、聚(N-乙烯基吡咯啶酮)、聚氨基酸和聚[N-(2-羟丙基)甲基丙烯酰胺]。
在一个实施方案中,PEG脂质包含基于PEG(有时称作聚(环氧乙烷))的聚合物部分。
PEG脂质还包含脂质部分。在一些实施方案中,脂质部分可源自二酰基甘油或二酰基甘油酰胺、包括包含具有独立地包含约C4至约C40饱和或不饱和碳原子的烷基链长度的二烷基甘油或二烷基甘油酰氨基的那些,其中所述链可包含一个或多个官能基,诸如酰胺或酯。在一些实施方案中,烷基链长度包含约C10至C20。二烷基甘油或二烷基甘油酰氨基可还包含一个或多个取代的烷基。链长可为对称或不对称的。
除非另外指示,否则如本文所用,术语“PEG”意指任何聚乙二醇或其他聚亚烷醚聚合物。在一个实施方案中,PEG为乙二醇或环氧乙烷的任选地取代的直链或支链聚合物。在一个实施方案中,PEG为未取代的。在一个实施方案中,PEG被例如一个或多个烷基、烷氧基、酰基、羟基或芳基取代。在一个实施方案中,所述术语包括PEG共聚物,诸如PEG-聚氨基甲酸酯或PEG-聚丙烯(参见例如J.Milton Harris,Poly(ethylene glycol)chemistry:biotechnical and biomedical applications(1992));在另一实施方案中,所述术语不包括PEG共聚物。在一个实施方案中,PEG的分子量为约130至约50,000,在子实施方案中,约150至约30,000,在子实施方案中,约150至约20,000,在子实施方案中,约150至约15,000,在子实施方案中,约150至约10,000,在子实施方案中,约150至约6,000,在子实施方案中,约150至约5,000,在子实施方案中,约150至约4,000,在子实施方案中,约150至约3,000,在子实施方案中,约300至约3,000,在子实施方案中,约1,000至约3,000,和在子实施方案中,约1,500至约2,500。
在一些实施方案中,PEG(例如,与脂质部分或脂质,诸如隐形脂质缀合)为“PEG-2K”,也称为“PEG2k”或“PEG 2000”,其平均分子量为约2,000道尔顿。PEG-2K在本文中由下式(I)表示,其中n为45,意指被数目平均化的聚合度包含约45个亚基然而,也可使用本领域中已知的其他PEG实施方案,包括例如其中数目平均化的聚合度包含约23个亚基(n=23)和/或68个亚基(n=68)的那些。在一些实施方案中,n可在约30至约60范围内。在一些实施方案中,n可在约35至约55范围内。在一些实施方案中,n可在约40至约50范围内。在一些实施方案中,n可在约42至约48范围内。在一些实施方案中,n可为45。在一些实施方案中,R可选自H、取代的烷基和未取代的烷基。在一些实施方案中,R可为未取代的烷基。在一些实施方案中,R可为甲基。
在本文所描述的实施方案中的任一者中,PEG脂质可选自PEG-二月桂酰基甘油、PEG-二肉豆蔻酰基甘油(PEG-DMG)(例如1,2-二肉豆蔻酰基-rac-甘油-3-甲基聚氧乙二醇2000(PEG2k-DMG)或PEG-DMG(目录号GM-020,来自NOF,Tokyo,Japan))、PEG-二棕榈酰基甘油、PEG-二硬脂酰基甘油(PEG-DSPE)(目录号DSPE-020CN,NOF,Tokyo,Japan)、PEG-二月桂基甘油酰胺、PEG-二肉豆蔻基甘油酰胺、PEG-二棕榈酰基甘油酰胺和PEG-二硬脂酰基甘油酰胺、PEG-胆固醇(1-[8'-(胆甾-5-烯-3[β]-氧基)甲酰氨基-3',6'-二氧杂辛基]胺甲酰基-[Ω]-甲基-聚(乙二醇)、PEG-DMB(3,4-二-十四氧基苯甲基-[Ω]-甲基-聚(乙二醇)醚)、1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DMG)(目录号880150P,来自Avanti Polar Lipids,Alabaster,Alabama,USA)、1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSPE)(目录号880120C,来自Avanti Polar Lipids,Alabaster,Alabama,USA)、1,2-二硬脂酰基-sn-甘油、甲氧基聚乙二醇(PEG2k-DSG;GS-020,NOF Tokyo,Japan)、聚(乙二醇)-2000-二甲基丙烯酸酯(PEG2k-DMA)和1,2-二硬脂酰氧基丙基-3-胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSA)。在一个实施方案中,PEG脂质可为1,2-二肉豆蔻酰基-rac-甘油-3-甲基聚氧乙二醇2000(PEG2k-DMG)。在一个实施方案中,PEG脂质可为PEG2k-DMG。在一些实施方案中,PEG脂质可为PEG2k-DSG。在一个实施方案中,PEG脂质可为PEG2k-DSPE。在一个实施方案中,PEG脂质可为PEG2k-DMA。在一个实施方案中,PEG脂质可为PEG2k-C-DMA。在一个实施方案中,PEG脂质可为化合物S027,其公开于WO2016/010840(第[00240]至[00244]段)中。在一个实施方案中,PEG脂质可为PEG2k-DSA。在一个实施方案中,PEG脂质可为PEG2k-C11。在一些实施方案中,PEG脂质可为PEG2k-C14。在一些实施方案中,PEG脂质可为PEG2k-C16。在一些实施方案中,PEG脂质可为PEG2k-C18。
LNP递送gRNA
脂质纳米颗粒(LNP)为递送核苷酸和蛋白质负荷的熟知方式,并且可用于递送本文所公开的gRNA(例如sgRNA、dgRNA或crRNA)、组合物或药物制剂。在一些实施方案中,LNP递送核酸、蛋白质、或核酸连同蛋白质一起。如本文所用,脂质纳米颗粒(LNP)是指包含多个(即,超过一个)通过分子间力以物理方式彼此缔合的脂质分子的颗粒。LNP可例如为微球体(包括单层和多层囊泡,例如“脂质体”,在一些实施方案中为大体上球形的层状相脂质双层,并且在更特定实施方案中可包含水性核心,例如包含大部分RNA分子)、乳液中的分散相、微胞或悬浮液中的内相(参见例如WO2017173054,其内容特此以全文引用的方式并入)。可利用本领域技术人员已知能够向受试者递送核苷酸的任何LNP。
在一些实施方案中,本发明包括一种向受试者递送本文所公开的gRNA(例如sgRNA、dgRNA或crRNA)中的任一者的方法,其中gRNA与LNP缔合。在一些实施方案中,gRNA/LNP也与Cas核酸酶或编码Cas核酸酶的多核苷酸(例如mRNA或DNA)缔合。
在一些实施方案中,本发明包括一种组合物,其包含所公开gRNA中的任一者和LNP。在一些实施方案中,组合物还包含Cas9或编码Cas9的多核苷酸(例如mRNA或DNA)。
在一些实施方案中,本文提供一种将本文所描述的引导RNA中的任一者递送至受试者的细胞或细胞群,包括体内递送至受试者内的细胞或细胞群的方法,其中所述组分中的任一者或多者与LNP缔合。在一些实施方案中,所述方法还包括RNA引导的DNA结合剂(例如,Cas9或编码Cas9的多核苷酸(例如mRNA或DNA))。
在一些实施方案中,本发明提供一种组合物,其包含单独或与LNP组合的本文所描述的引导RNA中的任一者或本文所公开的供体构建体。在一些实施方案中,所述组合物还包含RNA引导的DNA结合剂(例如,Cas9或编码Cas9的多核苷酸(例如mRNA或DNA))。
在一些实施方案中,LNP包含阳离子脂质。在一些实施方案中,LNP包含十八碳-9,12-二烯酸(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯,也称作(9Z,12Z)-十八碳-9,12-二烯酸3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯)。在一些实施方案中,LNP包含摩尔比为约4.5的阳离子脂质胺与RNA磷酸酯(N:P)。在一些实施方案中,LNP包含8-((7,7-双(辛氧基)庚基)(2-羟乙基)氨基)辛酸壬酯。在一些实施方案中,LNP包含摩尔比为约4.5至6.5的阳离子脂质胺与RNA磷酸酯(N:P)。在一些实施方案中,LNP包含摩尔比为约4.5的阳离子脂质胺与RNA磷酸酯(N:P)。在一些实施方案中,LNP包含摩尔比为约6.0的阳离子脂质胺与RNA磷酸酯(N:P)。
在一些实施方案中,与本文所公开的gRNA缔合的LNP用于制备供治疗疾病或病症所用的药剂。
电穿孔为递送负荷的熟知方式,并且任何电穿孔方法可用于递送本文所公开的gRNA中的任一者。在一些实施方案中,电穿孔可用于递送本文所公开的gRNA中的任一者和Cas9或编码Cas9的多核苷酸(例如mRNA或DNA)。
在一些实施方案中,本发明包括一种向离体细胞递送本文所公开的gRNA中的任一者的方法,其中gRNA与LNP缔合或不与LNP缔合。在一些实施方案中,gRNA/LNP或gRNA也与Cas9或编码Cas9的多核苷酸(例如mRNA或DNA)缔合。参见例如WO2021222287,其以引用的方式并入本文中。
在一些实施方案中,载体包含一个或多个编码mRNA的核苷酸序列,所述mRNA编码RNA引导的DNA核酸酶,其可为Cas核酸酶,诸如Cas9或Cpf1。在一些实施方案中,载体包含一个或多个编码crRNA、trRNA和mRNA的核苷酸序列,所述mRNA编码RNA引导的DNA核酸酶,其可为Cas蛋白,诸如Cas9。在一个实施方案中,Cas9来自Spy Cas9或NmeCas9。在一些实施方案中,编码crRNA、trRNA或crRNA和trRNA(其可为sgRNA)的核苷酸序列包含以下或由以下组成:侧接有来自天然存在的CRISPR/Cas系统的重复序列的全部或一部分的引导序列。包含crRNA、trRNA或crRNA和trRNA或由其组成的核酸可还包含载体序列,其中所述载体序列包含以下或由以下组成:不会与crRNA、trRNA或crRNA和trRNA一起天然发现的核酸。
在一些实施方案中,组分可以裸核酸形式、以与诸如脂质体或泊洛沙姆(poloxamer)的药剂复合的核酸形式引入,或可通过病毒载体(例如腺病毒、AAV、疱疹病毒、反转录病毒、慢病毒)来递送。用于非病毒递送核酸的方法和组合物包括电穿孔、脂质体转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、LNP、聚阳离子或脂质:核酸缀合物、裸核酸(例如裸DNA/RNA)、人工病毒粒子和被药剂增强的DNA摄取。使用例如Sonitron 2000系统(Rich-Mar)进行的声致穿孔也可用于递送核酸。
***
本说明书和示例性实施方案不应视为限制性的。出于本说明书和所附权利要求书的目的,除非另外指示,否则表示数量、百分比或比例的所有数字,和说明书和权利要求书中所用的其他数值均应理解为在所有情况下通过术语“约”修饰至其尚未如此修饰的程度。
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
VI.实施例
提供以下实施例以说明某些所公开的实施方案并且不应视为以任何方式限制本公开的范围。
实施例1.材料和方法
核酸酶mRNA的体外转录(“IVT”)
使用常规方法通过体外转录来产生含有N1-甲基假-U的封端且多腺苷酸化的mRNA。通常,根据制造商的方案用XbaI使含有T7启动子、用于转译的序列和多腺苷酸化区的质体DNA线性化。通过加热使XbaI不活化。由酶和缓冲盐纯化所述线性化质体。用于产生修饰的mRNA的IVT反应通过在37℃下如下来进行:50ng/μL线性化质粒;2至5mM各GTP、ATP、CTP和N1-甲基假-UTP(Trilink);10至25mM ARCA(Trilink);5U/μL T7 RNA聚合酶;1U/μL鼠类RNA酶抑制剂(NEB);0.004U/μL无机大肠杆菌焦磷酸酶(NEB);和1×反应缓冲液孵育。添加TURBO DNA酶(ThermoFisher)至0.01U/μL的最终浓度,并且在37℃孵育反应物以移除DNA模板。
根据制造商的方案,使用MegaClear Transcription Clean-up试剂盒(ThermoFisher)或RNeasy Maxi试剂盒(Qiagen)来纯化mRNA。替代地,经由沉淀方案来纯化mRNA,在一些情况下,随后进行基于HPLC的纯化。简言之,在DNA酶消化之后,使用LiCl沉淀、乙酸铵沉淀和乙酸钠沉淀来纯化mRNA。对于HPLC纯化的mRNA,在LiCl沉淀和复原之后,通过RP-IP HPLC纯化mRNA(参见例如Kariko等人,Nucleic Acids Research,2011,第39卷,第21期el42)。合并所选汇集的级分并且通过如上文所描述的乙酸钠/乙醇沉淀来去盐。在另一替代方法中,mRNA用LiCl沉淀方法纯化,随后通过切向流过滤进一步纯化。通过测量在260nm的吸光度(Nanodrop)测定RNA浓度,并且通过毛细管电泳法用Bioanalyzer(Agilent)来分析转录物。
从编码根据SEQ ID No:321-323(参见表5中的序列)的开放阅读框架的质粒DNA产生化脓链球菌(“Spy”)Cas9 mRNA。当此段中引用的序列在下文中针对RNA提及时,应理解T应替换为U(其可为如上文所描述的修饰的核苷)。用于实施例中的信使RNA包含5'帽和3'多腺苷酸化序列,例如多达100个核苷酸。由商业供应商或使用标准体外合成技术用修饰的核苷酸化学合成引导RNA。
细胞制备
设计靶向小鼠、大鼠、人类和食蟹猴(猕猴)甲状腺素转运蛋白TTR基因的短sgRNA,并且将其用于如下文所描述的脂质体转染,分别转染至原代小鼠肝细胞(PMH)、原代大鼠肝细胞(PRH)、原代人类肝细胞(PHH)和原代食蟹猴肝细胞(PCH)中。将PMH、PRH、PHH或PCH解冻,并且再悬浮于含有接种补充剂的肝细胞解冻培养基(William's E培养基(Gibco,目录号A12176-01,批号2039733))、含有地塞米松(dexamethasone)+混合补充剂的肝细胞解冻培养基(Gibco,目录号A15563,批号2019842)和含有接种补充剂+FBS内含物的肝细胞解冻培养基(Gibco,目录号A13450,批号1970698)中,接着离心。丢弃上清液并且将集结的细胞再悬浮于肝细胞接种培养基加补充剂包(Invitrogen,目录号A1217601和Gibco,目录号CM3000)中。对细胞进行计数,并且将其接种于Bio-coat胶原蛋白I涂布的96孔板(ThermoFisher,目录号877272)中。允许所接种的细胞在组织培养孵育箱中、在37℃和5%CO2氛围下沉降并粘附4至6小时。在孵育之后,检查细胞的单层形成,并且用肝细胞维持培养基(Invitrogen,目录号A1217601和Gibco,目录号CM4000)洗涤一次。
制备含有sgRNA和Cas9 mRNA的LNP制剂
一般而言,以各种摩尔比将脂质纳米颗粒组分溶解于100%乙醇中。将RNA负荷(例如Cas9 mRNA和sgRNA)溶解于25mM柠檬酸盐、100mM NaCl(pH 5.0)中,产生大致0.45mg/mL的RNA负荷浓度。所使用的LNP含有的可离子化脂质(十八碳-9,12-二烯酸(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯,也称为(9Z,12Z)-十八碳-9,12-二烯酸3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯)(本文中也称为脂质A)、胆固醇、二硬脂酰基磷脂酰胆碱(DSPC)和1,2-二肉豆蔻酰基-rac-甘油-3-甲基聚氧乙二醇2000(PEG2k-DMG)呈50%脂质A、38%胆固醇、9% DSPC和3%PEG2k-DMG的摩尔比。以约6的脂质胺与RNA磷酸酯(N:P)的摩尔比和按重量计1:2的gRNA与mRNA的比率配制LNP。所使用的LNP包含单一RNA物种,诸如Cas9mRNA或sgRNA。LNP以类似方式由Cas9 mRNA和引导RNA的混合物制备。
使用交叉流技术,利用含脂质的乙醇与两个体积的RNA溶液和一个体积的水的冲击射流混合来制备LNP。经由混合十字管使于乙醇中的脂质与两个体积的RNA溶液混合。经由线内T形件将第四水流与十字管的输出流混合(参见WO2016010840图2)。将LNP在室温下保持1小时并进一步用水稀释(大约1:1v/v)。使用切向流过滤在平板滤筒(Sartorius,100kD MWCO)上浓缩稀释的LNP,并且随后使用PD-10去盐管柱(GE)将其缓冲液交换至50mMTris、45mM NaCl、5%(w/v)蔗糖,pH 7.5(TSS)中。接着使用0.2μm无菌过滤器过滤所得混合物。最终表征LNP以确定囊封效率、多分散性指数和平均粒度。将最终LNP储存于4℃或-80℃下直至进一步使用。
sgRNA和Cas9 mRNA脂质体转染
使用预混合脂质制剂进行Cas9 mRNA和gRNA的脂质体转染。脂质体转染试剂所含有的可离子化脂质(十八碳-9,12-二烯酸(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯,也称为(9Z,12Z)-十八碳-9,12-二烯酸3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯)、胆固醇、DSPC和PEG2k-DMG呈50%脂质A、38%胆固醇、9% DSPC和3% PEG2k-DMG的摩尔比。将此混合物在100%乙醇中复原,接着以约6.0的脂质胺与RNA磷酸酯(N:P)的摩尔比与RNA负荷(例如Cas9 mRNA和gRNA)混合。由商业供应商或使用标准体外合成技术用修饰的核苷酸化学合成引导RNA。包含表5的Cas9 ORF的mRNA通过如WO2019/067910中所描述的体外转录(IVT)产生,参见例如使用2小时IVT反应时间并通过LiCl沉淀,随后切向流过滤来纯化mRNA。
脂质体转染以按重量计1:1的gRNA与mRNA的比率进行。简言之,将细胞在37℃、5%CO2下孵育24小时,之后用LNP处理。将LNP在37℃下在含有6%食蟹猴或6%胎牛血清(FBS)的培养基中孵育10分钟。孵育后,依以300ng Cas9mRNA起始的8点或12点3倍剂量反应曲线,将LNP添加至小鼠或食蟹猴肝细胞中。处理后72小时溶解细胞以进行NGS分析,如实施例1中所描述。
基因组DNA分离
在72小时转染后收集细胞。使用50微升/孔的QuickExtract DNA提取溶液(Epicentre,目录号QE09050)或Quick Extract(Lucigen,目录号SS000035-D2)根据制造商方案从96孔板的各孔提取gDNA。
次世代测序(“NGS”)和编辑效率分析
为了定量地测定基因组中的靶位置处的编辑效率,使用测序来鉴别通过基因编辑引入的插入和缺失的存在。围绕所关注基因(例如TTR)内的靶位点设计PCR引物,并且扩增所关注基因组区域。按本领域中的标准进行引物序列设计。
根据制造商的方案(Illumina)执行额外PCR以添加化学物质以进行测序。扩增子在Illumina MiSeq仪器上测序。在消除具有低质量评分的读段之后,将读段与参考基因组(例如,hg38)比对。将含有所述读段的所得档案映射至参考基因组(BAM档案),其中选择重叠所关注的靶区的读段,并且计算野生型读段的数目相对于含有插入或缺失(“插入缺失”)的读段的数目。
编辑百分比(例如“编辑效率”或“编辑%”)定义为具有插入或缺失(“插入缺失”)的序列读段的总数目除以包含野生型的序列读段的总数目。
实施例2.原代肝细胞中的体外编辑
如表2A至2B中所示设计具有各种骨架序列的共享与小鼠、食蟹猴和人类TTR基因交叉反应的相同靶向序列的sgRNA,并且将其脂质体转染至原代小鼠肝细胞(PMH)、食蟹猴肝细胞(PCH)和人类肝细胞(PHH)中。除非另外指出,否则如上文所描述制备来自In VitroADMET Laboratories,Inc.和GibcoTM的细胞,通过脂质体转染处理,并且进行分析。具体地,使用PMH(批号#839)、PCH(批号#10136011)和PHH(批号#8296)细胞,并且分别以15,000、30,000和33,000个细胞/孔的密度接种。如实施例1中所描述,使用50%脂质A、38%胆固醇、9%DSPC和3% PEG2k-DMG的摩尔比来制备脂质体转染试剂。使用约6的N:P摩尔比和按重量计1:1的gRNA:mRNA比率来制备脂质体转染样品。分析中包括重复样品。具有标准差(SD)的平均编辑结果示出于表6和图1A(PMH)、图1B(PCH)和图1C(PHH)中。NA指示引导物的重复物中的一者不满足测序质量度量值,使得无法计算SD。
表6.PMH、PCH、PHH中的体外编辑
/>
实施例3.具有稀释曲线的原代肝细胞中的体外编辑
全部具有与小鼠、人类、食蟹猴TTR基因交叉反应的相同靶向序列的sgRNA被设计成具有如表2A至2B中所示的将PEG接头并入sgRNA恒定区的不同区中的各种骨架序列。如上文所描述将引导物和Cas9 mRNA脂质体转染至原代小鼠肝细胞(PMH)中。使用PMH(批号#839)细胞并以15,000个细胞/孔的密度接种。除非另外指出,否则如上文所描述制备来自GibcoTM的细胞,通过脂质体转染处理,并且进行分析。依以46.5nM引导物浓度起始的8点3倍稀释曲线分析引导物,如表7中所示。用对照引导物G000502和G012401测试两组引导物。样品一式三份地进行。EC50值和平均编辑结果示出于表7中。剂量反应曲线绘制于图2A和图2B中。
表7.PMH中的编辑百分比
/>
使用上文所描述的制备、通过LNP处理和分析细胞的相同方法,在原代小鼠肝细胞(PMH)和原代食蟹猴肝细胞(PCH)中进一步评估来自表7的所选sgRNA。使用来自GibcoTM的PMH(批号#839)和PCH(批号#CY6011)细胞,并且分别以15,000和30,000个细胞/孔的密度接种。如实施例1中所描述,以50%脂质A、38%胆固醇、9% DSPC和3% PEG2k-DMG的摩尔比,使用约6的N:P摩尔比和按重量计1:2的gRNA:mRNA比率来制备LNP制剂。依以46.5nM引导物浓度起始的8点3倍稀释剂量反应曲线分析引导物,如表8中所示。样品一式两份地进行。PMH和PCH的EC50值和平均编辑结果示出于表8中。剂量反应曲线分别绘制于图3A和图3B中。作为不确定值列举的EC50值用“ND”表示。
表8.PMH和PCH中的编辑
/>
除非另外指出,否则使用上文所描述的制备、通过LNP处理和分析细胞的相同方法,在原代小鼠肝细胞(PMH)、原代大鼠肝细胞(PRH)和原代食蟹猴肝细胞(PCH)中评估额外sgRNA。使用PMH(批号#839)细胞并以15,000个细胞/孔的密度接种。使用PMH(批号#839或批号#mc114)、PCH(批号#10136011)和PRH(批号#977A)细胞,并且分别以15,000、33,000和30,000个细胞/孔的密度接种。如实施例1中所描述,以50%脂质A、38%胆固醇、9% DSPC和3%PEG2k-DMG的摩尔比,使用约6的N:P摩尔比和按重量计1:2的gRNA:mRNA比率来制备LNP制剂。依以46.5nM引导物浓度起始的12点3倍剂量反应曲线分析引导物,如表8和9中所示。对于PMH和PCH,对照物G017276和G000502分别一式6份和一式4份地运行,并且其余样品分别一式4份和一式2份地运行。对于PMH和PCH,对照物G017276和G000502分别一式6份和一式3份地运行,并且测试样品分别一式4份和一式2份地运行。对于PRH,对照物G018631和G022500一式4份地运行,并且其余样品一式2份地运行。PMH和PCH的EC50值和平均编辑结果示出于表9中,并且PRH的EC50值和平均编辑结果示出于表10中。PMH、PCH和PRH的剂量反应曲线分别绘制于图4A、图4B和图4C中。
表9.PMH和PCH中的编辑
/>
表10.PRH中的编辑
/>
实施例4.使用脂质纳米颗粒(LNP)在小鼠肝脏中的体内编辑
如实施例1中所描述配制用于所有体内研究中的LNP。与方案的偏差在各别实施例中提及。用于LNP制备的运输和储存溶液(TSS)在实验中作为仅媒介物阴性对照给药。LNP中含有的sgRNA的核苷酸序列均靶向TTR基因中的相同序列,如表2A至2B中所指示。
实施例4.1小鼠模型中的体内编辑
测试来自表2A至2B的所选引导物设计的体内编辑效率。涉及小鼠的各研究中使用6至10周龄范围内的CD-1雌性小鼠。给药前对动物进行称重。以每只动物0.2mL的体积(每公斤体重约10mL),经由外侧尾部静脉给予LNP。给药后约6小时,观测动物的不良反应。在施用后二十四小时测量体重,并且在给药后8天,通过在异氟醚麻醉下放血将动物安乐死。经由心脏穿刺将血液收集至血清分离管中或含有缓冲柠檬酸钠的管中以得到血浆,如本文所描述。对于涉及体内编辑的研究,从各动物的左内叶收集肝脏组织以用于DNA提取和分析。
对于体内研究,使用基于珠粒的提取试剂盒,例如Zymo Quick-DNA 96试剂盒(Zymo Research,目录号D3010),根据制造商的方案从10mg组织中提取基因组DNA,所述方案包括使组织在溶解缓冲液中均质化(约400μL/10mg组织)。所有DNA样品相对于100ng/μL浓度归一化以用于PCR和后续NGS分析,如实施例1中所描述。
实施例4.2用于动物研究中的甲状腺素转运蛋白(TTR)ELISA分析
收集血液并如上文所描述分离血清。使用小鼠前白蛋白(甲状腺素转运蛋白)ELISA试剂盒(Aviva Systems Biology,目录号OKIA00111)测定总TTR血清含量;使用大鼠特异性ELISA试剂盒(Aviva Systems Biology,目录号OKIA00159)测量大鼠TTR血清含量。根据制造商方案制备试剂盒试剂和标准品。用1×分析稀释剂将小鼠或大鼠血清稀释至10,000倍的最终稀释度。此如下进行:进行两次连续50倍稀释,产生2500倍稀释度。进行最终4倍稀释步骤,得到10,000倍的总样品稀释度。将标准曲线稀释液(各100μL)与稀释的血清样品均添加至预涂有捕捉抗体的ELISA板的各孔中。将培养板在室温下孵育30分钟,随后洗涤。添加酶-抗体缀合物(每孔100μL),孵育20分钟。移除未缀合的抗体缀合物并再次洗涤培养板,随后添加显色受质溶液。将培养板孵育10分钟,随后添加100μL终止溶液,例如硫酸(约0.3M)。将培养板在SpectraMax M5或Clariostar板读取器上、在450nm的吸光度下读取。使用脱离标准曲线的四参数逻辑曲线拟合,通过SoftMax Pro软件版本6.4.2或Mars软件版本3.31计算血清TTR含量。根据分析稀释度调整最终血清值。相对于对照组,测定蛋白质阻断百分比(KD%)值,除非另外指示,否则对照组通常为媒介物(TSS)假处理的动物。在受试者或动物组中观测到负KD%值,其中TTR含量高于对照组平均值,得到负阻断值。
实施例4.3体内编辑和血清TTR阻断
LNP一般如实施例1中所描述制备。如实施例1中所描述分析LNP制剂的平均粒度、多分散性(pdi)、总RNA含量和RNA囊封效率,并且结果示出于表11中。
表11.LNP制剂分析
将含有表12中所指示的sgRNA的LNP以0.1mg/kg总RNA的剂量向雌性CD-1小鼠(n=5)施用,如上文所描述。引导物G017276充当对照。含有所指示sgRNA的LNP的编辑效率、TTR蛋白质含量和TTR阻断百分比(KD%)示出于表12中,并且编辑效率和TTR蛋白质含量示出于图5A和图5B中。
表12肝脏编辑、血清TTR蛋白质和TTR蛋白质阻断
将来自表12的所选引导物以0.1mg/kg和0.03mg/kg总RNA向雌性CD-1小鼠(n=5)施用,如上文所描述。引导物G012401和G01727充当对照。表13分别示出含有所指示sgRNA的LNP的编辑效率、TTR蛋白质含量和TTR阻断百分比,并且编辑效率示出于图6中。
表13.肝脏编辑、血清TTR蛋白质和血清TTR蛋白质KD%
将具有额外接头修饰的具有相同靶向序列的其他引导物以0.1mg/kg和0.03mg/kg总RNA向雌性CD-1小鼠(n=5)施用,如上文所描述。引导物G017276和G000502充当对照。表14分别示出含有所指示sgRNA的LNP的编辑效率、TTR蛋白质含量和TTR阻断百分比,并且编辑效率示出于图7中。
表14.肝脏编辑、血清TTR蛋白质和血清TTR蛋白质KD%
实施例5.使用脂质纳米颗粒(LNP)在大鼠肝脏中的体内编辑
实施例5.1大鼠中的LNP递送
在大鼠中进一步测试所选引导物设计。在涉及大鼠的各研究中使用来自CharlesRiver的6至8周龄范围内的斯普拉-道来氏雌性大鼠。LNP经由外侧尾部静脉注射给药。如实施例1中所描述,以50%脂质A、38%胆固醇、9% DSPC和3%PEG2k-DMG的摩尔比,使用约6的N:P摩尔比和按重量计1:2的gRNA:mRNA比率来制备LNP制剂。在给药后观测动物的不良反应。在施用后二十四小时测量体重,并且在给药后经由在CO2窒息下放血将动物安乐死。经由心脏穿刺将血液收集至血清分离管(Geriner Bio One,目录号450472)中。对于涉及体内编辑的研究,从各动物收集肝脏组织。如实施例5中所描述分离和处理基因组DNA。制备所有DNA样品以用于PCR和后续NGS分析,如实施例5中所描述。
评估各大鼠样品的肝脏中的编辑效率和TTR血清蛋白质含量,如实施例5中所描述。以下研究表中的每一者中所示的结果表示各LNP内所含有的sgRNA(关于sgRNA核苷酸序列,参见表2A至2B),其均靶向TTR基因中的相同序列。将LNP如实施例5中所描述制备。与方案的偏差在以下各别实施例中提及。
实施例5.2大鼠模型中的体内编辑和TTR阻断
将含有表15中所指示的sgRNA的LNP以0.1mg/kg和0.03mg/kg总RNA的剂量向雌性斯普拉-道来氏大鼠(n=5)施用,如上文所描述。引导物G000534和G018631充当对照。表15分别示出编辑效率、血清TTR蛋白质和TSS百分比。编辑效率和血清TTR蛋白质含量示出于图8A和图8B中。
表15.肝脏编辑和血清TTR
实施例6.使用LNP的相对于sgRNA或pgRNA的sgRNA:mRNA比率
进行研究以评估含有PEG接头的sgRNA设计(pgRNA)的编辑效率。所述研究比较两种具有相同引导序列的靶向TTR的gRNA,其中一种在引导物的恒定区中包含三个PEG接头(pgRNA,G021846),并且一种不包含(G021845),如表4B中所示。引导物和mRNA配制于单独的LNP中并混合至所需比率,以经由脂质纳米颗粒(LNP)递送至原代小鼠肝细胞(PMH)。
除非另外指出,否则如实施例1中所描述制备、处理和分析PMH细胞。来自In VitroADMET Laboratories的PMH细胞(批号#MCM114)以15,000个细胞/孔的密度接种。如下文所描述用LNP处理细胞。LNP一般如实施例1中所描述制备。以50%脂质A、38%胆固醇、9%DSPC和3% PEG2k-DMG的摩尔比的脂质组成来制备LNP。以约6的脂质胺与RNA磷酸酯(N:P)摩尔比来配制LNP。LNP囊封单一RNA物种,gRNA G021845、gRNA G021846或mRNA(mRNA M),如实施例1中所描述。
用不同量的按RNA负荷的重量计1:4、1:2、1:1、2:1、4:1或8:1的gRNA与mRNA比率的LNP来处理PMH细胞。各分析中包括重复样品。依以1ng/uL总RNA浓度起始的8点3倍剂量反应曲线分析引导物,如表16中所示。平均编辑百分比结果示出于表16中。图12A示出sgRNAG021845的平均编辑百分比,并且图12B示出sgRNA G021846的平均编辑百分比。表中的“ND”表示由于实验失败而无法检测到的值。
表16.PMH中的平均编辑百分比
/>
实施例7.使用LNP在PMH中修饰的聚乙二醇化引导物(pgRNA)的体外编辑
分析具有小鼠TTR基因中的相同靶向位点的修饰的pgRNA以评估PMH细胞中的编辑效率。
除非另外指出,否则如实施例1中所描述制备、处理和分析PMH细胞。使用来自InVitro ADMET Laboratories的PMH细胞(批号#MC148)并以15,000个细胞/孔的密度接种。LNP制剂如实施例1中所描述制备。以50%脂质A、38%胆固醇、9% DSPC和3% PEG2k-DMG的摩尔比的脂质组成来制备LNP。以约6的脂质胺与RNA磷酸酯(N:P)摩尔比并用如表17中所指示的gRNA或用mRNA来配制LNP。
用按重量计30ng总mRNA(mRNA P)的LNP和表17中所指示的量的gRNA的LNP来处理于100ul培养基中的PMH。样品一式两份地进行。PMH的平均编辑结果示出于表17和图13中。
表17.PMH中的平均编辑百分比
/>
实施例8.在PMH中评估引导序列化学修饰
测试在引导序列中具有化学修饰的聚乙二醇化引导RNA(pgRNA)在PMH中的两个不同小鼠TTR区(外显子1和外显子3)处的编辑效率。如实施例1中所描述以20,000个细胞/孔的接种密度制备PMH(In Vitro ADMET Laboratories)。Nme2Cas9 mRNA(mRNA O;SEQ IDNO:367)和靶向如表18中所指示的小鼠TTR中的两个不同基因座的gRNA的脂质体转染使用如实施例1中所描述的预混合脂质组合物。使用具有100ng/100ul的Nme2 mRNA并具有表18中所指示浓度的gRNA的脂质复合体来处理细胞。将细胞在维持培养基+10% FBS(Corning#35-010-CF)中在37℃下孵育72小时。孵育后,分离基因组DNA并进行NGS分析,如实施例1中所描述。
测定三种gRNA浓度(3nM、8nM或25nM)下各种引导物修饰模式的编辑效率。分析中包括重复样品。具有N79 pgRNA设计的测试引导物(G023066或G023067)的平均编辑结果示出于表18和图14A至图14B中,所述设计在gRNA的靶结合区中的指定核苷酸位置处缺乏2'-OMe。表19和图14C至图14D示出具有末端修饰pgRNA设计的测试引导物(G023070或G023104)的平均编辑百分比,所述设计在gRNA的靶结合区中的指定核苷酸位置处具有额外2'-OMe修饰。表中的“ND”表示由于实验失败而无法检测到的值。
表18.引导序列中的指定位置处缺乏2'-OMe修饰的N79 pgRNA的平均编辑百分比。ND=由于技术失败未报告资料。
表19.pgRNA的靶结合区中的指定位置处具有额外2'-OMe修饰的末端修饰pgRNA的平均编辑百分比。ND=由于技术失败未报告资料。
实施例9.在PMH中使用LNP的Nme2 NLS变体的剂量反应
分析具有不同NLS布置的编码Nme2Cas9 ORF的信使mRNA在原代小鼠肝细胞(PMH)中的编辑效率。所述分析测试靶向小鼠TTR基因座的引导物,并且包括sgRNA和pgRNA两种设计。
如实施例1中以20,000个细胞/孔的接种密度制备PMH。LNP一般如实施例1中所描述用单一RNA物种作为负荷制备,如表20中所指示。以50%脂质A、38%胆固醇、9% DSPC和3% PEG2k-DMG的摩尔比的脂质组成来制备LNP。以约6的脂质胺与RNA磷酸酯(N:P)摩尔比来配制LNP。
用按RNA重量计60ng/100ul含有gRNA的LNP和含有如表20中所指示的mRNA的LNP来处理细胞。将细胞在含有维持补充剂和10%胎牛血清的Williams'E培养基(Gibco,A1217601)中在37℃下孵育72小时。在37℃下孵育72小时后,收集细胞并通过NGS评定编辑,如实施例1中所描述。平均编辑百分比资料示出于表20和图15中。
表20.原代小鼠肝细胞中的小鼠TTR基因座处的平均编辑百分比。
实施例10.在PMH中使用LNP的Nme2 NLS变体的剂量反应
分析具有不同NLS布置的编码Nme2Cas9 ORF的信使mRNA在原代小鼠肝细胞(PMH)中的编辑效率。
如实施例1中所描述以20,000个细胞/孔的接种密度制备PMH(Gibco,MC148)。一般如实施例1中所描述用单一RNA物种作为负荷制备LNP。以50%脂质A、38%胆固醇、9% DSPC和3% PEG2k-DMG的摩尔比的脂质组成来制备LNP。以约6的脂质胺与RNA磷酸酯(N:P)摩尔比来配制LNP。
用按RNA重量计30ng/100ul含有gRNA G021844的LNP和含有如表21中所指示的mRNA的LNP来处理细胞。将细胞在含有维持补充剂和10%胎牛血清的Williams'E培养基(Gibco,A1217601)中在37℃下孵育24小时。在37℃下孵育72小时后,收集细胞并通过NGS评定编辑,如实施例1中所描述。平均编辑百分比资料示出于表21和图16中。
表21.用LNP处理的PMH中的平均编辑百分比。
/>
/>
实施例11.使用pgRNA和mRNA LNP的体内编辑
体内评估修饰的pgRNA的编辑效率。重复/反重复区、发夹1和发夹2的环中的每一者中的四个核苷酸被Spacer-18 PEG接头取代。
一般如实施例1中所描述用单一RNA物种作为负荷制备LNP。LNP含有50%脂质A、38%胆固醇、9% DSPC和3% PEG2k-DMG的摩尔比。以约6的脂质胺与RNA磷酸酯(N:P)摩尔比来配制LNP。
将含有表22中所指示的靶向TTR基因的gRNA的LNP如上文所描述以0.1mg/kg或0.3mg/kg总RNA的剂量向雌性CD-1小鼠(n=5)施用。含有mRNA(mRNA M;SEQ ID NO:365)的LNP和含有pgRNA(G021846或G021844)的LNP分别以按RNA重量计1:2的比率同时递送。给药后7天将小鼠安乐死。
含有所指示pgRNA的LNP的编辑效率、血清TTR阻断和TSS百分比示出于表22中并分别示出于图17A至图17C中。
表22.肝脏编辑、血清TTR蛋白质和TTR蛋白质阻断
在不同剂量水平的替代mRNA的情况下,在小鼠中评估来自上文所描述的研究的pgRNA(G021844)。LNP一般如实施例1中所描述用单一RNA物种作为负荷制备。如实施例1中所描述配制含有pgRNA(G21844)或mRNA(mRNA P或mRNA M)的LNP。以50%脂质A、38%胆固醇、9% DSPC和3% PEG2k-DMG的摩尔比制备所使用LNP。以约6的脂质胺与RNA磷酸酯(N:P)摩尔比来配制LNP。G000502和G021844均靶向小鼠TTR基因的外显子3。含有pgRNA的LNP和含有mRNA的LNP基于组合RNA重量,分别以按RNA重量计2:1的引导物:mRNA比率同时给药。额外LNP分别与按重量计1:2比率(优选地SpyCas9引导物:mRNA比率)的G000502和SpyCas9 mRNA共同配制。
将具有如表23中所指示的RNA负荷的LNP以0.1mg/kg或0.03mg/kg总RNA的剂量向雌性CD-1小鼠(n=4)施用。含有所指示gRNA的LNP的编辑效率示出于表23中并且示出于图17D至图17E中。
表23.肝脏编辑和血清TTR蛋白质阻断
实施例12.NmeCas9和sgRNA或pgRNA的体内编辑
在小鼠模型中测试用Nme2Cas9测试的修饰的pgRNA的编辑效率。所测试的所有NmesgRNA均包含靶向mTTR的相同24核苷酸引导序列。
LNP一般如实施例1中所描述用单一RNA物种作为负荷制备。以50%脂质A、38%胆固醇、9% DSPC和3% PEG2k-DMG的摩尔比制备所使用LNP。以约6的脂质胺与RNA磷酸酯(N:P)摩尔比来配制LNP。LNP以按gRNA与mRNA负荷的重量计2:1的比率混合。剂量基于gRNA和mRNA的组合RNA重量计算。用于LNP制备的运输和储存溶液(TSS)在实验中作为仅媒介物阴性对照给药。
将6至10周龄范围内的CD-1雌性小鼠用于涉及小鼠的各研究中(除了TSS对照n=4的外,n=5/组)。根据表24中所列出的剂量,经由尾部静脉注射静脉内施用制剂。在给药后至少24小时,定期观测动物的不良反应。处理之后六天,在异氟醚麻醉下通过心脏穿刺将动物安乐死;收集肝脏组织用于下游分析。收集重量在5与15mg之间的肝脏穿孔以分离基因组DNA和总RNA。用NGS测序分析基因组DNA样品,如实施例1中所描述。含有所指示mRNA和gRNA的LNP的编辑效率示出于表24中并且示出于图18中。
表24.小鼠肝脏中的平均编辑百分比
实施例13.gRNA的体内碱基编辑
在小鼠模型中用Nme碱基编辑器构建体测试具有不同mRNA的修饰的gRNA的编辑效率。LNP一般如实施例1中所描述用单一RNA物种作为负荷制备。以50%脂质A、38%胆固醇、9% DSPC和3% PEG2k-DMG的摩尔比制备所使用LNP。以约6的脂质胺与RNA磷酸酯(N:P)摩尔比来配制LNP。将LNP如实施例1中所描述配制,不同的处在于各组分、引导RNA或mRNA个别地配制于LNP中,并且LNP在施用之前混合,如表25中所描述。对于Nme2Cas9和Nme2Cas9碱基编辑器样品,LNP以按gRNA与编辑器mRNA负荷的重量计2:1的比率混合。对于SpyCas9碱基编辑器样品,LNP以按gRNA与编辑器mRNA负荷的重量计1:2的比率混合。如表31和图14中所指示的剂量基于gRNA与编辑器mRNA的组合RNA重量计算。用额外0.03mg/kg UGI mRNA处理碱基编辑器样品。用于LNP制备的运输和储存溶液(TSS)在实验中作为仅媒介物阴性对照给药。
将6至10周龄范围内的CD-1雌性小鼠用于涉及小鼠的各研究中(除了TSS对照n=4的外,n=5/组)。根据表25中所列出的剂量,经由尾部静脉注射静脉内施用制剂。在给药后至少24小时,定期观测动物的不良反应。处理之后六天,在异氟醚麻醉下通过心脏穿刺将动物安乐死;收集肝脏组织用于下游分析。收集重量在5与15mg之间的肝脏穿孔以分离基因组DNA和总RNA。使用DNA分离试剂盒(ZymoResearch,D3010)提取基因组DNA并用NGS测序分析样品,如实施例1中所描述。含有所指示gRNA的LNP的编辑效率示出于表25中并且示出于图19中。
表25.小鼠肝脏中的平均编辑百分比
实施例14.使用修饰的pgRNA在人类肝细胞瘤细胞中的体外编辑
具有各种骨架序列的靶向HEK3基因组基因座中的相同靶序列的引导RNA被设计成具有如表2B中所示的上茎的截短。将gRNA脂质体转染至人类肝细胞瘤(Huh7)细胞中以如下测定编辑效率。以15,000个细胞/孔的密度接种细胞。使用LipofectamineTMMessengerMAXTM试剂(Thermofisher),并且根据制造商的方案用50ng SpyCas9 mRNA(SEQID NO:323)/反应物和初始50nM引导物浓度来制备样品。将各引导RNA 5倍连续稀释以用于6点剂量反应。分析中包括重复样品。具有标准差(SD)的平均编辑结果示出于表26和图20中。
表26.Huh7细胞中的体外编辑
实施例15.额外实施方案
以下编号项目提供对本文实施方案的额外支持和描述。
项目1为一种引导RNA(gRNA),其包含内部接头。
项目2为如项目1所述的gRNA,其中所述内部接头取代所述gRNA的至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸。
项目3为如项目1或2所述的gRNA,其中所述内部接头具有约3至30个原子、任选地12至21个原子的桥接长度,并且所述接头取代所述gRNA的至少2个核苷酸。
项目4为如项目1至3中任一项所述的gRNA,其中所述内部接头具有约6至18个原子、任选地约6至12个原子的桥接长度,并且所述接头取代所述gRNA的至少2个核苷酸。
项目5为如项目1至4中任一项所述的gRNA,其中所述内部接头取代2至12个核苷酸。
项目6为如项目1至5中任一项所述的gRNA,其中所述内部接头位于所述gRNA的重复反重复区中。
项目7为如项目1至6中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述重复反重复区的至少4个核苷酸。
项目8为如项目1至7中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述重复反重复区的多至28个核苷酸。
项目9为如项目1至8中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述重复反重复区的2、3、4、5、6、7、8、9、10、11或12个核苷酸。
项目10为如项目1至9中任一项所述的gRNA,其中所述内部接头位于所述gRNA的发夹区中。
项目11为如项目1至10中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述发夹区的至少2个核苷酸。
项目12为如项目1至11中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述发夹区的至多22个核苷酸。
项目13为如项目1至12中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述发夹区的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22个核苷酸。
项目14为如项目1至13中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述发夹区的1、2、3、4、5、6、7、8或9个碱基对。
项目15为如项目1至14中任一项所述的gRNA,其中所述内部接头位于所述gRNA的连结点区中。
项目16为如项目1至15中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述连结点区的1或2个核苷酸。
项目17为如项目1至16中任一项所述的gRNA,其中所述内部接头位于所述gRNA的第一部分与所述gRNA的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
项目18为如项目1至17中任一项所述的gRNA,其中所述内部接头桥接双链体的第一部分与双链体的第二部分,其中所述双链体包含2至10个碱基对。
项目19为如项目1至18中任一项所述的gRNA,其中所述gRNA包含两个内部接头。
项目20为如项目1至18中任一项所述的gRNA,其中所述gRNA包含三个内部接头。
项目21为如项目1至20中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头位于所述重复反重复区的第一部分与第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
项目22为如项目21所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个核苷酸。
项目23为如项目21至22中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的至少4个核苷酸。
项目24为如项目21至23中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的至多28个核苷酸。
项目25为如项目21至24中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的4至20个核苷酸。
项目26为如项目21至25中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的4至14个核苷酸。
项目27为如项目21至26中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的4至6个核苷酸。
项目28为如项目21至27中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的环或其部分。
项目29为如项目21至28中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和茎或其部分。
项目30为如项目21至27中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环的2、3或4个核苷酸。
项目31为如项目21至27中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的至少1个核苷酸。
项目32为如项目21至31中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24个核苷酸。
项目33为如项目21至32中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的至少2个核苷酸。
项目34为如项目21至32中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的1、2、3、4、5、6、7或8个核苷酸。
项目35为如项目21至32中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的1、2、3、4、5、6、7、8、9、10、11或12个碱基对。
项目36为如项目21至32中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代构成所述发夹的所述环的所有核苷酸。
项目37为如项目21至32中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代构成所述发夹的所述环和茎的所有核苷酸。
项目38为如项目1至37中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述连结点区的1或2个核苷酸。
项目39为如项目1至38中任一项所述的gRNA,其中所述内部接头取代所述gRNA的发夹。
项目40为如项目39所述的gRNA,其中所述内部接头取代所述发夹的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22个核苷酸。
项目41为如项目39至40中任一项所述的gRNA,其中所述内部接头取代所述发夹的2至22个核苷酸。
项目42为如项目39至41中任一项所述的gRNA,其中所述内部接头取代所述发夹的2至12个核苷酸。
项目43为如项目39至42中任一项所述的gRNA,其中所述内部接头取代所述发夹的2至6个核苷酸。
项目44为如项目39至43中任一项所述的gRNA,其中所述内部接头取代所述发夹的2至4个核苷酸。
项目45为如项目39至44中任一项所述的gRNA,其中所述内部接头取代所述发夹的环或其部分。
项目46为如项目39至45中任一项所述的gRNA,其中所述内部接头取代所述发夹的所述环和茎或其部分。
项目47为如项目39至46中任一项所述的gRNA,其中所述内部接头取代所述发夹的所述环的2、3、4或5个核苷酸。
项目48为如项目39至47中任一项所述的gRNA,其中所述内部接头取代所述发夹的所述环和所述发夹的茎的至少1个核苷酸。
项目49为如项目39至48中任一项所述的gRNA,其中所述内部接头取代所述发夹的所述环和所述发夹的茎的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个核苷酸。
项目50为如项目39至49中任一项所述的gRNA,其中所述内部接头取代所述发夹的所述环和所述发夹的茎的至少2个核苷酸。
项目51为如项目39至50中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的至多18个核苷酸。
项目52为如项目39至51中任一项所述的gRNA,其中所述重复反重复区中的所述内部接头取代所述发夹的所述环和所述发夹的茎的1、2、3、4、5、6、7、8或9个碱基对。
项目53为如项目39至52中任一项所述的gRNA,其中所述内部接头取代构成所述发夹的所述环的所有核苷酸。
项目54为如项目39至53中任一项所述的gRNA,其中所述内部接头取代构成所述发夹的所述环和茎的所有核苷酸。
项目55为如项目39至54中任一项所述的gRNA,其中所述发夹为发夹1。
项目56为如项目39至54中任一项所述的gRNA,其中所述发夹为发夹2。
项目57为如项目39至54中任一项所述的gRNA,其中所述发夹为发夹1,并且所述内部接头取代所述发夹1。
项目58为如项目57所述的gRNA,其中所述gRNA还包含所述发夹1的3'的发夹2。
项目59为如项目58所述的gRNA,其中所述内部接头取代所述发夹2的环的至少2个核苷酸。
项目60为如项目58或59所述的gRNA,其中所述内部接头不取代所述发夹2。
项目61为如项目1至60中任一项所述的gRNA,其还包含引导区。
项目62为如项目61所述的gRNA,其中所述引导区的长度为17、18、19或20个核苷酸。
项目63为如项目1至62中任一项所述的gRNA,其中所述gRNA为单引导RNA(sgRNA)。
项目64为如项目1至62中任一项所述的gRNA,其中所述gRNA包含tracrRNA(trRNA)。
项目65为一种引导RNA(gRNA),其中所述gRNA为单引导RNA(sgRNA),其包含引导区和所述引导区的3'的保守部分,其中所述保守部分包含重复反重复区、连结点区、发夹1区和发夹2区,并且包含以下中的至少一者:
1)第一内部接头,其取代所述重复反重复区的上茎区的至少2个核苷酸;
2)第二内部接头,其取代所述连结点区的1或2个核苷酸;和
3)第三内部接头,其取代所述发夹1的至少2个核苷酸。
项目66为如项目65所述的gRNA,其中所述sgRNA包含所述第一内部接头和所述第二内部接头。
项目67为如项目65所述的gRNA,其中所述sgRNA包含所述第一内部接头和所述第三内部接头。
项目68为如项目65所述的gRNA,其中所述sgRNA包含所述第二内部接头和所述第三内部接头。
项目69为如项目65所述的gRNA,其中所述sgRNA包含所述第一内部接头、所述第二内部接头和所述第三内部接头。
项目70为如项目65至69中任一项所述的gRNA,其中所述第一内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。
项目71为如项目65至70中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的2、3、4、5、6、7、8、9、10、11或12个核苷酸。
项目72为如项目65至71中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的环或其部分。
项目73为如项目65至72中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和茎或其部分。
项目74为如项目65至73中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环的2、3或4个核苷酸。
项目75为如项目65至74中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和所述上茎区的茎的至少2、3、4、5、6、7或8个核苷酸。
项目76为如项目65至75中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和所述上茎区的茎的1、2、3或4个碱基对。
项目77为如项目65至76中任一项所述的gRNA,其中所述第一内部接头取代构成所述上茎区的所述环的所有核苷酸。
项目78为如项目65至77中任一项所述的gRNA,其中所述第一内部接头取代构成所述上茎区的所述环和茎的所有核苷酸。
项目79为如项目65至78中任一项所述的gRNA,其中所述第二内部接头具有约6至18个原子、任选地约6至12个原子的桥接长度。
项目80为如项目65至79中任一项所述的gRNA,其中所述第二内部接头取代所述sgRNA的所述连结点区的2个核苷酸。
项目81为如项目65至80中任一项所述的gRNA,其中所述第二内部接头取代所述sgRNA的所述连结点区的环的2个核苷酸。
项目82为如项目65至81中任一项所述的gRNA,其中所述第三内部接头具有约9至30个、任选地约12至21个原子的桥接长度。
项目83为如项目65至82中任一项所述的gRNA,其中所述第三内部接头取代所述gRNA的所述发夹1的2、3、4、5、6、7、8、9、10、11或12个核苷酸。
项目84为如项目65至83中任一项所述的gRNA,其中所述第三接头取代所述gRNA的所述发夹1的1、2、3、4或5个碱基对。
项目85为如项目65至84中任一项所述的gRNA,其中所述第三内部接头取代所述发夹1的环或其部分。
项目86为如项目65至85中任一项所述的gRNA,其中所述第三内部接头取代所述发夹1的所述环和茎或其部分。
项目87为如项目65至86中任一项所述的gRNA,其中所述第三内部接头取代所述发夹1的所述环的2、3或4个核苷酸。
项目88为如项目65至87中任一项所述的gRNA,其中所述第三内部接头取代所述发夹的所述环和所述发夹1的茎的至少1个核苷酸。
项目89为如项目65至88中任一项所述的gRNA,其中所述第三内部接头取代所述发夹的所述环和所述发夹1的茎的2、4或6个核苷酸。
项目90为如项目65至89中任一项所述的gRNA,其中所述重复反重复区中的所述第三内部接头取代所述发夹的所述环和所述发夹1的茎的1、2或3个碱基对。
项目91为如项目65至90中任一项所述的gRNA,其中所述第三内部接头取代构成所述发夹1的所述环的所有核苷酸。
项目92为如项目65至91中任一项所述的gRNA,其中所述第三内部接头取代构成所述发夹1的所述环和茎的所有核苷酸。
项目93为如项目65至92中任一项所述的gRNA,其中所述sgRNA的所述发夹2区不含有任何内部接头。
项目94为如项目65至93中任一项所述的gRNA,其中所述sgRNA为化脓链球菌Cas9sgRNA。
项目95为如项目65至94中任一项所述的gRNA,其中所述sgRNA包含含有SEQ IDNO:400的序列的保守部分。
项目96为如项目95所述的gRNA,其中相对于SEQ ID NO:400,核苷酸13至16(所述上茎区的US5至US8)中的2、3或4者被所述第一内部接头取代。
项目97为如项目95至96中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸12至17(所述上茎区的US4至US9)被所述第一内部接头取代。
项目98为如项目95至97中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸11至18(所述上茎区的US3至US10)被所述第一内部接头取代。
项目99为如项目95至98中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸10至19(所述上茎区的US2至US11)被所述第一内部接头取代。
项目100为如项目95至99中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸9至20(所述上茎区的US1至US10)被所述第一内部接头取代。
项目101为如项目95至100中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸36至37(所述连结点区的N6至N7)被所述第二内部接头取代。
项目102为如项目95至101中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸53至56(所述发夹1的H1-5至H1-8)中的2、3或4者被所述第三内部接头取代。
项目103为如项目95至102中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸52至57(所述发夹1的H1-4至H1-9)被所述第三内部接头取代。
项目104为如项目95至103中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸51至58(所述发夹1的H1-3至H1-10)被所述第三内部接头取代。
项目105为如项目95至104中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸50至59(所述发夹1的H1-1至H1-12)被所述第三内部接头取代。
项目106为如项目95至105中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸77至80缺失。
项目107为如项目65至94中任一项所述的gRNA,其中所述sgRNA包含SEQ ID NO:201的序列。
项目108为如项目107所述的gRNA,其中相对于SEQ ID NO:201,核苷酸33至36中的2、3或4者被所述第一内部接头取代。
项目109为如项目107至108中任一项所述的gRNA,其中相对于SEQ ID NO:201,核苷酸32至37被所述第一内部接头取代。
项目110为如项目107至109中任一项所述的gRNA,其中相对于SEQ ID NO:201,核苷酸31至38被所述第一内部接头取代。
项目111为如项目107至110中任一项所述的gRNA,其中相对于SEQ ID NO:201,核苷酸30至39被所述第一内部接头取代。
项目112为如项目107至111中任一项所述的gRNA,其中相对于SEQ ID NO:201,核苷酸29至40被所述第一内部接头取代。
项目113为如项目107至112中任一项所述的gRNA,其中相对于SEQ ID NO:201,核苷酸55至56被所述第二内部接头取代。
项目114为如项目107至113中任一项所述的gRNA,其中相对于SEQ ID NO:201,核苷酸50至53中的2、3或4者被所述第三内部接头取代。
项目115为如项目107至114中任一项所述的gRNA,其中相对于SEQ ID NO:201,核苷酸49至54被所述第三内部接头取代。
项目116为如项目107至115中任一项所述的gRNA,其中相对于SEQ ID NO:201,核苷酸77至80缺失。
项目117为一种引导RNA(gRNA),其中所述gRNA为单引导RNA(sgRNA),其包含引导区和所述引导区的3'的保守部分,其中保守部分包含重复反重复区、发夹1区和发夹2区,并且还包含以下中的至少一者:
1)第一内部接头,其取代所述sgRNA的所述重复反重复区的上茎区的至少2个核苷酸;
2)第二内部接头,其取代所述sgRNA的所述发夹1的1或2个核苷酸;或
3)第三内部接头,其取代所述sgRNA的所述发夹2的至少2个核苷酸。
项目118为如项目117所述的gRNA,其中所述sgRNA包含所述第一内部接头和所述第二内部接头。
项目119为如项目117所述的gRNA,其中所述sgRNA包含所述第一内部接头和所述第三内部接头。
项目120为如项目117所述的gRNA,其中所述sgRNA包含所述第二内部接头和所述第三内部接头。
项目121为如项目117所述的gRNA,其中所述sgRNA包含所述第一内部接头、所述第二内部接头和所述第三内部接头。
项目122为如项目117至121中任一项所述的gRNA,其中所述第一内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。
项目123为如项目117至122中任一项所述的gRNA,其中所述第一内部接头位于所述sgRNA的第一部分与所述sgRNA的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
项目124为如项目117至123中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的2、3、4、5、6、7、8、9、10、11或12个核苷酸。
项目125为如项目117至124中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的环或其部分。
项目126为如项目117至125中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和茎或其部分。
项目127为如项目117至126中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环的2、3或4个核苷酸。
项目128为如项目117至127中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和所述上茎区的茎的至少2、4、6或8个核苷酸。
项目129为如项目117至128中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和所述上茎区的茎的1、2、3或4个碱基对。
项目130为如项目117至129中任一项所述的gRNA,其中所述第一内部接头取代构成所述上茎区的所述环的所有核苷酸。
项目131为如项目117至130中任一项所述的gRNA,其中所述第一内部接头取代构成所述上茎区的所述环和茎的所有核苷酸。
项目132为如项目117至131中任一项所述的gRNA,其中所述第二内部接头具有约6至18个原子、任选地约6至12个原子的桥接长度。
项目133为如项目117至132中任一项所述的gRNA,其中所述第二内部接头取代所述sgRNA的所述发夹1的2个核苷酸。
项目134为如项目117至133中任一项所述的gRNA,其中所述第二内部接头取代所述sgRNA的所述连结点区的茎区的2个核苷酸。
项目135为如项目117至134中任一项所述的gRNA,其中所述第三内部接头具有约9至30个、任选地约12至21个原子的桥接长度。
项目136为如项目117至135中任一项所述的gRNA,其中所述第三内部接头取代所述gRNA的所述发夹2的4、6、8、10或12个核苷酸。
项目137为如项目117至136中任一项所述的gRNA,其中所述第三接头取代所述gRNA的所述发夹2的1、2、3、4或5个碱基对。
项目138为如项目117至137中任一项所述的gRNA,其中所述第三内部接头取代所述发夹2的环或其部分。
项目139为如项目117至138中任一项所述的gRNA,其中所述第三内部接头取代所述发夹2的所述环和茎或其部分。
项目140为如项目117至139中任一项所述的gRNA,其中所述第三内部接头取代所述发夹2的所述环的2、3或4个核苷酸。
项目141为如项目117至140中任一项所述的gRNA,其中所述第三内部接头取代所述发夹的所述环和所述发夹2的茎的至少1个核苷酸。
项目142为如项目117至141中任一项所述的gRNA,其中所述第三内部接头取代所述发夹的所述环和所述发夹2的茎的2、4或6个核苷酸。
项目143为如项目117至142中任一项所述的gRNA,其中所述重复反重复区中的所述第三内部接头取代所述发夹的所述环和所述发夹2的茎的1、2或3个碱基对。
项目144为如项目117至143中任一项所述的gRNA,其中所述第三内部接头取代构成所述发夹2的所述环的所有核苷酸。
项目145为如项目117至144中任一项所述的gRNA,其中所述第三内部接头位于所述sgRNA的第一部分与所述sgRNA的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
项目146为如项目117至145中任一项所述的gRNA,其中所述gRNA为金黄色葡萄球菌Cas9(SauCas9)引导RNA,并且不包含所述第三内部接头。
项目147为如项目117至146中任一项所述的gRNA,其中所述gRNA为白喉棒状杆菌Cas9(CdiCas9)引导RNA、嗜热链球菌Cas9(St1Cas9)引导RNA或解纤维热酸菌Cas9(AceCas9)引导RNA。
项目148为如项目117至147中任一项所述的gRNA,其中所述sgRNA包含SEQ ID NO:202的序列。
项目149为如项目148所述的gRNA,其中相对于SEQ ID NO:202,核苷酸35至38中的22、3或4者被所述第一内部接头取代。
项目150为如项目148至149中任一项所述的gRNA,其中相对于SEQ ID NO:202,核苷酸34至39被所述第一内部接头取代。
项目151为如项目148至150中任一项所述的gRNA,其中相对于SEQ ID NO:202,核苷酸33至40被所述第一内部接头取代。
项目152为如项目148至151中任一项所述的gRNA,其中相对于SEQ ID NO:202,核苷酸32至41被所述第一内部接头取代。
项目153为如项目148至152中任一项所述的gRNA,其中相对于SEQ ID NO:202,核苷酸31至42被所述第一内部接头取代。
项目154为如项目148至153中任一项所述的gRNA,其中相对于SEQ ID NO:202,核苷酸61至62被所述第二内部接头取代。
项目155为如项目148至154中任一项所述的gRNA,其中相对于SEQ ID NO:202,核苷酸84至87中的2、3或4者被所述第三内部接头取代。
项目156为如项目148至155中任一项所述的gRNA,其中相对于SEQ ID NO:202,核苷酸83至88被所述第三内部接头取代。
项目157为如项目148至156中任一项所述的gRNA,其中相对于SEQ ID NO:202,核苷酸82至89被所述第三内部接头取代。
项目158为如项目148至157中任一项所述的gRNA,其中相对于SEQ ID NO:202,核苷酸81至90被所述第三内部接头取代。
项目159为如项目148至158中任一项所述的gRNA,其中相对于SEQ ID NO:202,核苷酸97至100缺失。
项目160为一种引导RNA(gRNA),其包含引导区和所述引导区的3'的保守部分,其中所述保守部分包含重复反重复区、发夹1区和发夹2区,并且包含取代所述重复反重复区的至少2个核苷酸的第一内部接头和取代所述发夹2的至少2个核苷酸的第二内部接头。
项目161为如项目160所述的gRNA,其中所述第一内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。
项目162为如项目160至161中任一项所述的gRNA,其中所述第一内部接头取代所述gRNA的所述重复反重复区的2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个核苷酸。
项目163为如项目160至162中任一项所述的gRNA,其中所述第一内部接头位于所述sgRNA的第一部分与所述重复反重复区的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
项目164为如项目160至163中任一项所述的gRNA,其中所述第一内部接头取代所述重复反重复区的所述发夹的环或其部分。
项目165为如项目160至164中任一项所述的gRNA,其中所述第一内部接头取代所述重复反重复区的所述发夹的所述环和茎或其部分。
项目166为如项目160至165中任一项所述的gRNA,其中所述第一内部接头取代所述重复反重复区的所述发夹的所述环的1、2、3或4个核苷酸。
项目167为如项目160至166中任一项所述的gRNA,其中所述第一内部接头取代所述发夹的所述环和所述重复反重复区的所述发夹的上茎的至少1、2、3、4、5、6、7、8、9、10、11、12、13或14个核苷酸。
项目168为如项目160至167中任一项所述的gRNA,其中所述第一内部接头取代所述发夹的所述环和所述重复反重复区的所述发夹的上茎的1、2、3、4、5、6或7个碱基对。
项目169为如项目160至168中任一项所述的gRNA,其中所述第一内部接头取代构成所述重复反重复区的所述发夹的所述环的所有核苷酸。
项目170为如项目160至169中任一项所述的gRNA,其中所述第一内部接头取代构成所述重复反重复区的所述发夹的所述环和上茎的所有核苷酸。
项目171为如项目160至169中任一项所述的gRNA,其中所述第一内部接头取代构成所述重复反重复区的所述环的所有核苷酸;并且所述重复反重复区的所述发夹的上茎包含至少一个碱基对,或不超过一个、两个或三个碱基对。
项目172为如项目160至171中任一项所述的gRNA,其中所述第二内部接头具有约9至30个、任选地约12至21个原子的桥接长度。
项目173为如项目160至172中任一项所述的gRNA,其中所述第二内部接头取代所述gRNA的所述发夹2的2、3、4、5、6、7、8、9或10个核苷酸。
项目174为如项目160至173中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的环区。
项目175为如项目160至174中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的环区和茎区的部分。
项目176为如项目160至175中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的环或其部分。
项目177为如项目160至176中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的所述环和茎或其部分。
项目178为如项目160至177中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的所述环的2、3或4个核苷酸。
项目179为如项目160至178中任一项所述的gRNA,其中所述第二内部接头取代构成所述发夹2的所述环的所有核苷酸。
项目180为如项目160至179中任一项所述的gRNA,其中所述第二内部接头取代所述发夹2的所述环和所述发夹2的茎的至少1、2、3、4、5或6个核苷酸。
项目181为如项目160至180中任一项所述的gRNA,其中所述第二内部接头取代所述发夹的所述环和所述发夹2的茎的1、2或3个碱基对。
项目182为如项目160至181中任一项所述的gRNA,其中所述gRNA为St1Cas9引导RNA。
项目183为如项目160至182中任一项所述的gRNA,其中所述sgRNA包含SEQ ID NO:204的序列。
项目184为如项目183所述的gRNA,其中相对于SEQ ID NO:204,核苷酸41至44被所述第一内部接头取代。
项目185为如项目183至184中任一项所述的gRNA,其中相对于SEQ ID NO:204,核苷酸101至103被所述第二内部接头取代。
项目186为如项目183至185中任一项所述的gRNA,其中相对于SEQ ID NO:204,核苷酸100至104被所述第二内部接头取代。
项目187为如项目183至186中任一项所述的gRNA,其中相对于SEQ ID NO:204,核苷酸99至105被所述第二内部接头取代。
项目188为如项目183至187中任一项所述的gRNA,其中相对于SEQ ID NO:204,核苷酸98至106被所述第二内部接头取代。
项目189为如项目183至188中任一项所述的gRNA,其中相对于SEQ ID NO:204,核苷酸94至111内的2至18个核苷酸被取代。
项目190为一种引导RNA(gRNA),其包含引导区和所述引导区的3'的保守部分,其中所述保守部分包含重复反重复区和发夹区,并且包含取代所述重复反重复区的至少2个核苷酸的内部接头。
项目191为如项目190所述的gRNA,其中所述第一内部接头具有约9至30个原子、任选地约12至21个原子的桥接长度。
项目192为如项目190或191中任一项所述的gRNA,其中所述第一内部接头取代所述gRNA的所述重复反重复区的2、3、4、5、6、7、8、9、10、11或12个核苷酸。
项目193为如项目190至192中任一项所述的gRNA,其中所述第一内部接头位于所述sgRNA的第一部分与所述重复反重复区的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
项目194为如项目190至193中任一项所述的gRNA,其中所述gRNA为空肠弯曲杆菌Cas9(CjeCas9)引导RNA。
项目195为如项目190至194中任一项所述的gRNA,其中所述gRNA为CjeCas9引导RNA,并且所述内部接头仅存在于所述gRNA的所述重复反重复区中。
项目196为如项目190至195中任一项所述的gRNA,其中所述sgRNA包含SEQ ID NO:207的序列。
项目197为如项目196所述的gRNA,其中相对于SEQ ID NO:207,核苷酸33至36被所述内部接头取代。
项目198为如项目196至197中任一项所述的gRNA,其中相对于SEQ ID NO:207,核苷酸27至32和37至42中的1、2、3、4、5或6个碱基对被所述内部接头取代。
项目199为如项目190至193中任一项所述的gRNA,其中所述gRNA为新凶手弗朗西斯氏菌Cas9(FnoCas9)引导RNA。
项目200为如项目199所述的gRNA,其中所述sgRNA包含SEQ ID NO:208的序列。
项目201为如项目200所述的gRNA,其中相对于SEQ ID NO:208,核苷酸40至43中的2、3或4者被所述内部接头取代。
项目202为如项目200至201中任一项所述的gRNA,其中相对于SEQ ID NO:208,核苷酸39至44被所述内部接头取代。
项目203为一种引导RNA(gRNA),其包含重复反重复区和取代所述重复反重复区的至少2个核苷酸的内部接头。
项目204为如项目203所述的gRNA,其中所述内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。
项目205为如项目203至204中任一项所述的gRNA,其中所述内部接头取代所述gRNA的所述重复反重复区的2、3、4、5或6个核苷酸。
项目206为如项目203至205中任一项所述的组合物,其中所述gRNA为Cpf1引导RNA。
项目207为如项目206所述的组合物,其中所述Cpf1引导RNA为毛螺菌Cpf1(LbCpf1)引导RNA或氨基酸球菌属Cpf1(AsCpf1)引导RNA。
项目208为如项目203至207中任一项所述的gRNA,其中所述sgRNA包含SEQ ID NO:209的序列,并且相对于SEQ ID NO:209,核苷酸11至14、或12至15、或任选地12至14被所述内部接头取代。
项目209为如项目203至205中任一项所述的组合物,其中所述引导RNA为惰性真杆菌(EsCas13d)引导RNA。
项目210为如项目203至205和209中任一项所述的gRNA,其中所述sgRNA包含SEQID NO:210的序列,并且相对于SEQ ID NO:210,核苷酸9至16、或任选地10至15、或其至少2个核苷酸被所述内部接头取代。
项目N211为如项目1所述的gRNA,其中所述内部接头为第一内部接头、第二内部接头或第三内部接头;并且所述gRNA包含引导区和保守区,所述保守区包含以下中的一者或多者:
(a)缩短的重复/反重复区,其中所述缩短的重复/反重复区缺乏2至24个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸37至64中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸36通过以下连接至核苷酸65:(i)第一内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;或
(b)缩短的发夹1区,其中所述缩短的发夹1缺乏2至10个、任选地2至8个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸82至95中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸81通过以下连接至核苷酸96:(i)第二内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;或
(c)缩短的发夹2区,其中所述缩短的发夹2缺乏2至18个、任选地2至16个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸113至134中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸112通过以下连接至核苷酸135:(i)第三内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;
其中与SEQ ID NO:500相比,核苷酸144至145中的一者或两者任选地缺失。
项目N212为一种引导RNA(gRNA),其包含引导区和保守区,所述保守区包含以下中的一者或多者:
(a)缩短的重复/反重复区,其中所述缩短的重复/反重复区缺乏2至24个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸37至64中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸36通过以下连接至核苷酸65:(i)第一内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;或
(b)缩短的发夹1区,其中所述缩短的发夹1缺乏2至10个、任选地2至8个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸82至95中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸81通过以下连接至核苷酸96:(i)第二内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;或
(c)缩短的发夹2区,其中所述缩短的发夹2缺乏2至18个、任选地2至16个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸113至134中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸112通过以下连接至核苷酸135:(i)第三内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;
其中与SEQ ID NO:500相比,核苷酸144至145中的一者或两者任选地缺失;
其中所述gRNA包含所述第一内部接头、所述第二内部接头和所述第三内部接头中的至少一者。
项目N213为如项目N211或N212所述的gRNA,其中所述gRNA包含所述第一内部接头、所述第二内部接头和所述第三内部接头中的至少两者。
项目N214为如项目N211至N213中任一项所述的gRNA,其中所述gRNA包含所述第一内部接头、所述第二内部接头和所述第三内部接头。
项目N215为如项目N211至N214中任一项所述的gRNA,其中至少10个核苷酸为修饰的核苷酸。
项目N216为如项目N211至N215中任一项所述的gRNA,其中所述引导区具有(i)相对于SEQ ID NO:500,位置1至24内一个核苷酸的插入或1至4个核苷酸的缺失;或(ii)24个核苷酸的长度。
项目N217为如项目N211至N216中任一项所述的gRNA,其中所述引导区具有25、24、23、22、21或20个核苷酸的长度,任选地其中所述引导区具有SEQ ID NO:500的位置1至24处的25、24、23或22个核苷酸的长度。
项目N218为如项目N217所述的gRNA,其中所述引导区具有SEQ ID NO:500的位置1至24处的23或24个核苷酸的长度。
项目N219为如项目N211至N218中任一项所述的gRNA,其中所述gRNA还包含3'尾。
项目N220为如项目N219所述的gRNA,其中所述3'尾包含1、2、3、4、5、6、7、8、9或10个核苷酸。
项目N221为如项目N220所述的gRNA,其中所述3'尾包含1、2、3、4或5个核苷酸。
项目N222为如项目N219至N221中任一项所述的gRNA,其中所述3'尾以包含尿嘧啶或修饰的尿嘧啶的核苷酸终止。
项目N223为如项目N219至N222中任一项所述的gRNA,其中所述3'尾的长度为1个核苷酸。
项目N224为如项目N219至N223中任一项所述的gRNA,其中所述3'尾由包含尿嘧啶或修饰的尿嘧啶的核苷酸组成。
项目N225为如项目N219至N224中任一项所述的gRNA,其中所述3'尾包含存在于所述3'尾中的核苷酸中的任一者或多者的修饰。
项目N226为如项目N219至N225中任一项所述的gRNA,其中所述3'尾的所述修饰为2'-O-甲基(2'-OMe)修饰的核苷酸和核苷酸之间的硫代磷酸酯(PS)键联中的一者或多者。
项目N227为如前述项目N219至N226中任一项所述的gRNA,其中所述3'尾被完全修饰。
项目N228为如项目N211至N227中任一项所述的gRNA,其中所述gRNA的3'核苷酸为包含尿嘧啶或修饰的尿嘧啶的核苷酸。
项目N229为如项目N211至N228中任一项所述的gRNA,其中相对于SEQ ID NO:500,核苷酸144和145中的一者或多者缺失。
项目N230为如项目N211至N229中任一项所述的gRNA,其中相对于SEQ ID NO:500,核苷酸144和145均缺失。
项目N231为如项目N211至N218中任一项所述的gRNA,其中所述gRNA不包含3'尾。
项目N232为如项目N211至N231中任一项所述的gRNA,其中所述缩短的重复/反重复区缺乏2至28个核苷酸。
项目N233为如项目N211至N232中任一项所述的gRNA,其中所述缩短的重复/反重复区具有24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸的长度。
项目N234为如项目N211至N233中任一项所述的gRNA,其中所述缩短的重复/反重复区缺乏12至28个、任选地18至24个核苷酸。
项目N235为如项目N211至N234中任一项所述的gRNA,其中所述缩短的重复/反重复区具有24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个核苷酸的长度。
项目N236为如项目N211至N235中任一项所述的gRNA,其中所述缩短的重复/反重复区具有24、25、26、27、28、29、30、31、32、33或34个核苷酸的长度。
项目N237为如项目N211至N236中任一项所述的gRNA,其中SEQ ID NO:500的核苷酸37至64形成上茎,并且所述缩短的重复/反重复区的上茎的一个或多个碱基对缺失。
项目N238为如项目N211至N237中任一项所述的gRNA,其中所述缩短的重复/反重复区的上茎包含不超过一个、两个、三个或四个碱基对。
项目N239为如项目N211至N238中任一项所述的gRNA,其中所述缩短的重复/反重复区的上茎的位置39至48中的所有和位置53至62中的所有缺失,并且任选地核苷酸38或63被取代。
项目N240为如项目N211至N239中任一项所述的gRNA,其中所述缩短的重复/反重复区的上茎的位置38至63中的所有缺失,并且任选地核苷酸37或64被取代。
项目N241为如项目N211至N240中任一项所述的gRNA,其中所述缩短的重复/反重复区的上茎的核苷酸37至64中的所有缺失,并且任选地核苷酸36或65被取代。
项目N242为如项目N211至N241中任一项所述的gRNA,其中所述缩短的重复/反重复区具有长度为11个碱基配对核苷酸的双链体部分。
项目N243为如项目N211至N242中任一项所述的gRNA,其中所述缩短的重复/反重复区具有单一双链体部分。
项目N244为如项目N211至N243中任一项所述的gRNA,其中相对于SEQ ID NO:500,所述缩短的重复/反重复区的上茎包含一个或多个取代。
项目N245为如项目N211至N244中任一项所述的gRNA,其中所述第一内部接头取代核苷酸49至52中的至少一部分或所有。
项目N246为如项目N211至N245中任一项所述的gRNA,其中核苷酸37至64中的所有缺失,并且所述第一接头将核苷酸36直接连接至核苷酸65。
项目N247为如项目N211至N245中任一项所述的gRNA,其中核苷酸38至63中的所有缺失,并且所述第一接头将核苷酸37直接连接至核苷酸64。
项目N248为如项目N211至N245中任一项所述的gRNA,其中核苷酸39至62中的所有缺失,并且所述第一接头将核苷酸38直接连接至核苷酸63。
项目N249为如项目N211至N248中任一项所述的gRNA,其中所述缩短的重复/反重复区具有8至22个修饰的核苷酸。
项目N250为如项目N211至N249中任一项所述的gRNA,其中所述缩短的发夹1区缺乏2至10个、任选地2至8个、或2至4个核苷酸。
项目N251为如项目N211至N250中任一项所述的gRNA,其中所述缩短的发夹1区具有9、10、11、12、13、14、15、16、17、18、19、20或21个核苷酸的长度。
项目N252为如项目N211至N251中任一项所述的gRNA,其中所述缩短的发夹1区具有长度为4至8个、任选地7至8个碱基配对核苷酸的双链体部分。
项目N253为如项目N211至N252中任一项所述的gRNA,其中所述缩短的发夹1区具有单一双链体部分。
项目N254为如项目N211至N253中任一项所述的gRNA,其中所述缩短的发夹1区的一个或两个碱基对缺失。
项目N255为如项目N211至N254中任一项所述的gRNA,其中所述缩短的发夹1区的茎的长度为七个或八个碱基配对核苷酸。
项目N256为如项目N211至N255中任一项所述的gRNA,其中所述缩短的发夹1区的位置85至86中的一者或多者和核苷酸91至92中的一者或多者缺失。
项目N257为如项目N211至N256中任一项所述的gRNA,其中所述缩短的发夹1区的核苷酸86和91缺失。
项目N258为如项目N211至N257中任一项所述的gRNA,其中相对于SEQ ID NO:500,所述缩短的发夹1区的核苷酸82至95中的一者或多者被取代。
项目N259为如项目N211至N258中任一项所述的gRNA,其中所述第二内部接头取代核苷酸87至90中的至少一部分或全部。
项目N260为如项目N211至N259中任一项所述的gRNA,其中所述第二内部接头取代核苷酸81至95中的至少一部分或。
项目N261为如项目N211至N260中任一项所述的gRNA,其中所述缩短的发夹1区具有2至15个修饰的核苷酸。
项目N262为如项目N211至N261中任一项所述的gRNA,其中所述缩短的发夹2区缺乏2至18个、任选地2至16个核苷酸。
项目N263为如项目N211至N262中任一项所述的gRNA,其中所述缩短的发夹2区具有22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39或40个核苷酸的长度。
项目N264为如项目N211至N263中任一项所述的gRNA,其中所述缩短的发夹2区具有24、25、26、27、28、29、30、31、32、33或34个核苷酸的长度。
项目N265为如项目N211至N264中任一项所述的gRNA,其中所述缩短的发夹2区的位置113至121中的一者或多者和核苷酸126至134中的一者或多者缺失。
项目N266为如项目N211至N265中任一项所述的gRNA,其中所述缩短的发夹2区包含不成对区。
项目N267为如项目N211至N266中任一项所述的gRNA,其中所述缩短的发夹2区具有两个双链体部分。
项目N268为如项目N267所述的gRNA,其中所述缩短的发夹2区具有长度为4个碱基配对核苷酸的双链体部分。
项目N269为如项目N267至N268所述的gRNA,其中所述缩短的发夹2区具有长度为4至8个碱基配对核苷酸的双链体部分。
项目N270为如项目N267至N269所述的gRNA,其中所述缩短的发夹2区具有长度为4至6个碱基配对核苷酸的双链体部分。
项目N271为如项目N211至N270中任一项所述的gRNA,其中所述缩短的发夹2区的上茎包含一个、两个、三个或四个碱基对。
项目N272为如项目N211至N271中任一项所述的gRNA,其中核苷酸113与134、核苷酸114与133、核苷酸115与132、核苷酸116与131、核苷酸117与130、核苷酸118与129、核苷酸119与128、核苷酸120与127和核苷酸121与126中的至少一对缺失。
项目N273为如项目N211至N272中任一项所述的gRNA,其中所述缩短的发夹2区的位置113至121和126至134中的所有缺失。
项目N274为如项目N211至N273中任一项所述的gRNA,其中所述缩短的发夹2区的核苷酸113至134中的一者或多者相对于SEQ ID NO:1被取代。
项目N275为如项目N211至N274中任一项所述的gRNA,其中所述第三内部接头取代核苷酸122至125中的至少一部分或所有。
项目N276为如项目N211至N275中任一项所述的gRNA,其中所述第三内部接头取代核苷酸112至135中的至少一部分或所有。
项目211为如项目1至210和N1至N276中任一项所述的gRNA,其中所述内部接头具有约6埃至37埃的桥接长度。
项目212为如项目1至211中任一项所述的gRNA,其中所述内部接头包含至少两个彼此共价连接的乙二醇亚基。
项目213为如项目1至212中任一项所述的gRNA,其中所述内部接头包含1至10个彼此共价连接的乙二醇亚基。
项目214为如项目1至213中任一项所述的gRNA,其中所述内部接头包含3至10个彼此共价连接的乙二醇亚基。
项目215为如项目1至214中任一项所述的gRNA,其中所述内部接头包含3至6个彼此共价连接的乙二醇亚基。
项目216为如项目1至215中任一项所述的gRNA,其中所述内部接头包含3个彼此共价连接的乙二醇亚基。
项目217为如项目1至216中任一项所述的gRNA,其中所述内部接头包含6个彼此共价连接的乙二醇亚基。
项目218为如项目1至217中任一项所述的gRNA,其中所述内部接头包含式(I)的结构:
~-L0-L1-L2-#
(I)
其中:
~指示连至前一核苷酸的3'取代基的键;
#指示连至后一核苷酸的5'取代基的键;
L0为空值或C1-3脂族基;
L1为-[E1-(R1)]m-,其中
各R1独立地为任选地被1或2个E2取代的C1-5脂族基团,
各E1和E2独立地为氢键受体,或各自独立地选自环烃和杂环烃,并且
各m为1、2、3、4、5、6、7、8、9或10;并且
L2为空值、C1-3脂族基,或为氢键受体。
项目219为如项目218所述的gRNA,其中m为6、7、8、9或10。
项目220为如项目218至219中任一项所述的gRNA,其中m为1、2、3、4或5。
项目221为如项目218至220中任一项所述的gRNA,其中m为1、2或3。
项目222为如项目218至221中任一项所述的gRNA,其中L0为空值。
项目223为如项目218至221中任一项所述的gRNA,其中L0为-CH2-或-CH2CH2-。
项目224为如项目218至223中任一项所述的gRNA,其中L2为空值。
项目225为如项目218至223中任一项所述的gRNA,其中L2为-O-、-S-、-CH2-或-CH2CH2-。
项目226为如项目218至225中任一项所述的gRNA,其中所述式(I)结构中~至#的路径上的最短原子链中的原子数目为30或更小、27或更小、24或更小、21或更小,或为18或更小,或为15或更小,或为12或更小,或为10或更小。
项目227为如项目218至226中任一项所述的gRNA,其中所述式(I)结构中~至#的路径上的最短原子链中的原子数目为6至30、任选地9至30、任选地9至21。
项目228为如项目218至227中任一项所述的gRNA,其中所述式(I)结构中~至#的路径上的最短原子链中的原子数目为9。
项目229为如项目218至227中任一项所述的gRNA,其中所述式(I)结构中~至#的路径上的最短原子链中的原子数目为18。
项目230为如项目218至229中任一项所述的gRNA,其中各C1-3脂族基团和C1-5脂族基团为饱和的。
项目231为如项目218至229中任一项所述的gRNA,其中至少一个C1-5脂族基团为C1-4亚烷基,或其中至少两个C1-5脂族基团为C1-4亚烷基,或其中至少三个C1-5脂族基团为C1-4亚烷基。
项目232为如项目218至231中任一项所述的gRNA,其中至少一个R1选自-CH2-、-CH2CH2-、-CH2CH2CH2-或-CH2CH2CH2CH2-。
项目233为如项目218至231中任一项所述的gRNA,其中各R1独立地选自-CH2-、-CH2CH2-、-CH2CH2CH2-或-CH2CH2CH2CH2-。
项目234为如项目218至233中任一项所述的gRNA,其中各R1为-CH2CH2-。
项目235为如项目218至234中任一项所述的gRNA,其中至少一个C1-5脂族基团为C1-4亚烯基,或其中至少两个C1-5脂族基团为C1-4亚烯基,或其中至少三个C1-5脂族基团为C1-4亚烯基。
项目236为如项目218至235中任一项所述的gRNA,其中至少一个R1选自-CHCH-、-CHCHCH2-或-CH2CHCHCH2-。
项目237为如项目218至236中任一项所述的gRNA,其中各E1独立地选自-O-、-S-、-NH-、-NR-、-C(O)-O-、-OC(O)O-、-C(O)-NR-、-OC(O)-NR-、-NC(O)-NR-、-P(O)2O-、-OP(O)2O-、-OP(R)(O)O-、-OP(O)(S)O-、-S(O)2-、环烃和杂环烃。
项目238为如项目218至237中任一项所述的gRNA,其中各E1独立地选自-O-、-S-、-NH-、-NR-、-C(O)-O-、-OC(O)O-、-P(O)2O-、-OP(O)2O-和-OP(R)(O)O。
项目239为如项目218至238中任一项所述的gRNA,其中各E1为-O-。
项目240为如项目218至238中任一项所述的gRNA,其中各E1为-S-。
项目241为如项目218至240中任一项所述的gRNA,其中R1中的至少一个C1-5脂族基团任选地被一个E2取代。
项目242为如项目218至241中任一项所述的gRNA,其中各E2独立地选自-OH、-OR、-ROR、-SH、-SR、-C(O)-R、-C(O)-OR、-OC(O)-OR、-C(O)-H、-C(O)-OH、-OPO3、-PO3、-RPO3、-S(O)2-R、-S(O)2-OR、-RS(O)2-R、-RS(O)2-OR、-SO3、环烃和杂环烃。
项目243为如项目218至242中任一项所述的gRNA,其中各E2独立地选自-OH、-OR、-SH、-SR、-C(O)-R、-C(O)-OR、-OC(O)-OR、-OPO3、-PO3、-RPO3和-SO3。
项目244为如项目218至243中任一项所述的gRNA,其中各E2为-OH或OR。
项目245为如项目218至243中任一项所述的gRNA,其中各E2为-SH或SR。
项目246为如项目218至245中任一项所述的gRNA,其中所述内部接头包含PEG-接头。
项目247为如项目218至246中任一项所述的gRNA,其中所述内部接头包含具有1至10个乙二醇单元的PEG-接头。
项目248为如项目218至247中任一项所述的gRNA,其中所述内部接头包含具有3至6个乙二醇单元的PEG-接头。
项目249为如项目218至248中任一项所述的gRNA,其中所述内部接头包含具有3个乙二醇单元的PEG-接头。
项目250为如项目218至248中任一项所述的gRNA,其中所述内部接头包含具有6个乙二醇单元的PEG-接头。
项目251为如项目1至250中任一项所述的gRNA,其中所述gRNA为包含缩短的保守部分的短引导RNA,并且所述内部接头取代至少2、3、4、5、6、7、8、9、10、11或12个核苷酸。
项目252为如前述项目中任一项所述的gRNA,其中所述gRNA为包含sgRNA的保守部分的短单引导RNA(短sgRNA),所述保守部分包含发夹区,其中所述发夹区缺乏至少5至10个核苷酸。
项目253为如前述项目中任一项所述的gRNA,其中所述至少5至10个所缺乏核苷酸为连续的。
项目254为如前述项目中任一项所述的gRNA,其中所述至少5至10个所缺乏核苷酸
i.位于发夹1内;
ii.位于发夹1内和发夹1与发夹2之间的“N”;
iii.位于发夹1内和紧邻发夹1的3'的两个核苷酸;
iv.包含发夹1的至少一部分;
v.位于发夹2内;
vi.包含发夹2的至少一部分;
vii.位于发夹1和发夹2内;
viii.包含发夹1的至少一部分并且包含发夹1与发夹2之间的“N”;
ix.包含发夹2的至少一部分并且包含发夹1与发夹2之间的“N”;
x.包含发夹1的至少一部分,包含发夹1与发夹2之间的“N”,并且包含发夹2的至少一部分;
xi.位于发夹1或发夹2内,任选地包含发夹1与发夹2之间的“N”;
xii.为连续的;
xiii.为连续的并且包含发夹1与发夹2之间的“N”;
xiv.为连续的并且跨越发夹1的至少一部分和发夹2的一部分;
xv.为连续的并且跨越发夹1的至少一部分和发夹1与发夹2之间的“N”;或
xvi.为连续的并且跨越发夹1的至少一部分和紧邻发夹1的3'的两个核苷酸。
项目255为如前述项目中任一项所述的gRNA,其中所述gRNA为包含sgRNA的保守部分的短单引导RNA(短sgRNA),所述保守部分包含发夹区,其中所述发夹区缺乏至少5至10个核苷酸,并且其中所述短sgRNA包含5'端修饰或3'端修饰。
项目256为如前述项目中任一项所述的gRNA,其中所述至少5至10个核苷酸包含SEQ ID NO:400的核苷酸54至61、SEQ ID NO:400的核苷酸53至60;或SEQ ID NO:400的核苷酸54至58,任选地其中所述短sgRNA包含至少H1-1至H1-5和H2-1至H2-12的修饰。
项目257为如前述项目中任一项所述的gRNA,其包含缩短的发夹1区或取代且任选地缩短的发夹1区,其中
(i)以下核苷酸对中的至少一者在所述取代且任选地缩短的发夹1中被沃森-克里克配对核苷酸取代:H1-1与H1-12、H1-2与H1-11、H1-3与H1-10或H1-4与H1-9,并且所述发夹1区任选地缺乏
(aa)H1-5至H1-8中的任一者或两者,
(bb)以下核苷酸对中的一者、两者或三者:H1-1与H1-12、H1-2与H1-11、H1-3与H1-10或H1-4与H1-9,或
(cc)所述发夹1区的1至8个核苷酸;或
(ii)所述缩短的发夹1区缺乏6至8个核苷酸,优选地6个核苷酸;并且
(A)相对于SEQ ID NO:400,位置H1-1、H1-2或H1-3中的一者或多者缺失或被取代,或
(B)相对于SEQ ID NO:400,位置H1-6至H1-10中的一者或多者被取代;或
(iii)相对于SEQ ID NO:400,所述缩短的发夹1区缺乏5至10个核苷酸、优选地5至6个核苷酸,并且位置N18、H1-12或n中的一者或多者被取代。
项目258为如前述项目中任一项所述的gRNA,其包含缩短的上茎区,其中相对于SEQ ID NO:400,所述缩短的上茎区缺乏1至6个核苷酸,并且其中所述缩短的上茎区的6、7、8、9、10或11个核苷酸包含少于或等于4个取代。
项目259为如前述项目中任一项所述的gRNA,其在LS6、LS7、US3、US10、B3、N7、N15、N17、H2-2和H2-14中的任一者或多者处包含相对于SEQ ID NO:400的取代,其中所述被取代核苷酸既不为后接腺嘌呤的嘧啶,也不为前接嘧啶的腺嘌呤。
项目260为如前述项目中任一项所述的gRNA,其包含上茎区,其中上茎修饰包含所述上茎区中的US1至US12中的任一者或多者的修饰。
项目261为如前述项目中任一项所述的gRNA,其包含缩短的上茎区,其中所述缩短的上茎区缺乏1至6个核苷酸。
项目262为如前述项目中任一项所述的gRNA,其中所述gRNA包含修饰。
项目263为如项目262的引导RNA,其中所述修饰包含2'-O-甲基(2'-O-Me)修饰的核苷酸、2'-F修饰的核苷酸、2'-H修饰的核苷酸(DNA)、2'-O,4'-C-亚乙基修饰的核苷酸(ENA)、锁定核苷酸(LNA)或非锁定核苷酸(UNA)。
项目264为如项目262或263的引导RNA,其中所述修饰包含核苷酸之间的硫代磷酸酯(PS)键。
项目265为如项目262至264中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的5'端处的五个核苷酸中的一者或多者处的修饰。
项目266为如项目262至265中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的3'端处的五个核苷酸中的一者或多者处的修饰。
项目267为如项目262至266中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的5'端处的四个核苷酸中的每一者之间的PS键。
项目268为如项目262至267中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的3'端处的四个核苷酸中的每一者之间的PS键。
项目269为如项目262至268中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的5'端处的前三个核苷酸中的每一者处的2'-O-Me修饰的核苷酸。
项目270为如项目262至269中任一项所述的引导RNA,其中所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的3'端处的最后三个核苷酸中的每一者处的2'-O-Me修饰的核苷酸。
项目271为如前述项目中任一项所述的gRNA,其中所述gRNA包含3'尾。
项目272为如项目271所述的gRNA,其中所述3'尾包含至少1至10个核苷酸。
项目273为如项目271至272中任一项所述的gRNA,其中所述3'尾以具有尿嘧啶碱基的核苷酸终止。
项目274为如项目271至273中任一项所述的gRNA,其中所述3'尾的长度为1个核苷酸并且为具有尿嘧啶碱基的核苷酸。
项目275为如前述项目中任一项所述的gRNA,其中所述gRNA的3'核苷酸为具有尿嘧啶碱基的核苷酸。
项目276为如项目271至274中任一项所述的gRNA,其中所述3'尾包含存在于所述3'尾中的核苷酸中的任一者或多者的修饰。
项目277为如项目276所述的gRNA,其中所述3'尾被完全修饰。
项目278为如项目1至270中任一项所述的gRNA,其中所述gRNA不包含3'尾。
项目279为如前述项目中任一项所述的gRNA,其中所述gRNA包含3'端修饰。
项目280为如前述项目中任一项所述的gRNA,其中所述gRNA包含5'端修饰和3'端修饰。
项目281为如项目279至280中任一项所述的gRNA,其中所述3'或5'端修饰包含保护性端修饰,任选地为选自以下的修饰的核苷酸:2'-O-甲基(2'-OMe)修饰的核苷酸、2'-O-(2-甲氧基乙基)(2'-O-moe)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联、反向无碱基修饰的核苷酸或其组合。
项目282为如项目279至281中任一项所述的gRNA,其中所述3'或5'端修饰包含或还包含2'-O-甲基(2'-Ome)修饰的核苷酸。
项目283为如项目279至282中任一项所述的gRNA,其中所述3'或5'端修饰包含或还包含2'-氟(2'-F)修饰的核苷酸。
项目284为如项目279至283中任一项所述的gRNA,其中所述3'或5'端修饰包含或还包含核苷酸之间的硫代磷酸酯(PS)键联。
项目285为如项目279至284中任一项所述的gRNA,其中所述3'或5'端修饰包含或还包含反向无碱基修饰的核苷酸。
项目286为如前述项目中任一项所述的gRNA,其包含发夹区或所述发夹区中的修饰。
项目287为如项目286的gRNA,其包含所述发夹区中的修饰,其中所述发夹区中的所述修饰包含选自以下的修饰的核苷酸:2'-O-甲基(2'-Ome)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸之间的硫代磷酸酯(PS)键联或其组合。
项目288为如项目286或287的gRNA,其还包含3'端修饰。
项目289为如项目286或287的gRNA,其还包含3'端修饰和5'端修饰。
项目290为如项目286或287的gRNA,其还包含5'端修饰。
项目291为如项目286至290中任一项所述的gRNA,其中所述发夹区中的所述修饰包含或还包含2'-O-甲基(2'-Ome)修饰的核苷酸。
项目292为如项目286至291中任一项所述的gRNA,其中所述发夹区中的所述修饰包含或还包含2'-氟(2'-F)修饰的核苷酸。
项目293为如前述项目中任一项所述的gRNA,其包含上茎区或所述上茎区中的修饰。
项目294为如项目293所述的gRNA,其中上茎修饰包含以下中的任一者或多者:
i.所述上茎区中的US1至US12中的任一者或多者的修饰;和
ii.所述上茎区中的至少1、2、3、4、5、6、7、8、9、10、11或所有12个核苷酸的修饰。
项目295为如项目293所述的gRNA,其中所述上茎修饰包含以下中的一者或多者:
i.2'-OMe修饰的核苷酸;
ii.2'-O-moe修饰的核苷酸;
iii.2'-F修饰的核苷酸;
iv.2'-H修饰的核苷酸(DNA);
v.2'-O,4'-C-亚乙基修饰的核苷酸(ENA);
vi.锁定核苷酸(LNA);
vii.非锁定核苷酸(UNA);和
viii.(i.)至(iii.)中的一者或多者的组合。
项目296为如前述项目中任一项所述的gRNA,其中所述修饰包含YA修饰。
项目297为如前述项目中任一项所述的gRNA,其包含一个或多个引导区YA位点的YA修饰。
项目298为如项目296至297中任一项所述的gRNA,其中所述YA修饰包含YA位点的嘧啶被非嘧啶的取代。
项目299为如项目296至297中任一项所述的gRNA,其中所述YA修饰包含YA位点的腺嘌呤被非腺嘌呤的取代。
项目300为如项目296至298中任一项所述的gRNA,其包含YA修饰,其中所述修饰包含2'-氟、2'-H、2'-OMe、ENA、UNA、肌苷或PS修饰。
项目301为如前述项目中任一项所述的gRNA,其包含一个或多个保守区YA位点的YA修饰。
项目302为如前述项目中任一项所述的gRNA,其中所述YA修饰包含
(i)2'-OMe修饰,任选地属于所述YA位点的嘧啶;
(ii)2'-氟修饰,任选地属于所述YA位点的嘧啶;或
(iii)PS修饰,任选地属于所述YA位点的嘧啶。
项目303为如项目61至302中任一项所述的gRNA,其包含与SEQ ID NO:1-8、20-75、101-108和120-175中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列。
项目304为如项目61至303中任一项所述的gRNA,其包含与SEQ ID No:1-8、20-75、101-108和120-175中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列,其中与表2A中的参考序列标识符的核苷酸对应的所述gRNA的各核苷酸处的修饰与表2B中的参考序列标识符中所示的修饰相同或等同。
项目305为一种引导RNA(gRNA),其包含SEQ ID NO:1-8和20-75中的任一者。
项目306为如前述项目中任一项所述的gRNA,其包含针对表2A或表2B中的引导RNA所阐述的修饰。
项目307为一种引导RNA(gRNA),其包含SEQ ID NO:101-108和120-175中的任一者,包含表2A或表2B的修饰。
项目308为如前述项目中任一项所述的gRNA,其中所述gRNA与脂质纳米颗粒(LNP)缔合。
项目309为一种组合物,其包含如前述项目中任一项所述的gRNA。
项目310为一种LNP组合物,其包含如项目1至308中任一项所述的gRNA。
项目311为一种LNP组合物,其包含如项目63至116和211至308中任一项所述的gRNA和编码SpyCas9的mRNA。
项目312为一种LNP组合物,其包含如项目117至159和211至308中任一项所述的gRNA和编码SauCas9的mRNA。
项目313为一种LNP组合物,其包含如项目160至189和211至308中任一项所述的gRNA和编码St1Cas9的mRNA。
项目314为一种LNP组合物,其包含如项目190至202和211至308中任一项所述的gRNA和编码CjeCas9或FnoCas9的mRNA。
项目315为一种LNP组合物,其包含如项目203至308中任一项所述的gRNA和编码AsCpf1、LbCpf1或EsCas13d的mRNA。
项目316为如项目310至315中任一项所述的LNP组合物,其中所述LNP包含十八碳-9,12-二烯酸(9z,12z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯或8-((7,7-双(辛氧基)庚基)(2-羟乙基)氨基)辛酸壬酯。
项目317为如项目310至316中任一项所述的组合物,其中所述LNP包含摩尔比为约4.5至6.5的阳离子脂质胺与RNA磷酸酯(N:P),任选地约6.0的N:P。
项目318为如项目309至317所述的组合物,其中所述核酸酶包含蛋白质或编码所述核酸酶的核酸。
项目319为如项目318所述的组合物,其中所述核酸酶为Cas核酸酶。
项目320为如项目319所述的组合物,其中所述Cas核酸酶为Cas9。
项目321为如项目320所述的组合物,其中所述Cas9为化脓链球菌Cas9(SpyCas9)。
项目322为如项目320所述的组合物,其中所述Cas9为金黄色葡萄球菌Cas9(SauCas9)。
项目323为如项目320所述的组合物,其中所述Cas9为白喉棒状杆菌Cas9(CdiCas9)。
项目324为如项目320所述的组合物,其中所述Cas9为嗜热链球菌Cas9(St1Cas9)。
项目325为如项目320所述的组合物,其中所述Cas9为解纤维热酸菌Cas9(AceCas9)。
项目326为如项目320所述的组合物,其中所述Cas9为空肠弯曲杆菌Cas9(CjeCas9)。
项目327为如项目320所述的组合物,其中所述Cas9为沼泽红假单胞菌Cas9(RpaCas9)。
项目328为如项目320所述的组合物,其中所述Cas9为深红红螺菌Cas9(RruCas9)。
项目329为如项目320所述的组合物,其中所述Cas9为纳士放线菌Cas9(AnaCas9)。
项目330为如项目320所述的组合物,其中所述Cas9为新凶手弗朗西斯氏菌Cas9(FnoCas9)。
项目330.1为如项目320所述的组合物,其中所述Cas蛋白为脑膜炎双球菌Cas9(NmeCas9)。
项目331为如项目319所述的组合物,其中所述Cas核酸酶为Cpf1。
项目332为如项目331所述的组合物,其中所述Cpf1为毛螺菌Cpf1(LbCpf1),或所述Cpf1为氨基酸球菌属Cpf1(AsCpf1)。
项目333为如项目319所述的组合物,其中所述Cas蛋白为惰性真杆菌Cas13d(EsCas13d)。
项目334为如项目311至329中任一项所述的组合物,其中所述核酸酶为裂解酶、切口酶或无催化活性的核酸酶,或为包含脱氨酶的融合蛋白。
项目335为如项目311至334中任一项所述的组合物,其中所述核酸酶修饰的。
项目336为如前一项目所述的组合物,其中所述修饰的核酸酶包含核定位信号(NLS)。
项目337为如项目311至336所述的组合物,其中编码所述核酸酶的所述核酸选自:
a.DNA编码序列;
b.具有开放阅读框架(ORF)的mRNA;
c.表达载体中的编码序列;
d.病毒载体中的编码序列。
项目338为如前一项目所述的组合物,其中所述mRNA包含SEQ ID NO:321-323中任一者的序列。
项目339为一种药物制剂,其包含如项目1至308中任一项所述的gRNA或如项目309至338中任一项所述的组合物和药学上可接受的载剂。
项目340为一种修饰靶DNA的方法,其包括将以下中的任一者或多者递送至细胞:
i.如项目1至308中任一项所述的gRNA;
ii.如项目309至338中任一项所述的组合物;和
iii.如项目339所述的药物制剂。
项目341为如项目340所述的方法,其中所述gRNA包含不超过110、115、110、105、100、95、90、85、80、75、70、65、60、55、50、45或40个核苷酸。
项目342为如项目1至308中任一项所述的gRNA、如项目309至338所述的组合物、或如项目340所述的药物制剂,其用于制备供治疗疾病或病症所用的药剂。
项目343为如项目1至308中任一项所述的gRNA、如项目309至338所述的组合物或如项目340所述的药物制剂用于制造供治疗疾病或病症所用的药剂的用途。
项目344为一种化学合成的gRNA,其包含内部接头。
项目345为一种组合物,其包含如项目1至308中任一项所述的gRNA,其中所述组合物不包含所述gRNA的非连接部分。
项目346为一种固体载体,其共价连接至如项目1至308中任一项所述的gRNA的接头。
项目347为一种合成包含内部接头的gRNA的方法,其中所述方法为单合成过程。
项目348为一种合成gRNA的方法,其中内部接头在合成期间在线并入。
项目349为一种合成gRNA的方法,其使用一系列连续偶合反应,其中所述反应包括:
a)用于第一核苷酸与第二核苷酸的共价连接的偶合反应;
b)用于内部接头与所述第二核苷酸的共价连接的偶合反应;和
c)用于第三核苷酸与所述内部接头的共价连接的偶合反应,
其中用于所述共价连接的偶合反应全部相同。
项目350为如项目349所述的方法,其中使用亚磷酰胺化学方法进行共价连接。
项目351为如前述项目中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述gRNA为化学合成的。
项目352为如前述项目中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述内部接头在所述gRNA的化学合成期间经由偶合反应并入所述gRNA中。
项目353为如前述项目中任一项所述的gRNA、组合物、制剂、方法或用途,其通过包括添加所述内部接头的过程,通过使包含亚磷酰胺部分的接头与核苷残基反应来制备。
项目354为如前一项目所述的gRNA、组合物、制剂、方法或用途,其中所述过程还包括使包含亚磷酰胺部分的核苷酸与所述接头反应。
项目355为如前述项目中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述内部接头通过磷酸二酯或硫代磷酸酯键共价接合至相邻核苷酸。
项目356为如前述项目中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述内部接头中不存在尿素。
项目357为如前述项目中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述内部接头不位于所述gRNA的所述重复反重复区中。
项目358为如前述项目中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述gRNA包含不位于所述引导物的重复反重复中的内部接头。
项目359为如前述项目中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述gRNA为sgRNA。
项目360为如前述项目中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述内部接头桥接双链体区并取代2至12个核苷酸。
项目361为如前述项目中任一项所述的gRNA、组合物、制剂、方法或用途,其中所述gRNA在单合成中制得。
Claims (168)
1.一种引导RNA(gRNA),其包含内部接头。
2.如权利要求1所述的gRNA,其中所述内部接头具有约3至30个原子、任选地12至21个原子的桥接长度,并且所述接头取代所述gRNA的至少2个核苷酸。
3.如权利要求1或2所述的gRNA,其中所述内部接头具有约6至18个原子、任选地约6至12个原子的桥接长度,并且所述接头取代所述gRNA的至少2个核苷酸。
4.如权利要求1至3中任一项所述的gRNA,其中所述内部接头取代2至12个核苷酸。
5.如权利要求1至4中任一项所述的gRNA,其中所述内部接头位于所述gRNA的重复反重复区中。
6.如权利要求1至5中任一项所述的gRNA,其中所述内部接头取代所述gRNA的重复反重复区的至少4个核苷酸。
7.如权利要求1至6中任一项所述的gRNA,其中所述内部接头取代所述gRNA的重复反重复区的多至28个核苷酸。
8.如权利要求1至7中任一项所述的gRNA,其中所述内部接头位于所述gRNA的发夹区中。
9.如权利要求1至8中任一项所述的gRNA,其中所述内部接头位于所述gRNA的连结点区中。
10.如权利要求1至9中任一项所述的gRNA,其中所述内部接头位于所述gRNA的第一部分与所述gRNA的第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
11.如权利要求1至10中任一项所述的gRNA,其中所述重复反重复区中的内部接头位于所述重复反重复区的第一部分与第二部分之间的发夹中,其中所述第一部分和所述第二部分一起形成双链体部分。
12.如权利要求1至11中任一项所述的gRNA,其中所述内部接头取代所述gRNA的发夹。
13.如权利要求1至12中任一项所述的gRNA,其中所述gRNA为单引导RNA(sgRNA)。
14.一种引导RNA(gRNA),其中所述gRNA为单引导RNA(sgRNA),其包含引导区和所述引导区的3'的保守部分,其中所述保守部分包含重复反重复区、连结点区、发夹1区和发夹2区,并且包含以下中的至少一者:
4)第一内部接头,其取代所述重复反重复区的上茎区的至少2个核苷酸;
5)第二内部接头,其取代所述连结点区的1或2个核苷酸;和
6)第三内部接头,其取代所述发夹1的至少2个核苷酸。
15.如权利要求14所述的gRNA,其中所述第一内部接头具有约9至30个原子、任选地约15至21个原子的桥接长度。
16.如权利要求14或权利要求15所述的gRNA,其中所述第一内部接头取代所述上茎区的环或其部分。
17.如权利要求14至16中任一项所述的gRNA,其中所述第一内部接头取代所述上茎区的所述环和茎,或其部分。
18.如权利要求14至17中任一项所述的gRNA,其中所述第一内部接头取代构成所述上茎区的所述环的所有核苷酸。
19.如权利要求14至18中任一项所述的gRNA,其中所述第一内部接头取代构成所述上茎区的所述环和茎的所有核苷酸。
20.如权利要求14至19中任一项所述的gRNA,其中所述第二内部接头具有约6至18个原子、任选地约6至12个原子的桥接长度。
21.如权利要求14至20中任一项所述的gRNA,其中所述第三内部接头具有约9至30个、任选地约12至21个原子的桥接长度。
22.如权利要求14至21中任一项所述的gRNA,其中所述第三内部接头取代所述发夹1的环或其部分。
23.如权利要求14至21中任一项所述的gRNA,其中所述第三内部接头取代所述发夹1的所述环和茎或其部分。
24.如权利要求14至23中任一项所述的gRNA,其中所述第三内部接头取代构成所述发夹1的所述环的所有核苷酸。
25.如权利要求14至23中任一项所述的gRNA,其中所述第三内部接头取代构成所述发夹1的所述环和茎的所有核苷酸。
26.如权利要求14至25中任一项所述的gRNA,其中所述sgRNA的所述发夹2区不含有任何内部接头。
27.如权利要求14至26中任一项所述的gRNA,其中所述sgRNA为化脓链球菌Cas9sgRNA。
28.如权利要求14至27中任一项所述的gRNA,其中所述sgRNA包含含有SEQ ID NO:400的序列的保守部分。
29.如权利要求28所述的gRNA,其中
1)相对于SEQ ID NO:400,核苷酸13至16(所述上茎区的US5至US8)中的2、3或4者被所述第一内部接头取代;
2)相对于SEQ ID NO:400,核苷酸12至17(所述上茎区的US4至US9)被所述第一内部接头取代;
3)相对于SEQ ID NO:400,核苷酸11至18(所述上茎区的US3至US10)被所述第一内部接头取代;
4)相对于SEQ ID NO:400,核苷酸10至19(所述上茎区的US2至US11)被所述第一内部接头取代;或
5)相对于SEQ ID NO:400,核苷酸9至20(所述上茎区的US1至US12)被所述第一内部接头取代。
30.如权利要求28或29所述的gRNA,
1)其中相对于SEQ ID NO:400,核苷酸36至37(所述连结点区的N6至N7)被所述第二内部接头取代;
2)其中相对于SEQ ID NO:400,核苷酸53至56(所述发夹1的H1-5至H1-8)中的2、3或4者被所述第三内部接头取代;
3)其中相对于SEQ ID NO:400,核苷酸52至57(所述发夹1的H1-4至H1-9)被所述第三内部接头取代;
4)其中相对于SEQ ID NO:400,核苷酸51至58(所述发夹1的H1-3至H1-10)被所述第三内部接头取代;或
5)其中相对于SEQ ID NO:400,核苷酸50至59(所述发夹1的H1-1至H1-12)被所述第三内部接头取代。
31.如权利要求28至30中任一项所述的gRNA,其中相对于SEQ ID NO:400,核苷酸77至80缺失。
32.如权利要求14至27中任一项所述的gRNA,其中所述sgRNA包含SEQ ID NO:201的序列。
33.如权利要求32所述的gRNA,其中
1)相对于SEQ ID NO:201,核苷酸33至36中的2、3或4者被所述第一内部接头取代;
2)相对于SEQ ID NO:201,核苷酸32至37被所述第一内部接头取代;
3)相对于SEQ ID NO:201,核苷酸31至38被所述第一内部接头取代;
4)相对于SEQ ID NO:201,核苷酸30至39被所述第一内部接头取代;或
5)相对于SEQ ID NO:201,核苷酸29至40被所述第一内部接头取代。
34.如权利要求32或33所述的gRNA,其中
1)相对于SEQ ID NO:201,核苷酸55至56被所述第二内部接头取代;
2)相对于SEQ ID NO:201,核苷酸50至53中的2、3或4者被所述第三内部接头取代;
3)相对于SEQ ID NO:201,核苷酸49至54被所述第三内部接头取代。
35.如权利要求32至34中任一项所述的gRNA,其中相对于SEQ ID NO:201,核苷酸77至80缺失。
36.如权利要求1所述的gRNA,其中所述内部接头为第一内部接头、第二内部接头或第三内部接头;并且所述gRNA包含引导区和保守区,所述保守区包含以下中的一者或多者:
(a)缩短的重复/反重复区,其中所述缩短的重复/反重复区缺乏2至24个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸37至64中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸36通过以下连接至核苷酸65:(i)第一内部接头,
其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;
或
(b)缩短的发夹1区,其中所述缩短的发夹1缺乏2至10个、任选地2至8个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸82至95中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸81通过以下连接至核苷酸96:(i)第二内部接头,
其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;
或
(c)缩短的发夹2区,其中所述缩短的发夹2缺乏2至18个、任选地2至16个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸113至134中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸112通过以下连接至核苷酸135:(i)第三内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;
其中与SEQ ID NO:500相比,核苷酸144至145中的一者或两者任选地缺失。
37.一种引导RNA(gRNA),其包含引导区和保守区,所述保守区包含以下中的一者或多者:
(a)缩短的重复/反重复区,其中所述缩短的重复/反重复区缺乏2至24个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸37至64中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸36通过以下连接至核苷酸65:(i)第一内部接头,
其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;
或
(b)缩短的发夹1区,其中所述缩短的发夹1缺乏2至10个、任选地2至8个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸82至95中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸81通过以下连接至核苷酸96:(i)第二内部接头,
其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;
或
(c)缩短的发夹2区,其中所述缩短的发夹2缺乏2至18个、任选地2至16个核苷酸,其中
(i)相对于SEQ ID NO:500,核苷酸113至134中的一者或多者缺失且任选地被取代;并且
(ii)核苷酸112通过以下连接至核苷酸135:(i)第三内部接头,其单独或与核苷酸组合取代4个核苷酸,或(ii)至少4个核苷酸;
其中与SEQ ID NO:500相比,核苷酸144至145中的一者或两者任选地缺失;
其中所述gRNA包含所述第一内部接头、所述第二内部接头和所述第三内部接头中的至少一者。
38.如权利要求36或权利要求37所述的gRNA,其中至少10个核苷酸为修饰的核苷酸。
39.如权利要求36至38中任一项所述的gRNA,其中所述引导区具有(i)相对于SEQ IDNO:500,位置1至24内一个核苷酸的插入或1至4个核苷酸的缺失;或(ii)24个核苷酸的长度。
40.如权利要求36至39中任一项所述的gRNA,其中所述引导区具有23或24个核苷酸的长度,在SEQ ID NO:500的位置1至24。
41.如权利要求36至40中任一项所述的gRNA,其中相对于SEQ ID NO:500,核苷酸144和145中的一者或多者缺失。
42.如权利要求36至41中任一项所述的gRNA,其中相对于SEQ ID NO:500,核苷酸144和145均缺失。
43.如权利要求36至42中任一项所述的gRNA,其中所述缩短的重复/反重复区缺乏2至28个核苷酸。
44.如权利要求36至43中任一项所述的gRNA,其中所述缩短的重复/反重复区缺乏12至28个、任选地18至24个核苷酸。
45.如权利要求36至44中任一项所述的gRNA,其中SEQ ID NO:500的核苷酸37至64形成上茎,并且所述缩短的重复/反重复区的上茎的一个或多个碱基对缺失。
46.如权利要求36至45中任一项所述的gRNA,其中所述缩短的重复/反重复区的上茎包含不超过一个、两个、三个或四个碱基对。
47.如权利要求36至46中任一项所述的gRNA,其中所述缩短的重复/反重复区具有长度为11个碱基配对核苷酸的双链体部分。
48.如权利要求36至47中任一项所述的gRNA,其中所述缩短的重复/反重复区具有单一双链体部分。
49.如权利要求36至48中任一项所述的gRNA,其中相对于SEQ ID NO:500,所述缩短的重复/反重复区的上茎包含一个或多个取代。
50.如权利要求36至49中任一项所述的gRNA,其中所述第一内部接头取代核苷酸49至52中的至少一部分或全部。
51.如权利要求36至50中任一项所述的gRNA,其中所述缩短的发夹1区具有长度为4至8个、任选地7至8个碱基配对核苷酸的双链体部分。
52.如权利要求36至51中任一项所述的gRNA,其中所述缩短的发夹1区具有单一双链体部分。
53.如权利要求36至52中任一项所述的gRNA,其中所述缩短的发夹1区的一个或两个碱基对缺失。
54.如权利要求36至53中任一项所述的gRNA,其中所述缩短的发夹1区的茎的长度为七个或八个碱基配对核苷酸。
55.如权利要求36至54中任一项所述的gRNA,其中所述缩短的发夹1区的位置85至86中的一者或多者和核苷酸91至92中的一者或多者缺失。
56.如权利要求36至55中任一项所述的gRNA,其中相对于SEQ ID NO:500,所述缩短的发夹1区的核苷酸82至95中的一者或多者被取代。
57.如权利要求36至56中任一项所述的gRNA,其中所述第二内部接头取代核苷酸87至90中的至少一部分或全部。
58.如权利要求36至56中任一项所述的gRNA,其中所述第二内部接头取代核苷酸81至95中的至少一部分或全部。
59.如权利要求36至58中任一项所述的gRNA,其中所述缩短的发夹1区具有2至15个修饰的核苷酸。
60.如权利要求36至59中任一项所述的gRNA,其中所述缩短的发夹2区缺乏2至18个、任选地2至16个核苷酸。
61.如权利要求36至60中任一项所述的gRNA,其中所述缩短的发夹2区的位置113至121中的一者或多者和核苷酸126至134中的一者或多者缺失。
62.如权利要求36至61中任一项所述的gRNA,其中所述缩短的发夹2区包含不成对区。
63.如权利要求36至62中任一项所述的gRNA,其中所述缩短的发夹2区具有两个双链体部分。
64.如权利要求63所述的gRNA,其中所述缩短的发夹2区具有长度为4个碱基配对核苷酸的双链体部分。
65.如权利要求63或64所述的gRNA,其中所述缩短的发夹2区具有长度为4至8个碱基配对核苷酸的双链体部分。
66.如权利要求63至65中任一项所述的gRNA,其中所述缩短的发夹2区具有长度为4至6个碱基配对核苷酸的双链体部分。
67.如权利要求36至66中任一项所述的gRNA,其中所述缩短的发夹2区的上茎包含一个、两个、三个或四个碱基对。
68.如权利要求36至67中任一项所述的gRNA,其中所述缩短的发夹2区的位置113至121和126至134全部缺失。
69.如权利要求36至68中任一项所述的gRNA,其中相对于SEQ ID NO:500,所述缩短的发夹2区的核苷酸113至134中的一者或多者被取代。
70.如权利要求36至69中任一项所述的gRNA,其中所述第三内部接头取代核苷酸122至125中的至少一部分或全部。
71.如权利要求36至70中任一项所述的gRNA,其中所述第三内部接头取代核苷酸112至135中的至少一部分或全部。
72.如权利要求36至71中任一项所述的gRNA,其中所述缩短的发夹2区具有2至15个修饰的核苷酸。
73.如权利要求1至72中任一项所述的gRNA,其中所述gRNA的引导区包含至少两个修饰的核苷酸、任选地至少四个修饰的核苷酸。
74.如权利要求1至73中任一项所述的gRNA,
1)其包含3'端修饰,并包含所述重复/反重复区的上茎区中的修饰;
2)其包含3'端修饰和所述发夹1区中的修饰;或
3)其包含3'端修饰和所述发夹2区中的修饰。
75.如权利要求1至74中任一项所述的gRNA,
1)其包含5'端修饰,并包含所述重复/反重复区的上茎区中的修饰;
2)其包含5'端修饰和所述发夹1区中的修饰;
3)其包含5'端修饰和所述发夹2区中的修饰;
4)其包含5'端修饰、所述重复/反重复区的上茎区中的修饰和3'端修饰;
5)其包含5'端修饰、所述发夹1区中的修饰和3'端修饰;
6)其包含5'端修饰、所述发夹1区中的修饰、所述发夹2区中的修饰和3'端修饰;或
7)其包含5'端修饰、所述重复/反重复区中的修饰、所述发夹1区中的修饰、所述发夹2区中的修饰和3'端修饰。
76.如权利要求74至75中任一项所述的gRNA,其中所述重复/反重复区、所述发夹1区或所述发夹2区中的修饰包含选自以下的修饰的核苷酸:2'-O-甲基(2'-OMe)修饰的核苷酸和核苷酸间的硫代磷酸酯(PS)键联或其组合。
77.如权利要求1至76中任一项所述的gRNA,其中所述引导区的核苷酸1至3是修饰的,并且所述引导区中核苷酸1至3以外的核苷酸是未修饰的。
78.一种单引导RNA(sgRNA),其包含如表4A中所示的SEQ ID NO:1001-1012或任何其他序列中的任一者。
79.如权利要求1至78中任一项所述的gRNA,其包含与如表4A中所示的SEQ ID No:1001-1012或任何其他序列中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列。
80.如权利要求1至79中任一项所述的gRNA,其包含与如表4A至4B中所示的SEQ ID No:1001-1002和710-759中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列,其中与表4A中的参考序列标识符的核苷酸对应的所述gRNA的各核苷酸的修饰与表4B中的参考序列标识符中所示的修饰相同或等同。
81.如权利要求1至80中任一项所述的gRNA,其包含与如表4A至4B中所示的SEQ ID No:1001-1002和710-759中任一者的核苷酸序列的X至3'端的序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%或90%同一性的核苷酸序列,其中X为保守区的第一个核苷酸。
82.如权利要求1至42和44至81中任一项所述的gRNA,其还包含含有2'-O-Me修饰的核苷酸的3'尾。
83.如权利要求1至82中任一项所述的gRNA,其中所述gRNA将核酸酶引导至靶序列以进行结合。
84.如权利要求1至83中任一项所述的gRNA,其中所述gRNA将核酸酶引导至靶序列以诱导所述靶序列内双链断裂。
85.如权利要求1至84中任一项所述的gRNA,其中所述gRNA将核酸酶引导至靶序列以诱导所述靶序列内单链断裂。
86.如权利要求82至84中任一项所述的gRNA,其中所述核酸酶为NmeCas9。
87.如权利要求86所述的gRNA,其中所述Nme Cas9为Nme1Cas9、Nme2 Cas9或Nme3Cas9。
88.如权利要求1至87中任一项所述的gRNA,其中所述gRNA包含保守取代,例如以保持碱基配对。
89.如权利要求1至88中任一项所述的gRNA,其中所述内部接头具有约6埃至37埃的桥接长度。
90.如权利要求1至89中任一项所述的gRNA,其中所述内部接头包含1至10个彼此共价连接的乙二醇亚基。
91.如权利要求1至90中任一项所述的gRNA,其中所述内部接头包含至少两个彼此共价连接的乙二醇亚基。
92.如权利要求1至91中任一项所述的gRNA,其中所述内部接头包含3个彼此共价连接的乙二醇亚基。
93.如权利要求1至92中任一项所述的gRNA,其中所述内部接头包含6个彼此共价连接的乙二醇亚基。
94.如权利要求1至93中任一项所述的gRNA,其中所述内部接头包含式(I)的结构:
~-L0-L1-L2-#
(T)
其中:
~指示连至前一核苷酸的3'取代基的键;
#指示连至后一核苷酸的5'取代基的键;
L0为空或C1-3脂族基;
L1为-[E1-(R1)]m-,其中
各R1独立地为任选地被1或2个E2取代的C1-5脂族基团,
各E1和E2独立地为氢键受体,或各自独立地选自环烃和杂环烃,并且
各m为1、2、3、4、5、6、7、8、9或10;并且
L2为空、C1-3脂族基或为氢键受体。
95.如权利要求94所述的gRNA,其中所述内部接头包含PEG-接头。
96.如权利要求94或权利要求95所述的gRNA,其中所述内部接头包含具有1至10个乙二醇单元的PEG-接头。
97.如权利要求94至96中任一项所述的gRNA,其中所述内部接头包含具有3至6个乙二醇单元的PEG-接头。
98.如权利要求94至97中任一项所述的gRNA,其中所述内部接头包含具有3个乙二醇单元的PEG-接头。
99.如权利要求94至97中任一项所述的gRNA,其中所述内部接头包含具有6个乙二醇单元的PEG-接头。
100.如权利要求1至99中任一项所述的gRNA,其中所述gRNA为包含缩短的保守部分的短引导RNA,并且所述内部接头取代至少2、3、4、5、6、7、8、9、10、11或12个核苷酸。
101.如权利要求1至35或78至100中任一项所述的gRNA,其中所述gRNA为包含sgRNA的保守部分的短单引导RNA(短sgRNA),所述保守部分包含发夹区,其中所述发夹区缺乏至少5至10个核苷酸。
102.如权利要求101所述的gRNA,其中所述至少5至10个缺乏核苷酸为连续的。
103.如权利要求101或102所述的gRNA,其中所述至少5至10个缺乏核苷酸
i.位于发夹1内;
ii.位于发夹1内,和相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;
iii.位于发夹1内和紧邻发夹1的3'的两个核苷酸;
iv.包含发夹1的至少一部分;
v.位于发夹2内;
vi.包含发夹2的至少一部分;
vii.位于发夹1和发夹2内;
viii.包含发夹1的至少一部分并且包含相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;
ix.包含发夹2的至少一部分并且包含相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;
x.包含发夹1的至少一部分,包含相对于SEQ ID NO:400的发夹1与发夹2之间的“N”,并且包含发夹2的至少一部分;
xi.位于发夹1或发夹2内,任选地包含相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;
xii.为连续的;
xiii.为连续的并且包含相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;
xiv.为连续的并且跨越发夹1的至少一部分和发夹2的一部分;
xv.为连续的并且跨越发夹1的至少一部分和相对于SEQ ID NO:400的发夹1与发夹2之间的“N”;或
xvi.为连续的并且跨越发夹1的至少一部分和紧邻发夹1的3'的两个核苷酸。
104.如权利要求1至35或78至103中任一项所述的gRNA,其中所述gRNA为包含sgRNA的保守部分的短单引导RNA(短sgRNA),所述保守部分包含发夹区,其中所述发夹区缺乏至少5至10个核苷酸,并且其中所述短sgRNA包含5'端修饰或3'端修饰。
105.如权利要求1至35或78至104中任一项所述的gRNA,其中所述至少5至10个核苷酸包含SEQ ID NO:400的核苷酸54至61、SEQ ID NO:400的核苷酸53至60;或SEQ ID NO:400的核苷酸54至58,任选地其中所述短sgRNA包含至少H1-1至H1-5和H2-1至H2-12的修饰。
106.如权利要求1至35或78至105中任一项所述的gRNA,其包含缩短的发夹1区,或取代且任选地缩短的发夹1区,其中
(i)在所述取代且任选地缩短的发夹1中以下核苷酸对中的至少一者被沃森-克里克配对核苷酸取代:H1-1与H1-12、H1-2与H1-11、H1-3与H1-10或H1-4与H1-9,并且所述发夹1区任选地缺乏
(aa)H1-5至H1-8中的任一者或两者,
(bb)以下核苷酸对中的一者、两者或三者:H1-1与H1-12、H1-2与H1-11、H1-3与H1-10或H1-4与H1-9,或
(cc)所述发夹1区的1至8个核苷酸;或
(ii)所述缩短的发夹1区缺乏6至8个核苷酸、优选地6个核苷酸;并且
(aa)相对于SEQ ID NO:400,位置H1-1、H1-2或H1-3中的一者或多者缺失或被取代,或
(bb)相对于SEQ ID NO:400,位置H1-6至H1-10中的一者或多者被取代;或
(iii)相对于SEQ ID NO:400,所述缩短的发夹1区缺乏5至10个核苷酸、优选地5至6个核苷酸,并且位置N18、H1-12或n中的一者或多者被取代。
107.如权利要求1至35或78至106中任一项所述的gRNA,其包含缩短的上茎区,其中相对于SEQ ID NO:400,所述缩短的上茎区缺乏1至6个核苷酸,并且其中所述缩短的上茎区的6、7、8、9、10或11个核苷酸包含少于或等于4个取代。
108.如权利要求1至35或78至107中任一项所述的gRNA,其相对于SEQ ID NO:400包含在LS6、LS7、US3、US10、B3、N7、N15、N17、H2-2和H2-14中的任一者或多者的取代,其中所述取代核苷酸既不为后接腺嘌呤的嘧啶,也不为前接嘧啶的腺嘌呤。
109.如权利要求106所述的gRNA,其中所述缩短且取代的发夹1缺乏1至4个核苷酸,并且核苷酸H1-4至H1-9被内部接头取代。
110.如权利要求106所述的gRNA,其中所述缩短且取代的发夹1缺乏以下核苷酸对中的一者或两者:H1-1与H1-12、H1-2与H1-11或H1-3与H1-10;并且核苷酸H1-4至H1-9被内部接头取代。
111.如权利要求1至35或78至110中任一项所述的gRNA,其包含上茎区,其中所述上茎修饰包含所述上茎区中的US1至US12中的任一者或多者的修饰。
112.如权利要求1至35或78至111中任一项所述的gRNA,其包含缩短的上茎区,其中所述缩短的上茎区缺乏1至6个核苷酸。
113.如权利要求1至35或78至111中任一项所述的gRNA,其包含缩短的上茎区,其中所述缩短的上茎区缺乏7至10个核苷酸,并且2个核苷酸被内部接头取代。
114.如权利要求112或113所述的gRNA,其中所述内部接头具有约3至30个原子、任选地12至21个原子、6至18个原子、或6至12个原子的桥接长度。
115.如权利要求1至114中任一项所述的gRNA,其中所述gRNA包含修饰。
116.如权利要求115所述的引导RNA,其中所述修饰包含2'-O-甲基(2'-O-Me)修饰的核苷酸、2'-F修饰的核苷酸、2'-H修饰的核苷酸(DNA)、2'-O,4'-C-亚乙基修饰的核苷酸(ENA)、锁定核苷酸(LNA)或非锁定核苷酸(UNA)。
117.如权利要求115或116所述的引导RNA,其中所述修饰包含核苷酸间的硫代磷酸酯(PS)键。
118.如权利要求117所述的引导RNA,其中
(i)所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的5'端的五个核苷酸中的一者或多者的修饰;
(ii)所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的3'端的五个核苷酸中的一者或多者的修饰;
(iii)所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的5'端的四个核苷酸中的每一者之间的PS键;
(iv)所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的3'端的四个核苷酸中的每一者之间的PS键;
(v)所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的5'端的前三个核苷酸中的每一者的2'-O-Me修饰的核苷酸;或
(vi)所述引导RNA为sgRNA,并且所述修饰包含所述引导RNA的3'端的最后三个核苷酸中的每一者的2'-O-Me修饰的核苷酸。
119.如权利要求1至118中任一项所述的gRNA,其中所述gRNA的3'核苷酸为包含尿嘧啶或修饰的尿嘧啶的核苷酸。
120.如权利要求1至119中任一项所述的gRNA,其中所述gRNA包含3'尾。
121.如权利要求120所述的gRNA,其中所述3'尾包含至少1至10个核苷酸,任选地1、2、3、4或5个核苷酸。
122.如权利要求120或121所述的gRNA,其中所述3'尾以包含尿嘧啶或修饰的尿嘧啶的核苷酸终止。
123.如权利要求120至122中任一项所述的gRNA,其中所述3'尾的长度为1个核苷酸。
124.如权利要求120至123中任一项所述的gRNA,其中所述3'尾由包含尿嘧啶或修饰的尿嘧啶的核苷酸组成。
125.如权利要求120至124中任一项所述的gRNA,其中所述3'尾包含存在于所述3'尾中的核苷酸中的任一者或多者的修饰。
126.如权利要求120至125中任一项所述的gRNA,其中所述3'尾的修饰为2'-O-甲基(2'-OMe)修饰的核苷酸和核苷酸间的硫代磷酸酯(PS)键联中的一者或多者。
127.如权利要求125或126所述的gRNA,其中所述3'尾被完全修饰。
128.如权利要求1至119中任一项所述的gRNA,其中所述gRNA不包含3'尾。
129.如权利要求1至128中任一项所述的gRNA,其中所述gRNA包含3'端修饰或5'端修饰。
130.如权利要求129所述的gRNA,其中所述3'或5'端修饰包含或还包含2'-O-甲基(2'-Ome)修饰的核苷酸。
131.如权利要求129或权利要求130所述的gRNA,其中所述3'或5'端修饰包含或还包含核苷酸间的硫代磷酸酯(PS)键联。
132.如权利要求1至131中任一项所述的gRNA,其包含在发夹区或所述发夹区中的修饰。
133.如权利要求132所述的gRNA,其包含所述发夹区中的修饰,其中所述发夹区中的修饰包含选自以下的修饰的核苷酸:2'-O-甲基(2'-Ome)修饰的核苷酸、2'-氟(2'-F)修饰的核苷酸、核苷酸间的硫代磷酸酯(PS)键联或其组合。
134.如权利要求132或133所述的gRNA,其中所述发夹区中的修饰包含或还包含2'-O-甲基(2'-Ome)修饰的核苷酸。
135.如权利要求132至134中任一项所述的gRNA,其中所述发夹区中的修饰包含或还包含2'-氟(2'-F)修饰的核苷酸。
136.如权利要求1至135中任一项所述的gRNA,其包含在上茎区或所述上茎区中的修饰。
137.如权利要求136所述的gRNA,其中所述上茎修饰包含以下中的任一者或多者:
i.所述上茎区中的US1至US12(对应于SEQ ID NO:400的核苷酸9至20)中的任一者或多者的修饰;和
ii.所述上茎区中的至少1、2、3、4、5、6、7、8、9、10、11或所有12个核苷酸的修饰。
138.如权利要求136或137所述的gRNA,其中所述上茎修饰包含以下中的一者或多者:
i.2'-OMe修饰的核苷酸;
ii.2'-O-moe修饰的核苷酸;
iii.2'-F修饰的核苷酸;
iv.2'-H修饰的核苷酸(DNA);
v.2'-O,4'-C-亚乙基修饰的核苷酸(ENA);
vi.锁定核苷酸(LNA);
vii.非锁定核苷酸(UNA);和
viii.(i.)至(iii.)中的一者或多者的组合。
139.一种单引导RNA(sgRNA),其包含如表2A至2C中所示的SEQ ID NO:211-230或任何其他序列中的任一者。
140.如权利要求1至139中任一项所述的gRNA,其包含与如表2A至2C中所示的SEQ IDNo:211-230或任何其他序列中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列。
141.如权利要求1至140中任一项所述的gRNA,其包含与如表2A至2C中所示的SEQ IDNO:101-108、120-175、177-184、211-230中任一者的核苷酸序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、85%、80%、75%或70%同一性的核苷酸序列,其中与表2C中的参考序列标识符的核苷酸对应的所述gRNA的各核苷酸的修饰与表2A或2B中的参考序列标识符中所示的修饰相同或等同。
142.如权利要求1至141中任一项所述的gRNA,其包含与如表2A至2C中所示的SEQ IDNO:101-108、120-175、177-184和211-230中任一者的核苷酸序列的X至3'端的序列具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%或90%同一性的核苷酸序列,其中X为保守区的第一个核苷酸。
143.一种组合物,其包含如权利要求1至142中任一项所述的gRNA,与脂质纳米颗粒(LNP)缔合。
144.一种组合物,其包含如权利要求1至142中任一项所述的gRNA或如权利要求143所述的组合物,其还包含核酸酶或编码所述核酸酶的mRNA。
145.一种LNP组合物,其包含如权利要求1至142中任一项所述的gRNA。
146.一种LNP组合物,其包含如权利要求14至35和73至142中任一项所述的gRNA和编码SpyCas9的mRNA。
147.如权利要求145或权利要求146所述的LNP组合物,其中所述LNP包含十八碳-9,12-二烯酸(9z,12z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙酯或8-((7,7-双(辛氧基)庚基)(2-羟乙基)氨基)辛酸壬酯。
148.如权利要求145至147中任一项所述的组合物,其中所述LNP包含摩尔比为约4.5至6.5的阳离子脂质胺与RNA磷酸酯(N:P),任选地约6.0的N:P。
149.如权利要求144至148中任一项所述的组合物,其中所述核酸酶包含蛋白质或编码所述核酸酶的核酸。
150.如权利要求149所述的组合物,其中所述核酸酶为Cas核酸酶。
151.如权利要求150所述的组合物,其中所述Cas核酸酶为Cas9。
152.如权利要求151所述的组合物,其中所述Cas9为化脓链球菌Cas9(SpyCas9)。
153.如权利要求151所述的组合物,其中所述Cas9为NmeCas9,任选地其中所述NmeCas9为Nme1Cas9、Nme2Cas9或Nme3Cas9。
154.如权利要求144至153中任一项所述的组合物,其中所述核酸酶为裂解酶、切口酶或无催化活性的核酸酶,或为包含脱氨酶的融合蛋白。
155.如权利要求144至154中任一项所述的组合物,其中编码所述核酸酶的核酸选自:
a.DNA编码序列;
b.具有开放阅读框架(ORF)的mRNA;
c.表达载体中的编码序列;
d.病毒载体中的编码序列。
156.如权利要求155所述的组合物,其中所述mRNA包含SEQ ID NO:321-323、361、363-372和374-382中任一者的序列。
157.一种药物制剂,其包含如权利要求1至142中任一项所述的gRNA或如权利要求143至156中任一项所述的组合物和药学上可接受的载剂。
158.一种修饰靶DNA的方法,其包括将以下中的任一者或多者递送至细胞:
i.如权利要求1至142中任一项所述的gRNA;
ii.如权利要求143至156中任一项所述的组合物;和
iii.如权利要求157所述的药物制剂。
159.如权利要求158所述的方法,其中所述方法造成基因的插入或缺失。
160.如权利要求158或159所述的方法,其还包含将模板递送至所述细胞,其中所述模板的至少一部分并入所述靶DNA中在或接近所述Cas蛋白所诱导的双链断裂位点处。
161.如权利要求1至142中任一项所述的gRNA、如权利要求143至156中任一项所述的组合物或如权利要求157所述的药物制剂,其用于制备治疗疾病或病症的药剂。
162.如权利要求1至142中任一项所述的gRNA、如权利要求143至156中任一项所述的组合物或如权利要求157所述的药物制剂用于制造治疗疾病或病症的药剂的用途。
163.一种组合物,其包含如权利要求1至142中任一项所述的gRNA,其中所述组合物不包含所述gRNA的非连接部分。
164.一种固体载体,其共价连接至如权利要求1至142中任一项所述的gRNA的接头。
165.一种合成包含内部接头的gRNA的方法,其中所述方法为单合成过程。
166.一种合成gRNA的方法,其中内部接头在合成期间在线并入。
167.一种合成gRNA的方法,其使用一系列连续偶合反应进行,其中所述反应包括:
a)用于第一核苷酸与第二核苷酸的共价连接的偶合反应;
b)用于内部接头与所述第二核苷酸的共价连接的偶合反应;和
c)用于第三核苷酸与所述内部接头的共价连接的偶合反应,
其中用于所述共价连接的偶合反应全部相同。
168.如权利要求167所述的方法,其中使用亚磷酰胺化学方法进行共价连接。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/209,273 | 2021-06-10 | ||
US202163275427P | 2021-11-03 | 2021-11-03 | |
US63/275,427 | 2021-11-03 | ||
PCT/US2022/032791 WO2022261292A1 (en) | 2021-06-10 | 2022-06-09 | Modified guide rnas comprising an internal linker for gene editing |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117916375A true CN117916375A (zh) | 2024-04-19 |
Family
ID=90685579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280055508.4A Pending CN117916375A (zh) | 2021-06-10 | 2022-06-09 | 用于基因编辑的包含内部接头的修饰的引导rna |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117916375A (zh) |
-
2022
- 2022-06-09 CN CN202280055508.4A patent/CN117916375A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230287400A1 (en) | Modified Guide RNAs | |
TWI773666B (zh) | Crispr/cas 組分之脂質奈米粒子調配物 | |
JP7284179B2 (ja) | 製剤 | |
CN112567036A (zh) | 用于基因编辑的修饰的向导rna | |
JP2022505402A (ja) | アルブミン遺伝子座からの導入遺伝子発現のための組成物及び方法 | |
US20220372483A1 (en) | Modified Guide RNAs for Gene Editing | |
US20240150761A1 (en) | Modified Guide RNAs Comprising an Internal Linker for Gene Editing | |
US20220389430A1 (en) | Chemical modifications of small interfering rna with minimal fluorine content | |
TW202237837A (zh) | 經導入化學修飾核酸之穩定型標的編輯引導rna | |
KR20220034717A (ko) | 안정화된 crispr 복합체 | |
CN117916375A (zh) | 用于基因编辑的包含内部接头的修饰的引导rna | |
CN115956120A (zh) | 用于crispr基因组编辑的修饰的指导rna | |
WO2023081687A1 (en) | Modified guide rnas for gene editing | |
TWI835719B (zh) | 經修飾之嚮導rna | |
Copp | Repair of Intrastrand Alkylene Cross-links in Various DNA Structures by O6-Alkylguanine DNA Alkyltransferases | |
WO2023064813A2 (en) | Modified guide rnas for neisseria meningitidis cas9 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |