CN111328290A - 用于靶向核酸编辑的基于crispr/cas-腺嘌呤脱氨酶的组合物、系统和方法 - Google Patents
用于靶向核酸编辑的基于crispr/cas-腺嘌呤脱氨酶的组合物、系统和方法 Download PDFInfo
- Publication number
- CN111328290A CN111328290A CN201880055316.7A CN201880055316A CN111328290A CN 111328290 A CN111328290 A CN 111328290A CN 201880055316 A CN201880055316 A CN 201880055316A CN 111328290 A CN111328290 A CN 111328290A
- Authority
- CN
- China
- Prior art keywords
- protein
- sequence
- guide
- adenosine deaminase
- rna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 111
- 239000000203 mixture Substances 0.000 title claims abstract description 74
- 229960000643 adenine Drugs 0.000 title claims description 48
- 108091033409 CRISPR Proteins 0.000 title claims description 18
- 238000010354 CRISPR gene editing Methods 0.000 title claims description 10
- 150000007523 nucleic acids Chemical class 0.000 title abstract description 95
- 102000039446 nucleic acids Human genes 0.000 title abstract description 73
- 108020004707 nucleic acids Proteins 0.000 title abstract description 73
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims abstract description 394
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 272
- 230000008685 targeting Effects 0.000 claims abstract description 247
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 177
- 230000003197 catalytic effect Effects 0.000 claims abstract description 76
- 102000055025 Adenosine deaminases Human genes 0.000 claims abstract description 18
- 230000035772 mutation Effects 0.000 claims description 398
- 230000000694 effects Effects 0.000 claims description 171
- 125000003729 nucleotide group Chemical group 0.000 claims description 147
- 239000002773 nucleotide Substances 0.000 claims description 140
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 claims description 138
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 claims description 133
- 210000004027 cell Anatomy 0.000 claims description 132
- 230000034994 death Effects 0.000 claims description 86
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims description 85
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 80
- 230000027455 binding Effects 0.000 claims description 68
- 102000035181 adaptor proteins Human genes 0.000 claims description 60
- 108091005764 adaptor proteins Proteins 0.000 claims description 60
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 58
- 229930024421 Adenine Natural products 0.000 claims description 46
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 46
- 239000012636 effector Substances 0.000 claims description 45
- 108091023037 Aptamer Proteins 0.000 claims description 42
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims description 39
- 229960005305 adenosine Drugs 0.000 claims description 39
- 241000282414 Homo sapiens Species 0.000 claims description 29
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 28
- 102000040430 polynucleotide Human genes 0.000 claims description 28
- 108091033319 polynucleotide Proteins 0.000 claims description 28
- 201000010099 disease Diseases 0.000 claims description 26
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 26
- 241001465754 Metazoa Species 0.000 claims description 25
- 239000002157 polynucleotide Substances 0.000 claims description 25
- 101000742223 Homo sapiens Double-stranded RNA-specific editase 1 Proteins 0.000 claims description 24
- 102100038191 Double-stranded RNA-specific editase 1 Human genes 0.000 claims description 22
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 20
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 19
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 19
- 208000009869 Neu-Laxova syndrome Diseases 0.000 claims description 19
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 19
- 102000044126 RNA-Binding Proteins Human genes 0.000 claims description 19
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 19
- 108091034117 Oligonucleotide Proteins 0.000 claims description 15
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 claims description 14
- 108010066154 Nuclear Export Signals Proteins 0.000 claims description 13
- 101710159080 Aconitate hydratase A Proteins 0.000 claims description 12
- 101710159078 Aconitate hydratase B Proteins 0.000 claims description 12
- 101710105008 RNA-binding protein Proteins 0.000 claims description 12
- 210000004102 animal cell Anatomy 0.000 claims description 12
- 239000012634 fragment Substances 0.000 claims description 12
- 229940104302 cytosine Drugs 0.000 claims description 10
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 10
- 108020004414 DNA Proteins 0.000 claims description 9
- 230000004568 DNA-binding Effects 0.000 claims description 9
- 230000001580 bacterial effect Effects 0.000 claims description 8
- 239000002245 particle Substances 0.000 claims description 8
- 230000001225 therapeutic effect Effects 0.000 claims description 8
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 claims description 7
- 241000605861 Prevotella Species 0.000 claims description 7
- 230000004570 RNA-binding Effects 0.000 claims description 7
- 238000002560 therapeutic procedure Methods 0.000 claims description 7
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 6
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 6
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 6
- 238000002659 cell therapy Methods 0.000 claims description 6
- 230000001717 pathogenic effect Effects 0.000 claims description 6
- 238000011282 treatment Methods 0.000 claims description 6
- 239000013603 viral vector Substances 0.000 claims description 6
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 claims description 5
- 241000238366 Cephalopoda Species 0.000 claims description 5
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 claims description 5
- 210000003719 b-lymphocyte Anatomy 0.000 claims description 5
- 241000894007 species Species 0.000 claims description 5
- 101100462611 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) prr-1 gene Proteins 0.000 claims description 4
- 241000605894 Porphyromonas Species 0.000 claims description 4
- 102000043136 MAP kinase family Human genes 0.000 claims description 2
- 108091054455 MAP kinase family Proteins 0.000 claims description 2
- 241001478212 Riemerella anatipestifer Species 0.000 claims description 2
- 230000002265 prevention Effects 0.000 claims description 2
- 230000000069 prophylactic effect Effects 0.000 claims description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims 4
- 241000221955 Chaetomium Species 0.000 claims 1
- 235000015220 hamburgers Nutrition 0.000 claims 1
- 102100036664 Adenosine deaminase Human genes 0.000 description 379
- 108020005004 Guide RNA Proteins 0.000 description 275
- 235000018102 proteins Nutrition 0.000 description 159
- 230000000875 corresponding effect Effects 0.000 description 101
- 230000008439 repair process Effects 0.000 description 74
- 102000004190 Enzymes Human genes 0.000 description 66
- 108090000790 Enzymes Proteins 0.000 description 66
- 229940088598 enzyme Drugs 0.000 description 65
- 108060001084 Luciferase Proteins 0.000 description 64
- 239000005089 Luciferase Substances 0.000 description 64
- 125000005647 linker group Chemical group 0.000 description 50
- 108091036055 CccDNA Proteins 0.000 description 46
- 101710163270 Nuclease Proteins 0.000 description 46
- 239000013598 vector Substances 0.000 description 46
- 238000010357 RNA editing Methods 0.000 description 43
- 230000026279 RNA modification Effects 0.000 description 43
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 42
- 230000004048 modification Effects 0.000 description 42
- 238000012986 modification Methods 0.000 description 42
- 230000014509 gene expression Effects 0.000 description 40
- 230000001105 regulatory effect Effects 0.000 description 37
- 238000004422 calculation algorithm Methods 0.000 description 36
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 35
- 238000006481 deamination reaction Methods 0.000 description 33
- 239000000758 substrate Substances 0.000 description 33
- 230000009615 deamination Effects 0.000 description 32
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 31
- 235000001014 amino acid Nutrition 0.000 description 30
- 238000001994 activation Methods 0.000 description 29
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 29
- 230000004913 activation Effects 0.000 description 28
- 230000000295 complement effect Effects 0.000 description 27
- 238000011002 quantification Methods 0.000 description 26
- 102220585305 Serine/threonine-protein kinase STK11_S486A_mutation Human genes 0.000 description 25
- 238000007481 next generation sequencing Methods 0.000 description 25
- 238000013518 transcription Methods 0.000 description 25
- 230000035897 transcription Effects 0.000 description 25
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 24
- 238000003776 cleavage reaction Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 23
- 230000007017 scission Effects 0.000 description 23
- 239000012190 activator Substances 0.000 description 22
- 229940024606 amino acid Drugs 0.000 description 22
- 238000013461 design Methods 0.000 description 22
- 230000001976 improved effect Effects 0.000 description 22
- 108090000765 processed proteins & peptides Proteins 0.000 description 21
- 125000000341 threoninyl group Chemical group [H]OC([H])(C([H])([H])[H])C([H])(N([H])[H])C(*)=O 0.000 description 21
- 102100024364 Disintegrin and metalloproteinase domain-containing protein 8 Human genes 0.000 description 20
- 150000001413 amino acids Chemical group 0.000 description 20
- 238000003556 assay Methods 0.000 description 20
- 238000003197 gene knockdown Methods 0.000 description 20
- 108020004999 messenger RNA Proteins 0.000 description 20
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 20
- -1 NL95 Chemical compound 0.000 description 19
- 238000010586 diagram Methods 0.000 description 19
- 125000006850 spacer group Chemical group 0.000 description 19
- 238000012360 testing method Methods 0.000 description 19
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 18
- 108091079001 CRISPR RNA Proteins 0.000 description 18
- 230000004927 fusion Effects 0.000 description 18
- 230000009437 off-target effect Effects 0.000 description 18
- 102000004196 processed proteins & peptides Human genes 0.000 description 18
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 17
- 102000037865 fusion proteins Human genes 0.000 description 17
- 108020001507 fusion proteins Proteins 0.000 description 17
- 238000000338 in vitro Methods 0.000 description 17
- 208000011580 syndromic disease Diseases 0.000 description 17
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 16
- 238000007385 chemical modification Methods 0.000 description 16
- 230000001939 inductive effect Effects 0.000 description 16
- 239000000178 monomer Substances 0.000 description 16
- 229920001184 polypeptide Polymers 0.000 description 16
- 238000012384 transportation and delivery Methods 0.000 description 16
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 16
- UHDGCWIWMRVCDJ-XVFCMESISA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UHDGCWIWMRVCDJ-XVFCMESISA-N 0.000 description 15
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 15
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 15
- 108091028113 Trans-activating crRNA Proteins 0.000 description 14
- 125000000539 amino acid group Chemical group 0.000 description 14
- 241000196324 Embryophyta Species 0.000 description 13
- 239000004144 Ethoxylated Mono- and Di-Glyceride Substances 0.000 description 13
- 102100030708 GTPase KRas Human genes 0.000 description 13
- 101000611202 Homo sapiens Peptidyl-prolyl cis-trans isomerase B Proteins 0.000 description 13
- 210000004962 mammalian cell Anatomy 0.000 description 13
- 238000011084 recovery Methods 0.000 description 13
- 239000004055 small Interfering RNA Substances 0.000 description 13
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 13
- 108020004705 Codon Proteins 0.000 description 12
- 102100040283 Peptidyl-prolyl cis-trans isomerase B Human genes 0.000 description 12
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 12
- 210000005260 human cell Anatomy 0.000 description 12
- 230000001965 increasing effect Effects 0.000 description 12
- 230000032965 negative regulation of cell volume Effects 0.000 description 12
- 239000000047 product Substances 0.000 description 12
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 12
- 101710132601 Capsid protein Proteins 0.000 description 11
- 101710094648 Coat protein Proteins 0.000 description 11
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 11
- 101710125418 Major capsid protein Proteins 0.000 description 11
- 101710141454 Nucleoprotein Proteins 0.000 description 11
- 101710083689 Probable capsid protein Proteins 0.000 description 11
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 11
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 11
- 238000012163 sequencing technique Methods 0.000 description 11
- 230000007018 DNA scission Effects 0.000 description 10
- 230000033228 biological regulation Effects 0.000 description 10
- 238000009826 distribution Methods 0.000 description 10
- 238000010362 genome editing Methods 0.000 description 10
- 230000003993 interaction Effects 0.000 description 10
- 229920001223 polyethylene glycol Polymers 0.000 description 10
- 238000012216 screening Methods 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 238000006467 substitution reaction Methods 0.000 description 10
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 9
- 108091027967 Small hairpin RNA Proteins 0.000 description 9
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 9
- 238000001727 in vivo Methods 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 102200145604 rs80338864 Human genes 0.000 description 9
- 230000009870 specific binding Effects 0.000 description 9
- 230000009261 transgenic effect Effects 0.000 description 9
- 238000010453 CRISPR/Cas method Methods 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 8
- 229930010555 Inosine Natural products 0.000 description 8
- 101000860104 Leptotrichia wadei (strain F0279) CRISPR-associated endoribonuclease Cas13a Proteins 0.000 description 8
- 238000010459 TALEN Methods 0.000 description 8
- 102000040945 Transcription factor Human genes 0.000 description 8
- 108091023040 Transcription factor Proteins 0.000 description 8
- 229960003786 inosine Drugs 0.000 description 8
- 238000002703 mutagenesis Methods 0.000 description 8
- 231100000350 mutagenesis Toxicity 0.000 description 8
- 108091006106 transcriptional activators Proteins 0.000 description 8
- 239000004475 Arginine Substances 0.000 description 7
- 108090000331 Firefly luciferases Proteins 0.000 description 7
- 239000004471 Glycine Substances 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 7
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 7
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 7
- 230000003213 activating effect Effects 0.000 description 7
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 7
- 201000011510 cancer Diseases 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 230000000670 limiting effect Effects 0.000 description 7
- 108091027963 non-coding RNA Proteins 0.000 description 7
- 102000042567 non-coding RNA Human genes 0.000 description 7
- 230000001681 protective effect Effects 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- 125000000430 tryptophan group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C2=C([H])C([H])=C([H])C([H])=C12 0.000 description 7
- 229910052725 zinc Inorganic materials 0.000 description 7
- 239000011701 zinc Substances 0.000 description 7
- 102100034215 AFG3-like protein 2 Human genes 0.000 description 6
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 6
- 101000780591 Homo sapiens AFG3-like protein 2 Proteins 0.000 description 6
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 6
- 238000006957 Michael reaction Methods 0.000 description 6
- 108091093037 Peptide nucleic acid Proteins 0.000 description 6
- 108091028664 Ribonucleotide Proteins 0.000 description 6
- 102000039471 Small Nuclear RNA Human genes 0.000 description 6
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 210000004899 c-terminal region Anatomy 0.000 description 6
- 238000012512 characterization method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 6
- 230000001404 mediated effect Effects 0.000 description 6
- 230000030648 nucleus localization Effects 0.000 description 6
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 6
- 239000002336 ribonucleotide Substances 0.000 description 6
- 125000002652 ribonucleotide group Chemical group 0.000 description 6
- 108020004418 ribosomal RNA Proteins 0.000 description 6
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 6
- 239000000344 soap Substances 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 5
- 102000015735 Beta-catenin Human genes 0.000 description 5
- 108060000903 Beta-catenin Proteins 0.000 description 5
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 5
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 5
- 102000000331 Double-stranded RNA-binding domains Human genes 0.000 description 5
- 108050008793 Double-stranded RNA-binding domains Proteins 0.000 description 5
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 5
- 239000002202 Polyethylene glycol Substances 0.000 description 5
- 238000003559 RNA-seq method Methods 0.000 description 5
- 102100029064 Serine/threonine-protein kinase WNK1 Human genes 0.000 description 5
- 150000003838 adenosines Chemical class 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 230000002457 bidirectional effect Effects 0.000 description 5
- 102220414050 c.1839C>G Human genes 0.000 description 5
- 235000013922 glutamic acid Nutrition 0.000 description 5
- 239000004220 glutamic acid Substances 0.000 description 5
- 102000043770 human ADAR Human genes 0.000 description 5
- 150000002632 lipids Chemical class 0.000 description 5
- 102000026415 nucleotide binding proteins Human genes 0.000 description 5
- 108091014756 nucleotide binding proteins Proteins 0.000 description 5
- 230000037361 pathway Effects 0.000 description 5
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 5
- 230000000754 repressing effect Effects 0.000 description 5
- 102220012480 rs397516122 Human genes 0.000 description 5
- 238000011830 transgenic mouse model Methods 0.000 description 5
- 241001453380 Burkholderia Species 0.000 description 4
- 238000006117 Diels-Alder cycloaddition reaction Methods 0.000 description 4
- 101100490452 Drosophila melanogaster Adat1 gene Proteins 0.000 description 4
- 102000004533 Endonucleases Human genes 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 4
- 102100032606 Heat shock factor protein 1 Human genes 0.000 description 4
- 101000867525 Homo sapiens Heat shock factor protein 1 Proteins 0.000 description 4
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 4
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 4
- 101100385364 Listeria seeligeri serovar 1/2b (strain ATCC 35967 / DSM 20751 / CCM 3970 / CIP 100100 / NCTC 11856 / SLCC 3954 / 1120) cas13 gene Proteins 0.000 description 4
- 108700011259 MicroRNAs Proteins 0.000 description 4
- 206010029260 Neuroblastoma Diseases 0.000 description 4
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- 108020003562 Small Cytoplasmic RNA Proteins 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 4
- 108020004566 Transfer RNA Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 230000009918 complex formation Effects 0.000 description 4
- 239000005547 deoxyribonucleotide Substances 0.000 description 4
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 4
- 206010012601 diabetes mellitus Diseases 0.000 description 4
- 235000013399 edible fruits Nutrition 0.000 description 4
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 4
- 238000010363 gene targeting Methods 0.000 description 4
- 108010033706 glycylserine Proteins 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 4
- 239000002679 microRNA Substances 0.000 description 4
- 239000002105 nanoparticle Substances 0.000 description 4
- 150000004713 phosphodiesters Chemical class 0.000 description 4
- 230000000717 retained effect Effects 0.000 description 4
- 102220045004 rs587781750 Human genes 0.000 description 4
- 150000003457 sulfones Chemical class 0.000 description 4
- UWHCKJMYHZGTIT-UHFFFAOYSA-N tetraethylene glycol Chemical compound OCCOCCOCCOCCO UWHCKJMYHZGTIT-UHFFFAOYSA-N 0.000 description 4
- ZLHLYESIHSHXGM-UHFFFAOYSA-N 4,6-dimethyl-1h-imidazo[1,2-a]purin-9-one Chemical compound N=1C(C)=CN(C2=O)C=1N(C)C1=C2NC=N1 ZLHLYESIHSHXGM-UHFFFAOYSA-N 0.000 description 3
- 108700040115 Adenosine deaminases Proteins 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- YFDUWSBGVPBWKF-UHFFFAOYSA-N Butyl salicylate Chemical compound CCCCOC(=O)C1=CC=CC=C1O YFDUWSBGVPBWKF-UHFFFAOYSA-N 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 3
- 102100039223 Cytoplasmic polyadenylation element-binding protein 1 Human genes 0.000 description 3
- 101710143198 Cytoplasmic polyadenylation element-binding protein 1 Proteins 0.000 description 3
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 3
- 108090000204 Dipeptidase 1 Proteins 0.000 description 3
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 3
- 102100036698 Golgi reassembly-stacking protein 1 Human genes 0.000 description 3
- 102100027738 Heterogeneous nuclear ribonucleoprotein H Human genes 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- 101150067143 Hnrnph1 gene Proteins 0.000 description 3
- 101001072488 Homo sapiens Golgi reassembly-stacking protein 1 Proteins 0.000 description 3
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 241000186781 Listeria Species 0.000 description 3
- 101001000691 Medicago sativa Pectinesterase Proteins 0.000 description 3
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 3
- 101000907437 Mycoplasma hyopneumoniae (strain 232) Chaperone protein DnaK Proteins 0.000 description 3
- 239000004743 Polypropylene Substances 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 230000007022 RNA scission Effects 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 241000283907 Tragelaphus oryx Species 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 150000001345 alkine derivatives Chemical group 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- 150000001540 azides Chemical group 0.000 description 3
- 102000006635 beta-lactamase Human genes 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 102220346490 c.1423A>C Human genes 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 3
- 150000002148 esters Chemical class 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 229940029575 guanosine Drugs 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 3
- 102000044158 nucleic acid binding protein Human genes 0.000 description 3
- 108700020942 nucleic acid binding protein Proteins 0.000 description 3
- 230000007115 recruitment Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 102220013215 rs397516528 Human genes 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000004448 titration Methods 0.000 description 3
- 230000001988 toxicity Effects 0.000 description 3
- 231100000419 toxicity Toxicity 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 2
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical class O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 2
- QHPQWRBYOIRBIT-UHFFFAOYSA-N 4-tert-butylphenol Chemical compound CC(C)(C)C1=CC=C(O)C=C1 QHPQWRBYOIRBIT-UHFFFAOYSA-N 0.000 description 2
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 2
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 2
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 108010052875 Adenine deaminase Proteins 0.000 description 2
- 102100024090 Aldo-keto reductase family 1 member C3 Human genes 0.000 description 2
- 102100038495 Bile acid receptor Human genes 0.000 description 2
- ZUHQCDZJPTXVCU-UHFFFAOYSA-N C1#CCCC2=CC=CC=C2C2=CC=CC=C21 Chemical compound C1#CCCC2=CC=CC=C2C2=CC=CC=C21 ZUHQCDZJPTXVCU-UHFFFAOYSA-N 0.000 description 2
- 241000244203 Caenorhabditis elegans Species 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 102100026846 Cytidine deaminase Human genes 0.000 description 2
- 108010031325 Cytidine deaminase Proteins 0.000 description 2
- 108010020076 Cytochrome P-450 CYP2B1 Proteins 0.000 description 2
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 2
- 101710096438 DNA-binding protein Proteins 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 102000018825 Fanconi Anemia Complementation Group C protein Human genes 0.000 description 2
- 102100036118 Far upstream element-binding protein 1 Human genes 0.000 description 2
- 102100028818 Heterogeneous nuclear ribonucleoprotein L Human genes 0.000 description 2
- 101000930770 Homo sapiens Far upstream element-binding protein 1 Proteins 0.000 description 2
- 101000839078 Homo sapiens Heterogeneous nuclear ribonucleoprotein L Proteins 0.000 description 2
- 101000687317 Homo sapiens RNA-binding motif protein, X chromosome Proteins 0.000 description 2
- 101000712899 Homo sapiens RNA-binding protein with multiple splicing Proteins 0.000 description 2
- 101000655528 Homo sapiens Scaffold attachment factor B1 Proteins 0.000 description 2
- 102000010883 K Homology domains Human genes 0.000 description 2
- 108050001040 K Homology domains Proteins 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 201000003533 Leber congenital amaurosis Diseases 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 208000024556 Mendelian disease Diseases 0.000 description 2
- 201000011442 Metachromatic leukodystrophy Diseases 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical class C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 102100024939 RNA-binding motif protein, X chromosome Human genes 0.000 description 2
- 102100033135 RNA-binding protein with multiple splicing Human genes 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 102100032357 Scaffold attachment factor B1 Human genes 0.000 description 2
- 101001023030 Toxoplasma gondii Myosin-D Proteins 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 208000014769 Usher Syndromes Diseases 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 102000013814 Wnt Human genes 0.000 description 2
- 108050003627 Wnt Proteins 0.000 description 2
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical group C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- 150000001409 amidines Chemical class 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 2
- 235000013877 carbamide Nutrition 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 150000002170 ethers Chemical class 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 102000044898 human ADARB1 Human genes 0.000 description 2
- 210000003917 human chromosome Anatomy 0.000 description 2
- 229940042795 hydrazides for tuberculosis treatment Drugs 0.000 description 2
- 150000007857 hydrazones Chemical class 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 150000002466 imines Chemical class 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 201000006905 long QT syndrome 2 Diseases 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 150000002905 orthoesters Chemical class 0.000 description 2
- 150000002923 oximes Chemical class 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 125000006853 reporter group Chemical group 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000006798 ring closing metathesis reaction Methods 0.000 description 2
- ATHGHQPFGPMSJY-UHFFFAOYSA-N spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 description 2
- PFNFFQXMRSDOHW-UHFFFAOYSA-N spermine Chemical compound NCCCNCCCCNCCCN PFNFFQXMRSDOHW-UHFFFAOYSA-N 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 229940124530 sulfonamide Drugs 0.000 description 2
- 150000003456 sulfonamides Chemical class 0.000 description 2
- 150000003871 sulfonates Chemical class 0.000 description 2
- 150000003462 sulfoxides Chemical class 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 150000007970 thio esters Chemical class 0.000 description 2
- 150000003568 thioethers Chemical class 0.000 description 2
- 150000003585 thioureas Chemical class 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108091006107 transcriptional repressors Proteins 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- QQOWHRYOXYEMTL-UHFFFAOYSA-N triazin-4-amine Chemical class N=C1C=CN=NN1 QQOWHRYOXYEMTL-UHFFFAOYSA-N 0.000 description 2
- 150000003852 triazoles Chemical class 0.000 description 2
- ZIBGPFATKBEMQZ-UHFFFAOYSA-N triethylene glycol Chemical compound OCCOCCOCCO ZIBGPFATKBEMQZ-UHFFFAOYSA-N 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 150000003672 ureas Chemical class 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 238000012049 whole transcriptome sequencing Methods 0.000 description 2
- NNRFBVNRWVQADF-UHFFFAOYSA-N (2-aminohydrazinyl)urea Chemical compound NNNNC(N)=O NNRFBVNRWVQADF-UHFFFAOYSA-N 0.000 description 1
- DSGKWFGEUBCEIE-UHFFFAOYSA-N (2-carbonochloridoylphenyl) acetate Chemical compound CC(=O)OC1=CC=CC=C1C(Cl)=O DSGKWFGEUBCEIE-UHFFFAOYSA-N 0.000 description 1
- PZNPLUBHRSSFHT-RRHRGVEJSA-N 1-hexadecanoyl-2-octadecanoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)O[C@@H](COP([O-])(=O)OCC[N+](C)(C)C)COC(=O)CCCCCCCCCCCCCCC PZNPLUBHRSSFHT-RRHRGVEJSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- 150000005019 2-aminopurines Chemical class 0.000 description 1
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 1
- 125000001494 2-propynyl group Chemical group [H]C#CC([H])([H])* 0.000 description 1
- SVYBEBLNQGDRHF-UHFFFAOYSA-N 4-amino-N-(5-ethyl-1,3,4-thiadiazol-2-yl)benzenesulfonamide Chemical compound S1C(CC)=NN=C1NS(=O)(=O)C1=CC=C(N)C=C1 SVYBEBLNQGDRHF-UHFFFAOYSA-N 0.000 description 1
- BSFODEXXVBBYOC-UHFFFAOYSA-N 8-[4-(dimethylamino)butan-2-ylamino]quinolin-6-ol Chemical compound C1=CN=C2C(NC(CCN(C)C)C)=CC(O)=CC2=C1 BSFODEXXVBBYOC-UHFFFAOYSA-N 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 1
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102100032578 Adenosine deaminase domain-containing protein 1 Human genes 0.000 description 1
- 102100032577 Adenosine deaminase domain-containing protein 2 Human genes 0.000 description 1
- 241000024188 Andala Species 0.000 description 1
- 241000284466 Antarctothoa delta Species 0.000 description 1
- 241000269350 Anura Species 0.000 description 1
- 241001408449 Asca Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000611351 Bergeyella Species 0.000 description 1
- 102100027314 Beta-2-microglobulin Human genes 0.000 description 1
- 241000896810 Blepharella Species 0.000 description 1
- 201000004569 Blindness Diseases 0.000 description 1
- 102100040397 C->U-editing enzyme APOBEC-1 Human genes 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- 101100490563 Caenorhabditis elegans adr-1 gene Proteins 0.000 description 1
- 101100388220 Caenorhabditis elegans adr-2 gene Proteins 0.000 description 1
- 101100055199 Caenorhabditis elegans akap-1 gene Proteins 0.000 description 1
- 101100014702 Caenorhabditis elegans gld-1 gene Proteins 0.000 description 1
- 101100476671 Caenorhabditis elegans sart-3 gene Proteins 0.000 description 1
- 241000282461 Canis lupus Species 0.000 description 1
- 102000016362 Catenins Human genes 0.000 description 1
- 108010067316 Catenins Proteins 0.000 description 1
- 208000010693 Charcot-Marie-Tooth Disease Diseases 0.000 description 1
- 102000011591 Cleavage And Polyadenylation Specificity Factor Human genes 0.000 description 1
- 108010076130 Cleavage And Polyadenylation Specificity Factor Proteins 0.000 description 1
- 102100023774 Cold-inducible RNA-binding protein Human genes 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 102100024458 Cyclin-dependent kinase inhibitor 2A Human genes 0.000 description 1
- 241000035538 Cypridina Species 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- 102000000311 Cytosine Deaminase Human genes 0.000 description 1
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical group OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000044650 Deleted in Azoospermia 1 Human genes 0.000 description 1
- 108700042671 Deleted in Azoospermia 1 Proteins 0.000 description 1
- 102100033672 Deleted in azoospermia-like Human genes 0.000 description 1
- 101100126877 Dictyostelium discoideum ccbl gene Proteins 0.000 description 1
- LTMHDMANZUZIPE-AMTYYWEZSA-N Digoxin Natural products O([C@H]1[C@H](C)O[C@H](O[C@@H]2C[C@@H]3[C@@](C)([C@@H]4[C@H]([C@]5(O)[C@](C)([C@H](O)C4)[C@H](C4=CC(=O)OC4)CC5)CC3)CC2)C[C@@H]1O)[C@H]1O[C@H](C)[C@@H](O[C@H]2O[C@@H](C)[C@H](O)[C@@H](O)C2)[C@@H](O)C1 LTMHDMANZUZIPE-AMTYYWEZSA-N 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 241001653748 Doryteuthis pealeii Species 0.000 description 1
- 108700019024 Drosophila Adar Proteins 0.000 description 1
- 101000832777 Drosophila melanogaster Double-stranded RNA-specific editase Adar Proteins 0.000 description 1
- 208000037571 Ear-patella-short stature syndrome Diseases 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 102100036123 Far upstream element-binding protein 2 Human genes 0.000 description 1
- 241000589602 Francisella tularensis Species 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 241000963438 Gaussia <copepod> Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 102100035617 Heterogeneous nuclear ribonucleoprotein A/B Human genes 0.000 description 1
- 102100027706 Heterogeneous nuclear ribonucleoprotein D-like Human genes 0.000 description 1
- 102100033985 Heterogeneous nuclear ribonucleoprotein D0 Human genes 0.000 description 1
- 102100034000 Heterogeneous nuclear ribonucleoprotein F Human genes 0.000 description 1
- 102100028909 Heterogeneous nuclear ribonucleoprotein K Human genes 0.000 description 1
- 102100033993 Heterogeneous nuclear ribonucleoprotein L-like Human genes 0.000 description 1
- 102100028895 Heterogeneous nuclear ribonucleoprotein M Human genes 0.000 description 1
- 102100028896 Heterogeneous nuclear ribonucleoprotein Q Human genes 0.000 description 1
- 102100023999 Heterogeneous nuclear ribonucleoprotein R Human genes 0.000 description 1
- 102100033994 Heterogeneous nuclear ribonucleoproteins C1/C2 Human genes 0.000 description 1
- 102220470832 Histone deacetylase 7_S486A_mutation Human genes 0.000 description 1
- 101000797006 Homo sapiens Adenosine deaminase domain-containing protein 1 Proteins 0.000 description 1
- 101000796996 Homo sapiens Adenosine deaminase domain-containing protein 2 Proteins 0.000 description 1
- 101000906744 Homo sapiens Cold-inducible RNA-binding protein Proteins 0.000 description 1
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 description 1
- 101000871280 Homo sapiens Deleted in azoospermia-like Proteins 0.000 description 1
- 101000930766 Homo sapiens Far upstream element-binding protein 2 Proteins 0.000 description 1
- 101000854036 Homo sapiens Heterogeneous nuclear ribonucleoprotein A/B Proteins 0.000 description 1
- 101001081145 Homo sapiens Heterogeneous nuclear ribonucleoprotein D-like Proteins 0.000 description 1
- 101001017535 Homo sapiens Heterogeneous nuclear ribonucleoprotein D0 Proteins 0.000 description 1
- 101001017544 Homo sapiens Heterogeneous nuclear ribonucleoprotein F Proteins 0.000 description 1
- 101000838964 Homo sapiens Heterogeneous nuclear ribonucleoprotein K Proteins 0.000 description 1
- 101001017573 Homo sapiens Heterogeneous nuclear ribonucleoprotein L-like Proteins 0.000 description 1
- 101000839073 Homo sapiens Heterogeneous nuclear ribonucleoprotein M Proteins 0.000 description 1
- 101000839069 Homo sapiens Heterogeneous nuclear ribonucleoprotein Q Proteins 0.000 description 1
- 101001047853 Homo sapiens Heterogeneous nuclear ribonucleoprotein R Proteins 0.000 description 1
- 101001017574 Homo sapiens Heterogeneous nuclear ribonucleoproteins C1/C2 Proteins 0.000 description 1
- 101001138022 Homo sapiens La-related protein 1 Proteins 0.000 description 1
- 101000587083 Homo sapiens Methenyltetrahydrofolate synthase domain-containing protein Proteins 0.000 description 1
- 101000573451 Homo sapiens Msx2-interacting protein Proteins 0.000 description 1
- 101000979288 Homo sapiens Negative elongation factor E Proteins 0.000 description 1
- 101001091203 Homo sapiens Peptidyl-prolyl cis-trans isomerase E Proteins 0.000 description 1
- 101000945496 Homo sapiens Proliferation marker protein Ki-67 Proteins 0.000 description 1
- 101001077495 Homo sapiens RNA-binding Raly-like protein Proteins 0.000 description 1
- 101001077488 Homo sapiens RNA-binding protein Raly Proteins 0.000 description 1
- 101000709114 Homo sapiens SAFB-like transcription modulator Proteins 0.000 description 1
- 101000835998 Homo sapiens SRA stem-loop-interacting RNA-binding protein, mitochondrial Proteins 0.000 description 1
- 101000650621 Homo sapiens Septin-1 Proteins 0.000 description 1
- 101000657845 Homo sapiens Small nuclear ribonucleoprotein-associated proteins B and B' Proteins 0.000 description 1
- 101000891092 Homo sapiens TAR DNA-binding protein 43 Proteins 0.000 description 1
- 101000713909 Homo sapiens Tudor and KH domain-containing protein Proteins 0.000 description 1
- 101000617779 Homo sapiens U1 small nuclear ribonucleoprotein A Proteins 0.000 description 1
- 101000807859 Homo sapiens Vasopressin V2 receptor Proteins 0.000 description 1
- 101000805481 Homo sapiens Vigilin Proteins 0.000 description 1
- 102220622304 Huntingtin-associated protein 1_D10G_mutation Human genes 0.000 description 1
- 102000037978 Immune checkpoint receptors Human genes 0.000 description 1
- 108091008028 Immune checkpoint receptors Proteins 0.000 description 1
- 241000256602 Isoptera Species 0.000 description 1
- 201000008645 Joubert syndrome Diseases 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- 102100020859 La-related protein 1 Human genes 0.000 description 1
- 241000057444 Lactobacillus brevis subsp. coagulans Species 0.000 description 1
- 241000254158 Lampyridae Species 0.000 description 1
- 240000000599 Lentinula edodes Species 0.000 description 1
- 235000001715 Lentinula edodes Nutrition 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 241000589902 Leptospira Species 0.000 description 1
- 241000029590 Leptotrichia wadei Species 0.000 description 1
- 101150035573 MS2 gene Proteins 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 208000007794 Meier-Gorlin syndrome Diseases 0.000 description 1
- 102100029682 Methenyltetrahydrofolate synthase domain-containing protein Human genes 0.000 description 1
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 1
- 241000588622 Moraxella bovis Species 0.000 description 1
- 102100026285 Msx2-interacting protein Human genes 0.000 description 1
- 101100434310 Mus musculus Ada gene Proteins 0.000 description 1
- 101100013186 Mus musculus Fmr1 gene Proteins 0.000 description 1
- 101000995928 Mus musculus Nucleolar protein 58 Proteins 0.000 description 1
- 101100043441 Mus musculus Srsf12 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 101150076426 Ncbp2 gene Proteins 0.000 description 1
- 102100023070 Negative elongation factor E Human genes 0.000 description 1
- 108700021638 Neuro-Oncological Ventral Antigen Proteins 0.000 description 1
- 102100028102 Non-POU domain-containing octamer-binding protein Human genes 0.000 description 1
- 102220580210 Non-receptor tyrosine-protein kinase TYK2_D10A_mutation Human genes 0.000 description 1
- OSRWYQUSDMUYBS-UHFFFAOYSA-N OBO.OP(O)(O)=O Chemical compound OBO.OP(O)(O)=O OSRWYQUSDMUYBS-UHFFFAOYSA-N 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 101150029675 PP7 gene Proteins 0.000 description 1
- 108010047613 PTB-Associated Splicing Factor Proteins 0.000 description 1
- 102100034844 Peptidyl-prolyl cis-trans isomerase E Human genes 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 101150035718 Pno1 gene Proteins 0.000 description 1
- 241001116196 Prevotella saccharolytica Species 0.000 description 1
- 102100034836 Proliferation marker protein Ki-67 Human genes 0.000 description 1
- 241000192142 Proteobacteria Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000709748 Pseudomonas phage PRR1 Species 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 102000017742 Pumilio homology domains Human genes 0.000 description 1
- 108050005947 Pumilio homology domains Proteins 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 108020005067 RNA Splice Sites Proteins 0.000 description 1
- 102100038187 RNA binding protein fox-1 homolog 2 Human genes 0.000 description 1
- 102100025047 RNA-binding Raly-like protein Human genes 0.000 description 1
- 102100039692 RNA-binding motif, single-stranded-interacting protein 1 Human genes 0.000 description 1
- 102100025052 RNA-binding protein Raly Human genes 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000242739 Renilla Species 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241001478225 Riemerella Species 0.000 description 1
- 102100032664 SAFB-like transcription modulator Human genes 0.000 description 1
- 102100025491 SRA stem-loop-interacting RNA-binding protein, mitochondrial Human genes 0.000 description 1
- 201000006783 Seckel syndrome Diseases 0.000 description 1
- 102100034683 Small nuclear ribonucleoprotein-associated proteins B and B' Human genes 0.000 description 1
- 102100027780 Splicing factor, proline- and glutamine-rich Human genes 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 108091008874 T cell receptors Proteins 0.000 description 1
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 1
- 102100040347 TAR DNA-binding protein 43 Human genes 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 102100036460 Tudor and KH domain-containing protein Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 102100022013 U1 small nuclear ribonucleoprotein A Human genes 0.000 description 1
- 229910052770 Uranium Inorganic materials 0.000 description 1
- 241001311778 Uroteuthis chinensis Species 0.000 description 1
- 102100037108 Vasopressin V2 receptor Human genes 0.000 description 1
- 241000607269 Vibrio proteolyticus Species 0.000 description 1
- 102100037814 Vigilin Human genes 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 1
- SORGEQQSQGNZFI-UHFFFAOYSA-N [azido(phenoxy)phosphoryl]oxybenzene Chemical compound C=1C=CC=CC=1OP(=O)(N=[N+]=[N-])OC1=CC=CC=C1 SORGEQQSQGNZFI-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 230000012136 adenosine to inosine editing Effects 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 206010001902 amaurosis Diseases 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 201000002779 amyotrophic lateral sclerosis type 10 Diseases 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 238000010462 azide-alkyne Huisgen cycloaddition reaction Methods 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 102200020079 c.1374T>G Human genes 0.000 description 1
- 102220369206 c.1380C>G Human genes 0.000 description 1
- 102220347629 c.1529G>A Human genes 0.000 description 1
- 229940077731 carbohydrate nutrients Drugs 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000011203 carbon fibre reinforced carbon Substances 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 101150098304 cas13a gene Proteins 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000001332 colony forming effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000000536 complexating effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 210000003618 cortical neuron Anatomy 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 150000001982 diacylglycerols Chemical group 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 150000001985 dialkylglycerols Chemical class 0.000 description 1
- 150000001993 dienes Chemical class 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- LTMHDMANZUZIPE-PUGKRICDSA-N digoxin Chemical compound C1[C@H](O)[C@H](O)[C@@H](C)O[C@H]1O[C@@H]1[C@@H](C)O[C@@H](O[C@@H]2[C@H](O[C@@H](O[C@@H]3C[C@@H]4[C@]([C@@H]5[C@H]([C@]6(CC[C@@H]([C@@]6(C)[C@H](O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)C[C@@H]2O)C)C[C@@H]1O LTMHDMANZUZIPE-PUGKRICDSA-N 0.000 description 1
- 229960005156 digoxin Drugs 0.000 description 1
- LTMHDMANZUZIPE-UHFFFAOYSA-N digoxine Natural products C1C(O)C(O)C(C)OC1OC1C(C)OC(OC2C(OC(OC3CC4C(C5C(C6(CCC(C6(C)C(O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)CC2O)C)CC1O LTMHDMANZUZIPE-UHFFFAOYSA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 229940118764 francisella tularensis Drugs 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 125000001188 haloalkyl group Chemical group 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- BRWIZMBXBAOCCF-UHFFFAOYSA-N hydrazinecarbothioamide Chemical compound NNC(N)=S BRWIZMBXBAOCCF-UHFFFAOYSA-N 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 125000000743 hydrocarbylene group Chemical group 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 230000016784 immunoglobulin production Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 108700041430 link Proteins 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000001178 neural stem cell Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical group [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Chemical group 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 229920000768 polyamine Polymers 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229920000570 polyether Polymers 0.000 description 1
- 229920000120 polyethyl acrylate Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001451 polypropylene glycol Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 230000003334 potential effect Effects 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 102000003998 progesterone receptors Human genes 0.000 description 1
- 108090000468 progesterone receptors Proteins 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000007026 protein scission Effects 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000001718 repressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 102220334127 rs144614838 Human genes 0.000 description 1
- 102220245872 rs144862714 Human genes 0.000 description 1
- 102220285238 rs1553368595 Human genes 0.000 description 1
- 102220250553 rs1554455000 Human genes 0.000 description 1
- 102220244763 rs1555805380 Human genes 0.000 description 1
- 102220011658 rs200147804 Human genes 0.000 description 1
- 102220104442 rs200147804 Human genes 0.000 description 1
- 102220099002 rs201115573 Human genes 0.000 description 1
- 102200131219 rs267607597 Human genes 0.000 description 1
- 102220012463 rs397516106 Human genes 0.000 description 1
- 102220016951 rs397517892 Human genes 0.000 description 1
- 102220208978 rs561858384 Human genes 0.000 description 1
- 102220237325 rs562431619 Human genes 0.000 description 1
- 102220036871 rs587780095 Human genes 0.000 description 1
- 102220036981 rs587780151 Human genes 0.000 description 1
- 102220292668 rs749354249 Human genes 0.000 description 1
- 102220086772 rs749449032 Human genes 0.000 description 1
- 102220127770 rs749697583 Human genes 0.000 description 1
- 102220220394 rs759414746 Human genes 0.000 description 1
- 102220094837 rs771525293 Human genes 0.000 description 1
- 102220086104 rs774539871 Human genes 0.000 description 1
- 102220113897 rs775979333 Human genes 0.000 description 1
- 102220059923 rs777716061 Human genes 0.000 description 1
- 102220019061 rs80358616 Human genes 0.000 description 1
- 102220094419 rs876659332 Human genes 0.000 description 1
- 102220102992 rs878853861 Human genes 0.000 description 1
- 102220229891 rs878853861 Human genes 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 229940063673 spermidine Drugs 0.000 description 1
- 229940063675 spermine Drugs 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 1
- 125000004149 thio group Chemical group *S* 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 101150071238 tut1 gene Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/12—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
- A61K35/14—Blood; Artificial blood
- A61K35/17—Lymphocytes; B-cells; T-cells; Natural killer cells; Interferon-activated or cytokine-activated lymphocytes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3513—Protein; Peptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3519—Fusion with another nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04004—Adenosine deaminase (3.5.4.4)
Abstract
本发明提供了用于靶向和编辑核酸的系统、方法和组合物。特别地,本发明提供了非天然存在的或工程化的RNA靶向系统,所述系统包含靶向RNA的Cas13蛋白、至少一种指导分子和至少一种腺苷脱氨酶蛋白或其催化结构域。
Description
相关申请的交叉引用
本申请要求2017年6月26日提交的美国临时申请号62/525,181、2017年7月3日提交的美国临时申请号62/528,391、2017年7月18日提交的美国临时申请号62/534,016、2017年9月21日提交的美国临时申请号62/561,638、2017年10月4日提交的美国临时申请号62/568,304、2017年10月18日提交的美国临时申请号62/574,158、2017年11月27日提交的美国临时申请号62/591,187和2017年12月22日提交的美国临时申请号62/610,105的权益。以上确认的申请的全部内容特此以引用方式完全并入本文。
关于联邦资助研究的声明
本发明是根据由美国国立卫生研究院(National Institutes of Health)授予的授权号MH100706、MH110049和HL141201在政府支持下完成的。政府享有本发明的某些权利。
对以计算机可读格式共同归档的文档的引用
于2017年7月3日创建的大小为891,043字节的名为“Clin_var_pathogenic_SNPS_TC.txt”的ASCII兼容文本文件经由EFS-WEB与本发明一同提交,该文件的内容特此以引用方式并入本文。
发明领域
本发明总体上涉及用于靶向和编辑核酸,特别地用于目标靶基因座处腺嘌呤的可编程脱氨的系统、方法和组合物。
背景技术
在基因组测序技术和分析方法中的最新进展显著加速了对与范围广泛的生物功能和疾病相关联的遗传因子进行编目和映射的能力。精确的基因组靶向技术是通过允许个体遗传元件的选择性干扰而使得因果性遗传变异的系统性逆向工程化成为可能、以及推进合成生物学、生物技术应用、和医学应用所需要的。虽然基因组编辑技术,如设计师锌指、转录激活因子样效应子(TALE)、或归巢大范围核酸酶(homing meganuclease)对于产生靶向的基因组干扰是可得的,但是仍然需要采用新颖的策略和分子机制且是负担得起的、易于建立的、可扩展的、并且便于靶向真核基因组内的多个位置的新的基因组工程化技术。这将为基因组工程化和生物技术的新应用提供主要资源。
先前已经报道了胞嘧啶的可编程脱氨,其可用于校正A→G和T→C点突变。例如,Komor等人,Nature(2016)533:420-424报道了在非靶向DNA链中通过APOBEC1胞嘧啶脱氨酶进行的胞嘧啶脱氨,Cas9-指导RNA复合物与靶向DNA链的结合导致该非靶向DNA移位,从而使得胞嘧啶转化为尿嘧啶。另参见Kim等人,Nature Biotechnology(2017)35:371-376;Shimatani等人,Nature Biotechnology(2017)doi:10.1038/nbt.3833;Zong等人,NatureBiotechnology(2017)doi:10.1038/nbt.3811;Yang Nature Communication(2016)doi:10.1038/ncomms13330。
发明内容
本申请涉及修饰目标靶RNA序列。使用RNA靶向而非DNA靶向可以提供与治疗发展相关的若干优势。首先,靶向RNA有很大的安全益处:由于转录组中的可用序列空间显著小于基因组,因此将存在较少的脱靶事件,并且如果脱靶事件确实发生,那么它将是短暂的且不太可能带来负面的副作用。其次,RNA靶向治疗剂将更加有效,原因是它们不受细胞类型的影响,并且不必进入细胞核,从而使它们更易于递送。
本发明的至少第一方面涉及一种修饰目标靶RNA序列中的腺嘌呤的方法。在特定实施方案中,所述方法包括向所述靶RNA递送:(a)无催化活性的(死亡)Cas13蛋白;(b)指导分子,所述指导分子包含连接至正向重复序列的指导序列;和(c)腺苷脱氨酶蛋白或其催化结构域;其中所述腺苷脱氨酶蛋白或其催化结构域共价或非共价地连接至所述死亡Cas13蛋白或所述指导分子,或者适于在递送之后连接至所述死亡Cas13蛋白或所述指导分子;其中所述指导分子与所述死亡Cas13蛋白形成复合物并引导所述复合物结合所述目标靶RNA序列,其中所述指导序列能够与包含所述腺嘌呤的靶序列杂交以形成RNA双链体,其中所述指导序列在对应于所述腺嘌呤的位置处包含非配对胞嘧啶,导致在所形成的RNA双链体中出现A-C错配;其中所述腺苷脱氨酶蛋白或其催化结构域使所述RNA双链体中的所述腺嘌呤脱氨基。
在某些示例性实施方案中,所述Cas13蛋白是Cas13a、Cas13b或Cas 13c。
所述腺苷脱氨酶蛋白或其催化结构域融合至所述死亡Cas13蛋白的N端或C端。在某些示例性实施方案中,所述腺苷脱氨酶蛋白或其催化结构域通过接头融合至所述死亡Cas13蛋白。所述接头可以是(GGGGS)3-11(SEQ ID No.1-9)GSG5(SEQ ID No.10)或LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQ ID No.11)。
在某些示例性实施方案中,所述腺苷脱氨酶蛋白或其催化结构域连接至衔接蛋白,并且所述指导分子或所述死亡Cas13蛋白包含能够与所述衔接蛋白结合的适体序列。所述衔接序列可以选自MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、 7s和PRR1。
在某些示例性实施方案中,所述腺苷脱氨酶蛋白或其催化结构域插入到死亡Cas13蛋白的内环中。在某些示例性实施方案中,所述Cas13a蛋白在源自韦德纤毛菌(Leptotrichia wadei)的Cas 13a蛋白的两个HEPN结构域中,特别是在位置R474和R1046处,或在Cas13a直系同源物中的其相应氨基酸位置处包含一个或多个突变。
在某些示例性实施方案中,所述Cas 13蛋白是Cas13b蛋白,并且所述Cas13b在源自动物溃疡伯格菌(Bergeyella zoohelcum)ATCC 43767的Cas13b蛋白的位置R116、H121、R1177、H1182中的一个或多个位置中,或在Cas13b直系同源物中的其相应氨基酸位置中包含突变。在某些其他示例性实施方案中,所述突变是源自动物溃疡伯格菌ATCC 43767的Cas13b蛋白的R116A、H121A、R1177A、H1182A中的一者或多者,或Cas13b直系同源物的其相应氨基酸位置中的突变。
在某些示例性实施方案中,所述指导序列具有能够与所述靶序列形成所述RNA双链体的约29-53nt的长度。在某些其他示例性实施方案中,所述指导序列具有能够与所述靶序列形成所述RNA双链体的约40-50nt的长度。在某些示例性实施方案中,所述非配对C与所述指导序列的5’端之间的距离为20-30个核苷酸。
在某些示例性实施方案中,所述腺苷脱氨酶蛋白或其催化结构域是人类、头足类动物或果蝇腺苷脱氨酶蛋白或其催化结构域。在某些示例性实施方案中,已对所述腺苷脱氨酶蛋白或其催化结构域进行了修饰以包含在hADAR2-D氨基酸序列的谷氨酸488处、或同源ADAR蛋白中的相应位置处的突变。在某些示例性实施方案中,谷氨酸残基可以处于位置488或同源ADAR蛋白中的相应位置处,被谷氨酰胺残基替代(E488Q)。
在某些其他示例性实施方案中,所述腺苷脱氨酶蛋白或其催化结构域是包含突变E488Q的突变hADAR2d或包含突变E1008Q的突变hADAR1d。
在某些示例性实施方案中,所述指导序列包含不止一个对应于靶RNA序列中不同腺苷位点的错配,或者其中使用两个指导分子,每个指导分子均包含对应于靶RNA序列中不同腺苷位点的错配。
在某些示例性实施方案中,所述Cas13蛋白和任选地所述腺苷脱氨酶蛋白或其催化结构域包含一个或多个异源核定位信号(NLS)。
在某些示例性实施方案中,所述方法还包括确定所述目标靶序列以及选择最有效地使存在于所述靶序列中的所述腺嘌呤脱氨基的所述腺苷脱氨酶蛋白或其催化结构域。
目标靶RNA序列可以在细胞内部。所述细胞可以是真核细胞、非人类动物细胞、人类细胞、植物细胞。目标靶基因座可以在动物体内或者在植物内部。
目标靶RNA序列可以包含在体外RNA多核苷酸中。
可以将本文所述的系统的组分作为核糖核蛋白复合物或作为一种或多种多核苷酸分子递送至所述细胞。所述一种或多种多核苷酸分子可以包含一种或多种编码所述组分的mRNA分子。所述一种或多种多核苷酸分子可以包含在一种或多种载体内。所述一种或多种多核苷酸分子还可以包含可操作地配置成表达所述Cas13蛋白、所述指导分子和所述腺苷脱氨酶蛋白或其催化结构域的一个或多个调控元件,任选地其中所述一个或多个调控元件包括诱导型启动子。可以经由粒子、囊泡或一种或多种病毒载体递送所述一种或多种多核苷酸分子或所述核糖核蛋白复合物。所述粒子可以包含脂质、糖、金属或蛋白质。所述粒子可以包含脂质纳米粒子。所述囊泡可以包含外泌体或脂质体。所述一种或多种病毒载体可以包含一种或多种腺病毒、一种或多种慢病毒、或一种或多种腺相关病毒。
本文所公开的方法可用于通过操纵一个或多个靶RNA序列来修饰细胞、细胞系或生物体。
在某些示例性实施方案中,在所述目标靶RNA中所述腺嘌呤的所述脱氨补救了由含有病原性G→A或C→T点突变的转录物引起的疾病。
所述方法可用于治疗疾病。在某些示例性实施方案中,所述疾病选自梅尔-戈林综合征(Meier-Gorlin syndrome)、塞克尔综合征(Seckel syndrome)4、乔伯特综合征(Joubert syndrome)5、莱伯氏先天性黑蒙症(Leber congenital amaurosis)10;夏科-马里-图思病(Charcot-Marie-Tooth disease),2型;夏科-马里-图思病,2型;乌谢尔综合征(Usher syndrome),2C型;脊髓小脑性共济失调28;脊髓小脑性共济失调28;脊髓小脑性共济失调28;长QT综合征2;西奥格林-拉尔逊氏综合征(-Larsson syndrome);遗传性果糖尿病;遗传性果糖尿病;神经母细胞瘤;神经母细胞瘤;卡尔曼综合征(Kallmannsyndrome)1;卡尔曼综合征1;卡尔曼综合征1;异染性脑白质营养不良、雷特综合征(Rettsyndrome)、肌萎缩性侧索硬化症10型、李-佛美尼综合征(Li-Fraumeni syndrome),或表5中所列出的疾病。所述疾病可以是提前终止疾病。
本文所公开的方法可用于进行影响生物体能育性的修饰。所述修饰可以影响所述靶RNA序列的剪接。所述修饰可以在转录物中引入突变,从而引入氨基酸变化并引起癌细胞中新抗原的表达。
在某些示例性实施方案中,所述靶RNA可以是微小RNA或者包含在微小RNA中。在某些示例性实施方案中,在所述目标靶RNA中所述腺嘌呤的脱氨引起基因的功能获得或功能丧失。在某些示例性实施方案中,所述基因是由癌细胞表达的基因。
在另一方面,本发明包括使用本文所公开的方法获得的修饰的细胞或其子代,其中所述细胞与未经历所述方法的相应细胞相比,在所述目标靶RNA中包含次黄嘌呤或鸟嘌呤而非所述腺嘌呤。所述修饰的细胞或其子代可以是真核细胞、动物细胞、人类细胞、治疗性T细胞、产生抗体的B细胞、植物细胞。
在另一方面,本发明包括包含所述修饰的细胞或其子代的非人类动物。所述修饰细胞的可以是植物细胞。
在另一方面,本发明包括一种用于细胞疗法的方法,所述方法包括向有需要的患者施用本文所公开的修饰的细胞,其中所述修饰的细胞的存在补救了所述患者的疾病。
在另一方面,本发明涉及一种适用于修饰目标靶基因座中的腺嘌呤的工程化的非天然存在的系统,所述系统包含:A)包含连接至正向重复序列的指导序列的指导分子,或编码所述指导分子的核苷酸序列;B)无催化活性的Cas13蛋白,或编码所述无催化活性的Cas13蛋白的核苷酸序列;C)腺苷脱氨酶蛋白或其催化结构域,或编码所述腺苷脱氨酶蛋白或其催化结构域的核苷酸序列;其中所述腺苷脱氨酶蛋白或其催化结构域共价或非共价地连接至所述Cas13蛋白或所述指导分子,或者适于在递送之后连接至所述Cas13蛋白或所述指导分子;其中所述指导序列能够与包含腺嘌呤的靶RNA序列杂交以形成RNA双链体,其中所述指导序列在对应于所述腺嘌呤的位置处包含非配对胞嘧啶,导致在所形成的RNA双链体中出现A-C错配。
在另一方面,本发明涉及一种适用于修饰目标靶基因座中的腺嘌呤的工程化的非天然存在的载体系统,所述载体系统包含a)、b)和c)的核苷酸序列。
在另一方面,本发明涉及一种工程化的非天然存在的载体系统,所述载体系统包含一种或多种载体,所述一种或多种载体包含:第一调控元件,所述第一调控元件可操作地连接至编码包含所述指导序列的所述指导分子的核苷酸序列;第二调控元件,所述第二调控元件可操作地连接至编码所述无催化活性的Cas13蛋白的核苷酸序列;和编码腺苷脱氨酶蛋白或其催化结构域的核苷酸序列,所述核苷酸序列受所述第一调控元件或所述第二调控元件的控制或者可操作地连接至第三调控元件;其中如果所述编码腺苷脱氨酶蛋白或其催化结构域的核苷酸序列可操作地连接至所述第三调控元件,则所述腺苷脱氨酶蛋白或其催化结构域适于在表达之后连接至所述指导分子或所述Cas13蛋白;其中组分A)、组分B)和组分C)位于所述系统的相同或不同载体上。
由于本文所公开的方法证明了Cas13蛋白在哺乳动物细胞中结合RNA和特异性切割RNA的能力,因此其他扩展应用包括编辑剪接变体以及测量RNA结合蛋白与RNA相互作用的方式。
在另一方面,本发明涉及包含本文所公开的系统的体外或离体宿主细胞或其子代或者细胞系或其子代。所述宿主细胞或其子代可以是真核细胞、动物细胞、人类细胞或植物细胞。
在另一方面,本发明涉及一种腺苷脱氨酶蛋白或其催化结构域,并且包含如本文别处所述的一个或多个突变。
在某些实施方案中,这种腺苷脱氨酶蛋白或其催化结构域共价或非共价地连接至如本文别处所述的核酸结合分子或靶向结构域。因此,本发明还涉及包含所述腺苷脱氨酶蛋白或催化结构域和核酸结合分子的组合物,并且涉及所述腺苷脱氨酶蛋白或催化结构域与所述核酸结合分子的融合蛋白。
在另一方面,本发明涉及一种用于定点碱基编辑的工程化组合物,所述工程化组合物包含靶向结构域和腺苷脱氨酶或其催化结构域。在特定实施方案中,所述靶向结构域是寡核苷酸靶向结构域。在特定实施方案中,所述腺苷脱氨酶或其催化结构域包含一个或多个突变,相对于野生型,所述一个或多个突变增加了所述腺苷脱氨酶的活性或特异性。在特定实施方案中,所述腺苷脱氨酶包含一个或多个突变,相对于野生型,所述一个或多个突变改变了所述腺苷脱氨酶的功能性,优选地是如本文别处所述的所述腺苷脱氨酶使胞苷脱氨基的能力。在特定实施方案中,靶向结构域是包含CRISPR效应蛋白或其功能结构域和指导分子的CRISPR系统,更特别地是所述CRISPR系统是无催化活性的。在特定实施方案中,所述CRISPR系统包含RNA结合蛋白,优选地是Cas13,优选地是所述Cas13蛋白是Cas13a、Cas13b或Cas13c,优选地是其中所述Cas13是表1、表2、表3、表4或表6中任一项所列出的Cas13,或者是来自表1、表2、表3、表4或表6中任一项所列出的细菌种类,优选地是其中所述Cas13蛋白是普雷沃氏菌属种P5-125 Cas13b、咽喉卟啉单胞菌Cas13b或鸭疫里默氏杆菌Cas13b;优选地是普雷沃氏菌属种P5-125 Cas13b。在特定实施方案中,所述Cas13蛋白是Cas13a蛋白,并且所述Cas13a在源自韦德纤毛菌的Cas13a蛋白的两个HEPN结构域中,特别是在位置R474和R1046处,或在Cas13a直系同源物的其相应氨基酸位置处包含一个或多个突变,或者其中所述Cas13蛋白是Cas13b蛋白,并且所述Cas13b在源自动物溃疡伯格菌ATCC43767的Cas13b蛋白的位置R116、H121、R1177、H1182中的一个或多个位置处包含突变,优选地是R116A、H121A、R1177A、H1182A,或在Cas13b直系同源物的其相应氨基酸位置处包含突变,或者其中所述Cas13蛋白是Cas13b蛋白,并且所述Cas13b在源自普雷沃氏菌属种P5-125的Cas13b蛋白的位置R128、H133、R1053、H1058中的一个或多个位置处,优选地是在位置H133和H1058处包含突变,优选地是H133A和H1058A,或在如本文别处所述的Cas13b直系同源物的其相应氨基酸位置处包含突变,或者所述Cas13被截短,优选地是在C端被截短,优选地是其中所述Cas13是相应野生型Cas13的截短功能变体,任选地其中所述截短Cas13b由普雷沃氏菌属种P5-125 Cas13b的nt 1-984或Cas13b直系同源物或同系物的相应nt编码。
在特定实施方案中,所述靶向结构域的指导分子包含指导序列,所述指导序列能够与包含腺嘌呤的靶RNA序列杂交以形成RNA双链体,其中所述指导序列在对应于所述腺嘌呤的位置处包含非配对胞嘧啶,导致在所形成的RNA双链体中出现A-C错配。在特定实施方案中,所述指导序列具有能够与所述靶序列形成所述RNA双链体的约20-53nt、优选25-53nt、更优选29-53nt或40-50nt的长度,并且/或者其中所述指导序列的所述非配对C与5'末端之间的距离是20-30个核苷酸。在特定实施方案中,所述指导序列包含不止一个对应于所述靶RNA序列中的不同腺苷位点的错配,或者其中使用两种指导分子,每种指导分子均包含对应于所述靶RNA序列中的不同腺苷位点的错配。
在组合物的特定实施方案中,所述腺苷脱氨酶蛋白或其催化结构域任选地通过如本文别处所述的接头融合至所述靶向寡核苷酸的蛋白的N端或C端。或者,所述腺苷脱氨酶蛋白或其催化结构域插入到所述死亡Cas13蛋白的内环中。在另一个替代实施方案中,所述腺苷脱氨酶蛋白或其催化结构域连接至衔接蛋白,并且所述指导分子或所述死亡Cas13蛋白包含如本文别处所述的能够与所述衔接蛋白结合的适体序列。
在组合物的特定实施方案中,所述腺苷脱氨酶蛋白或其催化结构域能够使RNA中的腺苷或胞苷脱氨基,或者是RNA特异性腺苷脱氨酶并且/或者是细菌、人类、头足类动物或果蝇腺苷脱氨酶蛋白或其催化结构域,优选地是TadA,更优选地是ADAR,任选地是huADAR,任选地是(hu)ADAR1或(hu)ADAR2,优选地是huADAR2或其催化结构域。
在组合物的特定实施方案中,所述靶向结构域和任选地所述腺苷蛋白或其催化结构域优选地在C端包含一个或多个异源核输出信号(NES)或核定位信号(NLS),优选地是HIVRev NES或MAPK NES。
本发明的另一方面涉及用于预防性或治疗性治疗的如本文所设想的组合物,优选地是其中所述目标靶基因座在人类或动物体内,并且涉及修饰目标靶RNA序列中的腺嘌呤或胞苷的方法,所述方法包括将如上文所述的组合物递送至所述靶RNA。在特定实施方案中,任选地经由粒子、囊泡或一种或多种病毒载体作为一种或多种多核苷酸分子、作为核糖核蛋白复合物递送所述CRISPR系统和所述腺苷脱氨酶或其催化结构域。在特定实施方案中,所述组合物用于治疗或预防由含有病原性G→A或C→T点突变的转录物引起的疾病。因此,在特定实施方案中,本发明包括用于疗法的组合物。这意味着所述方法可以在体内,离体或者在体外进行。在特定实施方案中,所述方法不是治疗动物或人体的方法,也不是用于修饰人类细胞生殖系遗传特性的方法。在特定实施方案中;当实施所述方法时,人类细胞或动物细胞中不包含靶RNa。在特定实施方案中,当靶标是人类或动物靶标时,所述方法是离体或在体外进行的。
另一方面涉及一种从上述方法获得的或可以从上述方法获得的和/或包含上述组合物的分离的细胞或所述修饰的细胞的子代,优选地是其中所述细胞与未经历所述方法的相应细胞相比,在所述目标靶RNA中包含次黄嘌呤或鸟嘌呤而非所述腺嘌呤。在特定实施方案中,所述细胞是真核细胞,优选地是人类或非人类动物细胞,任选地是治疗性T细胞或产生抗体的B细胞,或者其中所述细胞是植物细胞。另一方面提供了一种包含所述修饰的细胞或其子代的非人类动物或植物。另一方面提供了如上文所述的修饰的细胞,其用于疗法,优选地是细胞疗法中。
附图说明
本发明的新颖特征在所附权利要求中具体阐述。通过参考阐述了其中利用了本发明原理的说明性实施方案的以下详细说明及其附图,将获得对本发明的特征和优点的更好理解:
图1示出了用于目标靶RNA序列处腺嘌呤的靶向脱氨的本发明的示例性实施方案,在本文中以Cas13b蛋白为例。
图2示出了RNA编辑作为在转录水平上(如当使用Cas13b时)治疗人类疾病的治疗策略的发展。通过靶向荧光素酶转录物中的工程化的早期终止密码子的Cas13-ADAR2融合进行RNA碱基编辑的示意图。
图3:用以恢复荧光素酶表达的指导物位置和长度优化。
图4:腺嘌呤脱氨酶蛋白的示例性序列。(SEQ ID No.650-656)
图5:示例性实施方案中所使用的指导物(SEQ ID No.657-660和703)
图6:编辑效率与编辑碱基有关,所述编辑碱基离DR更远且具有长RNA双链体,这可以通过延长指导物长度来实现。
图7:编辑位点离DR/蛋白质结合区越远,编辑效率越高。
图8:编辑位点离DR的距离
图9A和图9B:将ADAR1或ADAR2融合至Cas13b12(双R HEPN突变体)的N端或C端。指导物与荧光素酶中的终止密码子完美匹配。信号似乎与编辑碱基与指导物的5'末端之间的距离有关,较短的距离可以提供更好的编辑。
图10:用于Cas13a/Cas13b干扰的Cluc/Gluc平铺。
图11:通过NGS进行的ADAR编辑定量(荧光素酶报告基因)。
图12:通过NGS进行的ADAR编辑定量(KRAS和PPIB)。
图13:来自RNA Seq的Cas13a/b+shRNA特异性。
图14:用以减少脱靶的错配特异性(A:A或A:G)(SEQ ID No.661-668)
图15:用于中靶活性的错配。
图16:ADAR基序优选性
图17:用以增强RNA编辑效率的大气泡
图18:编辑转录物中的多个A(SEQ ID No.669-672)
图19:用于RNA编辑的指导物长度滴定
图20:哺乳动物密码子优化的Cas13b直系同源物介导高效RNA敲低。(A)代表性Cas13a、Cas13b和Cas13c基因座及相关crRNA的示意图。(B)用以测量HEK293FT细胞中的Cas13a切割活性的荧光素酶测定的示意图。(C)使用两种不同的靶向Cluc的指导物与19种Cas13a、15种Cas13b和5种Cas13c直系同源物进行的RNA敲低的效率。针对在非靶向指导物控制条件下的表达将荧光素酶表达归一化。(D)用两种不同的靶向Cluc的指导RNA,用三种不同的NLS和NES标签测定在C部分进行的前7个直系同源物的活性。(E)比较Cas13b12和Cas13a2(LwCas13a)针对Gluc和Cluc的敲低活性。将指导物沿转录物平铺,并且对Cas13b12与Cas13a2之间的指导物进行位置匹配。(F)Cas13a2、Cas13b6、Cas13b11和Cas13b12针对内源性KRAS转录物的指导物敲低,与相应的shRNA进行比较。
图21:Cas13酶介导哺乳动物细胞中的特异性RNA敲低。(A)用于Cas13a/b错配特异性测试的半简并靶序列的示意图。(SEQ ID No.673-694)(B)Cas13a/b的单错配敲低数据的热图。对于每种酶针对非靶向(NT)指导物将敲低归一化。(C)Cas13a的双错配敲低数据。每个错配的位置在X轴和Y轴上指示。敲低数据是给定位置集合的所有双错配的总和。对于每种酶针对(NT)指导物将数据归一化。(D)Cas13b的双错配敲低数据。有关说明,请参见C。(E)RNA-seq数据,比较了对于位置匹配的指导物Cas13 a/b和shRNA的全转录组特异性。Y轴表示靶向条件的读取计数,X轴表示非靶向条件的计数。(F)从Cas13 a/b和shRNA的RNA-seq数据计算的RNA表达。(G)来自RNA-seq数据的Cas13 a/b和shRNA的显著脱靶。使用FDR<0.05计算显著脱靶。
图22:无催化活性的Cas13b-ADAR融合物使得可以在哺乳动物细胞中进行靶向RNA编辑。(A)用Cas13b-ADAR融合蛋白进行RNA编辑以去除海萤(Cypridina)荧光素酶转录物上的终止密码子的示意图。(B)针对多个指导物位置,与野生型ADAR2融合的Cas13b和与超活性ADAR2 E488Q突变体融合的Cas13b之间的RNA编辑比较。针对海肾(Gaussia)荧光素酶对照值将荧光素酶表达归一化。(C)被设计来靶向编辑位点周围的不同位置的30、50、70和84nt指导物之间的RNA编辑比较。(D)周围基序序列对海萤荧光素酶转录物上的ADAR编辑效率的影响。(SEQ ID No.695)(E)显示用于测序定量的指导物相对于海萤荧光素酶转录物上的终止密码子的位置和长度的示意图。(F)如通过测序定量的,每种指导物设计在海萤荧光素酶转录物上的相应腺嘌呤碱基处的中靶和脱靶编辑效率。(G)具有与靶向腺嘌呤相对的不同碱基的指导物的荧光素酶读出。
图23:Cas13b-ADAR融合物的内源性RNA编辑。(A)对内源性KRAS和PPIB基因座的内源性Cas13b12-ADAR编辑的下一代测序。靶向每个转录物的两个不同区域,并且定量靶向腺嘌呤附近的所有腺嘌呤处的A->G编辑。
图24:确定最佳指导物位置的策略。
图25:(A)Cas13b-huADAR2促进突变荧光素酶转录物的修复。(B)Cas13b-huADAR1促进突变荧光素酶转录物的修复。(C)人类ADAR1和人类ADAR2的比较。
图26:E488Q与wt dADAR2编辑的比较。E488Q是dADAR2的超活性突变体。
图27:由Cas13b-huADAR2-E488Q靶向的转录物含有预期的A-G编辑。(A)热图。(B)模板中的位置。热图中仅示出A位点的至G编辑率。
图28:指导物的内源性平铺。(A)KRAS:热图。热图中仅示出A位点的至G编辑率。(B)模板中的位置(底部)。(C)PPIB:热图。热图中仅示出A位点的至G编辑率。模板中的位置(D)。
图29:非靶向编辑。
图30:接头优化。
图31:Cas13b ADAR可以用于纠正患者的在表达的cDNA中的病原性A>G突变。
图32:Cas13b-ADAR对5'G基序有轻微限制。
图33:筛选退化的PFS位置以影响编辑效率。所有PFS(4-N)种类的编辑度都高于非靶向种类。图A.(SEQ ID No.696-699)
图34:减少靶转录物中的脱靶编辑。
图35:减少靶转录物中的脱靶编辑。
图36:Cas13b-ADAR转录组特异性。中靶编辑是71%。(A)靶向指导物;482个显著位点。(B)非靶向指导物;949个显著位点。注意染色体0是Gluc并且染色体1是Cluc;之后按次序是人类染色体。
图37:Cas13b-ADAR转录组特异性。(A)靶向指导物。(B)非靶向指导物。
图38:与竞争性ADAR编辑策略相比,Cas13b具有最高的效率。
图39:竞争性RNA编辑系统。(A-B)BoxB;非靶向编辑是63%;(A)靶向指导物-2020个显著位点;(B)非靶向指导物-1805个显著位点。(C-D)Stafforst;非靶向编辑是36%;(C)靶向指导物-176个显著位点;(D)非靶向指导物-186个显著位点。
图40:ADAR的剂量滴定。crRNA的量是恒定的。
图41:剂量反应对特异性的影响。(A-B)150ng Cas13-ADAR;非靶向编辑是83%;(A)靶向指导物-1231个显著位点;(B)非靶向指导物-520个显著位点。(C-D)10ng Cas13-ADAR;非靶向编辑是80%;(C)靶向指导物-347个显著位点;(D)非靶向指导物-223个显著位点。
图42:ADAR1似乎比ADAR2更具特异性。中靶编辑是29%。(A)靶向指导物;11个显著位点。(B)非靶向指导物;6个显著位点。注意染色体0是Gluc并且染色体1是Cluc;之后按次序是人类染色体。
图43:ADAR特异性突变体具有增强的特异性。(A)靶向指导物。(B)非靶向指导物。(C)靶向指导物与靶向指导物之比。(D)靶向指导物和非靶向指导物。
图44:沿每个残基与RNA靶标的接触点绘制的ADAR突变体荧光素酶结果。
图45:ADAR特异性突变体具有增强的特异性。紫色点是选择用于全转录组脱靶NGS分析的突变体。红色点是起点(即E488Q突变体)。请注意,所有其他突变体也都具有E488Q突变。
图46:根据NGS,ADAR突变体更具特异性。(A)中靶。(B)脱靶。
图47:有关ADAR特异性突变体的荧光素酶数据与NGS匹配。(A)选择用于NGS的靶向指导物。(B)选择用于NGS的非靶向指导物。荧光素酶数据与图46中的NGS数据匹配。在非靶向指导物下具有较少活性的直系同源物在整个转录组中具有较少的脱靶,并且它们的中靶编辑效率可以通过靶向指导物荧光素酶条件来预测。
图48:Cas13b 12的C端截短物在ADAR编辑中仍然高度活跃。
图49:用于RNA敲低的高活性Cas13b直系同源物的表征结果A)常规Cas13基因座和相应crRNA结构的示意图。B)使用两种不同指导物评估19种Cas13a、15种Cas13b和7种Cas13c直系同源物的荧光素酶敲低。将使用两种指导物具有有效敲低的直系同源物标记上其宿主生物体名称。将值针对非靶向指导物进行归一化,所述非靶向指导物被设计来针对大肠杆菌LacZ转录物,与人类转录组没有同源性。C)通过针对Gluc平铺指导物并测量荧光素酶表达来比较PspCas13b和LwaCas13a敲低活性。值表示平均值+/–S.E.M.非靶向指导物与图49B中的相同。D)通过针对Cluc平铺指导物并测量荧光素酶表达来比较PspCas13b和LwaCas13a敲低活性。值表示平均值+/–S.E.M.非靶向指导物与图49B中的相同。E)针对LwaCas13a(红色)和shRNA(黑色)在非靶向对照(x轴)对比Gluc靶向条件(y轴)的RNA-seq文库中检测到的所有基因的以log2(每百万的转录物(TPM))值计的表达水平。显示的是三个生物学重复的平均值。标记了Gluc转录物数据点。非靶向指导物与图49B中的相同。F)针对PspCas13b(蓝色)和shRNA(黑色)在非靶向对照(x轴)对比Gluc靶向条件(y轴)的RNA-seq文库中检测到的所有基因的以log2(每百万的转录物(TPM))值计的表达水平。显示的是三个生物学重复的平均值。标记了Gluc转录物数据点。非靶向指导物与图49B中的相同。G)从E和F中的转录组范围分析获得的LwaCas13a、PspCas13b和shRNA的Gluc敲低的显著脱靶数量。
图50:用于RNA编辑的工程化dCas13b-ADAR融合物A)由dCas13b-ADAR融合蛋白进行的RNA编辑的示意图。将催化性死亡的Cas13b(dCas13b)融合至人类ADAR的脱氨酶结构域(ADARDD),后者天然地使dsRNA中的腺苷脱氨基成肌苷。crRNA通过与靶腺苷酸周围的碱基杂交,创建用于编辑的dsRNA结构并募集dCas13b-ADARDD融合物来指定靶位点。crRNA中与靶腺苷相对的胞苷错配会增强编辑反应,使靶腺苷脱氨基成肌苷,肌苷是许多细胞反应中在功能上模拟鸟苷的碱基。B)海萤荧光素酶W85X靶标和靶向指导物设计的示意图。(SEQ IDNo.700和701)靶腺苷的脱氨将终止密码子恢复为野生型色氨酸。间隔区长度是指导物中与靶序列同源的区域。错配距离是间隔区3'末端与错配胞苷之间的碱基数。将胞苷错配碱基作为错配距离计算的一部分包括在内。C)使用长度为30、50、70或84nt的平铺指导物的Cas13b-dADAR1(左)和Cas13b-ADAR2-cd(右)的荧光素酶活性恢复的定量。对于每个指导物长度,测试具有偶数错配距离的所有指导物。相对于30nt非靶向指导物,减去背景值,所述指导物是与人转录组无序列同源性的随机样本。D)用于靶向海萤荧光素酶W85X的靶标位点的示意图。(SEQ ID No.702)E)靶向海萤荧光素酶W85X的50nt指导物的A->I编辑的测序定量。蓝色三角形指示靶向腺苷。对于每种指导物,双链体RNA的区域以红色显示。值表示平均值+/–S.E.M.非靶向指导物与图50C中的相同。
图51:测量通过REPAIRv1进行RNA编辑的序列灵活性,筛选确定通过REPAIRv1进行RNA编辑的原间隔区侧接位点(PFS)优选性的示意图。将随机化PFS序列克隆到靶位点的5'端以进行REPAIR编辑。暴露于REPAIR之后,对来自靶位点和PFS的逆转录RNA进行深度测序,以使编辑的读段与PFS序列相关联。B)在两个不同的编辑位点,所有4-N PFS组合的RNA编辑效率分布。C)在所有可能的3碱基基序上,在Cluc W85处REPAIRv1的编辑百分比的定量结果。值表示平均值+/–S.E.M.非靶向指导物与图50C中的相同。D)针对所有可能的3碱基基序在Clue W85处进行RNA编辑的5'和3'碱基优选性的热图。
图52:使用REPAIRv1校正疾病相关突变A)用于靶向AVPR2 878G>A的靶标和指导物设计的示意图。(SEQ ID No.705-708)B)使用具有三种不同指导物设计的REPAIRv1以不同的百分比校正了AVPR2中的878G>A突变。对于每种指导物,双链体RNA的区域以红色显示。值表示平均值+/–S.E.M.非靶向指导物与图50C中的相同。C)用于靶向FANCC 1517G>A的靶标和指导物设计的示意图。(SEQ ID No.709-712)D)使用具有三种不同指导物设计的REPAIRv1以不同的百分比校正了FANCC中的1517G>A突变。对于每种指导物,双链体RNA的区域以红色显示。热图比例尺与板块B中的相同。值表示平均值+/-S.E.M.非靶向指导物与图50C中的相同。E)对使用REPAIRv1对34种不同的疾病相关G>A突变的编辑百分比的定量结果。非靶向指导物与图50C中的相同。F)对如通过ClinVar数据库所注释可以被校正的所有可能的G>A突变的分析结果。相对于如在Gluc转录物上定量的每基序而言的REPAIRv1的编辑效率,显示了ClinVar中所有G>A突变的编辑基序的分布。G)相对于如在Gluc转录物上定量的每基序而言的REPAIRv1的编辑效率,显示了ClinVar中所有G>A突变的编辑基序的分布。值表示平均值+/–S.E.M.
图53:表征REPAIRv1的特异性A)KRAS靶位点和指导物设计的示意图。(SEQ IDNo.713-720)B)平铺KRAS靶向指导物的编辑百分比的定量结果。显示了在中靶和相邻腺苷酸位点处的编辑百分比。对于每种指导物,双链体RNA的区域由红色矩形表示。值表示平均值+/–S.E.M.C)使用Cluc靶向指导物,REPAIRv1的全转录组显著RNA编辑位点。中靶位点Cluc位点(254A>G)以橙色突出显示。D)使用非靶向指导物,REPAIRv1(150ng转染的REPAIR载体)的全转录组显著RNA编辑位点。非靶向指导物与图50C中的相同。
图54:合理诱变ADAR2以提高REPAIRv1的特异性A)沿着关键ADAR2脱氨酶残基与dsRNA靶标之间的接触示意图绘制的各种dCas13-ADAR2突变体的荧光素酶信号恢复的定量结果及其特异性得分。所有脱氨酶突变均在dCas13-ADAR2DD(E488Q)背景上进行。特异性得分被定义为在靶向指导物与非靶向指导物条件之间的荧光素酶信号的比率。ADAR2脱氨酶结构域与dsRNA接触的示意图摘自参考文献(20)B)各种dCas13-ADAR2突变体的荧光素酶信号恢复的定量结果及其特异性评分。非靶向指导物与图50C中的相同。C)通过mRNA的全转录组测序得出的每个dCas13-ADAR2突变体的中靶编辑得分以及显著脱靶数量的测量结果。值表示平均值+/–S.E.M.非靶向指导物与图50C中的相同。D)使用靶向Cluc中的早期终止位点的指导物,REPAIRv1和REPAIRv2的全转录组显著RNA编辑位点。中靶Cluc位点(254A>G)以橙色突出显示。在每种条件下转染10ng REPAIR载体。E)围绕中靶Cluc编辑位点(SEQ IDNo.721)(254A>G)的RNA测序读取突出显示了REPAIRv1与REPAIRv2之间的脱靶编辑的差异。所有A>G编辑均以红色突出显示,而测序误差均以蓝色突出显示。间隙反映了对齐读取之间的间隔。非靶向指导物与图50C中的相同。F)使用靶向在内源性KRAS和PPIB转录物中的框外UAG位点的指导物通过REPAIRv1和REPAIRv2进行的RNA编辑。在每个条件行的右侧,将中靶编辑分数显示为横向条形图。由指导RNA形成的双链体区域由红色轮廓框显示。值表示平均值+/–S.E.M.非靶向指导物与图50C中的相同。
图55:用于Cas13b直系同源物的体内效率和PFS确定的细菌筛选。A)用于确定Cas13b直系同源物的PFS的细菌测定的示意图。将具有β-内酰胺酶靶向间隔区(SEQ IDNo.722)的Cas13b直系同源物与含有随机化PFS序列的β-内酰胺酶表达质粒共转化并进行双选择。在与Cas13b共转化过程中耗尽的PFS序列提示了靶向活性,并用于推断PFS优选性。B)如通过菌落形成单位(cfu)所测量的靶向β-内酰胺酶的Cas13b直系同源物的干扰活性的定量结果。值表示平均值+/-S.D。C)如通过耗尽序列从细菌测定中所确定的Cas13b直系同源物的PFS logo。PFS优选性是从在Cas13b条件下相对于空载体对照耗尽的序列中得出的。表7中列出了用于计算PFS weblogo的耗尽值。
图56:Cas13b敲低的优化和错配特异性的进一步表征。A)使用与多种核定位标签和核输出标签融合的前2个Cas13a和前4个Cas13b直系同源物来测量使用两种不同指导物的Gluc敲低。B)测量用四种不同指导物LwaCas13a、RanCas13b、PguCas13b和PspCas13b的KRAS敲低,并将其与四个位置匹配的shRNA对照物进行比较。非靶向指导物与图49B中的相同。表11中列出了shRNA非靶向指导序列。C)用于评估LwaCas13a和PspCas13b敲低的特异性的单错配和双错配质粒文库的示意图。每个可能的单错配和双错配都存在于靶序列中以及直接侧接靶位点5'端和3'端的3个位置中。(SEQ ID No.723-734)D)将具有指示的单错配的转录物的耗尽水平绘制为LwaCas13a和PspCas13b条件的热图。(SEQ ID No.723和736)野生型碱基以绿色框框出。E)将具有指示的双错配的转录物的耗尽水平绘制为LwaCas13a和PspCas13b条件的热图(SEQ ID No.723和736)。每个框表示指定位置所有可能的双错配的平均值。
图57:dCas13-ADAR2 RNA编辑的设计参数的表征结果A)野生型Cas13b和无催化活性的H133A/H1058A Cas13b(dCas13b)的Gluc靶向敲低效率。B)使用平铺Cluc靶向指导物测试的,融合至野生型ADAR2催化结构域或高活性E488Q突变型ADAR2催化催化结构域的dCas13b的荧光素酶活性恢复的定量结果。C)靶向海萤荧光素酶W85X的30nt指导物的指导物设计和A->I编辑的测序定量结果D)靶向PPIB的50nt指导物的指导物设计和A->I编辑的测序定量结果。E)接头选择对REPAIRv1的荧光素酶活性恢复的影响。F)靶向腺苷酸对面的碱基身份对REPAIRv1的荧光素酶活性恢复的影响(SEQ ID No.754和755)。值表示平均值+/–S.E.M.
图58:G>A突变的ClinVar基序分布。对于所有G>A突变在ClinVar数据库中观察到的每个可能的三联体基序的数量。
图59:dCas13b的截短仍然具有功能性RNA编辑。如对于Cluc W85X报告基因的荧光素酶信号的恢复所测量的,dCas13b的各种N端和C端截短允许RNA编辑。值表示平均值+/–S.E.M.构建体长度是指REPAIR构建体的编码序列。
图60:其他可编程ADAR系统与dCas13-ADAR2编辑器的比较。A)两种可编程ADAR方案的示意图:基于BoxB的靶向和全长ADAR2靶向。在BoxB方案中(顶图),将ADAR2脱氨酶结构域(ADAR2DD(E488Q))融合至称为兰布达N的小细菌病毒蛋白(其特异性地结合称为的小RNA序列),并且通过与靶位点和所结合的发夹具有同源性的指导RNA将融合蛋白募集到靶腺苷。全长ADAR2靶向利用与靶位点具有同源性的指导RNA和被ADAR2的双链RNA结合结构域识别的基序。然后,含有两个发夹的指导RNA可以指导ADAR2DD(E488Q)-进行位点特异性编辑。在全长ADAR2方案中(底图),ADAR2的dsRNA结合结构域结合指导RNA中的发夹,从而允许进行可编程的ADAR2编辑(SEQ ID No.756-760)。B)使用靶向Cluc的指导物和非靶向指导物,BoxB-ADAR2DD(E488Q)的全转录组显著RNA编辑位点。中靶Cluc位点(254A>G)以橙色突出显示。C)使用靶向Cluc的指导物和非靶向指导物,ADAR2的全转录组显著RNA编辑位点。中靶Cluc位点(254A>G)以橙色突出显示。D)使用靶向Cluc的指导物和非靶向指导物,REPAIRv1的全转录组显著RNA编辑位点。中靶Cluc位点(254A>G)以橙色突出显示。非靶向指导物与图50C中的相同。E)对于针对Cluc的靶向指导物,BoxB-ADAR2DD(E488Q)、ADAR2、和REPAIRv1的中靶编辑率百分比的定量结果。F)可编程的ADAR系统在不同靶向和非靶向条件之间的脱靶位点的重叠。绘制的值是两个脱靶数据集的最大可能交集的百分比。
图61:dCas13b-ADAR2突变体的效率和特异性A)对于Cluc靶向指导物和非靶向指导物,dCas13b-ADAR2DD(E488Q)突变体的荧光素酶活性恢复的定量结果。非靶向指导物与图50C中的相同。B)靶向指导物和非靶向指导物比率与如通过全转录组测序定量的RNA编辑脱靶数量之间的关系C)dCas13b-ADAR2DD(E488Q)突变体的全转录组脱靶RNA编辑位点数量与中靶Cluc编辑效率的定量结果。
图62:dCas13b-ADAR2DD(E488Q)突变体的全转录组RNA编辑特异性A)使用靶向Cluc的指导物,dCas13b-ADAR2DD(E488Q)突变体的全转录组显著RNA编辑位点。中靶Cluc位点(254A>G)以橙色突出显示。B)使用非靶向物,dCas13b-ADAR2DD(E488Q)突变体的全转录组显著RNA编辑位点。
图63:dCas13b-ADAR2DD(E488Q)编辑的脱靶中的基序偏倚的表征结果。A)对于每个dCas13b-ADAR2DD(E488Q)突变体,显示了转录组中所有A>G脱靶编辑中存在的基序。B)针对使用靶向指导物和非靶向指导物的REPAIRv1,显示了每基序身份的脱靶A>I编辑的分布。C)针对使用靶向指导物和非靶向指导物的REPAIRv2,显示了每基序身份的脱靶A>I编辑的分布。
图64:对REPAIRv1和REPAIRv2脱靶的进一步表征结果。A)REPAIRv1的每转录物脱靶数量的直方图。B)REPAIRv2的每转录物脱靶数量的直方图。C)REPAIRv1脱靶的变异效应预测。D)REPAIRv1脱靶在癌症相关基因中的分布。TSG、肿瘤阻遏基因。。E)REPAIRv2离靶的变异效应预测。F)REPAIRv2脱靶在癌症相关基因中的分布。
图65:REPAIRv1和REPAIRv2的RNA编辑效率和特异性。A)对于REPAIRv1和REPAIRv2,在靶向腺苷及相邻位点处使用KRAS靶向指导物1的情况下KRAS的编辑百分比的定量结果。对于每种指导物,双链体RNA的区域以红色显示。值表示平均值+/–S.E.M.非靶向指导物与图50C中的相同。B)对于REPAIRv1和REPAIRv2,在靶向腺苷及相邻位点处使用KRAS靶向指导物3的情况下KRAS的编辑百分比的定量结果。非靶向指导物与图50C中的相同。C)对于REPAIRv1和REPAIRv2,在靶向腺苷及相邻位点处使用PPIB靶向指导物2的情况下PPIB的编辑百分比的定量结果。非靶向指导物与图50C中的相同。
图66:使用A>I RNA编辑器,所有潜在密码子变化的展示。A)通过A>I编辑启用的所有潜在密码子转换的表。B)展示了通过A>I编辑启用的所有潜在密码子转换的密码子表。基于J.D.Watson,Molecular biology of the gene.(Pearson,Boston,编辑.第七版,2014),第xxxiv,872页(38)进行了改编和修改。C)经由指导序列中的错配对精确编码的核苷酸进行的REPAIR A至I编辑的模型。A至I转变是由ADAR2脱氨酶结构域的催化活性介导的,并且将被翻译机制读作鸟苷。碱基变化不依赖于内源性修复机制,只要RNA分子存在于细胞中就可以永久存在。D)REPAIR可以用于校正孟德尔疾病(Mendelian disease)突变。E)REPAIR可以用于多种变体的A至I多重编辑,以用于工程化途径或改变疾病。由于Cas13b酶加工其自身的阵列,因此可以通过递送单一CRISPR阵列表达盒来实现多重指导物递送。F)REPAIR可以用于通过影响酶结构域(诸如激酶)的氨基酸变化来修改蛋白质功能。G)REPAIR可以通过修饰剪接受体位点来调节转录物的剪接。
图67:Psp dCas13b的其他截短物。
图68:剂量对脱靶活性的潜在影响。
图69:Cas13直系同源物在哺乳动物细胞中的相对表达以及表达与干扰活性的相关性。A)如通过msfGFP荧光测量的Cas13直系同源物的表达。将C端带有msfGFP标签的Cas13直系同源物转染到HEK293FT细胞中,并在转染后48小时测量其荧光。B)Cas13表达与干扰活性的相关性。将由亚家族隔开的Cas13直系同源物的两个Gluc靶向指导物的平均RLU与通过msfGFP荧光测定的表达作图。针对非靶向指导物的RLU(其值设置为1)将靶向指导物的RLU归一化。非靶向指导物与图49B中Cas13b的指导物相同。
图70:dCas13b和REPAIRv1的RNA编辑活性的比较。A)用于靶向Cluc报告基因中的W85X突变的指导物示意图(SEQ ID No.911-917)B)dCas13b转染的指定指导物的A至I编辑的测序定量结果。对于每种指导物,双链体RNA的区域以红色显示。值表示平均值+/–S.E.M.非靶向指导物与图50C中的相同。C)用REPAIRv1转染的指定指导物的A至I编辑的测序定量结果。对于每种指导物,双链体RNA的区域以红色显示。值表示平均值+/–S.E.M.非靶向指导物与图50C中的相同。D)对于板块B和板块C中测试的指导物,dCas13b和dCas13b-ADAR2DD(E488Q)的中靶A至I编辑率的比较。E)靶腺苷对面的碱基身份对REPAIRv1的荧光素酶活性恢复的影响。值表示平均值+/–S.E.M.(SEQ ID No 754和755)
图71:在没有指导物的情况下评估的REPAIRv1编辑活性,以及与仅ADAR2脱氨酶结构域的比较。A)由有和没有指导物的REPAIRv1以及没有指导物的仅ADAR2脱氨酶结构域进行的Cluc W85X突变的A至I编辑的定量结果。值表示平均值+/–S.E.M.非靶向指导物与图50C中的相同。B)在板块A的REPAIRv1和ADAR2DD条件下差异表达的基因的数量。C)在板块A的REPAIRv1和ADAR2DD条件下显著脱靶的数量。D)板块A的REPAIRv1和ADAR2DD条件之间的脱靶A至I编辑事件的重叠。绘制的值是两个脱靶数据集的最大可能交集的百分比。
图72:脱靶序列与指导序列的相似性评估。A)使用Cluc靶向指导物,REPAIRv1的靶向指导序列与脱靶编辑位点之间的错配数(汉明距离)分布。B)使用Cluc靶向指导物,REPAIRv2的靶向指导序列与脱靶编辑位点之间的错配数(汉明距离)分布。
图73:两个不同载体剂量(150ng和10ng效应子)下,REPAIRv1、REPAIRv2、ADAR2RNA靶向和BoxB RNA靶向的比较。A)REPAIRv1、REPAIRv2、ADAR2 RNA靶向和BoxB RNA靶向方法的在Cluc W85X(254A>I)靶编辑位点处的RNA编辑活性的定量结果。使用靶向指导物或非靶向指导物对这四种方法中的每一种进行了测试。所显示的值是三次重复的平均值。B)REPAIRv1、REPAIRv2、ADAR2 RNA靶向和BoxB RNA靶向方法的RNA编辑脱靶的定量结果。使用针对Cluc W85X(254A>I)的靶向指导物或非靶向指导物对这四种方法中的每一种进行了测试。对于REPAIR构建体,非靶向指导物与图50C中的相同。
图74:REPAIRv1和REPAIRv2的RNA编辑效率和全基因组特异性。A)使用靶向指导物和非靶向指导物,REPAIRv1、REPAIRv2的在PPIB指导物1的中靶编辑位点处的RNA编辑活性的定量结果。值表示平均值+/–S.E.M.B)使用靶向指导物和非靶向指导物,REPAIRv1、REPAIRv2的在PPIB指导物2的中靶编辑位点处的RNA编辑活性的定量结果。值表示平均值+/–S.E.M。C)使用PPIB指导物1、PPIB指导物2或非靶向指导物,REPAIRv1或REPAIRv2的RNA编辑脱靶的定量结果。D)REPAIRv1的PPIB靶向、Cluc靶向和非靶向指导物之间的脱靶重叠。绘制的值是两个脱靶数据集的最大可能交集的百分比。
图75:REPAIRv1和REPAIRv2脱靶的高覆盖率测序。A)根据读取深度对REPAIRv1和REPAIRv2的脱靶编辑的定量结果,每种条件下总共有500万次读取(12.5x覆盖率)、1500万次读取(37.5x覆盖率)和5000万次读取(125x覆盖率)。B)在以下条件下,不同读取深度下的脱靶位点的重叠:REPAIRv1与REPAIRv1(左)、REPAIRv2与REPAIRv2(中)、以及REPAIRv1与REPAIRv2(右)。绘制的值是两个脱靶数据集的最大可能交集的百分比。C)在不同读取深度下,与REPAIRv1和REPAIRv2靶向条件的脱靶的覆盖率(log2(读取数))相比,脱靶位点的编辑率。D)在不同读取深度下,与REPAIRv1和REPAIRv2靶向条件的脱靶基因表达的log2(TPM+1)相比,脱靶位点的编辑率。
图76:U2OS细胞系中REPAIRv2活性和脱靶的定量结果。A)在U2OS细胞系中使用靶向Cluc的指导物,REPAIRv2的全转录组显著RNA编辑位点。中靶Cluc位点(254A>I)橙色突出显示。B)在U2OS细胞系中使用非靶向指导物,REPAIRv2的全转录组显著RNA编辑位点。C)在U2OS细胞系中使用靶向指导物或非靶向指导物,REPAIRv2的在Cluc W85X(254A>I)处的中靶编辑率。D)在U2OS细胞系中使用靶向Cluc的指导物或非靶向指导物,REPAIRv2的脱靶的定量结果。
图77:鉴定具有提高的效率和特异性的其他ADAR突变体。在荧光素酶靶标上测定在ADAR脱氨酶结构域中具有突变的Cas13b-ADAR融合物。更低的非靶向RLU指示更高的特异性。
图78:鉴定具有提高的效率和特异性的其他ADAR突变体。根据流式细胞术数据针对低、中和高破坏性突变选择突变体。
图79:鉴定具有提高的效率和特异性的其他ADAR突变体。
图80:鉴定具有提高的效率和特异性的其他ADAR突变体。
图81:通过在V351上进行饱和诱变来鉴定具有提高的效率和特异性的其他ADAR突变体。
图82:通过在T375上进行饱和诱变来鉴定具有提高的效率和特异性的其他ADAR突变体。
图83:通过在R455上进行饱和诱变来鉴定具有提高的效率和特异性的其他ADAR突变体。
图84:通过进行饱和诱变来鉴定具有提高的效率和特异性的其他ADAR突变体。
图85:3'结合环残基饱和诱变。
图86:选择具有提高的效率和特异性的ADAR突变体。筛选已鉴定出多个突变体,这些突变体与REPAIRv1相比具有提高的特异性,与REPAIRv1和REPAIRv2相比具有提高的活性。
图87:对具有其他E488突变的有前景的残基进行第二轮饱和诱变。
图88:对具有其他E488突变的有前景的残基进行第二轮饱和诱变。
图89:通过筛选鉴定的ADAR突变体的组合。
图90:通过筛选鉴定的ADAR突变体的组合。
图91:通过NGS测试最有前景的突变体。
图92:通过NGS测试最有前景的突变体。
图93:通过NGS测试最有前景的突变体。
图94:通过NGS测试最有前景的突变体。
图95:在现有构建体上寻找对于C-U活性最有前景的碱基翻转
图96:使用对于C->U活性最佳的指导物测试ADAR突变体
图97:针对C>U活性的验证V351突变体
图98:通过跨构建体测试淘选指导物,测试Cas13b-胞苷脱氨酶融合物。
图99:通过跨构建体测试淘选指导物,测试Cas13b-胞苷脱氨酶融合物。
图100是描绘融合至ADAR的Cas13b直系同源物表现出可变的蛋白质恢复和脱靶效应的图。将15种dCas13b直系同源物融合至ADAR融合并靶向以编辑海萤荧光素酶报告基因,该报告基因具有引入的早期终止位点,该早期终止位点在被校正后可以恢复荧光素酶功能。另外,还使用非靶向指导物来评估脱靶效应。REPAIRv1和REPAIRv2如Cox等人(2017)中所公布的。融合至ADAR的不同直系同源物表现出不同的恢复功能性荧光素酶的能力,以及不同的脱靶效应。特别地,与REPAIRv1相比,Cas12b6(鸭疫里默氏杆菌(RanCas13b))似乎具有更好的恢复功能性荧光素酶的能力以及更少的脱靶事件。选择标记为红色的点进行进一步的工程化和分析,因为这些是除了Cas13b12(REPAIRv1)以外,表现出最高的功能性蛋白恢复的两种直系同源物。
图101是显示针对所有直系同源物的编辑基因座的靶向测序的图。对编辑基因座的靶向下一代测序显示,大多数融合至ADAR的Cas13b直系同源物在靶腺苷处介导了真正的编辑事件。将直系同源物从上到下按从最低到最高的编辑百分比排序。特别地,尽管观察到Cas13b6表现出更高的功能性荧光素酶恢复率(图100),但REPAIRv1仍显示出在靶腺苷处更高的编辑事件百分比。另外,不同的直系同源物显示出在测序窗口内其他腺苷处的不同脱靶编辑百分比,并且特别地,Cas13b6在靶向和非靶向条件下在A33处的编辑均比REPAIRv1低得多,这与在荧光素酶测定中观察到的较低的脱靶信号一致(图100)。直系同源物之间的靶编辑与脱靶编辑之间的比率不一致,并且特别地,Cas13b6似乎可以使每脱靶编辑的中靶编辑量最大化。
图102是示出用于与腺相关病毒(AAV)一起递送的设计约束的示意图。AAV是一种临床相关的病毒递送载体,其用于有效包装和滴定病毒的包装限度为约4.7千碱基。然而,当包括启动子时,REPAIR要比这大得多。另外,理想的是在单个载体中递送整个系统(REPAIR融合蛋白+指导RNA),以便于生产和递送。因此选择Cas13b直系同源物以将其截短。
图103A是显示将Cas13b6的N端截短的结果的图。将每种直系同源物以20个氨基酸(60个碱基对)的间隔截短,最多将蛋白质的N端和C端各端的300个氨基酸(900个碱基对)截掉。然后通过前述荧光素酶校正测定评估RNA编辑活性。在靶向指导RNA条件下的荧光素酶恢复率在y轴上显示,而截短的Cas13b直系同源物的氨基酸尺寸在x轴上显示。在不同点截短会改变REPAIR融合物恢复荧光素酶功能的能力—相比全长Cas13b蛋白有些更好有些更坏,并且在不同的直系同源物中观察到不同的型式。图103B是显示将Cas13b6的C端截短的结果的图。对于Cas13b6,选择CΔ300截短是因为它具有最佳的活性和足够小的尺寸。
图104A是显示将Cas13b11的N端截短的结果的图。图104B是显示将Cas13b11的C端截短的结果的图。对于Cas13b11,选择NΔ280截短是因为它具有最佳的活性和足够小的尺寸。
图105A是显示将Cas13b12的N端截短的结果的图。图104B是显示将Cas13b12的C端截短的结果的图。对于Cas13b12,选择CΔ300截短是因为它具有最佳的活性和足够小的尺寸。
图106是显示在单个编辑位点上平铺指导RNA的图。编辑的靶标是荧光素酶报告基因中引入的提前终止密码子中的腺苷,如果被校正,该腺苷将使该位置的氨基酸恢复为色氨酸,由此恢复荧光素酶的功能。可以将具有50个和30个核苷酸间隔区的指导RNA平铺在此编辑位点上,以使靶腺苷处于指导RNA内的不同位置。使用全长和先前在前述三张幻灯片中提到的最佳截短物对这些指导物中的每一个都进行了评估。(SEQ ID No 700和701)
图107是显示具有不同指导RNA的Cas13b6结果的图。结果显示间隔区序列中的靶腺苷位置确实对编辑有影响。有趣的是,全长Cas13b和截短的Cas13b都显示出非常相似的型式,即在指导物内的最佳位置,但是不同的直系同源物表现出略微不同的型式,但是仍然是相对相似的(图108和图109)。一般来讲,对于A至I编辑而言,50bp的指导物似乎略胜一筹。在此在以下两张幻灯片上显示B11和B12(REPAIRv1)。
图108是显示具有不同指导RNA的Cas13b11结果的图。
图109是显示具有不同指导RNA的Cas13b12(REPAIRv1)结果的图。
图110是显示靶向KRAS的Cas13b6-REPAIR的图。在此图中,并非在单个编辑位置上移动指导物,而是将指导物的序列固定,并且每个指导RNA靶向固定序列内的不同腺苷。使用30和50个核苷酸的指导物,针对Cas13b6和Cas13b6CΔ300截短物评估了两个位点,如顶部示意图所示(SEQ ID No.918)。通过在编辑基因座上进行靶向下一代测序来评估编辑。同样,在指导物内不同的靶标位置显示了全长和截短的Cas13b6的不同的编辑率和型式。
图111是描绘定位标签可能影响中靶编辑的图。Cas13b6的不同定位标签(核定位标签和核出口标签)似乎会影响Cas13b6-REPAIR恢复荧光素酶活性的能力,但似乎不会明显影响脱靶活性。红色点是REPAIRv1和REPAIRv2,用于Cas13b12直系同源物且使用HIVNES,蓝色点用于Cas13b6直系同源物。
图112是显示RfxCas13d的结果的图。Cas13d是最近发现的一类Cas13蛋白,平均比Cas13b蛋白小。使用图106中所示的相同平铺指导物方案,在此图中测试了称为RfxCas13d的特征化Cas13d直系同源物的REPAIR活性。crRNA是指成熟的CRISPR RNA,而前crRNA是指未加工的版本。尽管在RfxCas13d-REPAIR情况下大多数指导RNA均未显示RNA编辑活性,但与以黑色显示的现有系统相比,似乎有些指导物介导了相对较好的编辑。
图113是显示用RfxCas13d进行的指导RNA介导的编辑的结果的图。数据显示,即使没有RfxCas13d-REPAIR或甚至没有ADAR,指导RNA(错配位置33)本身也能够以某种方式介导编辑事件(最左侧条件),而Cas13b12指导物则不然。此外,看起来ADAR或RfxCas13d-REPAIR的引入似乎并未对此指导RNA所介导的编辑产生太大影响。
图114是示出用于评估原代大鼠皮质神经元培养物中的RNA编辑的双载体系统设计的示意图。
图115是显示在具有双载体系统的神经元中实现高达35%的编辑的图。使用顶部示意图中所示的两个指导物(SEQ ID No.761,指导物1在指定位置具有一个碱基翻转/靶向腺苷,而指导物2具有两个靶向腺苷),使用图114中的双载体系统将带有B6/B11/B12的REPAIR包装到AAV中。在用AAV转导后14天,通过靶向下一代测序发现指导物2在B6-REPAIR情况下在A57处介导高达35%的编辑(B11-REPAIR为约30%),这表明AAV递送的REPAIR可以在有丝分裂后细胞类型中介导RNA碱基编辑。
图116是描绘单个载体AAV B6-REPAIR系统能够在神经元培养物中编辑RNA的图。使用图102中的单载体系统连同Cas13b6CΔ300截短,使用了图115中具有两个靶腺苷的指导物,以及跨相同序列但仅靶向A48的指导物(如所指出的那样)。用AAV转导后5天,靶向下一代测序显示使用指导物2在A24(与图115中的A57相同)处的编辑率大约为6%,这证明了单载体方法的可行性。
图117是描绘了融合至ADAR的不同Cas13b直系同源物的图。
图118是显示V351G编辑大大增加了REPAIR编辑的图。将V351G突变(pAB316)引入E488Q PspCas13b(Cas13b12)REPAIR构建体(REPAIR v1,pAB0048)中,并以TCG基序(TCG)测试高斯荧光素酶(gauss luciferase)构建体的C-U活性。通过下一代测序读出编辑,揭示了增加的C-U活性。
图119是显示内源性KRAS和PPIB靶向的图。将V351G突变(pAB316)引入E488QPspCas13b REPAIR构建体(REPAIR v1,pAB0048)中,并以不同基序测试高斯荧光素酶的四个位点(每个基因中两个位点)上的C-U活性。通过下一代测序读出编辑,揭示了增加的C-U活性。
图120是显示最佳V351G组合突变体的图。将所选位点(S486、G489)诱变为所有20个可能的残基,并在REPAIR[E488Q,V351G]的背景下进行测试。在两个荧光素酶基序TCG和GCG上测试构建体,并根据荧光素酶活性进行选择。
图121是显示S486A和V351G组合的C至U活性的图。在所有四个基序上均以[V351G,E488Q]背景和E488Q背景测试了S486A,并以荧光素酶活性作为读出。S486A在所有基序上都表现更好,尤其是在ACG和TCG上。
图122是显示S486A在所有基序上改善C至U编辑的图。当通过荧光素酶活性测量时,在[V351G,E488Q]背景上在所有基序上S486A都改善了靶向。
图123A是显示TCG和CCG靶向下的S486突变体C至U活性的图。图123B是显示仅CCG靶向下的S486突变体C至U活性的图。在所有四个基序上均以[V351G,E488Q]背景和E488Q背景测试了S486A,并以NGS作为读出。S486A在所有基序上都表现更好,尤其是在ACG和TCG上。
图124是显示S486A A至I活性的图。数据显示,当在荧光素酶报告基因上测量时,S486A突变保持先前构建体的A至I活性。
图125是显示S486A A至I脱靶活性的图。该数据显示,当在荧光素酶报告基因上测量时,S486A具有相当的A至I脱靶活性。
图126A是显示当通过荧光素酶活性(Gluc/Cluc RLU)读出时,S486A/V351G/E488Q(pAB493)、V351G/E488Q(pAB316)和E488Q(REPAIRv1)的靶向是相当的的图。图126B是显示当通过NGS(编辑分数)测定时,S486A/V351G/E488Q(pAB493)、V351G/E488Q(pAB316)和E488Q(REPAIRv1)的靶向是相当的的图。
图127A是显示通过NGS在Cluc报告基因构建体上测定的S486A C至U活性的图。图127B是显示通过NGS在内源性基因PPIB上测定的S486A C至U活性的图。
图128是描绘新T375和K376突变体的鉴定的图。将所选位点(T375、K376)诱变为所有20个可能的残基,并在REPAIR[E488Q,V351G]的背景下进行测试。在TCG荧光素酶基序上测试构建体,并根据荧光素酶活性进行选择。
图129是显示T375S具有松弛基序的图。在所有TCG和GCG基序上,以[S486A,V351G,E488Q]背景(pAB493)、[V351G,E488Q]背景(pAB316)和E488Q背景(pAB48)对T375S进行了测试,并以荧光素酶活性作为读出。T375S改善了GCG基序。
图130是显示T375S具有松弛基序的图。在GCG基序上,以[S486A,V351G,E488Q]背景(pAB493)、[V351G,E488Q]背景(pAB316)和E488Q背景(pAB48)对T375S进行了测试,并以荧光素酶活性作为读出。T375S改善了GCG基序。
图131是描绘B6和B11直系同源物显示出改善的RESCUE活性的图。针对T375S突变测试了Cas13b直系同源物Cas13b6(RanCas13b)和Cas13b11(PguCas13b),并且如通过荧光素酶测定所测量的显示出改善的活性。突变显示在相应的背景(T375S=T375S/S486A/V351G/E448Q)上。
图132是显示DNA2.0载体具有与瞬时转染载体相当的荧光素酶的图。与非慢病毒载体相比,具有Cas13b11(PguCas13b)的基于DN A2.0构建体的RESCUE载体(现在为Atum)显示出改善的荧光素酶活性。Atum载体图(https://benchling.com/s/seq-DENgx9izDhsRTFFgy71K)具有额外用于表达的EES元件。突变显示在相应的背景(V351G=V351G/E448Q,S486A=S486A/V351G/E448Q)上。
图133A是显示使用30bp的指导物利用RESCUE由REPAIR(B6CΔ300)验证的测试截短物的荧光素酶结果。图133B是显示使用50bp的指导物利用RESCUE由REPAIR(B6 CΔ300)验证的测试截短物的荧光素酶结果。对于全长版本和截短版本,26错配距离(如从5'末端测量的)显示出最佳活性。
图134A是显示使用30bp的指导物利用RESCUE由REPAIR(B11 NΔ280)验证的测试截短物的荧光素酶结果。图134B是显示使用50bp的指导物利用RESCUE由REPAIR(B11 NΔ280)验证的测试截短物的荧光素酶结果。对于全长版本和截短版本,26错配距离(如从5'末端测量的)显示出最佳活性。
图135是显示测试所有B6截短物的结果的图。从RanCas13b(B6)的N端和C端产生重复截短物,这些截短物具有T375S/S486A/V351G/E448Q突变,在CΔ200处达到最高活性,并且在CΔ320处具有活性。在荧光素酶上测试截短物,并将编辑作为荧光素酶活性读出。缺失的条指示没有数据。pAB0642是未截短的N端对照T375S/S486A/V351G/E448Q。pAB0440是未截短的C端对照E448Q。所有N端构建体和pAB0642均带有标记NES接头。所有C端构建体和pAB0440均具有HIV-NES接头。
图136是显示测试所有B11截短物的结果的图。从PguCas13b(B11)的N端和C端产生重复的截短物,这些截短物具有T375S/S486A/V351G/E448Q突变。在荧光素酶上测试截短物,并将编辑作为荧光素酶活性读出。
图137A是显示经由TCF-LEF RE Wnt途径报告基因(Promega)如通过β连环蛋白活性测量的REPAIR/RESCUE的β连环蛋白调节的图。图137B是显示如通过M50 Super 8xTOPFlash报告基因(Addgene)测量的REPAIR/RESCUE的β连环蛋白调节的图。通过使用RNA编辑以去除β连环蛋白上的磷酸化位点来测试β连环蛋白/Wnt途径诱导。针对REPAIR(RanCas13b直系同源物,E488Q突变)或RESCUE(RanCas13b直系同源物,T375S/S486A/V351G/E448Q突变)测试了靶向β连环蛋白的指导物的表型活性。T41A指导物显示出对两种报告因子的活性。
图138是显示β连环蛋白调节的NGS结果的图。REPAIR(RanCas13b直系同源物,E488Q突变)或RESCUE(RanCas13b直系同源物,T375S/S486A/V351G/E448Q突变)的在靶向位点处的A-I(A)或C-U(C)活性的NGS读出。REPAIR用于A靶标,并且RESCUE用于C靶标。
图139是描绘了不同平铺指导物在30_5突变(错配与指导物的5’端的距离为26nt)处显示出改善的基序活性的图。使用各种平铺指导物测试了所有四个基序的荧光素酶活性。术语对应于距间隔区3'端的距离(即26nt错配为30_5)。对于大多数基序,26错配距离(如从5'末端测量的)显示出最佳活性。使用RESCUE(RanCas13b直系同源物,T375S/S486A/V351G/E448Q突变)对指导物进行了测试。
图140A是显示REPAIR允许编辑与PTM相关联的残基的图。图140B是显示RESCUE允许编辑与PTM相关联的残基的图。
所附权利要求在此明确地以引用方式并入。
本文中的附图仅用于说明目的,而不一定按比例绘制。
具体实施方式
一般定义
除非另有规定,否则本文所用的技术和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同的含义。在分子生物学中常用的术语和技术的定义可以在以下文献中找到:Molecular Cloning:A Laboratory Manual,第2版(1989)(Sambrook、Fritsch和Maniatis);Molecular Cloning:A Laboratory Manual,第4版(2012)(Green和Sambrook);Current Protocols in Molecular Biology(1987)(F.M.Ausubel等人编辑);the seriesMethods in Enzymology(Academic Press,Inc.):PCR 2:A Practical Approach(1995)(M.J.MacPherson、B.D.Hames和G.R.Taylor编辑):Antibodies,A Laboraotry Manual(1988)(Harlow和Lane编辑):Antibodies A Laboraotry Manual,第2版2013(E.A.Greenfield编辑);Animal Cell Culture(1987)(R.I.Freshney编辑);BenjaminLewin,Genes IX,Jones and Bartlet出版,2008(ISBN 0763752223);Kendrew等人(编辑),The Encyclopedia of Molecular Biology,Blackwell Science Ltd.出版,1994(ISBN0632021829);Robert A.Meyers(编辑),Molecular Biology and Biotechnology:aComprehensive Desk Reference,VCH Publishers,Inc.出版,1995(ISBN9780471185710);Singleton等人,Dictionary of Microbiology and Molecular Biology第2版,J.Wiley&Sons(New York,N.Y.1994),三月,Advanced Organic ChemistryReactions,Mechanisms and Structure第4版,John Wiley&Sons(New York,N.Y.1992);和Marten H.Hofker和Jan van Deursen,Transgenic Mouse Methods and Protocols,第2版(2011)。
参考2016年6月17日提交的美国临时申请62/351,662和62/351,803、2016年8月17日提交的美国临时申请62/376,377、2016年10月19日提交的美国临时申请62/410,366、2016年12月9日提交的美国临时申请62/432,240、2017年3月15日提交的美国临时申请62/471,792和2017年4月12日提交的美国临时申请62/484,786。参考2017年6月19日提交的国际PCT申请PCT/US2017/038154。参考2017年3月15日提交的美国临时申请62/471,710(标题为“新颖Cas13B直系同源物CRISPR酶和系统(Novel Cas13B Orthologues CRISPR Enzymesand Systems)”,代理人编号:BI-10157 VP 47627.04.2149)。进一步参考2016年12月9日提交的美国临时申请62/432,553、2017年2月8日提交的美国临时申请62/456,645和2017年3月15日提交的美国临时62/471,930(标题为“基于CRISPR效应子系统的诊断(CRISPREffector System Based Diagnostics)”,代理人编号BI-10121 BROD 0842P),以及2017年4月12日提交的有待转让的美国临时申请(标题为“基于CRISPR效应子系统的诊断(CRISPREffector System Based Diagnostics)”,代理人BI-10121 BROD 0843P)。
除非上下文另有明确指示,否则如本文所用的单数形式“一个”、“一种”和“所述”包括单数和复数指示物。
术语“任选的”或“任选地”意指后续描述的事件、情形或替代物可能发生或可能不发生,并且该描述包括事件或情形发生的情况和不发生的情况。
通过端点表述的数值范围包括在对应范围内的所有数值和分数,以及所表述的端点。
如本文所用的术语“约”或“近似”当涉及诸如参数、量、时距等可测量的值时,有意涵盖指定值的变化和从指定值的变化,诸如指定值和从指定值+/-10%或更小、+/-5%或更小、+/-1%或更小和+/-0.1%或更小的变化,只要此类变化适于在所公开的发明中执行即可。应当理解,修饰语“约”或“近似”所涉及的值本身也是具体地且优选地公开的。
在本说明书通篇提及“一个实施方案”、“实施方案”、“示例性实施方案”意指结合实施方案描述的特定特征、结构或特性包括于本发明的至少一个实施方案中。因此,在本说明书通篇各处出现短语“在一个实施方案中”、“在实施方案中”或“示例性实施方案”不一定全部指代同一实施方案,但也有可能如此。此外,如本领域技术人员从本公开将明显了解的,在一个或多个实施方案中,特定特征、结构或特性可以按任何适合的方式组合。此外,虽然本文所述的一些实施方案包括其他实施方案中所包括的一些特征而非其他特征,但不同实施方案的特征的组合有意处于本发明的范围内。例如,在所附权利要求中,任何所要求保护的实施方案可以按任何组合使用。
先在将C2c2称为Cas13a。应当理解,本文中的术语“C2c2”与“Cas13a”可互换使用。
本文所引用的所有公布、公布的专利文献和专利申请特此以引用方式并入,如同每个单独公布、公布的专利文献或专利申请被确切地且单独地指明为以引用方式整体并入。
在下文中描述各种实施方案。应当指出的是,具体实施方案不旨在作为详尽的描述或作为对本文所论述的更广泛方面的限制。结合特定实施方案描述的一个方面不必限于该实施方案,而是可以与任何其他一个或多个实施方案一起实践。
综述
本文所公开的实施方案提供了用于靶向碱基编辑的系统、构建体和方法。一般来讲,本文所公开的系统包含靶向组分和碱基编辑组分。所述靶向组分的功能是将碱基编辑组分特异性地靶向其中一个或多个核苷酸有待被编辑的靶核苷酸序列。接着,碱基编辑组分可以催化化学反应,以将靶序列中的第一核苷酸转化为第二核苷酸。例如,碱基编辑器可以催化腺嘌呤的转化,使得其被细胞的转录或翻译机械装置读取为鸟嘌呤,反之亦然。同样地,碱基编辑组分可以催化胞苷转化为尿嘧啶,反之亦然。在某些示例性实施方案中,可以通过以诸如腺嘌呤脱氨酶或胞苷脱氨酶的已知碱基编辑器开始衍生碱基编辑器,并且使用诸如定向进化的方法对其进行修饰以衍生新的功能。定向进化技术在本领域中是已知的,并且可以包括在WO 2015/184016“遗传排列的高通量组装(High-Throughput Assembly ofGenetic Permuatations)”中描述的那些。应当理解,本发明在某些方面等同地涉及如本文所述并且已进行定向进化的脱氨酶本身,诸如本文别处所述的突变脱氨酶,连同如本文别处所述的编码此类脱氨酶的多核苷酸(包括载体和表达系统和/或递送系统),以及此类突变脱氨酶与靶向组分(诸如多核苷酸结合分子或系统)之间的融合物。
在一方面,本发明提供了用于通过腺苷脱氨酶或其修饰的变体对RNA或DNA中的腺嘌呤或胞苷进行靶向脱氨的方法。根据本发明的方法,腺苷脱氨酶(AD)蛋白被特异性地募集至待修饰的核酸。术语“AD官能化的组合物”是指本文所公开的用于定点碱基编辑的工程化组合物,所述组合物包含与腺苷脱氨酶或其催化结构域复合的靶向结构域。
在本发明方法的特定实施方案中,通过将腺苷脱氨酶或其催化结构域融合至靶向结构域来确保将腺苷脱氨酶募集至靶基因座。由两种分离的蛋白质产生融合蛋白的方法在本领域中是已知的,并且通常涉及间隔区或接头的使用。靶结构域可以在其N端或C端融合至腺苷脱氨酶蛋白或其催化结构域。
如关于融合蛋白使用的术语“接头”是指将所述蛋白连接以形成融合蛋白的分子。通常,除了连接蛋白质或保持蛋白质之间的一些最小距离或其他空间关系之外,此类分子不具有特殊的生物活性。然而,在某些实施方案中,可以选择接头以影响接头和/或融合蛋白的某些特性,诸如接头的折叠、净电荷或疏水性。
适用于本发明方法的接头是本领域技术人员所熟知的,并且包括但不限于直链或支链碳接头、杂环碳接头或肽接头。但是,如本文所用,接头还可以是共价键(碳-碳键或碳-杂原子键)。在特定实施方案中,接头用于将靶结构域和腺苷脱氨酶分开足以确保每种蛋白保留其所需功能特性的距离。优选的肽接头序列采用柔性的延伸构象,并且不表现出发展有序二级结构的倾向。在某些实施方案中,接头可以是化学部分,其可以是单体、二聚体、多聚体或聚合物。优选地,接头包含氨基酸。柔性接头中的典型氨基酸包括Gly、Asn和Ser。因此,在特定实施方案中,接头包含Gly、Asn和Ser氨基酸中的一种或多种的组合。其他接近中性的氨基酸,诸如Thr和Ala,也可以用于接头序列中。示例性接头公开于Maratea等人(1985),Gene 40:39-46;Murphy等人(1986)Proc.Nat'l.Acad.Sci.USA 83:8258-62;美国专利号4,935,233;和美国专利号4,751,180中。例如,可以使用GlySer接头GGS、GGGS或GSG。GGS、GSG、GGGS或GGGGS接头可以按3个(诸如(GGS)3(SEQ ID No.12)、(GGGGS)3)或5、6、7、9甚至12个(SEQ ID No.13)或更多个的重复使用,以提供合适的长度。在特定实施方案中,本文优选使用接头诸如(GGGGS)3。(GGGGS)6(GGGGS)9或(GGGGS)12可以优选用作替代方案。其他优选的替代方案是(GGGGS)1(SEQ ID No 14)、(GGGGS)2(SEQ ID No.15)、(GGGGS)4、(GGGGS)5、(GGGGS)7、(GGGGS)8、(GGGGS)10或(GGGGS)11。在又一个实施方案中,将LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQ ID No:11)用作接头。在又另一个实施方案中,接头是XTEN接头(SEQ ID No.761)。本发明还涉及一种用于通过靶向脱氨治疗或预防疾病或者使用AD官能化的组合物治疗或预防致病变体的方法。例如,A的脱氨可以补救由含有病原性G→A或C→T点突变的转录物引起的疾病。可以利用本发明来治疗或预防的疾病的实例包括癌症、梅尔-戈林综合征、塞克尔综合征4、乔伯特综合征5、莱伯氏先天性黑蒙症10;夏科-马里-图思病2型;夏科-马里-图思病2型;乌谢尔综合征2C型;脊髓小脑性共济失调28;脊髓小脑性共济失调28;脊髓小脑性共济失调28;长QT综合征2;西奥格林-拉尔逊氏综合征;遗传性果糖尿病;遗传性果糖尿病;神经母细胞瘤;神经母细胞瘤;卡尔曼综合征1;卡尔曼综合征1;卡尔曼综合征1;异染性脑白质营养不良。
因此,在特定实施方案中,本发明包括用于疗法的组合物。这意味着所述方法可以在体内,离体或者在体外进行。在特定实施方案中,所述方法不是治疗动物或人体的方法,也不是用于修饰人类细胞生殖系遗传特性的方法。在特定实施方案中;当实施所述方法时,人类细胞或动物细胞中不包含靶RNA。在特定实施方案中,当靶标是人类或动物靶标时,所述方法是离体或在体外进行的。
本发明还涉及一种用于敲除或敲低基因的不合需要的活性的方法,其中在所述基因的转录物处A或C的脱氨导致功能丧失。例如,在一个实施方案中,通过AD官能化的CRISPR系统进行靶向脱氨可引起无义突变,使得内源性基因中出现提前终止密码子。这可能改变内源性基因的表达,并使得编辑后的细胞具有期望的性状。在另一个实施方案中,通过AD官能化的组合物进行靶向脱氨可引起非保守的错义突变,使得内源性基因中出现不同氨基酸残基的密码。这可能改变内源性基因的功能,并使得编辑后的细胞具有期望的性状。
本发明还涉及一种通过使用AD官能化的组合物进行靶向脱氨而获得的修饰的细胞或其子代,其中与靶向脱氨之前的相应细胞相比,所述修饰的细胞在目标靶RNA中包含I或G而非A,或T而非C。修饰的细胞可以是真核细胞,诸如动物细胞、植物细胞、哺乳动物细胞或人类细胞。
在一些实施方案中,修饰的细胞是治疗性T细胞,诸如适于CAR-T疗法的T细胞。修饰可以使得在治疗性T细胞中出现一种或多种期望的性状,包括但不限于免疫检查点受体(例如PDA、CTLA4)的表达降低、HLA蛋白(例如B2M、HLA-A)的表达降低以及内源性TCR的表达降低。
在一些实施方案中,修饰的细胞是产生抗体的B细胞。修饰可以使得在B细胞中出现一种或多种期望的性状,包括但不限于抗体产生增强。
本发明还涉及一种修饰的非人类动物或修饰的植物。修饰的非人类动物可以是农场动物。修饰的植物可以是农作物。
本发明还涉及一种用于细胞疗法的方法,所述方法包括向有需要的患者施用本文所述的修饰的细胞,其中所述修饰的细胞的存在补救了所述患者的疾病。在一个实施方案中,用于细胞疗法的修饰的细胞是能够识别和/或攻击肿瘤细胞的CAR-T细胞。在另一个实施方案中,用于细胞疗法的修饰的细胞是干细胞,诸如神经干细胞、间充质干细胞、造血干细胞或iPSC细胞。
本发明另外涉及一种适用于修饰目标靶基因座中的腺嘌呤或胞苷的工程化的非天然存在的系统,所述系统包括:靶向结构域;腺苷脱氨酶蛋白或其催化结构域,或编码所述腺苷脱氨酶蛋白或其催化结构域的一个或多个核苷酸序列;其中所述腺苷脱氨酶蛋白或其催化结构域共价或非共价地连接至所述靶向结构域,或者适于在递送之后连接至所述靶向结构域;其中所述靶向结构域能够与目标RNA或DNA多核苷酸内包含腺嘌呤或胞苷的靶序列杂交。
本发明还涉及一种适用于修饰目标靶基因座中的腺嘌呤或胞苷的工程化的非天然存在的载体系统,所述载体系统包含一种或多种载体,所述一种或多种载体包含:(a)第一调控元件,所述第一调控元件可操作地连接至一个或多个编码编码靶向结构域的核苷酸序列;和(b)任选地编码腺苷脱氨酶蛋白或其催化结构域的核苷酸序列,所述核苷酸序列受第一调控序列的控制或者可操作地连接至第二调控元件;其中,如果所述编码腺苷脱氨酶蛋白或其催化结构域的核苷酸序列可操作地连接至第二调控元件,则所述腺苷脱氨酶蛋白或其催化结构域适于在表达之后连接至所述靶向结构域;其中所述靶向结构域能够与所述靶基因座内包含腺嘌呤或胞苷的靶序列杂交;其中组分(a)和组分(b)位于所述系统的相同或不同载体上。
本发明另外涉及包含本文所述的工程化的非天然存在的系统或载体系统的体外、离体或体内宿主细胞或细胞系或其子代。宿主细胞可以是真核细胞,诸如动物细胞、植物细胞、哺乳动物细胞或人类细胞。
腺苷脱氨酶
如本文所用,术语“腺苷脱氨酶”或“腺苷脱氨酶蛋白”是指能够催化如下所示的将腺嘌呤(或分子的腺嘌呤部分)转化为次黄嘌呤(或分子的次黄嘌呤部分)的水解脱氨反应的蛋白质、多肽或蛋白质或多肽的一个或多个功能结构域。在一些实施方案中,含腺嘌呤的分子是腺苷(A),而含次黄嘌呤的分子是肌苷(I)。含腺嘌呤的分子可以是脱氧核糖核酸(DNA)或核糖核酸(RNA)。
根据本公开,可以与本公开结合使用的腺苷脱氨酶包括但不限于称为作用于RNA的腺苷脱氨酶(ADAR)的酶家族成员、称为作用于tRNA的腺苷脱氨酶(ADAT)的酶家族成员,以及其他含腺苷脱氨酶结构域(ADAD)的家族成员。根据本公开,腺苷脱氨酶能够靶向RNA/DNA和RNA双链体中的腺嘌呤。实际上,Zheng等人(Nucleic Acids Res.2017,45(6):3369-3377)证明ADAR可以在RNA/DNA和RNA/RNA双链体上实现腺苷到肌苷的编辑反应。在特定实施方案中,如下文所详述,已对腺苷脱氨酶进行了修饰以增强其编辑RNA/DNAn RNA双链体中的DNA的能力。
在一些实施方案中,腺苷脱氨酶来源于一种或多种后生动物种类,包括但不限于哺乳动物、鸟、青蛙、鱿鱼、鱼、蝇和蠕虫。在一些实施方案中,腺苷脱氨酶是人类、鱿鱼或果蝇腺苷脱氨酶。
在一些实施方案中,腺苷脱氨酶是人类ADAR,包括hADAR1、hADAR2、hADAR3。在一些实施方案中,腺苷脱氨酶是秀丽隐杆线虫(Caenorhabditis elegans)ADAR蛋白,包括ADR-1和ADR-2。在一些实施方案中,腺苷脱氨酶是果蝇ADAR蛋白,包括dAdar。在一些实施方案中,腺苷脱氨酶是鱿鱼近海长鳍鱿鱼(Loligo pealeii)ADAR蛋白,包括sqADAR2a和sqADAR2b。在一些实施方案中,腺苷脱氨酶是人类ADAT蛋白。在一些实施方案中,腺苷脱氨酶是果蝇ADAT蛋白。在一些实施方案中,腺苷脱氨酶是人类ADAD蛋白,包括TENR(hADAD1)和TENRL(hADAD2)。
在一些实施方案中,腺苷脱氨酶是TadA蛋白,诸如大肠杆菌TadA。参见Kim等人,Biochemistry 45:6407-6416(2006);Wolf等人,EMBO J.21:3841-3851(2002)。在一些实施方案中,腺苷脱氨酶是小鼠ADA。参见Grunebaum等人,Curr.Opin.AllergyClin.Immunol.13:630-638(2013)。在一些实施方案中,腺苷脱氨酶是人类ADAT2。参见Fukui等人,J.Nucleic Acids 2010:260512(2010)。
在一些实施方案中,腺苷脱氨酶蛋白识别双链核酸底物中的一个或多个靶腺苷残基并将其转化为一个或多个肌苷残基。在一些实施方案中,双链核酸底物是RNA-DNA杂合双链体。在一些实施方案中,腺苷脱氨酶蛋白识别双链底物上的结合窗口。在一些实施方案中,结合窗口含有至少一个靶腺苷残基。在一些实施方案中,结合窗口在约3bp至约100bp的范围内。在一些实施方案中,结合窗口在约5bp至约50bp的范围内。在一些实施方案中,结合窗口在约10bp至约30bp的范围内。在一些实施方案中,结合窗口为约1bp、2bp、3bp、5bp、7bp、10bp、15bp、20bp、25bp、30bp、40bp、45bp、50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp或100bp。
在一些实施方案中,腺苷脱氨酶蛋白包含一个或多个脱氨酶结构域。不意欲受理论的束缚,预期脱氨酶结构域用于识别双链核酸底物中所含的一个或多个靶腺苷(A)残基并将其转化为一个或多个肌苷(I)残基。在一些实施方案中,脱氨酶结构域包含活性中心。在一些实施方案中,活性中心包含锌离子。在一些实施方案中,在A至I编辑过程中,靶腺苷残基处的碱基配对被破坏,并且靶腺苷残基从双螺旋中“翻转”出来以变得可被腺苷脱氨酶接近。在一些实施方案中,在活性中心内或附近的氨基酸残基与靶腺苷残基5’端的一个或多个核苷酸相互作用。在一些实施方案中,在活性中心内或附近的氨基酸残基与靶腺苷残基3’端的一个或多个核苷酸相互作用。在一些实施方案中,在活性中心内或附近的氨基酸残基进一步与相反链上与靶腺苷残基互补的核苷酸相互作用。在一些实施方案中,氨基酸残基与核苷酸的2’羟基形成氢键。
在一些实施方案中,腺苷脱氨酶包含人类ADAR2全蛋白(hADAR2)或其脱氨酶结构域(hADAR2-D)。在一些实施方案中,腺苷脱氨酶是与hADAR2或hADAR2-D同源的ADAR家族成员。
特别地,在一些实施方案中,同源ADAR蛋白是人类ADAR1(hADAR1)或其脱氨酶结构域(hADAR1-D)。在一些实施方式中,hADAR1-D的甘氨酸1007对应于甘氨酸487hADAR2-D,而hADAR1-D的谷氨酸1008对应于hADAR2-D的谷氨酸488。
在一些实施方案中,腺苷脱氨酶包含hADAR2-D的野生型氨基酸序列。在一些实施方案中,腺苷脱氨酶包含在hADAR2-D序列中的一个或多个突变,这样hADAR2-D的编辑效率和/或底物编辑优选性可根据特定需要而改变。
hADAR1和hADAR2蛋白的某些突变已描述于Kuttan等人,Proc Natl Acad Sci U SA.(2012)109(48):E3295-304;Want等人ACS Chem Biol.(2015)10(11):2512-9;和Zheng等人Nucleic Acids Res.(2017)45(6):3369-337,所述文献各自以引用方式整体并入本文。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的甘氨酸336处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置336处的甘氨酸残基被天冬氨酸残基替代(G336D)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的甘氨酸487处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置487处的甘氨酸残基被具有相对小的侧链的非极性氨基酸残基替代。例如,在一些实施方案中,位置487处的甘氨酸残基被丙氨酸残基替代(G487A)。在一些实施方案中,位置487处的甘氨酸残基被缬氨酸残基替代(G487V)。在一些实施方案中,位置487处的甘氨酸残基被具有相对大的侧链的氨基酸残基取代。在一些实施方案中,位置487处的甘氨酸残基被精氨酸残基替代(G487R)。在一些实施方案中,位置487处的甘氨酸残基被赖氨酸残基替代(G487K)。在一些实施方案中,位置487处的甘氨酸残基被色氨酸残基替代(G487W)。在一些实施方案中,位置487处的甘氨酸残基被酪氨酸残基替代(G487Y)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的谷氨酸488处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置488处的谷氨酸残基被谷氨酰胺残基替代(E488Q)。在一些实施方案中,位置488处的谷氨酸残基被组氨酸残基替代(E488H)。在一些实施方案中,位置488处的谷氨酸残基被精氨酸残基替代(E488R)。在一些实施方案中,位置488处的谷氨酸残基被赖氨酸残基替代(E488K)。在一些实施方案中,位置488处的谷氨酸残基被天冬酰胺残基替代(E488N)。在一些实施方案中,位置488处的谷氨酸残基被丙氨酸残基替代(E488A)。在一些实施方案中,位置488处的谷氨酸残基被甲硫氨酸残基替代(E488M)。在一些实施方案中,位置488处的谷氨酸残基被丝氨酸残基替代(E488S)。在一些实施方案中,位置488处的谷氨酸残基被苯丙氨酸残基替代(E488F)。在一些实施方案中,位置488处的谷氨酸残基被赖氨酸残基替代(E488L)。在一些实施方案中,位置488处的谷氨酸残基被色氨酸残基替代(E488W)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的苏氨酸490处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置490处的苏氨酸残基被半胱氨酸残基替代(T490C)。在一些实施方案中,位置490处的苏氨酸残基被丝氨酸残基替代(T490S)。在一些实施方案中,位置490处的苏氨酸残基被丙氨酸残基替代(T490A)。在一些实施方案中,位置490处的苏氨酸残基被苯丙氨酸残基替代(T490F)。在一些实施方案中,位置490处的苏氨酸残基被酪氨酸残基替代(T490Y)。在一些实施方案中,位置490处的苏氨酸残基被丝氨酸残基替代(T490R)。在一些实施方案中,位置490处的苏氨酸残基被丙氨酸残基替代(T490K)。在一些实施方案中,位置490处的苏氨酸残基被苯丙氨酸残基替代(T490P)。在一些实施方案中,位置490处的苏氨酸残基被酪氨酸残基替代(T490E)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的缬氨酸493处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置493处的缬氨酸残基被丙氨酸残基替代(V493A)。在一些实施方案中,位置493处的缬氨酸残基被丝氨酸残基替代(V493S)。在一些实施方案中,位置493处的缬氨酸残基被苏氨酸残基替代(V493T)。在一些实施方案中,位置493处的缬氨酸残基被精氨酸残基替代(V493R)。在一些实施方案中,位置493处的缬氨酸残基被天冬氨酸残基替代(V493D)。在一些实施方案中,位置493处的缬氨酸残基被脯氨酸残基替代(V493P)。在一些实施方案中,位置493处的缬氨酸残基被甘氨酸残基替代(V493G)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的丙氨酸589处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置589处的丙氨酸残基被缬氨酸残基替代(A589V)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的天冬酰胺597处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置597处的天冬酰胺残基被赖氨酸残基替代(N597K)。在一些实施方案中,腺苷脱氨酶包含在氨基酸序列的位置597处的突变,在野生型序列中该位置有天冬酰胺残基。在一些实施方案中,位置597处的天冬酰胺残基被精氨酸残基替代(N597R)。在一些实施方案中,腺苷脱氨酶包含在氨基酸序列的位置597处的突变,在野生型序列中该位置有天冬酰胺残基。在一些实施方案中,位置597处的天冬酰胺残基被丙氨酸残基替代(N597A)。在一些实施方案中,腺苷脱氨酶包含在氨基酸序列的位置597处的突变,在野生型序列中该位置有天冬酰胺残基。在一些实施方案中,位置597处的天冬酰胺残基被谷氨酸残基替代(N597E)。在一些实施方案中,腺苷脱氨酶包含在氨基酸序列的位置597处的突变,在野生型序列中该位置有天冬酰胺残基。在一些实施方案中,位置597处的天冬酰胺残基被组氨酸残基替代(N597H)。在一些实施方案中,腺苷脱氨酶包含在氨基酸序列的位置597处的突变,在野生型序列中该位置有天冬酰胺残基。在一些实施方案中,位置597处的天冬酰胺残基被甘氨酸残基替代(N597G)。在一些实施方案中,腺苷脱氨酶包含在氨基酸序列的位置597处的突变,在野生型序列中该位置有天冬酰胺残基。在一些实施方案中,位置597处的天冬酰胺残基被酪氨酸残基替代(N597Y)。在一些实施方案中,位置597处的天冬酰胺残基被苯丙氨酸残基替代(N597F)。在一些实施方案中,腺苷脱氨酶包含突变N597I。在一些实施方案中,腺苷脱氨酶包含突变N597L。在一些实施方案中,腺苷脱氨酶包含突变N597V。在一些实施方案中,腺苷脱氨酶包含突变N597M。在一些实施方案中,腺苷脱氨酶包含突变N597C。在一些实施方案中,腺苷脱氨酶包含突变N597P。在一些实施方案中,腺苷脱氨酶包含突变N597T。在一些实施方案中,腺苷脱氨酶包含突变N597S。在一些实施方案中,腺苷脱氨酶包含突变N597W。在一些实施方案中,腺苷脱氨酶包含突变N597Q。在一些实施方案中,腺苷脱氨酶包含突变N597D。在某些示例性实施方案中,以上所述的在N597处的突变是在E488Q背景的情形下进一步进行的。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的丝氨酸599处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置599处的丝氨酸残基被苏氨酸残基替代(S599T)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的天冬酰胺613处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置613处的天冬酰胺残基被赖氨酸残基替代(N613K)。在一些实施方案中,腺苷脱氨酶包含在氨基酸序列的位置613处的突变,在野生型序列中该位置有天冬酰胺残基。在一些实施方案中,位置613处的天冬酰胺残基被精氨酸残基替代(N613R)。在一些实施方案中,腺苷脱氨酶包含在氨基酸序列的位置613处的突变,在野生型序列中该位置有天冬酰胺残基。在一些实施方案中,位置613处的天冬酰胺残基被丙氨酸残基替代(N613A)。在一些实施方案中,腺苷脱氨酶包含在氨基酸序列的位置613处的突变,在野生型序列中该位置有天冬酰胺残基。在一些实施方案中,位置613处的天冬酰胺残基被谷氨酸残基替代(N613E)。在一些实施方案中,腺苷脱氨酶包含突变N613I。在一些实施方案中,腺苷脱氨酶包含突变N613L。在一些实施方案中,腺苷脱氨酶包含突变N613V。在一些实施方案中,腺苷脱氨酶包含突变N613F。在一些实施方案中,腺苷脱氨酶包含突变N613M。在一些实施方案中,腺苷脱氨酶包含突变N613C。在一些实施方案中,腺苷脱氨酶包含突变N613G。在一些实施方案中,腺苷脱氨酶包含突变N613P。在一些实施方案中,腺苷脱氨酶包含突变N613T。在一些实施方案中,腺苷脱氨酶包含突变N613S。在一些实施方案中,腺苷脱氨酶包含突变N613Y。在一些实施方案中,腺苷脱氨酶包含突变N613W。在一些实施方案中,腺苷脱氨酶包含突变N613Q。在一些实施方案中,腺苷脱氨酶包含突变N613H。在一些实施方案中,腺苷脱氨酶包含突变N613D。在一些实施方案中,以上所述的在N613处的突变进一步结合E488Q突变进行。
在一些实施方案中,为了提高编辑效率,腺苷脱氨酶可包含以下突变中的一个或多个:G336D、G487A、G487V、E488Q、E488H、E488R、E488N、E488A、E488S、E488M、T490C、T490S、V493T、V493S、V493A、V493R、V493D、V493P、V493G、N597K、N597R、N597A、N597E、N597H、N597G、N597Y、A589V、S599T、N613K、N613R、N613A、N613E(基于hADAR2-D中的氨基酸序列位置),以及同源ADAR蛋白中对应于以上突变的突变。
在一些实施方案中,为了降低编辑效率,腺苷脱氨酶可包含以下突变中的一个或多个:E488F、E488L、E488W、T490A、T490F、T490Y、T490R、T490K、T490P、T490E、N597F(基于hADAR2-D中的氨基酸序列位置),以及同源ADAR蛋白中对应于以上突变的突变。在特定实施方案中,可能令人感兴趣的是使用功效降低的腺苷脱氨酶来减少脱靶效应。
在一些实施方案中,为了减少脱靶效应,腺苷脱氨酶可包含在以下位置处的突变中的一个或多个:R348、V351、T375、K376、E396、C451、R455、N473、R474、K475、R477、R481、S486、E488、T490、S495、R510(基于hADAR2-D中的氨基酸序列位置),以及同源ADAR蛋白中对应于以上突变的突变。在一些实施方案中,腺苷脱氨酶包含在E488和选自R348、V351、T375、K376、E396、C451、R455、N473、R474、K475、R477、R481、S486、T490、S495、R510的一个或多个其他位置处的突变。在一些实施方案中,腺苷脱氨酶包含在T375处,以及任选地在一个或多个其他位置处的突变。在一些实施方案中,腺苷脱氨酶包含在N473处,以及任选地在一个或多个其他位置处的突变。在一些实施方案中,腺苷脱氨酶包含在V351处,以及任选地在一个或多个其他位置处的突变。在一些实施方案中,腺苷脱氨酶包含在E488和T375处,以及任选地在一个或多个其他位置处的突变。在一些实施方案中,腺苷脱氨酶包含在E488和N473处,以及任选地在一个或多个其他位置处的突变。在一些实施方案中,腺苷脱氨酶包含在E488和V351处,以及任选地在一个或多个其他位置处的突变。在一些实施方案中,腺苷脱氨酶包含在E488处以及T375、N473和V351中的一个或多个位置处的突变。
在一些实施方案中,为了减少脱靶效应,腺苷脱氨酶可包含选自以下的突变中的一个或多个:R348E、V351L、T375G、T375S、R455G、R455S、R455E、N473D、R474E、K475Q、R477E、R481E、S486T、E488Q、T490A、T490S、S495T和R510E(基于hADAR2-D中的氨基酸序列位置),以及同源ADAR蛋白中对应于以上突变的突变。在一些实施方案中,腺苷脱氨酶包含突变E488Q和选自R348E、V351L、T375G、T375S、R455G、R455S、R455E、N473D、R474E、K475Q、R477E、R481E、S486T、T490A、T490S、S495T和R510E的一个或多个另外的突变。在一些实施方案中,腺苷脱氨酶包含突变T375G或T375S,以及任选地一个或多个另外的突变。在一些实施方案中,腺苷脱氨酶包含突变N473D,以及任选地一个或多个另外的突变。在一些实施方案中,腺苷脱氨酶包含突变V351L,以及任选地一个或多个另外的突变。在一些实施方案中,腺苷脱氨酶包含突变E488Q和T375G或T375G,以及任选地一个或多个另外的突变。在一些实施方案中,腺苷脱氨酶包含突变E488Q和N473D,以及任选地一个或多个另外的突变。在一些实施方案中,腺苷脱氨酶包含突变E488Q和V351L,以及任选地一个或多个另外的突变。在一些实施方案中,腺苷脱氨酶包含突变E488Q以及T375G/S、N473D和V351L中的一个或多个。
结合至双链体RNA的人类ADAR2脱氨酶结构域的晶体结构显示出与修饰位点5’侧的RNA结合的蛋白质环。该5’结合环是造成ADAR家族成员之间底物特异性差异的一个原因。参见Wang等人,Nucleic Acids Res.,44(20):9872-9880(2016),该文献的内容以引用方式整体并入本文。另外,在酶活性位点附近识别出ADAR2特异性RNA结合环。参见Mathews等人,Nat.Struct.Mol.Biol.,23(5):426-33(2016),该文献的内容以引用方式整体并入本文。在一些实施方案中,腺苷脱氨酶在RNA结合环中包含一个或多个突变以提高编辑特异性和/或效率。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的丙氨酸454处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置454处的丙氨酸残基被丝氨酸残基替代(A454S)。在一些实施方案中,位置454处的丙氨酸残基被半胱氨酸残基替代(A454C)。在一些实施方案中,位置454处的丙氨酸残基被天冬氨酸残基替代(A454D)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的精氨酸455处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置455处的精氨酸残基被丙氨酸残基替代(R455A)。在一些实施方案中,位置455处的精氨酸残基被缬氨酸残基替代(R455V)。在一些实施方案中,位置455处的精氨酸残基被组氨酸残基替代(R455H)。在一些实施方案中,位置455处的精氨酸残基被甘氨酸残基替代(R455G)。在一些实施方案中,位置455处的精氨酸残基被丝氨酸残基替代(R455S)。在一些实施方案中,位置455处的精氨酸残基被谷氨酸残基替代(R455E)。在一些实施方案中,腺苷脱氨酶包含突变R455C。在一些实施方案中,腺苷脱氨酶包含突变R455I。在一些实施方案中,腺苷脱氨酶包含突变R455K。在一些实施方案中,腺苷脱氨酶包含突变R455L。在一些实施方案中,腺苷脱氨酶包含突变R455M。在一些实施方案中,腺苷脱氨酶包含突变R455N。在一些实施方案中,腺苷脱氨酶包含突变R455Q。在一些实施方案中,腺苷脱氨酶包含突变R455F。在一些实施方案中,腺苷脱氨酶包含突变R455W。在一些实施方案中,腺苷脱氨酶包含突变R455P。在一些实施方案中,腺苷脱氨酶包含突变R455Y。在一些实施方案中,腺苷脱氨酶包含突变R455E。在一些实施方案中,腺苷脱氨酶包含突变R455D。在一些实施方案中,以上所述的在R455处的突变进一步结合E488Q突变进行。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的异亮氨酸456处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置456处的异亮氨酸残基被缬氨酸残基替代(I456V)。在一些实施方案中,位置456处的异亮氨酸残基被亮氨酸残基替代(I456L)。在一些实施方案中,位置456处的异亮氨酸残基被天冬氨酸残基替代(I456D)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的苯丙氨酸457处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置457处的苯丙氨酸残基被酪氨酸残基替代(F457Y)。在一些实施方案中,位置457处的苯丙氨酸残基被精氨酸残基替代(F457R)。在一些实施方案中,位置457处的苯丙氨酸残基被谷氨酸残基替代(F457E)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的丝氨酸458处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置458处的丝氨酸残基被缬氨酸残基替代(S458V)。在一些实施方案中,位置458处的丝氨酸残基被苯丙氨酸残基替代(S458F)。在一些实施方案中,位置458处的丝氨酸残基被脯氨酸残基替代(S458P)。在一些实施方案中,腺苷脱氨酶包含突变S458I。在一些实施方案中,腺苷脱氨酶包含突变S458L。在一些实施方案中,腺苷脱氨酶包含突变S458M。在一些实施方案中,腺苷脱氨酶包含突变S458C。在一些实施方案中,腺苷脱氨酶包含突变S458A。在一些实施方案中,腺苷脱氨酶包含突变S458G。在一些实施方案中,腺苷脱氨酶包含突变S458T。在一些实施方案中,腺苷脱氨酶包含突变S458Y。在一些实施方案中,腺苷脱氨酶包含突变S458W。在一些实施方案中,腺苷脱氨酶包含突变S458Q。在一些实施方案中,腺苷脱氨酶包含突变S458N。在一些实施方案中,腺苷脱氨酶包含突变S458H。在一些实施方案中,腺苷脱氨酶包含突变S458E。在一些实施方案中,腺苷脱氨酶包含突变S458D。在一些实施方案中,腺苷脱氨酶包含突变S458K。在一些实施方案中,腺苷脱氨酶包含突变S458R。在一些实施方案中,以上所述的在S458处的突变进一步结合E488Q突变进行。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的脯氨酸459处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置459处的脯氨酸残基被半胱氨酸残基替代(P459C)。在一些实施方案中,位置459处的脯氨酸残基被组氨酸残基替代(P459H)。在一些实施方案中,位置459处的脯氨酸残基被色氨酸残基替代(P459W)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的组氨酸460处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置460处的组氨酸残基被精氨酸残基替代(H460R)。在一些实施方案中,位置460处的组氨酸残基被异亮氨酸残基替代(H460I)。在一些实施方案中,位置460处的组氨酸残基被脯氨酸残基替代(H460P)。在一些实施方案中,腺苷脱氨酶包含突变H460L。在一些实施方案中,腺苷脱氨酶包含突变H460V。在一些实施方案中,腺苷脱氨酶包含突变H460F。在一些实施方案中,腺苷脱氨酶包含突变H460M。在一些实施方案中,腺苷脱氨酶包含突变H460C。在一些实施方案中,腺苷脱氨酶包含突变H460A。在一些实施方案中,腺苷脱氨酶包含突变H460G。在一些实施方案中,腺苷脱氨酶包含突变H460T。在一些实施方案中,腺苷脱氨酶包含突变H460S。在一些实施方案中,腺苷脱氨酶包含突变H460Y。在一些实施方案中,腺苷脱氨酶包含突变H460W。在一些实施方案中,腺苷脱氨酶包含突变H460Q。在一些实施方案中,腺苷脱氨酶包含突变H460N。在一些实施方案中,腺苷脱氨酶包含突变H460E。在一些实施方案中,腺苷脱氨酶包含突变H460D。在一些实施方案中,腺苷脱氨酶包含突变H460K。在一些实施方案中,以上所述的在H460处的突变进一步结合E488Q突变进行。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的脯氨酸462处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置462处的脯氨酸残基被丝氨酸残基替代(P462S)。在一些实施方案中,位置462处的脯氨酸残基被色氨酸残基替代(P462W)。在一些实施方案中,位置462处的脯氨酸残基被谷氨酸残基替代(P462E)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的天冬氨酸469处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置469处的天冬氨酸残基被谷氨酰胺残基替代(D469Q)。在一些实施方案中,位置469处的天冬氨酸残基被丝氨酸残基替代(D469S)。在一些实施方案中,位置469处的天冬氨酸残基被酪氨酸残基替代(D469Y)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的精氨酸470处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置470处的精氨酸残基被丙氨酸残基替代(R470A)。在一些实施方案中,位置470处的精氨酸残基被异亮氨酸残基替代(R470I)。在一些实施方案中,位置470处的精氨酸残基被天冬氨酸残基替代(R470D)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的组氨酸471处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置471处的组氨酸残基被赖氨酸残基替代(H471K)。在一些实施方案中,位置471处的组氨酸残基被苏氨酸残基替代(H471T)。在一些实施方案中,位置471处的组氨酸残基被缬氨酸残基替代(H471V)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的脯氨酸472处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置472处的脯氨酸残基被赖氨酸残基替代(P472K)。在一些实施方案中,位置472处的脯氨酸残基被苏氨酸残基替代(P472T)。在一些实施方案中,位置472处的脯氨酸残基被天冬氨酸残基替代(P472D)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的天冬酰胺473处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置473处的天冬酰胺残基被精氨酸残基替代(N473R)。在一些实施方案中,位置473处的天冬酰胺残基被色氨酸残基替代(N473W)。在一些实施方案中,位置473处的天冬酰胺残基被脯氨酸残基替代(N473P)。在一些实施方案中,位置473处的天冬酰胺残基被天冬氨酸残基替代(N473D)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的精氨酸474处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置474处的精氨酸残基被赖氨酸残基替代(R474K)。在一些实施方案中,位置474处的精氨酸残基被甘氨酸残基替代(R474G)。在一些实施方案中,位置474处的精氨酸残基被天冬氨酸残基替代(R474D)。在一些实施方案中,位置474处的精氨酸残基被谷氨酸残基替代(R474E)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的赖氨酸475处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置475处的赖氨酸残基被谷氨酰胺残基替代(K475Q)。在一些实施方案中,位置475处的赖氨酸残基被天冬酰胺残基替代(K475N)。在一些实施方案中,位置475处的赖氨酸残基被天冬氨酸残基替代(K475D)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的丙氨酸476处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置476处的丙氨酸残基被丝氨酸残基替代(A476S)。在一些实施方案中,位置476处的丙氨酸残基被精氨酸残基替代(A476R)。在一些实施方案中,位置476处的丙氨酸残基被谷氨酸残基替代(A476E)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的精氨酸477处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置477处的精氨酸残基被赖氨酸残基替代(R477K)。在一些实施方案中,位置477处的精氨酸残基被苏氨酸残基替代(R477T)。在一些实施方案中,位置477处的精氨酸残基被苯丙氨酸残基替代(R477F)。在一些实施方案中,位置474处的精氨酸残基被谷氨酸残基替代(R477E)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的甘氨酸478处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置478处的甘氨酸残基被丙氨酸残基替代(G478A)。在一些实施方案中,位置478处的甘氨酸残基被精氨酸残基替代(G478R)。在一些实施方案中,位置478处的甘氨酸残基被酪氨酸残基替代(G478Y)。在一些实施方案中,腺苷脱氨酶包含突变G478I。在一些实施方案中,腺苷脱氨酶包含突变G478L。在一些实施方案中,腺苷脱氨酶包含突变G478V。在一些实施方案中,腺苷脱氨酶包含突变G478F。在一些实施方案中,腺苷脱氨酶包含突变G478M。在一些实施方案中,腺苷脱氨酶包含突变G478C。在一些实施方案中,腺苷脱氨酶包含突变G478P。在一些实施方案中,腺苷脱氨酶包含突变G478T。在一些实施方案中,腺苷脱氨酶包含突变G478S。在一些实施方案中,腺苷脱氨酶包含突变G478W。在一些实施方案中,腺苷脱氨酶包含突变G478Q。在一些实施方案中,腺苷脱氨酶包含突变G478N。在一些实施方案中,腺苷脱氨酶包含突变G478H。在一些实施方案中,腺苷脱氨酶包含突变G478E。在一些实施方案中,腺苷脱氨酶包含突变G478D。在一些实施方案中,腺苷脱氨酶包含突变G478K。在一些实施方案中,以上所述的在G478处的突变进一步结合E488Q突变进行。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的谷氨酰胺479处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置479处的谷氨酰胺残基被天冬酰胺残基替代(Q479N)。在一些实施方案中,位置479处的谷氨酰胺残基被丝氨酸残基替代(Q479S)。在一些实施方案中,位置479处的谷氨酰胺残基被脯氨酸残基替代(Q479P)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的精氨酸348处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置348处的精氨酸残基被丙氨酸残基替代(R348A)。在一些实施方案中,位置348处的精氨酸残基被谷氨酸残基替代(R348E)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的缬氨酸351处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置351处的缬氨酸残基被亮氨酸残基替代(V351L)。在一些实施方案中,腺苷脱氨酶包含突变V351Y。在一些实施方案中,腺苷脱氨酶包含突变V351M。在一些实施方案中,腺苷脱氨酶包含突变V351T。在一些实施方案中,腺苷脱氨酶包含突变V351G。在一些实施方案中,腺苷脱氨酶包含突变V351A。在一些实施方案中,腺苷脱氨酶包含突变V351F。在一些实施方案中,腺苷脱氨酶包含突变V351E。在一些实施方案中,腺苷脱氨酶包含突变V351I。在一些实施方案中,腺苷脱氨酶包含突变V351C。在一些实施方案中,腺苷脱氨酶包含突变V351H。在一些实施方案中,腺苷脱氨酶包含突变V351P。在一些实施方案中,腺苷脱氨酶包含突变V351S。在一些实施方案中,腺苷脱氨酶包含突变V351K。在一些实施方案中,腺苷脱氨酶包含突变V351N。在一些实施方案中,腺苷脱氨酶包含突变V351W。在一些实施方案中,腺苷脱氨酶包含突变V351Q。在一些实施方案中,腺苷脱氨酶包含突变V351D。在一些实施方案中,腺苷脱氨酶包含突变V351R。在一些实施方案中,以上所述的在V351处的突变进一步结合E488Q突变进行。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的苏氨酸375处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置375处的苏氨酸残基被甘氨酸残基替代(T375G)。在一些实施方案中,位置375处的苏氨酸残基被丝氨酸残基替代(T375S)。在一些实施方案中,腺苷脱氨酶包含突变T375H。在一些实施方案中,腺苷脱氨酶包含突变T375Q。在一些实施方案中,腺苷脱氨酶包含突变T375C。在一些实施方案中,腺苷脱氨酶包含突变T375N。在一些实施方案中,腺苷脱氨酶包含突变T375M。在一些实施方案中,腺苷脱氨酶包含突变T375A。在一些实施方案中,腺苷脱氨酶包含突变T375W。在一些实施方案中,腺苷脱氨酶包含突变T375V。在一些实施方案中,腺苷脱氨酶包含突变T375R。在一些实施方案中,腺苷脱氨酶包含突变T375E。在一些实施方案中,腺苷脱氨酶包含突变T375K。在一些实施方案中,腺苷脱氨酶包含突变T375F。在一些实施方案中,腺苷脱氨酶包含突变T375I。在一些实施方案中,腺苷脱氨酶包含突变T375D。在一些实施方案中,腺苷脱氨酶包含突变T375P。在一些实施方案中,腺苷脱氨酶包含突变T375L。在一些实施方案中,腺苷脱氨酶包含突变T375Y。在一些实施方案中,以上所述的在T375Y处的突变进一步结合E488Q突变进行。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的精氨酸481处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置481处的精氨酸残基被谷氨酸残基替代(R481E)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的丝氨酸486处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置486处的丝氨酸残基被苏氨酸残基替代(S486T)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的苏氨酸490处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置490处的苏氨酸残基被丙氨酸残基替代(T490A)。在一些实施方案中,位置490处的苏氨酸残基被丝氨酸残基替代(T490S)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的丝氨酸495处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置495处的丝氨酸残基被苏氨酸残基替代(S495T)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的精氨酸510处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置510处的精氨酸残基被谷氨酰胺残基替代(R510Q)。在一些实施方案中,位置510处的精氨酸残基被丙氨酸残基替代(R510A)。在一些实施方案中,位置510处的精氨酸残基被谷氨酸残基替代(R510E)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的甘氨酸593处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置593处的甘氨酸残基被丙氨酸残基替代(G593A)。在一些实施方案中,位置593处的甘氨酸残基被谷氨酸残基替代(G593E)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的赖氨酸594处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置594处的赖氨酸残基被丙氨酸残基替代(K594A)。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的位置A454、R455、I456、F457、S458、P459、H460、P462、D469、R470、H471、P472、N473、R474、K475、A476、R477、G478、Q479、R348、R510、G593、K594中的任何一个或多个位置处的突变,或同源ADAR蛋白中的相应位置处的突变。
在一些实施方案中,腺苷脱氨酶包含hADAR2-D氨基酸序列的突变A454S、A454C、A454D、R455A、R455V、R455H、I456V、I456L、I456D、F457Y、F457R、F457E、S458V、S458F、S458P、P459C、P459H、P459W、H460R、H460I、H460P、P462S、P462W、P462E、D469Q、D469S、D469Y、R470A、R470I、R470D、H471K、H471T、H471V、P472K、P472T、P472D、N473R、N473W、N473P、R474K、R474G、R474D、K475Q、K475N、K475D、A476S、A476R、A476E、R477K、R477T、R477F、G478A、G478R、G478Y、Q479N、Q479S、Q479P、R348A、R510Q、R510A、G593A、G593E、K594A中的任何一个或多个,或同源ADAR蛋白中的相应位置处的突变。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的位置T375、V351、G478、S458、H460中的任何一个或多个位置处的突变,或同源ADAR蛋白中的相应位置处的突变,任选地结合E488处的突变。在一些实施方案中,腺苷脱氨酶包含选自T375G、T375C、T375H、T375Q、V351M、V351T、V351Y、G478R、S458F、H460I的突变中的一个或多个,任选地结合E488Q。
在一些实施方案中,腺苷脱氨酶包含选自T375H、T375Q、V351M、V351Y、H460P的突变中的一个或多个,任选地结合E488Q。
在一些实施方案中,腺苷脱氨酶包含突变T375S和S458F,任选地结合E488Q。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的位置T375、N473、R474、G478、S458、P459、V351、R455、R455、T490、R348、Q479中的两个或更多个位置处的突变,或同源ADAR蛋白中的相应位置处的突变,任选地结合E488处的突变。在一些实施方案中,腺苷脱氨酶包含选自T375G、T375S、N473D、R474E、G478R、S458F、P459W、V351L、R455G、R455S、T490A、R348E、Q479P的突变中的两个或更多个,任选地结合E488Q。
在一些实施方案中,腺苷脱氨酶包含突变T375G和V351L。在一些实施方案中,腺苷脱氨酶包含突变T375G和R455G。在一些实施方案中,腺苷脱氨酶包含突变T375G和R455S。在一些实施方案中,腺苷脱氨酶包含突变T375G和T490A。在一些实施方案中,腺苷脱氨酶包含突变T375G和R348E。在一些实施方案中,腺苷脱氨酶包含突变T375S和V351L。在一些实施方案中,腺苷脱氨酶包含突变T375S和R455G。在一些实施方案中,腺苷脱氨酶包含突变T375S和R455S。在一些实施方案中,腺苷脱氨酶包含突变T375S和T490A。在一些实施方案中,腺苷脱氨酶包含突变T375S和R348E。在一些实施方案中,腺苷脱氨酶包含突变N473D和V351L。在一些实施方案中,腺苷脱氨酶包含突变N473D和R455G。在一些实施方案中,腺苷脱氨酶包含突变N473D和R455S。在一些实施方案中,腺苷脱氨酶包含突变N473D和T490A。在一些实施方案中,腺苷脱氨酶包含突变N473D和R348E。在一些实施方案中,腺苷脱氨酶包含突变R474E和V351L。在一些实施方案中,腺苷脱氨酶包含突变R474E和R455G。在一些实施方案中,腺苷脱氨酶包含突变R474E和R455S。在一些实施方案中,腺苷脱氨酶包含突变R474E和T490A。在一些实施方案中,腺苷脱氨酶包含突变R474E和R348E。在一些实施方案中,腺苷脱氨酶包含突变S458F和T375G。在一些实施方案中,腺苷脱氨酶包含突变S458F和T375S。在一些实施方案中,腺苷脱氨酶包含突变S458F和N473D。在一些实施方案中,腺苷脱氨酶包含突变S458F和R474E。在一些实施方案中,腺苷脱氨酶包含突变S458F和G478R。在一些实施方案中,腺苷脱氨酶包含突变G478R和T375G。在一些实施方案中,腺苷脱氨酶包含突变G478R和T375S。在一些实施方案中,腺苷脱氨酶包含突变G478R和N473D。在一些实施方案中,腺苷脱氨酶包含突变G478R和R474E。在一些实施方案中,腺苷脱氨酶包含突变P459W和T375G。在一些实施方案中,腺苷脱氨酶包含突变P459W和T375S。在一些实施方案中,腺苷脱氨酶包含突变P459W和N473D。在一些实施方案中,腺苷脱氨酶包含突变P459W和R474E。在一些实施方案中,腺苷脱氨酶包含突变P459W和G478R。在一些实施方案中,腺苷脱氨酶包含突变P459W和S458F。在一些实施方案中,腺苷脱氨酶包含突变Q479P和T375G。在一些实施方案中,腺苷脱氨酶包含突变Q479P和T375S。在一些实施方案中,腺苷脱氨酶包含突变Q479P和N473D。在一些实施方案中,腺苷脱氨酶包含突变Q479P和R474E。在一些实施方案中,腺苷脱氨酶包含突变Q479P和G478R。在一些实施方案中,腺苷脱氨酶包含突变Q479P和S458F。在一些实施方案中,腺苷脱氨酶包含突变Q479P和P459W。本段路中所述的所有突变还可以进一步结合E488Q突变进行。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的位置K475、Q479、P459、G478、S458中的任何一个或多个位置处的突变,或同源ADAR蛋白中的相应位置处的突变,任选地结合E488处的突变。在一些实施方案中,腺苷脱氨酶包含选自K475N、Q479N、P459W、G478R、S458P、S458F的突变中的一个或多个,任选地结合E488Q。
在一些实施方案中,腺苷脱氨酶包含在hADAR2-D氨基酸序列的位置T375、V351、R455、H460、A476中的任何一个或多个位置处的突变,或同源ADAR蛋白中的相应位置处的突变,任选地结合E488处的突变。在一些实施方案中,腺苷脱氨酶包含选自T375G、T375C、T375H、T375Q、V351M、V351T、V351Y、R455H、H460P、H460I、A476E的突变中的一个或多个,任选地结合E488Q。
在某些实施方案中,通过gRNA的化学修饰实现编辑的改善和脱靶修饰的减少。按照Vogel等人(2014),Angew Chem Int Ed,53:6267-6271,doi:10.1002/anie.201402634(以引用方式整体并入本文)中所例示进行化学修饰的gRNA降低了脱靶活性并提高了中靶效率。2'-O-甲基和硫代磷酸酯修饰的指导RNA通常可提高细胞中的编辑效率。
已证明ADAR显示出对编辑过的A的任一侧的相邻核苷酸的优选性(www.nature.com/nsmb/journal/v23/n5/full/nsmb.3203.html,Matthews等人(2017),Nature Structural Mol Biol,23(5):426-433,以引用方式整体并入本文)。因此,在某些实施方案中,选择gRNA、靶标和/或ADAR针对基序优选性进行优化。
在体外已证实有意错配允许编辑非优选的基序(https://academic.oup.com/nar/article-lookup/doi/10.1093/nar/gku272;Schneider等人(2014),Nucleic AcidRes,42(10):e87);Fukuda等人(2017),Scienticic Reports,7,doi:10.1038/srep41478,以引用方式整体并入本文)。因此,在某些实施方案中,为了提高在非优选的5’或3’相邻碱基上的RNA编辑效率,引入了相邻碱基中的有意错配。
结果表明,ADAR脱氨酶结构域的靶向窗口中的与C相对的A可先于其他碱基优先被编辑。此外,在靶向碱基的几个碱基内与U配对的A碱基显示出低Cas13b-ADAR融合物编辑水平,这表明该酶可以灵活地编辑多个A。参见例如图18。这两个观察结果表明,可以通过将待编辑的所有A与C错配来指定Cas13b-ADAR融合物的活性窗口中的多个A以进行编辑。因此,在某些实施方案中,活性窗口中的多个A:C错配被设计来创建多个A:I编辑。在某些实施方案中,为了阻遏活性窗口中潜在的脱靶编辑,将非靶A与A或G配对。
术语“编辑特异性”和“编辑优选性”在本文可互换使用,是指在双链底物中特定腺苷位点处A至I编辑的程度。在一些实施方案中,底物编辑优选性是由靶腺苷残基的5’最近邻和/或3’最近邻决定的。在一些实施方案中,腺苷脱氨酶对底物的5’最近邻的优选性排序为U>A>C>G(“>”表示更大的优选性)。在一些实施方案中,腺苷脱氨酶对底物的3’最近邻的优选性排序为G>C~A>U(“>”表示更大的优选性;“~”表示相似的优选性)。在一些实施方案中,腺苷脱氨酶对底物的3’最近邻的优选性排序为G>C>U~A(“>”表示更大的优选性;“~”表示相似的优选性)。在一些实施方案中,腺苷脱氨酶对底物的3’最近邻的优选性排序为G>C>A>U(“>”表示更大的优选性)。在一些实施方案中,腺苷脱氨酶对底物的3’最近邻的优选性排序为C~G~A>U(“>”表示更大的优选性;“~”表示相似的优选性)。在一些实施方案中,腺苷脱氨酶对含有靶腺苷残基的三联体序列的优选性排序为TAG>AAG>CAC>AAT>GAA>GAC(“>”表示更大的优选性),中心A为靶腺苷残基。
在一些实施方案中,腺苷脱氨酶的底物编辑优选性受腺苷脱氨酶蛋白中是否存在核酸结合结构域影响。在一些实施方案中,为了修改底物编辑优选性,将脱氨酶结构域与双链RNA结合结构域(dsRBD)或双链RNA结合基序(dsRBM)连接。在一些实施方案中,dsRBD或dsRBM可以来源于ADAR蛋白,诸如hADAR1或hADAR2。在一些实施方案中,使用包含至少一个dsRBD和脱氨酶结构域的全长ADAR蛋白。在一些实施方案中,所述一个或多个dsRBM或dsRBD处于脱氨酶结构域的N端。在其他实施方案中,所述一个或多个dsRBM或dsRBD处于脱氨酶结构域的C端。
在一些实施方案中,腺苷脱氨酶的底物编辑优选性受酶活性中心内或附近的氨基酸残基影响。在一些实施方案中,为了修改底物编辑优选性,腺苷脱氨酶可包含以下突变中的一个或多个:G336D、G487R、G487K、G487W、G487Y、E488Q、E488N、T490A、V493A、V493T、V493S、N597K、N597R、A589V、S599T、N613K、N613R(基于hADAR2-D中的氨基酸序列位置),以及同源ADAR蛋白中对应于以上突变的突变。
特别地,在一些实施方案中,为了降低编辑特异性,腺苷脱氨酶可包含以下突变中的一个或多个:E488Q、V493A、N597K、N613K(基于hADAR2-D中的氨基酸序列位置),以及同源ADAR蛋白中对应于以上突变的突变。在一些实施方案中,为了增加编辑特异性,腺苷脱氨酶可包含突变T490A。
在一些实施方案中,为了增加对具有最接近5’G的靶腺苷(A),诸如包含三联体序列GAC(中心A为靶腺苷残基)的底物的编辑优选性,腺苷脱氨酶可包含以下突变中的一个或多个:G336D、E488Q、E488N、V493T、V493S、V493A、A589V、N597K、N597R、S599T、N613K、N613R(基于hADAR2-D中的氨基酸序列位置),以及同源ADAR蛋白中对应于以上突变的突变。
特别地,在一些实施方案中,腺苷脱氨酶包含突变E488Q或同源ADAR蛋白中的相应突变,以便编辑包含以下三联体序列的底物:GAC、GAA、GAU、GAG、CAU、AAU、UAC,中心A为靶腺苷残基。
在一些实施方案中,腺苷脱氨酶包含如SEQ ID No.761所示的hADAR1-D的野生型氨基酸序列。在一些实施方案中,腺苷脱氨酶在hADAR1-D序列中包含一个或多个突变,这样hADAR1-D的编辑效率和/或底物编辑优选性可根据特定需要而改变。
在一些实施方案中,腺苷脱氨酶包含在hADAR1-D氨基酸序列的甘氨酸1007处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置1007处的甘氨酸残基被具有相对小的侧链的非极性氨基酸残基替代。例如,在一些实施方案中,位置1007处的甘氨酸残基被丙氨酸残基替代(G1007A)。在一些实施方案中,位置1007处的甘氨酸残基被缬氨酸残基替代(G1007V)。在一些实施方案中,位置1007处的甘氨酸残基被具有相对大的侧链的氨基酸残基取代。在一些实施方案中,位置1007处的甘氨酸残基被精氨酸残基替代(G1007R)。在一些实施方案中,位置1007处的甘氨酸残基被赖氨酸残基替代(G1007K)。在一些实施方案中,位置1007处的甘氨酸残基被色氨酸残基替代(G1007W)。在一些实施方案中,位置1007处的甘氨酸残基被酪氨酸残基替代(G1007Y)。另外,在其他实施方案中,位置1007处的甘氨酸残基被亮氨酸残基替代(G1007L)。在其他实施方案中,位置1007处的甘氨酸残基被苏氨酸残基替代(G1007T)。在其他实施方案中,位置1007处的甘氨酸残基被丝氨酸残基替代(G1007S)。
在一些实施方案中,腺苷脱氨酶包含在hADAR1-D氨基酸序列的谷氨酸1008处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,位置1008处的谷氨酸残基被具有相对大的侧链的极性氨基酸残基替代。在一些实施方案中,位置1008处的谷氨酸残基被谷氨酰胺残基替代(E1008Q)。在一些实施方案中,位置1008处的谷氨酸残基被组氨酸残基替代(E1008H)。在一些实施方案中,位置1008处的谷氨酸残基被精氨酸残基替代(E1008R)。在一些实施方案中,位置1008处的谷氨酸残基被赖氨酸残基替代(E1008K)。在一些实施方案中,位置1008处的谷氨酸残基被非极性或小极性氨基酸残基替代。在一些实施方案中,位置1008处的谷氨酸残基被苯丙氨酸残基替代(E1008F)。在一些实施方案中,位置1008处的谷氨酸残基被色氨酸残基替代(E1008W)。在一些实施方案中,位置1008处的谷氨酸残基被甘氨酸残基替代(E1008G)。在一些实施方案中,位置1008处的谷氨酸残基被异亮氨酸残基替代(E1008I)。在一些实施方案中,位置1008处的谷氨酸残基被缬氨酸残基替代(E1008V)。在一些实施方案中,位置1008处的谷氨酸残基被脯氨酸残基替代(E1008P)。在一些实施方案中,位置1008处的谷氨酸残基被丝氨酸残基替代(E1008S)。在其他实施方案中,位置1008处的谷氨酸残基被天冬酰胺残基替代(E1008N)。在其他实施方案中,位置1008处的谷氨酸残基被丙氨酸残基替代(E1008A)。在其他实施方案中,位置1008处的谷氨酸残基被甲硫氨酸残基替代(E1008M)。在一些实施方案中,位置1008处的谷氨酸残基被亮氨酸残基替代(E1008L)。
在一些实施方案中,为了提高编辑效率,腺苷脱氨酶可包含以下突变中的一个或多个:E1007S、E1007A、E1007V、E1008Q、E1008R、E1008H、E1008M、E1008N、E1008K(基于hADAR1-D中的氨基酸序列位置),以及同源ADAR蛋白中对应于以上突变的突变。
在一些实施方案中,为了降低编辑效率,腺苷脱氨酶可包含以下突变中的一个或多个:E1007R、E1007K、E1007Y、E1007L、E1007T、E1008G、E1008I、E1008P、E1008V、E1008F、E1008W、E1008S、E1008N、E1008K(基于hADAR1-D中的氨基酸序列位置),以及同源ADAR蛋白中对应于以上突变的突变。
在一些实施方案中,腺苷脱氨酶的底物编辑优选性、效率和/或选择性受酶活性中心内或附近的氨基酸残基影响。在一些实施方案中,腺苷脱氨酶包含在hADAR1-D序列的谷氨酸1008位置处,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,所述突变是E1008R,或同源ADAR蛋白中的相应突变。在一些实施方案中,E1008R突变体对在相反链上具有错配的G残基的靶腺苷残基具有提高的编辑效率。
在一些实施方案中,腺苷脱氨酶蛋白还包含或连接至一个或多个双链RNA(dsRNA)结合基序(dsRBM)或结构域(dsRBD),以识别并结合至双链核酸底物。在一些实施方案中,腺苷脱氨酶与双链底物之间的相互作用由一种或多种另外的蛋白质因子(包括CRISPR/CAS蛋白质因子)介导。在一些实施方案中,腺苷脱氨酶与双链底物之间的相互作用进一步由一种或多种核酸组分(包括指导RNA)介导。
具有C至U脱氨活性的修饰的腺苷脱氨酶
在某些示例性实施方案中,定向进化可以用于设计修饰的ADAR蛋白,除了将腺嘌呤脱氨为次黄嘌呤之外,所述ADAR蛋白还能够催化另外的反应。例如,修饰的ADAR蛋白可能能够催化胞嘧啶脱氨为尿嘧啶。尽管不受特定理论的束缚,但是提高C至U活性的突变可以改变结合口袋的形状,使其更适合较小的胞苷碱基。
在一些实施方案中,具有C至U脱氨活性的修饰的腺苷脱氨酶包含在hADAR2-D氨基酸序列的位置V351、T375、R455和E488中的任何一个或多个位置处的突变,或同源ADAR蛋白中的相应位置处的突变。在一些实施方案中,腺苷脱氨酶包含突变E488Q。在一些实施方案中,腺苷脱氨酶包含选自以下的突变中的一个或多个:V351I、V351L、V351F、V351M、V351C、V351A、V351G、V351P、V351T、V351S、V351Y、V351W、V351Q、V351N、V351H、V351E、V351D、V351K、V351R、T375I、T375L、T375V、T375F、T375M、T375C、T375A、T375G、T375P、T375S、T375Y、T375W、T375Q、T375N、T375H、T375E、T375D、T375K、T375R、R455I、R455L、R455V、R455F、R455M、R455C、R455A、R455G、R455P、R455T、R455S、R455Y、R455W、R455Q、R455N、R455H、R455E、R455D、R455K。在一些实施方案中,腺苷脱氨酶包含突变E488Q,并且还包含选自以下的突变中的一个或多个:V351I、V351L、V351F、V351M、V351C、V351A、V351G、V351P、V351T、V351S、V351Y、V351W、V351Q、V351N、V351H、V351E、V351D、V351K、V351R、T375I、T375L、T375V、T375F、T375M、T375C、T375A、T375G、T375P、T375S、T375Y、T375W、T375Q、T375N、T375H、T375E、T375D、T375K、T375R、R455I、R455L、R455V、R455F、R455M、R455C、R455A、R455G、R455P、R455T、R455S、R455Y、R455W、R455Q、R455N、R455H、R455E、R455D、R455K。
结合具有C至U脱氨活性的前述修饰的ADAR蛋白,本文所述的发明还涉及一种用于使目标靶RNA序列中的C脱氨基的方法,所述方法包括向靶RNA或DNA递送本文所公开的AD官能化的组合物。
在某些示例性实施方案中,所述用于使目标靶RNA序列中的C脱氨基的方法包括向所述靶RNA递送:(a)无催化活性的(死亡)Cas;(b)指导分子,所述指导分子包含连接至正向重复序列的指导序列;和(c)具有C至U脱氨活性的修饰的ADAR蛋白或其催化结构域;其中所述修饰的ADAR蛋白或其催化结构域共价或非共价地连接至所述死亡Cas蛋白或所述指导分子,或者适于在递送之后连接至所述死亡Cas蛋白或所述指导分子;其中所述指导分子与所述死亡Cas蛋白形成复合物并引导所述复合物结合所述目标靶RNA序列;其中所述指导序列能够与包含所述C的靶序列杂交以形成RNA双链体;其中任选地所述指导序列在对应于所述C的位置处包含非配对A或U,导致在所形成的RNA双链体中出现错配;并且其中所述修饰的ADAR蛋白或其催化结构域使所述RNA双链体中的所述C脱氨基。
结合具有C至U脱氨活性的前述修饰的ADAR蛋白,本文所述的发明还涉及一种适用于使目标靶基因座中的C脱氨基的工程化的非天然存在的系统,所述系统包含:(a)包含连接至正向重复序列的指导序列的指导分子,或编码所述指导分子的核苷酸序列;(b)无催化活性的Cas13蛋白,或编码所述无催化活性的Cas13蛋白的核苷酸序列;(c)具有C至U脱氨活性的修饰的ADAR蛋白或其催化结构域,或编码所述修饰的ADAR蛋白或其催化结构域的核苷酸序列;其中所述修饰的ADAR蛋白或其催化结构域共价或非共价地连接至所述Cas13蛋白或所述指导分子,或者适于在递送之后连接至所述Cas13蛋白或所述指导分子;其中所述指导序列能够与包含C的靶RNA序列杂交以形成RNA双链体;其中任选地所述指导序列在对应于所述C的位置处包含非配对A或U,导致在所形成的RNA双链体中出现错配;其中任选地所述系统是包含一种或多种载体的载体系统,所述一种或多种载体包含:(a)第一调控元件,所述第一调控元件可操作地连接至编码包含所述指导序列的所述指导分子的核苷酸序列;(b)第二调控元件,所述第二调控元件可操作地连接至编码所述无催化活性的Cas13蛋白的核苷酸序列;和(c)编码具有C至U脱氨活性的修饰的ADAR蛋白或其催化结构域的核苷酸序列,所述核苷酸序列受所述第一调控元件或第二调控元件的控制或者可操作地连接至第三调控元件;其中如果所述编码修饰的ADAR蛋白或其催化结构域的核苷酸序列可操作地连接至第三调控元件,则所述修饰的ADAR蛋白或其催化结构域适于在表达之后连接至所述指导分子或所述Cas13蛋白;其中组分(a)、组分(b)和组分(c)位于所述系统的相同或不同载体上,任选地其中所述第一调控元件、第二调控元件和/或第三调控元件是诱导型启动子。
根据本发明,腺苷脱氨酶的底物是在指导分子与其DNA靶标结合后形成的RNA/DNAn RNA双链体,该双链体之后与CRISPR-Cas酶形成CRISPR-Cas复合物。腺苷脱氨酶的底物还可以是在指导分子与其RNA靶标结合后形成的RNA/RNA双链体,该双链体之后与CRISPR-Cas酶形成CRISPR-Cas复合物。RNA/DNA或DNA/RNAn RNA在本文中也称为“RNA/DNA杂合体”、“DNA/RNA杂合体”或“双链底物”。指导分子和CRISPR-Cas酶的特殊特征在下文详述。
如本文所用,术语“编辑选择性”是指由腺苷脱氨酶编辑的双链底物上所有位点的分数。不受理论的束缚,预期腺苷脱氨酶的编辑选择性受双链底物的长度和二级结构(诸如错配碱基、凸环和/或内环的存在)影响。
在一些实施方案中,当底物是长于50bp的完全碱基配对的双链体时,腺苷脱氨酶可能能够使双链体内的多个腺苷残基(例如,所有腺苷残基的50%)脱氨基。在一些实施方案中,当底物短于50bp时,腺苷脱氨酶的编辑选择性受靶腺苷位点处错配存在的影响。特别地,在一些实施方案中,在相反链上具有错配的胞苷(C)残基的腺苷(A)残基被高效脱氨基。在一些实施方案中,在相反链上具有错配的鸟苷(G)残基的腺苷(A)残基被跳过而不进行编辑。
靶向结构域
本发明的方法、工具和组合物包含或利用可被称为靶向结构域的靶向组分。靶向结构域优选是DNA或RNA靶向结构域,更特别是寡核苷酸靶向结构域,或保留DNA和/或RNA结合活性的其变体或片段。寡核苷酸靶向结构域可以结合目标RNA或DNA中在靶基因座处或邻近处的序列、基序或结构特征。结构特征可以包括发夹、四环或核酸的其他二级结构特征。如本文所用,“邻近”意指腺苷脱氨酶在其中可以完成其碱基编辑功能的靶基因座的距离和/或取向内。在某些示例性实施方案中,寡核苷酸结合蛋白可以是RNA结合蛋白或其功能结构域,或者DNA结合蛋白或其功能结构域。
在特定实施方案中,靶向结构域还包含指导RNA(如将在下文所述)。核酸结合蛋白可以是(内切)核酸酶或任何其他(寡)核苷酸结合蛋白。在特定实施方案中,对核苷酸结合蛋白进行了修饰以使不为所述DNA或RNA结合所需的任何其他功能失活。在特定实施方案中,在核苷酸结合蛋白是(内切)核酸酶的情况下,优选地所述(内切)核酸酶具有与野生型DNA或RNA结合蛋白相比改变的或稀释的活性(即,如本文别处所述的修饰的核酸酶)。在某些实施方案中,所述核酸酶是靶向或位点特异性或归巢核酸酶或其具有改变的或修饰的活性的变体。在某些实施方案中,所述(寡)核苷酸结合蛋白是所述(寡)核苷酸结合蛋白的(寡)核苷酸结合结构域,并且不包含所述蛋白的不为DNA和/或RNA结合所需的一个或多个结构域(更具体地,不包含一个或多个其他功能结构域)。
RNA结合蛋白
在某些示例性实施方案中,寡核苷酸结合结构域可以包含RNA结合蛋白或其功能结构域或者由其组成,所述RNA结合蛋白包含RNA识别基序。包含RNA识别基序的示例性RNA结合蛋白包括但不限于:A2BP1;ACF;BOLL;BRUNOL4;BRUNOL5;BRUNOL6;CCBL2;CGI96;CIRBP;CNOT4;CPEB2;CPEB3;CPEB4;CPSF7;CSTF2;CSTF2T;CUGBP1;CUGBP2;D10S102;DAZ1;DAZ2;DAZ3;DAZ4;DAZAP1;DAZL;DNAJC17;DND1;EIF3S4;EIF3S9;EIF4B;EIF4H;ELAVL1;ELAVL2;ELAVL3;ELAVL4;ENOX1;ENOX2;EWSR1;FUS;FUSIP1;G3BP;G3BP1;G3BP2;GRSF1;HNRNPL;HNRPA0;HNRPA1;HNRPA2B1;HNRPA3;HNRPAB;HNRPC;HNRPCL1;HNRPD;HNRPDL;HNRPF;HNRPH1;HNRPH2;HNRPH3;HNRPL;HNRPLL;HNRPM;HNRPR;HRNBP1;HSU53209;HTATSF1;IGF2BP1;IGF2BP2;IGF2BP3;LARP7;MKI67IP;MSI1;MSI2;MSSP2;MTHFSD;MYEF2;NCBP2;NCL;NOL8;NONO;P14;PABPC1;PABPC1L;PABPC3;PABPC4;PABPC5;PABPN1;POLDIP3;PPARGC1;PPARGC1A;PPARGC1B;PPIE;PPIL4;PPRC1;PSPC1;PTBP1;PTBP2;PUF60;RALY;RALYL;RAVER1;RAVER2;RBM10;RBM11;RBM12;RBM12B;RBM14;RBM15;RBM15B;RBM16;RBM17;RBM18;RBM19;RBM22;RBM23;RBM24;RBM25;RBM26;RBM27;RBM28;RBM3;RBM32B;RBM33;RBM34;RBM35A;RBM35B;RBM38;RBM39;RBM4;RBM41;RBM42;RBM44;RBM45;RBM46;RBM47;RBM4B;RBM5;RBM7;RBM8A;RBM9;RBMS1;RBMS2;RBMS3;RBMX;RBMX2;RBMXL2;RBMY1A1;RBMY1B;RBMY1E;RBMY1F;RBMY2FP;RBPMS;RBPMS2;RDBP;RNPC3;RNPC4;RNPS1;ROD1;SAFB;SAFB2;SART3;SETD1A;SF3B14;SF3B4;SFPQ;SFRS1;SFRS10;SFRS11;SFRS12;SFRS15;SFRS2;SFRS2B;SFRS3;SFRS4;SFRS5;SFRS6;SFRS7;SFRS9;SLIRP;SLTM;SNRP70;SNRPA;SNRPB2;SPEN;SR140;SRRP35;SSB;SYNCRIP;TAF15;TARDBP;THOC4;TIA1;TIAL1;TNRC4;TNRC6C;TRA2A;TRSPAP1;TUT1;U1SNRNPBP;U2AF1;U2AF2;UHMK1;ZCRB1;ZNF638;ZRSR1;和ZRSR2。
在某些示例性实施方案中,RNA结合蛋白或其功能结构域可以包含K同源结构域。包含K同源结构域的示例性RNA结合蛋白包括但不限于:AKAP1;ANKHD1;ANKRD17;ASCC1;BICC1;DDX43;DDX53;DPPA5;FMR1;FUBP1;FUBP3;FXR1;FXR2;GLD1;HDLBP;HNRPK;IGF2BP1;IGF2BP2;IGF2BP3;KHDRBS1;KHDRBS2;KHDRBS3;KHSRP;KRR1;MEX3A;MEX3B;MEX3C;MEX3D;NOVA1;NOVA2;PCBP1;PCBP2;PCBP3;PCBP4;PNO1;PNPT1;QKI;SF1;和TDRKH。
在某些示例性实施方案中,RNA结合蛋白包含锌指基序。RNA结合蛋白或其功能结构域可以包含Cys2-His2、Gag-knuckle、Treble-clet、锌带、Zn2/Cys6类基序。
在某些示例性实施方案中,RNA结合蛋白可以包含Pumilio同源结构域。
TALEN
在某些实施方案中,核酸结合蛋白是(修饰的)转录激活因子样效应核酸酶(TALEN)系统。可以对转录激活因子样效应子(TALE)进行工程化以实际上结合任何所需的DNA序列。使用TALEN系统进行基因组编辑的示例性方法可见于例如Cermak T.DoyleEL.Christian M.Wang L.Zhang Y.Schmidt C,等人Efficient design and assembly ofcustom TALEN and other TAL effector-based constructs for DNAtargeting.Nucleic Acids Res.2011;39:e82;Zhang F.Cong L.Lodato S.KosuriS.Church GM.Arlotta P Efficient construction of sequence-specific TALeffectors for modulating mammalian transcription.Nat Biotechnol.2011;29:149-153以及美国专利号8,450,471、8,440,431和8,440,432,这些文献均以引用方式并入明确并入。作为进一步指导且非限制性地,天然存在的TALE或“野生型TALE”是由多种变形菌分泌的核酸结合蛋白。TALE多肽含有核酸结合结构域,该结构域由高度保守的单体多肽的串联重复序列组成,串联重复序列的长度主要为33、34或35个氨基酸,并且彼此的区别主要在于第12位和第13位氨基酸。在有利的实施方案中,核酸是DNA。如本文所用,术语“多肽单体”或“TALE单体”将用于指代TALE核酸结合结构域内的高度保守的重复多肽序列,而术语“重复可变二残基”或“RVD”将用于指代该多肽单体第12位和第13位的高度可变氨基酸。正如本公开通篇所提供的,使用IUPAC氨基酸单字母代码来描述RVD的氨基酸残基。包含在DNA结合结构域中的TALE单体的一般表示是X1-11-(X12X13)-X14-33或34或35,其中下标指示氨基酸位置,X表示任何氨基酸。X12X13指示RVD。在一些多肽单体中,第13位的可变氨基酸缺失或不存在,并且在此类多肽单体中,RVD由单个氨基酸组成。在此类情况下,RVD可以替代地表示为X*,其中X表示X12并且(*)指示X13不存在。DNA结合结构域包含TALE单体的几次重复,并且可以表示为(X1-11-(X12X13)-X14-33或34或35)z,其中在有利的实施方案中,z为至少5至40。在另一个有利的实施方式中,z为至少10至26。TALE单体具有核苷酸结合亲和力,该亲和力由其RVD中的氨基酸的身份决定。例如,RVD为NI的多肽单体优先结合至腺嘌呤(A),RVD为NG的多肽单体优先结合至胸腺嘧啶(T),RVD为HD的多肽单体优先结合至胞嘧啶(C),而RVD为NN的多肽单体优先结合至腺嘌呤(A)和鸟嘌呤(G)两者。在本发明的又另一个实施方案中,RVD为IG的多肽单体优先结合至T。因此,在TALE的核酸结合结构域中多肽单体重复序列的数目和顺序决定了其核酸靶标特异性。在本发明的其他实施方案中,RVD为NS的多肽单体识别所有四个碱基对并且可以结合至A、T、G或C。TALE的结构和功能进一步描述于例如Moscou等人,Science 326:1501(2009);Boch等人,Science 326:1509-1512(2009);和Zhang等人,Nature Biotechnology 29:149-153(2011),所述文献各自以引用方式整体并入。在某些实施方案中,靶向是通过多核酸结合TALEN片段来实现的。在某些实施方案中,靶向结构域包含无催化活性的TALEN或其核酸结合片段或者由其组成。
锌指核酸酶
在某些实施方案中,靶向结构域包含(修饰的)锌指核酸酶(ZFN)系统或由其组成。ZFN系统使用通过将锌指DNA结合结构域融合至DNA切割结构域而生成的人工限制性酶,可以将所述人工限制性酶设计为靶向所需的DNA序列。使用ZFN进行基因组编辑的示例性方法可见于例如美国专利号6,534,261、6,607,882、6,746,838、6,794,136、6,824,978、6,866,997、6,933,113、6,979,539、7,013,219、7,030,215、7,220,719、7,241,573、7,241,574、7,585,849、7,595,376、6,903,185和6,479,626,所述专利全部以引用方式明确并入。作为进一步指导且非限制性地,人工锌指(ZF)技术涉及ZF模块阵列,以靶向基因组中的新DNA结合位点。ZF阵列中的每个手指模块均靶向三个DNA碱基。定制的单个锌指结构域阵列组装成ZF蛋白(ZFP)。ZFP可以包含功能结构域。通过将ZF蛋白融合至IIS型限制性酶FokI的催化结构域,开发出第一个合成的锌指核酸酶(ZFN)。(Kim,Y.G.等人,1994,Chimeric restrictionendonuclease,Proc.Natl.Acad.Sci.U.S.A.91,883-887;Kim,Y.G.等人,1996,Hybridrestriction enzymes:zinc finger fusions to Fok I cleavage domain.Proc.Natl.Acad.Sci.U.S.A.93,1156-1160)。通过使用配对的ZFN异源二聚体可以增加切割特异性并且降低脱靶活性,每个ZFN异源二聚体靶向由短间隔区分隔的不同核苷酸序列。(Doyon,Y.等人,2011,Enhancing zinc-finger-nuclease activity with improved obligateheterodimeric architectures.Nat.Methods 8,74-79)。ZFP还可以被设计为转录激活因子和阻抑因子,并且已被用于靶向多种多样的生物体中的许多基因。在某些实施方案中,靶向结构域包含核酸结合锌指核酸酶或其核酸结合片段或者由其组成。在某些实施方案中,核酸结合锌指核酸酶(片段)是无催化活性的。
大范围核酸酶
在某些实施方案中,靶向结构域包含(修饰的)大范围核酸酶,大范围核酸酶是特征在于大识别位点(12至40个碱基对的双链DNA序列)的内切脱氧核糖核酸酶。使用大范围核酸酶的示例性方法可见于美国专利号:8,163,514;8,133,697;8,021,867;8,119,361;8,119,381;8,124,369;和8,129,134,所述专利以引用方式明确并入。在某些实施方案中,靶向是通过多核酸结合大范围核酸酶片段来实现的。在某些实施方案中,靶向是通过无催化活性的多核酸结合大范围核酸酶(片段)来实现的。因此,在特定实施方案中,靶向结构域包含核酸结合大范围核酸酶或其核酸结合片段或者由其组成。
CRISPR-Cas系统
在某些实施方案中,靶向结构域包含(修饰的)CRISPR/Cas复合物或系统。关于CRISPR-Cas系统、其组分、及此类组分的递送(包括方法、材料、递送媒介物、载体、粒子、以及其制造和使用(包括关于量和配制品)),连同表达CRISPR-Cas的真核细胞、表达CRISPR-Cas的真核生物(诸如小鼠)的一般信息,在本文别处进行描述。在某些实施方案中,靶向是通过寡核苷酸结合CRISPR蛋白片段和/或gRNA来实现的。在某些实施方案中,靶向是通过无催化活性的核酸结合CRISPR蛋白(片段)来实现的。因此,在特定实施方案中,靶向结构域包含寡核酸结合CRISPR蛋白或CRISPR蛋白和/或gRNA的寡核酸结合片段。
如本文所用,术语“Cas”大体上是指CRISPR/Cas系统或复合物的(修饰的)效应蛋白,并且可以非限制性地为(修饰的)Cas9或其他酶,诸如Cpf1、C2c1、C2c2、C2c3、组29或组30蛋白。术语“Cas”在本文中可以与术语“CRISPR”蛋白、“CRISPR/Cas蛋白”、“CRISPR效应子”、“CRISPR/Cas效应子”、“CRISPR酶”、“CRISPR/Cas酶”等互换使用,除非另外指明,如特定地且排他性地指代Cas9。应当理解,术语“CRISPR蛋白”可以与“CRISPR酶”互换使用,不论所述CRISPR蛋白与野生型CRISPR蛋白相比是否具有改变的,如增加的或降低的(或没有)酶活性。同样地,如本文所用,在某些实施方案中,在适当的情况下并且对技术人员而言是显而易见的,术语“核酸酶”可以指代催化活性已经改变,如具有增加的或降低的核酸酶活性,或者根本没有核酸酶活性、以及切口酶活性的修饰的核酸酶,以及如本文别处所定义的以其他方式修饰的核酸酶,除非另外指明,如特定地且排他性地指代未修饰的核酸酶。
在一些实施方案中,CRISPR效应蛋白是Cas9、Cpf1、C2c1、C2c2,或者Cas13a、Cas13b、Cas13c或Cas13d。在一些实施方案中,CRISPR效应蛋白是DNA靶向CRISPR效应蛋白。在一些实施方案中,CRISPR效应蛋白是II型CRISPR效应蛋白,诸如Cas9。在一些实施方案中,CRISPR效应蛋白是V型CRISPR效应蛋白,诸如Cpf1或C2c1。在一些实施方案中,CRISPR效应蛋白是RNA靶向CRISPR效应蛋白。在一些实施方案中,CRISPR效应蛋白是VI型CRISPR效应蛋白,诸如Cas13a、Cas13b、Cas13c或Cas13d。
在一些实施方案中,CRISPR效应蛋白是Cas9,例如SaCas9、SpCas9、StCas9、CjCas9等等,可以设想任何直系同源物。在一些实施方案中,CRISPR效应蛋白是Cpf1,例如AsCpf1、LbCpf1、FnCpf1等等,可以设想任何直系同源物。在某些实施方案中,根据本发明的如本文所述的靶向组分是(内切)核酸酶或其具有改变或修饰的活性的变体(即修饰的核酸酶,如本文别处所述)。在某些实施方案中,所述核酸酶是靶向或位点特异性或归巢核酸酶或其具有改变的或修饰的活性的变体。在某些实施方案中,所述核酸酶或靶向/位点特异性/归巢核酸酶是以下各项、包含以下各项、基本上由以下各项组成或者由以下各项组成:(修饰的)CRISPR/Cas系统或复合物、(修饰的)Cas蛋白、(修饰的)锌指、(修饰的)锌指核酸酶(ZFN)、(修饰的)转录因子样效应子(TALE)、(修饰的)转录因子样效应核酸酶(TALEN)或(修饰的)大范围核酸酶。在某些实施方案中,所述(修饰的)核酸酶或靶向/位点特异性/归巢核酸酶是以下物质、包含以下物质、基本上由以下物质组成或者由以下物质组成:(修饰的)RNA指导核酸酶。
在特定实施方案中,更特别地在核酸酶是CRISPR蛋白的情况下,靶向结构域还包含靶向所选核酸的指导分子。例如,在CRISPR/Cas系统的情形下,指导RNA能够与所选核酸序列杂交。如本文所用,“杂交”是指一种或多种多核苷酸反应形成经由核苷酸残基的碱基之间的氢键合而稳定的复合物的反应。氢键合可通过沃森克里克(Watson-Crick)碱基配对、霍格斯坦结合(Hoogstein binding)或以任何其他序列特异性方式发生。复合物可以包含形成双链体结构的两条链、形成多链复合物的三条或更多条链、一条自杂交链或它们的任意组合。杂交反应可以构成更广泛过程中的一个步骤,所述过程诸如PGR的起始或酶对多核苷酸的切割。能够与给定序列杂交的序列称之为给定序列的“补体”。
在本发明的方法和系统中,使用了CRISPR-Cas蛋白和相应的指导分子。更特别地,CRISPR-Cas蛋白是2类CRISPR-Cas蛋白。在某些实施方案中,所述CRISPR-Cas蛋白是Cas13。CRISPR-Cas系统不需要生成靶向特定序列的定制蛋白,而是单个Cas蛋白可以通过指导分子进行编程以识别特定核酸靶标,换句话说,可以使用所述指导分子将Cas酶蛋白募集至目标靶基因座的特定核酸。
如本文所用,术语“AD官能化的CRISPR系统”是指核酸靶向和编辑系统,所述系统包含(a)CRISPR-Cas蛋白,更特别地是无催化活性的Cas13蛋白;(b)包含指导序列的指导分子;(c)腺苷脱氨酶蛋白或其催化结构域;其中所述腺苷脱氨酶蛋白或其催化结构域共价或非共价地连接至所述CRISPR-Cas蛋白或所述指导分子,或者适于在递送之后连接至所述CRISPR-Cas蛋白或所述指导分子;其中所述指导序列与靶序列基本上互补,但包含对应于针对脱氨靶向的A的非配对C,导致由所述指导序列和所述靶序列形成的RNA双链体中出现A-C错配。对于在真核细胞中应用,CRISPR-Cas蛋白和/或腺苷脱氨酶优选地带有NLS标签。
在特定实施方案中,靶向结构域是CRISPR-cas蛋白。在某些示例性实施方案中,CRISPR-cas蛋白通过LEPGEKPYKCPECGKSFSQ SGALTRHQRTHTR(SEQ ID No.11)接头连接至脱氨酶蛋白或其催化结构域。在另外的特定实施方案中,CRISPR-Cas蛋白的C端通过LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQ ID No.11)接头连接至脱氨酶蛋白或其催化结构域的N端。另外,N端和C端NLS也可以充当接头(例如PKKKRKVEASSPKKRKVEAS(SEQ ID No.16))。在本发明方法的特定实施方案中,将腺苷脱氨酶蛋白或其催化结构域作为单独的蛋白递送至细胞或在细胞内表达,但对其进行了修饰以使其能够连接至靶向结构域或指导分子。在靶向结构域是C RISPR-Cas系统的那些实施方案中,腺苷脱氨酶可以连接至Cas蛋白或指导分子。在特定实施方案中,这是通过使用存在于多种多样的噬菌体外壳蛋白中的正交RNA结合蛋白或衔接蛋白/适体组合来确保的。此类外壳蛋白的实例包括但不限于:MS2、Qβ、F2、GA、fr、J P501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、 7s和PRR1。适体可以是通过反复轮次的体外选择或SELE X(指数富集的配体系统进化)进行工程化以便与特定靶标结合的天然存在的或合成的寡核苷酸。
在本发明的方法和系统的特定实施方案中,指导分子提供有一个或多个可以募集衔接蛋白的不同的RNA环或不同的序列。例如,可以通过插入一个或多个不同的RNA环或不同的序列来延长指导分子,而不会与Cas蛋白发生冲突,这些不同的RNA环或不同的序列可以募集可以结合至所述不同的RNA环或不同的序列的衔接蛋白。Konermann(Nature 2015,517(7536):583-588)中提供了修饰指导物的示例及其在将效应结构域募集至CRISPR-Cas复合物中的用途。在特定实施方案中,适体是选择性地结合哺乳动物细胞中的二聚化MS2噬菌体外壳蛋白的最小发夹适体,并且被引入到指导分子中,诸如茎环和/或四环中。在这些实施方案中,将腺苷脱氨酶蛋白融合至MS2。然后将腺苷脱氨酶蛋白与CRISPR-Cas蛋白和相应的指导RNA共同递送。
在一些实施方案中,将组分(a)、组分(b)和组分(c)作为核糖核蛋白复合物递送至细胞。可以经由一种或多种脂质纳米粒子递送核糖核蛋白复合物。
在一些实施方案中,将组分(a)、组分(b)和组分(c)作为一种或多种RNA分子诸如编码CRISPR-Cas蛋白、腺苷脱氨酶蛋白和任选地衔接蛋白的一种或多种指导RNA和一种或多种mRNA分子递送至细胞。可以经由一种或多种脂质纳米粒子递送RNA分子。
在一些实施方案中,将组分(a)、组分(b)和组分(c)作为一种或多种DNA分子递送至细胞。在一些实施方案中,一种或多种DNA分子包含在一种或多种载体诸如病毒载体(例如AAV)中。在一些实施方案中,所述一种或多种DNA分子包含可操作地配置成表达CRISPR-Cas蛋白、指导分子和腺苷脱氨酶蛋白或其催化结构域的一个或多个调控元件,任选地其中所述一个或多个调控元件包括诱导型启动子。
在某些实施方案中,CRISPR-Cas蛋白是死亡Cas13。在一些实施方案中,死亡Cas13是死亡Cas13a蛋白,其包含在HEPN结构域中的一个或多个突变。在一些实施方案中,死亡Cas13a包含对应于韦德纤毛菌(LwaCas13a)中的R474A和R1046A的突变。在一些实施方案中,死亡Cas13是死亡Cas13b蛋白,所述死亡Cas13b蛋白包含源自动物溃疡伯格菌ATCC43767的Cas13b蛋白的R116A、H121A、R1177A、H1182A中的一者或多者,或Cas13b直系同源物的其相应氨基酸位置中的突变。
在一些实施方案中,指导分子能够与RNA序列内包含待脱氨基的腺嘌呤的靶序列杂交,以形成包含与所述腺嘌呤相对的非配对胞嘧啶的RNA双链体。在形成RNA双链体后,指导分子与Cas13蛋白形成复合物,并引导所述复合物结合目标靶RNA序列处的RNA多核苷酸。下文提供了有关AD官能化的CRISPR-Cas系统中的指导物方面的细节。
在一些实施方案中,使用具有典型长度的Cas13指导RNA例如LawCas13与靶DNA形成RNA双链体。在一些实施方案中,使用比典型长度长的Cas13指导分子例如LawCas13a与靶DNA形成RNA双链体,包括在Cas13指导RNA-靶DNA复合物之外形成双链体。
在至少第一设计中,AD官能化的CRISPR系统包含(a)融合或连接至CRISPR-Cas蛋白的腺苷脱氨酶,其中所述CRISPR-Cas蛋白是无催化活性的;和(b)指导分子,其包含被设计来在指导序列与靶序列之间所形成的RNA双链体中引入A-C错配的指导序列。在一些实施方案中,CRISPR-Cas蛋白和/或腺苷脱氨酶在N端或C端或这两者上带有NLS标签。
在至少第二设计中,AD官能化的CRISPR系统包含(a)无催化活性的CRISPR-Cas蛋白;(b)指导分子,其包含被设计来在指导序列与靶序列之间所形成的RNA双链体中引入A-C错配的指导序列,和能够结合衔接蛋白(例如MS2外壳蛋白或PP7外壳蛋白)的适体序列(例如MS2RNA基序或PP7RNA基序);和(c)融合或连接至衔接蛋白的腺苷脱氨酶,其中适体和衔接蛋白的结合将腺苷脱氨酶募集至在指导序列与靶序列之间所形成的RNA双链体,以在A-C错配的A处进行靶向脱氨。在一些实施方案中,衔接蛋白和/或腺苷脱氨酶在N端或C端或这两者上带有NLS标签。CRISPR-Cas蛋白也可以带有NLS标签。
使用不同的适体和相应的衔接蛋白还可以实现正交基因编辑。在结合使用腺苷脱氨酶与胞苷脱氨酶用于正交基因编辑/脱氨的实例中,用不同的RNA环修饰靶向不同基因座的sgRNA,以分别募集MS2-腺苷脱氨酶和PP7-胞苷脱氨酶(或PP7-腺苷脱氨酶和MS2-胞苷脱氨酶),导致目标靶基因座处的A或C分别发生正交脱氨。PP7是噬菌体假单胞菌的RNA结合外壳蛋白。同MS2一样,它结合特定的RNA序列和二级结构。PP7RNA识别基序与MS2的不同。因此,PP7和MS2可以多路复用,以同时在不同的基因组基因座介导不同的效应。例如,靶向基因座A的sgRNA可以用MS2环修饰,从而募集MS2-腺苷脱氨酶;而靶向基因座B的另一sgRNA可以用PP7环修饰,从而募集PP7-胞苷脱氨酶。因此,在同一细胞中实现了正交的基因座特异性修饰。可以扩展该原理以并入其他正交RNA结合蛋白。
在至少第三设计中,AD官能化的CRISPR系统包含(a)插入到CRISPR-Cas蛋白的内环或非结构化区中的腺苷脱氨酶,其中所述CRISPR-Cas蛋白无催化活性或者是切口酶;和(b)指导分子,其包含被设计来在指导序列与靶序列之间所形成的RNA双链体中引入A-C错配的指导序列。
可以借助晶体结构鉴定适用于腺苷脱氨酶插入的CRISPR-Cas蛋白拆分位点。如果直系同源物与预期的CRISPR-Cas蛋白之间存在相对高程度的同源性,则可以使用直系同源物的晶体结构。
拆分位置可以位于某一区域或环内。优选地,拆分位置在氨基酸序列的中断不会导致结构特征(例如α-螺旋或β-折叠)部分或全部破坏的地方出现。非结构化区(由于结构化程度不足以使其在晶体中“冻结”而未出现在晶体结构中的区域)通常是首选选项。非结构化区或外环内的位置可能不必完全是上面提供的数字,而是可能会变化,例如以上给出的位置任一侧的1个、2个、3个、4个、5个、6个、7个、8个、9个甚至10个氨基酸(取决于环的大小),只要拆分位置仍落在外环的非结构化区内即可。
本文所述的AD官能化的CRISPR系统可以用于靶向RNA多核苷酸序列内的特定腺嘌呤或胞苷以进行脱氨。例如,指导分子可以与CRISPR-Cas蛋白形成复合物,并引导所述复合物结合目标RNA多核苷酸中的靶RNA序列。在某些示例性实施方案中,由于指导序列被设计成具有非配对C,因此在指导序列与靶序列之间所形成的RNA双链体包含A-C错配,该错配引导腺苷脱氨酶与同非配对C相对的A接触并使其脱氨基,从而将其转化为肌苷(I)。由于肌苷(I)碱基与C配对并且在细胞过程中具发挥类似G的功能,因此本文所述的A的靶向脱氨可用于校正不合需要的G-A和C-T突变,以及获得期望的A-G和T-C突变。
在一些实施方案中,AD官能化的CRISPR系统是用于体外RNA多核苷酸分子中的靶向脱氨。在一些实施方案中,AD官能化的CRISPR系统是用于细胞内DNA分子中的靶向脱氨。细胞可以是真核细胞,诸如动物细胞、哺乳动物细胞、人类细胞或植物细胞。
指导分子
2类V型CRISPR-Cas蛋白的指导分子或指导RNA包含tracr配对序列(在内源性CRISPR系统的情形中涵盖“正向重复序列”)和指导序列(在内源性CRISPR系统的情形中也称为“间隔区”)。实际上,与II型CRISPR-Cas蛋白成对比,Cas13蛋白不依赖于tracr序列的存在。在一些实施方案中,本文所述的CRISPR-Cas系统或复合物不包含和/或不依赖于tracr序列的存在(例如,若Cas蛋白是Cas13)。在某些实施方案中,指导分子可以包含融合或连接至指导序列或间隔区序列的正向重复序列,基本上由其组成,或由其组成。
一般来讲,CRISPR系统由促进在靶序列的位点处CRISPR复合物形成的元件表征。在形成CRISPR复合物的情形中,“靶序列”是指指导序列被设计成与其具有互补性的序列,其中靶DNA序列与指导序列之间的杂交促进CRISPR复合物的形成。
术语“指导分子”和“指导RNA”在本文可互换使用,是指能够与CRISPR-Cas蛋白形成复合物并且包含与靶核酸序列具有足够的互补性以与靶核酸序列杂交并引导复合物序列特异性地结合至靶核酸序列的指导序列的基于RNA的分子。如本文所述,指导分子或指导RNA特别涵盖具有一种或多种化学修饰(例如,通过化学连接两个核糖核苷酸或通过用一种或多种脱氧核糖核苷酸替代一种或多种核糖核苷酸)的基于RNA的分子。
如本文所用,V型或VI型CRISPR-Cas基因座效应蛋白的术语“crRNA”或“指导RNA”或“单指导RNA”或“sgRNA”或“一种或多种核酸组分”包括与靶核酸序列具有足够互补性以与靶核酸序列杂交并且引导核酸靶向复合物序列特异性地结合至靶核酸序列的任何多核苷酸序列。在一些实施方案中,当使用合适的比对算法最佳比对时,互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何合适算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Watermanalgorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒比对仪(Burrows WheelerAligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies;在www.novocraft.com上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在maq.sourceforge.net上可得)。可以通过任何合适的测定来评定指导序列(在核酸靶向指导RNA内)引导核酸靶向复合物序列特异性地结合至靶核酸序列的能力。举例来说,足以形成核酸靶向复合物的核酸靶向CRISPR系统的组分,包括有待测试的指导序列,可以提供给具有相应靶核酸序列的宿主细胞,诸如通过用编码核酸靶向复合物的组分的载体转染,继而诸如通过如本文所述的Surveyor测定评定靶核酸序列内的优先靶向(例如切割)。类似地,可以在试管中通过提供靶核酸序列、核酸靶向复合物的组分(包括有待测试的指导序列)和不同于测试指导序列的对照指导序列,以及在测试指导序列与对照指导序列反应之间比较靶序列处的结合或切割速率来评估靶核酸序列的切割。其他测定可能存在,并且将为本领域技术人员所想到。可以选择指导序列并且因此选择核酸靶向指导以靶向任何靶核酸序列。靶序列可以是DNA。靶序列可以是任何RNA序列。在一些实施方案中,靶序列可以是选自由以下组成的组的RNA分子内的序列:信使RNA(mRNA)、前体mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小细胞核RNA(snRNA)、小细胞核RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和小细胞质RNA(scRNA)。在一些优选的实施方案中,靶序列可以是选自由mRNA、前体mRNA和rRNA组成的组的RNA分子内的序列。在一些优选的实施方案中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选的实施方案中,靶序列可以是mRNA分子或前体mRNA分子内的序列。
在一些实施方案中,指导分子包含被设计成与靶序列具有至少一个错配的指导序列,使得在指导序列与靶序列之间所形成的RNA双链体包含在指导序列中的与靶A相对的非配对C,以便于靶序列上的脱氨。在一些实施方案中,除该A-C错配外,当使用合适的比对算法最佳比对时,互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。
如本文所用,V型或VI型CRISPR-Cas基因座效应蛋白的术语“crRNA”或“指导RNA”或“单指导RNA”或“sgRNA”或“一种或多种核酸组分”包括与靶核酸序列具有足够互补性以与靶核酸序列杂交并且引导核酸靶向复合物序列特异性地结合至靶核酸序列的任何多核苷酸序列。在一些实施方案中,当使用合适的比对算法最佳比对时,互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何合适算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Watermanalgorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒比对仪(Burrows WheelerAligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies;在www.novocraft.com上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在maq.sourceforge.net上可得)。可以通过任何合适的测定来评定指导序列(在核酸靶向指导RNA内)引导核酸靶向复合物序列特异性地结合至靶核酸序列的能力。举例来说,足以形成核酸靶向复合物的核酸靶向CRISPR系统的组分,包括有待测试的指导序列,可以提供给具有相应靶核酸序列的宿主细胞,诸如通过用编码核酸靶向复合物的组分的载体转染,继而诸如通过如本文所述的Surveyor测定评定靶核酸序列内的优先靶向(例如切割)。类似地,可以在试管中通过提供靶核酸序列、核酸靶向复合物的组分(包括有待测试的指导序列)和不同于测试指导序列的对照指导序列,以及在测试指导序列与对照指导序列反应之间比较靶序列处的结合或切割速率来评估靶核酸序列的切割。其他测定可能存在,并且将为本领域技术人员所想到。可以选择指导序列并且因此选择核酸靶向指导以靶向任何靶核酸序列。靶序列可以是DNA。靶序列可以是任何RNA序列。在一些实施方案中,靶序列可以是选自由以下组成的组的RNA分子内的序列:信使RNA(mRNA)、前体mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、小细胞核RNA(snRNA)、小细胞核RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长非编码RNA(lncRNA)和小细胞质RNA(scRNA)。在一些优选的实施方案中,靶序列可以是选自由mRNA、前体mRNA和rRNA组成的组的RNA分子内的序列。在一些优选的实施方案中,靶序列可以是选自由ncRNA和lncRNA组成的组的RNA分子内的序列。在一些更优选的实施方案中,靶序列可以是mRNA分子或前体mRNA分子内的序列。
在一些实施方案中,选择核酸靶向指导物以降低核酸靶向指导物内的二级结构程度。在一些实施方案中,当最佳折叠时,核酸靶向指导物的约或小于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或更少的核苷酸参与自身互补碱基配对。最佳折叠可以通过任何合适的多核苷酸折叠算法来确定。一些程序是基于计算最小吉布斯自由能(Gibbs free energy)。一种此类算法的实例是如Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所描述的mFold。另一个示例性折叠算法是维也纳大学(University ofVienna)的理论化学研究所(Institute for Theoretical Chemistry)开发的使用质心结构预测算法的在线网络服务器RNAfold(参见例如A.R.Gruber等人,2008,Cell 106(1):23-24;和PA Carr和GM Church,2009,Nature Biotechnology 27(12):1151-62)。
在某些实施方案中,指导RNA或crRNA可以包含正向重复(DR)序列和指导序列或间隔区序列,基本上由其组成,或由其组成。在某些实施方案中,指导RNA或crRNA可以包含融合或连接至指导序列或间隔区序列的正向重复序列,基本上由其组成,或由其组成。在某些实施方案中,正向重复序列可以位于指导序列或间隔区序列上游(即,5')。在其他实施方案中,正向重复序列可以位于指导序列或间隔区序列下游(即3')。
在某些实施方案中,crRNA包含茎环,优选单个茎环。在某些实施方案中,正向重复序列形成茎环,优选单个茎环。
在某些实施方案中,指导RNA的间隔区长度为15至35nt。在某些实施方案中,指导RNA的间隔区长度为至少15个核苷酸。在某些实施方案中,间隔区长度为15至17nt,例如15、16或17nt;17至20nt,例如17、18、19或20nt;20至24nt,例如20、21、22、23或24nt;23至25nt,例如23、24或25nt;24至27nt,例如24、25、26或27nt;27-30nt,例如27、28、29或30nt;30-35nt,例如30、31、32、33、34或35nt;或35nt或更长。
“tracrRNA”序列或类似术语包括与crRNA序列具有足够互补性以杂交的任何多核苷酸序列。在一些实施方案中,当沿着tracrRNA序列和crRNA序列中较短的一个序列最佳比对时,这两个序列之间的互补程度为约或大于约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%或更大。在一些实施方案中,tracr序列的长度为约或大于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50个或更多个核苷酸。在一些实施方案中,tracr序列和crRNA序列包含在单一转录物中,使得两者之间的杂交产生具有二级结构诸如发夹的转录物。在本发明的一个实施方案中,转录物或转录的多核苷酸序列具有至少两个或更多个发夹。在优选的实施方案中,转录物具有两个、三个、四个或五个发夹。在本发明的另一个实施方案中,转录物具有至多五个发夹。在发夹结构中,环的最后“N”和上游的序列5'的部分对应于tracr配对序列,而环的序列3'的部分对应于tracr序列。
一般来讲,互补程度是指沿着sca序列和tracr序列中较短的一个序列,这两个序列的最佳比对。最佳比对可以通过任何合适的比对算法来确定,并且可以进一步考虑二级结构,诸如sca序列或tracr序列内的自互补性。在一些实施方案中,当沿着tracr序列和sca序列中较短的一个序列最佳比对时,这两个序列之间的互补程度为约或大于约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%或更大。
一般来讲,CRISPR-Cas或CRISPR系统可以如在诸如WO 2014/093622(PCT/US2013/074667)的前述文献中那样使用并且共同地涉及CRISPR相关的(“Cas”)基因的表达中所涉及或引导所述基因的活性的转录物和其他元件,包括编码Cas基因(特别地,在CRISPR-Cas13的情况下为Cas13基因)的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(在内源性CRISPR系统的情形中涵盖“正向重复序列”和tracrRNA加工的部分正向重复序列)、指导序列(在内源性CRISPR系统的情形中也称为“间隔区”),或如本文所用的那个术语“一种或多种RNA”(例如用以导向Cas13的一种或多种RNA,例如CRISPR RNA和反式激活(tracr)RNA或单指导RNA(sgRNA)(嵌合RNA)),或来自CRISPR基因座的其他序列和转录物。一般来讲,CRISPR系统由促进在靶序列的位点处CRISPR复合物形成的元件表征(在内源性CRISPR系统的情形中也称为原间隔区)。在形成CRISPR复合物的情形中,“靶序列”是指指导序列被设计成与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。与靶序列的互补对于切割活性很重要的指导序列的部分在本文中称为种子序列。靶序列可以包含任何多核苷酸,诸如DNA或RNA多核苷酸。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中,并且可以包括处于存在于细胞内的线粒体、细胞器、囊泡、脂质体或粒子中或来自其的核酸。在一些实施方案中,特别是对于非核用途,NLS不是优选的。在一些实施方案中,CRISPR系统包含一个或多个核输出信号(NES)。在一些实施方案中,CRISPR系统包含一个或多个NLS和一个或多个NES。在一些实施方案中,可以通过搜索满足以下任何或所有条件的重复基序,在计算机上鉴定正向重复序列:1.在II型CRISPR基因座侧翼的2Kb基因组序列窗口中;2.跨度为20至50bp;和3.间隔20至50bp。在一些实施方案中,可以使用这些标准中的2个,例如1和2、2和3或1和3。在一些实施方案中,可以使用所有3个标准。
在本发明的实施方案中,术语指导序列和指导RNA,即,能够将Cas导向靶基因组基因座的RNA,如前面引用的文献诸如WO 2014/093622(PCT/US2013/074667)中所述互换使用。一般来讲,指导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并且引导CRISPR复合物序列特异性地结合至靶序列的任何多核苷酸序列。在一些实施方案中,当使用合适的比对算法最佳比对时,指导序列与其相应靶序列之间的互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何合适算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Watermanalgorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒比对仪(Burrows WheelerAligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies;在www.novocraft.com上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在maq.sourceforge.net上可得)。在一些实施方案中,指导序列的长度为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多个核苷酸。在一些实施方案中,指导序列的长度小于约75、50、45、40、35、30、25、20、15、12个或更少的核苷酸。优选地,指导序列长度为10 30个核苷酸。可以通过任何适合的测定来评定指导序列引导CRISPR复合物序列特异性地结合至靶序列的能力。例如,足以形成CRISPR复合物的CRISPR系统的组分,包括有待测试的指导序列,可以提供给具有相应靶序列的宿主细胞,诸如通过用编码CRISPR序列的组分的载体转染,继而诸如通过如本文所述的Surveyor测定评定靶序列内的优先切割。类似地,可以在试管中通过提供靶序列、CRISPR复合物的组分(包括有待测试的指导序列)和不同于测试指导序列的对照指导序列,以及在测试指导序列与对照指导序列反应之间比较靶序列处的结合或切割速率来评估靶多核苷酸序列的切割。其他测定可能存在,并且将为本领域技术人员所想到。
在CRISPR-Cas系统的一些实施方案中,指导序列与其相应靶序列之间的互补程度可以为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%;指导物或RNA或sgRNA的长度可以为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多个核苷酸;或者指导物或RNA或sgRNA的长度可以小于约75、50、45、40、35、30、25、20、15、12个或更少的核苷酸;并且有利地tracrRNA的长度为30或50个核苷酸。然而,本发明的一个方面是减少脱靶相互作用,例如,减少指导物与具有低互补性的靶序列相互作用。实际上,在实施例中显示,本发明涉及使得CRISPR-Cas系统能够区分靶序列与具有大于80%至约95%互补性,例如83%-84%或88-89%或94-95%互补性的脱靶序列(例如,区分具有18个核苷酸的靶标与具有1个、2个或3个错配的18个核苷酸的脱靶)的突变。因此,在本发明的情形中,指导序列与其相应靶序列之间的互补程度大于94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%,或100%。脱靶小于100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%的序列与指导物之间的互补性,有利的是,脱靶为100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%的序列与指导物之间的互补性。
根据本发明的特别优选的实施方案,所述指导RNA(能够将Cas导向至靶基因座)可以包含(1)能够与真核细胞中的基因组靶基因座杂交的指导序列;(2)tracr序列;和(3)tracr配对序列。所有(1)至(3)都可以驻留在单RNA中,即sgRNA(以5'至3'取向排列),或者tracr RNA可以是与包含指导序列和tracr序列的RNA不同的RNA。tracr与tracr配对序列杂交,并将CRISPR/Cas复合物引导至靶序列。如果tracr RNA与包含指导序列和tracr序列的RNA位于不同的RNA上,则可以优化每个RNA的长度以使其各自的天然长度缩短,并且可以对每个RNA进行独立的化学修饰以防止被细胞RNA酶降解或者以其他方式增加稳定性。
如本文所述的根据本发明的方法涵盖在如本文所论述的真核细胞中(体外,即,在分离的真核细胞中)诱导一个或多个突变,其包括向细胞递送如本文所论述的载体。一个或多个突变可以包括经由一个或多个指导RNA或sgRNA在一个或多个细胞的每个靶序列处一个或多个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA或sgRNA在所述一个或多个细胞的每个靶序列处1-75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA或sgRNA在所述一个或多个细胞的每个靶序列处1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA或sgRNA在所述一个或多个细胞的每个靶序列处5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变包括经由一个或多个指导RNA或sgRNA在所述一个或多个细胞的每个靶序列处10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA或sgRNA在所述一个或多个细胞的每个靶序列处20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA或sgRNA在所述一个或多个细胞的每个靶序列处40、45、50、75、100、200、300、400或500个核苷酸的引入、缺失或取代。
为了使毒性和脱靶效应最小化,控制所递送的Cas mRNA和指导RNA的浓度可能很重要。通过在细胞或非人类真核生物动物模型中测试不同的浓度,并使用深度测序分析潜在脱靶基因组基因座处的修饰程度,可以确定Cas mRNA和指导RNA的最佳浓度。或者,为了使毒性水平和脱靶效应最小化,可以将Cas切口酶mRNA(例如具有D10A突变的化脓链球菌Cas9)与靶向目标位点的一对指导RNA一起递送。使毒性和脱靶效应最小化的指导序列和策略可以如WO 2014/093622(PCT/US2013/074667)所述;或者经由如本文所述的突变。
通常,在内源性CRISPR系统的情形中,CRISPR复合物(包含杂交至靶序列并且与一种或多种Cas蛋白复合的指导序列)的形成导致靶序列中或附近(例如距其1、2、3、4、5、6、7、8、9、10、20、50个或更多个碱基对以内)一条或两条链的切割。不希望受到理论的束缚,tracr序列可以包含野生型tracr序列的全部或一部分(例如,野生型tracr序列的约或大于约20、26、32、45、48、54、63、67、85个或更多个核苷酸)或由其组成,还可以形成CRISPR复合物的一部分,如通过沿着tracr序列的至少一部分与可操作地连接至指导序列的tracr配对序列的全部或一部分杂交。
指导物修饰
在某些实施方案中,本发明的指导物包含非天然存在的核酸和/或非天然存在的核苷酸和/或核苷酸类似物和/或化学修饰。非天然存在的核酸可包括例如天然和非天然存在的核苷酸的混合物。非天然存在的核苷酸和/或核苷酸类似物可在核糖、磷酸和/或碱基部分被修饰。在本发明的实施方案中,指导核酸包含核糖核苷酸和非核糖核苷酸。在一个这样的实施方案中,指导物包含一种或多种核糖核苷酸和一种或多种脱氧核糖核苷酸。在本发明的实施方案中,指导物包含一种或多种非天然存在的核苷酸或核苷酸类似物,诸如具有硫代磷酸酯键联、硼酸磷酸酯键联的核苷酸、包含在核糖环的2, 之间的亚甲基桥的锁定核酸(LNA)、肽核酸(PNA)或桥接核酸(BNA)。修饰的核苷酸的其他实例包括2'-O-甲基类似物、2'-脱氧类似物、2-硫代尿苷类似物、N6-甲基腺苷类似物或2'-氟类似物。修饰的核苷酸的其他实例包括在2'位置处的化学部分的键联,包括但不限于肽、核定位序列(NLS)、肽核酸(PNA)、聚乙二醇(PEG)、三甘醇或四甘醇(TEG)。修饰的碱基的其他实例包括但不限于2-氨基嘌呤、5-溴-尿苷、假尿苷N1-甲基假尿苷5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处并入2'-O-甲基(M)、2'-O-甲基-3'-硫代磷酸酯(MS)、硫代磷酸酯(PS)、S-约束乙基(cEt)、2'-O-甲基-3'-硫代PACE(MSP)或2'-O-甲基-3'-膦酰基乙酸酯(MP)。此类化学修饰的指导物与未修饰的指导物相比可以包含增加的稳定性和增加的活性,不过中靶对脱靶特异性不可预测。(参见Hendel,2015,Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290,2015年6月29日在线发布;Ragdarm等人,0215,PNAS,E7110-E7111;Allerson等人,J.Med.Chem.2005,48:901-904;Bramsen等人,Front.Genet.,2012,3:154;Deng等人,PNAS,2015,112:11870-11875;Sharma等人,MedChemComm.,2014,5:1454-1471;Hendel等人,Nat.Biotechnol.(2015)33(9):985-989;Li等人,Nature Biomedical Engineering,2017,1,0066 DOI:10.1038/s41551-017-0066;Ryan等人,Nucleic Acids Res.(2018)46(2):792-803)。在一些实施方案中,指导RNA的5’和/或3’端被包括荧光染料、聚乙二醇、胆固醇、蛋白质或检测标签在内的多种功能性部分修饰。(参见Kelly等人,2016,J.Biotech.233:74-83)。在某些实施方案中,指导物在结合至靶DNA的区域中包含核糖核苷酸,并在结合至Cas9、Cpf1、C2c1或Cas13的区域中包含一个或多个脱氧核糖核苷酸和/或核苷酸类似物。在本发明的实施方案中,将脱氧核糖核苷酸和/或核苷酸类似物并入工程化的指导结构(诸如但不限于5'端和/或3'端、茎环区和种子区)中。在某些实施方案中,修饰不在茎环区的5'柄(5’-handle)中。指导物的茎环区的5'柄中的化学修饰可能会废除其功能(参见Li等人,Nature Biomedical Engineering,2017,1:0066)。在某些实施方案中,指导物的至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个或75个核苷酸经化学修饰。在一些实施方案中,指导物的3’端或5’端的3-5个核苷酸经化学修饰。在一些实施方案中,在种子区中仅引入较小的修饰,诸如2'-F修饰。在某些实施方案中,在指导物的3’端引入2'-F修饰。在某些实施方案中,指导物的5’端和/或3’端的3至5个核苷酸用2'-O-甲基(M)、2'-O-甲基-3'-硫代磷酸酯(MS)、S-约束乙基(cEt)、2'-O-甲基3'-硫代PACE(MSP)或2'-O-甲基-3'-膦酰基乙酸酯(MP)进行化学修饰。这样的修饰可以提高基因组编辑效率(参见Hendel等人,Nat.Biotechnol.(2015)33(9):985-989;Ryan等人,Nucleic Acids Res.(2018)46(2):792-803)。在某些实施方案中,指导物的所有磷酸二酯键被硫代磷酸酯(PS)取代以增强基因破坏的水平。在某些实施方案中,指导物的5’端和/或3’端的多于5个核苷酸用2’-O-Me、2’-F或S-约束乙基(cEt)进行化学修饰。这种化学修饰的指导物可以介导增强的基因破坏水平(参见Ragdarm等人,0215,PNAS,E7110-E7111)。在本发明的一个实施方案中,指导物被修饰成在其3’端和/或5’端包含化学部分。这样的部分包括但不限于胺、叠氮化物、炔、硫代基、二苯并环辛炔(DBCO)、若丹明、肽、核定位序列(NLS)、肽核酸(PNA)、聚乙二醇(PEG)、三甘醇或四甘醇(TEG)。在某些实施方案中,化学部分通过接头诸如烷基链缀合至指导物。在某些实施方案中,修饰的指导物的化学部分可用于将指导物附接至另一分子,诸如DNA、RNA、蛋白质或纳米粒子。这种化学修饰的指导物可用于识别或富集一般由CRISPR系统编辑的细胞(参见Lee等人,eLife,2017,6:e25312,DOI:10.7554)。在一些实施方案中,3个核苷酸的每个3'端和5'端均经化学修饰。在具体实施方案中,修饰包括2'-O-甲基或硫代磷酸酯类似物。在具体实施方案中,四环中的12个核苷酸和茎环区中的16个核苷酸被2'-O-甲基类似物替代。此类化学修饰改善了体内编辑和稳定性(参见Finn等人,Cell Reports(2018),22:2227-2235)。在一些实施方案中,指导物的超过60或70个核苷酸经化学修饰。在一些实施方案中,此修饰包括用2'-O-甲基或2'-氟核苷酸类似物替代核苷酸或磷酸二酯键的硫代磷酸酯(PS)修饰。在一些实施方案中,化学修饰包括在CRISPR复合物形成时延伸至核酸酶蛋白外部的指导核苷酸的2'-O-甲基或2'-氟修饰,或指导物的3'端的20至30个或更多个核苷酸的PS修饰。在特定实施方案中,化学修饰还包括在指导物的5'端的2'-O-甲基类似物或者在种子区和尾部区中的2'-氟类似物。此类化学修饰改善核酸酶降解的稳定性,并且维持或增强基因组编辑活性或效率,但所有核苷酸的修饰可能会消除指导物的功能(参见Yin等人,Nat.Biotech.(2018),35(12):1179-1187)。可以通过了解CRISPR复合物的结构,包括了解有限数量的核酸酶和RNA 2'-OH相互作用来指导此类化学修饰(参见Yin等人,Nat.Biotech.(2018),35(12):1179-1187)。在一些实施方案中,可以将一个或多个指导RNA核苷酸替换为DNA核苷酸。在一些实施方案中,将5'端尾部/种子指导区的多至2、4、6、8、10或12个RNA核苷酸替换为DNA核苷酸。在某些实施方案中,将3'端的大多数指导RNA核苷酸替换为DNA核苷酸。在特定实施方案中,将3'端的16个指导RNA核苷酸替换为DNA核苷酸。在特定实施方案中,将5'端尾部/种子区的8个指导RNA核苷酸和3'端的16个RNA核苷酸替换为DNA核苷酸。在特定实施方案中,将在CRISPR复合物形成时延伸至核酸酶蛋白外部的指导RNA核苷酸替换为DNA核苷酸。与未经修饰的指导物相比,这种用DNA核苷酸替代多个RNA核苷酸导致脱靶活性降低,但中靶活性相似;但是,替换掉3'端的所有RNA核苷酸可能会消除指导物的功能(参见Yin等人,Nat.Chem.Biol.(2018)14,311-316)。可以通过了解CRISPR复合物的结构,包括了解有限数量的核酸酶和RNA 2'-OH相互作用来指导此类修饰(参见Yin等人,Nat.Chem.Biol.(2018)14,311-316)。
在本发明的一方面,指导物包括修饰的Cpf1 crRNA,其具有5’柄和指导区段,所述指导区段还包括种子区和3'端。修饰的指导物可以与以下任一种Cpf1结合使用:氨基酸球菌属种BV3L6 Cpf1(AsCpf1);土拉弗朗西斯菌新凶手亚种U112 Cpf1(FnCpf1);李斯特氏菌(L.bacterium)MC2017 Cpf1(Lb3Cpf1);解蛋白丁酸弧菌Cpf1(BpCpf1);帕库氏菌GWC2011_GWC2_44_17 Cpf1(PbCpf1);异域菌门菌GW2011_GWA_33_10 Cpf1(PeCpf1);稻田氏钩端螺旋体Cpf1(LiCpf1);史密斯氏菌属种SC_K08D17 Cpf1(SsCpf1);李斯特氏菌MA2020 Cpf1(Lb2Cpf1);狗口腔卟啉单胞菌Cpf1(PcCpf1);猕猴卟啉单胞菌Cpf1(PmCpf1);候选白蚁甲烷支原体Cpf1(CMtCpf1);挑剔真杆菌Cpf1(EeCpf1);牛眼莫拉氏菌237 Cpf1(MbCpf1);解糖胨普雷沃氏菌Cpf1(PdCpf1);或李斯特氏菌ND2006 Cpf1(LbCpf1)。
在一些实施方案中,对指导物的修饰是化学修饰、插入、缺失或拆分。在一些实施方案中,化学修饰包括但不限于并入2'-O-甲基(M)类似物、2'-脱氧类似物、2-硫代尿苷类似物,N6-甲基腺苷类似物、2'-氟类似物、2-氨基嘌呤、5-溴-尿苷、假尿苷N1-甲基假尿苷5-甲氧基尿苷(5moU)、肌苷、7-甲基鸟苷、2'-O-甲基-3’硫代磷酸酯(MS)、S-约束乙基(cEt)、硫代磷酸酯(PS)、2'-O-甲基-3'-硫代PACE(MSP)或2'-O-甲基-3'-膦酰基乙酸酯(MP)。在一些实施方案中,指导物包含一种或多种硫代磷酸酯修饰。在某些实施方案中,指导物的至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或25个核苷酸经化学修饰。在一些实施方案中,所有核苷酸均经化学修饰。在某些实施方案中,种子区中的一个或多个核苷酸经化学修饰。在某些实施方案中,3’端中的一个或多个核苷酸经化学修饰。在某些实施方案中,5’柄中的核苷酸均未经化学修饰。在一些实施方案中,种子区中的化学修饰是次要修饰,诸如并入2’-氟类似物。在具体实施方案中,种子区的一个核苷酸被2’-氟类似物替代。在一些实施方案中,3’端中的5或10个核苷酸经化学修饰。在Cpf1CrRNA的3’端处的此类化学修饰提高基因切割效率(参见Li等人,Nature Biomedical Engineering,2017,1:0066)。在具体实施方案中,3'端中的5个核苷酸被2'-氟类似物替代。在具体实施方案中,3'端中的10个核苷酸被2'-氟类似物替代。在具体实施方案中,3'端中的5个核苷酸被2'-O-甲基(M)类似物替代。在一些实施方案中,3个核苷酸的每个3'端和5'端均经化学修饰。在具体实施方案中,修饰包括2'-O-甲基或硫代磷酸酯类似物。在具体实施方案中,四环中的12个核苷酸和茎环区中的16个核苷酸被2'-O-甲基类似物替代。此类化学修饰改善了体内编辑和稳定性(参见Finn等人,Cell Reports(2018),22:2227-2235)。
在一些实施方案中,指导物的5'柄的环经修饰。在一些实施方案中,指导物的5'柄的环被修饰为具有缺失、插入、拆分或化学修饰。在某些实施方案中,环包含3、4或5个核苷酸。在某些实施方案中,环包含序列UCUU、UUUU、UAUU或UGUU。在一些实施方案中,指导分子与单独的非共价连接的序列(其可以是DNA或RNA)形成茎环。
合成连接的指导物
在一方面,指导物包含经由非磷酸二酯键化学连接或缀合的tracr序列和tracr配对序列。在一方面,指导物包含经由非核苷酸环化学连接或缀合的tracr序列和tracr配对序列。在一些实施方案中,tracr和tracr配对序列经由非磷酸二酯共价接头连接。共价接头的实例包括但不限于选自由以下组成的组的化学部分:氨基甲酸酯、醚、酯、酰胺、亚胺、脒、氨基三嗪、腙、二硫键、硫醚、硫酯、硫代磷酸酯、二硫代磷酸酯、磺酰胺、磺酸酯、砜(fulfone)、亚砜、脲、硫脲、酰肼、肟、三唑、光不稳定键联、C-C键形成基团(诸如狄尔斯-阿尔德环加成对(Diels-Alder cyclo-addition pair)或闭环复分解对(ring-closingmetathesis pair))以及迈克尔反应对(Michael reaction pair)。
在特定实施方案中,首先使用标准亚磷酰胺合成方案合成tracr和tracr配对序列(Herdewijn,P.,编辑,Methods in Molecular Biology Col 288,OligonucleotideSynthesis:Methods and Applications,Humana Press,New Jersey(2012))。在一些实施方案中,可以使用本领域已知的标准方案将tracr或tracr配对序列官能化成含有适于连接的官能团(Hermanson,G.T.,Bioconjugate Techniques,Academic Press(2013))。官能团的实例包括但不限于羟基、胺、羧酸、羧酸卤化物、羧酸活性酯、醛、羰基、氯代羰基、咪唑基羰基、肼基、氨基脲、硫代氨基脲、硫醇、马来酰亚胺、卤代烷基、磺酰基、烯丙基、炔丙基、二烯、炔和叠氮化物。一旦tracr或tracr配对序列被官能化,就可以在两个寡核苷酸之间形成共价化学键或键联。化学键的实例包括但不限于基于以下的那些:氨基甲酸酯、醚、酯、酰胺、亚胺、脒、氨基三嗪、腙、二硫键、硫醚、硫酯、硫代磷酸酯、二硫代磷酸酯、磺酰胺、磺酸酯、砜(fulfone)、亚砜、脲、硫脲、酰肼、肟、三唑、光不稳定键联、C-C键形成基团(诸如狄尔斯-阿尔德环加成对(Diels-Alder cyclo-addition pair)或闭环复分解对(ring-closingmetathesis pair))以及迈克尔反应对(Michael reaction pair)。
在一些实施方案中,tracr和tracr配对序列可以经化学方式合成。在一些实施方案中,化学合成使用自动固相寡核苷酸合成机并利用2’-乙酰氧基乙基原酸酯(2’-ACE)(Scaringe等人,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)或2'-硫代氨基甲酸酯(2'-TC)化学品(Dellinger等人,J.Am.Chem.Soc.(2011)133:11540-11546;Hendel等人,Nat.Biotechnol.(2015)33:985-989)。
在一些实施方案中,可以使用各种生物缀合反应、环、桥和非核苷酸键经由糖、核苷酸间磷酸二酯键、嘌呤和嘧啶残基的修饰将tracr和tracr配对序列共价连接。Sletten等人,Angew.Chem.Int.Ed.(2009)48:6974-6998;Manoharan,M.Curr.Opin.Chem.Biol.(2004)8:570-9;Behlke等人,Oligonucleotides(2008)18:305-19;Watts等人,Drug.Discov.Today(2008)13:842-55;Shukla等人,ChemMedChem(2010)5:328-49。
在一些实施方案中,可以使用点击化学将tracr和tracr配对序列共价连接。在一些实施方案中,可以使用三唑接头将tracr和tracr配对序列共价连接。在一些实施方案中,可以使用涉及炔烃和叠氮化物产生高度稳定的三唑接头的Huisgen 1,3-偶极环加成反应将tracr和tracr配体序列共价连接(He等人,ChemBioChem(2015)17:1809-1812;WO 2016/186745)。在一些实施方案中,通过连接5'-己炔tracrRNA和3'-叠氮化物crRNA将tracr和tracr配对序列共价连接。在一些实施方案中,可以用2'-乙酰氧基乙基原酸酯(2'-ACE)基团保护5'-己炔tracrRNA和3'-叠氮化物crRNA中的一者或两者,然后可以使用Dharmacon方案将该基团去除(Scaringe等人,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)。
在一些实施方案中,可以经由接头(例如,非核苷酸环)将tracr和tracr配对序列共价连接,所述接头包含诸如间隔区、附接物、生物缀合物、发色团、报告基团、染料标记的RNA和非天然存在的核苷酸类似物的部分。更具体地,用于本发明目的的合适间隔区包括但不限于聚醚(例如聚乙二醇、多元醇、聚丙二醇或乙二醇和丙二醇的混合物)、聚胺基团(例如精胺、亚精胺及其聚合衍生物)、聚酯(例如聚(丙烯酸乙酯))、聚磷酸二酯、亚烃基以及它们的组合。合适的附接物包括可以被添加至接头以向接头增加附加特性的任何部分,诸如但不限于荧光标记。合适的生物缀合物包括但不限于肽、糖苷、脂质、胆固醇、磷脂、二酰基甘油和二烷基甘油、脂肪酸、烃、酶底物、类固醇、生物素、地高辛、碳水化合物、多糖。合适的发色团、报告基团和染料标记的RNA包括但不限于荧光染料(诸如荧光素和若丹明),化学发光、电化学发光和生物发光标记化合物。在WO 2004/015075中也描述了缀合两个RNA组分的示例性接头的设计。
接头(例如非核苷酸环)可以具有任何长度。在一些实施方案中,接头具有等于约0-16个核苷酸的长度。在一些实施方案中,接头具有等于约0-8个核苷酸的长度。在一些实施方案中,接头具有等于约0-4个核苷酸的长度。在一些实施方案中,接头具有等于约2个核苷酸的长度。在WO2011/008730中也描述了示例性接头设计。
典型的II型Cas sgRNA包含(以5'至3'方向):指导序列、poly U束、第一互补段(“重复序列”)、环(四环)、第二互补段(与重复序列互补的“抗重复序列”)、茎,以及另外的茎环和茎和poly A(通常为RNA中的poly U)尾(终止子)。在优选的实施方案中,指导物架构的某些方面得以保留,指导物架构的某些方面可以例如通过特征的添加、减去或取代进行修饰,而指导物架构的某些其他方面得以维持。工程化的sgRNA修饰(包括但不限于插入、缺失和取代)的优选位置包括指导物末端和sgRNA的在与CRISPR蛋白和/或靶标复合时暴露的区域,例如四环和/或环2。
在某些实施方案中,本发明的指导物包含用于衔接蛋白的特异性结合位点(例如适体),所述衔接蛋白可以包含一个或多个功能结构域(例如经由融合蛋白)。当这样的指导物形成CRISPR复合物(即结合至指导物和靶标的CRISPR酶)时,衔接蛋白结合功能结构域,并且与所述衔接蛋白缔合的功能结构域被定位成有利于属性化的功能生效的空间取向。例如,如果功能结构域是转录激活因子(例如VP64或p65),则转录激活因子被定位成允许其实现靶标转录的空间取向。同样,转录阻抑因子将被有利地定位以影响靶标转录,而核酸酶(例如Fok1)将被有利地定位以切割或部分切割靶标。
技术人员将理解,对允许衔接子+功能结构域结合但未正确定位衔接子+功能结构域(例如由于CRISPR复合物的三维结构内的空间位阻)的指导物的修饰是未预期的修饰。如本文所述,一种或多种修饰的指导物可在四环、茎环1、茎环2或茎环3处修饰,优选地在四环或茎环2中,且最优选地在四环处环和茎环2两者中修饰。
重复序列:抗重复序列双链体将从sgRNA的二级结构中显而易见。其通常可以是(沿5'至3'方向)poly U束之后四环之前的第一互补段;(沿5'至3'方向)四环之后poly A束之前的第二互补段。第一互补段(“重复序列”)与第二互补段(“抗重复序列”)互补。这样,当彼此折回时,它们沃森-克里克碱基配对形成dsRNA的双链体。这样,就A-U或C-G碱基配对而言,而且根据由于四环抗重复序列处于相反取向这一事实,抗重复序列是重复序列的互补序列。
在本发明的实施方案中,指导架构的修饰包括替代茎环2中的碱基。例如,在一些实施方案中,茎环2中的“actt”(RNA中的“acuu”)和“aagt”(RNA中的“aagu”)碱基被“cgcc”和“gcgg”替代。在一些实施方案中,茎环2中的“actt”和“aagt”碱基被4个核苷酸的互补的富含GC的区替代。在一些实施方案中,4个核苷酸的互补的富含GC的区是“cgcc”和“gcgg”(均沿5'至3'方向)。在一些实施方案中,4个核苷酸的互补的富含GC的区是“gcgg”和“cgcc”(均沿5'至3'方向)。在4个核苷酸的互补的富含GC的区中的C和G的其他组合将是显而易见的,包括CCCC和GGGG。
在一方面,茎环2(例如“ACTTgtttAAGT”)可以被任何“XXXXgtttYYYY”替代,例如,其中XXXX和YYYY代表任何互补的核苷酸组,它们将彼此碱基配对以产生茎。
在一方面,茎含有互补X和Y序列,包含至少约4bp,但也涵盖具有更多(例如5个、6个、7个、8个、9个、10个、11个或12个)或更少(例如3个、2个)的碱基对的茎。因此,可以涵盖例如X2-12和Y2-12(其中X和Y代表任何互补的核苷酸组)。在一方面,由X和Y核苷酸组成的茎与“gttt”一起将在总体二级结构中形成完整的发夹;并且,这可能是有利的,并且碱基对的数量可以是形成完整发夹的任何数量。在一方面,只要保留整个sgRNA的二级结构,就可以容忍任何互补的X:Y碱基配对序列(例如,就长度而言)。在一方面,茎可以是X:Y碱基配对的形式,这种形式不会破坏整个sgRNA的二级结构,因为它具有DR:tracr双链体和3个茎环。在一方面,连接ACTT和AAGT(或由X:Y碱基对组成的任何替代茎)的“gttt”四环可以是不干扰sgRNA的总体二级结构的长度相同(例如4个核苷酸)或更长的任何序列。在一方面,茎环可以是进一步延长茎环2的长度的物质,例如可以是MS2适体。在一方面,茎环3“GGCACCGagtCGGTGC”可以另外采用“XXXXXXXagtYYYYYYY”形式,例如,其中X7和Y7代表任何互补的核苷酸组,它们将彼此碱基对以形成茎。在一方面,茎含有互补X和Y序列,包含约7bp,但也涵盖具有更多或更少的碱基对的茎。在一方面,由X和Y核苷酸组成的茎与“agt”一起在总体二级结构中形成完整的发夹。在一方面,只要保留整个sgRNA的二级结构,就可以容忍任何互补的X:Y碱基配对序列。在一方面,茎可以是X:Y碱基配对的形式,这种形式不会破坏整个sgRNA的二级结构,因为它具有DR:tracr双链体和3个茎环。在一方面,茎环3的“agt”序列可以被延长,或者被适体例如MS2适体或通常保留茎环3的架构的序列替代。在一方面,对于替代茎环2和/或3,每个X和Y对可以指代任何碱基对。在一方面,涵盖非沃森-克里克(Watson-Crick)碱基配对,这种配对通常以其他方式保留该位置处茎环的架构。
在一方面中,DR:tracrRNA双链体可以被替换为以下形式:gYYYYag(N)NNNNxxxxNNNN(AAN)uuRRRRu(使用标准IUPAC核苷酸命名法),其中(N)和(AAN)代表双链体中的部分凸环,并且“xxxx”代表接头序列。只要与tracrRNA的相应NNNN部分成碱基对,那么正向重复序列的NNNN就可以是任何物质。在一方面,DR:tracrRNA双链体可以经由任何长度(xxxx...)、任何碱基组成的接头进行连接,只要接头不改变总体结构即可。
在一方面,sgRNA的结构要求是具有双链体和3个茎环。在大多数情况下,许多特定碱基要求的实际序列要求并不严格,因为应保留DR:tracrRNA双链体的架构,但是产生该架构的序列,即茎、环、凸环等可能会被改变。
适体
具有第一适体/RNA结合蛋白对的一个指导物可以连接或融合至激活因子,而具有第二适体/RNA结合蛋白对的第二指导物可以连接或融合至阻抑因子。这些指导物适用于不同的靶标(基因座),因此使得可以激活一个基因并阻抑一个基因。例如,以下示意图显示了这种方法:
指导物1-MS2适体-------MS2RNA结合蛋白-------VP64激活因子;和
指导物2-PP7适体-------PP7RNA结合蛋白-------SID4x阻抑因子。
本发明还涉及正交PP7/MS2基因靶向。在此实例中,用不同的RNA环修饰靶向不同基因座的sgRNA,以募集分别激活和阻抑其靶基因座的MS2-VP64或PP7-SID4X。PP7是噬菌体假单胞菌的RNA结合外壳蛋白。同MS2一样,它结合特定的RNA序列和二级结构。PP7RNA识别基序与MS2的不同。因此,PP7和MS2可以多路复用,以同时在不同的基因组基因座介导不同的效应。例如,靶向基因座A的sgRNA可以用MS2环修饰,从而募集MS2-VP64激活因子;而靶向基因座B的另一sgRNA可以用PP7环修饰,从而募集PP7-SID4X阻抑结构域。因此,在同一细胞中,dCas13可以介导正交的基因座特异性修饰。可以扩展该原理以并入其他正交RNA结合蛋白,诸如Q-β。
正交阻抑的替代选择包括向指导物中并入具有反向激活阻抑功能的非编码RNA环(在被整合到该指导物中的MS2/PP7环的类似位置处或在该指导物的3’端处)。例如,用非编码(但已知是阻抑性的)RNA环设计指导物(例如,使用干扰哺乳动物细胞中的RNA聚合酶II的Alu阻抑因子(在RNA中))。将Alu RNA序列定位在如本文使用的MS2RNA序列位置中(例如在四环和/或茎环2处);和/或在该指导物的3’端处。这给出了MS2、PP7或Alu在四环和/或茎环2位置处的可能的组合,以及任选地,Alu在该指导物的3’端处的添加(用或不用接头)。
两种不同适体(不同的RNA)的使用允许一起使用激活因子-衔接蛋白融合物和阻抑因子-衔接蛋白融合物与不同指导物,以激活一个基因的表达,同时阻抑另一个基因的表达。可以在多重方法中一起或基本上一起施用这些适体连同其不同指导物。可以同时使用大量的此类修饰的指导物(例如10种或20种或30种等),同时待递送仅一种(或至少最小数量的)Cas13,因为相对较小数量的Cas13可以与大量的修饰的指导物一起使用。衔接蛋白可以与一种或多种激活因子或一种或多种阻抑因子相缔合(优选地连接至或融合至它们)。例如,衔接蛋白可以与第一激活因子和第二激活因子相缔合。第一激活因子和第二激活因子可以是相同的,但是优选地它们是不同的激活因子。例如,一者可能是VP64,而另一者可能是p65,但是这些仅是实例并且设想了其他转录激活因子。可以使用三种或更多种或甚至四种或更多种激活因子(或阻抑因子),但是包装尺寸可以将数量限制为高于5个不同的功能结构域。优选在直接融合至衔接蛋白的情况下使用接头,其中两个或更多个功能结构域与衔接蛋白相缔合。合适的接头可能包括GlySer接头。
还可以设想的是,酶-指导物复合物整体上可以与两个或更多个功能结构域相缔合。例如,可以存在两个或更多个与该酶相缔合的功能结构域,或者可以存在两个或更多个与该指导物相缔合的功能结构域(经由一种或多种衔接蛋白),或者可以存在一个或多个与该酶相缔合的功能结构域和一个或多个与该指导物相缔合的功能结构域(经由一种或多种衔接蛋白)。
衔接蛋白与激活因子或阻抑因子之间的融合物可以包括接头。例如,可以使用GlySer接头GGGS。它们可以按3个((GGGGS)3)或6、9或甚至12个或更多个的重复使用,以根据需要提供合适的长度。可以在RNA结合蛋白与功能结构域(激活因子或阻抑因子)之间,或者在CRISPR酶(Cas13)与功能结构域(激活因子或阻抑因子)之间使用接头。使用这些接头来工程化适当量的“机械柔性”。
死亡指导物:包含死亡指导序列的指导RNA可以用于本发明。
在一方面,本发明提供了按以下方式修饰的指导序列,该方式允许形成CRISPR复合物并且成功地结合至靶标,但同时不允许成功地获得核酸酶活性(即没有核酸酶活性/没有插入缺失活性)。出于解释的原因,此类修饰的指导序列被称为“死亡指导物”或“死亡指导序列”。就核酸酶活性而言,可以认为这些死亡指导物或死亡指导序列是无催化活性的或无构象活性的。可以使用本领域通常使用的surveyor分析或深度测序来测量核酸酶活性,优选使用surveyor分析。类似地,就促进催化活性的能力或区分中靶和脱靶结合活性的能力而言,死亡指导序列并不可以足够地参与富有成效的碱基配对。简而言之,surveyor测定涉及纯化和扩增基因的CRISPR靶位点,并用能扩增CRISPR靶位点的引物形成异源双链体。再退火后,按照制造商推荐的方案用SURVEYOR核酸酶和SURVEYOR增强子S(Transgenomics)处理产物,在凝胶上进行分析,并基于相对条带强度进行定量。
因此,在相关方面,本发明提供了一种非天然存在的或工程化的组合物Cas13CRISPR-Cas系统,所述系统包含如本文所述的功能性Cas13和指导RNA(gRNA),其中所述gRNA包含死亡指导序列,由此所述gRNA能够与靶序列杂交,这样使得所述Cas13 CRISPR-Cas系统被引导至细胞中的目标基因组基因座,而没有如由SURVEYOR测定检测到的由所述系统的非突变Cas13酶的核酸酶活性所导致的可检测的插入缺失活性。为了简便起见,以下gRNA在本文中被称为“死亡gRNA”:其包含死亡指导序列,由此所述gRNA能够与靶序列杂交,这样使得所述Cas13 CRISPR-Cas系统被引导至细胞中的目标基因组基因座,而没有如由SURVEYOR测定检测到的由所述系统的非突变Cas13酶的核酸酶活性所导致的可检测的插入缺失活性。应当理解,如本文别处所述的根据本发明的任何gRNA都可以用作死亡gRNA/包含如下文所述的死亡指导序列的gRNA。如本文别处所述的任何方法、产品、组合物和用途都同样地适用于如下文进一步详述的死亡gRNA/包含死亡指导序列的gRNA。作为进一步的指导,提供了以下特定方面和实施方案。
可以通过任何适合的测定来评定死亡指导序列引导CRISPR复合物序列特异性地结合至靶序列的能力。例如,足以形成CRISPR复合物的CRISPR系统的组分,包括有待测试的死亡指导序列,可以提供给具有相应靶序列的宿主细胞,诸如通过用编码CRISPR序列的组分的载体转染,继而诸如通过如本文所述的Surveyor测定评定靶序列内的优先切割。类似地,可以在试管中通过提供靶序列、CRISPR复合物的组分(包括有待测试的死亡指导序列)和不同于测试死亡指导序列的对照指导序列,以及在测试指导序列与对照指导序列反应之间比较靶序列处的结合或切割速率来评估靶多核苷酸序列的切割。其他测定可能存在,并且将为本领域技术人员所想到。可以选择死亡指导序列以靶向任何靶序列。在一些实施方案中,靶序列是细胞基因组内的序列。
如本文进一步解释的,若干结构参数允许适当的框架到达这样的死亡指导物处。死亡指导序列短于对应的指导序列,这导致活跃的Cas13特异性插入缺失形成。死亡指导物比引导至相同Cas13的对应指导物短5%、10%、20%、30%、40%、50%,这导致活跃的Cas13特异性插入缺失形成。
如下文所解释的并且在本领域中已知的,gRNA-Cas特异性的一方面是正向重复序列,它有待被适当地连接至此类指导物。特别地,这意味着正向重复序列的设计取决于Cas的来源。因此,可用于经验证的死亡指导序列的结构数据可用于设计Cas特异性等效物。例如两个或更多个Cas效应蛋白的直系同源核酸酶结构域RuvC之间的结构相似性可以用于迁移设计等效死亡指导物。因此,可以在长度和序列上对本文的死亡指导物进行适当修饰,以反映此类Cas特异性等效物,从而允许形成CRISPR复合物并且成功地结合至靶标,而同时不允许成功地获得核酸酶活性。
死亡指导物在本文上下文以及现有技术中的使用为体外、离体和体内应用两者中的网络生物学和/或系统生物学提供了令人惊讶且出乎意料的平台,从而允许多重基因靶向,并且特别是双向多重基因靶向。在死亡指导物的使用之前,处理多个靶标例如以便激活、阻抑和/或沉默基因活性一直具有挑战性并且在一些情况下是不可能的。通过使用死亡指导物,可以例如在同一细胞中,在同一动物体内,或在同一患者体内处理多个靶标,并且因此处理多种活性。这种多重化可以同时发生或交错发生持续所需的时间段。
例如,死亡指导物现在允许首次使用gRNA作为基因靶向手段,而不是核酸酶活性的结果,并且同时提供激活或阻抑的引导手段。包含死亡指导物的指导RNA可以按一定方式被修饰为还包括以下元件,这些元件允许激活或阻抑基因活性,特别地是如本文别处所述的允许功能性放置基因效应子(例如基因活性的激活因子或阻抑因子)的蛋白衔接子(例如适体)。一个实例是并入适体,如本文和现有技术中所解释的。通过工程化包含死亡指导物的gRNA以并入蛋白相互作用适体(Konermann等人,"Genome-scale transcriptionactivation by an engineered CRISPR-Cas9 complex,"doi:10.1038/nature14136,以引用方式并入本文),可以组装由多个不同的效应结构域组成的合成转录激活复合物。可以在自然转录激活过程之后将其模式化。例如,可以将选择性地结合效应子(例如激活因子或阻抑因子;二聚化MS2噬菌体外壳蛋白与激活因子或阻抑因子形成的融合蛋白)的适体,或自身结合效应子(例如激活因子或阻抑因子)的蛋白质附加至死亡gRNA四环和/或茎环2。就MS2而言,融合蛋白MS2-VP64结合至四环和/或茎环2,进而介导例如Neurog2的转录上调。其他转录激活因子是例如VP64。P65、HSF1和MyoD1。仅作为此概念的示例,可以使用与PP7相互作用的茎环替代MS2茎环来募集阻抑性元件。
因此,一方面是本发明的gRNA,其包含死亡指导物,其中所述gRNA还包含如本文所述的提供基因激活或阻抑的修饰。死亡gRNA可以包含一种或多种适体。适体可以对基因效应子、基因激活因子或基因阻抑因子具有特异性。或者,适体可以对蛋白质具有特异性,该蛋白质又对特定的基因效应子、基因激活因子或基因阻抑因子具有特异性并且募集/结合它们。如果存在多个用于激活因子或阻抑因子募集的位点,则优选的是这些位点对于激活因子或阻抑因子具有特异性。如果存在多个用于激活因子或阻抑因子结合的位点,则这些位点可能对相同激活因子或相同阻抑因子具有特异性。这些位点还可以对不同激活因子或不同阻抑因子具有特异性。基因效应子、基因激活因子、基因阻抑因子可以按融合蛋白的形式存在。
在一个实施方案中,如本文所述的死亡gRNA或如本文所述的Cas13 CRISPR-Cas复合物包括非天然存在的或工程化的组合物,所述组合物包含两种或更多种衔接蛋白,其中每种衔接蛋白与一个或多个功能结构域相缔合,并且其中衔接蛋白与插入到死亡gRNA的至少一个环中的一个或多个不同的RNA序列结合。
因此,一方面提供了一种非天然存在的或工程化的组合物,所述组合物包含指导RNA(gRNA),所述指导RNA包含能够与细胞中目标基因组基因座中的靶序列杂交的死亡指导序列,其中所述死亡指导序列如本文所定义是包含至少一个或多个核定位序列的Cas13,其中所述Cas13任选地包含至少一个突变,其中所述死亡gRNA的至少一个环通过插入与一种或多种衔接蛋白结合的一个或多个不同的RNA序列来修饰,并且其中所述衔接蛋白与一个或多个功能结构域相缔合;或者,其中所述死亡gRNA被修饰为具有至少一个非编码功能环,并且其中所述组合物包含两种或更多种衔接蛋白,其中每种衔接蛋白与一个或多个功能结构域相缔合。
在某些实施方案中,所述衔接蛋白是包含功能结构域的融合蛋白,所述融合蛋白任选地在所述衔接蛋白与所述功能结构域之间包含接头,所述接头任选地包括GlySer接头。
在某些实施方案中,所述死亡gRNA的所述至少一个环不通过插入与所述一种或多种衔接蛋白结合的一个或多个不同的RNA序列来修饰。
在某些实施方案中,与所述衔接蛋白相缔合的所述一个或多个功能结构域是转录激活结构域。
在某些实施方案中,与所述衔接蛋白相缔合的所述一个或多个功能结构域是包含VP64、p65、MyoD1、HSF1、RTA或SET7/9的转录激活结构域。
在某些实施方案中,与所述衔接蛋白相缔合的所述一个或多个功能结构域是转录阻抑结构域。
在某些实施方案中,所述转录阻抑结构域是KRAB结构域。
在某些实施方案中,转录阻抑结构域是NuE结构域、NcoR结构域、SID结构域或SID4X结构域。
在某些实施方案中,与所述衔接蛋白相缔合的所述一个或多个功能结构域中的至少一个具有一种或多种活性,包括甲基酶活性、脱甲基酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性RNA切割活性、DNA切割活性或核酸结合活性。
在某些实施方案中,DNA切割活性是由于Fok1核酸酶。
在某些实施方案中,对死亡gRNA进行了修饰,使得在所述死亡gRNA结合衔接蛋白并进一步结合Cas13和靶标之后,功能结构域处于允许功能结构域以其属性化的功能发挥作用的空间取向。
在某些实施方案中,所述死亡gRNA的至少一个环是四环和/或环2。在某些实施方案中,死亡gRNA的四环和环2通过插入一个或多个不同的RNA序列来修饰。
在某些实施方案中,与一种或多种衔接蛋白结合的一个或多个不同的RNA序列的插入是适体序列。在某些实施方案中,所述适体序列是对相同衔接蛋白具有特异性的两个或更多个适体序列。在某些实施方案中,适体序列是对不同衔接蛋白特异的两个或更多个适体序列。
在某些实施方案中,衔接蛋白包含MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、 7s、PRR1。
在某些实施方案中,细胞是真核细胞。在某些实施方案中,真核细胞是哺乳动物细胞,任选地是小鼠细胞。在某些实施方案中,哺乳动物细胞是人类细胞。
在某些实施方案中,第一衔接蛋白与p65结构域相缔合,而第二衔接蛋白与HSF1结构域相缔合。
在某些实施方案中,所述组合物包含具有至少三个功能结构域的Cas13 CRISPR-Cas复合物,其中至少一个功能结构域与Cas13相缔合并且其中至少两个功能结构域与死亡gRNA相缔合。
在某些实施方案中,所述组合物还包含第二gRNA,其中所述第二gRNA是能够与第二靶序列杂交的活gRNA,使得第二Cas13 CRISPR-Cas系统被引导至细胞中的第二目标基因座基因座,并且由所述系统的Cas13酶的核酸酶活性所致在所述第二基因组基因座处检测到插入缺失活性。
在某些实施方案中,所述组合物还包含多个死亡gRNA和/或多个活gRNA。
本发明的一个方面是利用gRNA支架的模块性和可定制性来建立一系列具有不同结合位点(特别地适体)的gRNA支架,以便以正交方式募集不同类型的效应子。再次,作为更广泛概念的示例和说明,可以使用与PP7相互作用的茎环替代MS2茎环来结合/募集阻抑性元件,从而实现多重双向转录控制。因此,一般来讲,可以采用包含死亡指导物的gRNA来提供多重转录控制和优选的双向转录控制。这种转录控制是基因中最优选的。例如,一种或多种包含死亡指导物的gRNA可用于靶向一种或多种靶基因的激活。同时,一种或多种包含死亡指导物的gRNA可用于靶向一种或多种靶基因的阻抑。这样的序列可以按多种不同的组合应用,例如首先阻抑靶基因,接着在适当的时期激活其他靶标,或者在激活选择基因的同时阻抑选择基因,随后进行进一步激活和/或阻抑。因此,可以有利地一起解决一个或多个生物系统的多个组分。
在一方面,本发明提供了编码死亡gRNA的一种或多种核酸分子或Cas13 CRISPR-Cas复合物或如本文所述的组合物。
在一方面,本发明提供了一种载体系统,所述载体系统包含:编码如本文所定义的死亡指导RNA的核酸分子。在某些实施方案中,所述载体系统还包含编码Cas13的一种或多种核酸分子。在某些实施方案中,所述载体系统还包含编码(活)gRNA的一种或多种核酸分子。在某些实施方案中,所述核酸分子或所述载体还包含在真核细胞中可操作的一个或多个调控元件,所述一个或多个调控元件可操作地连接至编码指导序列(gRNA)的核酸分子和/或编码Cas13的核酸分子和/或任选的一个或多个核定位序列。
在另一方面,还可以使用结构分析来研究死亡指导物与活性Cas核酸酶之间使得能够发生DNA结合但不发生DNA切割的相互作用。以这种方式确定对于Cas的核酸酶活性重要的氨基酸。此类氨基酸的修饰可改善用于基因编辑的Cas酶。
另一方面是将如本文所解释的死亡指导物的使用与如本文所解释以及如本领域已知的CRISPR的其他应用相结合。例如,如本文所解释,可将包含用于靶向多重基因激活或阻抑或靶向多重双向基因激活/阻抑的死亡指导物的gRNA与包含维持核酸酶活性的指导物的gRNA相结合。这样的包含维持核酸酶活性的指导物的gRNA可以或可以不还包括允许阻抑基因活性的修饰(例如适体)。这样的包含维持核酸酶活性的指导物的gRNA可以或可以不还包括允许激活基因活性的修饰(例如适体)。以这种方式,引入了用于多重基因控制的另一种手段(例如,可以同时提供或与具有核酸酶活性的基因靶向抑制结合提供没有核酸酶活性/没有插入缺失活性的多重基因靶向激活)。
例如,1)使用包含靶向一个或多个基因并且用适当的适体进一步修饰以募集基因激活因子的一个或多个死亡指导物的一个或多个gRNA(例如1-50个、1-40个、1-30个、1-20个,优选1-10个,更优选1-5个);2)可以结合包含靶向一个或多个基因并且用适当的适体进一步修饰以募集基因阻抑因子的一个或多个死亡指导物的一个或多个gRNA(例如1-50个、1-40个、1-30个、1-20个,优选1-10个,更优选1-5个)。接着可以将1)和/或2)与3)靶向一个或多个基因的一个或多个gRNA(例如1-50个、1-40个、1-30个、1-20个,优选1-10个,更优选1-5个)组合。接着可以依次与1)+2)+3)连同4)靶向一个或多个基因并且用适当的适体进一步修饰以募集基因激活因子的一个或多个gRNA(1-50个、1-40个、1-30个、1-20个,优选1-10个,更优选1-5个)实施此组合。接着可以依次与1)+2)+3)+4)连同5)靶向一个或多个基因并且用适当的适体进一步修饰以募集基因阻抑因子的一个或多个gRNA(1-50个、1-40个、1-30个、1-20个,优选1-10个,更优选1-5个)实施此组合。因此,本发明包括各种用途和组合。例如,组合1)+2);组合1)+3);组合2)+3);组合1)+2)+3);组合1)+2)+3)+4);组合1)+3)+4);组合2)+3)+4);组合1)+2)+4);组合1)+2)+3)+4)+5);组合1)+3)+4)+5);组合2)+3)+4)+5);组合1)+2)+4)+5);组合1)+2)+3)+5);组合1)+3)+5);组合2)+3)+5);组合1)+2)+5)。
在一方面,本发明提供了一种用于设计、评估或选择用于将Cas13 CRISPR-Cas系统引导至靶基因座的死亡指导RNA靶向序列(死亡指导序列)的算法。特别地,已确定死亡指导RNA的特异性与i)GC含量和ii)靶向序列长度有关,并且可以通过改变这些参数加以优化。在一方面,本发明提供了一种使死亡指导RNA的脱靶结合或相互作用最小化的用于设计或评估死亡指导RNA靶向序列的算法。在本发明的一个实施方案中,用于选择用于将CRISPR系统引导至生物体中的基因座的死亡指导RNA靶向序列的算法包括:a)在所述基因座中定位一个或多个CRISPR基序,分析每个CRISPR基序下游的20nt序列,方式为:i)确定所述序列的GC含量,并且ii)确定在生物体基因组中最接近所述CRISPR序列的15个下游核苷酸是否存在脱靶匹配;以及c)如果所述序列的GC含量为70%或更低并且没有鉴定到脱靶匹配,则选择所述15个核苷酸用于在死亡指导RNA中使用。在一个实施方案中,如果GC含量为60%或更低,则选择所述序列用于靶向序列。在某些实施方案中,如果GC含量为55%或更低、50%或更低、45%或更低、40%或更低、35%或更低或30%或更低,则选择所述序列用于靶向序列。在一个实施方案中,分析基因座的两个或更多个序列,并且选择具有最低GC含量、或次低GC含量、或次最低GC含量的序列。在一个实施方案中,如果在生物体的基因组中没有鉴定到脱靶匹配,则选择所述序列用于靶向序列。在一个实施方案中,如果在基因组的调控序列中没有鉴定到脱靶匹配,则选择靶向序列。
在一方面,本发明提供了一种选择用于将官能化的CRISPR系统引导至生物体中的基因座的死亡指导RNA靶向序列的方法,所述方法包括:a)在所述基因座中定位一个或多个CRISPR基序;b)分析每个CRISPR基序下游的20nt序列,方式为:i)确定所述序列的GC含量,并且ii)确定在所述生物体的基因组中所述序列的前15nt是否存在脱靶匹配;c)如果所述序列的GC含量为70%或更低并且没有鉴定到脱靶匹配,则选择所述序列用于在指导RNA中使用。在一个实施方案中,如果GC含量为50%或更低,则选择所述序列。在一个实施方案中,如果GC含量为40%或更低,则选择所述序列。在一个实施方案中,如果GC含量为30%或更低,则选择所述序列。在一个实施方案中,分析两个或更多个序列,并且选择具有最低GC含量的序列。在一个实施方案中,在生物体的调控序列中确定脱靶匹配。在一个实施方案中,基因座是调控区。一方面提供了包含根据前述方法所选择的靶向序列的死亡指导RNA。
在一方面,本发明提供了一种用于将官能化的CRISPR系统靶向生物体中的基因座的死亡指导RNA。在本发明的一个实施方案中,所述死亡指导RNA包含靶向序列,其中所述靶序列的CG含量为70%或更低,并且所述靶向序列的前15nt与该生物体中的另一个基因座的调控序列中的CRISPR基序下游的脱靶序列不匹配。在某些实施方案中,靶向序列的GC含量为60%或更低、55%或更低、50%或更低、45%或更低、40%或更低、35%或更低或30%或更低。在某些实施方案中,靶向序列的GC含量为70%至60%或60%至50%或50%至40%或40%至30%。在一个实施方案中,在基因座的潜在靶向序列中所述靶向序列具有最低的CG含量。
在本发明的一个实施方案中,死亡指导物的前15nt与靶序列匹配。在另一个实施方案中,死亡指导物的前14nt与靶序列匹配。在另一个实施方案中,死亡指导物的前13nt与靶序列匹配。在另一个实施方案中,死亡指导物的前12nt与靶序列匹配。在另一个实施方案中,死亡指导物的前11nt与靶序列匹配。在另一个实施方案中,死亡指导物的前10nt与靶序列匹配。在本发明的一个实施方案中,死亡指导物的前15nt与另一个基因座的调控区中的CRISPR基序下游的脱靶序列不匹配。在其他实施方案中,死亡指导物的前14nt或前13nt、或指导物的前12nt、或死亡指导物的前11nt、或死亡指导物的前10nt与另一个基因座的调控区中的CRISPR基序下游的脱靶序列不匹配。在其他实施方案中,死亡指导物的前15nt、或14nt、或13nt、或12nt、或11nt与基因组中的CRISPR基序下游的脱靶序列不匹配。
在某些实施方案中,死亡指导RNA在3'端包括与靶序列不匹配的另外的核苷酸。因此,包括CRISPR基序下游的前15nt、或14nt、或13nt、或12nt、或11nt的死亡指导RNA的长度可以在3'端延长至12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt或更长。
本发明提供了一种用于将Cas13 CRISPR-Cas系统引导至基因座的方法,所述Cas13 CRISPR-Cas系统包括但不限于死亡Cas13(dCas13)或官能化的Cas13系统(其可以包括官能化的Cas13或官能化的指导物)。在一方面,本发明提供了一种用于选择死亡指导RNA靶向序列并将官能化的CRISPR系统引导至生物体中的基因座的方法。在一方面,本发明提供了一种用于选择死亡指导RNA靶向序列并通过官能化的Cas13 CRISPR-Cas系统实现靶基因座的基因调控的方法。在某些实施方案中,所述方法用于在最小化脱靶效应的同时实现靶基因调控。在一方面,本发明提供了一种用于选择两个或更多个死亡指导RNA靶向序列并通过官能化的Cas13 CRISPR-Cas系统实现两个或更多个靶基因座的基因调控的方法。在某些实施方案中,所述方法用于在最小化脱靶效应的同时实现两个或更多个靶基因座的调控。
在一方面,本发明提供了一种选择用于将官能化的Cas13引导至生物体中的基因座的死亡指导RNA靶向序列的方法,所述方法包括:a)在所述基因座中定位一个或多个CRISPR基序;b)分析每个CRISPR基序下游的序列,方式为:i)选择与所述CRISPR基序相邻的10至15nt,ii)确定所述序列的GC含量;以及c)如果所述序列的GC含量为40%或更高,则选择所述10至15nt序列作为靶向序列用于在指导RNA中使用。在一个实施方案中,如果GC含量为50%或更高,则选择所述序列。在一个实施方案中,如果GC含量为60%或更高,则选择所述序列。在一个实施方案中,如果GC含量为70%或更高,则选择所述序列。在一个实施方案中,分析两个或更多个序列,并且选择具有最高GC含量的序列。在一个实施方案中,所述方法还包括将与CRISPR基序下游的序列不匹配的核苷酸添加至所选序列的3'端。一方面提供了包含根据前述方法所选择的靶向序列的死亡指导RNA。
在一方面,本发明提供了一种用于将官能化的CRISPR系统引导至生物体中的基因座的死亡指导RNA,其中所述死亡指导RNA的靶向序列由与所述基因座的CRISPR基序相邻的10至15个核苷酸组成,其中靶序列的CG含量为50%或更高。在某些实施方案中,所述死亡指导RNA还包含添加至靶向序列的3'端的与基因座的CRISPR基序下游的序列不匹配的核苷酸。
在一方面,本发明提供了有待引导至一个或多个或两个或更多个基因座的单一效应子。在某些实施方案中,所述效应子与Cas13相缔合,并且一个或多个、或两个或更多个选择的死亡指导RNA用于将与Cas13缔合的效应子引导至一个或多个、或两个或更多个选择的靶基因座。在某些实施方案中,所述效应子与一个或多个、或两个或更多个选择的死亡指导RNA相缔合,当与Cas13酶复合时,每个选择的死亡指导RNA都使其所缔合的效应子定位至死亡指导RNA靶标。此类CRISPR系统的一个非限制性实例调节受相同转录因子调控的一个或多个、或两个或更多个基因座的活性。
在一方面,本发明提供了有待引导至一个或多个基因座的两个或更多个效应子。在某些实施方案中,采用两个或更多个死亡指导RNA,所述两个或更多个效应子中的每一个与选择的死亡指导RNA相缔合,两个或更多个效应子中的每一个均定位至其死亡指导RNA的选定靶标。此类CRISPR系统的一个非限制性实例调节受不同转录因子调控的一个或多个、或两个或更多个基因座的活性。因此,在一个非限制性实施方案中,两个或更多个转录因子定位至单一基因的不同调控序列。在另一个非限制性实施方案中,两个或更多个转录因子定位至不同基因的不同调控序列。在某些实施方案中,一个转录因子是激活因子。在某些实施方案中,一个转录因子是抑制因子。在某些实施方案中,一个转录因子是激活因子,并且另一个转录因子是抑制因子。在某些实施方案中,调控表达相同调控途径的不同组分的基因座。在某些实施方案中,调控表达不同调控途径的组分的基因座。
在一方面,本发明还提供了一种用于设计和选择特定用于由活性Cas13 CRISPR-Cas系统介导的靶DNA切割或靶标结合和基因调控的死亡指导RNA的方法和算法。在某些实施方案中,所述Cas13 CRISPR-Cas系统使用活性Cas13提供正交基因控制,所述活性Cas13切割一个基因座处的靶DNA,同时结合并促进另一个基因座的调控。
在一方面,本发明提供了一种选择用于将官能化的Cas13引导至生物体中的基因座的死亡指导RNA靶向序列而不发生切割的方法,所述方法包括:a)在所述基因座中定位一个或多个CRISPR基序;b)分析每个CRISPR基序下游的序列,方式为:i)选择与所述CRISPR基序相邻的10至15nt,ii)确定所述序列的GC含量;以及c)如果所述序列的GC含量为30%或更高、40%或更高,则选择所述10至15nt序列作为靶向序列用于在死亡指导RNA中使用。在某些实施方案中,靶向序列的GC含量为35%或更高、40%或更高、45%或更高、50%或更高、55%或更高、60%或更高、65%或更高或70%或更高。在某些实施方案中,靶向序列的GC含量为30%至40%或40%至50%或50%至60%或60%至70%。在本发明的一个实施方案中,分析基因座中的两个或更多个序列,并且选择具有最高GC含量的序列。
在本发明的一个实施方案中,靶向序列中评估了GC含量的部分是最接近PAM的15个靶核苷酸中的10至15个连续核苷酸。在本发明的一个实施方案中,指导物中考虑了GC含量的部分是最接近PAM的15个核苷酸中的10至11个核苷酸、或11至12个核苷酸、或12至13个核苷酸、或13或14或15个连续核苷酸。
在一方面,本发明进一步提供了一种用于鉴定促进CRISPR系统基因座切割同时避免功能激活或抑制的死亡指导RNA的算法。据观察,16至20个核苷酸的死亡指导RNA中的GC含量增加与DNA切割增加和功能激活减少相吻合。
本文还证明了通过将与CRISPR基序下游的靶序列不匹配的核苷酸添加到指导RNA的3'端可以提高官能化的Cas13的效率。例如,在长度为11至15nt的死亡指导RNA中,较短的指导物可能不太可能促进靶标切割,在促进CRISPR系统结合和功能控制方面效率也较低。在某些实施方案中,将与靶序列不匹配的核苷酸添加至死亡指导RNA的3'端增加激活效率,而不增加不期望的靶标切割。在一方面,本发明还提供了一种用于鉴定改进的死亡指导RNA的方法和算法,所述改进的死亡指导RNA有效地促进CRISPRP系统在DNA结合和基因调控中的功能而不促进DNA切割。因此,在某些实施方案中,本发明提供了一种死亡指导RNA,所述死亡指导RNA包括CRISPR基序下游的前15nt、或14nt、或13nt、或12nt、或11nt,并且其长度通过与靶标错配的核苷酸在3'端延长至12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt或更长。
在一方面,本发明提供了一种用于实现选择性正交基因控制的方法。如将从本文的公开理解的,根据本发明的考虑了指导物长度和GC含量的死亡指导物选择通过功能性Cas13 CRISPR-Cas系统提供了有效且具选择性的转录控制,例如以便通过激活或抑制调控基因座的转录并使脱靶效应最小化。因此,通过提供对单个靶基因座的有效调控,本发明还提供了对两个或更多个靶基因座的有效正交调控。
在某些实施方案中,正交基因控制是通过激活或抑制两个或更多个靶基因座而进行的。在某些实施方案中,正交基因控制是通过激活或抑制一个或多个靶基因座以及切割一个或多个靶基因座而进行的。
在一方面,本发明提供了一种包含非天然存在的Cas13 CRISPR-Cas系统的细胞,所述Cas13 CRISPR-Cas系统包含根据本文所述的方法或算法公开或制备的一种或多种死亡指导RNA,其中一种或多种基因产物的表达已被改变。在本发明的一个实施方案中,两种或更多种基因产物在细胞中的表达已被改变。本发明还提供了一种来自这种细胞的细胞系。
在一方面,本发明提供了一种包含含有非天然存在的Cas13 CRISPR-Cas系统的一种或多种细胞的多细胞生物体,所述Cas13 CRISPR-Cas系统包含根据本文所述的方法或算法公开或制备的一种或多种死亡指导RNA。在一方面,本发明提供了一种来自包含非天然存在的Cas13 CRISPR-Cas系统的细胞、细胞系或多细胞生物体的产物,所述Cas13 CRISPR-Cas系统包含根据本文所述的方法或算法公开或制备的一种或多种死亡指导RNA。
本发明的另一方面是如本文所述的包含一种或多种死亡指导物的gRNA,任选地结合如本文所述的或现有技术中的包含一种或多种指导物的gRNA、结合被工程化以用于过表达Cas13或优选敲入Cas13的系统(例如细胞、转基因动物、转基因小鼠、诱导型转基因动物、诱导型转基因小鼠)的用途。因此,单一系统(例如转基因动物、细胞)可以用作系统/网络生物学中多重基因修饰的基础。由于死亡指导物,现在这在体外、离体和体内均可实现。
例如,一旦提供了Cas13,就可以提供一种或多种死亡gRNA来引导多重基因调控,并且优选地是多重双向基因调控。如果必要或期望的话,可以采用在空间和时间上适当的方式提供一种或多种死亡gRNA(例如,组织特异性诱导Cas13表达)。因为在目标细胞、组织、动物中提供(例如表达)转基因/诱导型Cas13,所以包含死亡指导物的gRNA或包含指导物的gRNA都同样有效。同样地,本发明的另一方面是如本文所述的包含一种或多种死亡指导物的gRNA,任选地结合如本文所述的或现有技术中的包含一种或多种指导物的gRNA、结合被工程化以敲除Cas13 CRISPR-Cas的系统(例如细胞、转基因动物、转基因小鼠、诱导型转基因动物、诱导型转基因小鼠)的用途。
因此,如本文所述的死亡指导物与本文所述的CRISPR应用和本领域中已知的CRISPR应用的结合产生了用于系统的多重筛选的高效且准确的手段(例如,网络生物学)。这种筛选允许例如鉴定基因活性的特定组合(例如开/关组合),以鉴定造成疾病(特别地基因相关疾病)的基因。这种筛选的优选应用是癌症。同样地,本发明包括对此类疾病的治疗的筛选。细胞或动物可能会暴露在异常条件下,造成疾病或疾病样影响。可以提供候选组合物,并且在所需的多重环境中筛选效果。例如,可以筛查患者的癌细胞中哪些基因组合会导致细胞死亡,然后使用此信息来建立适当的疗法。
在一方面,本发明提供了一种药盒,所述药盒包含本文所述的一种或多种组分。所述药盒可以包括具有或不具有如本文所述的指导物的如本文所述的死亡指导物。
本文提供的结构信息允许探询死亡gRNA与靶DNA和Cas13的相互作用,从而允许工程化或改变死亡gRNA的结构以优化整个Cas13 CRISPR-Cas系统的功能。例如,可以通过插入可以结合至RNA的衔接蛋白来延长死亡gRNA的环,而不会与Cas13蛋白发生冲突。这些衔接蛋白可以进一步募集包含一个或多个功能结构域的效应蛋白或融合物。
在一些优选的实施方案中,功能结构域是转录激活结构域,优选为VP64。在一些实施方案中,功能结构域是转录阻抑结构域,优选为KRAB。在一些实施方案中,转录阻抑结构域是SID或SID的串联体(例如SID4X)。在一些实施方案中,功能结构域是表观遗传修饰结构域,从而提供了表观遗传修饰酶。在一些实施方案中,功能结构域是激活结构域,其可以是P65激活结构域。
本发明的一方面是上述元件被包含在单一组合物中或者被包含在单独的组合物中。这些组合物可以有利地应用于宿主以在基因组水平上引发功能效应。
一般来讲,以提供用于包含要结合(例如,经由融合蛋白)的一个或多个功能结构域的衔接蛋白的特异性结合位点(例如适体)的方式修饰死亡gRNA。修饰的死亡gRNA被修饰,使得一旦死亡gRNA形成CRISPR复合物(即,Cas13结合至死亡gRNA和靶标),衔接蛋白结合功能结构域,并且所述衔接蛋白上的功能结构域被定位成有利于属性化的功能生效的空间取向。例如,如果功能结构域是转录激活因子(例如VP64或p65),则转录激活因子被定位成允许其实现靶标转录的空间取向。同样,转录阻抑因子将被有利地定位以影响靶标转录,而核酸酶(例如Fok1)将被有利地定位以切割或部分切割靶标。
技术人员将理解,对允许衔接子+功能结构域结合但未正确定位衔接子+功能结构域(例如由于CRISPR复合物的三维结构内的空间位阻)的死亡gRNA的修饰是未预期的修饰。如本文所述,一种或多种修饰的死亡gRNA可在四环、茎环1、茎环2或茎环3处修饰,优选地在四环或茎环2中,且最优选地在四环处环和茎环2两者中修饰。
如本文所解释,功能结构域可以是例如选自由以下组成的组的一个或多个结构域:甲基酶活性、脱甲基酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性和分子开关(例如光诱导型)。在一些情况下,有利的是另外提供至少一个NLS。在一些情况下,将NLS定位在N末端处是有利的。当包括不止一个功能结构域时,所述功能结构域可以是相同或不同的。
可以将死亡gRNA设计为包括对相同或不同衔接蛋白具有特异性的多个结合识别位点(例如适体)。可以将死亡gRNA设计为结合至转录起始位点(即TSS)上游的启动子区-1000-+1个核酸(优选-200个核酸)。这种定位改善了影响基因激活(例如转录激活因子)或基因抑制(例如转录阻抑因子)的功能结构域。修饰的死亡gRNA可以是包含在组合物中的靶向一个或多个靶基因座的一个或多个修饰的死亡gRNA(例如,至少1个gRNA、至少2个gRNA、至少5个gRNA、至少10个gRNA、至少20个gRNA、至少30个gRNA、至少50个gRNA)。
衔接蛋白可以是任何数量的蛋白质,其结合至被引入到修饰的死亡gRNA中的适体或识别位点,并且一旦死亡gRNA已经被并入CRISPR复合物中,允许一个或多个功能结构域正确定位,以便以属性化功能影响靶标。如本申请中详细解释的,衔接蛋白可以是外壳蛋白,优选为噬菌体外壳蛋白。与此类衔接蛋白(例如,呈融合蛋白的形式)相缔合的功能结构域可以包括例如选自由以下组成的组的一个或多个结构域:甲基酶活性、脱甲基酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性和分子开关(例如光诱导型)。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在功能结构域是转录激活因子或转录阻抑因子的情况下,有利的是另外提供并且优选地在N端提供至少一个NLS。当包括不止一个功能结构域时,所述功能结构域可以是相同或不同的。衔接蛋白可以利用已知的接头来附接此类功能结构域。
因此,修饰的死亡gRNA、(失活的)Cas13(具有或不具有功能结构域)和具有一个或多个功能结构域的结合蛋白可以各自单独地包含在组合物中并且单独地或共同地施用至宿主。或者,可以将这些组分以单一组合物的形式提供给宿主。可以经由技术人员已知的或本文描述的用于递送至宿主的病毒载体(例如慢病毒载体、腺病毒载体、AAV载体)进行对宿主的施用。如本文所述,使用不同的选择标记物(例如,用于慢病毒gRNA选择)和gRNA浓度(例如,取决于是否使用多个gRNA)对于引出改进的效果而言可以是有利的。
在这个概念的基础上,若干变化适于引出基因组基因座事件,包括DNA切割、基因激活或基因灭活。使用所提供的组合物,本领域技术人员可以有利地且特异性地靶向具有相同或不同功能结构域的单个或多个基因座,以引出一个或多个基因组基因座事件。这些组合物可以按多种多样的方法应用,用于在细胞中筛选文库和在体内进行功能建模(例如,lincRNA的基因激活和功能鉴定;功能获得建模;功能丧失建模;使用本发明的组合物建立用于优化和筛选目的的细胞系和转基因动物)。
本发明涵盖本发明的组合物用于建立和利用条件型或诱导型CRISPR转基因细胞/动物的用途,这在本发明或应用之前是不可信的。例如,靶细胞条件性地或诱导性地包含Cas13(例如呈Cre依赖性构建体的形式)和/或条件性地或诱导性地包含衔接蛋白,并且在表达被引入到所述靶细胞中的载体之后,所述载体表达所述Cas13和/或衔接蛋白,这在所述靶细胞中诱导或产生Cas13表达和/或衔接子表达的条件。通过用产生CRISPR复合物的已知方法应用本发明的教导和组合物,受功能结构域影响的诱导型基因组事件也是本发明的一个方面。一个实例是创建CRISPR敲入/条件型转基因动物(例如,包含Lox-Stop-polyA-Lox(LSL)盒的小鼠),随后递送一种或多种组合物,所述组合物提供如本文所述的一种或多种修饰的死亡gRNA(例如,目标靶基因的TSS地-200个核苷酸,用于基因激活目的)(例如带有一种或多种被外壳蛋白(例如MS2)识别的适体的修饰的死亡gRNA)、如本文所述的一种或多种衔接蛋白(连接至一个或多个VP64的MS2结合蛋白)和用于诱导条件型动物的工具(例如,使Cas13表达可诱导的Cre重组酶)。或者,可以将衔接蛋白与条件型或诱导型Cas13一起作为条件型或诱导型元件提供,以提供用于筛选目的的有效模型,这种模型有利地仅需要最少的设计和特异性死亡gRNA的施用即可用于广泛的应用。
在另一方面,进一步修饰了死亡指导物以提高特异性。可以合成受保护的死亡指导物,由此将二级结构引入死亡指导物的3'端从而提高其特异性。受保护的指导RNA(pgRNA)包含能够与细胞中目标基因组基因座中的靶序列杂交的指导序列和保护链,其中所述保护链任选地与所述指导序列互补,并且其中所述指导序列可以部分地与保护链杂交。pgRNA任选地包含延伸序列。pgRNA-靶DNA杂交的热力学由指导RNA与靶DNA之间互补的碱基数决定。通过采用“热力学保护”,可以通过添加保护序列来提高死亡gRNA的特异性。例如,一种方法将不同长度的互补保护链添加至死亡gRNA内的指导序列的3'端。因此,保护链与死亡gRNA的至少一部分结合,并且提供了受保护的gRNA(pgRNA)。继而,可以使用所描述的实施方案容易地保护本文提及的死亡gRNA,从而产生pgRNA。保护链可以是单独的RNA转录物或链,或者是连接指死亡gRNA指导序列的3'端的嵌合型式。
串联指导物和在多重(串联)靶向方法中的用途
本发明人已经表明,如本文所定义的CRISPR酶可以采用多于一种RNA指导物而不会失去活性。这使得能够用如本文所定义的单个酶、系统或复合物,将如本文所定义的CRISPR酶、系统或复合物用于靶向多个DNA靶标、基因或基因座。这些指导RNA可以串联地排列,任选地由核苷酸序列(诸如本文所定义的正向重复序列)隔开。串联的不同指导RNA的位置不影响活性。注意,术语“CRISPR-Cas系统”、“CRISP-Cas复合物”、“CRISPR复合物”和“CRISPR系统”可互换使用。术语“CRISPR酶”、“Cas酶”或“CRISPR-Cas酶”也可以互换使用。在优选的实施方案中,所述CRISPR酶、CRISP-Cas酶或Cas酶是Cas13,或本文别处所述的其修饰的或突变的变体中的任一种。
在一方面,本发明提供了一种用于串联或多重靶向的非天然存在的或工程化的CRISPR酶,优选2类CRISPR酶,优选如本文所述的V型或VI型CRISPR酶,诸如但不限于如本文别处所述的Cas13。应当理解,如本文别处所述的根据本发明的任何CRISPR(或CRISPR-Cas或Cas)酶、复合物或系统均可用于这种方法。如本文别处所述的任何方法、产品、组合物和用途与下文进一步详述的多重或串联靶向方法同样适用。作为进一步的指导,提供了以下特定方面和实施方案。
在一方面,本发明提供了如本文所定义的Cas13酶、复合物或系统用于靶向多个基因座的用途。在一个实施方案中,这可以通过使用多个(串联或多重)指导RNA(gRNA)序列来建立。
在一方面,本发明提供了使用如本文所定义的Cas13酶、复合物或系统的一个或多个元件用于串联或多重靶向的方法,其中所述CRISP系统包含多个指导RNA序列。优选地,所述gRNA序列由核苷酸序列(像如本文别处所定义的正向重复序列)隔开。
如本文所定义的Cas13酶、系统或复合物提供了用于修饰多个靶多核苷酸的有效手段。如本文所定义的Cas13酶、系统或复合物具有多种多样的实用性,包括修饰(例如,缺失、插入、转位、失活、激活)多种细胞类型中的一个或多个靶多核苷酸。这样,本发明在此定义的Cas13酶、系统或复合物在例如基因疗法、药物筛选、疾病诊断和预后中具有广谱应用,包括靶向单个CRISPR系统内的多个基因座。
在一方面,本发明提供了如本文所定义的Cas13酶、系统或复合物,即具有以下项的Cas13 CRISPR-Cas复合物:具有至少一个与之相缔合的去稳定结构域的Cas13蛋白和靶向多个核酸分子(诸如DNA分子)的多个指导RNA,由此所述多个指导RNA中每者都特异性地靶向其相应的核酸分子(例如DNA分子)。每个核酸分子靶标(例如DNA分子)都可以编码基因产物或包括基因座。因此,使用多个指导RNA使得能够靶向多个基因座或多个基因。在一些实施方案中,Cas13酶可以切割编码基因产物的RNA分子。在一些实施方案中,基因产物的表达被改变。Cas13蛋白和指导RNA不能天然地一起存在。本发明涵盖包含串联排列的指导序列的指导RNA。本发明还涵盖经密码子优化以便在真核细胞中表达的Cas13蛋白的编码序列。在一个优选的实施方案中,真核细胞是哺乳动物细胞、植物细胞或酵母细胞,并且在一个更优选的实施方案中,哺乳动物细胞是人类细胞。基因产物的表达可以被降低。Cas13酶可以构成CRISPR系统或复合物的一部分,所述CRISPR系统或复合物还包含串联排列的指导RNA(gRNA),这些指导RNA包含一连串的2、3、4、5、6、7、8、9、10、15、25、25、30个、或超过30个指导序列,每个指导序列都能够特异性地杂交至细胞中的目标基因组基因座中的靶序列。在一些实施方案中,功能性Cas13 CRISPR系统或复合物结合至多个靶序列。在一些实施方案中,功能性CRISPR系统或复合物可以编辑多个靶序列,例如靶序列可以包含基因组基因座,并且在一些实施方案中,可以存在基因表达的改变。在一些实施方案中,功能性CRISPR系统或复合物可以包含另外的功能结构域。在一些实施方案中,本发明提供了一种用于改变或修饰多种基因产物的表达的方法。所述方法可以包括引入到含有所述靶核酸(例如DNA分子)、或含有和表达靶核酸(例如DNA分子)的细胞中;例如,这些靶核酸可以编码基因产物或提供基因广物(例如调控序列)的表达。
在优选的实施方案中,用于多重靶向的CRISPR酶是Cas13,或者CRISPR系统或复合物包含Cas13。在一些实施方案中,用于多重靶向的CRISPR酶是AsCas13,或者用于多重靶向的CRISPR系统或复合物包含AsCas13。在一些实施方案中,CRISPR酶是LbCas13,或者CRISPR系统或复合物包含LbCas13。在一些实施方案中,用于多重靶向的Cas酶切割DNA的两条链以产生双链断裂(DSB)。在一些实施方案中,用于多重靶向的CRISPR酶是切口酶。在一些实施方案中,用于多重靶向的Cas13酶是双切口酶。在一些实施方案中,用于多重靶向的Cas13酶是Cas13酶,像如本文别处所定义的DD Cas13酶。
在一些一般实施方案中,用于多重靶向的Cas13酶与一个或多个功能结构域相缔合。在一些更具体的实施方案中,用于多重靶向的CRISPR酶是如本文别处所定义的死亡Cas13。
在一方面,本发明提供了一种用于递送用于在多靶向中使用的如本文所定义的Cas13酶、系统或复合物或者本文所定义的多核苷酸的工具。此类递送工具的非限制性实例是例如递送复合物的一种或多种组分的一种或多种粒子、包含本文所讨论的一种或多种多核苷酸的一种或多种载体(例如,编码所述CRISPR酶、提供编码所述CRISPR复合物的核苷酸)。在一些实施方案中,载体可以是质粒或病毒载体,诸如AAV或慢病毒。用质粒瞬时转染进例如HEK细胞中可以是有利的,尤其是考虑到AAV的尺寸限制,并且在将Cas13装配进AAV中时用另外的指导RNA的情况下AAV可以达到上限。
还提供了一种模型,所述模型组成性地表达用于在多重靶向中使用的如本文所用的Cas13酶、复合物或系统的模型。该生物体可以是转基因的,并且可以已经用本发明载体转染或者可以是这样转染的生物的后代。在另一方面,本发明提供了包含如本文所定义的CRISPR酶、系统和复合物或本文所述的多核苷酸或载体的组合物。还提供了包含多个指导RNA(优选处于串联排列的形式)的Cas13 CRISPR系统或复合物。所述不同的指导RNA可以由核苷酸序列(诸如正向重复序列)隔开。
还提供了一种治疗受试者(例如有需要的受试者)的方法,所述方法包括通过用编码Cas13 CRISPR系统或复合物的多核苷酸或本文所述的任何多核苷酸或载体转化所述受试者而诱导基因编辑并且向所述受试者施用它们。还可以提供适合的修复模板,例如通过包含所述修复模板的载体递送所述修复模板。还提供了一种治疗受试者(例如有需要的受试者)的方法,所述方法包括通过用本文所述的多核苷酸或载体转化所述受试者而诱导多个靶基因座的转录激活或阻抑,其中所述多核苷酸或载体编码或包含含有优选地串联排列的多个指导RNA的Cas13酶、复合物或系统。在任何处理离体地(例如在细胞培养物中)发生的情况下,则应当理解的是,术语“受试者”可以由短语“细胞或细胞培养物”替换。
还提供了包含Cas13酶、复合物或系统(其包含优选地串联排列的多个指导RNA)的组合物,或编码或包含所述Cas13酶、复合物或系统(其包含优选地串联排列的多个指导RNA)的多核苷酸或载体,用于在如本文别处所定义的治疗方法中使用。可以提供包括此类组合物的药盒。还提供了所述组合物在用于此类治疗方法的药剂的制造中的用途。本发明还提供了Cas13 CRISPR系统在筛选(例如功能获得筛选)中的用途。人为地强行过表达基因的细胞能够例如通过负反馈回路随时间下调该基因(重建平衡)。到筛选开始时,未调控的基因可能再次被减少。使用诱导型Cas13激活因子允许正好在筛选之前诱导转录并且因此使假阴性命中的机会最小化。因此,通过在筛选(例如功能获得筛选)中使用本发明,可以使假阴性结果的机会最小化。
在一方面,本发明提供了一种工程化的非天然存在的CRISPR系统,所述系统包含Cas13蛋白和各自特异性地靶向细胞中编码基因产物的DNA分子的多种指导RNA,由此所述多种指导RNA各自靶向编码所述基因产物的其特异性DNA分子,并且所述Cas13蛋白切割编码所述基因产物的靶DNA分子,由此改变所述基因产物的表达;并且其中所述CRISPR蛋白和所述指导RNA并不天然地一起存在。本发明包括包含多个指导序列的多种指导RNA,这些指导序列优选地由核苷酸序列(诸如正向重复序列)隔开并且任选地融合至tracr序列。在本发明的一个实施方案中,CRISPR蛋白是V型或VI型CRISPR-Cas蛋白,并且在一个更优选的实施方案中,CRISPR蛋白是Cas13蛋白。本发明还涵盖经密码子优化以便在真核细胞中表达的Cas13蛋白。在一个优选的实施方案中,真核细胞是哺乳动物细胞,并且在一个更优选的实施方案中,哺乳动物细胞是人类细胞。在本发明的另一个实施方案中,基因产物的表达被降低。
在另一方面,本发明提供了工程化的非天然存在的载体系统,所述载体系统包含一种或多种载体,所述一种或多种载体包含第一调控元件和第二调控元件,所述第一调控元件可操作地连接至多种Cas13 CRISPR系统指导RNA,所述指导RNA各自特异性地靶向编码基因产物的DNA分子,所述第二个调控元件可操作地连接、编码CRISPR蛋白。两个调控元件可以位于系统的相同载体或不同载体上。所述多种指导RNA靶向细胞中编码多种基因产物的多个DNA分子,并且所述CRISPR蛋白可以切割编码所述基因产物的所述多个DNA分子(它可以切割一条链或两条链或者基本上没有核酸酶活性),由此改变所述多种基因产物的表达;并且,其中所述CRISPR蛋白和所述多种指导RNA并不天然地一起存在。在一个优选的实施方案中,CRISPR蛋白是Cas13蛋白,任选地经密码子优化以便在真核细胞中表达。在一个优选的实施方案中,真核细胞是哺乳动物细胞、植物细胞或酵母细胞,并且在一个更优选的实施方案中,哺乳动物细胞是人类细胞。在本发明的另一个实施方案中,多种基因产物各自的表达被改变,优选地被降低。
在一方面,本发明提供了包含一种或多种载体的载体系统。在一些实施方案中,所述系统包含:(a)第一调控元件,所述第一调控元件可操作地连接至正向重复序列和一个或多个插入位点,所述一个或多个插入位点用于在所述正向重复序列的上游或下游(以适用者为准)插入一个或多个指导序列,其中当表达时,所述一个或多个指导序列引导所述CRISPR复合物与真核细胞中的一个或多个靶序列的序列特异性结合,其中所述CRISPR复合物包含Cas13酶,所述Cas13酶与杂交至所述一个或多个靶序列的一个或多个指导序列复合;和(b)第二调控元件,所述第二调控元件可操作地连接至编码所述Cas13酶的酶编码序列,所述Cas13酶优选地包含至少一个核定位序列和/或至少一个NES;其中组分(a)和组分(b)位于所述系统的相同或不同载体上。在适用的情况下,还可以提供tracr序列。在一些实施方案中,组分(a)还包含可操作地连接至所述第一调控元件的两个或更多个指导序列,其中当表达时,所述两个或更多个指导序列中的每者都引导Cas13 CRISPR复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施方案中,所述CRISPR复合物包含一个或多个核定位序列和/或一个或多个NES,这些序列具有足够强度来在真核细胞的细胞核中或细胞核外驱动所述Cas13 CRISPR复合物以可检测的量积聚。在一些实施方案中,所述第一调控元件是聚合酶III启动子。在一些实施方案中,所述第二调控元件是聚合酶II启动子。在一些实施方案中,所述指导序列各自的长度为至少16、17、18、19、20、25个核苷酸,或16-30个之间、或16-25个之间、或16-20个之间的核苷酸。
重组表达载体可以包含处于适合于在宿主细胞中表达核酸的形式的编码用于在多靶向中使用的如本文所定义的Cas13酶、系统或复合物的多核苷酸,这意味着重组表达载体包含一个或多个调控元件,这些调控元件可以基于用于表达的宿主细胞来选择,可操作地连接至有待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在意指目标核苷酸序列以允许核苷酸序列表达(例如,在体外转录/翻译系统中或当该载体被引入到宿主细胞时在宿主细胞中)的方式连接至一个或多个调控元件。
在一些实施方案中,用一种或多种载体瞬时或非瞬时转染宿主细胞,所述一种或多种载体包含编码用于在多靶向中使用的如本文所定义的Cas13酶、系统或复合物的多核苷酸。在一些实施方案中,当细胞天然地出现在受试者体内时将其转染。在一些实施方案中,转染的细胞是从受试者获得。在一些实施方案中,细胞来源于从受试者获得的细胞,诸如细胞系。用于组织培养的多种多样的细胞系在本领域是已知的并且在本文别处示例。细胞系可从本领域技术人员已知的多种来源获得(参见例如美国典型培养物保藏中心(ATCC)(Manassus,Va.))。在一些实施方案中,使用利用一种或多种载体转染的细胞建立包括一个或多个载体来源的序列的新细胞系,所述一种或多种载体包含编码用于在多靶向中使用的如本文所定义的Cas13酶、系统或复合物的多核苷酸。在一些实施方案中,使用利用如本文所述的用于在多靶向中使用的Cas13 CRISPR系统或复合物的组分转染(诸如通过用一种或多种载体进行瞬时转染、或用RNA进行转染)并且通过Cas13 CRISPR系统或复合物的活性修饰的细胞建立新细胞系,所述新细胞系包含含有修饰但是缺少任何其他外源性序列的细胞。在一些实施方案中,在评定一种或多种测试化合物中使用用一种或多种载体瞬时或非瞬时转染的细胞或来源于此类细胞的细胞系,所述一种或多种载体包含编码用于在多靶向中使用的如本文所定义的Cas13酶、系统或复合物的多核苷酸。
术语“调控元件”如本文别处所定义。
有利的载体包括慢病毒和腺伴随病毒并且此类载体类型还可以被选择用于靶向特定细胞类型。
在一方面,本发明提供了一种真核宿主细胞,所述真核宿主细胞包含(a)第一调控元件,所述第一调控元件可操作地连接至正向重复序列和一个或多个插入位点,所述一个或多个插入位点用于在所述正向重复序列的上游或下游(以适用者为准)插入一个或多个指导RNA序列,其中当表达时,所述一个或多个指导序列引导所述Cas13 CRISPR复合物与真核细胞中的一个或多个对应靶序列的序列特异性结合,其中所述Cas13 CRISPR复合物包含Cas13酶,所述Cas13酶与杂交至所述一个或多个对应靶序列的一个或多个指导序列复合;和/或(b)第二调控元件,所述第二调控元件可操作地连接至编码所述Cas13酶的酶编码序列,所述Cas13酶优选地包含至少一个核定位序列和/或NES。在一些实施方案中,所述宿主细胞包含组分(a)和组分(b)。在适用的情况下,还可以提供tracr序列。在一些实施方案中,组分(a)、组分(b)或组分(a)和组分(b)被稳定地整合到所述宿主真核细胞的基因组中。在一些实施方案中,组分(a)还包含可操作地连接至所述第一调控元件并且任选地由正向重复序列隔开的两个或更多个指导序列,其中当表达时,所述两个或更多个指导序列中的每者都引导Cas13CRISPR复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施方案中,所述Cas13酶包含一个或多个核定位序列和/或核输出序列或NES,这些序列具有足够强度来在真核细胞的细胞核中和/或细胞核外驱动所述CRISPR酶以可检测的量积聚。
在一些实施方案中,所述Cas13酶是V型或VI型CRISPR系统酶。在一些实施方案中,所述Cas酶是Cas13酶。在一些实施方案中,所述Cas13酶来源于土拉弗朗西丝菌(Francisella tularensis)1、土拉弗朗西丝菌新凶手亚种(Francisella tularensissubsp.novicida)、易北普雷沃氏菌(Prevotella albensis)、毛螺科菌MC2017 1、解蛋白丁酸弧菌(Butyrivibrio proteoclasticus)、异域菌门菌(Peregrinibacteria bacterium)GW2011_GWA2_33_10、帕库氏菌(Parcubacteria bacterium)GW2011_GWC2_44_17、史密斯氏菌属种(Smithella sp.)SCADC、氨基酸球菌属种(Acidaminococcus sp.)BV3L6、毛螺科菌MA2020、候选白蚁甲烷支原体(Candidatus Methanoplasma termitum)、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉氏菌(Moraxella bovoculi)237、稻田氏钩端螺旋体(Leptospira inadai)、毛螺科菌ND2006、狗口腔卟啉单胞菌(Porphyromonascrevioricanis)3、解糖胨普雷沃氏菌(Prevotella disiens)或猕猴卟啉单胞菌(Porphyromonas macacae)Cas13,并且可以包括如本文别处所定义的Cas13的另外的改变或突变,并且可以是嵌合Cas13。在一些实施方案中,所述Cas13酶经密码子优化以便在真核细胞中表达。在一些实施方案中,所述CRISPR酶引导在所述靶序列位置处的一条或两条链的切割。在一些实施方案中,所述第一调控元件是聚合酶III启动子。在一些实施方案中,所述第二调控元件是聚合酶II启动子。在一些实施方案中,所述一个或多个指导序列(各自)的长度为至少16、17、18、19、20、25个核苷酸,或16-30个之间、或16-25个之间、或16-20个之间的核苷酸。当使用多个指导RNA时,它们优选地由正向重复序列隔开。在一方面,本发明提供了一种非人类的真核生物体;优选地是多细胞真核生物体,这些生物体包含根据任何所述实施方案的真核宿主细胞。在其他方面,本发明提供了一种真核生物体;优选地是多细胞真核生物体,这些生物体包含根据任何所述实施方案的真核宿主细胞。在这些方面的一些实施方案中,生物体可以是动物;例如哺乳动物。而且,生物体可以是节肢动物,诸如昆虫。所述生物体还可以是植物。此外,所述生物体可以是真菌。
在一方面,本发明提供了一种药盒,所述药盒包含本文所述的一种或多种组分。在一些实施方案中,所述药盒包括载体系统以及用于使用所述药盒的说明书。在一些实施方案中,所述载体系统包含(a)第一调控元件,所述第一调控元件可操作地连接至正向重复序列和一个或多个插入位点,所述一个或多个插入位点用于在所述正向重复序列的上游或下游(以适用者为准)插入一个或多个指导序列,其中当表达时,所述指导序列引导Cas13CRISPR复合物与真核细胞中的靶序列的序列特异性结合,其中所述Cas13 CRISPR复合物包含Cas13酶,所述Cas13酶与杂交至所述靶序列的指导序列复合;和/或(b)第二调控元件,所述第二调控元件可操作地连接至编码所述Cas13酶的酶编码序列,所述Cas13酶包含核定位序列。在适用的情况下,还可以提供tracr序列。在一些实施方案中,所述药盒包含位于所述系统的相同或不同载体上的组分(a)和组分(b)。在一些实施方案中,组分(a)还包含可操作地连接至所述第一调控元件的两个或更多个指导序列,其中当表达时,所述两个或更多个指导序列中的每者都引导CRISPR复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施方案中,所述Cas13酶包含一个或多个核定位序列,这些序列具有足够强度来在真核细胞的细胞核中驱动所述CRISPR酶以可检测的量积聚。在一些实施方案中,所述CRISPR酶是V型或VI型CRISPR系统酶。在一些实施方案中,所述CRISPR酶是Cas13酶。在一些实施方案中,所述Cas13酶来源于土拉弗朗西丝菌1、土拉弗朗西丝菌新凶手亚种、易北普雷沃氏菌、毛螺科菌MC2017 1、解蛋白丁酸弧菌、异域菌门菌GW2011_GWA2_33_10、帕库氏菌GW2011_GWC2_44_17、史密斯氏菌属种SCADC、氨基酸球菌属种BV3L6、毛螺科菌MA2020、候选白蚁甲烷支原体、挑剔真杆菌、牛眼莫拉氏菌237、稻田氏钩端螺旋体、毛螺科菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌或猕猴卟啉单胞菌Cas13(例如,被修饰成具有至少一个DD或与其相缔合),并且可以包括Cas13的另外的改变或突变,并且可以是嵌合Cas13。在一些实施方案中,所述DD-CRISPR酶经密码子优化以便在真核细胞中表达。在一些实施方案中,所述DD-CRISPR酶引导在所述靶序列位置处的一条或两条链的切割。在一些实施方案中,所述DD-CRISPR酶缺少或基本上缺少DNA链切割活性(例如,与野生型酶或没有降低核酸酶活性的突变或改变的酶相比,不超过5%核酸酶活性)。在一些实施方案中,所述第一调控元件是聚合酶III启动子。在一些实施方案中,所述第二调控元件是聚合酶II启动子。在一些实施方案中,所述指导序列的长度为至少16、17、18、19、20、25个核苷酸,或16-30个之间、或16-25个之间、或16-20个之间的核苷酸。
在一方面,本发明提供了一种修饰宿主细胞诸如真核细胞中的多个靶多核苷酸的方法。在一些实施方案中,所述方法包括允许Cas13 CRISPR复合物结合至多个靶多核苷酸,例如以实现所述多个靶多核苷酸的切割,由此修饰多个靶多核苷酸,其中所述Cas13CRISPR复合物包含Cas13酶,所述Cas13酶与各自杂交至所述靶多核苷酸内的特定靶序列的多个指导序列复合,其中所述多个指导序列连接至正向重复序列。在适用的情况下,还可以提供tracr序列(例如以提供单个指导RNA,即sgRNA)。在一些实施方案中,所述切割包括通过所述Cas13酶切割在每个靶序列位置处的一条或两条链。在一些实施方案中,所述切割导致所述多个靶基因的转录降低。在一些实施方案中,所述方法还包括通过与外源性模板多核苷酸同源重组修复所述经切割的靶多核苷酸中的一者或多者,其中所述修复导致突变,所述突变包括所述靶多核苷酸中的一者或多者的一个或多个核苷酸的插入、缺失或取代。在一些实施方案中,所述突变导致在从包含所述一个或多个靶序列中的一者或多者的基因表达的蛋白质中的一个或多个氨基酸改变。在一些实施方案中,所述方法还包括将一种或多种载体递送至所述真核细胞,其中所述一种或多种载体驱动以下一者或多者的表达:所述Cas13酶和连接至正向重复序列的所述多个指导RNA序列。在适用的情况下,还可以提供tracr序列。在一些实施方案中,将所述载体递送至受试者内的真核细胞。在一些实施方案中,所述修饰发生在细胞培养物中的所述真核细胞中。在一些实施方案中,所述方法还包括在所述修饰之前从受试者中分离所述真核细胞。在一些实施方案中,所述方法还包括使所述真核细胞和/或来源于其的细胞返回至所述受试者中。
在一方面,本发明提供了一种修饰多个多核苷酸在真核细胞中的表达的方法。在一些实施方案中,所述方法包括允许Cas13 CRISPR复合物结合至多个多核苷酸,这样使得所述结合导致所述多核苷酸的表达增加或降低;其中所述Cas13 CRISPR复合物包含Cas13酶,所述Cas13酶与各自特异性地杂交至所述多核苷酸内其自身靶序列的多个指导序列复合,其中所述指导序列连接至正向重复序列。在适用的情况下,还可以提供tracr序列。在一些实施方案中,所述方法还包括将一种或多种载体递送至所述真核细胞,其中所述一种或多种载体驱动以下一者或多者的表达:所述Cas13酶和连接至正向重复序列的所述多个指导序列。在适用的情况下,还可以提供tracr序列。
在一方面,本发明提供了一种重组多核苷酸,所述重组多核苷酸包含正向重复序列上游或下游(以适用者为准)的多个指导RNA序列,其中当表达时所述多个指导序列中的每者都引导Cas13 CRISPRR复合物与存在于真核细胞中的其相应的靶序列的序列特异性结合。在一些实施方案中,所述靶序列是存在于真核细胞中的病毒序列。在适用的情况下,还可以提供tracr序列。在一些实施方案中,所述靶序列是原癌基因或癌基因。
本发明的方面包括非天然存在的或工程化的组合物,所述组合物可以包含:指导RNA(gRNA),所述指导RNA包含能够杂交至细胞中的目标基因组基因座的靶序列的指导序列;以及如本文所定义的Cas13酶,所述Cas13酶可以包含至少一个或多个核定位序列。
本发明的一方面涵盖通过向细胞中引入本文所述的任何组合物来修饰目标基因组基因座以改变所述细胞中的基因表达的方法。
本发明的一方面是上述元件被包含在单一组合物中或者被包含在单独的组合物中。这些组合物可以有利地应用于宿主以在基因组水平上引发功能效应。
如本文所用,术语“指导RNA”或“gRNA”具有如本文别处所用的倾向,并且包括与靶核酸序列具有足够互补性以与靶核酸序列杂交并且引导核酸靶向复合物序列特异性地结合至靶核酸序列的任何多核苷酸序列。可以将每种gRNA设计为包括对相同或不同衔接蛋白具有特异性的多个结合识别位点(例如适体)。可以将每种gRNA设计为结合至转录起始位点(即TSS)上游的启动子区-1000-+1个核酸(优选-200个核酸)。这种定位改善了影响基因激活(例如转录激活因子)或基因抑制(例如转录阻抑因子)的功能结构域。修饰的gRNA可以是包含在组合物中的靶向一个或多个靶基因座的一个或多个修饰的gRNA(例如,至少1个gRNA、至少2个gRNA、至少5个gRNA、至少10个gRNA、至少20个gRNA、至少30个gRNA、至少50个gRNA)。所述多个gRNA序列可以是串联排列的并且优选由正向重复序列隔开。
因此,可以将如本文所定义的gRNA、CRISPR酶各自单独地包含在组合物中并且单独地或共同地施用至宿主。或者,可以将这些组分以单一组合物的形式提供给宿主。可以经由技术人员已知的或本文描述的用于递送至宿主的病毒载体(例如慢病毒载体、腺病毒载体、AAV载体)进行对宿主的施用。如本文所述,不同选择标记物(例如,用于慢病毒sgRNA选择)的使用和gRNA的浓度(例如,取决于是否使用多个gRNA)可能有利于引发改善的效应。在这个概念的基础上,若干变化适于引出基因组基因座事件,包括DNA切割、基因激活或基因灭活。使用所提供的组合物,本领域技术人员可以有利地且特异性地靶向具有相同或不同功能结构域的单个或多个基因座,以引出一个或多个基因组基因座事件。这些组合物可以按多种多样的方法应用,用于在细胞中筛选文库和在体内进行功能建模(例如,lincRNA的基因激活和功能鉴定;功能获得建模;功能丧失建模;使用本发明的组合物建立用于优化和筛选目的的细胞系和转基因动物)。
本发明涵盖本发明的组合物用于建立和利用条件型或诱导型CRISPR转基因细胞/动物的用途;参见例如Platt等人,Cell(2014),159(2):440-455或本文引用的PCT专利公布,诸如WO 2014/093622(PCT/US2013/074667)。例如,细胞或动物(诸如非人类动物,例如脊椎动物或哺乳动物,诸如啮齿动物例如小鼠、大鼠,或其他实验室或田间动物例如猫、狗、绵羊等)可以是“敲入的”,由此类似于Platt等人,所述动物条件性地或诱导性地表达Cas13。所述靶细胞或动物因此条件性地或诱导性地包含CRISPR酶(例如Cas13)(例如,呈Cre依赖性构建体的形式),在表达被引入所述靶细胞中的载体之后,所述载体表达所述CRISPR酶(例如Cas13),这在所述靶细胞中诱导或产生所述CRISPR酶(例如Cas13)表达的条件。通过用产生CRISPR复合物的已知方法应用如本文所定义的教导和组合物,诱导型基因组事件也是本发明的一个方面。此类诱导型事件的实例已在本文别处进行了描述。
在一些实施方案中,当靶向遗传疾病时,尤其是在治疗方法中,并且优选地在提供修复模板以校正或改变表型的情况下,表型改变优选是基因组修饰的结果。
在一些实施方案中,可以被靶向的疾病包括与致病剪接缺陷有关的那些疾病。
在一些实施方案中,细胞靶标包括造血干细胞/祖细胞(CD34+);人类T细胞;以及眼(视网膜细胞)-例如光感器前体细胞。
在一些实施方案中,基因靶标包括:人类β珠蛋白-HBB(用于治疗镰状细胞性贫血,包括通过刺激基因转化(使用密切相关的HBD基因作为内源性模板));CD3(T细胞);以及CEP920-视网膜(眼)。
在一些实施方案中,疾病靶标还包括:癌症;镰状细胞性贫血(基于点突变);HBV、HIV;β-地中海贫血;以及眼科或眼部疾病-例如引起莱伯氏先天性黑蒙症(LCA)的剪接缺陷。
在一些实施方案中,递送方法包括:酶-指导复合物(核糖核蛋白)的阳离子脂质介导的“直接”递送和质粒DNA的电穿孔。
本文所述的方法、产品和用途可以用于非治疗目的。此外,本文所述的方法中的任一项可以在体外或离体应用。
在一方面,提供了一种非天然存在的或工程化的组合物,所述组合物包含:
I.两个或更多个CRISPR-Cas系统多核苷酸序列,其包含
(a)第一指导序列,所述第一指导序列能够杂交至多核苷酸基因座中的第一靶序列,
(b)第二指导序列,所述第二指导序列能够杂交至多核苷酸基因座中的第二靶序列,
(c)正向重复序列,
以及
II.Cas13酶或编码它的第二多核苷酸序列,
其中当转录时,所述第一指导序列和所述第二指导序列分别引导第一Cas13CRISPR复合物和第二Cas13 CRISPR复合物与所述第一靶序列和所述第二靶序列的序列特异性结合,
其中所述第一CRISPR复合物包含与可杂交至所述第一靶序列的所述第一指导序列复合的Cas13酶,
其中所述第二CRISPR复合物包含与可杂交至所述第二靶序列的所述第二指导序列复合的Cas13酶,并且
并且其中所述第一指导序列引导邻近所述第一靶序列的DNA双链体的一条链的切割,并且所述第二指导序列引导邻近所述第二靶序列的另一条链的切割,从而诱导双链断裂,由此修饰所述生物体或所述非人类或非动物生物体。类似地,可以设想包含多于两种指导RNA的组合物,例如这些指导RNA各自对一种靶标具有特异性,并且被串联地排列在如本文所述的组合物或CRISPR系统或复合物中。
在另一个实施方案中,所述Cas13作为蛋白质递送到所述细胞中。在另一个且特别优选的实施方案中,所述Cas13作为蛋白质或作为编码它的核苷酸序列递送到所述细胞中。作为蛋白质递送至细胞可以包括核糖核蛋白(RNP)复合物的递送,在所述复合物中所述蛋白质与所述多种指导物复合。
在一方面,提供了通过本发明的组合物、系统或修饰的酶修饰的或包含本发明的组合物、系统或修饰的酶的宿主细胞和细胞系,包括干细胞及其子代。
在一方面,提供了细胞治疗方法,在这些方法中,例如对单个细胞或细胞群进行取样或培养,其中对所述细胞或细胞群如本文所述地进行离体修饰或已经如本文所述地进行离体修饰,然后将其重新引入(取样的细胞)或引入(培养的细胞)生物体内。就这一点而言,干细胞(无论是胚胎干细胞还是诱导型多能或全能干细胞)也是特别优选的。但是,当然还设想了体内实施方案。
本发明方法还可以包括递送模板,诸如修复模板,它们可以是dsODN或ssODN,参见下文。模板的递送可以经由与任何或所有CRISPR酶或指导RNA的递送同时的或分开的递送并且经由相同或不同的递送机制。在一些实施方案中,优选的是一起递送所述模板与所述指导RNA,并且优选地还有所述CRISPR酶。实例可以是AAV载体,其中CRISPR酶是AsCas或LbCas。
本发明方法还可以包括:(a)向所述细胞递送双链寡脱氧核苷酸(dsODN),所述双链寡脱氧核苷酸包含与通过所述双链断裂产生的突出端互补的突出端,其中所述dsODN被整合到所述目标基因座中;或-(b)向所述细胞递送单链寡脱氧核苷酸(ssODN),其中所述ssODN充当所述双链断裂的同源定向修复的模板。本发明的方法可以用于预防或治疗个体的疾病,任选地其中所述疾病是由所述目标基因座中的缺陷引起。本发明的方法可以是在所述个体的体内进行或针对取自所述个体的细胞离体地进行,任选地其中将所述细胞返回至所述个体。
本发明还涵盖通过使用如本文所定义的用于在串联或多靶向中使用的CRISPR酶或Cas酶或Cas13酶或CRISPR-CRISPR酶或CRISPR-Cas系统或CRISPR-Cas13系统获得的产物。
根据本发明的Cas13 CRISPR-Cas系统的受护航的指导物
在一方面,本发明提供了受护航的Cas13 CRISPR-Cas系统或复合物,尤其是涉及受护航的Cas13 CRISPR-Cas系统指导物的这样一种系统。所谓“受护航的”是指将Cas13CRISPR-Cas系统或复合物或指导物递送至细胞内的选定时间或位置,从而在空间或时间上控制Cas13 CRISPR-Cas系统或复合物或指导物的活性。例如,可以通过对适体配体(诸如细胞表面蛋白或其他局部细胞组分)具有结合亲和力的护航性RNA适体序列控制Cas13CRISPR-Cas系统或复合物或指导物的活性和目的地。或者,护航性适体可以例如对细胞上或细胞中的适体效应子作出反应,所述适体效应子诸如有瞬时效应子,诸如在特定时间施加至细胞的外部能源。
受护航的Cas13 CRISPR-Cas系统或复合物具有gRNA,其具有被设计来改善gRNA的结构、架构、稳定性、基因表达或它们的任何组合的功能结构。这样的结构可包括适体。
适体是可以例如使用一种称为指数富集的配体系统进化(SELEX;Tuerk C,GoldL:"Systematic evolution of ligands by exponential enrichment:RNA ligands tobacteriophage T4 DNA polymerase."Science 1990,249:505-510)的技术进行设计或选择以与其他配体紧密结合的生物分子。核酸适体可以例如选自随机序列寡核苷库,它们对大范围的生物医学相关靶具有高结合亲和力和特异性,这揭示了适体的广泛治疗实用性(Keefe、Anthony D.、Supriya Pai和Andrew Ellington."Aptamers as therapeutics."Nature Reviews Drug Discovery 9.7(2010):537-550)。这些特征还揭示了适体作为药物递送媒介物的广泛用途(Levy-Nissenbaum,Etgar等人"Nanotechnology and aptamers:applications in drug delivery."Trends in biotechnology 26.8(2008):442-449;和Hicke BJ,Stephens AW.“Escort aptamers:a delivery service for diagnosis andtherapy.”J Clin Invest 2000,106:923-928.)。还可以构建充当分子开关、通过改变特性来响应问询(que)的适体,诸如结合荧光团以模拟绿色荧光蛋白活性的RNA适体(Paige、Jeremy S.、Karen Y.Wu和Samie R.Jaffrey."RNA mimics of green fluorescentprotein."Science 333.6042(2011):642-646)。先前还已提出适体可以用作靶向的siRNA治疗性递送系统的组分,例如靶向细胞表面蛋白(Zhou,Jiehua和John J.Rossi."Aptamer-targeted cell-specific RNA interference."Silence 1.1(2010):4)。
因此,本文提供了例如通过一种或多种适体修饰的gRNA,所述一种或多种适体被设计来改善gRNA的递送,包括递送穿过细胞膜、到达细胞内隔室或进入细胞核。加上所述一种或多种适体或无所述一种或多种适体,这样的结构可包括一个或多个部分,以便使指导物可递送、可诱导或响应于选定的效应子。因此,本发明包括响应于正常或病理生理条件的gRNA,所述生理条件包括但不限于pH、低氧、O2浓度、温度、蛋白质浓度、酶浓度、脂质结构、曝光、机械破坏(例如超声波)、磁场、电场或电磁辐射。
本发明的一方面提供了非天然存在的或工程化的组合物,所述组合物包含受护航的指导RNA(egRNA),所述受护航的指导RNA包含:
RNA指导序列,所述RNA指导序列能够杂交至细胞中的目标基因组基因座中的靶序列;以及,
护航性RNA适体序列,其中所述护航性适体对所述细胞上或所述细胞中的适体配体具有结合亲和力,或者所述护航性适体响应于所述细胞上或所述细胞中的局部化适体效应子,其中所述适体配体或效应子在所述细胞上或所述细胞中的存在在空间上或在时间上是受限的。
所述护航性适体可以例如响应于与所述细胞中的适体配体或效应子的相互作用而改变构象。
所述护航性适体可以对所述适体配体具有特异性结合亲和力。
所述适体配体可以位于所述细胞中的位置或区室,例如在所述细胞的细胞膜上或细胞膜中。所述护航性适体与所述适体配体的结合可以因此将所述egRNA引导至所述细胞中的目标位置,如通过结合至作为细胞表面配体的适体配体的方式而至所述细胞的内部。以此方式,可以靶向所述细胞内的多个空间上受限的位置,诸如细胞核或线粒体。
一旦已经引入预期的改变,如通过在细胞基因组中编辑预期的基因拷贝,便不再需要在所述细胞中继续CRISPR/Cas13表达。实际上,持续表达在非预期基因组位点处存在脱靶效应的某些酪蛋白情况下等是不希望的。因此,限时表达是有用的。诱导型表达提供了一种方法,但是此外申请人已经工程化自我失活性Cas13 CRISPR-Cas系统,所述系统依赖于在所述CRISPR载体本身内使用非编码指导靶序列。因此,表达开始后,所述CRISPR系统将导致其自身的破坏,但是在破坏完成之前,它将有时间编辑靶基因的基因组拷贝(在二倍体细胞中具有正常点突变的情况下,需要至多两个编辑)。简单地,所述自我失活性Cas13CRISPR-Cas系统包括另外的RNA(即,指导RNA),其靶向CRISPR酶自身的编码序列或靶向与存在于下列一项或多项中的独特序列互补的非编码指导靶序列:(a)在驱动非编码RNA元件的表达的启动子内,(b)在驱动Cas13基因的表达的启动子内,(c)在Cas13编码序列中的100bp的ATG翻译起始密码子内,(d)在病毒递送载体的反向末端重复序列(iTR)内(例如,在AAV基因组中)。
所述egRNA可以包括RNA适体连接序列,其将护航性RNA序列可操作地连接至RNA指导序列。
在实施方案中,所述egRNA可以包括一个或多个光不稳定的键或非天然存在的残基。
在一方面,所述护航性RNA适体序列可以与靶miRNA互补,所述靶miRNA可以或可以不存在于细胞内,使得仅当存在所述靶miRNA时,才存在所述护航性RNA适体序列与所述靶miRNA的结合,这使得所述egRNA被所述细胞内的RNA诱导沉默复合物(RISC)切割。
在实施方案中,所述护航性RNA适体序列的长度可以例如为10至200个核苷酸,并且所述egRNA可以包括不止一个护航性RNA适体序列。
应当理解,如本文别处所述的任何RNA指导序列都可以用在本文所述的egRNA中。在本发明的某些实施方案中,所述指导RNA或成熟crRNA包含正向重复序列和指导序列或间隔区序列、基本上由其组成、或由其组成。在某些实施方案中,所述指导RNA或成熟crRNA包含连接至指导序列或间隔区序列的正向重复序列、基本上由其组成、或由其组成。在某些实施方案中,所述指导RNA或成熟crRNA包含19nt的部分正向重复序列,之后是23-25nt的指导序列或间隔区序列。在某些实施方案中,所述效应蛋白是FnCas13效应蛋白并且需要至少16nt的指导序列来实现可检测的DNA切割以及最少17nt的指导序列来实现有效的体外DNA切割。在某些实施方案中,正向重复序列位于指导序列或间隔区序列上游(即,5')。在一个优选的实施方案中,所述FnCas13指导RNA的种子序列(即,对于识别和/或杂交至靶基因座处的序列而言必需、关键的序列)大约在所述指导序列或间隔区序列的5’端上的前5nt内。
所述egRNA可以与Cas13—起被包括在非天然存在的或工程化的Cas13 CRISPR-Cas复合物组合物中,所述Cas13可以包括至少一个突变,例如以下突变:使得所述Cas13具有不超过5%的没有所述至少一个突变的Cas13的核酸酶活性,例如与没有所述至少一个突变的Cas13相比,具有减弱至少97%、或100%的核酸酶活性。所述Cas13还可以包括一个或多个核定位序列。在本文别处描述了具有调节的活性(诸如减弱的核酸酶活性)的突变Cas13酶。
所述工程化的Cas13 CRISPR-Cas组合物可以被提供在细胞(诸如真核细胞、哺乳动物细胞或人类细胞)中。
在实施方案中,本文所述的组合物包含Cas13 CRISPR-Cas复合物,所述复合物具有至少三个功能结构域,其中至少一个功能结构域与Cas13相缔合并且其中至少两个功能结构域与gRNA相缔合。
本文所述的组合物可以用于将基因组基因座事件引入宿主细胞(诸如真核细胞,特别是哺乳动物细胞)中、或非人类真核生物(特别是非人类哺乳动物,如小鼠)体内。基因组基因座事件可以包括影响基因座中的基因激活、基因抑制或切割。本文所述的组合物还可以用于修饰目标基因组基因座,以改变细胞中的基因表达。在本文别处详细描述了使用本文所提供的Cas13酶在宿主细胞中引入基因组基因座事件的方法。所述组合物的递送可以例如通过以下方式:递送编码所述组合物的一种或多种核酸分子,所述一种或多种核酸分子操作性地连接至一个或多个调控序列,并且体内地表达所述一种或多种核酸分子,例如通过慢病毒、腺病毒,或AAV的方式。
本发明提供了通过其可以调整gRNA介导的基因编辑活性的组合物和方法。本发明提供了gRNA二级结构,这些二级结构通过增加gRNA和/或增加递送至所述细胞中的RNA的量而提高切割效率。所述gRNA可以包括光不稳定型或诱导型核苷酸。
为了增加gRNA(例如通过病毒或非病毒技术递送的gRNA)的有效性,申请人将二级结构添加到所述gRNA中,这些二级结构增强其稳定性并且改进基因编辑。分开地,为了克服有效递送的缺乏,申请人用细胞渗透RNA适体修饰了gRNA;这些适体结合至细胞表面受体并且促进gRNA进入细胞中。值得注意的是,可以将这些细胞渗透适体设计成靶向特定细胞受体,以便介导细胞特异性递送。申请人还已经创造了可诱导的指导物。
诱导型系统的光响应性可以经由隐花色素-2和CIB1的激活和结合来实现。蓝光刺激诱导隐花色素-2中的激活的构象变化,导致其结合配偶体CIB1募集。这种结合是快速且可逆的,在脉冲刺激后的<15秒内达到饱和,并在刺激结束后的<15分钟内恢复至基线。这些快速的结合动力学使得系统暂时仅受转录/翻译和转录物/蛋白质降解的速度限制,而不受诱导剂的吸收和清除的限制。隐花色素-2的激活还是高度敏感的,使得可以使用低光强度刺激并减轻了光毒性的风险。此外,在诸如完整的哺乳动物脑的情形下,可变的光强度可用于控制受激区域的大小,从而获得比单独的载体递送所能提供的精度更高的精度。
本发明考虑了诸如电磁辐射、声能或热能的能源来诱导指导物。有利地,电磁辐射是可见光的组分。在优选的实施方案中,光是波长为约450至约495nm的蓝光。在特别优选的实施方案中,波长为约488nm。在另一个优选的实施方案中,光刺激是经由脉冲实现的。光功率可以在大约0-9mW/cm2的范围内。在优选的实施方案中,每15秒低至0.25秒的刺激范式应该会导致最大的激活。
本发明的实践中所涉及的细胞可以是原核细胞或真核细胞,有利地是动物细胞、植物细胞或酵母细胞,更有利地是哺乳动物细胞。
化学或能量敏感型指导物在由于化学源的结合或能量而被诱导时可能会发生构象变化,使其成为指导物并具有Cas13 CRISPR-Cas系统或复合物功能。本发明可涉及施加化学源或能量以具有指导物功能和Cas13 CRISPR-Cas系统或复合物功能;并且任选地进一步确定基因组基因座的表达已改变。
此化学诱导型系统有几种不同的设计:1.由脱落酸(ABA)可诱导的基于ABI-PYL的系统(参见例如http://stke.sciencemag.org/cgi/content/abstract/sigtrans;4/164/rs2);2.由雷帕霉素可诱导的基于FKBP-FRB系统(参见例如http://www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html);3.由赤霉素(GA)可诱导的基于GID1-GAI的系统(参见例如http://www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.html)。
由本发明所考虑的另一种系统是基于亚细胞定位变化的化学诱导型系统。申请人还开发了这样一种系统,在所述系统中多肽包括DNA结合结构域,所述结构域包括至少五个或更多个转录激活因子样效应子(TALE)单体,并且至少一半或多于一半的被特异性地要求对连接至至少一个或多个效应子结构域的目标基因组基因座进行靶向的单体被进一步连接至化学或能量敏感型蛋白。当化学或能量传递物与所述化学或能量敏感型蛋白结合时,这种蛋白将导致整个多肽的亚细胞定位变化(即将整个多肽从细胞质运输到细胞的细胞核中)。整个多肽从一个亚细胞区室或细胞器(在其中由于缺乏效应子结构域的底物,其活性被封存)向另一个亚细胞区室或细胞器(在其中存在所述底物)的这种运输将允许整个多肽与其所需的底物(即哺乳动物细胞核中的基因组DNA)相接触并且导致靶基因表达的激活或阻抑。
当所述效应子结构域是核酸酶时,这种类型的系统还可以用于诱导细胞中的目标基因组基因座的切割。
化学诱导型系统可以是由4-羟基他莫昔芬(4OHT)可诱导的基于雌激素受体(ER)的系统(参见例如http://www.pnas.org/content/104/3/1027.abstract)。雌激素受体的一种称为ERT2的突变配体结合结构域在与4-羟基他莫昔芬结合后易位到细胞的细胞核中。在本发明的另外的实施方案中,任何核受体、甲状腺激素受体、视黄酸受体、雌激素受体、雌激素相关受体、糖皮质激素受体、孕激素受体、雄激素受体的任何天然存在或工程化的衍生物都可以用于与基于ER的诱导型系统类似的诱导型系统。
另一种诱导型系统是基于使用由能量、热或无线电波可诱导的基于瞬时受体电位(TRP)离子通道的系统进行的设计(参见例如http://www.sciencemag.org/content/336/6081/604)。这些TRP家族蛋白响应于不同的刺激,包括光和热。当这种蛋白质被光或热激活时,离子通道将打开并允许诸如钙的离子进入质膜。这种离子涌流将与连接至多肽(包括指导物和Cas13 CRISPR-Cas复合物或系统的其他组分)的细胞内离子相互作用配偶体结合,并且所述结合将诱导所述多肽的亚细胞定位的变化,从而使得整个多肽进入细胞的细胞核。一旦进入细胞核,所述指导蛋白和Cas13 CRISPR-Cas复合物的其他组分就将呈活性状态并调节细胞中的靶基因表达。
这种类型的系统还可以用于诱导细胞中的目标基因组基因座的切割;并且就这一点而言,应指出的是所述Cas13酶是核酸酶。光可以通过激光或其他形式的能源产生。热可以通过提高温度来产生,温度的提高是由能源造成的、或由在从以无线电波形式递送的能源吸收能量之后释放热的纳米粒子造成的。
尽管光激活可以是有利的实施方案,但是有时对于光可能不穿透皮肤或其他器官的体内应用而言可能是尤为不利的。在这种情况下,可以考虑其他具有类似效果的能量激活方法,特别是电场能和/或超声。
优选地在体内条件下,使用约1V/cm至约10k V/cm的一个或多个电脉冲,基本上如本领域中所述施加电场能。代替脉冲或加上脉冲,可以采用连续方式递送电场。可以施加电脉冲,持续1微秒与500毫秒之间,优选地1微秒与100毫秒之间。可以连续地或以脉冲方式施加电场,持续约5分钟。
如本文所用,“电场能”是细胞暴露于其中的电能。在体内条件下,电场的强度优选为约1V/cm至约10kV/cm或更大(参见WO97/49450)。
如本文所用,术语“电场”包括在可变电容和电压下的一个或多个脉冲,并且包括指数波和/或方形波和/或调制波和/或调制方形波形式。对电场和电的提及应视为包括对细胞环境中电位差的存在的提及。如本领域中已知的,可以通过静电、交流电(AC)、直流电(DC)等来建立这样的环境。电场可以是均匀的、不均匀的或其他方式的,并且可以以时间依赖性方式改变强度和/或方向。
电场的单次或多次施加,以及超声的单次或多次施加也是可能的,可以是任何顺序和任何组合。超声和/或电场可以作为单次或多次连续施加或作为脉冲来递送(脉冲式递送)。
电穿孔已用于体外和体内程序中,以将异物引入活细胞中。在体外应用中,首先将活细胞样品与目标剂混合,接着将它们放置在电极(诸如平行板)之间。接着,电极向细胞/植入物混合物施加电场。执行体外电穿孔的系统的实例包括Electro Cell ManipulatorECM600产品和Electro Square Porator T820,这两者均由Genetronics,Inc的BTX分部制造(参见美国专利号5,869,326)。
已知的电穿孔技术(体外和体内)都通过向位于治疗区域周围的电极施加短暂的高压脉冲来发挥作用。电极之间产生的电场使细胞膜暂时变为多孔的,此时目标剂进入细胞。在已知的电穿孔应用中,此电场包括持续约100微秒的大约1000V/cm的单个方形波脉冲。这样的脉冲可以例如在Electro Square Porator T820的已知应用中产生。
在体外条件下,电场的强度优选为约1V/cm至约10kV/cm。因此,电场的强度可以为1V/cm、2V/cm、3V/cm、4V/cm、5V/cm、6V/cm、7V/cm、8V/cm、9V/cm、10V/cm、20V/cm、50V/cm、100V/cm、200V/cm、300V/cm、400V/cm、500V/cm、600V/cm、700V/cm、800V/cm、900V/cm、1kV/cm、2kV/cm、5kV/cm、10kV/cm、20kV/cm、50kV/cm或更大。在体外条件下,更优选为约0.5kV/cm至约4.0kV/cm。在体内条件下,电场的强度优选为约1V/cm至约10kV/cm。然而,当递送至靶位点的脉冲数量增加时,电场强度可能降低。因此,设想以较低的场强脉冲式递送电场。
优选地,采用多个脉冲的形式,诸如具有相同强度和电容的双脉冲或具有变化强度和/或电容的顺序脉冲来施加电场。如本文所用,术语“脉冲”包括在可变电容和电压下的一个或多个电脉冲,并且包括指数波和/或方形波和/或调制波/方形波形式。
优选地,将电脉冲作为选自指数波形式、方形波形式、调制波形式和调制方形波形式的波形递送。
优选的实施方案采用低压直流电。因此,申请人公开了以1V/cm与20V/cm之间的场强向细胞、组织或组织块施加电场,持续时间为100毫秒或更长,优选为15分钟或更长。
有利地,以约0.05W/cm2至约100W/cm2的功率水平施用超声。可以使用诊断性超声或治疗性超声,或它们的组合。
如本文所用,术语“超声”是指一种由机械振动组成的能量形式,所述机械振动的频率特别高以至于超出人类的听觉范围。超声频谱的频率下限通常可以取为约20kHz。大多数诊断性超声应用采用1至15MHz’的频率(Ultrasonics in Clinical Diagnosis,P.N.T.Wells,编辑,第2版,出版社Churchill Livingstone[Edinburgh,London&NY,1977])。
在诊断性和治疗性应用中皆已使用超声。当用作诊断性工具(诊断性超声)时,通常在高达约100mW/cm2的能量密度下使用超声(FDA推荐),但也使用过高达750mW/cm2的能量密度。在物理疗法中,通常使用高达约3至4W/cm2范围内的超声作为能源(WHO推荐)。在其他治疗性应用中,可以在短时间内采用更高强度的超声,例如100W/cm至1kW/cm2(或甚至更高)的HIFU。在本说明书中使用的术语“超声”旨在涵盖诊断性超声、治疗性超声和聚焦超声。
聚焦超声(FUS)允许在不使用侵入式探头的情况下递送热能(参见Morocz等人1998,Journal of Magnetic Resonance Imaging,第8卷,第1期,第136-142页。聚焦超声的另一种形式是高强度聚焦超声(HIFU),Moussatov等人,Ultrasonics(1998),第36卷,第8期,第893-900页以及TranHuuHue等人,Acustica(1997),第83卷,第6期,第1103-1106页中对此进行了综述。
优选地,采用诊断性超声和治疗性超声的组合。但是,该组合并非旨在进行限制,而是本领域技术人员将理解可以使用超声的任何多种组合。另外,能量密度、超声频率和暴露时间是可以改变的。
优选地,超声能源暴露的功率密度为约0.05至约100Wcm-2。甚至更优选地,超声能源暴露的功率密度为约1至约15Wcm-2。
优选地,超声能源暴露的频率为约0.015至约10.0MHz。更优选地,超声能源暴露的频率为约0.02至约5.0MHz或约6.0MHz。最优选地,以3MHz的频率施加超声。
优选地,暴露持续约10毫秒至约60分钟的时段。优选地,暴露持续约1秒至约5分钟的时段。更优选地,施加超声持续约2分钟。然而,取决于有待破坏的特定靶细胞,暴露可以持续更长的持续时间,例如持续15分钟。
有利地,将靶组织暴露于超声能源,超声能源的声功率密度为约0.05Wcm-2至约10Wcm-2,频率在约0.015至约10MHz的范围内(参见WO 98/52609)。但是替代方案也是可能的,例如超声能源暴露的声功率密度高于100Wcm-2,但持续缩短的时间段,例如1000Wcm-2持续毫秒范围或更小的时段。
优选地,超声施加呈多个脉冲的形式;因此,可以采用任何组合的连续波和脉冲波(脉冲式超声递送)。例如,可以施加连续波超声,之后施加脉冲波超声,反之亦然。可以采用任何顺序和组合将其重复任意次数。可以在连续波超声的背景下施加脉冲波超声,并且可以使用任何组数的任何数量的脉冲。
优选地,超声可包括脉冲波超声。在高度优选的实施方案中,以0.7Wcm-2或1.25Wcm-2的功率密度以连续波形式施加超声。如果使用了脉冲超声波,则可以采用更高的功率密度。
超声的使用是有利的,因为像光一样,超声可以精确地聚焦在靶标上。此外,超声是有利的,因为与光不同,超声可以更深地聚焦到组织中。因此,它更适于完整组织穿透(诸如但不限于肝叶)或完整器官(诸如但不限于整个肝脏或整个肌肉,诸如心脏)疗法。另一个重要的优点是超声是非侵入式刺激,可用于多种多样的诊断性和治疗性应用。举例来说,超声在医学成像技术以及骨科疗法中是众所周知的。此外,适于向受试者脊椎动物施加超声的仪器是广泛可得的,并且它们使用在本领域中是众所周知的。
本发明的快速转录反应和内源性靶向促成了用于研究转录动力学的理想系统。例如,本发明可以用于研究在靶基因的诱导表达时变体产生的动力学。在转录循环的另一端,mRNA降解研究通常响应于强细胞外刺激来进行,强细胞外刺激导致种类繁多的基因的表达水平发生变化。本发明可以用于可逆地诱导内源性靶标的转录,在此之后可以停止刺激,并且可以追踪独特靶标的降解动力学。
本发明的时间精度可以为时间基因调控提供与实验干预一致的动力。例如,在长时程增强(LTP)中具有可疑牵涉的靶标可以在器官型或解剖的神经元培养物中调节,但仅在刺激期间调节以诱导LTP,以便避免干扰这些细胞的正常发育。类似地,在展现出疾病表型的细胞模型中,怀疑牵涉在特定疗法的有效性中的靶标可以仅在治疗期间调节。相反,遗传靶标可以仅在病理刺激期间调节。其中遗传线索对外部实验刺激的定时具有相关性的任何数目的实验都可以潜在地从本发明的实用性中受益。
体内背景为本发明控制基因表达提供了同样丰富的机会。光诱导性提供了空间精度的潜力。利用光极技术的发展,可以将刺激光纤导线置于精确的脑区中。然后可以通过光强度调谐刺激区域尺寸。这可以与本发明的Cas13 CRISPR-Cas系统或复合物的递送结合完成,或者在转基因Cas13动物的情况下,可以递送本发明的指导RNA,并且光极技术可以允许调节精确脑区中的基因表达。可以向透明的表达Cas13的生物体施用本发明的指导RNA,并且然后可以存在极其精确的激光诱导的局部基因表达变化。
用于培养宿主细胞的培养基包括通常用于组织培养的培养基,诸如M199-earlebase、Eagle MEM(E-MEM)、Dulbecco MEM(DMEM)、SC-UCM102、UP-SFM(GIBCO BRL)、EX-CELL302(Nichirei)、EX-CELL293-S(Nichirei)、TFBM-01(Nichirei)、ASF104等。用于特定细胞类型的合适的培养基可以发现于美国典型培养物保藏中心(ATCC)或欧洲细胞培养物保藏中心(ECACC)。培养基可以补充有氨基酸(诸如L-谷氨酰胺)、盐、抗真菌剂或抗细菌剂(诸如Fungizone)、青霉素-链霉素、动物血清等。细胞培养基可以任选地是无血清的。
本发明还可以提供在体内有价值的时间精度。本发明可以用于在特定发育阶段期间改变基因表达。本发明可以用于将遗传线索定时至特定实验窗。例如,牵连在学习中的基因可以仅在完整的啮齿动物或灵长类动物脑的精确区域中在学习刺激期间过表达或阻抑。另外,本发明可以用于仅在疾病发展的特定阶段期间诱导基因表达变化。例如,癌基因可以仅在肿瘤达到特定尺寸或转移阶段后才过表达。相反,在阿尔茨海默病发展中可疑的蛋白质可以仅在动物生命的限定时间点且在特定脑区内敲低。尽管这些实例并未穷尽性地列出本发明的潜在应用,但是它们突出显示了本发明在其中可以是有力技术的一些领域。
受保护的指导物:本发明的酶可与受保护的指导RNA结合使用
在一方面,本发明的一个目的在于通过热力学调谐指导RNA与靶DNA的结合特异性来进一步增强Cas13给定的单独指导RNA的特异性。这是引入指导序列的错配、伸长或截短的通用方法,以增加/减少在基因组靶标与其潜在脱靶基因座之间共享的互补碱基与错配碱基的数目,以便向靶向的基因组基因座给出优于基因组脱靶的热力学优势。
在一方面,本发明提供了通过二级结构进行修饰的指导序列,以增加所述Cas13CRISPR-Cas系统的特异性,并且由此所述二级结构可以保护免受外切核酸酶活性影响并且允许将3’添加至所述指导序列。
在一方面,本发明提供了使“保护性RNA”杂交至指导序列,其中所述“保护性RNA”是与所述指导RNA(gRNA)的5’端互补的RNA链,以由此产生部分双链的gRNA。在本发明的一个实施方案中,用完全互补的保护性序列保护错配碱基降低了靶DNA结合至3’端处的错配碱基对的可能性。在本发明的实施方案中,还可以存在包含延伸长度的另外的序列。
与基因组靶标匹配的指导RNA(gRNA)延伸提供gRNA保护并且增强特异性。设想了用在间隔区种子端的远端的针对单独基因组靶标的匹配序列延伸gRNA,以提供增强的特异性。已经在没有截短的情况下在细胞中观察到增强特异性的匹配gRNA延伸。伴随这些稳定的长度延伸的gRNA结构的预测已经显示,稳定形式产生自保护状态,在这些保护状态中由于间隔区延伸部和间隔区种子中的互补序列,延伸部与gRNA种子形成闭环。这些结果证实,受保护的指导物概念还包括与20mer间隔区结合区远端的基因组靶序列匹配的序列。可以使用热力学预测来预测产生受保护的gRNA状态的完全匹配或部分匹配指导物延伸。这将受保护的gRNA的概念扩展至X与Z之间的相互作用,其中X的长度通常是17-20nt并且Z的长度是1-30nt。可以使用热力学预测来确定Z的最佳延伸状态,从而潜在地在Z中引入小数目的错配,以促进在X与Z之间形成受保护的构象。在本申请通篇,术语“X”和种子长度(SL)与术语外露长度(EpL)(其表示可为靶DNA结合所用的核苷酸的数目)可互换使用;术语“Y”和保护长度(PL)可互换使用,代表保护子的长度;并且术语“Z”、“E”、“E’”和“EL”可互换使用,对应于术语延伸长度(ExL),该术语代表靶序列延伸所靠的核苷酸的数目。
对应于延伸长度(ExL)的延伸序列可以任选地被直接附接至受保护的指导序列的3’端处的指导序列。所述延伸序列的长度可以是2至12个核苷酸。优选地,ExL在长度上可以被表示为0、2、4、6、8、10或12个核苷酸。在一个优选的实施方案中,ExL在长度上被表示为0或4个核苷酸。在一个更优选的实施方案中,ExL在长度上为4个核苷酸。所述延伸序列可以或可以不与靶序列互补。
延伸序列可以进一步任选地被直接附接至受保护的指导序列的5’端处的指导序列并且附接至保护性序列的3’端。因此,所述延伸序列充当受保护的序列与保护性序列之间的连接序列。不希望受理论的束缚,这样一种连接可以将保护性序列定位在受保护的序列附近,用于改进保护性序列与受保护的序列的结合。应当理解,种子、保护子和延伸部的上述关系适用于指导物的远端(即,靶向端)是5’端(例如,起作用的指导物是Cas13系统)的情况。在指导物的远端是3’端的实施方案中,该关系将是相反的。在这样一个实施方案中,本发明提供了使“保护性RNA”杂交至指导序列,其中所述“保护性RNA”是与所述指导RNA(gRNA)的3’端互补的RNA链,以由此产生部分双链的gRNA。
向gRNA的远端添加gRNA错配可以展示增强的特异性。在Y中引入未受保护的远端错配或用远侧错配(Z)延伸gRNA可以展示增强的特异性。所提及的这个概念限于受保护的gRNA中所用的X、Y、和Z组分。未受保护的错配概念可以被进一步推广至针对受保护的指导RNA描述的X、Y、和Z的概念。
Cas13.在一方面,本发明提供了增强的Cas13特异性,其中受保护的指导RNA(pgRNA)的双链3’端允许两种可能的结果:⑴将发生指导RNA-保护性RNA至指导RNA-靶DNA的链交换并且所述指导物将完全结合所述靶标,或(2)所述指导RNA将不能完全结合所述靶标并且因为Cas13靶标切割是需要指导RNA:靶DNA结合以激活Cas13催化的DSB的多步骤动力学反应,其中如果所述指导RNA不适当地结合,则不会发生Cas13切割。根据特定实施方案,与天然存在的CRISPR-Cas系统相比,受保护的指导RNA改进靶标结合特异性。根据特定实施方案,与天然存在的CRISPR-Cas相比,受保护的经修饰的指导RNA改进稳定性。根据特定实施方案,所述保护性序列具有3与120个核苷酸之间的长度并且包括3个或更多个与指导物或保护子的另一序列互补的连续核苷酸。根据特定实施方案,所述保护性序列形成发夹。根据特定实施方案,所述指导RNA还包括受保护的序列和外露序列。根据特定实施方案,所述外露序列是1至19个核苷酸。更特别地,所述外露序列至少75%、至少90%或约100%与所述靶序列互补。根据特定实施方案,所述指导序列至少90%或约100%与所述保护性链互补。根据特定实施方案,所述指导序列至少75%、至少90%或约100%与所述靶序列互补。根据特定实施方案,所述指导RNA还包括延伸序列。更特别地,当所述指导物的远端是3’端时,所述延伸序列可操作地连接至受保护的指导序列的3’端,并且任选地直接连接至受保护的指导序列的3’端。根据特定实施方案,所述延伸序列是1-12个核苷酸。根据特定实施方案,所述延伸序列可操作地连接至受保护的指导序列的3’端处的指导序列和保护性链的5’端,并且任选地直接连接至受保护的指导序列的3’端和保护性链的53’端,其中所述延伸序列是受保护的序列与保护性链之间的连接序列。根据特定实施方案,所述延伸序列100%不与保护性链互补,任选地至少95%、至少90%、至少80%、至少70%、至少60%或至少50%不与保护性链互补。根据特定实施方案,所述指导序列还包括附于指导序列端的错配,其中这些错配在热力学上优化特异性。
根据本发明,在某些实施方案中,将需要阻止链侵入的指导物修饰。例如,为了使脱靶活性最小化,在某些实施方案中,期望设计或修改指导物以阻止脱靶位点处的链侵入。在某些此类实施方案中,以中靶结合效率为代价来设计或修饰指导物可能是可接受的或有用的。在某些实施方案中,可以容忍靶位点处的指导物-靶标错配,这些错配大幅降低了脱靶活性。
在本发明的某些实施方案中,期望调整受保护的指导物的结合特征以使脱靶CRISPR活性最小化。因此,使用热力学预测算法来预测中靶和脱靶结合强度。可替代地或另外地,使用选择方法以绝对量度或相对于中靶效应减少或最小化脱靶效应。
设计选项包括但不限于:i)调整结合至受保护的链的保护性链的长度;ii)调整受保护的链的外露部分的长度;iii)用位于受保护的链的外部(远端)的茎环延伸受保护的链(即,设计成使得茎环在受保护链的远端的外部);iv)通过添加保护性链来延伸受保护的链,从而形成带有全部或部分受保护的链的茎环;v)通过设计一个或多个碱基错配和/或一个或多个非经典碱基配对来调整保护性链与受保护的链的结合;vi)调整由保护性链与受保护的链杂交而形成的茎的位置;以及vii)向受保护的链的末端添加非结构化保护子。
在一方面,本发明提供了一种工程化的非天然存在的CRISPR-Cas系统,所述系统包含Cas13蛋白和靶向在细胞中编码基因产物的DNA分子的受保护的指导RNA,由此所述受保护的指导RNA靶向编码所述基因产物的DNA分子,并且所述Cas13蛋白切割编码所述基因产物的DNA分子,由此改变所述基因产物的表达;并且其中所述Cas13蛋白和所述受保护的指导RNA并不天然地一起存在。本发明涵盖包含融合3’至正向重复序列的指导序列的受保护的指导RNA。本发明还涵盖经密码子优化以便在真核细胞中表达的Cas13 CRISPR蛋白。在一个优选的实施方案中,所述真核细胞是哺乳动物细胞、植物细胞或酵母细胞,并且在一个更优选的实施方案中,所述哺乳动物细胞是人类细胞。在本发明的另一个实施方案中,基因产物的表达被降低。在一些实施方案中,所述CRISPR蛋白是Cas13。在一些实施方案中,所述CRISPR蛋白是Cas12a。在一些实施方案中,所述Cas13或Cas12a酶蛋白是氨基酸球菌属BV3L6、毛螺科菌或新凶手弗朗西丝菌Cas13或Cas12a,并且可以包括来源于这些生物体的突变的Cas13或Cas12a。所述酶蛋白可以是另外的Cas13或Cas12a同源物或直系同源物。在一些实施方案中,编码Cfp1 Csa13或Cas12a酶蛋白的核苷酸序列经密码子优化以便在真核细胞中表达。在一些实施方案中,所述Cas13或Cas12a酶蛋白引导在所述靶序列位置处的一条或两条链的切割。在一些实施方案中,所述第一调控元件是聚合酶III启动子。在一些实施方案中,所述第二调控元件是聚合酶II启动子。一般来讲,并且贯穿本说明书,术语“载体”是指能够转运它所连接的另一个核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个游离端、不包含游离端(例如环状)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域中已知的多核苷酸的其他种类。一种类型的载体是“质粒”,其是指环状双链DNA环,可以诸如通过标准分子克隆技术向该环中插入另外的DNA区段。另一种类型的载体是病毒载体,其中病毒来源的DNA或RNA序列存在于包装到病毒(例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)中的载体中。病毒载体还包括由转染到宿主细胞中的病毒携带的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如非附加型哺乳动物载体)在引入到宿主细胞中之后被整合到宿主细胞的基因组中,并且因此随着宿主基因组一起复制。此外,某些载体能够引导它们可操作地连接的基因的表达。此类载体在本文中称为“表达载体”。在重组DNA技术中有效用的常用表达载体常常呈质粒的形式。
重组表达载体可以包含处于适于在宿主细胞中表达核酸的形式的本发明的核酸,这意味着重组表达载体包含一个或多个调控元件,这些调控元件可以基于用于表达的宿主细胞来选择,可操作地连接至有待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在意指目标核苷酸序列以允许核苷酸序列表达(例如,在体外转录/翻译系统中或当该载体被引入到宿主细胞时在宿主细胞中)的方式连接至一个或多个调控元件。
有利的载体包括慢病毒和腺伴随病毒并且此类载体类型还可以被选择用于靶向特定细胞类型。
在一方面,本发明提供了一种真核宿主细胞,所述真核宿主细胞包含(a)第一调控元件,所述第一调控元件可操作地连接至正向重复序列和一个或多个插入位点,所述一个或多个插入位点用于在所述正向重复序列的下游插入一个或多个指导序列,其中当表达时,所述指导序列引导CRISPR复合物与真核细胞中的靶序列的序列特异性结合,其中所述CRISPR复合物包含与包含杂交至所述靶序列的指导序列的指导RNA复合的CRISPR酶;和/或(b)第二调控元件,所述第二调控元件可操作地连接至编码所述Cas13酶的酶编码序列,所述Cas13酶包含核定位序列。在一些实施方案中,所述宿主细胞包含组分(a)和组分(b)。在一些实施方案中,组分(a)、组分(b)或组分(a)和组分(b)被稳定地整合到所述宿主真核细胞的基因组中。在一些实施方案中,组分(a)还包含可操作地连接至所述第一调控元件的两个或更多个指导序列,其中当表达时,所述两个或更多个指导序列中的每者都引导CRISPR复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施方案中,所述Cas13酶引导在所述靶序列位置处的一条或两条链的切割。在一些实施方案中,所述Cas13酶缺少DNA链切割活性。在一些实施方案中,所述第一调控元件是聚合酶III启动子。在一些实施方案中,所述第二调控元件是聚合酶II启动子。
在一方面,本发明提供了一种非人类的真核生物体;优选地是多细胞真核生物体,这些生物体包含根据任何所述实施方案的真核宿主细胞。在其他方面,本发明提供了一种真核生物体;优选地是多细胞真核生物体,这些生物体包含根据任何所述实施方案的真核宿主细胞。在这些方面的一些实施方案中,生物体可以是动物;例如哺乳动物。而且,生物体可以是节肢动物,诸如昆虫。生物体还可以是植物或酵母。此外,所述生物体可以是真菌。
在一方面,本发明提供了一种药盒,所述药盒包含上文所述的一种或多种组分。在一些实施方案中,所述药盒包括载体系统以及用于使用所述药盒的说明书。在一些实施方案中,所述载体系统包含(a)第一调控元件,所述第一调控元件可操作地连接至正向重复序列和一个或多个插入位点,所述一个或多个插入位点用于在所述正向重复序列的下游插入一个或多个指导序列,其中当表达时,所述指导序列引导Cas13 CRISPR复合物与真核细胞中的靶序列的序列特异性结合,其中所述CRISPR复合物包含与包含杂交至所述靶序列的指导序列的受保护的指导RNA复合的Cas13酶;和/或(b)第二调控元件,所述第二调控元件可操作地连接至编码所述Cas13酶的酶编码序列,所述Cas13酶包含核定位序列。在一些实施方案中,所述药盒包含位于所述系统的相同或不同载体上的组分(a)和组分(b)。在一些实施方案中,组分(a)还包含可操作地连接至所述第一调控元件的两个或更多个指导序列,其中当表达时,所述两个或更多个指导序列中的每者都引导CRISPR复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施方案中,所述Cas13酶包括一个或多个核定位序列,其具有足够强度来在真核细胞的细胞核中驱动所述Cas13酶以可检测的量积聚。在一些实施方案中,所述Cas13酶是氨基酸球菌属BV3L6、毛螺科菌MA2020或土拉弗朗西丝菌1新凶手Cas13,并且可以包括来源于这些生物体的突变的Cas13。所述酶可以是Cas13同源物或直系同源物。在一些实施方案中,所述CRISPR酶经密码子优化以便在真核细胞中表达。在一些实施方案中,所述CRISPR酶引导在所述靶序列位置处的一条或两条链的切割。在一些实施方案中,所述CRISPR酶缺少DNA链切割活性。在一些实施方案中,所述第一调控元件是聚合酶III启动子。在一些实施方案中,所述第二调控元件是聚合酶II启动子。
在一方面,本发明提供了一种修饰真核细胞中的靶多核苷酸的方法。在一些实施方案中,所述方法包括允许CRISPR复合物结合至所述靶多核苷酸以实现所述靶多核苷酸的切割,由此修饰所述靶多核苷酸,其中所述CRISPR复合物包含与受保护的指导RNA复合的Cas13酶,所述受保护的指导RNA包含杂交至所述靶多核苷酸内的靶序列的指导序列。在一些实施方案中,所述切割包括通过所述Cas13酶切割在靶序列位置处的一条或两条链。在一些实施方案中,所述切割导致靶基因的转录降低。在一些实施方案中,所述方法还包括通过基于非同源末端连接(NHEJ)的基因插入机制(更具体地与外源性模板多核苷酸)修复所述切割的靶多核苷酸,其中所述修复导致突变,包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失或取代。在一些实施方案中,所述突变导致在从包含所述靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。在一些实施方案中,所述方法还包括将一种或多种载体递送至所述真核细胞,其中所述一种或多种载体驱动下列一者或多者的表达:Cas13酶、包含连接至正向重复序列的指导序列的受保护的指导RNA。在一些实施方案中,将所述载体递送至受试者内的真核细胞。在一些实施方案中,所述修饰发生在细胞培养物中的所述真核细胞中。在一些实施方案中,所述方法还包括在所述修饰之前从受试者中分离所述真核细胞。在一些实施方案中,所述方法还包括使所述真核细胞和/或来源于其的细胞返回至所述受试者中。
在一方面,本发明提供了一种修饰多核苷酸在真核细胞中的表达的方法。在一些实施方案中,所述方法包括允许Cas13 CRISPR复合物结合至所述多核苷酸,这样使得所述结合导致所述多核苷酸的表达增加或降低;其中所述CRISPR复合物包含与受保护的指导RNA复合的Cas13酶,所述受保护的指导RNA包含杂交至所述多核苷酸内的靶序列的指导序列。在一些实施方案中,所述方法还包括将一种或多种载体递送至所述真核细胞,其中所述一种或多种载体驱动下列一者或多者的表达:所述Cas13酶和所述受保护的指导RNA。
在一方面,本发明提供了产生包含突变的疾病基因的模型真核细胞的方法。在一些实施方案中,疾病基因是与患有或产生疾病的风险的增加相关联的任何基因。在一些实施方案中,所述方法包括(a)向真核细胞中引入一种或多种载体,其中所述一种或多种载体驱动下列一者或多者的表达:Cas13酶和包含连接至正向重复序列的指导序列的受保护的指导RNA;以及(b)允许CRISPR复合物结合至靶多核苷酸上以实现在所述疾病基因内的所述靶多核苷酸的切割,其中所述CRISPR复合物包含与包含杂交至所述靶多核苷酸内的靶序列的序列的指导RNA复合的Cas13酶,由此产生包含突变的疾病基因的模型真核细胞。在一些实施方案中,所述切割包括通过所述Cas13酶切割在靶序列位置处的一条或两条链。在一些实施方案中,所述切割导致靶基因的转录降低。在一些实施方案中,所述方法还包括通过基于非同源末端连接(NHEJ)的基因插入机制(与外源性模板多核苷酸)修复所述切割的靶多核苷酸,其中所述修复导致突变,包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失或取代。在一些实施方案中,所述突变导致在从包含所述靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。
在一方面,本发明提供了一种用于开发生物活性剂的方法,所述生物活性剂调节与疾病基因相关联的细胞信号传导事件。在一些实施方案中,疾病基因是与患有或产生疾病的风险的增加相关联的任何基因。在一些实施方案中,所述方法包括(a)使测试化合物与所描述实施方案中任一项的模型细胞接触;以及(b)检测读数变化,所述变化指示与所述疾病基因的所述突变相关联的细胞信号传导事件的减少或增加,由此开发调节与所述疾病基因相关联的所述细胞信号传导事件的所述生物活性剂。
在一方面,本发明提供了一种包含正向重复序列下游的受保护的指导序列的重组多核苷酸,其中当表达时,所述受保护的指导序列引导CRISPR复合物与存在于真核细胞中的相应靶序列的序列特异性结合。在一些实施方案中,所述靶序列是存在于真核细胞中的病毒序列。在一些实施方案中,所述靶序列是原癌基因或癌基因。
在一方面,本发明提供了一种通过在一种或多种细胞的基因中引入一个或多个突变来选择一种或多种细胞的方法,所述方法包括:将一种或多种载体引入所述一种或多种细胞中,其中所述一种或多种载体驱动下列一者或多者的表达:Cas13酶、包含指导序列的受保护的指导RNA和编辑模板;其中所述编辑模板包含消除Cas13酶切的一个或多个突变;允许所述编辑模板与所述靶多核苷酸在有待选择的所述一种或多种细胞中的基于非同源末端连接(NHEJ)的基因插入机制;允许CRISPR复合物结合至靶多核苷酸以实现在所述基因内的所述靶多核苷酸的切割,其中所述CRISPR复合物包含与受保护的指导RNA复合的Cas13酶,所述受保护的指导RNA包含杂交至所述靶多核苷酸内的靶序列的指导序列,其中所述CRISPR复合物与所述靶多核苷酸的结合诱导细胞死亡,由此允许选择其中已经引入一个或多个突变的一种或多种细胞。在本发明的一个优选的实施方案中,所述有待选择的细胞可以是真核细胞。本发明的方面允许选择特定细胞,而不需要选择标记物或可能包括反选择系统的两步法。
关于所述Cas13酶的突变,当所述酶不是FnCas13时,突变可以是如在本文别处所描述的;还设想了任何这些置换氨基酸的保守性取代。在一方面,本发明提供了本文讨论的任何或每个或所有实施方案,其中所述CRISPR酶包含至少一个或多个、或至少两个或更多个突变,其中所述至少一个或多个突变或所述至少两个或更多个突变选自在本文别处描述的那些。
在另一方面,本发明涉及一种用于鉴定或设计待装配在或结合至CRISPR-Cas13系统或其功能部分的潜在化合物的计算机辅助方法、或反之亦然(用于鉴定或设计结合至所需化合物的潜在CRISPR-Cas13系统或其功能部分的计算机辅助方法)、或用于鉴定或设计潜在的CRISPR-Cas13系统的计算机辅助方法(例如,就预测能够被操纵的CRISPR-Cas13系统的区域而言—例如,基于晶体结构数据或基于Cas13直系同源物的数据,或就官能团(诸如激活因子或阻抑因子)可以附接至所述CRISPR-Cas13系统的何处而言,或就Cas13截短而言或就设计切口酶而言),所述方法包括:
使用计算机系统,例如包括处理器、数据存储系统、输入设备、和输出设备的编程计算机,以下步骤:
(a)通过所述输入设备将数据输入至所述编程计算机中,所述数据包括来自CRISPR-Cas13晶体结构的或与其有关的原子子集的三维坐标,例如在CRISPR-Cas13系统结合结构域中、或可替代地或另外地在基于Cas13直系同源物之间的或关于Cas13的或关于切口酶的或关于官能团的差异而变化的结构域中,任选地连同来自一种或多种CRISPR-Cas13系统复合物的结构信息,由此产生数据集;
(b)使用所述处理器比较所述数据集与储存在所述计算机数据存储系统中的计算机结构数据库,例如结合至或推定结合至或希望结合至CRISPR-Cas13系统的化合物的、或关于Cas13直系同源物的(例如,关于Cas13的或关于在Cas13直系同源物之间变化的结构域或区域的)、或关于CRISPR-Cas13晶体结构的、或关于切口酶的或关于官能团的结构;
(c)使用计算机方法从所述数据库中选择一种或多种结构—例如,可以结合至所需结构的CRISPR-Cas13结构、可以结合至某些CRISPR-Cas13结构的所需结构、可以被操纵的CRISPR-Cas13系统的部分(例如基于来自CRISPR-Cas13晶体结构的其他部分的和/或来自Cas13直系同源物的数据)、截短的Cas13、新颖的切口酶或特定的官能团、或用于附接官能团或官能团-CRISPR-Cas13系统的位置;
(d)使用计算机方法构建所选一种或多种结构的模型;以及
(e)将所选一种或多种结构输出至所述输出设备;
并且任选地合成所选一种或多种结构中的一者或多者;
并且进一步任选地作为CRISPR-Cas13系统或在其中测试所述合成的所选一种或多种结构;
或者,所述方法包括:提供所述CRISPR-Cas13晶体结构的至少两个原子(例如本文的CRISPR-Cas13晶体结构的晶体结构表的至少两个原子)的坐标,或所述CRISPR-Cas13晶体结构的至少一个子结构域的坐标(“所选坐标”);提供包含结合分子的候选物的或可以被操纵的所述CRISPR-Cas13系统的部分的结构(例如基于来自所述CRISPR-Cas13晶体结构的其他部分的和/或来自Cas13直系同源物的数据)、或官能团的结构,并且将所述候选物的结构与所选坐标匹配,以由此获得产品数据,所述产品数据包括可以结合至所需结构的CRISPR-Cas13结构、可以结合至某些CRISPR-Cas13结构的所需结构、可以被操纵的CRISPR-Cas13系统的部分、截短的Cas13、新颖的切口酶或特定的官能团、或用于附接官能团或官能团-CRISPR-Cas13系统的位置,并且将这些数据输出;并且任选地从所述产品数据合成一种或多种化合物并且进一步任选地包括作为CRISPR-Cas13系统或在其中测试所述合成的一种或多种化合物。
所述测试可以包括例如就结合、或执行所需功能对由所述合成的所选一种或多种结构产生的CRISPR-Cas13系统进行分析。
前述方法中的输出可以包括数据传输,例如经由电信、电话、视讯会议、公众通讯(例如演示,诸如计算机演示(例如POWERPOINT))、因特网、电子邮件、文献交流(诸如计算机程序(例如WORD))文件等进行的信息传输。因此,本发明还涵盖含有以下项的计算机可读介质:根据本文引用的晶体结构的原子坐标数据,所述数据限定了CRISPR-Cas13或其至少一个子结构域的三维结构;或针对CRISPR-Cas13的结构因子数据,所述结构因子数据可衍生自本文引用的晶体结构的原子坐标数据。所述计算机可读介质还可以含有前述方法的任何数据。本发明还涵盖用于产生或执行如在前述方法中的合理设计的方法计算机系统,其含有以下任一项:根据本文引用的晶体结构的原子坐标数据,所述数据限定了CRISPR-Cas13或其至少一个子结构域的三维结构;或针对CRISPR-Cas13的结构因子数据,所述结构因子数据可衍生自本文引用的晶体结构的原子坐标数据。本发明还涵盖经商方法,所述方法包括向用户提供所述计算机系统或所述介质或CRISPR-Cas13或其至少一个子结构域的三维结构、或针对CRISPR-Cas13的结构因子数据(所述结构列于本文引用的晶体结构的原子坐标数据中并且所述结构因子数据可衍生自本文引用的晶体结构的原子坐标数据)、或本文的计算机介质或本文的数据传输。
“结合位点”或“活性位点”包括结合腔或区域中的位点(诸如原子、氨基酸残基的官能团或多个这样的原子和/或基团)或基本上由其组成或由其组成,所述结合腔或区域可以结合至化合物(诸如核酸分子),所述化合物涉及在结合中。
所谓“匹配(fitting)”意指通过自动或半自动手段确定候选分子的一个或多个原子与本发明结构的至少一个原子之间的相互作用,并且计算这样的相互作用稳定的程度。相互作用包括由电荷、空间因素等引起的吸引和排斥。进一步描述了匹配用的各种基于计算机的方法。
所谓“均方根(或rms)偏差”,意指离均差的平方的算术平均数的平方根。
所谓“计算机系统”意指用于分析原子坐标数据的硬件装置、软件装置和数据存储装置。本发明的基于计算机的系统的最小硬件包括中央处理单元(CPU)、输入装置、输出装置和数据存储装置。合意地,提供显示器或监测器用于可视化结构数据。数据存储装置可以是RAM或用于存取本发明的计算机可读介质的装置。这样的系统的实例是运行Unix、Windows或Apple操作系统的计算机和平板设备。
所谓“计算机可读介质”意指可以被计算机直接或间接读取并且存取,例如使得所述介质适于在以上提及的计算机系统中使用的任何一种或多种介质。这样的介质包括但不限于:磁存储介质,诸如软盘、硬盘存储介质和磁带;光存储介质,诸如光盘或CD-ROM;电存储介质,诸如RAM和ROM;拇指驱动设备;云存储设备以及这些类别的混合体,诸如磁/光存储介质。
本发明涵盖上文所述的受保护的指导物在本文所述的优化的功能性CRISPR-Cas酶系统中的用途。
在一些实施方案中,指导RNA是基于支点的指导RNA。所述基于支点的指导RNA允许指导RNA仅基于细胞中其他转录物的RNA水平被激活。在某些实施方案中,所述指导RNA具有延伸部,所述延伸部包括环和折叠到指导物上并且封闭所述指导物的互补序列。所述环可以与细胞中的转录物或miRNA互补,并且结合这些转录物(如果存在的话)。这将使指导RNA展开,使其结合Cas13分子。然后,此结合的复合物可以敲除转录物或者编辑转录物,这依应用而定。
CRISPR-Cas酶
未经修饰形式的CRISPR-Cas蛋白是一种催化活性蛋白。这意味着在形成核酸靶向复合物(包含与靶序列中或附近(例如,离靶序列1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内)的一条或两条DNA链杂交的指导RNA)后,所述靶序列被修饰(例如,被切割)。如本文所用,术语“与目标靶基因座相缔合的一个或多个序列”是指在靶序列附近的序列(例如,离靶序列1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内,其中所述靶序列被包含在目标靶基因座中)。未修饰的催化活性Cas13蛋白产生交错切口,由此切割位点通常位于靶序列内。更特别地,交错切口通常是PAM远端的13-23个核苷酸。在特定实施方案中,非靶链上的切口是PAM下游的17个核苷酸(即,在PAM下游的核苷酸17与18之间),而靶链上的切口(即,与指导序列杂交的链)又出现了离PAM互补序列较远的4个核苷酸(这是3’链上PAM互补序列上游的21个核苷酸,或在PAM互补序列上游的核苷酸21与22之间)。
在根据本发明的方法中,优选地相对于相应的野生型酶使CRISPR-Cas蛋白突变,使得所述突变的CRISPR-Cas蛋白缺乏切割含有靶序列的靶基因座的一条或两条DNA链的能力。在特定实施方案中,使Cas13蛋白的一个或多个催化结构域突变以产生仅切割靶序列的一条DNA链的突变的Cas蛋白。
在特定实施方案中,可以相对于相应的野生型酶使CRISPR-Cas蛋白突变,使得所述突变的CRISPR-Cas蛋白基本上缺乏所有的DNA切割活性。在一些实施方案中,当突变酶的切割活性为所述酶的非突变形式的核酸切割活性的约不超过25%、10%、5%、1%、0.1%、0.01%或更低时,认为CRISPR-Cas蛋白基本上缺乏所有的DNA和/或RNA切割活性;一个实例可以是当突变形式的核酸切割活性与非突变形式相比是零或可忽略不计时。
在本文提供的方法的某些实施方案中,CRISPR-Cas蛋白是仅切割一条DNA链的突变CRISPR-Cas蛋白,即切口酶。更特别地,在本发明的情形中,所述切口酶确保在非靶序列(即,在靶序列的相反DNA链上并且是PAM序列的3’的序列)内的切割。作为进一步指导且非限制性地,来自氨基酸球菌属种的Cas13的Nuc结构域中的精氨酸至丙氨酸取代(R1226A)将Cas13从切割两条链的核酸酶转化为切口酶(切割单条链)。本领域技术人员将理解,在酶不是AsCas13的情况下,可以在相应位置的残基处形成突变。在特定实施方案中,Cas13是FnCas13,并且突变是在位置R1218处的精氨酸上。在特定实施方案中,Cas13是LbCas13,并且突变是在位置R1138处的精氨酸上。在特定实施方案中,Cas13是MbCas13,并且突变是在位置R1293处的精氨酸上。
在本文提供的方法的某些实施方案中,CRISPR-Cas蛋白具有降低的催化活性或没有催化活性。在CRISPR-Cas蛋白是Cas13蛋白的情况下,突变可包括但不限于催化性RuvC样结构域中的一个或多个突变,诸如D908A或E993A(依据AsCas13中的位置)。
在一些实施方案中,当突变酶的DNA切割活性为所述酶的非突变形式的DNA切割活性的约不超过25%、10%、5%、1%、0.1%、0.01%或更低时,认为CRISPR-Cas蛋白基本上缺乏所有的DNA切割活性;一个实例可以是例如当突变形式的DNA切割活性与非突变形式相比为零或可忽略不计时。在这些实施方案中,将CRISPR-Cas蛋白用作通用DNA结合蛋白。突变可以是人工引入的突变或者功能获得或功能丧失突变。
除以上所述的突变外,还可以另外对CRISPR-Cas蛋白进行修饰。如本文所用,关于CRISPR-Cas蛋白的术语“修饰的”通常是指与衍生其的野生型Cas蛋白相比,CRISPR-Cas蛋白具有一个或多个修饰或突变(包括点突变、截短、插入、缺失、嵌合体、融合蛋白等)。所谓衍生的,是指在与野生型酶具有高度序列同源性的意义上,衍生酶主要基于野生型酶,但是已经以本领域已知或如本文所述的某种方式对衍生酶进行了突变(修饰)。
在一些实施方案中,为了减小Cas13b效应子和一个或多个功能结构域的融合蛋白的尺寸,可以将Cas13b效应子的C端截短,同时仍维持其RNA结合功能。例如,可以将Cas13b效应子的C端的至少20个氨基酸、至少50个氨基酸、至少80个氨基酸、或至少100个氨基酸、或至少150个氨基酸、或至少200个氨基酸、或至少250个氨基酸、或至少300个氨基酸、或至少350个氨基酸、或最多120个氨基酸、或最多140个氨基酸、或最多160个氨基酸、或最多180个氨基酸、或最多200个氨基酸、或最多250个氨基酸、或至多300个氨基酸、或最多350个氨基酸、或最多400个氨基酸截短。Cas13b截短的具体实例包括C端Δ984-1090、C端Δ1026-1090和C端Δ1053-1090、C端Δ934-1090、C端Δ884-1090、C端Δ834-1090、C端Δ784-1090和C端Δ734-1090,其中氨基酸位置对应于氨基酸球菌属种P5-125 Cas13b蛋白的氨基酸位置。还可参见图67。
对CRISPR-Cas蛋白的另外的修饰可能会或可能不会导致功能改变。举例来说,且特别地就CRISPR-Cas蛋白而言,不导致功能改变的修饰包括例如针对表达到特定宿主中进行密码子优化,或向核酸酶提供特定标记物(例如用于可视化)。可能导致功能改变的修饰还可能包括突变,包括点突变、插入、缺失、截短(包括拆分的核酸酶)等。融合蛋白可包括但不限于例如与异源结构域或功能结构域(例如定位信号、催化结构域等)形成的融合物。在某些实施方案中,可以组合各种不同的修饰(例如,具有催化活性的突变核酸酶进一步融合至功能结构域(例如)以诱导DNA甲基化;或另一种核酸修饰,如包括但不限于断裂(例如通过不同的核酸酶(结构域))、突变、缺失、插入、替代、连接、消化、断裂或重组)。如本文所用,“改变的功能性”包括但不限于改变的特异性(例如改变的靶标识别、增加的(例如“增强的”Cas蛋白)或降低的特异性,或改变的PAM识别)、改变的活性(例如增加的或降低的催化活性,包括无催化活性的核酸酶或切口酶)和/或改变的稳定性(例如与去稳定结构域融合)。合适的异源结构域包括但不限于核酸酶、连接酶、修复蛋白、甲基转移酶、(病毒)整合酶、重组酶、转座酶、argonaute、胞苷脱氨酶、反转录子、II族内含子、磷酸酶、磷酸化酶、磺酰化酶(sulpfurylase)、激酶、聚合酶、核酸外切酶等。所有这些修饰的实例在本领域中都是已知的。将理解的是,如本文所提及的“修饰的”核酸酶,且特别地“修饰的”Cas或“修饰的”CRISPR-Cas系统或复合物优选地仍具有与多核酸相互作用或结合的能力(例如与指导分子复合)。这种修饰的Cas蛋白可与如本文所述的脱氨酶蛋白或其活性结构域组合。
在某些实施方案中,CRISPR-Cas蛋白可包含一种或多种使活性和/或特异性增强的修饰,例如包括使靶向或非靶向链稳定的突变残基(例如eCas9;“Rationallyengineered Cas9 nucleases with improved specificity”,Slaymaker等人(2016),Science,351(6268):84-88,以引用方式整体并入本文)。在某些实施方案中,工程化CRISPR蛋白的改变或修饰的活性包括增加的靶向效率或减少的脱靶结合。在某些实施方案中,工程化CRISPR蛋白的改变的活性包括修改的切割活性。在某些实施方案中,改变的活性包括对靶多核苷酸基因座的增加的切割活性。在某些实施方案中,改变的活性包括对靶多核苷酸基因座的降低的切割活性。在某些实施方案中,改变的活性包括对脱靶多核苷酸基因座的降低的切割活性。在某些实施方案中,修饰的核酸酶的改变的或修改的活性包括改变的解旋酶动力学。在某些实施方案中,修饰的核酸酶包含改变蛋白质与包含RNA的核酸分子(在Cas蛋白的情况下)、或靶多核苷酸基因座的链、或脱靶多核苷酸的链的缔合的修饰。在本发明的一方面,工程化CRISPR蛋白包含改变CRISPR复合物的形成的修饰。在某些实施方案中,改变的活性包括对脱靶多核苷酸基因座的增加的切割活性。因此,在某些实施方案中,相较于脱靶多核苷酸基因座,对靶多核苷酸基因座的特异性增加。在其他实施方案中,相较于脱靶多核苷酸基因座,对靶多核苷酸基因座的特异性降低。在某些实施方案中,突变导致脱靶效应(例如切割或结合特性、活性或动力学)降低,诸如在Cas蛋白的情况下,例如导致对靶标与指导RNA之间的错配的耐受性降低。其他突变可能导致脱靶效应(例如切割或结合特性、活性或动力学)增加。其他突变可能导致中靶效应(例如切割或结合特性、活性或动力学)增加或降低。在某些实施方案中,突变引起改变的(例如增加或降低的)解旋酶活性、功能性核酸酶复合物(例如CRISPR-Cas复合物)的缔合或形成。在某些实施方案中,如上所述,突变导致PAM识别改变,即相较于未修饰的Cas蛋白,可能(另外地或替代地)识别不同的PAM。为了增强特异性,特别优选的突变包括带正电的残基和/或(进化的)保守的残基,诸如保守的带正电残基。在某些实施方案中,此类残基可被突变为不带电荷的残基,诸如丙氨酸。
在某些实施方案中,本文所述的方法、产品和用途可以扩展至或适用于实施任何类型的CRISPR效应子。
在某些实施方案中,CRISPR效应子是2类CRISPR-Cas系统效应子。应当理解,术语“CRISPR效应子”优选地是指RNA指导的内切核酸酶。技术人员将理解,可以如本文别处所述地并且如本领域已知的对CRISPR效应子进行修饰。举例来说且并非限制,CRISPR效应子修饰包括影响CRISPR效应子功能或核酸酶活性(例如,无催化活性的变体(任选地与异源功能结构域融合或以其他方式缔合)、切口酶、改变的PAM特异性/识别、拆分CRISPR效应子…)、特异性(例如,增强的特异性突变体)、稳定性(例如,去稳定的变体)等的修饰。
在某些实施方案中,CRISPR效应子切割RNA,结合至RNA或者与RNA缔合。在某些实施方案中,CRISPR效应子切割DNA,结合至DNA或者与DNA缔合。在某些实施方案中,CRISPR效应子切割单链RNA,结合至单链RNA或者与单链RNA缔合。在某些实施方案中,CRISPR效应子切割单链DNA,结合至单链DNA或者与单链DNA缔合。在某些实施方案中,CRISPR效应子切割双链RNA,结合至双链RNA或者与双链RNA缔合。在某些实施方案中,CRISPR效应子切割双链DNA,结合至双链DNA或者与双链DNA缔合。在某些实施方案中,CRISPR效应子切割DNA/RNA杂交体,结合至DNA/RNA杂交体或者与DNA/RNA杂交体缔合。
在某些实施方案中,CRISPR效应子是2类II型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类II-A型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类II-B型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类II-C型CRISPR效应子。在某些实施方案中,CRISPR效应子是Cas9。
在某些实施方案中,CRISPR效应子是2类V型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类V-A型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类V-B型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类V-C型CRISPR效应子。在某些实施方案中,CRISPR效应子是Cas12a(Cpf1)。在某些实施方案中,CRISPR效应子是Cas12b(C2c1)。在某些实施方案中,CRISPR效应子是Cas12c(C2c3)。在某些实施方案中,CRISPR效应子是2类V-U型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类V-U1型CRISPR效应子(例如C2c4)。在某些实施方案中,CRISPR效应子是2类V-U2型CRISPR效应子(例如C2c8)。在某些实施方案中,CRISPR效应子是2类V-U3型CRISPR效应子(例如C2c10)。在某些实施方案中,CRISPR效应子是2类V-U4型CRISPR效应子(例如C2c9)。在某些实施方案中,CRISPR效应子是2类V-U5型CRISPR效应子(例如C2c5)。
在某些实施方案中,CRISPR效应子是2类VI型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类VI-A型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类VI-B型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类VI-B1型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类VI-B2型CRISPR效应子。在某些实施方案中,CRISPR效应子是2类VI-C型CRISPR效应子。在某些实施方案中,CRISPR效应子是Cas13a(C2c2)。在某些实施方案中,CRISPR效应子是Cas13b(C2c6)。在某些实施方案中,CRISPR效应子是Cas13c(C2c7)。
在某些实施方案中,CRISPR效应子包含一个或多个RuvC结构域。在某些实施方案中,CRISPR效应子包含RuvC-I结构域。在某些实施方案中,CRISPR效应子包含RuvC-II结构域。在某些实施方案中,CRISPR效应子包含RuvC-III结构域。在某些实施方案中,CRISPR效应子包含RuvC-I、RuvC-II和RuvC-III结构域。在某些实施方案中,RuvC-I、II和/或III中的一者或多者是连续的基序。在某些实施方案中,RuvC-I、II和/或III中的一者或多者是非连续的或离散的基序。在某些实施方案中,CRISPR效应子包含一个或多个HNH结构域。在某些实施方案中,CRISPR效应子包含一个或多个RuvC结构域和一个或多个HNH结构域。在某些实施方案中,CRISPR效应子包含RuvC-I结构域和HNH结构域。在某些实施方案中,CRISPR效应子包含RuvC-II结构域和HNH结构域。在某些实施方案中,CRISPR效应子包含RuvC-III结构域和HNH结构域。在某些实施方案中,CRISPR效应子包含RuvC-I、RuvC-II和RuvC-III结构域和HNH结构域。在某些实施方案中,CRISPR效应子包含一个或多个Nuc(核酸酶)结构域。在某些实施方案中,CRISPR效应子包含一个或多个RuvC结构域和一个或多个Nuc结构域。在某些实施方案中,CRISPR效应子包含RuvC-I结构域和Nuc结构域。在某些实施方案中,CRISPR效应子包含RuvC-II结构域和Nuc结构域。在某些实施方案中,CRISPR效应子包含RuvC-III结构域和Nuc结构域。
在某些实施方案中,CRISPR效应子包含一个或多个HEPN结构域。在某些实施方案中,CRISPR效应子包含HEPN I结构域。在某些实施方案中,CRISPR效应子包含HEPN II结构域。在某些实施方案中,CRISPR效应子包含HEPN I结构域和HEPN II结构域。在某些实施方案中,一个或多个HEPN结构域是连续结构域。在某些实施方案中,一个或多个HEPN结构域包含非连续的或离散的基序。
在某些实施方案中,CRISPR效应子是如在例如以下文献中公开的CRISPR效应子:Shmakov等人(2017),“Diversity and evolution of class 2CRISPR-Cas systems”,Nature Rev Microbiol,15(3):169-182;Shmakov等人(2015)“Discovery and functionalcharacterization of diverse class 2CRISPR-Cas systems”,Mol Cell,60(3):385-397;Makarova等人(2015),“An updated evolutionary classification of CRISPR-Cassystems”,Nat Rev Microbiol,13(11):722-736;或Koonin等人(2017),“Diversity,classification and evolution of CRISPR-Cas systems”,Curr Opin Microbiol,37:67-78。所有这些文献以及其中引用的参考文献以引用方式整体并入本文。
技术人员将理解,CRISPR效应子的选择可能取决于应用(例如敲除或阻抑、激活…),以及靶标(例如RNA或DNA,单链或双链,以及靶标序列,包括相关的PAM序列和/或特异性…)。应当理解,CRISPR效应子的选择可以确定其他CRISPR-Cas系统组分的细节(例如间隔区(或指导序列)长度、正向重复(或tracr配对)序列或长度、tracr的存在或不存在,以及tracr序列或长度等)。
CRISPR-Cas系统已在许多古细菌和细菌种类中得到鉴定。技术人员将理解,在某些实施方案中可以有利地使用来自任何已鉴定的CRISPR-Cas系统的CRISPR效应子同系物或直系同源物。应当理解,可以鉴定出另外的同系物(例如,另外的2类CRISPR-Cas系统和CRISPR效应子)或直系同源物(例如,来自其他古细菌或细菌种类的已知或未知的CRISPR-Cas系统或CRISPR效应子)。这可以适当地在本发明的某些实施方案和方面中使用。
举例来说,可以例如但不限于如Shmakov等人(2017),“Diversity and evolutionof class 2CRISPR-Cas systems”,Nature Rev Microbiol,15(3):169-182;或Shmakov等人(2015)“Discovery and functional characterization of diverse class 2CRISPR-Cas systems”,Mol Cell,60(3):385-397中所述鉴定CRISPR-Cas系统(和CRISPR效应子)用于鉴定CRISPR-Cas系统和效应子的方法以引用方式明确地并入本文。
在某些实施方案中,用于系统性检测2类CRISPR-Cas系统的方法可以从鉴定“种子”开始,所述“种子”指示在给定核苷酸序列中可能存在CRISPR-Cas基因座。例如,可以将Cas1用作种子,因为它是CRISPR-Cas系统中最常见的Cas蛋白,并且在序列水平上最高度保守。可以使用此种子搜索序列数据库。为了确保最大的检测灵敏度,可以通过比较Cas1序列谱和翻译后的基因组和宏基因组序列来进行搜索。在检测到Cas1基因后,通过搜索先前开发的Cas蛋白谱并应用CRISPR-Cas基因座分类标准,来检查其各自的“邻域”是否存在其他Cas基因。在补充方法中,为了将搜索扩展到非自主的CRISPR-Cas系统,可以使用CRISPR阵列作为种子重复相同的程序。为了确保以高水平的灵敏度检测CRISPR阵列,可以使用例如Piler-CR72和CRISPRfinder方法进行预测,可以将这些预测汇总并用作最终CRISPR集。如Shmakov等人(2017),“Diversity and evolution of class 2CRISPR-Cas systems”,Nature Rev Microbiol,15(3):169-182所说明,后一种方法(即,使用CRISPR阵列作为种子)产生了47,174个CRISPR阵列,这个数目是所检测到的Cas1基因数目的两倍多,反映的事实是许多CRISPR-Cas基因座缺少适应模块并且还存在许多“孤儿”阵列,其中一些阵列似乎起作用。
随后可以通过Cas蛋白质谱搜索将所有基因座分配给已知的CRISPR-Cas亚型,或者可以将它们分配给新的亚型。在某些实施方案中,鉴于Cas9和Cpf1是大蛋白(通常>1000个氨基酸)并且它们的蛋白结构表明需要这种大尺寸才能容纳CRISPR RNA(crRNA)-靶DNA复合物,可以对Cas1或CRISPR邻域中编码大蛋白(>500个氨基酸)的那些进行详细分析。然后可以使用基于灵敏谱的方法(例如HHpred、二级结构预测和手动检查多重比对)针对已知蛋白结构域对此类大蛋白的序列进行筛选。在2类效应蛋白含有核酸酶结构域的前提下,即使与已知的核酸酶家族远缘相关或不相关,含有在CRISPR-Cas功能的情形中被认为无关的结构域的蛋白(例如膜转运蛋白或代谢酶)可以丢弃。保留的蛋白质要么含有易于鉴定的核酸酶结构域,要么含有完全未知的核酸酶结构域。然后,可以使用最灵敏的结构域检测方法(诸如HHpred)对这些蛋白质的序列进行分析,并对各个可用作查询的蛋白质序列进行精细多重比对。使用灵敏方法是至关重要的,因为特别地参与抗病毒防御的蛋白质和Cas蛋白质通常会急速进化。至少从原则上说,上述发现2类CRISPR-Cas系统的程序预期是详尽无遗的,因为含有编码cas1和/或CRISPR附近的大蛋白(即,推定的2类效应子)的基因的所有基因座都得到详细分析。对2类效应子的结构要求(其是蛋白质尺寸截止点的基础)的假设以及Cas1和CRISPR检测的精度是这种方法的仅有局限。
在某些实施方案中,CRISPR效应子是例如根据上文呈现的方法鉴定的CRISPR效应子。应当理解,本领域技术人员可以容易地评估和验证所鉴定的CRISPR效应子的功能。
碱基切除修复抑制剂
在一些实施方案中,AD官能化的CRISPR系统还包含碱基切除修复(BER)抑制剂。不希望受任何特定理论的束缚,对I:T配对存在的细胞DNA修复反应可能导致细胞中核碱基编辑效率的降低。烷基腺嘌呤DNA糖基化酶(也称为DNA-3-甲基腺嘌呤糖基化酶、3-烷基腺嘌呤DNA糖基化酶或N-甲基嘌呤DNA糖基化酶)催化细胞DNA中次黄嘌呤的去除,这可能启动碱基切除修复,结果I:T配对逆转成A:T配对。
在一些实施方案中,BER抑制剂是烷基腺嘌呤DNA糖基化酶的抑制剂。在一些实施方案中,BER抑制剂是人类烷基腺嘌呤DNA糖基化酶的抑制剂。在一些实施方案中,BER抑制剂是多肽抑制剂。在一些实施方案中,BER抑制剂是结合次黄嘌呤的蛋白质。在一些实施方案中,BER抑制剂是结合DNA中的次黄嘌呤的蛋白质。在一些实施方案中,BER抑制剂是无催化活性的烷基腺嘌呤DNA糖基化酶蛋白或其结合结构域。在一些实施方案中,BER抑制剂是不从DNA中切除次黄嘌呤的无催化活性的烷基腺嘌呤DNA糖基化酶蛋白或其结合结构域。能够抑制(例如,在空间上阻断)烷基腺嘌呤DNA糖基化酶碱基切除修复酶的其他蛋白质在本公开的范围之内。另外,阻断或抑制碱基切除修复的任何蛋白质也在本公开的范围之内。
不希望受任何特定理论的束缚,可通过结合编辑链、阻断编辑碱基、抑制烷基腺嘌呤DNA糖基化酶、抑制碱基切除修复、保护编辑碱基和/或促进未编辑链固定的分子抑制碱基切除修复。据信,使用本文所述的BER抑制剂可以提高能够催化A至I变化的腺苷脱氨酶的编辑效率。
因此,在以上论述的AD官能化的CRISPR系统的第一设计中,可以将CRISPR-Cas蛋白或腺苷脱氨酶融合或连接至BER抑制剂(例如烷基腺嘌呤DNA糖基化酶的抑制剂)。在一些实施方案中,BER抑制剂可以包含在以下结构之一中(nCas13=Cas13切口酶;dCas13=死亡Cas13):[AD]-[任选的接头]-[nCas13/dCas13]-[任选的接头]-[BER抑制剂];[AD]-[任选的接头]-[BER抑制剂]-[任选的接头]-[nCas13/dCas13];[BER抑制剂]-[任选的接头]-[AD]-[任选的接头]-[nCas13/dCas13];[BER抑制剂]-[任选的接头]-[nCas13/dCas13]-[任选的接头]-[AD];[nCas13/dCas13]-[任选的接头]-[AD]-[任选的接头]-[BER抑制剂];[nCas13/dCas13]-[任选的接头]-[BER抑制剂]-[任选的接头]-[AD]。
类似地,在以上论述的AD官能化的CRISPR系统的第二设计中,可以将CRISPR-Cas蛋白、腺苷脱氨酶或衔接蛋白融合或连接至BER抑制剂(例如烷基腺嘌呤DNA糖基化酶的抑制剂)。在一些实施方案中,BER抑制剂可以包含在以下结构之一中(nCas13=Cas13切口酶;dCas13=死亡Cas13):[nCas13/dCas13]-[任选的接头]-[BER抑制剂];[BER抑制剂]-[任选的接头]-[nCas13/dCas13];[AD]-[任选的接头]-[衔接子]-[任选的接头]-[BER抑制剂];[AD]-[任选的接头]-[BER抑制剂]-[任选的接头]-[衔接子];[BER抑制剂]-[任选的接头]-[AD]-[任选的接头]-[衔接子];[BER抑制剂]-[任选的接头]-[衔接子]-[任选的接头]-[AD];[衔接子]-[任选的接头]-[AD]-[任选的接头]-[BER抑制剂];[衔接子]-[任选的接头]-[BER抑制剂]-[任选的接头]-[AD]。
在以上论述的AD官能化的CRISPR系统的第三设计中,可以将BER抑制剂插入CRISPR-Cas蛋白的内环或非结构化区中。
对细胞核的靶向
在一些实施方案中,本发明的方法涉及修饰目标靶基因座中的腺嘌呤,其中所述靶基因座处于细胞内。为了改善在本发明的方法中使用的CRISPR-Cas蛋白和/或腺苷脱氨酶蛋白或其催化结构域对细胞核的靶向,可能有利的是为这些组分之一或两者提供一个或多个核定位序列(NLS)。
在优选的实施方案中,在本发明的情形中使用的NLS与蛋白质是异源的。NLS的非限制性实例包括来源于以下的NLS序列:SV40病毒大T抗原的NLS,其具有氨基酸序列PKKKRKV(SEQ ID No.17)或PKKKRKVEAS(SEQ ID No.18);来自核质蛋白的NLS(例如核质蛋白两分NLS,其具有序列KRPAATKKAGQAKKKK(SEQ ID No.19));c-myc NLS,其具有氨基酸序列PAAKRVKLD(SEQ ID No.20)或RQRRNELKRSP(SEQ ID No.21);hRNPA1 M9 NLS,其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID No.22);来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID No.23);肌瘤T蛋白的序列VSRKRPRP(SEQ ID No.24)和PPKKARED(SEQ ID No.25);人p53的序列PQPKKKPL(SEQ IDNo.26);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID No.27);流感病毒NS1的序列DRLRR(SEQ ID No.28)和PKQKKRK(SEQ ID No.29);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ IDNo.30);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID No.31);人类聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID No.32);和类固醇激素受体(人类)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID No.33)。通常,一个或多个NLS具有足够的强度来驱动可检测量的DNA靶向Cas蛋白在真核细胞的细胞核中的积聚。通常,核定位活性的强度可以源自CRISPR-Cas蛋白中NLS的数量、所使用的特定NLS或这些因素的组合。可以通过任何合适的技术来检测细胞核中的积聚。例如,(如)结合用于检测细胞核的位置的手段(例如对细胞核具有特异性的染色剂诸如DAPI),可以将可检测的标记物融合至核酸靶向蛋白,从而可以可视化细胞内的位置。也可以从细胞中分离细胞核,接着可以通过用于检测蛋白质的任何合适的方法(诸如免疫组织化学、蛋白质印迹或酶活性测定)来分析细胞核的内容。也可以通过针对靶序列处的核酸靶向复合物形成的作用的测定(例如针对脱氨酶活性的测定),或针对受DNA靶向复合物形成/或DNA靶向影响而改变的基因表达的测定),如与未暴露于CRISPR-Cas蛋白和脱氨酶蛋白的对照物,或暴露于缺少一个或多个NLS的CRISPR-Cas和/或脱氨酶蛋白的对照物相比,间接确定细胞核中的积聚。
可以为CRISPR-Cas和/或腺苷脱氨酶蛋白提供1个或多个,诸如2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个异源NLS。在一些实施方案中,蛋白质在氨基末端处或附近包含约或多于约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个NLS,在羧基末端处或附近包含约或多于约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或多个NLS,或这些的组合(例如在氨基末端处为零或至少一个或多个NLS,或在羧基末端处为零或一个或多个NLS)。当存在多于一个NLS时,可以彼此独立地选择每个NLS,使得单个NLS可以多于一个拷贝存在和/或与一个或多个其他NLS组合以一个或多个拷贝存在。在一些实施方案中,当NLS的最近的氨基酸沿着多肽链距N端或C端约1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、40个、50个或更多个氨基酸内时,认为NLS接近N端或C端。在CRISPR-Cas蛋白的优选实施方案中,NLS附接至蛋白质的C端。
在本文提供的方法的某些实施方案中,CRISPR-Cas蛋白和脱氨酶蛋白作为单独的蛋白质被递送至细胞或在细胞内表达。在这些实施方案中,CRISPR-Cas和脱氨酶蛋白各自可以被提供有一个或多个如本文所述的NLS。在某些实施方案中,CRISPR-Cas和脱氨酶蛋白作为融合蛋白被递送至细胞或在细胞内表达。在这些实施方案中,CRISPR-Cas和脱氨酶蛋白之一或两者都被提供有一个或多个NLS。如上所述,当腺苷脱氨酶融合至衔接蛋白(诸如MS2)时,可以在衔接蛋白上提供一个或多个NLS,条件是这不干扰适体结合。在特定实施方案中,一个或多个NLS序列还可以充当腺苷脱氨酶与CRISPR-Cas蛋白之间的接头序列。
在某些实施方案中,本发明的指导物包含针对衔接蛋白的特异性结合位点(例如适体),所述衔接蛋白可以连接或融合至腺苷脱氨酶或其催化结构域。当这样的指导物形成CRISPR复合物(即结合至指导物和靶标的CRISPR-Cas蛋白)时,衔接蛋白结合腺苷脱氨酶或其催化结构域,并且与所述衔接蛋白缔合的腺苷脱氨酶或其催化结构域被定位成有利于属性化的功能生效的空间取向。
技术人员将理解,对允许衔接子+腺苷脱氨酶结合但未正确定位衔接子+腺苷脱氨酶(例如由于CRISPR复合物的三维结构内的空间位阻)的指导物的修饰是未预期的修饰。如本文所述,一种或多种修饰的指导物可在四环、茎环1、茎环2或茎环3处修饰,优选地在四环或茎环2中,且最优选地在四环处环和茎环2两者中修饰。
正交无催化活性的CRISPR-Cas蛋白的用途
在特定实施方案中,将Cas13切口酶与正交无催化活性的CRISPR-Cas蛋白结合使用以提高所述Cas13切口酶的效率(如Chen等人2017,Nature Communications 8:14958;doi:10.1038/ncomms14958中所述)。更特别地,通过与AD官能化的CRISPR系统中所用的Cas13切口酶不同的PAM识别位点来表征正交无催化活性的CRISPR-Cas蛋白,并且选择相应的指导序列以结合至邻近AD官能化的CRISPR系统的Cas13切口酶的靶序列的靶序列。如在本发明的情形中使用的正交无催化活性的CRISPR-Cas蛋白不形成AD官能化的CRISPR系统的一部分,而是仅用于增加所述Cas13切口酶的效率,并且与如在本领域中针对所述CRISPR-Cas蛋白描述的标准指导分子结合使用。在特定实施方案中,所述正交无催化活性的CRISPR-Cas蛋白是死亡CRISPR-Cas蛋白,即包含一种或多种消除所述CRISPR-Cas蛋白的核酸酶活性的突变。在特定实施方案中,无催化活性的正交CRISPR-Cas蛋白被提供有两种或更多种能够与邻近Cas13切口酶的靶序列的靶序列杂交的指导分子。在特定实施方案中,至少两种指导分子用于靶向所述无催化活性的CRISPR-Cas蛋白,其中至少一种指导分子能够与AD官能化的CRISPR系统的Cas13切口酶的靶序列的5”靶序列杂交并且至少一种指导分子能够与Cas13切口酶的靶序列的3’靶序列杂交,由此所述一个或多个靶序列可以处于与Cas13切口酶的靶序列相同或相反的DNA链上。在特定实施方案中,选择正交无催化活性的CRISPR-Cas蛋白的一种或多种指导分子的指导序列,以使靶序列邻近用于AD官能化的CRISPR的靶向(即Cas13切口酶的靶向)的指导分子的靶序列。在特定实施方案中,正交无催化活性的CRISPR-Cas酶的一个或多个靶序列各自与Cas13切口酶的靶序列分开大于5个但小于450个碱基对。与正交无催化活性的CRISPR-Cas蛋白一起使用的指导物的靶序列与AD官能化的CRISPR系统的靶序列之间的最佳距离可以由技术人员确定。在特定实施方案中,正交CRISPR-Cas蛋白是II类II型CRISPR蛋白。在特定实施方案中,正交CRISPR-Cas蛋白是II类V型CRISPR蛋白。在特定实施方案中,无催化活性的正交CRISPR-Cas蛋白在特定实施方案中,无催化活性的正交CRISPR-Cas蛋白已经如本文别处所述进行了修饰,以改变其PAM特异性。在特定实施方案中,Cas13蛋白切口酶是这样的一种切口酶:其本身在人类细胞中活性有限,但与无活性的正交CRISPR-Cas蛋白和一种或多种相应的邻近指导物组合可确保所需的切口酶活性。
CRISPR开发和使用
可以基于以下文章中所陈述的CRISPR-Cas开发和使用的方面,特别是涉及CRISPR蛋白复合物的递送以及RNA指导的内切核酸酶在细胞和生物体中的使用的方面进一步说明和扩展本发明:
Multiplex genome engineering using CRISPR-Cas systems.Cong,L.,Ran,F.A.,Cox,D.,Lin,S.,Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.,&Zhang,F.Science Feb 15;339(6121):819-23(2013);
RNA-guided editing of bacterial genomes using CRISPR-Cassystems.Jiang W.,Bikard D.,Cox D.,Zhang F,Marraffini LA.Nat Biotechnol Mar;31(3):233-9(2013);
One-Step Generation of Mice Carrying Mutations in Multiple Genes byCRISPR-Cas-Mediated Genome Engineering Wang H,Yang H.,Shivalila CS.,DawlatyMM.,Cheng AW.,Zhang F.,Jaenisch R Cell May 9:153(4):910-8(2013);
Optical control of mammalian endogenous transcription andepigenetic states.Konermann S,Brigham MD,Trevino AE,Hsu PD,Heidenreich M,CongL,Platt RJ,Scott DA,Church GM,Zhang F.Nature.Aug 22;500(7463):472-6.doi:10.1038/Nature12466.Epub 2013 Aug 23(2013);
Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced GenomeEditing Specificity.Ran,FA.,Hsu,PD.,Lin,CY.,Gootenberg,JS.,Konermann,S.,Trevino,AE.,Scott,DA.,Inoue,A.,Matoba,S.,Zhang,Y,&Zhang,F Cell Aug 28.pii:S0092-8674(13)01015-5(2013-A);
DNA targeting specificity of RNA-guided Cas9 nucleases.Hsu,P.,Scott,D.,Weinstein,J.,Ran,FA.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.,Wu,X.,Shalern,O.,Cradick,TJ.,Marraffini,LA.,Bao,G.,&Zhang,F.Nat Biotechnol doi:10.1038/nbt.2647(2013);
Genome engineering using the CRISPR-Cas9 system.Ran.FA.,Hsu,PD.,Wright,J.,Agarwala,V.,Scott,DA.,Zhang,F.Nature Protocols Nov;8(11):2281-308(2013-B);
Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells.Shalem,O.,Sanjana,NE.,Hartenian,E.,Shi,X.,Scott,DA,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench,JG.,Zhang,F.Science Dec 12.(2013);
Crystal structure of cas9 in complex with guide RNA and targetDNA.Nishimasu,H.,Ran,FA.,Hsu,PD.,Konermann,S.,Shehata,SI.,Dohmae,N.,Ishitani,R.,Zhang,F.,Nureki,O.Cell Feb 27,156(5):935-49(2014);
Genome-wide binding of the CRISPR endonuclease Cas9 in mammaliancells.Wu X.,Scott DA.,Kriz AJ.,Chiu AC.,Hsu PD.,Dadon DB.,Cheng AW.,TrevinoAE.,Konermann S.,Chen S.,Jaenisch R.,Zhang F.,Sharp PA Nat Biotechnol.Apr20.doi:10.1038/nbt.2889(2014);
CRISPR-Cas9 Knockin Mice for Genome Editing and CancerModeling.Platt RJ,Chen S,Zhou Y,Yim MJ,Swiech L,Kempton HR,Dahlman JE,ParnasO,Eisenhaure TM,Jovanovic M,Graham DB,Jhunjhunwala S,Heidenreich M,Xavier RJ,Langer R,Anderson DG,Hacohen N,Regev A,Feng G,Sharp PA,Zhang F.Cell 159(2):440-455 DOI:10.1016/j.cell.2014.09.014(2014);
Development and Applications of CRISPR-Cas9 for Genome Engineering,Hsu PD,Lander ES,Zhang F.,Cell.Jun 5;157(6):1262-78(2014).
Genetic screens in human cells using the CRISPR-Cas9 system,Wang T,Wei JJ,Sabatini DM,Lander ES.,Science.January 3;343(6166):80-84.doi:10.1126/science.1246981(2014);
Rational design of highly active sgRNAs for CRISPR-Cas9-mediatedgene inactivation,Doench JG,Hartenian E,Graham DB,Tothova Z,Hegde M,Smith I,Sullender M,Ebert BL,Xavier RJ,Root DE.,(published online 3 September 2014)Nat Biotechnol.Dec;32(12):1262-7(2014);
In vivo interrogation of gene function in the mammalian brain usingCRISPR-Cas9,Swiech L,Heidenreich M,Banerjee A,Habib N,Li Y,Trombetta J,Sur M,Zhang F.,(published online 19 October 2014)Nat Biotechnol.Jan;33(1):102-6(2015);
Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex,Konermann S,Brigham MD,Trevino AE,Joung J,Abudayyeh OO,BarcenaC,Hsu PD,Habib N,Gootenberg JS,Nishimasu H,Nureki O,Zhang F.,Nature.Jan 29;517(7536):583-8(2015).
A split-Cas9 architecture for inducible genome editing andtranscription modulation,Zetsche B,Volz SE,Zhang F.,(published online 02February 2015)Nat Biotechnol.Feb;33(2):139-42(2015);
Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth andMetastasis,Chen S,Sanjana NE,Zheng K,Shalem O,Lee K,Shi X,Scott DA,Song J,PanJQ,Weissleder R.Lee H,Zhang F,Sharp PA.Cell 160,1246-1260,March 12,2015(multiplex screen in mouse),and
In vivo genome editing using Staphylococcus aureus Cas9,Ran FA,CongL,Yan WX,Scott DA,Gootenberg JS,Kriz AJ,Zetsche B,Shalem O,Wu X,Makarova KS,Koonin EV,Sharp PA,Zhang F.,(published online 01 April 2015),Nature.Apr 9;520(7546):186-91(2015).
Shalem et al.,“High-throughput functional genomics using CRISPR-Cas9,”Nature Reviews Genetics 16,299-311(May 2015).
Xu et al.,“Sequence determinants of improved CRISPR sgRNA design,”Genome Research 25,1147-1157(August 2015).
Parnas et al.,“A Genome-wide CRISPR Screen in Primary Immune Cellsto Dissect Regulatory Networks,”Cell 162,675-686(July 30,2015).
Ramanan et al.,CRISPR-Cas9 cleavage of viral DNA efficientlysuppresses hepatitis B virus,”Scientific Reports 5:10833.doi:10.1038/srep10833(June 2,2015)
BCL11A enhancer dissection by Cas9-mediated in situ saturatingmutagenesis,Canver et al.,Nature 527(7577):192-7(Nov.12,2015)doi:10.1038/nature15521,Epub 2015Sep 16.
Cas13 Isa Single RNA-Guided Endonuclease of a Class 2 CRISPR-CasSystem,Zetsche et al.,Cell 163,759-71(Sep 25,2015).
Discovery and Functional Characterization of Diverse Class 2CRISPR-Cas Systems,Shmakov et al.,Molecular Cell,60(3),385-397 doi;10.1016/j.molcel.2015.10.008Epub October 22,2015.
Rationally engineered Cas9 nucleases with improved specifieity,Slaymaker et al.,Science 2016 Jan 1351(6268):84-88 doi:10.1126/science.aad5227.Epub 2015 Dec 1.
Gao et dl,“Engineered Cas13 Enzymes with Altered PAMSpecificities,”bioRxiv 091611;doi:http://dx.doi.org/10.1101/091611(Dec.4,2016).
将它们各自以引用方式并入本文,可以在本发明的实践中考虑,并在下文简要论述:
Cong等人基于嗜热链球菌(Streptococcus thermophilus)Cas9还有化脓链球菌(Streptococcus pyogenes)Cas9两者工程化了II型CRISPR-Cas系统以用于在真核细胞中使用,并且证实了Cas9核酸酶可以通过短RNA引导以诱导在人类和小鼠细胞中DNA的精确切割。他们的研究进一步显示Cas9在转化成一种切口酶时可以用来以最低诱变活性促进在真核细胞中的同源定向修复。另外,他们的研究证实多个指导序列可以被编码进单一CRISPR阵列中以使得能够在哺乳动物基因组内的内源性基因组基因座位点处同时编辑若干,证实了RNA指导的核酸酶技术的容易可编程性和广泛可应用性。这种使用RNA以编程细胞内序列特异性DNA切割的能力定义了新一类的基因组工程化工具。这些研究进一步显示,其他CRISPR基因座可能是可移植入哺乳动物细胞中的,并且还可以介导哺乳动物基因组切割。重要地,可以设想的是CRISPR-Cas系统的若干方面可以进一步改善以增加其效率和多功能性。
Jiang等人使用成簇的规律间隔的短回文重复序列(CRISPR)-关联的Cas9内切核酸酶,与双-RNA复合,以在肺炎链球菌(Streptococcus pneumoniae)和大肠杆菌(Escherichia coli)的基因组中引入精确的突变。该方法依赖于在靶向基因组位点处的双-RNA:Cas9-引导的切割,以杀死未突变的细胞,并且回避对选择性标记物或反选择系统的需要。该研究报道通过改变短CRISPR RNA(crRNA)的序列以使单一和多个核苷酸变化被携带在编辑模板上而重编程双-RNA:Cas9特异性。该研究显示,同时使用两种crRNA使得多重诱变成为可能。另外,当该方法与重组工程组合使用时,在肺炎链球菌中使用描述的方法回收的接近100%的细胞包含所需的突变,并且在大肠杆菌中回收的65%包含突变。
Wang等人(2013)使用CRISPR/Cas系统用于一步生成携带多基因中突变的小鼠,所述小鼠传统上是以多步通过在胚胎干细胞中的连续重组和/或小鼠的与单一突变的耗时性杂交生成的。CRISPR/Cas系统将大大加速功能上丰富的基因和上位基因相互作用的体内研究。
Ran等人(2013-A)描述了将Cas9切口酶突变体与配对的指导RNA相组合以引入靶向的双链断裂的方法。这解决了以下问题:来自微生物CRISPR-Cas系统的Cas9核酸酶通过指导序列而靶向特异性基因组基因座,所述指导序列可以耐受与该DNA靶标的某些错配并由此促进不希望的脱靶诱变。因为基因组中的单独切口以高保真性被修复,所以同时经由适当偏移指导RNA而形成切口对于双链断裂是必需的,并且所述切口形成扩大了特异性识别的碱基的数目以用于靶标切割。作者证实了使用配对的切口形成可以降低在细胞系中的脱靶活性50至1,500倍,并且从而促进在小鼠受精卵中的基因敲除而不牺牲中靶切割效率。这个通用策略使得多种多样的要求高特异性的基因组编辑应用成为可能。
Hsu等人(2013)表征了在人类细胞中SpCas9靶向特异性以告知靶位点的选择并避免脱靶效应。该研究评估了在293T和293FT细胞中>100个预测的基因组脱基因座处>700个指导RNA变体和SpCas9诱导的插入缺失突变水平。这些作者示出SpCas9以序列依赖性方式耐受指导RNA与靶DNA之间在不同位置处的错配,对错配的数目、位置和分布敏感。作者进一步表明,SpCas9介导的切割不受DNA甲基化的影响,并且SpCas9和指导RNA的剂量可被滴定为使得脱靶修饰最小化。另外,为了促进哺乳动物基因组工程化应用,这些作者报道提供基于网络的软件工具以指导靶序列的选择和验证连同脱靶分析。
Ran等人(2013-B)描述了用于在哺乳动物细胞中经由非同源末端连接(NHEJ)或同源定向修复(HDR)的Cas9-介导的基因组编辑、连同产生修饰的细胞系(以用于下游功能研究)的一组工具。为了最小化脱靶切割,这些作者进一步描述了一种双-切口策略,使用的是Cas9切口酶突变体与配对的指导RNA。由这些作者提供的方案经实验得出用于选择靶位点、评估切割效率和分析脱靶活性的指南。这些研究显示,以靶设计开始,基因修饰可以在少至1-2周内实现,并且修饰的克隆细胞系可以在2-3周内得以衍生。
Shalem等人描述了一种新的在全基因组范围上探询基因功能的方式。他们的研究显示,递送基因组范围的CRISPR-Cas9敲除(GeCKO)文库利用64,751个独特的指导序列靶向18,080个基因,这使得在人类细胞中阴性和阳性选择筛选两者成为可能。首先,这些作者显示,使用该GeCKO文库来鉴定癌症和多能干细胞中对于细胞活力至关重要的基因。接着,在黑素瘤模型中,这些作者针对基因进行筛选,这些基因的丧失涉及对维罗非尼(一种抑制突变体蛋白激酶BRAF的治疗剂)的抗性。他们的研究显示,最高级候选物包括先前验证的基因NF1和MED12连同新颖的命中物NF2、CUL3、TADA2B和TADA1。这些作者观察到在靶向相同基因的独立指导RNA之间的高水平的一致性以及高比率的命中确认,并且因此证实了采用Cas9进行基因组范围筛选的前景。
Nishimasu等人以2.5A°分辨率报道了与sgRNA及其靶DNA复合的化脓链球菌Cas9的晶体结构。该结构揭示了一种由靶识别和核酸酶叶片组成的两叶片架构,其将sgRNA:DNAn RNA双链体容纳在它们的界面处的带正电的凹槽中。然而识别叶片对于结合sgRNA和DNA是至关重要的,核酸酶叶片含有HNH和RuvC核酸酶结构域,这些结构域适合地被定位为分别用于靶DNA的互补和非互补链的切割。核酸酶叶还含有负责与原间隔区邻近基序(PAM)相互作用的羧基末端结构域。这种高分辨率结构和伴随的功能分析已经揭示了RNA指导的由Cas9进行的DNA靶向的分子机制,由此为合理设计新的通用基因组编辑技术做好准备。
Wu等人标定了在小鼠胚胎干细胞(mESC)中,来自化脓链球菌的无催化活性的Cas9(dCas9)(加载有单一指导RNA(sgRNA))的全基因组结合位点。这些作者显示,测试的四种sgRNA中的每一种将dCas9靶向至数十与数千个之间的基因组位点,这些基因组位点频繁地通过sgRNA中的5-核苷酸种子区和NGG原间隔区邻近基序(PAM)表征。染色质不可接近性降低了dCas9与具有匹配种子序列的其他位点的结合;因此70%的脱靶位点是与基因相关联的。这些作者显示,在用催化活性的Cas9转染的mESC中对295个dCas9结合位点的靶向测序鉴定出超过背景水平的仅一个突变位点。这些作者提出了一种针对Cas9结合和切割的两态模型,其中种子匹配触发了结合但是需要与靶DNA的广泛配对用于切割。
Doench等人创建了sgRNA池,覆盖六个内源性小鼠基因和三个内源性人类基因的一组的全部可能靶位点,并且通过抗体染色和流式细胞术定量地评定了这些sgRNA产生其靶基因的无效等位基因的能力。这些作者显示PAM的优化改善了活性并且还提供了用于设计sgRNA的在线工具。
Shalem等人(2015)描述了无催化活性的Cas9(dCas9)融合用于综合地阻抑(CRISPRi)或激活(CRISPRa)表达的方式,示出使用Cas9用于基因组范围的筛选(包括阵列和合并筛选)的进展、使基因组基因座失活的敲除方法、以及调节转录活性的策略。
Xu等人等人(2015)评定了在基于CRISPR的筛选中促成单一指导RNA(sgRNA)效率的DNA序列特征。这些作者探索了CRISPR-Cas9敲除的效率以及在切割位点处的核苷酸优选性。这些作者还发现对于CRISPRi/a的序列优选性基本上不同于对于CRISPR-Cas9敲除的序列优选性。
Parnas等人(2015)将合并的全基因组CRISPR-Cas9文库引入树突细胞(DC)中,以鉴定控制由细菌脂多糖(LPS)对肿瘤坏死因子(Tnf)的诱导的基因。对Tlr4信号传导的已知调节子和先前未知的候选物进行鉴定,并根据对于对LPS的典型反应的不同效果分成三个功能模块。
Ramanan等人(2015)证明了在受感染细胞中对病毒附加体DNA(cccDNA)的切割。HBV基因组作为3.2kb双链附加体DNA种类存在于受感染的肝细胞的细胞核中,该种类称为共价闭合环状DNA(cccDNA),其是HBV生命周期中的关键组分,其复制不受目前疗法的抑制。这些作者显示特异性靶向HBV的高度保守区的sgRNA稳固地阻遏病毒复制并耗尽cccDNA。
Nishimasu等人(2015)报道了与单一指导RNA(sgRNA)及其双链DNA靶标复合的SaCas9的晶体结构,其含有5'-TTGAAT-3'PAM和5'-TTGGGT-3'PAM。SaCas9与SpCas9的结构比较突出显示出结构保存和差别,解释了它们不同的PAM特异性和直系同源性sgRNA识别。
Canver等人(2015)证明了基于CRISPR-Cas9的非编码基因组元件的功能探索。这些作者开发了合并的CRISPR-Cas9指导RNA文库以进行人类和小鼠BCL11A增强子的原位饱和诱变,这揭示了增强子的关键特征。
Zetsche等人(2015)报道了Cas13的表征,Cas13是来自新凶手弗朗西丝菌(Francisella novicida)U112的2类CRISPR核酸酶,其具有与Cas9不同的特征。Cas13是一种缺乏tracrRNA的单一RNA指导的内切核酸酶,利用富含T的原间隔区邻近基序,并且经由交错的DNA双链断裂切割DNA。
Shmakov等人(2015)报道了三种不同的2类CRISPR-Cas系统。两种系统CRISPR酶(C2c1和C2c3)含有与Cas13远缘相关的RuvC样内切核酸酶结构域。与Cas13不同,C2c1依赖crRNA和tracrRNA两者进行DNA切割。第三种酶(C2c2)含有两个预测的HEPNRNA酶结构域,并且不依赖tracrRNA。
Slaymaker等人(2016)报道了使用结构指导的蛋白质工程化来改善化脓链球菌Cas9(SpCas9)的特异性。这些作者开发了“增强的特异性”SpCas9(eSpCas9)变异体,该变异体维持了稳固的中靶切割,并降低了脱靶效应。
本文提供的方法和工具是针对Cas13示例,Cas13是一种不使用tracrRNA的II型核酸酶。如本文所述,已经在不同的细菌种类中鉴定了Cas13的直系同源物。可以使用本领域中描述的方法鉴定具有类似特性的另外的II型核酸酶(Shmakov等人2015,60:385-397;Abudayeh等人2016,Science,5;353(6299))。在特定实施方案中,此类用于鉴定新颖CRISPR效应蛋白的方法可包括以下步骤:从数据库中选择编码种子的序列,所述种子鉴定CRISPRCas基因座的存在;鉴定位于种子的10kb内、在选定序列中包含开放阅读框(ORF)的基因座;从中选择包含多个ORF的基因座,其中仅单个ORF编码新颖的CRISPR效应子,所述新颖的CRISPR效应子具有大于700个氨基酸并且与已知的CRISPR效应子具有不超过90%的同源性。在特定实施方案中,种子是与CRISPR-Cas系统共用的蛋白质,诸如Cas1。在另外的实施方案中,使用CRISPR阵列作为种子以鉴定新的效应蛋白。
已经证实了本发明的有效性。可以例如通过电穿孔转染包含Cas13和crRNA的预组装重组CRISPR-Cas13复合物,从而产生高突变率且不存在可检测的脱靶突变。Hur,J.K.等人,Targeted mutagenesis in mice by electroporation of Cas13ribonucleoproteins,Nat Biotechnol.2016年6月6日.doi:10.1038/nbt.3596。全基因组分析显示,Cas13具有高度特异性。根据一种量度,在人类HEK293T细胞中确定的Cas13的体外切割位点明显少于SpCas9的体外切割位点。Kim,D.等人,Genome-wide analysisreveals specificities of Cas13 endonucleases in human cells,NatBiotechnol.2016年6月6日.doi:10.1038/nbt.3609。在果蝇中已经证明了采用Cas13的有效多重系统,该系统使用了从包含本发明tRNA的阵列中加工得到的gRNA。Port,F.等人,Expansion of the CRISPR toolbox in an animal with tRNA-flanked Cas9 and Cas13gRNAs.doi:http://dx.doi.org/10.1101/046417。
另外,“Dimeric CRISPR RNA-guided FokI nucleases for highly specificgenome editing”,Shengdar Q.Tsai、Nicolas Wyvekens、Cyd Khayter、JenniferA.Foden、Vishal Thapar、Deepak Reyon、Mathew J.Goodwin、Martin J.Aryee,J.KeithJoung Nature Biotechnology 32(6):569-77(2014)涉及二聚体RNA指导的FokI核酸酶,该酶识别扩展序列并且可以在人类细胞中高效编辑内源性基因。
关于CRISPR-Cas系统、其组分、及此类组分的递送(包括方法、材料、递送媒介物、载体、粒子、以及其制造和使用(包括关于量和配制品)),连同表达CRISPR-Cas的真核细胞、表达CRISPR-Cas的真核生物(诸如小鼠)的一般信息,参考以下:美国专利好号8,999,641、8,993,233、8,697,359、8,771,945、8,795,965、8,865,406、8,871,445、8,889,356、8,889,418、8,895,308、8,906,616、8,932,814和8,945,839;美国专利公布US 2014-0310830(美国申请序列号14/105,031)、US 2014-0287938 A1(美国申请序列号14/213,991)、US 2014-0273234 A1(美国申请序列号14/293,674)、US2014-0273232 A1(美国申请序列号14/290,575)、US 2014-0273231(美国申请序列号14/259,420)、US 2014-0256046 A1(美国申请序列号14/226,274)、US 2014-0248702 A1(美国申请序列号14/258,458)、US 2014-0242700A1(美国申请序列号14/222,930)、US 2014-0242699 A1(美国申请序列号14/183,512)、US2014-0242664 A1(美国申请序列号14/104,990)、US 2014-0234972 A1(美国申请序列号14/183,471)、US 2014-0227787 A1(美国申请序列号14/256,912)、US 2014-0189896 A1(美国申请序列号14/105,035)、US 2014-0186958(美国申请序列号14/105,017)、US 2014-0186919 A1(美国申请序列号14/104,977)、US 2014-0186843 A1(美国申请序列号14/104,900)、US 2014-0179770 A1(美国申请序列号14/104,837)和US 2014-0179006 A1(美国申请序列号14/183,486)、US 2014-0170753(美国申请序列号14/183,429);US 2015-0184139(美国申请序列号14/324,960);14/054,414欧洲专利申请EP 2 771 468(EP13818570.7)、EP 2 764 103(EP13824232.6)和EP 2 784 162(EP14170383.5);以及PCT专利公布WO2014/093661(PCT/U S2013/074743)、WO2014/093694(PCT/US2013/074790)、WO2014/093595(PCT/US2013/074611)、WO2014/093718(PCT/US2013/074825)、WO2014/093709(PCT/US2013/074812)、WO2014/093622(PCT/US2013/074667)、WO2014/093635(PCT/US2013/074691)、WO2014/093655(PCT/US2013/074736)、WO2014/093712(PCT/US2013/074819)、WO2014/093701(PCT/US2013/074800)、WO2014/018423(PCT/US2013/051418)、WO2014/204723(PCT/US2014/041790)、WO2014/204724(PCT/US2014/041800)、WO2014/204725(PCT/US2014/041803)、WO2014/204726(PCT/US2014/041804)、WO2014/204727(PCT/US2014/041806)、WO2014/204728(PCT/US2014/041808)、WO2014/204729(PCT/US2014/041809)、WO2015/089351(PCT/US2014/069897)、WO2015/089354(PCT/US2014/069902)、WO2015/089364(PCT/US2014/069925)、WO2015/089427(PCT/US2014/070068)、WO2015/089462(PCT/US2014/070127)、WO2015/089419(PCT/US2014/070057)、WO2015/089465(PCT/US2014/070135)、WO2015/089486(PCT/US2014/070175)、WO2015/058052(PCT/US2014/061077)、WO2015/070083(PCT/US2014/064663)、WO2015/089354(PCT/US2014/069902)、WO2015/089351(PCT/US2014/069897)、WO2015/089364(PCT/US2014/069925)、WO2015/089427(PCT/US2014/070068)、WO2015/089473(PCT/US2014/070152)、WO2015/089486(PCT/US2014/070175)、WO2016/049258(PCT/US2015/051830)、WO2016/094867(PCT/US2015/065385)、WO2016/094872(PCT/US2015/065393)、WO2016/094874(PCT/US2015/065396)、WO2016/106244(PCT/US2015/067177)。
还提到了2015年6月17日提交的美国申请62/180,709,受保护的指导RNA(PROTECTED GUIDE RNAS(PGRNAS));2014年12月12日提交的美国申请62/091,455,受保护的指导RNA(PROTECTED GUIDE RNAS(PGRNAS));2014年12月24日提交的美国申请62/096,708,受保护的指导RNA(PROTECTED GUIDE RNAS(PGRNAS));2014年12月12日提交的美国申请62/091,462、2014年12月23日提交的美国申请62/096,324、2015年6月17日提交的美国申请62/180,681和2015年10月5日提交的美国申请62/237,496,CRISPR转录因子的死亡指导物(DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS);2014年12月12日提交的美国申请62/091,456和2015年6月17日提交的美国申请62/180,692,用于CRISPR-CAS系统的受护航的和官能化的指导物(ESCORTED AND FUNCTIONALIZED GUIDES FOR CRISPR-CASSYSTEMS);2014年12月12日提交的美国申请62/091,461,用于关于造血干细胞(HSC)的基因组编辑的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE ANDTHERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORGENOME EDITING AS TO HEMATOPOETIC STEM CELLS(HSCs));2014年12月19日提交的美国申请62/094,903,通过基因组范围的插入捕获测序对双链断裂和基因组重排的无偏鉴定(UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BYGENOME-WISE INSERT CAPTURE SEQUENCING);2014年12月24日提交的美国申请62/096,761,用于序列操纵的系统、方法及优化的酶以及指导物支架的工程化(ENGINEERING OFSYSTEMS,METHODS AND OPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCEMANIPULATION);2014年12月30日提交的美国申请62/098,059、2015年6月18日提交的美国申请62/181,641和2015年6月18日提交的美国申请62/181,667,RNA靶向系统(RNA-TARGETING SYSTEM);2014年12月24日提交的美国申请62/096,656和2015年6月17日提交的62/181,151,具有稳定化结构域或与稳定化结构域相关联的CRISPR(CRISPR HAVING ORASSOCIATED WITH DESTABILIZATION DOMAINS);2014年12月24日提交的美国申请62/096,697,具有AAV或与AAV相关联的CRISPR(CRISPR HAVING OR ASSOCIATED WITH AAV);2014年12月30日提交的美国申请62/098,158,工程化CRISPR复合物插入靶向系统(ENGINEEREDCRISPR COMPLEX INSERTIONAL TARGETING SYSTEMS);2015年4月22日提交的美国申请62/151,052,用于胞外核外报告的细胞靶向(CELLULAR TARGETING FOR EXTRACELLULAREXOSOMAL REPORTING);2014年9月24日提交的美国申请62/054,490,使用粒子递送组分靶向病症和疾病的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE ANDTHERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORTARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS);2014年2月12日提交的美国申请61/939,154,用于用优化的功能性CRISPR-CAS系统进行序列操纵的系统、方法和组合物(SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATIONWITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS);2014年9月25日提交的美国申请62/055,484,用于用优化的功能性CRISPR-CAS系统进行序列操纵的系统、方法和组合物(SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZEDFUNCTIONAL CRISPR-CAS SYSTEMS);2014年12月4日提交的美国申请62/087,537,用于用优化的功能性CRISPR-CAS系统进行序列操纵的系统、方法和组合物(SYSTEMS,METHODS ANDCOMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CASSYSTEMS);2014年9月24日提交的美国申请62/054,651,用于对体内多种癌症突变的竞争建模的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE ANDTHERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORMODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO);2014年10月23日提交的美国申请62/067,886,用于对体内多种癌症突变的竞争建模的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THECRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLECANCER MUTATIONS IN VIVO);2014年9月24日提交的美国申请62/054,675和2015年6月17日提交的美国申请62/181,002,在神经元细胞/组织中CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CASSYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES);2014年9月24日提交的美国申请62/054,528,在免疫疾病或病症中CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS IN IMMUNE DISEASES OR DISORDERS);2014年9月25日提交的美国申请62/055,454,用于使用细胞穿透肽(CPP)靶向病症和疾病的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CASSYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELLPENETRATION PEPTIDES(CPP));2014年9月25日提交的美国申请62/055,460,多功能性CRISPR复合物和/或优化的酶连接的功能性CRISPR复合物(MULTIFUNCTIONAL-CRISPRCOMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES);2014年12月4日提交的美国申请62/087,475和2015年6月18日提交的62/181,690,用优化的功能性CRISPR-CAS系统进行功能性筛选(FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONALCRISPR-CAS SYSTEMS);2014年9月25日提交的美国申请62/055,487,用优化的功能性CRISPR-CAS系统进行功能性筛选(FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONALCRISPR-CAS SYSTEMS);2014年12月4日提交的美国申请62/087,546和2015年6月18日提交的62/181,687,多功能性CRISPR复合物和/或优化的酶连接的功能性CRISPR复合物(MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES);2014年12月30日提交的美国申请62/098,285,对肿瘤生长和转移的CRISPR介导的体内建模以及遗传筛选(CRISPR MEDIATED IN VIVO MODELING AND GENETICSCREENING OF TUMOR GROWTH AND METASTASIS)。
提到了2015年6月18日提交的美国申请62/181,659和2015年8月19日提交的美国申请62/207,318,用于序列操纵的CAS9直系同源物和变体的系统、方法、酶和指导物支架的工程化和优化(ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS,ENZYME AND GUIDESCAFFOLDS OF CAS9 ORTHOLOGS AND VARIANTS FOR SEQUENCE MANIPULATION)。提到了2015年6月18日提交的美国申请62/181,663和2015年10月22日提交的美国申请62/245,264,新颖的CRISPR酶和系统(NOVEL CRISPR ENZYMES AND SYSTEMS);2015年6月18日提交的美国申请62/181,675、2015年10月22日提交的美国申请62/285,349、2016年2月17日提交的62/296,522和2016年4月8日提交的美国申请62/320,231,新颖的CRISPR酶和系统(NOVELCRISPR ENZYMES AND SYSTEMS);2015年9月24日提交的美国申请62/232,067、2015年12月18日提交的美国申请14/975,085、欧洲申请号16150428.7、2015年8月16日提交的美国申请62/205,733、2015年8月5日提交的美国申请62/201,542、2015年7月16日提交的美国申请62/193,507和2015年6月18日提交的美国申请62/181,739,其各自的标题为新颖的CRISPR酶和系统(NOVEL CRISPR ENZYMES AND SYSTEMS);以及2015年10月22日提交的美国申请62/245,270,新颖的CRISPR酶和系统(NOVEL CRISPR ENZYMES AND SYSTEMS)。还提到了2014年12月12日提交的美国申请61/939,256和2014年12月12日提交的WO 2015/089473(PCT/US2014/070152),其各自的标题为用于序列操纵的具有新架构的系统、方法和优化的指导物组合物的工程化(ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED GUIDECOMPOSITIONS WITH NEW ARCHITECTURES FOR SEQUENCE MANIPULATION)。还提到了2015年8月15日提交的PCT/US2015/045504、2015年6月17日提交的美国申请62/180,699和2014年8月17日提交的美国申请62/038,358,其各自的标题为使用CAS9切口酶进行基因组编辑(GENOME EDITING USING CAS9 NICKASES)。
这些专利、专利公布和申请的每一者,以及在其中或在它们的审查程序期间引用的所有文献(“申请引用文献”)以及在这些申请引用文献中引用或参考的所有文献,连同其中提到的或在其中任何文献中提到并以引用方式并入本文的针对任何产品的任何说明书、说明、产品规格和产品表,特此以引用方式并入本文,并且可以在本发明的实践中采用。所有文献(例如这些专利、专利公布和申请以及申请引用文献)在如同每个单独文献被确切地且单独地指明为以引用方式并入的相同程度上以引用方式并入本文。
V型CRISPR-Cas蛋白
本申请描述了使用V型CRISPR-Cas蛋白的方法。本文以Cas13为例,由此鉴定了多种直系同源物或同源物。对于本领域技术人员将显而易见的是,可以鉴定其他直系同源物或同源物,并且本文所述的任何功能物可以被工程化为其他直系同源物,包括包含来自多种直系同源物的片段的嵌合酶。
鉴定新颖的CRISPR-Cas基因座的计算方法描述于EP3009511或US2016208243中,并且可包括以下步骤:检测编码Cas1蛋白的所有重叠群;鉴定cas1基因20kB内的所有预测蛋白编码基因;将已鉴定的基因与Cas蛋白特异性谱进行比较,并预测CRISPR阵列;选择含有大于500个氨基酸(>500aa)的蛋白质的未分类候选CRISPR-Cas基因座;使用诸如PSI-BLAST和HHPred的方法分析选定的候选物,以筛选已知的蛋白质结构域,从而鉴定新颖的2类CRISPR-Cas基因座(另参见Schmakov等人2015,Mol Cell.60(3):385-97)。除以上提及的步骤之外,还可以通过在宏基因组学数据库中搜索另外的同源物来另外对候选物进行分析。另外地或可替代地,为了将搜索扩展到非自主的CRISPR-Cas系统,可以使用CRISPR阵列作为种子执行相同的过程。
在一方面,检测编码Cas1蛋白的所有重叠群通过GenemarkS执行,GenemarkS是一种基因预测程序,其如以下进一步描述:“GeneMarkS:a self-training method forprediction of gene starts in microbial genomes.Implications for findingsequence motifs in regulatory regions.”John Besemer,Alexandre Lomsadze andMark Borodovsky,Nucleic Acids Research(2001)29,第2607-2618页,以引用方式并入本文。
在一方面,可以通过将已鉴定的基因与Cas蛋白特异性谱进行比较并根据NCBI保守结构域数据库(CDD)对其进行注释来鉴定所有预测的蛋白质编码基因,CDD是由针对古代结构域和全长蛋白质的完好注释的多序列比对模型集合组成的蛋白质注释资源。这些可作为位置特异性得分矩阵(PSSM)用于经由RPS-BLAST快速鉴定蛋白质序列中的保守结构域。CDD内容物包括NCBI编策的结构域,这些结构域使用3D结构信息来明确地限定结构域边界并为序列/结构/功能关系提供洞见;以及从多个外部来源数据库(Pfam、SMART、COG、PRK、TIGRFAM)导入的结构域模型。在另一方面,使用PILER-CR程序预测CRISPR阵列,PILER-CR程序是用于发现CRISPR重复序列的公共领域软件,如“PILER-CR:fast and accurateidentification of CRISPR repeats”,Edgar,R.C.,BMC Bioinformatics,Jan 20;8:18(2007)所述,该文献以引用方式并入本文。
在另一方面,使用PSI-BLAST(位置特异性迭代基本局部比对搜索工具)来进行逐例分析。PSI-BLAST使用蛋白质-蛋白质BLAST从经检测高于给定得分阈值的序列的多序列比对得出位置特异性得分矩阵(PSSM)或序型。该PSSM用于进一步在数据库中搜索新匹配项,并使用这些新检测到的序列进行更新以进行后续迭代。因此,PSI-BLAST提供了一种检测蛋白质之间远距离关系的手段。
在另一方面,使用HHpred进行逐例分析,HHpred是一种用于序列数据库搜索和结构预测的方法,该方法与BLAST或PSI-BLAST一样容易使用,同时在发现远同源物方面更加灵敏。实际上,HHpred的灵敏度可与目前可用的功能最强大的结构预测服务器相竞争。HHpred是第一台基于序型隐蔽马尔科夫模型(HMM)的成对比较的服务器。大多数传统的序列搜索方法搜索序列数据库(例如UniProt或NR),而HHpred搜索比对数据库(如Pfam或SMART)。这大大简化了多个序列簇而非混乱的单一序列的命中物列表。所有主要的公开可得的序型和比对数据库均可通过HHpred获得。HHpred接受单一查询序列或多重比对作为输入。仅在几分钟内,它就以类似于PSI-BLAST的易于阅读的格式返回搜索结果。搜索选项包括局部或全局比对以及对二级结构相似性评分。HHpred可以生成成对的查询模板序列比对、合并的查询模板多重比对(例如用于传递搜索),以及由MODELLER软件根据HHpred比对计算出的3D结构模型。
Cas13的直系同源物
术语“直系同源物(orthologue)”(在本文中也称为“直系同源物(ortholog)”)和“同系物(homologue)”(本文中也称为“同系物(homolog)”)在本领域中是众所周知的。作为进一步指导,如本文所用的蛋白质的“同系物”是与作为其同系物的蛋白质发挥相同或类似功能的相同种类的蛋白质。同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。如本文所用的蛋白质的“直系同源物”是与作为其直系同源物的蛋白质发挥相同或类似功能的不同种类的蛋白质。直系同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。同源物和直系同源物可以通过同源建模(参见例如Greer,Science第228卷(1985)1055和Blundell等人Eur J Biochem vol 172(1988),513)或“结构BLAST”(Dey F,Cliff Zhang Q,Petrey D,Honig B.Toward a"structural BLAST":usingstructural relationships to infer function.Protein Sci.2013 Apr;22(4):359-66.doi:10.1002/pro.2225.)来鉴定。另参见Shmakov等人(2015)了解在CRISPR-Cas基因座领域中的申请。同源蛋白质可以是但不需要是结构上相关的,或仅是部分结构上相关的。
Cas13基因存在于若干种不同的细菌基因组中,典型地与cas1、cas2和cas4基因以及CRISPR盒(例如新凶手弗朗西丝菌(Francisella cf.novicida)Fx1的FNFX1_1431-FNFX1_1428)在同一基因座中。因此,此推定的新颖CRISPR-Cas系统的布局似乎与II-B型的布局类似。此外,与Cas9类似,Cas13蛋白含有与转座子ORF-B同源的易于鉴定的C端区,并且包含活性的RuvC样核酸酶、富含精氨酸的区和Zn指(不存在于Cas9中)。然而,与Cas9不同,Cas13还存在于没有CRISPR-Cas环境的若干种基因组中,并且其与ORF-B的相对较高相似性表明其可能是转座子组分。表明如果此是真正的CRISPR-Cas系统并且Cas13是Cas9的功能类似物,则其将是新颖CRISPR-Cas类型,即V型(参见Annotation and Classification ofCRISPR-Cas Systems.Makarova KS,Koonin EV.Methods Mol Biol.2015;1311:47-75)。然而,如本文所述,将Cas13指代为亚型V-A以将其与C2c1p区分,该C2c1p不具有相同的结构域结构并且因此被指代为亚型V-B。
本发明涵盖来源于被指代为亚型V-A的Cas13基因座的Cas13效应蛋白的用途。在本文中,此类效应蛋白也称为“Cas13p”,例如Cas13蛋白(并且这种效应蛋白或Cas13蛋白或来源于Cas13基因座的蛋白也称为“CRISPR-Cas蛋白”)。
在特定实施方案中,效应蛋白是来自包括以下的属的生物体的Cas13效应蛋白:链球菌属(Streptococcus)、弯曲杆菌属(Campylobacter)、Nitratifractor、葡萄球菌属(Staphylococcus)、细小棒菌属(Parvibaculum)、罗氏菌属(Roseburia)、奈瑟氏菌属(Neisseria)、葡糖醋杆菌属(Gluconacetobacter)、固氮螺菌属(Azospirillum)、Sphaerochaeta、乳酸杆菌属(Lactobacillus)、真细菌属(Eubacterium)、棒状杆菌属(Corynebacter)、肉杆菌属(Carnobacterium)、红细菌属(Rhodobacter)、李斯特菌属(Listeria)、帕鲁迪菌属(Paludibacter)、梭菌属(Clostridium)、毛螺旋菌科(Lachnospiraceae)、Clostridiaridium、纤毛菌属(Leptotrichia)、弗朗西丝菌属、军团杆菌属(Legionella)、脂环酸芽孢杆菌属(Alicyclobacillus)、甲烷嗜甲基菌属(Methanomethyophilus)、卟啉单胞菌属(Porphyromonas)、普雷沃氏菌属、拟杆菌门(Bacteroidetes)、创伤球菌属(Helcococcus)、钩端螺旋体属(Leptospira)、脱硫弧菌属(Desulfovibrio)、脱硫盐碱杆菌属(Desulfonatronum)、丰佑菌科(Opitutaceae)、肿块芽孢杆菌属(Tuberibacillus)、芽孢杆菌属(Bacillus)、短芽孢杆菌属(Brevibacilus)、甲基杆菌属(Methylobacterium)、丁酸弧菌属(Butyvibrio)、异域菌门菌属(Perigrinibacterium)、副真杆菌属(Pareubacterium)、莫拉氏菌属(Moraxella)、硫微螺菌属(Thiomicrospira)或氨基酸球菌属。在特定实施方案中,Cas13效应蛋白选自选自以下的属的生物体:真细菌属、钩端螺旋体科、纤毛菌属、弗朗西丝菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃氏菌属、钩端螺旋体属、丁酸弧菌属、异域菌门菌属、副真杆菌属、莫拉氏菌属、硫微螺菌属或氨基酸球菌属。
在另外的特定实施方案中,Cas13效应蛋白来自选自以下的生物体:变异链球菌(S.mutans)、无乳链球菌(S.agalactiae)、似马链球菌(S.equisimilis)、血链球菌(S.sanguinis)、肺炎链球菌;空肠弯曲杆菌(C.jejuni)、大肠弯曲杆菌(C.coli);N.salsuginis、N.tergarcus;耳葡萄球菌(S.auricularis)、肉葡萄球菌(S.carnosus);脑膜炎奈瑟氏菌(N.meningitides)、淋病奈瑟氏菌(N.gonorrhoeae);单核增生李斯特菌(L.monocytogenes)、伊氏李斯特菌(L.ivanovii);肉毒梭菌(C.botulinum)、艰难梭菌(C.difficile)、破伤风梭菌(C.tetani)、索氏梭菌(C.sordellii)、稻田氏钩端螺旋体(L.inadai)、土拉弗朗西斯菌(F.tularensis)1、易北普雷沃氏菌(P.albensis)、毛螺科菌(L.bacterium)、解蛋白丁酸弧菌(B.proteoclasticus)、异域菌门菌(P.bacterium)、狗口腔卟啉单胞菌(P.crevioricanis)、解糖胨普雷沃氏菌(P.disiens)和猕猴卟啉单胞菌(P.macacae)。
效应蛋白可包含嵌合效应蛋白,所述嵌合效应蛋白包含来自第一效应蛋白(例如Cas13)直系同源物的第一片段和来自第二效应蛋白(例如Cas13)直系同源物的第二片段,并且其中第一和第二效应蛋白直系同源物是不同的。第一和第二效应蛋白(例如Cas13)直系同源物中的至少一者可以包含来自包括以下的生物体的效应蛋白(例如Cas13):链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳酸杆菌属、真细菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、帕鲁迪菌属、梭菌属、毛螺旋菌科、Clostridiaridium、纤毛菌属、弗朗西丝菌属、军团杆菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃氏菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属、丁酸弧菌属、异域菌门菌属、副真杆菌属、莫拉氏菌属、硫微螺菌属或氨基酸球菌属;例如包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自包括以下的生物体的Cas13:链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳酸杆菌属、真细菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、帕鲁迪菌属、梭菌属、毛螺旋菌科、Clostridiaridium、纤毛菌属、弗朗西丝菌属、军团杆菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌属、卟啉单胞菌属、普雷沃氏菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰佑菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属、丁酸弧菌属、异域菌门菌属、副真杆菌属、莫拉氏菌属、硫微螺菌属或氨基酸球菌属,其中第一片段和第二片段并非来自相同细菌;例如,包含第一片段和第二片段的嵌合效应蛋白,其中第一片段和第二片段各自选自包括以下的生物体的Cas13:变异链球菌、无乳链球菌、似马链球菌、血链球菌、肺炎链球菌;空肠弯曲杆菌、大肠弯曲杆菌;N.salsuginis、N.tergarcus;耳葡萄球菌、肉葡萄球菌;脑膜炎奈瑟氏菌、淋病奈瑟氏菌;单核增生李斯特菌、伊氏李斯特菌;肉毒梭菌、艰难梭菌、破伤风梭菌、索氏梭菌;土拉弗朗西斯菌1、易北普雷沃氏菌、毛螺科菌MC2017 1、解蛋白丁酸弧菌、异域菌门菌GW2011_GWA2_33_10、帕库氏菌GW2011_GWC2_44_17、史密斯氏菌属种SCADC、氨基酸球菌属种BV3L6、毛螺科菌MA2020、候选白蚁甲烷枝原体、挑剔真细菌、牛眼莫拉氏菌237、稻田钩端螺旋体、毛螺科菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌和猕猴卟啉单胞菌,其中第一片段和第二片段并非来自相同细菌。
在更优选的实施方案中,Cas13p来源于选自以下的细菌种类:土拉弗朗西斯菌1、易北普雷沃氏菌、毛螺科菌MC2017 1、解蛋白丁酸弧菌、异域菌门菌GW2011_GWA2_33_10、帕库氏菌GW2011_GWC2_44_17、史密斯氏菌属种SCADC、氨基酸球菌属种BV3L6、毛螺科菌MA2020、候选白蚁甲烷枝原体、挑剔真细菌、牛眼莫拉氏菌237、牛眼莫拉氏菌AAX08_00205、牛眼莫拉氏菌AAX11_00205、丁酸弧菌属种NC3005、硫微螺菌属种XS5、稻田钩端螺旋体、毛螺科菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃氏菌和猕猴卟啉单胞菌。在某些实施方案中,Cas13p来源于选自氨基酸球菌属种BV3L6、毛螺科菌MA2020的细菌种类。在某些实施方案中,效应蛋白来源于土拉弗朗西斯菌1的亚种,包括但不限于土拉弗朗西斯菌新凶手(Novicida)亚种。在某些优选的实施方案中,Cas13p来源于选自以下的细菌种类:氨基酸球菌属种BV3L6、毛螺科菌ND2006、毛螺科菌MA2020、牛眼莫拉氏菌AAX08_00205、牛眼莫拉氏菌AAX11_00205、丁酸弧菌属种NC3005、硫微螺菌属种XS5。
在特定实施方案中,如本文所提及的Cas13的同系物或直系同源物与本文所公开的示例性Cas13蛋白具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cas13的同系物或直系同源物与野生型Cas13具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。在Cas13具有一个或多个突变(是突变的)的情况下,如本文所提及的所述Cas13的同系物或直系同源物与突变的Cas13具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在一个实施方案中,Cas13蛋白可以是包括但不限于以下的属的生物体的直系同源物:氨基酸球菌属种、毛螺科菌或牛眼莫拉氏菌;在特定实施方案中,V型Cas蛋白可以是包括但不限于以下的属的生物体的直系同源物:氨基酸球菌属种BV3L6、毛螺科菌ND2006(LbCas13)或牛眼莫拉氏菌237。在特定实施方案中,如本文所提及的Cas13的同系物或直系同源物与本文所公开的Cas13序列中的一者或多者具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cas13的同系物或直系同源物与野生型FnCas13、AsCas13或LbCas13具有至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。
在特定实施方案中,本发明的Cas13蛋白与FnCas13、AsCas13或LbCas13具有至少60%,更特别地至少70%,诸如至少80%,更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同源性或同一性。在另外的实施方案中,如本文所提及的Cas13蛋白与野生型AsCas13或LbCas13具有至少60%,诸如至少70%,更特别地至少80%、更优选地至少85%、甚至更优选地至少90%,诸如例如至少95%的序列同一性。在特定实施方案中,本发明的Cas13蛋白与FnCas13具有少于60%的序列同一性。技术人员将理解,这包括Cas13蛋白的截短形式,由此在截短形式的长度上确定序列同一性。在特定实施方案中,Cas13酶不是FnCas13。
修饰的Cas13酶
在特定实施方案中,令人感兴趣的是利用本文所定义的工程化的Cas13蛋白(诸如Cas13),其中所述蛋白与包含RNA的核酸分子复合以形成CRISPR复合物,其中当在CRISPR复合物中时,所述核酸分子靶向一个或多个靶多核苷酸基因座,所述蛋白与未修饰的Cas13蛋白相比包含至少一种修饰,并且其中包含修饰的蛋白的CRISPR复合物与包含未修饰的Cas13蛋白的复合物相比具有改变的活性。应当理解,当在本文中提及CRISPR“蛋白”时,Cas13蛋白质优选地是修饰的CRISPR-Cas蛋白(例如,具有增加的或减少的(或没有)酶活性),如非限制地包括Cas13。术语“CRISPR蛋白”可以与“CRISPR-Cas蛋白”互换使用,不论所述CRISPR蛋白与野生型CRISPR蛋白相比是否具有改变的,如增加的或减少的(或没有)酶活性。
Cas13核酸酶一级结构的计算分析揭示了三个不同的区。第一是C端RuvC样结构域,其是仅功能表征的结构域。第二是N端α-螺旋区并且第三是位于RuvC样结构域与α-螺旋区之间的混合的α区和β区。
预测非结构化区的若干小段在Cas13一级结构之内。对于小的蛋白质序列的拆分和插入而言,不同的Cas13直系同源物内的暴露于溶剂且不保守的非结构化区是优选的侧面。另外,这些侧面可以用于在Cas13直系同源物之间产生嵌合蛋白。
基于以上信息,可以产生突变体,这些突变体使得酶失活或将双链核酸酶修饰为具有切口酶活性。在替代实施方案中,此信息用于开发具有减少的脱靶效应的酶(在本文其他地方描述)。
在以上所述的某些Cas13酶中,酶是通过一个或多个残基(在RuvC结构域中)的突变来修饰的,这些残基包括但不限于参照AsCas13(氨基酸球菌属种BV3L6)的氨基酸位置编号的位置R909、R912、R930、R947、K949、R951、R955、K965、K968、K1000、K1002、R1003、K1009、K1017、K1022、K1029、K1035、K1054、K1072、K1086、R1094、K1095、K1109、K1118、K1142、K1150、K1158、K1159、R1220、R1226、R1242和/或R1252。在某些实施方案中,包含所述一个或多个突变的Cas13酶具有修改的,更优选地增加的对靶标的特异性。
在以上所述的某些非天然存在的CRISPR-Cas蛋白中,酶是通过一个或多个残基(在RAD50中)的突变来修饰的,这些残基包括但不限于参照AsCas13(氨基酸球菌属种BV3L6)的氨基酸位置编号的位置K324、K335、K337、R331、K369、K370、R386、R392、R393、K400、K404、K406、K408、K414、K429、K436、K438、K459、K460、K464、R670、K675、R681、K686、K689、R699、K705、R725、K729、K739、K748和/或K752。在某些实施方案中,包含所述一个或多个突变的Cas13酶具有修改的,更优选地增加的对靶标的特异性。
在某些Cas13酶中,酶是通过一个或多个残基的突变来修饰的,这些残基包括但不限于参照AsCas13(氨基酸球菌属种BV3L6)的氨基酸位置编号的位置R912、T923、R947、K949、R951、R955、K965、K968、K1000、R1003、K1009、K1017、K1022、K1029、K1072、K1086、F1103、R1226和/或R1252。在某些实施方案中,包含所述一个或多个突变的Cas13酶具有修改的,更优选地增加的对靶标的特异性。
在某些实施方案中,Cas13酶是通过一个或多个残基的突变来修饰的,这些残基包括但不限于参照LbCas13(毛螺科菌ND2006)的氨基酸位置编号的位置R833、R836、K847、K879、K881、R883、R887、K897、K900、K932、R935、K940、K948、K953、K960、K984、K1003、K1017、R1033、R1138、R1165和/或R1252。在某些实施方案中,包含所述一个或多个突变的Cas13酶具有修改的,更优选地增加的对靶标的特异性。
在某些实施方案中,Cas13酶是通过一个或多个残基的突变来修饰的,这些残基包括但不限于参照AsCas13(氨基酸球菌属种BV3L6)的氨基酸位置编号的位置K15、R18、K26、Q34、R43、K48、K51、R56、R84、K85、K87、N93、R103、N104、T118、K123、K134、R176、K177、R192、K200、K226、K273、K275、T291、R301、K307、K369、S404、V409、K414、K436、K438、K468、D482、K516、R518、K524、K530、K532、K548、K559、K570、R574、K592、D596、K603、K607、K613、C647、R681、K686、H720、K739、K748、K757、T766、K780、R790、P791、K796、K809、K815、T816、K860、R862、R863、K868、K897、R909、R912、T923、R947、K949、R951、R955、K965、K968、K1000、R1003、K1009、K1017、K1022、K1029、A1053、K1072、K1086、F1103、S1209、R1226、R1252、K1273、K1282和/或K1288。在某些实施方案中,包含所述一个或多个突变的Cas13酶具有修改的,更优选地增加的对靶标的特异性。
在某些实施方案中,酶是通过一个或多个残基的突变来修饰的,这些残基包括但不限于参照FnCas13(新凶手弗朗西斯菌U112)的氨基酸位置编号的位置K15、R18、K26、R34、R43、K48、K51、K56、K87、K88、D90、K96、K106、K107、K120、Q125、K143、R186、K187、R202、K210、K235、K296、K298、K314、K320、K326、K397、K444、K449、E454、A483、E491、K527、K541、K581、R583、K589、K595、K597、K613、K624、K635、K639、K656、K660、K667、K671、K677、K719、K725、K730、K763、K782、K791、R800、K809、K823、R833、K834、K839、K852、K858、K859、K869、K871、R872、K877、K905、R918、R921、K932、I960、K962、R964、R968、K978、K981、K1013、R1016、K1021、K1029、K1034、K1041、K1065、K1084和/或K1098。在某些实施方案中,包含所述一个或多个突变的Cas13酶具有修改的,更优选地增加的对靶标的特异性。
在某些实施方案中,酶是通过一个或多个残基的突变来修饰的,这些残基包括但不限于参照LbCas13(毛螺科菌ND2006)的氨基酸位置编号的位置K15、R18、K26、K34、R43、K48、K51、R56、K83、K84、R86、K92、R102、K103、K116、K121、R158、E159、R174、R182、K206、K251、K253、K269、K271、K278、P342、K380、R385、K390、K415、K421、K457、K471、A506、R508、K514、K520、K522、K538、Y548、K560、K564、K580、K584、K591、K595、K601、K634、K640、R645、K679、K689、K707、T716、K725、R737、R747、R748、K753、K768、K774、K775、K785、K787、R788、Q793、K821、R833、R836、K847、K879、K881、R883、R887、K897、K900、K932、R935、K940、K948、K953、K960、K984、K1003、K1017、R1033、K1121、R1138、R1165、K1190、K1199和/或K1208。在某些实施方案中,包含所述一个或多个突变的Cas13酶具有修改的,更优选地增加的对靶标的特异性。
在某些实施方案中,酶是通过一个或多个残基的突变来修饰的,这些残基包括但不限于参照MbCas13(牛眼莫拉氏菌237)的氨基酸位置编号的位置K14、R17、R25、K33、M42、Q47、K50、D55、K85、N86、K88、K94、R104、K105、K118、K123、K131、R174、K175、R190、R198、I221、K267、Q269、K285、K291、K297、K357、K403、K409、K414、K448、K460、K501、K515、K550、R552、K558、K564、K566、K582、K593、K604、K608、K623、K627、K633、K637、E643、K780、Y787、K792、K830、Q846、K858、K867、K876、K890、R900、K901、M906、K921、K927、K928、K937、K939、R940、K945、Q975、R987、R990、K1001、R1034、I1036、R1038、R1042、K1052、K1055、K1087、R1090、K1095、N1103、K1108、K1115、K1139、K1158、R1172、K1188、K1276、R1293、A1319、K1340、K1349和/或K1356。在某些实施方案中,包含所述一个或多个突变的Cas13酶具有修改的,更优选地增加的对靶标的特异性。
在一个实施方案中,Cas13蛋白是通过在参照AsCas13的氨基酸位置编号的S1228处的突变(例如S1228A)来修饰的。参见Yamano等人,Cell 165:949-962(2016),该文献以引用方式整体并入本文。
在某些实施方案中,Cas13蛋白已被修饰以识别非天然PAM,如识别具有以下序列或包含以下序列的PAM:YCN、YCV、AYV、TYV、RYN、RCN、TGYV、NTTN、TTN、TRTN、TYTV、TYCT、TYCN、TRTN、NTTN、TACT、TYCC、TRTC、TATV、NTTV、TTV、TSTG、TVTS、TYYS、TCYS、TBYS、TCYS、TNYS、TYYS、TNTN、TSTG、TTCC、TCCC、TATC、TGTG、TCTG、TYCV或TCTC。在特定实施方案中,所述突变的Cas13包含在AsCas13的位置11、12、13、14、15、16、17、34、36、39、40、43、46、47、50、54、57、58、111、126、127、128、129、130、131、132、133、134、135、136、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、565、566、567、568、569、570、571、572、573、574、575、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、626、627、628、629、630、631、632、633、634、635、636、637、638、642、643、644、645、646、647、648、649、651、652、653、654、655、656、676、679、680、682、683、684、685、686、687、688、689、690、691、692、693、707、711、714、715、716、717、718、719、720、721、722、739、765、768、769、773、777、778、779、780、781、782、783、784、785、786、871、872、873、874、875、876、877、878、879、880、881、882、883、884或1048或在Cas13直系同源物中与其对应的位置处的一个或多个突变的氨基酸残基;优选地包含在位置130、131、132、133、134、135、136、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、570、571、572、573、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、630、631、632、646、647、648、649、650、651、652、653、683、684、685、686、687、688、689或690处的一个或多个突变的氨基酸残基;
在某些实施方案中,Cas13蛋白被修饰成具有增加的活性,即更宽的PAM特异性。在特定实施方案中,Cas13是通过一个或多个残基的突变来修饰的,这些残基包括但不限于AsCas13的位置539、542、547、548、550、551、552、167、604和/或607或AsCas13直系同源物、同系物或变体的相应位置,优选地在542或542和607处的突变的氨基酸残基,其中所述突变优选地为542R和607R,诸如S542R和K607R;或优选地在位置542和548(且任选地552)处的突变的氨基酸残基,其中所述突变优选地为542R和548V(且任选地552R),诸如S542R和K548V(且任选地N552R);或LbCas13的位置532、538、542和/或595,或AsCas13直系同源物、同系物或变体的相应位置,优选地在532或532和595处的突变的氨基酸残基,其中所述突变优选地为532R和595R,诸如G532R和K595R;或优选地在位置532和538(且任选地542)处的突变的氨基酸残基,其中所述突变优选地为532R和538V(且任选地542R),诸如G532R和K538V(且任选地Y542R),最优选地其中所述突变为AsCas13的S542R和K607R、S542R和K548V,或S542R、K548V和N552R。
灭活/失活的Cas13蛋白
在Cas13蛋白具有核酸酶活性的情况下,Cas13蛋白可以被修饰成具有减弱的核酸酶活性,例如,与野生型酶相比,具有至少70%、至少80%、至少90%、至少95%、至少97%或100%的核酸酶失活;或者换句话说,Cas13酶有利地具有非突变型或野生型Cas13酶或CRISPR-Cas蛋白的核酸酶活性的约0%,或不超过非突变型或野生型Cas13酶的核酸酶活性的约3%或约5%或约10%,这些酶例如是属于非突变型或野生型新凶手弗朗西斯菌U112(FnCas13)、氨基酸球菌属种BV3L6(AsCas13)、毛螺科菌ND2006(LbCas13)或牛眼莫拉氏菌237(MbCas13 Cas13酶或CRISPR-Cas蛋白)。有可能通过将突变引入到Cas13及其直系同源物的核酸酶结构域中实现此举。
在本发明的优选实施方案中,使用至少一种Cas13蛋白,其为Cas13切口酶。更特别地,使用Cas13切口酶,其不使靶链产生切口而是能够仅使与靶链互补的链,即在本文中也称为与指导序列不互补的链的非靶DNA链产生切口。更特别地,Cas13切口酶是Cas13蛋白,所述Cas13蛋白包含来自氨基酸球菌属种的Cas13的Nuc结构域中的位置1226A或Cas13直系同源物中的相应位置处的精氨酸突变。在另外的特定实施方案中,该酶包含精氨酸至丙氨酸取代或R1226A突变。本领域技术人员将理解,在酶不是AsCas13的情况下,可以在相应位置的残基处形成突变。在特定实施方案中,Cas13是FnCas13,并且突变是在位置R1218处的精氨酸上。在特定实施方案中,Cas13是LbCas13,并且突变是在位置R1138处的精氨酸上。在特定实施方案中,Cas13是MbCas13,并且突变是在位置R1293处的精氨酸上。
在某些实施方案中,另外地或可替代地使用经工程化的并且可以包含降低或消除核酸酶活性的一个或多个突变的CRISPR-Cas蛋白。FnCas13p RuvC结构域中的氨基酸位置包括但不限于D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A和N1257A。申请人还鉴定了与PD-(D/E)XK核酸酶超家族和HincII样内切核酸酶最类似的推定的第二核酸酶结构域。在此推定的核酸酶结构域中产生的大幅度降低核酸酶活性的点突变包括但不限于N580A、N584A、T587A、W609A、D610A、K613A、E614A、D616A、K624A、D625A、K627A和Y629A。在优选的实施方案中,FnCas13p RuvC结构域中的突变是D917A或E1006A,其中D917A或E1006A突变使FnCas13效应蛋白的DNA切割活性完全失活。在另一个实施方案中,FnCas13p RuvC结构域中的突变是D1255A,其中突变的FnCas13效应蛋白具有明显降低的核溶解活性。
更特别地,失活的Cas13酶包括在AsCas13的氨基酸位置As908、As993、As1263或Cas13直系同源物中的相应位置突变的酶。另外,失活的Cas13酶包括在LbCas13的氨基酸位置Lb832、925、947或1180或Cas13直系同源物中的相应位置突变的酶。更特别地,失活的Cas13酶包括包含AsCas13的突变AsD908A、AsE993A、AsD1263A或Cas13直系同源物中的相应突变中的一个或多个的酶。另外,失活的Cas13酶包括包含LbCas13的突变LbD832A、E925A、D947A或D1180A或Cas13直系同源物中的相应突变中的一个或多个的酶。
突变还可以在邻近残基处,例如在靠近以上指出的参与核酸酶活性的那些的氨基酸处形成。在一些实施方案中,仅RuvC结构域是失活的,而在其他实施方案中,另一推定的核酸酶结构域是失活的,其中效应蛋白复合物充当切口酶并且仅切割一条DNA链。在一个优选的实施方案中,其他推定的核酸酶结构域是HincII样内切核酸酶结构域。
失活的Cas13或Cas13切口酶可以具有缔合的(例如经由融合蛋白)一个或多个功能结构域,包括例如腺苷脱氨酶或其催化结构域。在一些情况下,有利的是另外提供至少一个异源NLS。在一些情况下,将NLS定位在N末端处是有利的。一般来讲,一个或多个功能结构域在失活的Cas13或Cas13切口酶上的定位是允许功能结构域的正确空间取向,从而以属性化的功能效应影响靶标的定位。例如,当功能结构域是腺苷脱氨酶其催化结构域时,腺苷脱氨酶催化结构域被定位成允许其接触靶腺嘌呤并使靶腺嘌呤脱氨基的空间取向。此可以包括除Cas13的N端/C端之外的位置。在一些实施方案中,腺苷脱氨酶蛋白或其催化结构域被插入到Cas13的内环中。
PAM的测定
如下可以确保PAM的测定。此实验与大肠杆菌中的StCas9异源表达的类似工作(Sapranauskas,R.等人Nucleic Acids Res 39,9275-9282(2011))极为相似。申请人将含有PAM和抗性基因两者的质粒引入到异源大肠杆菌中,接着铺板在相应抗生素上。如果存在质粒的DNA切割,则申请人观察不到有活力的菌落。
在进一步细节中,如下针对DNA靶标进行测定。在此测定中使用两种大肠杆菌菌株。一种携带编码来自细菌菌株的内源性效应蛋白基因座的质粒。另一种菌株携带空质粒(例如pACYC184,对照菌株)。将所有可能的7或8bp PAM序列呈递在抗生素抗性质粒(具有氨苄青霉素抗性基因的pUC19)上。将PAM定位成靠近原间隔区1的序列(内源性效应蛋白基因座中的第一间隔区的DNA靶标)。克隆了两个PAM文库。一个具有原间隔区的8个随机bp 5'(例如总的65536个不同PAM序列=复杂度)。另一个文库具有原间隔区的7个随机bp 3'(例如总复杂度是16384个不同的PAM)。将两个文库克隆成具有平均500个质粒/可能的PAM。用5'PAM和3'PAM文库在单独的转化中转化测试菌株和对照菌株并且将转化的细胞分别铺在氨苄青霉素板上。使用质粒的识别和随后的切割/干扰使得细胞对氨苄青霉素易感并且阻止了生长。转化后大约12小时,收获由测试菌株和对照菌株形成的所有菌落并且分离出质粒DNA。使用质粒DNA作为用于PCR扩增和随后的深度测序的模板。未转化的文库中的所有PAM的表现度显示转化细胞中的PAM的预期表现度。对照菌株中发现的所有PAM的表现度显示真实的表现度。测试菌株中的所有PAM的表现度显示哪个PAM未被酶识别并且与对照菌株的比较允许提取出耗尽PAM的序列。
对于某些野生型Cas13直系同源物,已鉴定出以下PAM:氨基酸球菌属种BV3L6Cas13(AsCas13)、毛螺科菌ND2006 Cas13(LbCas13)和易北普雷沃氏菌(PaCas13)可以切割以TTTV PAM开头的靶位点,其中V是A/C或G,FnCas13p可以切割以TTN开头的位点,其中N是A/C/G或T。牛眼莫拉氏菌AAX08_00205、牛眼莫拉氏菌AAX11_00205、丁酸弧菌属种NC3005、硫微螺菌属种XS5或毛螺科菌MA2020 PAM是5’TTN,其中N是A/C/G或T。天然PAM序列是TTTV或BTTV,其中B是T/C或G,V是A/C或G,并且效应蛋白是腔隙莫拉氏菌(Moraxella lacunata)Cas13。
密码子优化的核酸序列
在效应蛋白有待以核酸形式施用的情况下,本申请设想了使用密码子优化的CRISPR-Cas V型蛋白,并且更特别地是Cas13编码核酸序列(和任选地蛋白序列)。在这种情况下,密码子优化的序列的实例是对于在真核生物中表达而优化,例如人类(即,对于在人类中表达而优化),或对于在如本文所论述的另一种真核生物、动物或哺乳动物中表达而优化的序列;参见WO 2014/093622(PCT/US2013/074667)中的作为密码子优化的序列的实例的SaCas9人类密码子优化的序列(根据本领域的知识和本公开,密码子优化的编码核酸分子,尤其是关于效应蛋白(例如Cas13)在技术人员的能力范围之内)。虽然这是优选的,但将了解,其他实例可能存在,并且对于除人类以外的宿主种类的密码子优化或对于特定器官的密码子优化是已知的。在一些实施方案中,编码DNA/RNA-靶向Cas蛋白的酶编码序列对于在特定细胞,诸如真核细胞中表达进行密码子优化。真核细胞可以是特定生物体的那些或来源于特定生物体的那些,所述生物体诸如植物或哺乳动物,包括但不限于人类,或如本文所论述的非人类真核生物或动物或哺乳动物,例如小鼠、大鼠、兔、犬、家畜或非人类哺乳动物或灵长类动物。在一些实施方案中,可以排除有可能不会对人或动物带来任何实质性医学益处的修改人类的种系遗传身份的过程和/或修改动物的遗传身份的过程,以及由此类过程产生的动物。一般来讲,密码子优化是指修饰核酸序列用于增强在目标宿主细胞中的表达的过程,这个过程是通过用在宿主细胞的基因中较频繁或最频繁使用的密码子替代原生序列的至少一个密码子(例如约或大于约1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个密码子),同时维持原生氨基酸序列。不同种类对特定氨基酸的某些密码子展现特定偏性。密码子偏性(生物体之间密码子使用的差异)常常与信使RNA(mRNA)的翻译效率相关,据信所述效率继而尤其取决于所翻译的密码子的特性和特定转移RNA(tRNA)分子的可用性。细胞中所选tRN A的主导性一般反映了肽合成中最频繁使用的密码子。因此,可以基于密码子优化来调整基因用于给定的生物体中最佳基因表达。密码子使用表可容易得到,例如,在www.kazusa.orjp/codon/上可得的“密码子使用数据库(Codon UsageDatabase)”中,并且这些表可以按许多方式进行改编。参见Nakamura,Y.,等人“Codonusage tabulated from the international DNA sequence databases:status for theyear 2000”Nucl.Acids Res.28:292(2000)。对于在特定宿主细胞中表达对特定序列进行密码子优化的计算机算法也可得到,诸如Gene Forge(Aptagen;Jacobus,PA)也可得到。在一些实施方案中,编码DNA/RNA-靶向Cas蛋白的序列中的一个或多个密码子(例如1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个或所有密码子)对应于对于特定氨基酸最频繁使用的密码子。关于酵母中的密码子使用,参考在http://www.yeastgenome.org/community/codon_usage.shtml上可得的在线酵母基因组数据库(online Yeast Genomedatabase);或关于酵母中的密码子选择,参考Bennetzen和Hall,J Biol Chem.1982年3月25日;257(6):3026-31。关于包括藻类在内的植物中的密码子使用,参考Codon usage inhigher plants,green algae,and cyanobacteria,Campbell and Gowri,PlantPhysiol.1990年1月;92(1):1-11.;以及关于植物基因中的密码子使用,参考Murray等人,Nucleic Acids Res.1989年1月25日17(2):477-98;或Selection on the codon bias ofchloroplast and cyanelle genes in different plant and algal lineages,MortonBR,J Mol Evol.1998年4月;46(4):449-59。
在某些示例性实施方案中,CRISPR Cas蛋白选自表1。
表1
在某些示例性实施方案中,CRISPR效应蛋白是选自表2的Cas13a蛋白。
表2
在某些示例性实施方案中,CRISPR效应蛋白是选自表3的Cas13b蛋白。
表3
在某些示例性实施方案中,RNA靶向效应蛋白是如2018年6月26日提交的PCT申请号US18/39595和2017年8月16日提交的PCT申请号US 2017/047193中所公开的Cas13c效应蛋白。Cas13c的示例性野生型直系同源物序列在下表4B中提供。在某些示例性实施方案中,CRISPR效应蛋白是来自表4a或表4b的Cas13c蛋白。
表4a
表4B
在一些实施方案中,Cas13蛋白是Cas13d蛋白。Yan等人Molecular Cell,70,327-339(2018)。
在一些实施方案中,可以将AD官能化的CRISPR-Cas系统的组分以各种形式递送,这些形式诸如有DNA/RNA或RNA/RNA或蛋白质RNA的组合。例如,可以将Cas13蛋白作为DNA编码多核苷酸或RNA编码多核苷酸或作为蛋白质递送。可以将指导物作为DNA编码多核苷酸或RNA递送。设想了所有可能的组合,包括混合的递送形式。
工程化组合物的递送
在一些方面,本发明提供了包括以下步骤的方法:向宿主细胞递送一种或多种多核苷酸(诸如本文所述的一种或多种载体)、其一种或多种转录物和/或由其转录的一种或多种蛋白质。
载体
一般来讲,术语“载体”是指能够转运它所连接的另一个核酸的核酸分子。载体是复制子,诸如质粒、噬菌体或粘粒,可以向该复制子中插入另一个DNA区段以便使得该插入的区段复制。通常,载体在与适当控制元件缔合时能够复制。载体包括但不限于单链、双链或部分双链的核酸分子;包含一个或多个游离端、不包含游离端(例如环状)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域中已知的多核苷酸的其他种类。一种类型的载体是“质粒”,其是指环状双链DNA环,可以诸如通过标准分子克隆技术向该环中插入另外的DNA区段。另一种类型的载体是病毒载体,其中病毒来源的DNA或RNA序列存在于包装到病毒(例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)中的载体中。病毒载体还包括由转染到宿主细胞中的病毒携带的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如非附加型哺乳动物载体)在引入到宿主细胞中之后被整合到宿主细胞的基因组中,并且因此随着宿主基因组一起复制。此外,某些载体能够引导它们可操作地连接的基因的表达。此类载体在本文中称为“表达载体”。用于真核细胞并且在真核细胞中产生表达的载体在本文中可以称为“真核表达载体”。在重组DNA技术中有效用的常用表达载体常常呈质粒的形式。
重组表达载体可以包含处于适于在宿主细胞中表达核酸的形式的本发明的核酸,这意味着重组表达载体包含一个或多个调控元件,这些调控元件可以基于用于表达的宿主细胞来选择,可操作地连接至有待表达的核酸序列。在重组表达载体内,“可操作地连接”旨在意指目标核苷酸序列以允许核苷酸序列表达(例如,在体外转录/翻译系统中或当该载体被引入到宿主细胞时在宿主细胞中)的方式连接至一个或多个调控元件。有利的载体包括慢病毒和腺伴随病毒并且此类载体类型还可以被选择用于靶向特定细胞类型。
关于重组和克隆方法,提及2004年9月2日以US 2004-0171156 A1公布的美国专利申请10/815,730,该专利的内容以引用方式整体并入本文。
术语“调控元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)以及其他表达控制元件(例如转录终止信号,诸如多聚腺苷酸化信号和聚U序列)。此类调控元件描述于例如Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,AcademicPress,San Diego,Calif.(1990)。调控元件包括引导核苷酸序列在许多类型的宿主细胞中连续表达的那些元件和引导核苷酸序列仅在某些宿主细胞中表达的那些元件(例如组织特异性调控序列)。组织特异性启动子可以引导主要在希望的目标组织诸如肌肉、神经元、骨骼、皮肤、血液、特定器官(例如肝脏、胰脏)、或特定细胞类型(例如淋巴细胞)中的表达。调控元件还可以时间依赖性方式诸如细胞周期依赖性或发育阶段依赖性方式引导表达,这可以是或也可以不是组织特异性或细胞类型特异性的。在一些实施方案中,载体包含一个或多个pol III启动子(例如1个、2个、3个、4个、5个或更多个pol III启动子)、一个或多个polII启动子(例如1个、2个、3个、4个、5个或更多个pol II启动子)、一个或多个pol I启动子(例如1个、2个、3个、4个、5个或更多个pol I启动子)或它们的组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录病毒劳斯氏肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见例如Boshart等人,Cell,41:521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。术语“调控元件”还涵盖增强子元件,诸如WPRE;CMV增强子;HTLV-I的LTR中的R-U5’区段(Mol.Cell.Biol.,第8(1)卷,第466-472页,1988);SV40增强子;以及兔β-球蛋白的外显子2与3之间的内含子序列(Proc.Natl.Acad.Sci.USA.,第78(3)卷,第1527-31页,1981)。本领域技术人员将了解的是,表达载体的设计可以取决于诸如有待转化的宿主细胞的选择、所希望的表达水平等因素。载体可以引入到宿主细胞中从而产生由本文所述的核酸编码的转录物、蛋白质或肽,包括融合蛋白或肽(例如,成簇的规律间隔的短回文重复序列(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。关于调控序列,提及美国专利申请10/491,026,该专利的内容以引用方式整体并入本文。关于启动子,提及PCT公布WO 2011/028929和美国申请12/511,940,这些专利的内容以引用方式整体并入本文。
有利的载体包括慢病毒和腺伴随病毒并且此类载体类型还可以被选择用于靶向特定细胞类型。
在特定实施方案中,使用融合至腺苷脱氨酶的指导RNA和(任选地修饰或突变的)CRISPR-Cas蛋白的双顺反子载体。融合至腺苷脱氨酶的指导RNA和(任选地修饰或突变的)CRISPR-Cas蛋白的双顺反子表达载体是优选的。一般来讲且具体地讲,在此实施方案中,融合至腺苷脱氨酶的(任选地修饰或突变的)CRISPR-Cas蛋白优选地通过CBh启动子驱动。RNA可以优选地通过Pol III启动子诸如U6启动子驱动。理想的是,将两者结合。
载体可以被设计为在原核细胞或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白质或酶)。例如,CRISPR转录物可以在细菌细胞(诸如大肠杆菌)、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中表达。合适的宿主细胞在Goeddel,GENEEXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)中进一步论述。或者,重组表达载体可以例如使用T7启动子调控序列和T7聚合酶来进行体外转录和翻译。
载体可以在原核生物或原核细胞中引入并增殖。在一些实施方案中,使用原核生物扩增有待引入到真核细胞中的载体拷贝或者作为产生有待引入到真核细胞中的载体的中间载体(例如,扩增作为病毒载体包装系统的一部分的质粒)。在一些实施方案中,使用原核生物扩增载体拷贝并表达一种或多种核酸,如以便提供用于递送至宿主细胞或宿主生物体的一种或多种蛋白质来源。原核生物中的蛋白质表达最常在大肠杆菌中利用含有引导融合蛋白或非融合蛋白表达的组成型启动子或诱导型启动子的载体进行。融合载体将许多氨基酸添加到其中编码的蛋白质,诸如添加到重组蛋白的氨基末端。此类融合载体可以用于一种或多种目的,诸如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解度;以及(iii)通过充当亲和纯化中的配体来帮助纯化重组蛋白。通常,在融合表达载体中,蛋白水解切割位点被引入在融合部分与重组蛋白的接点处,以使得重组蛋白能够与融合部分分离,从而随后纯化该融合蛋白。此类酶及其同源识别序列包括因子Xa、凝血酶以及肠激酶。示例性融合表达载体包括pGEX(Pharmacia Biotech Inc;Smith and Johnson,1988.Gene 67:31-40)、pMAL(New England Biolabs,Beverly,Mass.)以及pRIT5(Pharmacia,Piscataway,N.J.),它们分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A融合至靶重组蛋白。合适的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann等人,(1988)Gene 69:301-315)和pET 11d(Studier等人,GENE EXPRESSION TECHNOLOGY:METHODS INENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)60-89)。在一些实施方案中,载体是酵母表达载体。用于在酵母酿酒酵母中表达的载体的实例包括pYepSec1(Baldari等人,1987.EMBO J.6:229-234)、pMFa(Kuijan和Herskowitz,1982.Cell 30:933-943)、pJRY88(Schultz等人,1987.Gene 54:113-123)、pYES2(Invitrogen Corporation,SanDiego,Calif.)以及picZ(InVitrogen Corp,San Diego,Calif.)。在一些实施方案中,载体使用杆状病毒表达载体驱动昆虫细胞中的蛋白质表达。可用于在培养的昆虫细胞(例如SF9细胞)表达蛋白质的杆状病毒载体包括pAc系列(Smith等人,1983.Mol.Cell.Biol.3:2156-2165)和pVL系列(Lucklow和Summers,1989.Virology 170:31-39)。
在一些实施方案中,载体能够使用哺乳动物表达载体驱动一种或多种序列在哺乳动物细胞中的表达。哺乳动物表达载体的实例包括pCDM8(Seed,1987.Nature 329:840)和pMT2PC(Kaufman等人,1987.EMBO J.6:187-195)。当用于哺乳动物细胞时,表达载体的控制功能典型地是由一个或多个调控元件提供的。例如,常用的启动子是来源于多瘤、腺病毒2、巨细胞病毒、猿猴病毒40,以及在此披露和本领域已知的其他来源。对于原核细胞和真核细胞二者的其他合适表达系统,参见例如Sambrook等人,MOLECULAR CLONING:A LABORATORYMANUAL.第2版,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1989中的第16章和第17章。
在一些实施方案中,重组哺乳动物表达载体能够引导核酸优先在特定细胞类型中表达(例如,组织特异性调控元件用于表达核酸)。组织特异性调控元件在本领域中是已知的。合适的组织特异性启动子的非限制性实例包括白蛋白启动子(肝脏特异性;Pinkert等人,1987.Genes Dev.1:268-277)、淋巴特异性启动子(Calame和Eaton,1988.Adv.Immunol.43:235-275)(具体地说T细胞受体)(Winoto和Baltimore,1989.EMBOJ.8:729-733)和免疫球蛋白(Baneiji等人,1983.Cell 33:729-740;Queen和Baltimore,1983.Cell 33:741-748)的启动子)、神经元特异性启动子(例如神经丝启动子;Byrne和Ruddle,1989.Proc.Natl.Acad.Sci.USA 86:5473-5477)、胰腺特异性启动子(Edlund等人,1985.Science 230:912-916),以及乳腺特异性启动子(例如乳清启动子;美国专利号4,873,316和欧洲申请公布号264,166)。还涵盖发育调节的启动子,例如鼠hox启动子(Kessel和Gruss,1990.Science 249:374-379)和α-胎蛋白启动子(Campes和Tilghman,1989.GenesDev.3:537-546)。关于这些原核载体和真核载体,提及美国专利6,750,059,该专利的内容以引用方式整体并入本文。本发明的其他实施方案可以涉及病毒载体的使用,关于此使用提及美国专利申请13/092,085,该专利的内容以引用方式整体并入本文。组织特异性调控元件在本领域中是已知的,并且就这一点而言,提及美国专利7,776,321,该专利的内容以引用方式整体并入本文。在一些实施方案中,调控元件可操作地连接至CRISPR系统的一个或多个元件,以便驱动该CRISPR系统的一个或多个元件表达。
在一些实施方案中,驱动核酸靶向系统的一个或多个元件表达的一种或多种载体被引入到宿主细胞中,以使得该核酸靶向系统的这些元件的表达能引导核酸靶向复合物在一个或多个靶位点处形成。例如,核酸靶向效应蛋白和核酸靶向指导RNA可以各自可操作地连接至单独载体上的单独调控元件。核酸靶向系统的一种或多种RNA可以被递送至转基因核酸靶向效应蛋白动物或哺乳动物,例如组成型地或诱导型地或条件型地表达核酸靶向效应蛋白的动物或哺乳动物;或以其他方式表达核酸靶向效应蛋白或具有含有核酸靶向效应蛋白的细胞的动物或哺乳动物,诸如通过在先向这些动物或哺乳动物施用编码或体内表达核酸靶向效应蛋白的一种或多种载体的方式。或者,从相同或不同调控元件表达的这些元件的两种或更多种可以组合在单一载体中,其中一种或多种另外的载体提供核酸靶向系统在第一载体中不包含的任何组分。组合于单一载体中的核酸靶向系统元件可以布置为任何适合的取向,诸如一个元件位于相对于第二元件的5'(“上游”)或相对于该第二元件的3'(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的相同链或相反链上,并且取向为相同或相反方向。在一些实施方案中,单一启动子驱动编码核酸靶向效应蛋白的转录物和嵌入一个或多个内含子序列之内(例如,各自在不同内含子中、两个或更多个在至少一个内含子中,或所有在单一内含子中)的核酸靶向指导RNA的表达。在一些实施方案中,核酸靶向效应蛋白和核酸靶向指导RNA可以可操作地连接至同一启动子并且从该同一启动子表达。用于表达核酸靶向系统的一个或多个元件的递送媒介物、载体、粒子、纳米粒子、配制品以及其组分如在前述文献诸如WO2014/093622(PCT/US2013/074667)中所使用的。在一些实施方案中,载体包含一个或多个插入位点,诸如限制性内切核酸酶识别序列(也称之为“克隆位点”)。在一些实施方案中,一个或多个插入位点(例如,约或超过约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个插入位点)位于一种或多种载体的一个或多个序列元件的上游和/或下游。当使用多个不同的指导序列时,可以使用单一表达构建体来使核酸靶向活性靶向细胞内的多个不同的相应靶序列。例如,单一载体可以包含约或超过约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个或更多个指导序列。在一些实施方案中,可以提供约或超过约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个含有此指导序列的载体,并且任选地将其递送至细胞中。在一些实施方案中,载体包含可操作地连接至编码核酸靶向效应蛋白的酶编码序列的调控元件。可以单独地递送核酸靶向效应蛋白或一种或多种核酸靶向指导RNA;并且有利的是经由粒子复合物递送这些中的至少一者。核酸靶向效应蛋白mRNA可以在核酸靶向指导RNA之前递送,以给出时间以待核酸靶向效应蛋白表达。核酸靶向效应蛋白mRNA可以在施用核酸靶向指导RNA之前1-12小时(优选约2-6小时)施用。或者,核酸靶向效应蛋白mRNA和核酸靶向指导RNA可以一起施用。有利地,指导RNA的第二加强剂量可以在初始施用核酸靶向效应蛋白mRNA+指导RNA之后1-12小时(优选约2-6小时)施用。为了实现最有效的基因组修饰水平,核酸靶向效应蛋白mRNA和/或指导RNA的附加施用可能是有用的。
常规的基于病毒和非病毒的基因转移方法可以用于在哺乳动物细胞或靶组织中引入核酸。此类方法可以用于向培养基或宿主生物体中的细胞施用编码核酸靶向系统的组分的核酸。非病毒载体递送系统包括DNA质粒、RNA(例如本文所述的载体的转录物)、裸核酸,以及与递送媒介物诸如脂质体复合的核酸。病毒载体递送系统包括DNA和RNA病毒,这些病毒在递送至细胞后具有附加型基因组或整合型基因组。对于基因疗法程序的综述,参见Anderson,Science 256:808-813(1992);Nabel和Felgner,TIBTECH 11:211-217(1993);Mitani和Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer和Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada等人,CurrentTopics in Microbiology and Immunology,Doerfler和(编辑)(1995);以及Yu等人,Gene Therapy 1:13-26(1994)。
非病毒递送核酸的方法包括包括脂质转染、核转染、微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸轭缀合物、裸DNA、人工病毒体以及剂增强DNA摄取。脂质转染描述于例如美国专利号5,049,386、4,946,787;以及4,897,355)并且脂质转染试剂是商业上销售的(例如TransfectamTM和LipofectinTM)。适于多核苷酸的有效受体识别脂质转染的阳离子脂质和中性脂质包括Felgner,WO 91/17424;WO 91/16024的那些。递送可以是递送至细胞(例如体外或离体施用)或靶组织(例如体内施用)。
质粒递送涉及将指导RNA克隆到CRISPR-Cas蛋白表达质粒中,并在细胞培养物中转染DNA。质粒主链是商业上可得的,并且不需要特定的设备。它们的优势为是模块化的,能够携带不同尺寸的CRISPR-Cas编码序列(包括编码更大尺寸蛋白质的序列)以及选择标记物。同时质粒的优点是它们可以确保瞬时但持续的表达。然而,质粒的递送不是直接的,使得体内效率通常很低。持续表达也可能是不利的,因为这可以增加脱靶编辑。另外,CRISPR-Cas蛋白的过度积累可能对细胞有毒。最后,质粒总是具有在宿主基因组中随机整合dsDNA的风险,更特别地是考虑到产生双链断裂(中靶和脱靶)。
脂质:核酸复合物(包括靶向脂质体,诸如免疫脂质复合物)的制备是本领域技术人员所熟知的(参见例如Crystal,Science 270:404-410(1995);Blaese等人,Cancer GeneTher.2:291-297(1995);Behr等人,Bioconjugate Chem.5:382-389(1994);Remy等人,Bioconjugate Chem.5:647-654(1994);Gao等人,Gene Therapy 2:710-722(1995);Ahmad等人,Cancer Res.52:4817-4820(1992);美国专利4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。对此将在下文更详细地论述。
使用用于递送核酸的基于RNA或DNA病毒的系统利用了用于将病毒靶向身体内的特定细胞并且将病毒有效负载运输到核内的高度进化的方法。病毒载体可以直接施用至患者(体内),或者它们可以用于体外处理细胞,并且修饰的细胞可以任选地施用至患者(离体)。常规的基于病毒的系统可以包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒以及单纯疱疹病毒载体。通过逆转录病毒、慢病毒以及腺相关病毒基因转移方法整合在宿主基因组中是可能的,这常常导致插入的转基因长期表达。另外,已经在许多不同的细胞类型和靶组织中观察到高转导效率。
可以通过并入外源包膜蛋白,扩展靶细胞的潜在靶群体而改变逆转录病毒的向性。慢病毒载体是能够转导或感染非分裂细胞并典型地产生较高病毒效价的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将取决于靶组织。逆转录病毒载体由顺式作用长末端重复序列组成,这些长末端重复序列具有包装多达6-10kb的外源序列的能力。最低量的顺式作用LTR对于载体的复制和包装而言是足够的,然后使用这些载体将治疗基因整合到靶细胞中,以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人类免疫缺陷病毒(HIV)以及它们的组合的那些(参见例如Buchscher等人,J.Virol.66:2731-2739(1992);Johann等人,J.Virol.66:1635-1640(1992);Sommnerfelt等人,Virol.176:58-59(1990);Wilson等人,J.Virol.63:2374-2378(1989);Miller等人,J.Virol.65:2220-2224(1991);PCT/US94/05700)。
在瞬时表达是优选的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有极高转导效率并且无需细胞分裂。用此类载体,已经获得了较高的效价和表达水平。可以在相对简单的系统中大量地产生此载体。还可以使用腺相关病毒(“AAV”)载体转导具有靶核酸的细胞,例如,在体外产生核酸和肽,以及用于体内和离体基因疗法程序(参见例如West等人,Virology 160:38-47(1987);美国专利号4,797,368;WO93/24641;Kotin,Human Gene Therapy 5:793-801(1994);Muzyczka,J.Clin.Invest.94:1351(1994)。重组AAV载体的构建描述于许多出版物中,包括美国专利号5,173,414;Tratschin等人,Mol.Cell.Biol.5:3251-3260(1985);Tratschin等人,Mol.Cell.Biol.4:2072-2081(1984);Hermonat和Muzyczka,PNAS 81:6466-6470(1984);以及Samulski等人,J.Virol.63:03822-3828(1989)。
本发明提供了含有以下各项或基本上由以下各项组成的AAV:编码CRISPR系统的外源性核酸分子,例如包含第一盒或由该第一盒组成的多个盒,该第一盒包含启动子、编码CRISPR-相关(Cas)蛋白(推定的核酸酶或解旋酶蛋白)(例如Cas13)的核酸分子和终止子或基本上由其组成,以及两个或更多个、有利地多至载体的包装尺寸限度,例如总计(包括该第一盒在内)五个包含启动子、编码指导RNA(gRNA)的核酸分子和终止子或基本上由其组成的盒(例如,每个盒示意性地表示为启动子-gRNA1-终止子、启动子-gRNA2-终止子...启动子-gRNA(N)-终止子,其中N是可以插入的数值,该数值是载体包装尺寸限度的上限);或者两个或更多个单独的rAAV,其各自含有CRISPR系统的一个或多于一个盒,例如第一rAAV含有包含启动子、编码Cas例如Cas(Cas13)的核酸分子和终止子或基本上由其组成的第一盒,并且第二rAAV含有一个或多个各自包含启动子、编码指导RNA(gRNA)的核酸分子和终止子或基本上由其组成的盒(例如,每个盒示意性地表示为启动子-gRNA1-终止子、启动子-gRNA2-终止子...启动子-gRNA(N)-终止子,其中N是可以插入的数值,该数值是载体包装尺寸限度的上限)。或者,由于Cas13可以处理自己的crRNA/gRNA,因此可以使用单一crRNA/gRNA阵列用于多重基因编辑。因此,rAAV可以含有单个包含启动子、多个crRNA/gRNA和终止子或基本上由其组成的表达盒(例如,示意性地表示为启动子-gRNA1-gRNA2…gRNA(N)终止子,其中N是可以插入的数值,该数值是载体包装尺寸限度的上限),而不是包括多个盒来递送gRNA。参见Zetsche等人Nature Biotechnology 35,31-34(2017),该文献以引用方式整体并入本文。由于rAAV是DNA病毒,因此本文关于AAV或rAAV的论述中的核酸分子有利地是DNA。在一些实施方案中,启动子有利地是人类突触蛋白I启动子(hSyn)。用于将核酸递送至细胞的另外的方法是本领域技术人员已知的。参见例如US20030087817,该专利以引用方式并入本文。
在另一个实施方案中,考虑了科卡尔(Cocal)水泡病毒包膜假型化逆转录病毒载体粒子(参见例如转让给Fred Hutchinson Cancer Research Center的美国专利公布号20120164118)。科卡尔病毒属于水泡病毒属,并且是哺乳动物水疱性口炎的致病物。科卡尔病毒最初从特立尼达拉岛(Trinidad)的螨虫中分离(Jonkers等人,Am.J.Vet.Res.25:236-242(1964)),并且在特立尼达拉岛、巴西和阿根廷已经确定了由昆虫、牛和马引起的感染。感染哺乳动物的许多水泡病毒已从天然感染的节肢动物中分离,这表明它们是载体传播(vector-borne)的。水泡病毒抗体在生活于农村地区的人中是常见的,而这些病毒是地方性的并且是实验室采集的;人类的感染通常导致流感样症状。科卡尔病毒包膜糖蛋白与印第安纳VSV-G享有71.5%氨基酸水平的一致性,并且对水泡病毒的包膜基因的系统发育比较显示科卡尔病毒在血清学上不同于水泡病毒内的印第安纳VSV-G株,但与其紧密相关。Jonkers等人,Am.J.Vet.Res.25:236-242(1964)以及Travassos da Rosa等人,Am.J.Tropical Med.&Hygiene 33:999-1006(1984)。科卡尔水泡病毒包膜蛋白假型化逆转录病毒载体粒子可以包括慢病毒、α逆转录病毒、β逆转录病毒、γ逆转录病毒、δ逆转录病毒以及ε逆转录病毒载体粒子,这些载体粒子可以包含逆转录病毒Gag、Pol,和/或一种或多种辅助蛋白以及科卡尔水泡病毒包膜蛋白。在这些实施方案的某些方面,Gag、Pol和辅助蛋白是慢病毒和/或γ逆转录病毒。
在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染宿主细胞。在一些实施方案中,当细胞天然地出现在受试者体内(任选地有待重新引入其中)时将其转染。在一些实施方案中,转染的细胞是从受试者获得。在一些实施方案中,细胞来源于从受试者获得的细胞,诸如细胞系。用于组织培养的多种多样的细胞系在本领域中是已知的。细胞系的实例包括但不限于C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚成纤维细胞、3T3 Swiss、3T3-L1、132-d5人类胎儿成纤维细胞;10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1cells、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、Vero cells、WM39、WT-49、X63、YAC-1、YAR,以及它们的转基因品种。细胞系可从本领域技术人员已知的多种来源获得(参见例如美国典型培养物保藏中心(ATCC)(Manassus,Va.))。
在特定实施方案中,AD官能化的CRISPR系统的一种或多种组分的瞬时表达和/或存在可能是令人感兴趣的,诸如用以减少脱靶效应。在一些实施方案中,用本文所述的一种或多种载体转染的细胞用于建立包含一种或多种载体来源的序列的新细胞系。在一些实施方案中,使用用如本文所述的AD官能化的CRISPR系统的组分瞬时转染(诸如通过一种或多种载体进行瞬时转染,或用RNA进行转染)并且通过CRISPR复合物的活性修饰的细胞建立细胞系,所述细胞系包含含有修饰但缺少任何其他外源性序列的细胞。在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染的细胞,或来源于此类细胞的细胞系用于评定一种或多种测试化合物。
在一些实施方案中,设想将RNA和/或蛋白质直接引入宿主细胞。例如,可以将CRISPR-Cas蛋白作为编码mRNA与体外转录的指导RNA一起递送。此类方法可以减少确保CRISPR-Cas蛋白起效的时间,并且进一步防止CRISPR系统组分的长期表达。
在一些实施方案中,本发明的RNA分子以脂质体或转化脂(lipofectin)脂质转染蛋白配制品递送,并且可以通过本领域技术人员所熟知的方法来制备。此类方法描述于例如美国专利5,593,972、5,589,466和5,580,859,这些专利以引用方式并入本文。已开发了特别旨在增强并改善siRNA到哺乳动物细胞的递送的递送系统(参见例如Shen等人FEBSLet.2003,539:111-114;Xia等人,Nat.Biotech.2002,20:1006-1010;Reich等人,Mol.Vision.2003,9:210-216;Sorensen等人,J.Mol.Biol.2003,327:761-766;Lewis等人,Nat.Gen.2002,32:107-108以及Simeoni等人,NAR 2003,31,11:2717-2724),并且这些递送系统可以适用于本发明。siRNA最近已成功用于抑制灵长类动物中的基因表达(参见,例如Tolentino等人,Retina 24(4):660,该文献也可以适用于本发明)。
实际上,RNA递送是可用的体内递送方法。有可能使用脂质体或纳米粒子将Cas13、腺苷脱氨酶和指导RNA递送至细胞中。因此,CRISPR-Cas蛋白(诸如Cas13)的递送、腺苷脱氨酶(其可以融合至CRISPR-Cas蛋白或衔接蛋白)的递送和/或本发明的RNA的递送可以可以呈RNA形式并且经由微泡、脂质体或一个粒子或多个粒子来进行。例如,可以将Cas13 mRNA、腺苷脱氨酶mRNA和指导RNA包装到脂质体粒子中以进行体内递送。脂质体转染试剂诸如来自Life Technologies的lipofectamine和市场上的其他试剂可以有效地将RNA分子递送至肝脏中。
RNA递送手段还优选包括经由粒子的RNA递送(Cho,S.、Goldberg,M.、Son,S.、Xu,Q.、Yang,F.、Mei,Y.、Bogatyrev,S.、Langer,R.和Anderson,D.,Lipid-likenanoparticles for small interfering RNA delivery to endothelial cells,Advanced Functional Materials,19:3112-3118,2010)或经由外泌体的递送(Schroeder,A.、Levins,C.、Cortez,C.、Langer,R.和Anderson,D.,Lipid-based nanotherapeuticsfor siRNA delivery,Journal of Internal Medicine,267:9-21,2010,PMID:20059641)。实际上,已显示外泌体在递送siRNA中特别有用,其为与CRISPR系统有一些相似之处的系统。例如,El-Andaloussi S等人(“Exosome-mediated delivery of siRNA in vitro andin vivo.”Nat Protoc.2012年12月;7(12):2112-26.doi:10.1038/nprot.2012.131.电子版2012年11月15日)描述了外泌体如何成为用于跨不同生物屏障的药物递送的有希望的工具并且可以用于体外和体内递送siRNA。他们的方法是通过包含与肽配体融合的外泌体蛋白的表达载体的转染来产生靶向的外泌体。然后将这些外泌体纯化并且由转染的细胞上清液进行表征,然后将RNA加载到外泌体中。根据本发明的递送或施用可以使用外泌体进行,特别地但不限于脑。维生素E(α-生育酚)可以与CRISPR Cas缀合并且与高密度脂蛋白(HDL)一起递送至脑,方式为例如与(Uno)等人(HUMAN GENE THERAPY 22:711-719(2011年6月))完成的用于将短干扰RNA(siRNA)递送至脑的方式类似。经由填充有磷酸盐缓冲盐水(PBS)或游离TocsiBACE或Toc-siBACE/HDL并且与脑灌注试剂盒3(Brain Infusion Kit 3)(Alzet)连接的微型渗透泵(型号1007D;Alzet,Cupertino,CA)灌注小鼠。将脑灌注插管置于在正中线的前囱的后方约0.5mm,以便灌注到背侧第三脑室中。Uno等人发现,通过相同的ICV灌注方法,少至3nmol的Toc-siRNA与HDL可以诱导相当程度的靶标减少。在本发明中对于人类可以考虑类似剂量的缀合至α-生育酚并且与HDL共同施用靶向脑的CRISPR Cas,例如,可以考虑靶向脑的约3nmol至约3μmol的CRISPR Cas。Zou等人((HUMAN GENE THERAPY22:465-475(April 2011))描述了靶向PKCγ的短发夹RNA的慢病毒介导的递送方法,其用于在大鼠脊髓中的体内基因沉默。Zou等人通过鞘内导管施用约10μl的具有1x109个转导单位(TU)/ml的滴度的重组慢病毒。在本发明中对于人类可以考虑类似剂量的靶向脑的在慢病毒载体中表达的CRISPR Cas,例如,可以考虑靶向脑的在具有1x109个转导单位(TU)/ml的滴度的慢病毒中的约10-50ml的CRISPR Cas。
载体的剂型
在一些实施方案中,载体(例如质粒或病毒载体)是例如通过肌内注射递送至目标组织,而有时经由静脉内、经皮、鼻内、经口、粘膜、或其他递送方法进行递送。这种递送可以经由单剂量或多剂量来进行。本领域技术人员理解的是,本文有待递送的实际剂量可以在很大程度上取决于多种因素而变化,诸如载体选择、靶细胞、生物体或组织、有待治疗的受试者的一般状况、所寻求的转化/修饰的程度、施用途径、施用方式、所寻求的转化/修饰的类型等。
这样的剂量还可以含有例如载剂(水、盐水、乙醇、甘油、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油等)、稀释剂、药学上可接受的载剂(例如磷酸盐缓冲盐水)、药学上可接受的赋形剂,和/或本领域已知的其他化合物。该剂型还可以含有一种或多种药学上可接受的盐,诸如例如,矿物酸盐诸如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等;以及有机酸盐,诸如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。另外,本文也可以存在辅助物质,诸如润湿剂或乳化剂、pH缓冲物质、凝胶或胶凝材料、调味剂、着色剂、微球体、聚合物、悬浮剂等。此外,还可以存在一种或多种其他常规药用成分,诸如防腐剂、保湿剂、悬浮剂、表面活性剂、抗氧化剂、抗结剂、填充剂、螯合剂、包衣剂、化学稳定剂等,尤其是在该剂型呈可重构形式时。合适的示例性成分包括微晶纤维素、羧甲基纤维素钠、聚山梨酯80、苯乙醇、三氯叔丁醇、山梨酸钾、抗坏血酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯酚、明胶、白蛋白以及它们的组合。对药学上可接受的赋形剂的彻底论述可获自REMINGTON'S PHARMACEUTICAL SCIENCES(Mack Pub.Co.,N.J.1991),该文献以引用方式并入本文。
在本文的一个实施方案中,递送是经由腺病毒进行的,其可以是含有至少1x105个腺病毒载体粒子(也称为粒子单位,pu)的单次加强剂量。在本文的一个实施方案中,该剂量优选为腺病毒载体的至少约1x106个粒子(例如约1x106-1x1012个粒子)、更优选至少约1x107个粒子、更优选至少约1x108个粒子(例如约1x108-1x1011个粒子或约1x108-1x1012个粒子)、且最优选至少约1x100个粒子(例如约1x109-1x1010个粒子或约1x109-1x1012个粒子),或甚至至少约1x1010个粒子(例如约1x1010-1x1012个粒子)。或者,该剂量包含不超过约1x1014个粒子、优选不超过约1x1013个粒子、甚至更优选不超过约1x012个粒子、甚至更优选不超过约1x1011个粒子、且最优选不超过约1x1010个粒子(例如不超过约1x109个粒子)。因此,该剂量可以含有单剂量的腺病毒载体,其具有例如约1x106粒子单位(pu)、约2x106pu、约4x106pu、约1x107pu、约2x107pu、约4x107pu、约1x108pu、约2x108pu、约4x108pu、约1x109pu、约2x109pu、约4x109pu、约1x1010pu、约2x1010pu、约4x1010pu、约1x1011pu、约2x1011pu、约4x1011pu、约1x1012pu、约2x1012pu或约4x1012pu的腺病毒载体。参见,例如,在2013年6月4日授权的授予Nabel等人的美国专利号8,454,972B2中的腺病毒载体;该专利通过引用结合在此,以及在其第29栏第36-58行的剂量。在本文的一个实施方案中,腺病毒是经由多剂量递送的。
在本文的一个实施方案中,递送是经由AAV进行的。用于针对人类的AAV的体内递送的治疗有效剂量被认为处于含有从约1x1010至约1x1010个功能AAV/ml溶液的从约20至约50ml的盐水溶液的范围内。可以调整该剂量以便使治疗益处相对于任何副作用平衡。在本文的一个实施方案中,AAV剂量大致处于约1x105至1x1050个基因组AAV、约1x108至1x1020个基因组AAV、约1x1010至约1x1016个基因组,或约1x1011至约1x1016个基因组AAV的浓度范围内。人类剂量可以是约1x1013个基因组AAV。这样的浓度能以约0.001ml至约100ml、约0.05至约50ml,或约10至约25ml的载剂溶液进行递送。通过建立剂量反应曲线的常规试验,本领域普通技术人员可以容易地确立其他有效剂量。参见,例如,2013年3月26日授权的授予Hajjar等人的美国专利号8,404,658B2,在第27栏,第45-60行。
在本文的一个实施方案中,递送是经由质粒进行的。在此类质粒组合物中,该剂量应当是足以引发反应的质粒的量。例如,在质粒组合物中的质粒DNA的适当量可以是约0.1至约2mg,或约1μg至约10μg/70kg个体。本发明的质粒将大体上包含(i)启动子;(ii)可操作地连接至所述启动子的编码CRISPR-Cas蛋白的序列;(iii)选择性标记物;(iv)复制起点;以及(v)在(ii)的下游并可操作地连接至(ii)的转录终止子。质粒还可以编码CRISPR复合物的RNA组分,但是这些组分中的一者或多者还可以被编码在不同载体上。
本文的剂量是基于平均70kg的个体。施用频率在医学或兽医学从业者(例如医师、兽医师)或本领域熟练的科学家的范围之内。还应注意的是,实验中使用的小鼠典型地是约20g,根据小鼠实验可以扩展到70kg的个体。
用于本文提供的组合物的剂量包括用于重复施用或重复给药的剂量。在特定实施方案中,在数周、数月或数年的时段内重复施用。可以进行合适的测定以获得最佳剂量方案。重复施用可以允许使用较低的剂量,这可以积极地影响脱靶修饰。
RNA递送
在特定实施方案中,使用基于RNA的递送。在这些实施方案中,CRISPR-Cas蛋白的mRNA、腺苷脱氨酶的mRNA(其可以融合至CRISPR-Cas蛋白或衔接子)与体外转录的指导RNA一起递送。Liang等人描述了使用基于RNA的递送的有效基因组编辑(Protein Cell.2015年5月;6(5):363-372)。在一些实施方案中,可以通过化学方式修饰编码Cas13和/或腺苷脱氨酶的mRNA,与质粒编码的Cas13和/或腺苷脱氨酶相比,这可以使活性提高。例如,一个或多个mRNA中的尿苷可以被假尿苷(Ψ)、N1-甲基假尿苷(me1Ψ)、5-甲氧基尿苷(5moU)部分或完全取代。参见Li等人,Nature Biomedical Engineering 1,0066 DOI:10.1038/s41551-017-0066(2017),该文献以引用方式整体并入本文。
RNP递送
在特定实施方案中,预复合的指导RNA、CRISPR-Cas蛋白和腺苷脱氨酶(其可以融合至CRISPR-Cas蛋白或衔接子)作为核糖核蛋白(RNP)递送。RNP的优势在于,与RNA方法相比,它们带来的快速编辑效应更大,因为该过程避免了对转录的需要。一个重要的优点是RNP递送都是瞬时的,从而减少了脱靶效应和毒性问题。以下作者已观察到不同细胞类型中的有效基因组编辑:Kim等人(2014,Genome Res.24(6):1012-9);Paix等人(2015,Genetics204(1):47-54);Chu等人(2016,BMC Biotechnol.16:4),以及Wang等人(2013,Cell.9;153(4):910-8)。
在特定实施方案中,以如WO2016161516中所述的基于多肽的穿梭剂的方式递送核糖核蛋白。WO2016161516描述了使用包含内体泄漏结构域(ELD)的合成肽对多肽货物的有效转导,所述内体泄漏结构域(ELD)可操作地连接至细胞穿透结构域(CPD),连接至富含组氨酸的结构域和CPD。类似地,这些多肽可用于在真核细胞中递送基于CRISPR效应子的RNP。
粒子
在一些方面或实施方案中,可以使用包含递送粒子配制品的组合物。在一些方面或实施方案中,配制品包含CRISPR复合物,该复合物包含CRISPR蛋白和指导物,该指导物引导CRISPR复合物特异性地结合至靶序列。在一些实施方案中,递送粒子包含基于脂质的粒子,任选地脂质纳米粒子,或阳离子脂质和任选地生物可降解的聚合物。在一些实施方案中,阳离子脂质包括1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)。在一些实施方案中,亲水性聚合物包括乙二醇或聚乙二醇。在一些实施方案中,递送粒子还包含脂蛋白,优选地胆固醇。在一些实施方案中,递送粒子的直径小于500nm、任选地直径小于250nm、任选地直径小于100nm、任选地直径为约35nm至约60nm。
示例性粒子递送复合物在2017年4月14日提交的题为“大有效负载的新型递送(Nove Delivery of Large Payloads)”的美国临时申请中进一步公开。
已知若干类型的粒子递送系统和/或配制品可用于各种各样的生物医学应用。一般来讲,粒子被定义为,就其传输和特性而言表现为整体的小物体。粒子根据直径被进一步分类。粗粒子的覆盖范围在2500与10,000纳米之间。细粒子的尺寸在100与2500纳米之间。超细粒子或纳米粒子的尺寸通常在1与100纳米之间。100nm限制是基于以下事实,即将粒子与块状材料区分开的新颖特性典型地在100nm以下的临界长度尺度上形成。
如本文所用,粒子递送系统/配制品被定义为包含根据本发明的粒子的任何生物递送系统/配制品。根据本发明的粒子是具有小于100微米(μm)的最大尺寸(例如直径)的任何实体。在一些实施方案中,本发明的粒子具有小于10μm的最大尺寸。在一些实施方案中,本发明的粒子具有小于2000纳米(nm)的最大尺寸。在一些实施方案中,本发明的粒子具有小于1000纳米(nm)的最大尺寸。在一些实施方案中,本发明的粒子具有小于900nm、800nm、700nm、600nm、500nm、400nm、300nm、200nm或100nm的最大尺寸。典型地,本发明的粒子具有500nm或更小的最大尺寸(例如直径)。在一些实施方案中,本发明的粒子具有250nm或更小的最大尺寸(例如直径)。在一些实施方案中,本发明的粒子具有200nm或更小的最大尺寸(例如直径)。在一些实施方案中,本发明的粒子具有150nm或更小的最大尺寸(例如直径)。在一些实施方案中,本发明的粒子具有100nm或更小的最大尺寸(例如直径)。在本发明的一些实施方案中使用较小的粒子,例如具有50nm或更小的最大尺寸的粒子。在一些实施方案中,本发明的粒子具有在25nm与200nm之间的最大尺寸。
就本发明而言,优选使用纳米粒子或脂质包膜递送CRISPR复合物的一种或多种组分,例如CRISPR-Cas蛋白或mRNA、或腺苷脱氨酶(其可以融合至CRISPR-Cas蛋白或衔接子)或mRNA、或指导RNA。其他递送系统或载体可以与本发明的纳米粒子方面结合使用。
一般来讲,“纳米粒子”是指直径小于1000nm的任何粒子。在某些优选的实施方案中,本发明的纳米粒子具有500nm或更小的最大尺寸(例如直径)。在其他优选的实施方案中,本发明的纳米粒子具有在25nm与200nm之间的最大尺寸。在其他优选的实施方案中,本发明的纳米粒子具有100nm或更小的最大尺寸。在其他优选的实施方案中,本发明的纳米粒子具有在35nm与60nm之间的最大尺寸。应当理解,在适当的情况下,本文中对粒子或纳米粒子的提及可以互换。
应当理解,粒子的尺寸将取决于是在加载之前还是加载之后测量而有所不同。因此,在特定实施方案中,术语“纳米粒子”可能仅适用于加载前的粒子。
本发明中涵盖的纳米粒子可以提供为不同的形式,例如为固体纳米粒子(例如金属(诸如银、金、铁、钛)、非金属、基于脂质的固体、聚合物)、纳米粒子的悬浮液,或它们的组合。可以制备金属、绝缘体和半导体纳米粒子,以及杂合结构(例如核-壳纳米粒子)。如果由半导体材料制备的纳米粒子足够小(典型地低于10nm)以至于出现电子能级的量子化,则这些纳米粒子还可以是标记量子点。此类纳米级粒子作为药物载剂或成像剂用于生物医学应用中并且可以适于本发明中的类似目的。
半固体和软纳米粒子以被制造出并且处于本发明的范围之内。半固体性质的原型纳米粒子是脂质体。目前,临床上将各种类型的脂质体纳米粒子用作抗癌药物和疫苗的递送系统。一半亲水并且另一半疏水的粒子称为杰那斯(Janus)粒子,并且对于稳定乳液是特别有效的。它们可以在水/油界面处自组装,并且充当固体表面活性剂。
粒子表征(包括例如表征形态、尺寸等)是使用多种不同的技术进行的。常用技术是电子显微术(TEM、SEM)、原子力显微镜(AFM)、动态光散射(DLS)、X-射线光电子光谱法(XPS)、粉末X-射线衍射(XRD)、傅里叶变换红外光谱法(FTIR)、基质辅助激光解吸/电离飞行时间质谱法(MALDI-TOF)、紫外-可见光谱法、双偏振干涉法以及核磁共振(NMR)。可以针对针对天然粒子(即加载前)或在加载货物(在本文中货物是指例如CRISPR-Cas系统的一种或多种组分,例如CRISPR蛋白或mRNA、或腺苷脱氨酶(其可以融合至CRISPR-Cas蛋白或衔接子)或mRNA、或指导RNA或它们的任何组合,并且可以包括另外的载剂和/或赋形剂)之后进行表征(尺寸测量)以便为本发明的任何体外、离体和/或体内应用的递送提供具有最佳尺寸的粒子。在某些优选的实施方案中,粒子尺寸(例如直径)表征是基于使用动态激光散射(DLS)的测量。关于粒子、其制备和使用方法以及其测量,提及美国专利号8,709,843;美国专利号6,007,845;美国专利号5,855,913;美国专利号5,985,309;美国专利号5,543,158;以及James E.Dahlman和Carmen Barnes等人Nature Nanotechnology(2014)的出版物,2014年5月11日在线公布,doi:10.1038/nnano.2014.84。
本发明范围内的粒子递送系统可以采用任何形式提供,包括但不限于固体、半固体、乳液或胶体粒子。这样,本文所述的任何递送系统,包括但不限于例如基于脂质的系统、脂质体、胶束、微泡、外泌体或基因枪,可以被提供作为本发明范围内的粒子递送系统。
可以使用粒子或脂质包膜同时递送CRISPR-Cas蛋白mRNA、腺苷脱氨酶(其可以融合至CRISPR-Cas蛋白或衔接子)或mRNA,以及指导RNA;例如,本发明的CRISPR-Cas蛋白和RNA,例如作为复合物,可以经由如Dahlman等人、WO2015089419 A2及其中引用的文献中的粒子诸如7C1来递送(参见例如James E.Dahlman和Carmen Barnes等人NatureNanotechnology(2014),2014年5月11日在线公布,doi:10.1038/nnano.2014.84),例如递送粒子包含脂质或类脂质(lipidoid)和亲水性聚合物,例如阳离子脂质和亲水性聚合物,例如其中阳离子脂质包括1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)或1,2-二十四酰基-sn-甘油基-3-磷酸胆碱(DMPC)并且/或者其中亲水性聚合物包括乙二醇或聚乙二醇(PEG);并且/或者其中粒子还包含胆固醇(例如,来自以下项的粒子:配制品1=DOTAP 100、DMPC 0、PEG 0、胆固醇0;配制品编号2=DOTAP 90、DMPC 0、PEG 10、胆固醇0;配制品编号3=DOTAP90、DMPC 0、PEG 5、胆固醇5),其中使用有效的多步方法形成粒子,其中第一步,将效应蛋白和RNA例如在无菌、不含核酸酶的1X PBS中例如在室温下以例如1:1的摩尔比在一起混合例如30分钟;并且分开地,将如适用于该配制品的DOTAP、DMPC、PEG和胆固醇溶解于醇(例如100%乙醇)中;并且,将这两种溶液混合在一起以形成含有这些复合物的粒子)。
可以使用粒子或脂质包膜同时递送核酸靶向效应蛋白(例如,V型蛋白诸如Cas13)mRNA和指导RNA。合适的粒子的实例包括但不限于US 9,301,923中描述的那些。
例如,Su X、Fricke J、Kavanagh DG、Irvine DJ(“In vitro and in vivo mRNAdelivery using lipid-enveloped pH-responsive polymer nanoparticles”MolPharm.2011年6月6日;8(3):774-87.doi:10.1021/mp100390w.电子版2011年4月1日)描述了生物可降解的核-壳结构粒子,其具有由磷脂双层壳包封的聚(β-氨基酯)(PBAE)核。这些被开发用于体内mRNA递送。该pH响应性PBAE组分被选择为促进内体破坏,而该脂质表面层被选择为将聚阳离子核的毒性最小化。因此,这些对于递送本发明的RNA是优选的。
在一个实施方案中,考虑了基于自组装生物粘附聚合物的粒子/纳米粒子,这些粒子可以适用于肽的经口递送、肽的静脉内递送以及肽的鼻递送,均递送至脑。还考虑了其他实施方案,诸如疏水性药物的经口吸收和眼部递送。分子包膜技术涉及被保护并递送至疾病位点的工程化聚合物包膜(参见例如Mazza,M.等人ACSNano,2013.7(2):1016-1026;Siew,A.等人Mol Pharm,2012.9(1):14-28;Lalatsa,A.等人J Contr Rel,2012.161(2):523-36;Lalatsa,A.等人,Mol Pharm,2012.9(6):1665-80;Lalatsa,A.等人Mol Pharm,2012.9(6):1764-74;Garrett,N.L.等人J Biophotonics,2012.5(5-6):458-68;Garrett,N.L.等人J Raman Spect,2012.43(5):681-688;Ahmad,S.等人J Royal Soc Interface2010.7:S423-33;Uchegbu,I.F.Expert Opin Drug Deliv,2006.3(5):629-40;Qu,X.等人Biomacromolecules,2006.7(12):3452-9以及Uchegbu,I.F.等人Int J Pharm,2001.224:185-199)。考虑了约5mg/kg的剂量,取决于靶组织,采用单剂量或多剂量。
可以使用由丹·安德森实验室(Dan Anderson’s lab)在MIT开发的可以将RNA递送至癌细胞以便使肿瘤生长停止的粒子/纳米粒子并且/或者使这些粒子/纳米粒子适于本发明的AD官能化的CRISPR-Cas系统。具体地说,安德森实验室开发了用于新生物材料和纳米配制品的合成、纯化、表征和配制的全自动化组合系统。参见例如Alabi等人,Proc NatlAcad Sci U S A.2013年8月6号;110(32):12881-6;Zhang等人,Adv Mater.2013年9月6日;25(33):4641-5;Jiang等人,Nano Lett.2013年3月13日;13(3):1059-64;Karagiannis等人,ACS Nano.2012年10月23日;6(10):8484-7;Whitehead等人,ACS Nano.2012年8月28日;6(8):6922-9和Lee等人,Nat Nanotechnol.2012年6月3日;7(6):389-93。
美国专利申请20110293703涉及类脂质化合物,这些化合物在多核苷酸的施用中也是特别有用的,它们可以适用于递送本发明的AD官能化的CRISPR-Cas系统。在一方面,氨基醇类脂质化合物与有待递送至细胞或受试者的剂组合而形成微粒子、纳米粒子、脂质体或胶束。有待通过粒子、脂质体或胶束递送的剂可以呈气体、液体或固体的形式,并且该剂可以是多核苷酸、蛋白质、肽或小分子。氨基醇类脂质化合物可以与其他氨基醇类脂质化合物、聚合物(合成的或天然的)、表面活性剂、胆固醇、碳水化合物、蛋白质、脂质等组合而形成粒子。然后这些粒子可以任选地与药物赋形剂组合而形成药物组合物。
美国专利公布号20110293703也提供了制备氨基醇类脂质化合物的方法。使胺的一种或多种等效物与环氧化物封端化合物的一种或多种等效物在合适条件下反应而形成本发明的氨基醇类脂质化合物。在某些实施方案中,胺的所有氨基基团与环氧化物封端化合物充分反应而形成叔胺。在其他实施方案中,胺的所有氨基基团未与环氧化物封端化合物完全反应形成叔胺,由此生成在氨基醇类脂质化合物中的伯胺或仲胺。将这些伯胺或仲胺照原样留下或者可以使其与另一种亲电体诸如不同的环氧化物封端化合物反应。如本领域技术人员将理解的,使胺与未过量的环氧化物封端化合物反应将产生多种不同的具有不同数目的尾部的氨基醇类脂质化合物。某些胺可以被两个环氧化物衍生的化合物尾部完全官能化,而其他分子不会被环氧化物衍生的化合物尾部完全官能化。例如,二胺或多胺可以包括离开该分子的不同氨基部分的一个、二个、三个、或四个环氧化物衍生的化合物尾部,从而产生伯胺、仲胺和叔胺。在某些实施方案中,并不是所有氨基基团都被完全官能化。在某些实施方案中,使用了两种相同类型的环氧化物封端化合物。在其他实施方案中,使用了两种或更多种不同的环氧化物封端化合物。氨基醇类脂质化合物的合成是用或不用溶剂进行的,并且该合成可以在30℃-100℃的范围内,优选在大约50℃-90℃的较高温度下进行。任选地,可以将制备的氨基醇类脂质化合物纯化。例如,可以将氨基醇类脂质化合物的混合物纯化以产生具有特定数目的环氧化物衍生的化合物尾部的氨基醇类脂质化合物。或者可以将混合物纯化以产生特定的立体异构体或区域异构体。可以使用卤代烷(例如碘甲烷)或其他烷化剂将这些氨基醇类脂质化合物烷化,并且/或者可以将它们酰化。
美国专利公布号20110293703也提供了通过本发明方法制备的氨基醇类脂质化合物的文库。可以使用涉及液体处理器、机器人、微量滴定板、计算机等的高通量技术制备并且/或者筛选这些氨基醇类脂质化合物。在某些实施方案中,筛选了这些氨基醇类脂质化合物的将多核苷酸或其他剂(例如蛋白质、肽、小分子)转染到细胞中的能力。
美国专利公布号20130302401涉及已经使用组合聚合制备的一类聚(β-氨基醇)(PBAA)。本发明的PBAA可以在生物技术和生物医学应用中用作涂层(诸如用于医疗装置或植入物的膜或多层膜的涂层)、添加剂、材料、赋形剂、生物防污剂(non-biofoulingagent)、微图案化剂以及细胞封装剂。当用作表面涂层时,这些PBAA在体外和体内均引发不同水平的炎症,这取决于它们的化学结构。这类材料的巨大化学多样性允许我们鉴定出在体外抑制巨噬细胞激活的聚合物涂层。此外,在羧化聚苯乙烯微粒的皮下移植之后,这些涂层减少了炎症细胞的募集,并且减轻了纤维化。这些聚合物可以用于形成用于细胞封装的聚电解质复合物胶囊。本发明还可以具有许多其他的生物应用,诸如抗微生物涂层、DNA或siRNA递送,以及干细胞组织工程化。美国专利公布号20130302401的教导内容可以适用于本发明的AD官能化的CRISPR-Cas系统。
可以例如通过电穿孔转染包含Cas13、腺苷脱氨酶(其可以融合至Cas13或衔接蛋白)和指导RNA的预组装重组CRISPR-Cas复合物,从而产生高突变率且不存在可检测的脱靶突变。Hur,J.K.等人,Targeted mutagenesis in mice by electroporation of Cas13ribonucleoproteins,Nat Biotechnol.2016年6月6日.doi:10.1038/nbt.3596。
就局部递送至脑而言,这可以通过多种方式来实现。例如,可以例如通过注射经纹状体内递送材料。注射可以经由颅骨切开术立体定位地进行。
在一些实施方案中,可以使用基于糖的粒子,例如GalNAc,如本文所述且参考WO2014118272(以引用方式并入本文)以及Nair,JK等人,2014,Journal of the AmericanChemical Society 136(49),16958-16961)以及在此的教导内容,除非另外表明,否则特别涉及适用于所有粒子的递送。这可以被认为是基于糖的粒子,并且本文提供了关于其他粒子递送系统和/或配制品的更多细节。GalNAc因此可以被认为是在本文所述的其他粒子的意义上的粒子,使得一般用途和其他考虑因素(例如所述粒子的递送)也适用于GalNAc粒子。溶液相缀合策略可以例如用于将作为PFP(五氟苯酚)酯激活的三触角GalNAc簇(分子量约2000)附接至5'-己基氨基修饰的寡核苷酸上(5′-HA ASO,分子量约8000Da;等人,Bioconjugate Chem.,2015,26(8),第1451-1455页)。类似地,已描述了用于体内核酸递送的聚(丙烯酸酯)聚合物(参见WO2013158141,该专利以引用方式并入本文)。在另外的替代实施方案中,为了改善递送,可以使用预先混合的CRISPR纳米粒子(或蛋白复合物)与天然存在的血清蛋白(Akinc A等人,2010,Molecular Therapy第18卷第7期,1357-1364)。
纳米线团
此外,可以使用纳米线团来递送AD官能化的CRISPR系统,例如,如在以下文献中所述的:Sun W等人,Cocoon-like self-degradable DNA nanoclew for anticancer drugdelivery.,J Am Chem Soc.2014年10月22日;136(42):14722-5.doi:10.1021/ja5088024.电子版2014年10月13日;或Sun W等人,Self-Assembled DNA Nanoclews for theEfficient Delivery of CRISPR-Cas9 for Genome Editing.,Angew Chem Int EdEngl.2015年10月5日;54(41):12029-33.doi:10.1002/anie.201506030.电子版2015年8月27日。
LNP
在一些实施方案中,递送是通过将Cas13蛋白或mRNA形式封装在脂质粒子诸如LNP中而进行的。因此,在一些实施方案中,考虑了脂质纳米粒子(LNP)。抗转甲状腺素蛋白小干扰RNA已被封装在脂质纳米粒子中并且被递送至人类(参见例如Coelho等人,N Engl J Med2013;369:819-29),并且此系统可以适于并应用于本发明的CRISPR Cas系统。考虑了静脉内施用约0.01至约1mg/kg体重的剂量。考虑了降低输注相关反应的风险的药物,诸如考虑了地塞米松、对乙酰氨基酚、苯海拉明或西替利嗪,以及雷尼替丁。还考虑了约0.3mg/kg的多剂量,每4周一次,五个剂量。
LNP已经显示在将siRNA递送至肝脏中是高度有效的(参见例如Tabernero等人,Cancer Discovery,2013年4月,第3卷,第4期,第363-470页),并且因此被考虑用于将编码CRISPR Cas的RNA递送至肝脏。可以考虑6mg/kg的LNP的约四个剂量的用量,每两周一次。Tabernero等人证明,在以0.7mg/kg给予LNP前2个周期之后,观察到肿瘤消退,并且在6个周期结束之后,患者已经实现了部分反应,具有淋巴结转移完全消退以及肝脏肿瘤的显著萎缩。在40个剂量之后在此患者中获得完全反应,此患者在接受经过26个月的剂量之后保持缓解和完全治疗。具有RCC和在用VEGF途径抑制剂进行的在先疗法之后进展的包括肾脏、肺以及淋巴结的肝外位点疾病的两位患者在所有位点的疾病都在大约8至12个月内保持稳定,并且一位具有PNET和肝转移的患者继续在18个月(36个剂量)的延伸研究中保持疾病稳定。
然而,必须将LNP的电荷考虑在内。当阳离子脂质与带负电的脂质结合时,诱导促进细胞内递送的非双层结构。因为带电荷的LNP在静脉内注射之后迅速从循环中清除,所以开发了具有低于7的pKa值的可电离阳离子脂质(参见例如Rosin等人,Molecular Therapy,第19卷,第12期,第1286-2200页,2011年12月)。带负电的聚合物诸如RNA可以低pH值(例如pH 4)加载到LNP中,在此pH时可电离脂质展示出正电荷。然而,在生理学pH值下,LNP表现出与更长的循环时间相容的低表面电荷。已经关注了四种可电离阳离子脂质,即1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基-酮基-N,N-二甲基-3-氨基丙烷(DLinKDMA),以及1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)。已经显示,含有这些脂质的LNP siRNA系统在体内肝细胞中表现出显著不同的基因沉默特性,具有根据采用因子VII基因沉默模型的DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP系列而变化的潜能(参见例如Rosin等人,Molecular Therapy,第19卷,第12期,第1286-2200页,2011年12月)。可以考虑在LNP中或与LNP相关联的1μg/ml的LNP或CRISPR-Cas RNA的剂量,尤其是对于含有DLinKC2-DMA的配制品而言。
LNP的制备和CRISPR Cas封装可以使用并且/或者调适自Rosin等人,MolecularTherapy,第19卷,第12期,第1286-2200页,2011年12月)。阳离子脂质1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基酮基-N,N-二甲基-3-氨基丙烷(DLinK-DMA)、1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)、(3-o-[2″-(甲氧基聚乙二醇2000)琥珀酰基]-1,2-二肉豆蔻酰基-sn-乙二醇(PEG-S-DMG),以及R-3-[(ω-甲氧基-聚(乙二醇)2000)氨甲酰基]-1,2-二肉豆蔻酰氧基丙基-3-胺(PEG-C-DOMG)可以由Tekmira Pharmaceuticals(Vancouver,Canada)提供或合成。胆固醇可购自Sigma(St Louis,MO)。特定的CRISPR CasRNA可以封装在含有DLinDAP、DLinDMA、DLinK-DMA和DLinKC2-DMA的LNP中(阳离子脂质:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG,摩尔比为40:10:40:10)。在必要时,可并入0.2%SP-DiOC18(Invitrogen,Burlington,Canada)来评定细胞摄取、细胞内递送和生物分布。可以通过以下方式来进行封装:将由阳离子脂质:DSPC:胆固醇:PEG-c-DOMG(40:10:40:10摩尔比)组成的脂质混合物溶解在乙醇中,直至最终脂质浓度为10mmol/l。可以将脂质的此乙醇溶液逐滴添加到pH 4.0的50mmol/l柠檬酸盐中以形成多层囊泡,从而产生30%乙醇(体积/体积)的终浓度。在使用挤出机(Northern Lipids,Vancouver,Canada)通过两个重叠的80nm Nuclepore聚碳酸酯过滤器挤出多层囊泡之后,可以形成大的单层囊泡。可以通过以下方式来实现封装:将溶解在含有30%乙醇(体积/体积)的pH 4.0的50mmol/l柠檬酸盐中的2mg/ml的RNA逐滴添加到挤出的预成形的大单层囊泡中,并且在31℃下孵育30分钟,伴随持续混合直至最终的RNA/脂质重量比为0.06/1(重量/重量)。通过使用Spectra/Por 2再生纤维素透析膜在pH 7.4的磷酸盐缓冲盐水(PBS)中透析16小时进行乙醇的去除以及配制缓冲液的中和。可以使用NICOMP 370型粒径分析仪、囊泡/强度模式以及高斯拟合通过动态光散射测定纳米粒子粒径分布(Nicomp Particle Sizing,Santa Barbara,CA)。所有三个LNP系统的粒径可能为约70nm。可以通过使用VivaPureD MiniH柱(Sartorius StedimBiotech)从在透析前后收集的样品中去除游离RNA来确定RNA封装效率。可以从洗脱的纳米粒子中提取封装的RNA并且将其在260nm下量化。通过使用来自Wako Chemicals USA(Richmond,VA)的胆固醇E酶测定测量囊泡中的胆固醇含量来确定RNA与脂质的比率。结合本文对LNP和PEG脂质的论述,PEG化的脂质体或LNP同样适用于CRISPR-Cas系统或其组分的递送。
可以在含有50:10:38.5摩尔比的DLinKC2-DMA、DSPC和胆固醇的乙醇中制备脂质预混物溶液(20.4mg/ml总脂质浓度)。可以0.75:1的摩尔比(乙酸钠:DLinKC2-DMA)将乙酸钠添加到脂质预混物中。随后可以通过将该混合物与1.85倍体积的柠檬酸盐缓冲液(10mmol/l,pH 3.0)在剧烈搅拌下合并来使脂质水合,从而使得在含有35%乙醇的水性缓冲液中自发形成脂质体。可以在37℃下孵育该脂质体溶液以允许粒径的时间依赖性增加。可以通过动态光散射(Zetasizer Nano ZS,Malvern Instruments,Worcestershire,UK)在孵育过程中的不同时间处去除等分试样来研究脂质体尺寸的变化。一旦实现所希望的粒径,就可以将水性PEG脂质溶液(储备溶液=在35%(体积/体积)乙醇中的10mg/ml PEG-DMG)添加到该脂质体混合物中,以产生3.5%总脂质的最终PEG摩尔浓度。在添加PEG-脂质之后,这些脂质体应该其大小,有效抑制进一步生长。然后可以大约1:10(重量:重量)的RNA与总脂质比率将RNA添加到空脂质体中,然后在37℃下孵育30分钟以形成加载的LNP。随后可以将该混合物在PBS中透析过夜,并且用0.45-μm的注射器式过滤器进行过滤。
球形核酸(SNATM)构建体和其他纳米粒子(特别是金纳米粒子)也被考虑作为将CRISPR-Cas系统递送至预期靶标的手段。大量数据表明,基于核酸官能化的金纳米粒子的AuraSense Therapeutics'Spherical Nucleic Acid(SNATM)构建体是可用的。
可以与本文的教导内容结合使用的文献包括:Cutler等人,J.Am.Chem.Soc.2011133:9254-9257;Hao等人,Small.2011 7:3158-3162;Zhang等人,ACS Nano.2011 5:6962-6970;Cutler等人,J.Am.Chem.Soc.2012 134:1376-1391;Young等人,Nano Lett.2012 12:3867-71;Zheng等人,Proc.Natl.Acad.Sci.USA.2012 109:11975-80;Mirkin,Nanomedicine 2012 7:635-638;Zhang等人,J.Am.Chem.Soc.2012 134:16488-1691;Weintraub,Nature 2013 495:S14-S16,Choi等人,Proc.Natl.Acad.Sci.USA.2013 110(19):7625-7630;Jensen等人,Sci.Transl.Med.5,209ra152(2013)以及Mirkin等人,Small,10:186-192。
具有RNA的自组装纳米粒子可以用PEG化的聚乙烯亚胺(PEI)构建,其中Arg-Gly-Asp(RGD)肽配体附接在聚乙二醇(PEG)的远端。例如,这一系统已经被用作靶向表达整合素的肿瘤新血管系统和递送抑制血管内皮生长因子受体2(VEGF R2)表达以及由此实现抑制肿瘤血管新生的siRNA的手段(参见例如Schifferers等人,Nucleic Acids Research,2004,第32卷,第19期)。纳米束(nanoplex)可以通过以下方式来制备:将等体积的阳离子聚合物水溶液和核酸水溶液混合,以产生在2至6范围上的可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量。在阳离子聚合物与核酸之间的静电相互作用导致聚复合物的形成,该聚合物具有约100nm的平均粒径分布,此后称为纳米束。设想了CRISPR Cas的约100至200mg的剂量,用于Schiffelers等人的自组装纳米粒子中的递送。
Bartlett等人(PNAS,2007年9月25日,第第104卷,第39期)的纳米复合物也可以适用于本发明。Bartlett等人的纳米复合物通过以下方式来制备:将等体积的阳离子聚合物水溶液和核酸水溶液混合,以产生在2至6范围上的可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量。在阳离子聚合物与核酸之间的静电相互作用导致聚复合物的形成,该聚合物具有约100nm的平均粒径分布,此后称为纳米束。Bartlett等人的DOTA-siRNA的合成如下:1,4,7,10-四氮杂环十二烷-1,4,7,10-四乙酸单(N-羟基琥珀酰亚胺酯)(DOTA-NHS酯)订购自Macrocyclics(Dallas,TX)。将于碳酸盐缓冲液(pH 9)中的具有100倍摩尔过量的DOTA-NHS-酯的胺修饰的RNA有义链添加到微量离心管中。通过在室温下搅拌4小时使这些内容物反应。将DOTA-RNA有义缀合物用乙醇沉淀,重新悬浮在水中,并且退火到未修饰的反义链上以产生DOTA-siRNA。所有液体均用Chelex-100(Bio-Rad,Hercules,CA)预处理,以去除痕量金属污染物。可以通过使用含有环糊精的聚阳离子形成Tf靶向和非靶向的siRNA纳米粒子。典型地,以3(+/-)的进料比和0.5克/升的siRNA浓度在水中形成纳米粒子。用Tf(金刚烷-PEG-Tf)修饰在靶向纳米粒子表面上的百分之一的金刚烷-PEG分子。将纳米粒子悬浮在用于注射的5%(重量/体积)葡萄糖载剂溶液中。
Davis等人(Nature,第464卷,2010年4月15日)进行了使用靶向的纳米粒子递送系统的RNA临床试验(临床试验登记号NCT00689065)。在21天周期的第1、3、8和10天通过30min的静脉内输注向患有标准护理疗法难治的实体癌的患者施用靶向的纳米粒子剂量。纳米粒子由合成递送系统组成,该系统含有:(1)线性的基于环糊精的聚合物(CDP);(2)展示在纳米粒子外部上的用于接合癌细胞表面上的TF受体(TFR)的人类转铁蛋白(TF)靶向配体;(3)亲水性聚合物(用于促进纳米粒子在生物流体中的稳定性的聚乙二醇(PEG));以及(4)被设计来降低RRM2(先前在临床中使用的序列指代为siR2B+5)表达的siRNA。长久以来已知TFR在恶性细胞中被下调,并且RRM2是一种确立的抗癌靶标。已经显示这些纳米粒子(临床版本指代为CALAA-01)在非人类灵长类动物中的多剂量研究中耐受性良好。虽然已经通过脂质体递送向患有慢性粒细胞白血病的单一患者施用了siRNA,但是Davis等人的临床试验是初期人类试验,该试验用靶向递送系统全身性地递送siRNA并且治疗患有实体癌的患者。为了确定该靶向递送系统是否能够将功能性siRNA有效递送至人类肿瘤,Davis等人研究了来自三个不同的剂量组群的三位患者的活组织检查;患者A、B和C,他们均患有转移性黑素瘤并且分别接受了18、24和30mg m-2 siRNA的CALAA-01剂量。对于本发明的CRISPRCas系统,还可以考虑类似的剂量。用含有线性的基于环糊精的聚合物(CDP)、展示在纳米粒子外部上的用于接合癌细胞表面上的TF受体(TFR)的人类转铁蛋白(TF)靶向配体和/或亲水性聚合物(例如,用于促进纳米粒子在生物流体中的稳定性的聚乙二醇(PEG))的纳米粒子,可以实现本发明的递送。
以引用方式并入本文的美国专利号8,709,843提供了用于将含有治疗剂的粒子靶向递送至组织、细胞和细胞内区室的药物递送系统。本发明提供了包含缀合至表面活性剂、亲水性聚合物或脂质的聚合物的靶向粒子。以引用方式并入本文的美国专利号6,007,845提供了下述粒子:所述粒子具有通过将多官能化合物与一种或多种疏水性聚合物和一种或多种亲水性聚合物共价地连接而形成的多嵌段共聚合物的核,并且含有生物活性材料。以引用方式并入本文的美国专利No.5,855,913提供了下述颗粒组合物:所述颗粒组合物含有具有小于0.4g/cm3振实密度以及介于5μm与30μm之间的平均直径的空气动力学光粒子,在其表面上并入了表面活性剂,以用于向肺部系统的药物递送。以引用方式并入本文的美国专利号5,985,309提供了下述粒子:所述粒子并入了表面活性剂和/或带正电荷或带负电荷的治疗剂或诊断剂和带相反电荷的带电荷分子的亲水性或疏水性复合物,以用于向肺部系统的递送。以引用方式并入本文的美国专利号5,543,158提供了生物可降解的可注射粒子,所述粒子具有生物可降解实心核,该核在其表面上含有生物活性材料和聚(烷撑二醇)部分。以引用方式并入本文的WO2012135025(也以US20120251560公布)描述了缀合的聚乙烯亚胺(PEI)聚合物和缀合的氮杂大环(统称为“缀合微质体(lipomer)”或“微质体”)。在某些实施方案中,可以设想的是,此类缀合微质体可以用于CRISPR-Cas系统的情形中以在体外、离体和在体内实现基因组干扰,从而修饰基因表达,包括调节蛋白质表达。
在一个实施方案中,纳米粒子可以是环氧化物修饰的脂质-聚合物,有利地是7C1(参见例如James E.Dahlman和Carmen Barnes等人Nature Nanotechnology(2014),2014年5月11日在线发布,doi:10.1038/nnano.2014.84)。C71是通过使C15环氧化物封端脂质与PEI600以14:1摩尔比反应合成的,并且与C14PEG2000一起进行配制以产生纳米粒子(直径介于35与60nm之间),这些纳米粒子在PBS溶液中在至少40天内保持稳定。
环氧化物修饰的脂质-聚合物可以用于将本发明的CRISPR-Cas系统递送至肺部细胞、心血管细胞或肾细胞,然而本领域的技术人员可以调适该系统以递送至其他靶器官。设想了约0.05至约0.6mg/kg的剂量范围。还设想了经数天或数周的剂量,其中总剂量为约2mg/kg。
在一些实施方案中,用于递送RNA分子的LNP通过本领域已知的方法来制备,所述方法诸如在例如WO 2005/105152(PCT/EP2005/004920)、WO 2006/069782(PCT/EP2005/014074)、WO 2007/121947(PCT/EP2007/003496)和WO 2015/082080(PCT/EP2014/003274)中所述的那些方法,这些文献以引用方式并入本文。明确地旨在增强和改善siRNA到哺乳动物细胞中的递送的LNP描述于例如Aleku等人,Cancer Res.,68(23):9788-98(2008年12月1日);Strumberg等人,Int.J.Clin.Pharmacol.Ther.,50(1):76-8(2012年1月);Schultheis等人,J.Clin.Oncol.,32(36):4141-48(2014年12月20日)以及Fehring等人,Mol.Ther.,22(4):811-20(2014年4月22日)(这些文献以引用方式并入本文),并且可以应用于本发明的技术。
在一些实施方案中,LNP包括在WO 2005/105152(PCT/EP2005/004920)、WO 2006/069782(PCT/EP2005/014074)、WO 2007/121947(PCT/EP2007/003496)和WO 2015/082080(PCT/EP2014/003274)中所公开的任何LNP。
在一些实施方案中,LNP包含至少一种具有式I的脂质:
(Formula I),其中R1和R2各自且独立地选自包括烷基的组,n是1与4之间的任何整数,并且R3是选自包括赖氨酰基、鸟氨酰基、2,4-二氨基丁酰基、组氨酰基和根据式II的酰基部分的组的酰基:
其中m是1至3的任何整数,并且Y-是药学上可接受的阴离子。在一些实施方案中,根据式I的脂质包括至少两个不对称的C原子。在一些实施方案中,式I的对映异构体包括但不限于R-R;S-S;R-S和S-R对映异构体。
在一些实施方案中,R1是月桂基并且R2是肉豆蔻基。在另一个实施方案中,R1是棕榈基并且R2是油基。在一些实施方案中,m是1或2。在一些实施方案中,Y-选自卤化物、乙酸盐或三氟乙酸盐。
在一些实施方案中,LNP包含一种或多种选自以下的脂质:
β-精氨酰基-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐(式III):
β-精氨酰基-2,3-二氨基丙酸-N-月桂基-N-肉豆蔻基-酰胺三盐酸盐(式IV):
ε-精氨酰基-赖氨酸-N-月桂基-N-肉豆蔻基-酰胺三盐酸盐(式Ⅴ):
在一些实施方案中,LNP还包含某种成分。举例来说,但不作为限制,在一些实施方案中,所述成分选自肽、蛋白质、寡核苷酸、多核苷酸、核酸或它们的组合。在一些实施方案中,所述成分是抗体,例如单克隆抗体。在一些实施方案中,所述成分是选自例如核酶、适体、镜像异构适配体(spiegelmer)、DNA、RNA、PNA、LNA或它们的组合的核酸。在一些实施方案中,核酸是指导RNA和/或mRNA。
在一些实施方案中,LNP的成分包括编码CRIPSR-Cas蛋白的mRNA。在一些实施方案中,LNP的成分包括编码II型或V型CRIPSR-Cas蛋白的mRNA。在一些实施方案中,LNP的成分包括编码腺苷脱氨酶(其可以融合至CRISPR-Cas蛋白或衔接蛋白)的mRNA。
在一些实施方案中,LNP的成分还包括一种或多种指导RNA。在一些实施方案中,LNP被配置成递送前述mRNA并将RNA导向至血管内皮。在一些实施方案中,LNP被配置成递送前述mRNA并将RNA导向至肺内皮。在一些实施方案中,LNP被配置成递送前述mRNA并将RNA导向至肝脏。在一些实施方案中,LNP被配置成递送前述mRNA并将RNA导向至肺。在一些实施方案中,LNP被配置成递送前述mRNA并将RNA导向至心脏。在一些实施方案中,LNP被配置成递送前述mRNA并将RNA导向至脾。在一些实施方案中,LNP被配置成递送前述mRNA并将RNA导向至肾脏。在一些实施方案中,LNP被配置成递送前述mRNA并将RNA导向至胰腺。在一些实施方案中,LNP被配置成递送前述mRNA并将RNA导向至脑。在一些实施方案中,LNP被配置成递送前述mRNA并将RNA导向至巨噬细胞。
在一些实施方案中,LNP还包含至少一种辅助脂质。在一些实施方案中,辅助脂质选自磷脂和类固醇。在一些实施方案中,磷脂是磷酸的二酯和/或单酯。在一些实施方案中,磷脂是磷酸甘油酯和/或鞘脂。在一些实施方案中,类固醇是天然存在的和/或基于部分氢化的环戊[a]菲的合成化合物。在一些实施方案中,类固醇含有21至30个C原子。在一些实施方案中,类固醇是胆固醇。在一些实施方案中,辅助脂质选自l,2-二植烷酰基-sn-甘油基-3-磷酸乙醇胺(DPhyPE)、神经酰胺和1,2-二油酰基sn-甘油基-3-磷酸乙醇胺(DOPE)。
在一些实施方案中,所述至少一种辅助脂质包含选自包括PEG部分、HEG部分、聚羟乙基淀粉(聚HES)部分和聚丙烯部分的组的部分。在一些实施方案中,所述部分具有在约500至10,000Da之间或在约2,000至5,000Da之间的分子量。在一些实施方案中,PEG部分选自l,2-二硬脂酰基-sn-甘油基-3磷酸乙醇胺、l,2-二烷基-sn-甘油基-3-磷酸乙醇胺和神经酰胺-PEG。在一些实施方案中,PEG部分具有在约500至10,000Da之间或在约2,000至5,000Da之间的分子量。在一些实施方案中,PEG部分具有2,000Da的分子量。
在一些实施方案中,辅助脂质为组合物的总脂质含量的约20摩尔%至80摩尔%。在一些实施方案中,辅助脂质组分为LNP的总脂质含量的约35摩尔%至65摩尔%。在一些实施方案中,LNP包含占LNP的总脂质含量的50摩尔%的脂质和50摩尔%的辅助脂质。
在一些实施方案中,LNP包含β-3-精氨酰基-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐、β-精氨酰基-2,3-二氨基丙酸-N-月桂基-N-肉豆蔻基-酰胺三盐酸盐或精氨酰基-赖氨酸-N-月桂基-N-肉豆蔻基-酰胺三盐酸盐中的任一者与DPhyPE的组合,其中DPhyPE的含量为LNP的总脂质含量的约80摩尔%、65摩尔%、50摩尔%和35摩尔%。在一些实施方案中,LNP包含β-精氨酰基-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐(脂质)和1,2-二植烷酰基-sn-甘油基-3-磷酸乙醇胺(辅助脂质)。在一些实施方案中,LNP包含β-精氨酰基-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐(脂质)、1,2-二植烷酰基-sn-甘油基-3-磷酸乙醇胺(第一辅助脂质)和1,2-二硬脂酰基-sn-甘油基-3-磷酸乙醇胺-PEG2000(第二辅助脂质)。
在一些实施方案中,第二辅助脂质为总脂质含量的约0.05摩尔%至4.9摩尔%之间或约1摩尔%至3摩尔%之间。在一些实施方案中,LNP包含为总脂质含量的约45摩尔%至50摩尔%之间的脂质、为总脂质含量的约45摩尔%至50摩尔%之间的第一辅助脂质,条件是存在为总脂质含量的约0.1摩尔%至5摩尔%之间、约1摩尔%至4摩尔%之间或约2摩尔%的PEG化的第二辅助脂质,其中脂质、第一辅助脂质和第二辅助脂质的含量之和为总脂质含量的100摩尔%,并且其中第一辅助脂质和第二辅助脂质之和为总脂质含量的50摩尔%。在一些实施方案中,LNP包含:(a)50摩尔%的β-精氨酰基-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐、48摩尔%的l,2-二植烷酰基-sn-甘油基-3-磷酸乙醇胺;以及2摩尔%的l,2-二硬脂酰基-sn-甘油基-3-磷酸乙醇胺-PEG2000;或者(b)50摩尔%的β-精氨酰基-2,3-二氨基丙酸-N-棕榈基-N-油基-酰胺三盐酸盐、49摩尔%的l,2-二植烷酰基-sn-甘油基-3-磷酸乙醇胺;以及1摩尔%的N(羰基-甲氧基聚乙二醇-2000)-l,2-二硬脂酰基-sn-甘油基3-磷酸乙醇胺,或其钠盐。
在一些实施方案中,LNP含有核酸,其中核酸骨架磷酸盐与阳离子脂质氮原子的进料比为约1:1.5-7或约1:4。
在一些实施方案中,LNP还包含屏蔽化合物,所述屏蔽化合物可以在体内条件下从脂质组合物中去除。在一些实施方案中,屏蔽化合物是生物惰性化合物。在一些实施方案中,屏蔽化合物在其表面或分子本身上不携带任何电荷。在一些实施方案中,屏蔽化合物是聚乙二醇(PEG)、基于羟乙基葡萄糖(HEG)的聚合物、聚羟乙基淀粉(聚HES)和聚丙烯。在一些实施方案中,PEG、HEG、聚HES和聚丙烯的重量为约500至10,000Da之间或约2000至5000Da之间。在一些实施方案中,屏蔽化合物是PEG2000或PEG5000。
在一些实施方案中,LNP包含至少一种脂质、第一辅助脂质和在体内条件下可以从脂质组合物中去除的屏蔽化合物。在一些实施方案中,LNP还包含第二辅助脂质。在一些实施方案中,第一辅助脂质是神经酰胺。在一些实施方案中,第二辅助脂质是神经酰胺。在一些实施方案中,神经酰胺包含至少一个6至10个碳原子的短碳链取代基。在一些实施方案中,神经酰胺包含8个碳原子。在一些实施方案中,屏蔽化合物附接至神经酰胺。在一些实施方案中,屏蔽化合物附接至神经酰胺。在一些实施方案中,屏蔽化合物共价附接至神经酰胺。在一些实施方案中,屏蔽化合物附接至LNP中的核酸。在一些实施方案中,屏蔽化合物共价附接至核酸。在一些实施方案中,屏蔽化合物通过接头附接至核酸。在一些实施方案中,接头在生理条件下被切割。在一些实施方案中,接头选自ssRNA、ssDNA、dsRNA、dsDNA、肽、S-S接头和pH敏感接头。在一些实施方案中,接头部分附接至核酸有义链的3’端。在一些实施方案中,屏蔽化合物包含pH敏感接头或pH敏感部分。在一些实施方案中,pH敏感接头或pH敏感部分是阴离子接头或阴离子部分。在一些实施方案中,在酸性环境中,阴离子接头或阴离子部分带较少的阴离子或为中性的。在一些实施方案中,pH敏感接头或pH敏感部分选自低聚(谷氨酸)、低聚酚盐和二亚乙基三胺五乙酸。
在先前段落中的任何LNP实施方案中,LNP可以具有约50至600mosmole/kg之间、约250至350mosmole/kg之间或约280至320mosmole/kg之间的重量克分子渗透压浓度,并且/或者其中由脂质和/或一种或两种辅助脂质和屏蔽化合物形成的LNP具有约20至200nm之间、约30至100nm之间或约40至80nm之间的粒度。
在一些实施方案中,屏蔽化合物提供了更长的体内循环时间,并且允许含核酸的LNP的更好的生物分布。在一些实施方案中,屏蔽化合物防止LNP与血清化合物或其他体液或细胞质膜(例如,向其施用LNP的脉管系统的内皮层的细胞质膜)的化合物相互作用。另外地或可替代地,在一些实施方案中,屏蔽化合物还防止免疫系统的元件立即与LNP相互作用。另外地或可替代地,在一些实施方案中,屏蔽化合物充当抗调理化合物。不希望受到任何机制或理论的束缚,在一些实施方案中,屏蔽化合物形成覆盖物或外壳,所述覆盖物或外壳减少了LNP可用于与其环境相互作用的表面区域。另外地或可替代地,在一些实施方案中,屏蔽化合物屏蔽LNP的总电荷。
在另一个实施方案中,LNP包含至少一种具有式VI的脂质:
其中n是1、2、3或4,其中m是1、2或3,其中Y-是阴离子,其中R1和R2各自单独地且独立地选自由以下组成的组:直链C12-C18烷基和直链C12-C18烯基;固醇化合物,其中所述固醇化合物是选自由胆固醇和豆甾醇组成的组;以及PEG化脂质,其中所述PEG化脂质包含PEG部分,其中所述PEG化脂质选自由以下组成的组:
式VII的PEG化磷酸乙醇胺:
其中R3和R4单独地且独立地是直链C13-C17烷基,并且p是15至130之间的任何整数;
式VIII的PEG化神经酰胺:
其中R5是直链C7-C15烷基,并且q是15至130之间的任何数字;以及
式IX的PEG化二酰基甘油:
其中R6和R7各自单独地且独立地是直链C11-C17烷基,并且r是15至130的任何整数。
在一些实施方案中,R1和R2彼此不同。在一些实施方案中,R1是棕榈基并且R2是油基。在一些实施方案中,R1是月桂基并且R2是肉豆蔻基。在一些实施方案中,R1和R2是相同的。在一些实施方案中,R1和R2各自单独地且独立地选自由以下组成的组:C12烷基、C14烷基、Cl6烷基、Cl8烷基、Cl2烯基、C14烯基、Cl6烯基和Cl8烯基。在一些实施方案中,C12烯基、C14烯基、Cl6烯基和Cl 8烯基各自包含一个或两个双键。在一些实施方案中,Cl8烯基是在C9与C10之间具有一个双键的Cl8烯基。在一些实施方案中,C18烯基是顺式-9-十八烷基。
在一些实施方案中,阳离子脂质是式X的化合物:
在一些实施方案中,固醇化合物是胆固醇。在一些实施方案中,固醇化合物是豆固醇(stigmasterin)。
在一些实施方案中,PEG化脂质的PEG部分具有约800至5,000Da的分子量。在一些实施方案中,PEG化脂质的PEG部分的分子量为约800Da。在一些实施方案中,PEG化脂质的PEG部分的分子量为约2000Da。在一些实施方案中,PEG化脂质的PEG部分的分子量为约5,000Da。在一些实施方案中,PEG化脂质是式VII的PEG化磷酸乙醇胺,其中R3和R4各自单独地且独立地是直链C13-C17烷基,并且p是18、19或20,或44、45或46,或113、114或115中的任何整数。在一些实施方案中,R3和R4是相同的。在一些实施方案中,R3和R4是不同的。在一些实施方案中,R3和R4各自单独地且独立地选自由以下组成的组:C13烷基、Cl5烷基和Cl7烷基。在一些实施方案中,式VII的PEG化磷酸乙醇胺是l,2-二硬脂酰基-sn-甘油基-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](铵盐):
在一些实施方案中,PEG化脂质是式VIII的PEG化神经酰胺,其中R5是直链C7-C15烷基,并且q是18、19或20,或44、45或46,或113、114或115中的任何整数。在一些实施方案中,R5是直链C7烷基。在一些实施方案中,R5是直链Cl5烷基。在一些实施方案中,式VIII的PEG化神经酰胺是N-辛酰基-鞘氨醇-1-{琥珀酰基[甲氧基(聚乙二醇)2000]}:
在一些实施方案中,PEG化脂质是式IX的PEG化二酰基甘油,其中R6和R7各自单独地且独立地是直链Cl1-Cl7烷基,并且r是18、19或20,或44、45或46,或113、114或115中的任何整数。在一些实施方案中,R6和R7是相同的。在一些实施方案中,R6和R7是不同的。在一些实施方案中,R6和R7各自单独地且独立地选自由以下组成的组:Cl7烷基、直链C15烷基和直链Cl3烷基。在一些实施方案中,式IX的PEG化二酰基甘油是1,2-二硬脂酰基-sn-甘油[甲氧基(聚乙二醇)2000]:
在一些实施方案中,LNP包含至少一种选自式III、IV和V的阳离子脂质、至少一种选自胆固醇和豆固醇的固醇,并且其中PEG化脂质是选自式XI和XII中的至少一者。在一些实施方案中,LNP包含至少一种选自式III、IV和V的阳离子脂质、至少一种选自胆固醇和豆固醇的固醇,并且其中PEG化脂质是选自式XIII和XIV中的至少一者。在一些实施方案中,LNP包含至少一种选自式III、IV和V的阳离子脂质、至少一种选自胆固醇和豆固醇的固醇,并且其中PEG化脂质是选自式XV和XVI中的至少一者。在一些实施方案中,LNP包含式III的阳离子脂质、作为固醇化合物的胆固醇,并且其中PEG化脂质是式XI。
在先前段落中的任何LNP实施方案中,其中阳离子脂质组合物的含量在约65摩尔%至75摩尔%之间,固醇化合物的含量在约24摩尔%至34摩尔%之间,并且PEG化脂质的含量在约0.5摩尔%至1.5摩尔%之间,其中脂质组合物中阳离子脂质、固醇化合物和PEG化脂质的含量之和为100摩尔%。在一些实施方案中,阳离子脂质为约70摩尔%,固醇化合物的含量为约29摩尔%,并且PEG化脂质的含量为约1摩尔%。在一些实施方案中,LNP为70摩尔%的式III、29摩尔%的胆固醇和1摩尔%的式XI。
外泌体
外泌体是转运RNA和蛋白质的内源性纳米囊泡,并且可以将RNA递送至脑和其他靶器官。为了降低免疫原性,Alvarez-Erviti等人(2011,Nat Biotechnol 29:341)使用了用于外泌体产生的自我衍生的树突细胞。通过将树突细胞工程化为表达Lamp2b(一种外泌体膜蛋白,融合至神经元特异性RVG肽)实现对脑的靶向。通过电穿孔使纯化的外泌体加载外源性RNA。静脉内注射的RVG靶向的外泌体将GAPDH siRNA特异性地递送至脑中的神经元、小胶质细胞、少突神经胶质细胞,导致特异性的基因敲低。预暴露于RVG外泌体未减弱敲低,并且在其他组织中未观察到非特异性摄取。通过BACE1的强的mRNA(60%)和蛋白质(62%)敲低证明了外泌体介导的siRNA递送的治疗潜能,BACE1是阿尔茨海默病中的治疗靶标。
为了获得免疫惰性的外泌体库,Alvarez-Erviti等人收获了来自具有均质主要组织相容性复合体(MHC)单倍型的近交C57BL/6小鼠的骨髓。由于未成熟树突细胞产生大量的缺乏T细胞激活物诸如MHC-II和CD86的外泌体,Alvarez-Erviti等人选择了具有粒细胞/巨噬细胞集落刺激因子(GM-CSF)的树突细胞,持续7天。次日,使用良好建立的超速离心方案从培养上清液中纯化外泌体。产生的外泌体在物理上是均质的,具有直径为80nm的粒径分布峰,正如通过纳米粒子跟踪分析(NTA)和电子显微术所测定。Alvarez-Erviti等人获得了6-12μg的外泌体(基于蛋白质浓度测量的)/106个细胞。
接着,Alvarez-Erviti等人研究了使用适于纳米级应用的电穿孔方案给修饰的外泌体加载外源性货物的可能性。由于电穿孔对于纳米级的膜粒子尚未良好表征,使用非特异性Cy5标记的RNA用于电穿孔方案的经验优化。在外泌体超速离心和溶解之后测定了封装的RNA量。在400V和125μF下的电穿孔产生RNA的最大保留并且用于所有的后续实验。
Alvarez-Erviti等人向正常C57BL/6小鼠施用被封装在150μg的RVG外泌体中的150μg的每种BACE1 siRNA并且将敲低效率与四只对照小鼠进行比较:未处理的小鼠、仅用RVG外泌体注射的小鼠、用与体内阳离子脂质体试剂复合的BACE1 siRNA注射的小鼠、以及用与RVG-9R复合的BACE1 siRNA注射的小鼠,该RVG肽与静电结合至siRNA的9个D-精氨酸缀合。在施用之后3天,分析皮层组织样品,并且在siRNA-RVG-9R处理的小鼠和siRNARVG外泌体处理的小鼠中均观察到显著的蛋白质敲低(45%,P<0.05,相对于62%,P<0.01),这是由于BACE1 mRNA水平的显著降低(分别为66%[+或-]15%,P<0.001和61%[+或-]13%,P<0.01)。此外,申请人证明了在RVG外泌体处理的动物中总[β]-淀粉样蛋白1-42水平上的显著降低(55%,P<0.05),该β淀粉样蛋白是在阿尔茨海默病理学中的淀粉样白斑的主要组分。所观察到的降低大于在心室内注射BACE1抑制剂之后的正常小鼠中展示的β淀粉样蛋白1-40降低。Alvarez-Erviti等人在BACE1切割产物上进行了5'-cDNA末端快速扩增(RACE),这提供了经由siRNA的RNAi-介导的敲低的证据。
最后,Alvarez-Erviti等人通过评定IL-6、IP-10、TNFα和IFN-α血清浓度研究了RNA-RVG外泌体是否诱导了体内免疫反应。在外泌体处理之后,类似于与强有力地刺激IL-6分泌的siRNA-RVG-9R成对比的siRNA转染试剂处理,登记了在所有细胞因子上的非显著性变化,证实了外泌体处理的免疫惰性属性(profile)。假定外泌体仅封装20%的siRNA,用RVG外泌体的递送比RVG-9R递送显得更有效,因为用少五倍的siRNA实现了相当的mRNA敲低和更好的蛋白质敲低,而没有相应水平的免疫刺激。这个实验证明了RVG外泌体技术的治疗潜力,这种技术潜在地适用于与神经变性疾病相关的基因的长期沉默。Alvarez-Erviti等人的外泌体递送系统可以适用于将本发明的AD官能化的CRISPR-Cas系统递送至治疗靶标,尤其是神经变性疾病。对于本发明可以考虑封装在约100至1000mg的RVG外泌体中的约100至1000mg的CRISPR Cas的剂量。
El-Andaloussi等人(Nature Protocols 7,2112-2126(2012))公开了可以如何利用来源于培养细胞的外泌体用于体外和体内递送RNA。这个方案首先描述了通过转染包含与肽配体融合的外泌体蛋白的表达载体产生靶向的外泌体。接着,El-Andaloussi等人解释了如何纯化和表征来自转染的细胞上清液的外泌体。接着,El-Andaloussi等人详述了将RNA加载到外泌体中的关键步骤。最后,El-Andaloussi等人概述了如何使用外泌体有效地在体外递送RNA以及体内递送至小鼠脑中。还提供了预期结果的实例,其中外泌体介导的RNA递送通过功能测定和成像来评估。整个方案进行约3周。根据本发明的递送或施用可以使用由自我衍生的树突细胞产生的外泌体进行。根据本文的教导内容,这可以用于本发明的实践中。
在另一个实施方案中,考虑了Wahlgren等人(Nucleic Acids Research,2012,第40卷,第17期e130)的血浆外泌体。外泌体是由包括树突细胞(DC)、B细胞、T细胞、肥大细胞、上皮细胞和肿瘤细胞的许多细胞类型产生的纳米尺寸的囊泡(30-90nm大小)。这些囊泡通过晚期内体的向内出芽而形成,然后在与质膜融合后释放到细胞外环境。因为外泌体天然地在细胞之间运送RNA,所以这种特性在基因疗法中可能有用,并且根据本公开可以用于本发明的实践中。
来自血浆的外泌体可以通过以下方式制备:在900g离心血沉棕黄层持续20分钟以便分离血浆,之后收获细胞上清液,在300g离心10分钟以便消除细胞,并且在16 500g离心30分钟,之后通过0.22mm过滤器进行过滤。通过在120 000g超速离心70分钟使外泌体沉淀。根据在RNAi人类/小鼠启动试剂盒(RNAi Human/Mouse Starter Kit,Quiagen,Hilden,Germany)中的制造商的说明进行siRNA到外泌体中的化学转染。siRNA以终浓度2mmol/ml添加到100ml PBS中。在加入HiPerFect转染试剂之后,将混合物在室温下孵育10分钟。为了去除过量的胶束,使用醛/硫酸盐乳胶珠再分离外泌体。可以类似于siRNA进行CRISPR Cas到外泌体中的化学转染。外泌体可以与从健康供体的外周血中分离的单核细胞和淋巴细胞共培养。因此,可以考虑的是,可以将含有CRISPR Cas的外泌体引入到人类的单核细胞和淋巴细胞中并且以自体方式再引入到人类中。因此,可以使用血浆外泌体进行根据本发明的递送或施用。
脂质体
可以用脂质体进行根据本发明的递送或施用。脂质体是球形囊泡结构,其由围绕内部水性区室的单层或多层脂质双层以及相对不可渗透的外部亲脂性磷脂双层构成。脂质体作为药物递送载剂受到了相当的重视,因为它们是生物相容、无毒的,可以递送亲水性和亲脂性药物分子,保护它们的货物免于被血浆酶降解,并且转运它们的负载跨过生物膜和血脑屏障(BBB)(对于评述,参见例如,Spuch和Navarro,Journal of Drug Delivery,第2011卷,文章ID 469679,第12页,2011.doi:10.1155/2011/469679)。
可以由几种不同类型的脂质制造脂质体;然而,磷脂最常用来产生作为药物载剂的脂质体。虽然当脂质膜与水性溶液混合时脂质体形成是自发的,但是也可以通过使用均质机、超声破碎器或挤出设备通过以振荡的形式施加力使其加速(对于评述,参见例如,Spuch和Navarro,Journal of Drug Delivery,第2011卷,文章ID 469679,第12页,2011.doi:10.1155/2011/469679)。
可以将几种其他添加剂添加到脂质体中以修改其结构和特性。例如,可以将胆固醇或鞘磷脂添加到脂质体混合物中,以便帮助稳定化脂质体结构并且防止脂质体内部货物的泄漏。此外,脂质体由氢化卵磷脂酰胆碱或卵磷脂酰胆碱、胆固醇和磷酸二鲸蜡脂制备,并且脂质体的平均囊泡尺寸被调整到约50nm和100nm。(对于评述,参见例如,Spuch和Navarro,Journal of Drug Delivery,第2011卷,文章ID 469679,第12页,2011.doi:10.1155/2011/469679)。
脂质体配制品可以主要由天然磷脂和脂质诸如1,2-二硬脂酰基-sn-甘油基-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱和单唾酸酰神经节苷酯构成。由于这种配制品仅仅由磷脂组成,脂质体配制品已经遇到了许多挑战,其中之一是在血浆中的不稳定性。已经作出战胜这些挑战的若干尝试,特别是在脂质膜的处理方面。这些尝试之一集中于胆固醇的处理。将胆固醇添加到常规配制品中减缓了封装的生物活性化合物到血浆中的迅速释放,或者添加1,2-二油酰基-sn-甘油基-3-磷酸乙醇胺(DOPE)增加了稳定性(对于评述,参见例如,Spuch和Navarro,Journal of Drug Delivery,第2011卷,文章ID 469679,第12页,2011.doi:10.1155/2011/469679)。
在一个特别有利的实施方案中,特洛伊木马(Trojan Horse)脂质体(也称为分子特洛伊木马)是令人希望的并且方案可见于http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long。这些粒子允许转基因在血管内注射之后递送至整个脑。在不受限制的情况下,据信表面缀合有特异性抗体的中性脂质粒子允许经由胞吞作用跨过血脑屏障。特洛伊木马脂质体可以用于将核酸酶的CRISPR家族经由血管内注射递送至脑,这将允许全脑转基因动物,而不需要胚胎操纵。对于在脂质体中的体内施用,可以考虑约1-5g的DNA或RNA。
在另一个实施方案中,AD官能化的CRISPR Cas系统或其组分可以在脂质体中施用,所述脂质体诸如稳定的核酸-脂质粒子(SNALP)(参见例如Morrissey等人,NatureBiotechnology,第23卷,第8期,2005年8月)。考虑每日静脉内注射约1、3或5mg/kg/天的SNALP中的被靶向的特异性CRISPR Cas。日治疗可以经过约三天,并且然后每周治疗持续约五周。在另一个实施方案中,还考虑了通过以约1或2.5mg/kg的剂量静脉内注射施用封装有特异性CRISPR Cas的SNALP)(参见例如Zimmerman等人,Nature Letters,第441卷,2006年5月4日)。SNALP配制品可以含有为2:40:10:48的摩尔百分比的脂质3-N-[(w甲氧基聚(乙二醇)2000)氨甲酰基]-1,2-二肉豆蔻氧基-丙胺(PEG-C-DMA)、1,2-二亚油基氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2-二硬脂酰基-sn-甘油基-3-磷酸胆碱(DSPC)和胆固醇(参见例如Zimmerman等人,Nature Letters,第441卷,2006年5月4日)。
在另一个实施方案中,已经证明稳定的核酸-脂质粒子(SNALP)将分子有效地递送至高度血管化的HepG2-衍生的肝脏肿瘤,但是不递送至血管化不良的HCT-116衍生的肝脏肿瘤(参见例如Li,Gene Therapy(2012)19,775-780)。可以通过以下方式制备SNALP脂质体:使用25:1的脂质/siRNA比率和48/40/10/2的胆固醇/D-Lin-DMA/DSPC/PEG-C-DMA的摩尔比,用二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和siRNA配制D-Lin-DMA和PEG-C-DMA。所得的SNALP脂质体的尺寸为约80-100nm。
在又一个实施方案中,SNALP可以包含合成胆固醇(Sigma-Aldrich,St Louis,MO,USA)、二棕榈酰磷脂酰胆碱(Avanti Polar Lipids,Alabaster,AL,USA)、3-N-[(w-甲氧基聚(乙二醇)2000)氨甲酰基]-1,2-二肉豆蔻氧基丙胺,以及阳离子的1,2-二亚油基氧基-3-N,N二甲基氨基丙烷(参见例如Geisbert等人,Lancet 2010;375:1896-905)。可以考虑例如静脉内推注施用约2mg/kg总CRISPR Cas/剂的剂量。
在又一个实施方案中,SNALP可以包含合成胆固醇(Sigma-Aldrich)、1,2-二硬脂酰基-sn-甘油基-3-磷酸胆碱(DSPC;Avanti Polar Lipids Inc.)、PEG-cDMA,以及1,2-二亚油基氧基-3-(N;N-二甲基)氨基丙烷(DLinDMA)(参见例如Judge,J.Clin.Invest.119:661-673(2009))。用于体内研究的配制品可以包含约9:1的最终脂质/RNA质量比。
Alnylam Pharmaceuticals的Barros和Gollob已对RNAi纳米药物的安全性进行了评论(参见例如Advanced Drug Delivery Reviews 64(2012)1730-1737)。稳定的核酸脂质粒子(SNALP)由四种不同的脂质构成-在低pH下为阳离子的可电离脂质(DLinDMA)、中性辅助脂质、胆固醇以及可扩散的聚乙二醇(PEG)-脂质。该粒子的直径为大约80nm并且在生理pH下是电中性的。在配制期间,可电离脂质用于在粒子形成期间使脂质与阴离子RNA缩合。当在渐增的酸性内体条件下带正电荷时,可电离脂质还介导SNALP与内体膜的融合,从而能够将RNA释放到细胞质中。PEG-脂质在配制期间稳定化粒子并且减少聚集,并且随后提供改善药代动力学特性的中性的亲水性外部。
到目前为止,已经使用具有RNA的SNALP配制品开始了两个临床项目。TekmiraPharmaceuticals最近在具有升高的LDL胆固醇的成年志愿者中完成了SNALP-ApoB I期单剂量研究。ApoB主要是在肝脏和空肠中表达,并且是为VLDL和LDL的组装和分泌所必需的。十七位受试者接受了SNALP-ApoB的单剂量(跨7个剂量水平的剂量递增)。没有肝脏毒性(预期为基于临床前研究的潜在剂量限制性毒性)的证据。处于最高剂量的(两位中的)一位受试者经历了与免疫系统刺激一致的流感样症状,于是做出结束该试验的决定。
Alnylam Pharmaceuticals已经类似地推出了ALN-TTR01,其采用以上所述的SNALP技术并且靶向突变体和野生型TTR的肝细胞产生,从而治疗TTR淀粉样变性(ATTR)。已经描述了三种ATTR综合征:家族性淀粉样变性多神经病(FAP)和家族性淀粉样心肌病(FAC)-两者均由TTR中的常染色体显性突变引起;以及由野生型TTR引起的老年全身性淀粉样变性(SSA)。最近在患有ATTR的患者中完成了ALN-TTR01的安慰剂对照单剂量递增I期试验。向31位患者(23位用研究药物,8位用安慰剂)在0.01至1.0mg/kg(基于siRNA)的剂量范围内以15分钟静脉内输注施用ALN-TTR01。治疗耐受性良好,其中在肝功能试验中没有显著增加。在≥0.4mg/kg时在23位患者的3位中注意到输注相关反应;所有患者均对减慢输注速率做出了反应并且所有患者继续参与研究。在处于1mg/kg的最高剂量(如根据临床前和NHP研究预期的)的两位患者中注意到血清细胞因子IL-6、IP-10和IL-1ra的最小与瞬时升高。在1mg/kg时观察到ALN-TTR01的预期药效动力学效应,即血清TTR的降低。
在又一个实施方案中,可以通过将阳离子脂质、DSPC、胆固醇以及PEG-脂质例如以40:10:40:10的摩尔比分别溶解在例如乙醇中来制备SNALP(参见Semple等人,NatureNiotechnology,第28卷,第2期,2010年2月,第172-177页)。将脂质混合物添加到水性缓冲液(50mM柠檬酸盐,pH 4)中,混合至最终的乙醇和脂质浓度分别为30%(体积/体积)和6.1mg/ml,并且使得其在22℃下平衡2分钟,然后挤出。使用Lipex挤出仪(NorthernLipids),在22℃下将水合脂质挤出通过两个重叠的80nm孔径大小的过滤器(Nuclepore),直到获得如通过动态光散射分析测定的70-90nm直径的囊泡为止。这大致需要1-3次通过。将siRNA(溶解在50mM柠檬酸盐中,pH为4的含有30%乙醇的水性溶液)以约5ml/min的速率在混合下添加到预平衡的(35℃)囊泡中。在达到0.06(重量/重量)的最终靶siRNA/脂质比率之后,将混合物在35℃下另外孵育30分钟,以允许囊泡重组和siRNA的封装。然后去除乙醇并且通过透析或切向流渗滤用PBS(155mM NaCl,3mM Na2HPO4,1mM KH2PO4,pH 7.5)替换外部缓冲液。使用受控的逐步稀释法工艺将siRNA封装在SNALP中。KC2-SNALP的脂质构分为以57.1:7.1:34.3:1.4的摩尔比使用的DLin-KC2-DMA(阳离子脂质)、二棕榈酰磷脂酰胆碱(DPPC;Avanti Polar Lipids)、合成胆固醇(Sigma)和PEG-C-DMA。在形成加载的粒子后,将SNALP在PBS中透析并且在使用之前通过0.2μm的过滤器灭菌过滤。平均粒径为75-85nm,并且90%-95%的siRNA被封装在脂质粒子之内。用于体内测试的在配制品中的最终siRNA/脂质比率为约0.15(重量/重量)。在临使用之前将含有因子VII siRNA的LNP-siRNA系统在无菌PBS中稀释到适当浓度,并且通过侧尾静脉以10ml/kg的总体积静脉内施用配制品。这种方法和这些递送系统可以外推到本发明的AD官能化的CRISPR Cas系统。
其他脂质
其他阳离子脂质,诸如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA)可以类似于SiRNA地用来封装CRISPR Cas或其组分或对其编码的一个或多个核酸分子(参见例如Jayaraman,Angew.Chem.Int.Ed.2012,51,8529-8533),因此可以用于本发明的实践中。可以考虑具有下列脂质组成的预成型囊泡:分别处于摩尔比40/10/40/10的氨基脂质、二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和(R)-2,3-双(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基碳酸酯(PEG-脂质),以及大约0.05(w/w)的FVII siRNA/总脂质比率。为了确保在70-90nm范围内的窄粒径分布以及0.11+0.04(n=56)的低多分散性指数,可以在添加指导RNA之前将粒子通过80nm的膜挤出达三次。可以使用含有高度有效的氨基脂质16的粒子,其中四种脂质组分16、DSPC、胆固醇和PEG-脂质的摩尔比(50/10/38.5/1.5)可以被进一步优化,以增强体内活性。
Michael S D Kormann等人("Expression of therapeutic proteins afterdelivery of chemically modified mRNA in mice:Nature Biotechnology,第29卷,第154-157页(2011))描述了脂质包膜用于递送RNA的用途。在本发明中,脂质包膜的使用也是优选的。
在另一个实施方案中,脂质可以用本发明的AD官能化的CRISPR Cas系统或其一种或多种组分或对其编码的一个或多个核酸分子一起配制而形成脂质纳米粒子(LNP)。脂质包括但不限于,DLin-KC2-DMA4、C12-200和辅助脂质二硬脂酰磷脂酰胆碱、胆固醇和PEG-DMG,可以使用自发囊泡形成程序将其与CRISPR Cas而不是siRNA一起配制(参见例如Novobrantseva,Molecular Therapy-Nucleic Acids(2012)1,e4;doi:10.1038/mtna.2011.3)。组分摩尔比可以是约50/10/38.5/1.5(DLin-KC2-DMA或C12-200/二硬脂酰磷脂酰胆碱/胆固醇/PEG-DMG)。在DLin-KC2-DMA和C12-200脂质纳米粒子(LNP)的情况下,最终脂质:siRNA的重量比分别为约12:1和9:1。配制品可以具有约80nm的平均粒子直径,具有>90%的包封效率。可以考虑3mg/kg的剂量。
Tekmira在美国和国外具有一组针对LNP和LNP配制品的不同方面的大约95个同族专利(参见例如美国专利号7,982,027;7,799,565;8,058,069;8,283,333;7,901,708;7,745,651;7,803,397;8,101,741;8,188,263;7,915,399;8,236,943和7,838,658,以及欧洲专利号1766035;1519714;1781593和1664316),所有这些专利均可用于并且/或者适于本发明。
AD官能化的CRISPR Cas系统或其组分或对其编码的一个或多个核酸分子可以封装在PLGA微球中进行递送,诸如进一步描述于美国公布申请20130252281和20130245107以及20130244279(转让给Moderna Therapeutics)中,这些申请涉及包含修饰的核酸分子的组合物的配制品的多个方面,这些核酸分子可以编码蛋白质、蛋白质前体、或该蛋白质或该蛋白质前体的部分或完全加工形式。该配制品可以具有50:10:38.5:1.5-3.0(阳离子脂质:融合脂质:胆固醇:PEG脂质)的摩尔比。PEG脂质可以选自但不限于PEG-c-DOMG、PEG-DMG。融合脂质可以是DSPC。另参见Schrum等人,Delivery and Formulation of EngineeredNucleic Acids,美国公布申请20120251618。
Nanomerics的技术着手解决针对广泛治疗学的生物利用度挑战,包括基于低分子量疏水性药物、肽以及核酸的治疗剂(质粒、siRNA、miRNA)。该技术已经证明了明显优势的特异性的施用途径包括经口途径、跨血脑屏障的转运、向实体瘤的递送,以及向眼部的递送。参见例如Mazza等人,2013,ACS Nano.2013年2月26日;7(2):1016-26;Uchegbu和Siew,2013,J Pharm Sci.102(2):305-10以及Lalatsa等人,2012,J Control Release.2012年7月20日;161(2):523-36。
美国专利公布号20050019923描述了用于向哺乳动物身体递送生物活性分子诸如多核苷酸分子、肽和多肽和/或药剂的阳离子树状聚合物。树状聚合物适用于将生物活性分子的递送靶向至例如肝脏、脾、肺、肾脏或心脏(或甚至脑)。树状聚合物是由简单的支化单体单元以逐步方式制备的合成性3维大分子,其性质和功能性可以容易地进行控制和改变。树状聚合物经由向多功能核(发散式合成法)或朝向多功能核(收敛式合成法)重复加成结构单元来合成,并且结构单元的3维壳的每次加成使得更高级别的树状聚合物形成。聚丙烯亚胺树状聚合物从二氨基丁烷核开始,通过对伯胺的丙烯腈的双迈克尔加成反应向其上添加两倍数目的氨基基团,然后进行腈的氢化。这导致氨基基团的加倍。聚丙烯亚胺树状聚合物含有100%的可质子化氮以及高达64个末端氨基基团(5级,DAB 64)。可质子化基团通常是能够在中性pH下接受质子的胺基。树状聚合物作为基因递送剂的用途在很大程度上集中于聚酰胺-胺和含磷化合物的用途,其中胺/酰胺的混合物或N--P(O2)S分别作为缀合单元,没有报道关于更低级别的聚丙烯亚胺树状聚合物用于基因递送的用途的著作。还研究了作为pH敏感的控制释放系统的聚丙烯亚胺树状聚合物,其用于药物递送以及当被外周氨基酸基团化学修饰时用于它们的客体分子的封装。还研究了聚丙烯亚胺树状聚合物的细胞毒性和其与DNA的相互作用以及DAB 64的转染效力。
美国专利公布号20050019923是基于与早期报道相反的观察:阳离子树状聚合物诸如聚丙烯亚胺树状聚合物展示出合适的特性,诸如特异性靶向和低毒性,其用于靶向递送生物活性分子诸如遗传物质。此外,阳离子树状聚合物的衍生物也展示出适用于生物活性分子的靶向递送的特性。另参见,生物活性聚合物(Bioactive Polymers),美国公布申请20080267903,其公开了“不同的聚合物,包括阳离子聚胺聚合物和树枝状聚合物显示出具有抗增殖活性,并且因此可用于治疗特征为不希望的细胞增殖的病症,诸如新生物和肿瘤、炎性病症(包括自身免疫性病症)、银屑病和动脉粥样硬化。这些聚合物可以作为活性剂单独使用,或者作为其他治疗剂(诸如药物分子或用于基因疗法的核酸)的递送媒介物。在此类情况下,聚合物的自身固有的抗肿瘤活性可以补足有待递送的剂的活性。”这些专利公布的公开内容可以与本文的教导内容结合使用,以用于递送一种或多种AD官能化的CRISPRCas系统或其一种或多种组分或对其编码的一个或多个核酸分子。
超电荷蛋白
超电荷蛋白是一类具有非常高的正或负的理论净电荷的工程化或天然存在的蛋白质并且可以用于递送一种或多种AD官能化的CRISPR Cas系统或其一种或多种组分或对其编码的一个或多个核酸分子。超负电荷蛋白和超正电荷蛋白两者都表现出显著的抵抗热诱导或化学诱导的聚集的能力。超正电荷蛋白还能够穿透哺乳动物细胞。使货物诸如质粒DNA、RNA或其他蛋白质与这些蛋白质缔合可以使得这些大分子到体外和体内的哺乳动物细胞中的功能递送成为可能。在2007年报道了超电荷蛋白的产生和表征(Lawrence等人2007,Journal of the American Chemical Society 129,10110-10112)。
RNA和质粒DNA到哺乳动物细胞中的非病毒递送对于研究和治疗应用都是有价值的(Akinc等人,2010,Nat.Biotech.26,561-569)。纯化的+36GFP蛋白(或其他超正电荷蛋白)与RNA在适当的无血清培养基中混合并且使得其在添加到细胞中之前复合。在这个阶段包含血清抑制超电荷蛋白-RNA复合物的形成并且降低治疗效果。已经发现以下方案对于多种细胞系是有效的(McNaughton等人,2009,Proc.Natl.Acad.Sci.USA 106,6111-6116)(然而,应当进行改变蛋白质和RNA剂量的预试验来优化用于特定细胞系的程序):(1)在治疗前一天,以1x 105个细胞/孔铺在48孔板中。(2)在治疗当天,将纯化的+36GFP蛋白在无血清的培养基中稀释至终浓度200nM。添加RNA至50nM的终浓度。涡旋混合并且在室温下孵育10分钟。(3)在孵育期间,从细胞抽出培养基并且用PBS洗涤一次。(4)在孵育+36GFP和RNA之后,向细胞添加蛋白质-RNA复合物。(5)将细胞与复合物在37℃下孵育4小时。(6)在孵育之后,抽出培养基并且用20U/mL的肝素PBS洗涤三次。用含血清的培养基另外孵育细胞48小时或更长,这取决于用于活性的测定。(7)通过免疫印迹、qPCR、表型测定或其他适当的方法分析细胞。
进一步发现,+36GFP在一系列细胞中是有效的质粒递送试剂。由于质粒DNA是一种比siRNA大的货物,有效复合质粒需要成比例地更大的+36GFP蛋白。为了有效质粒递送,申请人已经开发了一种带有C端HA2肽标签的+36GFP变体,这种肽是一种已知的来源于流感病毒血凝素蛋白的内体破坏肽。以下方案在多种细胞中是有效的,但是如上所述,建议针对特定细胞系和递送应用优化质粒DNA和超电荷蛋白的剂量:(1)在治疗前一天,以1x 105/孔铺在48孔板中。(2)在治疗当天,将纯化的GFP蛋白在无血清的培养基中稀释至终浓度2mM。添加1mg质粒DNA。涡旋混合并且在室温下孵育10分钟。(3)在孵育期间,从细胞抽出培养基并且用PBS洗涤一次。(4)在孵育GFP和质粒DNA之后,向细胞轻轻添加蛋白质-DNA复合物。(5)将细胞与复合物在37C下孵育4小时。(6)在孵育之后,抽出培养基并且用PBS洗涤。在含血清培养基中孵育细胞,并且另外孵育24-48小时。(7)在适当时分析质粒递送(例如,通过质粒驱动的基因表达)。
另参见,例如,McNaughton等人,Proc.Natl.Acad.Sci.USA 106,6111-6116(2009);Cronican等人,ACS Chemical Biology 5,747-752(2010);Cronican等人,Chemistry&Biology 18,833-838(2011);Thompson等人,Methods in Enzymology 503,293-319(2012);Thompson,D.B.,等人,Chemistry&Biology 19(7),831-843(2012)。超电荷蛋白的这些方法可以用于并且/或者适于本发明的AD官能化的CRISPR Cas系统的递送。这些系统结合本文的教导内容可以用于递送一种或多种AD官能化的CRISPR Cas系统或其一种或多种组分或对其编码的一个或多个核酸分子。
细胞穿透肽(CPP)
在又一个实施方案中,考虑了细胞穿透肽(CPP)用于AD官能化的CRISPR Cas系统的递送。CPP是促进各种分子货物(从纳米级粒子至小化学分子和大的DNA片段)的细胞摄取的短肽。如本文所用,术语“货物”包括但不限于由以下组成的组:治疗剂、诊断性探针、肽、核酸、反义寡核苷酸、质粒、蛋白质、粒子(包括纳米粒子)、脂质体、发色团、小分子以及放射性物质。在本发明的方面中,货物还可以包括AD官能化的CRISPR Cas系统的任何组分或整个AD官能化的CRISPR Cas系统。本发明的各方面还提供了用于将所需货物递送至受试者中的方法,所述方法包括:(a)制备包含本发明的细胞穿透肽和所需货物的复合物,以及(b)向受试者经口地、关节内地、腹膜内地、鞘内地、动脉内地(intrarterially)、鼻内地、实质内地(intraparenchymally)、皮下地、肌内地、静脉内地、真皮地、直肠内地或局部地施用复合物。货物通过经由共价键的化学键联或通过非共价的相互作用与肽缔合。
CPP的功能是将货物递送至细胞中,这是一种通常通过胞吞作用发生的过程,其中货物被递送至活哺乳动物细胞的内体。细胞穿透肽具有不同的尺寸、氨基酸序列并且带电荷,但是所有CPP具有一种独特的特征,该特征是易位质膜并且将各种分子货物递送至细胞质或细胞器的能力。CPP易位可以被分类成三种主要的进入机制:直接穿透膜中、胞吞作用介导的进入,以及通过瞬时结构的形成的易位。CPP在医学中发现了许多应用,在治疗不同疾病包括癌症中作为药物递送剂,和病毒抑制剂以及用于细胞标记的造影剂。后者的实例包括充当用于GFP、MRI造影剂或量子点的载剂。CPP作为用于研究和医学的体外及体内递送载体具有极大潜力。CPP典型地具有下述的氨基酸组成,该氨基酸组成含有高相对丰度的带正电荷的氨基酸诸如赖氨酸或精氨酸或具有含有极性/带电荷氨基酸和非极性、疏水性氨基酸的交替图案的序列。这两种类型的结构分别称为聚阳离子的或两亲性的。CPP的第三种类别是仅含有非极性残基的疏水性肽,具有低净电荷或具有对于细胞摄取关键的疏水性氨基酸基团。所发现的初始CPP中之一是来自人类免疫缺陷病毒1(HIV-1)的反激活转录激活因子(Tat),发现其高效地从周围介质被许多培养中的细胞类型摄取。从此以后,多种已知的CPP得到了相当地扩展并且产生了具有更有效的效应蛋白转导特性的小分子合成类似物。CPP包括但不限于穿透素、Tat(48-60)、转运素和(R-AhX-R4)(Ahx=氨基己酰基)。
美国专利8,372,951提供了来源于嗜酸性粒细胞阳离子蛋白(ECP)的CPP,该CPP表现出非常高的细胞穿透效率和低毒性。还提供了将带有其货物的CPP递送至脊椎动物受试者中的方面。CPP及其递送的另外方面描述于美国专利8,575,305;8;614,194和8,044,019中。CPP可用于递送AD官能化的CRISPR-Cas系统或其组分。可以用于递送AD官能化的CRISPR-Cas系统或其组分的CPP还被提供于手稿“通过细胞穿透肽介导的Cas9蛋白和指导RNA的递送进行的基因破坏(Gene disruption by cell-penetrating peptide-mediateddelivery of Cas9 protein and guide RNA)”,Suresh Ramakrishna、Abu-Bonsrah KwakuDad、Jagadish Beloor等人Genome Res.2014年4月2日,该文献以引用方式并入,其中证实了用CPP缀合的重组Cas9蛋白和CPP复合的指导RNA的处理导致人类细胞系中的内源性基因破坏。在论文中,Cas9蛋白经由硫醚键缀合至CPP,而指导RNA与CPP复合,形成了稠合的带正电荷的粒子。已经显示,用修饰的Cas9和指导RNA同时和顺序地治疗人类细胞,包括胚胎干细胞、真皮成纤维细胞、HEK293T细胞、HeLa细胞和胚胎癌细胞,导致有效的基因破坏,伴随相对于质粒转染而言降低的脱靶突变。
气雾剂递送
对肺病进行治疗的受试者可以在自主呼吸时例如每侧肺部接受药物有效量的支气管递送的雾化的AAV载体系统。因此,一般而言,对于AAV递送,雾化的递送是优选的。腺病毒或AAV粒子可以用于递送。可以将合适的基因构建体克隆到递送载体中,这些基因构建体各自可操作地连接至一个或多个调控序列。
包装和启动子
用于驱动CRISPR-Cas蛋白和腺苷脱氨酶编码核酸分子表达的启动子可以包括AAVITR,其可以用作启动子。这对于消除对另外的启动子元件(可能在载体中占用空间)的需要是有利的。空出来的另外的空间可以用于驱动另外的元件(gRNA等)的表达。另外,ITR活性是相对较弱的,因此可以用于降低由于Cas13的过表达所致的潜在毒性。
对于普遍表达,可以使用的启动子包括:CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链等。对于脑或其他CNS表达,可以使用启动子:用于所有神经元的突触蛋白I(SynapsinI)、用于兴奋性神经元的CaMKIIα、用于GABA能神经元的GAD67或GAD65或VGAT。对于肝脏表达,可以使用白蛋白启动子。对于肺表达,可以使用SP-B。对于内皮细胞,可以使用ICAM。对于造血细胞,可以使用IFNβ或CD45。对于成骨细胞,可以使用OG-2。
用于驱动指导RNA的启动子可以包括Pol III启动子,诸如U6或H1,以及使用PolII启动子和内含子盒来表达指导RNA。
腺相关病毒(AAV)
靶向结构域、腺苷脱氨酶和一种或多种指导RNA可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其他质粒或病毒载体类型进行递送,特别地,使用来自以下文献的配方和剂量:例如,美国专利号8,454,972(针对腺病毒的配方、剂量)、8,404,658(针对AAV的配方、剂量)和5,846,946(针对DNA质粒的配方、剂量)以及来自临床试验和关于涉及慢病毒、AAV和腺病毒的临床试验的出版物的配方和剂量。例如,对于AAV,施用途径、配方和剂量可以如美国专利号8,454,972并且如涉及AAV的临床试验。对于腺病毒,施用途径、配方和剂量可以如美国专利号8,404,658并且如涉及腺病毒的临床试验。对于质粒递送,施用途径、配方和剂量可以如美国专利号5,846,946并且如涉及质粒的临床试验。剂量可以基于或外推为平均70kg的个体(例如,男性成人),并且可以针对不同重量和种类的患者、受试者、哺乳动物进行调整。施用频率在医学或兽医学从业者(例如医师、兽医师)的范围之内,其取决于常规因素,包括患者或受试者的年龄、性别、一般健康状况、其他状况以及着手解决的特定病状或症状。可以将病毒载体注射到目标组织中。对于细胞类型特异性基因组修饰,Cas13和腺苷脱氨酶的表达可以由细胞类型特异性启动子驱动。例如,肝脏特异性表达可以使用白蛋白启动子,而神经元特异性表达(例如靶向CNS病症)可以使用突触蛋白I启动子。
就体内递送而言,AAV相比于其他病毒载体是有利的,这是由于两个原因:低毒性(这可能是由于纯化方法不需要细胞粒子的超速离心所致,而超速离心可能激活免疫反应);以及引起插入诱变的低概率,原因在于它未整合到宿主基因组中。
AAV的包装限度为4.5或4.75Kb。这意味着Cas13以及启动子和转录终止子必须都适于相同的病毒载体。大于4.5或4.75Kb的构建体将导致病毒产生显著减少。SpCas9是相当大的,该基因自身超过4.1Kb,使其难于包装到AAV中。因此本发明的实施方案包括利用更短的Cas13同源物。
关于AAV,AAV可以是AAV1、AAV2、AAV5或它们的任何组合。可以相对于有待被靶向的细胞从这些AAV中选择AAV;例如,可以选择用于靶向脑或神经元细胞的AAV血清型1、2、5或杂合衣壳AAV1、AAV2、AAV5或它们的任何组合;并且可以选择用于靶向心脏组织的AAV4。AAV8可用于递送至肝脏。本文的启动子和载体是单独优选的。就这些细胞而论(参见Grimm,D.等人,J.Virol.82:5887-5911(2008)),某些AAV血清型的列表如下:
慢病毒
病毒是复杂的反转录病毒,其具有在有丝分裂细胞和有丝分裂后细胞两者中感染并表达其基因的能力。最为人熟知的慢病毒是人类免疫缺陷病毒(HIV),其使用其他病毒的包膜糖蛋白来靶向广泛范围的细胞类型。
慢病毒可以如下制备。在克隆pCasES10(含有慢病毒转移质粒骨架)之后,将处于低传代数(p=5)的HEK293FT接种在T-75烧瓶中,以在转染之前的一天在具有10%胎牛血清而没有抗生素的DMEM中达到50%汇合。在20小时之后,将培养基更换为OptiMEM(无血清)培养基,并且在4小时后进行转染。将细胞用10μg的慢病毒转移质粒(pCasES10)和下列包装质粒转染:5μg的pMD2.G(VSV-g假型)和7.5ug的psPAX2(gag/pol/rev/tat)。在具有阳离子脂质递送剂(50uL的Lipofectamine 2000和100ul的Plus试剂)的4mL OptiMEM中进行转染。在6小时之后,将培养基更换为具有10%胎牛血清的无抗生素的DMEM。这些方法在细胞培养期间使用血清,但是优选无血清的方法。
慢病毒可以如下纯化。在48小时后收获病毒上清液。首先清除上清液中的碎片,然后通过0.45um低蛋白结合(PVDF)过滤器进行过滤。然后将它们在超速离心机中以24,000rpm旋转2小时。将病毒沉淀重新悬浮在50ul的DMEM中,在4C下过夜。然后将它们等分,并且立即在-80℃下冷冻。
在另一个实施方案中,还考虑了基于马感染性贫血病毒(EIAV)的最小非灵长类动物慢病毒载体,特别是对于眼部基因疗法而言(参见例如Balagaan,J Gene Med 2006;8:275–285)。在另一个实施方案中,还考虑了一种经由视网膜下注射递送用于治疗湿型年龄相关性黄斑变性的、表达血管生成抑制蛋白(内皮抑素和血管抑素)的基于马感染性贫血病毒的慢病毒基因疗法载体(参见例如Binley等人,HUMAN GENE THERAPY 23:980-991(2012年9月)),并且此载体可以被修改用于本发明的AD官能化的CRISPR-Cas系统。
在另一个实施方案中,自我失活性慢病毒载体可以用于并且/或者适于本发明的AD官能化的CRISPR-Cas系统核,该自我失活性慢病毒载体具有靶向由HIV tat/rev共享的共有外显子的siRNA、核仁定位TAR诱饵和抗CCR5特异性锤头状核酶(参见例如DiGiusto等人(2010)Sci Transl Med 2:36ra43)。可以收集最少2.5×106个CD34+细胞/每千克患者体重并且以2×106个细胞/ml的密度在X-VIVO 15培养基(Lonza)中预刺激16至20小时,该培养基含有2μmol/L-谷氨酰胺、干细胞因子(100ng/ml)、Flt-3配体(Flt-3L)(100ng/ml)和促血小板生成素(10ng/ml)(CellGenix)。可以用慢病毒以感染复数5在75-cm2的包覆有纤连蛋白(25mg/cm2)(RetroNectin,Takara Bio Inc.)的组织培养瓶中转导预刺激的细胞,持续16至24小时。
慢病毒载体已公开于帕金森病的治疗中,参见例如美国专利公布号20120295960以及美国专利号7303910和7351585。慢病毒载体还已公开于眼部疾病的治疗中,参见例如美国专利公布号20060281180、20090007284、US20110117189;US20090017543;US20070054961、US20100317109。还已公开了将慢病毒载体递送至脑,参见例如美国专利公布号US20110293571;US20110293571、US20040013648、US20070025970、US20090111106和美国专利号US7259015。
在非动物生物体中的应用
一种或多种AD官能化的CRISPR系统(例如,单一或多重)可以与农作物基因组的研究进展结合来使用。本文所述的系统可以用于进行有效且性价比高的植物基因或基因组探询或编辑或操纵—例如,用于快速研究并且/或者选择并且/或者探询并且/或者比较并且/或者操纵并且/或者转化植物基因或基因组;例如,以便为一种或多种植物产生、鉴定、开发、优化或赋予一种或多种性状或一种或多种特征或者以转化植物基因组。因此,可以存在植物、具有新性状或特征组合的新植物或具有增强的性状的新植物的改善的产生方法。关于定点整合(SDI)或基因编辑(GE)或任何近反向育种(Near Reverse Breeding)(NRB)或反向育种(RB)技术中的植物,可以使用AD官能化的CRISP R系统。利用本文所述的Cas13效应蛋白系统的方面可能类似于CRI SPR-Cas(例如CRISPR-Cas9)系统在植物中的使用,并且提及亚利桑那大学(University of Arizona)网站“CRISPR-PLANT”(http://www.genome.arizona.edu/crispr/)(得到宾州州立大学(Penn State)和AGI的支持)。本发明的实施方案可以用于在植物中或在先前已使用RNAi或类似基因组编辑技术的情况中进行基因组编辑;参见例如,Nekrasov,“Plant genome editing made easy:targeted mutagenesisin model and crop plants using the CRISPR-Cas system,”Plant Methods 2013,9:39(doi:10.1186/1746-4811-9-39);Brooks,“Efficient gene editing in tomato in thefirst generation using the CRISPR-Cas9 system,”Plant Physiology,2014年9月,第114.247577页;Shan,“Targeted genome modification of crop plants using aCRISPR-Cas system,”Nature Biotechnology 31,686-688(2013);Feng,“Efficientgenome editing in plants using a CRISPR-Cas system,”Cell Research(2013)23:1229-1232.doi:10.1038/cr.2013.114;2013年8月20日在线公布;Xie,“RNA-guidedgenome editing in plants using a CRISPR-Cas system,”Mol Plant.2013年11月;6(6):1975-83.doi:10.1093/mp/sst119.电子版2013年8月17日;Xu,“Gene targetingusing the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice,”Rice2014,7:5(2014);Zhou等人,“Exploiting SNPs for biallelic CRISPR mutations inthe outcrossing woody perennial Populus reveals 4-coumarate:CoA ligasespecificity and Redundancy,”New Phytologist(2015)(论坛)1-4(仅在www.newphytologist.com处在线可得);Caliando等人,“Targeted DNA degradationusing a CRISPR device stably carried in the host genome,NATURE COMMUNICATIONS6:6989,DOI:10.1038/ncomms7989,www.nature.com/naturecommunications DOI:10.1038/ncomms7989;美国专利号6,603,061-土壤杆菌属介导的植物转化方法(Agrobacterium-Mediated Plant Transformation Method);美国专利号7,868,149-植物基因组序列及其用途(Plant Genome Sequences and Uses Thereof)以及US 2009/0100536-具有增强的农艺性状的转基因植物(Transgenic Plants with EnhancedAgronomic Traits),每份文献的所有内容和公开内容均以引用方式整体并入本文。在本发明的实践中,Morrell等人“农作物基因组:进展与应用(Crop genomics:advances andapplications)”,Nat Rev Genet.2011年12月29日;13(2):85-96的内容和公开内容;每份文献以引用方式并入本文,包括关于本文的实施方案如何可以就植物而使用。因此,除非另外表明,否则本文提及动物细胞也可以加上必要的变更应用于植物细胞;并且,本文的具有降低的脱靶效应的酶和采用此类酶的系统可以用于植物应用,包括本文提及的那些。
向植物和酵母应用定点碱基编辑
一般来讲,术语“植物”涉及植物界中通过细胞分裂特征性生长、含有叶绿体并具有包含纤维素的细胞壁的任何不同光合作用生物体、真核生物体、单细胞生物体或多细胞生物体。术语植物涵盖单子叶植物和双子叶植物。确切地说,这些植物旨在包括但不限于被子植物和裸子植物,诸如刺槐、苜蓿、苋菜、苹果、杏、朝鲜蓟、白蜡树、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、桦树、山毛榉、黑莓、蓝莓、西兰花、抱子甘蓝、卷心菜、油菜、哈密瓜、胡萝卜、木薯、花椰菜、雪松、谷类、芹菜、栗子、樱桃、大白菜、柑橘、克莱门氏小柑橘、三叶草、咖啡、玉米、棉花、豇豆、黄瓜、柏树、茄子、榆树、菊苣、桉树、茴香、无花果、冷杉、天竺葵、葡萄、葡萄柚、落花生、地樱桃、树胶铁杉、山核桃木、羽衣甘蓝、奇异果、甘蓝、落叶松、莴苣、韭、柠檬、青柠、洋槐、松树、孔雀草、玉米、芒果、枫树、甜瓜、粟、蘑菇、芥菜、坚果、橡树、燕麦、油棕、秋葵、洋葱、橙、观赏植物或花或树木、木瓜、棕榈、荷兰芹、欧洲防风草、豌豆、桃、花生、梨、泥炭(peat)、胡椒、柿子、木豆、松树、菠萝、大蕉、李子、石榴、马铃薯、南瓜、菊苣、萝卜、油菜籽、覆盆子、稻、黑麦、高粱、红花、黄华柳、大豆、菠菜、云杉、南瓜属植物果实、草莓、糖甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、烟草、番茄、树类、黑小麦、草坪草、芜菁、藤本植物、胡桃、豆瓣菜、西瓜、小麦、山药、紫杉以及西葫芦。术语植物还涵盖藻类,藻类主要是光能自养生物,它们主要一致缺少根、叶以及其他表征高等植物的器官。
用于使用如本文所述的AD官能化的CRISPR系统进行基因组编辑的方法可以用于对基本上任何植物赋予所需的性状。针对本文所述的所需生理以及农学特征,可以使用本公开的核酸构建体和以上提及的各种转化方法对多种多样的植物和植物细胞系统进行工程化。在优选的实施方案中,用于工程化的靶植物和植物细胞包括但不限于那些单子叶植物和双子叶植物,诸如农作物(包括谷类作物(例如小麦、玉米、稻、粟、大麦)、果实作物(例如番茄、苹果、梨、草莓、橙)、饲料作物(例如苜蓿)、根用蔬菜作物(例如胡萝卜、马铃薯、甜菜、山药)、叶类蔬菜作物(例如莴苣、菠菜);开花植物(例如矮牵牛、玫瑰、菊花)、松柏植物以及松树(例如松杉、云杉);植物修复中所使用的植物(例如重金属累积植物);油料作物(例如向日葵、油菜种子)和用于实验目的植物(例如拟南芥属)。因此,这些方法和系统可以用于遍及广泛范围的植物,像例如与属于以下目的双子叶植物:木兰目(Magniolales)、八角目(Illiciales)、樟目(Laurales)、胡椒目(Piperales)、马兜铃目(Aristochiales)、睡莲目(Nymphaeales)、毛茛目(Ranunculales)、罂粟目(Papeverales)、瓶子草科(Sarraceniaceae)、昆栏树目(Trochodendrales)、金缕梅目(Hamamelidales)、杜仲目(Eucomiales)、塞子木目(Leitneriales)、杨梅目(Myricales)、壳斗目(Fagales)、木麻黄目(Casuarinales)、石竹目(Caryophyllales)、肉穗果目(Batales)、寥目(Polygonales)、蓝雪目(Plumbaginales)、五桠果目(Dilleniales)、山茶目(Theales)、锦葵目(Malvales)、荨麻目(Urticales)、玉蕊目(Lecythidales)、堇菜目(Violales)、杨柳目(Salicales)、白花菜目(Capparales)、杜鹃花目(Ericales)、岩梅目(Diapensales)、柿树目(Ebenales)、报春花目(Primulales)、蔷薇目(Rosales)、豆目(Fabales)、川草目(Podostemales)、小二仙草目(Haloragales)、桃金娘目(Myrtales)、山茱萸目(Cornales)、山龙眼目(Proteales)、檀香目(San tales)、大花草目(Rafflesiales)、卫矛目(Celastrales)、大戟目(Euphorbiales)、鼠李目(Rhamnales)、无患子目(Sapindales)、胡桃目(Juglandales)、牻牛儿苗目(Geraniales)、远志目(Polygalales)、伞形目(Umbellales)、龙胆目(Gentianales)、花葱目(Polemoniales)、唇形目(Lamiales)、车前草目(Plantaginales)、玄参目(Scrophulariales)、桔梗目(Campanulales)、茜草目(Rubiales)、川续断目(Dipsacales)以及菊目(Asterales);这些方法和CRISPR-Cas系统可以用于单子叶植物,诸如属于以下目的单子叶植物:泽泻目(Alismatales)、水鳖目(Hydrocharitales)、茨藻目(Najadales)、霉草目(Triuridales)、鸭跖草目(Commelinales)、谷精草目(Eriocaulales)、帚灯草目(Restionales)、禾本目(Poales)、灯芯草目(Juncales)、莎草科(Cyperales)、香蒲目(Typhales)、凤梨目(Bromeliales)、姜目(Zingiberales)、槟榔目(Arecales)、环花目(Cyclanthales)、露兜树目(Pandanales)、天南星目(Arales)、百合目(Lilliales)以及兰目(Orchidales),或者用于属于裸子植物(Gymnospermae)的植物,例如属于松杉目(Pinales)、银杏目(Ginkgoales)、苏铁目(Cycadales)、南洋杉目(Araucariales)、柏目(Cupressales)以及麻黄目(Gnetales)的植物。
本文所述的AD官能化的CRISPR系统和使用方法可以用于广泛范围的植物种类,这些植物种类包括在下面的双子叶植物、单子叶植物或裸子植物属的非限制性列表中:颠茄属(Atropa)、油丹属(Alseodaphne)、腰果属(Anacardium)、落花生属(Arachis)、琼楠属(Beilschmiedia)、芸苔属(Brassica)、红花属(Carthamus)、木防己属(Cocculus)、巴豆属(Croton)、甜瓜属(Cucumis)、柑橘属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、长春花属(Catharanthus)、椰子属(Cocos)、咖啡属(Coffea)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、杜氏木属(Duguetia)、花菱草属(Eschscholzia)、榕属(Ficus)、草莓属(Fragaria)、海罂粟属(Glaucium)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、橡胶树属(Hevea)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、卷枝藤属(Landolphia)、亚麻属(Linum)、木姜子属(Litsea)、番茄属(Lycopersicon)、羽扇豆属(Lupinus)、木薯属(Manihot)、马郁兰属(Majorana)、苹果属(Malus)、苜蓿属(Medicago)、烟草属(Nicotiana)、木犀榄属(Olea)、银胶菊属(Parthenium)、罂粟属(Papaver)、鳄梨属(Persea)、菜豆属(Phaseolus)、黄连木属(Pistacia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卜属(Raphanus)、蓖麻属(Ricinus)、千里光属(Senecio)、防己属(Sinomenium)、千金藤属(Stephania)、欧白芥属(Sinapis)、茄属(Solanum)、可可属(Theobroma)、三叶草属(Trifolium)、胡芦巴属(Trigonella)、蚕豆属(Vicia)、蔓长春花属(Vinca)、葡萄属(Vilis)和豇豆属(Vigna);以及葱属(Allium)、须芒草属(Andropogon)、画眉草属(Aragrostis)、天门冬属(Asparagus)、燕麦属(Avena)、狗牙根属(Cynodon)、油棕属(Elaeis)、羊茅属(Festuca)、羊茅黑麦草属(Festulolium)、萱草属(Heterocallis)、大麦属(Hordeum)、浮萍属(Lemna)、毒麦属(Lolium)、芭蕉属(Musa)、稻属(Oryza)、黍属(Panicum)、狼尾草属(Pannesetum)、梯牧草属(Phleum)、早熟禾属(Poa)、黑麦属(Secale)、高粱属(Sorghum)、小麦属(Triticum)、玉蜀黍属(Zea)、冷杉属(Abies)、杉木属(Cunninghamia)、麻黄属(Ephedra)、云杉属(Picea)、松属(Pinus),以及黄杉属(Pseudotsuga)。
AD官能化的CRISPR系统以及使用方法还可以用于遍及广泛范围的“藻类”或“藻类细胞”;包括例如选自若干真核生物门的藻类,其包括红藻植物门(Rhodophyta)(红藻)、绿藻门(Chlorophyta)(绿藻)、褐藻门(Phaeophyta)(褐藻)、硅藻门(Bacillariophyta)(硅藻)、真眼点藻纲(Eustigmatophyta)和沟鞭藻类以及原核门蓝藻门(Cyanobacteria)(蓝绿藻)。术语“藻类”包括例如选自以下的藻类:双眉藻属(Amphora)、鱼腥藻属(Anabaena)、纤维藻属(Anikstrodesmis)、丛粒藻属(Botryococcus)、角毛藻属(Chaetoceros)、衣藻属(Chlamydomonas)、绿藻属(Chlorella)、绿球藻属(Chlorococcum)、小环藻属(Cyclotella)、筒柱藻属(Cylindrotheca)、杜氏藻属(Dunaliella)、球石藻属(Emiliana)、眼虫属(Euglena)、红球藻属(Hematococcus)、等鞭金藻属(Isochrysis)、单鞭金藻属(Monochrysis)、单针藻属(Monoraphidium)、微绿球藻属(Nannochloris)、拟微绿球藻属(Nannnochloropsis)、舟形藻属(Navicula)、肾鞭藻属(Nephrochloris)、肾爿藻属(Nephroselmis)、菱形藻属(Nitzschia)、节球藻属(Nodularia)、念珠藻属(Nostoc)、髓球藻属(Oochromonas)、卵囊藻(Oocystis)、颤藻属(Oscillartoria)、巴夫藻属(Pavlova)、褐指藻属(Phaeodactylum)、扁藻属(Playtmonas)、颗石藻属(Pleurochrysis)、紫菜属(Porhyra)、假鱼腥藻属(Pseudoanabaena)、塔胞藻属(Pyramimonas)、裂丝藻属(Stichococcus)、聚球藻属(Synechococcus)、集胞藻属(Synechocystis)、四爿藻属(Tetraselmis)、海链藻属(Thalassiosira)以及束毛藻属(Trichodesmium)。
可以根据本发明的方法处理植物的一部分,即“植物组织”,以产生改良的植物。植物组织还涵盖植物细胞。如本文所用的术语“植物细胞”是指活体植物的个体单元,或者在完整全株中或者为在体外组织培养基中、在培养基或琼脂上、在生长培养基或缓冲液的悬浮液中或作为高等组织单元一部分生长的分离形式,例如像植物组织、植物器官或全株。
“原生质体”是指这样的植物细胞,其保护性细胞壁使用例如机械或酶手段被完全去除或部分去除从而形成活体植物的完整生物化学活性单元,该活性单元在适当生长条件下可以重新形成细胞壁、增殖并再生成全株。
术语“转化”广泛地是指通过借助于土壤杆菌或多种化学或物理方法之一来引入DNA从而对植物宿主进行遗传修饰的过程。如本文所用,术语“植物宿主”是指植物,包括植物的任何细胞、组织、器官、或子代。许多合适的植物组织或植物细胞可以被转化,并且包括但不限于原生质体、体细胞胚胎、花粉、叶、幼苗、茎、愈伤组织、匍伏茎、试管块茎、以及胚芽。植物组织还是指这种植物、种子、子代、繁殖体(不管有性还是无性生殖的)、以及这些中任一项的后代(诸如插条或种子)的任何克隆。
如本文所用,术语“转化的”是指已引入外源DNA分子诸如构建体的细胞、组织、器官或生物体。所引入的DNA分子可以整合到受体细胞、组织、器官或生物体的基因组DNA中,以使得引入的DNA分子被传递至后续子代。在这些实施方案中,“转化的”或“转基因的”细胞或植物还可以包括细胞或植物的子代以及通过育种程序采用这种转化的植物作为杂交的母体并表现出因引入的DNA分子的存在而产生的改变的表型的子代。优选地,转基因植物是能育的并且能够将引入的DNA通过有性繁殖传递给子代。
术语“子代”诸如转基因植物的子代是由植物或转基因植物生出的、由其产生的或从其来源的子代。所引入的DNA分子还可以被瞬时引入到受体细胞中,使得所引入的DNA分子不被后续子代遗传并且因此不被认为是“转基因的”。因此,如本文所用,“非转基因”植物或植物细胞是不含有稳定整合到其基因组中的外源DNA的植物。
如本文所用,术语“植物启动子”是能够启动植物细胞转录的启动子,无论其是否来源自植物细胞。示例性的合适植物启动子包括但不限于,那些获得自植物、植物病毒以及细菌(诸如包含在植物细胞中表达的基因的土壤杆菌属或根瘤菌属)的启动子。
如本文所用,“真菌细胞”是指真菌界内的任何类型的真核细胞。真菌界内的门包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、芽枝霉门(Blastocladiomycota)、壶菌门(Chytridiomycota)、球囊菌门(Glomeromycota)、微孢子虫目(Microsporidia)以及新美鞭菌门(Neocallimastigomycota)。真菌细胞可包括酵母、霉菌和丝状真菌。在一些实施方案中,真菌细胞是酵母细胞。
如本文所用,术语“酵母细胞”是指子囊菌门和担子菌门内的任何真菌细胞。酵母细胞可以包括芽殖酵母细胞、裂殖酵母细胞和霉菌细胞。不限于这些生物体,在实验室和工业环境中使用的许多类型的酵母菌是子囊菌门的部分。在一些实施方案中,酵母细胞是酿酒酵母(S.cerervisiae)、马克思克鲁维酵母(Kluyveromyces marxianus)或东方伊萨酵母(Issatchenkia orientalis)细胞。其他酵母细胞可以包括但不限于假丝酵母属种(Candida spp.)(例如白色念珠菌(Candida albicans))、亚罗酵母属种(Yarrowia spp.)(例如亚罗解脂酵母(Yarrowialipolytica))、毕赤酵母属种(Pichia spp.)(例如巴斯德毕赤酵母(Pichiapastoris))、克鲁维酵母菌属种(Kluyveromyces spp.)(例如产乳糖酶酵母(Kluyveromyces lactis)和马克思克鲁维酵母)、脉孢菌属种(Neurospora spp.)(例如粗糙脉孢菌(Neurospora crassa))、镰刀菌属种(Fusarium spp.)(例如尖孢镰刀菌(Fusarium oxysporum)),以及伊萨酵母属种(Issatchenkia spp.)(例如东方伊萨酵母,又称为库德里阿兹威毕赤酵母(Pichia kudriavzevii)和Candida acidothermophilum)。在一些实施方案中,真菌细胞是丝状真菌细胞。如本文所用,术语“丝状真菌细胞”是指以丝状体(即菌丝或菌丝体)生长的任何类型的真菌细胞。丝状真菌细胞的实例可以包括但不限于曲霉属种(Aspergillus spp.)(例如黑曲霉(Aspergillus niger))、木霉属种(Trichoderma spp.)(例如里氏木霉(Trichoderma reesei))、根霉属种(Rhizopus spp.)(例如米根霉(Rhizopus oryzae))以及被孢霉属种(Mortierella spp.)(例如深黄被孢霉(Mortierella isabellina))。
在一些实施方案中,真菌细胞是工业菌株。如本文所用,“工业菌株”是指工业工艺(例如,商业或工业规模的产品生产)中使用的或从中分离的任何真菌细胞菌株。工业菌株可以指代典型地在工业工艺中使用的真菌种类,或者它可以指代还可用于非工业目的(例如,实验室研究)的真菌种类的分离株。工业工艺的实例可以包括发酵(例如,在食品或饮料产品的生产中)、蒸馏、生物燃料生产、化合物生产以及多肽生产。工业菌株的实例可以包括但不限于JAY270和ATCC4124。
在一些实施方案中,真菌细胞是多倍体细胞。如本文所用,“多倍体”细胞可以指代其基因组以多于一个拷贝存在的任何细胞。多倍体细胞可以指代天然地发现处于多倍体状态的细胞类型,或者它可以指代已被诱导以多倍体状态存在的细胞(例如,通过特异性调节、改变、失活、激活、或者减数分裂、胞质分裂或DNA复制的修饰)。多倍体细胞可以指代其整个基因组是多倍体的细胞,或者它可以指代在特定目标基因组基因座中为多倍体的细胞。不希望受理论的束缚,认为与在单倍体细胞中相比指导RNA的丰度在多倍体细胞的基因组工程化中可能更经常地是速率限制性组分,并且因此使用本文所述的AD官能化的CRISPR系统的方法可以利用使用某一真菌细胞类型的优点。
在一些实施方案中,真菌细胞是二倍体细胞。如本文所用,“二倍体”细胞可以指代其基因组以两个拷贝存在的任何细胞。二倍体细胞可以指代天然地发现处于二倍体状态的细胞类型,或者它可以指代已被诱导以二倍体状态存在的细胞(例如,通过特异性调节、改变、失活、激活、或者减数分裂、胞质分裂或DNA复制的修饰)。例如,酿酒酵母菌株S228C可以维持处于单倍体或二倍体状态。二倍体细胞可以指代其整个基因组是二倍体的细胞,或者它可以指代在特定目标基因组基因座中为二倍体的细胞。在一些实施方案中,真菌细胞是单倍体细胞。如本文所用,“单倍体”细胞可以指代其基因组以一个拷贝存在的任何细胞。单倍体细胞可以指代天然地发现处于单倍体状态的细胞类型,或者它可以指代已被诱导以单倍体状态存在的细胞(例如,通过特异性调节、改变、失活、激活、或者减数分裂、胞质分裂或DNA复制的修饰)。例如,酿酒酵母菌株S228C可以维持处于单倍体或二倍体状态。单倍体细胞可以指代其整个基因组是单倍体的细胞,或者它可以指代在特定目标基因组基因座中为单倍体的细胞。
如本文所用,“酵母表达载体”是指含有编码RNA和/或多肽的一个或多个序列的核酸并且还可以含有控制一个或多个核酸表达的任何所需元件,以及使得能够在酵母细胞内复制并维持表达载体的任何元件。许多合适的酵母表达载体及其特征在本领域中是已知的;例如,各种载体和技术示出于Yeast Protocols,第2版,Xiao,W.,编辑(Humana Press,New York,2007)以及Buckholz,R.G.和Gleeson,M.A.(1991)Biotechnology(NY)9(11):1067-72。酵母载体可以包含但不限于着丝粒(CEN)序列、自主复制序列(ARS)、可操作地连接至目标序列或基因的启动子(诸如RNA聚合酶III启动子)、终止子(诸如RNA聚合酶III终止子)、复制起点和标记基因(例如,营养缺陷型、抗生素型、或其他选择性标记物)。在酵母菌中使用的表达载体的实例可以包括质粒、酵母人工染色体、2μ质粒、酵母整合型质粒、酵母复制型质粒、穿梭载体以及附加型质粒。
AD官能化的CRISPR系统组分在植物和植物细胞基因组中的稳定整合
在特定实施方案中,设想的是引入编码AD官能化的CRISPR系统的组分的多核苷酸,以稳定整合到植物细胞的基因组中。在这些实施方案中,可以依据指导RNA和/或腺苷脱氨酶和Cas13的融合蛋白在何时、何处及在何条件下表达,对转化载体或表达系统的设计进行调整。
在特定实施方案中,设想的是将AD官能化的CRISPR系统的组分稳定地引入植物细胞的基因组DNA中。另外地或可替代地,设想的是引入AD官能化的CRISPR系统的组分,以将其稳定整合到植物细胞器的DNA中,诸如但不限于质体、线粒体或叶绿体。
用于稳定整合到植物细胞基因组中的表达系统可以含有以下元件中的一者或多者:可用于在植物细胞中表达指导RNA和/或腺苷脱氨酶和Cas13的融合蛋白的启动子元件;增强表达的5’非翻译区;进一步增强在某些细胞(诸如单子叶植物细胞)中表达的内含子元件;为插入编码指导RNA和/或腺苷脱氨酶和Cas13的融合蛋白的序列以及其他所需元件提供方便的限制性位点的多克隆位点;以及为所表达的转录物提供有效终止的3’非翻译区。
表达系统的元件可以处于一个或多个表达构建体上,所述一个或多个表达构建体是环状的(诸如质粒或转化载体),或者是非环状的(诸如线性双链DNA)。
在特定实施方案中,AD官能化的CRISPR表达系统至少包含:编码与植物中的靶序列杂交的指导RNA(gRNA)的核苷酸序列,并且其中所述指导RNA包含指导序列和同向重复序列;以及编码腺苷脱氨酶和Cas13的融合蛋白的核苷酸序列,其中组分(a)或(b)位于相同或不同构建体上,并且由此不同核苷酸序列可以处于植物细胞内可操作的相同或不同调控元件的控制下。
可以通过多种常规技术将含有AD官能化的CRISPR系统的组分的一个或多个DNA构建体和(在适用情况下)模板序列引入到植物、植物部分或植物细胞的基因组中。所述方法大体上包括以下步骤:选择合适的宿主细胞或宿主组织、将所述一个或多个构建体引入到宿主细胞或宿主组织中,以及由其再生植物细胞或植物。
在特定实施方案中,可以使用诸如但不限于电穿孔、微注射、植物细胞原生质体的雾化束注入的技术将DNA构建体引入到植物细胞中,或者可以使用诸如DNA粒子轰击的基因枪法直接将这些DNA构建体引入到植物组织中(另参见Fu等人,Transgenic Res.2000年2月;9(1):11-9)。粒子轰击的基础是使包覆有目标一种或多种基因的粒子朝向细胞加速,从而导致粒子穿透原生质并且典型地稳定整合到基因组中。(参见例如Klein等人,Nature(1987),Klein et ah,Bio/Technology(1992),Casas et ah,Proc.Natl.Acad.Sci.USA(1993).)。
在特定实施方案中,可以通过土壤杆菌介导的转化将含有AD官能化的CRISPR系统的组分的DNA构建体引入到植物中。可以将DNA构建体与合适的T-DNA侧接区组合,并且将它们引入到常规根瘤土壤杆菌(Agrobacterium tumefaciens)宿主载体中。通过感染植物或通过用含有一种或多种Ti(肿瘤诱导)质粒的土壤杆菌属细菌培育植物原生质体,可以将外源DNA并入植物基因组中。(参见例如Fraley等人(1985)、Rogers等人(1987)和美国专利号5,563,055)。
植物启动子
为了确保在植物细胞中适当表达,典型地将本文所述的AD官能化的CRISPR系统的组分置于植物启动子(即在植物细胞中可操作的启动子)的控制下。设想了使用不同类型的启动子。
组成型植物启动子是能够在所有或几乎所有植物组织的所有或几乎所有植物发育阶段表达可读框(ORF)的启动子(称为“组成型表达”)。组成型启动子的一个非限制性实例是花椰菜花叶病毒35S启动子。“调节启动子”是指非组成型地、但是以时间和/或空间调节方式指导基因表达的启动子,并且包括组织特异性、组织优选型及诱导型启动子。不同启动子可以指导在不同组织或细胞类型中、或在不同发育阶段、或响应于不同环境条件的基因表达。在特定实施方案中,AD官能化的CRISPR组分中的一者或多者在组成型启动子(诸如花椰菜花叶病毒35S启动子)的控制下表达,组织优选型启动子可以用于靶向特定植物组织中某些细胞类型,例如叶或根的维管细胞或种子的特定细胞内的增强的表达。用于AD官能化的CRISPR系统的特定启动子的实例可见于Kawamata等人,(1997)Plant Cell Physiol38:792-803;Yamamoto等人,(1997)Plant J 12:255-65;Hire等人,(1992)Plant Mol Biol20:207-18;Kuster等人,(1995)Plant Mol Biol 29:759-72;以及Capana等人,(1994)Plant Mol Biol 25:681-91。
在有限的情况下,为了避免脱氨酶的非特异性活性,诱导型启动子可以有利地表达AD官能化的CRISPR系统组分中的一者或多者。在特定实施方案中,AD官能化的CRISPR系统的一个或多个元件在诱导型启动子的控制下表达。允许空间时间控制基因编辑或基因表达的诱导型启动子的实例可以使用能量形式。能量形式可以包括但不限于声能、电磁辐射、化学能和/或热能。诱导型系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交转录激活系统(FKBP、ABA等)、或光诱导型系统(光敏色素、LOV结构域或隐花色素),诸如以序列特异性方式引导转录活性改变的光诱导型转录效应子(LITE)。光诱导型系统的组分可以包括腺苷脱氨酶和Cas13的融合蛋白、光反应性细胞色素异源二聚体(例如,来自阿拉伯芥)。诱导型DNA结合蛋白及其使用方法的另外的实例提供于US 61/736465和US61/721,283中,这些专利以引用方式整体并入本文。
在特定实施方案中,可以通过使用例如化学调节型启动子来实现瞬时表达或诱导型表达,即由此应用外源性化学品诱导基因表达。也可以通过化学阻抑型启动子来获得对基因表达的调节,其中应用化学品阻抑基因表达。化学诱导型启动子包括但不限于:由苯磺酰胺除草剂安全剂激活的玉米ln2-2启动子(De Veylder等人,(1997)Plant Cell Physiol38:568-77)、由用作萌前除草剂的疏水性亲电子化合物激活的玉米GST启动子(GST-ll-27,WO 93/01294),以及由水杨酸激活的烟草PR-1a启动子(Ono等人,(2004)BiosciBiotechnol Biochem 68:803-7)。还可以在本文中使用由抗生素调节的启动子,诸如四环素诱导型启动子和四环素阻抑型启动子(Gatz等人,(1991)Mol Gen Genet 227:229-37;美国专利号5,814,618和5,789,156)。
特定植物细胞器中的易位和/表达
表达系统可以包含在特定植物细胞器中易位并且/或者表达的元件。
叶绿体靶向
在特定实施方案中,设想的是将AD官能化的CRISPR系统用于特异性修饰叶绿体基因或确保在叶绿体中的表达。出于此目的,使用叶绿体转化方法或者将AD官能化的CRISPR组分区室化至叶绿体的方法。例如,在质粒基因组中引入遗传修饰可以减少生物安全性问题,诸如通过花粉的基因流。
叶绿体转化的方法在本领域中是已知的,并且包括粒子轰击、PEG处理和微注射。另外,涉及转化盒从核基因组易位至质粒的方法可以如WO2010061186所述地使用。
或者,设想的是将AD官能化的CRISPR组分中的一者或多者靶向植物叶绿体。这是通过在表达构建体中结合编码叶绿体转运肽(CTP)或质体转运肽的序列来实现的,该序列可操作地连接至编码腺苷脱氨酶和Cas13的融合蛋白的序列的5’区。在易位到叶绿体中的过程中,在处理步骤中去除CTP。所表达蛋白质的叶绿体靶向是本领域技术人员所熟知的(参见例如Protein Transport into Chloroplasts,2010,Annual Review of PlantBiology,第61卷:157-180)。在此类实施方案中,还期望将指导RNA靶向植物叶绿体。例如在US 20040142476中描述了可以用于借助于叶绿体定位序列来将指导RNA易位到叶绿体中的方法和构建体,该专利以引用方式并入本文。可以将构建体的此类变型并入本发明的表达系统中以有效地使AD官能化的CRISPR系统组分易位。
在藻类细胞中引入编码AD官能化的CRISPR系统的多核苷酸.
转基因藻类(或其他植物诸如油菜)可能在植物油或生物燃料诸如醇类(尤其是甲醇和乙醇)或其他产品的生产中特别有用。这些可以被工程化以表达或过表达高水平的油或醇类,以供在油或生物燃料行业中使用。
US 8945839描述了一种用于使用Cas9工程化微藻(莱茵衣藻(Chlamydomonasreinhardtii)细胞)的方法。使用类似的工具,本文所述的AD官能化的CRISPR系统的方法可以应用于衣藻属种和其他藻类。在特定实施方案中,在藻类中引入CRISPR-Cas蛋白(例如Cas13)、腺苷脱氨酶(其可以融合至CRISPR-Cas蛋白或适体结合衔接蛋白)和指导RNA,其使用在组成型启动子诸如Hsp70A-Rbc S2或β2-微管蛋白的控制下表达腺苷脱氨酶和Cas13的融合蛋白的载体进行表达。指导RNA任选地使用含有T7启动子的载体递送。或者,可以将Cas13mRNA和体外转录的指导RNA递送至藻类细胞。电穿孔方案可由本领域技术人员获得,诸如来自GeneArt衣藻属工程化试剂盒(GeneArt Chlamydomonas Engineering kit)的标准推荐方案。
在酵母细胞中引入AD官能化的组合物
在特定实施方案中,本发明涉及AD官能化的CRISPR系统用于酵母细胞的基因组编辑的用途。可以用于引入编码AD官能化的CRISPR系统组分的多核苷酸的转化酵母细胞的方法描述于Kawai等人,2010,Bioeng Bugs.2010年11月-12月;1(6):395-403)。非限制性实例包括通过醋酸锂处理(其还可以包括运载DNA和PEG处理)、轰击或通过电穿孔来转化酵母细胞。
在植物和植物细胞中瞬时表达AD官能化的CRISPR系统组分
在特定实施方案中,设想的是在植物细胞中瞬时表达指导RNA和/或CRISPR-Cas基因。在这些实施方案中,仅当细胞中存在指导RNA、CRISPR-Cas蛋白(例如Cas13)和腺苷脱氨酶(其可以融合至CRISPR-Cas蛋白或适体结合衔接蛋白)时,AD官能化的CRISPR系统可以确保靶基因的修饰,这样使得可以进一步控制基因修饰。因为CRISPR-Cas蛋白的表达是瞬时的,自此类植物细胞再生的植物典型地不含外源DNA。在特定实施方案中,CRISPR-Cas蛋白由植物细胞稳定表达,并且指导序列被瞬时表达。
在特定实施方案中,可以使用植物病毒载体将AD官能化的CRISPR系统组分引入植物细胞中(Scholthof等人1996,Annu Rev Phytopathol.1996;34:299-323)。在另外的特定实施方案中,所述病毒载体是来自DNA病毒的载体。例如,双粒病毒组(例如卷心菜曲叶病毒、豆黄矮病毒、小麦矮化病毒、番茄曲叶病毒、玉米条纹病毒、烟草曲叶病毒或番茄金色花叶病毒)或矮缩病毒组(例如蚕豆坏死黄脉病毒)。在其他特定实施方案中,所述病毒载体是来自RNA病毒的载体。例如,烟草脆裂病毒组(例如烟草扰乱病毒、烟草花叶病毒)、马铃薯X病毒组(例如马铃薯X病毒),或大麦病毒组(例如,大麦条纹花叶病毒)。植物病毒复制基因组是非整合型载体。
在特定实施方案中,用于瞬时表达AD官能化的CRISPR系统的载体是例如pEAQ载体,该载体被专门定制用于在原生质体中进行土壤杆菌介导的瞬时表达(Sainsbury F.等人,Plant Biotechnol J.2009Sep;7(7):682-93)。使用修饰的卷心菜叶曲病毒(CaLCuV)载体以在表达CRISPR酶的稳定转基因植物中表达指导RNA证明了基因组位置的精确靶向(Scientific Reports 5,文章编号:14926(2015),doi:10.1038/srep14926)。
在特定实施方案中,可以将编码指导RNA和/或CRISPR-Cas基因的双链DNA片段瞬时导入到植物细胞中。在此类实施方案中,以足够的量提供引入的双链DNA片段以修饰细胞,但在预期时间段过去之后或者在一次或多次细胞分裂之后不再持续。用于在植物中进行直接DNA转移的方法是技术人员已知的(参见例如Davey等人Plant Mol Biol.1989年9月;13(3):273-85。)
在其他实施方案中,将编码CRISPR-Cas蛋白(例如Cas13)和/或腺苷脱氨酶(其可以融合至CRISPR-Cas蛋白或适体结合衔接蛋白)的RNA多核苷酸引入到植物细胞中,然后植物细胞被生成足够量的蛋白质的宿主细胞翻译并加工以修饰该细胞(在至少一种指导RNA存在下),该引入在预期时间段过去之后或者在一次或多次细胞分裂之后不再持续。用于将mRNA引入植物原生质体以进行瞬时表达的方法是技术人员已知的(参见例如Gallie,PlantCell Reports(1993),13;119-122)。
还设想了以上所述的不同方法的组合。
将AD官能化的组合物递送至植物细胞
在特定实施方案中,令人感兴趣的是将AD官能化的CRISPR系统的一种或多种组分直接递送至植物细胞。对于产生非转基因植物,这是尤其令人感兴趣的(参见下文)。在特定实施方案中,在植物或植物细胞外部制备AD官能化的CRISPR系统组分中的一者或多者并将其传递至细胞。例如,在特定实施方案中,在体外制备CRISPR-Cas蛋白,之后将其引入植物细胞中。可以通过本领域技术人员已知的各种方法来制备CRISPR-Cas蛋白,包括重组生产。在表达之后,将CRISPR-Cas蛋白分离,如果需要的话进行再折叠,进行纯化和任选地进行处理以去除任何纯化标签(诸如His标签)。一旦获得粗的、部分纯化的、或更完全纯化的CRISPR-Cas蛋白,就可以将该蛋白引入植物细胞中。
在特定实施方案中,将CRISPR-Cas蛋白与靶向目标基因的指导RNA混合,以形成预组装的核糖核蛋白。
可以经由电穿孔、通过用CRISPR-Cas相关基因产品包覆的粒子的轰击、通过化学转染或通过跨细胞膜转运的一些其他手段,将这些单独的组分或预组装的核糖核蛋白引入到植物细胞中。例如,已证明用预组装CRISPR核糖核蛋白转染植物原生质体确保了植物基因组的靶向修饰(如Woo等人Nature Biotechnology,2015;DOI:10.1038/nbt.3389)所述。
在特定实施方案中,使用纳米粒子将AD官能化的CRISPR系统组分引入到植物细胞中。这些组分,无论是蛋白质或核酸或它们的组合,都可以上载到纳米粒子上或包装在纳米粒子中并且适用于这些植物(例如像WO 2008042156和US 20130185823所述的)。特别地,本发明的实施方案包括上载有或包装有以下各项的纳米粒子:编码CRISPR-Cas蛋白(例如Cas13)的一个或多个DNA分子、编码腺苷脱氨酶(其可以融合至CRISPR-Cas蛋白或适体结合衔接蛋白)的一个或多个DNA分子,以及编码指导RNA的DNA分子和/或如WO2015089419中所述的分离的指导RNA。
将AD官能化的CRISPR系统的一种或多种组分引入植物细胞中的其他手段是使用细胞穿透肽(CPP)。因此,在特定实施方案中,本发明包括含有连接至CRISPR-Cas蛋白的细胞穿透肽的组合物。在本发明的特定实施方案中,将CRISPR-Cas蛋白和/或指导RNA与一种或多种CPP偶联以有效地将它们转运到植物原生质体内。Ramakrishna(Genome Res.2014年6月;24(6):1020-7,针对人类细胞中的Cas9)。在其他实施方案中,CRISPR-Cas基因和/或指导RNA由一个或多个环状或非环状DNA分子编码,所述一个或多个环状或非环状DNA分子与一个或多个CPP偶联以便进行植物原生质体递送。然后将植物原生质体再生为植物细胞并进一步再生为植物。CPP通常被描述为来源于蛋白质或来源于能够以非受体依赖性方式跨细胞膜转运生物分子的嵌合序列的小于35个氨基酸的短肽。CPP可以是阳离子肽、具有疏水性序列的肽、两亲性肽、具有富含脯氨酸的序列和抗微生物序列的肽,以及嵌合肽或二分肽(Pooga和Langel 2005)。CPP能够穿透生物膜,并且如此触发不同生物分子跨细胞膜移动到细胞质中,并能改善它们的细胞内通路,并且因此促进生物分子与靶标的相互作用。CPP的实例包括:Tat(通过HIV 1型进行病毒复制所需的核转录激活蛋白)、穿透素、卡波济(Kaposi)成纤维细胞增长因子(FGF)信号肽序列、整联蛋白β3信号肽序列;聚精氨酸肽Arg序列、富含鸟嘌呤的分子转运体、甜箭头肽(sweet arrow peptide)等。
使用AD官能化的组合物制备遗传修饰的非转基因植物
在特定实施方案中,本文所述的方法用于修饰内源性基因或修饰其表达而不永久性引入到任何外源基因的植物的基因组中,包括编码CRISPR组分的外源基因,以便避免在植物基因组中存在外源DNA。这可能是令人感兴趣的,因为对非转基因植物的规则要求较不严格。
在特定实施方案中,这是通过AD官能化的CRISPR系统组分的瞬时表达来确保的。在特定实施方案中,一种或多种组分是在一种或多种病毒载体上表达的,所述一种或多种表达载体产生足够的CRISPR-Cas蛋白、腺苷脱氨酶和指导RNA,以一致地稳定地确保根据本文所述的方法修饰目标基因。
在特定实施方案中,在植物原生质体中确保AD官能化的CRISPR系统构建体的瞬时表达并且因此该构建体并未整合到基因组中。有限的表达窗口足以允许AD官能化的CRISPR系统确保如本文所述的靶基因的修饰。
在特定实施方案中,AD官能化的CRISPR系统的不同组分借助于如上文所述的粒子递送分子诸如纳米粒子或CPP分子单独地或混合地引入在植物细胞、原生质体或植物组织中。
AD官能化的CRISPR系统组分的表达可以通过腺苷脱氨酶的脱氨酶活性诱导基因组的靶向修饰。上文所述的不同策略允许CRISPR介导的靶向基因组编辑,而无需将AD官能化的CRISPR系统组分引入到植物基因组中。瞬时导入到植物细胞中的组分典型地在杂交后去除。
植物培养和再生
在特定实施方案中,具有修饰基因组并且通过本文所述的任何方法产生或获得的植物细胞可以被培养至再生成具有转化或修饰表型并因此具有所需表型的全株。常规的再生技术是本领域技术人员所熟知的。此类再生技术的特定实例依赖于组织培养生长培养基中某些植物激素的操纵,并且典型地依赖于已与所需核苷酸序列一起引入的杀生物剂和/或除草剂标记物。在另外的特定实施方案中,植物再生是从培养的原生质体、植物愈伤组织、外植体、器官、花粉、胚胎或其部分获得的(参见例如Evans等人(1983),Handbook ofPlant Cell Culture;Klee等人(1987)Ann.Rev.of Plant Phys.)。
在特定实施方案中,如本文所述的转化或改良的植物可以自体受精以提供本发明的纯合改良植物(对于DNA修饰是纯合的)的种子,或者可以与非转基因植物或不同的改良植物杂交以提供纯合植物的种子。当将重组DNA引入到植物细胞中时,这种杂交所产生的植物是对于重组DNA分子为杂合的植物。通过与改良植物杂交并包含遗传修饰(可以是重组DNA)而获得的此类纯合植物和杂合植物在此被称为“子代”。子代植物是从原始转基因植物传代并且含有通过本文提供的方法引入的基因组修饰或重组DNA分子的植物。或者,遗传修饰植物可以是通过以上所述方法之一使用AD官能化的CRISPR系统来获得的,因此无外源DNA并入该基因组中。通过进一步育种获得的此类植物的子代也可以含有遗传修饰。育种是通过常用于不同农作物的任何育种方法来进行(例如Allard,Principles of PlantBreeding,John Wiley&Sons,NY,U.of CA,Davis,CA,50-98(1960)。
生成具有增强的农艺性状的植物
本文提供的AD官能化的CRISPR系统可用于引入靶向的A-G和T-C突变。通过在单一细胞中共表达旨在实现多种修饰的多个靶向RNA,可以确保多重基因组修饰。此技术可以用于高度精确工程化植物以使其具有改良的特征,包括增强的营养品质、增加的对疾病的抗性和对生物和非生物胁迫的抗性,以及增加的有商业价值的植物产品或异源化合物的产生。
在特定实施方案中,如本文所述的AD官能化的CRISPR系统用于引入靶向的A-G和T-C突变。这种突变可以是无义突变(例如,提前终止密码子)或错义突变(例如,编码不同的氨基酸残基)。当某些内源性基因中的A-G和T-C突变可以赋予或促成所需性状时,这是令人感兴趣的。
本文所述的方法通常导致生成“改良植物”,在这点上它们与野生型植物相比具有一种或多种期望的性状。在特定实施方案中,获得的植物、植物细胞或植物部分是包含并入植物的所有或部分细胞的基因组中的外源性DNA序列的转基因植物。在特定实施方案中,获得非转基因遗传修饰植物、植物部分或细胞,在这点上没有外源性DNA序列并入植物的任何植物细胞的基因组中。在此类实施方案中,改良植物是非转基因的。当仅确保内源性基因的修饰并且在植物基因组中未引入或维持外源基因时,所得遗传修饰农作物不含有外源基因并且因此可以基本上认为是非转基因的。
在特定实施方案中,多核苷酸通过DNA病毒(例如双粒病毒组)或RNA病毒(例如烟草脆裂病毒组)递送至细胞。在特定实施方案中,引入步骤包括将含有编码CRISPR-Cas蛋白、腺苷脱氨酶和指导RNA的一个或多个多核苷酸序列的T-DNA递送至植物细胞,其中所述递送是经由土壤杆菌进行的。可以将编码AD官能化的CRISPR系统的组分的多核苷酸序列可操作地连接至启动子,诸如组成型启动子(例如花椰菜花叶病毒35S启动子)或细胞特异性启动子或诱导型启动子。在特定实施方案中,通过微粒轰击引入多核苷酸。在特定实施方案中,所述方法还包括在引入步骤之后筛选植物细胞,以确定目标基因的表达是否已被修饰。在特定实施方案中,所述方法包括从植物细胞再生植物的步骤。在另外的实施方案中,所述方法包括使植物杂交育种以获得遗传上所需的植物谱系。
在以上所述的方法的特定实施方案中,抗病性农作物是通过靶向突变疾病易感性基因或植物防卫基因中的编码负调节子的基因(例如,Mlo基因)来获得的。在特定实施方案中,耐除草剂农作物是通过靶向取代植物基因诸如编码乙酰乳酸合酶(ALS)和原卟啉原氧化酶(PPO)的基因的特定核苷酸来生成的。在特定实施方案中,通过靶向突变编码负调节子的基因而产生的具有非生物胁迫耐受性的耐干旱和盐农作物、通过靶向突变Waxy基因而产生的低直链淀粉谷物、通过靶向突变糊粉层中的主要脂肪酶基因而产生的具有降低的酸败性的稻谷或其他谷物等。在特定实施方案中。编码目标性状的内源性基因的更广泛列表列出在下文中。
使用AD官能化的组合物修饰多倍体植物
许多植物都是多倍体的,这意味着它们携带其基因组的复制拷贝—像在小麦中,有时多至六个。根据本发明利用AD官能化的CRISPR系统的方法可以被“多重化”以影响基因的所有拷贝,或者一次靶向许多基因。例如,在特定实施方案中,本发明的方法用于同时确保不同基因中负责阻遏针对疾病的防卫的功能丧失突变。在特定实施方案中,本发明的方法用于同时阻遏小麦植物细胞内TaMLO-Al、TaMLO-Bl和TaMLO-Dl核酸序列的表达并且由该细胞再生小麦植物,以便确保该小麦植物抵抗白粉病(另参见WO 2015109752)。
赋予农艺性状的示例性基因
在特定实施方案中,本发明涵盖在内源性基因及其调控元件中包括靶向A-G和T-C突变的方法,所述内源性基因诸如以下列出的基因:
1.赋予对害虫或疾病的抗性的基因:
植物疾病抗性基因。可以用克隆的抗性基因转化植物以工程化对特定病原体菌株具有抗性的植物。参见例如Jones等人,Science 266:789(1994)(cloning of the tomatoCf-9gene for resistance to Cladosporium fulvum);Martin等人,Science 262:1432(1993)(tomato Pto gene for resistance to Pseudomonas syringae pv.tomatoencodes aprotein kinase);Mindrinos等人,Cell 78:1089(1994)(Arabidopsmay beRSP2 gene for resistance to Pseudomonas syringae)。可以对在病原体感染期间被上调或下调的植物基因进行工程化以获得病原体抗性。参见例如Thomazella等人,bioRxiv064824;doi:https://doi.org/10.1101/064824Epub.2016年7月23日(tomato plantswith deletions in the SlDMR6-1 which is normally upregulated during pathogeninfection)。
赋予对害虫诸如大豆囊胞线虫的抗性的基因。参见例如,PCT申请WO 96/30517;PCT申请WO 93/19181。
苏云金芽孢杆菌蛋白,参见例如Geiser等人,Gene 48:109(1986)。
凝集素,参见例如Van Damme等人,Plant Molec.Biol.24:25(1994。
维生素结合蛋白,诸如抗生物素蛋白,参见PCT申请US93/06487,该申请教导了抗生物素蛋白和抗生物素蛋白同系物作为针对害虫的杀幼虫剂的用途。
酶抑制剂诸如蛋白酶或朊酶抑制剂或淀粉酶抑制剂。参见例如Abe等人,J.Biol.Chem.262:16793(1987);Huub等人,Plant Molec.Biol.21:985(1993));Sumitani等人,Biosci.Biotech.Biochem.57:1243(1993)和美国专利号5,494,813。
昆虫特异性激素或信息素,诸如蜕皮类固醇或保幼激素、或其变体、基于它的模拟物、或其拮抗剂或激动剂。参见例如Hammock等人,Nature 344:458(1990)。
昆虫特异性肽或神经肽,这些肽在表达时破坏受影响害虫的生理。例如Regan,J.Biol.Chem.269:9(1994)和Pratt等人,Biochem.Biophys.Res.Comm.163:1243(1989)。另参见美国专利号5,266,317。
在自然界中由蛇、黄蜂或任何其他生物体产生的昆虫特异性毒液。例如,参见Pang等人,Gene 116:165(1992)。
引起单萜、倍半萜、甾体、异羟肟酸、苯丙素衍生物或具有杀昆虫活性的另一种非蛋白质分子超积累的酶。
参与生物活性分子修饰(包括翻译后修饰)的酶;例如,糖解酶、蛋白水解酶、脂解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、壳多糖酶以及葡聚糖酶,无论是天然还是合成的。参见PCT申请WO93/02197;Kramer等人,Insect Biochem.Molec.Biol.23:691(1993)和Kawalleck等人,Plant Molec.Biol.21:673(1993)。
刺激信号转导的分子。例如,参见Botella等人,Plant Molec.Biol.24:757(1994)和Griess等人,Plant Physiol.104:1467(1994)。
病毒侵入蛋白或源于此的复合物毒素。参见Beachy等人,Ann.rev.Phytopathol.28:451(1990)。
在自然界中由病原体或寄生虫产生的发育阻滞蛋白。参见Lamb等人,Bio/Technology 10:1436(1992)和Toubart等人,Plant J.2:367(1992)。
在自然界中由植物产生的发育阻滞蛋白。例如,Logemann等人,Bio/Technology10:305(1992)。
在植物中,病原体通常是宿主特异性的。例如,一些镰刀菌种类将引起番茄枯萎病但仅攻击番茄,而其他镰刀菌种类仅攻击小麦。植物具有现有和诱导的防卫以抵抗大部分病原体。跨植物各代的突变和重组事件导致引起易感性的遗传变异性,特别是当病原体以比植物更大频率繁殖时。在植物中可以存在非宿主抗性,例如宿主和病原体是不相容的或者可以存在针对所有病原体种族的部分抗性,这些抗性典型地是通过许多基因来控制的,并且/或者也存在对一些病原体种族而不是其他种族的完全抗性。此抗性典型地是通过几种基因控制的。使用多种方法和AD官能化的CRISPR系统组分,现在存在一种在此预先诱导特异性突变的新工具。因此,可以分析抗性基因来源基因组,并且在具有所需特征或形状的植物中,使用所述多种方法和AD官能化的CRISPR系统组分来诱导抗性基因增加。本发明系统可以比先前的诱变剂更精确地完成此分析并且因此加速并改善植物育种程序。
2.涉及植物疾病的基因,诸如WO 2013046247中列出的基因
稻谷病害:稻瘟病菌(Magnaporthe grise)、宫部旋孢腔菌(Cochliobolusmiyabeanus)、立枯丝核菌(Rhizoctonia solani)、藤仓赤霉(Gibberella fujikuroi);小麦病害:白粉病菌(Erysiphe graminis)、禾谷镰刀菌(Fusarium graminearum)、燕麦镰刀菌(F.avenaceum)、黄色镰刀菌(F.culmorum)、雪霉叶枯菌(Microdochium nivale)、条形柄锈菌(Puccinia striiformis)、禾柄锈菌(P.graminis)、隐匿柄锈菌(P.recondita)、粉红雪腐病菌(Micronectriella nivale)、核瑚菌属种(Typhulasp.)、小麦黑粉菌(Ustilagotritici)、小麦网腥黑穗病菌(Tilletia caries)、小麦基腐病菌(Pseudocercosporellaherpotrichoides)、禾生球腔菌(Mycosphaerella graminicola)、小麦壳多孢(Stagonospora nodorum)、偃麦草核腔菌(Pyrenophora tritici-repentis);大麦病害:白粉病菌、禾谷镰刀菌、燕麦镰刀菌、黄色镰刀菌、雪霉叶枯菌、条形柄锈菌、禾柄锈菌、大麦柄锈菌(P.hordei)、裸黑粉菌(Ustilago nuda)、大麦云纹斑病菌(Rhynchosporiumsecalis)、圆核腔菌(Pyrenophora teres)、禾旋孢腔菌(Cochliobolus sativus)、麦类核腔菌(Pyrenophora graminea)、立枯丝核菌:玉米病害:玉米黑粉菌(Ustilago maydis)、异旋孢腔菌(Cochliobolus heterostrophus)、高粱胶尾孢(Gloeocercospora sorghi)、多堆柄锈菌(Puccinia polysora)、玉米灰斑病菌(Cercospora zeae-maydis)、立枯丝核菌;
柑橘病害:柑橘间座壳菌(Diaporthe citri)、柑橘痂囊腔菌(Elsinoefawcetti)、指状青霉菌(Penicillium digitatum)、桔青霉菌(P.italicum)、寄生疫霉(Phytophthora parasitica)、柑橘褐腐疫霉(Phytophthora citrophthora);苹果病害:苹果链核盘菌(Monilinia mali)、苹果树腐烂病菌(Valsa ceratosperma)、苹果白粉病菌(Podosphaera leucotricha)、互隔交链孢菌苹果致病型(Alternaria alternata applepathotype)、苹果黑星病菌(Venturia inaequalis)、尖孢炭疽(Colletotrichumacutatum)、恶疫霉(Phytophtora cactorum);
梨病害:梨黑星病菌(Venturia nashicola)、梨黑星菌(V.pirina)、互隔交链孢霉日本梨致病型(Alternaria alternata Japanese pear pathotype)、梨胶锈菌(Gymnosporangium haraeanum)、恶疫霉;
桃病害:桃褐腐病菌(Monilinia fructicola)、嗜果枝孢菌(Cladosporiumcarpophilum)、拟茎点霉属种(Phomopsis sp.);
葡萄病害:痂囊腔菌(Elsinoe ampelina)、檬果炭疽病菌(Glomerellacingulata)、葡萄白粉菌(Uninula necator)、葡萄锈病菌(Phakopsora ampelopsidis)、葡萄球座菌(Guignardia bidwellii)、葡萄霜霉菌(Plasmopara viticola);
柿子病害:柿盘长孢菌(Gloesporium kaki)、柿角斑病菌(Cercospora kaki)、柿叶球腔菌(Mycosphaerela nawae);
瓠果病害:瓜类炭疽菌(Colletotrichum lagenarium)、黄瓜白粉病菌(Sphaerotheca fuliginea)、甜瓜球腔菌(Mycosphaerella melonis)、尖孢镰刀菌、黄瓜霜霉病菌(Pseudoperonospora cubensis)、疫霉属种(Phytophthora sp.)、腐霉属种(Pythium sp.);
番茄病害:茄链格孢菌(Alternaria solani)、番茄叶霉病菌(Cladosporiumfulvum)、致病疫霉菌(Phytophthora infestans);番茄丁香假单胞菌(Pseudomonassyringae pv.Tomato);辣椒疫霉菌(Phytophthora capsici);黄单胞菌(Xanthomonas)
茄子病害:茄褐纹病菌(Phomopsis vexans)、二孢白粉菌(Erysiphecichoracearum);十字花科蔬菜病害:萝卜链格孢菌(Alternaria japonica)、白菜白斑病菌(Cercosporella brassicae)、根肿病菌(Plasmodiophora brassicae)、寄生霜霉菌(Peronospora parasitica);
大葱病害:葱柄锈菌(Puccinia allii)、大葱霜霉(Peronospora destructor);
大豆病害:大豆紫斑病菌(Cercospora kikuchii)、大豆痂囊腔菌(Elsinoeglycines)、菜豆间座壳大豆变种(Diaporthe phaseolorum var.sojae)、大豆壳针孢(Septoria glycines)、大豆尾孢(Cercospora sojina)、豆薯层锈菌(Phakopsorapachyrhizi)、大豆疫霉病菌(Phytophthora sojae)、立枯丝核菌、棒抱叶斑病菌(Corynespora casiicola)、核盘菌(Sclerotinia sclerotiorum);
芸豆病害:菜豆炭疽病菌(Colletrichum lindemthianum);
花生病害:花生黑斑病菌(Cercospora personata)、花生褐斑病菌(Cercosporaarachidicola)、齐整小核菌(Sclerotium rolfsii);
豌豆病害豌豆:豌豆白粉菌(Erysiphe pisi);
马铃薯病害:茄链格孢菌、致病疫霉菌、马铃薯疫霉绯腐病菌(Phytophthoraerythroseptica)、马铃薯粉状疮痂病菌(Spongospora subterranean,f.sp.Subterranean);
草莓病害:薄草单丝壳菌(Sphaerotheca humuli)、檬果炭疽病菌;
茶病害:茶网饼病菌(Exobasidium reticulatum)、茶白星病菌(Elsinoeleucospila)、拟盘多毛孢属种(Pestalotiopsis sp.)、茶炭疽菌(Colletotrichum theae-sinensis);
烟草病害:烟草赤星病菌(Alternaria longipes)、二孢白粉菌、烟草炭疽病菌(Colletotrichum tabacum)、烟草霜霉菌(Peronospora tabacina)、烟草疫霉菌(Phytophthora nicotianae);
油菜籽病害:核盘菌、立枯丝核菌;
棉花病害:立枯丝核菌;
甜菜病害:甜菜尾孢菌(Cercospora beticola)、水稻纹枯病菌(Thanatephoruscucumeris)、水稻纹枯病菌、螺壳状丝囊霉(Aphanomyces cochlioides);
玫瑰病害:蔷薇双壳菌(Diplocarpon rosae)、蔷薇单丝壳茵(Sphaerothecapannosa)、蔷薇霜霉(Peronospora sparsa);
菊花和菊科病害:莴苣盘枝霉(Bremia lactuca)、野菊壳针抱(Septoriachrysanthemi-indici)、堀氏菊柄锈菌(Puccinia horiana);
各种植物的病害:瓜果腐霉菌(Pythium aphanidermatum)、德巴利氏腐霉菌(Pythium debarianum)、禾草腐霉菌(Pythium graminicola)、畸雌腐霉菌(Pythiumirregulare)、终极腐霉菌(Pythium ultimum)、灰葡萄孢菌(Botrytis cinerea)、核盘菌;
萝卜病害:甘蓝链格孢菌(Alternaria brassicicola);
结缕草病害:同果核盘菌(Sclerotinia homeocarpa)、立枯丝核菌;
香蕉病害:香蕉黑条叶斑病菌(Mycosphaerella fijiensis)、香蕉黄条叶斑病菌(Mycosphaerella musicola);
向日葵病害:向日葵霜霉病菌(Plasmopara halstedii);
在不同植物生长初期阶段由以下各项引起的种子疾病或病害:曲霉属种、青霉属种(Penicillium spp.)、镰刀菌属种(Fusarium spp.)、赤霉菌属种(Gibberella spp.)、木霉属种、根串珠霉属种(Thielaviopsis spp.)、根霉属种、毛霉菌属种(Mucor spp.)、伏革菌属种(Corticium spp.)、茎点霉属种(Rhoma spp.)、丝核菌属种(Rhizoctonia spp.)、色二孢属种(Diplodia spp.)等;
由杆菌属种(Polymixa spp.)、油壶菌属种(Olpidium spp.)等介导的各种植物病毒病。
3.赋予对除草剂的抗性的基因的实例:
对抑制生长点或分生组织的除草剂的抗性,该除草剂诸如咪唑啉酮或硫酰脲,例如分别在Lee等人,EMBO J.7:1241(1988)和Miki等人,Theor.Appl.Genet.80:449(1990)中所述的。
草甘膦耐受性(分别由例如突变体5-烯醇丙酮莽草酸-3-磷酸合酶(EPSP)基因、aroA基因和草甘膦乙酰转移酶(GAT)基因赋予的抗性)、或者对于其他膦羧基化合物诸如草铵膦的抗性(由来自链霉菌种类(包括吸水链霉菌(Streptomyces hygroscopicus)和绿色产色链霉菌(Streptomyces viridichromogenes))的草丁膦乙酰基转移酶(PAT)基因赋予)、以及对吡啶氧基或苯氧基丙酸和环异己酮的抗性(由ACC酶抑制剂编码基因赋予)。参见例如美国专利号4,940,835和美国专利号6,248,876、美国专利号4,769,061、欧洲专利号0 333 033和美国专利号4,975,374。另参见欧洲专利号0242246;DeGreef等人,Bio/Technology 7:61(1989);Marshall等人,Theor.Appl.Genet.83:435(1992);Castle等人的WO 2005012515,以及WO 2005107437。
对抑制光合成的除草剂的抗性,该除草剂诸如三嗪(psbA和gs+基因)或苯基氰(腈水解酶基因),以及谷胱甘肽S-转移酶,如在Przibila等人,Plant Cell 3:169(1991);美国专利号4,810,648和Hayes等人,Biochem.J.285:173(1992)中所述的。
编码使除草剂去毒的酶或对抑制具有抗性的突变体谷氨酰胺合酶的基因,例如在美国专利申请序列号11/760,602中所述的。或者去毒酶是编码草丁膦乙酰转移酶的酶(诸如来自链霉菌种类的bar或pat蛋白)。草丁膦乙酰转移酶例如描述于美国专利号5,561,236;5,648,477;5,646,024;5,273,894;5,637,489;5,276,268;5,739,082;5,908,810和7,112,665。
羟基苯丙酮酸双氧化酶(HPPD)抑制剂,即天然存在的HPPD抗性酶,或者编码突变或嵌合HPPD酶的基因,如在WO 96/38567、WO 99/24585和WO 99/24586、WO 2009/144079、WO2002/046387,或美国专利号6,768,044中所述的。
4.涉及非生物胁迫耐受性的基因实例:
能够在植物细胞或植物中减少聚(ADP-核糖)聚合酶(PARP)基因的表达/或活性的转基因,如在WO 00/04173或WO/2006/045633中所述的。
能够减少植物或植物细胞的PARG编码基因的表达和/或活性的转基因,如例如在WO 2004/090140中所述的。
编码烟酰胺腺嘌呤二核苷酸补救合成途径的植物功能酶的转基因,这些酶包括烟酰胺酶、烟酰酸磷酸核糖基转移酶、烟酸单核苷酸腺嘌呤转移酶、烟酰胺腺嘌呤二核苷酸合成酶或烟酰胺磷酸核糖基转移酶,如在例如EP 04077624.7、WO 2006/133827、PCT/EP07/002,433、EP 1999263或WO 2007/107326中所述的。
涉及碳水化合物生物合成的酶包括在例如EP 0571427、WO 95/04826、EP0719338、WO 96/15248、WO 96/19581、WO 96/27674、WO 97/11188、WO 97/26362、WO 97/32985、WO 97/42328、WO 97/44472、WO 97/45545、WO 98/27212、WO 98/40503、WO99/58688、WO 99/58690、WO 99/58654、WO 00/08184、WO 00/08185、WO 00/08175、WO 00/28052、WO00/77229、WO 01/12782、WO 01/12826、WO 02/101059、WO 03/071860、WO 2004/056999、WO2005/030942、WO 2005/030941、WO 2005/095632、WO 2005/095617、WO 2005/095619、WO2005/095618、WO 2005/123927、WO 2006/018319、WO 2006/103107、WO 2006/108702、WO2007/009823、WO 00/22140、WO 2006/063862、WO 2006/072603、WO 02/034923、EP06090134.5、EP 06090228.5、EP 06090227.7、EP 07090007.1、EP 07090009.7、WO 01/14569、WO 02/79410、WO 03/33540、WO 2004/078983、WO 01/19975、WO 95/26407、WO 96/34968、WO 98/20145、WO 99/12950、WO 99/66050、WO 99/53072、美国专利号6,734,341、WO00/11192、WO 98/22604、WO 98/32326、WO 01/98509、WO 01/98509、WO 2005/002359、美国专利号5,824,790、美国专利号6,013,861、WO 94/04693、WO 94/09144、WO 94/11520、WO95/35026或WO 97/20936中所述的酶;或者如EP 0663956、WO 96/01904、WO 96/21023、WO98/39460和WO 99/24593所公开的涉及多聚果糖(尤其是菊粉和果聚糖类型)的产生的酶;如WO 95/31553、US 2002031826、美国专利号6,284,479、美国专利号5,712,107、WO 97/47806、WO 97/47807、WO 97/47808和WO 00/14249所公开的涉及α-1,4-葡聚糖的产生的酶;如WO 00/73422所公开的涉及α-1,6分支α-1,4-葡聚糖的产生的酶;如例如WO 00/47727、WO00/73422、EP 06077301.7、美国专利号5,908,975和EP 0728213所公开的涉及交替糖的产生的酶;如例如WO 2006/032538、WO 2007/039314、WO 2007/039315、WO 2007/039316、JP2006304779和WO 2005/012529所公开的涉及透明质酸的产生的酶。
提高抗旱性的基因。例如,WO 2013122472公开了功能性泛素蛋白连接酶蛋白(UPL)、更具体地说是UPL3的缺乏或水平降低导致所述植物对水的需求减少或者对干旱的抗性提高。具有增加的耐旱性的转基因植物的其他实例公开于例如US 2009/0144850、US2007/0266453和WO 2002/083911。US2009/0144850描述了一种由于DR02核酸表达的改变而展示耐旱性表型的植物。US 2007/0266453描述了一种由于DR03核酸表达的改变而展示耐旱性表型的植物,并且WO 2002/08391 1描述了一种由于在保卫细胞中表达的ABC转运体的活性降低而具有增加的对干旱胁迫的耐受性的植物。另一个实例是Kasuga和合著者(1999)的著作,他们描述了在正常生长条件下编码DREB1 A的cDNA在转基因植物中的过表达激活了许多胁迫耐受性基因的表达并且导致对干旱、盐负荷以及寒冷的耐受性提高。然而,在正常生长条件下DREB1A的表达也导致严重的生长迟缓(Kasuga(1999)Nat Biotechnol 17(3)287-291)。
在另外的特定实施方案中,可以通过影响特定植物性状来改良农作物植物。例如,通过开发耐杀虫剂植物、提高植物的抗病性、提高植物的昆虫和线虫抗性、提高植物针对寄生杂草的抗性、提高植物的耐旱性、提高植物的营养价值、提高植物的胁迫耐受性、避免自花授粉、提高植物饲料消化率生物量、提高谷物产量等。在下文中提供了若干特定的非限制性实例。
除单一基因的靶向突变之外,AD官能化的CRISPR系统可以被设计成允许在植物中靶向突变多基因、缺失染色体片段、位点特异性整合转基因、体内定点诱变、以及精确基因替代或等位基因交换。因此,本文描述的方法在基因发现和验证、突变和顺基因育种,以及杂交育种中具有广泛的应用。这些应用有助于产生新一代的具有各种改良的农艺性状的遗传修饰农作物,这些农艺性状诸如除草剂耐受性、抗病性、非生物胁迫耐受性、高产率以及优等品质。
使用AD官能化的组合物产生雄性不育植物
杂交植物与自交植物相比典型地具有有利的农艺性状。然而,对于自花授粉植物,杂交体传代可能是有挑战的。在不同植物类型中,已经修饰了对植物能育性,更特别地雄性能育性至关重要的基因。例如,在玉米中,至少鉴定了两种对能育性至关重要的基因(Amitabh Mohanty International Conference on New Plant Breeding MolecularTechnologies Technology Development And Regulation,2014年10月9-10日,Jaipur,India;Svitashev等人Plant Physiol.2015年10月;169(2):931-45;Djukanovic等人PlantJ.2013Dec;76(5):888-99)。本文提供的方法和系统可以用于靶向雄性能育性所需要的基因,以便生成雄性不育植物,这些植物可以易于杂交以生成杂交体。在特定实施方案中,本文提供的AD官能化的CRISPR系统用于靶向诱变细胞色素P450-样基因(MS26)或大范围核酸酶基因(MS45),从而向玉米植物赋予雄性不育性。如此遗传改变的玉米植物可以用于杂交育种程序。
增加植物的能育性阶段
特定实施方案,本文提供的方法和系统用于延长植物诸如稻谷植物的能育性阶段。例如,可以靶向稻谷能育性阶段基因诸如Ehd3,以便生成基因中的突变并且可以选择小植物以延长再生植物能育性阶段(如CN 104004782中所述的)。
使用AD官能化的组合物生成目标农作物的遗传变异
农作物植物中野生种质和遗传变异的可用性是农作物改良程序的关键,但是来自农作物植物的种质的可用多样性是有限的。本发明设想了用于生成目标种质的遗传变异的多样性的方法。在AD官能化的CRISPR系统的此应用中,提供了靶向植物基因组中的不同位置的指导RNA文库并且将该文库与CRISPR-Cas蛋白和腺苷脱氨酶一起引入到植物细胞中。以这种方式,可以生成基因组范围的点突变和基因敲除的集合。在特定实施方案中,所述方法包括由如此获得的细胞生成植物部分或植物以及针对目标性状筛选细胞。靶基因可以包含编码区和非编码区两者。在特定实施方案中,性状是胁迫耐受性,并且所述方法是用于生成胁迫耐受性农作物品种的方法。
使用AD官能化的组合物影响果实催熟
催熟是果实和蔬菜成熟过程中的正常阶段。仅在催熟开始后的几天,催熟致使果实或蔬菜不可食用。这个过程给农民和消费者都造成了重大损失。在特定实施方案中,本发明的方法用于减少乙烯的产生。这是通过确保以下各项中的一者或多者来确保的:a.阻遏ACC合酶基因表达。ACC(1-氨基环丙烷-1-羧酸)合酶是负责将S-腺苷甲硫氨酸(SAM)转化成ACC的酶;这是乙烯生物合成中的第二个步骤至最后一个步骤。当合酶基因的反义(“镜像”)或截短的拷贝插入到植物基因组中时会阻碍酶表达;b.插入ACC脱氨酶基因。从一种常见的非致病性土壤细菌绿针假单胞菌(Pseudomonas chlororaphis)获得编码该酶的基因。它将ACC转化为一种不同的化合物,从而减少可用于产生乙烯的ACC量;c.插入SAM水解酶基因。这种方法类似于ACC脱氨酶,其中当乙烯前体代谢物的量减少时乙烯产生受到阻碍;在此情况下,SAM被转化为高丝氨酸。从大肠杆菌T3噬菌体获得编码该酶的基因;以及d.阻遏ACC氧化酶基因表达。ACC氧化酶是催化ACC氧化成乙烯的酶,这是乙烯生物合成途径中的最后一个步骤。使用本文所述的方法,下调ACC氧化酶基因,导致乙烯产生受到阻遏,从而延迟果实催熟。在特定实施方案中,对于以上所述修饰另外地或可替代地,本文所述的方法用于修饰乙烯受体,以便干扰由果实获得的乙烯信号。在特定实施方案中,修饰,更特别地说阻遏了编码乙烯结合蛋白的ETR1基因的表达。在特定实施方案中,对于以上所述修饰另外地或可替代地,本文所述的方法用于修饰编码多聚半乳糖醛酸酶(PG)的基因的表达,所述多聚半乳糖醛酸酶是负责分解果胶(维持植物细胞壁完整性的物质)的酶。果胶分解发生在催熟过程开始时,导致水果软化。因此,在特定实施方案中,本文描述的方法用于在PG基因中引入突变或阻遏PG基因的激活,以便减少所产生的PG酶的量,从而延迟果胶降解。
因此,在特定实施方案中,所述方法包括使用AD官能化的CRISPR系统来确保如上所述的植物细胞基因组的一种或多种修饰,并且由所述细胞再生植物。在特定实施方案中,植物是番茄植物。
增加植物的保存期限
在特定实施方案中,本发明的方法用于修饰涉及产生影响植物或植物部分的保存期限的化合物的基因。更特别地,修饰是在防止马铃薯块茎中的还原糖积累的基因中。在高温处理时,这些还原糖与游离氨基酸反应,产生棕色苦味产物和高水平的丙烯酰胺,丙烯酰胺是一种潜在的致癌物。在特定实施方案中,本文提供的方法用于减少或抑制液泡转化酶基因(VInv)的表达,所述液泡转化酶基因编码将蔗糖分解为葡萄糖和果糖的蛋白质(Clasen等人DOI:10.1111/pbi.12370)。
使用AD官能化的组合物确保增值的性状
在特定实施方案中,AD官能化的CRISPR系统用于产生营养提高的农作物。在特定实施方案中,本文提供的方法适于生成“功能性食品”,即可以提供超过它所含有的传统营养物的健康益处的修饰的食品或食品成分,并且/或者适于生成“营养食品”,即可以被视为食品或食品的一部分并且提供健康益处(包括预防和治疗疾病)的物质。在特定实施方案中,营养食品可用于预防并且/或者治疗癌症、糖尿病、心血管疾病以及高血压中的一者或多者。
营养提高的农作物的实例包括(Newell-McGloughlin,Plant Physiology,2008年7月,第147卷,第939-953页):
改良的蛋白质品质、含量和/或氨基酸组成,诸如对于以下各项所描述的:百喜草(Luciani等人2005,Florida Genetics Conference Poster)、油菜(Roesler等人,1997,Plant Physiol 113 75-81)、玉米(Cromwell等人,1967,1969J Anim Sci 26 1325-1331;O’Quin等人2000J Anim Sci 78 2144-2149;Yang等人2002,Transgenic Res 1111-20;Young等人2004,Plant J 38 910-922)、马铃薯(Yu J和Ao,1997Acta Bot Sin 39 329-334;Chakraborty等人2000,Proc Natl Acad Sci USA 97 3724-3729;Li等人2001)ChinSci Bull 46 482-484、稻(Katsube等人1999,Plant Physiol 120 1063-1074)、大豆(Dinkins等人2001,Rapp 2002,In Vitro Cell Dev Biol Plant 37 742-747)、甘薯(Egnin和Prakash 1997,In Vitro Cell Dev Biol 33 52A)。
必需氨基酸含量,诸如对于以下各项所描述的:油菜(Falco等人1995,Bio/Technology 13 577-582)、羽扇豆(White等人2001,J Sci Food Agric 81 147-154)、玉米(Lai和Messing,2002,Agbios 2008GM crop database(March 11,2008))、马铃薯(Zeh等人2001,Plant Physiol 127792-802)、高粱(Zhao等人2003,Kluwer Academic Publishers,Dordrecht,The Netherlands,第413-416页)、大豆(Falco等人1995Bio/Technology 13577-582;Galili等人2002Crit Rev Plant Sci 21 167-204)。
油类和脂肪酸,诸如对于油菜(Dehesh等人(1996)Plant J 9 167-172[PubMed];Del Vecchio(1996)INFORM International News on Fats,Oils and Related Materials7 230-243;Roesler等人(1997)Plant Physiol 113 75-81[PMC free article][PubMed];Froman和Ursin(2002,2003)Abstracts of Papers of the American Chemical Society223U35;James等人(2003)Am J Clin Nutr 77 1140-1145[PubMed];Agbios(2008,above);棉花(Chapman等人(2001).J Am Oil Chem Soc 78 941-947;Liu等人(2002)J Am CollNutr 21 205S–211S[PubMed];O'Neill(2007)Australian Life Scientist.http://www.biotechnews.com.au/index.php/id;866694817;fp;4;fpid;2(June 17,2008)、亚麻籽(Abbadi等人,2004,Plant Cell 16:2734-2748)、玉米(Young等人,2004,Plant J 38910-922)、油棕(Jalani等人1997,J Am Oil Chem Soc 74 1451-1455;Parveez,2003,AgBiotechNet 113 1-8)、稻(Anai等人,2003,Plant Cell Rep 21 988-992)、大豆(Reddy和Thomas,1996,Nat Biotechnol 14 639-642;Kinney和Kwolton,1998,Blackie Academicand Professional,London,pp 193-213)、向日葵(Arcadia,Biosciences 2008)
碳水化合物,诸如对于以下各项所描述的果聚糖:菊苣(Smeekens(1997)TrendsPlant Sci 2 286-287;Sprenger等人(1997)FEBS Lett 400355-358;Sévenier等人(1998)Nat Biotechnol 16 843-846)、玉米(Caimi等人(1996)Plant Physiol 110 355-363)、马铃薯(Hellwege等人,1997Plant J 12 1057-1065)、甜菜(Smeekens等人1997,同上);菊粉,诸如对于马铃薯所述(Hellewege等人2000,Proc Natl Acad Sci USA 978699-8704);淀粉,诸如对于稻所述的(Schwall等人(2000)Nat Biotechnol 18 551-554;Chiang等人(2005)Mol Breed 15 125-143),
维生素和类葫萝卜素,诸如对于以下各项所述的:油菜(Shintani和DellaPenna(1998)Science 282 2098-2100)、玉米(Rocheford等人(2002).J Am Coll Nutr 21 191S–198S;Cahoon等人(2003)Nat Biotechnol 21 1082-1087;Chen等人(2003)Proc Natl AcadSci USA 1003525-3530)、芥菜籽(Shewmaker等人(1999)Plant J 20 401-412)、马铃薯(Ducreux等人,2005,J Exp Bot 56 81-89)、稻(Ye等人(2000)Science 287 303-305)、草莓(Agius等人(2003),Nat Biotechnol 21 177-181)、番茄(Rosati等人(2000)Plant J 24413-419;Fraser等人(2001)J Sci Food Agric 81 822-827;Mehta等人(2002)NatBiotechnol 20 613-618;Díazde la Garza等人(2004)Proc Natl Acad Sci USA 10113720-13725;Enfissi等人(2005)Plant Biotechnol J 3 17-27;DellaPenna(2007)ProcNatl Acad Sci USA 104 3675-3676。
功能性次级代谢产物,诸如对于以下各项所述的:苹果(芪类,Szankowski等人(2003)Plant Cell Rep 22:141-149)、苜蓿(白藜芦醇,Hipskind和Paiva(2000)Mol PlantMicrobe Interact 13 551-562)、猕猴桃(白藜芦醇,Kobayashi等人(2000)Plant CellRep 19 904-910)、玉米和大豆(类黄酮,Yu等人(2000)Plant Physiol 124 781-794)、马铃薯(花青素和生物碱糖苷,Lukaszewicz等人(2004)J Agric Food Chem 521526-1533)、稻(类黄酮和白藜芦醇,Stark-Lorenzen等人(1997)Plant Cell Rep 16 668-673;Shin等人(2006)Plant Biotechnol J 4 303-315)、番茄(+白藜芦醇、绿原酸、类黄酮、芪;Rosati等人(2000)同上;Muir等人(2001)Nature 19 470-474;Niggeweg等人(2004)Nat Biotechnol22746-754;Giovinazzo等人(2005)Plant Biotechnol J 3 57-69)、小麦(咖啡酸和阿魏酸、白藜芦醇;United Press International(2002));以及
矿物质可用性,诸如对于以下各项所述的:苜蓿(植酸酶,Austin-Phillips等人(1999)http://www.molecularfarming.com/nonmedical.html)、生菜(Lettuse)(铁;Goto等人(2000)Theor Appl Genet 100 658-664)、稻(铁,Lucca等人(2002)J Am Coll Nutr21 184S–190S)、玉米、大豆和小麦(植酸酶,Drakakaki等人(2005)Plant Mol Biol 59869-880;Denbow等人(1998)Poult Sci 77 878-881;Brinch-Pedersen等人(2000)Mol Breed 6195-206)。
在特定实施方案中,增值的性状与存在于植物中的化合物的设想的健康益处相关。例如,在特定实施方案中,通过应用本发明的方法来确保以下化合物中的一者或多者的合成的修改或者诱导/增加它们的合成,以获得增值的农作物:
·类葫萝卜素,诸如存在于胡萝卜中的α-胡萝卜素,其中和可引起对细胞的损害的自由基;或者存在于各种果实和蔬菜中的β-胡萝卜素,其中和自由基
·存在于绿色蔬菜中的叶黄素,其有助于维持健康视力
·存在于番茄和番茄产品中的番茄红素,认为其降低前列腺癌风险;
·存在于柑橘和玉米中的玉米黄素,其有助于维持健康视力
·膳食纤维,诸如存在于麦麸中的不溶性纤维,其可以降低乳腺癌和/或结肠癌风险;以及存在于燕麦中的β葡聚糖;存在于车前子(Psylium)和全谷粒中的可溶性纤维,其可以降低心血管疾病(CVD)风险;
·脂肪酸,诸如ω-3脂肪酸,其可以降低CVD风险并提高心理功能和视功能;缀合亚油酸,其可以改善身体组成,可以减小某些癌症风险;以及GLA,其可以降低癌症和CVD的炎症风险,可以改善身体组成;
·黄酮类,诸如存在于小麦中的羟基苯乙烯,其具有抗氧化剂样活性,可以降低退行性疾病风险;存在于果实和蔬菜中的黄酮醇、儿茶酚和鞣酸,它们中和自由基并且可以降低癌症风险;
·葡萄糖异硫氰酸酯、吲哚、异硫氰酸酯,诸如存在于十字花科蔬菜(花椰菜、羽衣甘蓝)、辣根中的萝卜硫素,其中和自由基,可以降低癌症风险;
·酚类,诸如存在于葡萄中的芪类,其可以降低退行性疾病、心脏病和癌症的风险,可以有延年益寿功效;以及存在于蔬菜和柑橘中的咖啡酸和阿魏酸,它们具有抗氧化剂样活性,可以降低退行性疾病、心脏病和眼病的风险;以及存在于可可中的表儿茶素,其具有抗氧化剂样活性,可以降低退行性疾病和心脏病的风险;
·存在于玉米、大豆、小麦和木制油中的植物甾烷醇/固醇,它们可以通过减低血胆固醇水平来降低冠心病风险;
·存在于洋姜、胡葱、洋葱粉中的果聚糖、菊糖、低聚果糖,它们可以提高胃肠健康;
·存在于大豆中的皂苷,其可以减低LDL胆固醇;
·存在于大豆中的大豆蛋白质,其可以降低心脏病风险;
·植物雌激素,诸如存在于大豆中的异黄酮,其可以减少绝经期症状(诸如热潮红),可以减少骨质疏松症和CVD;以及存在于亚麻、黑麦和蔬菜中的木脂素,其可以防止心脏病和一些癌症,可以降低LDL胆固醇、总胆固醇。;
·硫化物和硫醇,诸如存在于洋葱、大蒜、橄榄、韭葱和青葱(scallon)中的二烯丙基硫;以及存在于十字花科蔬菜中的烯丙基甲基三硫、二硫醇硫酮,它们可以降低LDL胆固醇,帮助维持健康免疫系统;以及
·鞣酸,诸如存在于蔓越橘、可可中的原花色素,其可以提高泌尿道健康,可以降低CVD和高血压风险。
此外,本发明的方法还设想了修改蛋白质/淀粉功能性、保质期、味道/美学、纤维品质、以及减少过敏原、抗营养素以及毒素的形状。
因此,本发明涵盖了用于产生具有营养增加价值的植物的方法,所述方法包括使用如本文所述的AD官能化的CRISPR系统将编码涉及产生具有增加的营养价值的组分的酶的基因引入到植物细胞中并且由所述植物细胞再生植物,所述植物的特征在于所述具有增加的营养价值的组分的表达增加。在特定实施方案中,AD官能化的CRISPR系统用于例如通过修饰控制此化合物代谢的一种或多种转录因子来间接修改这些化合物的内源性合成。上文描述了用于使用AD官能化的CRISPR系统将目标基因引入到植物细胞中并且/或者修饰内源性基因的方法。
在已修饰为赋予增值性状的植物中的一些具体修饰实例是:具有修饰的脂肪酸代谢的植物,方式为例如用硬脂酰-ACP去饱和酶的反义基因转化植物以增加植物硬脂酸含量的。参见Knultzon等人,Proc.Natl.Acad.Sci.U.S.A.89:2624(1992)。另一个实例涉及例如通过克隆接着再引入与可以负责特征为低水平植酸的玉米突变体的单一等位基因相关联的DNA来降低植酸酯含量。参见Raboy等人,Maydica 35:383(1990)。
类似地,在强启动子控制下调节玉米糊粉层中黄酮类的产生的玉米(玉蜀黍)TfsC1和R的表达导致拟南芥属(阿拉伯芥)中的花青素的高积累速率,推测是通过激活整个途径(Bruce等人,2000,Plant Cell12:65-80)。DellaPenna(Welsch等人,2007Annu RevPlant Biol 57:711-738)发现Tf RAP2.2及其相互作用配偶体SINAT2增加拟南芥叶中的胡萝卜素形成作用。在转基因拟南芥中表达Tf Dof1诱导了编码用于产生碳架、标记性增加氨基酸含量以及减少Glc水平的酶的基因的上调(Yanagisawa,2004Plant Cell Physiol 45:386-391),并且DOF TfAtDof1.1(OBP2)上调了拟南芥的葡萄糖异硫氰酸酯生物合成途径中的所有步骤(Skirycz等人,2006Plant J 47:10-24)。
减少植物中的过敏原
在特定实施方案中,本文提供的方法用于生成具有减少的水平的过敏原的植物,从而使得它们对于消费者而言更安全。在特定实施方案中,所述方法包括修饰负责产生植物过敏原的一种或多种基因的表达。例如,在特定实施方案中,所述方法包括下调植物细胞诸如黑麦草植物细胞中的Lol p5基因的表达并且由所述植物细胞再生植物以便减少所述植物的花粉的过敏原性(Bhalla等人1999,Proc.Natl.Acad.Sci.USA第96卷:11676-11680)。
花生过敏和对豆类过敏总体上是真实而严重的健康问题。本发明的AD官能化的CRISPR系统可以用于鉴定然后突变编码此类豆类的过敏原性蛋白的基因。不限于此类基因和蛋白质,Nicolaou等人鉴定了花生、大豆、扁豆、豌豆、羽扇豆、青豆以及绿豆中的过敏原性蛋白。参见Nicolaou等人,Current Opinion in Allergy and Clinical Immunology2011;11(3):222)。
用于目标内源性基因的筛选方法
本文提供的方法进一步允许鉴定编码涉及产生具有增加的营养价值的组分的酶的有价值基因或者通常是影响跨种类、门和植物界的目标农艺性状的基因。通过使用如本文所述的AD官能化的CRISPR系统选择性地靶向例如编码植物代谢途径的酶的基因,可以鉴定负责植物某些营养方面的基因。类似地,通过选择性地靶向可以影响所期望的农艺性状的基因,可以鉴定相关基因。因此,本发明涵盖了用于编码涉及产生具有特定营养价值和/或农艺性状的化合物的酶的基因的筛选方法。
在生物燃料生产中使用AD官能化的CRISPR系统
如本文所用,术语“生物燃料”是由植物和植物来源的资源制成的替代燃料。可以从有机物质中提取可再生生物燃料,已通过碳固定方法获得或者通过使用或转化生物质制成有机物质的能量。此生物质可以直接用于生物燃料或者可以通过热转化、化学转化和生物化学转化来转化成含有能量的便利物质。这种生物质转化可以产生固体、液体或气体形式的燃料。存在两种类型的生物燃料:生物乙醇和生物柴油。生物乙醇主要是通过纤维素(淀粉)的糖发酵过程产生的,纤维素大部分来源于玉米和甘蔗。在另一方面,生物柴油主要是由油料作物诸如油菜籽、棕榈和大豆产生的。生物燃料主要用于运输。
增强用于生物燃料生产的植物特性
在特定实施方案中,使用如本文所述的AD官能化的CRISPR系统的方法用于改变细胞壁的特性,以便促进关键性水解剂进入,从而更有效地释放用于发酵的糖。在特定实施方案中,修改纤维素和/或木质素的生物合成。纤维素是细胞壁的主要组分。纤维素和木质素的生物合成是共调节的。通过减少植物中的木质素比例,可以增加纤维素的比例。在特定实施方案中,本文所述的方法用于下调植物中的木质素生物合成,以便增加可发酵的碳水化合物。更特别地,本文所述的方法用于下调如WO 2008064289 A2所公开的选自由以下组成的组的至少第一木质素生物合成基因:4-香豆酸酯3-羟化酶(C3H)、苯丙氨酸氨-裂解酶(PAL)、肉桂酸酯4-羟化酶(C4H)、羟基肉桂酰转移酶(HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰辅酶A 3-O-甲基转移酶(CCoAOMT)、阿魏酸酯5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰辅酶A-还原酶(CCR)、4-香豆酸酯辅酶A连接酶(4CL)、单木质醇-木质素-特异性糖基转移酶,以及醛脱氢酶(ALDH)。
在特定实施方案中,本文所述的方法用于产生在发酵过程中生成较低水平乙酸的植物生物质(另参见WO 2010096488)。更特别地,本文所公开的方法用于生成与CaslL同源的突变,以减少多糖乙酰化。
修饰用于生物燃料生产的酵母
在特定实施方案中,本文提供的AD官能化的CRISPR系统用于通过重组微生物进行生物乙醇生产。例如,AD官能化的CRISPR系统可以用于工程化微生物,诸如酵母,以由可发酵糖生成生物燃料或生物聚合物并且任选地能够降解来源于作为可发酵糖来源的农业废弃物的植物来源的木质纤维素。在一些实施方案中,AD官能化的CRISPR系统用于修饰与生物燃料生产途径竞争的内源性代谢途径。
因此,在更具体的实施方案中,本文所述的方法用于如下修饰微生物:修饰编码所述宿主细胞的代谢途径中的酶的至少一种核酸,其中所述途径产生除来自丙酮酸酯的乙醛或来自乙醛的乙醇之外的代谢物,并且其中所述修饰导致所述代谢物的产生减少,或者引入编码所述酶的抑制剂的至少一种核酸。
修饰用于植物油或生物燃料生产的藻类和植物
例如,转基因藻类或其他植物诸如油菜可能在植物油或生物燃料诸如醇类(尤其是甲醇和乙醇)的生产中特别有用。这些可以被工程化以表达或过表达高水平的油或醇类,以供在油或生物燃料行业中使用。
根据本发明的特定实施方案,AD官能化的CRISPR系统用于生成可用于生物燃料生产的富含脂质的硅藻。
在特定实施方案中,设想的是特异性地修饰涉及改变由藻类细胞产生的脂质的量和/或脂质的品质的基因。编码涉及脂肪酸合成途径的酶的基因的实例可以编码具有例如以下酶活性的蛋白质:乙酰辅酶A羧化酶、脂肪酸合酶、3-酮乙基_酰基-运载蛋白合酶III、甘油-3-磷酸脱氢酶(G3PDH)、烯酰-酰基运载蛋白还原酶(烯酰-ACP-还原酶)、甘油-3-磷酸酰基转移酶、溶血磷脂酰基转移酶或二酰甘油酰基转移酶、磷脂:二酰甘油酰基转移酶、磷脂酸磷酸酶、脂肪酸硫酯酶诸如软脂酰蛋白硫酯酶,或苹果酸酶活性。在另外的实施方案中,设想的是生成具有增加的脂质积累的硅藻。这可以通过靶向减少脂质分解代谢的基因来实现。对于用于本发明的方法中特别令人感兴趣的是涉及激活三酰基甘油和游离脂肪酸的基因,以及直接涉及脂肪酸的β氧化的基因,诸如脂酰辅酶A合成酶、3-酮脂酰辅酶A硫解酶、脂酰辅酶A氧化酶活性以及磷酸葡萄糖变位酶。本文所述的AD官能化的CRISPR系统和方法可以用于特异性地激活硅藻中的此类基因以增加其脂质含量。
诸如微藻的生物被广泛用于合成生物学。Stovicek等人(Metab.Eng.Comm.,2015;2:13描述了工业用酵母例如酿酒酵母的基因组编辑,以有效产生用于工业生产的有力菌株。Stovicek使用了对于酵母进行密码子优化的CRISPR-Cas9系统来同时破坏内源性基因的两个等位基因并且敲除异源基因。Cas9和指导RNA由基因组或附加型2μ基载体位置表达。这些作者们还证实基因破坏效率可以通过优化Cas9和指导RNA表达水平来提高。Hlavová等人(Biotechnol.Adv.2015)论述了使用诸如CRISPR的技术靶向核基因和叶绿体基因进行插入诱变和筛选来开发微藻种类或菌株。
US 8945839描述了一种用于使用Cas9工程化微藻(莱茵衣藻细胞)的方法。使用类似的工具,本文所述的AD官能化的CRISPR系统的方法可以应用于衣藻属种和其他藻类。在特定实施方案中,在藻类中引入CRISPR-Cas蛋白(例如Cas13)、腺苷脱氨酶(其可以融合至CRISPR-Cas蛋白或适体结合衔接蛋白)和指导RNA,其使用在组成型启动子诸如Hsp70A-RbcS2或β2-微管蛋白的控制下表达CRISPR-Cas蛋白和任选地腺苷脱氨酶的载体进行表达。指导RNA将使用含有T7启动子的载体递送。或者,可以将mRNA和体外转录的指导RNA递送至藻类细胞。电穿孔方法遵循来自GeneArt衣藻属工程化试剂盒的标准推荐方法。
使用AD官能化的组合物生成能够进行脂肪酸生产的微生物
在特定实施方案中,本发明的方法用于生成能够产生脂肪酸酯诸如脂肪酸甲酯(“FAME”)和脂肪酸乙酯(“FAEE”)的遗传工程化微生物。
典型地,宿主细胞可以被工程化以通过表达或过表达编码硫酯酶的基因、编码脂酰辅酶A合酶的基因以及编码酯合酶的基因来由存在于培养基中的碳源诸如醇产生脂肪酸酯。因此,本文提供的方法用于修饰微生物,以便过表达或引入硫酯酶基因、编码脂酰辅酶A合酶的基因以及编码酯合酶的基因。在特定实施方案中,硫酯酶基因选自tesA、'tesA、tesB、fatB、fatB2、fatB3、fatAl或fatA。在特定实施方案中,编码脂酰辅酶A合酶的基因选自fadDJadK、BH3103、pfl-4354、EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa39,或编码具有相同特性的酶的鉴定的基因。在特定实施方案中,编码酯合酶的基因是编码来自以下各项的合酶/脂酰辅酶A:二酰基甘油酰基转移酶的基因:霍霍巴(Simmondsiachinensis)、不动杆菌属种ADP、泊库岛食烷菌(Alcanivorax borkumensis)、铜绿假单胞菌(Pseudomonas aeruginosa)、亚德海床杆菌(Fundibacter jadensis)、阿拉伯芥或真养产碱杆菌(Alkaligenes eutrophus),或其变体。另外地或可替代地,本文提供的方法用于减少以下各项中的至少一者在所述微生物中的表达:编码脂酰辅酶A脱氢酶的基因、编码外膜蛋白受体的基因,以及编码脂肪酸生物合成转录调节子的基因。在特定实施方案中,诸如通过引入突变使这些基因中的一者或多者失活。在特定实施方案中,编码脂酰辅酶A脱氢酶的基因是fadE。在特定实施方案中,编码脂肪酸生物合成的转录调节子的基因编码DNA转录阻抑因子,例如fabR。
另外地或可替代地,所述微生物被修饰为减少以下各项中的至少一者的表达:编码丙酮酸甲酸裂解酶的基因、编码乳酸脱氢酶的基因或二者。在特定实施方案中,编码丙酮酸甲酸裂解酶的基因是pflB。在特定实施方案中,编码乳酸脱氢酶的基因是IdhA。在特定实施方案中,诸如通过在其中引入突变使这些基因中的一者或多者失活。
在特定实施方案中,微生物埃希菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳酸杆菌属(Lactobacillus)、红球菌属(Rhodococcus)、聚球蓝细菌属(Synechococcus)、集胞藻属(Synechoystis)、假单胞菌属、曲霉属、木霉属、脉孢菌属、镰刀菌属、腐质霉属(Humicola)、根毛霉属(Rhizomucor)、克鲁维酵母属、毕赤酵母属、毛霉菌属、蚀丝霉属(Myceliophtora)、青霉属、平革菌属(Phanerochaete)、侧耳属(Pleurotus)、栓菌属(Trametes)、金孢子菌属(Chrysosporium)、酵母菌属(Saccharomyces)、寡养单胞菌属(Stenotrophamonas)、裂殖酵母属(Saccharomyces)、亚罗酵母属或链霉菌属。
使用AD官能化的CRISPR系统生成能够进行有机酸生产的微生物
本文提供的方法还用于工程化能够更具体地说由戊糖或己糖生产有机酸的微生物。在特定实施方案中,所述方法包括将外源性LDH基因引入到微生物中。在特定实施方案中,所述微生物中的有机酸生产另外地或可替代地通过使编码涉及内源性代谢途径的蛋白质的内源性基因失活来增加,所述代谢途径产生除目标有机酸之外的代谢物,并且/或者其中所述内源性代谢途径消耗有机酸。在特定实施方案中,所述修饰确保减少除目标有机酸之外的代谢物的产生。根据特定实施方案,所述方法用于引入其中消耗有机酸的内源性途径或编码涉及产生除目标有机酸之外的代谢物的内源性途径的产物的基因的至少一种工程化基因缺失和/或失活。在特定实施方案中,所述至少一种工程化基因缺失或失活是在编码选自由以下组成的组的酶的一种或多种基因中:丙酮酸脱羧酶(pdc)、延胡索酸还原酶、醇脱氢酶(adh)、乙醛脱氢酶、磷酸烯醇丙酮酸羧化酶(ppc)、D-乳酸脱氢酶(d-ldh)、L-乳酸脱氢酶(l-ldh)、乳酸2-单加氧酶。在另外的实施方案中,所述至少一种工程化基因缺失和/或失活是在编码丙酮酸脱羧酶(pdc)的内源性基因中。
在另外的实施方案中,微生物被工程化以产生乳酸,并且所述至少一种工程化基因缺失和/或失活是在编码乳酸脱氢酶的内源性基因中。另外地或可替代地,微生物包含编码细胞色素依赖性乳酸脱氢酶诸如细胞色素B2依赖性L-乳酸脱氢酶的内源性基因的至少一种工程化基因缺失或失活。
使用AD官能化的CRISPR系统生成改良的利用木糖或纤维二糖的酵母菌株
在特定实施方案中,AD官能化的CRISPR系统可以应用于选择改良的利用木糖或纤维二糖的酵母菌株。易错PCR可以用于扩增涉及木糖利用或纤维二糖利用途径的一种(或多种)基因。涉及木糖利用途径和纤维二糖利用途径的基因的实例可以包括但不限于描述于Ha,S.J.等人(2011)Proc.Natl.Acad.Sci.USA 108(2):504-9以及Galazka,J.M.等人(2010)Science 330(6000):84-6中的那些基因。如WO2015138855所述,各自在这种选择的基因中包含随机突变的双链DNA分子的所得文库可以与AD官能化的CRISPR系统的组分共转化到酵母菌株(例如S288C)中,并且可以选择具有增加的木糖或纤维二糖利用能力的菌株。
使用AD官能化的CRISPR系统生成用于类异戊二烯生物合成的改良的酵母菌株
Tadas等人描述了多重CRISPR/Cas9系统在面包酵母酿酒酵母的一个转化步骤中用于基因组工程化多至5个不同基因组基因座的成功应用(MetabolicEngineering第28卷,2015年3月,第213-222页),得到具有高甲羟戊酸酯(它是工业上重要的异戊二烯生物合成途径的关键中间体)产量的菌株。在特定实施方案中,AD官能化的CRISPR系统可以应用于如本文所述的用于鉴定在异戊二烯合成中使用的另外高产的酵母菌株的多重基因组工程化方法中。
改良的植物和酵母细胞
本发明还提供了通过本文提供的方法可获得并且通过本文提供的方法获得的植物和酵母细胞。通过本文所述的方法获得的改良的植物可以适用于通过表达确保例如对植物害虫、除草剂、干旱、低温或高温、过量水等耐受的基因来进行食品或饲料生产。
通过本文所述的方法获得的改良的植物,尤其是农作物和藻类可以适用于通过表达例如比野生型中通常所见更高的蛋白质、碳水化合物、营养素或维生素水平来进行食品或饲料生产。就这一点而言,改良的植物,尤其是豆类和块茎类是优选的。
改良的藻类或其他植物诸如油菜可能在植物油或生物燃料诸如醇类(尤其是甲醇和乙醇)的生产中特别有用。这些可以被工程化以表达或过表达高水平的油或醇类,以供在油或生物燃料行业中使用。
本发明还提供了改良的植物部分。植物部分包括但不限于叶、茎、根、块茎、种子、胚乳、胚珠以及花粉。如本文所设想的植物部分可以是有活力的、无活力的、可再生的和/或不可再生的。
本文还涵盖的是提供根据本发明的方法生成的植物细胞和植物。在本发明的范围内还包括通过传统育种方法产生的包含遗传修饰的植物的配子、种子、胚胎(合子胚或体细胞胚)、子代或杂交体。此类植物可以含有插入在靶序列处或代替靶序列的异源或外源DNA序列。或者,此类植物可以仅含有在一个或多个核苷酸中的改变(突变、缺失、插入、取代)。这样,此类植物与祖代植物的不同之处仅在于特定修饰的存在。
因此,本发明提供了通过本方法产生的植物、动物或细胞或其子代。子代可以是产生的植物或动物的克隆,或者可以由通过与相同种类的其他个体杂交以使另外的期望的性状渗入其后代来进行的有性繁殖产生。在多细胞生物体(特别是动物或植物)的情况下,细胞可以是体内或离体的。
用于使用如本文所述的AD官能化的CRISPR系统进行基因组编辑的方法可以用于对基本上任何植物、藻类、真菌、酵母等赋予所需的性状。针对本文所述的所需生理以及农艺特征,可以使用本公开的核酸构建体和以上提及的各种转化方法对多种多样的植物、藻类、真菌、酵母等以及植物藻类、真菌、酵母细胞或组织系统系统进行工程化。
在特定实施方案中,本文所述的方法用于修饰内源性基因或修饰其表达而不永久性引入到任何外源基因的植物、藻类、真菌、酵母等的基因组中,包括编码CRISPR组分的外源基因,以便避免在植物基因组中存在外源DNA。这可能是令人感兴趣的,因为对非转基因植物的规则要求较不严格。
本文所述的方法通常导致生成“改良的植物、藻类、真菌、酵母等”,在这点上它们与野生型植物相比具有一种或多种期望的性状。在特定实施方案中,获得非转基因遗传修饰植物、藻类、真菌、酵母等、部分或细胞,在这点上没有外源性DNA序列并入植物的任何细胞的基因组中。在此类实施方案中,改良的植物、藻类、真菌、酵母等是非转基因的。当仅确保内源性基因的修饰并且在植物、藻类、真菌、酵母等基因组中未引入或维持外源基因时,所得遗传修饰农作物不含有外源基因并且因此可以基本上认为是非转基因的。AD官能化的CRISPR系统用于植物、藻类、真菌、酵母等基因组编辑的不同应用包括但不限于:编辑内源性基因以赋予目标农业性状。赋予农艺性状的示例性基因包括但不限于赋予对害虫或疾病的抗性的基因;涉及植物疾病的基因,诸如WO 2013046247中列出的基因;赋予对除草剂、杀真菌剂等的抗性的基因;涉及(非生物)胁迫耐受性的基因。CRISPR-Cas系统的用途的其他方面包括但不限于:产生(雄性)不育植物;增加植物/藻类等的能育性阶段;生成目标农作物的遗传变异;影响果实催熟;增加植物/藻类等的保存期限;减少植物/藻类等中的过敏原;确保增值的性状(例如营养提高);用于目标内源性基因的筛选方法;生物燃料、脂肪酸、有机酸等的生产。
AD官能化的组合物可以用于非人类生物体
在一方面,本发明提供了一种非人类的真核生物体;优选地是多细胞真核生物体,这些生物体包含根据任何所述实施方案的真核宿主细胞。在其他方面,本发明提供了一种真核生物体;优选地是多细胞真核生物体,这些生物体包含根据任何所述实施方案的真核宿主细胞。在这些方面的一些实施方案中,生物体可以是动物;例如哺乳动物。而且,生物体可以是节肢动物,诸如昆虫。本发明还可以扩展到其他农业应用,例如像农场和生产动物。例如,猪具有许多特征,这些特征使得它们作为生物医学模型是有吸引力的,尤其是在再生医学中。特别地,具有重症联合免疫缺陷(SCID)的猪可以提供用于再生医学、异种移植(还在本文别处论述)以及肿瘤发展的有用模型,并且将有助于开发用于人类SCID患者的疗法。Lee等人(Proc Natl Acad Sci U S A.2014年5月20日;111(20):7260-5)利用一种报告基因指导的转录激活因子样效应核酸酶(TALEN)系统,以高效率生成对体细胞中的重组激活基因(RAG)2的靶向修饰,包括影响两种等位基因的一些修饰。可以将AD官能化的CRISPR系统应用于类似的系统。
Lee等人的方法(Proc Natl Acad Sci U S A.2014年5月20日;111(20):7260-5)可以如下类似地应用于本发明。突变的猪是通过靶向修饰胎儿成纤维细胞中的RAG2,随后进行SCNT和胚胎转移而产生的。将编码CRISPR Cas和报告基因的构建体电穿孔到胎儿来源的成纤维细胞中。在48小时后,表达绿色荧光蛋白的转染细胞以估计每孔单个细胞的稀释度分到96孔板的单个孔中。通过扩增侧接任何CRISPR Cas切割位点的基因组DNA片段随后对PCR产物进行测序来筛选RAG2的靶向修饰。在筛选并确保不存在位点外突变之后,将携带RAG2的靶向修饰的细胞用于SCNT。去除极体连同卵母细胞的一部分相邻细胞质(推测含有中期II板),并且将供体细胞置于卵黄周隙中。然后对重构的胚胎进行电穿孔,以使供体细胞与卵母细胞融合,接着进行化学激活。将激活的胚胎在具有0.5μM Scriptaid(S7817;Sigma-Aldrich)的猪受精卵培养基(Porcine Zygote Medium)3(PZM3)中孵育14-16小时。接着洗涤胚胎以去除Scriptaid并且在PZM3中培养,直到它们转移到代孕猪的输卵管为止。
本发明用于创建对动物的疾病或病症建模的平台,在一些实施方案中所述动物是哺乳动物,在一些实施方案中是人类。在某些实施方案中,此类模型和平台是基于啮齿动物,在非限制性实例中是基于大鼠或小鼠。此类模型和平台可以利用近交啮齿动物品系之间的区别和比较。在某些实施方案中,此类模型和平台是基于灵长类动物、马、牛、绵羊、山羊、猪、狗、猫或鸟,例如以直接对此类动物的疾病和病症建模或产生此类动物的修改和/或改良的品系。有利地,在某些实施方案中,创建基于动物的平台或模型以模拟人类疾病或病症。例如,猪与人类的相似性使猪成为对人类疾病建模的理想平台。与啮齿动物模型相比,猪模型的开发既昂贵又费时。在另一方面,猪和其他动物在遗传、解剖、生理和病理生理上与人类的相似性更高。本发明提供了一种用于靶向基因和基因组编辑、基因和基因组修饰以及基因和基因组调节的高效平台,以便在此类动物平台和模型使用。尽管道德标准阻碍了人类模型的开发,并且在许多情况下阻碍了基于非人类灵长类动物的模型的开发,但是本发明可用于体外系统,包括但不限于细胞培养系统、三维模型和系统,以及用以模拟、建模并研究人类的结构、器官和系统的遗传学、解剖学、生理学和病理生理学的类器官。所述平台和模型提供对单个或多个靶标的操纵。
在某些实施方案中,本发明适用于像Schomberg等人(FASEB Journal,2016年4月;30(1):增补版571.1)的疾病模型的疾病模型。为了对遗传性疾病1型神经纤维瘤病(NF-1)建模,Schomberg使用CRISPR-Cas9通过将CRISPR/Cas9组分胞质性微注射到猪胚胎中而在猪神经纤维蛋白1基因中引入突变。为Cas9靶向切割基因内外显子上游和下游的区靶向位点创建了CRISPR指导RNA(gRNA),并通过特定的单链寡脱氧核苷酸(ssODN)模板介导了修复,从而引入了2500bp的缺失。CRISPR-Cas系统还用于工程化具有特定NF-1突变或突变簇的猪,并且还可以用于工程化特异于或代表给定人类个体的突变。本发明类似地用于开发人类多基因疾病的动物模型,包括但不限于猪模型。根据本发明,使用多重指导物和任选地一个或多个模板同时靶向一个基因或多个基因中的多个遗传基因座。
本发明还适用于修饰其他动物诸如牛的SNP。Tan等人(Proc Natl Acad Sci U SA.2013年10月8日;110(41):16526-16531)使用质粒、rAAV和寡核苷酸模板扩增家畜基因编辑工具包,以包括转录激活因子样(TAL)效应核酸酶(TALEN)-和成簇的规律间隔的短回文重复序列(CRISPR)/Cas9-刺激性同源定向修复(HDR)。根据他们的方法将基因特异性指导RNA序列克隆到Church实验室指导RNA载体(Addgene ID:41824)中(Mali P等人(2013)RNA-Guided Human Genome Engineering via Cas9.Science 339(6121):823-826)。Cas9核酸酶通过共转染hCas9质粒(Addgene ID:41815)或由RCIScript-hCas9合成的mRNA来提供。此RCIScript-hCas9通过将来自hCas9质粒(涵盖hCas9 cDNA)的XbaI-AgeI片段亚克隆到RCIScript质粒中来构建。
Heo等人(Stem Cells Dev.2015年2月1日;24(3):393-402.doi:10.1089/scd.2014.0278.电子版2014年11月3日)报道了在牛基因组中使用牛多能细胞和成簇的规律间隔的短回文重复序列(CRISPR)/Cas9核酸酶的高效基因靶向。首先,Heo等人通过异位表达山中因子(yamanaka factor)并且进行GSK3β和MEK抑制剂(2i)处理来由牛体成纤维细胞生成诱导的多能干细胞(iPSC)。Heo等人观察到,这些牛iPSC在畸胎瘤的基因表达和发育潜力方面高度类似于天然多能干细胞。此外,对于牛NANOG基因座特异的CRISPR-Cas9核酸酶在牛iPSC和胚胎的牛基因组中显示高度有效的编辑。
提供了一种对诸如牛的动物执行并传播经济上重要的经济性状的性状的谱图分析,这些性状诸如胴体组成、胴体质量、母体和繁殖性状以及平均日增重。综合性谱图分析以DNA标记物(最常是单核苷酸多态性或SNP)的发现开始。在谱图之后的所有标记物是由研究机构的独立科学家发现的,这些研究机构包括大学、研究团体以及政府机构诸如USDA。然后在验证群体中分析标记物。使用代表各种生产环境和生物类型的多种资源种群,通常与来自牛肉产业的种畜、母犊牛、饲育场和/或包装部门的行业伙伴一起工作,以收集不能普遍获得的表型。牛基因组数据库是广泛可得的,参见例如NAGRP牛基因组协调程序(http://www.animalgenome.org/cattle/maps/db.html)。因此,本发明可以应用于靶向牛SNP。本领域技术人员可以利用用于靶向SNP的以上方案并且将它们应用于牛SNP,例如,如Tan等人或Heo等人所述的。
Qingjian Zou等人(Journal of Molecular Cell Biology,在2015年10月12日在线先行公布)证明通过靶向狗肌生成抑制蛋白(MSTN)基因(骨骼肌质量的负调节子)的第一外显子可增加狗的肌肉质量。首选,通过将sgRNA靶向MSTN与Cas9载体共转染到犬胚胎成纤维细胞(CEF)中来验证sgRNA的效率。之后,通过微注射具有正常形态学的胚胎以及Cas9mRNA和MSTN sgRNA的混合物并且将受精卵自身移植到同一母狗的输卵管来生成MSTN KO狗。与其野生型同窝出生母狗相比,敲除小狗在大腿上显示明显的肌肉表型。这也可以使用本文提供的AD官能化的CRISPR系统来进行。
家畜-猪
在一些实施方案中,家畜中的病毒靶标可以包括例如猪巨噬细胞上的猪CD163。CD163与PRRSv(猪繁殖与呼吸综合征病毒,它是一种动脉炎病毒)的感染(认为是通过病毒细胞侵入)相关联。PRRSv的感染,尤其是对猪肺泡巨噬细胞(可见于肺中)的感染导致先前不能治愈的猪综合征(“神秘猪病”或“蓝耳病”),使得家猪遭受(包括)繁殖障碍、体重减轻和高死亡率。常常可见机会性感染诸如流行性肺炎、脑膜炎和耳肿胀,这是因为通过巨噬细胞活性丧失会引起免疫缺陷。由于抗生素使用的增加和经济损失(估计每年660百万美元),这也具有重大的经济和环境影响。
如密苏里大学(University of Missouri)的Kristin M Whitworth和RandallPrather博士等人(Nature Biotech 3434,2015年12月07日在线公布)与Genus Plc合作报道的,使用CRISPR-Cas9靶向CD163,当编辑的猪的后代暴露于PRRSv时它们是有抗性的。使在CD163的外显子7中均具有突变的一个雄性起始者和一种雌性起始者繁殖产生后代。雄性起始者具有一个等位基因的外显子7中的11-bp的缺失,这导致结构域5中氨基酸45处的移码突变和错义翻译以及氨基酸64处的后一个提前终止密码子。另一个等位基因具有外显子7中的2-bp添加和在前内含子中的377-bp缺失,预测这引起结构域5的前49个氨基酸的表达,随后是在氨基酸85处的提前终止密码子。母猪在一个等位基因中具有7bp添加,预测该添加在翻译时表达结构域5的前48个氨基酸,随后是在氨基酸70处的提前终止密码子。母猪的另一个等位基因是不可扩增的。预测选定的后代是无效动物(CD163-/-),即CD163敲除。
因此,在一些实施方案中,猪肺泡巨噬细胞可以被CRISPR蛋白靶向。在一些实施方案中,猪CD163可以被CRISPR蛋白靶向。在一些实施方案中,猪CD163可以通过诱导DSB或通过插入或缺失来敲除,例如外显子7的靶向缺失或修饰,包括以上所述的那些缺失或修饰中的一种或多种,或者在该基因的其他区域中,例如外显子5的缺失或修饰。
还设想了编辑的猪及其子代,例如CD163敲除猪。这可以是出于家畜、育种或建模目的(即,猪模型)。还提供了包含基因敲除的精液。
CD163是富含半胱氨酸清道夫受体(SRCR)超家族的成员。基于体外研究,蛋白质的SRCR结构域5是负责启封和释放病毒基因组的结构域。这样,也可以靶向SRCR超家族的其他成员,以便评定对其他病毒的抗性。PRRSV还是哺乳动物动脉炎病毒组的成员,所述病毒组还包括鼠乳酸脱氢酶病毒、猴出血热病毒和马动脉炎病毒。动脉炎病毒享有重要的发病机理特性,包括巨噬细胞向性和引起严重疾病和持续感染二者的能力。因此,可以例如通过猪CD163或其在其他种类中的同系物来提供动脉炎病毒以及特别地鼠乳酸脱氢酶病毒、猴出血热病毒和马动脉炎病毒,并且还提供鼠、猴和马的模型以及敲除。
实际上,此方法可以扩展到引起其他家畜疾病且可以传播到人类的病毒或细菌,诸如猪流感病毒(SIV)株,包括丙型流感和称为H1N1、H1N2、H2N1、H3N1、H3N2以及H2N3的甲型流感亚型,以及以上提及的肺炎、脑膜炎和水肿。
在一些实施方案中,本文所述的AD官能化的CRISPR系统可以用于遗传性修饰猪基因组以使一个或多个猪内源性逆转录病毒(PERV)基因座失活,从而促进猪向人类异种移植的临床应用。参见Yang等人,Science 350(6264):1101-1104(2015),该文献以引用方式整体并入本文。在一些实施方案中,本文所述的AD官能化的CRISPR系统可以用于产生不包含任何活性猪内源性逆转录病毒(PERV)基因座的遗传修饰的猪。
使用AD官能化的组合物进行治疗性靶向
如将显而易见的,设想的是AD官能化的CRISPR系统可以用于靶向任何目标多核苷酸序列。本发明提供了一种非天然存在的或工程化的组合物、或编码所述组合物的组分的一种或多种多核苷酸、或包含编码所述组合物的组分的一种或多种多核苷酸的载体或递送系统,其用于体内、离体或体外修饰靶细胞,并且所述修饰可以这样一种方式实施:改变细胞,使得一旦被修饰,CRISPR修饰的细胞的子代或细胞系保留改变的表型。修饰的细胞和子代可以是多细胞生物体的一部分,诸如在将CRISPR系统离体或体内应用于所需细胞类型的情况下的植物或动物。CRISPR发明可以是一种治疗性治疗方法。治疗性治疗方法可以包括基因或基因组编辑,或基因疗法。可以使用本发明的组合物和方法治疗的其他疾病在ClinVar数据库中进一步公开(Landrum等人,Nucleic Acids Res.2016年1月4日;44(D1):D862-8;Landrum等人,Nucleic Acids Res.2014年1月1日;42(1):D980-5;http://www.ncbi.nlm.nih.gov/books/NBK174587/)。
过继细胞疗法
本发明还考虑使用本文所述的AD官能化的CRISPR系统来修饰用于过继疗法的细胞。因此,本发明的方面涉及过继性转移对于选定抗原诸如肿瘤相关抗原特异的免疫系统细胞诸如T细胞(参见Maus等人,2014,Adoptive Immunotherapy for Cancer or Viruses,Annual Review of Immunology,第32卷:189-225;Rosenberg和Restifo,2015,Adoptivecell transfer as personalized immunotherapy for human cancer,Science第348卷,第6230期,第62-68页;以及Restifo等人,2015,Adoptive immunotherapy for cancer:harnessing the T cell response.Nat.Rev.Immunol.12(4):269-281;以及Jenson和Riddell,2014,Design and implementation of adoptive therapy with chimericantigen receptor-modified T cells.Immunol Rev.257(1):127-144)。可以例如采用各种策略来通过改变T细胞受体(TCR)的特异性,例如通过引入具有选定的肽特异性的新TCRα和β链来遗传性修饰T细胞(参见美国专利号8,697,854;PCT专利公布:WO2003020763、WO2004033685、WO2004044004、WO2005114215、WO2006000830、WO2008038002、WO2008039818、WO2004074322、WO2005113595、WO2006125962、WO2013166321、WO2013039889、WO2014018863、WO2014083173;美国专利号8,088,379)。
作为TCR修饰的替代方案或者除TCR修饰之外,可以使用嵌合抗原受体(CAR),以便生成对于选定靶标诸如恶性肿瘤细胞特异的免疫反应细胞诸如T细胞,其中已经描述了多种多样的受体嵌合构建体(参见美国专利号5,843,728;5,851,828;5,912,170;6,004,811;6,284,240;6,392,013;6,410,014;6,753,162;8,211,422;以及PCT公布WO9215322)。替代CAR构建体可以被表征为属于连续世代。第一代CAR典型地由对于抗原特异的抗体单链可变片段组成,例如包括连接至特异性抗体的VH的VL,通过柔性接头连接,例如通过CD8α铰链结构域和CD8α跨膜结构域,连接至CD3ζ或FcRγ的跨膜和细胞内信号传导结构域(scFv-CD3ζ或scFv-FcRγ;参见美国专利号7,741,465;美国专利号5,912,172;美国专利号5,906,936)。第二代CAR并入一种或多种共刺激分子的细胞内结构域,诸如内结构域内的CD28、OX40(CD134)或4-1BB(CD137)(例如scFv-CD28/OX40/4-1BB-CD3ζ;参见美国专利号8,911,993;8,916,381;8,975,071;9,101,584;9,102,760;9,102,761)。第三代CAR包括共刺激内结构域的组合,诸如CD3ζ-链、CD97、GDI la-CD18、CD2、ICOS、CD27、CD154、CDS、OX40、4-1BB或CD28信号传导结构域(例如scFv-CD28-4-1BB-CD3ζ或scFv-CD28-OX40-CD3ζ;参见美国专利号8,906,682;美国专利号8,399,645;美国专利号5,686,281;PCT公布号WO2014134165;PCT公布号WO2012079000)。或者,可以通过在抗原特异性T细胞中表达CAR来协调共刺激,所述抗原特异性T细胞被选择以便在伴随共刺激的情况下例如由专职抗原呈递细胞上的抗原接合其天然αβTCR之后得以激活并扩增。此外,另外的工程化受体可以被提供在免疫反应细胞上,例如以提高T细胞攻击的靶向并且/或者最小化副作用。
可以使用替代技术转化免疫反应靶细胞,所述替代技术诸如原生质体融合、脂转染、转染或电穿孔。可以使用多种多样的载体,诸如逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、质粒或转座子(诸如睡美人易位子)(参见美国专利号6,489,458;7,148,203;7,160,682;7,985,739;8,227,432),这些载体可以用于例如使用通过CD3ζ和CD28或CD137传导信号的第2代抗原特异性CAR来引入CAR。病毒载体可以例如包括基于HIV、SV40、EBV、HSV或BPV的载体。
被靶向转化的细胞可以例如包括T细胞、自然杀伤细胞(NK)、细胞毒性T淋巴细胞(CTL)、调节T细胞、人类胚胎干细胞、肿瘤浸润淋巴细胞(TIL)或淋巴样细胞可以由其分化的多能干细胞。表达所需CAR的T细胞可以例如通过与γ-辐射激活和增殖细胞(AaPC)共培养来选择,这些激活和增殖细胞共表达癌症抗原和共刺激分子。工程化CAR T细胞可以例如通过在可溶性因子诸如IL-2和IL-21存在下在AaPC上共培养来扩增。可以例如执行此扩增以提供记忆CAR+T细胞(这些细胞可以例如通过非酶数字阵列和/或多板块(multi-panel)流式细胞术来测定)。以这种方式,可以提供具有针对携带抗原的肿瘤的特异性细胞毒性活性的CAR T细胞(任选地与所需趋化因子诸如干扰素-γ的产生相结合)。这种类型的CAR T细胞例如可以用于动物模型中,例如以威慑肿瘤异种移植物。
诸如上述方法的方法可以适于提供例如通过施用有效量的免疫反应细胞来治疗患有诸如瘤形成的疾病的患者并且/或者增加所述患者的存活的方法,所述免疫反应细胞包含结合选定抗原的抗原识别受体,其中所述结合激活免疫反应细胞,从而治疗或预防所述疾病(诸如瘤形成、病原体感染、自身免疫病症或同种异体移植反应)。在具有或不具有淋巴细胞耗尽过程的情况下,例如在使用环磷酰胺的情况下,CAR T细胞疗法的给药可以例如涉及施用106至109个细胞/kg。
在一个实施方案中,可以向经受免疫阻遏治疗的患者施用所述治疗。细胞或细胞群体可以被制成由于编码至少一种免疫阻遏剂的受体的基因的失活而抵抗此免疫阻遏剂。不受理论的束缚,免疫阻遏治疗应有助于在患者内选择和扩增根据本发明的免疫反应细胞或T细胞。
可以采用任何常规方式执行根据本发明的细胞或细胞群体的施用,这些方式包括通过雾化吸入、注射、摄取、输血、植入或移植。可以向患者皮下、真皮内、瘤内、节点内、髓内、肌内、通过静脉内注射或淋巴管内注射、或者腹膜内施用所述细胞或细胞群体。在一个实施方案中,本发明的细胞组合物优选地通过静脉内注射来施用。
所述细胞或细胞群体的施用可以由104-109个细胞/kg体重、优选地105至106个细胞/kg体重(包括这些范围内细胞数目的所有整数值)的施用组成。在具有或不具有淋巴细胞耗尽过程的情况下,例如在使用环磷酰胺的情况下,CAR T细胞疗法的给药可以例如涉及施用106至109个细胞/kg。细胞或细胞群体可以按一个或多个剂量施用。在另一个实施方案中,有效量的细胞作为单一剂量施用。在另一个实施方案中,有效量的细胞作为多于一个剂量在一段时间内施用。施用的时间在管理医师的判断内并且取决于患者的临床状况。细胞或细胞群体可以从任何来源诸如血库或供体获得。虽然个体需要不同,但是针对特定疾病或疾患的给定细胞类型的有效量的最佳范围的确定在本领域技术人员技能之内。有效量是指提供治疗或预防益处的量。施用的剂量将取决于接受者的年龄、健康和体重、同期治疗(如果有的话)的类型、治疗的频率以及所需的作用性质。
在另一个实施方案中,肠胃外施用有效量的细胞或包含那些细胞的组合物。施用可以是静脉内施用。可以通过在肿瘤内注射直接进行施用。
为了防止可能的不良反应,可以用转基因安全开关装备工程化的免疫反应细胞,所述转基因安全开关呈致使这些细胞易于暴露于特定信号的转基因形式。例如,单纯疱疹病毒胸苷激酶(TK)可以这种方式使用,例如通过在干细胞移植之后引入到用作供体淋巴细胞输注的同种异体T淋巴细胞中(Greco等人,Improving the safety of cell therapywith the TK-suicide gene.Front.Pharmacol.2015;6:95)。在此类细胞中,施用核苷前药诸如更昔洛韦或阿昔洛韦引起细胞死亡。替代安全开关构建体包括诱导型半胱天冬酶9,其例如通过施用使两个非功能性icasp9分子连接在一起形成活性酶的小分子二聚体来触发。已经描述了用于实施细胞增殖控制的多种多样的替代方法(参见美国专利公布号20130071414;PCT专利公布WO2011146862;PCT专利公布WO2014011987;PCT专利公布WO2013040371;Zhou等人BLOOD,2014,123/25:3895-3905;Di Stasi等人,The New EnglandJournal of Medicine 2011;365:1673-1683;Sadelain M,The New England Journal ofMedicine 2011;365:1735-173;Ramos等人,Stem Cells 28(6):1107-15(2010))。
在过继疗法的另一个改进方案中,如本文所述的AD官能化的CRISPR-Cas系统进行的基因组编辑可以用于使免疫反应细胞适于替代实施方式,例如提供编辑的CAR T细胞(参见Poirot等人,2015,Multiplex genome edited T-cell manufacturing platform for"off-the-shelf"adoptive T-cell immunotherapies,Cancer Res 75(18):3853)。例如,免疫反应细胞可以被编辑为缺失一些或所有类别的HLA II型和/或I型分子的表达,或者敲除可以抑制所需免疫反应的选定基因诸如PD1基因。
可以使用如本文所述的AD官能化的CRISPR系统来编辑细胞。可以通过本文所述的任何方法将AD官能化的CRISPR系统递送至免疫细胞。在优选的实施方案中,将细胞离体编辑并转移至有需要的受试者。可以编辑免疫反应细胞、CAR-T细胞或用于过继细胞转移的任何细胞。可以进行编辑以消除潜在的同种异体反应性T-细胞受体(TCR)、破坏化学治疗剂的靶标、阻断免疫校验点、激活T细胞并且/或者增加功能耗竭或功能障碍的CD8+T-细胞的分化和/或增殖(参见PCT专利公布:WO2013176915、WO2014059173、WO2014172606、WO2014184744和WO2014191128)。编辑可以导致基因失活。
T细胞受体(TCR)是响应于抗原呈递而参与激活T细胞的细胞表面受体。TCR通常是由组装形成异源二聚体的两条链α和β形成,并且与CD3-转导亚基缔合形成存在于细胞表面的T细胞受体复合物。TCR的每条α和β链由免疫球蛋白样N端可变区(V)和恒定(C)区、疏水性跨膜结构域以及短胞质区组成。如对于免疫球蛋白分子,α和β链的可变区是通过V(D)J重组而生成,从而在T细胞群体内形成多种抗原特异性。然而,与识别完整抗原的免疫球蛋白相比,T细胞通过与MHC分子缔合的加工肽片段来激活,从而将额外维度引入到由T细胞进行的抗原识别中,这被称为MHC限制。通过T细胞受体识别供体与受体之间的MHC差异导致T细胞增殖和移植物抗宿主疾病(GVHD)的潜在发展。TCRα或TCRβ的失活可以导致TCR从T细胞表面消除,从而阻止了同种抗原的识别并因此产生GVHD。然而,TCR破坏通常导致CD3信号传导组分的消除并且改变另外的T细胞扩增的方式。
同种异体细胞被宿主免疫系统迅速排斥。已证明存在于非辐射血液产品中的同种异体淋巴细胞将持续不超过5至6天(Boni,Muranski等人2008 Blood 1;112(12):4746-54)。因此,为了防止同种异体细胞排斥,通常必须在一定程度上阻遏宿主的免疫系统。然而,在过继细胞转移的情况下,使用免疫阻遏药物也对引入的治疗性T细胞具有有害作用。因此,为了在这些情况下有效使用过继免疫治疗方法,引入的细胞将需要抵抗免疫阻遏治疗。因此,在特定实施方案中,本发明还包括优选地通过使编码免疫阻遏剂的靶标的至少一种基因失活来修饰T细胞以使其抵抗免疫阻遏剂的步骤。免疫阻遏剂是一种通过若干作用机制之一阻遏免疫功能的物质。免疫阻遏剂可以是但不限于钙调磷酸酶抑制剂、雷帕霉素的靶标、白介素-2受体α-链阻断剂、肌苷单磷酸脱氢酶的抑制剂、二氢叶酸还原酶的抑制剂、皮质类固醇或免疫阻遏抗代谢物。本发明允许通过使T细胞中的免疫阻遏剂的靶标失活来对用于免疫疗法的T细胞赋予免疫阻遏抗性。作为非限制性实例,免疫阻遏剂的靶标可以是免疫阻遏剂的受体,诸如:CD52、糖皮质激素受体(GR)、FKBP家族基因成员以及亲环蛋白家族基因成员。
免疫检验点是减慢或停止免疫反应并且防止因免疫细胞的不受控活性所致的过度组织损害的抑制性途径。在某些实施方案中,所靶向的免疫检查点是程序性死亡-1(PD-1或CD279)基因(PDCD1)。在其他实施方案中,所靶向的免疫检查点是细胞毒性T-淋巴细胞相关抗原(CTLA-4)。在其他实施方案中,所靶向的免疫检查点是CD28和CTLA4 Ig超家族的另一个成员,诸如BTLA、LAG3、ICOS、PDL1或KIR。在另外的其他实施方案中,所靶向的免疫检查点是TNFR超家族的成员,诸如CD40、OX40、CD137、GITR、CD27或TIM-3。
其他免疫检验点包括含有Src同源2结构域的蛋白酪氨酸磷酸酶1(SHP-1)(WatsonHA等人,SHP-1:the next checkpoint target for cancer immunotherapy?Biochem SocTrans.2016年4月15日;44(2):356-62)。SHP-1是一种广泛表达的抑制性蛋白酪氨酸磷酸酶(PTP)。在T细胞中,它是抗原依赖性激活和增殖的负调节子。它是一种胞质蛋白,并且因此不适于抗体介导的疗法,但是它在激活和增殖中的作用使得它成为过继转移策略中用于遗传操纵的有吸引力的靶标,诸如嵌合抗原受体(CAR)T细胞。免疫检查点还可以包括具有Ig和ITIM结构域的T细胞免疫受体(TIGIT/Vstm3/WUCAM/VSIG9)和VISTA(Le Mercier I等人,(2015)Beyond CTLA-4 and PD-1,the generation Z of negative checkpointregulators.Front.Immunol.6:418)。
WO2014172606涉及使用MT1和/或MT1抑制剂来增加耗竭的CD8+ T细胞的增殖和/或活性并且减少CD8+ T细胞耗竭(例如,减少功能耗竭或不反应的CD8+免疫细胞)。在某些实施方案中,在过继性转移的T细胞中通过基因编辑靶向金属硫蛋白。
在某些实施方案中,基因编辑的靶标可以是涉及免疫检验点蛋白的表达的至少一个靶向基因座。此类靶标可以包括但不限于CTLA4、PPP2CA、PPP2CB、PTPN6、PTPN22、PDCD1、ICOS(CD278)、PDL1、KIR、LAG3、HAVCR2、BTLA、CD160、TIGIT、CD96、CRTAM、LAIR1、SIGLEC7、SIGLEC9、CD244(2B4)、TNFRSF10B、TNFRSF10A、CASP8、CASP10、CASP3、CASP6、CASP7、FADD、FAS、TGFBRII、TGFRBRI、SMAD2、SMAD3、SMAD4、SMAD10、SKI、SKIL、TGIF1、IL10RA、IL10RB、HMOX2、IL6R、IL6ST、EIF2AK4、CSK、PAG1、SIT1、FOXP3、PRDM1、BATF、VISTA、GUCY1A2、GUCY1A3、GUCY1B2、GUCY1B3、MT1、MT2、CD40、OX40、CD137、GITR、CD27、SHP-1或TIM-3。在优选的实施方案中,靶向涉及PD-1或CTLA-4基因的表达的基因座。在其他优选的实施方案中,靶向基因的组合,诸如但不限于PD-1和TIGIT。
在其他实施方案中,编辑至少两种基因。基因对可以包括但不限于PD1和TCRα、PD1和TCRβ、CTLA-4和TCRα、CTLA-4和TCRβ、LAG3和TCRα、LAG3和TCRβ、Tim3和TCRα、Tim3和TCRβ、BTLA和TCRα、BTLA和TCRβ、BY55和TCRα、BY55和TCRβ、TIGIT和TCRα、TIGIT和TCRβ、B7H5和TCRα、B7H5和TCRβ、LAIR1和TCRα、LAIR1和TCRβ、SIGLEC10和TCRα、SIGLEC10和TCRβ、2B4和TCRα、2B4和TCRβ。
无论是在T细胞的遗传修饰之前还是之后,T细胞都可以通常使用如例如以下文献所述的方法来激活并扩增:美国专利6,352,694;6,534,055;6,905,680;5,858,358;6,887,466;6,905,681;7,144,575;7,232,566;7,175,843;5,883,223;6,905,874;6,797,514;6,867,041;以及7,572,631。T细胞可以在体外或体内扩增。
本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学以及重组DNA领域中已知的技术,这些技术在本领域技能范围之内。参见MOLECULAR CLONING:A LABORATORY MANUAL,第2版(1989)(Sambrook、Fritsch和Maniatis);MOLECULAR CLONING:A LABORATORY MANUAL,第4版(2012)(Green和Sambrook);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(1987)(F.M.Ausubel等人编辑);METHODS INENZYMOLOGY系列(Academic Press,Inc.);PCR 2:APRACTICAL APPROACH(1995)(M.J.MacPherson、B.D.Hames和G.R.Taylor编辑);ANTIBODIES,A LABORATORY MANUAL(1988)(Harlow和Lane编辑);ANTIBODIES A LABORATORY MANUAL,第2版(2013)(E.A.Greenfield编辑);以及ANIMAL CELL CULTURE(1987)(R.I.Freshney编辑)。
使用CRISPR系统进行的筛查/诊断/治疗
癌症
本发明的方法和组合物可以用于鉴定与药物耐受性和疾病细胞持久性相关联的细胞状态、组分和机制。Terai等人(Cancer Research,19-Dec-2017,doi:10.1158/0008-5472.CAN-17-1904)报道了用厄洛替尼+THZ1(CDK7/12抑制剂)组合疗法治疗的EGFR依赖性肺癌PC9细胞中的全基因组CRISPR/Cas9增强子/阻遏因子筛选,以鉴定增强厄洛替尼/THZ1协同作用的多种基因,以及阻遏协同作用的组分和途径。Wang等人(Cell Rep.2017年2月7日;18(6):1543-1557.doi:10.1016/j.celrep.2017.01.031.;Krall等人,Elife.2017年2月1日;6.pii:e18970.doi:10.7554/eLife.18970)报道了使用全基因组CRISPR功能丧失筛选来鉴定对MAPK抑制剂具有抗性的介体。Donovan等人(PL oS One.2017年1月24日;12(1):e0170445.doi:10.1371/journal.pone.0170445.eCollection 2017)使用CRISPR介导的诱变方法来鉴定MA PK信号传导途径基因的新颖功能获得和耐药性等位基因。Wang等人(Cell.2017年2月23日;168(5):890-903.e15.doi:10.1016/j.cell.2017.01.013.电子版2017年2月2日)使用全基因组CRISPR筛选来鉴定基因网络以及与致癌Ras的合成致死相互作用。Chow等人(Nat Neuros ci.2017年10月;20(10):1329-1341.doi:10.1038/nn.4620.电子版2017年8月14日)开发了在胶质母细胞瘤中的腺相关病毒介导的自发遗传CRISPR筛选技术,以鉴定胶质母细胞瘤中的功能阻遏因子。Xue等人(Nature.2014年10月16日;514(7522):380-4.doi:10.1038/nature13589.电子版2014年8月6日)在小鼠肝脏中采用CRISPR介导的癌症基因直接突变。
Chen等人(J Clin Invest.2017年12月4日pii:90793.doi:10.1172/JCI90793.[印刷前电子版])使用基于CRISPR的筛选来鉴定MYCN扩增的神经母细胞瘤对EZH2的依赖性。支持在患有MYCN扩增的神经母细胞瘤的患者中进行EZH2抑制剂测试。
Vijai等人(Cancer Discov.2016年11月;6(11):1267-1275.电子版2016年9月21日)报道了使用CRISPR在乳腺上皮细胞系中生成杂合突变以评定乳腺癌风险。
Chakraborty等人(Sci Transl Med.2017年7月12日;9(398).pii:eaal5272.doi:10.1126/scitranslmed.aal5272)使用基于CRISPR的筛选来鉴定作为治疗透明细胞肾细胞癌的潜在靶标的EZH1
代谢性疾病
本发明的方法和组合物在治疗肝脏遗传性代谢性疾病方面提供优于常规基因治疗方法的优势,所述疾病包括但不限于家族性高胆固醇血症、血友病、鸟氨酸转氨甲酰酶缺乏症、1型遗传性酪氨酸血症和α-1抗胰蛋白酶缺乏症。参见Bryson等人,YaleJ.Biol.Med.90(4):553-566,19-Dec-2017。
Bompada等人(Int J Biochem Cell Biol.2016年12月;81(Pt A):82-91.doi:10.1016/j.biocel.2016.10.022.电子版2016年10月29日)描述了使用CRISPR来敲除胰腺β细胞中的组蛋白乙酰转移酶,以证明组蛋白乙酰化是葡萄糖诱导的TXNIP基因表达增加并且因此是糖毒性诱导的细胞凋亡的关键调节子。
肌肉
Provenzano等人(Mol Ther Nucleic Acids.9:337-348.2017年12月15日;.doi:10.1016/j.omtn.2017.10.006.电子版2017年10月14日)报道了来自1型肌强直性营养不良患者的肌原细胞中的CRISPR/Cas9介导的CTG扩增缺失和永久回复至正常表型。本发明的方法和组合物类似地适用于核苷酸重复序列病症,不限于CTG扩增。Tabebordbar等人(2016年1月22日;351(6271):407-411.doi:10.1126/science.aad5177.电子版2015年12月31日)报道了使用CRISPR来编辑Dmd外显子23基因座,以校正DMD中的破坏性突变。Tabebordbar表明,在新生儿和成年小鼠中可编程CRISPR复合物可以局部地和全身性地递送至终末分化的骨骼肌纤维和心肌细胞以及肌肉卫星细胞,在细胞中它们介导靶向基因修饰,恢复肌营养不良蛋白表达并且部分地恢复营养不良肌肉的功能缺陷。另参见Nelson等人,(Science.2016年1月22日;351(6271):403-7.doi:10.1126/science.aad5143.电子版2015年12月31日)。
感染性疾病
Sidik等人(Cell.2016年9月8日;166(6):1423-1435.e12.doi:10.1016/j.cell.2016.08.019.电子版2016年9月2日)和Patel等人(Nature.2017年8月31日;548(7669):537-542.doi:10.1038/nature23477.电子版2017年8月7日)描述了弓形虫中的CRISPR筛选和抗寄生虫干预措施的扩展。
存在若干关于全基因组CRISPR筛选的报告,旨在鉴定宿主-病原体相互作用的基础组分和过程。实例包括Blondel等人(Cell Host Microbe.2016年8月10日;20(2):226-37.doi:10.1016/j.chom.2016.06.010.电子版2016年7月21日);Shapiro等人(NatMicrobiol.2018年1月;3(1):73-82.doi:10.1038/s41564-017-0043-0.电子版2017年10月23日)和Park等人(Nat Genet.2017年2月;49(2):193-203.doi:10.1038/ng.3741.电子版2016年12月19日)。
Ma等人(Cell Host Microbe.2017年5月10日;21(5):580-591.e7.doi:10.1016/j.chom.2017.04.005)采用全基因组CRISPR功能丧失筛选来鉴定治疗性干预的病毒转化驱动的合成致死靶标。
心血管疾病
CRISPR系统可以用作鉴定与血管疾病相关联的基因或遗传变体的工具。这对于鉴定潜在的治疗或预防靶标很有用。Xu等人(Atherosclerosis,2017年9月21日pii:S0021-9150(17)31265-0.doi:10.1016/j.atherosclerosis.2017.08.031.[印刷前电子版])报道了使用CRISPR来敲除ANGPTL3基因,以确认ANGPTL3在调节LDL-C血浆水平中的作用。Gupta等人,(Cell.2017年7月27日;170(3):522-533.e15.doi:10.1016/j.cell.2017.06.049)报道了使用CRISPR来编辑干细胞来源的内皮细胞以鉴定与血管疾病相关联的遗传变体。Beaudoin等人,(Arterioscler Thromb Vasc Biol.2015年6月;35(6):1472-1479.doi:10.1161/ATVBAHA.115.305534。电子版2015年4月2日)报道了使用CRISPR基因组编辑来破坏转录因子MEF2在该基因座处的结合。这为探索血管内皮中的PHACTR1功能如何影响冠状动脉疾病奠定了基础。Pashos等人(Cell Stem Cell.2017年4月6日;20(4):558-570.e10.doi:10.1016/j.stem.2017.03.017.)报道了使用CRISPR技术来靶向多能干细胞和肝细胞样细胞以鉴定功能性变体和脂质功能性基因。
神经系统疾病
本发明提供了用于研究和治疗神经系统疾病和病症的方法和组合物。Nakayama等人,(Am J Hum Genet.2015年5月7日;96(5):709-19.doi:10.1016/j.ajhg.2015.03.003.电子版2015年4月9日)报道了使用CRISPR来研究PYCR2在人类CNS发育中的作用,并且鉴定小头畸形和髓鞘形成减少的潜在靶标。Swiech等人(Nat Biotechnol.2015年1月;33(1):102-6.doi:10.1038/nbt.3055.电子版2014年10月19日)报道了使用CRISPR来在体内靶向成年小鼠脑中的单个(Mecp2)以及多个基因(Dnmt1、Dnmt3a和Dnmt3b)。Shin等人(Hum MolGenet.2016年10月15日;25(20):4566-4576.doi:10.1093/hmg/ddw286)描述了使用CRISPR来使亨廷顿氏病(Huntingon’s disease)突变失活。Platt等人(Cell Rep.2017年4月11日;19(2):335-350.doi:10.1016/j.celrep.2017.03.052)报道了使用CRISPR敲入小鼠来鉴定Chd8在自闭症谱系障碍中的作用。Seo等人(J Neurosci.2017年10月11日;37(41):9917-9924.doi:10.1523/JNEUROSCI.0621-17.2017.电子版2017年9月14日)描述了使用CRISPR来生成神经变性病症的模型。Petersen等人(Neuron.2017年12月6日;96(5):1003-1012.e7.doi:10.1016/j.neuron.2017.10.008.电子版2017年11月2日)展示了CRISPR敲除少突胶质祖细胞中的激活素A受体I型,以鉴定具有髓鞘再生障碍的疾病的潜在靶标。本发明的方法和组合物是类似地可适用的。
CRISPR技术的其他应用
Renneville等人(Blood.2015年10月15日;126(16):1930-9.doi:10.1182/blood-2015-06-649087.电子版2015年8月28日)报道了使用CRISPR来研究EHMT1和EMHT2在胎儿血红蛋白表达中的作用,并且鉴定SCD的新颖治疗靶标。
Tothova等人(Cell Stem Cell.2017年10月5日;21(4):547-555.e8.doi:10.1016/j.stem.2017.07.015)报道了在造血干细胞和祖细胞中使用CRISPR以便产生人类骨髓疾病模型。
Giani等人(Cell Stem Cell.2016年1月7日;18(1):73-78.doi:10.1016/j.stem.2015.09.015.电子版2015年10月22日)报道说,通过在人类多能干细胞中进行CRISPR/Cas9基因组编辑来使SH2B3失活,可以增强红系细胞的扩增并保持分化。
Wakabayashi等人(Proc Natl Acad Sci U S A.2016年4月19日;113(16):4434-9.doi:10.1073/pnas.1521754113.电子版2016年4月4日)采用CRISPR来深入了解GATA1转录活性,并且研究人类红系病症中非编码变体的病原性。
Mandal等人(Cell Stem Cell.2014年11月6日;15(5):643-52.doi:10.1016/j.stem.2014.10.004.电子版2014年11月6日)描述了CRISPR/Cas9靶向原代人类CD4+ T细胞和CD34+造血干细胞和祖细胞(HSPC)中的两个临床相关基因,即B2M和CCR5。
Polfus等人(Am J Hum Genet.2016年9月1日;99(3):785.doi:10.1016/j.ajhg.2016.08.002.电子版2016年9月1日)在原代人类造血干细胞和祖细胞中使用CRISPR来编辑造血细胞系并进行后续靶向敲低实验,并且研究GFI1B变体在人类造血中的作用。
Najm等人(Nat Biotechnol.2017年12月18.doi:10.1038/nbt.4048.[印刷前电子版])报道了使用具有一对SaCas9和SpCas9的CRISPR复合物来实现双重靶向以生成高复杂度的合并的双敲除文库,从而鉴定跨多种细胞类型的合成致死和缓冲基因对,包括MAPK途径基因和凋亡基因。
Manguso等人(Nature.2017年7月27日;547(7664):413-418.doi:10.1038/nature23270.电子版2017年7月19日.)报道了使用CRISPR筛选来识别并且/或者确认新的免疫疗法靶标。另参见Roland等人(Proc Natl Acad Sci U S A.2017年6月20日;114(25):6581-6586.doi:10.1073/pnas.1701263114.电子版2017年6月12日.);Erb等人(Nature.2017年3月9日;543(7644):270-274.doi:10.1038/nature21688.电子版2017年3月1日.);Hong等人,(Nat Commun.2016年6月22日;7:11987.doi:10.1038/ncomms11987);Fei等人,(Proc Natl Acad Sci U S A.2017年6月27日;114(26):E5207-E5215.doi:10.1073/pnas.1617467114.电子版2017年6月13日.);Zhang等人,(Cancer Discov.2017年9月29日.doi:10.1158/2159-8290.CD-17-0532.[印刷前电子版])。
Joung等人(Nature.2017年8月17日;548(7667):343-346.doi:10.1038/nature23451.电子版2017年8月9日.)报道了使用全基因组筛选来分析长的非编码RNA(lncRNA);另参见Zhu等人,(Nat Biotechnol.2016年12月;34(12):1279-1286.doi:10.1038/nbt.3715.电子版2016年10月31日);Sanjana等人,(Science.2016年9月30日;353(6307):1545-1549)。
Barrow等人(Mol Cell.2016年10月6日;64(1):163-175.doi:10.1016/j.molcel.2016.08.023.电子版2016年9月22日.)报道了使用全基因组CRISPR筛选来寻找线粒体疾病的治疗靶标。另参见Vafai等人,(PLoS One.2016年9月13日;11(9):e0162686.doi:10.1371/journal.pone.0162686.eCollection 2016)。
Guo等人(Elife.(2017年12月5日;6.pii:e29329.doi:10.7554/eLife.29329)报道了使用CRISPR来靶向人类软骨细胞以阐明人类生长的生物机制。
Ramanan等人(Sci Rep.2015年6月2日;5:10833.doi:10.1038/srep10833)报道了使用CRISPR来靶向并且切割HBV基因组中的保守区。
疾病相关突变和病原性SNP的校正
在一方面,本文所述的发明提供了用于修饰靶基因座处的腺苷残基的方法,目的是补救并且/或者预防由或可能由G至A或C至T点突变或病原性单核苷酸多态性(SNP)引起的疾病状况。
影响脑和中枢神经系统的疾病
与影响脑和中枢神经系统的各种疾病相关联的病原性G至A或C至T突变/SNP已在ClinVar数据库中报告并在表A中公开,这些疾病包括但不限于阿尔茨海默病、帕金森病、自闭症、肌萎缩性侧索硬化症(ALS)、精神分裂症、肾上腺脑白质营养不良、艾卡尔迪-Goutieres综合征(Aicardi Goutieres syndrome)、法布里病(Fabry disease)、莱施-奈恩综合征(Lesch-Nyhan syndrome)和门克斯病(Menkes Disease)。因此,本发明的一个方面涉及一种用于校正与如以下所论述的这些疾病中的任一种相关联的一种或多种病原性G至A或C至T突变/SNP的方法。
Nakayama等人,(Am J Hum Genet.2015年5月7日;96(5):709-19.doi:10.1016/j.ajhg.2015.03.003.电子版2015年4月9日)报道了使用CRISPR来研究PYCR2在人类CNS发育中的作用,并且鉴定小头畸形和髓鞘形成减少的潜在靶标。Swiech等人(NatBiotechnol.2015年1月;33(1):102-6.doi:10.1038/nbt.3055.电子版2014年10月19日)报道了使用CRISPR来在体内靶向成年小鼠脑中的单个(Mecp2)以及多个基因(Dnmt1、Dnmt3a和Dnmt3b)。Shin等人(Hum Mol Genet.2016年10月15日;25(20):4566-4576.doi:10.1093/hmg/ddw286)描述了使用CRISPR来使亨廷顿氏病(Huntingon’s disease)突变失活。
阿尔茨海默病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与阿尔茨海默病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自PSEN1、PSEN2和APP的至少一种基因中,至少包括以下各项:
NM_000021.3(PSEN1):c.796G>A(p.Gly266Ser)
NM_000484.3(APP):c.2017G>A(p.Ala673Thr)
NM_000484.3(APP):c.2149G>A(p.Val717Ile)
NM_000484.3(APP):c.2137G>A(p.Ala713Thr)
NM_000484.3(APP):c.2143G>A(p.Val715Met)
NM_000484.3(APP):c.2141C>T(p.Thr714Ile)
NM_000021.3(PSEN1):c.438G>A(p.Met146Ile)
NM_000021.3(PSEN1):c.1229G>A(p.Cys410Tyr)
NM_000021.3(PSEN1):c.487C>T(p.His163Tyr)
NM_000021.3(PSEN1):c.799C>T(p.Pro267Ser)
NM_000021.3(PSEN1):c.236C>T(p.Ala79Val)
NM_000021.3(PSEN1):c.509C>T(p.Ser170Phe)
NM_000447.2(PSEN2):c.1289C>T(p.Thr430Met)
NM_000447.2(PSEN2):c.717G>A(p.Met239Ile)
NM_000447.2(PSEN2):c.254C>T(p.Ala85Val)
NM_000021.3(PSEN1):c.806G>A(p.Arg269His)
NM_000484.3(APP):c.2018C>T(p.Ala673Val)。
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自PSEN1、PSEN2和APP的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防阿尔茨海默病的方法。
帕金森病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与帕金森病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,在一些实施方案中,病原性突变/SNP存在于选自SNCA、PLA2G6、FBXO7、VPS35、EIF4G1、DNAJC6、PRKN、SYNJ1、CHCHD2、PINK1、PARK7、LRRK2、ATP13A2和GBA的至少一种基因中,至少包括以下各项:
NM_000345.3(SNCA):c.157G>A(p.Ala53Thr)
NM_000345.3(SNCA):c.152G>A(p.Gly51Asp)
NM_003560.3(PLA2G6):c.2222G>A(p.Arg741Gln)
NM_003560.3(PLA2G6):c.2239C>T(p.Arg747Trp)
NM_003560.3(PLA2G6):c.1904G>A(p.Arg635Gln)
NM_003560.3(PLA2G6):c.1354C>T(p.Gln452Ter)
NM_012179.3(FBXO7):c.1492C>T(p.Arg498Ter)
NM_012179.3(FBXO7):c.65C>T(p.Thr22Met)
NM_018206.5(VPS35):c.1858G>A(p.Asp620Asn)
NM_198241.2(EIF4G1):c.3614G>A(p.Arg1205His)
NM_198241.2(EIF4G1):c.1505C>T(p.Ala502Val)
NM_001256865.1(DNAJC6):c.2200C>T(p.Gln734Ter)
NM_001256865.1(DNAJC6):c.2326C>T(p.Gln776Ter)
NM_004562.2(PRKN):c.931C>T(p.Gln311Ter)
NM_004562.2(PRKN):c.1358G>A(p.Trp453Ter)
NM_004562.2(PRKN):c.635G>A(p.Cys212Tyr)
NM_203446.2(SYNJ1):c.773G>A(p.Arg258Gln)
NM_001320327.1(CHCHD2):c.182C>T(p.Thr61Ile)
NM_001320327.1(CHCHD2):c.434G>A(p.Arg145Gln)
NM_001320327.1(CHCHD2):c.300+5G>A
NM_032409.2(PINK1):c.926G>A(p.Gly309Asp)
NM_032409.2(PINK1):c.1311G>A(p.Trp437Ter)
NM_032409.2(PINK1):c.736C>T(p.Arg246Ter)
NM_032409.2(PINK1):c.836G>A(p.Arg279His)
NM_032409.2(PINK1):c.938C>T(p.Thr313Met)
NM_032409.2(PINK1):c.1366C>T(p.Gln456Ter)
NM_007262.4(PARK7):c.78G>A(p.Met26Ile)
NM_198578.3(LRRK2):c.4321C>T(p.Arg1441Cys)
NM_198578.3(LRRK2):c.4322G>A(p.Arg1441His)
NM_198578.3(LRRK2):c.1256C>T(p.Ala419Val)
NM_198578.3(LRRK2):c.6055G>A(p.Gly2019Ser)
NM_022089.3(ATP13A2):c.1306+5G>A
NM_022089.3(ATP13A2):c.2629G>A(p.Gly877Arg)
NM_022089.3(ATP13A2):c.490C>T(p.Arg164Trp)
NM_001005741.2(GBA):c.1444G>A(p.Asp482Asn)
m.15950G>A。
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自SNCA、PLA2G6、FBXO7、VPS35、EIF4G1、DNAJC6、PRKN、SYNJ1、CHCHD2、PINK1、PARK7、LRRK2、ATP13A2和GBA的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防帕金森病的方法。
自闭症
在一些实施方案中,本文所述的方法、系统和组合物用于校正与自闭症相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自MECP2、NLGN3、SLC9A9、EHMT1、CHD8、NLGN4X、GSPT2和PTEN的至少一种基因中,至少包括以下各项:
NM_001110792.1(MECP2):c.916C>T(p.Arg306Ter)
NM_004992.3(MECP2):c.473C>T(p.Thr158Met)
NM_018977.3(NLGN3):c.1351C>T(p.Arg451Cys)
NM_173653.3(SLC9A9):c.1267C>T(p.Arg423Ter)
NM_024757.4(EHMT1):c.3413G>A(p.Trp1138Ter)
NM_020920.3(CHD8):c.2875C>T(p.Gln959Ter)
NM_020920.3(CHD8):c.3172C>T(p.Arg1058Ter)
NM_181332.2(NLGN4X):c.301C>T(p.Arg101Ter)
NM_018094.4(GSPT2):c.1021G>A(p.Val341Ile)
NM_000314.6(PTEN):c.392C>T(p.Thr131Ile)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自MECP2、NLGN3、SLC9A9、EHMT1、CHD8、NLGN4X、GSPT2和PTEN的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防自闭症的方法。
肌萎缩性侧索硬化症(ALS)
在一些实施方案中,本文所述的方法、系统和组合物用于校正与ALS相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自SOD1、VCP、UBQLN2、ERBB4、HNRNPA1、TUBA4A、SOD1、TARDBP、FIG4、OPTN、SETX、SPG11、FUS、VAPB、ANG、CHCHD10、SQSTM1和TBK1的至少一种基因中,至少包括以下各项:
NM_000454.4(SOD1):c.289G>A(p.Asp97Asn)
NM_007126.3(VCP):c.1774G>A(p.Asp592Asn)
NM_007126.3(VCP):c.464G>A(p.Arg155His)
NM_007126.3(VCP):c.572G>A(p.Arg191Gln)
NM_013444.3(UBQLN2):c.1489C>T(p.Pro497Ser)
NM_013444.3(UBQLN2):c.1525C>T(p.Pro509Ser)
NM_013444.3(UBQLN2):c.1573C>T(p.Pro525Ser)
NM_013444.3(UBQLN2):c.1490C>T(p.Pro497Leu)
NM_005235.2(ERBB4):c.2780G>A(p.Arg927Gln)
NM_005235.2(ERBB4):c.3823C>T(p.Arg1275Trp)
NM_031157.3(HNRNPA1):c.940G>A(p.Asp314Asn)
NM_006000.2(TUBA4A):c.643C>T(p.Arg215Cys)
NM_006000.2(TUBA4A):c.958C>T(p.Arg320Cys)
NM_006000.2(TUBA4A):c.959G>A(p.Arg320His)
NM_006000.2(TUBA4A):c.1220G>A(p.Trp407Ter)
NM_006000.2(TUBA4A):c.1147G>A(p.Ala383Thr)
NM_000454.4(SOD1):c.112G>A(p.Gly38Arg)
NM_000454.4(SOD1):c.124G>A(p.Gly42Ser)
NM_000454.4(SOD1):c.125G>A(p.Gly42Asp)
NM_000454.4(SOD1):c.14C>T(p.Ala5Val)
NM_000454.4(SOD1):c.13G>A(p.Ala5Thr)
NM_000454.4(SOD1):c.436G>A(p.Ala146Thr)
NM_000454.4(SOD1):c.64G>A(p.Glu22Lys)
NM_000454.4(SOD1):c.404G>A(p.Ser135Asn)
NM_000454.4(SOD1):c.49G>A(p.Gly17Ser)
NM_000454.4(SOD1):c.217G>A(p.Gly73Ser)
NM_007375.3(TARDBP):c.892G>A(p.Gly298Ser)
NM_007375.3(TARDBP):c.943G>A(p.Ala315Thr)
NM_007375.3(TARDBP):c.883G>A(p.Gly295Ser)
NM_007375.3(TARDBP):c.*697G>A
NM_007375.3(TARDBP):c.1144G>A(p.Ala382Thr)
NM_007375.3(TARDBP):c.859G>A(p.Gly287Ser)
NM_014845.5(FIG4):c.547C>T(p.Arg183Ter)
NM_001008211.1(OPTN):c.1192C>T(p.Gln398Ter)
NM_015046.5(SETX):c.6407G>A(p.Arg2136His)
NM_015046.5(SETX):c.8C>T(p.Thr3Ile)
NM_025137.3(SPG11):c.118C>T(p.Gln40Ter)
NM_025137.3(SPG11):c.267G>A(p.Trp89Ter)
NM_025137.3(SPG11):c.5974C>T(p.Arg1992Ter)
NM_004960.3(FUS):c.1553G>A(p.Arg518Lys)
NM_004960.3(FUS):c.1561C>T(p.Arg521Cys)
NM_004960.3(FUS):c.1562G>A(p.Arg521His)
NM_004960.3(FUS):c.1520G>A(p.Gly507Asp)
NM_004960.3(FUS):c.1483C>T(p.Arg495Ter)
NM_004960.3(FUS):c.616G>A(p.Gly206Ser)
NM_004960.3(FUS):c.646C>T(p.Arg216Cys)
NM_004738.4(VAPB):c.166C>T(p.Pro56Ser)
NM_004738.4(VAPB):c.137C>T(p.Thr46Ile)
NM_001145.4(ANG):c.164G>A(p.Arg55Lys)
NM_001145.4(ANG):c.155G>A(p.Ser52Asn)
NM_001145.4(ANG):c.407C>T(p.Pro136Leu)
NM_001145.4(ANG):c.409G>A(p.Val137Ile)
NM_001301339.1(CHCHD10):c.239C>T(p.Pro80Leu)
NM_001301339.1(CHCHD10):c.176C>T(p.Ser59Leu)
NM_001142298.1(SQSTM1):c.-47-1924C>T
NM_003900.4(SQSTM1):c.1160C>T(p.Pro387Leu)
NM_003900.4(SQSTM1):c.1175C>T(p.Pro392Leu)
NM_013254.3(TBK1):c.1340+1G>A
NM_013254.3(TBK1):c.2086G>A(p.Glu696Lys)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自SOD1、VCP、UBQLN2、ERBB4、HNRNPA1、TUBA4A、SOD1、TARDBP、FIG4、OPTN、SETX、SPG11、FUS、VAPB、ANG、CHCHD10、SQSTM1和TBK1的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防ALS的方法。
精神分裂症
在一些实施方案中,本文所述的方法、系统和组合物用于校正与精神分裂症相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自PRODH、SETD1A和SHANK3的至少一种基因中,至少包括以下各项:
NM_016335.4(PRODH):c.1292G>A(p.Arg431His)
NM_016335.4(PRODH):c.1397C>T(p.Thr466Met)
NM_014712.2(SETD1A):c.2209C>T(p.Gln737Ter)
NM_033517.1(SHANK3):c.3349C>T(p.Arg1117Ter)
NM_033517.1(SHANK3):c.1606C>T(p.Arg536Trp)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自PRODH、SETD1A和SHANK3的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防精神分裂症的方法。
肾上腺脑白质营养不良
在一些实施方案中,本文所述的方法、系统和组合物用于校正与肾上腺脑白质营养不良相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于ABCD1基因中,至少包括以下各项:
NM_000033.3(ABCD1):c.421G>A(p.Ala141Thr)
NM_000033.3(ABCD1):c.796G>A(p.Gly266Arg)
NM_000033.3(ABCD1):c.1252C>T(p.Arg418Trp)
NM_000033.3(ABCD1):c.1552C>T(p.Arg518Trp)
NM_000033.3(ABCD1):c.1850G>A(p.Arg617His)
NM_000033.3(ABCD1):c.1396C>T(p.Gln466Ter)
NM_000033.3(ABCD1):c.1553G>A(p.Arg518Gln)
NM_000033.3(ABCD1):c.1679C>T(p.Pro560Leu)
NM_000033.3(ABCD1):c.1771C>T(p.Arg591Trp)
NM_000033.3(ABCD1):c.1802G>A(p.Trp601Ter)
NM_000033.3(ABCD1):c.346G>A(p.Gly116Arg)
NM_000033.3(ABCD1):c.406C>T(p.Gln136Ter)
NM_000033.3(ABCD1):c.1661G>A(p.Arg554His)
NM_000033.3(ABCD1):c.1825G>A(p.Glu609Lys)
NM_000033.3(ABCD1):c.1288C>T(p.Gln430Ter)
NM_000033.3(ABCD1):c.1781-1G>A
NM_000033.3(ABCD1):c.529C>T(p.Gln177Ter)
NM_000033.3(ABCD1):c.1866-10G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地至少存在于ABCD1基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防肾上腺脑白质营养不良的方法。
艾卡尔迪-Goutieres综合征
在一些实施方案中,本文所述的方法、系统和组合物用于校正与艾卡尔迪-Goutieres综合征相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自TREX1、RNASEH2C、ADAR和IFIH1的至少一种基因中,至少包括以下各项:
NM_016381.5(TREX1):c.794G>A(p.Trp265Ter)
NM_033629.4(TREX1):c.52G>A(p.Asp18Asn)
NM_033629.4(TREX1):c.490C>T(p.Arg164Ter)
NM_032193.3(RNASEH2C):c.205C>T(p.Arg69Trp)
NM_001111.4(ADAR):c.3019G>A(p.Gly1007Arg)
NM_022168.3(IFIH1):c.2336G>A(p.Arg779His)
NM_022168.3(IFIH1):c.2335C>T(p.Arg779Cys)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自TREX1、RNASEH2C、ADAR和IFIH1的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防艾卡尔迪-Goutieres综合征的方法。
法布里病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与法布里病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于GLA基因中,至少包括以下各项:
NM_000169.2(GLA):c.1024C>T(p.Arg342Ter)
NM_000169.2(GLA):c.1066C>T(p.Arg356Trp)
NM_000169.2(GLA):c.1025G>A(p.Arg342Gln)
NM_000169.2(GLA):c.281G>A(p.Cys94Tyr)
NM_000169.2(GLA):c.677G>A(p.Trp226Ter)
NM_000169.2(GLA):c.734G>A(p.Trp245Ter)
NM_000169.2(GLA):c.748C>T(p.Gln250Ter)
NM_000169.2(GLA):c.658C>T(p.Arg220Ter)
NM_000169.2(GLA):c.730G>A(p.Asp244Asn)
NM_000169.2(GLA):c.369+1G>A
NM_000169.2(GLA):c.335G>A(p.Arg112His)
NM_000169.2(GLA):c.485G>A(p.Trp162Ter)
NM_000169.2(GLA):c.661C>T(p.Gln221Ter)
NM_000169.2(GLA):c.916C>T(p.Gln306Ter)
NM_000169.2(GLA):c.1072G>A(p.Glu358Lys)
NM_000169.2(GLA):c.1087C>T(p.Arg363Cys)
NM_000169.2(GLA):c.1088G>A(p.Arg363His)
NM_000169.2(GLA):c.605G>A(p.Cys202Tyr)
NM_000169.2(GLA):c.830G>A(p.Trp277Ter)
NM_000169.2(GLA):c.979C>T(p.Gln327Ter)
NM_000169.2(GLA):c.422C>T(p.Thr141Ile)
NM_000169.2(GLA):c.285G>A(p.Trp95Ter)
NM_000169.2(GLA):c.735G>A(p.Trp245Ter)
NM_000169.2(GLA):c.639+919G>A
NM_000169.2(GLA):c.680G>A(p.Arg227Gln)
NM_000169.2(GLA):c.679C>T(p.Arg227Ter)
NM_000169.2(GLA):c.242G>A(p.Trp81Ter)
NM_000169.2(GLA):c.901C>T(p.Arg301Ter)
NM_000169.2(GLA):c.974G>A(p.Gly325Asp)
NM_000169.2(GLA):c.847C>T(p.Gln283Ter)
NM_000169.2(GLA):c.469C>T(p.Gln157Ter)
NM_000169.2(GLA):c.1118G>A(p.Gly373Asp)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地至少存在于GLA基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防法布里病的方法。
莱施-奈恩综合征
在一些实施方案中,本文所述的方法、系统和组合物用于校正与莱施-奈恩综合征相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于HPRT1基因中,至少包括以下各项:
NM_000194.2(HPRT1):c.151C>T(p.Arg51Ter)
NM_000194.2(HPRT1):c.384+1G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地至少存在于HPRT1基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防莱施-奈恩综合征的方法。
门克斯病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与门克斯病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于ATP7A基因中,至少包括以下各项:
NM_000052.6(ATP7A):c.601C>T(p.Arg201Ter)
NM_000052.6(ATP7A):c.2938C>T(p.Arg980Ter)
NM_000052.6(ATP7A):c.3056G>A(p.Gly1019Asp)
NM_000052.6(ATP7A):c.598C>T(p.Gln200Ter)
NM_000052.6(ATP7A):c.1225C>T(p.Arg409Ter)
NM_000052.6(ATP7A):c.1544-1G>A
NM_000052.6(ATP7A):c.1639C>T(p.Arg547Ter)
NM_000052.6(ATP7A):c.1933C>T(p.Arg645Ter)
NM_000052.6(ATP7A):c.1946+5G>A
NM_000052.6(ATP7A):c.1950G>A(p.Trp650Ter)
NM_000052.6(ATP7A):c.2179G>A(p.Gly727Arg)
NM_000052.6(ATP7A):c.2187G>A(p.Trp729Ter)
NM_000052.6(ATP7A):c.2383C>T(p.Arg795Ter)
NM_000052.6(ATP7A):c.2499-1G>A
NM_000052.6(ATP7A):c.2555C>T(p.Pro852Leu)
NM_000052.6(ATP7A):c.2956C>T(p.Arg986Ter)
NM_000052.6(ATP7A):c.3112-1G>A
NM_000052.6(ATP7A):c.3466C>T(p.Gln1156Ter)
NM_000052.6(ATP7A):c.3502C>T(p.Gln1168Ter)
NM_000052.6(ATP7A):c.3764G>A(p.Gly1255Glu)
NM_000052.6(ATP7A):c.3943G>A(p.Gly1315Arg)
NM_000052.6(ATP7A):c.4123+1G>A
NM_000052.6(ATP7A):c.4226+5G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地至少存在于ATP7A基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防门克斯病的方法。
眼病
本发明提供了对遗传性和获得性眼病的有效治疗。Holmgaard等人(Mol.Ther.Nucleic Acids 9:89-99,2017年12月15日doi:10.1016/j.omtn.2017.08.016.电子版2017年9月21日)报道了当SpCas9由编码靶向Vegfa的SpCas9的慢病毒载体(LV)递送时,以高频率形成插入缺失,并且在转导细胞中VEGFA显著减少。Duan等人(J BiolChem.2016年7月29日;291(31):16339-47.doi:10.1074/jbc.M116.729467.电子版2016年5月31日)描述了使用CRISPR来靶向人类原代视网膜色素上皮细胞中的MDM2基因组基因座。
本发明的方法和组合物类似地适用于眼病的治疗,所述眼病包括年龄相关性黄斑变性。
Huang等人(Nat Commun.2017年7月24日;8(1):112.doi:10.1038/s41467-017-00140-3使用CRISPR来编辑VEGFR2以治疗与血管新生相关联的疾病。
与各种眼部疾病相关联的病原性G至A或C至T突变/SNP已在ClinVar数据库中报告并在表A中公开,这些疾病包括但不限于斯特格病(Stargardt Disease)、巴比二氏综合征(Bardet-Biedl Syndrome)、锥杆营养不良、先天性静止性夜盲症、乌谢尔综合征(UsherSyndrome)、莱伯氏先天性黑蒙症(Leber Congenital Amaurosis)、色素性视网膜炎和色盲症。因此,本发明的一个方面涉及一种用于校正与如以下所论述的这些疾病中的任一种相关联的一种或多种病原性G至A或C至T突变/SNP的方法。
斯特格病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与斯特格病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于ABCA4基因中,至少包括以下各项:
NM_000350.2(ABCA4):c.4429C>T(p.Gln1477Ter)
NM_000350.2(ABCA4):c.6647C>T(p.Ala2216Val)
NM_000350.2(ABCA4):c.5312+1G>A
NM_000350.2(ABCA4):c.5189G>A(p.Trp1730Ter)
NM_000350.2(ABCA4):c.4352+1G>A
NM_000350.2(ABCA4):c.4253+5G>A
NM_000350.2(ABCA4):c.3871C>T(p.Gln1291Ter)
NM_000350.2(ABCA4):c.3813G>A(p.Glu1271=)
NM_000350.2(ABCA4):c.1293G>A(p.Trp431Ter)
NM_000350.2(ABCA4):c.206G>A(p.Trp69Ter)
NM_000350.2(ABCA4):c.3322C>T(p.Arg1108Cys)
NM_000350.2(ABCA4):c.1804C>T(p.Arg602Trp)
NM_000350.2(ABCA4):c.1937+1G>A
NM_000350.2(ABCA4):c.2564G>A(p.Trp855Ter)
NM_000350.2(ABCA4):c.4234C>T(p.Gln1412Ter)
NM_000350.2(ABCA4):c.4457C>T(p.Pro1486Leu)
NM_000350.2(ABCA4):c.4594G>A(p.Asp1532Asn)
NM_000350.2(ABCA4):c.4919G>A(p.Arg1640Gln)
NM_000350.2(ABCA4):c.5196+1G>A
NM_000350.2(ABCA4):c.6316C>T(p.Arg2106Cys)
NM_000350.2(ABCA4):c.3056C>T(p.Thr1019Met)
NM_000350.2(ABCA4):c.52C>T(p.Arg18Trp)
NM_000350.2(ABCA4):c.122G>A(p.Trp41Ter)
NM_000350.2(ABCA4):c.1903C>T(p.Gln635Ter)
NM_000350.2(ABCA4):c.194G>A(p.Gly65Glu)
NM_000350.2(ABCA4):c.3085C>T(p.Gln1029Ter)
NM_000350.2(ABCA4):c.4195G>A(p.Glu1399Lys)
NM_000350.2(ABCA4):c.454C>T(p.Arg152Ter)
NM_000350.2(ABCA4):c.45G>A(p.Trp15Ter)
NM_000350.2(ABCA4):c.4610C>T(p.Thr1537Met)
NM_000350.2(ABCA4):c.6112C>T(p.Arg2038Trp)
NM_000350.2(ABCA4):c.6118C>T(p.Arg2040Ter)
NM_000350.2(ABCA4):c.6342G>A(p.Val2114=)
NM_000350.2(ABCA4):c.6658C>T(p.Gln2220Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于ABCA4基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防斯特格病的方法。
巴比二氏综合征
在一些实施方案中,本文所述的方法、系统和组合物用于校正与巴比二氏综合征相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自BBS1、BBS2、BBS7、BBS9、BBS10、BBS12、LZTFL1和TRIM32的至少一种基因中,至少包括以下各项:
NM_024649.4(BBS1):c.416G>A(p.Trp139Ter)
NM_024649.4(BBS1):c.871C>T(p.Gln291Ter)
NM_198428.2(BBS9):c.263+1G>A
NM_001178007.1(BBS12):c.1704G>A(p.Trp568Ter)
NM_001276378.1(LZTFL1):c.271C>T(p.Arg91Ter)
NM_031885.3(BBS2):c.1864C>T(p.Arg622Ter)
NM_198428.2(BBS9):c.1759C>T(p.Arg587Ter)
NM_198428.2(BBS9):c.1789+1G>A
NM_024649.4(BBS1):c.432+1G>A
NM_176824.2(BBS7):c.632C>T(p.Thr211Ile)
NM_012210.3(TRIM32):c.388C>T(p.Pro130Ser)
NM_031885.3(BBS2):c.823C>T(p.Arg275Ter)
NM_024685.3(BBS10):c.145C>T(p.Arg49Trp)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自BBS1、BBS2、BBS7、BBS9、BBS10、BBS12、LZTFL1和TRIM32的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防巴比二氏综合征的方法。
锥杆营养不良
在一些实施方案中,本文所述的方法、系统和组合物用于校正与锥杆营养不良相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自RPGRIP1、DRAM2、ABCA4、ADAM9和CACNA1F的至少一种基因中,至少包括以下各项:
NM_020366.3(RPGRIP1):c.154C>T(p.Arg52Ter)
NM_178454.5(DRAM2):c.494G>A(p.Trp165Ter)
NM_178454.5(DRAM2):c.131G>A(p.Ser44Asn)
NM_000350.2(ABCA4):c.161G>A(p.Cys54Tyr)
NM_000350.2(ABCA4):c.5714+5G>A
NM_000350.2(ABCA4):c.880C>T(p.Gln294Ter)
NM_000350.2(ABCA4):c.6079C>T(p.Leu2027Phe)
NM_000350.2(ABCA4):c.3113C>T(p.Ala1038Val)
NM_000350.2(ABCA4):c.634C>T(p.Arg212Cys)
NM_003816.2(ADAM9):c.490C>T(p.Arg164Ter)
NM_005183.3(CACNA1F):c.244C>T(p.Arg82Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自RPGRIP1、DRAM2、ABCA4、ADAM9和CACNA1F的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防锥杆营养不良的方法。
先天性静止性夜盲症
在一些实施方案中,本文所述的方法、系统和组合物用于校正与先天性静止性夜盲症相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自GRM6、TRPM1、GPR179和CACNA1F的至少一种基因中,至少包括以下各项:
NM_000843.3(GRM6):c.1462C>T(p.Gln488Ter)
NM_002420.5(TRPM1):c.2998C>T(p.Arg1000Ter)
NM_001004334.3(GPR179):c.673C>T(p.Gln225Ter)
NM_005183.3(CACNA1F):c.2576+1G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自GRM6、TRPM1、GPR179和CACNA1F的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防先天性静止性夜盲症的方法。
乌谢尔综合征
在一些实施方案中,本文所述的方法、系统和组合物用于校正与乌谢尔综合征相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自MYO7A、USH1C、CDH23、PCDH15、USH2A、ADGRV1、WHRN和CLRN1的至少一种基因中,至少包括以下各项:
NM_000260.3(MYO7A):c.640G>A(p.Gly214Arg)
NM_000260.3(MYO7A):c.1200+1G>A
NM_000260.3(MYO7A):c.141G>A(p.Trp47Ter)
NM_000260.3(MYO7A):c.1556G>A(p.Gly519Asp)
NM_000260.3(MYO7A):c.1900C>T(p.Arg634Ter)
NM_000260.3(MYO7A):c.1963C>T(p.Gln655Ter)
NM_000260.3(MYO7A):c.2094+1G>A
NM_000260.3(MYO7A):c.4293G>A(p.Trp1431Ter)
NM_000260.3(MYO7A):c.5101C>T(p.Arg1701Ter)
NM_000260.3(MYO7A):c.5617C>T(p.Arg1873Trp)
NM_000260.3(MYO7A):c.5660C>T(p.Pro1887Leu)
NM_000260.3(MYO7A):c.6070C>T(p.Arg2024Ter)
NM_000260.3(MYO7A):c.470+1G>A
NM_000260.3(MYO7A):c.5968C>T(p.Gln1990Ter)
NM_000260.3(MYO7A):c.3719G>A(p.Arg1240Gln)
NM_000260.3(MYO7A):c.494C>T(p.Thr165Met)
NM_000260.3(MYO7A):c.5392C>T(p.Gln1798Ter)
NM_000260.3(MYO7A):c.5648G>A(p.Arg1883Gln)
NM_000260.3(MYO7A):c.448C>T(p.Arg150Ter)
NM_000260.3(MYO7A):c.700C>T(p.Gln234Ter)
NM_000260.3(MYO7A):c.635G>A(p.Arg212His)
NM_000260.3(MYO7A):c.1996C>T(p.Arg666Ter)
NM_005709.3(USH1C):c.216G>A(p.Val72=)
NM_022124.5(CDH23):c.7362+5G>A
NM_022124.5(CDH23):c.3481C>T(p.Arg1161Ter)
NM_022124.5(CDH23):c.3628C>T(p.Gln1210Ter)
NM_022124.5(CDH23):c.5272C>T(p.Gln1758Ter)
NM_022124.5(CDH23):c.5712+1G>A
NM_022124.5(CDH23):c.5712G>A(p.Thr1904=)
NM_022124.5(CDH23):c.5923+1G>A
NM_022124.5(CDH23):c.6049+1G>A
NM_022124.5(CDH23):c.7776G>A(p.Trp2592Ter)
NM_022124.5(CDH23):c.9556C>T(p.Arg3186Ter)
NM_022124.5(CDH23):c.3706C>T(p.Arg1236Ter)
NM_022124.5(CDH23):c.4309C>T(p.Arg1437Ter)
NM_022124.5(CDH23):c.6050-9G>A
NM_033056.3(PCDH15):c.3316C>T(p.Arg1106Ter)
NM_033056.3(PCDH15):c.7C>T(p.Arg3Ter)
NM_033056.3(PCDH15):c.1927C>T(p.Arg643Ter)
NM_001142772.1(PCDH15):c.400C>T(p.Arg134Ter)
NM_033056.3(PCDH15):c.3358C>T(p.Arg1120Ter)
NM_206933.2(USH2A):c.11048-1G>A
NM_206933.2(USH2A):c.1143+1G>A
NM_206933.2(USH2A):c.11954G>A(p.Trp3985Ter)
NM_206933.2(USH2A):c.12868C>T(p.Gln4290Ter)
NM_206933.2(USH2A):c.14180G>A(p.Trp4727Ter)
NM_206933.2(USH2A):c.14911C>T(p.Arg4971Ter)
NM_206933.2(USH2A):c.5788C>T(p.Arg1930Ter)
NM_206933.2(USH2A):c.5858-1G>A
NM_206933.2(USH2A):c.6224G>A(p.Trp2075Ter)
NM_206933.2(USH2A):c.820C>T(p.Arg274Ter)
NM_206933.2(USH2A):c.8981G>A(p.Trp2994Ter)
NM_206933.2(USH2A):c.9304C>T(p.Gln3102Ter)
NM_206933.2(USH2A):c.13010C>T(p.Thr4337Met)
NM_206933.2(USH2A):c.14248C>T(p.Gln4750Ter)
NM_206933.2(USH2A):c.6398G>A(p.Trp2133Ter)
NM_206933.2(USH2A):c.632G>A(p.Trp211Ter)
NM_206933.2(USH2A):c.6601C>T(p.Gln2201Ter)
NM_206933.2(USH2A):c.13316C>T(p.Thr4439Ile)
NM_206933.2(USH2A):c.4405C>T(p.Gln1469Ter)
NM_206933.2(USH2A):c.9570+1G>A
NM_206933.2(USH2A):c.8740C>T(p.Arg2914Ter)
NM_206933.2(USH2A):c.8681+1G>A
NM_206933.2(USH2A):c.1000C>T(p.Arg334Trp)
NM_206933.2(USH2A):c.14175G>A(p.Trp4725Ter)
NM_206933.2(USH2A):c.9390G>A(p.Trp3130Ter)
NM_206933.2(USH2A):c.908G>A(p.Arg303His)
NM_206933.2(USH2A):c.5776+1G>A
NM_206933.2(USH2A):c.11156G>A(p.Arg3719His)
NM_032119.3(ADGRV1):c.2398C>T(p.Arg800Ter)
NM_032119.3(ADGRV1):c.7406G>A(p.Trp2469Ter)
NM_032119.3(ADGRV1):c.12631C>T(p.Arg4211Ter)
NM_032119.3(ADGRV1):c.7129C>T(p.Arg2377Ter)
NM_032119.3(ADGRV1):c.14885G>A(p.Trp4962Ter)
NM_015404.3(WHRN):c.1267C>T(p.Arg423Ter)
NM_174878.2(CLRN1):c.619C>T(p.Arg207Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自MYO7A、USH1C、CDH23、PCDH15、USH2A、ADGRV1、WHRN和CLRN1的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防增强型乌谢尔综合征的方法。
莱伯氏先天性黑蒙症
在一些实施方案中,本文所述的方法、系统和组合物用于校正与莱伯氏先天性黑蒙症相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自TULP1、RPE65、SPATA7、AIPL1、CRB1、NMNAT1和PEX1的至少一种基因中,至少包括以下各项:
NM_003322.5(TULP1):c.1495+1G>A
NM_000329.2(RPE65):c.11+5G>A
NM_018418.4(SPATA7):c.322C>T(p.Arg108Ter)
NM_014336.4(AIPL1):c.784G>A(p.Gly262Ser)
NM_201253.2(CRB1):c.1576C>T(p.Arg526Ter)
NM_201253.2(CRB1):c.3307G>A(p.Gly1103Arg)
NM_201253.2(CRB1):c.2843G>A(p.Cys948Tyr)
NM_022787.3(NMNAT1):c.769G>A(p.Glu257Lys)
NM_000466.2(PEX1):c.2528G>A(p.Gly843Asp)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自TULP1、RPE65、SPATA7、AIPL1、CRB1、NMNAT1和PEX1的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防莱伯氏先天性黑蒙症的方法。
色素性视网膜炎
在一些实施方案中,本文所述的方法、系统和组合物用于校正与色素性视网膜炎相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自CRB1、IFT140、RP1、IMPDH1、PRPF31、RPGR、ABCA4、RPE65、EYS、NRL、FAM161A、NR2E3、USH2A、RHO、PDE6B、KLHL7、PDE6A、CNGB1、BEST1、C2orf71、PRPH2、CA4、CERKL、RPE65、PDE6B和ADGRV1的至少一种基因中,至少包括以下各项:
NM_001257965.1(CRB1):c.2711G>A(p.Cys904Tyr)
NM_014714.3(IFT140):c.3827G>A(p.Gly1276Glu)
NM_006269.1(RP1):c.2029C>T(p.Arg677Ter)
NM_000883.3(IMPDH1):c.931G>A(p.Asp311Asn)
NM_015629.3(PRPF31):c.1273C>T(p.Gln425Ter)
NM_015629.3(PRPF31):c.1073+1G>A
NM_000328.2(RPGR):c.1387C>T(p.Gln463Ter)
NM_000350.2(ABCA4):c.4577C>T(p.Thr1526Met)
NM_000350.2(ABCA4):c.6229C>T(p.Arg2077Trp)
NM_000329.2(RPE65):c.271C>T(p.Arg91Trp)
NM_001142800.1(EYS):c.2194C>T(p.Gln732Ter)
NM_001142800.1(EYS):c.490C>T(p.Arg164Ter)
NM_006177.3(NRL):c.151C>T(p.Pro51Ser)
NM_001201543.1(FAM161A):c.1567C>T(p.Arg523Ter)
NM_014249.3(NR2E3):c.166G>A(p.Gly56Arg)
NM_206933.2(USH2A):c.2209C>T(p.Arg737Ter)
NM_206933.2(USH2A):c.14803C>T(p.Arg4935Ter)
NM_206933.2(USH2A):c.10073G>A(p.Cys3358Tyr)
NM_000539.3(RHO):c.541G>A(p.Glu181Lys)
NM_000283.3(PDE6B):c.892C>T(p.Gln298Ter)
NM_001031710.2(KLHL7):c.458C>T(p.Ala153Val)
NM_000440.2(PDE6A):c.1926+1G>A
NM_001297.4(CNGB1):c.2128C>T(p.Gln710Ter)
NM_001297.4(CNGB1):c.952C>T(p.Gln318Ter)
NM_004183.3(BEST1):c.682G>A(p.Asp228Asn)
NM_001029883.2(C2orf71):c.1828C>T(p.Gln610Ter)
NM_000322.4(PRPH2):c.647C>T(p.Pro216Leu)
NM_000717.4(CA4):c.40C>T(p.Arg14Trp)
NM_201548.4(CERKL):c.769C>T(p.Arg257Ter)
NM_000329.2(RPE65):c.118G>A(p.Gly40Ser)
NM_000322.4(PRPH2):c.499G>A(p.Gly167Ser)
NM_000539.3(RHO):c.403C>T(p.Arg135Trp)
NM_000283.3(PDE6B):c.2193+1G>A
NM_032119.3(ADGRV1):c.6901C>T(p.Gln2301Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自CRB1、IFT140、RP1、IMPDH1、PRPF31、RPGR、ABCA4、RPE65、EYS、NRL、FAM161A、NR2E3、USH2A、RHO、PDE6B、KLHL7、PDE6A、CNGB1、BEST1、C2orf71、PRPH2、CA4、CERKL、RPE65、PDE6B和ADGRV1的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防色素性视网膜炎的方法。
色盲症
在一些实施方案中,本文所述的方法、系统和组合物用于校正与色盲症相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自CNGA3、CNGB3和ATF6的至少一种基因中,至少包括以下各项:
NM_001298.2(CNGA3):c.847C>T(p.Arg283Trp)
NM_001298.2(CNGA3):c.101+1G>A
NM_001298.2(CNGA3):c.1585G>A(p.Val529Met)
NM_019098.4(CNGB3):c.1578+1G>A
NM_019098.4(CNGB3):c.607C>T(p.Arg203Ter)
NM_019098.4(CNGB3):c.1119G>A(p.Trp373Ter)
NM_007348.3(ATF6):c.970C>T(p.Arg324Cys)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自CNGA3、CNGB3和ATF6的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防色盲症的方法。
影响听力的疾病
与影响听力的各种疾病相关联的病原性G至A或C至T突变/SNP已在ClinVar数据库中报告并在表A中公开,这些疾病包括但不限于耳聋和非综合征性听力丧失。因此,本发明的一个方面涉及一种用于校正与如以下所论述的这些疾病中的任一种相关联的一种或多种病原性G至A或C至T突变/SNP的方法。
耳聋
Gao等人(Nature.2017年12月20.doi:10.1038/nature25164.[印刷前电子版])报道了使用CRISPR-Cas9进行基因组编辑以靶向小鼠中的Tmc1基因并且减少进行性听力丧失和耳聋。在一些实施方案中,本文所述的方法、系统和组合物用于校正与耳聋相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自FGF3、MYO7A、STRC、ACTG1、SLC17A8、TMC1、GJB2、MYH14、COCH、CDH23、USH1C、GJB2、MYO7A、PCDH15、MYO15A、MYO3A、WHRN、DFNB59、TMC1、LOXHD1、TMPRSS3、OTOGL、OTOF、JAG1和MARVELD2的至少一种基因中,至少包括以下各项:
NM_005247.2(FGF3):c.283C>T(p.Arg95Trp)
NM_000260.3(MYO7A):c.652G>A(p.Asp218Asn)
NM_000260.3(MYO7A):c.689C>T(p.Ala230Val)
NM_153700.2(STRC):c.4057C>T(p.Gln1353Ter)
NM_001614.3(ACTG1):c.721G>A(p.Glu241Lys)
NM_139319.2(SLC17A8):c.632C>T(p.Ala211Val)
NM_138691.2(TMC1):c.1714G>A(p.Asp572Asn)
NM_004004.5(GJB2):c.598G>A(p.Gly200Arg)
NM_004004.5(GJB2):c.71G>A(p.Trp24Ter)
NM_004004.5(GJB2):c.416G>A(p.Ser139Asn)
NM_004004.5(GJB2):c.224G>A(p.Arg75Gln)
NM_004004.5(GJB2):c.95G>A(p.Arg32His)
NM_004004.5(GJB2):c.250G>A(p.Val84Met)
NM_004004.5(GJB2):c.428G>A(p.Arg143Gln)
NM_004004.5(GJB2):c.551G>A(p.Arg184Gln)
NM_004004.5(GJB2):c.223C>T(p.Arg75Trp)
NM_024729.3(MYH14):c.359C>T(p.Ser120Leu)
NM_004086.2(COCH):c.151C>T(p.Pro51Ser)
NM_022124.5(CDH23):c.4021G>A(p.Asp1341Asn)
NM_153700.2(STRC):c.4701+1G>A
NM_153676.3(USH1C):c.496+1G>A
NM_004004.5(GJB2):c.131G>A(p.Trp44Ter)
NM_004004.5(GJB2):c.283G>A(p.Val95Met)
NM_004004.5(GJB2):c.298C>T(p.His100Tyr)
NM_004004.5(GJB2):c.427C>T(p.Arg143Trp)
NM_004004.5(GJB2):c.109G>A(p.Val37Ile)
NM_004004.5(GJB2):c.-23+1G>A
NM_004004.5(GJB2):c.148G>A(p.Asp50Asn)
NM_004004.5(GJB2):c.134G>A(p.Gly45Glu)
NM_004004.5(GJB2):c.370C>T(p.Gln124Ter)
NM_004004.5(GJB2):c.230G>A(p.Trp77Ter)
NM_004004.5(GJB2):c.231G>A(p.Trp77Ter)
NM_000260.3(MYO7A):c.5899C>T(p.Arg1967Ter)
NM_000260.3(MYO7A):c.2005C>T(p.Arg669Ter)
NM_033056.3(PCDH15):c.733C>T(p.Arg245Ter)
NM_016239.3(MYO15A):c.3866+1G>A
NM_016239.3(MYO15A):c.6178-1G>A
NM_016239.3(MYO15A):c.8714-1G>A
NM_017433.4(MYO3A):c.2506-1G>A
NM_015404.3(WHRN):c.1417-1G>A
NM_001042702.3(DFNB59):c.499C>T(p.Arg167Ter)
NM_138691.2(TMC1):c.100C>T(p.Arg34Ter)
NM_138691.2(TMC1):c.1165C>T(p.Arg389Ter)
NM_144612.6(LOXHD1):c.2008C>T(p.Arg670Ter)
NM_144612.6(LOXHD1):c.4714C>T(p.Arg1572Ter)
NM_144612.6(LOXHD1):c.4480C>T(p.Arg1494Ter)
NM_024022.2(TMPRSS3):c.325C>T(p.Arg109Trp)
NM_173591.3(OTOGL):c.3076C>T(p.Gln1026Ter)
NM_194248.2(OTOF):c.4483C>T(p.Arg1495Ter)
NM_194248.2(OTOF):c.2122C>T(p.Arg708Ter)
NM_194248.2(OTOF):c.2485C>T(p.Gln829Ter)
NM_001038603.2(MARVELD2):c.1498C>T(p.Arg500Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自FGF3、MYO7A、STRC、ACTG1、SLC17A8、TMC1、GJB2、MYH14、COCH、CDH23、USH1C、GJB2、MYO7A、PCDH15、MYO15A、MYO3A、WHRN、DFNB59、TMC1、LOXHD1、TMPRSS3、OTOGL、OTOF、JAG1和MARVELD2的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防耳聋的方法。
非综合征性听力丧失
在一些实施方案中,本文所述的方法、系统和组合物用于校正与非综合征性听力丧失相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自GJB2、POU3F4、MYO15A、TMPRSS3、LOXHD1、OTOF、MYO6、OTOA、STRC、TRIOBP、MARVELD2、TMC1、TECTA、OTOGL和GIPC3的至少一种基因中,至少包括以下各项:
NM_004004.5(GJB2):c.169C>T(p.Gln57Ter)
NM_000307.4(POU3F4):c.499C>T(p.Arg167Ter)
NM_016239.3(MYO15A):c.8767C>T(p.Arg2923Ter)
NM_024022.2(TMPRSS3):c.323-6G>A
NM_024022.2(TMPRSS3):c.916G>A(p.Ala306Thr)
NM_144612.6(LOXHD1):c.2497C>T(p.Arg833Ter)
NM_194248.2(OTOF):c.2153G>A(p.Trp718Ter)
NM_194248.2(OTOF):c.2818C>T(p.Gln940Ter)
NM_194248.2(OTOF):c.4799+1G>A
NM_004999.3(MYO6):c.826C>T(p.Arg276Ter)
NM_144672.3(OTOA):c.1880+1G>A
NM_153700.2(STRC):c.5188C>T(p.Arg1730Ter)
NM_153700.2(STRC):c.3670C>T(p.Arg1224Ter)
NM_153700.2(STRC):c.4402C>T(p.Arg1468Ter)
NM_024022.2(TMPRSS3):c.1192C>T(p.Gln398Ter)
NM_001039141.2(TRIOBP):c.6598C>T(p.Arg2200Ter)
NM_016239.3(MYO15A):c.7893+1G>A
NM_016239.3(MYO15A):c.5531+1G>A
NM_016239.3(MYO15A):c.6046+1G>A
NM_144612.6(LOXHD1):c.3169C>T(p.Arg1057Ter)
NM_001038603.2(MARVELD2):c.1331+1G>A
NM_138691.2(TMC1):c.1676G>A(p.Trp559Ter)
NM_138691.2(TMC1):c.1677G>A(p.Trp559Ter)
NM_005422.2(TECTA):c.5977C>T(p.Arg1993Ter)
NM_173591.3(OTOGL):c.4987C>T(p.Arg1663Ter)
NM_153700.2(STRC):c.3493C>T(p.Gln1165Ter)
NM_153700.2(STRC):c.3217C>T(p.Arg1073Ter)
NM_016239.3(MYO15A):c.5896C>T(p.Arg1966Ter)
NM_133261.2(GIPC3):c.411+1G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自GJB2、POU3F4、MYO15A、TMPRSS3、LOXHD1、OTOF、MYO6、OTOA、STRC、TRIOBP、MARVELD2、TMC1、TECTA、OTOGL和GIPC3的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防非综合征性听力丧失的方法。
血液病症
与各种血液病症相关联的病原性G至A或C至T突变/SNP已在ClinVar数据库中报告并在表A中公开,这些疾病包括但不限于β地中海贫血、甲型血友病、乙型血友病、丙型血友病和威斯科特-奥尔德里奇综合征。因此,本发明的一个方面涉及一种用于校正与如以下所论述的这些疾病中的任一种相关联的一种或多种病原性G至A或C至T突变/SNP的方法。
β地中海贫血
在一些实施方案中,本文所述的方法、系统和组合物用于校正与β地中海贫血相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于HBB基因中,至少包括以下各项:
NM_000518.4(HBB):c.-137C>T
NM_000518.4(HBB):c.-50-88C>T
NM_000518.4(HBB):c.-140C>T
NM_000518.4(HBB):c.316-197C>T
NM_000518.4(HBB):c.93-21G>A
NM_000518.4(HBB):c.114G>A(p.Trp38Ter)
NM_000518.4(HBB):c.118C>T(p.Gln40Ter)
NM_000518.4(HBB):c.92+1G>A
NM_000518.4(HBB):c.315+1G>A
NM_000518.4(HBB):c.92+5G>A
NM_000518.4(HBB):c.-50-101C>T
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于HBB基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防β地中海贫血的方法。
甲型血友病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与甲型血友病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于F8基因中,至少包括以下各项:
NM_000132.3(F8):c.3169G>A(p.Glu1057Lys)
NM_000132.3(F8):c.902G>A(p.Arg301His)
NM_000132.3(F8):c.1834C>T(p.Arg612Cys)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于F8基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防甲型血友病的方法。
莱登因子V(Factor V Leiden)
在一些实施方案中,本文所述的方法、统和组合物用于校正莱登因子V突变。这种致病单点突变(G1746->A)代表了高加索人群的遗传性多因素易栓症中最丰富的遗传风险因素。由于点突变,在凝血因子F5的蛋白C依赖性蛋白水解切割位点(R533R534)上出现单个氨基酸取代(R534[→]Q)。杂合缺陷仅伴随血栓形成风险的微小增加(约8倍),而纯合缺陷具有更为明显的作用(风险增加了>80倍)。19定向RNA编辑有潜力通过以RNA水平进行修复弥补这种遗传缺陷。
乙型血友病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与乙型血友病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于F9基因中,至少包括以下各项:
NM_000133.3(F9):c.835G>A(p.Ala279Thr)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于F9基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防乙型血友病的方法。
丙型血友病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与丙型血友病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于F11基因中,至少包括以下各项:
NM_000128.3(F11):c.400C>T(p.Gln134Ter)
NM_000128.3(F11):c.1432G>A(p.Gly478Arg)
NM_000128.3(F11):c.1288G>A(p.Ala430Thr)
NM_000128.3(F11):c.326-1G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于F11基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防丙型血友病的方法。
威斯科特-奥尔德里奇综合征
在一些实施方案中,本文所述的方法、系统和组合物用于校正与威斯科特-奥尔德里奇综合征相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于WAS基因中,至少包括以下各项:
NM_000377.2(WAS):c.37C>T(p.Arg13Ter)
NM_000377.2(WAS):c.257G>A(p.Arg86His)
NM_000377.2(WAS):c.777+1G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于WAS基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防威斯科特-奥尔德里奇综合征的方法。
肝脏疾病
与各种肝脏疾病相关联的病原性G至A或C至T突变/SNP已在ClinVar数据库中报告并在表A中公开,这些疾病包括但不限于运甲状腺素蛋白淀粉样变性、α-1抗胰蛋白酶缺乏症、威尔逊氏病(Wilson’s disease)和苯丙酮尿症。因此,本发明的一个方面涉及一种用于校正与如以下所论述的这些疾病中的任一种相关联的一种或多种病原性G至A或C至T突变/SNP的方法。
运甲状腺素蛋白淀粉样变性
在一些实施方案中,本文所述的方法、系统和组合物用于校正与运甲状腺素蛋白淀粉样变性相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于TTR基因中,至少包括以下各项:
NM_000371.3(TTR):c.424G>A(p.Val142Ile)
NM_000371.3(TTR):c.148G>A(p.Val50Met)
NM_000371.3(TTR):c.118G>A(p.Val40Ile)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于TTR基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防运甲状腺素蛋白淀粉样变性的方法。
α-1-抗胰蛋白酶缺乏症
在一些实施方案中,本文所述的方法、系统和组合物用于校正与α-1-抗胰蛋白酶缺乏症相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于SERPINA1基因中,至少包括以下各项:
NM_000295.4(SERPINA1):c.538C>T(p.Gln180Ter)
NM_001127701.1(SERPINA1):c.1178C>T(p.Pro393Leu)
NM_001127701.1(SERPINA1):c.230C>T(p.Ser77Phe)
NM_001127701.1(SERPINA1):c.1096G>A(p.Glu366Lys)
NM_000295.4(SERPINA1):c.1177C>T(p.Pro393Ser)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于SERPINA1基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防α-1-抗胰蛋白酶缺乏症的方法。
威尔逊氏病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与威尔逊氏病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于ATP7B基因中,至少包括以下各项:
NM_000053.3(ATP7B):c.2293G>A(p.Asp765Asn)
NM_000053.3(ATP7B):c.3955C>T(p.Arg1319Ter)
NM_000053.3(ATP7B):c.2865+1G>A
NM_000053.3(ATP7B):c.3796G>A(p.Gly1266Arg)
NM_000053.3(ATP7B):c.2621C>T(p.Ala874Val)
NM_000053.3(ATP7B):c.2071G>A(p.Gly691Arg)
NM_000053.3(ATP7B):c.2128G>A(p.Gly710Ser)
NM_000053.3(ATP7B):c.2336G>A(p.Trp779Ter)
NM_000053.3(ATP7B):c.4021G>A(p.Gly1341Ser)
NM_000053.3(ATP7B):c.3182G>A(p.Gly1061Glu)
NM_000053.3(ATP7B):c.4114C>T(p.Gln1372Ter)
NM_000053.3(ATP7B):c.1708-1G>A
NM_000053.3(ATP7B):c.865C>T(p.Gln289Ter)
NM_000053.3(ATP7B):c.2930C>T(p.Thr977Met)
NM_000053.3(ATP7B):c.3659C>T(p.Thr1220Met)
NM_000053.3(ATP7B):c.2605G>A(p.Gly869Arg)
NM_000053.3(ATP7B):c.2975C>T(p.Pro992Leu)
NM_000053.3(ATP7B):c.2519C>T(p.Pro840Leu)
NM_000053.3(ATP7B):c.2906G>A(p.Arg969Gln)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于ATP7B基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防威尔逊氏病的方法。
苯丙酮尿症
在一些实施方案中,本文所述的方法、系统和组合物用于校正与苯丙酮尿症相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于PAH基因中,至少包括以下各项:
NM_000277.1(PAH):c.1315+1G>A
NM_000277.1(PAH):c.1222C>T(p.Arg408Trp)
NM_000277.1(PAH):c.838G>A(p.Glu280Lys)
NM_000277.1(PAH):c.331C>T(p.Arg111Ter)
NM_000277.1(PAH):c.782G>A(p.Arg261Gln)
NM_000277.1(PAH):c.754C>T(p.Arg252Trp)
NM_000277.1(PAH):c.473G>A(p.Arg158Gln)
NM_000277.1(PAH):c.727C>T(p.Arg243Ter)
NM_000277.1(PAH):c.842C>T(p.Pro281Leu)
NM_000277.1(PAH):c.728G>A(p.Arg243Gln)
NM_000277.1(PAH):c.1066-11G>A
NM_000277.1(PAH):c.781C>T(p.Arg261Ter)
NM_000277.1(PAH):c.1223G>A(p.Arg408Gln)
NM_000277.1(PAH):c.1162G>A(p.Val388Met)
NM_000277.1(PAH):c.1066-3C>T
NM_000277.1(PAH):c.1208C>T(p.Ala403Val)
NM_000277.1(PAH):c.890G>A(p.Arg297His)
NM_000277.1(PAH):c.926C>T(p.Ala309Val)
NM_000277.1(PAH):c.441+1G>A
NM_000277.1(PAH):c.526C>T(p.Arg176Ter)
NM_000277.1(PAH):c.688G>A(p.Val230Ile)
NM_000277.1(PAH):c.721C>T(p.Arg241Cys)
NM_000277.1(PAH):c.745C>T(p.Leu249Phe)
NM_000277.1(PAH):c.442-1G>A
NM_000277.1(PAH):c.842+1G>A
NM_000277.1(PAH):c.776C>T(p.Ala259Val)
NM_000277.1(PAH):c.1200-1G>A
NM_000277.1(PAH):c.912+1G>A
NM_000277.1(PAH):c.1065+1G>A
NM_000277.1(PAH):c.472C>T(p.Arg158Trp)
NM_000277.1(PAH):c.755G>A(p.Arg252Gln)
NM_000277.1(PAH):c.809G>A(p.Arg270Lys)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于PAH基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防苯丙酮尿症的方法。
肾脏疾病
与各种肾脏疾病相关联的病原性G至A或C至T突变/SNP已在ClinVar数据库中报告并在表A中公开,这些疾病包括但不限于常染色体隐性遗传性多囊肾病和肾性肉毒碱转运缺陷。因此,本发明的一个方面涉及一种用于校正与如以下所论述的这些疾病中的任一种相关联的一种或多种病原性G至A或C至T突变/SNP的方法。
常染色体隐性遗传性多囊肾病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与常染色体隐性遗传性多囊肾病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于PKHD1基因中,至少包括以下各项:
NM_138694.3(PKHD1):c.10444C>T(p.Arg3482Cys)
NM_138694.3(PKHD1):c.9319C>T(p.Arg3107Ter)
NM_138694.3(PKHD1):c.1480C>T(p.Arg494Ter)
NM_138694.3(PKHD1):c.707+1G>A
NM_138694.3(PKHD1):c.1486C>T(p.Arg496Ter)
NM_138694.3(PKHD1):c.8303-1G>A
NM_138694.3(PKHD1):c.2854G>A(p.Gly952Arg)
NM_138694.3(PKHD1):c.7194G>A(p.Trp2398Ter)
NM_138694.3(PKHD1):c.10219C>T(p.Gln3407Ter)
NM_138694.3(PKHD1):c.107C>T(p.Thr36Met)
NM_138694.3(PKHD1):c.8824C>T(p.Arg2942Ter)
NM_138694.3(PKHD1):c.982C>T(p.Arg328Ter)
NM_138694.3(PKHD1):c.4870C>T(p.Arg1624Trp)
NM_138694.3(PKHD1):c.1602+1G>A
NM_138694.3(PKHD1):c.1694-1G>A
NM_138694.3(PKHD1):c.2341C>T(p.Arg781Ter)
NM_138694.3(PKHD1):c.2407+1G>A
NM_138694.3(PKHD1):c.2452C>T(p.Gln818Ter)
NM_138694.3(PKHD1):c.5236+1G>A
NM_138694.3(PKHD1):c.6499C>T(p.Gln2167Ter)
NM_138694.3(PKHD1):c.2725C>T(p.Arg909Ter)
NM_138694.3(PKHD1):c.370C>T(p.Arg124Ter)
NM_138694.3(PKHD1):c.2810G>A(p.Trp937Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于PKHD1基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防常染色体隐性遗传性多囊肾病的方法。
肾性肉毒碱转运缺陷
在一些实施方案中,本文所述的方法、系统和组合物用于校正与肾性肉毒碱转运缺陷相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于SLC22A5基因中,至少包括以下各项:
NM_003060.3(SLC22A5):c.760C>T(p.Arg254Ter)
NM_003060.3(SLC22A5):c.396G>A(p.Trp132Ter)
NM_003060.3(SLC22A5):c.844C>T(p.Arg282Ter)
NM_003060.3(SLC22A5):c.505C>T(p.Arg169Trp)
NM_003060.3(SLC22A5):c.1319C>T(p.Thr440Met)
NM_003060.3(SLC22A5):c.1195C>T(p.Arg399Trp)
NM_003060.3(SLC22A5):c.695C>T(p.Thr232Met)
NM_003060.3(SLC22A5):c.845G>A(p.Arg282Gln)
NM_003060.3(SLC22A5):c.1193C>T(p.Pro398Leu)
NM_003060.3(SLC22A5):c.1463G>A(p.Arg488His)
NM_003060.3(SLC22A5):c.338G>A(p.Cys113Tyr)
NM_003060.3(SLC22A5):c.136C>T(p.Pro46Ser)
NM_003060.3(SLC22A5):c.506G>A(p.Arg169Gln)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于SLC22A5基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防肾性肉毒碱转运缺陷的方法。
心血管疾病
本文所公开的实施方案可以直接用于治疗或预防已知靶标的心血管疾病。Khera等人(Nat Rev Genet.2017年6月;18(6):331-344.doi:10.1038/nrg.2016.160。电子版2017年3月13日)描述了常见的变体关联研究,这些将大约60个遗传基因座与冠心病风险联系起来,用于促进更好地了解成因风险因素,以及新治疗剂的潜在生物学发展。例如,Khera解释到使PCSK9中的突变失活降低了循环LDL胆固醇的水平并且降低了CAD风险,这引起了人们对PCSK9抑制剂开发的浓厚兴趣。此外,被设计来模拟APOC3或LPA中的保护性突变的反义寡核苷酸分别显示约70%的甘油三酯水平降低和80%的循环脂蛋白(a)水平降低。此外,Wang等人,(Arterioscler Thromb Vasc Biol.2016年5月;36(5):783-6.doi:10.1161/ATVBAHA.116.307227.电子版2016年3月3日)和Ding等人(Circ Res.2014年8月15日;115(5):488-92.doi:10.1161/CIRCRESAHA.115.304351.电子版2014年6月10日)报道了使用CRISPR来靶向Pcsk9基因以便预防心血管疾病。
肌肉疾病
与各种肌肉疾病相关联的病原性G至A或C至T突变/SNP已在ClinVar数据库中报告并在表A中公开,这些疾病包括但不限于杜兴氏肌营养不良(Duchenne musculardystrophy)、贝克肌营养不良(Becker muscular dystrophy)、肢带型肌营养不良、埃-德二氏肌营养不良(Emery-Dreifuss muscular dystrophy)和面肩肱型肌营养不良。因此,本发明的一个方面涉及一种用于校正与如以下所论述的这些疾病中的任一种相关联的一种或多种病原性G至A或C至T突变/SNP的方法。
杜兴氏肌营养不良
在一些实施方案中,本文所述的方法、系统和组合物用于校正与杜兴氏肌营养不良相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于DMD基因中,至少包括以下各项:
NM_004006.2(DMD):c.2797C>T(p.Gln933Ter)
NM_004006.2(DMD):c.4870C>T(p.Gln1624Ter)
NM_004006.2(DMD):c.5551C>T(p.Gln1851Ter)
NM_004006.2(DMD):c.3188G>A(p.Trp1063Ter)
NM_004006.2(DMD):c.8357G>A(p.Trp2786Ter)
NM_004006.2(DMD):c.7817G>A(p.Trp2606Ter)
NM_004006.2(DMD):c.7755G>A(p.Trp2585Ter)
NM_004006.2(DMD):c.5917C>T(p.Gln1973Ter)
NM_004006.2(DMD):c.5641C>T(p.Gln1881Ter)
NM_004006.2(DMD):c.5131C>T(p.Gln1711Ter)
NM_004006.2(DMD):c.4240C>T(p.Gln1414Ter)
NM_004006.2(DMD):c.3427C>T(p.Gln1143Ter)
NM_004006.2(DMD):c.2407C>T(p.Gln803Ter)
NM_004006.2(DMD):c.2368C>T(p.Gln790Ter)
NM_004006.2(DMD):c.1683G>A(p.Trp561Ter)
NM_004006.2(DMD):c.1663C>T(p.Gln555Ter)
NM_004006.2(DMD):c.1388G>A(p.Trp463Ter)
NM_004006.2(DMD):c.1331+1G>A
NM_004006.2(DMD):c.1324C>T(p.Gln442Ter)
NM_004006.2(DMD):c.355C>T(p.Gln119Ter)
NM_004006.2(DMD):c.94-1G>A
NM_004006.2(DMD):c.5506C>T(p.Gln1836Ter)
NM_004006.2(DMD):c.1504C>T(p.Gln502Ter)
NM_004006.2(DMD):c.5032C>T(p.Gln1678Ter)
NM_004006.2(DMD):c.457C>T(p.Gln153Ter)
NM_004006.2(DMD):c.1594C>T(p.Gln532Ter)
NM_004006.2(DMD):c.1150-1G>A
NM_004006.2(DMD):c.6223C>T(p.Gln2075Ter)
NM_004006.2(DMD):c.3747G>A(p.Trp1249Ter)
NM_004006.2(DMD):c.2861G>A(p.Trp954Ter)
NM_004006.2(DMD):c.9563+1G>A
NM_004006.2(DMD):c.4483C>T(p.Gln1495Ter)
NM_004006.2(DMD):c.4312C>T(p.Gln1438Ter)
NM_004006.2(DMD):c.8209C>T(p.Gln2737Ter)
NM_004006.2(DMD):c.4071+1G>A
NM_004006.2(DMD):c.2665C>T(p.Arg889Ter)
NM_004006.2(DMD):c.2202G>A(p.Trp734Ter)
NM_004006.2(DMD):c.2077C>T(p.Gln693Ter)
NM_004006.2(DMD):c.1653G>A(p.Trp551Ter)
NM_004006.2(DMD):c.1061G>A(p.Trp354Ter)
NM_004006.2(DMD):c.8914C>T(p.Gln2972Ter)
NM_004006.2(DMD):c.6118-1G>A
NM_004006.2(DMD):c.4729C>T(p.Arg1577Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于DMD基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防杜兴氏肌营养不良的方法。
贝克肌营养不良
在一些实施方案中,本文所述的方法、系统和组合物用于校正与贝克肌营养不良相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于DMD基因中,至少包括以下各项:
NM_004006.2(DMD):c.3413G>A(p.Trp1138Ter)
NM_004006.2(DMD):c.358-1G>A
NM_004006.2(DMD):c.10108C>T(p.Arg3370Ter)
NM_004006.2(DMD):c.6373C>T(p.Gln2125Ter)
NM_004006.2(DMD):c.9568C>T(p.Arg3190Ter)
NM_004006.2(DMD):c.8713C>T(p.Arg2905Ter)
NM_004006.2(DMD):c.1615C>T(p.Arg539Ter)
NM_004006.2(DMD):c.3151C>T(p.Arg1051Ter)
NM_004006.2(DMD):c.3432+1G>A
NM_004006.2(DMD):c.5287C>T(p.Arg1763Ter)
NM_004006.2(DMD):c.5530C>T(p.Arg1844Ter)
NM_004006.2(DMD):c.8608C>T(p.Arg2870Ter)
NM_004006.2(DMD):c.8656C>T(p.Gln2886Ter)
NM_004006.2(DMD):c.8944C>T(p.Arg2982Ter)
NM_004006.2(DMD):c.5899C>T(p.Arg1967Ter)
NM_004006.2(DMD):c.10033C>T(p.Arg3345Ter)
NM_004006.2(DMD):c.10086+1G>A
NM_004019.2(DMD):c.1020G>A(p.Thr340=)
NM_004006.2(DMD):c.1261C>T(p.Gln421Ter)
NM_004006.2(DMD):c.1465C>T(p.Gln489Ter)
NM_004006.2(DMD):c.1990C>T(p.Gln664Ter)
NM_004006.2(DMD):c.2032C>T(p.Gln678Ter)
NM_004006.2(DMD):c.2332C>T(p.Gln778Ter)
NM_004006.2(DMD):c.2419C>T(p.Gln807Ter)
NM_004006.2(DMD):c.2650C>T(p.Gln884Ter)
NM_004006.2(DMD):c.2804-1G>A
NM_004006.2(DMD):c.3276+1G>A
NM_004006.2(DMD):c.3295C>T(p.Gln1099Ter)
NM_004006.2(DMD):c.336G>A(p.Trp112Ter)
NM_004006.2(DMD):c.3580C>T(p.Gln1194Ter)
NM_004006.2(DMD):c.4117C>T(p.Gln1373Ter)
NM_004006.2(DMD):c.649+1G>A
NM_004006.2(DMD):c.6906G>A(p.Trp2302Ter)
NM_004006.2(DMD):c.7189C>T(p.Gln2397Ter)
NM_004006.2(DMD):c.7309+1G>A
NM_004006.2(DMD):c.7657C>T(p.Arg2553Ter)
NM_004006.2(DMD):c.7682G>A(p.Trp2561Ter)
NM_004006.2(DMD):c.7683G>A(p.Trp2561Ter)
NM_004006.2(DMD):c.7894C>T(p.Gln2632Ter)
NM_004006.2(DMD):c.9361+1G>A
NM_004006.2(DMD):c.9564-1G>A
NM_004006.2(DMD):c.2956C>T(p.Gln986Ter)
NM_004006.2(DMD):c.883C>T(p.Arg295Ter)
NM_004006.2(DMD):c.31+36947G>A
NM_004006.2(DMD):c.10279C>T(p.Gln3427Ter)
NM_004006.2(DMD):c.433C>T(p.Arg145Ter)
NM_004006.2(DMD):c.9G>A(p.Trp3Ter)
NM_004006.2(DMD):c.10171C>T(p.Arg3391Ter)
NM_004006.2(DMD):c.583C>T(p.Arg195Ter)
NM_004006.2(DMD):c.9337C>T(p.Arg3113Ter)
NM_004006.2(DMD):c.8038C>T(p.Arg2680Ter)
NM_004006.2(DMD):c.1812+1G>A
NM_004006.2(DMD):c.1093C>T(p.Gln365Ter)
NM_004006.2(DMD):c.1704+1G>A
NM_004006.2(DMD):c.1912C>T(p.Gln638Ter)
NM_004006.2(DMD):c.133C>T(p.Gln45Ter)
NM_004006.2(DMD):c.5868G>A(p.Trp1956Ter)
NM_004006.2(DMD):c.565C>T(p.Gln189Ter)
NM_004006.2(DMD):c.5089C>T(p.Gln1697Ter)
NM_004006.2(DMD):c.2512C>T(p.Gln838Ter)
NM_004006.2(DMD):c.10477C>T(p.Gln3493Ter)
NM_004006.2(DMD):c.93+1G>A
NM_004006.2(DMD):c.4174C>T(p.Gln1392Ter)
NM_004006.2(DMD):c.3940C>T(p.Arg1314Ter)参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于DMD基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防贝克肌营养不良的方法。
肢带型肌营养不良
在一些实施方案中,本文所述的方法、系统和组合物用于校正与肢带型肌营养不良相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自SGCB、MYOT、LMNA、CAPN3、DYSF、SGCA、TTN、ANO5、TRAPPC11、LMNA、POMT1和FKRP的至少一种基因中,至少包括以下各项:
NM_000232.4(SGCB):c.31C>T(p.Gln11Ter)
NM_006790.2(MYOT):c.164C>T(p.Ser55Phe)
NM_006790.2(MYOT):c.170C>T(p.Thr57Ile)
NM_170707.3(LMNA):c.1488+1G>A
NM_170707.3(LMNA):c.1609-1G>A
NM_000070.2(CAPN3):c.1715G>A(p.Arg572Gln)
NM_000070.2(CAPN3):c.2243G>A(p.Arg748Gln)
NM_000070.2(CAPN3):c.145C>T(p.Arg49Cys)
NM_000070.2(CAPN3):c.1319G>A(p.Arg440Gln)
NM_000070.2(CAPN3):c.1343G>A(p.Arg448His)
NM_000070.2(CAPN3):c.1465C>T(p.Arg489Trp)
NM_000070.2(CAPN3):c.1714C>T(p.Arg572Trp)
NM_000070.2(CAPN3):c.2306G>A(p.Arg769Gln)
NM_000070.2(CAPN3):c.133G>A(p.Ala45Thr)
NM_000070.2(CAPN3):c.499-1G>A
NM_000070.2(CAPN3):c.439C>T(p.Arg147Ter)
NM_000070.2(CAPN3):c.1063C>T(p.Arg355Trp)
NM_000070.2(CAPN3):c.1250C>T(p.Thr417Met)
NM_000070.2(CAPN3):c.245C>T(p.Pro82Leu)
NM_000070.2(CAPN3):c.2242C>T(p.Arg748Ter)
NM_000070.2(CAPN3):c.1318C>T(p.Arg440Trp)
NM_000070.2(CAPN3):c.1333G>A(p.Gly445Arg)
NM_000070.2(CAPN3):c.1957C>T(p.Gln653Ter)
NM_000070.2(CAPN3):c.1801-1G>A
NM_000070.2(CAPN3):c.2263+1G>A
NM_000070.2(CAPN3):c.956C>T(p.Pro319Leu)
NM_000070.2(CAPN3):c.1468C>T(p.Arg490Trp)
NM_000070.2(CAPN3):c.802-9G>A
NM_000070.2(CAPN3):c.1342C>T(p.Arg448Cys)
NM_000070.2(CAPN3):c.1303G>A(p.Glu435Lys)
NM_000070.2(CAPN3):c.1993-1G>A
NM_003494.3(DYSF):c.3113G>A(p.Arg1038Gln)
NM_001130987.1(DYSF):c.5174+1G>A
NM_001130987.1(DYSF):c.159G>A(p.Trp53Ter)
NM_001130987.1(DYSF):c.2929C>T(p.Arg977Trp)
NM_001130987.1(DYSF):c.4282C>T(p.Gln1428Ter)
NM_001130987.1(DYSF):c.1577-1G>A
NM_003494.3(DYSF):c.5529G>A(p.Trp1843Ter)
NM_001130987.1(DYSF):c.1576+1G>A
NM_001130987.1(DYSF):c.4462C>T(p.Gln1488Ter)
NM_003494.3(DYSF):c.5429G>A(p.Arg1810Lys)
NM_003494.3(DYSF):c.5077C>T(p.Arg1693Trp)
NM_001130978.1(DYSF):c.1813C>T(p.Gln605Ter)
NM_003494.3(DYSF):c.3230G>A(p.Trp1077Ter)
NM_003494.3(DYSF):c.265C>T(p.Arg89Ter)
NM_003494.3(DYSF):c.4434G>A(p.Trp1478Ter)
NM_003494.3(DYSF):c.3478C>T(p.Gln1160Ter)
NM_001130987.1(DYSF):c.1372G>A(p.Gly458Arg)
NM_003494.3(DYSF):c.4090C>T(p.Gln1364Ter)
NM_001130987.1(DYSF):c.2409+1G>A
NM_003494.3(DYSF):c.1708C>T(p.Gln570Ter)
NM_003494.3(DYSF):c.1956G>A(p.Trp652Ter)
NM_001130987.1(DYSF):c.5004-1G>A
NM_003494.3(DYSF):c.331C>T(p.Gln111Ter)
NM_001130978.1(DYSF):c.5776C>T(p.Arg1926Ter)
NM_003494.3(DYSF):c.6124C>T(p.Arg2042Cys)
NM_003494.3(DYSF):c.2643+1G>A
NM_003494.3(DYSF):c.4253G>A(p.Gly1418Asp)
NM_003494.3(DYSF):c.610C>T(p.Arg204Ter)
NM_003494.3(DYSF):c.1834C>T(p.Gln612Ter)
NM_003494.3(DYSF):c.5668-7G>A
NM_001130978.1(DYSF):c.3137G>A(p.Arg1046His)
NM_003494.3(DYSF):c.1053+1G>A
NM_003494.3(DYSF):c.1398-1G>A
NM_003494.3(DYSF):c.1481-1G>A
NM_003494.3(DYSF):c.2311C>T(p.Gln771Ter)
NM_003494.3(DYSF):c.2869C>T(p.Gln957Ter)
NM_003494.3(DYSF):c.4756C>T(p.Arg1586Ter)
NM_003494.3(DYSF):c.5509G>A(p.Asp1837Asn)
NM_003494.3(DYSF):c.5644C>T(p.Gln1882Ter)
NM_003494.3(DYSF):c.5946+1G>A
NM_003494.3(DYSF):c.937+1G>A
NM_003494.3(DYSF):c.5266C>T(p.Gln1756Ter)
NM_003494.3(DYSF):c.3832C>T(p.Gln1278Ter)
NM_003494.3(DYSF):c.5525+1G>A
NM_003494.3(DYSF):c.3112C>T(p.Arg1038Ter)
NM_000023.3(SGCA):c.293G>A(p.Arg98His)
NM_000023.3(SGCA):c.850C>T(p.Arg284Cys)
NM_000023.3(SGCA):c.403C>T(p.Gln135Ter)
NM_000023.3(SGCA):c.409G>A(p.Glu137Lys)
NM_000023.3(SGCA):c.747+1G>A
NM_000023.3(SGCA):c.229C>T(p.Arg77Cys)
NM_000023.3(SGCA):c.101G>A(p.Arg34His)
NM_000023.3(SGCA):c.739G>A(p.Val247Met)
NM_001256850.1(TTN):c.87394C>T(p.Arg29132Ter)
NM_213599.2(ANO5):c.762+1G>A
NM_213599.2(ANO5):c.1213C>T(p.Gln405Ter)
NM_213599.2(ANO5):c.1639C>T(p.Arg547Ter)
NM_213599.2(ANO5):c.1406G>A(p.Trp469Ter)
NM_213599.2(ANO5):c.1210C>T(p.Arg404Ter)
NM_213599.2(ANO5):c.2272C>T(p.Arg758Cys)
NM_213599.2(ANO5):c.41-1G>A
NM_213599.2(ANO5):c.172C>T(p.Arg58Trp)
NM_213599.2(ANO5):c.1898+1G>A
NM_021942.5(TRAPPC11):c.1287+5G>A
NM_170707.3(LMNA):c.1608+1G>A
NM_007171.3(POMT1):c.1864C>T(p.Arg622Ter)
NM_024301.4(FKRP):c.313C>T(p.Gln105Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自SGCB、MYOT、LMNA、CAPN3、DYSF、SGCA、TTN、ANO5、TRAPPC11、LMNA、POMT1和FKRP的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防肢带型肌营养不良的方法。
埃-德二氏肌营养不良
在一些实施方案中,本文所述的方法、系统和组合物用于校正与埃-德二氏肌营养不良相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于EMD或SYNE1基因中,至少包括以下各项:
NM_000117.2(EMD):c.3G>A(p.Met1Ile)
NM_033071.3(SYNE1):c.11908C>T(p.Arg3970Ter)
NM_033071.3(SYNE1):c.21721C>T(p.Gln7241Ter)
NM_000117.2(EMD):c.130C>T(p.Gln44Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于EMD或SYNE1基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防埃-德二氏肌营养不良的方法。
面肩肱型肌营养不良
在一些实施方案中,本文所述的方法、系统和组合物用于校正与面肩肱型肌营养不良相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于SMCHD1基因中,至少包括以下各项:
NM_015295.2(SMCHD1):c.3801+1G>A
NM_015295.2(SMCHD1):c.1843-1G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于SMCHD1基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防面肩肱型肌营养不良的方法。
先天性代谢缺损(IEM)
与各种IEM相关联的病原性G至A或C至T突变/SNP已在ClinVar数据库中报告并在表A中公开,这些疾病包括但不限于原发性高草酸尿症1型、精氨酸琥珀酸裂解酶缺乏症、鸟氨酸氨甲酰基转移酶缺乏症和枫糖尿病。因此,本发明的一个方面涉及一种用于校正与如以下所论述的这些疾病中的任一种相关联的一种或多种病原性G至A或C至T突变/SNP的方法。
原发性高草酸尿症1型
在一些实施方案中,本文所述的方法、系统和组合物用于校正与原发性高草酸尿症1型相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于AGXT基因中,至少包括以下各项:
NM_000030.2(AGXT):c.245G>A(p.Gly82Glu)
NM_000030.2(AGXT):c.698G>A(p.Arg233His)
NM_000030.2(AGXT):c.466G>A(p.Gly156Arg)
NM_000030.2(AGXT):c.106C>T(p.Arg36Cys)
NM_000030.2(AGXT):c.346G>A(p.Gly116Arg)
NM_000030.2(AGXT):c.568G>A(p.Gly190Arg)
NM_000030.2(AGXT):c.653C>T(p.Ser218Leu)
NM_000030.2(AGXT):c.737G>A(p.Trp246Ter)
NM_000030.2(AGXT):c.1049G>A(p.Gly350Asp)
NM_000030.2(AGXT):c.473C>T(p.Ser158Leu)
NM_000030.2(AGXT):c.907C>T(p.Gln303Ter)
NM_000030.2(AGXT):c.996G>A(p.Trp332Ter)
NM_000030.2(AGXT):c.508G>A(p.Gly170Arg)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于AGXT基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防原发性高草酸尿症1型的方法。
精氨酸琥珀酸裂解酶缺乏症
在一些实施方案中,本文所述的方法、系统和组合物用于校正与精氨酸琥珀酸裂解酶缺乏症相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于ASL基因中,至少包括以下各项:
NM_001024943.1(ASL):c.1153C>T(p.Arg385Cys)
NM_000048.3(ASL):c.532G>A(p.Val178Met)
NM_000048.3(ASL):c.545G>A(p.Arg182Gln)
NM_000048.3(ASL):c.175G>A(p.Glu59Lys)
NM_000048.3(ASL):c.718+5G>A
NM_000048.3(ASL):c.889C>T(p.Arg297Trp)
NM_000048.3(ASL):c.1360C>T(p.Gln454Ter)
NM_000048.3(ASL):c.1060C>T(p.Gln354Ter)
NM_000048.3(ASL):c.35G>A(p.Arg12Gln)
NM_000048.3(ASL):c.446+1G>A
NM_000048.3(ASL):c.544C>T(p.Arg182Ter)
NM_000048.3(ASL):c.1135C>T(p.Arg379Cys)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于ASL基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防面肩肱型肌营养不良的方法。
鸟氨酸氨甲酰基转移酶缺乏症
在一些实施方案中,本文所述的方法、系统和组合物用于校正与鸟氨酸氨甲酰基转移酶缺乏症相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于OTC基因中,至少包括以下各项:
NM_000531.5(OTC):c.119G>A(p.Arg40His)
NM_000531.5(OTC):c.422G>A(p.Arg141Gln)
NM_000531.5(OTC):c.829C>T(p.Arg277Trp)
NM_000531.5(OTC):c.674C>T(p.Pro225Leu)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于OTC基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防鸟氨酸氨甲酰基转移酶缺乏症的方法。
枫糖尿病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与枫糖尿病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自BCKDHA、BCKDHB、DBT和DLD的至少一种基因中,至少包括以下各项:
NM_000709.3(BCKDHA):c.476G>A(p.Arg159Gln)
NM_183050.3(BCKDHB):c.3G>A(p.Met1Ile)
NM_183050.3(BCKDHB):c.554C>T(p.Pro185Leu)
NM_001918.3(DBT):c.1033G>A(p.Gly345Arg)
NM_000709.3(BCKDHA):c.940C>T(p.Arg314Ter)
NM_000709.3(BCKDHA):c.793C>T(p.Arg265Trp)
NM_000709.3(BCKDHA):c.868G>A(p.Gly290Arg)
NM_000108.4(DLD):c.1123G>A(p.Glu375Lys)
NM_000709.3(BCKDHA):c.1234G>A(p.Val412Met)
NM_000709.3(BCKDHA):c.288+1G>A
NM_000709.3(BCKDHA):c.979G>A(p.Glu327Lys)
NM_001918.3(DBT):c.901C>T(p.Arg301Cys)
NM_183050.3(BCKDHB):c.509G>A(p.Arg170His)
NM_183050.3(BCKDHB):c.799C>T(p.Gln267Ter)
NM_183050.3(BCKDHB):c.853C>T(p.Arg285Ter)
NM_183050.3(BCKDHB):c.970C>T(p.Arg324Ter)
NM_183050.3(BCKDHB):c.832G>A(p.Gly278Ser)
NM_000709.3(BCKDHA):c.1036C>T(p.Arg346Cys)
NM_000709.3(BCKDHA):c.288+9C>T
NM_000709.3(BCKDHA):c.632C>T(p.Thr211Met)
NM_000709.3(BCKDHA):c.659C>T(p.Ala220Val)
NM_000709.3(BCKDHA):c.964C>T(p.Gln322Ter)
NM_001918.3(DBT):c.1291C>T(p.Arg431Ter)
NM_001918.3(DBT):c.251G>A(p.Trp84Ter)
NM_001918.3(DBT):c.871C>T(p.Arg291Ter)
NM_000056.4(BCKDHB):c.1016C>T(p.Ser339Leu)
NM_000056.4(BCKDHB):c.344-1G>A
NM_000056.4(BCKDHB):c.633+1G>A
NM_000056.4(BCKDHB):c.952-1G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自BCKDHA、BCKDHB、DBT和DLD的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防枫糖尿病的方法。
癌症相关疾病
与各种癌症和癌症相关疾病相关联的病原性G至A或C至T突变/SNP已在ClinVar数据库中报告并在表A中公开,这些疾病包括但不限于乳腺癌-卵巢癌和林奇综合征(Lynchsyndrome)。因此,本发明的一个方面涉及一种用于校正与如以下所论述的这些疾病中的任一种相关联的一种或多种病原性G至A或C至T突变/SNP的方法。
乳腺癌-卵巢癌
在一些实施方案中,本文所述的方法、系统和组合物用于校正与乳腺癌-卵巢癌相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于BRCA1或BRCA2基因中,至少包括以下各项:
NM_007294.3(BRCA1):c.5095C>T(p.Arg1699Trp)
NM_000059.3(BRCA2):c.7558C>T(p.Arg2520Ter)
NM_007294.3(BRCA1):c.2572C>T(p.Gln858Ter)
NM_007294.3(BRCA1):c.3607C>T(p.Arg1203Ter)
NM_007294.3(BRCA1):c.5503C>T(p.Arg1835Ter)
NM_007294.3(BRCA1):c.2059C>T(p.Gln687Ter)
NM_007294.3(BRCA1):c.4675+1G>A
NM_007294.3(BRCA1):c.5251C>T(p.Arg1751Ter)
NM_007294.3(BRCA1):c.5444G>A(p.Trp1815Ter)
NM_000059.3(BRCA2):c.9318G>A(p.Trp3106Ter)
NM_000059.3(BRCA2):c.9382C>T(p.Arg3128Ter)
NM_000059.3(BRCA2):c.274C>T(p.Gln92Ter)
NM_000059.3(BRCA2):c.6952C>T(p.Arg2318Ter)
NM_007294.3(BRCA1):c.1687C>T(p.Gln563Ter)
NM_007294.3(BRCA1):c.2599C>T(p.Gln867Ter)
NM_007294.3(BRCA1):c.784C>T(p.Gln262Ter)
NM_007294.3(BRCA1):c.280C>T(p.Gln94Ter)
NM_007294.3(BRCA1):c.5542C>T(p.Gln1848Ter)
NM_007294.3(BRCA1):c.5161C>T(p.Gln1721Ter)
NM_007294.3(BRCA1):c.4573C>T(p.Gln1525Ter)
NM_007294.3(BRCA1):c.4270C>T(p.Gln1424Ter)
NM_007294.3(BRCA1):c.4225C>T(p.Gln1409Ter)
NM_007294.3(BRCA1):c.4066C>T(p.Gln1356Ter)
NM_007294.3(BRCA1):c.3679C>T(p.Gln1227Ter)
NM_007294.3(BRCA1):c.1918C>T(p.Gln640Ter)
NM_007294.3(BRCA1):c.963G>A(p.Trp321Ter)
NM_007294.3(BRCA1):c.718C>T(p.Gln240Ter)
NM_000059.3(BRCA2):c.9196C>T(p.Gln3066Ter)
NM_000059.3(BRCA2):c.9154C>T(p.Arg3052Trp)
NM_007294.3(BRCA1):c.3991C>T(p.Gln1331Ter)
NM_007294.3(BRCA1):c.4097-1G>A
NM_007294.3(BRCA1):c.1059G>A(p.Trp353Ter)
NM_007294.3(BRCA1):c.1115G>A(p.Trp372Ter)
NM_007294.3(BRCA1):c.1138C>T(p.Gln380Ter)
NM_007294.3(BRCA1):c.1612C>T(p.Gln538Ter)
NM_007294.3(BRCA1):c.1621C>T(p.Gln541Ter)
NM_007294.3(BRCA1):c.1630C>T(p.Gln544Ter)
NM_007294.3(BRCA1):c.178C>T(p.Gln60Ter)
NM_007294.3(BRCA1):c.1969C>T(p.Gln657Ter)
NM_007294.3(BRCA1):c.2275C>T(p.Gln759Ter)
NM_007294.3(BRCA1):c.2410C>T(p.Gln804Ter)
NM_007294.3(BRCA1):c.2869C>T(p.Gln957Ter)
NM_007294.3(BRCA1):c.2923C>T(p.Gln975Ter)
NM_007294.3(BRCA1):c.3268C>T(p.Gln1090Ter)
NM_007294.3(BRCA1):c.3430C>T(p.Gln1144Ter)
NM_007294.3(BRCA1):c.3544C>T(p.Gln1182Ter)
NM_007294.3(BRCA1):c.4075C>T(p.Gln1359Ter)
NM_007294.3(BRCA1):c.4201C>T(p.Gln1401Ter)
NM_007294.3(BRCA1):c.4399C>T(p.Gln1467Ter)
NM_007294.3(BRCA1):c.4552C>T(p.Gln1518Ter)
NM_007294.3(BRCA1):c.5054C>T(p.Thr1685Ile)
NM_007294.3(BRCA1):c.514C>T(p.Gln172Ter)
NM_007294.3(BRCA1):c.5239C>T(p.Gln1747Ter)
NM_007294.3(BRCA1):c.5266C>T(p.Gln1756Ter)
NM_007294.3(BRCA1):c.5335C>T(p.Gln1779Ter)
NM_007294.3(BRCA1):c.5345G>A(p.Trp1782Ter)
NM_007294.3(BRCA1):c.5511G>A(p.Trp1837Ter)
NM_007294.3(BRCA1):c.5536C>T(p.Gln1846Ter)
NM_007294.3(BRCA1):c.55C>T(p.Gln19Ter)
NM_007294.3(BRCA1):c.949C>T(p.Gln317Ter)
NM_007294.3(BRCA1):c.928C>T(p.Gln310Ter)
NM_007294.3(BRCA1):c.5117G>A(p.Gly1706Glu)
NM_007294.3(BRCA1):c.5136G>A(p.Trp1712Ter)
NM_007294.3(BRCA1):c.4327C>T(p.Arg1443Ter)
NM_007294.3(BRCA1):c.1471C>T(p.Gln491Ter)
NM_007294.3(BRCA1):c.1576C>T(p.Gln526Ter)
NM_007294.3(BRCA1):c.160C>T(p.Gln54Ter)
NM_007294.3(BRCA1):c.2683C>T(p.Gln895Ter)
NM_007294.3(BRCA1):c.2761C>T(p.Gln921Ter)
NM_007294.3(BRCA1):c.3895C>T(p.Gln1299Ter)
NM_007294.3(BRCA1):c.4339C>T(p.Gln1447Ter)
NM_007294.3(BRCA1):c.4372C>T(p.Gln1458Ter)
NM_007294.3(BRCA1):c.5153G>A(p.Trp1718Ter)
NM_007294.3(BRCA1):c.5445G>A(p.Trp1815Ter)
NM_007294.3(BRCA1):c.5510G>A(p.Trp1837Ter)
NM_007294.3(BRCA1):c.5346G>A(p.Trp1782Ter)
NM_007294.3(BRCA1):c.1116G>A(p.Trp372Ter)
NM_007294.3(BRCA1):c.1999C>T(p.Gln667Ter)
NM_007294.3(BRCA1):c.4183C>T(p.Gln1395Ter)
NM_007294.3(BRCA1):c.4810C>T(p.Gln1604Ter)
NM_007294.3(BRCA1):c.850C>T(p.Gln284Ter)
NM_007294.3(BRCA1):c.1058G>A(p.Trp353Ter)
NM_007294.3(BRCA1):c.131G>A(p.Cys44Tyr)
NM_007294.3(BRCA1):c.1600C>T(p.Gln534Ter)
NM_007294.3(BRCA1):c.3286C>T(p.Gln1096Ter)
NM_007294.3(BRCA1):c.3403C>T(p.Gln1135Ter)
NM_007294.3(BRCA1):c.34C>T(p.Gln12Ter)
NM_007294.3(BRCA1):c.4258C>T(p.Gln1420Ter)
NM_007294.3(BRCA1):c.4609C>T(p.Gln1537Ter)
NM_007294.3(BRCA1):c.5154G>A(p.Trp1718Ter)
NM_007294.3(BRCA1):c.5431C>T(p.Gln1811Ter)
NM_007294.3(BRCA1):c.241C>T(p.Gln81Ter)
NM_007294.3(BRCA1):c.3331C>T(p.Gln1111Ter)
NM_007294.3(BRCA1):c.3967C>T(p.Gln1323Ter)
NM_007294.3(BRCA1):c.415C>T(p.Gln139Ter)
NM_007294.3(BRCA1):c.505C>T(p.Gln169Ter)
NM_007294.3(BRCA1):c.5194-12G>A
NM_007294.3(BRCA1):c.5212G>A(p.Gly1738Arg)
NM_007294.3(BRCA1):c.5332+1G>A
NM_007294.3(BRCA1):c.1480C>T(p.Gln494Ter)
NM_007294.3(BRCA1):c.2563C>T(p.Gln855Ter)
NM_007294.3(BRCA1):c.1066C>T(p.Gln356Ter)
NM_007294.3(BRCA1):c.3718C>T(p.Gln1240Ter)
NM_007294.3(BRCA1):c.3817C>T(p.Gln1273Ter)
NM_007294.3(BRCA1):c.3937C>T(p.Gln1313Ter)
NM_007294.3(BRCA1):c.4357+1G>A
NM_007294.3(BRCA1):c.5074+1G>A
NM_007294.3(BRCA1):c.5277+1G>A
NM_007294.3(BRCA1):c.2338C>T(p.Gln780Ter)
NM_007294.3(BRCA1):c.3598C>T(p.Gln1200Ter)
NM_007294.3(BRCA1):c.3841C>T(p.Gln1281Ter)
NM_007294.3(BRCA1):c.4222C>T(p.Gln1408Ter)
NM_007294.3(BRCA1):c.4524G>A(p.Trp1508Ter)
NM_007294.3(BRCA1):c.5353C>T(p.Gln1785Ter)
NM_007294.3(BRCA1):c.962G>A(p.Trp321Ter)
NM_007294.3(BRCA1):c.220C>T(p.Gln74Ter)
NM_007294.3(BRCA1):c.2713C>T(p.Gln905Ter)
NM_007294.3(BRCA1):c.2800C>T(p.Gln934Ter)
NM_007294.3(BRCA1):c.4612C>T(p.Gln1538Ter)
NM_007294.3(BRCA1):c.3352C>T(p.Gln1118Ter)
NM_007294.3(BRCA1):c.4834C>T(p.Gln1612Ter)
NM_007294.3(BRCA1):c.4523G>A(p.Trp1508Ter)
NM_007294.3(BRCA1):c.5135G>A(p.Trp1712Ter)
NM_007294.3(BRCA1):c.1155G>A(p.Trp385Ter)
NM_007294.3(BRCA1):c.4987-1G>A
NM_000059.3(BRCA2):c.9573G>A(p.Trp3191Ter)
NM_000059.3(BRCA2):c.1945C>T(p.Gln649Ter)
NM_000059.3(BRCA2):c.217C>T(p.Gln73Ter)
NM_000059.3(BRCA2):c.523C>T(p.Gln175Ter)
NM_000059.3(BRCA2):c.2548C>T(p.Gln850Ter)
NM_000059.3(BRCA2):c.2905C>T(p.Gln969Ter)
NM_000059.3(BRCA2):c.4689G>A(p.Trp1563Ter)
NM_000059.3(BRCA2):c.4972C>T(p.Gln1658Ter)
NM_000059.3(BRCA2):c.1184G>A(p.Trp395Ter)
NM_000059.3(BRCA2):c.2137C>T(p.Gln713Ter)
NM_000059.3(BRCA2):c.3217C>T(p.Gln1073Ter)
NM_000059.3(BRCA2):c.3523C>T(p.Gln1175Ter)
NM_000059.3(BRCA2):c.4783C>T(p.Gln1595Ter)
NM_000059.3(BRCA2):c.5800C>T(p.Gln1934Ter)
NM_000059.3(BRCA2):c.6478C>T(p.Gln2160Ter)
NM_000059.3(BRCA2):c.7033C>T(p.Gln2345Ter)
NM_000059.3(BRCA2):c.7495C>T(p.Gln2499Ter)
NM_000059.3(BRCA2):c.7501C>T(p.Gln2501Ter)
NM_000059.3(BRCA2):c.7887G>A(p.Trp2629Ter)
NM_000059.3(BRCA2):c.8910G>A(p.Trp2970Ter)
NM_000059.3(BRCA2):c.9139C>T(p.Gln3047Ter)
NM_000059.3(BRCA2):c.9739C>T(p.Gln3247Ter)
NM_000059.3(BRCA2):c.582G>A(p.Trp194Ter)
NM_000059.3(BRCA2):c.7963C>T(p.Gln2655Ter)
NM_000059.3(BRCA2):c.8695C>T(p.Gln2899Ter)
NM_000059.3(BRCA2):c.8869C>T(p.Gln2957Ter)
NM_000059.3(BRCA2):c.1117C>T(p.Gln373Ter)
NM_000059.3(BRCA2):c.1825C>T(p.Gln609Ter)
NM_000059.3(BRCA2):c.2455C>T(p.Gln819Ter)
NM_000059.3(BRCA2):c.2881C>T(p.Gln961Ter)
NM_000059.3(BRCA2):c.3265C>T(p.Gln1089Ter)
NM_000059.3(BRCA2):c.3283C>T(p.Gln1095Ter)
NM_000059.3(BRCA2):c.3442C>T(p.Gln1148Ter)
NM_000059.3(BRCA2):c.3871C>T(p.Gln1291Ter)
NM_000059.3(BRCA2):c.439C>T(p.Gln147Ter)
NM_000059.3(BRCA2):c.4525C>T(p.Gln1509Ter)
NM_000059.3(BRCA2):c.475+1G>A
NM_000059.3(BRCA2):c.5344C>T(p.Gln1782Ter)
NM_000059.3(BRCA2):c.5404C>T(p.Gln1802Ter)
NM_000059.3(BRCA2):c.5773C>T(p.Gln1925Ter)
NM_000059.3(BRCA2):c.5992C>T(p.Gln1998Ter)
NM_000059.3(BRCA2):c.6469C>T(p.Gln2157Ter)
NM_000059.3(BRCA2):c.7261C>T(p.Gln2421Ter)
NM_000059.3(BRCA2):c.7303C>T(p.Gln2435Ter)
NM_000059.3(BRCA2):c.7471C>T(p.Gln2491Ter)
NM_000059.3(BRCA2):c.7681C>T(p.Gln2561Ter)
NM_000059.3(BRCA2):c.7738C>T(p.Gln2580Ter)
NM_000059.3(BRCA2):c.7886G>A(p.Trp2629Ter)
NM_000059.3(BRCA2):c.8140C>T(p.Gln2714Ter)
NM_000059.3(BRCA2):c.8363G>A(p.Trp2788Ter)
NM_000059.3(BRCA2):c.8572C>T(p.Gln2858Ter)
NM_000059.3(BRCA2):c.8773C>T(p.Gln2925Ter)
NM_000059.3(BRCA2):c.8821C>T(p.Gln2941Ter)
NM_000059.3(BRCA2):c.9109C>T(p.Gln3037Ter)
NM_000059.3(BRCA2):c.9317G>A(p.Trp3106Ter)
NM_000059.3(BRCA2):c.9466C>T(p.Gln3156Ter)
NM_000059.3(BRCA2):c.9572G>A(p.Trp3191Ter)
NM_000059.3(BRCA2):c.8490G>A(p.Trp2830Ter)
NM_000059.3(BRCA2):c.5980C>T(p.Gln1994Ter)
NM_000059.3(BRCA2):c.7721G>A(p.Trp2574Ter)
NM_000059.3(BRCA2):c.196C>T(p.Gln66Ter)
NM_000059.3(BRCA2):c.7618-1G>A
NM_000059.3(BRCA2):c.8489G>A(p.Trp2830Ter)
NM_000059.3(BRCA2):c.7857G>A(p.Trp2619Ter)
NM_000059.3(BRCA2):c.1261C>T(p.Gln421Ter)
NM_000059.3(BRCA2):c.1456C>T(p.Gln486Ter)
NM_000059.3(BRCA2):c.3319C>T(p.Gln1107Ter)
NM_000059.3(BRCA2):c.5791C>T(p.Gln1931Ter)
NM_000059.3(BRCA2):c.6070C>T(p.Gln2024Ter)
NM_000059.3(BRCA2):c.7024C>T(p.Gln2342Ter)
NM_000059.3(BRCA2):c.961C>T(p.Gln321Ter)
NM_000059.3(BRCA2):c.9380G>A(p.Trp3127Ter)
NM_000059.3(BRCA2):c.8364G>A(p.Trp2788Ter)
NM_000059.3(BRCA2):c.7758G>A(p.Trp2586Ter)
NM_000059.3(BRCA2):c.2224C>T(p.Gln742Ter)
NM_000059.3(BRCA2):c.5101C>T(p.Gln1701Ter)
NM_000059.3(BRCA2):c.5959C>T(p.Gln1987Ter)
NM_000059.3(BRCA2):c.7060C>T(p.Gln2354Ter)
NM_000059.3(BRCA2):c.9100C>T(p.Gln3034Ter)
NM_000059.3(BRCA2):c.9148C>T(p.Gln3050Ter)
NM_000059.3(BRCA2):c.9883C>T(p.Gln3295Ter)
NM_000059.3(BRCA2):c.1414C>T(p.Gln472Ter)
NM_000059.3(BRCA2):c.1689G>A(p.Trp563Ter)
NM_000059.3(BRCA2):c.581G>A(p.Trp194Ter)
NM_000059.3(BRCA2):c.6490C>T(p.Gln2164Ter)
NM_000059.3(BRCA2):c.7856G>A(p.Trp2619Ter)
NM_000059.3(BRCA2):c.8970G>A(p.Trp2990Ter)
NM_000059.3(BRCA2):c.92G>A(p.Trp31Ter)
NM_000059.3(BRCA2):c.9376C>T(p.Gln3126Ter)
NM_000059.3(BRCA2):c.93G>A(p.Trp31Ter)
NM_000059.3(BRCA2):c.1189C>T(p.Gln397Ter)
NM_000059.3(BRCA2):c.2818C>T(p.Gln940Ter)
NM_000059.3(BRCA2):c.2979G>A(p.Trp993Ter)
NM_000059.3(BRCA2):c.3166C>T(p.Gln1056Ter)
NM_000059.3(BRCA2):c.4285C>T(p.Gln1429Ter)
NM_000059.3(BRCA2):c.6025C>T(p.Gln2009Ter)
NM_000059.3(BRCA2):c.772C>T(p.Gln258Ter)
NM_000059.3(BRCA2):c.7877G>A(p.Trp2626Ter)
NM_000059.3(BRCA2):c.3109C>T(p.Gln1037Ter)
NM_000059.3(BRCA2):c.4222C>T(p.Gln1408Ter)
NM_000059.3(BRCA2):c.7480C>T(p.Arg2494Ter)
NM_000059.3(BRCA2):c.7878G>A(p.Trp2626Ter)
NM_000059.3(BRCA2):c.9076C>T(p.Gln3026Ter)
NM_000059.3(BRCA2):c.1855C>T(p.Gln619Ter)
NM_000059.3(BRCA2):c.4111C>T(p.Gln1371Ter)
NM_000059.3(BRCA2):c.5656C>T(p.Gln1886Ter)
NM_000059.3(BRCA2):c.7757G>A(p.Trp2586Ter)
NM_000059.3(BRCA2):c.8243G>A(p.Gly2748Asp)
NM_000059.3(BRCA2):c.8878C>T(p.Gln2960Ter)
NM_000059.3(BRCA2):c.8487+1G>A
NM_000059.3(BRCA2):c.8677C>T(p.Gln2893Ter)
NM_000059.3(BRCA2):c.250C>T(p.Gln84Ter)
NM_000059.3(BRCA2):c.6124C>T(p.Gln2042Ter)
NM_000059.3(BRCA2):c.7617+1G>A
NM_000059.3(BRCA2):c.8575C>T(p.Gln2859Ter)
NM_000059.3(BRCA2):c.8174G>A(p.Trp2725Ter)
NM_000059.3(BRCA2):c.3187C>T(p.Gln1063Ter)
NM_000059.3(BRCA2):c.9381G>A(p.Trp3127Ter)
NM_000059.3(BRCA2):c.2095C>T(p.Gln699Ter)
NM_000059.3(BRCA2):c.1642C>T(p.Gln548Ter)
NM_000059.3(BRCA2):c.8608C>T(p.Gln2870Ter)
NM_000059.3(BRCA2):c.3412C>T(p.Gln1138Ter)
NM_000059.3(BRCA2):c.4246C>T(p.Gln1416Ter)
NM_000059.3(BRCA2):c.6475C>T(p.Gln2159Ter)
NM_000059.3(BRCA2):c.7366C>T(p.Gln2456Ter)
NM_000059.3(BRCA2):c.7516C>T(p.Gln2506Ter)
NM_000059.3(BRCA2):c.8969G>A(p.Trp2990Ter)
NM_000059.3(BRCA2):c.6487C>T(p.Gln2163Ter)
NM_000059.3(BRCA2):c.2978G>A(p.Trp993Ter)
NM_000059.3(BRCA2):c.7615C>T(p.Gln2539Ter)
NM_000059.3(BRCA2):c.9106C>T(p.Gln3036Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于BRCA1或BRCA2基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防乳腺癌-卵巢癌的方法。
林奇综合征
在一些实施方案中,本文所述的方法、系统和组合物用于校正与林奇综合征相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自MSH6、MSH2、EPCAM、PMS2和MLH1的至少一种基因中,至少包括以下各项:
NM_000179.2(MSH6):c.1045C>T(p.Gln349Ter)
NM_000251.2(MSH2):c.1384C>T(p.Gln462Ter)
NM_002354.2(EPCAM):c.133C>T(p.Gln45Ter)
NM_002354.2(EPCAM):c.429G>A(p.Trp143Ter)
NM_002354.2(EPCAM):c.523C>T(p.Gln175Ter)
NM_000179.2(MSH6):c.2680C>T(p.Gln894Ter)
NM_000251.2(MSH2):c.350G>A(p.Trp117Ter)
NM_000179.2(MSH6):c.2735G>A(p.Trp912Ter)
NM_000179.2(MSH6):c.3556+1G>A
NM_000251.2(MSH2):c.388C>T(p.Gln130Ter)
NM_000535.6(PMS2):c.1912C>T(p.Gln638Ter)
NM_000535.6(PMS2):c.1891C>T(p.Gln631Ter)
NM_000249.3(MLH1):c.454-1G>A
NM_000251.2(MSH2):c.1030C>T(p.Gln344Ter)
NM_000179.2(MSH6):c.2330G>A(p.Trp777Ter)
NM_000179.2(MSH6):c.2191C>T(p.Gln731Ter)
NM_000179.2(MSH6):c.2764C>T(p.Arg922Ter)
NM_000179.2(MSH6):c.2815C>T(p.Gln939Ter)
NM_000179.2(MSH6):c.3020G>A(p.Trp1007Ter)
NM_000179.2(MSH6):c.3436C>T(p.Gln1146Ter)
NM_000179.2(MSH6):c.3647-1G>A
NM_000179.2(MSH6):c.3772C>T(p.Gln1258Ter)
NM_000179.2(MSH6):c.3838C>T(p.Gln1280Ter)
NM_000179.2(MSH6):c.706C>T(p.Gln236Ter)
NM_000179.2(MSH6):c.730C>T(p.Gln244Ter)
NM_000249.3(MLH1):c.1171C>T(p.Gln391Ter)
NM_000249.3(MLH1):c.1192C>T(p.Gln398Ter)
NM_000249.3(MLH1):c.1225C>T(p.Gln409Ter)
NM_000249.3(MLH1):c.1276C>T(p.Gln426Ter)
NM_000249.3(MLH1):c.1528C>T(p.Gln510Ter)
NM_000249.3(MLH1):c.1609C>T(p.Gln537Ter)
NM_000249.3(MLH1):c.1613G>A(p.Trp538Ter)
NM_000249.3(MLH1):c.1614G>A(p.Trp538Ter)
NM_000249.3(MLH1):c.1624C>T(p.Gln542Ter)
NM_000249.3(MLH1):c.1684C>T(p.Gln562Ter)
NM_000249.3(MLH1):c.1731+1G>A
NM_000249.3(MLH1):c.1731+5G>A
NM_000249.3(MLH1):c.1732-1G>A
NM_000249.3(MLH1):c.1896G>A(p.Glu632=)
NM_000249.3(MLH1):c.1989+1G>A
NM_000249.3(MLH1):c.1990-1G>A
NM_000249.3(MLH1):c.1998G>A(p.Trp666Ter)
NM_000249.3(MLH1):c.208-1G>A
NM_000249.3(MLH1):c.2101C>T(p.Gln701Ter)
NM_000249.3(MLH1):c.2136G>A(p.Trp712Ter)
NM_000249.3(MLH1):c.2224C>T(p.Gln742Ter)
NM_000249.3(MLH1):c.230G>A(p.Cys77Tyr)
NM_000249.3(MLH1):c.256C>T(p.Gln86Ter)
NM_000249.3(MLH1):c.436C>T(p.Gln146Ter)
NM_000249.3(MLH1):c.445C>T(p.Gln149Ter)
NM_000249.3(MLH1):c.545G>A(p.Arg182Lys)
NM_000249.3(MLH1):c.731G>A(p.Gly244Asp)
NM_000249.3(MLH1):c.76C>T(p.Gln26Ter)
NM_000249.3(MLH1):c.842C>T(p.Ala281Val)
NM_000249.3(MLH1):c.882C>T(p.Leu294=)
NM_000249.3(MLH1):c.901C>T(p.Gln301Ter)
NM_000251.2(MSH2):c.1013G>A(p.Gly338Glu)
NM_000251.2(MSH2):c.1034G>A(p.Trp345Ter)
NM_000251.2(MSH2):c.1129C>T(p.Gln377Ter)
NM_000251.2(MSH2):c.1183C>T(p.Gln395Ter)
NM_000251.2(MSH2):c.1189C>T(p.Gln397Ter)
NM_000251.2(MSH2):c.1204C>T(p.Gln402Ter)
NM_000251.2(MSH2):c.1276+1G>A
NM_000251.2(MSH2):c.1528C>T(p.Gln510Ter)
NM_000251.2(MSH2):c.1552C>T(p.Gln518Ter)
NM_000251.2(MSH2):c.1720C>T(p.Gln574Ter)
NM_000251.2(MSH2):c.1777C>T(p.Gln593Ter)
NM_000251.2(MSH2):c.1885C>T(p.Gln629Ter)
NM_000251.2(MSH2):c.2087C>T(p.Pro696Leu)
NM_000251.2(MSH2):c.2251G>A(p.Gly751Arg)
NM_000251.2(MSH2):c.2291G>A(p.Trp764Ter)
NM_000251.2(MSH2):c.2292G>A(p.Trp764Ter)
NM_000251.2(MSH2):c.2446C>T(p.Gln816Ter)
NM_000251.2(MSH2):c.2470C>T(p.Gln824Ter)
NM_000251.2(MSH2):c.2536C>T(p.Gln846Ter)
NM_000251.2(MSH2):c.2581C>T(p.Gln861Ter)
NM_000251.2(MSH2):c.2634G>A(p.Glu878=)
NM_000251.2(MSH2):c.2635C>T(p.Gln879Ter)
NM_000251.2(MSH2):c.28C>T(p.Gln10Ter)
NM_000251.2(MSH2):c.472C>T(p.Gln158Ter)
NM_000251.2(MSH2):c.478C>T(p.Gln160Ter)
NM_000251.2(MSH2):c.484G>A(p.Gly162Arg)
NM_000251.2(MSH2):c.490G>A(p.Gly164Arg)
NM_000251.2(MSH2):c.547C>T(p.Gln183Ter)
NM_000251.2(MSH2):c.577C>T(p.Gln193Ter)
NM_000251.2(MSH2):c.643C>T(p.Gln215Ter)
NM_000251.2(MSH2):c.645+1G>A
NM_000251.2(MSH2):c.652C>T(p.Gln218Ter)
NM_000251.2(MSH2):c.754C>T(p.Gln252Ter)
NM_000251.2(MSH2):c.792+1G>A
NM_000251.2(MSH2):c.942G>A(p.Gln314=)
NM_000535.6(PMS2):c.949C>T(p.Gln317Ter)
NM_000249.3(MLH1):c.306+1G>A
NM_000249.3(MLH1):c.62C>T(p.Ala21Val)
NM_000251.2(MSH2):c.1865C>T(p.Pro622Leu)
NM_000179.2(MSH6):c.426G>A(p.Trp142Ter)
NM_000251.2(MSH2):c.715C>T(p.Gln239Ter)
NM_000249.3(MLH1):c.350C>T(p.Thr117Met)
NM_000251.2(MSH2):c.1915C>T(p.His639Tyr)
NM_000251.2(MSH2):c.289C>T(p.Gln97Ter)
NM_000251.2(MSH2):c.2785C>T(p.Arg929Ter)
NM_000249.3(MLH1):c.131C>T(p.Ser44Phe)
NM_000249.3(MLH1):c.1219C>T(p.Gln407Ter)
NM_000249.3(MLH1):c.306+5G>A
NM_000251.2(MSH2):c.1801C>T(p.Gln601Ter)
NM_000535.6(PMS2):c.1144+1G>A
NM_000251.2(MSH2):c.1984C>T(p.Gln662Ter)
NM_000249.3(MLH1):c.381-1G>A
NM_000535.6(PMS2):c.631C>T(p.Arg211Ter)
NM_000251.2(MSH2):c.790C>T(p.Gln264Ter)
NM_000251.2(MSH2):c.366+1G>A
NM_000249.3(MLH1):c.298C>T(p.Arg100Ter)
NM_000179.2(MSH6):c.3013C>T(p.Arg1005Ter)
NM_000179.2(MSH6):c.694C>T(p.Gln232Ter)
NM_000179.2(MSH6):c.742C>T(p.Arg248Ter)
NM_000249.3(MLH1):c.1039-1G>A
NM_000249.3(MLH1):c.142C>T(p.Gln48Ter)
NM_000249.3(MLH1):c.1790G>A(p.Trp597Ter)
NM_000249.3(MLH1):c.1961C>T(p.Pro654Leu)
NM_000249.3(MLH1):c.2103+1G>A
NM_000249.3(MLH1):c.2135G>A(p.Trp712Ter)
NM_000249.3(MLH1):c.588+5G>A
NM_000249.3(MLH1):c.790+1G>A
NM_000251.2(MSH2):c.1035G>A(p.Trp345Ter)
NM_000251.2(MSH2):c.1255C>T(p.Gln419Ter)
NM_000251.2(MSH2):c.1861C>T(p.Arg621Ter)
NM_000251.2(MSH2):c.226C>T(p.Gln76Ter)
NM_000251.2(MSH2):c.2653C>T(p.Gln885Ter)
NM_000251.2(MSH2):c.508C>T(p.Gln170Ter)
NM_000251.2(MSH2):c.862C>T(p.Gln288Ter)
NM_000251.2(MSH2):c.892C>T(p.Gln298Ter)
NM_000251.2(MSH2):c.970C>T(p.Gln324Ter)
NM_000179.2(MSH6):c.4001G>A(p.Arg1334Gln)
NM_000251.2(MSH2):c.1662-1G>A
NM_000535.6(PMS2):c.1882C>T(p.Arg628Ter)
NM_000535.6(PMS2):c.2174+1G>A
NM_000535.6(PMS2):c.2404C>T(p.Arg802Ter)
NM_000179.2(MSH6):c.3991C>T(p.Arg1331Ter)
NM_000179.2(MSH6):c.2503C>T(p.Gln835Ter)
NM_000179.2(MSH6):c.718C>T(p.Arg240Ter)
NM_000249.3(MLH1):c.1038G>A(p.Gln346=)
NM_000249.3(MLH1):c.245C>T(p.Thr82Ile)
NM_000249.3(MLH1):c.83C>T(p.Pro28Leu)
NM_000249.3(MLH1):c.884G>A(p.Ser295Asn)
NM_000249.3(MLH1):c.982C>T(p.Gln328Ter)
NM_000251.2(MSH2):c.1046C>T(p.Pro349Leu)
NM_000251.2(MSH2):c.1120C>T(p.Gln374Ter)
NM_000251.2(MSH2):c.1285C>T(p.Gln429Ter)
NM_000251.2(MSH2):c.1477C>T(p.Gln493Ter)
NM_000251.2(MSH2):c.2152C>T(p.Gln718Ter)
NM_000535.6(PMS2):c.703C>T(p.Gln235Ter)
NM_000249.3(MLH1):c.2141G>A(p.Trp714Ter)
NM_000251.2(MSH2):c.1009C>T(p.Gln337Ter)
NM_000251.2(MSH2):c.1216C>T(p.Arg406Ter)
NM_000179.2(MSH6):c.3202C>T(p.Arg1068Ter)
NM_000251.2(MSH2):c.1165C>T(p.Arg389Ter)
NM_000249.3(MLH1):c.1943C>T(p.Pro648Leu)
NM_000249.3(MLH1):c.200G>A(p.Gly67Glu)
NM_000249.3(MLH1):c.793C>T(p.Arg265Cys)
NM_000249.3(MLH1):c.2059C>T(p.Arg687Trp)
NM_000249.3(MLH1):c.677G>A(p.Arg226Gln)
NM_000249.3(MLH1):c.2041G>A(p.Ala681Thr)
NM_000249.3(MLH1):c.1942C>T(p.Pro648Ser)
NM_000249.3(MLH1):c.676C>T(p.Arg226Ter)
NM_000251.2(MSH2):c.2038C>T(p.Arg680Ter)
NM_000179.2(MSH6):c.1483C>T(p.Arg495Ter)
NM_000179.2(MSH6):c.2194C>T(p.Arg732Ter)
NM_000179.2(MSH6):c.3103C>T(p.Arg1035Ter)
NM_000179.2(MSH6):c.892C>T(p.Arg298Ter)
NM_000249.3(MLH1):c.1459C>T(p.Arg487Ter)
NM_000249.3(MLH1):c.1731G>A(p.Ser577=)
NM_000249.3(MLH1):c.184C>T(p.Gln62Ter)
NM_000249.3(MLH1):c.1975C>T(p.Arg659Ter)
NM_000249.3(MLH1):c.199G>A(p.Gly67Arg)
NM_000251.2(MSH2):c.1076+1G>A
NM_000251.2(MSH2):c.1147C>T(p.Arg383Ter)
NM_000251.2(MSH2):c.181C>T(p.Gln61Ter)
NM_000251.2(MSH2):c.212-1G>A
NM_000251.2(MSH2):c.2131C>T(p.Arg711Ter)
NM_000535.6(PMS2):c.697C>T(p.Gln233Ter)
NM_000535.6(PMS2):c.1261C>T(p.Arg421Ter)
NM_000251.2(MSH2):c.2047G>A(p.Gly683Arg)
NM_000535.6(PMS2):c.400C>T(p.Arg134Ter)
NM_000535.6(PMS2):c.1927C>T(p.Gln643Ter)
NM_000179.2(MSH6):c.1444C>T(p.Arg482Ter)
NM_000179.2(MSH6):c.2731C>T(p.Arg911Ter)
NM_000535.6(PMS2):c.943C>T(p.Arg315Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自BCKDHA、BCKDHB、DBT和DLD的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防林奇综合征的方法。
其他遗传疾病
与其他遗传疾病相关联的病原性G至A或C至T突变/SNP已在ClinVar数据库中报告并在表A中公开,这些疾病包括但不限于马凡综合征、赫尔勒综合征(Hurler syndrome)、糖原贮积病和囊性纤维化。因此,本发明的一个方面涉及一种用于校正与如以下所论述的这些疾病中的任一种相关联的一种或多种病原性G至A或C至T突变/SNP的方法。
马凡综合征
在一些实施方案中,本文所述的方法、系统和组合物用于校正与马凡综合征相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于FBN1基因中,至少包括以下各项:
NM_000138.4(FBN1):c.1879C>T(p.Arg627Cys)
NM_000138.4(FBN1):c.1051C>T(p.Gln351Ter)
NM_000138.4(FBN1):c.184C>T(p.Arg62Cys)
NM_000138.4(FBN1):c.2855-1G>A
NM_000138.4(FBN1):c.3164G>A(p.Cys1055Tyr)
NM_000138.4(FBN1):c.368G>A(p.Cys123Tyr)
NM_000138.4(FBN1):c.4955G>A(p.Cys1652Tyr)
NM_000138.4(FBN1):c.7180C>T(p.Arg2394Ter)
NM_000138.4(FBN1):c.8267G>A(p.Trp2756Ter)
NM_000138.4(FBN1):c.1496G>A(p.Cys499Tyr)
NM_000138.4(FBN1):c.6886C>T(p.Gln2296Ter)
NM_000138.4(FBN1):c.3373C>T(p.Arg1125Ter)
NM_000138.4(FBN1):c.640G>A(p.Gly214Ser)
NM_000138.4(FBN1):c.5038C>T(p.Gln1680Ter)
NM_000138.4(FBN1):c.434G>A(p.Cys145Tyr)
NM_000138.4(FBN1):c.2563C>T(p.Gln855Ter)
NM_000138.4(FBN1):c.7466G>A(p.Cys2489Tyr)
NM_000138.4(FBN1):c.2089C>T(p.Gln697Ter)
NM_000138.4(FBN1):c.592C>T(p.Gln198Ter)
NM_000138.4(FBN1):c.6695G>A(p.Cys2232Tyr)
NM_000138.4(FBN1):c.6164-1G>A
NM_000138.4(FBN1):c.5627G>A(p.Cys1876Tyr)
NM_000138.4(FBN1):c.4061G>A(p.Trp1354Ter)
NM_000138.4(FBN1):c.1982G>A(p.Cys661Tyr)
NM_000138.4(FBN1):c.6784C>T(p.Gln2262Ter)
NM_000138.4(FBN1):c.409C>T(p.Gln137Ter)
NM_000138.4(FBN1):c.364C>T(p.Arg122Cys)
NM_000138.4(FBN1):c.3217G>A(p.Glu1073Lys)
NM_000138.4(FBN1):c.4460-8G>A
NM_000138.4(FBN1):c.4786C>T(p.Arg1596Ter)
NM_000138.4(FBN1):c.7806G>A(p.Trp2602Ter)
NM_000138.4(FBN1):c.247+1G>A
NM_000138.4(FBN1):c.2495G>A(p.Cys832Tyr)
NM_000138.4(FBN1):c.493C>T(p.Arg165Ter)
NM_000138.4(FBN1):c.5504G>A(p.Cys1835Tyr)
NM_000138.4(FBN1):c.5863C>T(p.Gln1955Ter)
NM_000138.4(FBN1):c.6658C>T(p.Arg2220Ter)
NM_000138.4(FBN1):c.7606G>A(p.Gly2536Arg)
NM_000138.4(FBN1):c.7955G>A(p.Cys2652Tyr)
NM_000138.4(FBN1):c.3037G>A(p.Gly1013Arg)
NM_000138.4(FBN1):c.8080C>T(p.Arg2694Ter)
NM_000138.4(FBN1):c.1633C>T(p.Arg545Cys)
NM_000138.4(FBN1):c.7205-1G>A
NM_000138.4(FBN1):c.4621C>T(p.Arg1541Ter)
NM_000138.4(FBN1):c.1090C>T(p.Arg364Ter)
NM_000138.4(FBN1):c.1585C>T(p.Arg529Ter)
NM_000138.4(FBN1):c.4781G>A(p.Gly1594Asp)
NM_000138.4(FBN1):c.643C>T(p.Arg215Ter)
NM_000138.4(FBN1):c.3668G>A(p.Cys1223Tyr)
NM_000138.4(FBN1):c.8326C>T(p.Arg2776Ter)
NM_000138.4(FBN1):c.6354C>T(p.Ile2118=)
NM_000138.4(FBN1):c.1468+5G>A
NM_000138.4(FBN1):c.1546C>T(p.Arg516Ter)
NM_000138.4(FBN1):c.4615C>T(p.Arg1539Ter)
NM_000138.4(FBN1):c.5368C>T(p.Arg1790Ter)
NM_000138.4(FBN1):c.1285C>T(p.Arg429Ter)
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于FBN1基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防马凡综合征的方法。
赫尔勒综合征
在一些实施方案中,本文所述的方法、系统和组合物用于校正与赫尔勒综合征相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP至少存在于IDUA基因中,至少包括以下各项:
NM_000203.4(IDUA):c.972+1G>A
NM_000203.4(IDUA):c.1855C>T(p.Arg619Ter)
NM_000203.4(IDUA):c.152G>A(p.Gly51Asp)
NM_000203.4(IDUA):c.1205G>A(p.Trp402Ter)
NM_000203.4(IDUA):c.208C>T(p.Gln70Ter)
NM_000203.4(IDUA):c.1045G>A(p.Asp349Asn)
NM_000203.4(IDUA):c.1650+5G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于IDUA基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防赫尔勒综合征的方法。
糖原贮积病
在一些实施方案中,本文所述的方法、系统和组合物用于校正与糖原贮积病相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于选自GAA、AGL、PHKB、PRKAG2、G6PC、PGAM2、GBE1、PYGM和PFKM的至少一种基因中,至少包括以下各项:
NM_000152.4(GAA):c.1927G>A(p.Gly643Arg)
NM_000152.4(GAA):c.2173C>T(p.Arg725Trp)
NM_000642.2(AGL):c.3980G>A(p.Trp1327Ter)
NM_000642.2(AGL):c.16C>T(p.Gln6Ter)
NM_000642.2(AGL):c.2039G>A(p.Trp680Ter)
NM_000293.2(PHKB):c.1546C>T(p.Gln516Ter)
NM_016203.3(PRKAG2):c.1592G>A(p.Arg531Gln)
NM_000151.3(G6PC):c.248G>A(p.Arg83His)
NM_000151.3(G6PC):c.724C>T(p.Gln242Ter)
NM_000151.3(G6PC):c.883C>T(p.Arg295Cys)
NM_000151.3(G6PC):c.247C>T(p.Arg83Cys)
NM_000151.3(G6PC):c.1039C>T(p.Gln347Ter)
NM_000152.4(GAA):c.1561G>A(p.Glu521Lys)
NM_000642.2(AGL):c.2590C>T(p.Arg864Ter)
NM_000642.2(AGL):c.3682C>T(p.Arg1228Ter)
NM_000642.2(AGL):c.118C>T(p.Gln40Ter)
NM_000642.2(AGL):c.256C>T(p.Gln86Ter)
NM_000642.2(AGL):c.2681+1G>A
NM_000642.2(AGL):c.2158-1G>A
NM_000290.3(PGAM2):c.233G>A(p.Trp78Ter)
NM_000152.4(GAA):c.1548G>A(p.Trp516Ter)
NM_000152.4(GAA):c.2014C>T(p.Arg672Trp)
NM_000152.4(GAA):c.546G>A(p.Thr182=)
NM_000152.4(GAA):c.1802C>T(p.Ser601Leu)
NM_000152.4(GAA):c.1754+1G>A
NM_000152.4(GAA):c.1082C>T(p.Pro361Leu)
NM_000152.4(GAA):c.2560C>T(p.Arg854Ter)
NM_000152.4(GAA):c.655G>A(p.Gly219Arg)
NM_000152.4(GAA):c.1933G>A(p.Asp645Asn)
NM_000152.4(GAA):c.1979G>A(p.Arg660His)
NM_000152.4(GAA):c.1465G>A(p.Asp489Asn)
NM_000152.4(GAA):c.2512C>T(p.Gln838Ter)
NM_000158.3(GBE1):c.1543C>T(p.Arg515Cys)
NM_005609.3(PYGM):c.1726C>T(p.Arg576Ter)
NM_005609.3(PYGM):c.1827G>A(p.Lys609=)
NM_005609.3(PYGM):c.148C>T(p.Arg50Ter)
NM_005609.3(PYGM):c.613G>A(p.Gly205Ser)
NM_005609.3(PYGM):c.1366G>A(p.Val456Met)
NM_005609.3(PYGM):c.1768+1G>A
NM_001166686.1(PFKM):c.450+1G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于选自GAA、AGL、PHKB、PRKAG2、G6PC、PGAM2、GBE1、PYGM和PFKM的至少一种基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防糖原贮积病的方法。
囊性纤维化
在一些实施方案中,本文所述的方法、系统和组合物用于校正与囊性纤维化相关联的一种或多种病原性G至A或C至T突变/SNP。在一些实施方案中,病原性突变/SNP存在于CFTR基因中,至少包括以下各项:
NM_000492.3(CFTR):c.3712C>T(p.Gln1238Ter)
NM_000492.3(CFTR):c.3484C>T(p.Arg1162Ter)
NM_000492.3(CFTR):c.1766+1G>A
NM_000492.3(CFTR):c.1477C>T(p.Gln493Ter)
NM_000492.3(CFTR):c.2538G>A(p.Trp846Ter)
NM_000492.3(CFTR):c.2551C>T(p.Arg851Ter)
NM_000492.3(CFTR):c.3472C>T(p.Arg1158Ter)
NM_000492.3(CFTR):c.1475C>T(p.Ser492Phe)
NM_000492.3(CFTR):c.1679G>A(p.Arg560Lys)
NM_000492.3(CFTR):c.3197G>A(p.Arg1066His)
NM_000492.3(CFTR):c.3873+1G>A
NM_000492.3(CFTR):c.3196C>T(p.Arg1066Cys)
NM_000492.3(CFTR):c.2490+1G>A
NM_000492.3(CFTR):c.3718-1G>A
NM_000492.3(CFTR):c.171G>A(p.Trp57Ter)
NM_000492.3(CFTR):c.3937C>T(p.Gln1313Ter)
NM_000492.3(CFTR):c.274G>A(p.Glu92Lys)
NM_000492.3(CFTR):c.1013C>T(p.Thr338Ile)
NM_000492.3(CFTR):c.3266G>A(p.Trp1089Ter)
NM_000492.3(CFTR):c.1055G>A(p.Arg352Gln)
NM_000492.3(CFTR):c.1654C>T(p.Gln552Ter)
NM_000492.3(CFTR):c.2668C>T(p.Gln890Ter)
NM_000492.3(CFTR):c.3611G>A(p.Trp1204Ter)
NM_000492.3(CFTR):c.1585-8G>A
NM_000492.3(CFTR):c.223C>T(p.Arg75Ter)
NM_000492.3(CFTR):c.1680-1G>A
NM_000492.3(CFTR):c.349C>T(p.Arg117Cys)
NM_000492.3(CFTR):c.1203G>A(p.Trp401Ter)
NM_000492.3(CFTR):c.1240C>T(p.Gln414Ter)
NM_000492.3(CFTR):c.1202G>A(p.Trp401Ter)
NM_000492.3(CFTR):c.1209+1G>A
NM_000492.3(CFTR):c.115C>T(p.Gln39Ter)
NM_000492.3(CFTR):c.1116+1G>A
NM_000492.3(CFTR):c.1393-1G>A
NM_000492.3(CFTR):c.1573C>T(p.Gln525Ter)
NM_000492.3(CFTR):c.164+1G>A
NM_000492.3(CFTR):c.166G>A(p.Glu56Lys)
NM_000492.3(CFTR):c.170G>A(p.Trp57Ter)
NM_000492.3(CFTR):c.2053C>T(p.Gln685Ter)
NM_000492.3(CFTR):c.2125C>T(p.Arg709Ter)
NM_000492.3(CFTR):c.2290C>T(p.Arg764Ter)
NM_000492.3(CFTR):c.2353C>T(p.Arg785Ter)
NM_000492.3(CFTR):c.2374C>T(p.Arg792Ter)
NM_000492.3(CFTR):c.2537G>A(p.Trp846Ter)
NM_000492.3(CFTR):c.292C>T(p.Gln98Ter)
NM_000492.3(CFTR):c.2989-1G>A
NM_000492.3(CFTR):c.3293G>A(p.Trp1098Ter)
NM_000492.3(CFTR):c.4144C>T(p.Gln1382Ter)
NM_000492.3(CFTR):c.4231C>T(p.Gln1411Ter)
NM_000492.3(CFTR):c.4234C>T(p.Gln1412Ter)
NM_000492.3(CFTR):c.579+5G>A
NM_000492.3(CFTR):c.595C>T(p.His199Tyr)
NM_000492.3(CFTR):c.613C>T(p.Pro205Ser)
NM_000492.3(CFTR):c.658C>T(p.Gln220Ter)
NM_000492.3(CFTR):c.1117-1G>A
NM_000492.3(CFTR):c.3294G>A(p.Trp1098Ter)
NM_000492.3(CFTR):c.1865G>A(p.Gly622Asp)
NM_000492.3(CFTR):c.743+1G>A
NM_000492.3(CFTR):c.1679+1G>A
NM_000492.3(CFTR):c.1657C>T(p.Arg553Ter)
NM_000492.3(CFTR):c.1675G>A(p.Ala559Thr)
NM_000492.3(CFTR):c.165-1G>A
NM_000492.3(CFTR):c.200C>T(p.Pro67Leu)
NM_000492.3(CFTR):c.2834C>T(p.Ser945Leu)
NM_000492.3(CFTR):c.3846G>A(p.Trp1282Ter)
NM_000492.3(CFTR):c.1652G>A(p.Gly551Asp)
NM_000492.3(CFTR):c.4426C>T(p.Gln1476Ter)
NM_000492.3:c.3718-2477C>T
NM_000492.3(CFTR):c.2988+1G>A
NM_000492.3(CFTR):c.2657+5G>A
NM_000492.3(CFTR):c.2988G>A(p.Gln996=)
NM_000492.3(CFTR):c.274-1G>A
NM_000492.3(CFTR):c.3612G>A(p.Trp1204Ter)
NM_000492.3(CFTR):c.1646G>A(p.Ser549Asn)
NM_000492.3(CFTR):c.3752G>A(p.Ser1251Asn)
NM_000492.3(CFTR):c.4046G>A(p.Gly1349Asp)
NM_000492.3(CFTR):c.532G>A(p.Gly178Arg)
NM_000492.3(CFTR):c.3731G>A(p.Gly1244Glu)
NM_000492.3(CFTR):c.1651G>A(p.Gly551Ser)
NM_000492.3(CFTR):c.1585-1G>A
NM_000492.3(CFTR):c.1000C>T(p.Arg334Trp)
NM_000492.3(CFTR):c.254G>A(p.Gly85Glu)
NM_000492.3(CFTR):c.1040G>A(p.Arg347His)
NM_000492.3(CFTR):c.273+1G>A
参见表A。因此,本发明的一个方面涉及一种用于通过校正一种或多种病原性G至A或C至T突变/SNP、特别地存在于CFTR基因中的一种或多种病原性G至A或C至T突变/SNP、且更特别地以上所述的一种或多种病原性G至A或C至T突变/SNP来治疗或预防囊性纤维化的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性2乳腺癌-卵巢癌相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于BRCA2基因中(HGVS:U43746.1:n.7829+1G>A)。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防家族性2乳腺癌-卵巢癌的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与遗传因子IX缺乏症相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于F9基因中的GRCh38:ChrX:139537145处,导致Arg至Gln取代。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防遗传因子IX缺乏症的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与β+地中海贫血、β地中海贫血和重型β地中海贫血相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于HBB基因中的GRCh38:Chr11:5226820处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防β+地中海贫血、β地中海贫血和重型β地中海贫血的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与马凡综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于FBN1基因中(IVS2DS,G-A,+1),如Yamamoto等人J Hum Genet.2000;45(2):115-8所报道的。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防马凡综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与威斯科特-奥尔德里奇综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于WAS基因的内含子6的位置-1处(IVS6AS,G-A,-1),如Kwan等人(1995)所报道的。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防威斯科特-奥尔德里奇综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与囊性纤维化相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于CFTR基因中的GRCh38:Chr7:117590440处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防囊性纤维化的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与囊性纤维化和遗传性胰腺炎相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于CFTR基因中的GRCh38:Chr7:117606754处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防囊性纤维化和遗传性胰腺炎的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与囊性纤维化相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于CFTR基因中的GRCh38:Chr7:117587738处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防囊性纤维化的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与透克综合征(Turcot syndrome)和林奇综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MSH2基因中的GRCh38:Chr2:47470964处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防透克综合征和林奇综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与囊性纤维化相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于CFTR基因中的GRCh38:Chr7:117642437处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防囊性纤维化的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与林奇综合征II和林奇综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MLH1基因中的GRCh38:Chr3:37001058处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防林奇综合征II和林奇综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与囊性纤维化相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于CFTR基因中的GRCh38:Chr7:117642594处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防囊性纤维化的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与囊性纤维化相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于CFTR基因中的GRCh38:Chr7:117592658处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防囊性纤维化的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性1乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于BRCA1基因中的GRCh38:Chr17:43057051处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防家族性1乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与二氢嘧啶脱氢酶缺乏症、希尔施普龙病1(Hirschsprung disease 1)、氟尿嘧啶反应、嘧啶类似物反应-毒性/ADR、卡培他滨反应-毒性/ADR、氟尿嘧啶反应-毒性/ADR、喃氟啶(tegafur)反应-毒性/ADR相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于DPYD基因中的GRCh38:Chr1:97450058处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防二氢嘧啶脱氢酶缺乏症、希尔施普龙病1、氟尿嘧啶反应、嘧啶类似物反应-毒性/ADR、卡培他滨反应-毒性/ADR、氟尿嘧啶反应-毒性/ADR、喃氟啶反应-毒性/ADR的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与林奇综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MSH2基因中的GRCh38:Chr2:47478520处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防林奇综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与林奇综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MLH1基因中的GRCh38:Chr3:37011819处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防林奇综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与林奇综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MLH1基因中的GRCh38:Chr3:37014545处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防林奇综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与林奇综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MLH1基因中的GRCh38:Chr3:37011867处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防林奇综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与林奇综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MLH1基因中的GRCh38:Chr3:37025636处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防林奇综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与林奇综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MLH1基因中的GRCh38:Chr3:37004475处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防林奇综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与林奇综合征和遗传性癌症易感综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MSH2基因中的GRCh38:Chr2:47416430处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防林奇综合征和遗传性癌症易感综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与林奇综合征和遗传性癌症易感综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MSH2基因中的GRCh38:Chr2:47408400处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防林奇综合征和遗传性癌症易感综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与林奇综合征和遗传性癌症易感综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MLH1基因中的GRCh38:Chr3:36996710处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防林奇综合征和遗传性癌症易感综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性1乳腺癌-卵巢癌相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于BRCA1基因中的GRCh38:Chr17:43067696处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防家族性1乳腺癌-卵巢癌的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性2乳腺癌-卵巢癌和遗传性乳腺癌及卵巢癌综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于BRCA2基因中的GRCh38:Chr13:32356610处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防家族性2乳腺癌-卵巢癌和遗传性乳腺癌及卵巢癌综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与原发性扩张型心肌病和原发性家族性肥厚型心肌病相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MYH7基因中的GRCh38:Chr14:23419993处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防原发性扩张型心肌病和原发性家族性肥厚型心肌病的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与原发性家族性肥厚型心肌病、躯干前曲症(camptocormism)和肥厚型心肌病相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MYH7基因中的GRCh38:Chr14:23415225处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防原发性家族性肥厚型心肌病、躯干前曲症和肥厚型心肌病的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性乳腺癌、家族性2乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于BRCA2基因中的GRCh38:Chr13:32357741处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防家族性乳腺癌、家族性2乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与原发性扩张型心肌病、肥厚型心肌病、心肌病和左心室肌致密化不全相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于MYH7基因中的GRCh38:Chr14:23431584处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防原发性扩张型心肌病、肥厚型心肌病、心肌病和左心室肌致密化不全的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性1乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于BRCA1基因中的GRCh38:Chr17:43067607处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防家族性1乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性1乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征、遗传性癌症易感综合征和乳腺癌相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于BRCA1基因中的GRCh38:Chr17:43047666处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防家族性1乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征、遗传性癌症易感综合征和乳腺癌的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性2乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于BRCA1基因中的GRCh38:Chr13:32370558处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防家族性2乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性1乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征、遗传性癌症易感综合征和乳腺癌相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于BRCA1基因中的GRCh38:Chr17:43074330处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防家族性1乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征、遗传性癌症易感综合征和乳腺癌的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性1乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征相关联的病原性A至G(A>G)突变或SNP,其中所述病原性A>G突变或SNP位于BRCA1基因中的GRCh38:Chr17:43082403处。因此,本发明的另一方面涉及一种用于通过校正前述病原性A>G突变或SNP来治疗或预防家族性1乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与囊性纤维化和遗传性胰腺炎相关联的病原性C至T(C>T)突变或SNP,其中所述病原性C>T突变或SNP位于CFTR基因中的GRCh38:Chr7:117639961处。因此,本发明的另一方面涉及一种用于通过校正前述病原性C>T突变或SNP来治疗或预防囊性纤维化和遗传性胰腺炎的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性2乳腺癌-卵巢癌相关联的病原性C至T(C>T)突变或SNP,其中所述病原性C>T突变或SNP位于BRCA2基因中的GRCh38:Chr13:32336492处。因此,本发明的另一方面涉及一种用于通过校正前述病原性C>T突变或SNP来治疗或预防家族性2乳腺癌-卵巢癌的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性1乳腺癌-卵巢癌相关联的病原性C至T(C>T)突变或SNP,其中所述病原性C>T突变或SNP位于BRCA1基因中的GRCh38:Chr17:43063365处。因此,本发明的另一方面涉及一种用于通过校正前述病原性C>T突变或SNP来治疗或预防家族性1乳腺癌-卵巢癌的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性1乳腺癌-卵巢癌相关联的病原性C至T(C>T)突变或SNP,其中所述病原性C>T突变或SNP位于BRCA1基因中的GRCh38:Chr17:43093613处。因此,本发明的另一方面涉及一种用于通过校正前述病原性C>T突变或SNP来治疗或预防家族性1乳腺癌-卵巢癌的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性乳腺癌和家族性1乳腺癌-卵巢癌相关联的病原性C至T(C>T)突变或SNP,其中所述病原性C>T突变或SNP位于BRCA1基因中的GRCh38:Chr17:43093931处。因此,本发明的另一方面涉及一种用于通过校正前述病原性C>T突变或SNP来治疗或预防家族性乳腺癌和家族性1乳腺癌-卵巢癌的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性肥厚型心肌病1、原发性家族性肥厚型心肌病和肥厚型心肌病相关联的病原性C至T(C>T)突变或SNP,其中所述病原性C>T突变或SNP位于MYH7基因中的GRCh38:Chr14:23429279处。因此,本发明的另一方面涉及一种用于通过校正前述病原性C>T突变或SNP来治疗或预防家族性肥厚型心肌病1、原发性家族性肥厚型心肌病和肥厚型心肌病的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性2乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征相关联的病原性C至T(C>T)突变或SNP,其中所述病原性C>T突变或SNP位于BRCA2基因中的GRCh38:Chr13:32356472处。因此,本发明的另一方面涉及一种用于通过校正前述病原性C>T突变或SNP来治疗或预防家族性2乳腺癌-卵巢癌、遗传性乳腺癌及卵巢癌综合征以及遗传性癌症易感综合征的方法。
在一些实施方案中,本文所述的方法、系统和组合物用于校正据信与家族性肥厚型心肌病1、原发性家族性肥厚型心肌病、家族性限制型心肌病和肥厚型心肌病相关联的病原性C至T(C>T)突变或SNP,其中所述病原性C>T突变或SNP位于MYH7基因中的GRCh38:Chr14:23429005处。因此,本发明的另一方面涉及一种用于通过校正前述病原性C>T突变或SNP来治疗或预防家族性肥厚型心肌病1、原发性家族性肥厚型心肌病、家族性限制型心肌病和肥厚型心肌病的方法。
另外的病原性A>G突变和SNP可见于ClinVar数据库中。因此,本公开的另一方面涉及使用本文所述的方法、系统和组合物对ClinVar中所列的病原性A>G突变或SNP进行校正以治疗或预防与其相关联的疾病或疾患。
另外的病原性C>T突变和SNP可见于ClinVar数据库中。因此,本公开的另一方面涉及使用本文所述的方法、系统和组合物对ClinVar中所列的病原性C>T突变或SNP进行校正以治疗或预防与其相关联的疾病或疾患。可以使用本文所公开的实施方案解决的其他T突变或SNP列于随本文件提交的标题为“Clin_var_pathogenic_SNPS_TC_txt”的ASCII文本文件中的表格中。
磷酸化位点修饰和其他翻译后修饰
本发明还考虑使用本文所述的AD官能化的CRISPR系统来修饰磷酸化位点和其他翻译后修饰(PTM)。本文所述的AD官能化的CRISPR系统可以编辑与翻译后修饰相关联的残基(图140A和图140B)。蛋白质磷酸化牵涉多个细胞过程,并且相对易于靶向(Humprey等人Trends Endocrinol Metab 2015,26(12):676-687)。当前用以靶向磷酸化位点或其他PTM的技术包括全蛋白敲低或敲除、碱基编辑和小分子。但是,这些方法都具有某些缺点。蛋白靶标的敲低或敲除将去除整个蛋白质而不仅仅去除PTM,碱基编辑是永久性的,而小分子也难以形成并且可能具有未知的靶标。使用本文所述的AD官能化的CRISPR系统去除磷酸化位点可以允许研究磷酸化的功能,例如,其可以用于筛选激酶靶标以确定对表型的相对贡献,或者用于对潜在的小分子进行全转录组筛选。使用具有AD官能化的CRISPR系统靶向PTM也可以在癌症、炎症、新陈代谢和分化方面具有治疗潜力。
在某些实施方案中,本文所述的AD官能化的CRISPR系统可以用于靶向Stat3和/或IRF-5磷酸化以减少炎症。靶位点可以选自由以下组成的组:Stat3 Tyr705、IRF-5Thr10、Ser158、Ser309、Ser317、Ser451和Ser462,所有这些位点都牵涉白介素信号传导和/或自身免疫(Sadreev等人PLOS One 2014,9(10):e110913)。因此,本发明的另一方面涉及一种用于通过靶向前述磷酸化位点来治疗或预防自身免疫性疾病的方法。
在某些实施方案中,本文所述的AD官能化的CRISPR系统可以用于靶向胰岛素受体底物(IRS)磷酸化。靶位点可以选自由以下组成的组:IRS-1的Ser-265、Ser-302、Ser-325、Ser-336、Ser-358、Ser-407、和Ser-408。这些位点的磷酸化降低胰岛素敏感性(Copps和White Diabetologia 2012,10月;55(10):2565-2582),而减少这些位点处的抑制性丝氨酸磷酸化可以挽救胰岛素敏感性。因此,本发明的另一方面涉及一种用于通过靶向前述磷酸化位点来治疗或预防糖尿病的方法。
产生亚效突变
在某些实施方案中,本文所述的AD官能化的CRISPR系统可以用于产生亚效突变。工程化亚效突变可导致必需基因显著下调而无致死性,从而允许直接创建涉及亚效突变的疾病模型并且以微调方式降低某些蛋白质的水平以用于治疗应用。PolyA轨道插入是一种创建亚效突变体的现有技术。使用AD官能化的CRISPR系统引入亚效突变具有的破坏性极小、其精确、并且可以进行微调。
在某些实施方案中,AD官能化的CRISPR系统可以用于靶向编辑免疫检查点蛋白。在癌症疗法中使用免疫检查点阻断以通过促进T细胞激活和增殖来增强抗肿瘤免疫力,所述癌症疗法包括抗CTLA4和抗PD-1疗法(Byun等人,Nat Reviews Endocrinology 2017)。使用AD官能化的CRISPR系统可以改善现有CTLA-4、PD-1/PD-L1抑制剂疗法的疗效。AD官能化的CRISPR系统还可以用于抑制其他阻遏性免疫检查点(诸如TIM-3、KIR和LAG-3),并将亚效突变引入免疫激活检查点(诸如4-IBB和GITR)。在特定实施方案中,AD官能化的CRISPR系统可以用于靶向编辑CTLA-4/B7-1相互作用表面99MYPPPY104茎环(Stamper等人,Nature 2001年3月29日;410(6828):608-11),例如,C至U编辑可以将脯氨酸转化为丝氨酸或亮氨酸,而A至I编辑可以将酪氨酸转化为半胱氨酸,将甲硫氨酸转化为缬氨酸。在特定实施方案中,AD官能化的CRISPR系统可以用于靶向编辑E33、R35、T53和E97处的CTLA-4/B7-2界面(Schwartz等人,Nature 2001年3月29日;410(6828):604-8;Peach等人,Cell(1994)),例如,C至U编辑可以将精氨酸转化为半胱氨酸、终止密码子或色氨酸,而A至I编辑可以将谷氨酸转化为甘氨酸,将精氨酸转化为甘氨酸。因此,本发明的另一方面涉及一种用于通过编辑前述涉及免疫检查点蛋白相互作用的残基来治疗或预防癌症的方法。
调节蛋白质稳定性
在某些实施方案中,本文所述的AD官能化的CRISPR系统可以用于调节蛋白质稳定性。在特定实施方案中,AD官能化的CRISPR系统可以用于一般降解决定子靶向。降解决定子是蛋白质的一部分,其在调节蛋白质降解速率中很重要。已知的降解决定子包括短的氨基酸序列、结构基序和位于蛋白质中任何位置的外露氨基酸(通常是赖氨酸或精氨酸)。一些蛋白质可以含有多个降解决定子。尽管存在许多类型的不同降解决定子,并且在这些组中甚至也存在高度的变异性,但降解决定子在参与调节蛋白质降解速率方面都非常相似,并且可以被归类为“泛素依赖性”或“非泛素依赖性”。
在某些示例性实施方案中,AD官能化的CRISPR系统可以用于靶向编辑存在于SMN2中的降解决定子,SMN2是一种牵涉进脊髓型肌萎缩(SMA)的蛋白质。SMA是由运动神经元1(SMN1)基因缺失的纯合生存引起的,留下了一个重复基因SMN2作为SMN蛋白的唯一来源。SMA疾病的严重程度与功能蛋白的量有关。例如,重度SMA(I型)患者通常具有一个或两个SMN2拷贝,中度严重度SMA(II型)患者通常具有3个SMN2拷贝,而轻度SMA(III型)患者大多具有3或4个SMN2拷贝。由SMN2前mRNA产生的大多数mRNA都被外显子7跳过(约80%),导致高度不稳定且几乎不可检测的蛋白质(SMNΔ7)。这种剪接缺陷在SMNΔ7的C端15个氨基酸处产生降解信号(降解决定子;SMNΔ7-DEG)。S270A突变使SMNΔ7-DEG失活,产生稳定的SMNΔ7,从而挽救了SMN缺失细胞的活力。(Cho和Dreyfuss,Genes and Dev.,2010年3月1日;24(5):438-42)。AD官能化的CRISPR系统可以用于靶向编辑S270,由此破坏SMN2中存在的降解决定子。因此,本发明的另一方面涉及一种用于通过编辑前述涉及调控SMN稳定性的残基来治疗或预防SMA的方法。
在某些实施方案中,AD官能化的CRISPR系统可以用于破坏D-box降解决定子,使得Arg转化为Gly,或Leu转化为The。在其他实施方案中,AD官能化的CRISPR系统可以用于破坏KEN-box降解决定子,使得Lys转化为Arg/Glu,Glu转化为Gly,或者Asn转化为Ser/Asp。
首先在酵母中针对小鼠鸟氨酸脱羧酶的PEST序列对N-降解决定子进行表征。PEST序列是富含脯氨酸(P)、谷氨酸(E)、丝氨酸(S)和苏氨酸(T)的肽序列。此序列与具有短细胞内半衰期的蛋白质相关联;因此,假设PEST序列充当蛋白质降解的信号肽。AD官能化的CRISPR系统可以用于靶向编辑PEST序列,从而调节蛋白质稳定性。在特定示例性实施方案中,AD官能化的CRISPR系统可以用于靶向PEST序列或IκBα中的调控的非泛素依赖性降解决定子(Fortmann等人,JMB Molecular Bio 2015年8月28日;427(17):2748-2756)。在特定实施方案中,AD官能化的CRISPR系统可以用于编辑NANOG中的PEST序列,以促进胚胎干细胞(ESC)多能性。在特定实施方案中,AD官能化的CRISPR系统可以用于编辑Cdc25A磷酸酶中的PEST序列。在其他实施方案中,AD官能化的CRISPR系统还可以用于促进蛋白质降解,方式为例如使残基突变以增强降解程度或者使N端甲硫氨酸突变。
靶向离子通道以用于疗法
在某些实施方案中,本文所述的AD官能化的CRISPR系统可以用于靶向离子通道。离子调控许多生理过程,包括心脏收缩力、神经系统信号转导和肺血管压力控制。影响离子通道的小分子(诸如地高辛和利多卡因)已广泛用于临床医学。然而,这些小分子具有毒性问题,并且仅在较短的时间范围内起作用,而诸如心力衰竭或心律失常等要治疗的疾病通常是慢性的。敲除方法也是不可取的,因为它可能会影响离子通道所发挥的其他生物学作用。
在某些实施方案中,AD官能化的CRISPR系统可以用于产生终止密码子以阻断离子通道。在某些实施方案中,AD官能化的CRISPR系统可以用于产生终止密码子以跳过外显子。离子通道可以是钠或钾离子通道。在特定实施方案中,AD官能化的CRISPR系统可以用于在钠通道亚基Nav1.7中产生选自由以下组成的组的突变:V36I、F216S、S241T、R277X、Y328X、N395K、S459X、E693X、I767X、R830X、I848T、L858H、L858H、L858F、A863P、W897X、R996C、F1200LfsX33、I1235LfsX2、V1298F、V1298D、V1299F、F1449V、c.4336-7_10delGTTTX、I1461T、F1462V、T1464I、R1488X、M1267K、K1659X、W1689X(Drenth和Waxman,JCI,2007年12月;117(12):3603-9)。在某些实施方案中,AD官能化的CRISPR系统可以用于编辑神经元中的RNA。可以经由膜片钳评定由此引起的离子通道活性变化,并且可以使用现有的小鼠模型检查疼痛敏感性(Gao等人,J Neurosci.2009年4月1日;29(13):4096-108)。因此,本发明的另一方面涉及一种用于通过编辑前述涉及离子通道活性的残基来治疗或预防心力衰竭或心律失常的方法。
进行TGFβ调节以预防心脏重塑
在某些实施方案中,AD官能化的CRISPR系统可以用于调节TGFβ信号传导以预防心脏重塑。心肌梗塞后,TGFβ信号传导促进心脏纤维化和心肌细胞凋亡,并且阻断可治愈心脏组织的炎症反应。因此,可以通过阻断TGFβ信号传导来预防不良的心脏重塑。II型TGFβ受体需要在Ser213和Ser409以及Thr259、336和424处进行自身磷酸化才能发挥活性。AD官能化的CRISPR系统可以用于使丝氨酸突变为Leu或Phe,或者使酪氨酸突变为Cys,这可以防止成纤维细胞和心肌细胞中的自身磷酸化和TGFβ激活。
在某些实施方案中,AD官能化的CRISPR系统可以用于使TGFβ受体下游的Smad转录因子突变,以防止其经由磷酸化激活。AD官能化的CRISPR系统可以使选自由以下组成的组的磷酸化位点突变:Smad3的Thr8、Thr179、Ser208和Ser213,以及Smad2的Ser245、Ser250、Ser255和Thr8。AD官能化的CRISPR系统可以用于使丝氨酸突变为Leu或Phe,或者使苏氨酸突变为Ile或Met。因此,本发明的另一方面涉及一种用于通过编辑前述涉及TGFβ信号传导的残基来预防心脏重塑的方法。
其他应用
在某些实施方案中,AD官能化的CRISPR系统可以用于谱系追踪。在某些实施方案中,AD官能化的CRISPR系统可以用于用REPAIR系统进行感测。可以诱导不同的直系同源物,并且将编辑集中在合成转录物上。在某些实施方案中,AD官能化的CRISPR系统可以用于对特定蛋白质进行饱和诱变以鉴定功能结构域。在某些实施方案中,AD官能化的CRISPR系统可以用于鉴定RNA结合蛋白相互作用。AD官能化的CRISPR系统可以用于定位蛋白质-蛋白质结合界面。对一种蛋白质进行饱和诱变,之后进行FRET和细胞分选,以确定哪个指导RNA破坏了蛋白质-蛋白质相互作用。
在某些实施方案中,AD官能化的CRISPR系统可以用于瞬时灭活或激活蛋白质,产生杂合保护性突变、前蛋白或原蛋白切割位点,产生新抗原,产生条件型融合蛋白、编辑poly-A信号,进行RNA靶向以引入其他表观转录组修饰,鉴定或修饰RNA结合蛋白位点,定位RNA-RNA接触,或编辑共定位的RNP。
在一些实施方案中,AD官能化的CRISPR系统可以用于修饰泛素化或乙酰化位点,组织再生,细胞分化,产生被泛素连接酶识别的基序,单细胞条形码,产生剪接位点,或改变抗原受体。
工作实施例
实施例1
腺嘌呤脱氨酶(AD)使双链RNA中特定位点处的腺嘌呤脱氨基。
一些AD可以在DNA-RNAn RNA双链体上实现腺嘌呤脱氨(例如Zheng等人,NucleicAcids Research 2017),这一事实提供了利用在非活性Cas13的RNA指导的DNA结合期间所形成的R-环中在指导RNA与其互补DNA靶标之间所形成的RNA体来开发RNA指导的AD的独特机会。通过使用无活性的Cas13来募集AD,AD酶随后将作用于RNA-DNAn RNA双链体中的腺嘌呤。
在一个实施方案中,使用以下突变来获得无活性的Cas13诸如Cas13b:R116A、H121A、R1177A和H1182A。为了提高通过AD进行编辑的效率,使用突变ADAR,诸如包含突变E488Q的突变hADAR2d。
用于将AD募集至特定基因座的设计:
1.带有NLS标签的无活性Cas13在N端或C端融合至AD。使用多种接头,包括诸如GSG5的柔性接头或诸如LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR(SEQ ID No.11)的接头。
2.用诸如MS2结合位点的适体修饰指导RNA支架(例如Konermann等人,Nature2015)。将带有NLS标签的AD-MS2结合蛋白融合物与(带有NLS标签的无活性或Cas13b)和相应的指导RNA共同引入到靶细胞中。
3.将AD插入带有NLS标签的无活性或切口酶Cas13的内环中。
RNA指导物的设计:
1.设计长度与Cas13蛋白的天然指导序列相对应的指导序列以靶向目标RNA。
2.使用比典型长度长的RNA指导物以在蛋白质指导RNA-靶DNA复合物之外形成RNA双链体。
对于这些RNA指导物设计中的每一个,与靶RNA链上腺嘌呤相对的RNA碱基将被指定为C而不是U。
AD的选择和设计:
使用了多种AD,每种AD具有不同的活性水平。这些AD
1.人类ADAR(hADAR1、hADAR2、hADAR3)
2.鱿鱼普通章鱼(Octopus vulgaris)ADAR
3.鱿鱼乌贼(Sepia)ADAR;乳光枪乌贼(Doryteusthis opalescens)ADAR
ADAT(人类ADAT、果蝇ADAT)
还可以使用突变以增加ADAR针对DNA-RNAn RNA双链体反应的活性。例如,对于人类ADAR基因,使用hADAR1d(E1008Q)或hADAR2d(E488Q)突变以增加其针对DNA-RNA靶标的活性。
每种ADAR具有不同级别的序列情形要求(sequence context requirement)。例如,对于hADAR1d(E1008Q),tAg和aAg位点被有效脱氨基,而aAt和cAc的编辑效率较低,而gAa和gAc的编辑效率甚至更低。然而,情形要求因不同的ADAR而异。
图1中提供了该系统一种型式的示意图。图4中提供了示例性AD蛋白的氨基酸序列。
实施例2
用于Cas13a/Cas13b干扰的Cluc/Gluc平铺
为了比较Cas13a和Cas13b之间的敲低效率,分别用24个或96个指导物对海萤荧光素酶和海肾荧光素酶基因进行平铺(图10)。将指导物与Cas13a和Cas13b匹配,结果显示Cas13b的敲低效率增加,针对每个基因,所有指导物(一个指导物除外)都显示出Cas13b的效率更高。
通过NGS进行的ADAR编辑定量
通过设计具有提前终止密码子UAG的荧光素酶报告基因,测试Cas13b-ADAR2 RNA的编辑效率,所述提前终止密码子UAG阻止荧光素酶的表达(图11A)。设计7个不同长度的指导物并相对于UAG终止密码子定位,这些指导物都含有针对UAG中的A的C错配。已知C错配会在编辑位点处产生气泡,该气泡是ADAR催化结构域所偏爱的。Cas13b-ADAR2进行的RNA编辑会将UAG转换为UIG(UGG),这引入了色氨酸而不是终止密码子,并且允许进行翻译。在HEK293FT细胞中指导物和Cas13b12-ADAR2融合物的表达使荧光素酶表达恢复到不同水平,其中指导物5的恢复程度最大(图111B)。一般来讲,随着编辑位点离crRNA的3'端(正向重复序列所处的位置并且因此是蛋白质结合的位置)更远,从指导物1-指导物5,编辑水平不断提高。这可能指示crRNA:靶标双链体中被蛋白质结合的部分是ADAR催化结构域不可接近的。指导物5、指导物6和指导物7显示出最大的活性,因为编辑位点位于远离DR/蛋白质结合区域的指导物的远端,而且因为它们的指导物更长,产生受ADAR偏好的更长的RNA双链体。当编辑位点在RNA双链体中间时,ADAR活性最佳。针对非靶向指导物条件,将荧光素酶活性的相对表达归一化。
对这些样品进行测序以精确定量RNA编辑效率(图11C)。编辑效率列在指导物标签旁边的括号中。总体而言,通过测序确定的编辑百分比与荧光素酶表达恢复的相对水平相符,如图11B所示。指导物5显示出最多的RNA编辑,中靶A处的G转化率为45%。在一些情况下,该区域中存在少量的脱靶A-G编辑。这些编辑可以通过在指导序列中引入G错配来减少,所述G错配不受ADAR催化结构域偏好。
除了编辑荧光素酶报告转录物外,还设计了指导物来编辑KRAS和PPIB转录物中的框外UAG位点,其中两个指导物靶向每个转录物(图12)。这些指导物的设计原理与上述指导物5相同(45nt的间隔区,编辑位点距3'DR的距离为27nt,具有针对编辑位点的腺苷的C错配)。KRAS指导物能够在中靶腺苷处实现6.5%和13.7%的编辑,而PPIB指导物则能够实现7.7%和9.2%的编辑。这些指导物中的一些也存在一些脱靶,可以通过在间隔区中针对附近可能存在的脱靶腺苷设计G错配来减少脱靶。看起来脱靶似乎发生在靶腺苷的双链体区3’上。
来自RNA Seq的Cas13a/b+shRNA特异性
为了确定Cas13b12敲低的特异性,对整个转录组中的所有mRNA进行RNA测序(图13A)。针对非靶向指导物比较了指导物靶向Gluc和KRAS的敲低,发现Cas13a2和Cas13b12对靶转录物具有特异性敲低(图13A中的红色点),而shRNA具有许多脱靶,如分布中更大的变异所证实的。对于这些条件中的每一个,显著脱靶数量显示在图13B中。对于变化超过2倍或低于0.8倍的任何脱靶转录物,均需通过FDR校正的t检验(p<0.01)测量显著脱靶。与针对shRNA条件发现的数百个脱靶相比,Cas13a和Cas13b条件的脱靶极少。每个条件的敲低效率显示在图13C中。
用以减少脱靶的错配特异性(A:A或A:G)
为了减少靶腺苷编辑位点附近的腺苷的脱靶,设计了与潜在脱靶腺苷具有G或A错配的指导物(图14和下表)。G或A错配在活性上不为ADAR催化结构域所偏好。
上表中的指导物被设计为针对要编辑的中靶腺苷具有C错配,并且针对已知脱靶位点具有G或A错配(基于上述RNA测序结果)。间隔序列中的错配是大写的。
用于中靶活性的错配
先前对ADAR2催化结构域的研究表明,与靶A相对的不同碱基可以影响肌苷编辑的数量(Zheng等人(2017),Nucleic Acid Research,45(6):3369-3377)。具体来说,发现U和C与ADAR编辑的自然A相对,而G和A则不然。为了测试A和G与编辑后的A的错配是否可以用于阻遏ADAR活性,在荧光素酶报告基因测定中,使用所有其他3种可能的碱基对已知具有C错配的活性指导物进行了测试(图16)。通过测定荧光素酶活性来定量相对活性。下表中提供了指导序列。
通过化学修饰gRNA改善编辑并减少脱靶修饰
按照Vogel等人(2014),Angew Chem Int Ed,53:6267-6271,doi:10.1002/anie.201402634))中所例示进行化学修饰的gRNA降低了脱靶活性并提高了中靶效率。2'-O-甲基和硫代磷酸酯修饰的指导RNA通常可提高细胞中的编辑效率。
基序优选性
已证明ADAR显示出对编辑过的A的任一侧的相邻核苷酸的优选性(www.nature.com/nsmb/journal/v23/n5/full/nsmb.3203.html,Matthews等人(2017),Nature Structural Mol Biol,23(5):426-433)。通过用围绕靶向A的可变碱基靶向海萤荧光素酶转录物来系统地测试优选性(图17)。
用以增强RNA编辑效率的大气泡
为了提高对非优选5'或3'相邻碱基的RNA编辑效率,在相邻碱基中引入了有意错配,已在体外证明此举可以允许编辑非优选基序(https://academic.oup.com/nar/article-lookup/doi/10.1093/nar/gku272;Schneider等人(2014),Nucleic Acid Res,42(10):e87);Fukuda等人(2017),Scienticic Reports,7,doi:10.1038/srep41478)。测试了另外的错配(诸如鸟苷取代),以查看它们是否降低自然优选性(图18)。
编辑转录物中的多个A
结果表明,ADAR脱氨酶结构域的靶向窗口中的与C相对的A可先于其他碱基优先被编辑。此外,在靶向碱基的几个碱基内与U配对的A碱基显示出低Cas13b-ADAR融合物编辑水平,这表明该酶可以灵活地编辑多个A(图19)。这两个观察结果表明,可以通过使待编辑的所有A与C错配来指定Cas13b-ADAR融合物的活性窗口中的多个A以进行编辑。为了对此进行测试,采用了优化实验中最有前景的指导物并且在活性窗口中设计了多个A:C错配,以测试创建多个A:I编辑的可能性。使用NGS定量此实验的编辑率。为了阻遏活性窗口中的潜在脱靶编辑,将非靶A与A或G配对(取决于碱基优选性实验的结果)。
用于RNA编辑的指导物长度滴定
ADAR天然地作用于长度>20bp的分子间或分子内RNA双链体(另参见Nishikura等人(2010),Annu Rev Biochem,79:321-349)。结果展示,更长的crRNA产生更长的双链体,它具有更高的活性水平。为了针对RNA编辑活性系统地比较不同长度的指导物的活性,在荧光素酶报告基因测定中我们设计了30、50、70和84个碱基的指导物以校正终止密码子(图20和下表)。我们设计了这些指导物,使得编辑的A的位置存在于在mRNA:crRNA双链体内相对于crRNA特异性决定区的3'端所有可能的偶数距离(即+2、+4等)处。
逆转因果疾病突变
合成了具有病原性G>A突变(其将早期终止位点引入基因中)的下表中的三个基因并且将它们整合到非人类细胞系中。测试了Cas13b12-ADAR2通过将终止密码子UAG改变为UIG(UGG)并由此恢复蛋白质翻译来校正转录物的能力。
下表5中示出了另外48个病原性G>A突变连同伴随的疾病。围绕这些突变合成了200bp的片段而非整个基因,并将这些片段克隆在GFP前面。当早期停止位点恢复时,将允许GFP的翻译,并且可以通过高通量荧光以及RNA测序测量校正。
表5
实施例3
有效且精确的核酸编辑就治疗遗传性疾病而言具有广阔的前景,尤其是在RNA水平上,在RNA水平上可以挽救疾病相关转录物,以产生功能性蛋白质产品。VI型CRISPR-Cas系统含有可编程的单效应RNA指导的RNA酶Cas13。在此,我们概述了VI型系统的多样性,以工程化能够进行稳健敲低的Cas13直系同源物,并且通过使用无催化活性的Cas13(dCas13)来将腺苷脱氨酶活性引导至哺乳动物细胞中的转录物来证实RNA编辑。通过将ADAR2脱氨酶结构域与dCas13融合并工程化指导RNA以产生最佳的RNA双链体底物,我们实现了从特定的单个腺苷到肌苷(在翻译过程中被读出为鸟苷)的靶向编辑,其效率常规地在20%-40%的范围内,并且最高达89%。该系统(称之为用于可编程A至I替换的RNA编辑(REPAIR))可以进一步工程化以实现高特异性。工程化变体REPAIRv2显示出的特异性增加大于170倍,同时保持了稳健的中靶A至I编辑,以及使系统最小化以方便病毒递送。我们使用REPAIRv2编辑含有已知病原性突变的全长转录物,并且产生适合于包装在腺相关病毒(AAV)载体中的功能性截短形式。REPAIR提出了一个有前途的RNA编辑平台,所述平台在研究、治疗学和生物技术方面具有广泛的适用性。精确的核酸编辑技术对于研究细胞功能和作为新颖疗法非常有价值。尽管当前的编辑工具(诸如Cas9核酸酶)可以实现对基因组基因座的可编程修饰,但是由于插入或缺失或需要供体模板进行精确编辑,编辑常常是异质的。碱基编辑器(诸如dCas9-APOBEC融合物)允许进行编辑而不会产生双链断裂,但由于胞苷脱氨酶活性的性质(编辑靶标窗口中的任何胞苷),因此可能缺乏精确性。此外,对原间隔区相邻基序(PAM)的要求限制了可能的编辑位点的数量。在此,我们描述了精确且灵活的RNA碱基编辑工具的开发,所述工具使用了来自VI型原核生物成簇规律间隔短回文重复序列(CRISPR)自适应免疫系统的RNA指导的RNA靶向Cas13酶。
精确的核酸编辑技术对于研究细胞功能和作为新颖疗法非常有价值。当前基于可编程核酸酶(诸如原核生物成簇规律间隔短回文重复序列(CRISPR)相关的核酸酶Cas9(1-4)或Cpf1(5))的编辑工具已广泛用于介导靶向DNA切割,进而通过非同源末端连接(NHEJ)驱动靶向的基因破坏或通过模板依赖性同源直接修复(HDR)驱动精确的基因编辑(6)。NHEJ利用在分裂细胞和有丝分裂后细胞中均活跃的宿主机器,并且通过产生可导致蛋白质编码基因移码的插入或插入缺失突变的混合物,提供有效的基因破坏。相比之下,HDR由表达主要限于复制细胞的宿主机器介导。因此,有丝分裂后细胞中基因编辑能力的开发仍然是主要挑战。最近,DNA碱基编辑器(诸如使用无催化活性的Cas9(dCas9)将胞苷脱氨酶活性靶向至特定的基因组靶标,以在靶标窗口内实现胞嘧啶向胸腺嘧啶的转化)允许在不产生DNA双链断裂的情况下进行编辑并显著降低插入缺失的形成(7,8)。然而,由于Cas9在编辑位点处需要原间隔区相邻基序(PAM),因此DNA碱基编辑器的靶向范围受到限制(9)。在此,我们描述了使用VI型CRISPR相关RNA指导的RNA酶Cas13开发精确且灵活的RNA碱基编辑技术(10-13)。
Cas13酶具有两个介导精确RNA切割的结合高级真核生物和原核生物核苷酸(HEPN)的内切RNA酶结构域(10,11)。迄今为止,已鉴定出三个Cas13蛋白家族:Cas13a(以前称为C2c2)、Cas13b和Cas13c(12,13)。我们最近报道,Cas13a酶可以适合用作核酸检测的工具(14)以及哺乳动物和植物细胞的RNA敲低和转录物追踪的工具(15)。Cas13酶的RNA指导性质使其成为RNA结合和干扰应用的有吸引力工具。
作用于酶的RNA(ADAR)家族的腺苷脱氨酶通过使腺苷水解脱氨为肌苷来介导转录物的内源性编辑,肌苷是在翻译和剪接中与鸟苷功能上等同的核碱基(16)。有两种功能性人ADAR直系同源物ADAR1和ADAR2,它们由N末端双链RNA结合结构域和C末端催化脱氨结构域组成。ADAR1和ADAR2的内源性靶位点含有实质性的双链同一性,并且催化结构域需要双链体区域才能在体外和体内进行有效编辑(18,19)。重要的是,ADAR催化结构域能够在没有任何体外蛋白质辅助因子的情况下使靶腺苷脱氨基(20)。发现ADAR1主要靶向重复区,而ADAR2主要靶向非重复编码区(17)。尽管ADAR蛋白具有优选的可能限制靶向的潜在灵活性的编辑基序,但超活性突变体(诸如ADAR(E488Q)(21))放松了序列限制,并且提高腺苷到肌苷的编辑率。ADAR优先使RNA双链体中与胞苷碱基相对的腺苷脱氨基(22),从而为精确的碱基编辑提供了有希望的机会。尽管以前的方法已经经由RNA指导物工程化靶向ADAR融合物(23-26),但是尚未报道这些方法的特异性,并且它们各自的靶向机制依赖于RNA-RNA杂交,而不借助于可能增强靶标识别和严格性的蛋白质配偶体。
在此,我们测定了整个Cas13酶家族在哺乳动物细胞中的RNA敲低活性,并且鉴定出来自普雷沃氏菌属种P5-125的Cas13b直系同源物(PspCas13b)对于哺乳动物细胞应用而言是最有效且最具特异性的。然后,我们将ADAR2脱氨酶结构域(ADARDD)与无催化活性的PspCas13b融合,并且证实了用于对报告基因和内源性转录物以及疾病相关突变的可编程A到I(G)替换(REPAIR)的RNA编辑。最后,我们采用合理的诱变方案来改善dCas13b-ADAR2DD融合物的特异性,以产生特异性增加超过170倍的REPAIRv2。
方法
细菌构建体的设计和克隆
在Lac启动子的控制下,将经哺乳动物密码子优化的Cas13b构建体克隆到氯霉素抗性pACYC184载体中。然后,在pJ23119启动子的控制下,将由BsaI限制性位点隔开的两个相应的正向重复(DR)序列插入Cas13b的下游。最后,使用T4 PNK(New England Biolabs)将用于靶向间隔区的寡核苷酸磷酸化、退火、并且使用T7连接酶(Enzymatics)连接到BsaI消化的载体中,以生成靶向Cas13b载体。所使用的指导序列在表11中。
细菌PFS筛选
通过使用NEB Gibson Assembly(New England Biolabs)插入含有带有2个5'随机化核苷酸和4个3'随机化核苷酸的Cas13b靶标的PCR产物来克隆氨苄青霉素抗性质粒用于PFS筛选,所述5'随机化核苷酸和所述3'随机化核苷酸由在紧邻氨苄青霉素抗性基因bla起始密码子下游的靶位点隔开。然后将100ng氨苄青霉素抗性靶质粒与65-100ng氯霉素抗性Cas13b细菌靶向质粒一起电穿孔到Endura电感受态细胞中。将质粒添加到细胞中,在冰上孵育15分钟,使用制造商的方案进行电穿孔,然后将950uL的回收培养基添加到细胞中,之后在37C下生长一小时。将生长物铺板到氯霉素和氨苄青霉素双重选择板上。将生长物的连续稀释液用于估计cfu/ng DNA。铺板后16小时,将细胞从板上刮下,并且使用QiagenPlasmid Plus Maxi试剂盒(Qiagen)收获存活的质粒DNA。通过PCR扩增存活的Cas13b靶序列及其侧翼区域,并且使用Illumina NextSeq进行测序。为了评估PFS优选性,提取原始文库中含有随机化核苷酸的位置,并使用自定义python脚本提取存在于两个生物复制品中的仅相对于载体条件耗尽的序列。然后,将Cas13b条件下的PFS丰度与仅载体对照之比的-log2用于计算优选的基序。具体地,将所有-log2(样品/载体)耗尽比高于特定阈值的序列都用于生成序列基序的weblogo(weblogo.berkeley.edu)。表9中列出了用于针对每个Cas13b直系同源物生成weblogo的特定耗尽比值。
用于RNA干扰的哺乳动物构建体的设计和克隆
为了产生用于在哺乳动物细胞中测试Cas13直系同源物的载体,对经哺乳动物密码子优化的Cas13a、Cas13b和Cas13c基因进行PCR扩增,并且在EF1α启动子的控制下,将其金门(golden-gate)克隆到含有双重NLS序列和C端msfGFP的哺乳动物表达载体中。为了进一步优化,在EF1α启动子的控制下,将Cas13直系同源物金门克隆到含有不同C端定位标签的目的载体中。
通过扩增海肾荧光素酶和海萤荧光素酶编码DNA、EF1α和CMV启动子的PCR和使用NEB Gibson Assembly(New England Biolabs)的组件来克隆双重荧光素酶报告基因。
为了表达Cas13a、Cas13b或Cas13c直系同源物的哺乳动物指导RNA,合成了具有金门受体位点的相应正向重复序列,并且通过限制性消化克隆将其在U6表达下克隆。然后通过金门克隆将各个指导序列克隆到每个直系同源物的相应表达主链中。补充表10中列出了所有Cas13质粒。补充表11-补充表13中列出了用于敲低实验的所有Cas13指导序列。
对Cas13在哺乳动物细胞中的表达的测量
使用靶向和非靶向指导物将双重NLS Cas13-msfGFP构建体转染到HEK293FT细胞中。转染后48小时,使用读板仪在非靶向指导物条件下测量GFP荧光。
针对Cas13干扰特异性的合并错配文库的克隆
通过PCR产生合并错配文库靶位点。将含有G-荧光素酶中的在靶标内每个位置处含有94%正确碱基和2%每个错误碱基的混合物的半简并靶序列的寡核苷酸用作一个引物,并且将对应于G-荧光素酶的非靶向区的寡核苷酸用作PCR反应中的第二引物。然后使用NEB Gibson assembly(New England Biolabs)将错配文库靶标克隆到双重荧光素酶报告基因中以代替野生型G-荧光素酶。
用于RNA编辑的哺乳动物构建体的设计和克隆
经由在HEPN结构域的催化位点处的两个组氨酸到丙氨酸突变(H133A/H1058A)使PspCas13b失去催化活性(dPspCas13b)。合成人类ADAR1和ADAR2的脱氨酶结构域,并且对其进行PCR扩增以gibson克隆到pcDNA-CMV载体主链中,并且经由GS或GSGGGGS(SEQ IDNo.296)接头在C端处与dPspCas13b融合。对于我们测试不同接头的实验,我们在dPspCas13b与ADAR2dd之间克隆了以下其他接头:GGGGSGGGGSGGGGS、EAAAK(SEQ IDNo.297)、GGSGGSGGSGGSGGSGGS(SEQ ID No.298)和SGSETPGTSESATPES(SEQ ID No.299)(XTEN)。通过将适当的突变体gibson克隆到dPspCas13b-GSGGGGS主链中来产生特异性突变体。
通过在用于敲低实验的荧光素酶报告载体中产生W85X突变(TGG>TAG),产生了用于测量RNA编辑活性的荧光素酶报告载体。该报告载体表达功能性Gluc以作为归一化对照,但是由于添加了早期终止位点,所以所述功能性Gluc是缺陷型Cluc。为了测试ADAR编辑基序优选性,我们克隆了在Cluc的第85位密码子(XAX)处腺苷周围的每个可能基序。补充表10中列出了所有质粒。
为了测试REPAIR的PFS优选性,我们克隆了合并的质粒文库,所述文库在靶区域和腺苷编辑位点的上游含有6个碱基对的简并PFS序列。所述文库是由Integrated DNATechnologies(IDT)以超聚物形式合成,并且通过退火引物并将DNA聚合酶I的Klenow片段(New England Biolabs)填充在序列中而成为双链的。然后将该含有简并序列的dsDNA片段gibson克隆到消化的报告载体中,然后将该载体异丙醇沉淀并纯化。然后将克隆的文库电穿孔到Endura感受态大肠杆菌细胞(Lucigen)中并且铺板在245mm x 245mm方形生物测定板(Nunc)上。16小时后,收获菌落并且使用无内毒素的MACHEREY-NAGEL midiprep试剂盒进行中量制备。通过下一代测序验证克隆的文库。
为了克隆疾病相关突变以测试REPAIR活性,选择了与ClinVar中定义的疾病发病机理相关的34个G>A突变,并且在CMV启动子下将这些突变周围的200bp区域金门克隆在mScarlett与EGFP之间。选择AVPR2和FANCC中的两个另外的G>A突变用于在EF1α表达下Gibson克隆整个基因序列。
为了表达用于REPAIR的哺乳动物指导RNA,合成了具有金门受体位点的PspCas13b正向重复序列,并且通过限制性消化克隆将其在U6表达下克隆。然后通过金门克隆将各个指导物克隆到该表达主链中。补充表14中列出了用于REPAIR实验的指导序列。
哺乳动物细胞培养
在HEK293FT品系(美国典型培养物保藏中心(ATCC))中进行了哺乳动物细胞培养实验,将所述品系在具有高葡萄糖、丙酮酸钠和GlutaMAX(Thermo Fisher Scientific)、额外补充有1×青霉素-链霉素(Thermo Fisher Scientific)和10%胎牛血清(VWRSeradigm)的杜氏改良型伊格尔培养基(Dulbecco’s Modified Eagle Medium)中生长。将细胞保持在低于80%的汇合度。
除非另有说明,否则所有转染均用Lipofectamine 2000(Thermo FisherScientific)在涂覆有聚-D-赖氨酸(BD Biocoat)的96孔板中进行。在转染前十六个小时将细胞以大约20,000个细胞/孔铺板,以确保在转染时达到90%汇合度。对于板上的每个孔,将转染质粒与Opti-MEMI还原血清培养基(Thermo Fisher)合并至总共25μl。分别地,将24.5ul的Opti-MEM与0.5ul的Lipofectamine 2000合并。然后将质粒和Lipofectamine溶液合并,并且孵育5分钟,然后将其吸移到细胞上。根据制造商的规程,使用Lipofectamine3000进行U2OS转染。
RNA敲低哺乳动物细胞测定
为了评定在具有报吿构建体的哺乳动物细胞中的RNA靶向,将150ng的Cas13构建体与300ng的指导表达质粒和12.5ng的敲低报吿构建体共转染。转染后48小时,从细胞中移取出含有分泌型荧光素酶的培养基,将其在PBS中以1:5稀释,并且使用注射方案在读板仪(Biotek Synergy Neo2)上使用BioLux海萤和Biolux海肾荧光素酶测定试剂盒(NewEngland Biolabs)测量活性。进行的所有重复都是生物学重复。
为了靶向内源性基因,将150ng的Cas13构建体与300ng的指导表达质粒共转染。转染后48小时,将细胞裂解并且收获RNA并使用先前描述的Cells-to-Ct试剂盒(ThermoFisher Scientific)的(33)修改版进行逆转录。使用针对用于KRAS转录物的TaqMan qPCR探针(Thermo Fisher Scientific)、GAPDH对照探针(Thermo Fisher Scientific)和快速高级主混合物(Thermo Fisher Scientific),通过qPCR测量cDNA表达。在LightCycler 480仪器II(Roche)上读取qPCR反应,以384孔格式进行四次5ul技术重复。
使用错配靶标的合并文库评估RNA特异性
使用接种在6孔板中的HEK293FT细胞测试了Cas13干扰错配靶标文库的能力。使用2400ng Cas13载体、4800ng指导物和240ng错配的靶标文库转染约70%汇合细胞。转染后48小时,收获细胞并且使用QIAshredder(Qiagen)和Qiagen RNeasy微型试剂盒提取RNA。按照制造商的基因特异性引发方案使用qScript Flex cDNA合成试剂盒(Quantabio)和Gluc特异性RT引物,对1ug提取RNA进行逆转录。然后扩增cDNA并在Illumina NextSeq上测序。
通过对每个序列的读数进行计数来分析测序,并且通过确定log2(-读取计数比)值来计算耗尽得分,其中读取计数比是靶向指导物条件与非靶向指导物条件的读取计数之比。该得分值表示序列上Cas13的活性水平,较高的值表示更强的耗尽,并且因此表示较高的Cas13切割活性。确定了单错配和双错配序列的单独分布,并将其绘制为热图,所述热图具有针对每个错配身份的耗尽得分。对于双错配序列,绘制了给定位置处所有可能的双错配的平均值。
通过RNA测序对哺乳动物细胞中的Cas13进行全转录组分析
为了测量全转录组特异性,共转染了150ng Cas13构建体、300ng指导表达质粒和15ng敲低报告构建体;对于shRNA条件,共转染了300ng shRNA靶向质粒、15ng敲低报告构建体和150ng EF1α驱动mCherry(以平衡报告基因负载)。转染后48小时,用RNeasy Plus微型试剂盒(Qiagen)纯化RNA,使用NEBNext Poly(A)mRNA磁性分离模块(New EnglandBiolabs)选择mRNA,并且将其制备用于用Illumina的NEBNext Ultra RNA文库制备试剂盒(New England Biolabs)进行测序。然后在NextSeq(Illumina)上对RNA测序文库进行测序。
为了分析全转录组测序数据,使用Bowtie和RSEM版本1.2.31利用默认参数参考序列GRCh38组件比对读数(34):在用或不用参考基因组的情况下从RNA测序数据进行准确的转录定量]。将转录物表达定量为log2(TPM+1),过滤基因以使log2(TPM+1)>2.5。为了选择差异表达的基因,仅考虑差异变化>2或<.75的基因。在三个靶向重复品与非靶向重复品上学生T检验评估差异表达的统计显著性,并且通过Benjamini-Hochberg程序针对<0.01%的错误发现率进行过滤。
哺乳动物细胞转染中的ADAR RNA编辑
为了评估哺乳动物细胞中的REPAIR活性,我们转染了150ng REPAIR载体、300ng指导表达质粒和40ng RNA编辑报告基因。48小时后,从细胞中收获RNA并且使用先前描述的方法(33)和基因特异性逆转录引物进行逆转录。然后使用NEBNext高保真度2X PCR主混合物(New England Biolabs)对提取的cDNA进行两轮PCR,以添加Illumina衔接子和样品条形码。然后在Illumina NextSeq或MiSeq上对文库进行下一代测序。然后在测序窗口内评估所有腺苷处的RNA编辑率。
在荧光素酶报告基因被靶向用于RNA编辑的实验中,我们在RNA收获之前还收获了具有分泌型荧光素酶的培养基。在这种情况下,因为校正后的Cluc可能处于较低水平,因此我们没有稀释培养基。我们使用注射方案在读板仪(Biotek Synergy Neo2)上使用BioLux海萤和Biolux海肾荧光素酶测定试剂盒(New England Biolabs)测量了荧光素酶活性。进行的所有重复都是生物学重复。
PFS结合哺乳动物筛选
为了确定PFS对编辑效率的贡献,将625ng PFS靶标文库、4.7ug指导物和2.35ugREPAIR共转染在铺板在225cm2烧瓶中的HEK293FT细胞上。将质粒与33ul PLUS试剂(ThermoFisher Scientific)混合,用Opti-MEM调节至533ul,孵育5分钟,再与30ul Lipofectamine2000和500ul Opti-MEM合并,再孵育5分钟,然后将其吸移到细胞上。转染后48小时,使用RNeasy Plus微型试剂盒(Qiagen)收获RNA,使用基因特异性引物用qScript Flex(Quantabio)逆转录,并使用NEBNext高保真度2X PCR主混合物(New England Biolabs)以两轮PCR进行扩增以添加Illumina衔接子和样品条形码。将所述文库在Illumina NextSeq上测序,并且将靶腺苷处的RNA编辑率与PFS身份进行映射。为了增加覆盖率,PFS在计算上被折叠为4个核苷酸。计算每个PFS的REPAIR编辑率,在减去相应PFS的非靶向率的情况下将其在生物学复制品上求平均值。
全转录组测序以评价ADAR编辑特异性
为了分析整个转录组的脱靶RNA编辑位点,我们使用RNeasy Plus微型制备试剂盒(Qiagen)在转染后48小时从细胞中收获总RNA。然后使用NEBNext Poly(A)mRNA磁性分离模块(NEB)富集mRNA级分,然后将此RNA制备用于使用Illumina的NEBNext Ultra RNA文库制备试剂盒(NEB)进行测序。然后将文库在Illumina NextSeq上进行测序并加载成使得每个样品读取至少500万次。
靶向和全转录组实验的RNA编辑分析
使用我们开发的自定义工作流程在FireCloud计算框架(https://software.broadinstitute.org/firecloud/)上进行全转录组编辑RNA测序数据分析:https://portal.firecloud.org/#methods/m/rna_editing_final_workflow/rna_editing_final_workflow/1。为了进行分析,除非另外指明,否则将序列文件随机降采样至500万个读取。使用添加了Gluc和Cluc序列的参考序列GRCh38组件生成了索引,并且使用Bowtie/RSEM版本1.3.0对读数进行比对和定量。然后对比对BAM进行分类并且使用REDitools(35,36)用以下参数分析RNA编辑位点:-t 8 -e -d -l -U[AG or TC]-p -u -m20 -T6-0 -W -v 1 -n 0.0。在未转染或EG FP转染的条件下发现的任何显著的编辑均视为SNP或转染伪像,并将其从脱靶分析中过滤掉。如果在通过Benjamini Hochberg校正进行多次假设校正之后Fisher的精确检验得出的p值小于0.05,并且3个生物学重复品中至少有2个鉴定出编辑位点,则认为脱靶是显著的。相对于最大可能的重叠(相当于两个样本之间的较少编辑数量)计算样本之间的编辑重叠。重叠编辑位点的百分比计算为共有编辑位点的数量除以两个样本的最小编辑数量乘以100。对于高覆盖率测序分析,使用Kaviar(37)的SNP鉴定方法对已知SNP位置进行额外一层过滤。
为了分析每个脱靶的预测变异效应,使用作为UCSC基因组浏览器工具套件的一部分的变异注释整合器(https://genome.ucsc.edu/cgi-bin/hgVai)使用SIFT和PolyPhen-2注释对脱靶编辑位点列表进行了分析。要声明脱靶基因是否是致癌基因,请参阅COSMIC癌症体细胞突变目录(cancer.sanger.ac.uk)中的致癌注释数据库。
为了分析REPAIR构建体是否干扰RNA水平,将从RSEM分析输出的每百万转录物(TPM)值用于表达计数,并且通过取log2(TPM+1)转化为对数空间。为了找到差异调控的基因,在三个靶向指导物重复品与三个非靶向指导物重复品上进行了学生t检验。仅对log2(TPM+1)值大于2.5的基因进行统计分析,并且只有倍数变化大于2或小于0.8的基因才被认为是差异调控的。如果基因具有小于0.01的错误发现率,则报告所述基因。
结果
对哺乳动物细胞中Cas13家族成员的综合表征
我们先前开发了LwaCas13a用于哺乳动物敲低应用,但是它需要msfGFP稳定结构域才能有效敲低,尽管特异性很高,但敲低效率并没有始终低于50%(15)。我们试图通过表征一组遗传多样的Cas13家族成员以评定其在哺乳动物细胞中的RNA敲低活性来鉴定出一种更稳健的RNA靶向CRISPR系统(图49A)。我们将21个Cas13a、15个Cas13b和7个Cas13c哺乳动物密码子优化的直系同源物(表6)克隆到具有N端和C端核输出信号(NES)序列和C端msfGFP的表达载体中,以增强蛋白质稳定性。为了测定在哺乳动物细胞中的干预,我们设计了双重报告构建体,所述构建体在单独的启动子下表达直系同源的海肾(Gluc)和海萤(Cluc)荧光素酶,从而使一种荧光素酶充当Cas13干预活性的量度,而另一种则可以作为内部对照。对于每个直系同源物,我们使用来源于氨苄青霉素干预测定的Cas13b PFS基序(图55;表7)和来自先前Cas13a活性报道的3’H PFS(非G)设计了与PFS相容的指导RNA(10)。
我们用Cas13表达、指导RNA和报告质粒转染了HEK293FT细胞,并在48小时后定量了靶向Gluc的水平(图49B、图69A)。对每个Cas13直系同源物测试两个指导RNA揭示了一系列的活性水平,包括在两个指导RNA上相对于最近表征的LwaCas13a具有相似或增加干预的五个Cas13b直系同源物(图49B),并且我们观察到在Cas13表达与干扰活性之间只有微弱的相关性(图69B-图69D)。我们选择了这五个Cas13b直系同源物,以及前两个Cas13a直系同源物,以进行进一步的工程化。
接下来,我们测试了在没有msfGFP的情况下,Cas13介导的Gluc的敲低,以选择不需要稳定结构域来实现稳健活性的直系同源物。我们假设,除了msfGFP外,Cas13活性还可能受到亚细胞定位的影响,如先前针对LwaCas13a优化所报道的(15)。因此,我们测试了在C端与六个不带msfGFP的不同定位标签之一融合的七个选择的Cas13直系同源物的干扰活性。使用荧光素酶报告基因测定,我们发现在C端与HIV Rev基因NES融合的PspCas13b和PguCas13b和在C端与MAPK NES融合的RanCas13b具有最高水平的干扰活性(图56A)。为了进一步区分热点直系同源物的活性水平,我们将三个优化的Cas13b构建体与最佳的LwaCas13a-msfGFP融合物和shRNA针对其使用位置匹配的指导物敲低KRAS转录物的能力进行比较(图56B)。我们观察到PspCas13b的干扰水平最高(平均敲低率为62.9%),由此选择了该PspCas13b来与LwaCas13a进行进一步比较。
为了更严格地定义PspCas13b和LwaCas13a的活性水平,我们设计了沿Gluc和Clue平铺的位置匹配指导物,并且使用我们的荧光素酶报告基因测定测定了它们的活性。我们分别测试了靶向Gluc和Cluc的93个和20个位置匹配指导物,发现相对于LwaCas13a,PspCas13b具有始终增加的敲低水平(PspCas13b的平均值为92.3%,而LwaCas13a的敲低率为40.1%)(图49C、图49D)。
Cas13哺乳动物干扰活性的特异性
为了表征PspCas13b和LwaCas13a的干扰特异性,我们设计了在整个靶序列以及三个侧翼5'和3'碱基对中含有单错配和双错配的荧光素酶靶标的质粒文库(图56C)。我们用LwaCas13a或PspCas13b、靶向未修饰靶序列的固定指导RNA以及对应于适当系统的错配靶标文库转染了HEK293FT细胞。然后,我们对未切割的转录物进行了靶向RNA测序,以定量错配靶序列的耗尽。我们发现LwaCas13a和PspCas13b具有相对不耐受单错配的中心区域,所述中心区域对于PspCas13b靶标从碱基对12-26扩展并且对于LwaCas13a靶标从碱基对13-24扩展(图56D)。与单突变相比,双错配的耐受性甚至更低,在较大的窗口中观察到的敲低活性很小,在各自的靶标中,所述窗口对于PspCas13b从碱基对12-29扩展并且对于LwaCas13a从碱基对8-27扩展(图56E)。另外,由于在靶序列的5'和3'端侧翼的三个核苷酸中含有错配,我们可以评定PFS对Cas13敲低活性的限制。测序表明,几乎所有PFS组合都可实现稳健的敲低,这表明对于测试的任一种酶,可能都不存在PFS对哺乳动物细胞中的干扰的限制。这些结果表明Cas13a和Cas13b显示出相似的序列约束和对错配的敏感性。
接下来,我们表征了PspCas13b和LwaCas13a在转录组的mRNA级分上的干扰特异性。我们进行了转录组范围的mRNA测序,以检测显著差异表达的基因。LwaCas13a和PspCas13b展示出稳健的Gluc敲低(图49E、图49F),并且与显示出数百个脱靶的位置匹配的shRNA相比具有高度特异性(图49G),这与我们之前对哺乳动物细胞中LwaCas13a的特异性的表征结果一致(15)。
Cas13-ADAR融合物实现靶向RNA编辑
鉴于PspCas13b在哺乳动物细胞中实现了一致、稳健且特异性的mRNA敲低,我们设想其可以适合作为RNA结合平台来募集ADAR的脱氨酶结构域(ADARDD)以进行可编程RNA编辑。为了工程化缺乏核酸酶活性的PspCas13b(dPspCas13b,据此称之为dCas13b),我们使HEPN结构域中的保守催化残基突变,并且观察到荧光素酶RNA敲低活性的丧失(图57A)。我们假设dCas13b-ADARDD融合物可以通过指导RNA募集以靶向腺苷,其中杂交的RNA产生ADAR活性所需的双链体底物(图50A)。为了提高靶腺苷脱氨率,我们在最初的RNA编辑设计中引入了另外两个修饰:我们引入了与靶腺苷相对的错配胞苷(先前据报道此举增加了脱氨频率),并将dCas13b与含有超活化突变以增强催化活性的人类ADAR1或ADAR2的脱氨酶结构域(ADAR1DD(E1008Q)(27)或ADAR2DD(E488Q)(21))融合。
为了测试dCas13b-ADARDD的活性,我们通过引入无义突变(W85X(UGG->UAG))在Cluc上产生RNA编辑报告基因,所述突变可通过A->I编辑(图50B)而功能上修复为野生型密码子并且然后检测为Cluc荧光的恢复。我们在靶腺苷上均匀平铺其中间隔区长度为30、50、70或84个核苷酸的指导物,以确定最佳的指导物布置和设计(图50C)。我们发现dCas13b-ADAR1DD需要更长的指导序列来修复Cluc报告基因,而dCas13b-ADAR2DD在测试的所有指导序列长度下均是功能性的(图50C)。我们还发现,超活性E488Q突变提高了编辑效率,因为具有野生型ADAR2DD的荧光素酶的恢复减少(图57B)。根据此活性展示,我们选择dCas13b-ADAR2DD(E488Q)用于进一步表征,并且将此方法指定为可编程A至I替换的RNA编辑版本1(REPAIRv1)。
为了验证荧光素酶活性的恢复是由于真正的编辑事件引起的,我们直接通过逆转录和靶向的下一代测序测量了经历REPAIRv1的Cluc转录物的编辑。我们测试了在靶位点周围的30nt和50nt的间隔区,并且发现两种指导物长度均导致预期的A至I编辑,而50nt的间隔区实现了更高的编辑百分比(图50D、图50E、图57C)。我们还观察到,50nt间隔区增加了在非靶向腺苷处的编辑倾向,这可能是由于双链体RNA区域的增加(图50E、图57C)。
接下来我们靶向内源性基因PPIB。我们设计了平铺PPIB的50nt的间隔区,并且发现我们可以最高达28%的编辑效率编辑PPIB转录物(图57D)。为了测试REPAIR是否可以被进一步优化,我们修改了dCas13b与ADAR2DD(E488Q)之间的接头(图57E,表8),并且发现接头选择适度影响了荧光素酶活性的恢复。此外,我们测试了dCas13b和指导物单独介导编辑事件的能力,发现编辑需要ADAR脱氨酶结构域(图70A-图70D)。
定义用于RNA编辑的序列参数
鉴于我们可以在测试位点实现精确的RNA编辑,我们想要表征针对转录组中任何RNA靶标进行系统编程的序列限制。序列限制可能源自dCas13b靶向限制(诸如PFS)或ADAR序列优选性(26)。为了研究对REPAIRv1的PFS限制,我们设计了质粒文库,该文库在Cluc转录物上的靶位点的5'端带有一系列四个随机化核苷酸(图51A)。我们靶向UAG或AAC基序内的中心腺苷并且发现对于这两个基序,所有PFS均展示出可检测水平的RNA编辑,其中大多数PFS在靶位点具有大于50%的编辑(图51B)。接下来,我们试图确定REPAIRv1中的ADAR2DD是否具有紧邻靶碱基侧翼的任何序列限制,如先前已关于ADAR2DD报道的(26)。我们测试了直接在靶腺苷周围的5'和3'侧翼核苷酸的每种可能组合(图51C),并且发现REPAIRv1能够编辑所有基序(图51D)。最后,我们分析了与间隔区序列中的靶A相对的碱基的身份是否影响编辑效率,并且发现A-C错配具有最高的荧光素酶恢复率,其中A-G、A-U和A-A具有大大降低的REPAIRv1活性(图57F、图70E)。
使用REPAIRv1对疾病相关人类突变的校正
为了证明REPAIRv1系统对于哺乳动物细胞中的RNA编辑的广泛适用性,我们针对两种与疾病相关突变设计了REPAIRv1指导物:X连锁性肾原性糖尿病中的878G>A(AVPR2W293X)和范科尼贫血中的1517G>A(FANCC W506X)。我们将针对携带这些突变的基因的cDNA的表达构建体转染到HEK293FT细胞中,并且测试REPAIRv1是否可以校正突变。使用含有50nt间隔区的指导RNA,我们能够实现AVPR2的35%校正和FANCC的23%校正(图52A-图52D)。然后,我们测试了REPAIRv1校正34种疾病相关G>A突变(表9)的能力,并且发现我们能够在33个位点处实现显著编辑,编辑效率最高达28%(图52E)。我们选择的突变只是ClinVar数据库中病原性G至A突变的一部分(5,739个),所述数据库还包括另外11,943个G至A变异(图52F和图58)。因为没有序列限制,所以REPAIRv1能够潜在地编辑所有这些疾病相关突变,尤其是考虑到无论靶基序如何,我们都观察到了显著编辑(图51C和图52G)。
将REPAIRv1系统递送至患病细胞为用于治疗性用途的先决条件,并且因此我们试图设计可包装到治疗相关病毒载体诸如腺相关病毒(AAV)载体的REPAIRv1构建体。AAV载体具有4.7kb的包装限度,它不能容纳大尺寸的dCas13b-ADARDD(4473bp)连同启动子和表达调控元件。为了减小尺寸,对于RNA编辑活性我们测试了许多与ADAR2DD(E488Q)融合的dCas13的N端和C端截短物。我们发现所有测试的C端截短物仍有功能并且能够恢复荧光酶信号(图59),并且最大的截短C端Δ984-1090(融合蛋白的总尺寸,4,152bp)足够小以适应AAV载体的包装限度。
REPAIRv1的全转录物组特异性
尽管PspCas13b的RNA敲低具有高特异性,在荧光素酶平铺实验中,在指导物:靶标双链体内观察到脱靶腺苷编辑(图50E)。为了查看这是否是普遍存在的现象,我们评估内源性转录物KRAS并且测量靶腺苷附近的脱靶编辑程度(图53A)。我们发现对于KRAS而言,虽然中靶编辑率为23%,但在靶位点周围存在许多也具有可检测的A至G编辑的位点(图53B)。
由于在指导物:靶标双链体内观察到的脱靶编辑,所以我们通过对所有mRNA进行RNA测序来评估所有可能的转录物组脱靶。RNA测序揭示存在大量A至G脱靶事件,其中在靶向条件下具有1,732个脱靶并且在非靶向条件下具有925个脱靶,其中828个脱靶重叠(图53C、图53D)。在整个转录物组的所有编辑位点中,中靶编辑位点具有最高的编辑率,A至G转化率为89%。
鉴于Cas13靶向的高特异性,我们有理由认为脱靶可由ADAR引起。我们重复了Cluc靶向实验,这次将REPAIRv1加靶向指导物、REPAIRv1加非靶向指导物、单独的REPAIRv1或单独的ADARDD(E488Q)的转录组变化进行了比较(图71)。在每种条件下我们都发现到差异表达的基因和脱靶编辑事件(图71C)。有趣的是,在ADARDD(E488Q)与所有REPAIRv1脱靶编辑之间脱靶编辑事件存在高度重叠,这支持以下假设:REPAIR脱靶编辑由独立于dCas13b的ADARDD(E488Q)编辑事件驱动(图71)。
先前已描述了两种RNA指导的ADAR系统(图60A)。第一种系统利用ADAR2DD与结合至RNA发夹的小病毒蛋白兰布达N的融合物(22)。具有双链发夹的指导物RNA指导ADAR2DD编辑指导RNA中编码的位点(23)。第二种系统设计利用全长ADAR2(ADAR2)和具有ADAR2的双链RNA结合结构域(dsRBD)识别的发夹的指导RNA(21,24)。我们分析了这两种系统与REPAIRv1相比的编辑效率并且发现BoxB-ADAR2和ADAR2系统分别证实了63%和36%编辑率,相比之下REPAIRv1实现了89%编辑率(图60B-图60E)。另外,BoxB和ADAR2系统在靶向指导物条件下分别产生2018和174个观察到的脱靶,相比之下在REPAIRv1靶向指导物条件下产生1,229个脱靶。值得注意的是,使用两种基于ADAR2DD的系统(REPAIRv1和BoxB)的所有条件均在其脱靶中显示高重叠百分比,而ADAR2系统具有一组显著不同的脱靶(图60F)。靶向条件与非靶向条件之间以及REPAIRv1与BoxB条件之间的脱靶重叠表明,ADAR2DD独立于dCas13靶向驱动脱靶(图60F)。
通过合理蛋白质工程化改进REPAIRv1的特异性
为了改进REPAIR的特异性,我们采用ADAR2DD(E488Q)的结构指导的蛋白质工程化。由于脱靶的独立于指导物的性质,我们假设去稳定ADAR2DD(E488Q)-RNA结合将选择性地减少脱靶编辑,但由于dCas13b将ADAR2DD(E488Q)黏连到靶位点所致的局部浓度增加而保持中靶编辑。我们在ADAR2DD(E488Q)背景下诱变处理先前确定接触靶RNA的双链体区域的ADAR2DD(E488Q)残基(图54A)(18)。为了评定效率和特异性,我们在假设非靶向条件下检测到的背景荧光素酶恢复将指示更广泛脱靶活性的情况下使用靶向和非靶向指导物测试了17种单一突变体。我们发现在所选残基处的突变对靶向和非靶向指导物的荧光素酶活性具有显著影响(图54A、图54B、图61A)。大部分突变体显著改善靶向指导物的荧光素酶活性或者增加靶向指导物与非靶向指导物的活性比率,我们将该比率称为特异性得分(图54A、图54B)。我们选择这些突变体中的一个子集(图54B)用于通过下一代测序进行全转录物组特异性分析。正如预期,由全转录物组测序测量的脱靶与突变体的特异性得分相关(图61B)。我们发现除了ADAR2DD(E488Q/R455E),所有测序的REPAIRv1突变体都可以有效地编辑报告转录物(图54C),其中许多突变体显示脱靶数量减少(图61C、图62)。我们进一步探索特异性突变体的脱靶的周围基序,并且发现REPAIRv1和大部分工程化突变体表现出对齐编辑的强3’G优选性,这与表征的ADAR2基序一致(图63A)(28)。我们选择突变体ADAR2DD(E488Q/T375G)进行未来的实验,因为它在四种突变体中具有最高的编辑百分比和最低数量的全转录物组脱靶,我们将其称为REPAIRv2。与REPAIRv1相比,REPAIRv2表现出特异性增加,其中通过高覆盖率测序(125X覆盖率,10ng DNA转染)确定全转录物组脱靶从18,385个减少至20个(图54D)。在Cluc的靶向腺苷周围的区域中,REPAIRv2具有减少的脱靶编辑,在测序痕迹图中可见(图54E)。在来源于下一代测序的基序中,REPAIRv1呈现针对3’G的强优选性,但对所有基序均显示脱靶编辑(图63B);相比之下,REPAIRv2仅编辑最强脱靶基序(图63C)。编辑在转录物上的分布严重错位,其中高度编辑的基因具有超过60个编辑(图64A、图64B),而REPAIRv2仅多次编辑一个转录物(EEF1A1)(图64D-64F)。据预测REPAIRv1脱靶编辑产生许多变体,包括1000个错义突变(图64C),其中有93个致癌事件(图64D)。相比之下,REPAIRv2仅具有6个错义突变(图64E),这些错义突变不具有致癌结果(图64F)。预测的脱靶效应的此减小将REPAIRv2与其他RNA编辑方法区分开。使用不同剂量的指导RNA进行的实验表明,剂量反应可能会降低靶标活性(图68)。
对REPAIRv1或v2脱靶编辑周围序列的分析未揭示指导序列的同源性,表明脱靶可能与dCas13b无关(图72),这与REPAIRv1与ADAR脱氨酶结构域之间的脱靶的高度重叠一致(图71D)。为了直接将REPAIRv2与其他可编程ADAR系统进行比较,我们对所有系统以两种不同的ADAR载体剂量重复进行了Cluc靶向实验,发现在两种剂量下REPAIRv2的中靶编辑事件与BoxB和ADAR2相当,但脱靶编辑事件明显更少(图73)。与REPAIRv1相比,在两种剂量下REPAIRv2都具有增强的特异性(图73B),这一发现还扩展到靶向PPIB上不同位点的两个指导物(图74A-图74D)。值得注意的是,一般来讲,低剂量条件(10ng)比高剂量条件(150ng)具有更少的脱靶(图70)。
为了以更高的灵敏度评定编辑特异性,我们以明显更高的测序深度(转录组的125X覆盖度)对REPAIRv1和v2的低剂量条件(10ng转染的DNA)进行了测序。在较高的测序深度下发现脱靶的数量增加,这对应于检测到较少的脱靶事件(图75)。此外,我们推测不同的转录组状态也可能潜在地改变脱靶事件的数量。因此,我们测试了骨肉瘤U2OS细胞系中的REPAIRv2活性,对于靶向指导物和非靶向指导物分别观察到6个和7个脱靶(图76)。
申请人将REPAIRv2靶向内源性基因以测试特异性增强突变是否减少靶转录物中的附近编辑同时保持高效率中靶编辑。对于靶向KRAS或PPIB的指导物,我们发现REPAIRv2不具有可检测的脱靶编辑,并且可分别以27.1%和13%有效编辑中靶腺苷(图54F、图54G)。此特异性扩展至另外的靶位点,包括在REPAIRv1的非靶向条件下展示高水平背景的区域,诸如其他KRAS或PPIB靶位点(图65)。总之,REPAIRv2消除了编辑的腺苷周围的双链体区域中的脱靶并且显示显著增强的全转录物组特异性。
结论
申请人已在此表明RNA指导的RNA靶向的VI-B型效应子Cas13b能够进行高度有效且特异性的RNA敲低,为用于询问必需基因和非编码RNA以及将细胞过程控制在转录物水平下的改进工具提供基础。无催化活性的Cas13b(dCas13b)保留可编程的RNA结合能力,我们在此通过将dCas13b融合至腺苷脱氨酶ADAR2以实现精确A至I编辑来支持此能力,我们将此系统称为REPAIRv1(可编程A至I置换的RNA编辑版本1)。对该系统进行进一步工程化产生了REPAIRv2,这样一种方法相对于当前编辑平台具有相当的或增加的活性,比先前描述的RNA编辑平台具有显著提高的特异性(25,29),同时保持了高水平的中靶功效。
尽管Cas13b表现出高保真度,但是使用dCas13b-ADAR2DD融合物的初始结果显示了数以千计的脱靶。为了解决这个问题,申请人采用合理的诱变策略来改变接触RNA双链体的ADAR2DD残基,从而鉴定当融合至dCas13b时能够精确、有效且高特异性编辑的变体ADAR2DD(E488Q/T375G)。使用此变体的编辑效率相当于或好于使用两种当前可用系统BoxB-ADARDD或ADAR2编辑实现的效率。此外,REPAIRv2系统在整个转录物组中仅产生10个可观察的脱靶,至少比两种替代性编辑技术好一个数量级。尽管ADAR可以使RNA-DNA异源双链体中DNA链上的腺苷脱氨基(20),但在这种情况下可能不能实现,因为Cas13b不能有效结合DNA并且REPAIR位于细胞质中。此外,脱靶位点与指导序列缺乏同源性,并且脱靶位与仅ADARDD(E488Q)条件存在强烈重叠,这表明脱靶不受靶指导物结合的影响。更深度的测序和新颖的肌苷富集方法可以进一步完善将来我们对REPAIR特异性的了解。
REPAIR系统与其他核酸编辑工具相比提供了许多优点。首先,可以通过将胞苷置于所需腺苷对面的指导物延伸部内以形成对于ADAR编辑活性而言理想的有利A-C错配来在指导物中编辑精确靶位点。其次,Cas13不具有靶向序列限制,诸如PFS或PAM,并且也不具有靶腺苷周围的基序优选性,从而允许转录组中的任何腺苷被REPAIR系统潜在靶向。然而,我们注意到,DNA碱基编辑器可以靶向有义链或反义链,而REPAIR系统局限于转录的序列,由此限制我们可以靶向的可能编辑位点的总数目。然而,由于使用REPAIR靶向的更灵活性质,此系统可以影响到的ClinVar内的编辑(图52C)比Cas9-DNA碱基编辑器更多。第三,REPAIR系统直接将靶腺苷脱氨基成肌苷并且不依赖于内源性修复途径(诸如碱基切除或错配修复),以生成所需编辑结果。因此,REPAIR应在不能支持其他形式的编辑的非分裂细胞中(如在有丝分裂后的细胞中,如在神经元中)是可能的。第四,RNA编辑可以是瞬时的,提供了对编辑结果进行时序控制的可能性。此特性将可能适用于治疗由细胞状态的临时变化造成的疾病,诸如局部炎症。
REPAIR系统为额外工程化提供了多个机会。Cas13b具有前crRNA加工活性(13),从而允许多重编辑多个变体,这些变体单独地不能改变疾病风险,但一起可具有加成作用和疾病改善可能。合理设计方法的延伸部分(诸如将有前景的突变组合)可以进一步增加该系统的特异性和效率,而公正的筛选方法可以识别用于改进REPAIR活性和特异性的额外残基。
目前,通过REPAIR可实现的碱基转化局限于由腺苷生成肌苷;dCas13与其他催化性RNA编辑结构域的额外融合物诸如APOBEC可实现胞苷至尿苷的编辑。另外,ADAR的诱变可放松底物优选性以靶向胞苷,从而允许C->U编辑器探索由双链RNA底物要求赋予的特异性增强。使用无催化活性的DNA靶向CRISPR效应子(诸如dCas9或dCpf1),通过形成DNA-RNA异源双链体靶标(20)或诱变处理ADAR结构域也可以实现DNA底物上腺苷至肌苷的编辑。
REPAIR可应用于一系列其中A至I(A至G)编辑可逆转或减慢疾病进展的治疗适应症(图66)。首先,可以使用在疾病相关组织中用于靶向有原因的孟德尔遗传学G至A突变的REPAIR的表达来恢复有害突变并治疗疾病。例如,在脑组织中经由AAV进行稳定REPAIR表达可以用于矫正引起局灶性癫痫的GRIN2A错义突变c.2191G>A(Asp731Asn)(28)或引起早发性阿尔兹海默病的APP错义突变c.2149G>A(Val717Ile)(29)。其次,REPAIR可以用于通过改变参与疾病相关信号转导的蛋白质的功能来治疗疾病。例如,REPAIR编辑将允许重新编码激酶的靶标,即一些丝氨酸、苏氨酸和酪氨酸残基(图66)。在疾病相关蛋白中的这些残基的磷酸化影响了许多病症的疾病进展,这些病症包括阿尔兹海默病和多发性神经变性病状(30)。第三,REPAIR可以用于改变表达的改善风险的G至A变体的序列以优先减小患者进入疾病状态的机会。最引人注目的情况是“保护性”风险改善等位基因,其显著减小进入疾病状态的机会并且在一些情况下赋予额外健康益处。例如,REPAIR可以用于在功能上模拟分别预防心血管疾病和银屑病性关节炎的PCSK9和IFIH1的A至G等位基因(31,39)。最后,REPAIR可以用于在治疗上修饰用于外显子调节疗法的剪接受体和供体位点。REPAIR可以将AU改变为IU或将AA改变为AI,它们分别是共有5’剪接供体或3’剪接受体位点的功能等效物,从而形成新的剪接接合部。另外,REPAIR编辑可以使共有3’剪接受体位点发生AG->IG突变以促进相邻下游外显子的跳读,这是已得到显著关注的用于治疗DMD的治疗性策略。调节剪接位点在反义寡核苷酸具有一些成效的疾病中具有广泛应用,诸如用于调节SMN2剪接以用于治疗脊髓型肌萎缩(32)。
我们证实了PspCas13b酶作为RNA敲低和RNA编辑工具的用途。用于可编程RNA结合的dCas13b平台具有许多应用,包括实况转录物成像、剪接修饰、靶向定位转录物、拉下RNA结合蛋白以及表观转录组修饰。在此,我们使用dCas13形成REPAIR,将其添加到现有成套的核酸编辑技术。REPAIR提供了用于治疗遗传疾病或模拟保护性等位基因的新方法并且建立了作为用于修改遗传功能的有用工具的RNA编辑。
表6本研究中所使用的Cas13直系同源物
表7细菌筛选中的PFS截断
表8在本研究中用于在哺乳动物细胞中进行RNA编辑的dCas13b-ADAR接头序列.
表9疾病相关突变的疾病信息
表10:本研究中所使用的关键性质粒
表11:在本研究中用于在哺乳动物细胞中敲低的指导物/shRNA序列
表12:用于Gluc敲低的指导序列
表13:用于Cluc敲低的指导序列
表14:在本研究中用于在哺乳动物细胞中进行RNA编辑的指导序列.将错配碱基翻转大写
实施例4-REPAIRv3搜索
为了鉴定具有提高的效率和特异性的额外ADAR突变体,在荧光素酶靶标上测定了在ADAR脱氨酶结构域中具有各种突变的Cas13b-ADAR融合物。
如图77所示,与REPAIRv1(dCas13b-ADAR2DD(E488Q))相比,R455H和S458F突变体各自表现出提高的效率和特异性。
如图79所示,H460P突变体与REPAIRv2(dCas13b-ADAR2DD(E488Q/T375G))相比表现出提高的效率,而与REPAIRv1相比表现出提高的特异性。H460I和A476E与REPAIRv1相比各自表现出提高的效率和特异性,而与REPAIRv2相比表现出提高的效率。
如图81所示,V351Y、V351M和V351T突变体与REPAIRv1相比在相似的效率下各自表现出提高的特异性,而与REPAIRv2相比在相似的特异性下表现出提高的效率。
如图82所示,T375H、T375C和T375Q突变体与REPAIRv1相比在相似的效率下各自表现出提高的特异性,而与REPAIRv2相比在相似的特异性下表现出提高的效率。
如图83所示,R455H突变体与REPAIRv1相比在相似的效率下表现出提高的特异性,而与REPAIRv2相比在相似的特异性下表现出提高的效率。
如图84所示,V351Y、V351M、V351T、T375H、T375C、T375Q、G478R、S485F和H460I突变体与REPAIRv1相比各自表现出提高的特异性,而与REPAIRv2相比表现出提高的效率。使用pMAX作为GFP对照。
如图86所示,V351Y、V351M、T375H、T375Q和H460P突变体与REPAIRv1相比各自表现出提高的特异性,而与REPAIRv2相比表现出提高的效率。
如图89-图90所示,许多组合突变体与REPAIRv1相比表现出提高的特异性,而与REPAIRv2相比表现出提高的效率。在这些组合中,T375S/S458F组合突变体表现出与REPAIRv1相比提高的效率和提高的特异性两者,以及与REPAIRv2相比提高的效率。
实施例5–具有C至U脱氨活性的ADAR突变体
为了鉴定具有C至U脱氨活性的ADAR突变体,在荧光素酶靶标上测定了在ADAR脱氨酶结构域中具有各种突变的Cas13b-ADAR融合体。
如图96-图97所示,测试了许多V351、T375和R455突变体催化C至U脱氨活性的能力,并进一步验证了某些具有C至U活性的V351突变体。下面提供了在图95中所示的构建体指导物配对中使用的指导序列
下面提供了在图99中所示的构建体指导物配对中使用的指导序列
参考文献
1.P.D.Hsu,E.S.Lander,F.Zhang,Development and applications of CRISPR-Cas9 for genome engineering.Cell 157,1262-1278(2014).
2.A.C.Komor,A.H.Badran,D.R.Liu,CRISPR-Based Technologies for theManipulation of Eukaryotic Genomes.Cell 168,20-36(2017).
3.L.Cong et al.,Multiplex genome engineering using CRISPR/Cassystems.Science 339,819-823(2013).
4.P.Mali et al.,RNA-guided human genome engineering via Cas9.Science339,823-826(2013).
5.B.Zetsche et al.,Cpf1 is a single RNA-guided endonuclease of aclass 2 CRISPR-Cas system.Cell 163,759-771(2015).
6.H.Kim,J.S.Kim,A guide to genome engineering with programmablenucleases.Nat Rev Genet 15,321-334(2014).
7.A.C.Komor,Y.B.Kim,M.S.Packer,J.A.Zuris,D.R.Liu,Programmable editingof a target base in genomic DNA without double-stranded DNA cleavage.Nature533,420-424(2016).
8.K.Nishida et al.,Targeted nucleotide editing using hybridprokaryotic and vertebrate adaptive immune systems.Science 353,(2016).
9.Y.B.Kim et al.,Increasing the genome-targeting scope and precisionof base editing with engineered Cas9-cytidine deaminase fusions.NatBiotechnol 35,371-376(2017).
10.O.O.Abudayyeh et al.,C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector,Science 353,aaf5573(2016).
11.S.Shmakov et al.,Discovery and Functional Characterization ofDiverse Class 2 CRISPR-Cas Systems.Mol Cell 60,385-397(2015).
12.S.Shmakov et al.,Diversity and evolution of class 2 CRISPR-Cassystems.Nat Rev Microbiol 15,169-182(2017).
13.A.A.Smargon et al.,Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 andCsx28.Mol Cell 65,618-630 e617(2017).
14.J.S.Gootenberg et al.,Nucleic acid detection with CRISPR-Cas13a/C2c2.Science 356,438-442(2017).
15.O.O.Abudayyeh et al.,RNA targeting with CRISPR-Cas13a.Nature inpress,(2017).
16.K.Nishikura,Functions and regulation of RNA editing by ADARdeaminases,Annu Rev Biochem 79,321-349(2010).
17.M.H.Tan et al.,Dynamic landscape and regulation of RNA editing inmammals.Nature 550,249-254(2017)
18.B.L.Bass,H.Weintraub,An unwinding activity that covalentlymodifies its double-stranded RNA substrate,Cell 55,1089-1098(1988).
19.M.M.Matthews et al.,Structures of human ADAR2 bound to dsRNAreveal base-flipping mechanism and basis for site selectivity,Nat Struct MolBiol 23,426-433(2016).
20.Y.Zheng,C.Lorenzo,P.A.Beal,DNA editing in DNA/RNA hybrids byadenosine deaminases that act on RNA.Nucleic Acids Res 45,3369-3377(2017).
21.A.Kuttan,B.L.Bass,Mechanistic insights into editing-sitespecificity of ADARs.Proc Natl Acad Sci U S A 109,E3295-3304(2012).
22.S.K.Wong,S.Sato,D.W.Lazinski,Substrate recognition by ADAR1 andADAR2.RNA 7,846-858(2001).
23.M.Fukuda et al.,Construction of a guide-RNA for site-directed RNAmutagenesis utilising intracellular A-to-I RNA editing.Sci Rep 7,41478(2017).
24.M.F.Montiel-Gonzalez,I.Vallecillo-Viejo,G.A.Yudowski,J.J.Rosenthal,Correction of mutations within the cystic fibrosistransmembrane conductance regulator by site-directed RNA editing.Proc NatlAcad Sci U S A 110,18285-18290(2013).
25.M.F.Montiel-Gonzalez,1.C.Vallecillo-Viejo,J.J.Rosenthal,Anefficient system for selectively altering genetic information withinmRNAs.Nucleic Acids Res 44,e157(2016)
26.J.Wettengel,P.Reautschnig,S.Geisler,P.J.Kahle,T.Stafforst,Harnessing human ADAR2 for RNA repair-Recoding a PINK1 mutation rescuesmitophagy.Nucleic Acids Res 45,2797-2808(2017).
27.Y.Wang,J.Havel,P.A.Beal,A Phenotypic Screen for Functional Mutantsof Human Adenosine Deaminase Acting on RNA 1.ACS Chem Biol 10,2512-2519(2015).
28.K.A.Lehmann,B.L.Bass,Double-stranded RNA adenosine deaminasesADAR1 and ADAR2 have overlapping specificities.Biochemistry 39,12875-12884(2000).
29.T.Stafforst,M.F.Schneider,An RNA-deaminase conjugate selectivelyrepairs point mutations.Angew Chem Int Ed Engl 51,11166-11169(2012).
30.C.Ballatore,V.M.Lee,J.Q.Trojanowski,Tau-mediated neurodegenerationin Alzheimer’s disease and related disorders.Nat Rev Neurosci 8,663-672(2007).
31.Y.Li et al.,Carriers of rare missense variants in IFIHI areprotected from psoriasis.J Invest Dermatol 130,2768-2772(2010).
32.R.S.Finkel et al.,Treatment of infantile-onset spinal muscularatrophy with nusinersen:a phase 2,open-label,dose-escalation study.Lancet388,3017-3026(2016).
33.J.Joung et al.,Genome-scale CRISPR-Cas9 knockout andtranscriptional activation screening.Nat Protoc 12,828-863(2017).
34.B.Li,C.N.Dewey,RSEM:accurate transcript quantification from RNA-Seq data with or without a reference genome.BMC Bioinformatics 12,323(2011).
35.E.Picardi,A.M.D′Erchia,A.Montalvo,G.Pesole,Using REDItools toDetect RNA Editing Events in NGS Datasets.Curr Protoc Bioinformatics 49,12 1211-15(2015).
36.E.Picardi,G.Pesole,REDItools:high-throughput RNA editing detectionmade easy.Bioinformatics 29,1813-1814(2013).
37.G.Glusman,J.Caballero,D.E.Mauldin,L.Hood,J.C.Roach,Kaviar:anaccessible system for testing SNV novelty.Bioinformatics 27,3216-3217(2011).
38.J.D.Watson,Molecular biology of the gene.(Pearson,Boston,ed.Seventh edition,2014),pp.xxxiv,872pages.
39.R.C.Ferreira et al.,Association of IFIH1 and other autoimmunityrisk alleles with selective IgA deficiency.Nat Genet 42,777-780(2010).
本发明进一步涉及以下方面,在下文以编号声明来描述这些方面:
1.一种修饰目标靶RNA序列中的腺嘌呤的方法,所述方法包括向所述靶RNA递送:
(a)无催化活性的(死亡)Cas13蛋白;
(b)指导分子,所述指导分子包含连接至正向重复序列的指导序列;和
(c)腺苷脱氨酶蛋白或其催化结构域;
其中所述腺苷脱氨酶蛋白或其催化结构域共价或非共价地连接至所述死亡Cas13蛋白或所述指导分子,或者适于在递送之后连接至所述死亡Cas13蛋白或所述指导分子;
其中指导分子与所述死亡Cas13蛋白形成复合物并引导所述复合物结合所述目标RNA靶标,其中所述指导序列能够与包含所述腺嘌呤的靶序列杂交以形成RNA双链体,其中所述指导序列在对应于所述腺嘌呤的位置处包含非配对胞嘧啶,导致在所形成的异源双链体中出现A-C错配;
并且其中所述腺苷脱氨酶蛋白或其催化结构域使所述RNA双链体中的所述腺嘌呤脱氨基。
2.如声明1所述的方法,其中所述Cas13蛋白是Cas13a、Cas13b或Cas 13c。
3.如声明1所述的方法,其中所述腺苷脱氨酶蛋白或其催化结构域融合至所述死亡Cas13蛋白的N端或C端。
4.如声明3所述的方法,其中所述腺苷脱氨酶蛋白或其催化结构域通过接头融合至所述死亡Cas13蛋白。
5.如声明4所述的方法,其中所述接头是(GGGGS)3-11、GSG5或LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR,或者其中所述接头是XTEN接头。
6.如声明1所述的方法,其中所述腺苷脱氨酶蛋白或其催化结构域连接至衔接蛋白,并且所述指导分子或所述死亡Cas13蛋白包含能够与所述衔接蛋白结合的适体序列。
7.如声明6所述的方法,其中所述衔接序列选自MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、 7s和PRR1。
8.如声明1所述的方法,其中所述腺苷脱氨酶蛋白或其催化结构域插入到所述死亡Cas13蛋白的内环中。
9.如声明8所述的方法,其中所述Cas13蛋白是Cas13a蛋白,并且所述Cas13a在源自韦德纤毛菌(Leptotrichia wadei)的Cas 13a蛋白的两个HEPN结构域中,特别是在位置R474和R1046处,或在Cas13a直系同源物中的其相应氨基酸位置处包含一个或多个突变。
10.如声明9所述的方法,其中所述Cas13蛋白是Cas13b蛋白,并且所述Cas13b在源自动物溃疡伯格菌(Bergeyella zoohelcum)ATCC 43767的Cas13b蛋白的位置R116、H121、R1177、H1182中的一个或多个位置中,或在Cas13b直系同源物中的其相应氨基酸位置中包含突变。
11.如声明所述的方法,其中所述突变是源自动物溃疡伯格菌ATCC 43767的Cas13b蛋白的R116A、H121A、R1177A、H1182A中的一者或多者,或Cas13b直系同源物的其相应氨基酸位置中的突变。
12.如声明1所述的方法,其中所述指导序列具有能够与所述靶序列形成所述RNA双链体的约20-53nt、优选25-53nt、更优选29-53nt的长度。
13.如声明12所述的方法,其中所述指导序列具有能够与所述靶序列形成所述RNA双链体的约40-50nt的长度。
14.如声明1所述的方法,其中所述指导序列的所述非配对C与5’端之间的距离为20-30个核苷酸。
15.如前述声明中任一项所述的方法,其中所述腺苷脱氨酶蛋白或其催化结构域是人类、头足类动物或果蝇腺苷脱氨酶蛋白或其催化结构域。
16.如声明1所述的方法,其中已对所述腺苷脱氨酶蛋白或其催化结构域进行了修饰以包含在hADAR2-D氨基酸序列的谷氨酸488处、或同源ADAR蛋白中的相应位置处的突变。
17.如声明16所述的方法,其中在位置488或同源ADAR蛋白中的相应位置处的所述谷氨酸残基被谷氨酰胺残基替代(E488Q)。
18.如声明16或17所述的方法,其中所述腺苷脱氨酶蛋白或其催化结构域是包含突变E488Q的突变hADAR2d或包含突变E1008Q的突变hADAR1d。
19.如前述声明中任一项所述的方法,其中所述指导序列包含不止一个对应于所述靶RNA序列中的不同腺苷位点的错配,或者其中使用两种指导分子,每种指导分子均包含对应于所述靶RNA序列中的不同腺苷位点的错配。
20.如前述声明中任一项所述的方法,其中所述Cas13蛋白和任选地所述腺苷脱氨酶蛋白或其催化结构域包含一个或多个异源核定位信号(NLS)。
21.如前述声明中任一项所述的方法,其中所述方法包括确定所述目标靶序列以及选择最有效地使存在于所述靶序列中的所述腺嘌呤脱氨基的所述腺苷脱氨酶蛋白或其催化结构域。
22.如前述声明中任一项所述的方法,其中所述无催化活性的Cas13蛋白获自Cas13切口酶,所述Cas13切口酶来源于选自由表1、表2、表3或表4中任一项所列出的细菌种类组成的组的细菌种类。
23.如前述声明中任一项所述的方法,其中所述目标靶RNA序列在细胞内。
24.如声明23所述的方法,其中所述细胞是真核细胞。
25.如声明24所述的方法,其中所述细胞是非人类动物细胞。
26.如声明24所述的方法,其中所述细胞是人类细胞。
27.如声明24所述的方法,其中所述细胞是植物细胞。
28.如前述声明中任一项所述的方法,其中所述目标靶基因座在动物体内。
29.如前述声明中任一项所述的方法,其中所述目标靶基因座在植物内部。
30.如前述声明中任一项所述的方法,其中所述目标靶RNA序列包含在体外RNA多核苷酸中。
31.如前述声明中任一项所述的方法,其中将所述组分(a)、组分(b)和组分(c)作为核糖核蛋白复合物递送至所述细胞。
32.如前述声明中任一项所述的方法,其中将所述组分(a)、组分(b)和组分(c)作为一种或多种多核苷酸分子递送至所述细胞。
33.如声明32所述的方法,其中所述一种或多种多核苷酸分子包含一种或多种编码组分(a)和/或组分(c)的mRNA分子。
34.如声明33所述的方法,其中所述一种或多种多核苷酸分子包含在一种或多种载体内。
35.如声明34所述的方法,其中所述一种或多种多核苷酸分子包含可操作地配置成表达所述Cas13蛋白、所述指导分子和所述腺苷脱氨酶蛋白或其催化结构域的一个或多个调控元件,任选地其中所述一个或多个调控元件包括诱导型启动子。
36.如声明32所述的方法,其中经由粒子、囊泡或一种或多种病毒载体递送所述一种或多种多核苷酸分子或所述核糖核蛋白复合物。
37.如声明36所述的方法,其中所述粒子包含脂质、糖、金属或蛋白质。
38.如声明37所述的方法,其中所述粒子包含脂质纳米粒子。
39.如声明36所述的方法,其中所述囊泡包含外泌体或脂质体。
40.如声明34所述的方法,其中所述一种或多种病毒载体包含一种或多种腺病毒、一种或多种慢病毒、或一种或多种腺相关病毒。
41.如前述声明中任一项所述的方法,其中所述方法通过操纵一个或多个靶RNA序列来修饰细胞、细胞系或生物体。
42.如声明41所述的方法,其中在所述目标靶RNA中所述腺嘌呤的所述脱氨补救了由含有病原性G→A或C→T点突变的转录物引起的疾病。
43.如声明42所述的方法,其中所述疾病选自梅尔-戈林综合征、塞克尔综合征4、乔伯特综合征5、莱伯氏先天性黑蒙症10;夏科-马里-图思病2型;夏科-马里-图思病2型;乌谢尔综合征2C型;脊髓小脑性共济失调28;脊髓小脑性共济失调28;脊髓小脑性共济失调28;长QT综合征2;西奥格林-拉尔逊氏综合征;遗传性果糖尿病;遗传性果糖尿病;神经母细胞瘤;神经母细胞瘤;卡尔曼综合征1;卡尔曼综合征1;卡尔曼综合征1;异染性脑白质营养不良、雷特综合征、肌萎缩性侧索硬化症10型、李-佛美尼综合征,或表5中所列出的疾病。
44.如声明42所述的方法,其中所述疾病是提前终止疾病。
45.如声明41所述的方法,其中所述修饰影响生物体的能育性。
46.如声明41所述的方法,其中所述修饰影响所述靶RNA序列的剪接。
47.如声明41所述的方法,其中所述修饰在转录物中引入突变,从而引入氨基酸变化并引起癌细胞中新抗原的表达。
48.如声明41所述的方法,其中所述靶RNA包含在微小RNA内。
49.如声明41所述的方法,其中在所述目标靶RNA中所述腺嘌呤的所述脱氨导致基因的功能获得或功能丧失。
50.如声明49所述的方法,其中所述基因是由癌细胞表达的基因。
51.一种从如前述声明中任一项所述的方法获得的修饰的细胞或所述修饰的细胞的子代,其中所述细胞与未经历所述方法的相应细胞相比,在所述目标靶RNA中包含次黄嘌呤或鸟嘌呤而非所述腺嘌呤。
52.如声明51所述的修饰的细胞或其子代,其中所述细胞是真核细胞。
53.如声明51所述的修饰的细胞或其子代,其中所述细胞是动物细胞。
54.如声明51所述的修饰的细胞或其子代,其中所述细胞是人类细胞。
55.如声明51所述的修饰的细胞或其子代,其中所述细胞是治疗性T细胞。
56.如声明51所述的修饰的细胞或其子代,其中所述细胞是产生抗体的B细胞。
57.如声明51所述的修饰的细胞或其子代,其中所述细胞是植物细胞。
58.一种非人类动物,所述非人类动物包含如声明51所述的修饰的细胞。
59.一种植物,所述植物包含如声明58所述的修饰的细胞。
60.一种用于细胞疗法的方法,所述方法包括向有需要的患者施用如声明51-55中任一项所述的修饰的细胞,其中所述修饰的细胞的存在补救了所述患者的疾病。
61.一种适用于修饰目标靶基因座中的腺嘌呤的工程化的非天然存在的系统,所述系统包含:
a)包含连接至正向重复序列的指导序列的指导分子,或编码所述指导分子的核苷酸序列;
b)无催化活性的Cas13蛋白,或编码所述无催化活性的Cas13蛋白的核苷酸序列;
c)腺苷脱氨酶蛋白或其催化结构域,或编码所述腺苷脱氨酶蛋白或其催化结构域的核苷酸序列;
其中所述腺苷脱氨酶蛋白或其催化结构域共价或非共价地连接至所述Cas13蛋白或所述指导分子,或者适于在递送之后连接至所述Cas13蛋白或所述指导分子;
其中所述指导序列能够与包含腺嘌呤的靶RNA序列杂交以形成RNA双链体,其中所述指导序列在对应于所述腺嘌呤的位置处包含非配对胞嘧啶,导致在所形成的RNA双链体中出现A-C错配。
62.一种适用于修饰目标靶基因座中的腺嘌呤的工程化的非天然存在的载体系统,所述载体系统包含如声明61所述的a)、b)和c)的核苷酸序列。
63.如声明62所述的工程化的非天然存在的载体系统,所述载体系统包含一种或多种载体,所述一种或多种载体包含:
a)第一调控元件,所述第一调控元件可操作地连接至编码包含所述指导序列的所述指导分子的核苷酸序列,
b)第二调控元件,所述第二调控元件可操作地连接至编码所述无催化活性的Cas13蛋白的核苷酸序列;和
c)编码腺苷脱氨酶蛋白或其催化结构域的核苷酸序列,所述核苷酸序列受所述第一调控元件或所述第二调控元件的控制或者可操作地连接至第三调控元件;
其中如果所述编码腺苷脱氨酶蛋白或其催化结构域的核苷酸序列可操作地连接至所述第三调控元件,则所述腺苷脱氨酶蛋白或其催化结构域适于在表达之后连接至所述指导分子或所述Cas13蛋白;
其中组分(a)、组分(b)和组分(c)位于所述系统的相同或不同载体上。
64.一种包含如声明61-63中任一项所述的系统的体外或离体宿主细胞或其子代或者细胞系或其子代。
65.如声明64所述的宿主细胞或其子代或者细胞系或其子代,其中所述细胞是真核细胞。
66.如声明64所述的宿主细胞或其子代或者细胞系或其子代,其中所述细胞是动物细胞。
67.如声明64所述的宿主细胞或其子代或者细胞系或其子代,其中所述细胞是人类细胞。
68.如声明64所述的宿主细胞或其子代或者细胞系或其子代,其中所述细胞是植物细胞。
69.如声明1所述的方法,其中所述胞嘧啶不在鸟苷的5’侧翼。
70.如声明1所述的方法,其中所述腺苷脱氨酶是ADAR,任选地是huADAR,任选地是(hu)ADAR1或(hu)ADAR2,优选地是huADAR2。
71.如声明1所述的方法,其中所述Cas13,优选地是Cas13b,被截短,优选地是在C端被截短,优选地是其中所述Cas13是相应野生型Cas13的截短功能变体。
72.如声明1所述的方法,其中所述腺苷脱氨酶能够使RNA中的腺苷脱氨基,或者是RNA特异性腺苷脱氨酶。
73.如声明1或16所述的方法,其中已对所述腺苷脱氨酶蛋白或其催化结构域进行了修饰以包含ADAR的一个或多个突变,优选地是如本文所述的突变,例如图43-图47中任一个所提供的突变,或ADAR同系物或直系同源物中的相应突变。
***
本公开不限于本申请中所描述的特定实施方案。如对于本领域技术人员将显而易见的,在不脱离本公开的精神和范围的情况下可以进行许多修改和变型。除本文列举的那些方法和组合物之外,根据前述描述在本公开范围内的功能上等效的方法和组合物对于本领域技术人员将是显而易见的。这些修改和变型也旨在落入所附权利要求的范围内。本公开仅由所附权利要求的术语以及这些权利要求所享有的等效物的全部范围来限制。应当理解,本公开不限于特定的方法、试剂、化合物组合物或生物系统,它们当然可以变化。还应理解,本文使用的术语仅用于描述特定实施方案的目的,而并非旨在进行限制。
此外,在以马库什组来描述本公开的特征或方面的情况下,本领域技术人员将认识到,由此也以马库什组的任何单独成员或成员的子组来描述本公开。
其他实施方案在以下权利要求中阐述。
Claims (31)
1.一种用于定点碱基编辑的工程化组合物,所述工程化组合物包含靶向结构域和腺苷脱氨酶或其催化结构域。
2.如权利要求1所述的组合物,其中所述靶向结构域是寡核苷酸结合结构域。
3.如权利要求1或2所述的组合物,其中所述腺苷脱氨酶或其催化结构域包含一个或多个突变,相对于野生型,所述一个或多个突变提高了所述腺苷脱氨酶的活性或特异性。
4.如权利要求1或2所述的组合物,其中所述腺苷脱氨酶包含一个或多个突变,相对于野生型,所述一个或多个突变改变了所述腺苷脱氨酶的功能性,优选地是所述腺苷脱氨酶使胞苷脱氨基的能力。
5.如前述权利要求中任一项所述的组合物,其中所述靶向结构域是CRISPR系统,所述CRISPR系统包含CRISPR效应蛋白或其保留DNA和/或RNA结合能力的片段,和指导分子。
6.如权利要求5所述的组合物,其中所述CRISPR系统是无催化活性的。
7.如权利要求5或6所述的组合物,其中所述CRISPR系统包含RNA结合蛋白,优选地是Cas13,优选地是所述Cas13蛋白是Cas13a、Cas13b或Cas13c,优选地是其中所述Cas13是表1、表2、表3、表4或表6中任一项所列出的Cas13,或者是来自表1、表2、表3、表4或表6中任一项所列出的细菌种类,优选地是其中所述Cas13蛋白是普雷沃氏菌属种P5-125 Cas13b、咽喉卟啉单胞菌Cas13b或鸭疫里默氏杆菌Cas13b;优选地是普雷沃氏菌属种P5-125 Cas13b。
8.如权利要求5、6或7所述的组合物,其中所述指导分子包含指导序列,所述指导序列能够与包含腺嘌呤的靶RNA序列杂交以形成RNA双链体,其中所述指导序列在对应于所述腺嘌呤的位置处包含非配对胞嘧啶,导致在所形成的RNA双链体中出现A-C错配。
9.如权利要求7所述的组合物,其中所述Cas13蛋白是Cas13a蛋白,并且所述Cas13a在源自韦德纤毛菌的Cas13a蛋白的两个HEPN结构域中,特别是在位置R474和R1046处,或在Cas13a直系同源物的其相应氨基酸位置处包含一个或多个突变,或者其中所述Cas13蛋白是Cas13b蛋白,并且所述Cas13b在源自动物溃疡伯格菌ATCC43767的Cas13b蛋白的位置R116、H121、R1177、H1182中的一个或多个位置处包含突变,优选地是R116A、H121A、R1177A、H1182A,或在Cas13b直系同源物的其相应氨基酸位置处包含突变,或者其中所述Cas13蛋白是Cas13b蛋白,并且所述Cas13b在源自普雷沃氏菌属种P5-125的Cas13b蛋白的位置R128、H133、R1053、H1058中的一个或多个位置处,优选地是在位置H133和H1058处包含突变,优选地是H133A和H1058A,或在Cas13b直系同源物的其相应氨基酸位置处包含突变。
10.如权利要求7所述的组合物,其中所述Cas13,优选地是Cas13b,被截短,优选地是在C端被截短,优选地是其中所述Cas13是相应野生型Cas13的截短功能变体,任选地其中所述截短Cas13b由普雷沃氏菌属种P5-125 Cas13b的nt 1-984或Cas13b直系同源物或同系物的相应nt编码。
11.如权利要求7所述的组合物,其中所述Cas13是无催化活性的Cas13,优选地是Cas13b6。
12.如权利要求10所述的组合物,其中所述指导序列具有能够与所述靶序列形成所述RNA双链体的约20-53nt、优选25-53nt、更优选29-53nt或40-50nt的长度,并且/或者其中所述指导序列的所述非配对C与5'末端之间的距离是20-30个核苷酸。
13.如权利要求12所述的组合物,其中所述指导序列包含不止一个对应于所述靶RNA序列中的不同腺苷位点的错配,或者其中使用两种指导分子,每种指导分子均包含对应于所述靶RNA序列中的不同腺苷位点的错配。
14.如前述权利要求中任一项所述的组合物,其中腺苷脱氨酶蛋白或其催化结构域任选地通过接头融合至所述靶向寡核苷酸的蛋白的N端或C端,优选地是其中所述接头是(GGGGS)3-11、GSG5或LEPGEKPYKCPECGKSFSQSGALTRHQRTHTR,或者其中所述接头是XTEN接头。
15.如权利要求7至13中任一项所述的组合物,其中所述腺苷脱氨酶蛋白或其催化结构域插入到所述死亡Cas13蛋白的内环中。
16.如权利要求7至13中任一项所述的组合物,其中所述腺苷脱氨酶蛋白或其催化结构域连接至衔接蛋白,并且所述指导分子或所述死亡Cas13蛋白包含能够与所述衔接蛋白结合的适体序列,优选地是其中所述衔接序列选自MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s和PRR1。
17.如前述权利要求中任一项所述的组合物,其中所述腺苷脱氨酶蛋白或其催化结构域能够使RNA中的腺苷或胞苷脱氨基,或者是RNA特异性腺苷脱氨酶并且/或者是细菌、人类、头足类动物或果蝇腺苷脱氨酶蛋白或其催化结构域,优选地是TadA,更优选地是ADAR,任选地是huADAR,任选地是(hu)ADAR1或(hu)ADAR2,优选地是huADAR2或其催化结构域。
18.如权利要求17所述的组合物,其中所述ADAR蛋白是包含突变E488Q的突变hADAR2d或包含突变E1008Q的突变hADAR1d。
19.如前述权利要求中任一项所述的组合物,其中所述靶向结构域和任选地所述腺苷蛋白或其催化结构域优选地在C端包含一个或多个异源核输出信号(NES)或核定位信号(NLS),优选地是HIV Rev NES或MAPK NES。
20.如前述权利要求中任一项所述的组合物,其中所述目标靶RNA序列在细胞内,所述细胞优选地是真核细胞,最优选地是人类或非人类动物细胞或植物细胞。
21.如前述权利要求中任一项所述的组合物,其用于预防性或治疗性治疗,优选地是其中所述目标靶基因座在人类或动物体内。
22.一种修饰目标靶RNA序列中的腺嘌呤或胞苷的方法,所述方法包括将根据权利要求1至21中任一项所述的组合物递送至所述靶RNA。
23.如权利要求22所述的方法,其中所述靶向结构域包含如权利要求5至7中任一项所述的CRISPR系统,其中所述指导分子与所述CRISPR效应蛋白形成复合物并引导所述复合物结合所述目标靶RNA序列,其中所述指导序列能够与包含所述腺嘌呤或胞嘧啶的靶序列杂交以形成RNA双链体;其中所述腺苷脱氨酶蛋白或其催化结构域使所述RNA双链体中的所述腺嘌呤或胞苷脱氨基。
24.如权利要求22所述的方法,其中所述CRISPR系统包含如权利要求7至21中任一项所述的Cas13。
25.如权利要求22或23所述的方法,其中任选地经由粒子、囊泡或一种或多种病毒载体作为一种或多种多核苷酸分子、作为核糖核蛋白复合物递送所述CRISPR系统和所述腺苷脱氨酶或其催化结构域。
26.如权利要求22至24中任一项所述的方法或如权利要求1至21中任一项所述的组合物,其用于治疗或预防由含有病原性G→A或C→T点突变的转录物引起的疾病。
27.一种从如权利要求22至25中任一项所述的方法获得的和/或包含如权利要求1-21中任一项所述的组合物的分离的细胞或所述修饰的细胞的子代,优选地是其中所述细胞与未经历所述方法的相应细胞相比,在所述目标靶RNA中包含次黄嘌呤或鸟嘌呤而非所述腺嘌呤。
28.如权利要求27所述的细胞或其子代,其中所述细胞是真核细胞,优选地是人类或非人类动物细胞,任选地是治疗性T细胞或产生抗体的B细胞,或者其中所述细胞是植物细胞。
29.一种非人类动物,所述非人类动物包含如权利要求27或28所述的修饰的细胞或其子代。
30.一种植物,所述植物包含如权利要求27所述的修饰的细胞或其子代。
31.如权利要求27或28所述的修饰的细胞,其用于疗法,优选地是细胞疗法中。
Applications Claiming Priority (17)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762525181P | 2017-06-26 | 2017-06-26 | |
US62/525,181 | 2017-06-26 | ||
US201762528391P | 2017-07-03 | 2017-07-03 | |
US62/528,391 | 2017-07-03 | ||
US201762534016P | 2017-07-18 | 2017-07-18 | |
US62/534,016 | 2017-07-18 | ||
US201762561638P | 2017-09-21 | 2017-09-21 | |
US62/561,638 | 2017-09-21 | ||
US201762568304P | 2017-10-04 | 2017-10-04 | |
US62/568,304 | 2017-10-04 | ||
US201762574158P | 2017-10-18 | 2017-10-18 | |
US62/574,158 | 2017-10-18 | ||
US201762591187P | 2017-11-27 | 2017-11-27 | |
US62/591,187 | 2017-11-27 | ||
US201762610105P | 2017-12-22 | 2017-12-22 | |
US62/610,105 | 2017-12-22 | ||
PCT/US2018/039616 WO2019005884A1 (en) | 2017-06-26 | 2018-06-26 | CRISPR / CAS-ADENINE DEAMINASE COMPOSITIONS, SYSTEMS AND METHODS FOR TARGETED NUCLEIC ACID EDITION |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111328290A true CN111328290A (zh) | 2020-06-23 |
Family
ID=64742672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880055316.7A Pending CN111328290A (zh) | 2017-06-26 | 2018-06-26 | 用于靶向核酸编辑的基于crispr/cas-腺嘌呤脱氨酶的组合物、系统和方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20210093667A1 (zh) |
EP (1) | EP3645054A4 (zh) |
JP (2) | JP7454494B2 (zh) |
KR (1) | KR20200031618A (zh) |
CN (1) | CN111328290A (zh) |
AU (1) | AU2018290843A1 (zh) |
CA (1) | CA3064601A1 (zh) |
WO (1) | WO2019005884A1 (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111727247A (zh) * | 2017-10-04 | 2020-09-29 | 博德研究所 | 用于靶向核酸编辑的系统、方法和组合物 |
CN112126645A (zh) * | 2020-09-11 | 2020-12-25 | 广州吉赛生物科技股份有限公司 | 一种环形rna敲低方法及其应用 |
CN112877314A (zh) * | 2021-03-08 | 2021-06-01 | 四川大学 | 一种诱导型碱基编辑系统及其应用 |
CN113519456A (zh) * | 2021-08-27 | 2021-10-22 | 三江县连兴蛇业有限公司 | 一种五步蛇养殖方法 |
CN113667734A (zh) * | 2021-07-16 | 2021-11-19 | 四川大学华西医院 | Shank3片段序列甲基化检测试剂在制备精神分裂症诊断试剂盒中的用途 |
CN114480491A (zh) * | 2022-01-19 | 2022-05-13 | 南京市妇幼保健院 | 一种grin2a基因突变认知障碍小鼠模型的构建和应用 |
CN114560946A (zh) * | 2020-11-27 | 2022-05-31 | 华东师范大学 | 无pam限制的腺嘌呤单碱基编辑产品、方法和应用 |
WO2022253351A1 (zh) * | 2021-06-04 | 2022-12-08 | 中国科学院脑科学与智能技术卓越创新中心 | 新型Cas13蛋白及其筛选方法和应用 |
WO2023024504A1 (en) * | 2021-08-22 | 2023-03-02 | Huigene Therapeutics Co., Ltd. | Crispr-cas13 system for treating sod1-associated diseases |
WO2023036189A1 (zh) * | 2021-09-07 | 2023-03-16 | 华东师范大学 | 腺嘌呤脱氨酶、包含其的腺嘌呤碱基编辑器及其应用 |
CN115820691A (zh) * | 2022-07-25 | 2023-03-21 | 安徽农业大学 | 一种基于LbCpf1变体的水稻碱基编辑系统和应用 |
WO2023098485A1 (zh) * | 2021-11-30 | 2023-06-08 | 上海科技大学 | 一种基于c2c9核酸酶的新型基因组编辑系统及其应用 |
WO2023237063A1 (en) * | 2022-06-08 | 2023-12-14 | Huidagene Therapeutics Co., Ltd. | Novel guide nucleic acids for rna base editing systems and uses thereof |
Families Citing this family (87)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
WO2016022363A2 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
AU2015367378A1 (en) | 2014-12-17 | 2017-06-15 | Proqr Therapeutics Ii B.V. | Targeted RNA editing |
KR102418185B1 (ko) | 2016-06-22 | 2022-07-06 | 프로큐알 테라퓨틱스 Ⅱ 비.브이. | 단일 가닥 rna-편집 올리고뉴클레오타이드 |
US11661590B2 (en) | 2016-08-09 | 2023-05-30 | President And Fellows Of Harvard College | Programmable CAS9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
WO2018071868A1 (en) | 2016-10-14 | 2018-04-19 | President And Fellows Of Harvard College | Aav delivery of nucleobase editors |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
US11274300B2 (en) | 2017-01-19 | 2022-03-15 | Proqr Therapeutics Ii B.V. | Oligonucleotide complexes for use in RNA editing |
WO2018165504A1 (en) | 2017-03-09 | 2018-09-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
KR20190127797A (ko) | 2017-03-10 | 2019-11-13 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 시토신에서 구아닌으로의 염기 편집제 |
CA3057192A1 (en) | 2017-03-23 | 2018-09-27 | President And Fellows Of Harvard College | Nucleobase editors comprising nucleic acid programmable dna binding proteins |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
US11732274B2 (en) | 2017-07-28 | 2023-08-22 | President And Fellows Of Harvard College | Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE) |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
AU2018338318B2 (en) * | 2017-09-21 | 2022-12-22 | Massachusetts Institute Of Technology | Systems, methods, and compositions for targeted nucleic acid editing |
CA3082251A1 (en) | 2017-10-16 | 2019-04-25 | The Broad Institute, Inc. | Uses of adenosine base editors |
WO2019084062A1 (en) * | 2017-10-23 | 2019-05-02 | The Broad Institute, Inc. | SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION |
WO2020043750A1 (en) * | 2018-08-28 | 2020-03-05 | Roche Innovation Center Copenhagen A/S | Neoantigen engineering using splice modulating compounds |
JP7344300B2 (ja) | 2018-09-18 | 2023-09-13 | ブイエヌブイ ニューコ インク. | Arcベースのカプシドおよびその使用 |
JP2022523302A (ja) | 2019-01-28 | 2022-04-22 | プロキューアール セラピューティクス ツー ベスローテン フェンノートシャップ | アッシャー症候群の処置のためのrna編集オリゴヌクレオチド |
WO2020160150A1 (en) * | 2019-01-29 | 2020-08-06 | The Regents Of The University Of California | Rna-targeting cas enzymes |
CA3127493A1 (en) * | 2019-01-31 | 2020-08-06 | Beam Therapeutics Inc. | Nucleobase editors having reduced non-target deamination and assays for characterizing nucleobase editors |
KR20210126680A (ko) * | 2019-02-13 | 2021-10-20 | 빔 테라퓨틱스, 인크. | 알파-1 항트립신 결핍증을 치료하기 위한 조성물 및 방법 |
CN116497067A (zh) | 2019-02-13 | 2023-07-28 | 比姆医疗股份有限公司 | 治疗血红素病变的组合物和方法 |
KR20210125560A (ko) * | 2019-02-13 | 2021-10-18 | 빔 테라퓨틱스, 인크. | 유전성 질환의 치료를 위한 것을 포함하는, 아데노신 데아미나제 염기 편집기를 사용한 질환-관련 유전자의 스플라이스 수용체 부위 파괴 |
CA3128876A1 (en) * | 2019-02-13 | 2020-08-20 | Beam Therapeutics Inc. | Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease |
CA3128886A1 (en) * | 2019-02-13 | 2020-08-20 | Beam Therapeutics Inc. | Compositions and methods for treating glycogen storage disease type 1a |
US20230053540A1 (en) | 2019-02-19 | 2023-02-23 | Massachusetts Institute Of Technology | Treatment of liver injury |
US20220154282A1 (en) | 2019-03-12 | 2022-05-19 | The Broad Institute, Inc. | Detection means, compositions and methods for modulating synovial sarcoma cells |
US20220152115A1 (en) | 2019-03-13 | 2022-05-19 | The Broad Institute, Inc. | Microglial progenitors for regeneration of functional microglia in the central nervous system and therapeutics uses thereof |
US20220143148A1 (en) | 2019-03-14 | 2022-05-12 | The Broad Institute, Inc. | Compositions and methods for modulating cgrp signaling to regulate intestinal innate lymphoid cells |
GB201903520D0 (en) * | 2019-03-14 | 2019-05-01 | Tropic Biosciences Uk Ltd | Modifying the specificity of non-coding rna molecules for silencing genes in eukaryotic cells |
US20220177863A1 (en) | 2019-03-18 | 2022-06-09 | The Broad Institute, Inc. | Type vii crispr proteins and systems |
US20220152148A1 (en) | 2019-03-18 | 2022-05-19 | The Broad Institute, Inc. | Modulation of type 2 immunity by targeting clec-2 signaling |
US20220142948A1 (en) | 2019-03-18 | 2022-05-12 | The Broad Institute, Inc. | Compositions and methods for modulating metabolic regulators of t cell pathogenicity |
MX2021011426A (es) | 2019-03-19 | 2022-03-11 | Broad Inst Inc | Metodos y composiciones para editar secuencias de nucleótidos. |
US20220195514A1 (en) | 2019-03-29 | 2022-06-23 | The Broad Institute, Inc. | Construct for continuous monitoring of live cells |
WO2020232271A1 (en) | 2019-05-14 | 2020-11-19 | The Broad Institute, Inc. | Compositions and methods for targeting multinucleated cells |
WO2020236734A1 (en) | 2019-05-17 | 2020-11-26 | The Broad Institute, Inc. | Methods of determination of genome architecture and epigenetic profile |
US20220226464A1 (en) | 2019-05-28 | 2022-07-21 | Massachusetts Institute Of Technology | Methods and compositions for modulating immune responses |
US20220243178A1 (en) | 2019-05-31 | 2022-08-04 | The Broad Institute, Inc. | Methods for treating metabolic disorders by targeting adcy5 |
WO2021030627A1 (en) | 2019-08-13 | 2021-02-18 | The General Hospital Corporation | Methods for predicting outcomes of checkpoint inhibition and treatment thereof |
EP4047087A4 (en) * | 2019-08-19 | 2023-08-23 | Southern Medical University | CONSTRUCTION AND APPLICATION OF HIGH-FIDELITY CRISPR/ASCPF1 MUTANTS |
CN110511286B (zh) * | 2019-08-29 | 2022-08-02 | 上海科技大学 | 一种rna碱基编辑分子 |
US20220333133A1 (en) | 2019-09-03 | 2022-10-20 | Voyager Therapeutics, Inc. | Vectorized editing of nucleic acids to correct overt mutations |
US11793787B2 (en) | 2019-10-07 | 2023-10-24 | The Broad Institute, Inc. | Methods and compositions for enhancing anti-tumor immunity by targeting steroidogenesis |
US20240101983A1 (en) * | 2019-10-18 | 2024-03-28 | Nanyang Technological University | Programmable rna editing platform |
US11844800B2 (en) | 2019-10-30 | 2023-12-19 | Massachusetts Institute Of Technology | Methods and compositions for predicting and preventing relapse of acute lymphoblastic leukemia |
CN115210366A (zh) * | 2019-12-02 | 2022-10-18 | 加利福尼亚大学董事会 | 工程化环状指导rna |
WO2021113270A1 (en) | 2019-12-02 | 2021-06-10 | Shape Therapeutics Inc. | Therapeutic editing |
US20230039928A1 (en) | 2019-12-23 | 2023-02-09 | Proqr Therapeutics Ii B.V. | Antisense oligonucleotides for nucleotide deamination in the treatment of Stargardt disease |
US20230127008A1 (en) * | 2020-03-11 | 2023-04-27 | The Broad Institute, Inc. | Stat3-targeted base editor therapeutics for the treatment of melanoma and other cancers |
CA3179862A1 (en) * | 2020-04-09 | 2021-10-14 | Verve Therapeutics, Inc. | Base editing of angptl3 and methods of using same for treatment of disease |
IL297761A (en) | 2020-05-08 | 2022-12-01 | Broad Inst Inc | Methods and compositions for simultaneously editing two helices of a designated double-helix nucleotide sequence |
EP4150077A1 (en) * | 2020-05-15 | 2023-03-22 | Korro Bio, Inc. | Methods and compositions for the adar-mediated editing of transmembrane channel-like protein 1 (tmc1) |
WO2021231679A1 (en) * | 2020-05-15 | 2021-11-18 | Korro Bio, Inc. | Methods and compositions for the adar-mediated editing of gap junction protein beta 2 (gjb2) |
WO2021231692A1 (en) * | 2020-05-15 | 2021-11-18 | Korro Bio, Inc. | Methods and compositions for the adar-mediated editing of otoferlin (otof) |
EP4150078A1 (en) * | 2020-05-15 | 2023-03-22 | Korro Bio, Inc. | Methods and compositions for the adar-mediated editing of argininosuccinate lyase (asl) |
WO2022007803A1 (zh) | 2020-07-06 | 2022-01-13 | 博雅辑因(北京)生物科技有限公司 | 一种改善的rna编辑方法 |
AU2021381397A1 (en) * | 2020-11-19 | 2023-06-15 | Wake Forest University Health Sciences | Vectors, systems and methods for eukaryotic gene editing |
WO2022138929A1 (ja) | 2020-12-25 | 2022-06-30 | アステラス製薬株式会社 | 標的rnaのポリアデニル化シグナル配列を編集するためのガイドrna |
EP4347620A1 (en) | 2021-05-28 | 2024-04-10 | Sana Biotechnology, Inc. | Lipid particles containing a truncated baboon endogenous retrovirus (baev) envelope glycoprotein and related methods and uses |
AU2022325231A1 (en) | 2021-08-11 | 2024-02-08 | Sana Biotechnology, Inc. | Genetically modified cells for allogeneic cell therapy to reduce complement-mediated inflammatory reactions |
WO2023019226A1 (en) | 2021-08-11 | 2023-02-16 | Sana Biotechnology, Inc. | Genetically modified cells for allogeneic cell therapy |
AU2022325955A1 (en) | 2021-08-11 | 2024-02-08 | Sana Biotechnology, Inc. | Genetically modified cells for allogeneic cell therapy to reduce instant blood mediated inflammatory reactions |
CA3227108A1 (en) | 2021-08-11 | 2023-02-16 | Xiaomeng HU | Genetically modified primary cells for allogeneic cell therapy |
WO2023039373A2 (en) * | 2021-09-08 | 2023-03-16 | The Regents Of The University Of California | Crispr-cas effector polypeptides and method of use thereof |
TW202321440A (zh) | 2021-10-07 | 2023-06-01 | 美商肝特斯公司 | 追蹤接受者中之供體細胞之方法 |
WO2023064923A2 (en) * | 2021-10-15 | 2023-04-20 | Mammoth Biosciences, Inc. | Fusion effector proteins and uses thereof |
WO2023069790A1 (en) | 2021-10-22 | 2023-04-27 | Sana Biotechnology, Inc. | Methods of engineering allogeneic t cells with a transgene in a tcr locus and associated compositions and methods |
CN116083398B (zh) * | 2021-11-05 | 2024-01-05 | 广州瑞风生物科技有限公司 | 分离的Cas13蛋白及其应用 |
WO2023115039A2 (en) | 2021-12-17 | 2023-06-22 | Sana Biotechnology, Inc. | Modified paramyxoviridae fusion glycoproteins |
TW202342757A (zh) | 2021-12-17 | 2023-11-01 | 美商薩那生物科技公司 | 經修飾副黏液病毒科附著醣蛋白 |
WO2023133595A2 (en) | 2022-01-10 | 2023-07-13 | Sana Biotechnology, Inc. | Methods of ex vivo dosing and administration of lipid particles or viral vectors and related systems and uses |
WO2023150518A1 (en) | 2022-02-01 | 2023-08-10 | Sana Biotechnology, Inc. | Cd3-targeted lentiviral vectors and uses thereof |
WO2023150647A1 (en) | 2022-02-02 | 2023-08-10 | Sana Biotechnology, Inc. | Methods of repeat dosing and administration of lipid particles or viral vectors and related systems and uses |
WO2023152371A1 (en) | 2022-02-14 | 2023-08-17 | Proqr Therapeutics Ii B.V. | Guide oligonucleotides for nucleic acid editing in the treatment of hypercholesterolemia |
WO2023158836A1 (en) | 2022-02-17 | 2023-08-24 | Sana Biotechnology, Inc. | Engineered cd47 proteins and uses thereof |
WO2023185878A1 (en) * | 2022-03-28 | 2023-10-05 | Huidagene Therapeutics Co., Ltd. | Engineered crispr-cas13f system and uses thereof |
WO2023196818A1 (en) | 2022-04-04 | 2023-10-12 | The Regents Of The University Of California | Genetic complementation compositions and methods |
CN114774468B (zh) * | 2022-04-20 | 2022-12-20 | 温氏食品集团股份有限公司 | 一种等位基因分子标记及抗蓝耳病猪群体组建方法 |
WO2023225662A2 (en) * | 2022-05-20 | 2023-11-23 | William Marsh Rice University | Protac-cid systems for use in multiplex gene regulation |
WO2024044655A1 (en) | 2022-08-24 | 2024-02-29 | Sana Biotechnology, Inc. | Delivery of heterologous proteins |
WO2024054897A1 (en) * | 2022-09-07 | 2024-03-14 | The University Of Chicago | Methods for treating cancer with hyperactive adar enzymes |
WO2024064838A1 (en) | 2022-09-21 | 2024-03-28 | Sana Biotechnology, Inc. | Lipid particles comprising variant paramyxovirus attachment glycoproteins and uses thereof |
WO2024081820A1 (en) | 2022-10-13 | 2024-04-18 | Sana Biotechnology, Inc. | Viral particles targeting hematopoietic stem cells |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105934516A (zh) * | 2013-12-12 | 2016-09-07 | 哈佛大学的校长及成员们 | 用于基因编辑的cas变体 |
CN110799645A (zh) * | 2017-04-12 | 2020-02-14 | 博德研究所 | 新型vi型crispr直系同源物和系统 |
CN111417727A (zh) * | 2017-05-18 | 2020-07-14 | 博德研究所 | 用于靶向核酸编辑的系统、方法和组合物 |
Family Cites Families (84)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4217344A (en) | 1976-06-23 | 1980-08-12 | L'oreal | Compositions containing aqueous dispersions of lipid spheres |
US4235871A (en) | 1978-02-24 | 1980-11-25 | Papahadjopoulos Demetrios P | Method of encapsulating biologically active materials in lipid vesicles |
US4186183A (en) | 1978-03-29 | 1980-01-29 | The United States Of America As Represented By The Secretary Of The Army | Liposome carriers in chemotherapy of leishmaniasis |
US4261975A (en) | 1979-09-19 | 1981-04-14 | Merck & Co., Inc. | Viral liposome particle |
US4485054A (en) | 1982-10-04 | 1984-11-27 | Lipoderm Pharmaceuticals Limited | Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV) |
US4501728A (en) | 1983-01-06 | 1985-02-26 | Technology Unlimited, Inc. | Masking of liposomes from RES recognition |
US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
US4751180A (en) | 1985-03-28 | 1988-06-14 | Chiron Corporation | Expression using fused genes providing for protein product |
US4774085A (en) | 1985-07-09 | 1988-09-27 | 501 Board of Regents, Univ. of Texas | Pharmaceutical administration systems containing a mixture of immunomodulators |
US4935233A (en) | 1985-12-02 | 1990-06-19 | G. D. Searle And Company | Covalently linked polypeptide cell modulators |
DE122007000007I1 (de) | 1986-04-09 | 2007-05-16 | Genzyme Corp | Genetisch transformierte Tiere, die ein gewünschtes Protein in Milch absondern |
US4837028A (en) | 1986-12-24 | 1989-06-06 | Liposome Technology, Inc. | Liposomes with enhanced circulation time |
US4873316A (en) | 1987-06-23 | 1989-10-10 | Biogen, Inc. | Isolation of exogenous recombinant proteins from the milk of transgenic mammals |
US5703055A (en) | 1989-03-21 | 1997-12-30 | Wisconsin Alumni Research Foundation | Generation of antibodies through lipid mediated DNA delivery |
US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
WO1991017424A1 (en) | 1990-05-03 | 1991-11-14 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
US5593972A (en) | 1993-01-26 | 1997-01-14 | The Wistar Institute | Genetic immunization |
US5944710A (en) | 1996-06-24 | 1999-08-31 | Genetronics, Inc. | Electroporation-mediated intravascular delivery |
US5869326A (en) | 1996-09-09 | 1999-02-09 | Genetronics, Inc. | Electroporation employing user-configured pulsing scheme |
GB9710049D0 (en) | 1997-05-19 | 1997-07-09 | Nycomed Imaging As | Method |
GB9710809D0 (en) | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
WO1999021977A1 (en) | 1997-10-24 | 1999-05-06 | Life Technologies, Inc. | Recombinational cloning using nucleic acids having recombination sites |
EP1060261B1 (en) | 1998-03-02 | 2010-05-05 | Massachusetts Institute of Technology | Poly zinc finger proteins with improved linkers |
US6750059B1 (en) | 1998-07-16 | 2004-06-15 | Whatman, Inc. | Archiving of vectors |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US7013219B2 (en) | 1999-01-12 | 2006-03-14 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US20030104526A1 (en) | 1999-03-24 | 2003-06-05 | Qiang Liu | Position dependent recognition of GNN nucleotide triplets by zinc fingers |
US7030215B2 (en) | 1999-03-24 | 2006-04-18 | Sangamo Biosciences, Inc. | Position dependent recognition of GNN nucleotide triplets by zinc fingers |
US6794136B1 (en) | 2000-11-20 | 2004-09-21 | Sangamo Biosciences, Inc. | Iterative optimization in the design of binding proteins |
AU2002336760A1 (en) | 2001-09-26 | 2003-06-10 | Mayo Foundation For Medical Education And Research | Mutable vaccines |
US20040058886A1 (en) | 2002-08-08 | 2004-03-25 | Dharmacon, Inc. | Short interfering RNAs having a hairpin structure containing a non-nucleotide loop |
CA2573702C (en) | 2004-07-16 | 2013-10-15 | The Government Of The United States Of America As Represented By The Sec Retary Of The Department Of Health And Human Services | Vaccine constructs and combination of vaccines designed to improve the breadth of the immune response to diverse strains and clades of hiv |
CA2626262C (en) | 2005-10-18 | 2015-09-08 | Homme W. Hellinga | Rationally-designed meganucleases with altered sequence specificity and dna-binding affinity |
AU2008346801A1 (en) | 2007-12-31 | 2009-07-16 | Nanocor Therapeutics, Inc. | RNA interference for the treatment of heart failure |
WO2010129602A2 (en) | 2009-05-04 | 2010-11-11 | Fred Hutchinson Cancer Research Center | Cocal vesiculovirus envelope pseudotyped retroviral vectors |
EP2454371B1 (en) | 2009-07-13 | 2021-01-20 | Somagenics, Inc. | Chemical modification of small hairpin rnas for inhibition of gene expression |
US8927807B2 (en) | 2009-09-03 | 2015-01-06 | The Regents Of The University Of California | Nitrate-responsive promoter |
PL2510096T5 (pl) | 2009-12-10 | 2018-06-29 | Regents Of The University Of Minnesota | Modyfikacja DNA zależna od efektora TAL |
CN116622704A (zh) | 2012-07-25 | 2023-08-22 | 布罗德研究所有限公司 | 可诱导的dna结合蛋白和基因组干扰工具及其应用 |
ES2883590T3 (es) | 2012-12-12 | 2021-12-09 | Broad Inst Inc | Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas |
EP2932421A1 (en) | 2012-12-12 | 2015-10-21 | The Broad Institute, Inc. | Methods, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
ES2576128T3 (es) | 2012-12-12 | 2016-07-05 | The Broad Institute, Inc. | Modificación por tecnología genética y optimización de sistemas, métodos y composiciones para la manipulación de secuencias con dominios funcionales |
EP4234696A3 (en) | 2012-12-12 | 2023-09-06 | The Broad Institute Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
CN113528577A (zh) | 2012-12-12 | 2021-10-22 | 布罗德研究所有限公司 | 用于序列操纵的系统、方法和优化的指导组合物的工程化 |
EP2931899A1 (en) | 2012-12-12 | 2015-10-21 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof |
ES2701749T3 (es) | 2012-12-12 | 2019-02-25 | Broad Inst Inc | Métodos, modelos, sistemas y aparatos para identificar secuencias diana para enzimas Cas o sistemas CRISPR-Cas para secuencias diana y transmitir resultados de los mismos |
US20140310830A1 (en) | 2012-12-12 | 2014-10-16 | Feng Zhang | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes |
JP6552965B2 (ja) | 2012-12-12 | 2019-07-31 | ザ・ブロード・インスティテュート・インコーポレイテッド | 配列操作のための改善された系、方法および酵素組成物のエンジニアリングおよび最適化 |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
US11332719B2 (en) | 2013-03-15 | 2022-05-17 | The Broad Institute, Inc. | Recombinant virus and preparations thereof |
CN105793425B (zh) | 2013-06-17 | 2021-10-26 | 布罗德研究所有限公司 | 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用 |
RU2716420C2 (ru) | 2013-06-17 | 2020-03-11 | Те Брод Инститьют Инк. | Доставка и применение систем crispr-cas, векторов и композиций для целенаправленного воздействия и терапии в печени |
EP3011035B1 (en) | 2013-06-17 | 2020-05-13 | The Broad Institute, Inc. | Assay for quantitative evaluation of target site cleavage by one or more crispr-cas guide sequences |
CN105492611A (zh) | 2013-06-17 | 2016-04-13 | 布罗德研究所有限公司 | 用于序列操纵的优化的crispr-cas双切口酶系统、方法以及组合物 |
RU2725502C2 (ru) | 2013-06-17 | 2020-07-02 | Те Брод Инститьют Инк. | Доставка, конструирование и оптимизация систем, способы и композиции для целенаправленного воздействия и моделирования заболеваний и нарушений постмитотических клеток |
CA2915834A1 (en) | 2013-06-17 | 2014-12-24 | Massachusetts Institute Of Technology | Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation |
EP3725885A1 (en) | 2013-06-17 | 2020-10-21 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
EP3058091B1 (en) | 2013-10-18 | 2020-03-25 | The Broad Institute, Inc. | Spatial and cellular mapping of biomolecules in situ by high-throughput sequencing |
DK3066201T3 (en) | 2013-11-07 | 2018-06-06 | Editas Medicine Inc | CRISPR-RELATED PROCEDURES AND COMPOSITIONS WITH LEADING GRADES |
MX2016007327A (es) | 2013-12-12 | 2017-03-06 | Broad Inst Inc | Suministro, uso y aplicaciones terapeuticas de sistemas y composiciones crispr-cas para dirigirlos a trastornos y enfermedades usando componentes para suministro de particulas. |
AU2014361781B2 (en) | 2013-12-12 | 2021-04-01 | Massachusetts Institute Of Technology | Delivery, use and therapeutic applications of the CRISPR -Cas systems and compositions for genome editing |
CA2932439A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute, Inc. | Crispr-cas systems and methods for altering expression of gene products, structural information and inducible modular cas enzymes |
BR112016013207A2 (pt) | 2013-12-12 | 2017-09-26 | Massachusetts Inst Technology | administração, uso e aplicações terapêuticas dos sistemas crispr-cas e composições para o hbv e distúrbios e doenças virais |
WO2015089364A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Crystal structure of a crispr-cas system, and uses thereof |
WO2015089473A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation |
JP6712948B2 (ja) | 2013-12-12 | 2020-06-24 | ザ・ブロード・インスティテュート・インコーポレイテッド | 組成物、及びヌクレオチドリピート障害におけるcrispr−cas系の使用方法 |
WO2015089486A2 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems |
US11898141B2 (en) | 2014-05-27 | 2024-02-13 | The Broad Institute, Inc. | High-throughput assembly of genetic elements |
WO2016049258A2 (en) | 2014-09-25 | 2016-03-31 | The Broad Institute Inc. | Functional screening with optimized functional crispr-cas systems |
EP3230452A1 (en) | 2014-12-12 | 2017-10-18 | The Broad Institute Inc. | Dead guides for crispr transcription factors |
EP3985115A1 (en) | 2014-12-12 | 2022-04-20 | The Broad Institute, Inc. | Protected guide rnas (pgrnas) |
WO2016094874A1 (en) | 2014-12-12 | 2016-06-16 | The Broad Institute Inc. | Escorted and functionalized guides for crispr-cas systems |
WO2016106244A1 (en) | 2014-12-24 | 2016-06-30 | The Broad Institute Inc. | Crispr having or associated with destabilization domains |
WO2016161516A1 (en) | 2015-04-10 | 2016-10-13 | Feldan Bio Inc. | Polypeptide-based shuttle agents for improving the transduction efficiency of polypeptide cargos to the cytosol of target eukaryotic cells, uses thereof, methods and kits relating to same |
EP3294880A4 (en) | 2015-05-15 | 2018-12-26 | Dharmacon, Inc. | Synthetic single guide rna for cas9-mediated gene editing |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
KR102185464B1 (ko) * | 2017-03-15 | 2020-12-03 | 매사추세츠 인스티튜트 오브 테크놀로지 | 신규 cas13b 오르소로그 crispr 효소 및 시스템 |
CA3062595A1 (en) * | 2017-05-10 | 2018-11-15 | The Regents Of The University Of California | Directed editing of cellular rna via nuclear delivery of crispr/cas9 |
CN107939288B (zh) | 2017-11-14 | 2019-04-02 | 中国科学院地质与地球物理研究所 | 一种非旋转套的防转装置以及旋转导向装置 |
-
2018
- 2018-06-26 CN CN201880055316.7A patent/CN111328290A/zh active Pending
- 2018-06-26 WO PCT/US2018/039616 patent/WO2019005884A1/en active Search and Examination
- 2018-06-26 JP JP2020520440A patent/JP7454494B2/ja active Active
- 2018-06-26 KR KR1020207001740A patent/KR20200031618A/ko not_active Application Discontinuation
- 2018-06-26 CA CA3064601A patent/CA3064601A1/en active Pending
- 2018-06-26 EP EP18824672.2A patent/EP3645054A4/en active Pending
- 2018-06-26 AU AU2018290843A patent/AU2018290843A1/en active Pending
- 2018-06-26 US US16/617,560 patent/US20210093667A1/en active Pending
-
2023
- 2023-06-06 JP JP2023092936A patent/JP2023123499A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105934516A (zh) * | 2013-12-12 | 2016-09-07 | 哈佛大学的校长及成员们 | 用于基因编辑的cas变体 |
CN110799645A (zh) * | 2017-04-12 | 2020-02-14 | 博德研究所 | 新型vi型crispr直系同源物和系统 |
CN111417727A (zh) * | 2017-05-18 | 2020-07-14 | 博德研究所 | 用于靶向核酸编辑的系统、方法和组合物 |
Non-Patent Citations (1)
Title |
---|
MELISSA M MATTHEWS ET AL.: ""Structures of human ADAR2 bound to dsRNA reveal base-flipping mechanism and basis for site selectivity"", 《NATURE STRUCTURAL & MOLECULAR BIOLOGY》, vol. 23, no. 5, pages 426 - 435 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111727247A (zh) * | 2017-10-04 | 2020-09-29 | 博德研究所 | 用于靶向核酸编辑的系统、方法和组合物 |
CN112126645A (zh) * | 2020-09-11 | 2020-12-25 | 广州吉赛生物科技股份有限公司 | 一种环形rna敲低方法及其应用 |
CN112126645B (zh) * | 2020-09-11 | 2021-06-01 | 广州吉赛生物科技股份有限公司 | 一种环形rna敲低方法及其应用 |
CN114560946A (zh) * | 2020-11-27 | 2022-05-31 | 华东师范大学 | 无pam限制的腺嘌呤单碱基编辑产品、方法和应用 |
CN112877314A (zh) * | 2021-03-08 | 2021-06-01 | 四川大学 | 一种诱导型碱基编辑系统及其应用 |
CN112877314B (zh) * | 2021-03-08 | 2023-06-13 | 四川大学 | 一种诱导型碱基编辑系统及其应用 |
WO2022253351A1 (zh) * | 2021-06-04 | 2022-12-08 | 中国科学院脑科学与智能技术卓越创新中心 | 新型Cas13蛋白及其筛选方法和应用 |
CN113667734A (zh) * | 2021-07-16 | 2021-11-19 | 四川大学华西医院 | Shank3片段序列甲基化检测试剂在制备精神分裂症诊断试剂盒中的用途 |
WO2023024504A1 (en) * | 2021-08-22 | 2023-03-02 | Huigene Therapeutics Co., Ltd. | Crispr-cas13 system for treating sod1-associated diseases |
CN113519456B (zh) * | 2021-08-27 | 2022-09-06 | 三江县连兴科技有限公司 | 一种五步蛇养殖方法 |
CN113519456A (zh) * | 2021-08-27 | 2021-10-22 | 三江县连兴蛇业有限公司 | 一种五步蛇养殖方法 |
WO2023036189A1 (zh) * | 2021-09-07 | 2023-03-16 | 华东师范大学 | 腺嘌呤脱氨酶、包含其的腺嘌呤碱基编辑器及其应用 |
WO2023098485A1 (zh) * | 2021-11-30 | 2023-06-08 | 上海科技大学 | 一种基于c2c9核酸酶的新型基因组编辑系统及其应用 |
CN114480491A (zh) * | 2022-01-19 | 2022-05-13 | 南京市妇幼保健院 | 一种grin2a基因突变认知障碍小鼠模型的构建和应用 |
WO2023237063A1 (en) * | 2022-06-08 | 2023-12-14 | Huidagene Therapeutics Co., Ltd. | Novel guide nucleic acids for rna base editing systems and uses thereof |
CN115820691A (zh) * | 2022-07-25 | 2023-03-21 | 安徽农业大学 | 一种基于LbCpf1变体的水稻碱基编辑系统和应用 |
CN115820691B (zh) * | 2022-07-25 | 2023-08-22 | 安徽农业大学 | 一种基于LbCpf1变体的水稻碱基编辑系统和应用 |
Also Published As
Publication number | Publication date |
---|---|
EP3645054A4 (en) | 2021-03-31 |
JP2020528761A (ja) | 2020-10-01 |
EP3645054A1 (en) | 2020-05-06 |
JP2023123499A (ja) | 2023-09-05 |
KR20200031618A (ko) | 2020-03-24 |
CA3064601A1 (en) | 2019-01-03 |
WO2019005884A1 (en) | 2019-01-03 |
AU2018290843A1 (en) | 2020-01-16 |
US20210093667A1 (en) | 2021-04-01 |
JP7454494B2 (ja) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7454494B2 (ja) | 標的化された核酸編集のためのcrispr/cas-アデニンデアミナーゼ系の組成物、系及び方法 | |
AU2020202810B2 (en) | Systems, methods, and compositions for targeted nucleic acid editing | |
US20240076651A1 (en) | Systems, methods, and compositions for targeted nucleic acid editing | |
US20210130800A1 (en) | Systems, methods, and compositions for targeted nucleic acid editing | |
US20210009972A1 (en) | Systems methods, and compositions for targeted nucleic acid editing | |
US20200248169A1 (en) | Crispr/cas-cytidine deaminase based compositions, systems, and methods for targeted nucleic acid editing | |
EP3701042A1 (en) | Systems, methods, and compositions for targeted nucleic acid editing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40030307 Country of ref document: HK |