CN110959039A - 新型cas13b直向同源物crispr酶和系统 - Google Patents
新型cas13b直向同源物crispr酶和系统 Download PDFInfo
- Publication number
- CN110959039A CN110959039A CN201880033145.8A CN201880033145A CN110959039A CN 110959039 A CN110959039 A CN 110959039A CN 201880033145 A CN201880033145 A CN 201880033145A CN 110959039 A CN110959039 A CN 110959039A
- Authority
- CN
- China
- Prior art keywords
- rna
- protein
- cell
- sequence
- cas13b
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108091033409 CRISPR Proteins 0.000 title claims description 12
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 721
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 617
- 239000012636 effector Substances 0.000 claims abstract description 348
- 238000000034 method Methods 0.000 claims abstract description 193
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 113
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 107
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 107
- 239000000203 mixture Substances 0.000 claims abstract description 105
- 210000004027 cell Anatomy 0.000 claims description 301
- 230000014509 gene expression Effects 0.000 claims description 135
- 239000013598 vector Substances 0.000 claims description 112
- 230000000694 effects Effects 0.000 claims description 99
- 230000004048 modification Effects 0.000 claims description 65
- 238000012986 modification Methods 0.000 claims description 65
- 230000035772 mutation Effects 0.000 claims description 58
- 125000003729 nucleotide group Chemical group 0.000 claims description 57
- 239000002773 nucleotide Substances 0.000 claims description 55
- 238000012384 transportation and delivery Methods 0.000 claims description 52
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 44
- 102000040430 polynucleotide Human genes 0.000 claims description 39
- 108091033319 polynucleotide Proteins 0.000 claims description 39
- 239000002157 polynucleotide Substances 0.000 claims description 39
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 38
- 230000001105 regulatory effect Effects 0.000 claims description 38
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 claims description 34
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 34
- 208000009869 Neu-Laxova syndrome Diseases 0.000 claims description 30
- 230000000051 modifying effect Effects 0.000 claims description 30
- 108020004705 Codon Proteins 0.000 claims description 29
- 238000013519 translation Methods 0.000 claims description 26
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 22
- 238000011282 treatment Methods 0.000 claims description 21
- 210000004962 mammalian cell Anatomy 0.000 claims description 15
- 230000001965 increasing effect Effects 0.000 claims description 14
- 238000013518 transcription Methods 0.000 claims description 13
- 230000035897 transcription Effects 0.000 claims description 13
- 239000013603 viral vector Substances 0.000 claims description 13
- 108020004414 DNA Proteins 0.000 claims description 12
- 239000002245 particle Substances 0.000 claims description 12
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 12
- 230000004952 protein activity Effects 0.000 claims description 11
- 108020004999 messenger RNA Proteins 0.000 claims description 9
- 238000002560 therapeutic procedure Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 7
- 238000010171 animal model Methods 0.000 claims description 7
- 230000003247 decreasing effect Effects 0.000 claims description 7
- 210000005260 human cell Anatomy 0.000 claims description 7
- 230000004075 alteration Effects 0.000 claims description 6
- 230000002829 reductive effect Effects 0.000 claims description 6
- 230000009870 specific binding Effects 0.000 claims description 6
- 230000002103 transcriptional effect Effects 0.000 claims description 6
- 238000010354 CRISPR gene editing Methods 0.000 claims description 5
- 230000003612 virological effect Effects 0.000 claims description 4
- 230000001973 epigenetic effect Effects 0.000 claims description 3
- 210000001808 exosome Anatomy 0.000 claims description 3
- 239000002502 liposome Substances 0.000 claims description 3
- 230000001177 retroviral effect Effects 0.000 claims description 3
- 208000009889 Herpes Simplex Diseases 0.000 claims description 2
- 239000003607 modifier Substances 0.000 claims description 2
- 239000003981 vehicle Substances 0.000 claims description 2
- 230000008685 targeting Effects 0.000 abstract description 117
- 108020005004 Guide RNA Proteins 0.000 abstract description 80
- 235000018102 proteins Nutrition 0.000 description 573
- 108091027544 Subgenomic mRNA Proteins 0.000 description 251
- 241000196324 Embryophyta Species 0.000 description 203
- 108091028113 Trans-activating crRNA Proteins 0.000 description 70
- 235000001014 amino acid Nutrition 0.000 description 67
- 150000001413 amino acids Chemical class 0.000 description 58
- 230000027455 binding Effects 0.000 description 51
- 239000000047 product Substances 0.000 description 49
- 230000001939 inductive effect Effects 0.000 description 39
- 108090000765 processed proteins & peptides Proteins 0.000 description 37
- 102000004196 processed proteins & peptides Human genes 0.000 description 35
- 230000006870 function Effects 0.000 description 34
- 108091036055 CccDNA Proteins 0.000 description 33
- 238000004519 manufacturing process Methods 0.000 description 31
- 230000014616 translation Effects 0.000 description 30
- 238000000338 in vitro Methods 0.000 description 29
- 230000026279 RNA modification Effects 0.000 description 28
- 210000001519 tissue Anatomy 0.000 description 26
- 238000010357 RNA editing Methods 0.000 description 25
- 238000001727 in vivo Methods 0.000 description 25
- 230000009368 gene silencing by RNA Effects 0.000 description 24
- 108020004422 Riboswitch Proteins 0.000 description 23
- 238000003776 cleavage reaction Methods 0.000 description 23
- 230000007017 scission Effects 0.000 description 23
- 102000004190 Enzymes Human genes 0.000 description 22
- 108090000790 Enzymes Proteins 0.000 description 22
- 108020001507 fusion proteins Proteins 0.000 description 22
- 102000037865 fusion proteins Human genes 0.000 description 22
- 241000195493 Cryptophyta Species 0.000 description 21
- 239000005089 Luciferase Substances 0.000 description 21
- 230000004927 fusion Effects 0.000 description 21
- 229920001184 polypeptide Polymers 0.000 description 21
- 239000002551 biofuel Substances 0.000 description 20
- 238000003197 gene knockdown Methods 0.000 description 20
- 230000009261 transgenic effect Effects 0.000 description 20
- 108060001084 Luciferase Proteins 0.000 description 19
- 230000008439 repair process Effects 0.000 description 19
- 125000006850 spacer group Chemical group 0.000 description 19
- 230000002538 fungal effect Effects 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 18
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 17
- 230000003993 interaction Effects 0.000 description 17
- 230000008569 process Effects 0.000 description 17
- 238000011002 quantification Methods 0.000 description 17
- 238000006467 substitution reaction Methods 0.000 description 17
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 16
- 210000003763 chloroplast Anatomy 0.000 description 16
- 230000000875 corresponding effect Effects 0.000 description 16
- 201000010099 disease Diseases 0.000 description 16
- 230000004807 localization Effects 0.000 description 16
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 15
- 101710163270 Nuclease Proteins 0.000 description 15
- 108091030071 RNAI Proteins 0.000 description 15
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 15
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 15
- 125000000539 amino acid group Chemical group 0.000 description 15
- 210000004899 c-terminal region Anatomy 0.000 description 15
- 230000015556 catabolic process Effects 0.000 description 15
- 238000006731 degradation reaction Methods 0.000 description 15
- 108091070501 miRNA Proteins 0.000 description 15
- 230000000087 stabilizing effect Effects 0.000 description 15
- 230000002452 interceptive effect Effects 0.000 description 14
- 210000005253 yeast cell Anatomy 0.000 description 14
- 241000700605 Viruses Species 0.000 description 13
- 230000003197 catalytic effect Effects 0.000 description 13
- 101710159080 Aconitate hydratase A Proteins 0.000 description 12
- 101710159078 Aconitate hydratase B Proteins 0.000 description 12
- 108090000994 Catalytic RNA Proteins 0.000 description 12
- 102000053642 Catalytic RNA Human genes 0.000 description 12
- 102000053602 DNA Human genes 0.000 description 12
- 101710105008 RNA-binding protein Proteins 0.000 description 12
- 210000001938 protoplast Anatomy 0.000 description 12
- 108091092562 ribozyme Proteins 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 11
- 239000003446 ligand Substances 0.000 description 11
- 102100038191 Double-stranded RNA-specific editase 1 Human genes 0.000 description 10
- 241000233866 Fungi Species 0.000 description 10
- 101000742223 Homo sapiens Double-stranded RNA-specific editase 1 Proteins 0.000 description 10
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 10
- 108091027967 Small hairpin RNA Proteins 0.000 description 10
- 125000003275 alpha amino acid group Chemical group 0.000 description 10
- 238000003556 assay Methods 0.000 description 10
- 230000001580 bacterial effect Effects 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 10
- 238000010362 genome editing Methods 0.000 description 10
- 125000005647 linker group Chemical group 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 238000011084 recovery Methods 0.000 description 10
- 239000004055 small Interfering RNA Substances 0.000 description 10
- 241000894007 species Species 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- -1 M12 Chemical compound 0.000 description 9
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 9
- 206010028980 Neoplasm Diseases 0.000 description 9
- 208000020584 Polyploidy Diseases 0.000 description 9
- 230000004570 RNA-binding Effects 0.000 description 9
- 108020004566 Transfer RNA Proteins 0.000 description 9
- 240000008042 Zea mays Species 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 239000013604 expression vector Substances 0.000 description 9
- 230000001404 mediated effect Effects 0.000 description 9
- 239000002679 microRNA Substances 0.000 description 9
- 230000007115 recruitment Effects 0.000 description 9
- 230000001225 therapeutic effect Effects 0.000 description 9
- 241001465754 Metazoa Species 0.000 description 8
- 230000007022 RNA scission Effects 0.000 description 8
- 108020004459 Small interfering RNA Proteins 0.000 description 8
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 8
- 230000001413 cellular effect Effects 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000009437 off-target effect Effects 0.000 description 8
- 244000052769 pathogen Species 0.000 description 8
- 230000004850 protein–protein interaction Effects 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- 210000003705 ribosome Anatomy 0.000 description 8
- 210000004708 ribosome subunit Anatomy 0.000 description 8
- 238000012772 sequence design Methods 0.000 description 8
- 239000002924 silencing RNA Substances 0.000 description 8
- 108091079001 CRISPR RNA Proteins 0.000 description 7
- 108010066154 Nuclear Export Signals Proteins 0.000 description 7
- 108700026244 Open Reading Frames Proteins 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 210000000805 cytoplasm Anatomy 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- 230000000670 limiting effect Effects 0.000 description 7
- 230000001717 pathogenic effect Effects 0.000 description 7
- 230000037361 pathway Effects 0.000 description 7
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 7
- 230000009466 transformation Effects 0.000 description 7
- 108700028369 Alleles Proteins 0.000 description 6
- 240000002791 Brassica napus Species 0.000 description 6
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 6
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- 241000206602 Eukaryota Species 0.000 description 6
- 241000208822 Lactuca Species 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- 108700019146 Transgenes Proteins 0.000 description 6
- 241000607479 Yersinia pestis Species 0.000 description 6
- 125000004429 atom Chemical group 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 201000011510 cancer Diseases 0.000 description 6
- 238000012512 characterization method Methods 0.000 description 6
- 230000001276 controlling effect Effects 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 230000002209 hydrophobic effect Effects 0.000 description 6
- 229920005610 lignin Polymers 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 6
- 230000008488 polyadenylation Effects 0.000 description 6
- DODQJNMQWMSYGS-QPLCGJKRSA-N 4-[(z)-1-[4-[2-(dimethylamino)ethoxy]phenyl]-1-phenylbut-1-en-2-yl]phenol Chemical compound C=1C=C(O)C=CC=1C(/CC)=C(C=1C=CC(OCCN(C)C)=CC=1)/C1=CC=CC=C1 DODQJNMQWMSYGS-QPLCGJKRSA-N 0.000 description 5
- 241000589158 Agrobacterium Species 0.000 description 5
- 235000002566 Capsicum Nutrition 0.000 description 5
- 101710132601 Capsid protein Proteins 0.000 description 5
- 101710094648 Coat protein Proteins 0.000 description 5
- 108700010070 Codon Usage Proteins 0.000 description 5
- 102100031562 Excitatory amino acid transporter 2 Human genes 0.000 description 5
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 101000866287 Homo sapiens Excitatory amino acid transporter 2 Proteins 0.000 description 5
- 241000209219 Hordeum Species 0.000 description 5
- 235000003228 Lactuca sativa Nutrition 0.000 description 5
- 108091007460 Long intergenic noncoding RNA Proteins 0.000 description 5
- 101710125418 Major capsid protein Proteins 0.000 description 5
- 241000208125 Nicotiana Species 0.000 description 5
- 101710141454 Nucleoprotein Proteins 0.000 description 5
- 101710083689 Probable capsid protein Proteins 0.000 description 5
- 102000015097 RNA Splicing Factors Human genes 0.000 description 5
- 108010039259 RNA Splicing Factors Proteins 0.000 description 5
- 244000062793 Sorghum vulgare Species 0.000 description 5
- 230000001594 aberrant effect Effects 0.000 description 5
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 5
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 5
- 239000003242 anti bacterial agent Substances 0.000 description 5
- 229940088710 antibiotic agent Drugs 0.000 description 5
- 230000000903 blocking effect Effects 0.000 description 5
- 210000002421 cell wall Anatomy 0.000 description 5
- 239000001913 cellulose Substances 0.000 description 5
- 229920002678 cellulose Polymers 0.000 description 5
- 235000010980 cellulose Nutrition 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 230000000368 destabilizing effect Effects 0.000 description 5
- 241001493065 dsRNA viruses Species 0.000 description 5
- 230000001976 improved effect Effects 0.000 description 5
- 230000002401 inhibitory effect Effects 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 244000005700 microbiome Species 0.000 description 5
- 210000004940 nucleus Anatomy 0.000 description 5
- 210000003463 organelle Anatomy 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 230000003362 replicative effect Effects 0.000 description 5
- 239000000523 sample Substances 0.000 description 5
- 150000003384 small molecules Chemical class 0.000 description 5
- 230000004936 stimulating effect Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000032258 transport Effects 0.000 description 5
- 108020005345 3' Untranslated Regions Proteins 0.000 description 4
- YHOXIEXEPIIKMD-UHFFFAOYSA-N 9a-[(4-chlorophenyl)methyl]-7-hydroxy-4-[4-(2-piperidin-1-ylethoxy)phenyl]-2,9-dihydro-1h-fluoren-3-one Chemical compound C1C2=CC(O)=CC=C2C2=C(C=3C=CC(OCCN4CCCCC4)=CC=3)C(=O)CCC21CC1=CC=C(Cl)C=C1 YHOXIEXEPIIKMD-UHFFFAOYSA-N 0.000 description 4
- 108091023037 Aptamer Proteins 0.000 description 4
- 241000235349 Ascomycota Species 0.000 description 4
- 208000023275 Autoimmune disease Diseases 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 241000219198 Brassica Species 0.000 description 4
- 235000006008 Brassica napus var napus Nutrition 0.000 description 4
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 4
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 4
- 241000701489 Cauliflower mosaic virus Species 0.000 description 4
- 241000218631 Coniferophyta Species 0.000 description 4
- 235000002767 Daucus carota Nutrition 0.000 description 4
- 244000000626 Daucus carota Species 0.000 description 4
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 4
- 108091029865 Exogenous DNA Proteins 0.000 description 4
- 235000016623 Fragaria vesca Nutrition 0.000 description 4
- 240000009088 Fragaria x ananassa Species 0.000 description 4
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 244000068988 Glycine max Species 0.000 description 4
- 235000010469 Glycine max Nutrition 0.000 description 4
- 244000299507 Gossypium hirsutum Species 0.000 description 4
- 235000007340 Hordeum vulgare Nutrition 0.000 description 4
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 4
- 235000011430 Malus pumila Nutrition 0.000 description 4
- 244000070406 Malus silvestris Species 0.000 description 4
- 235000015103 Malus silvestris Nutrition 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 240000004658 Medicago sativa Species 0.000 description 4
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 4
- 240000007594 Oryza sativa Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- 239000006002 Pepper Substances 0.000 description 4
- 241000235645 Pichia kudriavzevii Species 0.000 description 4
- 235000016761 Piper aduncum Nutrition 0.000 description 4
- 240000003889 Piper guineense Species 0.000 description 4
- 235000017804 Piper guineense Nutrition 0.000 description 4
- 235000008184 Piper nigrum Nutrition 0.000 description 4
- 240000001987 Pyrus communis Species 0.000 description 4
- 235000014443 Pyrus communis Nutrition 0.000 description 4
- 230000014632 RNA localization Effects 0.000 description 4
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 4
- 241000714474 Rous sarcoma virus Species 0.000 description 4
- 240000003768 Solanum lycopersicum Species 0.000 description 4
- 241000219315 Spinacia Species 0.000 description 4
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 4
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 4
- 239000004098 Tetracycline Substances 0.000 description 4
- 241000209140 Triticum Species 0.000 description 4
- 235000021307 Triticum Nutrition 0.000 description 4
- 244000078534 Vaccinium myrtillus Species 0.000 description 4
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 4
- 239000012190 activator Substances 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 150000001298 alcohols Chemical class 0.000 description 4
- 230000006907 apoptotic process Effects 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 235000005822 corn Nutrition 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 108020001096 dihydrofolate reductase Proteins 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 230000002708 enhancing effect Effects 0.000 description 4
- 238000000855 fermentation Methods 0.000 description 4
- 230000004151 fermentation Effects 0.000 description 4
- 210000003783 haploid cell Anatomy 0.000 description 4
- 239000004009 herbicide Substances 0.000 description 4
- 238000007901 in situ hybridization Methods 0.000 description 4
- 230000000415 inactivating effect Effects 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 230000017730 intein-mediated protein splicing Effects 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 210000003470 mitochondria Anatomy 0.000 description 4
- 239000002105 nanoparticle Substances 0.000 description 4
- 239000003921 oil Substances 0.000 description 4
- 235000019198 oils Nutrition 0.000 description 4
- 239000003208 petroleum Substances 0.000 description 4
- 210000002706 plastid Anatomy 0.000 description 4
- 210000001850 polyploid cell Anatomy 0.000 description 4
- ZAHRKKWIAAJSAO-UHFFFAOYSA-N rapamycin Natural products COCC(O)C(=C/C(C)C(=O)CC(OC(=O)C1CCCCN1C(=O)C(=O)C2(O)OC(CC(OC)C(=CC=CC=CC(C)CC(C)C(=O)C)C)CCC2C)C(C)CC3CCC(O)C(C3)OC)C ZAHRKKWIAAJSAO-UHFFFAOYSA-N 0.000 description 4
- 229920002477 rna polymer Polymers 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- QFJCIRLUMZQUOT-HPLJOQBZSA-N sirolimus Chemical compound C1C[C@@H](O)[C@H](OC)C[C@@H]1C[C@@H](C)[C@H]1OC(=O)[C@@H]2CCCCN2C(=O)C(=O)[C@](O)(O2)[C@H](C)CC[C@H]2C[C@H](OC)/C(C)=C/C=C/C=C/[C@@H](C)C[C@@H](C)C(=O)[C@H](OC)[C@H](O)/C(C)=C/[C@@H](C)C(=O)C1 QFJCIRLUMZQUOT-HPLJOQBZSA-N 0.000 description 4
- 229960002930 sirolimus Drugs 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- 235000019364 tetracycline Nutrition 0.000 description 4
- 150000003522 tetracyclines Chemical class 0.000 description 4
- 238000001890 transfection Methods 0.000 description 4
- 230000010474 transient expression Effects 0.000 description 4
- 230000005945 translocation Effects 0.000 description 4
- 241001515965 unidentified phage Species 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 244000099147 Ananas comosus Species 0.000 description 3
- 241000219194 Arabidopsis Species 0.000 description 3
- 244000105624 Arachis hypogaea Species 0.000 description 3
- 244000003416 Asparagus officinalis Species 0.000 description 3
- 235000005340 Asparagus officinalis Nutrition 0.000 description 3
- 244000075850 Avena orientalis Species 0.000 description 3
- 241000206761 Bacillariophyta Species 0.000 description 3
- 241000221198 Basidiomycota Species 0.000 description 3
- 239000002028 Biomass Substances 0.000 description 3
- 240000007124 Brassica oleracea Species 0.000 description 3
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 3
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 3
- 241000499511 Cabbage leaf curl virus Species 0.000 description 3
- 241000219504 Caryophyllales Species 0.000 description 3
- 241000195585 Chlamydomonas Species 0.000 description 3
- 241000195649 Chlorella <Chlorellales> Species 0.000 description 3
- 241000207199 Citrus Species 0.000 description 3
- 240000007154 Coffea arabica Species 0.000 description 3
- 229920000742 Cotton Polymers 0.000 description 3
- 241000724252 Cucumber mosaic virus Species 0.000 description 3
- 244000241257 Cucumis melo Species 0.000 description 3
- 235000009854 Cucurbita moschata Nutrition 0.000 description 3
- 240000001980 Cucurbita pepo Species 0.000 description 3
- 230000004543 DNA replication Effects 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- 108090000204 Dipeptidase 1 Proteins 0.000 description 3
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 3
- 241000134874 Geraniales Species 0.000 description 3
- 108010010234 HDL Lipoproteins Proteins 0.000 description 3
- 102000015779 HDL Lipoproteins Human genes 0.000 description 3
- 244000020551 Helianthus annuus Species 0.000 description 3
- 235000003222 Helianthus annuus Nutrition 0.000 description 3
- 101000611202 Homo sapiens Peptidyl-prolyl cis-trans isomerase B Proteins 0.000 description 3
- 241000725303 Human immunodeficiency virus Species 0.000 description 3
- 208000023105 Huntington disease Diseases 0.000 description 3
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 3
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 3
- 240000003183 Manihot esculenta Species 0.000 description 3
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 3
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 3
- 240000005561 Musa balbisiana Species 0.000 description 3
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 3
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 3
- 102100040283 Peptidyl-prolyl cis-trans isomerase B Human genes 0.000 description 3
- 241000425347 Phyla <beetle> Species 0.000 description 3
- 241000218657 Picea Species 0.000 description 3
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 3
- 241000018646 Pinus brutia Species 0.000 description 3
- 235000011613 Pinus brutia Nutrition 0.000 description 3
- 241000709992 Potato virus X Species 0.000 description 3
- 108010029485 Protein Isoforms Proteins 0.000 description 3
- 102000001708 Protein Isoforms Human genes 0.000 description 3
- 238000003559 RNA-seq method Methods 0.000 description 3
- 244000088415 Raphanus sativus Species 0.000 description 3
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 102000006382 Ribonucleases Human genes 0.000 description 3
- 108010083644 Ribonucleases Proteins 0.000 description 3
- 102000004389 Ribonucleoproteins Human genes 0.000 description 3
- 108010081734 Ribonucleoproteins Proteins 0.000 description 3
- 241000220221 Rosales Species 0.000 description 3
- 241000192031 Ruminococcus Species 0.000 description 3
- 244000253911 Saccharomyces fragilis Species 0.000 description 3
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 3
- 241000209056 Secale Species 0.000 description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 3
- 235000009337 Spinacia oleracea Nutrition 0.000 description 3
- 241000723873 Tobacco mosaic virus Species 0.000 description 3
- 108020000999 Viral RNA Proteins 0.000 description 3
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 102000006635 beta-lactamase Human genes 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Natural products N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 230000030833 cell death Effects 0.000 description 3
- 230000032823 cell division Effects 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 235000020971 citrus fruits Nutrition 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 235000016213 coffee Nutrition 0.000 description 3
- 235000013353 coffee beverage Nutrition 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000021953 cytokinesis Effects 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 238000006471 dimerization reaction Methods 0.000 description 3
- 210000001840 diploid cell Anatomy 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 108091006047 fluorescent proteins Proteins 0.000 description 3
- 102000034287 fluorescent proteins Human genes 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 3
- 230000002101 lytic effect Effects 0.000 description 3
- 235000009973 maize Nutrition 0.000 description 3
- 230000021121 meiosis Effects 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000030648 nucleus localization Effects 0.000 description 3
- 229960003104 ornithine Drugs 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 239000010773 plant oil Substances 0.000 description 3
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 3
- 230000016434 protein splicing Effects 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 230000001172 regenerating effect Effects 0.000 description 3
- 235000009566 rice Nutrition 0.000 description 3
- 229960002180 tetracycline Drugs 0.000 description 3
- 229930101283 tetracycline Natural products 0.000 description 3
- 229960002363 thiamine pyrophosphate Drugs 0.000 description 3
- 235000008170 thiamine pyrophosphate Nutrition 0.000 description 3
- 239000011678 thiamine pyrophosphate Substances 0.000 description 3
- YXVCLPJQTZXJLH-UHFFFAOYSA-N thiamine(1+) diphosphate chloride Chemical compound [Cl-].CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N YXVCLPJQTZXJLH-UHFFFAOYSA-N 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- 230000001988 toxicity Effects 0.000 description 3
- 231100000419 toxicity Toxicity 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- 238000012800 visualization Methods 0.000 description 3
- VUFNLQXQSDUXKB-DOFZRALJSA-N 2-[4-[4-[bis(2-chloroethyl)amino]phenyl]butanoyloxy]ethyl (5z,8z,11z,14z)-icosa-5,8,11,14-tetraenoate Chemical compound CCCCC\C=C/C\C=C/C\C=C/C\C=C/CCCC(=O)OCCOC(=O)CCCC1=CC=C(N(CCCl)CCCl)C=C1 VUFNLQXQSDUXKB-DOFZRALJSA-N 0.000 description 2
- 108010016192 4-coumarate-CoA ligase Proteins 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 2
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 2
- 108020005176 AU Rich Elements Proteins 0.000 description 2
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 2
- 108020002663 Aldehyde Dehydrogenase Proteins 0.000 description 2
- 102000005369 Aldehyde Dehydrogenase Human genes 0.000 description 2
- 241000234282 Allium Species 0.000 description 2
- 244000144730 Amygdalus persica Species 0.000 description 2
- 241000192542 Anabaena Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 101150102415 Apob gene Proteins 0.000 description 2
- 102000018616 Apolipoproteins B Human genes 0.000 description 2
- 108010027006 Apolipoproteins B Proteins 0.000 description 2
- 235000017060 Arachis glabrata Nutrition 0.000 description 2
- 235000010777 Arachis hypogaea Nutrition 0.000 description 2
- 235000018262 Arachis monticola Nutrition 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 235000007319 Avena orientalis Nutrition 0.000 description 2
- 235000007558 Avena sp Nutrition 0.000 description 2
- 235000000832 Ayote Nutrition 0.000 description 2
- 235000016068 Berberis vulgaris Nutrition 0.000 description 2
- 241000335053 Beta vulgaris Species 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 235000003351 Brassica cretica Nutrition 0.000 description 2
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 2
- 235000017647 Brassica oleracea var italica Nutrition 0.000 description 2
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 2
- 235000003343 Brassica rupestris Nutrition 0.000 description 2
- 241000724256 Brome mosaic virus Species 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 108010067661 Caffeate O-methyltransferase Proteins 0.000 description 2
- 240000008574 Capsicum frutescens Species 0.000 description 2
- 241000218645 Cedrus Species 0.000 description 2
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 2
- 241000195628 Chlorophyta Species 0.000 description 2
- 108010061190 Cinnamyl-alcohol dehydrogenase Proteins 0.000 description 2
- 244000241235 Citrullus lanatus Species 0.000 description 2
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 2
- 235000005979 Citrus limon Nutrition 0.000 description 2
- 244000248349 Citrus limon Species 0.000 description 2
- 240000000560 Citrus x paradisi Species 0.000 description 2
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 2
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 2
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 2
- 241000192700 Cyanobacteria Species 0.000 description 2
- 241000035538 Cypridina Species 0.000 description 2
- 206010011968 Decreased immune responsiveness Diseases 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 241000199914 Dinophyceae Species 0.000 description 2
- 240000005717 Dioscorea alata Species 0.000 description 2
- 235000002723 Dioscorea alata Nutrition 0.000 description 2
- 235000007056 Dioscorea composita Nutrition 0.000 description 2
- 235000009723 Dioscorea convolvulacea Nutrition 0.000 description 2
- 235000005362 Dioscorea floribunda Nutrition 0.000 description 2
- 235000004868 Dioscorea macrostachya Nutrition 0.000 description 2
- 235000005361 Dioscorea nummularia Nutrition 0.000 description 2
- 235000005360 Dioscorea spiculiflora Nutrition 0.000 description 2
- 108010069091 Dystrophin Proteins 0.000 description 2
- 102000001039 Dystrophin Human genes 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108700039887 Essential Genes Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 241000223218 Fusarium Species 0.000 description 2
- 241000223221 Fusarium oxysporum Species 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 241000168525 Haematococcus Species 0.000 description 2
- 101000807859 Homo sapiens Vasopressin V2 receptor Proteins 0.000 description 2
- 101710194716 Hydroxycinnamoyltransferase Proteins 0.000 description 2
- 235000006350 Ipomoea batatas var. batatas Nutrition 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 241000209510 Liliopsida Species 0.000 description 2
- 241000218922 Magnoliophyta Species 0.000 description 2
- 241000235575 Mortierella Species 0.000 description 2
- 108010085220 Multiprotein Complexes Proteins 0.000 description 2
- 102000007474 Multiprotein Complexes Human genes 0.000 description 2
- 235000003805 Musa ABB Group Nutrition 0.000 description 2
- 102100022437 Myotonin-protein kinase Human genes 0.000 description 2
- 206010028851 Necrosis Diseases 0.000 description 2
- 241000221961 Neurospora crassa Species 0.000 description 2
- 238000000636 Northern blotting Methods 0.000 description 2
- 241000192656 Nostoc Species 0.000 description 2
- 108020003217 Nuclear RNA Proteins 0.000 description 2
- 102000043141 Nuclear RNA Human genes 0.000 description 2
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 2
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 2
- 201000009110 Oculopharyngeal muscular dystrophy Diseases 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 241000009328 Perro Species 0.000 description 2
- 244000025272 Persea americana Species 0.000 description 2
- 235000008673 Persea americana Nutrition 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- 108700023158 Phenylalanine ammonia-lyases Proteins 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 240000004713 Pisum sativum Species 0.000 description 2
- 235000010582 Pisum sativum Nutrition 0.000 description 2
- 235000015266 Plantago major Nutrition 0.000 description 2
- 241000139306 Platt Species 0.000 description 2
- 241000723784 Plum pox virus Species 0.000 description 2
- 101710124239 Poly(A) polymerase Proteins 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 235000006040 Prunus persica var persica Nutrition 0.000 description 2
- 102000014450 RNA Polymerase III Human genes 0.000 description 2
- 108010078067 RNA Polymerase III Proteins 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 240000005384 Rhizopus oryzae Species 0.000 description 2
- 235000013752 Rhizopus oryzae Nutrition 0.000 description 2
- 241000206572 Rhodophyta Species 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 235000011449 Rosa Nutrition 0.000 description 2
- 235000017848 Rubus fruticosus Nutrition 0.000 description 2
- 240000007651 Rubus glaucus Species 0.000 description 2
- 235000011034 Rubus glaucus Nutrition 0.000 description 2
- 235000009122 Rubus idaeus Nutrition 0.000 description 2
- 240000000111 Saccharum officinarum Species 0.000 description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 description 2
- 108020005543 Satellite RNA Proteins 0.000 description 2
- 241001515849 Satellite Viruses Species 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- 241000207763 Solanum Species 0.000 description 2
- 235000002597 Solanum melongena Nutrition 0.000 description 2
- 244000061458 Solanum melongena Species 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- 241000723573 Tobacco rattle virus Species 0.000 description 2
- 241000016010 Tomato spotted wilt orthotospovirus Species 0.000 description 2
- 108010036937 Trans-cinnamate 4-monooxygenase Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- 241000219793 Trifolium Species 0.000 description 2
- 108010065850 Tristetraprolin Proteins 0.000 description 2
- 101710176279 Tubulin beta-2 chain Proteins 0.000 description 2
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 2
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 2
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 2
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 2
- 102100037108 Vasopressin V2 receptor Human genes 0.000 description 2
- 235000010726 Vigna sinensis Nutrition 0.000 description 2
- 244000042314 Vigna unguiculata Species 0.000 description 2
- 241000726445 Viroids Species 0.000 description 2
- 235000009754 Vitis X bourquina Nutrition 0.000 description 2
- 235000012333 Vitis X labruscana Nutrition 0.000 description 2
- 240000006365 Vitis vinifera Species 0.000 description 2
- 235000014787 Vitis vinifera Nutrition 0.000 description 2
- 235000007244 Zea mays Nutrition 0.000 description 2
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 108091005764 adaptor proteins Proteins 0.000 description 2
- 102000035181 adaptor proteins Human genes 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 229950006790 adenosine phosphate Drugs 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000005784 autoimmunity Effects 0.000 description 2
- MQTOSJVFKKJCRP-BICOPXKESA-N azithromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)N(C)C[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 MQTOSJVFKKJCRP-BICOPXKESA-N 0.000 description 2
- 229960004099 azithromycin Drugs 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000003225 biodiesel Substances 0.000 description 2
- 230000008236 biological pathway Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 2
- 235000021029 blackberry Nutrition 0.000 description 2
- 235000021014 blueberries Nutrition 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 108010035812 caffeoyl-CoA O-methyltransferase Proteins 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 230000025084 cell cycle arrest Effects 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 230000004663 cell proliferation Effects 0.000 description 2
- 230000008166 cellulose biosynthesis Effects 0.000 description 2
- 210000002230 centromere Anatomy 0.000 description 2
- 230000009918 complex formation Effects 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 235000004879 dioscorea Nutrition 0.000 description 2
- 230000005059 dormancy Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 239000000446 fuel Substances 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 239000000833 heterodimer Substances 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 238000011503 in vivo imaging Methods 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 102100031622 mRNA decay activator protein ZFP36 Human genes 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 230000002503 metabolic effect Effects 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 235000010460 mustard Nutrition 0.000 description 2
- 230000017074 necrotic cell death Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 108020004017 nuclear receptors Proteins 0.000 description 2
- 235000014571 nuts Nutrition 0.000 description 2
- 230000002246 oncogenic effect Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 235000020232 peanut Nutrition 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 238000003976 plant breeding Methods 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 235000015136 pumpkin Nutrition 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000014493 regulation of gene expression Effects 0.000 description 2
- 230000000754 repressing effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 230000000392 somatic effect Effects 0.000 description 2
- 210000001324 spliceosome Anatomy 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 230000035882 stress Effects 0.000 description 2
- 238000012916 structural analysis Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 108091035539 telomere Proteins 0.000 description 2
- 102000055501 telomere Human genes 0.000 description 2
- 210000003411 telomere Anatomy 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 230000007306 turnover Effects 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- 230000029812 viral genome replication Effects 0.000 description 2
- IYKLZBIWFXPUCS-VIFPVBQESA-N (2s)-2-(naphthalen-1-ylamino)propanoic acid Chemical compound C1=CC=C2C(N[C@@H](C)C(O)=O)=CC=CC2=C1 IYKLZBIWFXPUCS-VIFPVBQESA-N 0.000 description 1
- CNMAQBJBWQQZFZ-LURJTMIESA-N (2s)-2-(pyridin-2-ylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC1=CC=CC=N1 CNMAQBJBWQQZFZ-LURJTMIESA-N 0.000 description 1
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 1
- KSEBMYQBYZTDHS-HWKANZROSA-M (E)-Ferulic acid Natural products COC1=CC(\C=C\C([O-])=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-M 0.000 description 1
- BLCJBICVQSYOIF-UHFFFAOYSA-N 2,2-diaminobutanoic acid Chemical compound CCC(N)(N)C(O)=O BLCJBICVQSYOIF-UHFFFAOYSA-N 0.000 description 1
- WTOFYLAWDLQMBZ-UHFFFAOYSA-N 2-azaniumyl-3-thiophen-2-ylpropanoate Chemical compound OC(=O)C(N)CC1=CC=CS1 WTOFYLAWDLQMBZ-UHFFFAOYSA-N 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 125000001572 5'-adenylyl group Chemical group C=12N=C([H])N=C(N([H])[H])C=1N=C([H])N2[C@@]1([H])[C@@](O[H])([H])[C@@](O[H])([H])[C@](C(OP(=O)(O[H])[*])([H])[H])([H])O1 0.000 description 1
- 101150052384 50 gene Proteins 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 102000017919 ADRB2 Human genes 0.000 description 1
- 240000004507 Abelmoschus esculentus Species 0.000 description 1
- 244000283070 Abies balsamea Species 0.000 description 1
- 235000007173 Abies balsamea Nutrition 0.000 description 1
- 241000208140 Acer Species 0.000 description 1
- 241001133760 Acoelorraphe Species 0.000 description 1
- 235000009434 Actinidia chinensis Nutrition 0.000 description 1
- 244000298697 Actinidia deliciosa Species 0.000 description 1
- 235000009436 Actinidia deliciosa Nutrition 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- 241000743339 Agrostis Species 0.000 description 1
- 235000005254 Allium ampeloprasum Nutrition 0.000 description 1
- 240000006108 Allium ampeloprasum Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 235000009328 Amaranthus caudatus Nutrition 0.000 description 1
- 240000001592 Amaranthus caudatus Species 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 235000011437 Amygdalus communis Nutrition 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 102000005666 Apolipoprotein A-I Human genes 0.000 description 1
- 108010059886 Apolipoprotein A-I Proteins 0.000 description 1
- 101710095342 Apolipoprotein B Proteins 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 235000003911 Arachis Nutrition 0.000 description 1
- 244000080767 Areca catechu Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000228245 Aspergillus niger Species 0.000 description 1
- 206010003591 Ataxia Diseases 0.000 description 1
- 241001106067 Atropa Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 235000005781 Avena Nutrition 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- KHBQMWCZKVMBLN-UHFFFAOYSA-N Benzenesulfonamide Chemical compound NS(=O)(=O)C1=CC=CC=C1 KHBQMWCZKVMBLN-UHFFFAOYSA-N 0.000 description 1
- 240000000724 Berberis vulgaris Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 235000018185 Betula X alpestris Nutrition 0.000 description 1
- 235000018212 Betula X uliginosa Nutrition 0.000 description 1
- 241000335423 Blastomyces Species 0.000 description 1
- 241001072256 Boraginaceae Species 0.000 description 1
- 241001465180 Botrytis Species 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000011293 Brassica napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000004221 Brassica oleracea var gemmifera Nutrition 0.000 description 1
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 1
- 244000308368 Brassica oleracea var. gemmifera Species 0.000 description 1
- 235000010149 Brassica rapa subsp chinensis Nutrition 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000000536 Brassica rapa subsp pekinensis Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 241000499436 Brassica rapa subsp. pekinensis Species 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 241001453380 Burkholderia Species 0.000 description 1
- 235000010773 Cajanus indicus Nutrition 0.000 description 1
- 244000105627 Cajanus indicus Species 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 240000001548 Camellia japonica Species 0.000 description 1
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 1
- 241000222122 Candida albicans Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 241000723418 Carya Species 0.000 description 1
- 102100032616 Caspase-2 Human genes 0.000 description 1
- 108090000552 Caspase-2 Proteins 0.000 description 1
- 235000014036 Castanea Nutrition 0.000 description 1
- 241001070941 Castanea Species 0.000 description 1
- 241000208328 Catharanthus Species 0.000 description 1
- 102000005575 Cellulases Human genes 0.000 description 1
- 108010084185 Cellulases Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000227752 Chaetoceros Species 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- 108010062745 Chloride Channels Proteins 0.000 description 1
- 102000011045 Chloride Channels Human genes 0.000 description 1
- 108700031407 Chloroplast Genes Proteins 0.000 description 1
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 241000233652 Chytridiomycota Species 0.000 description 1
- 235000007542 Cichorium intybus Nutrition 0.000 description 1
- 244000298479 Cichorium intybus Species 0.000 description 1
- 241000723347 Cinnamomum Species 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 241000589519 Comamonas Species 0.000 description 1
- 241000233838 Commelina Species 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 244000168525 Croton tiglium Species 0.000 description 1
- 108010037139 Cryptochromes Proteins 0.000 description 1
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 235000009852 Cucurbita pepo Nutrition 0.000 description 1
- 241000219130 Cucurbita pepo subsp. pepo Species 0.000 description 1
- 235000003954 Cucurbita pepo var melopepo Nutrition 0.000 description 1
- 241000186690 Cupressales Species 0.000 description 1
- 244000301850 Cupressus sempervirens Species 0.000 description 1
- 241000196114 Cycadales Species 0.000 description 1
- 241001147476 Cyclotella Species 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- 235000019106 Cynara scolymus Nutrition 0.000 description 1
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- 102100023419 Cystic fibrosis transmembrane conductance regulator Human genes 0.000 description 1
- 108010052832 Cytochromes Proteins 0.000 description 1
- 102000018832 Cytochromes Human genes 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102100026139 DNA damage-inducible transcript 4 protein Human genes 0.000 description 1
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 1
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 241000618813 Dilleniales Species 0.000 description 1
- 235000011511 Diospyros Nutrition 0.000 description 1
- 244000236655 Diospyros kaki Species 0.000 description 1
- 101100273028 Drosophila melanogaster Caf1-55 gene Proteins 0.000 description 1
- 101100441545 Drosophila melanogaster Cfp1 gene Proteins 0.000 description 1
- 101100214180 Drosophila melanogaster Ythdf gene Proteins 0.000 description 1
- 208000003556 Dry Eye Syndromes Diseases 0.000 description 1
- 206010013774 Dry eye Diseases 0.000 description 1
- 241000195634 Dunaliella Species 0.000 description 1
- 108010053101 ELAV Proteins Proteins 0.000 description 1
- 102000016662 ELAV Proteins Human genes 0.000 description 1
- 102000055765 ELAV-Like Protein 1 Human genes 0.000 description 1
- 108700015856 ELAV-Like Protein 1 Proteins 0.000 description 1
- 241001115402 Ebolavirus Species 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 235000001950 Elaeis guineensis Nutrition 0.000 description 1
- 244000127993 Elaeis melanococca Species 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241000218671 Ephedra Species 0.000 description 1
- 244000024675 Eruca sativa Species 0.000 description 1
- 235000014755 Eruca sativa Nutrition 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 244000004281 Eucalyptus maculata Species 0.000 description 1
- 241000266331 Eugenia Species 0.000 description 1
- 241000195620 Euglena Species 0.000 description 1
- 102000012858 Eukaryotic Initiation Factor-4G Human genes 0.000 description 1
- 108010057192 Eukaryotic Initiation Factor-4G Proteins 0.000 description 1
- 241000208367 Euonymus Species 0.000 description 1
- 241001489978 Eupolyphaga Species 0.000 description 1
- 235000010099 Fagus sylvatica Nutrition 0.000 description 1
- 240000000731 Fagus sylvatica Species 0.000 description 1
- 241000234642 Festuca Species 0.000 description 1
- 241000218218 Ficus <angiosperm> Species 0.000 description 1
- 240000006927 Foeniculum vulgare Species 0.000 description 1
- 235000004204 Foeniculum vulgare Nutrition 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 241000702463 Geminiviridae Species 0.000 description 1
- 241000208152 Geranium Species 0.000 description 1
- 102100030651 Glutamate receptor 2 Human genes 0.000 description 1
- 102000051366 Glycosyltransferases Human genes 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 241000218664 Gnetales Species 0.000 description 1
- 229920000989 Gold Flex Polymers 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- 102220491568 Heat shock 70 kDa protein 1B_D10A_mutation Human genes 0.000 description 1
- 241000756137 Hemerocallis Species 0.000 description 1
- 241000258937 Hemiptera Species 0.000 description 1
- 241000711549 Hepacivirus C Species 0.000 description 1
- 108010014594 Heterogeneous Nuclear Ribonucleoprotein A1 Proteins 0.000 description 1
- 102000017013 Heterogeneous Nuclear Ribonucleoprotein A1 Human genes 0.000 description 1
- 102000006479 Heterogeneous-Nuclear Ribonucleoproteins Human genes 0.000 description 1
- 108010019372 Heterogeneous-Nuclear Ribonucleoproteins Proteins 0.000 description 1
- 244000043261 Hevea brasiliensis Species 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000959437 Homo sapiens Beta-2 adrenergic receptor Proteins 0.000 description 1
- 101000912753 Homo sapiens DNA damage-inducible transcript 4 protein Proteins 0.000 description 1
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000833167 Homo sapiens Poly(A) RNA polymerase GLD2 Proteins 0.000 description 1
- 101000780643 Homo sapiens Protein argonaute-2 Proteins 0.000 description 1
- 101000795753 Homo sapiens mRNA decay activator protein ZFP36 Proteins 0.000 description 1
- 102000016252 Huntingtin Human genes 0.000 description 1
- 108050004784 Huntingtin Proteins 0.000 description 1
- 208000035150 Hypercholesterolemia Diseases 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100039060 Interleukin enhancer-binding factor 2 Human genes 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 241001501885 Isochrysis Species 0.000 description 1
- 241000235644 Issatchenkia Species 0.000 description 1
- 240000007049 Juglans regia Species 0.000 description 1
- 235000009496 Juglans regia Nutrition 0.000 description 1
- 241000735470 Juncus Species 0.000 description 1
- 241000721662 Juniperus Species 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241001138401 Kluyveromyces lactis Species 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- ZGUNAGUHMKGQNY-ZETCQYMHSA-N L-alpha-phenylglycine zwitterion Chemical compound OC(=O)[C@@H](N)C1=CC=CC=C1 ZGUNAGUHMKGQNY-ZETCQYMHSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FBOZXECLQNJBKD-ZDUSSCGKSA-N L-methotrexate Chemical compound C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 FBOZXECLQNJBKD-ZDUSSCGKSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 241000442132 Lactarius lactarius Species 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 241000218652 Larix Species 0.000 description 1
- 235000005590 Larix decidua Nutrition 0.000 description 1
- 241000209499 Lemna Species 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 1
- 240000007472 Leucaena leucocephala Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 241000234269 Liliales Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 241000209082 Lolium Species 0.000 description 1
- 241000219745 Lupinus Species 0.000 description 1
- 241000702489 Maize streak virus Species 0.000 description 1
- 241000121629 Majorana Species 0.000 description 1
- 241000219171 Malpighiales Species 0.000 description 1
- 240000000982 Malva neglecta Species 0.000 description 1
- 235000000060 Malva neglecta Nutrition 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108091007780 MiR-122 Proteins 0.000 description 1
- 241001295810 Microsporidium Species 0.000 description 1
- 101100144701 Mus musculus Drosha gene Proteins 0.000 description 1
- 101100494762 Mus musculus Nedd9 gene Proteins 0.000 description 1
- 101100046352 Mus musculus Tjap1 gene Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 206010068871 Myotonic dystrophy Diseases 0.000 description 1
- 108010052185 Myotonin-Protein Kinase Proteins 0.000 description 1
- 241000219926 Myrtaceae Species 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 241001494793 Nanovirus Species 0.000 description 1
- 235000017879 Nasturtium officinale Nutrition 0.000 description 1
- 240000005407 Nasturtium officinale Species 0.000 description 1
- 241000502321 Navicula Species 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 108700021638 Neuro-Oncological Ventral Antigen Proteins 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 241000221960 Neurospora Species 0.000 description 1
- 101100462611 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) prr-1 gene Proteins 0.000 description 1
- 241000207746 Nicotiana benthamiana Species 0.000 description 1
- 108700031302 Nuclear Factor 45 Proteins 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 241000209477 Nymphaeaceae Species 0.000 description 1
- 241000199478 Ochromonas Species 0.000 description 1
- 241000238413 Octopus Species 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241000514008 Oocystis Species 0.000 description 1
- 239000008896 Opium Substances 0.000 description 1
- 241000233855 Orchidaceae Species 0.000 description 1
- 241000209094 Oryza Species 0.000 description 1
- 241000237502 Ostreidae Species 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 235000003283 Pachira macrocarpa Nutrition 0.000 description 1
- 241001479578 Packera contermina Species 0.000 description 1
- 235000019482 Palm oil Nutrition 0.000 description 1
- 241000209117 Panicum Species 0.000 description 1
- 235000006443 Panicum miliaceum subsp. miliaceum Nutrition 0.000 description 1
- 235000009037 Panicum miliaceum subsp. ruderale Nutrition 0.000 description 1
- 240000001090 Papaver somniferum Species 0.000 description 1
- 235000008753 Papaver somniferum Nutrition 0.000 description 1
- BUQLXKSONWUQAC-UHFFFAOYSA-N Parthenolide Natural products CC1C2OC(=O)C(=C)C2CCC(=C/CCC1(C)O)C BUQLXKSONWUQAC-UHFFFAOYSA-N 0.000 description 1
- 240000004370 Pastinaca sativa Species 0.000 description 1
- 235000017769 Pastinaca sativa subsp sativa Nutrition 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 241000206766 Pavlova Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000005877 Peptide Initiation Factors Human genes 0.000 description 1
- 108010044843 Peptide Initiation Factors Proteins 0.000 description 1
- 108010085186 Peroxisomal Targeting Signals Proteins 0.000 description 1
- 244000062780 Petroselinum sativum Species 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 241000206731 Phaeodactylum Species 0.000 description 1
- 241000199919 Phaeophyceae Species 0.000 description 1
- 241000219833 Phaseolus Species 0.000 description 1
- 108010030688 Photinus luciferase Proteins 0.000 description 1
- 235000009230 Physalis pubescens Nutrition 0.000 description 1
- 240000001558 Physalis viscosa Species 0.000 description 1
- 235000002491 Physalis viscosa Nutrition 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 241000218633 Pinidae Species 0.000 description 1
- 240000008299 Pinus lambertiana Species 0.000 description 1
- 235000003445 Pistacia Nutrition 0.000 description 1
- 241000543704 Pistacia Species 0.000 description 1
- 235000003447 Pistacia vera Nutrition 0.000 description 1
- 240000006711 Pistacia vera Species 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 241000196317 Platymonas Species 0.000 description 1
- 241000209504 Poaceae Species 0.000 description 1
- 241001536628 Poales Species 0.000 description 1
- 102100024380 Poly(A) RNA polymerase GLD2 Human genes 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- 241000723762 Potato virus Y Species 0.000 description 1
- 241000710007 Potexvirus Species 0.000 description 1
- 241000605861 Prevotella Species 0.000 description 1
- 241000611831 Prevotella sp. Species 0.000 description 1
- 241000208476 Primulaceae Species 0.000 description 1
- 102100034207 Protein argonaute-2 Human genes 0.000 description 1
- 108700020978 Proto-Oncogene Proteins 0.000 description 1
- 102000052575 Proto-Oncogene Human genes 0.000 description 1
- 235000009827 Prunus armeniaca Nutrition 0.000 description 1
- 244000018633 Prunus armeniaca Species 0.000 description 1
- 241001290151 Prunus avium subsp. avium Species 0.000 description 1
- 244000141353 Prunus domestica Species 0.000 description 1
- 235000011435 Prunus domestica Nutrition 0.000 description 1
- 235000006029 Prunus persica var nucipersica Nutrition 0.000 description 1
- 244000017714 Prunus persica var. nucipersica Species 0.000 description 1
- 244000294611 Punica granatum Species 0.000 description 1
- 235000014360 Punica granatum Nutrition 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- LCTONWCANYUPML-UHFFFAOYSA-M Pyruvate Chemical compound CC(=O)C([O-])=O LCTONWCANYUPML-UHFFFAOYSA-M 0.000 description 1
- 241000219492 Quercus Species 0.000 description 1
- 235000016976 Quercus macrolepis Nutrition 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 241000218201 Ranunculaceae Species 0.000 description 1
- 101000866288 Rattus norvegicus Excitatory amino acid transporter 1 Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 241000245165 Rhododendron ponticum Species 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 241000221987 Russula Species 0.000 description 1
- 241001093501 Rutaceae Species 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 241000221035 Santalaceae Species 0.000 description 1
- 108091026924 Sar RNA Proteins 0.000 description 1
- 241000134890 Saxifragales Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102100031463 Serine/threonine-protein kinase PLK1 Human genes 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 241000709761 Soybean dwarf virus Species 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 102000000551 Syk Kinase Human genes 0.000 description 1
- 108010016672 Syk Kinase Proteins 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 241000192584 Synechocystis Species 0.000 description 1
- 241000228341 Talaromyces Species 0.000 description 1
- 241001116500 Taxus Species 0.000 description 1
- 241001122767 Theaceae Species 0.000 description 1
- 240000006474 Theobroma bicolor Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 240000006909 Tilia x europaea Species 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 241000948318 Tobacco leaf curl virus Species 0.000 description 1
- 241000723717 Tobravirus Species 0.000 description 1
- 241000059156 Toddalia Species 0.000 description 1
- 241000702295 Tomato golden mosaic virus Species 0.000 description 1
- 241001135990 Tomato leaf curl virus Species 0.000 description 1
- 241000283907 Tragelaphus oryx Species 0.000 description 1
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 1
- 235000014364 Trapa natans Nutrition 0.000 description 1
- 240000001085 Trapa natans Species 0.000 description 1
- 241000499912 Trichoderma reesei Species 0.000 description 1
- 235000001484 Trigonella foenum graecum Nutrition 0.000 description 1
- 244000250129 Trigonella foenum graecum Species 0.000 description 1
- 241000233948 Typha Species 0.000 description 1
- 108091026838 U1 spliceosomal RNA Proteins 0.000 description 1
- 241001106462 Ulmus Species 0.000 description 1
- 241000306282 Umbelopsis isabellina Species 0.000 description 1
- 235000007212 Verbena X moechina Moldenke Nutrition 0.000 description 1
- 240000001519 Verbena officinalis Species 0.000 description 1
- 235000001594 Verbena polystachya Kunth Nutrition 0.000 description 1
- 235000007200 Verbena x perriana Moldenke Nutrition 0.000 description 1
- 235000002270 Verbena x stuprosa Moldenke Nutrition 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 235000010749 Vicia faba Nutrition 0.000 description 1
- 240000006677 Vicia faba Species 0.000 description 1
- 235000002098 Vicia faba var. major Nutrition 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 241000702302 Wheat dwarf virus Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 241000235015 Yarrowia lipolytica Species 0.000 description 1
- 241000209149 Zea Species 0.000 description 1
- 241000482268 Zea mays subsp. mays Species 0.000 description 1
- 241000907316 Zika virus Species 0.000 description 1
- 241000234314 Zingiber Species 0.000 description 1
- 241000234675 Zingiberales Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000036579 abiotic stress Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 206010064930 age-related macular degeneration Diseases 0.000 description 1
- 239000002154 agricultural waste Substances 0.000 description 1
- 230000009418 agronomic effect Effects 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 239000004178 amaranth Substances 0.000 description 1
- 235000012735 amaranth Nutrition 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 238000003975 animal breeding Methods 0.000 description 1
- 230000000879 anti-atherosclerotic effect Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 101150010487 are gene Proteins 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000016520 artichoke thistle Nutrition 0.000 description 1
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 1
- 235000000183 arugula Nutrition 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- UCMIRNVEIXFBKS-UHFFFAOYSA-N beta-alanine Chemical group NCCC(O)=O UCMIRNVEIXFBKS-UHFFFAOYSA-N 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 101150049515 bla gene Proteins 0.000 description 1
- 230000008499 blood brain barrier function Effects 0.000 description 1
- 210000001218 blood-brain barrier Anatomy 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000000981 bystander Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000005907 cancer growth Effects 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 229940095731 candida albicans Drugs 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 230000033026 cell fate determination Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000036978 cell physiology Effects 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 230000004640 cellular pathway Effects 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 235000019693 cherries Nutrition 0.000 description 1
- 108091006116 chimeric peptides Proteins 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 230000011088 chloroplast localization Effects 0.000 description 1
- 108010031100 chloroplast transit peptides Proteins 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 125000000490 cinnamyl group Chemical group C(C=CC1=CC=CC=C1)* 0.000 description 1
- 229920003211 cis-1,4-polyisoprene Polymers 0.000 description 1
- YNNUSGIPVFPVBX-NHCUHLMSSA-N clemastine Chemical compound CN1CCC[C@@H]1CCO[C@@](C)(C=1C=CC(Cl)=CC=1)C1=CC=CC=C1 YNNUSGIPVFPVBX-NHCUHLMSSA-N 0.000 description 1
- 229960002881 clemastine Drugs 0.000 description 1
- 230000002566 clonic effect Effects 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000008645 cold stress Effects 0.000 description 1
- 230000001332 colony forming effect Effects 0.000 description 1
- 235000018597 common camellia Nutrition 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000008876 conformational transition Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000007799 cork Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 108010031180 cypridina luciferase Proteins 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000001461 cytolytic effect Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- 230000008641 drought stress Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 201000002491 encephalomyelitis Diseases 0.000 description 1
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 230000003492 excitotoxic effect Effects 0.000 description 1
- 231100000063 excitotoxicity Toxicity 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- KSEBMYQBYZTDHS-HWKANZROSA-N ferulic acid Chemical compound COC1=CC(\C=C\C(O)=O)=CC=C1O KSEBMYQBYZTDHS-HWKANZROSA-N 0.000 description 1
- 235000001785 ferulic acid Nutrition 0.000 description 1
- 229940114124 ferulic acid Drugs 0.000 description 1
- KSEBMYQBYZTDHS-UHFFFAOYSA-N ferulic acid Natural products COC1=CC(C=CC(O)=O)=CC=C1O KSEBMYQBYZTDHS-UHFFFAOYSA-N 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 239000004459 forage Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 208000030536 genetic skin disease Diseases 0.000 description 1
- 230000037442 genomic alteration Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 108010089305 glutamate receptor type B Proteins 0.000 description 1
- 108010033706 glycylserine Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 235000021384 green leafy vegetables Nutrition 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000008642 heat stress Effects 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 230000001146 hypoxic effect Effects 0.000 description 1
- 101150095658 ilf2 gene Proteins 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000004410 intraocular pressure Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- MWDZOUNAPSSOEL-UHFFFAOYSA-N kaempferol Natural products OC1=C(C(=O)c2cc(O)cc(O)c2O1)c3ccc(O)cc3 MWDZOUNAPSSOEL-UHFFFAOYSA-N 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- XIXADJRWDQXREU-UHFFFAOYSA-M lithium acetate Chemical compound [Li+].CC([O-])=O XIXADJRWDQXREU-UHFFFAOYSA-M 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 241000238565 lobster Species 0.000 description 1
- 238000003670 luciferase enzyme activity assay Methods 0.000 description 1
- 229960005375 lutein Drugs 0.000 description 1
- KBPHJBAIARWVSC-RGZFRNHPSA-N lutein Chemical compound C([C@H](O)CC=1C)C(C)(C)C=1\C=C\C(\C)=C\C=C\C(\C)=C\C=C\C=C(/C)\C=C\C=C(/C)\C=C\[C@H]1C(C)=C[C@H](O)CC1(C)C KBPHJBAIARWVSC-RGZFRNHPSA-N 0.000 description 1
- IQPNAANSBPBGFQ-UHFFFAOYSA-N luteolin Chemical compound C=1C(O)=CC(O)=C(C(C=2)=O)C=1OC=2C1=CC=C(O)C(O)=C1 IQPNAANSBPBGFQ-UHFFFAOYSA-N 0.000 description 1
- 235000009498 luteolin Nutrition 0.000 description 1
- LRDGATPGVJTWLJ-UHFFFAOYSA-N luteolin Natural products OC1=CC(O)=CC(C=2OC3=CC(O)=CC(O)=C3C(=O)C=2)=C1 LRDGATPGVJTWLJ-UHFFFAOYSA-N 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229960000485 methotrexate Drugs 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 108091051828 miR-122 stem-loop Proteins 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000004001 molecular interaction Effects 0.000 description 1
- 210000000337 motor cortex Anatomy 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000002151 myoclonic effect Effects 0.000 description 1
- 230000003274 myotonic effect Effects 0.000 description 1
- 230000001338 necrotic effect Effects 0.000 description 1
- 230000007823 neuropathy Effects 0.000 description 1
- 201000001119 neuropathy Diseases 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 210000004492 nuclear pore Anatomy 0.000 description 1
- 230000025308 nuclear transport Effects 0.000 description 1
- 108091008104 nucleic acid aptamers Proteins 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 231100000590 oncogenic Toxicity 0.000 description 1
- 229960001027 opium Drugs 0.000 description 1
- 239000005416 organic matter Substances 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 235000020636 oyster Nutrition 0.000 description 1
- 239000002540 palm oil Substances 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- KTEXNACQROZXEV-PVLRGYAZSA-N parthenolide Chemical compound C1CC(/C)=C/CC[C@@]2(C)O[C@@H]2[C@H]2OC(=O)C(=C)[C@@H]21 KTEXNACQROZXEV-PVLRGYAZSA-N 0.000 description 1
- 229940069510 parthenolide Drugs 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 235000012162 pavlova Nutrition 0.000 description 1
- 239000003415 peat Substances 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 235000011197 perejil Nutrition 0.000 description 1
- 208000022177 perioral myoclonia with absences Diseases 0.000 description 1
- 208000033808 peripheral neuropathy Diseases 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- 230000003094 perturbing effect Effects 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 244000112814 pipewort Species 0.000 description 1
- 235000020233 pistachio Nutrition 0.000 description 1
- 239000004069 plant analysis Substances 0.000 description 1
- 108010056274 polo-like kinase 1 Proteins 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000019525 primary metabolic process Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 230000003946 protein process Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 229940076788 pyruvate Drugs 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000001718 repressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 235000009165 saligot Nutrition 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 208000017520 skin disease Diseases 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 235000020354 squash Nutrition 0.000 description 1
- 230000002311 subsequent effect Effects 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
- 230000000946 synaptic effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 235000013616 tea Nutrition 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 229940040944 tetracyclines Drugs 0.000 description 1
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- 235000019157 thiamine Nutrition 0.000 description 1
- 239000011721 thiamine Substances 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- NGSWKAQJJWESNS-ZZXKWVIFSA-N trans-4-coumaric acid Chemical compound OC(=O)\C=C\C1=CC=C(O)C=C1 NGSWKAQJJWESNS-ZZXKWVIFSA-N 0.000 description 1
- QURCVMIEKCOAJU-UHFFFAOYSA-N trans-isoferulic acid Natural products COC1=CC=C(C=CC(O)=O)C=C1O QURCVMIEKCOAJU-UHFFFAOYSA-N 0.000 description 1
- KBPHJBAIARWVSC-XQIHNALSSA-N trans-lutein Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C(=CC(O)CC2(C)C)C KBPHJBAIARWVSC-XQIHNALSSA-N 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000009752 translational inhibition Effects 0.000 description 1
- 235000001019 trigonella foenum-graecum Nutrition 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000009281 ultraviolet germicidal irradiation Methods 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 238000011311 validation assay Methods 0.000 description 1
- 210000005167 vascular cell Anatomy 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000020234 walnut Nutrition 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- FJHBOVDFOQMZRV-XQIHNALSSA-N xanthophyll Natural products CC(=C/C=C/C=C(C)/C=C/C=C(C)/C=C/C1=C(C)CC(O)CC1(C)C)C=CC=C(/C)C=CC2C=C(C)C(O)CC2(C)C FJHBOVDFOQMZRV-XQIHNALSSA-N 0.000 description 1
- 235000008210 xanthophylls Nutrition 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/30—Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
Abstract
本发明提供了用于靶向核酸的系统、方法和组合物。特别地,本发明提供了非天然存在的或经工程化的RNA‑靶向系统,其包含新型RNA‑靶向Cas13b效应蛋白和至少一种靶向核酸组分如向导RNA或crRNA。
Description
相关申请和通过引用并入
本申请要求2017年3月15日提交的美国临时申请62/471,710和2017年10月2日提交的美国临时申请62/566,829的优先权。
参考包括其指定的尤其是2016年10月21日提交的美国申请No.PCT/US2016/058302在内的PCT申请。参考2015年10月22日提交的美国临时专利申请62/245,270、2016年2月17日提交的美国临时专利申请62/296,548和2016年8月17日提交的美国临时专利申请62/376,367和62/376,382。进一步参考2017年3月15日提交的美国临时62/471,792和2017年4月12日提交的美国临时62/484,786。提到了Smargon等人(2017),“Cas13b Is a TypeVI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by AccessoryProteins Csx27 and Csx28,”Molecular Cell 65,618-630(2017年2月16日)doi:10.1016/j.molcel.2016.12.023.Epub 2017年1月5日和Smargon等人(2017),“Cas13b Isa Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated byAccessory Proteins Csx27 and Csx28,”bioRxiv 092577;doi:https://doi.org/10.1101/092577.2017年12月9日公布。前述申请和文献引用中的每一个在此均通过引用并入本文。
实际上,本文和本文引用或参考的所有文档或者本文引用的文档,连同本文提及的或通过引用并入本文的任何文档中的任何产品的任何制造商的说明书、描述、产品规格和产品表,均在此通过引用并入本文,并且可以用于本发明的实践中。更具体地,所有参考文档通过引用并入,就好像每个单独文档被具体地和单独地指示通过引用并入一样。
关于联邦资助研究的声明
本发明是在美国国立卫生研究院(National Institutes of Health)颁发的第MH100706号和第MH110049号拨款下借助政府支持进行的。政府拥有本发明的某些权利。
发明领域
本发明通常涉及用于控制涉及序列靶向(诸如扰动基因转录物或核酸编辑)的基因表达的系统、方法和组合物,其可以使用与成簇的规律间隔的短回文重复(CRISPR)及其组分相关的载体系统。
发明背景
细菌和古细菌适应性免疫的CRISPR-CRISPR相关(Cas)系统就是一些这样的系统,它们显示出蛋白质组成和基因组基因座结构的极端多样性。CRISPR-Cas系统基因座具有50多个基因家族,并且没有严格的通用基因来指示基因座结构的快速进化和极端多样性。到目前为止,采用多管齐下的方法,对93种Cas蛋白的大约395个图谱进行了全面的cas基因鉴定。分类包括签名基因图谱以及基因座结构签名。提出了一种新的CRISPR-Cas系统分类方法,其中将这些系统大致分为两类:具有多亚基效应子复合物的1类和具有由Cas9蛋白例示的单亚基效应子模块的2类。与2类CRISPR-Cas系统相关的新型效应蛋白可能被开发为功能强大的基因组工程化工具,并且对推定的新型效应蛋白及其工程化和优化的预测非常重要。新型Cas13b直向同源物及其用途是合乎期望的。
在本申请中对任何文档的引用或标识均不承认此类文档可用作本发明的现有技术。
发明内容
效应蛋白包括两个亚组,VI-B1型和VI-B2型,并且包括是RNA可编程核酸酶、RNA干扰并且可参与针对RNA噬菌体的细菌过继性免疫的成员。Cas13b系统可在CRISPR阵列附近包含大型单个效应子(长度约为1100个氨基酸),和两个小推定辅助蛋白(长度约为200个氨基酸)中的一个或无一个。基于附近的小蛋白质,该系统二分为两个基因座A和B。在每个基因座的物种中,没有至阵列上游或下游25千碱基对的额外蛋白质是保守的。除少数例外,CRISPR阵列包含长度为36个核苷酸的正向重复序列和长度为30个核苷酸的间隔子序列。正向重复序列通常很保守,尤其是在末端,在5'末端的GTTG/GUUG与在3'末端的CAAC互补。这种保守性暗示了RNA环结构的强碱基配对,所述RNA环结构可能与基因座中的一种或多种蛋白质相互作用。与正向重复互补的基序搜索显示在阵列附近没有候选物tracrRNA,可能表明有单个crRNA,类似于在Cpf1基因座中发现的。
在本发明的实施方案中,VI-B型系统包含新型Cas13b效应蛋白和任选的在Cas13b效应蛋白的上游或下游编码的小的辅助蛋白。在某些实施方案中,小的辅助蛋白增强了Cas13b效应子靶向RNA的能力。
本发明提供了非天然存在的或经工程化的组合物,其包含
i)某些新型Cas13b效应蛋白,和
ii)crRNA,
其中crRNA包含a)引导序列,其能够杂交至靶RNA序列,和b)正向重复序列,
从而形成包含与杂交至靶RNA序列的引导序列复合的Cas13b效应蛋白的CRISPR复合物。复合物可体内或离体形成并被引入细胞或与RNA接触;或可体内形成。
在一些实施方案中,本发明的非天然存在的或经工程化的组合物可包含增强VI-B型CRISPR-Cas效应蛋白活性的辅助蛋白。
在某些此类实施方案中,增强Cas13b效应蛋白活性的辅助蛋白是csx28蛋白。在此类实施方案中,VI-B型CRISPR-Cas效应蛋白和VI-B型CRISPR-Cas辅助蛋白可来自相同来源或来自不同来源。
在一些实施方案中,本发明的非天然存在的或经工程化的组合物包含阻遏Cas13b效应蛋白活性的辅助蛋白。
在某些此类实施方案中,阻遏Cas13b效应蛋白活性的辅助蛋白是csx27蛋白。在此类实施方案中,VI-B型CRISPR-Cas效应蛋白和VI-B型CRISPR-Cas辅助蛋白可来自相同来源或来自不同来源。在本发明的某些实施方案中,VI-B型CRISPR-Cas效应蛋白来自表1。在某些实施方案中,VI-B型CRISPR-Cas辅助蛋白来自表1。
在一些实施方案中,本发明的非天然存在的或经工程化的组合物包含两种或多种crRNA。
在一些实施方案中,本发明的非天然存在的或经工程化的组合物包含杂交至原核细胞中的靶RNA序列的引导序列。
在一些实施方案中,本发明的非天然存在的或经工程化的组合物包含杂交至真核细胞中的靶RNA序列的引导序列。
在一些实施方案中,Cas13b效应蛋白包含一种或多种核定位信号(NLS)。
本发明的Cas13b效应蛋白是以下、或在以下中、或包含以下、或基本上由以下组成、或由以下组成、或涉及或涉及到以下:来自表1或如由表1所示的此类蛋白。本发明意在提供以下、或涉及到以下、或涉及以下、或包括以下、或基本上由以下组成、或由以下组成:来自表1或如由表1所述的包含如本文所示的突变或其改变的蛋白。表1 Cas13b效应蛋白在本文中结合表1更详细地讨论。
在本发明的非天然存在的或经工程化的组合物的一些实施方案中,Cas13b效应蛋白与一个或多个功能结构域缔合。缔合可以通过效应蛋白与功能结构域的直接键联,或通过与crRNA缔合进行。在非限制性实例中,crRNA包含可与目标功能结构域缔合的添加或插入的序列,包括例如与核酸结合衔接蛋白结合的适体或核苷酸。
在某些非限制性实施方案中,本发明的非天然存在的或经工程化的组合物包含切割靶RNA序列的功能结构域。
在某些非限制性实施方案中,本发明的非天然存在的或经工程化的组合物包含修饰靶RNA序列的转录或翻译的功能结构域。
在本发明的组合物的一些实施方案中,Cas13b效应蛋白与一个或多个功能结构域缔合;和效应蛋白在HEPN结构域内含有一种或多种突变,从而所述复合物可递送表观遗传修饰剂或转录或翻译激活或阻遏信号。复合物可体外或离体形成并且引入细胞或与RNA接触;或可体内形成。
在本发明的非天然存在的或经工程化的组合物的一些实施方案中,Cas13b效应蛋白和辅助蛋白来自相同的生物体。
在本发明的非天然存在的或经工程化的组合物的一些实施方案中,Cas13b效应蛋白和辅助蛋白来自不同的生物体。
本发明还提供了VI-B型CRISPR-Cas载体系统,其包含一种或多种载体,所述载体包含:
第一调控元件,其可操作地连接至编码Cas13b效应蛋白的核苷酸序列,和
第二调控元件,其可操作地连接至编码crRNA的核苷酸序列。
在某些实施方案中,本发明的载体系统还包含可操作地连接至VI-B型CRISPR-Cas辅助蛋白的核苷酸序列的调控元件。
当适当时,编码VI-B型CRISPR-Cas效应蛋白和/或编码VI-B型CRISPR-Cas辅助蛋白的核苷酸序列经密码子优化以用于在真核细胞中表达。
在本发明的载体系统的一些实施方案中,编码Cas13b效应蛋白和辅助蛋白的核苷酸序列经密码子优化以用于在真核细胞中表达。
在一些实施方案中,本发明的载体系统被包含在单个载体中。
在本发明的载体系统的一些实施方案中,一种或多种载体包括病毒载体。
在本发明的载体系统的一些实施方案中,一种或多种载体包括一种或多种逆转录病毒、慢病毒、腺病毒、腺相关或单纯疱疹病毒载体。
本发明提供了经配置以递送非天然存在的或经工程化的组合物的Cas13b效应蛋白和一种或多种核酸组分的递送系统,所述非天然存在的或经工程化的组合物包含:
i)Cas13b效应蛋白,和
ii)crRNA,
其中crRNA包含a)杂交至细胞中的靶RNA序列的引导序列,和b)正向重复序列,
其中Cas13b效应蛋白与crRNA形成复合物,
其中引导序列向导序列特异性结合至靶RNA序列,
从而形成包含与杂交至靶RNA序列的引导序列复合的Cas13b效应蛋白的CRISPR复合物。复合物可体外或离体形成并且引入细胞或与RNA接触;或可体内形成。
在本发明的递送系统的一些实施方案中,该系统包含一种或多种载体或一种或多种多核苷酸分子,所述一种或多种载体或多核苷酸分子包含编码非天然存在的或经工程化的组合物的Cas13b效应蛋白和一种或多种核酸组分的一种或多种多核苷酸分子。
在一些实施方案中,本发明的递送系统包含递送载体,所述递送载体包含一种或多种脂质体、一种或多种颗粒、一种或多种外泌体、一种或多种微囊泡、基因枪或一种或多种病毒载体。
在一些实施方案中,本发明的非天然存在的或经工程化的组合物用于治疗性治疗方法中或研究计划中。
在一些实施方案中,本发明的非天然存在的或经工程化的载体系统用于治疗性治疗方法中或研究计划中。
在一些实施方案中,本发明的非天然存在的或经工程化的递送系统可用于治疗性治疗方法中或研究计划中。
本发明提供了修饰目标靶基因的表达的方法,所述方法包括使靶RNA与一种或多种非天然存在的或经工程化的组合物接触,所述非天然存在的或经工程化的组合物包含
i)Cas13b效应蛋白,和
ii)crRNA,
其中crRNA包含a)杂交至细胞中的靶RNA序列的引导序列,和b)正向重复序列,
其中Cas13b效应蛋白与crRNA形成复合物,
其中引导序列向导序列特异性结合至细胞中的靶RNA序列,
从而形成包含与杂交至靶RNA序列的引导序列复合的Cas13b效应蛋白的CRISPR复合物,
从而修饰目标靶基因座的表达。复合物可体内或离体形成并被引入细胞或与RNA接触;或可体内形成。
在一些实施方案中,修饰目标靶基因的表达的方法还包括使靶RNA与增强Cas13b效应蛋白活性的辅助蛋白接触。
在修饰目标靶基因的表达的方法的一些实施方案中,增强Cas13b效应蛋白活性的辅助蛋白是csx28蛋白。
在一些实施方案中,修饰目标靶基因的表达的方法还包括使靶RNA与阻遏Cas13b效应蛋白活性的辅助蛋白接触。
在修饰目标靶基因的表达的方法的一些实施方案中,阻遏Cas13b效应蛋白活性的辅助蛋白是csx27蛋白。
在一些实施方案中,修饰目标靶基因的表达的方法包括切割靶RNA。
在一些实施方案中,修饰目标靶基因的表达的方法包括增加或减少靶RNA的表达。
在修饰目标靶基因的表达的方法的一些实施方案中,靶基因在原核细胞中。
在修饰目标靶基因的表达的方法的一些实施方案中,靶基因在真核细胞中。
本发明提供了包含经修饰的目标靶标的细胞,其中目标靶标根据本文公开的方法中的任一个修饰。
在本发明的一些实施方案中,细胞是原核细胞。
在本发明的一些实施方案中,细胞是真核细胞。
在一些实施方案中,在细胞中目标靶标的修饰导致:
细胞包含至少一种基因产物的改变表达;
细胞包含至少一种基因产物的改变表达,其中至少一种基因产物的表达增加;或
细胞包含至少一种基因产物的改变表达,其中至少一种基因产物的表达减少。
在一些实施方案中,细胞是哺乳动物细胞或人细胞。
本发明提供了包含本文公开的细胞或者通过本文公开的任何方法修饰的细胞的细胞系。
本发明提供了多细胞生物体,其包含本文公开的一种或多种细胞或根据本文公开的任何方法修饰的一种或多种细胞。
本发明提供了植物或动物模型,其包含本文公开的一种或多种细胞或根据本文公开的任何方法修饰的一种或多种细胞。
本发明提供了来自本文公开的细胞或细胞系或生物体或植物或动物模型的基因产物。
在一些实施方案中,表达的基因产物的量大于或小于来自不具有改变的表达的细胞的基因产物的量。
本发明提供了经分离的Cas13b效应蛋白,其包括以下或基本上由以下组成或由以下组成或如以下所示:表1。表1 Cas13b效应蛋白如在本文中结合表1更详细地讨论。本发明提供了编码Cas13b效应蛋白的经分离的核酸。在本发明的一些实施方案中,经分离的核酸包含DNA序列并且还包含编码crRNA的序列。本发明提供了经分离的真核细胞,其包含编码Cas13b效应蛋白的核酸。因此,在本文中,“Cas13b效应蛋白”或“效应蛋白”或“Cas”或“Cas蛋白”或“RNA靶向效应蛋白”或“RNA靶向效应蛋白”或类似表达应参考表1理解,并且可被解读为表1 Cas13b效应蛋白CRISPR系统;和参考引导RNA或sgRNA应结合Cas13b系统crRNA的本文讨论解读,如其在其他系统中是sgRNA,可被认为是或类似于本发明中的crRNA。
本发明提供了鉴定适合的引导序列用于本发明的Cas13b效应蛋白(如表1)的需要的方法,所述方法包括:
(a)选择生物体内的一套必需基因
(b)设计能够杂交至区域(这些基因的编码区以及这些基因的5’和3’UTR)的靶向引导序列文库
(c)生成不杂交至所述生物体的基因组内的任何区域的随机化的引导序列作为对照引导
(d)制备包含RNA-靶向蛋白和第一抗性基因的质粒,和包含靶向向导的所述文库和所述对照向导和第二抗性基因的引导质粒文库,
(e)共引入所述质粒至宿主细胞中
(f)引入所述宿主细胞在用于所述第一和第二抗性基因的选择培养基上
(g)对生长宿主细胞的必需基因进行测序
(h)通过将细胞的耗竭与对照向导进行比较,确定用靶向向导转化的细胞的耗竭的重要性;和
(i)基于耗竭的引导序列确定对适合的引导序列的需要。
在此类方法的一方面,通过比较在耗竭的细胞中由向导靶向的序列来确定针对RNA靶向蛋白的适合的引导序列的PFS序列。在此类方法的一方面,该方法还包括在不同的重复实验中比较不同条件的向导丰度。在此类方法的一方面,选择控制向导是因为确定它们在重复实验中显示出向导耗竭中的有限偏差。在此类方法的一方面,耗竭的重要性被确定为:(a)比最耗竭的对照向导更多的耗竭;或(b)耗竭大于平均耗竭+对照向导的标准偏差的两倍。在此类方法的一方面,宿主细胞是细菌宿主细胞。在此类方法的一方面,共引入质粒的步骤是通过电穿孔进行的,并且宿主细胞是电感受态宿主细胞。
Cas13b
本发明提供了修饰与目标靶基因座相关或在目标靶基因座处的序列的方法,该方法包括将包含Cas13b效应蛋白和一种或多种核酸组分的非天然存在的或经工程化的组合物递送至所述基因座,其中效应蛋白与一种或多种核酸组分形成复合物,并且在所述复合物与目标基因座结合后,效应蛋白诱导与目标靶基因座相关或在目标靶基因座处的序列的修饰。在一个优选的实施方案中,修饰是引入链断裂。在一个优选的实施方案中,与目标靶基因座相关或在目标靶基因座处的序列包含RNA或由RNA组成。
本发明提供了修饰与目标靶基因座相关或在目标靶基因座处的序列的方法,该方法包括将包含Cas13b效应蛋白、任选小的辅助蛋白以及一种或多种核酸组分的非天然存在的或经工程化的组合物递送至所述基因座,其中效应蛋白与一种或多种核酸组分形成复合物,并且在所述复合物与目标基因座结合后,效应蛋白诱导与目标靶基因座相关或在目标靶基因座处的序列的修饰。在一个优选的实施方案中,修饰是引入链断裂。在一个优选的实施方案中,与目标靶基因座相关或在目标靶基因座处的序列包含RNA或由RNA组成。
本发明提供了修饰与目标靶基因座相关或在目标靶基因座处的序列的方法,该方法包括将包含Cas13b基因座效应蛋白和一种或多种核酸组分的非天然存在的或经工程化的组合物递送到与基因座相关或在基因座处的序列,其中Cas13b效应蛋白与一种或多种核酸组分形成复合物,并且在所述复合物结合至目标基因座后效应蛋白诱导与目标靶基因座相关或在目标靶基因座处的序列的修饰。在一个优选的实施方案中,修饰是引入链断裂。在一个优选的实施方案中,Cas13b效应蛋白与一种核酸组分形成复合物;有利地,经工程化的或非天然存在的核酸组分。与目标靶基因座相关或在目标靶基因座处的序列的修饰的诱导可以是Cas13b效应蛋白-核酸向导的。在一个优选的实施方案中,一种核酸组分是CRISPRRNA(crRNA)。在一个优选的实施方案中,一种核酸组分是成熟crRNA或向导RNA,其中成熟crRNA或向导RNA包含间隔子序列(或向导序列)和正向重复(DR)序列或其衍生物。在一个优选的实施方案中,间隔子序列或其衍生物包含种子序列,其中种子序列对于识别和/或杂交至在靶基因座处的序列是重要的。在本发明的一个优选的实施方案中,crRNA是可与短DR序列缔合的短crRNA。在本发明的另一个实施方案中,crRNA是可与长DR序列(或双重DR)缔合的长crRNA。本发明的各方面涉及具有一种或多种非天然存在的或经工程化的或经修饰的或经优选的核酸组分的Cas13b效应蛋白复合物。在一个优选的实施方案中,核酸组分包含RNA。在一个优选的实施方案中,复合物的核酸组分可包含连接至正向重复序列的引导序列,其中正向重复序列包括一个或多个茎环或经优选的二级结构。在本发明的优选的实施方案中,正向重复可以是短DR或长DR(双重DR)。在一个优选的实施方案中,正向重复可经修饰或包含一种或多种蛋白质结合衔接子。在一个优选的实施方案中,一种或多种衔接子可被包含,诸如经优化的二级结构的部分。此类衔接子可能够结合噬菌体外壳蛋白。噬菌体外壳蛋白可选自包括以下的组:QP、F2、GA、fir、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、Mil、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、4>Cb5、4>Cb8r、4>Cbl2r、4>Cb23r、7s和PRR1。在一个优选的实施方案中,噬菌体外壳蛋白是MS2。本发明还提供了长度为30或更多个、40或更多个或50或更多个核苷酸的复合物的核酸组分。
本发明提供了基因组编辑或修饰与目标靶基因座相关或在目标靶基因座处的序列的方法,其中该方法包括将Cas13b复合物引入任何期望的细胞类型、原核或真核细胞,从而Cas13b效应蛋白复合物有效地起到干扰真核或原核细胞中的RNA的作用。在优选的实施方案中,细胞是真核细胞,并且RNA是从哺乳动物基因组转录的或存在于哺乳动物细胞中。在人细胞中RNA编辑或基因组编辑的优选方法中,Cas13b效应蛋白可以包括但不限于本文公开的Cas13b效应蛋白的特定种类。
本发明还提供了修饰目标靶基因座的方法,该方法包括将包含Cas13b效应蛋白和一种或多种核酸组分的非天然存在的或经工程化的组合物递送至所述基因座,其中Cas13b效应蛋白与一种或多种核酸组分形成复合物,并且当所述复合物与目标基因座结合后,效应蛋白诱导目标靶基因座的修饰。在一个优选的实施方案中,修饰是引入链断裂。
在此类方法中,目标靶基因座可以被包含在RNA分子内。在此类方法中,目标靶基因座可以被体外包含在RNA分子中。
在此类方法中,目标靶基因座可被包含在细胞内的RNA分子中。该细胞可以是原核细胞或真核细胞。该细胞可以是哺乳动物细胞。通过本发明引入细胞的修饰可以使得改变细胞和细胞后代以改善生物产物诸如抗体、淀粉、醇或其他所需细胞输出的产生。通过本发明引入细胞的修饰可以使得细胞和细胞后代包含改变产生的生物产物的改变。
哺乳动物细胞可以是非人类哺乳动物,如灵长类动物、牛科动物、绵羊类动物、猪科动物、犬科动物、啮齿类动物、兔科诸如猴、牛、绵羊、猪、狗、兔、大鼠或小鼠细胞。细胞可以是非哺乳动物真核细胞,诸如禽鸟(如,鸡)、脊椎动物(如,鲑鱼)或贝类(如,牡蛎、白鲑、龙虾、虾)细胞。细胞也可以是植物细胞。植物细胞可以属于单子叶植物或双子叶植物,或属于农作物或谷物植物,诸如木薯、玉米、高粱、大豆、小麦、燕麦或水稻。植物细胞还可以属于藻类、树木或生产植物、水果或蔬菜(如,树诸如柑橘树,如橙、葡萄柚或柠檬树;桃或油桃树;苹果或梨树;坚果树诸如杏仁或胡桃树或开心果树;茄属植物;芸苔属植物;莴苣属植物;菠菜属植物:辣椒属植物,棉花,烟草、芦笋、胡萝卜、白菜、西兰花、花椰菜、番茄、茄子、胡椒、生菜、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等)。
本发明提供了修饰目标靶基因座的方法,该方法包括将包含Cas13b效应蛋白和一种或多种核酸组分的非天然存在的或经工程化的组合物递送至所述基因座,其中效应蛋所述蛋白与一种或多种核酸组分形成复合物,并且在所述复合物与目标基因座结合后,效应蛋白诱导目标靶基因座的修饰。在一个优选的实施方案中,修饰是引入链断裂。
在此类方法中,目标靶基因座可以被包含在RNA分子内。在一个优选的实施方案中,目标靶基因座包含RNA或由RNA组成。
本发明还提供了修饰目标靶基因座的方法,该方法包括将包含Cas13b效应蛋白和一种或多种核酸组分的非天然存在的或经工程化的组合物递送至所述基因座,其中Cas13b效应蛋白与一种或多种核酸组分形成复合物,并且当所述复合物与目标基因座结合后,效应蛋白诱导目标靶基因座的修饰。在一个优选的实施方案中,修饰是引入链断裂。
优选地,在此类方法中,目标靶基因座可以包含在体外的RNA分子中。同样优选地,在此类方法中,目标靶基因座可以包含在细胞内的RNA分子中。细胞可以是原核细胞或真核细胞。细胞可以是哺乳动物细胞。细胞可以是啮齿动物细胞。细胞可以是小鼠细胞。
在所描述的方法中的任何一种中,目标靶基因座可以是目标基因组或表观基因组基因座。在所描述的方法中的任何一种中,复合物可以与多个向导一起递送以供多重使用。在所描述的方法中的任何一种中,可以使用一种以上的蛋白质。
在本发明的其它方面,核酸组分可以包括CRISPR RNA(crRNA)序列。由于效应蛋白是Cas13b效应蛋白,核酸组分可以包括CRISPR RNA(crRNA)序列,并且通常可以不包括任何反式激活crRNA(tracrRNA)序列。
在所描述的方法中的任何一种中,效应蛋白和核酸组分可以通过一种或多种编码蛋白质和/或核酸组分的多核苷酸分子来提供,并且其中所述一种或多种多核苷酸分子被可操作地配置成表达蛋白质和/或核酸组分。一种或多种多核苷酸分子可以包含一种或多种可操作地被配置成表达蛋白质和/或核酸组分的调控元件。一种或多种多核苷酸分子可以包含在一种或多种载体中。在所描述的方法中的任何一种中,目标靶基因座可以是目标基因组、表观基因组或转录组基因座。在所描述的方法中的任何一种中,复合物可以与多个向导一起递送以供多重使用。在所描述的方法中的任何一种中,可以使用一种以上的蛋白质。
在所描述的方法中的任何一种中,链断裂可以是单链断裂或双链断裂。在优选的实施方案中,双链断裂可以指RNA的两部分的断裂,例如当单链RNA分子折叠到自身上时形成的RNA的两部分,或者由含有自互补序列的RNA分子形成的假定双螺旋允许RNA的部分折叠并与其自身配对。
调控元件可以包括诱导型启动子。多核苷酸和/或载体系统可以包括诱导型系统。
在所描述的方法中的任何一种中,一种或多种多核苷酸分子可以包含在递送系统中,或者一种或多种载体可以包含在递送系统中。
在所描述的方法中的任何一种中,非天然存在或工程改造的组合物可以通过脂质体、包含纳米颗粒的颗粒、外泌体、微泡、基因枪或一种或多种病毒载体来递送。
本发明还提供了一种非天然存在的或工程改造的组合物,其是具有如本文所讨论或如本文所描述的方法中的任何一种中所限定的特征的组合物。
因此,在某些实施方案中,本发明提供了非天然存在的或工程改造的组合物,诸如特别是能够或配置成修饰目标靶基因座的组合物,所述组合物包含Cas13b效应蛋白和一种或多种核酸组分,其中效应蛋白与一种或多种核酸组分形成复合物,并且当所述复合物结合到目标基因座时,效应蛋白诱导目标靶基因座的修饰。在某些实施方案中,效应蛋白可以是Cas13b效应蛋白。
在另一个方面,本发明还提供了一种非天然存在的或工程改造的组合物,诸如特别是能够配置成修饰目标靶基因座的组合物,所述组合物包含:(a)向导RNA分子(或向导RNA分子的组合,例如第一向导RNA分子和第二向导RNA分子)或编码向导RNA分子的核酸(或编码向导RNA分子组合的一种或多种核酸);(b)Cas13b效应蛋白。在某些实施方案中,效应蛋白可以是Cas13b效应蛋白。
在另一方面,本发明还提供了一种非天然存在的或工程改造的组合物,其包含:(I.)一种或多种CRISPR-Cas系统多核苷酸序列,其包含(a)能够与多核苷酸基因座中的靶序列杂交的向导序列、(b)tracr配偶体序列、和(c)tracr RNA序列;和(II.)编码Cas13b效应蛋白的第二多核苷酸序列,其中当转录时,tracr配偶体序列与tracrRNA序列杂交,并且向导序列指导CRISPR复合物与靶序列的序列特异性结合,并且其中CRISPR复合物包含与以下序列复合的Cas13b效应蛋白:(1)与靶序列杂交的向导序列和(2)与tracrRNA序列杂交的tracr配偶体序列。在某些实施方案中,效应蛋白可以是Cas13b效应蛋白。
在某些实施方案中,可能不需要tracrRNA。因此,在某些实施方案中,本发明还提供了非天然存在的或工程改造的组合物,其包含:(I.)一种或多种CRISPR-Cas系统多核苷酸序列,其包含(a)能够与多核苷酸基因座中的靶序列杂交的向导序列,和(b)正向重复序列;和(II.)编码Cas13b效应蛋白的第二多核苷酸序列,其中当转录时,向导序列指导CRISPR复合物与靶序列的序列特异性结合,并且其中CRISPR复合物包含与以下序列复合的Cas13b效应蛋白:(1)与靶序列杂交的向导序列,和(2)正向重复序列。优选地,效应蛋白可以是Cas13b效应蛋白。在不受限制的情况下,申请人假设在此类情况下,正向重复序列可以包含足以将crRNA负载到效应蛋白上的二级结构。作为示例而非限制,此类二级结构可以包括正向重复内的茎环(例如一个或多个茎环),基本上由其组成或由其组成。
本发明还提供了包含一种或多种载体的载体系统,所述一种或多种载体包含一种或多种编码非天然存在的或工程改造的组合物的组分的多核苷酸分子,所述组合物是具有如本文所描述的方法中的任何一种中所限定的特征的组合物。
本发明还提供了一种递送系统,其包含一种或多种载体或一种或多种多核苷酸分子,所述一种或多种载体或多核苷酸分子包含编码非天然存在的或工程改造的组合物的组分一种或多种多核苷酸分子,所述组合物是具有如本文所讨论或如本文所描述的方法中的任何一种中所限定的特征的组合物。
本发明还提供了用于治疗的治疗性方法的非天然存在的或工程改造的组合物,或编码所述组合物的组分的一种或多种多核苷酸,或包含编码所述组合物的组分的一种或多种多核苷酸的载体或递送系统。所述治疗的治疗性方法可以包括基因或基因组编辑,或基因疗法。
本发明还提供了方法和组合物,其中效应蛋白的一个或多个氨基酸残基可以被修饰,例如表1蛋白质的工程改造的或非天然存在的Cas13b效应蛋白,或包含表1蛋白质,或由表1蛋白质组成,或基本上由表1蛋白质组成。在一个实施方案中,修饰可以包括效应蛋白的一个或多个氨基酸残基的突变。一个或多个突变可以在效应蛋白的一个或多个催化活性结构域中。与缺乏所述一种或多种突变的效应蛋白相比,效应蛋白可能具有降低或消除的核酸酶活性。效应蛋白可能不指导在目标靶基因座处一条RNA链的裂解。在优选的实施方案中,一种或多种突变可以包括两种突变。在一个优选的实施方案中,在Cas13b效应蛋白中一个或多个氨基酸残基被修饰,例如,工程改造的或非天然存在的Cas13b效应蛋白。在本发明的某些实施方案中,效应蛋白包含一个或多个HEPN结构域。在一个优选的实施方案中,效应蛋白包含两个HEPN结构域。在另一个优选的实施方案中,效应蛋白包含在蛋白质的C端的一个HEPN结构域和在N端的另一个HEPN结构域。在某些实施方案中,一种或多种突变或两种或多种突变可以在效应蛋白的催化活性结构域中,该效应蛋白包含HEPN结构域,或与HEPN结构域同源的催化活性结构域。在某些实施方案中,效应蛋白包含以下突变中的一种或多种:R116A、H121A、R1177A、H1182A(其中氨基酸位置对应于源自动物溃疡伯杰氏菌(Bergeyellazoohelcum)ATCC 43767的第29组蛋白质的氨基酸位置)。技术人员将理解,不同Cas13b蛋白中相应的氨基酸位置可以被突变到相同的效果。在某些实施方案中,一种或多种突变完全或部分消除了蛋白质的催化活性(例如裂解速率改变、特异性改变等)。在某些实施方案中,如本文所述的效应蛋白是“死”效应蛋白,诸如死Cas13b效应蛋白(即d Cas13b)。在在某些实施方案中,效应蛋白具有HEPN结构域1中的一种或多种突变。在某些实施方案中,效应蛋白具有HEPN结构域2中的一种或多种突变。在某些实施方案中,效应蛋白具有HEPN结构域1和HEPN结构域2中的一种或多种突变。效应蛋白可以包含一个或多个异源功能结构域。一个或多个异源功能结构域可以包括一个或多个核定位信号(NLS)结构域。一个或多个异源功能结构域可以包括至少两个或多个NLS结构域。一个或多个NLS结构域可以位于效应蛋白(例如,Cas13b效应蛋白)的末端处或其附近,并且如果是两个或多个NLS,则两个NLS中的每一个都可以位于效应蛋白(例如,Cas13b应蛋白)的末端处或其附近。一个或多个异源功能结构域可以包括一个或多个转录激活结构域。在优选的实施方案中,转录激活结构域可以包含VP64。一个或多个异源功能结构域可以包括一个或多个转录抑制结构域。在一个优选的实施方案中,转录抑制结构域包括KRAB结构域或SID结构域(例如,SID4X)。一个或多个异源功能结构域可以包括一个或多个核酸酶结构域。在一个优选的实施方案中,核酸酶结构域包含Fokl。
本发明还规定一个或多个异源功能结构域具有以下活性中的一种或多种:甲基化酶活性、脱甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、单链RNA裂解活性、双链RNA裂解活性、单链DNA裂解活性、双链DNA裂解活性和核酸结合活性。至少一个或多个异源功能结构域可以在效应蛋白的氨基末端处或其附近和/或其中至少一个或多个异源功能结构域在效应蛋白的羧基末端处或其附近。一个或多个异源功能结构域可以与效应蛋白融合。一个或多个异源功能结构域可以拴系到效应蛋白。一个或多个异源功能结构域可以通过接头部分连接到效应蛋白。
在某些实施方案中,如本文所述的Cas13b效应蛋白可以与包含介于30和40bp长、更通常地介于34和38bp长、甚至更通常地介于36和37bp长,例如30、31、32、33、34、35、36、37、38、39或40bp长的短CRISPR重复的基因座相关联。在某些实施方案中,CRISPR重复是介于80和350bp长的长重复或双重复,诸如介于80和200bp长,甚至更通常地介于86和88bp长,例如,80、81、82、83、84、85、86、87、88、89或90bp长。
在某些实施方案中,前间隔区序列邻近基序(PAM)或PAM样基序指导如本文公开的效应蛋白(例如Cas13b效应蛋白)复合物结合至目标靶基因组。一些实施方案中,PAM可以是5’PAM(即,位于前间隔区序列5’端的上游)。在其它实施方案中,PAM可以是3’PAM(即,位于前间隔区序列5’端的下游)。在其它实施方案中,需要5’PAM和3’PAM两者。在本发明的某些实施方案中,可能不需要PAM或PAM样基序来指导效应蛋白(例如Cas13b效应蛋白)的结合。在某些实方案中,5’PAM是D(即,A、G或U)。在某些实施方案中,5’PAM是用于Cas13b效应蛋白的D。在本发明的某些实施方案中,在重复序列处的裂解可以产生crRNA(例如短或长crRNA),其包含全长间隔区序列,所述全长间隔区序列在5’端侧接短核苷酸(例如5、6、7、8、9或10nt或更长,如果是双重复的话)重复序列(这可以称为crRNA“标签”)和在3’端侧接重复序列的其余部分。在某些实施方案中,由本文所述效应蛋白进行的靶向可能需要在crRNA标签和靶5’侧接序列之间缺乏同源性。这一要求可能类似于Samai等“Co-transcriptionalDNA and RNA Cleavage during Type III CRISPR-Cas Immunity”Cell 161,1164-1174,2015年5月21日中进一步描述的要求,其中该要求被认为是区分来自CRISPR阵列本身的入侵核酸上的真实靶标,并且其中重复序列的存在将导致与CRISPR标签的完全同源性并防止自身免疫。
在某些实施方案中,Cas13b效应蛋白被工程改造并可包含一种或多种减少或消除核酸酶活性的突变,从而减少或消除RNA干扰活性。也可以在邻近残基处进行突变,例如,在参与核酸酶活性的氨基酸附近的氨基酸处。在一些实施方案中,使一个或多个推定的催化核酸酶结构域失活,并且效应蛋白复合物缺乏裂解活性,并作为RNA结合复合物发挥作用。在一个优选的实施方案中,所得的RNA结合复合物可以与如本文所述的一个或多个功能结构域连接。
在某些实施方案中,一个或多个功能结构域是可控的,即可诱导的。
在本发明的某些实施方案中,向导RNA或成熟crRNA包含正向重复序列和向导序列或间隔区序列,基本上由其组成或由其组成。在某些实施方案中,向导RNA或成熟crRNA包含连接至向导序列或间隔区序列的正向重复序列,基本上由其组成或由其组成。在本发明的优选的实施方案中,成熟crRNA包含茎环或优化的茎环结构或优化的二级结构。在优选的实施方案中,成熟crRNA包含正向重复序列中的茎环或优化的茎环结构,其中茎环或优化的茎环结构对于裂解活性很重要。在某些实施方案中,成熟crRNA优选包含单个茎环。在某些实施方案中,正向重复序列优选包含单个茎环。在某些实施方案中,效应蛋白复合物的裂解活性通过引入影响茎环RNA双链体结构的突变来修饰。在优选的实施方案中,可以引入维持茎环RNA双链体的突变,由此维持效应蛋白复合物的裂解活性。在其它优选的实施方案中,可以引入破坏茎环的RNA双链体结构的突变,由此完全消除效应蛋白复合物的裂解活性。
如本文提供的CRISPR系统可以利用包含向导序列的crRNA或类似多核苷酸,其中多核苷酸是RNA、DNA或RNA和DNA的混合物,和/或其中多核苷酸包含一种或多种核苷酸类似物。该序列可以组成任何结构,包括但不限于天然crRNA的结构,例如凸起、发夹或茎环结构。在某些实施方案中,包含向导序列的多核苷酸与第二多核苷酸序列形成双链体,所述第二多核苷酸序列可以是RNA或DNA序列。
在某些实施方案中,该方法利用化学修饰的向导RNA。向导RNA化学修饰的实例包括但不限于,在一个或多个末端核苷酸处掺入2’-O-甲基(M)、2’-O-甲基3’硫代磷酸酯(MS)或2’-O-甲基3’硫代PACE(MSP)。与未修饰的向导RNA相比,这种化学修饰的向导RNA可包含增加的稳定性和增加的活性,尽管中靶相比于脱靶特异性是不可预测的。(参见,Hendel,2015,Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290,2015年6月29日在线发布)。化学修饰的向导RNA还包括但不限于,具有硫代磷酸酯键联和锁核酸(LNA)核苷酸的RNA,所述RAN在核糖环的2’和4’碳之间包含亚甲基桥。
本发明还提供了编码效应蛋白的核苷酸序列,所述核苷酸序列被密码子优化以在真核生物或真核细胞中以本文描述的方法或组合物中的任何一种表达。在本发明的实施方案中,密码子优化的效应蛋白是本文所讨论的任何Cas13b效应蛋白,并且针对真核细胞或生物体中的可操作性进行密码子优化,所述真核细胞或生物体例如如本文其它地方提到的此类细胞或生物体,例如但不限于,酵母细胞或哺乳动物细胞或生物体,包括小鼠细胞、大鼠细胞和人细胞或非人真核生物生物体,例如植物。
在本发明的某些实施方案中,将至少一个核定位信号(NLS)附接至编码Cas13b效应蛋白的核酸序列上。在优选的实施方案中,附接至少一个或多个C末端或N末端NLS(因此编码Cas13b效应蛋白的核酸分子可以包括编码NLS,使得表达的产物具有附接或连接的NLS)。在优选的实施方案中,对于在真核细胞,优选人细胞中最佳表达和核靶向,附接C末端NLS。本发明还涵盖用于递送多种核酸组分的方法,其中每种核酸组分对不同的目标靶基因座具有特异性,从而修饰多个目标靶基因座。复合物的核酸组分可以包括一种或多种蛋白质结合核酸适体。一种或多种适体能够结合噬菌体外壳蛋白。噬菌体外壳蛋白可选自包括以下的组:Qβ、F2,、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M1l、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCbl2r、φCb23r、7s和PRR1。在优选的实施方案中,噬菌体外壳蛋白是MS2。本发明还提供了长度为30个或更多、40个或更多或50个或更多核苷酸的复合物的核酸组分。
在另一方面,本发明提供了包含修饰的目标靶基因座的真核细胞,其中目标靶基因座已经根据本文所述方法中的任何一种进行了修饰。另一方面提供了所述细胞的细胞系。另一方面提供了包含一种或多种所述细胞的多细胞生物。
在某些实施方案中,目标靶基因座的修饰可导致:真核细胞包含至少一种基因产物的表达改变;真核细胞包含至少一种基因产物的表达改变,其中至少一种基因产物的表达增加;真核细胞包含至少一种基因产物的表达改变,其中所述至少一种基因产物的表达减少;或者真核细胞包含编辑的基因组。
在某些实施方案中,真核细胞可以是哺乳动物细胞或人细胞。
在进一步的实施方案中,如本说明书中描述的非天然存在或工程改造的组合物、载体系统或递送系统可用于:位点特异性基因敲除;位点特异性基因组编辑;RNA序列特异性干扰;或者多重基因组工程改造。
还提供了来自如本文所述的细胞、细胞系或生物体的基因产物。在某些实施方案中,表达的基因产物的量可以大于或小于来自没有改变的表达或编辑的基因组的细胞的基因产物的量。在某些实施方案中,与来自没有改变的表达或编辑的基因组的细胞的基因产物相比,基因产物可以被改变。
在另一个方面,本发明提供了用于识别新型核酸修饰效应物的方法,其包括:从编码推定的核酸修饰酶基因座的一组核酸序列中识别推定的核酸修饰基因座,所述推定的核酸修饰酶基因座距离基因座的保守基因组元件在限定的距离内,所述基因座包含至少一种超过限定大小限制的蛋白质,或者两者都包含;将所识别的推定的核酸修饰基因座分组为包含同源蛋白质的子组;通过基于以下中的一项或多项从一个或多个子组选择核酸修饰基因座来识别候选核酸修饰基因座的最终组:包含具有相对于其它子组中的基因座与已知蛋白质结构域具有低结构域同源性的推定效应蛋白的基因座的子组;包含相对于其它子组中的基因座与保守基因组元件具有最小距离的推定蛋白质的子组;具有与相对于其它子组中的大效应蛋白具有与推定的相邻辅助蛋白相同的取向的大效应蛋白的基因座的子组;包含相对于其它基因座具有较低现有核酸修饰分类的推定的效应蛋白的子组;包含相对于其它子组与已知核酸修饰基因座具有较低接近度的基因座;以及每个子组中候选基因座的总数。
在一个实施方案中,该核酸序列的组从基因组或宏基因组数据库中获得,例如包含原核基因组或宏基因组序列的基因组或宏基因组数据库。
在一个实施方案中,距离保守基因组元件的限定距离介于1kb和25kb之间。
在一个实施方案中,保守基因组元件包括重复元件,例如CRISPR阵列。在特定的实施方案中,距离保守基因组元件的限定距离在CRISPR阵列的10kb以内。
在一个实施方案中,包含在推定的核酸修饰(效应物)基因座内的蛋白质的限定大小限制大于200个氨基酸,或者更具体地,限定大小限制大于700个氨基酸。在一个实施方案中,推定的核酸修饰基因座介于900至1800个氨基酸之间。
在一个实施方案中,使用核酸组的重复或模式发现分析(诸如PILER-CR)来识别保守基因组元件。
在一个实施方案中,本文所述方法的分组步骤至少部分基于结构域同源性搜索或HHpred蛋白结构域同源性搜索的结果。
在一个实施方案中,限定的阈值是0至le-7的BLAST最近邻截止值。
在一个实施方案中,本文描述的方法进一步包括过滤步骤,该步骤仅包括具有介于900和1800个氨基酸之间的推定蛋白质的基因座。
在一个实施方案中,本文描述的方法进一步包括候选核酸修饰效应物的核酸修饰功能的实验验证,包括产生一组编码核酸修饰效应物的核酸构建体,并进行一种或多种生物化学验证测定,例如通过在菌落中使用PAM验证、体外裂解测定、检验方法、哺乳动物细胞中的实验、PFS验证或其组合。
在一个实施方案中,本文描述的方法进一步包括制备非天然存在的或工程改造的组合物,所述组合物包含来自所识别的核酸修饰基因座的一种或多种蛋白质。
在一个实施方案中,所识别的基因座包含2类CRISPR效应物,或者所识别的基因座缺少Casl或Cas2,或者所识别的基因座包含单个效应物。
在一个实施方案中,单个大效应蛋白长度大于900个或大于1100个氨基酸,或者包含至少一个HEPN结构域。
在一个实施方案中,至少一个HEPN结构域在效应蛋白的N或C末端附近,或者位于效应蛋白的内部位置。
在一个实施方案中,单个大效应蛋白包含在蛋白质的N和C末端的HEPN结构域,和在蛋白内部的两个HEPN结构域。
在一个实施方案中,所识别的基因座还包含CRISPR阵列的2kb至10kb内的一个或两个推定的小辅助蛋白。
在一个实施方案中,小辅助蛋白小于700个氨基酸。在一个实施方案中,小辅助蛋白的长度为50至300个氨基酸。
在一个实施方案中,小辅助蛋白包含多个预测的跨膜结构域,或包含四个预测的跨膜结构域,或包含至少一个HEPN结构域。
在一个实施方案中,小辅助蛋白包含至少一个HEPN结构域和至少一个跨膜结构域。
在一个实施方案中,基因座不包含来自CRISPR阵列的25kb以外的额外蛋白质。
在一个实施方案中,CRISPR阵列包含含有长度为约36个核苷酸的正向重复序列。在一个具体实施方案中,正向重复包含5’端处的GTTG/GUUG,其与位于3’端处的CAAC反向互补。
在一个实施方案中,CRISPR阵列包含含有长度为约30个核苷酸的间隔区序列。
在一个实施方案中,识别的基因座缺乏小辅助蛋白。
本发明提供了一种识别新型CRISPR效应物的方法,其包括:a)识别编码CRISPR阵列的基因组或宏基因组数据库中的序列;b)在CRISPR阵列的10kb内识别所述选定序列中的一个或多个开放阅读框(ORF);c)基于大小介于900-1800个氨基酸之间的推定CRISPR效应蛋白的存在选择基因座,d)选择编码50-300个氨基酸的推定辅助蛋白的基因座;和e)识别编码推定CRISPR效应物和CRISPR辅助蛋白的基因座,并且任选地基于结构分析对它们进行分类。
在一个实施方案中,CRISPR效应物是VI型CRISPR效应物。在一个实施方案中,步骤(a)包括i)将基因组和/或宏基因组数据库中的序列与编码CRISPR阵列的至少一个预先识别的种子序列进行比较,并选择包含所述种子序列的序列;或者ii)基于CRISPR算法识别CRISPR阵列。
在一个实施方案中,步骤(d)包括识别核酸酶结构域。在一个实施方案中,步骤(d)包括识别RuvC、HPN和/或HEPN结构域。
在一个实施方案中,在CRISPR阵列的10kb内不存在编码Casl或Cas2的ORF。
在一个实施方案中,步骤(b)中的ORF编码50-300个氨基酸的推定辅助蛋白。
在一个实施方案中,将步骤(d)中获得的推定的新型CRISPR效应物用作种子序列,用于进一步比较基因组和/或宏基因组序列,并随后选择如权利要求1的步骤a)至d)中所述的目标基因座。在一个实施方案中,通过包括以下的方法获得预先识别的种子序列:(a)在基因组或宏基因组数据库中识别CRISPR基序,(b)在所述识别的CRISPR基序中提取多个特征,(c)使用无监督学习对CRISPR基因座进行分类,(d)基于所述分类识别保守基因座元件,以及(e)从中选择适合作为种子序列的推定CRISPR效应物。
在一个实施方案中,特征包括蛋白质元件、重复结构、重复序列、间隔区序列和间隔区图谱。在一个实施方案中,基因组和宏基因组数据库是细菌和/或古细菌基因组。在一个实施方案中,基因组和宏基因组序列从Ensembl和/或NCBI基因组数据库获得。在一个实施方案中,步骤(d)中的结构分析基于二级结构预测和/或序列比对。在一个实施方案中,步骤(d)通过基于剩余基因座编码的蛋白质对其进行聚类和对所获得的聚类进行人工推荐(manual curation)来实现的。
因此,本发明的一个目的不是在本发明中包括任何先前已知的产品、制造该产品的工艺或使用该产品的方法,从而申请人保留权利,并在此公开对任何先前已知的产品、工艺或方法的免责声明。还应注意的是,本发明不打算在本发明的范围内包括不符合USPTO(35 U.S.C.§112,第一段)或EPO(EPC第83条)的书面描述和启用要求的任何产品、工艺或产品的制造或产品的使用方法,因此申请人保留权利,并在此公开对任何先前描述的产品、产品的制造工艺或产品的使用方法的免责声明。在本发明的实践中,可能有利的是符合EPC第53(c)条和EPC细则第28(b)和(c)条。本文的任何内容都不能被解释为承诺。
应当注意,在本公开中,并且特别是在权利要求和/或段落中,诸如“包含(comprises)”、“包含(comprised)”、“包含(comprising)”等术语可以具有美国专利法赋予它的含义;例如,它们可以指“包括(includes)”、“包括(included)”、“包括(including)”等;并且诸如“基本上由……组成(consisting essentially of)”和“基本上由……组成(consists essentially of)”之类的术语具有美国专利法赋予它们的含义,例如,它们允许没有明确列举的元件,但是排除了现有技术中存在的或影响本发明的基本或新颖特征的元件。
公开这些和其它实施方案,或者其从以下详细描述中显而易见并涵盖在以下详细描述中。
附图说明
本发明的新颖特征在所附权利要求书中特别提出。通过参考阐述了其中利用了本发明原理的说明性实施方案的以下详细说明及其附图,将获得对本发明的特征和优点更好的理解:
图1A至图1B示出了Cas13b直向同源物的树比对。
图2A至图2C示出了C2c2和Cas13b直向同源物的树比对。
图3示出了测试Cas13b直向同源物在大肠杆菌(E.Coli)中的活性的示例性结果,由此将来自动物溃疡伯杰氏菌(B.zoohelcum)的Cas13b的引入与空载体的引入进行了比较。
图4示出了使用表1的不同直向同源物获得的特异性RNA切割活性的一般比较。
图5示出了如在图1和图2中提供的不同Cas13b直向同源物的比对。
图6A至图6B(A)示出了用于测试RNA干扰并鉴定PFS的MS2噬菌体滴噬斑测定的原间隔区序列设计。(B)示出了RNA干扰测定示意图。将靶序列置于赋予氨苄青霉素抗性的转录bla基因的起始位置处的框内,或者置于同一靶标质粒相反链上的非转录区中。将靶标质粒与bzCas13b质粒或赋予氯霉素抗性的空载体共转化,并铺板在双选择抗生素板上。鉴定出耗尽的菌落,并对相应的靶标进行测序以鉴定PFS。
图7示出了在不存在和存在csx27辅助蛋白的情况下来自直向同源物1、13和16的安全耗尽间隔子的归一化PFS得分的热图。
图8示出了在不存在和存在csx28辅助蛋白的情况下来自直向同源物2、3、8、9、14、19和21的安全耗尽间隔子的归一化PFS得分的热图。图9示出了来自直向同源物5、6、7、10、12和15的安全耗尽间隔子的归一化PFS得分的热图。
图10A至图10BB示出了来自不同直向同源物的安全耗尽间隔子的归一化PFS得分和推导的PFS的热图。
图11提供了使用测试的指导序列在哺乳动物细胞中具有较低活性的Cas13b直向同源物的萤光素酶干扰数据的概述。
图12提供了使用测试的指导序列在哺乳动物细胞中显示出低至中等活性的Cas13b直向同源物的萤光素酶干扰数据的概述。
图13提供了使用测试的指导序列在哺乳动物细胞中显示出显著活性的Cas13b直向同源物的萤光素酶干扰数据的概述。
图14A至图14B提供了使用测试的指导序列在哺乳动物细胞中显示出显著活性的一些Cas13b直向同源物的萤光素酶干扰数据的概述。
图15提供了使用测试的指导序列在哺乳动物细胞中显示出显著活性的Cas13b直向同源物的萤光素酶干扰数据的概述以及与C2c2活性的比较。
图16示出了使用相同指导序列在真核细胞中具有显著活性的直向同源物的复合数据。
图17A至图17G示出了使用两种不同报告基因(G-萤光素酶和C-萤光素酶)在哺乳动物细胞中Cas13b直向同源物的旁系效应。
图18示出了针对RNA敲低对高活性Cas13b直向同源物的表征。A)常规Cas13基因座和相应的crRNA结构的示意图。B)使用两种不同指导序列评估19个Cas13a、15个Cas13b和7个Cas13c直向同源物的萤光素酶敲低。将使用两种指导序列具有有效敲低的直向同源物标记上其宿主生物体名称。C)通过针对Gluc平铺指导序列并测量萤光素酶表达来比较PspCas13b和LwaCasl3a敲低活性。D)通过针对Clue平铺指导序列并测量萤光素酶表达来比较PspCas13b和LwaCasl3a敲低活性。E)针对LwaCasl3a(红色)和shRNA(黑色)在非靶向对照(x轴)对比Gluc靶向条件(y轴)的RNA-seq文库中检测到的所有基因的以log2(每百万的转录物(TPM))值计的表达水平。显示的是三个生物学重复的平均值。标记了Gluc转录物数据点。F)针对PspCas13b(蓝色)和shRNA(黑色)在非靶向对照(x轴)对比Gluc靶向条件(y轴)的RNA-seq文库中检测到的所有基因的以log2(每百万的转录物(TPM))值计的表达水平。显示的是三个生物学重复的平均值。标记了Gluc转录物数据点。G)根据E和F中的转录组范围分析从LwaCasl3a、PspCas13b和shRNA的Gluc敲低显著脱靶的数量。
图19示出了用于RNA编辑的工程化dCas13b-ADAR融合物。A)通过dCas13b-ADAR融合蛋白进行RNA编辑的示意图。B)海萤属(Cypridina)萤光素酶W85X靶标和靶向指导序列设计的示意图。C)使用长度为30、50、70或84nt的平铺指导序列的Cas13b-dADARl(左)和Cas13b-ADAR2-cd(右)的萤光素酶活性恢复的定量。D)用于靶向海萤属(Cypridina)萤光素酶W85X的靶标位点的示意图。E)靶向海萤属(Cypridina)萤光素酶W85X的50nt指导序列的A->I编辑的测序定量。
图20示出了通过REPAIRvl进行RNA编辑的测量序列灵活性。A)筛选确定通过REPAIRvl进行RNA编辑的原间隔区侧接位点(PFS)偏好的示意图。B)在两个不同编辑位点上所有4-N PFS组合的RNA编辑效率的分布。C)在所有可能的3碱基基序中在Clue W85处REPAIRvl编辑百分比的定量。D)针对所有可能的3碱基基序在ClueW85处进行RNA编辑的5'和3'碱基偏好的热图。
图21示出了使用REPAIRvl对疾病相关突变的校正。A)用于靶向AVPR2'N/'&G>N的靶标和指导序列设计的示意图。B)使用具有三种不同指导序列设计的REPAIRvl以不同的百分比校正了AVPR2中的878G>A突变。C)用于靶向FANCC 1517G>A的靶标和指导序列设计的示意图。D)使用具有三种不同指导序列设计的REPAIRvl以不同的百分比校正了FANCC中的1517G>A突变。E)使用REPAIRvl对34种不同的疾病相关G>A突变的编辑百分比的定量。F)如通过ClinVar数据库所注释可以被校正的所有可能的G>A突变的分析。G)相对于如在Gluc转录物上定量的每基序而言的REPAIRvl的编辑效率,显示了ClinVar中所有G>A突变的编辑基序的分布。
图22示出了REPAIRvl的表征特异性。A)KRAS靶标位点和指导序列设计的示意图。B)平铺A7MS'-靶向指导序列的编辑百分比的定量。在中靶和附近的腺苷酸位点显示了编辑百分比。对于每种指导序列,双链体RNA的区域由红色矩形表示。C)用Clue靶向指导序列通过REPAIRvl的转录组范围的重要RNA编辑位点。中靶位点Clue位点(254A>G)以橙色突出显示。D)用非靶向指导序列通过REPAIRvl的转录组范围的重要RNA编辑位点。
图23示出了为了改善REPAIRvl的特异性对ADAR2的合理诱变。A)沿着关键ADAR2脱氨酶残基与dsRNA靶标之间的接触示意图绘制的通过各种dCasl3-ADAR2突变体对萤光素酶信号恢复的定量及其特异性得分。特异性得分被定义为在靶向指导序列与非靶向指导序列条件之间的萤光素酶信号的比率。B)通过各种dCasl3-ADAR2突变体对萤光素酶信号恢复的定量与其特异性得分。C)通过mRNA的转录组范围测序测量每个dCasl3-ADAR2突变体的中靶编辑分数以及显著脱靶的数量。D)使用靶向Clue中的预终止位点的指导序列通过REPAIRvl和REPAIRv2的转录组范围的重要RNA编辑位点。中靶Clue位点(254A>G)以橙色突出显示。E)围绕中靶Clue编辑位点(254A>G)的RNA测序读数突出显示了REPAIRvl与REPAIRv2之间的脱靶编辑的差异。所有A>G编辑均以红色突出显示,而测序错误均以蓝色突出显示。F)使用靶向在内源性KRAS和PPIB转录物中的框外UAG位点的指导序列通过REPAIRvl和REPAIRv2进行的RNA编辑。在每个条件行的右侧,将中靶编辑分数显示为横向条形图。由指导RNA形成的双链体区域由红色轮廓框显示。
图24示出了针对体内效率对Cas13b直向同源物的细菌筛选和PFS确定。A)用于确定Cas13b直向同源物的PFS的细菌测定的示意图。具有β-内酰胺酶靶向间隔子的Cas13b直向同源物与β-内酰胺酶表达质粒共转化并进行双选择。B)如通过菌落形成单位(cfu)所测量的靶向β-内酰胺酶的Cas13b直向同源物的干扰活性的定量。C)如通过耗尽序列从细菌测定中所确定的Cas13b直向同源物的PFS标识。
图25示出了Cas13b敲低的优化和错配特异性的进一步表征。A)使用与各种核定位和核输出标签融合的前2个Cas13a和前4个Cas13b直向同源物来测量使用两种不同指导序列的的Gluc敲低。B)用四种不同指导序列对LwaCasl3a、RanCas13b、PguCas13b和PspCas13b测量KRAS敲低,并将其与四个位置匹配的shRNA对照进行比较。C)用于评价LwaCasl3a和PspCas13b敲低的特异性的单错配和双错配质粒文库的示意图。每个可能的单错配和双错配都存在于靶序列中以及靶位点5'端和3'端侧翼的3个位置中。D)将具有指示的单错配的转录物的耗尽水平绘制为LwaCasl3a和PspCas13b条件的热图。E)将具有指示的双错配的转录物的耗尽水平绘制为LwaCasl3a和PspCas13b条件的热图。
图26示出了用于dCasl3-ADAR2 RNA编辑的设计参数的表征。A)靶向野生型Cas13b和催化失活的H133A/H1058A Cas13b(dCas13b)的Gluc的敲低效率。B)通过与野生型ADAR2催化结构域或高活性E488Q突变型ADAR2催化催化结构域融合的dCas13b使用平铺Clue靶向指导序列测试的萤光素酶活性恢复的定量。C)靶向海萤属萤光素酶W85X的30nt指导序列的A->I编辑的指导序列设计和测序定量。D)靶向PPIB的50nt指导序列的A->I编辑的指导序列设计和测序定量。E)接头选择对REPAIRvl的萤光素酶活性恢复的影响。F)靶向腺苷酸对面的碱基识别对REPAIRvl的萤光素酶活性恢复的影响。
图27示出了G>A突变的clinVar基序分布。对于所有G>A突变在ClinVar数据库中观察到的每个可能的三联体基序的数量。
图28A至图28B示出了通过dCas13b截短的RNA结合。描绘了dCas13b的各种N末端和C末端截短。通过萤光素酶信号的恢复、比较使用靶向和非靶向指导序列的活性所测量的,在存在ADAR依赖性RNA编辑的情况下指示RNA结合。氨基酸位置对应于普雷沃菌属物种P5-125 Cas13b蛋白的氨基酸位置。
图29示出了其他可编程的ADAR系统与dCasl3-ADAR2编辑器的比较。A)两种可编程的ADAR方案的示意图:基于BoxB的靶向和全长ADAR2靶向。在BoxB方案中(顶图),ADAR2脱氨酶结构域(ADAR2DD(E488Q))融合至称为λN(AN)的小细菌病毒蛋白,其特异性地结合称为BoxB-^t的小RNA序列。然后,含有两个BoxB-A发夹的指导RNA可以指导ADAR2DD(E488Q),-XN进行位点特异性编辑。在全长ADAR2方案中(底图),ADAR2的dsRNA结合结构域结合指导RNA中的发夹,从而允许可编程的ADAR2编辑。B)使用靶向Clue的指导序列和非靶向指导序列通过BoxB-ADAR2DD(E488Q)的转录组范围的重要RNA编辑位点。中靶Clue位点(254A>G)以橙色突出显示。C)使用靶向Clue的指导序列和非靶向指导序列通过ADAR2的转录组范围的重要RNA编辑位点。中靶Clue位点(254A>G)以橙色突出显示。D)使用靶向Clue的指导序列和非靶向指导序列通过REPAIRvl的转录组范围的重要RNA编辑位点。中靶Clue位点(254A>G)以橙色突出显示。E)对于针对Cluc的靶向指导序列,BoxB-ADAR2DD(E488Q)、ADAR2、和REPAIRvl的中靶编辑率百分比的定量。F)可编程的ADAR系统在不同靶向和非靶向条件之间的脱靶位点的重叠。
图30示出了dCas13b-ADAR2突变体的效率和特异性。A)对于Clue靶向和非靶向指导序列通过dCas13b-ADAR2DD(E488Q)突变体的萤光素酶活性恢复的定量。B)
在靶向和非靶向指导序列的比率与RNA编辑脱靶的数量之间的关系,如通过转录组范围内的测序定量的。C)对于dCas13b-ADAR2DD(E488Q)突变体,转录组范围脱靶RNA编辑位点数量与中靶Clue编辑效率的定量。
图31示出了dCas13b-ADAR2DD(E488Q)突变体的RNA编辑的转录组范围特异性。A)使用靶向Clue的指导序列通过dCas13b-ADAR2DD(E488Q)突变体的转录组范围的重要RNA编辑位点。中靶Clue位点(254A>G)以橙色突出显示。B)使用非靶向指导序列通过dCas13b-ADAR2DD(E488Q)突变体的转录组范围的重要RNA编辑位点。
图32示出了在dCas13b-ADAR2DD(E488Q)编辑的脱靶中的基序偏倚的表征。A)对于每个dCas13b-ADAR2DD(E488Q)突变体,示出了转录组中所有A>G脱靶编辑中存在的基序。B)针对使用靶向和非靶向指导序列的REPAIRvl,示出了每基序身份的脱靶A>G编辑的分布。C)针对使用靶向和非靶向指导序列的REPAIRv2,示出了每基序身份的脱靶A>G编辑的分布。
图33示出了REPAIRvl和REPAIRv2脱靶的进一步表征。A)对于REPAIRvl每转录物的脱靶数量的直方图。B)对于REPAIRv2每转录物的脱靶数量的直方图。C)REPAIRvl脱靶的变体效果预测。D)REPAIRvl脱靶的潜在致癌效果的分布。E)REPAIRv2脱靶的变体效果预测。F)REPAIRv2脱靶的潜在致癌效果的分布。
图34示出了REPAIRvl和REPAIRv2的RNA编辑效率和特异性。A)对于REPAIRvl和REPAIRv2在靶向腺苷酸及邻近位点处使用AXES'-靶向指导序列1的情况下KRAS的编辑百分比的定量。B)对于REPAIRvl和REPAIRv2在靶向腺苷酸及邻近位点处使用AXAS'-靶向指导序列3的情况下KRAS的编辑百分比的定量。C)对于REPAIRvl和REPAIRv2在靶向腺苷酸及邻近位点处使用/X/7>-靶向指导序列2的情况下PPIB的编辑百分比的定量。
图35示出了使用A>G RNA编辑器对所有潜在密码子变化的展示。A)通过A>I编辑启用的所有潜在密码子转换表。B)展示了通过A>I编辑启用的所有潜在密码子转换的密码子表。C)
图36A至图36B示出了Csx蛋白对RNA干扰的作用。A)Cas13b和Cas13b+Csx27的比较;B)Cas13b和Cas13b+Csx28的比较。
图37A至图37F示出了经由萤光素酶测定比较了通过Cas13b和Cas13b+Csx28的转录物敲低。A)Pin Cas13b(WP_036860899);B)Pbu Cas13b(WP_004343973);C)Rin Cas13b(WP_004919755);D)Pau Cas13b(WP025000926);E)Pgu Cas13b(WP_039434803);F)PigCas13b(WP_053444417)
本文的附图仅用于说明目的,并且不必按比例绘制。
具体实施方案
一般来说,CRISPR-Cas或CRISPR系统共同地指代CRISPR相关的(“Cas”)基因的表达中所涉及或引导所述基因的活性的转录物和其它元件,包括编码Cas基因的序列、tracr(反式活化CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(在内源CRISPR系统的情形下涵盖“正向重复”和tracrRNA加工的部分正向重复)、指导序列(在内源CRISPR系统的情形下也称作“间隔区”),或如本文所用的那个术语“一种或多种RNA”(例如用以指导Cas(诸如Cas9)的一种或多种RNA,例如CRISPR RNA和反式活化(tracr)RNA或单指导RNA(sgRNA)(嵌合RNA)),或来自CRISPR基因座的其它序列和转录物。一般来说,CRISPR系统由促进在靶序列位点处CRISPR复合物形成的元件(在内源CRISPR系统的情形中也称作原间隔区)表征。当CRISPR蛋白是2类VI-B型效应子时,不需要tracrRNA。在本发明的工程化系统中,正向重复可涵盖天然存在的序列或非天然存在的序列。本发明的正向重复不限于天然存在的长度和序列。正向重复的长度可以是36nt,但是正向重复可以变化为更长或更短。例如,正向重复可以为30nt或更长,诸如30-100nt或更长。例如,正向重复的长度可以为30nt、40nt、50nt、60nt、70nt、70nt、80nt、90nt、100nt或更长。在一些实施方案中,本发明的正向重复可以包括插入在天然存在的正向重复序列的5'末端与3'末端之间的合成核苷酸序列。在某些实施方案中,插入序列可以是自身互补的,例如20%、30%、40%、50%、60%、70%、80%、90%或100%自身互补的。
此外,本发明的正向重复可以包括核苷酸插入,诸如适体或与衔接蛋白结合(以便与功能结构域缔合)的序列。在某些实施方案中,包含此类插入的正向重复的一端为短DR的大致第一半部,并且该端为短DR的大致第二半部。
在形成CRISPR复合物的情形下,“靶序列”是指指导序列被设计成与其具有互补性的序列,其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含任何多核苷酸,诸如DNA或RNA多核苷酸。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。在一些实施方案中,可以通过搜索满足以下标准中的任一项或所有标准的重复基序,而经由计算机模拟(in silico)鉴定正向重复:1.存在于II型CRISPR基因座侧翼的基因组序列的2Kb窗口中;2.跨度为20到50bp;以及3.间隔20到50bp。在一些实施方案中,可以使用这些标准中的2个,例如1和2、2和3,或1和3。在一些实施方案中,可以使用所有3个标准。
在本发明的实施方案中,术语指导序列和指导RNA,即能够将Cas13b效应蛋白引导到靶基因座的RNA,可如在本文引用的文献诸如WO 2014/093622(PCT/US2013/074667)中互换使用。通常,指导序列(或间隔序列)是这样的任何多核苷酸序列,所述多核苷酸序列与靶多核苷酸序列具有足够互补性以与靶序列杂交并且引导CRISPR复合物与靶序列的序列特异性结合。在一些实施方案中,当使用适合的比对算法最佳比对时,指导序列与其相应靶序列之间的互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可以借助于用于比对序列的任何适合算法来确定,所述适合算法的非限制性示例包括史密斯-沃特曼算法(Smith-Waterman algorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒比对仪(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies;在www.novocraft.com上可得)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可得)和Maq(在maq.sourceforge.net上可得)。在一些实施方案中,指导序列(或间隔序列)的长度为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多核苷酸。在一些实施方案中,指导序列的长度小于约75、50、45、40、35、30、25、20、15、12个或更少核苷酸。优选地,指导序列是10-40个核苷酸长,诸如20-30或20-40个核苷酸长或更长,诸如30个核苷酸长或约30个核苷酸长。在某些实施方案中,对于Cas13b效应子,指导序列为10-30个核苷酸长,诸如20-30或20-40个核苷酸长或更长,诸如30个核苷酸长或约30个核苷酸长。在某些实施方案中,指导序列是10-30个核苷酸长,诸如20-30个核苷酸长,诸如30个核苷酸长。向导序列引导CRISPR复合物序列特异性结合至靶序列的能力可以通过任何适合的测定来评价。举例来说,足以形成CRISPR复合物的CRISPR系统的组分,包括待测试的指导序列,可以提供给具有相应靶序列的宿主细胞,诸如通过用编码CRISPR序列的组分的载体转染,之后评定靶序列内的优先裂解,诸如通过如本文所述的Surveyor测定。类似地,可以在试管中通过提供靶序列、CRISPR复合物的组分(包括待测试的指导序列和不同于测试指导序列的对照指导序列),以及在测试与对照指导序列反应之间对靶序列处的结合或裂解速率进行比较,来评估靶多核苷酸序列的裂解。其它测定是可能的,并且将为本领域技术人员所想到。
本发明提供了特定的Cas13b效应子、核酸、系统、载体和使用方法。所有VI-B都是通过结构以及还通过HEPN结构域的位置而可与VI-A(Cas13b)区分的。几乎没有可能将缺少小辅助蛋白的Cas13b与具有小辅助蛋白的Cas13b分开,不同之处是VI-B2基因座看起来具有更加保守的小辅助蛋白。
如本文所用,术语Cas13b-sl辅助蛋白、Cas13b-sl蛋白、Cas13b-sl、Csx27和Csx27蛋白可互换使用,并且术语Cas13b-s2辅助蛋白、Cas13b-s2蛋白、Cas13b-S2、Csx28和Csx28蛋白可互换使用。
在经典的CRISPR-Cas系统中,指导序列与其相应靶序列之间的互补程度可以为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或100%;指导物或RNA或crRNA的长度可以为约或大于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多个核苷酸;或者指导物或RNA或crRNA的长度可以小于约75、50、45、40、35、30、25、20、15、12个或更少个核苷酸;并且有利地tracr RNA的长度为30或50个核苷酸。然而,本发明的一个方面是减少脱靶相互作用,例如,减少指导物与具有低互补性的靶序列相互作用。确实,在示例中显示,本发明涉及使得CRISPR-Cas系统能够区分靶序列与具有大于80%至约95%互补性,例如83%-84%或88-89%或94-95%互补性的脱靶序列(例如,区分具有18个核苷酸的靶标与具有1个、2个或3个错配的18个核苷酸的脱靶)的突变。因此,在本发明的情形下,指导序列与其相应靶序列之间的互补程度大于94.5%或95%或95.5%或96%或96.5%或97%或97.5%或98%或98.5%或99%或99.5%或99.9%,或100%。脱靶小于100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%或94%或93%或92%或91%或90%或89%或88%或87%或86%或85%或84%或83%或82%或81%或80%的序列与指导物之间的互补性,有利的是,脱靶为100%或99.9%或99.5%或99%或99%或98.5%或98%或97.5%或97%或96.5%或96%或95.5%或95%或94.5%的序列与指导物之间的互补性。
在根据本发明的特别优选的实施方案中,指导RNA(能够将Cas引导至靶基因座)可以包含(1)能够与真核细胞中的靶基因座(多核苷酸靶基因座,诸如RNA靶基因座)杂交的指导序列;(2)正向重复(DR)序列),其位于单个RNA中,即sgRNA(以5'至3'取向布置)或crRNA。
在特定实施方案中,野生型Cas13b效应蛋白具有RNA结合和切割功能。
在特定实施方案中,Cas13b效应蛋白可以具有DNA切割功能。在这些实施方案中,可以基于本文提供的效应蛋白来提供方法,所述方法涵盖在如本文所论述的真核细胞中(在体外,即在分离的真核细胞中)诱导一个或多个突变,所述方法包括向细胞递送如本文所论述的载体。一个或多个突变可以包括经由一个或多个指导RNA或sgRNA或crRNA在细胞的每个靶序列处一个或多个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA或sgRNA或crRNA在所述一个或多个细胞的每个靶序列处1-75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA或sgRNA或crRNA在所述一个或多个细胞的每个靶序列处1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA或sgRNA或crRNA在所述一个或多个细胞的每个靶序列处5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变包括经由一个或多个指导RNA或sgRNA或crRNA在所述一个或多个细胞的每个靶序列处10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA或sgRNA或crRNA在所述一个或多个细胞的每个靶序列处20、21、22、23、24、25、26、27、28、29、30、35、40、45、50或75个核苷酸的引入、缺失或取代。突变可以包括经由一个或多个指导RNA或sgRNA或crRNA在所述一个或多个细胞的每个靶序列处40、45、50、75、100、200、300、400或500个核苷酸的引入、缺失或取代。
为了最小化毒性和脱靶效应,将为重要的是控制所递送的Cas13b mRNA和指导RNA的浓度。可通过在细胞或非人真核生物动物模型中测试不同浓度并使用深度测序分析潜在脱靶基因组基因座的修饰程度来确定Cas13b mRNA和指导RNA的最佳浓度。或者,为了使毒性水平和脱靶效应最小化,可以将Cas13b切口酶mRNA(例如具有D10A突变的化脓链球菌Cas9)与靶向感兴趣的位点的一对指导RNA一起递送。用于使毒性和脱靶效应最小化的指导序列和策略可以如在WO 2014/093622(PCT/US2013/074667)中;或通过如本文中的突变。
通常,在内源CRISPR系统的情形下,CRISPR复合物(包含杂交至靶序列并与一种或多种Cas蛋白复合的指导序列)的形成使得靶序列中或附近(例如距其1、2、3、4、5、6、7、8、9、10、20、50个或更多个碱基对以内)的一条或两条链(如果适用的话)裂解。
编码Cas13b的核酸分子有利地为密码子优化的。在这种情况下,密码子优化的序列的一个示例是对于在真核生物(例如人(即,对于在人中表达而优化),或对于如本文所论述的另一种真核生物、动物或哺乳动物)中表达而优化的序列;参见例如WO 2014/093622(PCT/US2013/074667)中的SaCas9人密码子优化的序列。虽然这是优选的,但应当了解,其它示例是可能的,并且对于除人以外的宿主物种的密码子优化或对于特定器官的密码子优化是已知的。在一些实施方案中,编码Cas的酶编码序列对于在特定细胞,诸如真核细胞中表达进行密码子优化。真核细胞可以是特定生物体的那些或来源于特定生物体,诸如哺乳动物,包括但不限于人,或如本文所论述的非人真核生物或动物或哺乳动物,例如小鼠、大鼠、兔、犬、家畜或非人哺乳动物或灵长类动物。在一些实施方案中,可以排除有可能不会对人或动物带来任何实质性医学益处的修改人类的种系遗传身份的过程和/或修改动物的遗传身份的过程,以及由此类过程产生的动物。一般来说,密码子优化是指修饰核酸序列以用于增强在感兴趣的宿主细胞中的表达的过程,该过程是通过用在宿主细胞的基因中较频繁或最频繁使用的密码子置换原生序列的至少一个密码子(例如约或大于约1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个密码子),同时维持原生氨基酸序列。各个物种对特定氨基酸的某些密码子展现特定偏倚。密码子偏倚(生物体之间密码子使用的差异)常常与信使RNA(mRNA)的翻译效率相关,据信所述效率继而尤其取决于所翻译的密码子的特性和特定转移RNA(tRNA)分子的可用性。细胞中所选tRNA的主导性一般反映了肽合成中最频繁使用的密码子。因此,可以基于密码子优化来调整基因用于给定生物体中的最佳基因表达。密码子使用表可容易得到,例如,在www.kazusa.orjp/codon/上可得的“密码子使用数据库(Codon Usage Database)”中,并且这些表可以按许多方式进行改编。参见Nakamura,Y.等“Codon usage tabulated from the international DNA sequencedatabases:status for the year 2000”Nucl.Acids Res.28:292(2000)。对于为在特定宿主细胞中表达而对特定序列进行密码子优化的计算机算法也是可得的,诸如Gene Forge(Aptagen;Jacobus,PA)也是可得的。在一些实施方案中,编码Cas的序列中的一个或多个密码子(例如1个、2个、3个、4个、5个、10个、15个、20个、25个、50个或更多个或所有密码子)对应于对于特定氨基酸最频繁使用的密码子。
在某些实施方案中,如本文所描述的方法可以包括提供Cas13b转基因细胞,在所述Cas13b转基因细胞中提供或引入了编码一种或多种指导RNA的一种或多种核酸,所述一种或多种核酸在细胞中与包含感兴趣的一种或多种基因的启动子的调控元件可操作地连接。如本文所用的术语“Cas13b转基因细胞”是指这样的细胞,诸如真核细胞,在所述细胞中Cas13b基因已经在基因组上整合。细胞的性质、类型或来源根据本发明并无特别限制。而且,Cas13b转基因如何引入细胞中的方式可以有变化并且可以是如本领域中已知的任何方法。在某些实施方案中,通过将Cas13b转基因引入分离的细胞中来获得Cas13b转基因细胞。在某些其它实施方案中,通过从Cas13b转基因生物体中分离细胞来获得Cas13b转基因细胞。举例来说而非限制地,如本文所提及的Cas13b转基因细胞可以来源于Cas13b转基因真核生物,诸如Cas13b敲入真核生物。参考WO 2014/093622(PCT/US13/74667),该参考文献以引用方式并入本文。可以修改针对靶向Rosa基因座的转让给Sangamo BioSciences,Inc.的美国专利公布号20120017290和20110265198的方法以利用本发明的CRISPR Cas系统。还可以修改针对靶向Rosa基因座的转让给Cellectis的美国专利公布号20130236946的方法以利用本发明的CRISPR Cas系统。通过另一个示例,参考Platt等(Cell;159(2):440-455(2014)),其描述了Cas9敲入小鼠,该参考文献以引用方式并入本文。Cas13b转基因还可以包含Lox-Stop-polyA-Lox(LSL)盒,从而促成由Cre重组酶可诱导的Cas13b表达。或者,可以通过将Cas13b转基因引入分离的细胞中来获得Cas13b转基因细胞。用于转基因的递送系统在本领域中是众所周知的。举例来说,可以借助于如本文别处也描述的载体(例如,AAV、腺病毒、慢病毒)和/或颗粒和/或颗粒递送将Cas13b转基因递送于例如真核细胞中。
技术人员应理解,如本文所提及的细胞,诸如Cas13b转基因细胞除了具有整合的Cas13b基因或当与能够将Cas13b引导到靶基因座的RNA复合时由Cas13b的序列特异性作用产生的突变以外还可以包含基因组改变,诸如一种或多种致癌突变,例如但不限于Platt等(2014),Chen等(2014)或Kumar等(2009)中所述。
在一些实施方案中,Cas13b序列与一个或多个核定位序列(NLS)融合,诸如与约或大于约1、2、3、4、5、6、7、8、9、10个或更多个NLS融合。在一些实施方案中,Cas13b在氨基末端处或附近包含约或大于约1、2、3、4、5、6、7、8、9、10个或更多个NLS,在羧基末端处或附近包含约或大于约1、2、3、4、5、6、7、8、9、10个或更多个NLS,或这些的组合(例如在氨基末端处零或至少一个或更多个NLS,以及在羧基末端处零或一个或更多个NLS)。当存在多于一个NLS时,每个NLS可以彼此独立地选择,使得单个NLS可以多于一个拷贝存在和/或与一个或多个其它NLS组合地以一个或多个拷贝存在。在本发明的一个优选实施方案中,Cas13b包含至多6个NLS。在一些实施方案中,当NLS的最接近氨基酸在沿着多肽链距N末端或C末端约1、2、3、4、5、10、15、20、25、30、40、50个或更多个氨基酸内时,认为NLS接近所述N末端或C末端。NLS的非限制性示例包括源自以下的NLS序列:SV40病毒大T抗原的NLS,其具有氨基酸序列PKKKRKV(SEQ ID NO:X);来自核质蛋白的NLS(例如,核质蛋白二分NLS,其具有序列KRPAATKKAGQAKKKK)(SEQ ID NO:X);c-myc NLS,其具有氨基酸序列PAAKRVKLD(SEQ ID NO:X)或RQRRNELKRSP(SEQ ID NO:X);hRNPAl M9 NLS,其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:X);来自内输蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:X);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:X)和PPKKARED(SEQ ID NO:X);人p53的序列POPKKKPL(SEQ ID NO:X);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:X);流感病毒NS1的序列DRLRR(SEQ ID NO:X)和PKQKKRK(SEQ IDNO:X);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:X);小鼠Mxl蛋白的序列REKKKFLKRR(SEQ ID NO:X);人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:X);以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:X)。通常,一个或多个NLS具有足够的强度来驱动Cas以可检测量在真核细胞的细胞核中积累。通常,核定位活性的强度可以源自Cas中NLS的数量、所使用的特定NLS,或这些因素的组合。细胞核中积累的检测可以通过任何合适的技术来执行。例如,可将可检测的标记物融合至Cas,使得细胞内的位置可视化,诸如与用于检测细胞核位置的手段(例如,对细胞核特异的染色剂,诸如DAPI)组合。也可以从细胞中分离细胞核,然后可以通过用于检测蛋白质的任何合适的方法,诸如免疫组织化学、蛋白质印迹或酶活性测定来分析细胞核的内容物。细胞核中积累也可以间接地确定,例如通过用于对与未暴露于Cas或复合物的对照或暴露于缺少所述一种或多种NLS的Cas的对照相比,CRISPR复合物形成的影响的测定(例如用于靶序列处的DNA切割或突变的测定,或用于受CRISPR复合物形成和/或Cas酶活性影响而改变的基因表达活性的测定)。
在某些方面,本发明涉及载体,所述载体例如用于在细胞中递送或引入Cas13b和/或能够将Cas13b引导至靶基因座的RNA(即引导RNA),而且也用于传播这些组分(例如在原核细胞中)。如本文所用,“载体”是允许或促进实体从一种环境转移到另一种环境的工具。其是另一DNA片段可插入其中以便实现插入片段的复制的复制子,如质粒、噬菌体或粘粒。一般地,载体当与适当的控制元件缔合时能够进行复制。一般来说,术语“载体”是指能够转运已经与其连接的另一种核酸的核酸分子。载体包括但不限于为单链、双链或部分双链的核酸分子;包含一个或多个自由端、不包含自由端(例如环状)的核酸分子;包含DNA、RNA或这两者的核酸分子;以及本领域中已知的其它多核苷酸种类。一种类型的载体是“质粒”,其是指环状双链DNA环,另外的DNA片段可例如通过标准分子克隆技术插入其中。另一种类型的载体是病毒载体,其中病毒来源的DNA或RNA序列存在于载体中,用于包装成病毒(例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒(AAV))。病毒载体还包括病毒携带的用于转染进入宿主细胞的多核苷酸。某些载体能够在它们被引入的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其它载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到宿主细胞的基因组当中,并因此与宿主基因组一起被复制。此外,某些载体能够指导与它们操作性连接的基因的表达。这类载体在本文中被称为“表达载体”。重组DNA技术中常用的表达载体常常呈质粒的形式。
重组表达载体可包含本发明的核酸,其形式适合在宿主细胞中表达该核酸,这意味着重组表达载体包括一种或多种调控元件,所述调控元件可根据要用于表达的宿主细胞来选择,与要表达的核酸序列操作性连接。在重组表达载体内,“可操作地连接”旨在表示所关注的核苷酸序列以允许表达该核苷酸序列的方式(例如在体外转录/翻译系统中,或者在将载体引入宿主细胞时的宿主细胞中)与调控元件连接。关于重组和克隆方法,参考2004年9月2日以US 2004-0171156 Al公布的美国专利申请10/815,730,其内容以全文引用的方式并入本文。
载体可包括调控元件,例如启动子。载体可包含Cas13b编码序列和/或单个、但也可能包含至少2、3或8或16或32或48或50个指导RNA(例如,crRNA)编码序列,如1-2、1-3、1-4、1-5、3-6、3-7、3-8、3-9、3-10、3-8、3-16、3-30、3-32、3-48、3-50个RNA(例如,crRNA)。在单个载体中,可有对于每一RNA(例如,crRNA)的启动子,有利地是当存在多达约16个RNA(例如,crRNA)时;并且当单个载体提供多于16个RNA(例如,crRNA)时,一个或多个启动子可驱动RNA(例如,crRNA)中多于一个的表达,例如当有32个RNA(例如,sgRNA或crRNA)时,每一启动子可驱动两个RNA(例如,sgRNA或crRNA)的表达,并且当有48个RNA(例如,sgRNA或crRNA)时,每一启动子可驱动三个RNA(例如,sgRNA或crRNA)的表达。根据简单的算法以及成熟的克隆方案和本公开中的教导,本领域技术人员可以很容易地针对用于合适的示例性载体如AAV及合适的启动子如U6启动子(例如,U6-sgRNA或-crRNA)的RNA(例如,sgRNA或crRNA)实施本发明。例如,AAV的包装限制为技术人员可以很容易地在单个载体中装配12-16个(例如,13个)U6-sgRNA或crRNA盒。可通过任意合适的方式对此进行组装,如通过用于TALE组装的金门策略(golden gate strategy,http://www.genome-engineering.org/taleffectors/)。技术人员也可采用串联引导策略将U6-sgRNA或-crRNA的数量增加大约1.5倍,例如从12-16个(例如,13个)增加到大约18-24个(例如,约19个)U6-sgRNA或-crRNA。因此,本领域技术人员可以很容易地达到在单个载体(例如,AAV载体)中大约18-24个(例如,约19个)启动子-RNA,例如U6-sgRNA或-crRNA。增加载体中的启动子和RNA(例如,sgRNA或crRNA)数量的进一步的方法是使用单个启动子(例如,U6)来表达由可切割序列分开的RNA(例如sgRNA或crRNA)的阵列。并且增加载体中的启动子-RNA(例如,sgRNA或crRNA)数量的更进一步的方法是表达由编码序列或基因的内含子中的可切割序列分开的启动子-RNA(例如,sgRNA或crRNA)的阵列;并且在这种情况下,有利的是使用聚合酶II启动子,其可以增加表达并能够以组织特异性方式转录长RNA(参见例如,nar.oxfordjoumals.org/content/34/7/e53.short、www.nature.com/mt/joumal/vl6/n9/abs/mt2008144a.html)。在有利的实施方案中,AAV可包装靶向多达约50个基因的U6串联sgRNA。因此,根据本领域中的知识和本公开中的教导,技术人员可以很容易地制备和使用在控制下表达多个RNA或引导物或sgRNA或crRNA或者操作性或功能性地与一个或多个启动子连接的载体,例如单个载体—特别是关于本文讨论的RNA或引导物或sgRNA或crRNA的数量,而无需进行任何过度实验。
引导RNA,例如sgRNA或crRNA编码序列和/或Cas13b编码序列,可以功能性或操作性地与调控元件连接,且因此调控元件驱动表达。启动子可以是组成型启动子和/或条件型启动子和/或诱导型启动子和/或组织特异性启动子。启动子可选自RNA聚合酶、pol I、polII、pol III、T7、U6、Hl、逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、P-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EFla启动子。有利的启动子是启动子是U6。
在本发明的一方面,本申请的也称为RNA或RNA靶向CRISPR系统的新型RNA靶向系统是基于本文确认的Cas13b蛋白,其不需要产生定制蛋白来靶向特定的RNA序列,而是可由RNA分子对单个酶进行编程以识别特定的RNA靶标,换言之,可使用所述RNA分子将酶募集至特定的RNA靶标。
在一些实施方案中,核酸靶向系统的一个或多个元件来源于包含内源性CRISPRRNA靶向系统的特定生物体。在某些实施方案中,CRISPR RNA靶向系统见于真细菌和瘤胃球菌属。在某些实施方案中,效应蛋白包含靶向的和侧支的ssRNA切割活性。在某些实施方案中,效应蛋白包含双重HEPN结构域。在某些实施方案中,效应蛋白缺乏Casl3a的Helical-1结构域的对应结构域。在某些实施方案中,效应蛋白比先前表征的中值大小为928aa的第2类CRISPR效应物小。此中值大小比Cas13c的小了190aa(17%),比Cas13b的小了超过200aa(18%),并且比Cas13a的小了超过300aa(26%)。在某些实施方案中,效应蛋白不需要侧翼序列(例如,PFS、PAM)。
在某些实施方案中,效应蛋白基因座结构包括含有辅助蛋白的WYL结构域(因此在这些结构域的初始确认组中保守的三个氨基酸之后表示;参见例如WYL结构域IPR026881)。在某些实施方案中,WYL结构域辅助蛋白包含至少一个螺旋-转角-螺旋(HTH)或带状-螺旋-螺旋(RHH)DNA结合结构域。在某些实施方案中,含有辅助蛋白的WYL结构域增加了RNA靶向效应蛋白的靶向及侧支ssRNA切割活性两者。在某些实施方案中,含有辅助蛋白的WYL结构域包含N末端RHH结构域,以及主要为疏水性保守残基的模式,包括对应于原始WYL基序的不变酪氨酸亮氨酸对。在某些实施方案中,含有辅助蛋白的WYL结构域是WYL1。WYL1是主要与瘤胃球菌属相关的单WYL结构域蛋白。
在其它示例实施方案中,VI型RNA靶向Cas酶是Cas13d。在某些实施方案中,Casl3d是惰性真杆菌DSM 15702(EsCasl3d)或瘤胃球菌属N15.MGS-57(RspCasl3d)(参见例如Yan等人,Casl3d Is a Compact RNA-Targeting Type VI CRISPR Effector PositivelyModulated by a WYL-Domain-Containing Accessory Protein,Molecular Cell(2018),doi.org/10.1016/j.molcel.2018.02.028)。RspCasl3d和EsCasl3d没有侧翼序列需求(例如,PFS、PAM)。
本文所述的核酸靶向系统、载体系统、载体及组合物可用于各种核酸靶向应用,改变或修饰基因产物的合成,如蛋白质、核酸切割、核酸编辑、核酸剪接;靶核酸的运输、靶核酸的追踪、靶核酸的分离、靶核酸的可视化等。
在有利的实施方案中,本发明涵盖参考表1的Cas13b效应蛋白。表1 Cas13b效应蛋白在本文中结合表1有更详细的讨论。
Cas13b核酸酶
本发明的Cas13b效应蛋白是诸如来自或列于表1的蛋白,或者来自或列于表1,或者包含诸如来自或列于表1的蛋白,或者基本上由诸如来自或列于表1的蛋白组成,或者由诸如来自或列于表1的蛋白组成,或者涉及诸如来自或列于表1的蛋白,或与诸如来自或列于表1的蛋白有关。本发明旨在提供来自或列于表1的蛋白,或者与来自或列于表1的蛋白有关,或者涉及来自或列于表1的蛋白,或者包含来自或列于表1的蛋白,或者基本上由来自或列于表1的蛋白组成,或者由来自或列于表1的蛋白组成,包括如本文所列出的其突变或改变。表1Cas13b效应蛋白在本文中结合表1有更详细的讨论。
因此,在一些实施方案中,效应蛋白可以是RNA结合蛋白,如死亡-Cas型效应蛋白,其可任选如本文所述例如用转录激活物或阻遏物结构域、NLS或其它功能结构域进行功能化。在一些实施方案中,效应蛋白可以是切割单链RNA的RNA结合蛋白。如果结合的RNA是ssRNA,则ssRNA被完全切割。在一些实施方案中,效应蛋白可以是切割双链RNA的RNA结合蛋白,例如如果其包含两个RNA酶结构域的话。如果结合的RNA是dsRNA,则dsRNA被完全切割。在一些实施方案中,效应蛋白可以是具有切口酶活性的RNA结合蛋白,即其结合dsRNA,但仅切割RNA链之一。
CRISPR系统中的RNA酶功能是已知的,例如已经报道了某些III型CRISPR-Cas系统的mRNA靶向(Hale等人,2014,Genes Dev,第28卷,2432-2443;Hale等人,2009,Cell,第139卷,945-956;Peng等人,2015,Nucleic acids research,第43卷,406-417),并且提供了显著的优点。因此提供了经由本发明的效应蛋白靶向RNA的CRISPR-Cas系统、组合物或方法。
靶RNA,即所关注的RNA,是本发明要靶向的RNA,其导致效应蛋白向靶RNA上所关注的靶位点募集并结合在那里。靶RNA可以是RNA的任意合适的形式。在一些实施方案中,这可包括mRNA。在其它实施方案中,靶RNA可包括tRNA或rRNA。
干扰RNA(RNAi)和微RNA(miRNA)
在其它实施方案中,靶RNA可包括干扰RNA,即涉及RNA干扰途径的RNA,如shRNA、siRNA等。在其它实施方案中,靶RNA可包括微RNA(miRNA)。对干扰RNA或miRNA进行控制可有助于通过缩减干扰RNA或miRNA在体内或体外的寿命而减少这些方法中所产生的脱靶效应(OTE)。
如果效应蛋白及合适的引导物被选择性地表达(例如在合适的启动子例如组织或细胞周期特异性启动子和/或增强子的控制下在空间上或时间上),则这可用于“保护”所述细胞或系统(体内或体外)免受这些细胞中的RNAi的影响。这在不需要RNAi的邻近组织或细胞中或用于比较效应蛋白及合适的引导物被表达和不被表达(即,分别为RNAi不被控制和被控制)的细胞或组织的目的时可能是有用的。效应蛋白可用于控制或结合包含RNA或由RNA组成的分子,如核酶、核糖体或核糖开关。在本发明的实施方案中,RNA引导物可将效应蛋白募集至这些分子,使得效应蛋白能与它们结合。
核醣体RNA(rRNA)
例如,诸如阿奇霉素的氮杂内酯类(azalide)抗生素是众所周知的。它们靶向并破坏50S核糖体亚基。在一些实施方案中,本发明的效应蛋白连同用以靶向50S核糖体亚基的合适引导RNA一起可以被募集至50S核糖体亚基并与其结合。因此,本发明提供与针对核糖体(特别是50s核糖体亚基)靶标的合适引导物配合的本发明的效应蛋白。与针对核糖体(特别是50s核糖体亚基)靶标的合适引导物配合的此用途效应蛋白的用途可包括抗生素用途。特别地,抗生素用途类似于诸如阿奇霉素的氮杂内酯类抗生素的作用。在一些实施方案中,可以靶向原核生物核糖体亚基,如原核生物中的70S亚基、上面提到的50S亚基、30S亚基以及16S和5S亚基。在其它实施方案中,可以靶向真核生物核糖体亚基,如真核生物中的80S亚基、60S亚基、40S亚基以及28S、18S.5.8S和5S亚基。
效应蛋白可以是任选如本文所述被功能化的RNA结合蛋白。在一些实施方案中,效应蛋白可以是切割单链RNA的RNA结合蛋白。在任一种情况下,但特别是在RNA结合蛋白切割单链RNA的情况下,则可以调节并且特别是降低或破坏核糖体功能。这可适用于任意核糖体RNA和任意核糖体亚基,并且rRNA的序列是众所周知的。
因此设想了通过使用本发明的效应蛋白与核糖体靶标的合适引导物配合来控制核糖体活性。这可通过切割或结合核糖体来进行。特别地,设想了降低核糖体活性。这在体内或体外测定核糖体功能方面可能是有用的,但也作为基于体内或体外核糖体活性来控制治疗的手段。此外,设想了在体内或体外系统中控制(即减少)蛋白质合成,这种控制包括抗生素及研究和诊断用途。
核糖开关
核糖开关(也称为船蛸属酶,aptozyme)是结合小分子的信使RNA分子的调控片段。这通常导致由mRNA编码的蛋白质的产量发生变化。因此,设想了通过使用本发明的效应蛋白与核糖开关靶标的合适引导物配合来控制核糖开关活性。这可以通过切割或结合核糖开关来进行。特别地,设想了降低核糖开关活性。这在体内或体外测定核糖开关功能方面可能是有用的,但也作为基于体内或体外核糖开关活性来控制治疗的手段。此外,设想了在体内或体外系统中控制(即减少)蛋白质合成。关于rRNA的这种控制可包括抗生素及研究和诊断用途。
核酶
核酶是类似于酶(其当然是蛋白质)的具有催化性质的RNA分子。因为核酶不管是天然存在的还是经工程改造的都包含RNA或者由RNA组成,因此它们也可以被本发明的RNA结合效应蛋白靶向。在一些实施方案中,效应蛋白可以是切割核酶从而使其失活的RNA结合蛋白。因此设想了通过使用本发明的效应蛋白与核酶靶标的合适引导物配合来控制核酶活性。这可通过切割或结合核酶来进行。特别地,设想了降低核酶活性。这在体内或体外测定核酶功能方面可能是有用的,但也作为基于体内或体外核酶活性来控制治疗的手段。
基因表达,包括RNA加工
效应蛋白也可与合适的引导物一起用于靶向基因表达,包括经由RNA加工的控制。RNA加工的控制可包括RNA加工反应,如经由靶向RNApol的RNA剪接,包括可变剪接;病毒复制(特别是卫星病毒、噬菌体和逆转录病毒,如HBV、HBC和HIV及本文所列的其它病毒),包括植物中的类病毒;以及tRNA生物合成。效应蛋白及合适的引导物也可用于控制RNA激活(RNAa)。RNAa导致促进基因表达,因此可以通过破坏或减少RNAa并因此降低对基因表达的促进来实现对基因表达的控制。
RNAi筛选
确认其敲低与表型改变相关的基因产物,可经由RNAi筛选来探询生物学途径并确认组成部分。也可通过如下方式对这些筛选或在这些筛选期间施加控制,即在筛选中使用效应蛋白及合适的引导物消除或降低RNAi的活性,并因此恢复(先前受干扰的)基因产物的活性(通过清除或减少干扰/抑制)。
也可以处理卫星RNA(satRNA)和卫星病毒。
本文关于RNA酶活性的控制通常意指降低、消极破坏或敲低或敲除。
体内RNA应用
抑制基因表达
本文提供的靶标特异性RNA酶允许非常特异性地切割靶RNA。由于基因组未被修饰,因而在RNA水平上的干扰允许在空间上和时间上以非侵入性方式进行调节。
已显示可通过mRNA靶向治疗许多疾病。虽然这些研究大多数涉及施用siRNA,但很明显可以类似的方式应用本文提供的RNA靶向效应蛋白。
mRNA靶标(及相应的疾病治疗)的实例有VEGF、VEGF-R1和RTP801(在AMD和/或DME的治疗中)、半胱天冬酶2(在Naion的治疗中)ADRB2(在眼内压的治疗中)、TRPVI(在干眼综合征的治疗中、Syk激酶(在哮喘的治疗中)、Apo B(在高胆固醇血症的治疗中)、PLK1、KSP和VEGF(在实体瘤的治疗中)、Ber-Abl(在CML的治疗中)(Burnett和Rossi Chem Biol.2012,19(1):60-71))。类似地,已显示RNA靶向在治疗RNA病毒介导的疾病如HIV(靶向HIV Tet和Rev)、RSV(靶向RSV核衣壳)和HCV(靶向miR-122)方面有效(Burnett和Rossi ChemBiol.2012,19(1):60-71)。
进一步设想的是本发明的RNA靶向效应蛋白可用于突变特异性或等位基因特异性敲低。引导RNA可以被设计为特异性地靶向转录mRNA中包含突变或等位基因特异性序列的序列。这种特异性敲低特别适合涉及与突变或等位基因特异性基因产物相关的病症的治疗应用。例如,家族性低?脂蛋白血症(FHBL)的大多数病例由ApoB基因中的突变引起。此基因编码载脂蛋白B蛋白的两种形式:短形式(ApoB-48)和较长形式(ApoB-100)。导致FHBL的几种ApoB基因突变使两种形式的ApoB都异常短。用本发明的RNA靶向效应蛋白特异性地靶向和敲低突变的ApoB mRNA转录物可有益于治疗FHBL。作为另一实例,亨廷顿氏病(HD)由编码亨廷顿蛋白的基因中的CAG三联体重复序列的扩增引起,其导致蛋白质异常。用本发明的RNA靶向效应蛋白特异性地靶向和敲低编码亨廷顿蛋白的突变或等位基因特异性mRNA转录物可能有益于治疗HD。
要注意的是,在这种背景下,并且对于本文描述的各种应用来说更一般地,可以设想使用断裂形式的RNA靶向效应蛋白。实际上,这不仅可提高特异性,而且也可有利于递送。从Cas13b酶的两个部分基本上包含功能性Cas13b的意义上说,Cas13b是断裂的。理想地,断裂应始终使催化结构域不受影响。该Cas13b可起核酸酶的作用,或者其可以是死亡Cas13b,由于通常在其催化结构域中的突变原因,其实质上是催化活性很小或没有催化活性的RNA结合蛋白。
断裂Cas13b的每一半可与二聚化配偶体融合。借助于实例而非限制,采用雷帕霉素敏感的二聚化结构域允许产生用于暂时控制Cas13b活性的化学诱导型断裂Cas13b。因此可通过将Cas13b断裂成两个片段而使其成为化学诱导型,并且雷帕霉素敏感的二聚化结构域可用于Cas13b的受控重组装。断裂Cas13b的两个部分可被认为是断裂Cas13b的N'末端部分和C'末端部分。融合通常在Cas13b的断裂点。换言之,断裂Cas13b的N'末端部分的C'末端融合至二聚体的两半之一,而C'末端部分的N'末端融合至二聚体的另一半。
从破裂是新产生的意义上说,Cas13b不一定要断裂。断裂点通常是经由电脑模拟设计的,并且被克隆到构建体中。断裂Cas13b的两个部分即N'末端和C'末端部分一起形成完整的Cas13b,其优选包含70%或更多的野生型氨基酸(或编码它们的核苷酸),优选至少80%或更多、优选至少90%或更多、优选至少95%或更多并且最优选至少99%或更多的野生型氨基酸(或编码它们的核苷酸)。一些修剪是可能的,并且设想了突变体。可以完全去除非功能结构域。重要的是可将两个部分合在一起,并且所需的Cas13b功能被恢复或重构。二聚体可以是同二聚体或异二聚体。
在某些实施方案中,如本文所述的Cas13b效应物可用于突变特异性或等位基因特异性靶向,如用于突变特异性或等位基因特异性敲低。
RNA靶向效应蛋白可进一步融合至另一功能性RNA酶结构域,如非特异性RNA酶或Argonaute 2,其协同作用以增加RNA酶活性或确保信息的进一步降解。
通过调节RNA功能来调节基因表达
除了通过切割mRNA直接影响基因表达外,RNA靶向也可用于影响细胞内的RNA加工的特定方面,这可允许对基因表达进行更精细的调节。一般地,调节可例如通过干扰蛋白质与RNA的结合来介导,比如阻断蛋白质的结合或募集RNA结合蛋白。实际上,可在诸如mRNA的剪接、转运、定位、翻译和转换的不同水平上确保调节。类似地在治疗的背景下,可设想通过使用RNA特异性靶向分子来在这些水平中的每一水平上解决(致病的)功能障碍。在这些实施方案中,在许多情况下优选的是,RNA靶向蛋白是“死亡”Cas13b,其已经丧失了切割RNA靶标的能力,但其保持了与之结合的能力,如本文所述的Cas13b的突变形式。
a)可变剪接
许多人类基因由于可变剪接而表达多种mRNA。已显示不同的疾病与导致所表达基因的功能丧失或功能增强的异常剪接有关。虽然这些疾病中的一些是由导致剪接缺陷的突变引起的,但其中一些不是。一种治疗选择直接针对剪接机制。本文所述的RNA靶向效应蛋白可例如用于阻断或促进剪接,包括或排除外显子,并影响特定同种型的表达和/或刺激替代蛋白产物的表达。下面更详细地描述这类应用。
与靶RNA结合的RNA靶向效应蛋白可在空间上阻断剪接因子接入RNA序列。靶向剪接位点的RNA靶向效应蛋白可在所述位点处阻断剪接,任选将剪接重定向至相邻位点。例如,与5'剪接位点结合的RNA靶向效应蛋白可阻断剪接体的U1组分的募集,有利于跳过该外显子。或者,靶向剪接增强子或沉默子的RNA靶向效应蛋白可阻止反式调控剪接因子在靶位点结合并有效阻断或促进剪接。可通过由如本文所述的RNA靶向效应蛋白将ILF2/3募集至外显子附近的前体mRNA进一步实现外显子排除。作为又一实例,可附接富含甘氨酸的结构域用于hnRNP Al的募集和外显子排除(Del Gatto-Konczak等人,Mol Cell Biol.1999Jan;19(l):251-60)。
在某些实施方案中,通过适当选择gRNA,可以靶向特异性剪接变体,而不会靶向其他剪接变体。
在某些情况下,RNA靶向效应蛋白可用于促进剪接(例如,剪接有缺陷的地方)。例如,RNA靶向效应蛋白可以与能够稳定剪接调节茎-环以便进一步剪接的效应物相关。RNA靶向效应蛋白可以与特定剪接因子的共有结合位点序列连接,以便将蛋白募集至靶DNA。
与异常剪接有关的疾病的实例包括但不限于因失去了调节突触中起作用的蛋白剪接的Nova蛋白而引起的副肿瘤性眼阵挛肌阵挛共济失调(或称POMA),以及因囊性纤维化跨膜传导调节子的缺陷性剪接,导致产生无功能的氯离子通道,从而引起的囊性纤维化。在其他疾病中,异常RNA剪接导致功能获得。例如在肌强直性营养不良中就是这种情况,所述肌强直性营养不良是由于mRNA的3'UTR中CUG三联体重复扩增(50至>1500次重复),导致剪接缺陷,从而引起的。
通过将剪接因子(例如U1)募集到5'剪接位点以促进所需外显子周围内含子的切除,可将RNA靶向效应蛋白用于包含外显子。此类募集可通过与精氨酸/丝氨酸富集的结构域的融合物来介导,所述精氨酸/丝氨酸富集的结构域用作剪接活化剂(Gravely BR andManiatis T,Mol Cell.1998(5):765-71)。
设想RNA靶向效应蛋白可用于在期望位点阻断剪接机制,导致防止外显子识别和不同蛋白产物的表达。可以治疗的疾病的一个实例是杜兴氏肌营养不良(DMD),所述杜兴氏肌营养不良是由编码抗肌萎缩蛋白的基因中的突变引起的。几乎所有DMD突变都会导致移码,从而导致抗肌萎缩蛋白翻译受损。可以将RNA靶向效应蛋白与剪接点或外显子剪接增强子(ESE)配对,从而防止外显子识别,导致部分功能蛋白的翻译。这会将致命的杜兴氏表型转化为较不严重的贝克尔表型。
b)RNA修饰
RNA编辑是一个自然过程,其中通过RNA中的微小修饰来增加给定序列的基因产物的多样性。通常,修饰涉及腺苷(A)向肌苷(I)的转化,从而导致不同于基因组编码的RNA序列。通常通过ADAR酶确保RNA修饰,借此使前体RNA靶标通过包含待编辑腺苷的外显子与内含子非编码元件之间的碱基配对形成不完善的双链RNA。A-I编辑的经典实例是谷氨酸受体GluR-B mRNA,借此改变导致通道的电导性质改变(Higuchi M,等Cell.1993;75:1361-70)。
在人类中,ADAR1基因中的杂合功能缺失会导致皮肤疾病,即人类色素性遗传皮肤病(Miyamura Y,等Am J Hum Genet.2003;73:693-9)。设想本发明的RNA靶向效应蛋白可用于纠正功能失常的RNA修饰。
还设想可以将RNA腺苷甲基化酶(N(6)-甲基腺苷)与本发明的RNA靶向效应蛋白融合并靶向所关注的转录物。该甲基化酶引起可逆的甲基化,具有调节作用,并可能通过调节多种RNA相关的细胞途径来影响基因表达和细胞命运决定(Fu等人,Nat Rev Genet.2014;15(5):293-306)。
c)多腺苷酸化
mRNA的多腺苷酸化对于mRNA的核转运、翻译效率和稳定性是重要的,所有这些以及多腺苷酸化的过程均取决于特定的RBP。大多数真核mRNA在转录后会接受约200个核苷酸的3'多聚(A)尾。多腺苷酸化涉及不同的RNA结合蛋白复合物,其刺激聚(A)聚合酶的活性(Minvielle-Sebastia L等人,Curr Opin Cell Biol.1999;11:352-7)。设想本文提供的RNA靶向效应蛋白可用于干扰或促进RNA结合蛋白与RNA之间的相互作用。
与参与多腺苷酸化的缺陷蛋白有关的疾病的实例是眼咽肌营养不良(OPMD)(Brais B,等Nat Genet.1998;18:164-7)。
d)RNA输出
在前体mRNA处理之后,mRNA从细胞核输出到细胞质。这是通过一种细胞机制来确保的,所述机制涉及产生载体复合物,然后将该载体复合物通过核孔转运并在细胞质中释放mRNA,随后回收载体。
已经发现在RNA的输出中起作用的蛋白质(例如TAP)的过表达增加了转录物的输出,否则所述转录物在非洲爪蟾中的输出效率低(Katahira J,等人,EMBO J.1999;18:2593-609)。
e)mRNA定位
mRNA定位可确保空间调节蛋白质的产生。转录物定位于细胞的特定区域可以通过定位元件来确保。在特定的实施方案中,设想本文所述的效应蛋白可用于使定位元件靶向所关注的RNA。效应蛋白可设计为结合靶转录物,并将其穿梭到细胞中由其肽信号标签确定的位置。更特别地,例如,与核定位信号(NLS)融合的RNA靶向效应蛋白可用于改变RNA定位。
定位信号的其他示例包括邮政编码结合蛋白(ZBP1),所述邮政编码结合蛋白确保β-肌动蛋白在几种不对称细胞类型即KDEL保留序列(定位于内质网)、核输出信号(定位于细胞质)、线粒体靶向信号(定位于线粒体)、过氧化物酶体靶向信号(定位于过氧化物酶体)和m6A标记/YTHDF2(定位于p体)中定位于细胞质,。设想的其他方法是将RNA靶向效应蛋白与已知定位的蛋白(例如膜、突触)融合。
或者,根据本发明的效应蛋白可以例如用于定位依赖性敲低。通过将效应蛋白融合到合适的定位信号上,将效应物靶向特定的细胞区室。仅驻留在该区室中的靶RNA将被有效地靶向,而否则将驻留在不同细胞区室中的相同靶标不被靶向,从而可以建立定位依赖性敲低。
f)翻译
本文所述的RNA靶向效应蛋白可用于增强或抑制翻译。设想上调翻译是控制细胞电路的一种非常可靠的方法。此外,对于功能性研究,蛋白翻译筛选可能优于转录上调筛选,所述转录物上调筛选的缺点是转录上调不会转化为蛋白产量的增加。
设想本文所述的RNA靶向效应蛋白可用于将翻译起始因子(例如EIF4G)带到所关注信使RNA的5'非翻译重复序列(5'UTR)附近以驱动翻译(如De Gregorio等EMBO J.1999;18(17):4865-74所述对于不可重编程的RNA结合蛋白)。作为另一个实例,可以通过RNA靶向效应蛋白将细胞质多聚(A)聚合酶GLD2募集至靶mRNA。这将允许靶mRNA的定向多腺苷酸化,从而刺激翻译。
类似地,本文设想的RNA靶向效应蛋白可用于阻断mRNA的翻译阻遏剂,例如ZBP1(Huttelmaier S,等Nature.2005;438:512-5)。通过与靶RNA的翻译起始位点结合,可以直接影响翻译。
此外,将RNA靶向效应蛋白融合到稳定mRNA的蛋白上,例如通过防止例如RNA酶抑制剂的降解,可以增加所关注转录物的蛋白质产量。
设想本文所述的RNA靶向效应蛋白可用于通过结合在RNA转录物的5'UTR区域中并且阻止核糖体形成并开始翻译而抑制翻译。
此外,RNA靶向效应蛋白可用于将CCR4-NOT腺苷酸酶复合物的组分Caf1募集至靶mRNA,从而导致靶转录物的脱腺苷化和蛋白翻译的抑制。
例如,本发明的RNA靶向效应蛋白可用于增加或减少治疗相关蛋白的翻译。其中可将RNA靶向效应蛋白用于下调或上调翻译的治疗应用的实例是肌萎缩侧索硬化(ALS)和心血管疾病。据报道,ALS运动皮层和脊髓中以及ALS脑组织中多个EAAT2 mRNA异常转录物中神经胶质谷氨酸转运蛋白EAAT2的水平降低。EAAT2蛋白和功能的丧失被认为是ALS兴奋性中毒的主要原因。EAAT2蛋白水平和功能的恢复可能会提供治疗益处。因此,RNA靶向效应蛋白可以有益地用于上调EAAT2蛋白的表达,例如,通过如上所述阻断翻译阻遏剂或稳定mRNA。载脂蛋白A1是高密度脂蛋白(HDL)的主要蛋白组分,ApoA1和HDL通常被认为具有抗动脉粥样硬化作用。设想RNA靶向效应蛋白可以有益地用于上调ApoA1的表达,例如通过如上所述阻断翻译阻遏剂或稳定mRNA。
g)mRNA更新
翻译与mRNA更新和调节的mRNA稳定性紧密相关。已经描述了特定蛋白与转录物(例如神经元中的ELAV/Hu蛋白,Keene JD,1999,Proc Natl Acad Sci USA.96:5-7)和tristetraprolin(TTP)的稳定性有关。这些蛋白质通过保护信息免于在细胞质中降解来稳定靶mRNA(Peng SS等,1988,EMBO J.17:3461-70)。
设想本发明的RNA靶向效应蛋白可用于干扰或促进用于稳定mRNA转录物的蛋白的活性,从而影响mRNA更新。例如,使用RNA靶向效应蛋白使人TTP募集至靶RNA将允许富含腺苷酸-尿苷酸的元件(富含AU的元件)介导的翻译抑制和靶标降解。在许多编码原癌基因、核转录因子和细胞因子并促进RNA稳定性的mRNA的3'UTR中发现了富含AU的元件。作为另一个实例,可将RNA靶向效应蛋白与另一种mRNA稳定蛋白HuR融合(Hinman MN and Lou H,CellMol Life Sci 2008;65:3168-81),并将其募集到靶转录物中以延长其寿命或稳定短寿命的mRNA。
还设想本文所述的RNA靶向效应蛋白可用于促进靶转录物的降解。例如,可以将m6A甲基转移酶募集至靶转录物以将该转录物定位于P-体,从而导致靶标的降解。
作为又一个实例,可将如本文所述的RNA靶向效应蛋白融合至非特异性核酸内切酶结构域PilT N-末端(PIN),以将其募集至靶转录物并使其降解。
患有副肿瘤性神经系统疾病(PND)相关性脑脊髓炎和神经病的患者是在中枢神经系统以外的肿瘤中产生抗Hu蛋白的自身抗体的患者(Szabo A等1991,Cell.;67:325-33),所述自身抗体随后穿过血脑屏障。设想本发明的RNA靶向效应蛋白可用于干扰自身抗体与mRNA转录物的结合。
由营养不良性肌强直蛋白激酶(DMPK)基因3'UTR中的(CUG)n扩增引起的1型营养不良患者(DM1),其特征是这种转录物在细胞核中积累。设想与靶向(CUG)n重复序列的核酸内切酶融合的本发明的RNA靶向效应蛋白可以抑制此类异常转录物的累积。
h)与多功能蛋白的相互作用
一些RNA结合蛋白可与众多RNA上的多个位点结合,从而在多种过程中发挥作用。例如,已经发现hnRNP A1蛋白结合外显子剪接沉默序列,拮抗剪接因子,与端粒末端缔合(从而刺激端粒活性)并结合miRNA以促进Drosha介导的加工从而影响成熟。设想本发明的RNA结合效应蛋白可以在一个或多个位置干扰RNA结合蛋白的结合。
i)RNA折叠
RNA采用确定的结构以执行其生物学活性。替代性三级结构间构象的转变对于大多数RNA介导的过程至关重要。然而,RNA折叠可能与几个问题有关。例如,RNA可能具有折叠成不正确的其他构象并以不正确的其他构象解折叠的趋势,和/或正确的三级结构可能在热力学上并不充分优于其他结构。本发明的RNA靶向效应蛋白,尤其是切割缺陷或死亡的靶向RNA的蛋白,可用于指导(m)RNA的折叠和/或获取其正确的三级结构。
靶向RNA的效应蛋白质在调节细胞状态中的用途
在某些实施方案中,与crRNA的复合物中的Cas13b在结合至靶RNA时被活化并且随后裂解任何附近的ssRNA靶标(即“旁路(collateral)”或“旁观者(bystander)”效应)。Cas13b一旦被同源靶标引发,就可裂解其它(非互补)RNA分子。此类混杂RNA裂解可潜在地引起细胞毒性,或以其它方式影响细胞生理或细胞状态。
因此,在某些实施方案中,如本文所述的非天然存在或工程化的组合物、载体系统或递送系统被用于或用于诱导细胞休眠。在某些实施方案中,如本文所述的非天然存在或工程化的组合物、载体系统或递送系统被用于或用于诱导细胞周期停滞。在某些实施方案中,如本文所述的非天然存在或工程化的组合物、载体系统或递送系统被用于或用于减少细胞生长和/或细胞增殖,在某些实施方案中,如本文所述的非天然存在或工程化的组合物、载体系统或递送系统被用于或用于诱导细胞无能。在某些实施方案中,如本文所述的非天然存在或工程化的组合物、载体系统或递送系统被用于或用于诱导细胞凋亡。在某些实施方案中,如本文所述的非天然存在或工程化的组合物、载体系统或递送系统被用于或用于细胞坏死。在某些实施方案中,如本文所述的非天然存在或工程化的组合物、载体系统或递送系统被用于或用于诱导细胞死亡。在某些实施方案中,如本文所述的非天然存在或工程化的组合物、载体系统或递送系统被用于或用于诱导程序性细胞死亡。
在某些实施方案中,本发明涉及用于诱导细胞休眠的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。在某些实施方案中,本发明涉及用于诱导细胞周期停滞的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。在某些实施方案中,本发明涉及用于减少细胞生长和/或细胞增殖的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。在某些实施方案中,本发明涉及用于诱导细胞无能的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。在某些实施方案中,本发明涉及用于诱导细胞凋亡的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。在某些实施方案中,本发明涉及用于诱导细胞坏死的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。在某些实施方案中,本发明涉及用于诱导细胞死亡的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。在某些实施方案中,本发明涉及用于诱导程序性细胞死亡的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。
如本文所述的方法和用途可以是治疗性的或预防性的,并且可靶向特定的细胞、细胞(亚)群体或细胞/组织类型。具体地说,如本文所述的方法和用途可以是治疗性的或预防性的,并且可靶向表达一种或多种靶序列的特定细胞、细胞(亚)群体或细胞/组织类型,诸如一种或多种特定的靶RNA(例如ss RNA)。无限制地,靶细胞可以是例如表达特定转录物的癌细胞,例如给定类别的神经元、引起例如自身免疫的(免疫)细胞或被特定(例如病毒)病原体感染的细胞等。
因此,在某些实施方案中,本发明涉及用于治疗以存在不期望的细胞(宿主细胞)为特征的病理病状的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。在某些实施方案中,本发明涉及如本文所述的非天然存在或工程化的组合物、载体系统或递送系统用于治疗以存在不期望的细胞(宿主细胞)为特征的病理病状的用途。在某些实施方案中,本发明涉及如本文所述的非天然存在或工程化的组合物、载体系统或递送系统,其用于治疗以存在不期望的细胞(宿主细胞)为特征的病理病状。应理解,优选地,CRISPR-Cas系统靶向对不期望的细胞有特异性的靶标。在某些实施方案中,本发明涉及如本文所述的非天然存在或工程化的组合物、载体系统或递送系统用于治疗、预防或减轻癌症的用途。在某些实施方案中,本发明涉及如本文所述的非天然存在或工程化的组合物、载体系统或递送系统,其用于治疗、预防或减轻癌症。在某些实施方案中,本发明涉及用于治疗、预防或减轻癌症的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。应理解,优选地,CRISPR-Cas系统靶向对癌细胞有特异性的靶标。在某些实施方案中,本发明涉及如本文所述的非天然存在或工程化的组合物、载体系统或递送系统用于治疗、预防或减轻病原体对细胞的感染的用途。在某些实施方案中,本发明涉及如本文所述的非天然存在或工程化的组合物、载体系统或递送系统,其用于治疗、预防或减轻病原体对细胞的感染。在某些实施方案中,本发明涉及用于治疗、预防或减轻病原体对细胞的感染的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。应理解,优选地,CRISPR-Cas系统靶向对被病原体感染的细胞有特异性的靶标(例如来源于病原体的靶标)。在某些实施方案中,本发明涉及如本文所述的非天然存在或工程化的组合物、载体系统或递送系统用于治疗、预防或减轻自身免疫病症的用途。在某些实施方案中,本发明涉及如本文所述的非天然存在或工程化的组合物、载体系统或递送系统,其用于治疗、预防或减轻自身免疫病症。在某些实施方案中,本发明涉及用于治疗、预防或减轻自身免疫病症的方法,其包括引入或诱导如本文所述的非天然存在或工程化的组合物、载体系统或递送系统。应理解,优选地,CRISPR-Cas系统靶向对引起自身免疫病症的细胞有特异性的靶标(例如特异性免疫细胞)。
靶向RNA的效应蛋白质在RNA检测中的用途
进一步设想靶向RNA的效应蛋白质可用于Northern印迹测定。Northern印迹涉及使用电泳按大小分离RNA样品。靶向RNA的效应蛋白质可用于特异性结合和检测靶RNA序列。
靶向RNA的效应蛋白质可融合至荧光蛋白质(诸如GFP)并且用于追踪活细胞中的RNA定位。更具体地说,靶向RNA的效应蛋白质可以失活,因为它不再裂解RNA。在特定实施方案中,设想可使用靶向RNA的脱落的效应蛋白质,其中信号取决于两种亚蛋白质的结合,以便确保更精确的显现。或者,可使用当多个靶向RNA的效应蛋白质复合物结合至靶转录物时重构的脱落的荧光蛋白质。进一步设想转录物靶向沿mRNA的多个结合位点,使得荧光信号可扩大真实信号并允许焦点鉴别。作为再一替代方案,荧光蛋白质可从脱落的内含肽重构。
靶向RNA的效应蛋白质例如适合用于确定RNA或特异性剪接变体的定位、mRNA转录物的水平、转录物的上调或下调以及疾病特异性诊断。靶向RNA的效应蛋白质可用于使用例如荧光显微镜检查或流式细胞术(诸如荧光活化细胞分选(FACS),其允许细胞的高通量筛选和细胞分选后活细胞的回收)使(活)细胞中的核酸显现。此外,可在应激(例如使用分子抑制剂抑制癌症生长或细胞上的缺氧条件)下同时评估不同转录物的表达水平。另一应用是使用双光子显微镜检查在神经刺激期间跟踪转录物到突触连接的定位。
在某些实施方案中,如本文所述的根据本发明的组分或复合物可用于多重抗误差矫正荧光原位杂交(multiplexed error-robust fluorescence in situ hybridization,MERFISH;Chen等人,Science;2015;348(6233)),该杂交例如使用(荧光地)标记的Cas13b效应物。
体外顶点标记(apex labeling)
细胞过程取决于蛋白质、RNA和DNA之间的分子相互作用网络。准确检测蛋白质-DNA和蛋白质-RNA相互作用是理解此类过程的关键。体外邻近标记技术采用与例如可光活化探针组合的亲和标签来标记体外目的蛋白质或RNA附近的多肽和RNA。在UV辐照之后,可光活化基团与紧邻标签分子的蛋白质和其它分子反应,从而标记它们。随后可回收和鉴别标记的相互作用分子。本发明的RNA靶向效应蛋白质可例如用于将探针靶向所选RNA序列。
这些应用也可应用于用于疾病相关应用或难以培养的细胞类型的体内成像的动物模型中。
靶向RNA的效应蛋白质在RNA折纸(origami)/体外组装系中的用途
组合学
RNA折纸是指用于使用RNA作为整合模板创建二维或三维结构的纳米级折叠结构。在RNA中编码折叠结构并且因此通过合成的RNA序列来确定所得RNA的形状(Geary等人2014.Science,345(6198),第799-804页)。RNA折纸可用作用于将诸如蛋白质的其它组分布置成复合物的支架。本发明的靶向RNA的效应蛋白质可例如用于使用合适的导向RNA将目的蛋白质靶向RNA折纸。
这些应用也可应用于用于疾病相关应用或难以培养的细胞类型的体内成像的动物模型中。
靶向RNA的效应蛋白质在RNA分离或纯化、富集或耗竭中的用途
进一步设想,当与RNA复合时,靶向RNA的效应蛋白质可用于分离和/或纯化RNA。靶向RNA的效应蛋白质可例如融合至亲和标签,所述亲和标签可用于分离和/或纯化靶向RNA的效应蛋白质复合物。此类应用例如可用于分析细胞中的基因表达谱。
在特定实施方案中,可以设想靶向RNA的效应蛋白质可用于靶向特异性非编码RNA(ncRNA),由此阻断其活性,从而提供有用的功能探针。在某些实施方案中,如本文所述的效应蛋白质可用于特异性富集特定RNA(包括但不限于增加稳定性等),或替代地用于特异性耗竭特定RNA(诸如但不限于例如特定剪接变体、异形体等)。
lincRNA功能和其它核RNA的探询
当前RNA敲低策略(诸如siRNA)的缺点是它们大多限于靶向细胞溶质转录物,因为蛋白质机制是细胞溶质性的。本发明的靶向RNA的效应蛋白质(一种并非细胞功能所必需的外源系统)的优点在于它可用于细胞中的任何区室中。通过将NLS信号融合至靶向RNA的效应蛋白质,其可被导向至细胞核,从而允许靶向核RNA。例如,设想探测lincRNA的功能。
长基因间非编码RNA(lincRNA)是未得到充分开发的广阔研究领域。大多数lincRNA具有至今未知的功能,所述功能可以是使用本发明的靶向RNA的效应蛋白质的研究。
RNA结合蛋白的鉴别
鉴别与特定RNA结合的蛋白质可能有助于理解许多RNA的作用。例如,许多lincRNA与转录和表观遗传调控因子相关联,以控制转录。了解哪些蛋白质与给定的lincRNA结合可以帮助阐明给定调控途径中的组分。可以设计本发明的RNA靶向效应蛋白,以将生物素连接酶募集到特异性转录物中,以便用生物素标记局部结合的蛋白质。然后可以将蛋白质拉下并通过质谱分析对其进行鉴别。
RNA上复合物的组装和底物穿梭
本发明的RNA靶向效应蛋白可以进一步用于在RNA上组装复合物。这可以通过用多种相关蛋白(例如特定合成途径的组分)对RNA靶向效应蛋白进行功能化来实现。或者,可以将多种RNA靶向效应蛋白用这些不同的相关蛋白官能化,并靶向同一RNA或相邻的靶RNA。在RNA上组装复合物的有用应用例如是促进蛋白质之间的底物穿梭。
合成生物学
生物系统的开发具有广泛的用途,包括临床应用。可以设想,本发明的可编程RNA靶向效应蛋白可以融合形式使用,以分裂毒性结构域的蛋白以实现定向细胞死亡,例如使用癌症相关RNA作为靶转录物。此外,涉及蛋白质间相互作用的途径可在合成生物系统中例如通过与激酶或其他酶等适宜效应物的融合复合物加以影响。
蛋白质剪接:内含肽
蛋白质剪接是翻译后过程,其中中间的多肽(称为内含肽),催化其自身从释放其的多肽(称为外显肽)中的切除,以及随后与这些外显肽的连接。两个或更多个本文所述RNA靶向效应蛋白在靶转录物上的组装可用于引导脱落内含肽的释放(Topilina and MillsMob DNA.2014 Feb 4;5(1):5),从而使得能够直接计算mRNA转录物的存在量以及随后释放的蛋白质产物(例如代谢酶或转录因子)(用于下游激活转录途径)。此应用在合成生物学(请参见上文)或大规模生物生产(仅在特定条件下生产产品)中可能具有重大意义。
可诱导的递送的自灭活系统
在一个实施方案中,将包含本发明的RNA靶向效应蛋白和效应物组分的融合复合物设计为可诱导的,例如可光诱导的或可化学诱导的。这种诱导性使得能够在期望的时刻激活效应物组分。
例如,通过设计其中使用CRY2PHR/CIBN配对进行融合的融合复合物来实现光诱导性。该系统对于光诱导活细胞中蛋白质相互作用特别有用(Konermann S等人Nature.2013;500:472-476)。
例如,通过设计其中使用FKBP/FRB(FK506结合蛋白/FKBP雷帕霉素结合)配对进行融合的融合复合物来提供化学诱导性。使用该系统时,需使用雷帕霉素进行蛋白质结合(Zetsche等人Nat Biotechnol.2015;33(2):139-42描述了该系统用于Cas9的用途)。
此外,当本发明RNA靶向效应蛋白以DNA形式引入细胞中时,其可以通过诱导型启动子来调节,例如四环素或强力霉素控制的转录激活(Tet-On和Tet-Off表达系统)、激素诱导型基因表达系统,例如蜕皮激素诱导型基因表达系统和阿拉伯糖诱导型基因表达系统。当以RNA形式递送时,可通过核糖开关调节RNA靶向效应蛋白的表达,所述核糖开关可感测小分子,如四环素(如Goldfless et al,Nucleic Acids Res.2012;40(9):e64中所述)。
在一个实施方案中,可以调节本发明的RNA靶向效应蛋白的递送,以改变细胞中蛋白质或crRNA的量,从而改变所需效应或任何不期望的脱靶效应的幅度。
在一个实施方案中,可以将本文所述的RNA靶向效应蛋白设计为自灭活的。当以RNA(mRNA或复制RNA治疗剂)的形式递送到细胞中时(Wrobleska et al NatBiotechnol.2015 Aug;33(8):839-841),它们可以通过破坏自身的RNA使表达及随后的效应失活,从而减少了驻留时间和潜在的不良影响。
对于如本文所述的RNA靶向效应蛋白的进一步的体内应用,参考Mackay JP等人(Nat Struct Mol Biol.2011 Mar;18(3):256-61)、Nelles等人(Bioessays.2015 Jul;37(7):732-9)以及Abil Z和Zhao H(Mol Biosyst.2015 Oct;11(10):2658-65),其通过引用并入本文中。特别地,在本发明的某些实施方案中,优选地在某些实施方案中,通过使用催化失活的Cas13b设想了以下应用:增强翻译(例如Cas13b-翻译促进因子融合物(例如eIF4融合物));抑制翻译(例如gRNA靶向核糖体结合位点);外显子跳跃(例如gRNA靶向剪接供体和/或受体位点);外显子包括(例如gRNA靶向待包括的或与Cas13b融合的特定外显子剪接供体和/或受体位点或募集剪接体组分(例如U1 snRNA));访问RNA定位(例如Cas13b-标志融合物(例如EGFP融合物));改变RNA定位(例如Cas13b-定位信号融合物(例如NLS或NES融合物));RNA降解(在这种情况下,如果依赖于Cas13b的活性,则不使用无催化活性的Cas13b,或者为了提高特异性,可以使用脱落Cas13b);抑制非编码RNA功能(例如miRNA),例如通过gRNA降解或gRNA与功能位点结合(可能通过Cas13b-信号序列融合物进行重新定位在特异性位点滴定出)。
如本文之前所述和在实施例中所证实,Cas13b功能对于crRNA的5'或3'延伸和crRNA环的延伸是稳固的。因此设想可以将MS2环和其他募集结构域添加至crRNA,而不影响复合物的形成以及与靶转录物的结合。对crRNA的这类旨在募集各种效应物结构域的修饰适用于上述RNA靶向效应蛋白的各种用途。
Cas13b能够介导对RNA噬菌体的抗性。因此,设想Cas13b可用于例如对动物、人类和植物进行免疫接种以抵抗仅有RNA的病原体,包括但不限于埃博拉病毒和寨卡病毒。
在某些实施方案中,Cas13b可以处理(裂解)其自己的阵列。这既适用于野生型Cas13b蛋白,也适用于包含本文所述的一或多个突变氨基酸残基的突变Cas13b蛋白。因此可以设想,针对不同的靶转录物和/或应用设计的多个crRNA可以作为单个pre-crRNA或作为由一个启动子驱动的单个转录物递送。这种递送方法的优点在于其实质上更紧凑,更容易合成并且更容易在病毒系统中递送。应理解,对于本文Cas13b的直系同源物而言,确切的氨基酸位置可以变化,这可以通过蛋白质比对来适当地确定,如本领域已知的,以及如本文其他处所述。本发明的方面还涵盖了本文所述的组合物和系统在基因组工程中的方法和用途,例如用于在体外、体内或离体改变或操纵原核或真核细胞中一种或多种基因或一种或多种基因产物的表达。
在一个方面,本发明提供用于调节(例如降低)靶RNA在细胞中的表达的方法和组合物。在主题方法中,提供了本发明的Cas13b系统,所述系统干扰RNA的转录、稳定性和/或翻译。
在某些实施方案中,使用有效量的Cas13b系统裂解RNA或抑制RNA表达。就此而言,所述系统具有与siRNA和shRNA相似的用途,因此也可以替代此类方法。所述方法包括但不限于使用Cas13b系统作为例如干扰核糖核酸(例如siRNA或shRNA)或其转录模板(例如编码shRNA的DNA)的替代物。例如通过将Cas13b系统施用至包括靶细胞的哺乳动物,将其引入靶细胞。
有利地,本发明的Cas13b系统具有特异性。例如,尽管干扰核糖核酸(例如siRNA或shRNA)多核苷酸系统受到设计和稳定性问题以及脱靶结合的困扰,但本发明的Cas13b系统可设计成具有高特异性。
去稳定Cas13b
在某些实施方案中,本文所述的根据本发明的效应蛋白与去稳定结构域(DD)相关联或融合。在一些实施方案中,所述DD是ER50。在一些实施方案中,这个DD的相应稳定配体是4HT。因而,在一些实施方案中,所述至少一个DD中的一个是ER50,并且其稳定配体是4HT或CMP8。在一些实施方案中,所述DD是DHFR50。在一些实施方案中,这个DD的相应稳定配体是TMP。因而,在一些实施方案中,所述至少一个DD中的一个是DHFR50,并且其稳定配体是TMP。在一些实施方案中,所述DD是ER50。在一些实施方案中,这个DD的相应稳定配体是CMP8。因此,CMP8可能是ER50系统中4HT的替代稳定配体。尽管有可能可以/应该将CMP8和4HT用于竞争性物质中,但某些细胞类型可能更易受这两种配体中的一种或另一种的影响,并且根据本公开和本领域中的知识,技术人员可以使用CMP8和/或4HT。
在一些实施方案中,可以将一个或两个DD融合至Cas13b的N-端,而将一个或两个DD融合至Cas13b的C-端。在一些实施方案中,至少两个DD与Cas13b相关联,并且所述DD是相同的DD,即,所述DD是同源的。因此,这两个(或两个或更多个)DD都可以是ER50DD。在一些实施方案中,这是优选的。或者,两个(或两个或更多个)DD可以是DHFR50 DD。在一些实施方案中这也是优选的。在一些实施方案中,所述至少两个DD与Cas13b相关联,并且所述DD是不同的DD,即,所述DD是异源的。因此,所述DD中的一个可以是ER50,而所述DD中的一个或更多个或任何其他DD可以是DHFR50。具有两个或多个异源的DD可能是有利的,因为会提供更高水平的降解控制。多于一个DD在N端或C端上的串联融合可能会增强降解;并且这种串联融合可以是例如ER50-ER50-Cas13b或DHFR-DHFR-Cas13b。设想在两个稳定配体均不存在的情况下将发生高水平的降解,在一个稳定配体不存在而另一个存在的情况下发生中等水平的降解,而在两个(或多个中的两个)稳定配体均存在的情况下会发生低水平的降解。也可以通过具有N端ER50 DD和C端DHFR50DD来进行控制。
在一些实施方案中,Cas13b与DD的融合物包括DD与Cas13b之间的连接子。在一些实施方案中,所述连接子是GlySer连接子。在一些实施方案中,DD-Cas13b还包含至少一个核输出信号(NES)。在一些实施方案中,DD-Cas13b包含两个或更多个NES。在一些实施方案中,DD-Cas13b包含至少一个核定位信号(NLS)。可以是在除了NES之外还包含NLS。在一些实施方案中,Cas13b包含定位(核输入或输出)信号作为Cas13b与DD之间的连接子或作为其一部分,或基本上由其组成或由其组成。HA或Flag标签也在本发明的连接子范围内。申请人使用NLS和/或NES作为连接子头,也使用甘氨酸丝氨酸连接子(最短为GS,长至(GGGGS)3)。
去稳定结构域的作用通常是使多种蛋白质不稳定;参见,例如,Miyazaki,J AmChem Soc.Mar 7,2012;134(9):3942-3945,其以引用方式并入本文中。CMP8或4-羟基他莫昔芬可能是去稳定结构域。更一般来说,发现哺乳动物DHFR的温度敏感突变体(DHFRts)(其按N端法则是去稳定残基)在允许的温度下稳定,但在37℃下不稳定。在表达DHFRts的细胞中添加甲氨蝶呤(哺乳动物DHFR的高亲和力配体)可部分抑制蛋白质的降解。这是一个重要的证明,即证明小分子配体可以稳定细胞中原本被靶向降解的蛋白质。雷帕霉素衍生物用于稳定mTOR的FRB结构域的不稳定突变体(FRB*)并恢复融合激酶GSK-3β.6,7的功能。这个系统证明配体依赖性稳定性代表了一种有吸引力的用来调控特定蛋白质在复杂生物环境中的功能的策略。控制蛋白质活性的系统可能涉及DD在泛素互补时因为雷帕霉素诱导的FK506结合蛋白和FKBP12的二聚而变得有功能。可以将人FKBP12或ecDHFR蛋白的突变体工程改造为在其高亲和力配体(分别为Shield-1或甲氧苄啶(TMP))不存在时在代谢上不稳定。这些突变体是可用于实施本发明的一些可能的去稳定结构域(DD),并且呈与Cas13b的融合物形式的DD的不稳定性导致由蛋白酶体引起的整个融合蛋白的Cas13b降解。Shield-1和TMP以剂量依赖性方式结合并稳定DD。雌激素受体配体结合结构域(ERLBD,ERS1的残基305-549)也可以被工程改造化为去稳定结构域。由于雌激素受体信号转导途径涉及多种疾病,例如乳腺癌,因此已经对所述途径进行了广泛研究,并且已经开发出许多雌激素受体激动剂和拮抗剂。因此,已知ERLBD与药物的相容对。有一些配体与ERLBD的突变型而非野生型结合。通过使用编码三个突变(L384M,M421G,G521R)12的这些突变结构域中的一个,可以使用不干扰内源雌激素敏感性网络的配体来调控ERLBD衍生DD的稳定性。可以引入另一突变(Y537S),以进一步去稳定ERLBD并将其构造成潜在的DD候选物。这种四突变体是有利的DD发展。突变体ERLBD可以与Cas13b融合,并且其稳定性可以使用配体来调控或扰动,借此Cas13b具有DD。另一个DD可以是基于突变FKBP蛋白的12-kDa(107个氨基酸)标签,并由Shield1配体稳定。参见,例如,Nature Methods 5,(2008)。例如,DD可以是经修饰的FK506结合蛋白12(FKBP12),其与合成的生物惰性小分子Shield-1结合并由其可逆地稳定;参见,例如Banaszynski LA,Chen LC,Maynard-Smith LA,Ooi AG,Wandless TJ.A rapid,reversible,and tunable method to regulate protein function in living cellsusing synthetic small molecules.(一种使用合成的小分子调控活细胞中蛋白质功能的快速、可逆和可调的方法).Cell.2006;126:995-1004;Banaszynski LA,Sellmyer MA,Contag CH,Wandless TJ,Thorne SH.Chemical control of protein stability andfunction in living mice.(活体小鼠中蛋白质稳定性和功能的化学控制)Nat Med.2008;14:1123-1127;Maynard-Smith LA,Chen LC,Banaszynski LA,Ooi AG,Wandless TJ.Adirected approach for engineering conditional protein stability usingbiologically silent small molecules.(使用生物沉默小分子对条件蛋白稳定性进行工程改造的定向方法)The Journal of biological chemistry.2007;282:24866-24872;以及Rodriguez,Chem Biol.Mar 23,2012;19(3):391-398——所有这些均以引用方式并入本文中,并且可以在本发明的实践中采用,以选择在本发明的实践中与Cas13b相关联的DD。可以看出,本领域的知识包括许多DD,并且DD可以例如(有利地通过连接子)与Cas13b融合,借此可以使DD在配体存在时稳定,而当配体不存在时,DD可能变得不稳定,借此Cas 3b完全不稳定,或者DD可以在不存在配体时是稳定的,而当存在配体时,DD可能变得不稳定;DD使得能够对Cas13b并且因此对CRISPR-Cas13b复合物或系统进行调控或控制(可以说是打开或关闭),从而提供了用于例如在体内或体外环境调控或控制所述系统的手段。例如,当所关注的蛋白质表达为与DD标签的融合物时,它被去稳定并在细胞中迅速降解,例如被蛋白酶体降解。因此,稳定配体不存在导致D相关Cas被降解。当新的DD与所关注的蛋白质融合时,其不稳定性被赋予所关注的蛋白,导致整个融合蛋白迅速降解。Cas的峰值活性有时有利于减少脱靶效应。因此,短的高活性突发是优选的。本发明能够提供此类峰。从某种意义上说,所述系统是可诱导的。在某些其他意义上,所述系统在不存在稳定配体的情况下被阻遏,在存在稳定配体的情况下去阻遏。
Cas13突变
在某些实施方案中,如本文所述的根据本发明的效应蛋白(CRISPR酶;Cas13;效应蛋白)是催化失活的或死亡的Cas13效应蛋白(dCas13)。在一些实施方案中,dCas13效应子包含核酸酶结构域中的突变。在一些实施方案中,dCas13效应蛋白已被截短。为了减小Cas13效应子和一个或多个功能域的融合蛋白的大小,可以截断Cas13效应子的C末端,同时仍保持其RNA结合功能。例如,可以在Cas13b效应子的C末端截短至少20个氨基酸,至少50个氨基酸,至少80个氨基酸,或至少100个氨基酸,或至少150个氨基酸,或至少200个氨基酸,或至少250个氨基酸,或至少300个氨基酸,或至少350个氨基酸,或者最多120个氨基酸,或最多140个氨基酸,或最多160个氨基酸,或最多180个氨基酸,或最多200个氨基酸,或最多250个氨基酸,或最多300个氨基酸,或最多350个氨基酸,或最多400个氨基酸。Cas13截短的具体例子包括C末端Δ984-1090、C末端Δ1026-1090和C末端Δ1053-1090、C末端Δ934-1090、C末端Δ884-1090、C末端Δ834-1090、C末端Δ784-1090和C-末端Δ734-1090,其中氨基酸位置对应于普氏菌属(Prevotella sp.)P5-125Cas13b蛋白的氨基酸位置。参见图28。
调节Cas13效应蛋白
本发明提供调节CRISPR蛋白功能的辅助蛋白。在某些实施方案中,辅助蛋白调节CRISPR蛋白的催化活性。在本发明的一个实施方案中,辅助蛋白调节靶向的或序列特异性的核酸酶活性。在本发明的一个实施方案中,辅助蛋白调节副核酸酶(collateralnuclease)活性。在本发明的一个实施方案中,辅助蛋白调节与靶核酸的结合。
根据本发明,待调节的核酸酶活性可以针对包含RNA或由RNA组成的核酸,包括但不限于mRNA、miRNA、siRNA和包含可切割的RNA键以及核苷酸类似物的核酸。在本发明的一个实施方案中,待调节的核酸酶活性可以针对包含DNA或由DNA组成的核酸,包括但不限于包含可切割DNA键和核酸类似物的核酸。
在本发明的一个实施方案中,辅助蛋白增强CRISPR蛋白的活性。在某些这样的实施方案中,辅助蛋白包含HEPN结构域并增强RNA切割。在某些实施方案中,辅助蛋白抑制CRISPR蛋白的活性。在某些这样的实施方案中,辅助蛋白包含失活的HEPN结构域或完全缺乏HEPN结构域。
根据本发明,天然存在的VI型CRISPR系统的辅助蛋白包含在CRISPR基因座处或附近编码的小蛋白,其起到改变CRISPR蛋白的活性的作用。通常,CRISPR基因座可鉴定为包含推定的CRISPR阵列和/或编码推定的CRISPR效应蛋白。在一个实施方案中,效应蛋白可以是800至2000个氨基酸,或900至1800个氨基酸,或950至1300个氨基酸。在一个实施方案中,辅助蛋白可以在推定的CRISPR效应蛋白或阵列的25kb内,或20kb内或15kb内,或10kb内,或距推定的CRISPR效应蛋白或阵列2kb至10kb。
在本发明的一个实施方案中,辅助蛋白是50至300个氨基酸,或100至300个氨基酸,或150至250个氨基酸或大约200个氨基酸。辅助蛋白的非限制性实例包括本文中鉴定的csx27和csx28蛋白。
本发明的CRISPR辅助蛋白的鉴定和使用独立于CRISPR效应蛋白分类。可以发现本发明的辅助蛋白与多种CRISPR效应蛋白结合或被工程化以与其一起发挥作用。本文中鉴定和使用的辅助蛋白的实例一般是CRISPR效应蛋白的代表。应理解的是,CRISPR效应蛋白分类可能涉及同源性、特征位置(例如,REC结构域、NUC结构域、HEPN序列的位置)、核酸靶标(例如DNA或RNA)、tracr RNA的存在与否、直接重复序列5'或3'的指导/间隔序列的位置或其他标准。在本发明的实施方案中,辅助蛋白的鉴定和用途超越了这些分类。
在靶向RNA的VI型CRISPR-Cas系统中,Cas蛋白通常包含两个保守的HEPN结构域,其参与RNA切割。在某些实施方案中,Cas蛋白加工crRNA以产生成熟的crRNA。crRNA的指导序列识别具有互补序列的靶RNA,而Cas蛋白降解靶标链。更特别地,在某些实施方案中,在靶标结合后,Cas蛋白发生结构重排,其使两个HEPN结构域合在一起以形成活性HEPN催化位点,然后切割靶RNA。在Cas蛋白表面附近催化位点的位置允许非特异性的附带ssRNA切割。
在某些实施方案中,辅助蛋白在增加或减少靶标和/或旁侧附带RNA切割中起作用。不受理论的束缚,可以设想激活CRISPR活性的辅助蛋白(例如,csx28蛋白或者包含HEPN结构域的直系同源物或变体)能够与Cas蛋白相互作用并将其HEPN结构域与Cas蛋白的HEPN结构域组合以形成活性HEPN催化位点,而可以设想抑制性辅助蛋白(例如,缺少HEPN结构域的csx27)能够与Cas蛋白相互作用并减少或阻断Cas蛋白的将两个HEPN域结合到一起的构象。
根据本发明,在某些实施方案中,增强VI型Cas蛋白或其复合物的活性包括使VI型Cas蛋白或其复合物与来自激活该Cas蛋白的同一生物体的辅助蛋白接触。在其他实施方案中,增强VI型Cas蛋白或其复合物的活性包括使VI型Cas蛋白或其复合物与来自相同亚类(例如,VI-b型)中不同生物体的激活辅助蛋白接触。在其他实施方案中,增强VI型Cas蛋白或其复合物的活性包括使VI型Cas蛋白或其复合物与不在该亚类内的辅助蛋白(例如,具有VI-b型辅助蛋白的VI-b型以外的VI型Cas蛋白,反之亦然)接触。
根据本发明,在某些实施方案中,VI型Cas蛋白质或其复合物的阻遏活性包括使VI型Cas蛋白质或其复合物与来自抑制该Cas蛋白的相同生物体的辅助蛋白接触。在其他实施方案中,VI型Cas蛋白或其复合物的阻遏活性包括使VI型Cas蛋白或其复合物与来自相同亚类(例如,VI-b型)中不同生物体的阻遏辅助蛋白接触。在其他实施方案中,VI型Cas蛋白或其复合物的阻遏活性包括使VI型Cas蛋白或其复合物与不在该亚类内的阻遏辅助蛋白(例如,具有VI-b型阻遏辅助蛋白的VI-b型之外的VI型Cas蛋白,反之亦然)接触。
在其中VI型Cas蛋白和VI型辅助蛋白来自相同生物体的某些实施方案中,这两种蛋白在工程化CRISPR系统中一起发挥作用。在某些实施方案中,希望的是例如通过改变蛋白质任一或两者或者其表达来改变工程化CRISPR系统的功能。在其中VI型Cas蛋白和VI型辅助蛋白来自可以在相同类或不同类内的不同生物体的实施方案中,蛋白质可以在工程化CRISPR系统中一起发挥作用,但是常常需要或必须改变蛋白质中的一种或两者以一起发挥作用。
因此,在本发明的某些实施方案中,Cas蛋白和辅助蛋白中任一或两者可以修饰以调节Cas蛋白和辅助蛋白之间蛋白质-蛋白质相互作用的方面。在某些实施方案中,可Cas蛋白和辅助蛋白中任一或两者以修饰以调节蛋白质-核酸相互作用的方面。调节蛋白质-蛋白质相互作用和蛋白质-核酸相互作用的方式包括但不限于拟合分子表面、极性相互作用、氢键,和调节范德华相互作用。在某些实施方案中,调节蛋白质-蛋白质相互作用或蛋白质-核酸结合包括增加或减少结合相互作用。在某些实施方案中,调节蛋白质-蛋白质相互作用或蛋白质-核酸结合包括有利于或不利于蛋白质或核酸的构象的修饰。
“拟合”是指确定(包括通过自动或半自动方式)在Cas13蛋白的一个或多个原子与Cas13辅助蛋白的至少一个原子之间或在Cas13蛋白的一个或多个原子与核酸的一个或多个原子之间,或Cas13辅助蛋白和核酸的一个或多个原子之间的相互作用,并计算这种相互作用稳定的程度。相互作用包括由电荷、空间考虑因素等引起的吸引和排斥。
在本发明的情况中,VI型CRISPR蛋白或其复合物或者VI型CRISPR辅助蛋白或其复合物的三维结构提供了用于鉴定Cas13直系同源物中的其他突变的额外工具。晶体结构也可以作为设计新的和特定的Cas13s和Cas13辅助蛋白的基础。进一步描述了各种用于拟合的基于计算机的方法。可以通过使用对接程序的计算机建模来检查Cas13、辅助蛋白和核酸的结合相互作用。对接程序是已知的。例如GRAM、DOCK或AUTODOCK(参见Walters等,DrugDiscovery Today,第3卷,第4期(1998),160-178,和Dunbrack等,Folding and Design 2(1997),第27-42页)。该过程可以包括计算机拟合以确定结合伴体的形状和化学结构多好。可以进行VI型系统的活性位点或结合位点的计算机辅助的手动检查。也可以使用诸如GRID(P.Goodford,J.Med.Chem,1985,28,849-57)(确定具有各种官能团的分子之间的可能相互作用位点的程序)的程序来分析活性位点或结合位点以预测结合化合物的部分结构。可以使用计算机程序来估计两个结合伴体(例如VI型CRISPR系统的组件,或者核酸分子和VI型CRISPR系统的组分)的吸引、排斥或空间位阻。
氨基酸置换可以基于氨基酸性质的相似性(例如极性、电荷、溶解度、疏水性、亲水性和/或残基的两亲性质)进行,因此将氨基酸成组合在一起作为功能组是有用的。氨基酸可以仅基于其侧链的性质而成组合在一起。在比较直系同源物时,它们可能出于结构或催化原因是保守的。这些组可以以维恩图(Livingstone C.D.和Barton G.J.(1993)“Proteinsequence alignments:a strategy for the hierarchical analysis of residueconservation”Comput.Appl.Biosci.9:745-756)(Taylor W.R.(1986)“Theclassification of amino acid conservation”J.Theor.Biol.119;205-218)的形式描述。例如根据下表可以进行保守置换,其描述了通常接受的维恩图氨基酸分组。
在工程化Cas13系统中,修饰可包括Cas13蛋白的一个或多个氨基酸残基的修饰和/或可包括Cas13辅助蛋白的一个或多个氨基酸残基的修饰。
在工程化Cas13系统中,修饰可包括位于包含在未修饰的Cas13蛋白和/或Cas13辅助蛋白中带正电的残基的区域中的一个或多个氨基酸残基的修饰。
在工程化Cas13系统中,修饰可以包括未修饰的Cas13蛋白和/或Cas13辅助蛋白中带正电的一个或多个氨基酸残基的修饰。
在工程化Cas13系统中,修饰可包括未修饰的Cas13蛋白和/或Cas13辅助蛋白中非带正电的一个或多个氨基酸残基的修饰。
修饰可包括未修饰的Cas13蛋白和/或Cas13辅助蛋白中不带电的一个或多个氨基酸残基的修饰。
修饰可包括未修饰的Cas13蛋白和/或Cas13辅助蛋白中带负电的一个或多个氨基酸残基的修饰。
修饰可包括未修饰的Cas13蛋白和/或Cas13辅助蛋白中疏水的一个或多个氨基酸残基的修饰。
修饰可包括未修饰的Cas13蛋白和/或Cas13辅助蛋白中极性的一个或多个氨基酸残基的修饰。
修饰可以包括用带电的氨基酸置换疏水氨基酸或极性氨基酸,该带电的氨基酸可以是带负电的或带正电的氨基酸。修饰可包括用带正电的或极性的或疏水性氨基酸置换带负电的氨基酸。修饰可包括用带负电的或极性的或疏水性氨基酸置换带正电的氨基酸。
本发明的实施方案包括可包含同源置换(置换和替换均在本文中用于表示现有氨基酸残基或核苷酸与替代残基或核苷酸的交换)的序列(多核苷酸或多肽),所述置换可以发生,例如,在氨基酸的情况下,类似对类似置换,例如碱性对碱性、酸性对酸性、极性对极性等。也可能发生非同源置换,即从一类残基到另一类或可替代地涉及包括非天然氨基酸例如鸟氨酸(下文称为Z)、二氨基丁酸鸟氨酸(下文称为B)、正亮氨酸鸟氨酸(下文称为O)、吡啶丙氨酸、噻吩丙氨酸、萘基丙氨酸和苯基甘氨酸。变体氨基酸序列可包含合适的间隔基团,其可插入序列的任何两个氨基酸残基之间,包括烷基例如甲基、乙基或丙基,以及氨基酸间隔子如甘氨酸或β-丙氨酸残基。本领域技术人员可以很好地理解另一种形式的变异,其涉及拟肽形式的一个或多个氨基酸残基的存在。为避免疑义,“拟肽形式”用于指变体氨基酸残基,其中α-碳取代基位于残基的氮原子而不是α-碳上。制备拟肽形式的肽的方法是本领域已知的,例如Simon RJ等,PNAS(1992)89(20),9367-9371和Horwell DC,TrendsBiotechnol.(1995)13(4),132-134。
同源性建模:其他Cas13直系同源物中的相应残基可以通过Zhang等,2012(Nature;490(7421):556-60)和Chen等,2015(PLoS Comput Biol;11(5):e1004248)的方法鉴定,其是预测由结构域基序界面介导的相互作用的计算蛋白质-蛋白质相互作用(PPI)方法。PrePPI(Predicting PPI)是基于结构的PPI预测方法,使用贝叶斯统计框架将结构证据与非结构证据相结合。该方法涉及采用一对查询蛋白质并使用结构比对来鉴定对应于其实验确定的结构或同源模型的结构代表。通过考虑全局和局部几何关系,结构比对进一步用于鉴定近距离和远距离结构邻域两者。每当结构代表的两个邻域形成蛋白质数据库中报告的复合物时,这定义了用于对两个查询蛋白质之间的相互作用进行建模的模板。通过将代表性结构叠加在模板中对应的结构邻域上来创建复合体的模型。该方法在Dey等,2013(Prot Sci;22:359-66)中描述。
RNA靶向-CRISPR系统对植物和酵母的应用
定义:
通常,术语“植物”涉及通过细胞分裂而特征性地生长的植物界的任何各种光合作用的、真核的、单细胞的或多细胞的生物,含有叶绿体,并且具有由纤维素组成的细胞壁。术语植物包括单子叶植物和双子叶植物。具体而言,植物旨在包括但不限于被子植物和裸子植物,例如金合欢、苜蓿、苋菜、苹果、杏、朝鲜蓟、白蜡树、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、桦树、山毛榉、黑莓、蓝莓、西兰花、布鲁塞尔的豆芽、白菜、油菜、哈密瓜、胡萝卜、木薯、花椰菜、雪松、谷物、芹菜、板栗、樱桃、大白菜、柑橘、克莱门汀、三叶草、咖啡、玉米、棉花、豇豆、黄瓜、柏树、茄子、榆树、莴苣、桉树、茴香、无花果、冷杉、天竺葵、葡萄、葡萄柚、花生、地面樱桃、胶铁杉、山核桃、羽衣甘蓝、猕猴桃、大头菜、落叶松、生菜、韭菜、柠檬、石灰、蝗虫、松、掌叶铁线蕨、玉米、芒果、枫树、甜瓜、小米、蘑菇、芥末、坚果、橡树、燕麦、油棕榈、秋葵、洋葱、橙子、观赏植物或花或树、木瓜、棕榈、欧芹、欧洲防风草、豌豆、桃、花生、梨、泥炭、胡椒、柿子、木豆、松、菠萝、车前草、李子、石榴、土豆、南瓜、菊苣、萝卜、油菜、覆盆子、大米、黑麦、高粱、红花、淡黄色、大豆、菠菜、云杉、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、烟草、西红柿、树木、小黑麦、草坪草、萝卜、藤、核桃、豆瓣菜、西瓜、小麦、山药、红豆杉和西葫芦。术语植物还包括藻类,其主要是光合自养生物,主要通过缺乏根、叶和其他表征高等植物的器官而统一。
使用本文所述的RNA靶向系统调节基因表达的方法可用于赋予基本上任何植物所需的性状。通过使用本公开的核酸构建体和上述各种转化方法,多种植物和植物细胞系统可以被工程化以获得本文所述的期望的生理学和农艺学特征。在优选的实施方案中,用于工程化的感兴趣的植物和植物细胞包括但不限于那些单子叶和双子叶植物,例如作物,包括谷类作物(例如小麦、玉米、水稻、小米、大麦),水果作物(例如西红柿、苹果、梨、草莓、橙子),饲料作物(例如苜蓿),根茎类蔬菜作物(例如胡萝卜土豆、甜菜、山药),绿叶蔬菜作物(例如莴苣、菠菜);开花植物(例如矮牵牛、玫瑰、菊花),针叶树和松树(例如松树、云杉),用于植物修复的植物(例如重金属积累植物);油料作物(例如向日葵、油菜籽)和用于实验目的植物(例如拟南芥)。因此,该方法和CRISPR-Cas系统可用于广泛的植物,例如属于以下目的双子叶植物:Magniolales、八角目、樟目、胡椒目、Aristochiales、睡莲目、毛莨目、Papeverales、瓶子草科、昆栏树目、金缕梅目、Eucomiales、莱脱纳目、杨梅目、壳斗目、木麻黄目、石竹目、肉穗果目、蓼目、蓝雪目、五桠果目、山茶目、锦葵目、荨麻目、玉蕊目、紫堇目、杨柳目、白花菜目、欧石楠目、岩梅目、柿树目、报春花目、蔷薇目、豆目、川苔草目、小二仙草目、桃金娘目、山茱萸目、山龙眼目、檀香目、大花草目、卫矛目、大戟目、鼠李目、无患子目、胡桃目、牻牛儿苗目、远志目、伞形目、龙胆目、花葱目、唇形目、车前草目、玄参目、桔梗目、茜草目、川续断目和菊目;这些方法和CRISPR-Cas系统可以与单子叶植物一起使用,例如属于以下目的那些:泽泻目、水鳖目、茨藻目、霉草目、鸭跖草目、谷精草目、帚灯草目、禾本目、灯芯草目、莎草目、香蒲目、凤梨目、姜目、槟榔目、环花目、露兜树目、天南星目、Lilliales和兰目,或属于裸子植物的植物,例如属于以下目的那些:松目、银杏目、苏铁目、南洋杉目、Cupressales和买麻藤目。
本文所述的RNA靶向CRISPR系统和使用方法可用于广泛的植物物种,包括在下文的双子叶植物、单子叶植物或裸子植物属的非限制性列表中:颠茄属、油丹属、槚如树属、花生属、琼楠属、芸苔属、红花属、木防己属、巴豆属、甜瓜属、柑橘属、西瓜属、辣椒属、长春花属、椰子属、咖啡属、南瓜属、胡萝卜属、杜氏木属、花菱草属、榕属、草莓属、海罂粟属、大豆属、棉属、向日葵属、橡胶树属、莨菪属、莴苣属、卷枝藤属、亚麻属、木姜子属、番茄属、羽扇豆属、木薯属、Majorana、苹果属、苜蓿属、烟草属、木犀榄属、银胶菊属、罂粟属、鳄梨属、菜豆属、黄连木属、豌豆属、梨属、李属、萝卜属、蓖麻属、千里光属、风龙属、千金藤属、芥子属、茄属、可可属、三叶草属、胡芦巴属、蚕豆属、蔓长春花属、葡萄属(Vilis)和豇豆属;和葱属、须芒草属、剪股颖属(Aragrostis)、天门冬属、燕麦属、狗牙根属、油棕属、羊茅属、黑麦草属、萱草属、大麦属、浮萍属、毒麦属、芭蕉属、稻属、黍属、Pannesetum、梯牧草属、早熟禾属、黑麦属、高粱属、小麦属、玉蜀黍属、冷杉属、杉木属、麻黄属、云杉属、松属和黄杉属。
RNA靶向CRISPR系统和使用方法也可用于广泛的“藻类”或“藻类细胞”;包括例如选自多种真核门的藻类,包括红藻(红藻),绿藻(绿藻),褐藻(硅藻),硅藻(硅藻),鞭毛藻和甲藻以及原核门蓝藻(蓝绿藻)。术语“藻类”包括例如选自以下的藻类:双眉藻属、鱼腥藻属、Anikstrodesmis、葡萄藻属、角毛藻属、衣藻属、小球藻属、绿球藻属、小环藻属、细柱藻属、杜氏藻属、Emiliana、眼虫藻属、红球藻属、等鞭金藻属、单鞭金藻属、单针藻属、微球藻、拟微绿球藻属、舟形藻属、肾鞭藻属、肾爿藻属、菱形藻属、节球藻属、念珠藻属、棕鞭藻属(Oochromonas)、卵囊藻属、Oscillartoria、巴夫藻属、褐指藻属、扁藻属、颗石藻属、紫菜属、假鱼腥藻属、塔胞藻属、裂丝藻属、聚球藻属、集胞藻属、四爿藻属、海链藻属和束毛藻属。
可以根据本发明的方法处理植物的一部分,即“植物组织”,以产生改良的植物。植物组织还包括植物细胞。如本文所用的术语“植物细胞”是指活体植物的个体单位,在完整的整株植物中或在体外组织培养物中生长的分离形式,在培养基或琼脂上,在生长培养基或缓冲液中悬浮或作为更高组织的单元的一部分,例如植物组织,植物器官或整株植物。
“原生质体”是指使用例如机械或酶的方法完全或部分除去其保护性细胞壁的植物细胞,从而产生活植物的完整生物化学感受态单元,其可以在适当的生长条件下重建其细胞壁、增殖并且再生成长为整个植物。
术语“转化”广泛地指通过借助于农杆菌或多种化学或物理方法之一导入DNA来对植物宿主进行遗传修饰的过程。如本文所用,术语“植物宿主”是指植物,包括植物的任何细胞、组织、器官或后代。可转化许多合适的植物组织或植物细胞,包括但不限于原生质体、体细胞胚、花粉、叶、幼苗、茎、愈伤组织、匍匐茎、微块茎和枝条。植物组织还指这种植物、种子、后代、繁殖体的任何克隆,无论是有性还是无性生成,以及任何这些的后代,例如插条或种子。
如本文所用的术语“转化的”是指其中已经导入了外源DNA分子(例如构建体)的细胞、组织、器官或生物体。导入的DNA分子可以整合到受体细胞、组织、器官或生物体的基因组DNA中,使得导入的DNA分子传递给随后的后代。在这些实施方案中,“转化的”或“转基因的”细胞或植物还可以包括细胞或植物的后代和由育种程序产生的后代,所述育种程序使用这样的转化植物作为杂交亲本并且表现出由导入的DNA分子的存在而产生的改变的表型。优选地,转基因植物是可育的并且能够通过有性繁殖将导入的DNA传递给后代。
术语“后代”,例如转基因植物的后代,是由植物或转基因植物出生、产生或衍生的后代。导入的DNA分子也可以瞬时导入受体细胞,使得导入的DNA分子不被之后的后代继承,因此不被认为是“转基因的”。因此,如本文所用,“非转基因的”植物或植物细胞是不含稳定整合到其基因组中的外源DNA的植物。
如本文所用的术语“植物启动子”是能够在植物细胞中起始转录的启动子,无论其来源是否是植物细胞。示例性的合适的植物启动子包括但不限于从植物、植物病毒和细菌例如农杆菌或根瘤菌获得的那些,其包含在植物细胞中表达的基因。
如本文所用,“真菌细胞”是指真菌界内的任何类型的真核细胞。真菌界内的门包括子囊菌门、担子菌门、芽枝霉门、壶菌门、球囊菌门、微孢子虫和新丽鞭毛菌门。真菌细胞可包括酵母、霉菌和丝状真菌。在一些实施方案中,真菌细胞是酵母细胞。
如本文所用,术语“酵母细胞”是指子囊菌门(Ascomycota)和担子菌门(Basidiomycota)内的任何真菌细胞。酵母细胞可包括出芽酵母细胞、裂殖酵母细胞和霉菌细胞。不限于这些生物,在实验室和工业环境中使用的许多类型的酵母是子囊菌门的一部分。在一些实施方案中,酵母细胞是酿酒酵母(S.cerervisiae)、马克斯克鲁维酵母(Kluyveromyces marxianus)或东方伊萨酵母(Issatchenkia orientalis)细胞。其他酵母细胞可以包括但不限于念珠菌属(例如,白色念珠菌)、耶氏酵母属(例如,解脂耶氏酵母(Yarrowia lipolytica))、毕赤酵母属(例如,巴斯德毕赤酵母(Pichia pastoris))、克鲁维酵母属(例如,乳酸克鲁维酵母和马克斯克鲁维酵母)、脉孢菌属(Neurospora spp.)(例如,粗糙脉孢菌(Neurospora crassa))、镰刀菌属(Fusarium spp.)(例如,尖孢镰刀菌(Fusarium oxysporum))和伊萨酵母属(Issatchenkia spp.)(例如,东方伊萨酵母(Issatchenkia orientalis),又名Pichia kudriavzevii和Candidaacidothermophilum)。在一些实施方案中,真菌细胞是丝状真菌细胞。如本文所用,术语“丝状真菌细胞”是指生长成细丝(即菌丝或菌丝体)的任何类型的真菌细胞。丝状真菌细胞的实例可包括但不限于曲霉属(Aspergillus spp.)(例如,黑曲霉(Aspergillus niger))、木霉属(Trichoderma spp.)(例如,里氏木霉(Trichoderma reesei))、根霉属(Rhizopusspp.)(例如,米根霉(Rhizopus oryzae))和被孢霉属(Mortierella spp.)(例如,深黄被孢霉(Mortierella isabellina))。
在一些实施方案中,真菌细胞是工业菌株。如本文所用,“工业菌株”是指在工业过程(例如,以商业或工业规模生产产品)中使用或从工业过程中分离的任何真菌细胞菌株。工业菌株可以指通常用于工业过程的真菌物种,或者它可以指也可以用于非工业目的(例如,实验室研究)的真菌物种的分离物。工业过程的实例可包括发酵(例如,在食品或饮料产品的生产中)、蒸馏、生物燃料生产、化合物的生产和多肽的生产。工业菌株的实例可包括但不限于JAY270和ATCC4124。
在一些实施方案中,真菌细胞是多倍体细胞。如本文所用,“多倍体”细胞可以指其基因组以多于一个拷贝存在的任何细胞。多倍体细胞可以指天然发现为多倍体状态的细胞类型,或者它可以指已经被诱导以多倍体状态存在的细胞(例如,通过特异性调节、改变、失活、激活或改良减数分裂、胞质分裂或DNA复制)。多倍体细胞可以指整个基因组是多倍体的细胞,或者它可以指在特定的感兴趣基因组基因座中是多倍体的细胞。不希望受理论束缚,据信指导RNA的丰度相对于单倍体细胞更可能是多倍体细胞的基因组工程中的限速成分,因此使用本文所述的Cas13b CRISPR系统的方法可以利用使用某种真菌细胞类型。
在一些实施方案中,真菌细胞是二倍体细胞。如本文所用,“二倍体”细胞可以指其基因组以两个拷贝存在的任何细胞。二倍体细胞可以指天然发现为二倍体状态的细胞类型,或者它可以指已经被诱导以二倍体状态存在的细胞(例如,通过特异性调节、改变、失活、激活或改良减数分裂、胞质分裂或DNA复制)。例如,酿酒酵母菌株S228C可以维持在单倍体或二倍体状态。二倍体细胞可以指整个基因组是二倍体的细胞,或者它可以指在特定的基因组基因座中是二倍体的细胞。在一些实施方案中,真菌细胞是单倍体细胞。如本文所用,“单倍体”细胞可以指其基因组以一个拷贝存在的任何细胞。单倍体细胞可以指天然发现为单倍体状态的细胞类型,或者它可以指已经被诱导以单倍体状态存在的细胞(例如,通过特异性调节、改变、失活、激活或改良减数分裂、胞质分裂或DNA复制)。例如,酿酒酵母菌株S228C可以维持在单倍体或二倍体状态。单倍体细胞可以指整个基因组是单倍体的细胞,或者它可以指在特定的感兴趣基因组基因座中是单倍体的细胞。
如本文所用,“酵母表达载体”是指含有一种或多种编码RNA和/或多肽的序列的核酸,并且可以进一步含有控制核酸表达的任何所需元件,以及能够在酵母细胞内复制和维持表达载体的任何元件。很多合适的酵母表达载体及其特征是本领域已知的;例如,在Yeast Protocols,2nd edition,Xiao,W.,ed.(Humana Press,New York,2007)及Buckholz,R.G.和Gleeson,M.A.(1991)Biotechnology(NY)9(11):1067-72中描述了各种载体和技术。酵母载体可以包含但不限于着丝粒(CEN)序列、自主复制序列(ARS)、可操作地连接至感兴趣的序列或基因的启动子(例如,RNA聚合酶III启动子)、终止子(例如RNA聚合酶III终止子)、复制起始子和标志物基因(例如,营养缺陷型、抗生素或其他选择标志物)。用于酵母的表达载体的实例可包括质粒、酵母人工染色体、2μ质粒、酵母整合质粒、酵母复制质粒、穿梭载体和附加型质粒。
在植物和植物细胞的基因组中稳定整合RNA靶向CRISPR系统组分
在特定的实施方案中,设想导入编码RNA靶向CRISPR系统的组分的多核苷酸以稳定整合到植物细胞的基因组中。在这些实施方案中,转化载体或表达系统的设计可以根据指导RNA和/或RNA靶向基因表达的时间、地点和条件进行调整。
在特定的实施方案中,设想将RNA靶向CRISPR系统的组分稳定地导入植物细胞的基因组DNA中。另外地或替代地,设想将RNA靶向CRISPR系统的组分导入以稳定整合到植物细胞器的DNA中,例如但不限于质体、线粒体或叶绿体。
用于稳定整合到植物细胞基因组中的表达系统可含有一种或多种以下元件:可用于在植物细胞中表达指导RNA和/或RNA靶向酶的启动子元件;5’非翻译区以增强表达;内含子元件以进一步增强某些细胞(例如单子叶细胞)中的表达;多克隆位点以提供方便的限制性位点用于插入一个或多个指导RNA和/或RNA靶向基因序列和其他期望元件;和3’非翻译区以提供表达的转录物的有效终止。
表达系统的元件可以在一个或多个表达构建体上,所述表达构建体是环状的,例如质粒或转化载体,或非环状的,例如线性双链DNA。
在特定的实施方案中,Cfp1 CRISPR表达系统至少包括:
(a)编码与植物中的靶序列杂交的指导RNA(gRNA)的核苷酸序列,并且其中指导RNA包含指导序列和直接重复序列,和
(b)编码Cpf1蛋白的核苷酸序列,
其中组分(a)或(b)位于相同或不同的构建体上,并且由此不同的核苷酸序列可以在植物细胞中相同或不同的可操作调控元件的控制下。
可以通过各种常规技术将含有RNA靶向CRISPR系统的组分的DNA构建体导入植物、植物部分或植物细胞的基因组中。该过程通常包括如下步骤:选择合适的宿主细胞或宿主组织,将构建体导入至宿主细胞或宿主组织,以及从其再生植物细胞或植物。
在特定的实施方案中,可以使用例如但不限于电穿孔、显微注射,植物细胞原生质体的气溶胶束注射的技术将DNA构建体导入植物细胞中,或者可以使用基因枪方法(例如作为DNA粒子轰击(还参见Fu等,Transgenic Res.2000 Feb;9(1):11-9))将DNA构建体直接导入植物组织。粒子轰击的基础是朝向细胞加速包覆感兴趣的基因的颗粒,导致颗粒穿透原生质体并且通常稳定地整合到基因组中(参见,例如,Klein等,Nature(1987),Klein等,Bio/Technology(1992),Casas等,Proc.Natl.Acad.Sci.USA(1993))。
在特定的实施方案中,可以通过农杆菌介导的转化将含有RNA靶向CRISPR系统的组分的DNA构建体导入植物中。DNA构建体可以与合适的T-DNA侧翼区组合,并导入常规的根癌农杆菌(Agrobacterhmi tumefaciens)宿主载体中。可以通过感染植物或通过将植物原生质体与含有一种或多种Ti(肿瘤诱导)质粒的农杆菌细菌孵育,将外源DNA引入植物的基因组中(参见,例如,Fraley等,(1985),Rogers等,(1987)和U.S.Pat.No.5,563,055)。
植物启动子
为了确保在植物细胞中的适当表达,本文所述的Cas13b CRISPR系统的组分通常置于植物启动子(即在植物细胞中可操作的启动子)的控制下。设想使用不同类型的启动子。
组成型植物启动子是能够在植物的所有或几乎所有发育阶段期间在所有或几乎所有植物组织中表达其控制的开放阅读框(ORF)的启动子(称为“组成型表达”)。组成型启动子的一个非限制性实例是花椰菜花叶病毒35S启动子。本发明设想了修饰RNA序列的方法,且因此也设想了调节植物生物分子的表达。因此,在本发明的特定实施方案中,将RNA靶向CRISPR系统的一个或多个元件置于可调节的启动子的控制下是有利的。“受调节的启动子”是指不是以组成型而是以时间和/或空间调节的方式引导基因表达的启动子,并且包括组织特异性、组织优选和诱导型启动子。不同的启动子可以引导在不同组织或细胞类型中的,或在不同发育阶段处的,或响应于不同环境条件的基因表达。在特定的实施方案中,一种或多种RNA靶向CRISPR组分在组成型启动子(例如,花椰菜花叶病毒35S启动子)的控制下表达。组织优选的启动子可用于靶向特定植物组织内某些细胞类型的增强表达,例如叶子或根中的维管细胞或种子的特定细胞中。用于RNA靶向CRISPR系统的特定启动子的实例见于Kawamata等,(1997)Plant Cell Physiol 38:792-803;Yamamoto等,(1997)Plant J 12:255-65;Hire等,(1992)Plant Mol Biol 20:207-18;Kuster等,(1995)Plant Mol Biol29:759-72和Capana等,(1994)Plant Mol Biol 25:681-91。
可诱导的并且允许基因编辑或基因表达的时空控制的启动子的实例可以使用能量形式。能量形式可包括但不限于声能、电磁辐射、化学能和/或热能。诱导型系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交转录激活系统(FKBP、ABA等)或光诱导型系统(光敏色素,LOV结构域或隐花色素),例如,以序列特异性的方式引导转录活性变化的光诱导型转录效应子(LITE)。光诱导型系统的组分可包括RNA靶向Cas13b、光响应性细胞色素异源二聚体(例如来自拟南芥)和转录激活/抑制结构域。诱导型DNA结合蛋白的其他实例及其使用方法在US 61/736465和US 61/721,283中提供,其通过整体引用并入本文。
在特定的实施方案中,瞬时或诱导型表达可以通过使用例如化学调节的启动子来实现,即由此外源化学物质的应用诱导基因表达。基因表达的调节也可以通过化学抑制型启动子获得,其中化学物质的应用抑制基因表达。化学诱导型启动子包括但不限于由苯磺酰胺除草剂安全剂激活的玉米ln2-2启动子(De Veylder等,(1997)Plant Cell Physiol38:568-77)、由用作芽前除草剂的疏水亲电子化合物激活的玉米GST启动子(GST-U-27,W093/01294)和由水杨酸激活的烟草PR-1a启动子(Ono等,(2004)Biosci BiotechnolBiochem 68:803-7)。受抗生素调节的启动子,例如四环素诱导型和四环素抑制型启动子(Gatz等,(1991)Mol Gen Genet 227:229-37;U.S.专利No.5,814,618和5,789,156)也可用于本文。
易位到特定植物细胞器和/或在特定植物细胞器中的表达
表达系统可包含用于在特定植物细胞器中易位和/或表达的元件。
叶绿体靶向
在特定的实施方案中,设想RNA靶向CRISPR系统用于特异性改变叶绿体基因的表达和/或翻译或确保在叶绿体中表达。出于该目的,使用叶绿体转化方法或将RNA靶向CRISPR组分区隔至叶绿体。例如,在质体基因组中导入遗传修饰可以减少生物安全性问题,例如通过花粉的基因流动。
叶绿体转化的方法是本领域已知的,包括粒子轰击、PEG处理和显微注射。另外,如WO2010061186中所述,可以使用涉及将转化盒从核基因组易位至质体的方法。
可替代地,设想将一种或多种RNA靶向CRISPR组分靶向至植物叶绿体。这通过在表达构建体中整合到编码叶绿体转运肽(CTP)或质体转运肽的序列来实现,所述序列可操作地连接至编码RNA靶向CRISPR蛋白的序列的5’区。在易位到叶绿体中的过程中,CTP被除去。表达蛋白的叶绿体靶向是本领域技术人员熟知的(参见例如Protein Transport intoChloroplasts,2010,Annual Review of Plant Biology,Vol.61:157-180)。在这样的实施方案中,还期望将一个或多个指导RNA靶向至植物叶绿体。可用于通过叶绿体定位序列将指导RNA易位到叶绿体中的方法和构建体描述于例如US 20040142476中,其通过引用并入本文。这些构建体的变体可以整合到本发明的表达系统中,以有效地易位RNA靶向-指导RNA。
在藻类细胞中导入编码CRISPR-RNA靶向系统的多核苷酸。
转基因藻类(或其他植物例如油菜)可特别用于植物油或生物燃料例如醇(尤其是甲醇和乙醇)或其他产品的生产。这些可以被设计成表达或过表达高含量的油或醇以用于石油或生物燃料工业。
US 8945839描述了使用Cas9工程化微藻(莱茵衣藻(Chlamydomonasreinhardtii)细胞)种)的方法。使用类似的工具,本文描述的RNA靶向CRISPR系统的方法可以应用于衣藻的种和其他藻类。在特定的实施方案中,将RNA靶向蛋白和指导RNA导入藻类中,使用在组成型启动子例如Hsp70A-Rbc S2或β2-微管蛋白的控制下表达RNA靶向蛋白的载体来表达。任选地使用含有T7启动子的载体递送指导RNA。或者,可以将RNA靶向mRNA和体外转录的指导RNA递送至藻类细胞。电穿孔方案是技术人员可得的,例如来自Gene ArtChlamydomonas Engineering试剂盒的标准推荐方案。
在酵母细胞中导入编码RNA靶向组分的多核苷酸
在特定的实施方案中,本发明涉及RNA靶向CRISPR系统在酵母细胞中用于RNA编辑的用途。可以用于导入编码RNA靶向CRISPR系统组分的多核苷酸的转化酵母细胞的方法是技术人员所公知的,并且通过Kawai等,2010,Bioeng Bugs.2010Nov-Dec;1(6):395-403综述。非限制性实例包括通过乙酸锂处理(其可进一步包括载体DNA和PEG处理)、轰击或通过电穿孔转化酵母细胞。
在植物和植物细胞中RNA靶向CRISP系统组分的瞬时表达
在特定的实施方案中,设想指导RNA和/或RNA靶向基因在植物细胞中瞬时表达。在这些实施方案中,RNA靶向CRISPR系统仅在指导RNA和RNA靶向蛋白存在于细胞中时才能确保RNA靶分子的修饰,从而可以进一步控制基因表达。由于RNA靶向酶的表达是瞬时的,从这种植物细胞再生的植物通常不含外源DNA。在特定的实施方案中,RNA靶向酶由植物细胞稳定表达,并且指导序列被瞬时表达。
在特别优选的实施方案中,可以使用植物病毒载体将RNA靶向CRISPR系统组分导入植物细胞中(Scholthof等1996,Annu Rev Phytopathol.1996;34:299-323)。在其他特定的实施方案中,病毒载体是来自DNA病毒的载体。例如,双粒病毒(例如,卷心菜叶卷曲病毒、豆黄矮病毒、小麦矮化病毒、西红柿叶卷曲病毒、玉米条纹病毒、烟草叶卷曲病毒或西红柿金花叶病毒)或纳米病毒(例如,蚕豆坏死黄色病毒)。在其他特定的实施方案中,病毒载体是来自RNA病毒的载体。例如,烟草脆裂病毒组(tobravirus)(例如,烟草拨浪鼓病毒、烟草花叶病毒)、马铃薯x病毒组(potexvirus)(例如,马铃薯病毒X)或大麦病毒属(例如,大麦条纹花叶病毒)。植物病毒的复制基因组是非整合性载体,这在避免产生GMO植物方面是有意义的。
在特定的实施方案中,用于瞬时表达RNA靶向CRISPR构建体的载体是例如pEAQ载体,其适合于在原生质体中农杆菌介导的瞬时表达(Sainsbury F.等,Plant BiotechnolJ.2009Sep;7(7):682-93)。使用修饰的甘蓝叶卷曲病毒(CaLCuV)载体在表达Cas13b的稳定转基因植物中表达gRNA,证实基因组位置的精确靶向(参见Scientific Reports 5,Article number:14926(2015),doi:10.1038/srepl4926)。
在特定的实施方案中,可以将编码指导RNA或crRNA和/或RNA靶向基因的双链DNA片段瞬时导入至植物细胞中。在这些实施方案中,提供足量的导入的双链DNA片段以修饰细胞中的RNA分子,但在预期的一段时间后或在一次或多次细胞分裂后不会持续存在。植物中直接DNA转移的方法是本领域技术人员已知的(参见,例如,Davey等Plant Mol Biol.1989Sep;13(3):273-85)。
在其他的实施方案中,将编码RNA靶向蛋白的RNA多核苷酸导入植物细胞中,然后由宿主细胞翻译和加工,产生足够量的蛋白质以修饰细胞的RNA分子(存在至少一种指导RNA的情况下),但在预期的一段时间后或在一次或多次细胞分裂后不会持续存在。用于将mRNA导入植物原生质体以瞬时表达的方法是本领域技术人员已知的(参见,例如,Gallie,Plant Cell Reports(1993),13;119-122)。还设想了上述不同方法的组合。
将RNA靶向CRISPR组分递送至植物细胞
在特定的实施方案中,令人感兴趣的是将RNA靶向CRISPR系统的一种或多种组分直接递送至植物细胞。这对于非转基因植物的产生是尤其有意义的。在特定的实施方案中,一种或多种RNA靶向组分在植物或植物细胞外制备并递送至细胞。例如,在特定实施方案中,RNA靶向蛋白在导入植物细胞之前在体外制备。RNA靶向蛋白可通过本领域技术人员已知的各种方法制备,包括重组生产。表达后,对RNA靶向蛋白进行分离、重折叠(如果需要)、纯化并任选地处理以除去任何纯化标签,例如His标签。一旦获得粗制的、部分纯化的或更完全纯化的RNA靶向蛋白,就可以将所述蛋白导入植物细胞中。
在特定的实施方案中,将RNA靶向蛋白与靶向感兴趣RNA的指导RNA混合以形成预组装的核糖核蛋白。
可以通过电穿孔、通过被RNA靶向相关基因产物包被的颗粒进行轰击、通过化学转染或通过细胞膜的一些其他转运方式将个体组分或预组装的核糖核蛋白导入植物细胞中。例如,已经证实用预组装的CRISPR核糖核蛋白转染植物原生质体确保了植物基因组的靶向修饰(如Woo等Nature Biotechnology,2015;DOI:10.1038/nbt.3389所述)。可以对这些方法进行改变以实现植物中RNA分子的靶向修饰。
在特定的实施方案中,使用纳米颗粒将RNA靶向CRISPR系统组分导入植物细胞中。可以将作为蛋白质或核酸或其组合的组分加载到纳米颗粒上或包装在纳米颗粒中并应用于植物(例如描述于WO2008042156和US20130185823中)。特别是,如WO2015089419中所述,本发明的实施方案包括上载或包装编码RNA靶向蛋白的DNA分子、编码指导RNA的DNA分子和/或分离的指导RNA的纳米颗粒。
将RNA靶向CRISPR系统的一种或多种组分导入植物细胞的其他方法是使用细胞穿透肽(CPP)。因此,本发明的特定的实施方案包括含有与RNA靶向蛋白连接的细胞穿透肽的组合物。在本发明的特定的实施方案中,RNA靶向蛋白和/或指导RNA与一种或多种CPP偶联以有效地将它们转运到植物原生质体内(Ramakrishna(2014)Genome Res.2014Jun;24(6):1020-7,对于人细胞中的Cas9)。在其他的实施方案中,RNA靶向基因和/或指导RNA由一种或多种环状或非环状DNA分子编码,所述DNA分子偶联至一种或多种用于植物原生质体递送的CPP。然后将植物原生质体再生成植物细胞并进一步再生植物。CPP通常被描述为少于35个氨基酸的短肽,其源自蛋白质或来自能够以受体非依赖性方式跨细胞膜转运生物分子的嵌合序列。CPP可以是阳离子肽、具有疏水序列的肽、两亲性肽、具有富含脯氨酸和抗微生物序列的肽,以及嵌合或二分肽(Pooga和Langel 2005)。CPP能够穿透生物膜并因此触发各种生物分子移动穿过细胞膜进入细胞质并改善其细胞内途径,从而促进生物分子与靶标的相互作用。CPP的实例包括:Tat(HIV1型病毒复制所需的核转录激活蛋白)、穿透蛋白、Kaposi成纤维细胞生长因子(FGF)信号肽序列、整联蛋白β3信号肽序列;多精氨酸多肽Args序列、富含鸟嘌呤的分子转运蛋白、甜箭肽等。
设想用于植物、藻类或真菌应用的靶RNA
靶RNA,即目的RNA,是被本发明靶向的RNA,导致募集到靶RNA上的目标靶位点和RNA靶向蛋白在靶RNA上的目标靶位点处的结合。靶RNA可以是RNA的任何合适形式。在一些实施方案中,这可以包括mRNA。在其他实施方案中,靶RNA可以包括转移RNA(tRNA)或核糖体RNA(rRNA)。在其他实施方案中,靶RNA可以包括干扰RNA(RNAi)、微RNA(miRNA)、微开关、微酶(microzymes)、卫星RNA和RNA病毒。靶RNA可以位于植物细胞的细胞质中,或位于细胞核中或植物细胞器中,例如线粒体、叶绿体或质体中。
在特定的实施方案中,RNA靶向CRISPR系统用于切割RNA或另外地抑制RNA表达。
RNA靶向CRISPR系统用于通过RNA调节来调节植物基因表达的用途
RNA靶向蛋白还可与合适的指导RNA一起用于通过控制RNA加工而靶向基因表达。RNA加工的控制可以包括RNA加工反应,如RNA剪接,包括可选剪接;病毒复制(特别是植物病毒,包括植物中的类病毒体)和tRNA生物合成。RNA靶向蛋白与合适的指导RNA的结合也可用于控制RNA激活(RNAa)。RNAa导致促进基因表达,因此通过破坏或减少RNAa且因此基因表达的促进减少的方式可以实现对基因表达的控制。
本发明的RNA靶向效应蛋白可以进一步用于植物中的抗病毒活性,特别是针对RNA病毒。可以使用对所选病毒RNA序列选择性的合适的指导RNA将效应蛋白靶向于病毒RNA。特别地,效应蛋白可以是切割RNA如单链RNA的活性核酸酶。因此,提供了本发明的RNA靶向效应蛋白作为抗病毒剂的用途。可以以这种方式抵抗的病毒的实例包括但不限于烟草花叶病毒(TMV)、番茄斑萎病毒(TSWV)、黄瓜花叶病毒(CMV)、马铃薯病毒Y(PVY)、花椰菜花叶病毒(CaMV)(RT病毒)、李痘病毒(PPV)、雀麦草花叶病毒(BMV)和马铃薯X病毒(PVX)。
作为靶向基因修饰的替代方案,在本文中进一步描述了调节植物、藻类或真菌中的RNA表达的实例。
特别感兴趣的是通过mRNA的调控切割的基因表达的受调控控制。这可以通过将RNA靶向的元件置于如本文所述的受调控启动子的控制下来实现。
RNA靶向CRISPR系统恢复tRNA分子的功能性的用途
Pring等人描述了植物线粒体和叶绿体中的RNA编辑,其改变mRNA序列以编码与DNA不同的蛋白质(Plant Mol.Biol.(1993)21(6):1163-1170。doi:10.1007/BF00023611)。在本发明的特定实施方案中,可以将特异性靶向的线粒体和叶绿体mRNA的RNA靶向CRISPR系统的元件导入植物或植物细胞中以在这种植物细胞器中表达不同的蛋白质,从而模拟体内发生的过程。
RNA靶向CRISPR系统作为RNA干扰的替代方式以抑制RNA表达的用途
RNA靶向CRISPR系统的具有类似于RNA抑制或RNA干扰的用途,因此也可以代替此类方法。在特定的实施方案中,本发明的方法包括使用RNA靶向CRISPR作为例如干扰核糖核酸(如siRNA或shRNA或dsRNA)的替代物。本文进一步描述了作为靶向基因修饰的替代方案抑制植物、藻类或真菌中RNA表达的实例。
RNA靶向CRISPR系统控制RNA干扰的用途
对干扰RNA或miRNA的控制可通过减少体内或体外干扰RNA或miRNA的寿命来帮助减少那些方法所看到的脱靶效应(OTE)。在特定的实施方案中,靶RNA可以包括干扰RNA,即参与RNA干扰途径的RNA。在其他实施方案中,靶RNA可以包括微RNA(miRNA)或双链RNA(dsRNA)。
在其他特定的实施方案中,如果RNA靶向蛋白和合适的指导RNA选择性地表达(例如在受调控的启动子的控制下空间或时间地表达,例如组织特异性的或细胞周期特异性的启动子和/或增强子),这可用于在这些细胞中“保护”细胞或系统(体内或体外)免于RNAi的影响。这可能可用于其中不需要RNAi的邻近组织或细胞中或者用于比较其中表达或不表达效应蛋白和合适的指导RNA(即,分别其中RNAi不受控制和其中受到控制)的细胞或组织。RNA靶向蛋白可用于控制或结合包含RNA或由RNA组成的分子,例如核酶、核糖体或核糖开关。本发明的实施方案中,指导RNA可以将RNA靶向蛋白募集到这些分子,使得RNA合成蛋白能够与它们结合。
本发明的RNA靶向CRISPR系统无需过度实验即可用于本公开的植物原位RNAi技术领域,包括虫害防治、植物病害管理和除草剂抗性管理,以及植物分析中和其他应用(例如,参见Kim等,Pesticide Biochemistry and Physiology(Impact Factor:2.01).01/2015;120.DOI:10.1016/j.pestbp.2015.01.002;Sharma等Academic Journals(2015),Vol.12(18)pp2303-2312);Green J.M,inPest Management Science,Vol70(9),pp 1351-1357),因为本申请提供了用于该系统的有意工程化(informed engineering)的基础。
RNA靶向CRISPR系统在植物、藻类和真菌中改变核糖开关和控制代谢的用途
核糖开关(也称为aptozymes)是信使RNA的调控片段,其结合小分子并进而调节基因表达。这种机制允许细胞感知这些小分子的细胞内浓度。特定的核糖开关通常通过改变这种基因的转录、翻译或剪接来调节其相邻基因。因此,在本发明的特定实施方案中,设想通过使用RNA靶向蛋白与合适的指导RNA结合以靶向核糖开关来控制核糖开关活性。这可以是通过核糖开关的切割或结合到核糖开关。在特定实施方案中,设想降低核糖开关活性。最近,表征了结合硫胺素焦磷酸(TPP)的核糖开关,并发现其调节植物和藻类中的硫胺素生物合成。此外,看起来该元件是植物中初级代谢的必需调节剂(Bocobza和Aharoni,PlantJ.2014Aug;79(4):693-703。doi:10.1111/tpj.12540。Epub 2014 Jun 17)。TPP核糖开关还存在于某些真菌中,如在粗糙脉孢菌中,其中它控制选择性剪接以条件性地产生上游开放阅读框(uORF),从而影响下游基因的表达(Cheah MT等,(2007)Nature 447(7143):497-500.doi:10.1038/nature05769)。本文所述的RNA靶向CRISPR系统可用于操纵植物、藻类或真菌中的内源核糖开关活性,并因此改变其控制的下游基因的表达。在特定实施方案中,RNA靶向CRISP系统可以用于在体内或体外测定核糖开关功能,以及用于研究其对于代谢网络的相关性。在特定实施方案中,RNA靶向CRISPR系统可以潜在地用于核糖开关的工程化,作为植物中的代谢物传感器和用于基因控制的平台。
RNA靶向CRISPR在用于植物、藻类或真菌的RNAi筛选中的用途
鉴定其敲低与表型改变有关的基因产物,可以通过RNAi筛选来询问生物学途径并鉴定组成部分。在本发明的特定实施方案中,还可通过使用本文所述的Guide 29或Guide30蛋白和合适的指导RNA在这些筛选上或期间施加控制,以去除或降低筛选中RNAi的活性,且因此恢复(先前受干扰的)基因产物的活性(通过消除或减少干扰/阻遏)。
RNA靶向分子用于体内或体外RNA分子可视化的用途
在特定的实施方案中,本发明提供了核酸结合系统。RNA与互补探针的原位杂交是一项强大的技术。通常,荧光DNA寡核苷酸用于通过杂交检测核酸。通过某些修饰,例如锁核酸(LNA),获得了提高的效率,但是仍然需要有效且通用的替代方案。这样,RNA靶向系统的标记元件可以用作原位杂交的有效和可适应的系统的替代方案。
RNA靶向CRISPR系统在植物和酵母中的进一步应用
RNA靶向CRISPR系统在生物燃料生产中的用途
如本文使用的术语“生物燃料”是从植物和植物衍生的资源制成的替代燃料。可再生生物燃料可以从有机物中提取,其能量是通过碳固定过程获得的,或者是通过生物质的使用或转化而获得的。该生物质可以直接用于生物燃料,或者可以通过热转化、化学转化和生化转化转化为方便的含能量物质。这种生物质转化可以使燃料成为固体、液体或气体形式。有两种类型的生物燃料:生物乙醇和生物柴油。生物乙醇主要通过纤维素(淀粉)的糖发酵过程生产,其主要来源于玉米和甘蔗。另一方面,生物柴油主要生产自油料作物例如油菜籽、棕榈油和大豆。生物燃料主要用于运输。
增强用于生物燃料生产的植物特性
在特定的实施方案中,使用本文所述的RNA靶向CRISPR系统的方法用于改变细胞壁的性质以便于通过关键水解剂的接近而获得发酵种更高效的糖释放。在特定的实施方案中,纤维素和/或木质素的生物合成被修饰。纤维素是细胞壁的主要成分。纤维素和木质素的生物合成是共同调节的。通过降低植物中木质素的比例,可以增加纤维素的比例。在特定的实施方案中,本文描述的方法用于下调植物中的木质素生物合成,从而增加可发酵的碳水化合物。更特别是,本文描述的方法用于下调至少第一木质素生物合成基因,所述基因选自在WO2008064289A2中公开的4-香豆酸3-羟化酶(C3H)、苯丙氨酸氨裂解酶(PAL)、肉桂酸4-羟化酶(C4H)、羟基肉桂酰转移酶(HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰CoA3-O-甲基转移酶(CCoAOMT)、阿魏酸5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰辅酶A还原酶(CCR)、4-香豆酸-CoA连接酶(4CL)、木质素特异性糖基转移酶和醛脱氢酶(ALDH)。
在特定的实施方案中,本文所述的方法用于产生在发酵过程中产生低水平乙酸的植物物料(也参见WO 2010096488)。
修饰酵母用于生物燃料生产
在特定的实施方案中,本文提供的RNA靶向酶用于通过重组微生物生产生物乙醇。例如,RNA靶向酶可用于工程化微生物,例如酵母,以从可发酵糖产生生物燃料或生物聚合物,并任选地能够降解源自农业废物的植物衍生的木质纤维素作为可发酵糖的来源。更特别是,本发明提供了方法,由此RNA靶向CRISPR复合物用于改变生物燃料生产所需的内源基因的表达和/或修饰可能干扰生物燃料合成的内源基因。更特别是,所述方法涉及刺激将微生物例如酵母中一种或多种核苷酸序列的表达,所述核苷酸序列编码参与丙酮酸转化为乙醇或另一种感兴趣产物的酶。在特定的实施方案中,所述方法确保刺激允许微生物降解纤维素的一种或多种酶,例如纤维素酶的表达。在其他实施方案中,RNA靶向CRISPR复合物用于抑制与生物燃料生产途径竞争的内源性代谢途径。
修饰藻类和植物以生产植物油或生物燃料
T转基因藻类或其他植物例如油菜可特别用于生产植物油或生物燃料,例如醇(尤其是甲醇和乙醇)。这些可以被工程化以表达或过表达高含量的油或醇用于石油或生物燃料工业。
US 8945839描述了一种使用Cas9工程化微藻(莱茵衣藻细胞)物种的方法。使用类似的工具,本文描述的RNA靶向CRISPR系统的方法可以应用于衣藻物种和其他藻类。在特定的实施方案中,将RNA靶向效应蛋白和指导RNA导入藻类中,所述藻类使用在组成型启动子例如Hsp70A-Rbc S2或β2-微管蛋白的控制下表达RNA靶向效应蛋白的载体表达。使用含有T7启动子的载体递送指导RNA。或者,可以将体外转录的指导RNA递送至藻类细胞。电穿孔方案遵循Gene Art Chlamydomonas Engineering试剂盒的标准推荐方案。
RNA靶向酶在植物中的特别应用
在特定的实施方案中,本发明可以被用作在植物系统中用于病毒去除的疗法,因为其能够切割病毒RNA。先前在人体系统中的研究已证实利用CRISPR成功靶向单链RNA病毒,丙型肝炎病毒(A.Price等,Proc.Natl.Acad.Sci,2015)。这些方法也可以适应于在植物中使用RNA靶向CRISPR系统。
改良植物
本发明还提供通过本文提供的方法可获得的和已获得的植物和酵母细胞。通过本文所述方法获得的改良植物通过基因的修饰表达可能在食品或饲料生产中有用,例如,确保对植物害虫、除草剂、干旱、低温或高温、过量水等的耐受性。
通过本文所述方法获得的改良植物(特别是作物和藻类)通过表达比野生型中通常见到的更高的蛋白质、碳水化合物、营养或维生素水平可能在食品和饲料生产中有用。在这方面,改良植物,特别是豆类和块茎是首选。
例如,改良的藻类或其他植物(如油菜)在植物油或生物燃料(如酒精(特别是甲醇和乙醇)的生产中可能特别有用。这些可能被工程化成表达或过表达高水平的石油或酒精用于石油或生物燃料行业。
本发明还规定了植物的改良部分。植物部分包括但不限于叶子、茎、根、块茎、种子、内膜、卵泡和花粉。本文所设想的植物部分可能存活、不存活、可再生和/或不可再生。
本文还包括提供根据本发明方法生成的植物细胞和植物。由传统育种方法产生的包含遗传修饰的植物的配子、种子、胚胎、合子的或体细胞的、后代或杂交的植物也包含在本发明的范围之内。这样的植物可能含有插入或代替靶序列的异源或外来DNA序列。或者,这样的植物可能只含有一个或多个核苷酸的改变(突变、缺失、插入、置换)。因此,这样的植物只会因存在特定的修饰而不同于其祖植物。
在本发明的实施方案中,Cas13b系统用于工程化抗病原体的植物,例如通过产生对细菌、真菌或病毒引起的疾病的耐药性。在某些实施方案中,通过工程化作物来产生Cas13b系统,该系统将被害虫吞化,导致死亡,从而达到病原体的抗性。在本发明的实施方案中,Cas 13b系统用于工程化非生物应力耐受性。在另一个实施方案中,Cas 13b系统用于工程化干旱应力耐受性或盐应力耐受性,或冷或热应力耐受性。Younis等2014,Int.J.Biol.Sci.10;1150综述了植物育种方法的潜在靶标,所有这些靶标都可通过使用本文所述的Cas13b系统进行校正或改进。一些非限制的靶标作物包括Arabidops Zea maysis thaliana,Oryza sativa L,Prunus domestica L.,Gossypium hirsutum,Nicotianarustica,Zea mays,Medicago sativa,Nicotiana benthamiana and Arabidopsisthaliana
在本发明的实施方案中,Cas13b系统用于作物害虫的管理。例如,作物害虫中可操作的Cas13b系统可以从植物宿主表达,也可以直接转移到靶标,例如使用病毒载体。
在实施方案中,本发明提供了一种从异质非人类起始生物中有效产生同源生物的方法。在实施方案中,本发明用于植物育种。在另一实施方案中,本发明用于动物育种。在此类实施方案中,通过干扰至少一个参与双链断裂、染色体配对和/或链交换的靶标基因,通过防止或抑制重组,使纯合子生物(如植物或动物)产生。
CAS13B蛋白在优化功能RNA靶向系统中的应用
从一个方面来说,本发明提供了一个用于将功能组分具体递送到RNA环境的系统。这可以通过使用由本发明的RNA靶向效应蛋白组成的CRISPR系统确保,该系统允许对RNA的不同组分进行特定靶向。更具体地说,此类组分包括激活子或阻遏子,如RNA翻译、降解等的激活子或阻遏子。本系统的应用将在此其他位置进行说明。
根据本发明提供的非天然存在或工程化组合物包含指导RNA,所述指导RNA包含能够杂交到细胞的感兴趣基因组基因座的靶序列,其中指导RNA是通过插入一种或多个结合接头蛋白的不同的RNA序列来修饰。在特定的实施方案,RNA序列可以结合到两个或两个以上接头蛋白(例如适体),其中每个接头蛋白与一个或多个功能域相关。本文所述Cas13b酶的指导RNA显示能够进行指导RNA的修饰。在特定的实施方案中,指导RNA通过在直接重复或指导序列的3’插入直接重复的不同RNA序列5’进行修饰。当有多个功能域时,功能域可以相同或不同,例如,两个相同或两个不同的激活子或阻遏子。在一个方面,本发明提供了本文讨论的组合物,其中一个或多个功能域附着在RNA靶向酶上,使得当结合到靶标RNA时,功能域处于空间方向,允许功能域在其赋予功能中起作用;在一个方面,本发明提供了本文讨论的组合物,其中该组合物包含CRISPR-Cas复合物,其具有至少三个功能域,其中至少一个与RNA靶向酶相关,其中至少两个与gRNA相关。
因此,在一个方面,本发明提供非天然存在或工程化CRISPR-Cas13b复合物,其包含本文讨论的指导RNA和是RNA靶向酶的Cas13b,其中任选的RNA靶向酶包含至少一个突变,使得RNA靶向酶的核酸酶活性为不含所述至少一个突变的酶的不超过5%,和任选地一个或多个包含至少一个或多个核定位序列。在特定的实施方案,指导RNA被另外地或替代地修饰以确保仍然与RNA靶向酶结合,但防止RNA靶向酶的切割(如本文其他部分详述)。
在特定的实施方案,RNA靶向酶是Cas13b酶,其具有不含至少一个突变的Cas13b酶相比97%或100%的降低的核酸酶活性。在一个方面,本发明提供了本文讨论的组合物,其中Cas13b酶包含两个或两个以上突变,如本文所述。
在特定的实施方案中,如上文所述,提供包括两个或多个功能域的RNA靶向系统。在特定的实施方案中,两个或多个功能域是异源功能域。在特定的实施方案,该系统包括接头蛋白,其是包含功能域的融合蛋白,融合蛋白任选地包含接头蛋白和功能域之间的连接子。在特定的实施方案中,连接子包括GlySer连接子。此外,或者另外,一个或多个功能域通过连接子(任选地地是GlySer连接子)连接到RNA效应蛋白。在特定的实施方案中,一个或多个功能域通过一个或两个HEPN域附着在RNA靶向酶上。
在某方面,本发明提供了一种本文讨论的组合物,其中与接头蛋白或RNA靶向酶相关的一个或多个功能域是能够激活或抑制RNA翻译的结构域。在一个方面,本发明提供了本文讨论的组合物,其中至少一个或多个与接头蛋白相关的功能域具有一种或多种活性,包括甲基酶活性、脱甲基酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性RNA切割活性、DNA切割活性或核酸结合活性,或分子开关活性或化学诱导性或光诱导性。
从一个方面来说,本发明提供了一个本文讨论的组合物,其包含适体序列。在特定的实施方案中,适体序列是对同一接头蛋白特异的两个或两个以上适体序列。在一个方面,本发明提供了本文讨论的组合物,其中适体序列是对不同接头蛋白特异的两个或两个以上适体序列。在一个方面,本发明提供了本文讨论的组合物,其中接头蛋白包括MS2,PP7、QP、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、Mil、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、PRR1。因此,在特定的实施方案,适体是从特异结合任一种如上列出的接头蛋白的结合蛋白中挑选的。在一个方面,本发明提供了本文讨论的组合物,其中细胞是真核细胞。在一个方面,本发明提供了本文讨论的组合物,其中真核细胞是哺乳动物细胞、植物细胞或酵母细胞,其中哺乳动物细胞任选地为小鼠细胞。在一个方面,本发明提供了本文讨论的组合物,其中哺乳动物细胞是人细胞。
在一个方面,本发明提供了上述讨论的组合物,其中有多个指导RNA或gRNA或crRNA,并且这些靶向不同的序列,由此当使用该组合物时,存在多重作用。在一个方面,本发明提供了一种组合物,其中存在通过插入与一种或多种接头蛋白结合的不同RNA序列来修饰的多种指导RNA或gRNA或crRNA。
在一个方面,本发明提供了本文讨论的组合物,其中与一个或多个功能域相关的一个或多个接头蛋白存在并结合至插入到指导RNA的不同RNA序列中。
在一个方面,本发明提供了本文讨论的组合物,其中指导RNA被修饰为具有至少一个非编码功能回路;例如,其中至少一个非编码功能回路是抑制性的;例如,其中至少有一个非编码功能回路包含Alu。
从一个方面来说,本发明提供了一种修饰基因表达的方法,包括施用至宿主或在宿主中体内表达一种或多种本文所讨论的组合物。
在一个方面,本发明提供了一种本文讨论的方法,包括提供组合物或用于编码的核酸分子,其中所述核酸分子与调控序列可操作性地连接,并在体内表达。在一个方面,本发明提供了一个本文讨论的方法,其中体内表达是通过慢病毒、腺病毒或AAV。
在一个方面,本发明提供了本文讨论的细胞的哺乳动物细胞系,其中细胞系任选地为人细胞系或小鼠细胞系。在一个方面,本发明提供了一个转基因哺乳动物模式,任选地小鼠,其中模式已经用本文讨论的组合物进行了转化,或者是所述转化子的后代。
从一个方面来说,本发明提供了编码指导RNA的核酸分子或靶向CRISPR-Cas13b复合物的RNA或本文所讨论述的组合物。在一个方面,本发明提供了一个载体,其包含:编码指导RNA(gRNA)或crRNA的核酸分子,该分子包含能够杂交到细胞中RNA靶序列的指导序列,其中通过插入结合两种或两种以上接头蛋白的不同RNA序列来修饰gRNA或crRNA的直接重复,其中每个接头蛋白与一个或多个功能域相关;或者,其中gRNA被修饰为至少有一个非编码功能回路。在一个方面,本发明提供包含编码以下的核酸分子的载体:非天然存在或工程化CRISPR-Cas 13b复合物组合物,其包含本文讨论的gRNA或crRNA,和RNA靶向酶,其中任选地RNA靶向酶包含至少一个突变,使得RNA靶向酶的核酸酶活性是没有所述至少一个突变的RNA靶向酶的不超过5%,和任选地一个或多个包含至少一个或多个核定位序列。在一个方面,载体可以进一步包含在真核细胞中可操作的调控元件,其与编码指导RNA(gRNA)或crRNA的核酸分子和/或编码RNA靶向酶和/或任选地核定位序列的核酸分子可操作地连接。
在一个方面,本发明提供了一个试剂盒,包括本文描述的一个或多个组分。在一些实施方案中,该试剂盒包括本文所述的载体系统和使用该试剂盒的说明。
在一个方面,本发明提供了一种筛选功能获得(GOF)或功能丧失(LOF)或筛选非编码RNA或潜在调节区域(例如增强子、阻遏子)的方法,其包括本文讨论的细胞系或本文讨论的模式的细胞,其包含或表达RNA靶向酶,并将本文讨论的组合物引入细胞系或模式的细胞中,其中gRNA或crRNA包含激活子或阻遏子,并分别监测GOF或LOF,引入gRNA或crRNA的哪些细胞包含激活子,或引入gRNA或crRNA的哪些细胞包含阻遏子。
从一个方面来说,本发明提供了非天然存在或工程化组合物的文库,各组合物都包含含有能够杂交到细胞中感兴趣的靶RNA序列的指导序列的RNA靶向CRISPR指导RNA(gRNA)或crRNA,RNA靶向酶,其中RNA靶向酶包含至少一个突变,使得RNA靶向酶的核酸酶活性不超过不含所述至少一个突变的RNA靶向酶的5%,其中gRNA或crRNA通过插入与一个或多个接头蛋白结合的不同RNA序列被修饰,并且其中接头蛋白与一个或多个功能域相关,其中组合物包含一个或多个或两个或更两个接头蛋白,其中每个蛋白质与一个或多个功能域相关,其中gRNA或crRNA包含含有多种RNA靶向指导RNA(gRNA)或crRNA的基因组宽文库。在一个方面,本发明提供了如本文所述的文库,其中RNA靶向RNA靶向酶具有与不含所述至少一个突变的RNA靶向酶相比至少97%或100%的降低的核酸酶活性。在一个方面,本发明提供了如本文所述的文库,其中接头蛋白是包含功能域的融合蛋白。在一个方面,本发明提供了本文所述的文库,其中gRNA或crRNA不是通过插入与一个或两个或更多个接头蛋白结合的不同RNA序列而修饰。在一个方面,本发明提供了如本文所述的文库,其中一个或两个或更多个功能域与RNA靶向酶相关。在一个方面,本发明提供了如本文所述的文库,其中细胞的细胞群是真核细胞群。在一个方面,本发明提供了本文所述的文库,其中真核细胞是哺乳动物细胞、植物细胞或酵母细胞。在一个方面,本发明提供了如本文所述的文库,其中哺乳动物细胞是人类细胞。在一个方面,本发明提供了如本文所述的文库,其中细胞群是胚胎干细胞(ES)群。
在一个方面,本发明提供了如本文所述的文库,其中靶标为约100或更多个RNA序列。在一个方面,本发明提供了如本文所述的文库,其中靶标为约1000或更多个RNA序列。在一个方面,本发明提供了如本文所述的文库,其中靶标为约20,000或更多个序列。在一个方面,本发明提供了如本文所述的文库,其中靶标是整个转录组。在一个方面,本发明提供了如本文所述的文库,其中靶标是靶序列的小组合(panel),其聚焦于相关或可取的通路上。在一个方面,本发明提供了如本文所述的文库,其中通路是免疫通路。在一个方面,本发明提供了如本文所述的文库,其中通路是细胞分裂通路。
在一个方面,本发明提供了一种生成包含具有修饰表达的基因的模式真核细胞的方法。在一些实施方案中,疾病基因是与增加患病或疾病进展风险相关的任何基因。在一些实施方案中,该方法包括:(a)将编码本文以上所描述的系统的组分的一个或多个载体引入真核细胞中,和(b)允许CRISPR复合物与靶多核苷酸结合,使得修饰基因的表达,从而生成包含修饰基因表达的模式真核细胞。
本文提供的结构信息允许对指导RNA或crRNA与靶RNA和RNA靶向酶的相互作用的询问,允许工程化或改变指导RNA结构,以优化整个RNA靶向CRISPR-Cas13b系统的功能。例如,指导RNA或crRNA可以延长,通过插入可结合RNA的接头蛋白而无需与RNA靶蛋白碰撞。这些接头蛋白可以进一步招募包含一个或多个功能域的效应蛋白或融合体。
本发明的一个方面是上述要素被包含在单个组合物中,或包含在个体组合物中。这些组合物可以有利地应用于宿主,以引起基因组水平的功能效应。
技术人员将理解,允许接头+功能域的结合但接头+功能域不能正确定位(例如,由于CRISPR Cas 13b复合物的三围结构内的位阻)的对指导RNA或crRNA的修饰是不想要的修饰。一个或多个修饰的指导RNA或crRNA可以通过在直接重复或指导序列的3’引入直接重复的不同RNA序列5’来修饰。
修饰的指导RNA或crRNA、失活的RNA靶向酶(具有或不具有功能域)和具有一个或多个功能域的结合蛋白,可各自个体地包含在组合物中或使用个体地或组合地施用给宿主。或者,这些组分可以在用于施用给宿主的单个组合物中提供。对宿主的施用可能通过技术人员知晓或本文描述的病毒载体进行以递送给宿主(例如,慢病毒载体、腺病毒载体、AAV载体)。如本文所述,使用不同的选择标志物(例如,用于慢病毒gRNA或crRNA选择)和gRNA或crRNA的浓度(例如,取决于是否使用多个gRNA或crRNA)可能有利于引起更好的效果。
使用所提供的组合物,本领域技术人员可以有利地、特异性地针对具有相同或不同功能域的单个或多个基因座,从而引发一个或多个基因组事件。组合物可应用于各种方法用于细胞文库中的筛选和体内功能模式(例如,lincRNA的基因激活和功能的识别;功能获得模式;功能丧失模式;利用本发明的组合物建立细胞系和转基因动物用于优化和筛选)。
本发明理解使用当前发明的组合物来建立和利用条件的或诱导的CRISPR Cas13b RNA靶向事件。(例如,Platt等,Cell(2014),http://dx.doi.org/10.1016/j.cell.2014.09.014,或本文引用的PCT专利公开,例如WO 2014/093622(PCT/US2013/074667),在本发明或申请之前不可信)。
根据本发明的指导RNA包含死亡指导序列
在一个方面,本发明提供了指导序列,这些序列以允许形成CRISPR Cas 13b复合物并成功地结合到靶标上,同时不允许成功的核酸酶活性(即无核酸酶活性/无插入缺失活性)的方式修饰。用于解释,此类修饰的指导序列称为"死亡指导"或"死亡指导序列"。这些死亡指导或死亡指导序列可被视为对核酸酶活性的催化上不具有活性或构象上不具有活性。事实上,死亡指导序列可能不足以参与与促进催化活性或区分中靶与脱靶结合活性相关的有效碱基配对。简而言之,该测定涉及合成CRISPR靶RNA和包含与靶RNA不匹配的指导RNA,将这些与RNA靶向酶相结合,基于凝胶基于切割产物产生的条带的存在分析切割,和基于相对条带强度定量切割。
因此,在相关方面,本发明提供一种非天然存在或工程化组合物RNA靶向CRISPR-Cas系统,其包含本文所述的功能RNA靶向酶,和指导RNA(gRNA)或crRNA,其中gRNA或crRNA包含死亡指导序列,由此gRNA能够杂交到靶序列,使得RNA靶向CRISPR-Cas系统定向到细胞中感兴趣的基因组基因座,而无可检测的系统的非突变RNA靶向酶的切割活性。需要理解的是,根据本文在别处描述的本发明,任何gRNA或crRNA都可以用作包含死亡指导序列的死亡gRNA/crRNA。
可以通过任何合适的测定来评估死亡指导序列定向CRISPR复合物与RNA靶序列的序列特异性结合的能力。例如,足以形成CRISPR Cas 13b复合物的CRISPR Cas 13b系统的组分,包括要测试的死亡指导序列,可以提供给具有相应靶序列的宿主单元,例如通过用编码系统的组分的的载体转染,然后评估靶序列内的有限切割。
如本文进一步解释,几个结构参数允许适当的框架达到这样的死亡指导。死亡指导序列通常可以短于导致活性RNA切割的相应的指导序列。在特定的实施方案中,死亡指导为5%、10%、20%、30%、40%、50%短于定向相同的各自的指导。
如下所述,如本领域已知,gRNA或crRNA-RNA靶向特异性的一个方面是与这样的指导适当地连接的直接重复序列。特别是,这意味着直接重复序列被设计为依赖于RNA靶向酶的来源。可用于验证死亡指导序列的结构数据可用于设计Cas13b特异等同物。例如,两个或两个以上Cas 13b效应蛋白的正交核酸酶结构域HEPN之间的结构相似性可用于传递设计等同的死亡指导。因此,本文的死亡指导在长度和顺序上可以适当修饰,以反映此类Cas 13b特异等同物,允许形成CRISPR Cas13b复合物,并成功地与靶RNA结合,同时不允许成功的核酸酶活性。
死亡指导允许使用gRNA或crRNA作为基因靶向的手段,而不会产生核酸酶活动的后果,同时提供激活或抑制的定向手段。包含死亡指导的指导RNA或crRNA可被修饰为进一步包含允许激活或抑制基因活性的元件,特别是如本文其他地方所描述的蛋白质接头(例如,适体),其允许基因效应子的功能放置(例如,基因活性的激活子或阻遏子)。一个例子是适体的并入,如本文和本领域所解释。通过工程化包含死亡指导的gRNA或crRNA来并入蛋白质相互作用的适体(Konermann等,“Genome-scale transcription activation by anengineered CRISPR-Cas9 complex,”doi:10.1038/nature14136,,通过引用并入本文),可以组合多个不同的效应子结构域。这可以在自然过程后被模式化。
一般信息
在本发明的实施方案中,术语指导序列和指导RNA和crRNA可互换使用,如上述引用的文件例如WO 2014/093622(PCT/US2013/074667)。一般来说,指导序列是与靶多核苷酸序列具有足够的互补性以便与靶序列杂交和介导CRISPR复合物与靶序列的序列特定性结合的任何多核苷酸序列。在一些实施方案中,当使用合适的比对算法进行最佳比对时指导序列与其相应的靶序列之间的互补程度约为或超过50%、60%、75%、80%、85%、90%、95%、95%、97.5%、99%或以上。最佳比对可以使用任何合适的算法来比对序列,非限制性示例包括Smith-Waterman算法,the Needleman-Wunsch算法,基于the Burrows-WheelerTransform的算法(例如Burrows Wheeler Aligner),ClustalW,Clustal X,BLAT,Novoalign(Novocraft Technologies;从www.novocraft.com获得),ELAND(Illumina,SanDiego,CA),SOAP(从soap.genomics.org.cn获得),和Maq(从maq.sourceforge.net获得)。在一些实施方案中,指导序列约为或超过5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸的长度。在一些实施方案中,指导序列小于约75、50、45、40、35、30、25、20、15、12或更少的核苷酸长度。优选指导序列为10-30个核苷酸长,例如30个核苷酸长。任何合适的测定都评估指导序列介导CRISPR复合物与靶序列的序列特定性结合的能力。例如,足以形成CRISPR复合物的CRISPR系统的组分,包含要测试的指导序列,可以提供给具有相应靶序列的宿主细胞,例如通过转染编码CRISPR序列的组分的载体,然后评估靶序列中的优先切割,如由本文所描述的Surveyor测定。同样,通过提供靶序列、CRISPR复合物的组分(包含待测试的指导序列和不同于测试指导序列的对照指导序列)和比较待测试和对照指导序列反应之间的靶序列处的结合或切割速率可以在试管中评估靶多核苷酸序列的切割。其他的测定是可能的,并且对本领域技术人员是显而易见的。可以选择指导序列来靶向任何靶序列。在一些实施方案中,靶序列是细胞基因组内的序列。示例性靶序列包含在靶基因组中的独特的序列。
一般来说,在整个说明书中,"载体"一词是指能够运输其所连接的另一个核酸的核酸分子。载体包括但不限于单链、双链或部分双链的核酸分子;核酸分子,包括一个或多个自由端,无自由端(例如,圆形);包含DNA、RNA或两者的核酸分子;和本领域已知的其他种类的多核苷酸。一种类型的载体是"质粒",它是指环状双链DNA环,其例如通过标准的分子克隆技术可以插入另外的DNA片段。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于载体中用于包装成病毒(例如,逆转录病毒、复制有缺陷的逆转录病毒、腺病毒、复制有缺陷的腺病毒,以及腺相关病毒)。病毒载体还包括由病毒携带的多核苷酸,用于转染到宿主细胞。某些载体能够在宿主细胞中自主复制,并引入其中(例如,具有复制细菌来源的细菌载体和表皮哺乳动物载体)。其他载体(例如,非表皮哺乳动物载体)在引入宿主细胞后被集成到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够引导与它们可操作地连接的基因的表达。此处称为"表达载体"。导致真核细胞中表达的载体在本文可以称为"真核表达载体"。重组DNA技术中有用的常见表达载体通常以质粒的形式出现。
重组表达载体可以包括本发明的核酸,其形式适合在宿主细胞中表达核酸,这意味着重组表达载体包括一个或多个调控元件,这些调控元件可以根据用于表达的宿主细胞(与要表达的核酸序列的可操作地连接)选择。在重组表达载体中,"可操作地连接"是指感兴趣的核苷酸序列以允许表达核苷酸序列的方式与调控元件相关联(例如,在体外转录/翻译系统中或在宿主细胞中,当载体被引入宿主细胞时)。
术语"调控元件"旨在包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如转录末端信号,如多腺苷酸信号和多U序列)。例如,在Goeddel,GENEEXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)描述了这些调控元件。调控元件包括在许多类型宿主细胞中介导核苷酸序列的组成型表达的那些,以及介导核苷酸序列仅在某些宿主细胞中表达的那些(例如,组织特异性调控序列)。组织特异性启动子可能主要介导在感兴趣的所需组织中的表达,如肌肉、神经元、骨骼、皮肤、血液、特定器官(如肝脏、胰腺)或特定细胞类型(如淋巴细胞)。调控元件也可以介导以时间依赖的方式的表达,例如以细胞周期依赖或发育阶段依赖的方式表达,这可能也可能不是组织或细胞类型特异。在一些实施方案中,载体包含一个或多个polIII启动子(例如,1、2、3、4、5或更多pol III启动子)、一个或多个pol II启动子(例如,1、2、3、4、5或多个pol II启动子)、一个或多个pol I启动子(例如,1、2、3、4、5或更多pol I启动子)或其组合。pol III启动子的示例包括但不限于U6和Hl启动子。pol II启动子的示例包括但不限于,抗逆转录病毒鲁丝肉瘤病毒(RSV)LTR启动子(任选地与RSV增强子),巨细胞病毒(CMV)启动子(任选地与CMV增强子)[参见,例如,Boshart et al,Cell,41:521-530(1985)],SV40启动子,二氢叶酸还原酶启动子,P-actin启动子,磷酸甘油激酶(PGK)启动子,和EFla启动子。术语"调控元件"还包括增强子元件,如WPRE;CMV增强子;HTLV-I(摩尔细胞)LTR中的R-U5'段(Mol.Cell.Biol.,Vol.8(1),p.466-472,1988);SV40增强子;和兔子P-globin的外显子2和3之间的内含子序列(Proc.Natl.Acad.Sci.USA.,Vol.78(3),p.1527-31,1981)。本领域技术人员将理解,表达载体的设计可以依赖于要转化的宿主细胞的选择、所需的表达水平等因素。载体可以引入宿主细胞,从而产生转录子、蛋白质或肽,包括融合蛋白或肽,如本文所述核酸所编码(例如,成簇规律间隔短回文重复序列(CRISPR)转录子、蛋白质、酶、其突变形式、融合蛋白等)。
有利的载体包括慢病毒和腺相关病毒,也可以选择这样的载体的类型以靶向特定类型的细胞。
如本文所用,VI型CRISPR-Cas基因座效应蛋白的术语"crRNA"或"指导RNA"或"单指导RNA"或"sgRNA"或"一个或多个核酸组分"包括任何与靶核酸序列具有充分互补性的多核苷酸序列以与靶核酸序列杂交,并介导RNA靶向复合物与靶RNA序列的序列特异性结合。
在某些实施方案中,本文提供的CRISPR系统可以使用包含指导序列的crRNA或类似多核苷酸,其中多核苷酸为RNA、DNA或RNA和DNA的混合物,和/或其中多核苷酸包括一个或多个核苷酸类似物。序列可以包括任何结构,包括但不限于原生crRNA的结构,如凸起、发夹或茎环结构。在某些实施方案中,包含指导序列的多核苷酸形成与可以是RNA或DNA序列的第二多核苷酸序列形成双链。
在某些实施方案中,本发明的指导包含非天然存在的核酸和/或非天然存在的核苷酸和/或核苷酸类似物和/或化学修饰。例如,非天然存在的核酸可以包含天然和非天然存在的核苷酸的混合物。非天然存在的核苷酸和/或核苷酸类似物可在核糖核酸、磷酸盐和/或碱基部分进行修饰。在本发明的实施方案中,指导核酸包含核苷酸和非核苷酸。在一个此类实施方案中,指导包含一个或多个核苷酸和一个或多个脱氧核苷酸。在本发明的实施方案中,指导包含一个或多个非天然存在的核苷酸或核苷酸类似物,如带磷酸键、硼磷酸键的核苷酸、包含核糖环的2'和4'碳之间的亚甲基桥的锁核酸(LNA)核苷酸,或桥接核酸(BNA)。修饰核苷酸的其他示例包括2'-O-甲基类似物、2'-脱氧类似物、2-二氧化硅类似物、N6-甲基腺苷类似物或2'氟类似物。修饰碱基的进一步示例包括但不限于2-氨基苯丙氨酸、5-溴-尿氨酸、伪尿氨酸(T)、N1-甲基伪尿苷(mel'P)、5-甲氧尿(5moU)、肌氨酸、7-甲基瓜诺辛。指导RNA化学修饰的例子包括但不限于在一个或多个末端核苷酸中加入2'-O-甲基(M)、2'-O-甲基3'磷酸酯(MS)、S约束乙基(cEt)或2'-O-甲基3'thioPACE(MSP)。与未修饰指导RNA相比,这种化学修饰指导RNA可以包括更高的稳定性和更高的活性,尽管中靶与脱靶特异性是不可预测的。(参见Hendel,2015,Nat Biotechnol.33(9):985-9,doi:10.1038/nbt.3290,published online 29 June 2015;Allerson等,J.Med.Chem.2005,48:901-904;Bramsen等,Front.Genet.,2012,3:154;Deng等,PNAS,2015,112:11870-11875;Sharma等,MedChemComm.,2014,5:1454-1471;Li等,Nature Biomedical Engineering,2017,1,0066DOI:10.1038/s41551-017-0066)。
在一些实施方案中,指导RNA的5'和/或3'末端被各种功能性部分(包括荧光染料、聚乙烯乙二醇、胆固醇、蛋白质或检测标签)修饰。(见Kelly等,2016,J.Biotech.233:74-83)。在某些实施方案中,指导包含与靶DNA结合的区域的核苷酸,和与Cas9、Cpfl或C2cl结合的区域中的一个或多个脱氧核苷酸和/或核苷酸类似物。在本发明的实施方案中,脱氧核苷酸和/或核苷酸类似物被导入工程化指导结构,如5'和/或3'端、茎环区域和种子区域。在某些实施方案中,修饰不在茎环区域的5'-柄中。指导的茎环区域的5'柄中的化学修饰可能会取消其功能(见Li,等,Nature Biomedical Engineering,2017,1:0066)。在某些实施方案中,至少1、2、3、4、5、6、7、8,9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75个核苷酸是化学修饰。在一些实施方案中,指导的3'或5'端的3-5核苷酸经过化学修饰。在一些实施方案中,种子区域只引入少量修饰,如2'-F修饰。在一些实施方案中,2'-F修饰在指导的3'端引入。在某些实施方案中,指导的5'和/或3'端的3至5个核苷酸用2'-O-甲基(M)、2'-O-甲基-3'-磷硫酸酯(MS)、S约束乙基(cEt)或2'-O-甲基-3'-硫磷(MSP)进行化学修饰。这种修饰可以提高基因组编辑效率(见Hendel等,Nat.Biotechnol.(2015)33(9):985-989)。在某些实施方案中,指导的所有磷酸化物键都用磷酸磷(PS)代替,以提高基因破坏水平。在某些实施方案中,指导的5'和/或3'端的五个以上核苷酸用2'-O-Me、2'-F或S约束乙基(cEt)进行化学修饰。这种化学修饰指导可以调节增强的基因破坏水平(见Ragdarm等,0215,PNAS,E7110-E7111)。在本发明的实施方案中,指导被修饰为在其3'和/或5'末端的化学部分组成。这种部分包括,但不限于胺,叠氮化物,烷基,硫,二苯基氯胺(DBCO),或罗达明。在一定实施方案中,化学部分通过连接子(如烷基链)与指导结合。在某些实施方案中,修饰指导的化学部分可用于将指导附接到另一个分子上,例如DNA、RNA、蛋白质或纳米粒子。这种化学修饰指导可用于识别或丰富由CRISPR系统遗传编辑的细胞(见Lee等,eLife,2017,6:e25312,DOI:10.7554)。
在本发明的一个方面,该指导包括用于Cpfl的改性crRNA,其具有5'柄和进一步包含种子区域和3'末端的指导段。在一些实施方案中,修饰后的指导可与以下的任何一种Cpfl一起使用:Acidaminococcus sp.BV3L6 Cpf1(AsCpf1);Francisella tularensissubsp.Novicida U112 Cpf1(FnCpf1);L.bacterium MC2017 Cpf1(Lb3Cpf1);Butyrivibrio proteoclasticus Cpf1(BpCpf1);Parcubacteria bacterium GWC2011_GWC2_44_17 Cpf1(PbCpf1);Peregrinibacteria bacterium GW2011_GWA_33_10 Cpf1(PeCpf1);Leptospira inadai Cpf1(LiCpf1);Smithella sp.SC_K08D17 Cpf1(SsCpf1);L.bacterium MA2020 Cpf1(Lb2Cpf1);Porphyromonas crevioricanis Cpf1(PcCpf1);Porphyromonas macacae Cpf1(PmCpf1);Candidatus Methanoplasma termitum Cpf1(CMtCpf1);Eubacterium eligens Cpf1(EeCpf1);Moraxella bovoculi 237 Cpf1(MbCpf1);Prevotella disiens Cpf1(PdCpf1);or L.bacterium ND2006 Cpf1(LbCpf1)。
在一些实施方案中,对指导的修饰是化学修饰、插入、缺失或拆分。在一些实施方案中,化学修饰包括但不限于,导入2'-O-甲基(M)类似物、2'-脱氧类似物、2-二氧基丁类似物、N6-甲基腺苷类似物、2'-氟类似物、2-氨基苯甲酸酯、5-溴-尿碱、伪尿氨酸(T)、N1-甲基二氧化硅(mel'P)、5-甲氧尿酸(5moU)、肌氨酸、7-甲基苯丙胺、2'-O-甲基-3'-磷酸酯(MS)、S约束乙基(cEt)、磷硫磷(PS)或2'-O-甲基-3'硫磷(MSP)。在一些实施方案中,指导包含一种或多种磷酸酯修饰。在某些实施方案中,指导中的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或25个核苷酸均经过化学修饰。在某些实施方案中,种子区域中的一个或多个核苷酸经过化学修饰。在某些实施方案中,3'末端的一个或多个核苷酸经过化学修饰。在某些实施方案中,5'柄中无核苷酸经化学修饰。在一些实施方案中,种子区域中的化学修饰是一种轻微的修饰,例如加入2'-氟类似物。在特定的实施方案中,种子区域的一个核苷酸被2'-氟类似物取代。在一些实施方案中,3'末端的5或10个核苷酸经过化学修饰。Cpfl CrRNA 3'-末端的这种化学修饰提高了基因切割效率(见Li,等,NatureBiomedical Engineering,2017,1:0066)。在特定的实施方案中,3'末端的5个核苷酸被2'-氟类似物取代。在具体实施方案中,3'末端的10个核苷酸被2'-氟类似物取代。在特定的实施方案中,3'末端的5个核苷酸被2'-O-甲基(M)类似物取代。
在一些实施方案中,指导的5'柄的环被修饰。在一些实施方案中,指导的5'-柄的环被修饰为具有缺失、插入、分割或化学修饰。在某些实施方案中,环包含3、4或5核苷酸。在某些实施方案中,该环包含UCUU、UUUU、UAUU或UGUU的顺序。
在一个方面,本指导包含通过非磷酸二酯键进行化学连接或作何的部分。在一个方面,指导包含,在非限制的例子,tracr序列和tracr配对序列部分或直接重复和靶向序列部分,其通过非核苷酸环二化学连接缀合。在一些实施方案中,这些部分通过非磷酸二酯共价连接子连接。共价连接子的例子包括但不限于以下化学部分:氨基甲酸酯,醚,酯,酰胺,亚胺,脒,氨基三嗪,腙,二硫化物,硫醚,硫代酯,硫代磷酸酯,二硫代磷酸酯,磺酰胺,磺酸酯,富勒酮,亚砜,脲,硫脲,酰肼,肟,三唑,光不稳定键,C-C键形成基团,例如Diels-Alder环加成对或闭环易位对,以及Michael反应对。
在一些实施方案中,指导的部分首先使用标准磷酰胺合成方案(Herdewijn,P.,ed.,Methods in Molecular Biology Col 288,Oligonucleotide Synthesis:Methodsand Applications,Humana Press,New Jersey(2012))。在一些实施方案中,非靶向指导部分可功能化,以包含适当的功能基团,以便使用本领域已知的标准方案(Hermanson,G.T.,Bioconjugate Techniques,Academic Press(2013))。功能性基团的示例包括但不限于羟基,胺,羧酸,卤代羧酸,羧酸活性酯,醛,羰基,氯羰基,咪唑基羰基,酰肼,氨基脲,硫代氨基脲,硫醇,马来酰亚胺,卤代烷基,亚磺酰基,烯丙基,炔丙基,二烯,炔和叠氮化物。一旦指导的非靶向部分被官能化,两个寡核苷酸之间可以形成共价化学键或连接。化学键的例子包括但不限于,基于氨基甲酸酯,醚,酯,酰胺,亚胺,am,氨基三嗪,hydro,二硫化物,硫醚,硫代酯,硫代磷酸酯,二硫代磷酸酯,磺酰胺,磺酸酯,富勒酮,亚砜,脲,硫脲,酰肼,肟,三唑,光不稳定键基团,例如Diels-Alder环加成对或闭环易位对,以及Michael反应对的那些。
在一些实施方案中,指导的一个或多个部分可以化学合成。在一些实施方案中,化学合成使用具有2'-乙酰乙酸酯(2'-ACE)的自动固相寡核苷酸合成仪(Scaringe等,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)或2'硫化氢(2'-TC)化学(Dellinger等,J.Am.Chem.Soc.(2011)133:11540-11546;Hendel等,Nat.Biotechnol.(2015)33:985-989)。
在一些实施方案中,可以使用各种生物缀合反应,环,桥和非核苷酸键通过修饰糖,核苷酸间磷酸二酯键,嘌呤和嘧啶残基来共价连接引导部分。Sletten等,Angew.Chem.Int.Ed.(2009)48:6974-6998;Manoharan,M.Curr.Opin.Chem.Biol.(2004)8:570-9;Behlke等,Oligonucleotides(2008)18:305-19;Watts,等,Drug.Discov.Today(2008)13:842-55;Shukla,等,ChemMedChem(2010)5:328-49。
在一些实施方案中,可以使用点击化学将指导部分共价连接。在一些实施方案中,可以使用三唑接头将指导部分共价连接。在一些实施方案中,可以使用涉及炔烃和叠氮化物的Huisgen 1,3-偶极环加成反应将指导部分共价连接以产生高度稳定的三唑连接体(He等人,ChemBioChem(2015)17:1809-1812;WO 2016/186745)。在一些实施方案中,通过连接5’-己炔部分和3’-叠氮化物部分将指导部分共价连接。在一些实施方案中,可以用2'-乙酰氧基乙基原酸酯(2'-ACE)基团保护5'-己炔指导部分和3'-叠氮化物指导部分中的一个或两个,然后可以使用Dharmacon方案(Scaringe)将其除去。(Scaringe等,J.Am.Chem.Soc.(1998)120:11820-11821;Scaringe,Methods Enzymol.(2000)317:3-18)。
在一些实施方案中,指导部分可以经由连接子(例如,非核苷酸环)共价连接,所述连接子包含诸如间隔子,附接物,生物缀合物,生色团,报告基团,染料标记的RNA和非天然存在的核苷酸类似物的部分。更具体地,用于本发明目的的合适的间隔子包括但不限于聚醚(例如,聚乙二醇,多元醇,聚丙二醇或乙烯和丙二醇的混合物),多胺基团(例如,斯潘宁,亚精胺及其聚合物衍生物)),聚酯(例如,聚(丙烯酸乙酯)),聚磷酸二酯,亚烷基及其组合。合适的附接物包括可以被添加到连接子以向连接子增加附加性质的任何部分,例如但不限于荧光标记。合适的生物缀合物包括但不限于肽,糖苷,脂质,胆固醇,磷脂,二酰基甘油和二烷基甘油,脂肪酸,烃,酶底物,类固醇,生物素,洋地黄毒苷,碳水化合物,多糖。合适的生色团,报告基团和染料标记的RNA包括但不限于荧光染料,例如荧光素和若丹明,化学发光,电化学发光和生物发光标记化合物。在WO 2004/015075中也描述了缀合两个RNA组分的示例性连接头的设计。
连接子(例如,非核苷酸环)可以是任意长度的。在一些实施方案中,连接子的长度相当于约0-16个核苷酸。在一些实施方案中,连接子的长度相当于约0-8个核苷酸。在一些实施方案中,连接子的长度相当于约0-4个核苷酸。在一些实施方案中,连接子的长度相当于大约2个核苷酸。WO2011/008730中还介绍了连接子设计示例。
在一些实施方案中,当使用合适的比对算法最佳比对时,互补程度为约或大于约50%,60%,75%,80%,85%,90%,95%,97.5%,99%或更高。可以使用任何合适的用于比对序列的算法来确定最佳比对,其非限制性实例包括Smith-Waterman算法,Needleman-Wunsch算法,基于Burrows-Wheeler变换的算法(例如,Burrows Wheeler Aligner),ClustalW,Clustal X,BLAT,Novoalign(Novocraft Technologies;可在www.novocraft.com上获得),ELAND(Illumina,圣地亚哥,加利福尼亚),SOAP(可在soap.genomics.org.cn上获得)和Maq(可在maq.sourceforge.net上获得)。可以通过任何合适的测定来评估指导序列(在RNA靶向指导RNA或crRNA内)指导核酸靶向复合物与靶核酸序列的序列特异性结合的能力。例如,可以例如通过转染,将足以形成核酸靶向复合物的靶向RNA的CRISPR Cas13b系统的组分(包含待测试的指导序列)提供给具有相应靶核酸序列的宿主细胞,例如用编码核酸靶向复合物的组分的载体转染,随后评估靶核酸序列内的优先靶向(例如,切割),例如通过本文所述的Surveyor测定。类似地,可以通过提供靶核酸序列、核酸靶向复合物的组分,包括待测试的指导序列和不同于该待测试的指导的对照指导序列,和比较待测试和对照指导序列反应之间在靶序列上的结合或切割速率来在试管中评估靶核酸序列的切割。其他测定是可能的,并且对本领域技术人员而言是显而易见的。可以选择指导序列,并因此选择RNA靶向指导RNA或crRNA以靶向任何靶核酸序列。靶序列可以是DNA。靶序列可以是任何RNA序列。在一些实施方案中,靶序列可以是选自信使RNA(mRNA),前mRNA,核糖体RNA(rRNA),转移RNA(tRNA),微小RNA(miRNA),小干扰RNA(siRNA),小核RNA(snRNA),小核仁RNA(snoRNA),双链RNA(dsRNA),非编码RNA(ncRNA),长非编码RNA(lncRNA)和小胞质RNA(scRNA))。在一些优选的实施方案中,靶序列可以是RNA分子内的序列,选自RNA,pre-mRNA和rRNA。在一些优选的实施方案中,靶序列可以是RNA分子内的序列,该分子选自ncRNA和lncRNA。在一些更优选的实施方案中,靶序列可以是mRNA分子或pre-mRNA分子内的序列。。
在一些实施方案中,选择RNA靶向指导RNA或crRNA来降低RNA靶向指导RNA或crRNA中的二级结构的程度。在一些实施方案中,大约或小于约75%、50%、40%、30%、25%、20%、15%、10%、5%、1%或以下的RNA靶向指导RNA核苷酸在最佳折叠时参与自我互补碱基配对。最佳折叠可以通过任何合适的多核苷酸折叠算法来确定。一些程序是基于计算最小的吉布斯自由能。例如,如Zuker和Stiegler(Nucleic Acids Res.9(1981),133-148)所述,一个这样的算法就是mFold。另一个折叠算法的例子是维也纳大学理论化学研究所开发的在线网络服务器RNAfold,使用质心结构预测算法(参见,例如,A.R.Gruber等,2008,Cell106(1):23-24;and PA Carr and GM Church,2009,Nature Biotechnology 27(12):1151-62)。
在某些实施方案中,指导RNA或crRNA可以包含直接重复(DR)序列和指导序列或间隔子序列,或主要由其组成,或由其组成。在某些实施方案中,指导RNA或crRNA可以包含与指导序列或间隔子序列融合和连接的直接重复序列,或主要由其组成,或由其组成。在某些实施方案中,直接重复序列可能位于指导序列或间隔子序列的上游(即5')。在其他实施方案中,直接重复序列可位于指导序列或间隔子序列的下游(即3')。在其他实施方案中,可能存在多个DR(如双DR)。
在某些实施方案中,crRNA包括一个茎环,优选是单茎环。在某些实施方案中,直接重复序列形成茎环,优选为单茎环。
在某些实施方案中,指导RNA的间隔子长度为15至35nt。在某些实施方案中,指导RNA的间隔子长度至少为15个核苷酸。在某些实施方案中,间隔子长度为15至17nt,例如15、16或17nt,从17nt到20nt,例如,17、18、19或20nt,从20到24nt,例如,20、21、22、23、或24nt,从23到25nt,例如,23、24或25nt,从24到27nt,例如24、25、26或27nt,从27-30nt,例如27、28、29或30nt,从30-35nt,例如30、31、32、33、34或35nt或35nt或更长。
"tracrRNA"序列或类似术语包括任何与crRNA序列具有充分互补性以杂交的多核苷酸序列。一般来说,互补性的程度是指沿两个序列的较短长度sca序列和tracr序列的最佳比对。最佳比对方式可以通过任何合适的比对算法确定,并可能进一步考虑二级结构,如sca序列或tracr序列中的自互补性。在一些实施方案中,当最佳比对时,沿两个长度的较短时tracr序列与sca序列的互补性程度约为或超过约25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、或更高。在某些实施方案中,可能不需要tracrRNA。事实上,来自Bergeyella zoohelcum或其直系同源物的Cas13b效应蛋白不需要tracrRNA来确保RNA靶标的切割。
更详细地,对于RNA靶标的测定如下,条件是需要PAM序列来指导识别。在该测定中使用两种大肠杆菌菌株。一个携带编码来自细菌菌株的内源性效应蛋白基因座的质粒。另一株携带空质粒(例如,pACYC184,对照株)。所有可能的7或8bp PAM序列均显示在抗生素抗性质粒(具有氨苄青霉素抗性基因的pUC19)上。PAM位于原始间隔子1的序列旁边(RNA靶向内源性效应蛋白基因座中的第一个间隔子)。克隆了两个PAM库。一个具有8个随机bp的原型间隔子5'(例如,总共65536个不同的PAM序列=复杂度)。另一个库具有7个bp 3'的原型间隔子(例如,总复杂度为16384个不同的PAM)。克隆两个文库,每个可能的PAM平均具有500个质粒。用5’PAM和3’PAM文库分别转化测试菌株和对照菌株,并将转化的细胞分别铺在氨苄青霉素平板上。对该质粒的识别和随后的切割/干扰使细胞容易受到氨苄青霉素的侵害并阻止其生长。转化后约12小时,收集并分离出质粒RNA的测试菌株和对照菌株形成所有菌落。质粒RNA用作PCR扩增和随后的深度测序的模板。未转化文库中所有PAM的表示均显示了转化细胞中PAM的预期表示。对照菌株中发现的所有PAM的表示均显示了实际表示。测试菌株中所有PAM的表示显示了酶未识别出哪些PAM,与对照菌株进行比较可以提取出耗尽的PAM的序列。在特定实施方案中,切割,例如RNA切割不是PAM依赖性的。实际上,对于Bergeyella zoohelcum效应子蛋白及其直系同源物,RNA靶标的切割似乎是PAM非依赖性的,因此本发明的表1的Cas13b可以以PAM非依赖性的方式起作用。
为了使毒性和脱靶作用最小化,控制递送的靶向RNA的指导RNA的浓度将是重要的。可以通过在细胞或非人类真核生物动物模型中测试不同的浓度并使用深度测序来分析潜在的脱靶基因组位点的修饰程度,来确定核酸靶向指导RNA的最佳浓度。对于体内递送,应当选择给出中靶修饰的最高水平同时最小化脱靶修饰水平的浓度。RNA靶向系统有利地衍生自CRISPR-Cas13b系统。在一些实施方案中,RNA靶向系统的一个或多个要素衍生自包含本文讨论的表1Cas13b效应蛋白系统的内源RNA靶向系统的特定生物。
术语“直系同源物”(在本文中也称为“直向同源物”)和“同源物”(在本文中也称为“同源物”)是本领域众所周知的。通过进一步的指导,本文所用的蛋白质的“同源物”是与该蛋白质的同系物具有相同或相似功能的相同物种的蛋白质。同源蛋白质可以但不必在结构上相关,或仅在部分结构上相关。如本文所用,蛋白质的“直系同源物”是不同物种的蛋白质,其发挥与其作为直向同源物的蛋白质相同或相似的功能。直系同源蛋白可以但不必在结构上相关,或仅在部分结构上相关。在特定实施方案中,本文所指的Cas13b蛋白的同源物或直系同源物与下表1中列出的Cas13b效应蛋白具有至少80%,更优选至少85%,甚至更优选至少90%,例如至少95%的序列同源性或同一性。在一个优选的实施方案中,Cas13b效应蛋白可以是或来自表1中鉴定的生物或该生物所属的属。
已经发现许多Cas13b直向同源物的特征是具有共同的基序。因此,在特定的实施方案中,Cas13b效应蛋白是包含与以下序列的一种或多种具有至少70%序列同一性的序列的蛋白:DKHXFGAFLNLARHN(SEQ ID NO:XX),GLLFFVSLFLDK(SEQ ID NO:XX),SKIXGFK(SEQID NO:XX),DMLNELXRCP(SEQ ID NO:XX),RXZDRFPYFALRYXD(SEQ ID NO:XX)和LRFQVBLGXY(SEQ ID NO:XX)。在进一步的特定实施方案中,Cas13b效应蛋白包含与这些序列中的至少2、3、4、5或全部6个具有至少70%序列同一性的序列。在另外的特定实施方案中,与这些序列的序列同一性为至少75%,80%,85%,90%,95%或100%。在另外的特定实施方案中,Cas13b效应蛋白是包含与GLLFFVSLFL(SEQ ID NO:XX)和RHQXRFPYF(SEQ ID NO:XX)具有100%序列同一性的序列的蛋白。在另外的特定实施方案中,Cas13b效应子是Cas13b效应子蛋白,其包含与RHQDRFPY(SEQ ID NO:XX)具有100%序列同一性的序列。
在特定的实施方案中,Cas13b效应蛋白是与选自以下的Cas13b蛋白具有至少65%,优选至少70%,75%,80%,85%,90%,95%或更多的序列同一性的Cas13b效应蛋白:Prevotella buccae,Porphyromonas gingivales,Prevotella saccharolytica,Riemerella antipestifer。在进一步的特定实施方案中,Cas13b效应子为选自以下的Cas13b蛋白:Bacteroides pyogenes,Prevotella sp.MA2016,Riemerellaanatipestifer,Porphyromonas gulae,Porphyromonas gingivalis,and Porphyromonassp.COT-052OH4946。
应当理解,可以在本发明范围内的表1 Cas13b酶的直系同源物可以包括包含表1Cas13b酶的多个直系同源物的片段的嵌合酶。这样的直系同源物的实例在本文其他地方描述。嵌合酶可包含表1Cas13b酶的片段和来自另一种CRISPR酶的片段,例如来自以下生物的表1 Cas13b酶的直系同源物,该生物包括但不限于Bergeyella,Prevotella,Porphyromonas,Bacteroides,Alistipes,Riemerella,Myroides,Flavobacterium,Capnocytophaga,Chryseobacterium,Phaeodactylibacter,Paludibacter orPsychroflexus。嵌合酶可包含第一片段和第二片段,和多个片段,其中第一片段和第二片段之一是或来自表1 Cas13b酶,另一片段是或来自不同物种的CRISPR酶的直系同源物。
在实施方案中,本文所指的Cas13b RNA靶向Cas13b效应蛋白还涵盖效应蛋白或其同源物或直向同源物的功能变体。如本文所用,蛋白质的“功能变体”是指这种蛋白质的变体,其至少部分保留该蛋白质的活性。功能变体可以包括突变体(可以是插入,缺失或替代突变体),包括多型体(polymorph)等,包括如本文结合表1所讨论的。功能变体中还包括这种蛋白质与另一种通常不相关的核酸、蛋白质、多肽或肽的融合产物。功能变体可以是天然存在的,也可以是人造的。在一个实施方案中,可以对编码Cas13b RNA靶向效应蛋白或其直系同源物或同源物的核酸分子进行密码子优化以在真核细胞中表达。真核生物可以如本文所述。核酸分子可以被工程化或非天然存在。
在一个实施方案中,Cas13b RNA靶向效应蛋白或其直系同源物或同源物可包含一个或多个突变。所述突变可以是人工引入的突变,并且可以包括但不限于催化域中的一个或多个突变,例如,在一个或多个HEPN结构域中引入一个或多个突变。
在一个实施方案中,Cas13b蛋白或其直系同源物或同源物可以用作与功能域融合或可操作地连接的通用核酸结合蛋白。示例性功能域可以包括但不限于翻译引发子,翻译激活子,翻译阻遏物,核酸酶,特别是核糖核酸酶,剪接体,珠,光诱导/可控结构域或化学诱导/可控结构域。
在一些实施方案中,未修饰的RNA靶向效应蛋白(Cas13b)可以具有切割活性。在一些实施方案中,Cas13b可以指导在靶序列的位置或附近(例如在靶序列内和/或靶序列的互补序列内或在与靶序列相关的序列上)切割一条或两条核酸链,例如,在距靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多个碱基对内。在一些实施方案中,Cas13b蛋白可指导靶序列内和/或靶序列的互补序列内或与靶序列相关的序列和/或距靶序列的第一个或最后一个核苷酸约1、2、3,4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多个碱基对内的一条或两条链的不止一个切割(例如,一、二、三、四、五或更多个切割)。在一些实施方案中,切割可以是平末端(blunt)的,即产生平的末端。在一些实施方案中,切割可以是粘性的,即产生粘性末端。在一些实施方案中,载体编码可以相对于相应的野生型酶突变的核酸靶向Cas13b蛋白,使得突变的核酸靶向Cas13b蛋白缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力,例如HEPN结构域中的改变或突变以产生基本上缺乏全部RNA切割活性的突变Cas13b,例如,突变酶的RNA切割活性大约不超过该酶的非突变形式的核酸切割活性的25%、10%、5%、1%、0.1%、0.01%或更少;一个实例可以是当突变形式的核酸切割活性与非突变形式相比为零或可忽略时。所谓衍生,申请人是指衍生的酶在很大程度上与野生型酶具有很大的序列同源性,但是它已经以本领域已知或本文所描述的某种方式进行了突变(修饰)。
通常,在内源RNA靶向系统的背景下,RNA靶向复合物(包含与靶序列杂交并与一种或多种RNA靶向效应蛋白复合的指导RNA或crRNA)的形成导致在靶序列中或附近(例如,距离1、2、3、4、5、6、7、8、9、10、20、50个或更多个碱基对内)的RNA链的切割。如本文所用,术语“与感兴趣的靶基因座相关的序列”是指靠近靶序列附近的序列(例如距离靶序列1、2、3、4、5、6、7、8、9、10、20、50或更多个碱基对内,其中靶序列包含在感兴趣的靶基因座内)。
密码子最优化序列的一个实例,在这种情况下,是用于在真核生物例如人中(即用于在人中表达而优化)或者用于本文讨论的另一种真核生物,动物或哺乳动物中表达而优化的序列;参见例如WO 2014/093622(PCT/US2013/074667)中的SaCas9人密码子优化的序列作为密码子优化的序列的实例(根据本领域的知识和本公开,密码子优化的编码核酸分子特别是关于效应蛋白(例如,Cas13b)是在技术人员的能力范围)。尽管这是优选的,但应理解其他实例也是可能的,并且已知用于除人类以外的宿主物种的密码子优化或用于特定器官的密码子优化。在一些实施方案中,对编码RNA靶向Cas13b蛋白的酶编码序列进行密码子优化以在特定细胞如真核细胞中表达。真核细胞可以是诸如哺乳动物的特定生物的细胞或衍生自其的细胞,所述哺乳动物包括但不限于本文所述的人或非人真核生物或动物或哺乳动物,例如小鼠、大鼠、兔、狗、家畜或非人类哺乳动物或灵长类动物。在一些实施方案中,可能导致遭受痛苦而对人或动物没有任何实质性医学益处的用于修饰人的种系遗传特性的方法和/或用于修饰动物的遗传特性的方法的动物的方法,以及由这种方法产生的动物,可能会被排除在外。一般而言,密码子优化是指通过用该宿主细胞的基因中更经常或最常用的密码子替换天然序列的至少一个密码子(例如,约或大于约1、2、3、4、5、10,15个,20个,25个,50个或更多密码子)同时保持了天然氨基酸序列的用于在感兴趣的宿主细胞中增强表达的修饰核苷酸序列的方法。各种物种对特定氨基酸的某些密码子表现出特定的偏见。密码子偏见(生物之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而信使RNA(mRNA)的翻译效率又被认为尤其取决于翻译的密码子的性质和特定转移RNA(tRNA)分子的可获得性。所选tRNA在细胞中的优势通常反映了肽合成中最常使用的密码子。因此,可以基于密码子优化来定制基因以在给定生物中获得最佳基因表达。密码子使用表很容易获得,例如,可在www.kazusa.orjp/codon/的“密码子使用数据库”中找到,并且这些表可以通过多种方式进行修改。参见Nakamura,Y.,等“Codon usage tabulated from theinternational DNA sequence databases:status for the year 2000”Nucl.AcidsRes.28:292(2000)。也可获得用密码子优化特定序列以在特定宿主细胞中表达的计算机算法,例如Gene Forge(Aptagen;Jacobus,PA)。在一些实施方案中,编码DNA/RNA靶向Cas蛋白的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50或更多或所有密码子)对应于特定氨基酸的最常用密码子。
(i)Cas13b或编码它的核酸分子或(ii)crRNA可以单独递送;并且有利地,(i)和(ii)之一的至少一者或两者,例如,组装的复合物是通过颗粒或纳米颗粒复合物递送。RNA靶向效应器蛋白mRNA可以在RNA靶向指导RNA或crRNA之前递送,以给出表达核酸靶向效应蛋白的时间。RNA靶向效应蛋白(Cas13b)mRNA可能在施用RNA靶向指导RNA或crRNA前1-12小时(优选约2-6小时)施用。或者,RNA靶向效应器蛋白mRNA和RNA靶向指导RNA或crRNA可以一起施用。有利地,可以在初次施用RNA靶向效应(Cas13b)蛋白mRNA+指导RNA后1-12小时(优选约2-6小时)施用第二加强剂量的指导RNA或crRNA。RNA靶向效应蛋白mRNA和/或指导RNA或crRNA的另外的施用可能对获得最有效水平的基因组修饰有用。
在一个方面,本发明提供了使用RNA靶向系统的一个或多个元件的方法。本发明的RNA靶向复合物提供了用于修饰线性或超螺旋的靶RNA单链或双链的有效手段。本发明的RNA靶向复合物具有多种多样的实用性,包括在多种细胞类型中修饰(例如,缺失,插入,转运,失活,活化)靶RNA。这样,本发明的RNA靶向复合物在例如基因治疗,药物筛选,疾病诊断和预后中具有广泛应用。示例性RNA靶向复合物包含与指导RNA或crRNA复合的RNA靶向效应蛋白,所述指导RNA或crRNA与感兴趣的靶基因座内的靶序列杂交。
在一个实施方案中,本发明提供了一种切割靶RNA的方法。该方法可以包括使用与靶RNA结合并实现所述靶RNA的切割的RNA靶向复合物修饰靶RNA。在一个实施方案中,本发明的RNA靶向复合物,当被引入细胞中时,可以在RNA序列中产生断裂(例如,单链断裂或双链断裂)。例如,该方法可用于切割细胞中的疾病RNA。例如,可以将包含侧接上游序列和下游序列的待整合的序列的外源RNA模板引入细胞中。上游和下游序列与RNA中整合位点的每一侧共享序列相似性。需要时,供体RNA可以是mRNA。外源RNA模板包含待整合的序列(例如,突变RNA)。用于整合的序列可以是对于细胞为内源性或外源性的序列。待整合的序列的实例包括编码蛋白质的RNA或非编码RNA(例如,微小RNA)。因此,用于整合的序列可以可操作地连接至合适的一个或多个控制序列。或者,待整合的序列可以提供调节功能。选择外源RNA模板中的上游和下游序列以促进感兴趣的RNA序列与供体RNA之间的重组。上游序列是与用于整合的靶位点上游的RNA序列共享序列相似性的RNA序列。类似地,下游序列是与整合的靶位点下游的RNA序列共享序列相似性的RNA序列。外源RNA模板中的上游和下游序列可以与靶RNA序列具有75%,80%,85%,90%,95%或100%的序列同一性。优选地,外源RNA模板中的上游和下游序列与靶RNA序列具有约95%,96%,97%,98%,99%或100%的序列同一性。在一些方法中,外源RNA模板中的上游和下游序列与靶RNA序列具有约99%或100%的序列同一性。上游或下游序列可包含约20bp至约2500bp,例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400,1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中,示例性上游或下游序列具有约200bp至约2000bp,约600bp至约1000bp,或更特别地约700bp至约1000bp。在一些方法中,外源RNA模板可以进一步包含标志物。这样的标志物可以使得容易筛选靶向的整合。合适的标志物的实例包括限制性位点、荧光蛋白或可选择标志物。可以使用重组技术来构建本发明的外源RNA模板(参见,例如,Sambrook等,2001,和Ausubel等,1996)。在通过整合外源RNA模板来修饰靶RNA的方法中,通过核酸靶向复合物将断裂(例如,双链或单链RNA中的双链或单链断裂)引入RNA序列,该断裂通过与外源RNA模板同源重组来修复,使得将模板整合到RNA靶中。双链断裂的存在促进了模板的整合。在其他实施方案中,本发明提供了一种在真核细胞中改变RNA的表达的方法。该方法包括通过使用与DNA或RNA(例如,mRNA或前mRNA)结合的核酸靶向复合物来增加或减少靶多核苷酸的表达。在一些方法中,可以使靶RNA失活以实现细胞中的表达的改变。例如,在将RNA靶向复合物与细胞中的靶序列结合后,靶RNA失活,使得该序列不翻译,不产生编码的蛋白,或该序列不像野生型序列那样发挥功能。例如,可以使蛋白质或微小RNA编码序列失活,使得不产生蛋白质或微小RNA或前微小RNA转录物。RNA靶向复合物的靶RNA可以是对于真核细胞为内源性或外源性的任何RNA。例如,靶RNA可以是存在于真核细胞的核中的RNA。靶RNA可以是编码基因产物(例如蛋白质)的序列(例如,mRNA或前mRNA)或非编码序列(例如,ncRNA,lncRNA,tRNA或rRNA)。靶RNA的实例包括与信号传导生化途径相关的序列,例如与信号传导生化途径相关的RNA。靶RNA的实例包括疾病相关RNA。“疾病相关”RNA是指与非疾病对照的组织或细胞相比,在源自受疾病影响的组织的细胞中以异常水平或异常形式产生翻译产物的任何RNA。它可以是从变得异常高水平表达的基因转录的RNA。它可以是从变得异常低水平表达的基因转录的RNA,其中改变的表达与疾病的发生和/或进展相关。疾病相关RNA还指从具有突变或遗传变异的基因转录的RNA,所述突变或遗传变异与负责疾病的病因的基因直接负责或连锁不平衡。翻译产物可以是已知的或未知的,并且可以处于正常或异常水平。RNA靶向复合物的靶RNA可以是对于真核细胞为内源性或外源性的任何RNA。例如,靶RNA可以是存在于真核细胞的核中的RNA。靶RNA可以是编码基因产物(例如蛋白质)的序列(例如,mRNA或mRNA)或非编码序列(例如,ncRNA,lncRNA,tRNA或rRNA)。
在一些实施方案中,该方法可以包括使RNA靶向复合物与靶RNA结合以实现所述靶RNA的切割,从而修饰靶RNA,其中RNA靶向复合物包含与指导RNA或crRNA复合的核酸靶向效应(Cas13b)蛋白,所述指导RNA或crRNA与所述靶RNA内的靶序列杂交。在一个方面,本发明提供了一种在真核细胞中改变RNA的表达的方法。在一些实施方案中,该方法包括使RNA靶向复合物与RNA结合,使得所述结合导致所述RNA的表达增加或减少;其中RNA靶向复合物包含与指导RNA复合的核酸靶向效应(Cas13b)蛋白。修饰靶RNA的方法可以是在真核细胞中,其可以体内、离体或体外。在一些实施方案中,该方法包括从人或非人动物中取样细胞或细胞群,并修饰一个或多个细胞。培养可以是在任何阶段离体进行。一个或多个细胞甚至可以被重新引入非人动物或植物中。对于重新引入的细胞,特别优选的是细胞是干细胞。
两种不同适体的使用(各自与不同的RNA靶向指导RNA关联)允许使用激活物-衔接蛋白融合体和阻遏物-衔接蛋白融合体,与不同的RNA靶向指导RNA或crRNA,以激活RNA的表达,同时抑制另一个。它们以及它们不同的指导RNA或crRNA可以以多重方式一起或基本上一起施用。可以同时使用大量这样的修饰的RNA靶向指导RNA或crRNA,例如10或20或30等,而仅一个(或至少很少数量)的效应蛋白(Cas13b)分子需要被递送,因为相对少量的效应蛋白分子可以与大量的修饰的指导体一起使用。衔接蛋白可以与一种或多种激活物或一种或多种阻遏物关联(优选连接或融合)。例如,衔接蛋白可以与第一激活物和第二激活物关联。第一和第二激活物可以相同,但是优选它们是不同的激活物。可以使用三种或更多种或甚至四种或更多种激活物(或阻遏物),但包装尺寸可以限制高于5个不同功能结构域的数量。相对于与衔接蛋白直接融合,优选使用接头,其中两个或更多个功能结构域与衔接蛋白关联。合适的接头可能包括GlySer接头。
还设想RNA靶向效应蛋白-指导RNA复合物作为整体可以与两个或更多个功能结构域关联。例如,可以有两个或更多个与RNA靶向效应蛋白关联的功能结构域,或者可以有两个或更多个与指导RNA或crRNA关联的功能结构域(通过一个或多个衔接蛋白),或者可以有一个或多个与RNA靶向效应蛋白关联的功能结构域和一个或多个与指导RNA或crRNA关联的功能结构域(通过一个或多个衔接蛋白)。
衔接蛋白与激活物或阻遏物之间的融合体可包含接头。例如,可以使用GlySer接头GGGS。它们可以重复使用3次((GGGGS)3)或6次、9次、甚至12次或更多次,以根据需要提供合适的长度。可以在指导RNA与功能结构域(激活物或阻遏物)之间,或在核酸靶向效应蛋白与功能结构域(激活物或阻遏物)之间,使用接头。接头允许用户设计适当数量的“机械灵活性”。
Cas13b效应蛋白复合物可以递送功能性效应子
与可以通过在RNA水平上突变来消除表达的CRISPR-Cas13b介导的敲除不同,CRISPR-Cas13b敲除允许通过使用人工转录因子来暂时减少基因表达,例如通过突变Cas13b蛋白的切割结构域中的残基,导致产生催化失活的Cas13b蛋白。催化失活的Cas13b与指导RNA或crRNA复合并定位至指导RNA或crRNA的靶向结构域指定的RNA序列,然而它不切割靶标。失活的Cas13b蛋白与效应子结构域例如转录抑制结构域的融合使得能够将效应子募集至由指导RNA指定的任何位点。
优化的功能性RNA靶向系统
因此,在一个方面,本发明提供了用于将功能性组分特异性递送至RNA环境的系统。这可以使用包含本发明的RNA靶向效应蛋白(表1,Cas13b)的CRISPR系统来确保,其允许不同组分特异性靶向RNA。更具体地,这样的组分包括激活物或阻遏物,例如RNA翻译、降解等的激活物或阻遏物。
根据一个方面,本发明提供了非天然存在的或工程化的组合物,其包含指导RNA或crRNA,所述指导RNA或crRNA包含能够与细胞中的感兴趣的靶序列杂交的指导序列,其中所述指导RNA或crRNA是通过插入一个或多个结合衔接蛋白的不同RNA序列来修饰。在特定的实施方案中,RNA序列可以结合两个或更多个衔接蛋白(例如,适体),并且其中每个衔接蛋白与一个或多个功能结构域关联。当存在多于一个功能结构域时,功能结构域可以相同或不同,例如两个相同或两个不同的激活物或阻遏物。在一个方面,本发明提供了本文讨论的组合物,其中一个或多个功能结构域连接至RNA靶向酶,使得在与靶RNA结合后,功能结构域处于允许功能结构域以其归属功能起作用的空间取向。在一个方面,本发明提供了本文讨论的组合物,其中所述组合物包含具有至少三个功能结构域的CRISPR-Cas13b复合物,其中至少一个与RNA靶向酶关联,并且其中至少两个与gRNA或crRNA关联。
Cas13b效应蛋白复合物或其组分的递送
通过本公开和本领域的知识,TALE、CRISPR-Cas系统或其组分或其核酸分子(包括例如HDR模板)或编码或提供其组分的核酸分子可以通过本文一般和详细描述的递送系统递送。
载体递送,例如质粒,病毒递送:可以使用任何合适的载体,例如质粒或病毒载体,例如腺相关病毒(AAV)、慢病毒、腺病毒或其他病毒载体类型,或其组合,来递送CRISPR酶和/或任何本发明RNA,例如指导RNA。效应蛋白和一种或多种指导RNA可以包装到一个或多个载体中,例如质粒或病毒载体。在一些实施方案中,载体,例如质粒或病毒载体,是通过例如肌内注射递送至感兴趣的组织,而其他时间递送是通过静脉内,透皮,鼻内,口服,粘膜或其他递送方法。这样的递送可以是单剂量或多剂量。本领域技术人员理解,本文中待递送的实际剂量可以根据多种因素而有很大变化,例如载体选择,靶细胞、生物体或组织,待治疗的受试者的一般情况,所寻求的转变/改变的程度,施用途径,施用方式,所寻求的转变/改变的类型等。
这样的剂量可以进一步包含例如载体(水,盐水,乙醇,甘油,乳糖,蔗糖,磷酸钙,明胶,右旋糖酐,琼脂,果胶,花生油,芝麻油等),稀释剂,药学上可接受的载体(例如磷酸盐缓冲盐水),药学上可接受的赋形剂,和/或本领域已知的其他化合物。剂量还可以包含一种或多种药学上可接受的盐,例如无机酸盐,例如盐酸盐,氢溴酸盐,磷酸盐,硫酸盐等;和有机酸的盐,例如乙酸盐,丙酸盐,丙二酸盐,苯甲酸盐等。另外,本文也可以存在辅助物质,例如润湿剂或乳化剂,pH缓冲物质,凝胶或胶凝材料,调味剂,着色剂,微球,聚合物,悬浮剂等。另外,还可以存在一种或多种其他常规药物成分,例如防腐剂,湿润剂,助悬剂,表面活性剂,抗氧化剂,抗结块剂,填充剂,螯合剂,包衣剂,化学稳定剂等,特别是如果剂型是可重构形式。合适的示例性成分包括微晶纤维素,羧甲基纤维素钠,聚山梨酸酯80,苯乙醇,氯丁醇,山梨酸钾,山梨酸,二氧化硫,没食子酸丙酯,对羟基苯甲酸酯,乙基香兰素,甘油,苯酚,对氯苯酚,明胶,白蛋白及其组合。药学上可接受的赋形剂的详尽讨论可获自REMINGTON'SPHARMACEUTICAL SCIENCES(Mack Pub.Co.,N.J.1991),其通过引用并入本文。
在本文的一个实施方案中,递送是通过腺病毒进行,其可以是以包含至少1×105个腺病毒载体颗粒(也称为颗粒单位,pu)的单一加强剂量。在本文的一个实施方案中,剂量优选为至少约1×106个颗粒(例如,约1×106-1×1012个颗粒),更优选至少约1×107个颗粒,更优选至少约1×108个颗粒(例如,约1×108-1×1011个颗粒或约1×108-1×1012个颗粒),最优选至少约1×100个颗粒(例如,约1×109-1×1010个颗粒或约1×109-1×1012个颗粒,或甚至至少约1×1010个颗粒(例如,约1×1010-1×1012个颗粒)的腺病毒载体。或者,该剂量包含不超过约1×1014个颗粒,优选不超过约1×1013个颗粒,甚至更优选不超过约1×1012个颗粒,甚至更优选不超过约1×1011个颗粒,最优选不超过约1×1010个颗粒(例如,不超过约1×109个物品)。因此,该剂量可以包含单剂量的腺病毒载体,其具有例如约1×106颗粒单位(pu),约2×106pu,约4×106pu,约1×107pu,约2×107pu,约4×107pu,约1×108pu,约2×108pu,约4×108pu,约1×109pu,约2×109pu,约4×109pu,约1×1010pu,约2×1010pu,约4×1010pu,约1×1011pu,约2×1011pu,约4×1011pu,约1×1012pu,约2×1012pu或约4×1012pu的腺病毒载体。参见,例如,2013年6月4日授权的Nabel等的美国专利号8,454,972B2中的腺病毒载体,通过引用并入本文,及其在第29栏第36-58行的剂量。在本文的一个实施方案中,腺病毒是通过多次剂量递送。
在本文的一个实施方案中,递送是通过AAV进行。用于向人类体内递送AAV的治疗有效剂量据信为约20至约50ml盐水溶液,其包含约1×1010至约1×1010功能性AAV/ml溶液。可以调节剂量以平衡治疗益处与任何副作用。在本文的一个实施方案中,AAV剂量通常是约1×105至1×1050个基因组AAV,约1×108至1×1020个基因组AAV,约1×1010至约1×1016个基因组,或约1×1011至约1×1016个基因组AAV的浓度范围内。人剂量可以是约1×1013个基因组AAV。这样的浓度可以以约0.001ml至约100ml,约0.05至约50ml,或约10至约25ml的载体溶液递送。通过建立剂量响应曲线的常规试验,本领域普通技术人员可以容易地确定其他有效剂量。参见,例如,2013年3月26日授权的Hajjar等的美国专利号8,404,658B2,第27栏第45-60行。
在本文的一个实施方案中,递送是通过质粒。在这样的质粒组合物中,剂量应为足以引起应答的质粒的量。例如,质粒组合物中的质粒DNA的合适量可以是每70kg个体约0.1至约2mg,或约1μg至约10μg。本发明的质粒通常将包含(i)启动子;(ii)与所述启动子可操作地连接的编码核酸靶向CRISPR酶的序列;(iii)可选择标志物;(iv)复制起点;和(v)在(ii)下游并与之可操作性地连接的转录终止子。该质粒还可以编码CRISPR复合物的RNA组分,但是这些中的一个或多个或者可以在不同的载体上编码。
本文的剂量是基于平均70kg的个体。施用频率是在医学或兽医从业者(例如,医师,兽医)或本领域技术人员的能力范围内。还注意,实验中使用的小鼠通常约为20g,并且从小鼠实验可以扩展到70kg的个体。
在一些实施方案中,本发明的RNA分子是以脂质体或脂质转染剂制剂等形式递送,并且可以通过本领域技术人员众所周知的方法来制备。这样的方法例如在美国专利号5,593,972、5,589,466和5,580,859中描述,其通过引用并入本文。已经开发了专门针对增强和改善siRNA递送到哺乳动物细胞中的递送系统(参见,例如,Shen等,FEBS Let.2003,539:111-114;Xiaetal.,Nat.Biotech.2002,20:1006-1010;Reich等,Mol.Vision.2003,9:210-216;Sorensen等,J.Mol.Biol.2003,327:761-766;Lewis等,Nat.Gen.2002,32:107-108和Simeoni等,NAR 2003,31,11:2717-2724),并且可以应用于本发明。siRNA最近已成功用于抑制灵长类动物中的基因表达(参见,例如,Tolentino等,Retina 24(4):660,其也可以应用于本发明。
实际上,RNA递送是体内递送的有用方法。可以使用脂质体或颗粒将核酸靶向Cas蛋白和指导RNA(例如HR修复模板)递送到细胞中。因此,本发明的核酸靶向Cas13b蛋白的递送和/或指导RNA或crRNA的递送可以是以RNA形式并且通过微泡、脂质体或颗粒。例如,可以将Cas13b mRNA和指导RNA或crRNA包装到脂质体颗粒中以体内递送。脂质体转染试剂,例如Life Technologies的lipofectamine和市场上的其他试剂,可以有效地将RNA分子递送到肝脏中。
RNA的递送方式也优选包括经由纳米颗粒(Cho,S.,Goldberg,M.,Son,S.,Xu,Q.,Yang,F.,Mei,Y.,Bogatyrev,S.,Langer,R.和Anderson,D.,Lipid-like nanoparticlesfor small interfering RNA delivery to endothelial cells,Advanced FunctionalMaterials,19:3112-3118,2010)或外泌体(Schroeder,A.,Levins,C.,Cortez,C.,Langer,R.,and Anderson,D.,Lipid-based nanotherapeutics for siRNA delivery,Journal ofInternal Medicine,267:9-21,2010,PMID:20059641)的RNA递送。实际上,已显示外泌体在递送siRNA方面特别有用,是与RNA靶向系统有些相似之处的系统。例如,El-Andaloussi S等(“Exosome-mediated delivery of siRNA in vitro and in vivo.”Nat Protoc.2012Dec;7(12):2112-26.doi:10.1038/nprot.2012.131.Epub,2012年11月15日)描述了外泌体如何是用于跨不同生物屏障的药物递送的有希望的工具,并可以利用用于体内和体外递送siRNA。他们的方法是通过转染包含与肽配体融合的外泌体蛋白的表达载体来产生靶向的外泌体。然后将外泌体从转染细胞上清液中纯化和表征,然后RNA被装入外泌体。根据本发明的递送或施用可以用外泌体进行,特别是但不限于大脑。维生素E(α-生育酚)可以与核酸靶向Cas蛋白缀合,并与高密度脂蛋白(HDL)一起递送到大脑,例如,采用与Uno等相似的方法(HUMAN GENE THERAPY 22:711–719(2011年6月))递送短干扰RNA(siRNA)至大脑。通过充满磷酸盐缓冲液(PBS)或游离TocsiBACE或Toc-siBACE/HDL并与Brain Infusion Kit3(Alzet)连接的Osmotic微型泵(型号1007D;Alzet,Cupertino,CA)输注小鼠。将大脑输液插管在前囟前约0.5mm处中间放置,以输注到背第三脑室中。Uno等发现,少至3nmol的Toc-siRNA与HDL一起可以诱导与使用相同ICV输注方法程度相当的靶点减少。在本发明中,对于人类可以设想相似剂量的缀合至α-生育酚并与靶向大脑的HDL共同施用的核酸靶向效应蛋白,例如,可以设想约3nmol至约3μmol的靶向大脑的核酸靶向效应蛋白。Zou等((HUMANGENE THERAPY 22:465-475(2011年4月))描述了慢病毒介导的靶向PKCγ的短发夹RNA的递送方法,用于大鼠的脊髓中的体内基因沉默。Zou等通过鞘内导管施用约10μl的效价为1×109转导单位(TU)/ml的重组慢病毒。在本发明中,对于人类可以设想相似剂量的在靶向大脑的慢病毒载体中表达的核酸靶向效应蛋白,例如,可以设想约10-50ml的效价为1×109转导单位(TU)/ml的慢病毒中靶向大脑的核酸靶向效应蛋白。
就局部递送至大脑而言,这可以通过多种方式实现。例如,材料可以例如通过注射在纹状体内递送。注射可以通过开颅手术立体定位地进行。
通常地包装和启动子
将编码RNA靶向效应蛋白(Cas13b蛋白)的核酸分子(例如DNA)包装到载体(例如病毒载体)中以介导体内基因组修饰的方法包括:
单一病毒载体:
包含两个或更多个表达盒的载体:
启动子-编码核酸靶向效应蛋白的核酸分子-终止子
启动子-指导RNA1-终止子
启动子-指导RNA(N)-终止子(至多至载体大小)
双重病毒载体:
载体1,其包含一个表达盒,用于驱动RNA靶向效应蛋白(Cas13b)的表达
启动子-编码RNA靶向效应(Cas13b)蛋白的核酸分子-终止子
载体2,其包含一个或多个表达盒,用于驱动一种或多种指导RNA或crRNA的表达
启动子-指导RNA1或crRNA1-终止子
启动子-指导RNA1(N)或crRNA1(N)-终止子(至多至载体大小)。
用于驱动编码RNA靶向效应蛋白的核酸分子表达的启动子可以包括可以用作启动子的AAV ITR:这有利于消除对另外的启动子元件(其可以占用载体空间)的需要。释放的额外空间可用于驱动另外的元件(gRNA等)的表达。而且,ITR活性相对较弱,因此可用于降低由于核酸靶向效应蛋白的过表达而引起的潜在毒性。对于普遍表达,可以使用以下启动子:CMV,CAG,CBh,PGK,SV40,铁蛋白重链或轻链等。对于大脑或其他CNS表达,可以使用以下启动子:SynapsinI用于所有神经元,CaMKIIalpha用于兴奋性神经元,GAD67或GAD65或VGAT用于GABA能神经元,等等。对于肝脏表达,可以使用白蛋白启动子。对于肺部表达,可以使用SP-B。对于内皮细胞,可以使用ICAM。对于造血细胞,可以使用IFNbeta或CD45。对于成骨细胞可以使用OG-2。用于驱动指导RNA的启动子可以包括:Pol III启动子,例如U6或H1;PolII启动子和内含子盒,以表达指导RNA或crRNA。
腺相关病毒(AAV)
可以使用腺相关病毒(AAV),慢病毒,腺病毒或其他质粒或病毒载体类型递送Cas13b和一种或多种指导RNA或crRNA,特别是,使用来自例如美国专利号8,454,972(用于腺病毒的制剂、剂量),8,404,658(用于AAV的制剂、剂量)和5,846,946(用于DNA质粒的制剂、剂量)以及来自涉及慢病毒、AAV和腺病毒的临床试验和关于临床试验的出版物的制剂和剂量。例如,对于AAV,施用途径、制剂和剂量可以如美国专利号8,454,972和涉及AAV的临床试验中所述。对于腺病毒,施用途径、制剂和剂量可以如美国专利号8,404,658和涉及腺病毒的临床试验中所述。对于质粒递送,施用途径、制剂和剂量可以如美国专利号5,846,946中和涉及质粒的临床研究中所述。剂量可以基于或外推至平均70kg的个体(例如,男性成人),并且可以针对不同体重和物种的患者、受试者、哺乳动物进行调整。施用频率是在医学或兽医从业者(例如医师,兽医)的能力范围内,这取决于通常的因素,包括年龄、性别、总体健康状况、患者或受试者的其他状况和要解决的特定状况或症状。可以将病毒载体注射到感兴趣的组织中。对于细胞类型特异性基因组修饰,RNA靶向效应蛋白(Cas13b效应蛋白)的表达可以由细胞类型特异性启动子驱动。例如,肝脏特异性表达可能使用白蛋白启动子,神经元特异性表达(例如,用于靶向CNS紊乱)可能使用SynapsinI启动子。就体内递送而言,AAV因为多个原因而优于其他病毒载体:低毒性(这可以是由于不需要可激活免疫应答的细胞颗粒的超离心的纯化方法)和低概率引起插入诱变,因为它不整合到宿主基因组中。
AAV的包装限制为4.5或4.75Kb。这意味着RNA靶向效应蛋白(Cas13b效应蛋白)编码序列以及启动子和转录终止子必须都装配到同一病毒载体中。对于AAV,AAV可以是AAV1,AAV2,AAV5或其任何组合。可以针对待靶向的细胞选择AAV中的AAV;例如,可以选择AAV血清型1、2、5或混合衣壳AAV1,AAV2,AAV5或其任何组合以靶向大脑或神经元细胞;并且可以选择AAV4以靶向心脏组织。AAV8可用于递送至肝脏。本文的启动子和载体是个体地优选的。关于这些细胞的某些AAV血清型的列表(参见Grimm,D.等,J.Virol.82:5887-5911(2008))如下:
慢病毒
慢病毒是复杂的逆转录病毒,具有在有丝分裂和有丝分裂后细胞两者中感染并表达其基因的能力。最常见的慢病毒是人类免疫缺陷病毒(HIV),其使用其他病毒的包膜糖蛋白以靶向广泛的细胞类型。慢病毒可以如下制备。在克隆pCasES10(其包含慢病毒转移质粒骨架)后,在转染到含10%胎牛血清且无抗生素的DMEM中前一天将低传代(p=5)的HEK293FT接种到T-75烧瓶中至50%汇合。20小时后,将培养基更换为OptiMEM(无血清)培养基,并在4小时后进行转染。用10μg慢病毒转移质粒(pCasES10)和以下包装质粒来转染细胞:5μg的pMD2.G(VSV-g假型),和7.5μg的psPAX2(gag/pol/rev/tat)。在具有阳离子脂质递送剂(50uL Lipofectamine 2000和100ul Plus试剂)的4ml OptiMEM中进行转染。6小时后,将培养基更换为含10%胎牛血清的无抗生素DMEM。这些方法在细胞培养过程中使用血清,但优选无血清的方法。
慢病毒可以如下纯化。48小时后收获病毒上清液。首先清除上清液中的碎片,然后通过0.45um低蛋白结合(PVDF)过滤器进行过滤。然后将它们在超速离心机中以24,000rpm旋转2小时。将病毒沉淀在4℃下重悬于50ul DMEM中过夜。然后将它们等分并立即在-80℃冷冻。
在另一个实施方案中,还设想了基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体,特别是用于眼基因治疗(参见,例如,Balagaan,J Gene Med 2006;8:275-285)。在另一个实施方案中,还设想了基于马感染性贫血病毒的慢病毒基因治疗载体,其表达血管抑制蛋白内皮抑素和血管抑素,其通过视网膜下注射递送以治疗年龄相关性黄斑变性的网状形式(参见例如,Binley等.,HUMAN GENE THERAPY 23:980–991(2012年9月)),并且该载体可针对本发明的核酸靶向系统进行修饰。
在另一个实施方案中,具有靶向HIV tat/rev共有的共同外显子的siRNA、核定位TAR诱饵和抗CCR5特异性锤头状核酶的自失活慢病毒载体(参见,例如,DiGiusto等.(2010)Sci Transl Med 2:36ra43)可以被使用和/或适于本发明的核酸靶向系统。可以收集最少2.5×106CD34+细胞每千克患者体重,并在含有2μmol/L谷氨酰胺、干细胞因子(100ng/ml),Flt-3配体(Flt-3L)(100ng/ml)和血小板生成素(10ng/ml)(CellGenix)的X-VIVO 15培养基(Lonza)中预刺激16至20小时,密度为2×106细胞/ml。可以在包被有纤连蛋白(25mg/cm2)(RetroNectin,Takara Bio Inc.)的75cm2组织培养瓶中以5的感染复数用慢病毒转导预刺激的细胞16至24小时。
已经公开了帕金森氏病治疗中的慢病毒载体,参见例如美国专利公开号20120295960和美国专利号7303910和7351585。还已经公开了用于治疗眼部疾病的慢病毒载体,参见,例如,美国专利公开号20060281180、20090007284,US20110117189;US20090017543;US20070054961,US20100317109。也已公开用于递送至大脑的慢病毒载体,参见,例如,美国专利公开号US20110293571;US20110293571,US20040013648,US20070025970,US20090111106和美国专利号US7259015。
RNA递送
RNA递送:核酸靶向Cas13b蛋白和/或指导RNA也可以RNA的形式递送。可以使用包含以下元件的PCR盒合成mRNA:T7_promoter-kozak序列(GCCACC)-效应蛋白-来自β珠蛋白的3'UTR-polyA尾巴(一串120或更多个腺嘌呤)。该盒可用于通过T7聚合酶转录。指导RNA或crRNA也可以使用体外转录从含有T7_promoter-GG-指导RNA或crRNA序列的盒转录。
颗粒递送系统和/或制剂:
已知多种类型的颗粒递送系统和/或制剂可用于多种生物医学应用。通常,颗粒被定义为在其运输和属性方面表现为整体单位的小物体。颗粒根据直径进一步分类。粗颗粒覆盖2,500至10,000纳米的范围。细颗粒的尺寸在100到2,500纳米之间。超细颗粒或纳米颗粒的尺寸通常在1到100纳米之间。100nm限度的基础是将颗粒与块状材料区分开的新特性通常在100nm以下的临界长度尺度发生。
如本文所用,颗粒递送系统/制剂定义为包含根据本发明的颗粒的任何生物递送系统/制剂。根据本发明的颗粒是具有小于100微米(μm)的最大尺寸(例如直径)的任何实体。在一些实施方案中,本发明的颗粒具有小于10μm的最大尺寸。在一些实施方案中,本发明的颗粒具有小于2000纳米(nm)的最大尺寸。在一些实施方案中,本发明的颗粒具有小于1000纳米(nm)的最大尺寸。在一些实施方案中,本发明的颗粒具有小于900nm,800nm,700nm,600nm,500nm,400nm,300nm,200nm或100nm的最大尺寸。通常,本发明的颗粒具有500nm或更小的最大尺寸(例如,直径)。在一些实施方案中,本发明的颗粒具有250nm或更小的最大尺寸(例如,直径)。在一些实施方案中,本发明的颗粒具有200nm或更小的最大尺寸(例如,直径)。在一些实施方案中,本发明的颗粒具有150nm或更小的最大尺寸(例如,直径)。在一些实施方案中,本发明的颗粒具有100nm或更小的最大尺寸(例如,直径)。在本发明的一些实施方案中,使用较小的颗粒,例如具有50nm或更小的最大尺寸。在一些实施方案中,本发明的颗粒具有在25nm至200nm之间的最大尺寸。
颗粒表征(包括表征形态、尺寸等)是使用多种不同技术完成。常用技术是电子显微镜(TEM、SEM),原子力显微镜(AFM),动态光散射(DLS),X射线光电子能谱(XPS),粉末X射线衍射(XRD),傅里叶变换红外光谱(FTIR),基质辅助激光解吸/电离飞行时间质谱(MALDI-TOF),紫外可见光谱,双极化干涉仪和核磁共振(NMR)。可以针对天然颗粒(即,预装载)或在装载货物后进行表征(尺寸测量)(此处货物是指,例如,CRISPR-Cas13b系统的一个或多个组分,例如Cas13b酶或mRNA或指导RNA,或其任何组合,并且可以包括另外的载体和/或赋形剂),以提供具有对于本发明的任何体外、离体和/或体内应用递送最佳的尺寸的颗粒。在某些优选实施方案中,颗粒尺寸(例如直径)表征是基于使用动态激光散射(DLS)的测量。提到了美国专利号8,709,843;美国专利号5,886,855;美国专利号5,855,913;美国专利号5,985,309;美国专利号5,543,158;以及James E.Dahlman and Carmen Barnes等.NatureNanotechnology(2014),2014年5月11日在线公布,doi:10.1038/nnano.2014.84的出版物,涉及颗粒,制备和使用它们的方法及其测量。另见Dahlman等.“Orthogonal gene controlwith a catalytically active Cas9 nuclease,”Nature Biotechnology 33,1159-1161(2015年11月)
本发明范围内的颗粒递送系统可以以任何形式提供,包括但不限于固体、半固体、乳液或胶体颗粒。这样,本文所述的任何递送系统,包括但不限于例如基于脂质的系统,脂质体,胶束,微囊泡,外泌体或基因枪,可以作为本发明范围内的颗粒递送系统提供。
颗粒
可使用颗粒或脂质包膜同时递送Cas13b mRNA和指导RNA或crRNA。例如,本发明的CRISPR酶和RNA,例如作为复合物,可以通过如Dahlman等,WO2015089419A2及其中引用的文献中的颗粒来递送,例如7C1(参见,例如,James E.Dahlman and Carmen Barnes等.NatureNanotechnology(2014),2014年5月11日在线公布,doi:10.1038/nnano.2014.84),例如包含脂质或类脂质和亲水性聚合物(例如阳离子脂质和亲水性聚合物)的递送颗粒,例如其中阳离子脂质包含1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)或1,2-双十四烷酰基-sn-甘油-3-磷酸胆碱(DMPC)和/或其中亲水性聚合物包含乙二醇或聚乙二醇(PEG);和/或其中颗粒进一步包含胆固醇(例如,来自制剂1的颗粒=DOTAP 100,DMPC 0,PEG 0,胆固醇0;制剂编号2=DOTAP 90,DMPC 0,PEG 10,胆固醇0;制剂编号3=DOTAP 90,DMPC 0,PEG 5,胆固醇5),其中使用高效的多步骤方法形成颗粒,其中首先将效应蛋白和RNA例如以1:1的摩尔比混合在一起,例如在室温下混合,例如混合30分钟,例如在无菌的无核酸酶的1X PBS中混合;并且分别将适用于制剂的DOTAP,DMPC,PEG和胆固醇溶解在醇例如100%乙醇中;然后将两种溶液混合在一起以形成含有复合物的颗粒。可使用颗粒或脂质包膜同时递送Cas13b效应蛋白mRNA和指导RNA。该Dahlman等的技术可以应用在本发明中。可以使用环氧化物修饰的脂质聚合物将本发明的核酸靶向系统递送至肺、心血管或肾细胞,然而本领域技术人员可以使该系统适应递送至其他靶器官。设想的剂量范围为约0.05至约0.6mg/kg。还设想了几天或几周的剂量,总剂量为约2mg/kg。例如,Su X,Fricke J,Kavanagh DG,Irvine DJ(“In vitro and in vivo mRNA delivery using lipid-enveloped pH-responsivepolymer nanoparticles”Mol Pharm.2011 Jun 6;8(3):774-87.doi:10.1021/mp100390w.Epub 2011年4月1日)描述了可生物降解的核-壳结构颗粒,其中聚(β-氨基酯)(PBAE)核被磷脂双层壳包裹。这些被开发用于体内mRNA递送。选择pH响应性PBAE组分以促进核内体破坏,同时选择脂质表面层以最小化聚阳离子核的毒性。这样因此对于递送本发明的RNA是优选的。
在一个实施方案中,设想了基于自组装生物粘附性聚合物的颗粒,其可被用于口服递送肽,静脉内递送肽和鼻内递送肽,均被递送至大脑。还设想了其他实施方案,例如疏水性药物的口服吸收和眼部递送。分子包膜技术涉及工程化聚合物包膜,其受到保护并被递送到疾病部位(参见,例如,Mazza,M.等.ACSNano,2013.7(2):1016-1026;Siew,A.,等.Mol Pharm,2012.9(1):14-28;Lalatsa,A.,等.J Contr Rel,2012.161(2):523-36;Lalatsa,A.,等.,Mol Pharm,2012.9(6):1665-80;Lalatsa,A.,等.Mol Pharm,2012.9(6):1764-74;Garrett,N.L.,等.J Biophotonics,2012.5(5-6):458-68;Garrett,N.L.,等.JRaman Spect,2012.43(5):681-688;Ahmad,S.,等.J Royal Soc Interface 2010.7:S423-33;Uchegbu,I.F.Expert Opin Drug Deliv,2006.3(5):629-40;Qu,X.,等.Biomacromolecules,2006.7(12):3452-9 and Uchegbu,I.F.,等.Int J Pharm,2001.224:185-199)。设想了约5mg/kg的剂量,根据靶组织,采用单剂量或多剂量。
关于颗粒,还参见Alabi等.,Proc Natl Acad Sci U S A.2013 Aug 6;110(32):12881-6;Zhang等.,Adv Mater.2013 Sep 6;25(33):4641-5;Jiang等.,Nano Lett.2013Mar 13;13(3):1059-64;Karagiannis等.,ACS Nano.2012 Oct 23;6(10):8484-7;Whitehead等.,ACS Nano.2012 Aug 28;6(8):6922-9,和Lee等.,Nat Nanotechnol.2012Jun 3;7(6):389-93。
美国专利申请20110293703涉及类脂质化合物也在多核苷酸的施用中特别有用,其可用于递送本发明的核酸靶向系统。在一个方面,将氨基醇类脂质化合物与试剂结合以递送至细胞或受试者以形成微粒、纳米颗粒、脂质体或胶束。由颗粒、脂质体或胶束递送的试剂可以是气体、液体或固体的形式,并且该试剂可以是多核苷酸、蛋白质、肽或小分子。氨基醇类脂质化合物可以与其它氨基醇类脂质化合物、聚合物(合成或天然)、表面活性剂、胆固醇、碳水化合物、蛋白质、脂质等组合以形成颗粒。然后可以将这些颗粒任选地与药物赋形剂组合以形成药物组合物。美国专利公开号20110293703也提供了制备氨基醇类脂质化合物的方法。使一个或多个当量的胺与一个或多个当量的环氧化物封端化合物在合适的条件下反应以形成本发明的氨基醇类脂质化合物。在某些实施方案中,胺的所有氨基与环氧化物封端化合物完全反应以形成叔胺。在其他实施方案中,胺的所有氨基不与环氧化物封端化合物完全反应以形成叔胺,从而在氨基醇类脂质化合物中产生伯胺或仲胺。这些伯胺或仲胺保持原样,或者可以与另一种亲电子试剂,例如不同的环氧化物封端化合物反应。如本领域技术人员将理解的,使胺与少于过量的环氧化物封端化合物反应将产生具有不同尾数的多种不同的氨基醇类脂质化合物。某些胺可以被两个环氧化物衍生化合物尾完全官能化,而其他分子不被环氧化物衍生化合物尾完全官能化。例如,二胺或多胺可包含分子的不同氨基部分上的一个、两个、三个或四个环氧化物衍生化合物尾,从而形成伯、仲和叔胺。在某些实施方案中,所有氨基未被完全官能化。在某些实施方案中,使用两种相同类型的环氧化物封端化合物。在其他实施方案中,使用两种或更多种不同的环氧化物封端化合物。氨基醇类脂质化合物的合成是在有或没有溶剂的情况下进行,并且该合成可以是在30-100℃,优选大约50-90℃的较高温度下进行。制备的氨基醇类脂质化合物可以任选地纯化。例如,可以纯化氨基醇类脂质化合物的混合物以产生具有特定数量的环氧化物衍生化合物尾的氨基醇类脂质化合物。或者,可以纯化混合物以产生特定的立体异构体或区域异构体。氨基醇类脂质化合物还可以使用烷基卤化物(例如,甲基碘)或其它烷基化剂烷基化,和/或它们可以被酰化。
美国专利公开号20110293703也提供了通过本发明方法制备的氨基醇类脂质化合物的文库。可以使用涉及液体处理机,机器人,微量滴定板,计算机等的高通量技术制备和/或筛选这些氨基醇类脂质化合物。在某些实施方案中,筛选氨基醇类脂质化合物转染多核苷酸或其他试剂(例如,蛋白质、肽、小分子)到细胞中的能力。美国专利公开号20130302401涉及已经使用组合聚合制备的一类聚(β-氨基醇)(PBAA)。本发明的PBAA可以在生物技术和生物医学应用中用作涂层(例如用于医疗装置或植入物的膜或多层膜的涂层),添加剂,材料,赋形剂,非生物污损剂,微图案形成剂和细胞包封剂。当用作表面涂层时,这些PBAA根据其化学结构在体内和体外引起不同程度的炎症。这类材料的巨大化学多样性允许我们鉴定体外抑制巨噬细胞活化的聚合物涂层。此外,这些涂层在皮下植入羧化聚苯乙烯微粒之后,减少了炎症细胞的募集并减少了纤维化。这些聚合物可用于形成用于细胞包封的聚电解质复合物囊剂。本发明还可具有许多其他生物学应用,例如抗微生物涂层,DNA或siRNA递送,和干细胞组织工程。美国专利公开号20130302401的教导可以应用于本发明的核酸靶向系统。
在另一个实施方案中,设想了脂质纳米颗粒(LNP)。抗转甲状腺素蛋白小干扰RNA已被包封在脂质纳米颗粒中并递送至人类(参见,例如,Coelho等.,N Engl J Med 2013;369:819-29),并且这样的系统可以适于并应用于本发明的核酸靶向系统。设想了静脉内施用的约0.01至约1mg每千克体重的剂量。设想了降低输注相关反应的风险的药物治疗,例如地塞米松,对乙酰氨基酚,苯海拉明或西替利嗪,以及雷尼替丁。还设想了每四周约0.3mg每kg、五个剂量的多剂量。已经显示LNP在递送siRNA至肝脏的方面高度有效(参见,例如,Tabernero等.,Cancer Discovery,April 2013,Vol.3,No.4,pages 363-470),因此设想用于递送编码核酸靶向效应蛋白的RNA至肝脏。可以设想每两周约四剂量的6mg/kg LNP的剂量。Tabernero等证明,在以0.7mg/kg给药LNP的前2个周期后,观察到肿瘤消退,并且到6个周期结束时,患者已实现部分响应,淋巴结转移完全消退,肝肿瘤明显缩小。该患者在40剂量后获得了完全响应,该患者在接受26个月的剂量后仍处于缓解状态并完成了治疗。在VEGF途径抑制剂的在先治疗后发生进展的具有RCC和包括肾、肺和淋巴结的肝外疾病部位的两位患者,在所有部位具有大约8至12个月的稳定病情,并且具有PNET和肝转移的患者继续延伸研究达18个月(36剂量),病情稳定。然而,LNP的电荷必须纳入考虑。由于阳离子脂质与带负电荷的脂质结合以诱导促进细胞内递送的非双层结构。因为带电的LNP在静脉注射后迅速从循环中清除,因此开发了pKa值低于7的可离子化阳离子脂质(参见,例如,Rosin等,Molecular Therapy,vol.19,no.12,pages 1286-2200,2011年12月)。可以将带负电荷的聚合物(例如RNA)在低pH值(例如pH 4)下加载到LNP中,其中可离子化脂质表现出正电荷。然而,在生理pH值下,LNP表现出与更长循环时间相容的低表面电荷。四种可离子化阳离子脂质已得到关注,即1,2-二亚油基-3-二甲基铵-丙烷(DLinDAP),1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA),1,2-二亚油基氧基-酮基-N,N-二甲基-3-氨基丙烷(DLinKDMA)和1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)。已经显示,包含这些脂质的LNP siRNA系统体内在肝细胞中表现出明显不同的基因沉默特性,其效力采用因子VII基因沉默模型根据DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP系列而变化(参见,例如Rosin等,Molecular Therapy,vol.19,no.12,pages 1286-2200,2011年12月)。可以设想1μg/ml的LNP或在LNP中或与LNP关联的CRISPR-Cas RNA的剂量,特别是对于含有DLinKC2-DMA的制剂。
LNP的制备和CRISPR-Cas13b包封可以用自和/或改编自Rosin等,MolecularTherapy,vol.19,no.12,pages 1286-2200,2011年12月)。阳离子脂质1,2-二亚油基-3-二甲基铵-丙烷(DLinDAP),1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA),1,2-二亚油基氧基酮-N,N-二甲基-3-氨基丙烷(DLinK-DMA),1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA),(3-o-[2”-(甲氧基聚乙二醇2000)琥珀酰基]-1,2-二肉豆蔻酰基-sn-乙二醇(PEG-S-D MG)和R-3-[(ω-甲氧基-聚(乙二醇)2000)氨基甲酰基]-1,2-二肉豆蔻酰基氧丙基-3-胺(PEG-C-DOMG)可由Tekmira Pharmaceuticals(加拿大温哥华)提供或合成。胆固醇可购自Sigma(密苏里州圣路易斯)。可以将特异性核酸靶向复合物(CRISPR-Cas)RNA包封在含有DLinDAP,DLinDMA,DLinK-DMA和DLinKC2-DMA的LNP中(阳离子脂质:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG为40:10:40:10摩尔比)。需要时,可掺入0.2%SP-DiOC18(Invitrogen,加拿大伯灵顿)以评估细胞摄取、细胞内递送和生物分布。可以通过将包含阳离子脂质:DSPC:胆固醇:PEG:c-DOMG(40:10:40:10摩尔比)的脂质混合物溶解在乙醇中至最终脂质浓度为10mmol/l来进行包封。可以将这种脂质的乙醇溶液滴加至pH 4.0的50mmol/l柠檬酸盐中以形成多层囊泡以产生30%乙醇体积/体积的最终浓度。可以使用挤出机(Northern Lipids,加拿大温哥华),在多层囊泡挤出经过两个堆叠的80nm Nuclepore聚碳酸酯滤膜后,形成大的单层囊泡。可以通过将以2mg/ml溶于含有30%乙醇体积/体积、pH 4.0的50mmol/l柠檬酸盐中的RNA,滴加到挤出的预制大单层囊泡中,并在31℃孵育30分钟并持续混合达到最终RNA/脂质重量比为0.06/1重量/重量。使用Spectra/Por 2再生纤维素透析膜,通过pH 7.4的磷酸盐缓冲盐水(PBS)透析16小时,去除乙醇并中和制剂缓冲液。可以通过使用NICOMP370粒度仪、囊泡/强度模式和高斯拟合(Nicomp Particle Sizing,Santa Barbara,CA)的动态光散射来测定粒度分布。所有三个LNP系统的粒度均为约70nm直径。RNA包封效率可通过使用VivaPureD MiniH柱(Sartorius Stedim Biotech)从透析前后收集的样品中去除游离RNA来确定。可以从洗脱的颗粒中提取包封的RNA,并在260nm处定量。通过使用来自Wako Chemicals USA(Richmond,VA)的胆固醇E酶测定法测量囊泡中的胆固醇含量来确定RNA与脂质的比率。结合本文对LNP和PEG脂质的讨论,聚乙二醇化脂质体或LNP同样适合于递送核酸靶向系统或其组分。大型LNP的制备可以用自和/或改编自Rosin等,Molecular Therapy,vol.19,no.12,pages 1286-2200,2011年12月。可以在含有50:10:38.5摩尔比的DLinKC2-DMA、DSPC和胆固醇的乙醇中制备脂质预混溶液(总脂质浓度为20.4mg/ml)。可以以0.75:1的摩尔比(乙酸钠:DLinKC2-DMA)将乙酸钠添加到脂质预混合物中。随后可通过在剧烈搅拌下将混合物与1.85体积的柠檬酸盐缓冲液(10mmol/l,pH 3.0)合并来水合脂质,从而在含有35%乙醇的水性缓冲液中自发形成脂质体。脂质体溶液可以在37℃下孵育以允许粒度的时间依赖性增加。可以在培养期间的不同时间取出等分试样,以通过动态光散射(Zetasizer Nano ZS,Malvern Instruments,Worcestershire,UK)来研究脂质体大小的变化。一旦达到期望粒度,可以将PEG脂质水溶液(储备液=在35%(vol/vol)乙醇中的10mg/ml PEG-DMG)添加到脂质体混合物中以产生3.5%总脂质的最终PEG摩尔浓度。加入PEG-脂质后,脂质体应达到其大小,从而有效结束进一步的生长。然后可以将RNA以大约1:10(重量:重量)的RNA与总脂质的比率添加至空脂质体,然后在37℃下孵育30分钟以形成负载的LNP。随后可以将混合物在PBS中透析过夜,并用0.45-μm注射器过滤器过滤。
球形核酸(SNATM)构建体和其他颗粒(特别是金颗粒)也被设想作为将核酸靶向系统递送至预期靶标的手段。大量数据表明,基于核酸功能化金颗粒的AuraSenseTherapeutics’s Spherical Nucleic Acid(SNATM)构建体是有用的。
可以与本文的教导结合使用的文献包括:Cutler等.,J.Am.Chem.Soc.2011 133:9254-9257,Hao等.,Small.2011 7:3158-3162,Zhang等.,ACS Nano.2011 5:6962-6970,Cutler等.,J.Am.Chem.Soc.2012 134:1376-1391,Young等.,Nano Lett.2012 12:3867-71,Zheng等.,Proc.Natl.Acad.Sci.USA.2012 109:11975-80,Mirkin,Nanomedicine 20127:635-638 Zhang等.,J.Am.Chem.Soc.2012 134:16488-1691,Weintraub,Nature 2013495:S14-S16,Choi等.,Proc.Natl.Acad.Sci.USA.2013 110(19):7625-7630,Jensen等.,Sci.Transl.Med.5,209ra152(2013)和Mirkin,等.,Small,10:186-192。
具有RNA的自组装颗粒可以用聚乙烯亚胺(PEI)构建,该聚乙烯亚胺(PEI)被附着在聚乙二醇(PEG)远端的Arg-Gly-Asp(RGD)肽配体聚乙二醇化。该系统已经用作例如靶向表达整联蛋白的肿瘤新血管并递送抑制血管内皮生长因子受体2(VEGFR2)表达的siRNA,从而实现肿瘤血管生成的手段(参见,例如,Schiffelers等.,Nucleic Acids Research,2004,Vol.32,No.19)。纳米复合物可以通过将等体积的阳离子聚合物和核酸的水溶液混合以给出可离子化氮(聚合物)相对于磷酸盐(核酸)的净摩尔过量为2至6来制备。阳离子聚合物与核酸之间的静电相互作用导致形成平均粒度分布约100nm的polyplex,因此在本文中称为nanoplex。设想约100至200mg的核酸靶向复合物RNA的剂量用于在Schiffelers等的自组装颗粒中递送。
Bartlett等的nanoplex(PNAS,2007年9月25日,vol.104,no.39)也可以应用于本发明。Bartlett等的nanoplex是通过将等体积的阳离子聚合物和核酸的水溶液混合以给出可离子化氮(聚合物)相对于磷酸盐(核酸)的净摩尔过量为2至6而制备。阳离子聚合物与核酸之间的静电相互作用导致形成平均粒度分布为约100nm的polyplex,因此在本文中称为nanoplex。Bartlett等的DOTA-siRNA合成如下:1,4,7,10-四氮杂环十二烷-1,4,7,10-四乙酸单(N-羟基琥珀酰亚胺酯)(DOTA-NHSester)是从Macrocyclics(Dallas,TX)订购。将在碳酸盐缓冲液(pH 9)中的胺修饰RNA有义链与100倍摩尔过量的DOTA-NHS-酯添加到微量离心管中。通过在室温下搅拌4小时使内容物反应。将DOTA-RNA有义缀合物进行乙醇沉淀,重悬于水中,然后退火至未修饰的反义链,以产生DOTA-siRNA。所有液体均用Chelex-100(Bio-Rad,Hercules,CA)预处理以去除痕量金属污染物。可以通过使用含环糊精的聚阳离子形成Tf靶向和非靶向的siRNA颗粒。通常,在水中以3(+/-)的电荷比和0.5g/L的siRNA浓度形成颗粒。用Tf修饰靶向颗粒的表面上的金刚烷-PEG分子的百分之一(金刚烷-PEG-Tf)。将颗粒悬浮在5%(wt/vol)葡萄糖载体溶液中以用于注射。
Davis等(Nature,Vol 464,2010年4月15日)进行了RNA临床试验,该试验使用了靶向颗粒递送系统(临床试验注册号NCT00689065)。,在21天周期的第1、3、8和10天通过30分钟静脉输注向标准疗法难治性实体癌患者施用靶向颗粒的剂量。颗粒包含,基本上由以下组成,或由以下组成:合成递送系统,其含有(1)线性的、基于环糊精的聚合物(CDP),(2)靶向人运铁蛋白(TF)的靶向配体,该配体展示在纳米颗粒的外部以与癌细胞的表面上的TF受体(TFR)接合,(3)亲水性聚合物(聚乙二醇(PEG),用于促进生物体液中的纳米颗粒稳定性),和(4)设计用于减少RRM2表达的siRNA(在临床中使用的序列以前表示为siR2B+5)。长期以来,已知TFR在恶性细胞中被上调,而RRM2是已确立的抗癌靶标。这些颗粒(临床版本表示为CALAA-01)已经在非人灵长类动物的多给药研究中显示出良好耐受。尽管已经通过脂质体递送向一名患有慢性粒细胞白血病的患者施用了siRNA,但Davis等的临床试验是通过靶向递送系统全身递送siRNA并治疗实体癌患者的首次人类试验。为了确定靶向递送系统是否可以向人肿瘤有效递送功能性siRNA,Davis等研究了来自三个不同给药组的三名患者的活检;患者A、B和C均患有转移性黑色素瘤,分别接受18、24和30mg m-2 siRNA的CALAA-01剂量。对于本发明的核酸靶向系统,也可以设想相似的剂量。本发明的递送可以通过含有线性的、基于环糊精的聚合物(CDP),在颗粒的外部展示以接合在癌细胞的表面上的TF受体(TFR)的靶向人转铁蛋白(TF)的配体,和/或亲水性聚合物(例如,聚乙二醇(PEG),用于促进生物体液中的颗粒稳定性)的颗粒来实现。
就本发明而言,优选具有RNA靶向复合物的一个或多个组分,例如其核酸靶向效应(Cas13b)蛋白或mRNA,或使用颗粒或脂质包膜递送的指导RNA或crRNA。可以结合本发明的颗粒方面使用其他递送系统或载体。本发明涵盖的颗粒可以以不同的形式提供,例如,作为固体颗粒(例如,金属如银,金,铁,钛,非金属,基于脂质的固体,聚合物),颗粒的悬浮液,或其组合。可以制备金属,电介质和半导体颗粒,以及杂合结构(例如,核-壳颗粒)。如果由半导体材料制成的颗粒足够小(通常小于10nm)到发生电子能级的量化,则也可以用量子点标记颗粒。这样的纳米级颗粒在生物医学应用中用作药物载体或显像剂,并且可以适于本发明中的类似目的。
已经制造了半固体和软颗粒,并且它们是在本发明的范围内。半固体性质的原型颗粒是脂质体。临床上目前将各种类型的脂质体颗粒用作抗癌药物和疫苗的递送系统。一半亲水性且另一半疏水性的颗粒被称为Janus颗粒,对于使乳液稳定特别有效。它们可以在水/油界面处自组装并充当固体表面活性剂。
通过引用并入本文的美国专利号8,709,843提供了用于将含治疗剂的颗粒靶向递送至组织、细胞和细胞内隔室的药物递送系统。本发明提供了包含与表面活性剂、亲水聚合物或脂质缀合的聚合物的靶向颗粒。通过引用并入本文的美国专利号6,007,845提供了具有通过将多官能化合物与一种或多种疏水性聚合物和一种或多种亲水性聚合物共价连接而形成的多嵌段共聚物的核,并且含有生物活性材料的颗粒。通过引用并入本文的美国专利号5,855,913提供了颗粒组合物,其具有空气动力学轻质颗粒,其振实密度小于0.4g/cm3,平均直径在5μm至30μm之间,并在其表面上引入表面活性剂以用于药物递送至肺系统。通过引用并入本文的美国专利号5,985,309提供了结合表面活性剂和/或带正电或负电的治疗剂或诊断剂与带相反电荷的带电分子的亲水或疏水复合物的颗粒,用于递送至肺系统。通过引用并入本文的美国专利号5,543,158提供了可生物降解的可注射颗粒,其具有可生物降解的固体核,该核在表面上含有生物活性材料和聚(亚烷基二醇)部分。通过引用并入本文的WO2012135025(也公开为US20120251560)描述了缀合的聚乙烯亚胺(PEI)聚合物和缀合的氮杂大环化合物(统称为“缀合的脂聚物(lipomer)”或“脂聚物”)。在某些实施方案中,可以设想,本文引用的文献的这样的方法和材料,例如缀合的脂聚物,可以在核酸靶向系统的上下文中使用,以实现体外、离体和体内基因组扰动以改变基因表达,包括蛋白质表达的调节。
外泌体
外泌体是内源性的纳米囊泡,其转运RNA和蛋白质,并可将RNA递送至大脑和其他靶器官。为了降低免疫原性,Alvarez-Erviti等(2011,Nat Biotechnol 29:341)使用自衍生树突细胞来产生外泌体。通过改造树突状细胞以表达Lamp2b(一种外泌体膜蛋白,融合至神经元特异性RVG肽),实现了靶向大脑。通过电穿孔将外源RNA加载到纯化的外泌体。静脉注射的RVG靶向的外泌体将GAPDH siRNA特异性地递送至大脑中的神经元、小胶质细胞、少突胶质细胞,从而导致特异性基因敲低。预先暴露于RVG外泌体不减弱敲低,未观察到在其他组织中的非特异性摄取。外泌体介导的siRNA递送的治疗潜力是通过BACE1(阿尔茨海默氏病的治疗靶标)的强mRNA(60%)和蛋白质(62%)敲低而得以证明。
为了获得免疫学惰性外泌体的库,Alvarez-Erviti等从具有同质主要组织相容性复合体(MHC)单倍型的近交C57BL/6小鼠中收集骨髓。由于未成熟的树突状细胞产生大量不含T细胞激活物(例如MHC-II和CD86)的外泌体,Alvarez-Erviti等选择了7d的具有粒细胞/巨噬细胞集落刺激因子(GM-CSF)的树突状细胞。第二天,使用成熟的超速离心方案从培养上清液中纯化外泌体。产生的外泌体在物理上是均质的,通过粒度跟踪分析(NTA)和电子显微镜确定,粒度分布在80nm直径达到峰值。Alvarez-Erviti等获得了每106个细胞6-12μg的外泌体(基于蛋白质浓度测量)。接下来,Alvarez-Erviti等研究了使用适用于纳米级应用的电穿孔方案,用外源货物加载修饰的外泌体的可能性。由于没有很好地表征纳米级的膜颗粒的电穿孔,因此将非特异性Cy5标记的RNA用于电穿孔方案的经验优化。在超速离心和裂解外泌体后测定包封的RNA的量。在400V和125μF下的电穿孔导致最大保留RNA,并用于所有后续实验。Alvarez-Erviti等向正常C57BL/6小鼠施用150μg的包封在150μg的RVG外泌体中的每种BACE1 siRNA,并将敲低效率与四个对照进行比较:未处理的小鼠,仅注射RVG外泌体的小鼠,注射了与体内阳离子脂质体试剂复合的BACE1 siRNA的小鼠,和注射了与RVG-9R复合的BACE1siRNA的小鼠,该RVG肽与静电结合siRNA的9个D-精氨酸缀合。在施用后第3天分析皮质组织样品,在siRNA-RVG-9R处理和siRNA RVG外泌体处理的小鼠两者中均观察到显著的蛋白敲低(45%,P<0.05,相对于62%,P<0.01),原因是BACE1 mRNA水平的显著下降(分别为66%[+或-]15%,P<0.001和61%[+或-]13%,P<0.01)。此外,申请人证明在RVG-外泌体处理的动物中,总[β]-淀粉样蛋白1-42水平(阿尔茨海默氏病的病理学中的淀粉样蛋白斑的主要组分)显著降低(55%,P<0.05)。在脑室内注射BACE1抑制剂后,观察到的减少是大于正常小鼠中展示的β-淀粉样蛋白1-40的减少。Alvarez-Erviti等对BACE1裂解产物进行了cDNA末端的5'快速扩增(RACE),这提供了通过siRNA进行的RNAi介导的敲低的证据。最后,Alvarez-Erviti等通过评估IL-6,IP-10,TNFα和IFN-α血清浓度,研究了RNA-RVG外泌体是否体内诱导免疫应答。在外泌体处理后,与siRNA转染试剂处理相似,记录了所有细胞因子的非显著变化,与有效刺激IL-6分泌的siRNA-RVG-9R形成对比,从而确认了外泌体处理的免疫学惰性特性。考虑到外泌体仅包封20%的siRNA,用RVG-外泌体递送似乎比RVG-9R递送更有效,因为可比较的mRNA敲低和更高的蛋白质敲低是用五倍更少的siRNA实现而没有相应水平的免疫刺激。该实验证明了RVG外泌体技术的治疗潜力,其潜在地适合于长期沉默与神经退行性疾病相关的基因。Alvarez-Erviti等的外泌体递送系统可以用于将本发明的核酸靶向系统递送至治疗靶标,尤其是神经退行性疾病。可以设想包封在约100至1000mgRVG外泌体中的约100至1000mg核酸靶向系统的剂量用于本发明。
El-Andaloussi等(Nature Protocols 7,2112–2126(2012))提供了源自培养细胞的外泌体,其被利用来体内和体外递送RNA。该方案首先描述了通过转染表达载体产生靶向外泌体,该表达载体包含与肽配体融合的外泌体蛋白。接下来,El-Andaloussi等解释了如何从转染细胞上清液中纯化和表征外泌体。接下来,El-Andaloussi等详述了将RNA加载到外泌体中的关键步骤。最后,El-Andaloussi等概述了如何使用外泌体以体内和体内有效递送RNA到小鼠大脑中。还提供了预期结果的示例,其中通过功能测定和成像评估了外泌体介导的RNA递送。整个方案花费约3周。根据该发明的递送或施用可以是使用从自体来源的树突细胞产生的外泌体进行。根据本文的教导,这可以用于本发明的实践中。
在另一个实施方案中,设想了Wahlgren等(Nucleic Acids Research,2012,Vol.40,No.17 e130)的血浆外泌体。外泌体是由许多细胞类型产生的纳米大小的囊泡(大小为30-90nm),包括树突状细胞(DC),B细胞,T细胞,肥大细胞,上皮细胞和肿瘤细胞。这些囊泡是由晚期的核内体向内出芽形成,然后在与质膜融合后释放到细胞外环境中。因为外泌体天然地在细胞之间携带RNA,所以该性质可用于基因疗法,并且根据该公开内容可用于本发明的实践中。来自血浆的外泌体可以如下制备:将血沉棕黄层在900g离心20分钟以分离血浆,然后收集细胞上清液,在300g离心10分钟以去除细胞,在16500g离心30分钟,然后过滤经过0.22mm过滤器。通过以120000g超离心70分钟将外泌体沉淀。将siRNA化学转染到外泌体中是根据RNAi Human/Mouse Starter Kit(Quiagen,Hilden,德国)中的制造商说明书进行。将siRNA以2mmol/ml的终浓度添加到100ml PBS中。在加入HiPerFect转染试剂后,将混合物室温孵育10分钟。为了去除过量的胶束,使用醛/硫酸盐乳胶珠将外泌体再分离。核酸靶向系统化学转染到外泌体中可以类似于siRNA进行。外泌体可与从健康供体的外周血中分离的单核细胞和淋巴细胞共培养。因此,可以设想可以将含有核酸靶向系统的外泌体引入人的单核细胞和淋巴细胞中,并且自体地再引入人内。因此,可以使用血浆外泌体进行根据本发明的递送或施用。
脂质体
根据本发明的递送或施用可以用脂质体进行。脂质体是球形囊泡结构,由围绕内部水性区室的单层或多层脂质双层以及相对不可渗透的外部亲脂性磷脂双层组成。脂质体作为药物递送运载体受到了广泛关注,因为它们具有生物相容性、无毒性,可以递送亲水性和亲脂性药物分子,保护其负荷物免于被血浆酶降解,并且可以跨生物膜和血脑屏障(BBB)转运其负载(参见例如Spuch和Navarro,Journal of Drug Delivery,第2011卷,文章编号469679,第12页,2011,doi:10.1155/2011/469679查看综述)。脂质体可以由几种不同类型的脂质制成;然而,最常使用磷脂来产生脂质体作为药物运载体。虽然当脂质膜与一种水性溶液混合时脂质体形成是自发的,但是也可通过使用均质机、超声发生器或挤出设备以振动形式施加力来使该过程加速(参见例如Spuch和Navarro,Journal of Drug Delivery,第2011卷,文章编号469679,第12页,2011,doi:10.1155/2011/469679查看综述)。
可将几种其他添加剂加入脂质体中,以修饰其结构和特性。例如,可将胆固醇或鞘磷脂加入脂质体混合物中,以帮助稳定脂质体结构并防止脂质体内部负荷物泄漏。此外,由氢化卵磷脂酰胆碱或卵磷脂酰胆碱、胆固醇和磷酸二鲸蜡酯制备脂质体,并将它们的平均囊泡大小调节为约50和100nm。(参见例如Spuch和Navarro,Journal of Drug Delivery,第2011卷,文章编号469679,第12页,2011,doi:10.1155/2011/469679查看综述)。脂质体制剂主要可由天然磷脂和脂质诸如1,2-二硬脂酰基-sn-甘油-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱和单唾液酸神经节苷脂组成。由于这种制剂仅由磷脂组成,因此脂质体制剂遇到了许多挑战,其中一个挑战就是在血浆中的不稳定性。已经作出了克服这些挑战的若干尝试,特别是在脂质膜的处理方面。其中一种尝试集中在胆固醇的处理方面。将胆固醇加入常规制剂中减缓了包封的生物活性化合物快速释放到血浆中的速度,或者加入1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)增加了稳定性(参见例如Spuc h和Navarro,Journal ofDrug Delivery,第2011卷,文章编号469679,第12页,2011,doi:10.1155/2011/469679查看综述)。在一个特别有利的实施方案中,Trojan Horse脂质体(也称为Trojan Horses分子)是可取的,其方案可见于http://cshprotocols.cshlp.org/content/2010/4/ pdb.prot5407.long。这些颗粒允许在血管内注射转基因后将其递送到整个脑中。不受限制,据认为具有与表面缀合的特异性抗体的中性脂质颗粒允许经由内吞作用跨越血脑屏障。申请人假定利用Trojan Horse脂质体经由血管内注射将CRISPR-Cas13b复合物递送到脑中,这将获得全脑转基因动物而无需胚胎操作。对于在脂质体中的体内施用,可考虑约1-5g DNA或RNA。
在另一个实施方案中,核酸靶向系统或其组分可在脂质体诸如稳定的核酸-脂质颗粒(SNALP)中施用(参见例如Morrissey等人,Nature Biotechnology,第23卷,第8期,2005年8月)。考虑了每日静脉注射约1、3或5mg/kg/天的在SNALP中靶向的特异性核酸靶向系统。每日治疗可超过约三天,然后每周治疗持续约五周。在另一个实施方案中,还考虑了通过以约1或2.5mg/kg的剂量静脉注射施用的封装有特异性核酸靶向系统的SNALP(参见例如Zimmerman等人,Nature Letters,第441卷,2006年5月4日)。SNALP制剂可含有摩尔百分比为2:40:10:48的脂质3-N-[(w甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基-丙胺(PEG-C-DMA)、1,2-二亚油基氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2-二硬脂酰-sn-甘油-3-磷酸胆碱(DSPC)和胆固醇(例如参见Zimmerman等人,Nature Letters,第441卷,2006年5月4日)。在另一个实施方案中,已经证明稳定的核酸-脂质颗粒(SNALP)可以将分子有效递送到高度血管化的HepG2-衍生的肝脏肿瘤,但是不递送到血管化较差的HCT-116衍生的肝脏肿瘤(参见例如Li,Gene Therapy(2012)19,775-780)。SNALP脂质体可如下制备:用二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和siRNA,使用25:1的脂质/siRNA比率和48/40/10/2的胆固醇/D-Lin-DMA/DSPC/PEG-C-DMA摩尔比配制D-Lin-DMA和PEG-C-DMA。所得的SNALP脂质体的大小为约80-100nm。在又一个实施方案中,SNALP可包含合成胆固醇(Sigma-Aldrich,St Louis,MO,USA)、二棕榈酰磷脂酰胆碱(Avanti Polar Lipids,Alabaster,AL,USA)、3-N-[(w-甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基丙基胺和阳离子1,2-二亚油基氧基-3-N,N二甲基氨基丙烷(参见例如Geisbert等人,Lancet 2010;375:1896-905)。可考虑以例如作为静脉推注施用的每剂量约2mg/kg总核酸靶向系统的剂量。在又一个实施方案中,SNALP可包含合成胆固醇(Sigma-Aldrich)、1,2-二硬脂酰-sn-甘油-3-磷酸胆碱(DSPC;Avanti Polar Lipids Inc.)、PEG-cDMA和1,2-二亚油基氧基-3-(N;N-二甲基)氨基丙烷(DLinDMA)(参见例如Judge,J.Clin.Invest.119:661-673(2009))。用于体内研究的制剂可包含约9:1的最终脂质/RNA质量比。
Alnylam Pharmaceuticals的Barros和Gollob已对RNAi纳米药物的安全性进行了综述(例如参见Advanced Drug Delivery Reviews 64(2012)1730-1737)。稳定的核酸脂质颗粒(SNALP)由四种不同的脂质组成:在低pH下为阳离子的可电离脂质(DLinDMA)、中性辅助脂质、胆固醇和可扩散聚乙二醇(PEG)-脂质。该颗粒的直径为大约80nm,并且在生理pH值下呈电中性。在配制过程中,可电离脂质用于在颗粒形成过程中使脂质与阴离子RNA凝聚。当在越来越酸性的内体条件下带正电时,可电离脂质还会介导SNALP与内体膜融合,从而使RNA释放到细胞质中。PEG-脂质在配制过程中可稳定颗粒并减少聚集,随后提供可改善药代动力学特性的中性亲水性外部。迄今为止,已经使用SNALP制剂和RNA启动了两个临床项目。Tekmira Pharmaceuticals最近在LDL胆固醇升高的成年志愿者中完成了SNALP-ApoB的I期单剂量研究。ApoB主要在肝脏和空肠中表达,对于VLDL和LDL的组装和分泌必不可少。十七名受试者接受了单剂量的SNALP-ApoB(跨7个剂量水平的剂量递增)。没有证据表明产生了肝脏毒性(基于临床前研究,被预期为潜在的剂量限制性毒性)。接受最高剂量的(两名受试者中的)一名受试者经历了与免疫系统刺激相一致的流感样症状,于是决定结束试验。Alnylam Pharmaceuticals类似地推出了ALN-TTR01,其采用如上所述的SNALP技术并且靶向突变体和野生型TTR的肝细胞产生,从而治疗TTR淀粉样变性(ATTR)。已经描述了三种ATTR综合征:家族性淀粉样多神经病(FAP)和家族性淀粉样心肌病(FAC),这两者均由TTR中的常染色体显性突变引起;以及由野生型TTR引起的老年全身性淀粉样变性(SSA)。最近在ATTR患者中完成了ALN-TTR01的安慰剂对照单剂量递增I期试验。通过15分钟静脉输注在0.01至1.0mg/kg(基于siRNA)的剂量范围内向31名患者施用ALN-TTR01(23名输注研究药物,8名输注安慰剂)。治疗耐受性良好,在肝功能检查中没有显著增加。23名患者中,以≥0.4mg/kg输注的3名患者出现了与输注相关的反应;所有患者都对减慢输注速度有反应,并且所有患者都继续参与研究。以最高剂量1mg/kg输注的两名患者出现了血清细胞因子IL-6、IP-10和IL-1ra的最小和瞬时升高(根据临床前和NHP研究预期)。在1mg/kg处观察到血清TTR的降低,这是ALN-TTR01的预期药理效应。
在又一个实施方案中,可通过将阳离子脂质、DSPC、胆固醇和PEG-脂质例如以40:10:40:10的摩尔比分别溶解在例如乙醇中来制备SNALP(参见Semple等人,NatureNiotechnology,第28卷,第2期,2010年2月,第172-177页)。将该脂质混合物加入水性缓冲液(50mM柠檬酸盐,pH 4)中,混合直到最终的乙醇和脂质浓度分别为30%(体积/体积)和6.1mg/ml,使其在22℃下平衡2分钟,然后挤出。使用Lipex挤出机(Northern Lipids),在22℃下将水合脂质通过两个重叠的孔径为80nm的滤膜(Nuclepore)挤出,直到获得直径为70-90nm的囊泡(通过动态光散射分析确定)。这一般需要通过1-3次。将siRNA(溶解在50mM柠檬酸盐、pH 4水溶液中,含30%乙醇)以约5ml/min的速率一边混合一边加入预平衡(35℃)的囊泡中。达到0.06(重量/重量)的最终靶siRNA/脂质比率后,将混合物在35℃下再孵育30分钟,以进行囊泡重组和siRNA包封。然后除去乙醇,并通过透析或切向流渗滤将外部缓冲液替换为PBS(155mM NaCl、3mM Na2HPO4、1mM KH2PO4,pH 7.5)。使用受控的逐步稀释法过程将siRNA包封在SNALP中。KC2-SNALP的脂质成分为DLin-KC2-DMA(阳离子脂质)、二棕榈酰磷脂酰胆碱(DPPC;Avanti Polar Lipids)、合成胆固醇(Sigma)和PEG-C-DMA,它们以摩尔比57.1:7.1:34.3:1.4使用。在形成加载的颗粒后,将SNALP用PBS透析,并在使用前通过0.2μm滤膜过滤灭菌。平均粒度为75-85nm,并且90-95%的siRNA被包封在脂质颗粒中。用于体内测试的制剂中最终的siRNA/脂质比率为约0.15(重量/重量)。即将使用前,将含有因子VIIsiRNA的LNP-siRNA系统在无菌PBS中稀释到适当浓度,并且通过侧尾静脉以10ml/kg的总体积静脉施用制剂。这种方法和这些递送系统可外推到本发明的核酸靶向系统。
其他脂质
其他阳离子脂质诸如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA)可用来例如类似于SiRNA包封核酸靶向系统或其组分或编码其的核酸分子(参见例如Jayaraman,Angew.Chem.Int.Ed.2012,51,8529–8533),因此可用于实践本发明。可考虑具有以下脂质组成的预成型囊泡:摩尔比分别为40/10/40/10的氨基脂质、二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和(R)-2,3-双(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基碳酸酯(PEG-脂质),以及比率为大约0.05(重量/重量)的FVII siRNA/总脂质。为了确保在70-90nm范围内的窄粒度分布以及0.11±0.04(n=56)的低多分散性指数,可在加入引导RNA之前将颗粒通过80nm膜挤出多达三次。可使用含有高效氨基脂质16的颗粒,其中可进一步优化四种脂质组分即16、DSPC、胆固醇和PEG-脂质的摩尔比(50/10/38.5/1.5)以增强体内活性。
Michael S D Kormann等人("Expression of therapeutic proteins afterdelivery of chemically modified mRNA in mice:Nature Biotechnology,第29卷,第154-157页(2011))描述了使用脂质包膜来递送RNA。使用脂质包膜在本发明中也是优选的。
在另一个实施方案中,可将脂质与本发明的RNA靶向系统(CRISPR-Cas13b复合物,即与crRNA复合的Cas13b)或其组分或编码其的核酸分子一起配制,以形成脂质纳米颗粒(LNP)。脂质包括但不限于DLin-KC2-DMA4、C12-200和辅助脂质二硬脂酰磷脂酰胆碱、胆固醇,并且可使用自发囊泡形成程序将PEG-DMG与RNA靶向系统而不是siRNA一起配制(参见例如Novobrantseva,Molecular Therapy–Nucleic Acids(2012)1,e4;doi:10.1038/mtna.2011.3)。组分摩尔比可为约50/10/38.5/1.5(DLin-KC2-DMA或C12-200/二硬脂酰磷脂酰胆碱/胆固醇/PEG-DMG)。在为DLin-KC2-DMA和C12-200脂质颗粒(LNP)的情况下,最终的脂质:siRNA重量比可分别为约12:1和9:1。制剂的平均粒径可为约80nm,包覆效率>90%。可考虑3mg/kg的剂量。Tekmira在美国和国外拥有大约95个专利家族的产品组合,涉及LNP和LNP制剂的各个方面(参见例如美国专利号7,982,027、7,799,565、8,058,069、8,283,333、7,901,708、7,745,651、7,803,397、8,101,741、8,188,263、7,915,399、8,236,943和7,838,658以及欧洲专利号1766035、1519714、1781593和1664316),所有这些产品都可用于和/或适于本发明。
可将RNA靶向系统或其组分或编码其的核酸分子包封在诸如在美国公开申请20130252281和20130245107以及20130244279(转让给Moderna Therapeutics)中进一步描述的PLGA微球中进行递送,这些申请涉及配制包含经修饰的核酸分子的组合物的各方面,所述核酸分子可编码蛋白、蛋白前体或者蛋白或蛋白前体的部分或完全加工形式。该制剂的摩尔比可为50:10:38.5:1.5-3.0(阳离子脂质:融合脂质:胆固醇:PEG脂质)。PEG脂质可选自但不限于PEG-c-DOMG、PEG-DMG。融合脂质可为DSPC。还可参见Schrum等人,Deliveryand Formulation of Engineered Nucleic Acids、美国公开申请20120251618。
Nanomerics的技术解决了许多疗法的生物利用度挑战,包括低分子量疏水性药物、肽和基于核酸的疗法(质粒、siRNA、miRNA)。该技术已经证明具有明显优势的特异性施用途径包括口服途径、跨血脑屏障转运、向实体瘤和眼部递送。参见例如Mazza等人,2013,ACS Nano.2013年2月26日;7(2):1016-26;Uchegbu和Siew,2013,J Pharm Sci.102(2):305-10以及Lalatsa等人,2012,J Control Release.2012年7月20日;161(2):523-36。
美国专利公开号20050019923描述了用于将生物活性分子诸如多核苷酸分子、肽和多肽以及/或者药剂递送到哺乳动物体内的阳离子树状大分子。所述树状大分子适合靶向将生物活性分子递送到例如肝、脾、肺、肾或心脏(或甚至脑)。树状大分子是由简单的分支单体单元逐步制备而成的合成三维大分子,可以轻松控制和改变其性质和功能。树状大分子是通过将构建嵌段重复加成到多功能核(发散合成法)上或朝向多功能核重复加成构建嵌段(收敛合成法)而合成的,并且每次加成构建嵌段的三维壳都会导致新一代的树状大分子形成。聚丙烯亚胺树状大分子从二氨基丁烷核开始,通过将丙烯腈双迈克尔加成到伯胺上,然后将腈加氢,在该二氨基丁烷核上加成两倍数量的氨基基团。这导致氨基基团加倍。聚丙烯亚胺树状大分子含有100%的可质子化氮和多达64个末端氨基基团(第5代,DAB64)。可质子化基团通常是能够在中性pH下接受质子的胺基团。树状大分子作为基因递送剂的用途主要集中在聚酰胺-胺和含磷化合物的用途,其中胺/酰胺的混合物或N--P(O2)S分别作为缀合单元,还没有工作报道更低代的聚丙烯亚胺树状大分子用于基因递送的用途。还研究了聚丙烯亚胺树状大分子作为pH敏感的受控释放系统,用于递送药物以及当被外周氨基酸基团化学修饰时用于包封它们的客体分子。还研究了聚丙烯亚胺树状大分子的细胞毒性和与DNA的相互作用以及DAB 64的转染效率。美国专利公开号20050019923基于以下观察结果:与早期报道相反,阳离子树状大分子诸如聚丙烯亚胺树状大分子显示出用于靶向递送生物活性分子诸如遗传物质的合适特性,诸如特异性靶向和低毒性。另外,阳离子树状大分子的衍生物也显示出用于靶向递送生物活性分子的合适特性。还可参见BioactivePolymers(美国公开申请20080267903),其公开了包括阳离子聚胺聚合物和树状聚合物在内的各种聚合物被证明具有抗增殖活性,因此可用于治疗其特征为发生不希望的细胞增殖的疾病,诸如赘生物和肿瘤、炎症性疾病(包括自身免疫性疾病)、银屑病和动脉粥样硬化。这些聚合物可单独用作活性剂,或用作其他治疗剂诸如用于基因治疗的药物分子或核酸的递送媒介。在这种情况下,这些聚合物本身固有的抗肿瘤活性可补充要递送的药剂的活性。这些专利公开的公开内容可与本文的教导结合使用,用于递送核酸靶向系统或其组分或编码其的核酸分子。
超电荷蛋白
超电荷蛋白是一类具有异常高的正或负净理论电荷的工程化或天然存在的蛋白,并且可用于递送核酸靶向系统或其组分或编码其的核酸分子。超负电荷和超正电荷蛋白均表现出显著的抵抗热诱导或化学诱导的聚集的能力。超正电荷蛋白还能够穿透哺乳动物细胞。将负荷物诸如质粒DNA、RNA或其他蛋白与这些蛋白结合可以使这些大分子能够在体外和体内功能性递送到哺乳动物细胞中。David Liu的实验室在2007年报道了超电荷蛋白的产生和表征(Lawrence等人,2007,Journal of the American Chemical Society 129,10110–10112)。
将RNA和质粒DNA以非病毒方式递送到哺乳动物细胞中对于研究和治疗应用都是有价值的(Akinc等人,2010,Nat.Biotech.26,561-569)。将纯化的+36GFP蛋白(或其他超正电荷蛋白)在适当的无血清培养基中与RNA混合并使其复合,然后加入细胞中。在此阶段加入血清会抑制超电荷蛋白-RNA复合物的形成并降低治疗效果。发现以下方案对多种细胞系有效(McNaughton等人,2009,Proc.Natl.Acad.Sci.USA 106,6111-6116)。但是,应当进行改变蛋白和RNA剂量的先导实验,以优化特定细胞系的程序。(1)治疗前一天,在48孔板中每孔接种1x105个细胞。(2)治疗当天,在无血清培养基中稀释纯化的+36GFP蛋白直到最终浓度为200nM。加入RNA直到最终浓度为50nM。涡旋混合并在室温下孵育10分钟。(3)孵育期间,从细胞中吸出培养基,并用PBS洗涤一次。(4)孵育+36GFP和RNA后,将蛋白-RNA复合物加入细胞中。(5)将细胞与复合物在37℃下孵育4小时。(6)孵育后,吸出培养基,并用20U/mL肝素PBS洗涤三次。将细胞与含血清的培养基再孵育48小时或更长时间,具体取决于活性测定。(7)通过免疫印迹、qPCR、表型测定或其他合适的方法分析细胞。
发现+36GFP在许多细胞中都是有效的质粒递送试剂。还可参见例如McNaughton等人,Proc.Natl.Acad.Sci.USA 106,6111-6116(2009);Cronican等人,ACS ChemicalBiology 5,747-752(2010);Cronican等人,Chemistry&Biology 18,833-838(2011);Thompson等人,Methods in Enzymology 503,293-319(2012);Thompson,D.B.等人,Chemistry&Biology 19(7),831-843(2012)。超荷电蛋白的方法可用于和/或被调整为递送本发明的RNA靶向系统或其组分或编码其的核酸分子。
细胞穿透肽(CPP)
在又一个实施方案中,考虑了细胞穿透肽(CPP)用于递送CRISPR Cas系统。CPP是促进细胞摄取各种分子负荷物(从纳米级颗粒到小化学分子和大DNA片段)的短肽。本文所用的术语“负荷物”包括但不限于治疗剂、诊断探针、肽、核酸、反义寡核苷酸、质粒、蛋白、颗粒(包括纳米颗粒)、脂质体、发色团、小分子和放射性物质。在本发明的各方面,负荷物还可包括CRISPR Cas系统的任何组分或整个功能性CRISPR Cas系统。本发明的各方面还提供了用于将希望的负荷物递送到受试者体内的方法,其包括:(a)制备包含本发明的细胞穿透肽以及希望的负荷物的复合物,并且(b)将复合物经口服、关节内、腹膜内、鞘内、动脉内、鼻内、实质内、皮下、肌内、静脉内、经皮、直肠内或局部施用给受试者。负荷物通过化学键合经由共价键或通过非共价相互作用与肽缔合。CPP的功能是将负荷物递送到细胞中,这一过程通常通过内吞作用发生,其中负荷物被递送到活哺乳动物细胞的内体中。细胞穿透肽具有不同的大小、氨基酸序列和电荷,但是所有CPP都具有一个独特的特征,即能够转运质膜并促进将各种分子负荷物递送到细胞质或细胞器中。CPP转运可分为三种主要进入机制:直接穿透膜、内吞作用介导的进入以及通过形成暂时结构转运。CPP已在医学上得到广泛应用,在治疗不同疾病(包括癌症)时作为药物递送剂、作为病毒抑制剂以及作为用于细胞标记的造影剂。后者的实例包括充当GFP的运载体、MRI造影剂或量子点。CPP作为用于研究和医学的体外和体内递送载体具有巨大潜力。CPP通常具有以下氨基酸组成:包含较高相对丰度的带负电荷氨基酸,诸如赖氨酸或精氨酸,或者具有包含交替模式的极性/带电荷氨基酸和非极性疏水氨基酸的序列。这两种类型的结构分别称为聚阳离子或两亲性。第三类CPP是仅包含非极性残基、具有低净电荷或具有对于细胞摄入至关重要的疏水氨基酸基团的疏水肽。最初发现的其中一种CPP是来自人类免疫缺陷病毒1(HIV-1)的反式激活转录激活因子(Tat),发现其被多种培养细胞类型从周围培养基中有效摄取。从那以后,已知CPP的数量大大增加,并产生了具有更有效蛋白转导特性的小分子合成类似物。CPP包括但不限于穿透素、Tat(48-60)、转运素和(R-AhX-R4)(Ahx=氨基己酰基)。
美国专利8,372,951提供了一种来源于嗜酸粒细胞阳离子蛋白(ECP)的CPP,其表现出高细胞穿透效率和低毒性。还提供了将CPP与其负荷物一起递送到脊椎动物受试者中的各方面。CPP及其递送的其他方面在美国专利8,575,305、8;614,194和8,044,019中描述。CPP可以用于递送CRISPR-Cas系统或其组分。Suresh Ramakrishna、Abu-Bonsrah KwakuDad、Jagadish Beloor等人的稿件“Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA”(Genome Res,2014年4月2日,[印刷版前的电子版])中也提供了CPP可以用于递送CRISPR-Cas系统或其组分,该文献全文通过引用并入,其中证明了用CPP缀合的重组Cas9蛋白和CPP复杂的引导RNA处理可以导致人类细胞系中的内源基因破坏。在该论文中,Cas9蛋白经由硫醚键缀合到CPP,而引导RNA与CPP复合,从而形成缩合的带负电荷颗粒。结果表明,用经修饰的Cas9和引导RNA同时和顺序处理人类细胞,包括胚胎干细胞、真皮成纤维细胞、HEK293T细胞、HeLa细胞和胚胎癌细胞,可以导致有效的基因破坏,相对于质粒转染降低了脱靶突变。CPP递送可以用于实践本发明。
可植入装置
在另一个实施方案中,还考虑了可植入装置用于递送RNA靶向系统或其组分或编码其的核酸分子。例如,美国专利公开20110195123公开了一种局部且长期洗脱药物的可植入医疗装置,包括几种类型的这种装置、实施的治疗模式和植入方法。该装置包括聚合物基材诸如用作装置主体的基质以及药物,在某些情况下还包括支架材料诸如金属或其他聚合物以及增强可见度和成像的材料。可植入递送装置可有利于提供局部且长期释放,其中药物直接释放到病变区域诸如肿瘤、炎症、变性的细胞外基质(ECM),或用于有症状的目的,或释放到受损的平滑肌细胞,或用于预防。如上文所公开,一种药物是RNA,并且该系统可用于和/或适于本发明的核酸靶向系统。在一些实施方案中,植入模式是当今针对包括近距离放射疗法和针吸活组织检查在内的其他治疗开发和使用的现有植入程序。在这种情况下,本发明中描述的新植入物的尺寸类似于原始植入物。通常,在同一治疗程序中会植入几个装置。美国专利公开20110195123提供了一种药物递送可植入或可插入系统,其包括适用于腔体诸如腹腔和/或其中未锚定或未附接该药物递送系统的任何其他类型的施用的系统,包含可生物稳定的和/或可降解的和/或可生物吸收的聚合物基材,所述聚合物基材可例如任选地是基质。应当注意,术语“插入”也包括植入。如美国专利公开20110195123中所述,该药物输送系统优选地被实施为“Loder”。聚合物或多种聚合物是生物相容的,结合药剂和/或多种药剂,使得能够以受控的速率释放药剂,其中在一些实施方案中,聚合物基材诸如基质的总体积任选地且优选地不大于允许达到该药剂的治疗水平的最大体积。作为非限制性实例,这种体积优选地在0.1m3至1000mm3的范围内,如药剂负载的体积所要求的。例如在与其尺寸由功能性决定的装置(例如但不限于膝关节、宫内节育环或子宫颈环等等)结合时,该Loder可任选地更大。在一些实施方案中,药物递送系统(用于递送组合物)被设计成优选地采用可降解的聚合物,其中主要释放机制是本体溶蚀。或者在某些实施方案中,使用不可降解或降解缓慢的聚合物,其中主要释放机制是扩散而不是本体溶蚀,因此外部起到膜的作用,而其内部起到药物贮存器的作用,该贮存器长时间(例如约一周至约几个月)内几乎不受环境的影响。还可任选地使用具有不同释放机制的不同聚合物的组合。在总药物释放期的相当长一段时间内,优选地维持表面处的浓度梯度有效恒定,因此扩散速率是有效恒定的(称为“零模”扩散)。所谓术语“恒定”,是指优选地维持在治疗效果的较低阈值之上的扩散速率,但是其仍可任选地具有初期突释的特征并且/或者可波动,例如从而增加和降低到一定程度。优选地长期如此维持扩散速率,并且可以认为它恒定到一定水平,以优化治疗有效期,例如有效沉默期。药物递送系统任选地且优选地被设计成保护基于核苷酸的治疗剂免于降解,无论是由于化学性质还是由于受试者体内的酶和其他因素的攻击。美国专利公开号20110195123的药物输送系统任选地与感测和/或激活器具相关联,这些器具在通过激活和/或加速/减速的无创和/或微创方法植入装置之时和/或之后运行,所述方法例如任选地包括但不限于热力加热和冷却、激光束和超声波,包括聚焦超声和/或RF(射频)方法或装置。根据美国专利公开20110195123的一些实施方案,用于局部递送的部位可任选地包括特征为细胞高度异常增殖、细胞凋亡受到抑制的靶部位,包括肿瘤、活动性和/或慢性炎症和感染,包括自身免疫性疾病状态、退化组织(包括肌肉和神经组织)、慢性疼痛、退行性部位,以及用于增强组织再生的骨折位置以及其他伤口位置,以及受损的心肌、平滑肌和横纹肌。用于植入组合物的部位或靶部位优选地具有足够小用于靶向局部递送的半径、面积和/或体积。例如,靶部位的直径任选地在约0.1mm至约5cm的范围内。优选地选择靶部位的位置以实现最大治疗功效。例如,任选地且优选地将药物递送系统的组合物(任选地与如上所述用于植入的装置一起)植入肿瘤环境或与其相关的血液供应内或附近。例如,任选地将所述组合物(任选地与所述装置一起)经由乳头在血管系统之内植入胰腺、前列腺、乳房、肝脏内或附近等等。靶位置任选地选自以下位置、基本上由以下位置组成或由以下位置组成(仅作为非限制性实例,因为任选地体内的任何部位都可能适合植入Loder):1.脑中的退行性部位,如帕金森病或阿尔茨海默病中的基底神经节、白质和灰质;2.脊柱,如肌萎缩性脊髓侧索硬化症(ALS);3.子宫颈,用于预防HPV感染;4.活动性和慢性炎症性关节;5.真皮,如银屑病;6.交感和感觉神经部位,用于止痛作用;7.骨内植入;8.急性和慢性感染部位;9.阴道内;10.内耳听觉系统、内耳迷路、前庭系统;11.气管内12.心内、冠状动脉、心外膜;13.膀胱;14.胆道系统;15.实质组织,包括但不限于肾、肝、脾;16.淋巴结;17.唾液腺;18.牙龈;19.关节内(进入关节);20.眼内;21.脑组织;22.脑室;23.腔体,包括腹腔(例如但不限于卵巢癌);24.食道内以及25.直肠内。
任选地,系统(例如,含有组合物的装置)的插入与在靶部位及该部位附近向ECM注射材料相关联,以影响该靶部位及该部位附近的局部pH和/或温度和/或影响ECM中的药物扩散和/或药物动力学的其他生物因素。任选地,根据一些实施方案,所述药剂的释放可以与感测和/或激活器具相关联,这些器具在通过激活和/或加速/减速的无创和/或微创和/或其他方法植入装置之时和/或之后运行,所述方法包括激光束、辐射、热力加热和冷却以及超声波,包括聚焦超声和/或RF(射频)方法或装置以及化学激活物。
根据可用于实践本发明的美国专利公开20110195123的实施方案,药物优选地包含RNA,例如用于如下所述的乳房、胰腺、脑、肾脏、膀胱、肺和前列腺中的局部癌症病例。虽然以RNAi为例,但是许多药物都适用于包封在Loder中,并且可以与本发明结合使用,只要这些药物可以包封在Loder基材诸如基质中即可,并且这种系统可用于和/或被调整为递送本发明的核酸靶向系统。作为特定应用的另一个实例,由于基因表达异常而发生神经和肌肉退行性疾病。局部递送RNA可具有治疗特性,以干扰这种异常基因表达。局部递送包括小药物和大分子在内的抗凋亡、抗炎和抗退行性药物也可任选地具有治疗性。在这种情况下,Loder用于以恒定的速率和/或通过单独植入的专用装置延长释放。
所有这些均可用于和/或适用于本发明的RNA靶向系统。在本文讨论的可植入装置技术可以与本文的教导一起使用,因此根据本公开和本领域的知识,可经由可植入装置递送CRISPR-Cas13b系统或复合物或其组分或者编码或提供组分的核酸分子。
患者特异性筛选方法
靶向RNA的核酸靶向系统可以用于筛选患者或患者样品中是否存在特定RNA。
CRISPR效应蛋白mRNA和引导RNA
也可以分开递送CRISPR效应蛋白(Cas13b)或其mRNA(或更一般为其核酸分子)和引导RNA或crRNA,例如施用前者1-12小时(优选2-6小时左右)后才施用引导RNA或crRNA,也可以一起递送。可以在初次施用后1-12小时(优选2-6小时左右)施用第二加强剂量的引导RNA或crRNA。
Cas13b效应蛋白有时在本文中称为CRISPR酶。应当理解,效应蛋白基于酶或衍生自酶,因此在一些实施方案中,术语“效应蛋白”当然包括“酶”。但是,还应当理解,如一些实施方案中所要求的,效应蛋白可具有DNA或RNA结合活性,但不一定具有切割或切口活性,包括死亡Cas效应蛋白功能。
细胞靶标包括造血干/祖细胞(CD34+);人类T细胞;以及眼睛(视网膜细胞),例如光感器前体细胞。
本发明的方法还可以包括模板的递送。模板的递送可与任何或所有CRISPR效应蛋白(Cas13b)或引导序列或crRNA的递送同时或分开进行,并且经由相同或不同的递送机制进行。
诱导型系统
在一些实施方案中,CRISPR效应蛋白(Cas13n)可形成诱导型系统的组分。系统的可诱导性质将允许使用一种能量形式来对基因编辑或基因表达进行时空控制。能量形式可包括但不限于电磁辐射、声能、化学能和热能。诱导型系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交转录激活系统(FKBP、ABA等)或光诱导型系统(光敏素、LOV结构域或隐花色素)。在一个实施方案中,CRISPR效应蛋白可以是光诱导型转录效应物(LITE)的一部分,以便以序列特异性方式指导转录活性的变化。光的组分可包括CRISPR效应蛋白、光响应性细胞色素异二聚体(例如,来自拟南芥)和转录激活/阻遏结构域。诱导型DNA结合蛋白的其他实例及其使用方法在US 61/736465和US 61/721,283以及WO2014018423 A2中提供,这些文献全文特此通过引用并入。
自失活系统
一旦细胞中RNA的所有拷贝都被编辑,就不再需要在该细胞中继续Cas13b效应蛋白表达或活性。依靠使用Cas13b的RNA或者crRNA作为引导靶序列的自失活系统可以通过阻止Cas13b的表达或复合物的形成来关闭系统。
试剂盒
一方面,本发明提供了含有上述方法和组合物中公开的任何一种或多种元件的试剂盒。在一些实施方案中,该试剂盒包含本文所教导的载体系统或本文所教导的CRISPR/Cas13b系统或复合物的一种或多种组分,诸如crRNA和/或Cas13b效应蛋白或编码Cas13b效应蛋白的mRNA,以及使用该试剂盒的说明书。这些元件可单独或组合提供,并且可在任何合适的容器诸如小瓶、瓶或管中提供。在一些实施方案中,试剂盒包括一种或多种语言例如一种以上语言的说明书。说明书可特定于本文所述的应用和方法。在一些实施方案中,试剂盒包含一种或多种试剂,用于利用本文所述的一种或多种元件的过程中。试剂可在任何合适的容器中提供。例如,试剂盒可提供一种或多种反应或储存缓冲液。试剂可以可用于特定测定的形式提供,或者以在使用前需要添加一种或多种其他组分的形式(例如,以浓缩或冻干形式)提供。缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液以及它们的组合。在一些实施方案中,缓冲剂是碱性的。在一些实施方案中,缓冲液的pH为约7至约10。在一些实施方案中,试剂盒包含一个或多个寡核苷酸,它们对应于用于插入载体中的引导序列,以便可操作地连接引导序列或crRNA序列和调控元件。在一些实施方案中,试剂盒包含同源重组模板多核苷酸。在一些实施方案中,试剂盒包含本文所述的一个或多个载体和/或一个或多个多核苷酸。试剂盒可有利地允许提供本发明的系统的所有元件。
本发明在例如基因治疗、药物筛选、疾病诊断和预后中具有广泛的应用。
术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”、和“寡核苷酸”可互换使用。它们是指任何长度的核苷酸聚合形式,为脱氧核糖核苷酸或核糖核苷酸,或它们的类似物。多核苷酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性示例:基因或基因片段的编码或非编码区;由连锁分析定义的基因座;外显子;内含子;信使RNA(mRNA);转移RNA;核糖体RNA;短干扰RNA(siRNA);短发夹RNA(shRNA);微RNA(miRNA);核酶;cDNA;重组多核苷酸;支链多核苷酸;质粒;载体;具有任何序列的分离的DNA;具有任何序列的分离的RNA,核酸探针;以及引物。该术语还包括具有合成骨架的核酸样结构,参见例如Eckstein,1991;Baserga等,1992;Milligan,1993;WO 97/03211;WO 96/39154;Mata,1997;Strauss-Soukup,1997;以及Samstag,1996。多核苷酸可包含一个或多个经修饰的核苷酸,诸如甲基化的核苷酸和核苷酸类似物。可以在聚合物组装之前或之后赋予对核苷酸结构的修饰(如果存在的话)。核苷酸序列可被非核苷酸组分打断。多核苷酸可以在聚合后进一步修饰,诸如通过与标记组分缀合。如本文所用,术语“野生型”是本领域技术人员所理解的术语,并且是指在自然界中存在、与突变体或变体形式不同的生物体、菌株、基因或特征的典型形式。“野生型”可以为基线。如本文所用,术语“变体”应被认为是指表现出具有不同于自然界中存在的模式的品质。术语“非天然存在的”或“经工程化的”可互换使用,并且表示人工的参与。当提到核酸分子或多肽时,这些术语是指核酸分子或多肽至少基本上不含这样的至少一种其它组分,所述至少一种其它组分在自然界中与所述核酸分子或多肽天然缔合并存在于自然界中。“互补性”是指一个核酸通过传统的沃森-克里克碱基配对或其他非传统类型与另一个核酸序列形成氢键的能力。互补性百分比表示核酸分子中可与第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个中的5、6、7、8、9、10个为50%、60%、70%、80%、90%和100%互补)。“完全互补”是指核酸序列的所有连续残基将与第二核酸序列中相同数量的连续残基氢键结合。如本文所用的“基本上互补”是指在具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上的互补程度为至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%,或者是指两个核酸在严格条件下杂交。如本文所用,用于杂交的“严格条件”是指具有与靶序列的互补性的核酸主要与靶序列杂交,并且基本不与非靶序列杂交所处的条件。严格条件通常依赖于序列,并取决于许多因素而变化。一般来说,序列越长,则序列与其靶序列特异性杂交的温度越高。严格条件的非限制性示例详细描述于Tijssen(1993),Laboratory Techniques In Biochemistry And MolecularBiology-Hybridization With Nucleic Acid Probes第一部分第二章“Overview ofprinciples of hybridization and the strategy of nucleic acid probe assay”,Elsevier,N.Y中。当提到多核苷酸序列时,则也可以设想互补或部分互补的序列。这些序列优选能够在高度严格条件下与参考序列杂交。通常,为了最大化杂交速率,选择相对低严格性的杂交条件:比热熔点(Tm)低约20℃至25℃。Tm是在溶液中在限定的离子强度和pH下50%的特异性靶序列与完全互补探针杂交的温度。
通常,为了要求杂交序列的至少约85%的核苷酸互补性,选择比Tm低约5℃至15℃的高度严格洗涤条件。为了要求杂交序列的至少约70%的核苷酸互补性,选择比Tm低约15℃至30℃的中度严格洗涤条件。高度许可(非常低严格性)的洗涤条件可以低至比Tm低50℃,从而允许杂交序列之间的高水平的错配。本领域技术人员应认识到,杂交阶段和洗涤阶段中的其他物理和化学参数也可以改变,以影响根据靶序列与探针序列之间的特定同源性水平的可检测杂交信号的结果。优选的高度严格条件包括在42℃下在50%甲酰胺、5xSSC和1%SDS中孵育,或在65℃下在5xSSC和1%SDS中孵育,在0.2xSSC和0.1%SDS中洗涤。“杂交”是指这样的反应,在所述反应中一种或多种多核苷酸反应以形成复合物,该复合物经由核苷酸残基的碱基之间的氢键键合而稳定。氢键键合可以通过沃森克里克碱基配对、胡格斯坦结合或任何其他序列特异性方式发生。复合物可以包括形成双链结构的两条链、形成多链复合物的三条或更多条链、单条自杂交链,或这些的任意组合。杂交反应可以构成更广泛过程中的一个步骤,诸如PCR的启动,或者用酶切割多核苷酸。能够与给定序列杂交的序列被称为所述给定序列的“互补序列”。如本文所用,术语“基因组基因座”或“基因座”(多个基因座)是基因或DNA序列在染色体上的特定位置。“基因”是指编码多肽或RNA链的成段DNA或RNA,其在生物体中具有功能作用并且因此是活生物体中的遗传分子单位。出于本发明的目的,可以认为基因包括调节基因产物产生的区域,而无论此类调节序列是否与编码序列和/或转录序列相邻。因此,基因包括但不一定限于启动子序列、终止子、翻译调节序列(诸如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质结合位点和基因座控制区。如本文所用,“基因组基因座的表达”或“基因表达”是将来自基因的信息用于合成功能基因产物的过程。基因表达的产物往往是蛋白质,但在诸如rRNA基因或tRNA基因等非蛋白质编码基因中,产物是功能性RNA。所有已知的生命—真核生物(包括多细胞生物)、原核生物(细菌和古生菌)和病毒—都使用基因表达过程来产生功能性产物以存活。如本文所用,基因或核酸的“表达”不仅涵盖细胞基因表达,而且还涵盖克隆系统和任何其它情形中核酸的转录和翻译。如本文所用,“表达”还指多核苷酸从DNA模板转录(诸如转录成和mRNA或其他RNA转录物)的过程和/或转录的mRNA随后被翻译成肽、多肽或蛋白质的过程。转录物和编码多肽可以统称为“基因产物”。如果多核苷酸来源于基因组DNA,则表达可以包括在真核细胞中剪接mRNA。术语“多肽”、“肽”和“蛋白质”在本文中可互换使用地指代任何长度的氨基酸聚合物。聚合物可以是直链或支链的,其可以包含经修饰的氨基酸,并且其可以被非氨基酸打断。该术语还涵盖已经修饰的氨基酸聚合物;所述修饰为例如二硫键形成、糖基化、脂质化、乙酰化、磷酸化,或任何其他操纵,诸如与标记组分缀合。如本文所用,术语“氨基酸”包括天然和/或非天然或合成的氨基酸,包括甘氨酸和右旋或左旋光学异构体,以及氨基酸类似物和肽模拟物。如本文所用,术语“结构域”或“蛋白质结构域”是指蛋白质序列的一部分,该部分可以独立于蛋白质链的其余部分而存在和发挥作用。如本发明的各方面中所述,序列同一性与序列同源性相关。同源性比较可以通过眼睛进行,或者更通常地,借助于容易获得的序列比较程序。这些可商购获得的计算机程序可以计算两个或更多个序列之间的同源性百分比(%),并且还可以计算两个或更多个氨基酸或核酸序列所共享的序列同一性。
如本文所用,术语“野生型”是本领域技术人员所理解的术语,并且是指在自然界中存在、与突变体或变体形式不同的生物体、菌株、基因或特征的典型形式。“野生型”可以为基线。
如本文中所用,术语“变体”应被理解为表示具有与天然存在的偏离的模式的性质的表现。术语“非天然存在的”或“工程化的”可互换使用,并且表示人为介入。当提及核酸分子或多肽时,该术语意指该核酸分子或多肽至少基本上不含至少一种与它们在自然界中天然地结合的并且如在自然界中发现的其它组分。在所有方面和实施方案中,无论它们是否包括这些术语,应理解,优选地,其可以是任选的,因此优选地被包括或非优选地不被包括。此外,术语“非天然存在的”和“工程化的”可以互换使用,因此可以单独或组合使用,并且一个或另一个可以代替两者一起的提及。特别地,“工程化的”代替“非天然发生的”或“非天然发生的和/或工程化的”是优选的。
序列同源性可通过本领域已知的许多计算机程序(例如BLAST或FASTA等)中的任何一种来生成。用于进行这种比对的合适的计算机程序是GCG Wisconsin Bestfit软件包(University of Wisconsin,U.S.A;Devereux等,1984,Nucleic Acids Research 12:387)。可以执行序列比较的其它软件的实例包括但不限于BLAST软件包(参见Ausubel等,1999同上-第18章)、FASTA(Atschul等,1990,J.Mol.Biol.,403-410)和GENEWORKS比较工具套件。BLAST和FASTA均可用于离线和在线搜索(参见Ausubel等,1999同上,第7-58页至第7-60页)。然而,优选地使用GCG Bestfit程序。可在连续序列上计算百分比(%)序列同源性,即,将一个序列与另一序列比对,以及将一个序列中的每个氨基酸或核苷酸直接与另一序列中相应的氨基酸或核苷酸进行比较,一次一个残基。这称为“无缺口(ungapped)”比对。通常,仅在相对少的数量的残基上进行此类无缺口比对。尽管这是非常简单和一致的方法,但其未能考虑到,例如,在一对在其它方面相同的序列上,一个插入或缺失可导致随后的氨基酸被挤出比对之外,因此,在进行全局比对时,很有可能导致百分同源性的大规模降低。因此,大多数序列比较方法被设计成产生考虑到可能的插入和缺失的最佳比对,而不会过度地对总体同源性或同一性分数进行罚分。这通过在序列比对中插入“缺口”以试图使局部同源性或同一性最大化来实现。然而,这些更复杂的方法为出现在所述比对中的每一个缺口规定了“缺口罚分”,以便对于相同数量的相同氨基酸而言,具有尽可能少的缺口的序列比对-反映在两个被比较的序列之间具有较高的相关性-可以与具有许多缺口的序列相比获得更高的评分。通常使用“亲和力缺口成本(Affinify gap costs)”,其让缺口的存在承担相对高的成本,而让该缺口中每一个随后的残基承担较小的罚分。这是最常用的缺口评分系统。高缺口罚分当然可以产生具有较少缺口的最佳比对。大多数比对程序允许对缺口罚分被修改。然而,在将这种软件用于序列比较时优选使用缺省值。例如,在使用GCGWisconsin Bestfit软件包时,氨基酸序列的缺省缺口罚分为每个缺口-12以及每个延伸-4。因此,最大百分比同源性比的计算首先要求在考虑到缺口罚分的情况下产生最佳比对。用于进行这种比对的合适的计算机程序是GCG Wisconsin Bestfit软件包(Devereux等,1984Nuc.Acids Research 12第387页)。可执行序列比较之外的其它软件的实例包括但不限于BLAST软件包(参见Ausubel等,1999 Short Protocols in Molecular Biology,第四版-第18章)、FASTA(Altschul等,1990J.Mol.Biol.403-410)和GENEWORKS比较工具套件。BLAST和FASTA均可用于离线和在线搜索(参见Ausubel等,1999,Short Protocols inMolecular Biology,第7-58页至第7-60页)。然而,对于一些应用,优选地使用GCG Bestfit程序。称为BLAST 2 Sequences的新工具也可用于比较蛋白质和核苷酸序列(参见FEMSMicrobiol Lett.1999 174(2):247-50;FEMS Microbiol Lett.1999 177(1):187-8和美国国立卫生研究院网站上的国家生物技术信息中心)。尽管可以根据同一性来测量最终的百分比同源性,但比对过程本身通常不是基于全有或全无的成对比较(all-or-nothing paircomparison)的。相反地,通常使用标度的相似性评分矩阵(similarity score matrix),其根据化学相似性或进化距离为每个成对比较赋予分数。常用的这样的矩阵的实例是BLOSUM62矩阵-BLAST程序套件的缺省矩阵。GCG Wisconsin程序通常使用公开的缺省值或定制符号比较表,如果提供的话(关于进一步的细节见用户手册)。对于一些应用,优选使用GCG软件包公开的缺省值,或者在其它软件中,使用缺省矩阵,诸如BLOSUM62。或者,百分比同源性可基于与CLUSTAL(Higgins DG&Sharp PM(1988),Gene 73(1),237-244)类似的算法,使用DNASISTM(Hitachi Software)中的多重比对特征来进行计算。一旦软件产生了最佳比对,有可能计算出百分同源性,优选百分比序列同一性。软件通常将这作为序列比较的一部分进行并且生成数字结果。该序列也可具有氨基酸残基的缺失、插入或取代,它们产生沉默变化,导致功能等价的物质产生。可基于氨基酸性质(诸如,残基的极性、电荷、溶解度、疏水性、亲水性和/或两亲性性质)的相似性进行有意的氨基酸取代,因此将氨基酸一起编入功能组是有用的。氨基酸可仅基于它们的侧链的性质而分组在一起。然而,更有用的是也包含突变数据。出于结构原因,由此衍生的氨基酸的组可能是保守的。这些组可以以维恩图的形式描述(Livingstone C.D.和Barton G.J.(1993)“Protein sequence alignments:astrategy for the hierarchical analysis of residue conservation”Comput.Appl.Biosci.9:745-756)(Taylor W.R.(1986)“The classification of aminoacid conservation”J.Theor.Biol.119;205-218)。可以例如根据描述普遍接受的氨基酸的维恩图分组的下表进行保守取代(也参考与表1结合的本文中保守取代的论述)。
与表1结合的本文中关于保守取代的引述也被提及来指与保守取代相同。
术语“受试者”、“个体”和“患者”在本文可互换使用,是指脊椎动物,优选为哺乳动物,更优选为人。哺乳动物包括但不限于鼠、猿猴、人、农场动物、竞技动物和宠物。还涵盖了体内获得或体外培养的生物实体的组织、细胞及其后代。
术语“治疗剂(therapeutic agent)”、“有治疗能力的剂(therapeutic capableagent)”或“治疗剂(treatment agent)”可互换使用,并且是指在施用于受试者时赋予一些有益作用的分子或化合物。有益作用包括启动诊断确定;改善疾病、症状、病症或病理状况;减少或预防疾病、症状、病症或病患的发作;并且通常抵抗疾病、症状、病症或病理状况。如本文中所用,“治疗(treatment)”或“医治(treating)”或“缓和(palliating)”或“改善(ameliorating)”可互换使用。这些术语是指获得有益或期望结果的方法,包括但不限于治疗益处和/或预防益处。治疗益处意指一种或多种治疗中的疾病、病患或症状的任何与治疗相关的改善或对所述疾病、病患或症状的作用。为了预防益处,可向有发生特定疾病、病患或症状风险的受试者或报告了疾病的一个或多个生理症状的受试者施用组合物,即使该疾病、病患或症状可能仍未表现出来。术语“有效量”或“治疗有效量”是指足以实现有益或期望的结果的剂的量。治疗有效量可根据以下一项或多项而变化:受试者和所治疗的疾病状况、受试者的体重和年龄、疾病状况的严重度、施用方式等,所述治疗有效量可由本领域普通技术人员容易地确定。该术语还适用于将通过本文所述的成像方法中的任一种提供用于检测的图像的剂量。具体剂量可根据以下一项或多项而变化:所选的特定剂、要遵循的给药方案,、否与其它化合物联合施用、施用时间、要成像的组织以及将其携带于其中的物理递送系统。
除非另有说明,否则本发明的实施采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术,它们在本领域的技术范围内。参见Sambrook,Fritsch和Maniatis,MOLECULAR CLONING:A LABORATORY MANUAL,第2版(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F.M.Ausubel等,编辑(1987));the seriesMETHODS EN ENZYMOLOGY(Academic Press,Inc.):PCR 2:A PRACTICAL APPROACH(M.J.MacPherson,B.D.Hames和G.R.Taylor编辑(1995)),Harlow和Lane,编辑(1988)ANTIBODIES,A LABORATORY MANUAL,and ANIMAL CELL CULTURE(R.I.Freshney,编辑(1987))。本发明的几个方面涉及包含一个或多个载体的载体系统或多个载体本身。载体可被设计成在原核或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白质或酶)。例如,CRISPR转录物可在细菌细胞诸如大肠杆菌(Escherichia coli)、昆虫细胞(使用杆状病毒表达载体)、酵母细胞或哺乳动物细胞中表达。在Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)中进一步论述合适的宿主细胞。或者,可以例如使用T7启动子调控序列和T7聚合酶体外转录和翻译重组表达载体。本发明的实施方案包括可包含可发生的同源取代(取代和替代在本文中均用于表示现有氨基酸残基或核苷酸与替代残基或核苷酸的互换)(即,在氨基酸的情况下,同类取代(like-for-like substitution),诸如碱性对碱性、酸性对酸性、极性对极性等的取代)的序列(多核苷酸或多肽)。还可发生非同源取代,即从一类残基至另一类残基的取代,或者可选地涉及非天然氨基酸(诸如鸟氨酸(下文中称为Z)、二氨基丁酸鸟氨酸(下文中称为B)、正亮氨酸鸟氨酸(下文中称为O)、吡啶基丙氨酸、噻嗯基丙氨酸、萘基丙氨酸和苯基甘氨酸)的包含。变体氨基酸序列可包括可插入序列的任意两个氨基酸残基之间的合适的间隔子基团,所述间隔子基团,除了氨基酸间隔子诸如甘氨酸或P-丙氨酸残基以外,还包括烷基例如甲基、乙基或丙基。本领域技术人员可以很好地理解另外形式的变化,其涉及一个或多个呈类肽形式的氨基酸残基的存在。为避免疑问,“类肽形式”用于指其中oc-碳取代基位于残基的氮原子上而非oc-碳上的变体氨基酸残基。用于制备呈类肽形式的肽的方法是本领域已知的,例如Simon RJ等,PNAS(1992)89(20),9367-9371和Horwell DC,Trends Biotechnol.(1995)13(4),132-134.Homology modelling:Corresponding residues in other Cas13borthologs can beidentified by the methods of Zhang等2012(Nature;490(7421):556-60)和Chen等,2015(PLoS Comput Biol;11(5):el004248)—计算蛋白质间相互作用(PPI)方法,其预测由结构域-基序界面介导的相互作用。PrePPI(预测PPI)(一种基于结构的PPI预测方法)使用贝叶斯统计框架将结构证据与非结构证据结合在一起。该方法涉及获取一对查询蛋白,并使用结构比对来鉴定与其实验确定的结构或同源性模型相对应的结构代表。通过考虑全局和局部几何关系,将结构比对进一步用于鉴定结构近邻和结构远邻。每当结构代表的两个邻居形成蛋白质数据库中报告的复合物时,这就定义用于对两个查询蛋白质之间相互作用建模的模板。通过将代表性结构叠加在模板中其对应的结构邻居上来创建复合物的模型。在Dey等,2013(Prot Sci;22:359-66)中进一步描述这种方法。
为了本发明的目的,扩增意指使用能够以合理的保真度复制靶序列的引物和聚合酶的任何方法。可通过天然或重组DNA聚合酶(诸如TaqGoldTM、T7 DNA聚合酶、大肠杆菌DNA聚合酶的Klenow片段和逆转录酶)进行扩增。优选扩增方法是PCR。在某些方面,本发明涉及载体。如本文中所用,“载体”是允许或促进实体从一种环境转移到另一种环境的工具。其是复制子,诸如质粒、噬菌体或粘粒,可向其中插入另一个DNA区段,以实现所插入区段的复制。通常,当与适当的控制元件结合时,载体能够复制。通常,术语“载体”是指能够转运已与其连接的另一核酸的核酸分子。载体包括但不限于为单链、双链或部分双链的核酸分子;其包含一个或多个自由末端、无自由末端(例如,环状)的核酸分子;包含DNA、RNA或两者的核酸分子;和本领域已知的其它多核苷酸变体。载体的一种类型是“质粒”,其是指可以诸如通过标准分子克隆技术向其中插入另外的DNA区段的环状双链DNA环。载体的另一种类型是病毒载体,其中病毒来源的DNA或RNA序列存在于载体中以用于包装到病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒(AAV))中。病毒载体还包括病毒携带的用于转染到宿主细胞中的多核苷酸。某些载体能够在引入它们的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和游离型哺乳动物载体)。其它载体(例如,非游离型哺乳动物载体)在引入宿主细胞后,被整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够指导与其可操作地连接的基因的表达。此类载体在本文中称为“表达载体”。重组DNA技术中有用的常用表达载体通常为质粒形式。重组表达载体可以以适合用于在宿主细胞中表达核酸的形式包含本发明的核酸,这意味着重组表达载体包括一种或多种调控元件,其可根据待用于表达的宿主细胞来进行选择,与待表达的核酸序列可操作连接。在重组表达载体内,“可操作地连接的”旨在指目标核苷酸序列以允许核苷酸序列表达(例如,在体外转录/翻译系统中或当载体被引用宿主细胞中时在宿主细胞中)的方式与一个或多个调控元件连接。关于重组和克隆方法,提及了2004年9月2日公布为US 2004-0171156 Al的美国专利申请10/815,730(其内容通过引用整体并入本文)。本发明的方面涉及用于引导RNA和野生型、经修饰的或突变的CRISPR效应蛋白/酶(例如Cas13b效应蛋白)的双顺反子载体。双顺反子表达载体引导RNA和野生型、经修饰的或突变的CRISPR效应蛋白/酶(例如Cas13b效应蛋白)是优选的。通常,特别是在本实施方案和野生型中,经修饰或突变的CRISPR效应蛋白/酶(例如Cas13b效应蛋白)优选由CBh启动子驱动。RNA可以优选地由Pol III启动子(诸如U6启动子)驱动。理想地,将两者组合。
在一些实施方案中,提供了引导RNA或crRNA中的环。这可以是茎环或四环。该环优选是GAAA,但不限于该序列或实际上长度仅为4bp。实际上,用于发夹结构的优选环形成序列的长度为4个核苷酸,最优选具有序列GAAA。然而,可以使用更长或更短的环序列,替代序列亦可如此。序列优选包括核苷酸三联体(例如,AAA)和另外的核苷酸(例如C或G)。环形成序列的实例包括CAAA和AAAG。
在实施本文公开的任何方法中,可以通过本领域已知的一种或多种方法将合适的载体引入细胞或胚胎,所述方法包括但不限于显微注射、电穿孔、声致穿孔、生物弹射、磷酸钙介导转染、阳离子转染、脂质体转染、树状聚合物转染、热休克转染、核转染转染、磁转染、脂转染、刺穿转染、光学转染(optical transfection)、专利试剂增强的核酸摄取以及通过脂质体、免疫脂质体、病毒体或人工病毒体的递送。在一些方法中,通过显微注射将载体引入胚胎。可将一种或多种载体显微注射入胚胎的核或细胞质中。在一些方法中,可通过核转染将一种或多种载体引入细胞。
载体可被设计成在原核或真核细胞中表达CRISPR转录物(例如,核酸转录物、蛋白质或酶)。例如,CRISPR转录物可在细菌细胞(诸如大肠杆菌)、昆虫细胞(使用杆状病毒表达载体)、酵母细胞或哺乳动物细胞中表达。在Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)中进一步论述了合适的宿主细胞。或者,例如可使用T7启动子调控序列和T7聚合酶体外转录和翻译重组表达载体。
可将载体引入原核或真核细胞中并在原核或原核细胞中扩增。在一些实施方案中,原核生物用于扩增待被引入真核细胞的载体的拷贝或在待引入真核细胞的载体的生产中用作中间载体(例如,将质粒作为病毒载体包装系统的一部分扩增)。在一些实施方案中,原核生物用于扩增载体的拷贝并表达一种或多种核酸,诸如以提供用于递送至宿主细胞或宿主生物体的一种或多种蛋白质的来源。最常见地在具有含有指导融合蛋白或非融合蛋白表达的组成型或诱导型启动子的载体的大肠杆菌中进行原原核生物中的蛋白质表达。融合载体将许多氨基酸添加到其中编码的蛋白质,诸如添加到重组蛋白质的氨基末端。此类融合载体可用于一个或多个目的,诸如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解度;和(iii)通过在亲和纯化中充当配体来帮助重组蛋白的纯化。通常,在融合表达载体中,在融合部分和重组蛋白的联接处引入蛋白水解切割位点,以使得在融合蛋白纯化之后能够从融合部分分离重组蛋白。此类酶及其同源识别序列包括Xa因子、凝血酶和肠激酶。示例性融合表达载体包括分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A与靶重组蛋白融合的pGEX(Pharmacia Biotech Inc;Smith和Johnson,1988.Gene 67:31-40)、pMAL(New England Biolabs,Beverly,Mass.)和pRIT5(Pharmacia,Piscataway,N.J.)。合适的可诱导的非融合大肠杆菌表达载体的实例包括pTrc(Amrann等,(1988)Gene 69:301-315)和pET lid(Studier等,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)60-89)。在一些实施方案中,载体是酵母表达载体。用于在酿酒酵母中表达的载体的实例包括pYepSecl(Baldari等,1987.EMBO J.6:229-234)、pMFa(Kuijan和Herskowitz,1982.Cell 30:933-943)、pJRY88(Schultz等,1987.Gene54:113-123)、pYES2(Invitrogen Corporation,San Diego,Calif.)和picZ(InVitrogenCorp,San Diego,Calif.)。在一些实施方案中,载体使用杆状病毒表达载体在昆虫细胞中驱动蛋白质表达。可用于在培养的昆虫细胞(例如,SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(Smith等,1983.Mol.Cell.Biol.3:2156-2165)和pVL系列(Lucklow和Summers,1989.Virology 170:31-39)。在一些实施方案中,载体能够使用哺乳动物表达载体驱动哺乳动物细胞中一个或多个序列的表达。哺乳动物表达载体的实例包括pCDM8(Seed,1987.Nature329:840)和pMT2PC(Kaufman等,1987.EMBO J.6:187-195)。当用于哺乳动物细胞时,表达载体的控制功能通常由一个或多个调控元件提供。例如,常用的启动子源自多瘤病毒、腺病毒2、巨细胞病毒、猿猴病毒40以及本文公开和本领域已知的其它启动子。关于用于原核和真核细胞的其它合适的表达系统,参见,例如,Sambrook等,MOLECULARCLONING:A LABORATORY MANUAL.第2版,Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.,1989的第16章和第17章。在一些实施方案中,重组哺乳动物表达载体能够指导核酸优先在特定细胞类型中表达(例如,将组织特异性调控元件用于表达核酸)。组织特异性调控元件是本领域已知的。合适的组织特异性启动子的非限制性实例包括白蛋白启动子(肝特异性;Pinkert等,1987.Genes Dev.1:268-277)、淋巴样特异性启动子(Calame和Eaton,1988.Adv.Immunol.43:235-275),特别是T细胞受体的启动子(Winoto和Baltimore,1989.EMBO J.8:729-733)和免疫球蛋白(Baneiji等,1983.Cell 33:729-740;Queen和Baltimore,1983.Cell 33:741-748)、神经元特异性启动子(例如,神经丝启动子;Byrne和Ruddle,1989.Proc.Natl.Acad.Sci.USA 86:5473-5477)、胰腺特异性启动子(Edlund等,1985.Science 230:912-916)和乳腺特异性启动子(例如,乳清蛋白启动子;美国专利第4,873,316号和欧洲申请公布第264,166号)。还涵盖发育调控启动子,例如鼠hox启动子(Kessel和Gruss,1990.Science 249:374-379)和α-甲胎蛋白启动子(Campes和Tilghman,1989.Genes Dev.3:537-546)。关于这些原核和真核载体,提及了美国专利6,750,059,其内容通过引用整体并入本文。本发明的其它实施方案可涉及病毒载体的使用,关于所述病毒载体提及了美国专利申请13/092,085,其内容通过引用整体并入本文。组织特异性调控元件在本领域中是已知的,并且在这方面,提及了美国专利7,776,321,其内容通过引用整体并入本文。
在一些实施方案中,调控元件可操作地连接至CRISPR Cas13b系统或复合物的一个或多个元件或编码CRISPR Cas13b系统或复合物,以驱动CRISPR系统的所述一个或多个元件表达。通常,CRISPR(规律成簇间隔短回文重复序列),也称为SPIDR(间隔散在正向重复序列(SPacer Interspersed Direct Repeats)),构成通常对特定细菌物种特异的DNA基因座家族。CRISPR基因座包含在大肠杆菌中被识别的不同类别的散在短序列重复序列(Ishino等,J.Bacteriol.,169:5429-5433[1987];和Nakata等,J.Bacteriol.,171:3553-3556[1989])和相关基因。已在地中海嗜盐杆菌(Haloferax mediterranei)、化脓性链球菌(Streptococcus pyogenes)、鱼腥藻属(Anabaena)和结核分枝杆菌(Mycobacteriumtuberculosis)中鉴定类似的散在SSR(参见,Groenen等,Mol.Microbiol.,10:1057-1065[1993];Hoe等,Emerg.Infect.Dis.,5:254-263[1999];Masepohl等,Biochim.Biophys.Acta 1307:26-30[1996];和Mojica等,Mol.Microbiol.,17:85-93[1995])。CRISPR基因座通常与其他SSR相异在于重复序列的结构,所述重复序列被称为短规律间隔重复序列(SRSR)(Janssen等,OMICS J.Integ.Biol.,6:23-33[2002];和Mojica等,Mol.Microbiol.,36:244-246[2000]。通常,重复序列是在簇中出现的短元件,所述簇由长度基本恒定的独特间插序列规则间隔(Mojica等,[2000],同上)。尽管菌株之间的重复序列高度保守,但散在重复序列的数目和间隔区的序列通常因菌株而异(van Embden等,J.Bacteriol.,182:2393-2401[2000])。已在40多种原核生物中鉴定了CRISPR基因座(参见例如Jansen等,Mol.Microbiol.,43:1565-1575[2002];和Mojica等,[2005]),所述原核生物包括但不限于气火菌属(Aeropyrum)、热棒菌属(Pyrobaculum)、硫化叶菌属(Sulfolobus)、古生球菌属(Archaeoglobus)、盐盒菌属(Halocarcula)、甲焼杆菌属(Methanobacterium)、甲烧球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、甲烷嗜热菌属(Methanopyrus)、火球菌属(Pyrococcus)、嗜苦菌属(Picrophilus)、热原体属(Thermoplasma)、棒状杆菌属(Corynebacterium)、分枝杆菌属(Mycobacterium)、链霉菌属(Streptomyces)、产水菌属(Aquifex)、卟啉菌属(Porphyromonas)、绿菌属(Chlorobium)、栖热菌属(Thermus)、芽孢杆菌属(Bacillus)、李斯特氏菌属(Listeria)、葡萄球菌属(Staphylococcus)、梭菌属(Clostridium)、嗜热厌氧杆菌属(Thermoanaerobacter)、支原体属(Mycoplasma)、梭杆菌属(Fusobacterium)、Azarcus、色杆菌属(Chromobacterium)、奈瑟菌属(Neisseria)、亚硝化毛杆菌属(Nitrosomonas)、脱硫弧菌属(Desulfovibrio)、地杆菌属(Geobacter)、粘球菌属(Myxococcus)、弯曲杆菌属(Campylobacter)、沃廉菌属(Wolinella)、不动杆菌属(Acinetobacter)、欧文氏菌属(Erwinia)、埃希氏杆菌属(Escherichia)、军团菌属(Legionella)、甲基球菌属(Methylococcus)、巴斯德氏菌属(Pasteurella)、发光杆菌属(Photobacterium)、沙门氏菌属(Salmonella)、黄单胞菌属(Xanthomonas)、耶尔森氏菌属(Yersinia)、密螺旋体属(Treponema)和嗜热袍菌属(Thermotoga)。
一般而言,如在本申请中使用的“RNA靶向系统”统一指代在表达或引导RNA靶向CRISPR-相关13b(“Cas13b”)基因(在本文还称为效应蛋白)的活性中涉及的转录物和其他元件,包括编码RNA靶向Cas(效应物)蛋白和向导RNA(或crRNA序列)的序列,参考如本文论述的表1。一般而言,RNA靶向系统的特征在于促进在靶序列的位点形成RNA靶向复合物的元件。在形成RNA靶向复合物的背景下,“靶序列”是指向导序列(或向导或crRNA的向导序列)被设计成与其具有互补性的RNA序列,其中靶序列与向导RNA之间的杂交促进RNA靶向复合物的形成。不一定需要完全互补性,条件是存在足够的互补性以引起杂交并促进RNA靶向复合物的形成。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。在一些实施方案中,靶序列可在真核细胞的细胞器内。可用于重组为包含靶序列的靶向基因座的序列或模板被称为“编辑模板”或“编辑RNA”或“编辑序列”。在本发明的方面,外源性模板RNA可被称为编辑模板。在本发明的一个方面,重组是同源重组。一般来说,向导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并且引导核酸靶向复合物与靶序列的序列特异性结合的任何多核苷酸序列。在一些实施方案中,当使用适合的比对算法最佳比对时,向导序列与其相应靶序列之间的互补程度是约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。最佳比对可借助于用于比对序列的任何适合的算法来确定,其非限制性实例包括史密斯-沃特曼算法(Smith-Waterman algorithm)、尼德曼-翁施算法(Needleman-Wunsch algorithm)、基于巴罗斯-维勒变换(Burrows-Wheeler Transform)的算法(例如巴罗斯-维勒比对仪(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies)、ELAND(Illumina,San Diego,CA)、SOAP(在soap.genomics.org.cn上可获得)和Maq(在maq.sourceforge.net上可获得)。在一些实施方案中,向导序列的长度是约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多个核苷酸。在一些实施方案中,向导序列的长度少于约75、50、45、40、35、30、25、20、15、12个或更少核苷酸。向导序列引导RNA靶向复合物与靶序列的序列特异性结合的能力可通过任何适合的测定来评估。模板多核苷酸可具有任何适合的长度,如长度为约或多于约10、15、20、25、50、75、100、150、200、500、1000或更多个核苷酸。在一些实施方案中,模板多核苷酸与包含靶序列的多核苷酸的一部分互补。当最佳比对时,模板多核苷酸可与靶序列的一个或多个核苷酸(例如,约或多于约1、5、10、15、20、25、30、35、40、45、50、60、70,80、90、100或更多个核苷酸)重叠。在一些实施方案中,当模板序列和包含靶序列的多核苷酸进行最佳比对时,模板多核苷酸的最近核苷酸在距靶序列约1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000或更多个核苷酸内。在一些实施方案中,RNA靶向效应蛋白是包含一个或多个异源蛋白结构域(例如除了核酸靶向效应蛋白之外的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个结构域)的融合蛋白的一部分。在一些实施方案中,CRISPR Cas13b效应蛋白/酶是包含一个或多个异源蛋白结构域(例如除了CRISPR Cas13b酶之外的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个结构域)的融合蛋白的一部分。可与效应蛋白融合的蛋白质结构域的实例包括但不限于表位标签、报告基因序列和具有一种或多种以下活性的蛋白结构域:甲基化酶活性、脱甲基化酶活性、转录活化活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA裂解活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感病毒血凝素(HA)标签、Myc标签、VSV-G标签以及硫氧还蛋白(Trx)标签。报告基因的实例包括但不限于谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)β-半乳糖苷酶、β-葡萄糖醛酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和包括蓝色荧光蛋白(BFP)的自发荧光蛋白。靶向核酸的效应蛋白可与编码结合DNA分子或结合其他细胞分子的蛋白质或蛋白质的片段的基因序列融合,所述蛋白质或蛋白质片段包括但不限于麦芽糖结合蛋白(MBP)、S-标签、Lex A DNA结合结构域(DBD)融合体、GAL4 DNA结合结构域融合体和单纯疱疹病毒(HSV)BP 16蛋白融合体。可形成包含核酸靶向效应蛋白的融合蛋白的一部分的另外结构域描述于US20110059502中,其以引用的方式并入本文。在一些实施方案中,使用标记的核酸靶向效应蛋白来鉴定靶序列的位置。在一些实施方案中,CRISPR Cas13b酶可形成诱导型系统的组分。系统的可诱导性质将允许使用一种能量形式来进行基因编辑或基因表达的时空控制。能量形式可包括但不限于,电磁辐射、声能、化学能和热能。诱导型系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交转录活化系统(FKBP、ABA等)或光诱导型系统(光敏色素、LOV结构域或隐花色素)。在一个实施方案中,CRISPR Cas13b酶可以是光诱导型转录效应子(LITE)的一部分以便以序列特异性方式引导转录活性的变化。光的组分可包括CRISPR酶、光响应性细胞色素异二聚体(例如,来自拟南芥)以及转录活化/阻遏结构域。可诱导的DNA结合蛋白的其他实例及其使用方法提供于US 61/736465和US 61/721,283和WO 2014/018423以及US8889418、US8895308、US20140186919、US20140242700、US20140273234、US20140335620、WO2014093635中,其特此以引用的方式整体并入。在一些方面,本发明提供了包括将一种或多种多核苷酸,诸如如本文所述的一种或多种载体、其一种或多种转录物和/或从其转录的一种或多种蛋白质递送至宿主细胞的方法。在一些方面,本发明还提供了通过此类方法产生的细胞以及包含此类细胞或由此类细胞产生的生物体(如动物、植物或真菌)。在一些实施方案中,将与向导RNA或crRNA组合(并且任选地与其复合)的RNA靶向效应蛋白递送至细胞。常规的基于病毒和非病毒的基因转移方法可用于将核酸引入哺乳动物细胞或靶组织中。此类方法可用于向培养物中或宿主生物体中的细胞施用编码RNA靶向系统的组分的核酸。非病毒载体递送系统包括DNA质粒、RNA(例如本文所述的载体的转录物)、裸核酸以及与诸如脂质体的递送媒介物复合的核酸。病毒载体递送系统包括DNA和RNA病毒,所述病毒在递送至细胞后具有游离基因或整合的基因组。关于基因疗法程序的综述,参见Anderson,Science 256:808-813(1992);Nabel和Feigner,TIBTECH 11:211-217(1993);Mitani和Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer和Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada等人,in CurrentTopics in Microbiology and Immunology,Doerfler和Bohm(编辑)(1995);以及Yu等人,Gene Therapy 1:13-26(1994)。核酸的非病毒递送方法包括脂转染、核转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、人工病毒粒子以及DNA的试剂增强性摄取。脂转染描述于例如美国专利号5,049,386、4,946,787和4,897,355中)并且脂转染试剂有市售(例如TransfectamTM和LipofectinTM)。适用于多核苷酸的有效受体识别脂转染的阳离子和中性脂质包括Felgner、WO 91/17424、WO 91/16024的那些。递送可以是向细胞(例如体外或离体施用)或靶组织(例如体内施用)。
疾患模型
本发明的方法可用于产生植物、动物或细胞,所述植物、动物或细胞可用于建模和/或研究目标遗传或表观遗传疾患,如通过目标突变的模型或疾病模型。如本文所用,“疾病”是指受试者的疾病、病症或适应症。例如,本发明的方法可用于产生包含与疾病相关的一个或多个核酸序列中的修饰,或者其中与疾病相关的一个或多个核酸序列的表达被改变的植物、动物或细胞。这种核酸序列可编码或翻译疾病相关蛋白质序列或者可以是疾病相关的控制序列。因此,应理解在本发明的实施方案中,植物、受试者、患者、生物体或细胞可以是非人受试者、患者、生物体或细胞。因此,本发明提供了通过本发明的方法产生的植物、动物或细胞或其子代。子代可以是所产生的植物或动物的克隆,或者可由通过与相同物种的其他个体杂交以将其他所需性状渗入其后代的有性繁殖产生。在多细胞生物体、特别是动物或植物的情况下,细胞可以是体内或离体的。在细胞处于培养中的情况下,如果满足适当的培养条件并且优选地,如果所述细胞适合地适于此目的(例如干细胞),则可建立细胞系。还设想了由本发明产生的细菌细胞系。因此,还设想了细胞系。在一些方法中,疾病模型可用于使用在疾病的研究中常用的措施来研究基因或基因产物的突变或更通常基因或基因产物的表达改变(如降低)对动物或细胞以及疾病的发展和/或进展的影响。或者,这种疾病模型适用于研究药物活性化合物对疾病的影响。在一些方法中,疾病模型可用于评估潜在基因治疗策略的功效。即,可修饰疾病相关RNA,以使得展示或抑制或减轻疾病发展和/或进展,且然后测试化合物对进展或抑制或减轻的影响。
在利用表1 Cas13b效应蛋白及其复合物以及编码它们的核酸分子和使用它们的方法中可用于实践本发明,参考:Genome-Scale CRISPR-Cas9 Knockout Screening inHuman Cells.Shalem,O.,Sanjana,NE.,Hartenian,E.,Shi,X.,Scott,DA.,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench,JG.,Zhang,F.Science Dec 12.(2013).[付印前的电子版];以最终编辑的形式出版为:Science.2014年1月3日;343(6166):84-87。Shalem等人涉及用于在基因组广度范围上探询基因功能的新的方式。他们的研究表明,递送基因组范围的CRISPR-Cas9敲除(GeCKO)文库利用64,751个独特的向导序列靶向18,080个基因,所述向导序列使得在人细胞中阴性和阳性选择筛选两者成为可能。首先,作者显示使用GeCKO文库来鉴定癌症和多能干细胞中细胞存活所必需的基因。接下来,在黑素瘤模型中,作者筛选了其丧失涉及在对威罗菲尼的抗性中的基因,威罗菲尼是抑制突变型蛋白激酶BRAF的一种治疗剂。他们的研究表明,排名最高的候选基因包括先前验证的基因NF1和MED12,以及新颖的hitsNF2、CUL3、TADA2B和TADA1。作者观察到在靶向相同基因的独立向导RNA之间高水平的一致性以及高比率的命中确认,并且因此证实了采用Cas9进行基因组范围筛选的前景。还参考美国专利公布号US20140357530;和PCT专利公布WO2014093701,其特此以引用的方式并入本文。
术语“与……缔合”在此关于功能结构域与Cas13b效应蛋白或衔接蛋白的缔合使用。它涉及一个分子如何关于另一个分子“缔合”,例如在衔接蛋白与功能结构域之间或在Cas13b效应蛋白和功能结构域之间而使用。在此类蛋白质-蛋白质相互作用的情况下,可按抗体识别表位的方式就识别而论看待这种缔合。或者,一种蛋白质可经由两者的融合与另一种蛋白质缔合,例如一个亚基与另一个亚基融合。融合通常通过将一者的氨基酸序列添加至另一者的氨基酸序列而发生,例如经由将编码每种蛋白质或亚基的核苷酸序列剪接在一起。或者,这本质上可被视为两个分子之间的结合或直接键联,如融合蛋白。在任何情况下,融合蛋白可在两个目标亚基之间(即在酶与功能结构域之间或在衔接蛋白与功能结构域之间)包含接头。因此,在一些实施方案中,Cas13b效应蛋白或衔接蛋白通过与功能结构域结合而与其缔合。在其他实施方案中,Cas13b效应蛋白或衔接蛋白与功能结构域缔合,因为二者任选地经由中间接头融合在一起。
Cas13b效应蛋白复合物可用于植物中
在一些实施方案中,本发明包括一种修饰细胞或生物体的方法。细胞可以是原核细胞或真核细胞。细胞可以是哺乳动物细胞。哺乳动物细胞可以是非人灵长类动物、牛、猪、啮齿动物或小鼠细胞。细胞可以是非哺乳动物真核细胞,如家禽、鱼或虾。细胞也可以是植物细胞。植物细胞可以是作物,如木薯、玉米、高粱、小麦或水稻。植物细胞也可以是藻类、树木或蔬菜。通过本发明引入细胞的修饰可以是使得改变细胞和细胞的子代以改善生物产物如抗体、淀粉、醇或其他所需细胞输出的产生。通过本发明引入细胞的修饰可以是使得细胞和细胞的子代包含改变所产生的生物产物的改变。系统可包括一种或多种不同的载体。在本发明的一个方面,效应蛋白经密码子优化以表达所需的细胞类型,优选真核细胞,优选哺乳动物细胞或人细胞。Cas13b系统(例如单一或多重)可与作物基因组学中的最新进展结合使用。此类CRISPR系统可用于执行高效且经济有效的植物基因或基因组或转录组探询或编辑或操作,例如用于植物基因或基因组的快速调查和/或选择和/或探询和/或比较和/或操作和/或转化;例如,以产生、鉴定、开发、优化或赋予植物性状或特性或转化植物基因组。因此,可改善植物、具有性状或特性的新组合的新植物或具有增强的性状的新植物的产生。此类CRISPR系统可关于植物在定点整合(SDI)或基因编辑(GE)或任何近反向育种(NRB)或反向育种(RB)技术中使用。因此,除非另有说明,否则本文提及动物细胞也可加上必要的变更后应用于植物细胞;并且,本文中具有降低的脱靶效应的酶和采用此类酶的系统可用于植物应用中,包括本文中提及的那些。提供了通过效应蛋白(表1 Cas13b)和合适的向导(crRNA)修饰的工程化植物及其子代。这些可包括抗病或抗旱作物,如小麦、大麦、水稻、大豆或玉米;经修饰以除去或降低自花授粉的能力的植物(但其可相反任选地杂交);以及过敏原性食物,如花生和坚果,其中免疫原性蛋白已通过经由效应蛋白和适合的向导靶向而失效、毁坏或破坏。使用经典CRIPSR-Cas系统的任何方面都可适用于与为Cas蛋白不可知论的CRISPR系统,例如Cas13b效应蛋白系统。
治疗性治疗
根据本公开内容,包括治疗剂、测定和其他应用,本发明的系统可应用于先前RNA切割技术领域而无需过多实验,因为本申请提供系统的告知工程化的基础。本发明提供了对由RNA、毒性RNA和/或突变型RNA(例如像,剪接缺陷或截短)的过表达引起的疾病的治疗性治疗。毒性RNA的表达可能与核内含体的形成和脑、心脏或骨骼肌中的迟发性退行性改变相关。在最深入研究的实例(肌强直性营养不良)中,看来毒性RNA的主要致病作用是螯合结合蛋白并损害选择性剪接的调控(Hum.Mol.Genet.(2006)15(suppl 2):R162-R169)。遗传学家特别关注肌强直性营养不良[肌营养不良性肌强直症(DM)],因为它产生极为广泛的临床特征。部分列表包括肌肉虚耗、白内障、胰岛素抵抗、睾丸萎缩、心脏传导减慢、皮肤肿瘤以及对认知的影响。DM的经典形式(其现在被称为DM 1型(DM1))是由DMPK(一种编码胞质蛋白激酶的基因)的3'-非翻译区(UTR)中CTG重复序列的扩增引起。
先天性免疫系统主要通过识别受感染细胞内部的病毒核酸来检测病毒感染,这被称为DNA或RNA感测。体外RNA感测测定可用于检测特定RNA底物。RNA靶向效应蛋白可例如用于活细胞中基于RNA的感测。应用的实例是通过感测例如疾病特异性RNA的诊断。本发明的RNA靶向效应蛋白(表1 Cas13b)可进一步用于抗病毒活性,特别是针对RNA病毒。可使用对所选病毒RNA序列具有选择性的适合向导RNA来使效应蛋白(表1 Cas13b)靶向病毒RNA。特别地,效应蛋白可以是裂解RNA(如单链RNA)的活性核酸酶。预期本发明的酶系统靶向RNA上述RNA的治疗剂量是约0.1至约2mg/kg,所述剂量可在监测到的应答下顺序施用,并且如果需要重复剂量,最高至约7至10个剂量/患者。有利地,在治疗方案期间从每个患者收集样品,以确定治疗的有效性。例如,可分离并定量RNA样品以确定表达是否降低或改善。这种诊断在本领域技术人员的知识范围内。
转录物检测方法
本发明的效应蛋白(表1 Cas13b)和系统可用于特异性检测细胞或其他样品中的RNA。在存在目标RNA靶标的情况下,向导依赖性Cas13b核酸酶活性可能伴随着针对附带靶标的非特异性RNA酶活性。为了利用RNA酶活性,所需要的只是可检测地裂解的报告底物。例如,报告分子可包含RNA,在一端用荧光报告分子(fluor)标记并且在另一端用淬灭剂标记。在不存在Cas13b RNA酶活性的情况下,淬灭剂的物理接近性将来自fluor的荧光阻抑至低水平。当Cas13b靶标特异性裂解被目标RNA靶标和适合的向导RNA的存在活化时,含RNA的报告分子被非特异性裂解,并且fluor和淬灭剂在空间上分离。当被适当波长的光激发时,这导致fluor发出可检测的信号。在一种示例性测定方法中,将Cas13b效应子、目标靶标特异性向导RNA和报告分子添加至细胞样品。荧光增加表明存在目标RNA靶标。在另一种示例性方法中,提供了一种检测阵列。阵列的每个位置均提供有Cas13b效应子、报告分子和目标靶标特异性向导RNA。取决于待进行的测定,在阵列的每个位置处的目标靶标特异性向导RNA可以是相同的、不同的或其组合。例如,当需要测试单一来源样品中的一个或多个靶标时,可提供不同的目标靶标特异性向导RNA。可在每个位置提供相同的目标靶标特异性向导RNA,例如,当需要测试同一靶标的多个样品时。
在某些实施方案中,Cas13b瞬时或稳定地在体外系统或细胞中提供或表达,并被靶向或触发以非特异性地裂解细胞核酸。在一个实施方案中,Cas13b被工程化以敲低ssDNA,例如病毒ssDNA。在另一个实施方案中,Cas13b被工程化以敲低RNA。可设计系统,以使得敲低依赖于细胞或体外系统中存在的靶DNA,或通过向系统或细胞中添加靶核酸来触发。
在一个实施方案中,将Cas13b系统工程化以非特异性地裂解细胞的亚群中的RNA,所述细胞的亚群可通过异常DNA序列的存在来区分,例如其中异常DNA的裂解可能是不完全的或无效的。在一个非限制性实例中,靶向存在于癌细胞中并驱动细胞转化的DNA易位。经历染色体DNA和修复的细胞亚群可存活,而非特异性附带核糖核酸酶活性则有利地导致潜在存活者的细胞死亡。
最近附带活性被用于称为SHERLOCK的高度敏感性和特异性的核酸检测平台,所述平台可用于许多临床诊断(Gootenberg,J.S.等人Nucleic acid detection with CRISPR-Casl3a/C2c2.Science 356,438-442(2017))。
根据本发明,工程化的Cas13b系统针对RNA核酸内切酶活性进行优化,并且可在哺乳动物细胞中表达并被靶向以有效敲低细胞中的报告分子或转录物。
工程化的Cas13b与等温扩增的附带效应可提供基于CRISPR的诊断,从而提供具有高灵敏度和单碱基错配特异性的快速DNA或RNA检测。基于Cas13b的分子检测平台用于检测特定病毒株,区分病原细菌、基因型人DNA并鉴定无细胞的肿瘤DNA突变。此外,为了不依赖于冷链和长期储存可冻干反应试剂,并且易于在纸上复原用于实地应用。
在便携平台上在高灵敏度和单碱基特异性下快速检测核酸的能力可有助于疾病诊断和监测、流行病学和一般实验室任务。尽管方法是用于检测核酸,但它们在灵敏度、特异性、简易性、成本和速度当中有所权衡。
微生物成簇规律间隔的短回文重复(CRISPR)和CRISPR相关(CRISPR-Cas)适应性免疫系统含有可编程的核酸内切酶,其可支持用于基于CRISPR的诊断(CRISPR-Dx)。Cas13b可用CRISPR RNA(crRNA)重新编程以为特异性DNA感测提供平台。在识别其DNA靶标后,活化的Cas13b参与附近非靶向核酸(即RNA和/或ssDNA)的“附带”裂解。这种crRNA编程的附带裂解活性允许Cas13b在体内通过触发程序性细胞死亡或通过标记的RNA或ssDNA的非特异性降解来检测特异性DNA的存在。此处描述基于核酸扩增和Cas13b介导的商业报告RNA的附带裂解的具有高灵敏度的体外核酸检测平台,从而允许实时检测靶标。
在某些示例性实施方案中,Cas13b效应蛋白来自表1中鉴定的生物体。在某些示例性实施方案中,Cas13b效应蛋白来自选自以下的生物体:动物溃疡伯杰氏菌、中间普雷沃菌、颊普雷沃菌、牙龈卟啉单胞菌、酿脓拟杆菌、另枝菌属ZOR0009、普雷沃菌属MA2016、鸭疫里默氏杆菌、桔红色普雷沃菌(Prevotella aurantiaca)、解糖普雷沃菌、拟香味类香味菌(Myroides odoratimimus)CCUG 10230、犬咬二氧化碳嗜纤维菌、齿周卟啉单胞菌、普雷沃菌属P5-125、嗜鳃黄杆菌、拟香味类香味菌、柱状黄杆菌或卟啉单胞菌属COT-052OH4946。在另一个实施方案中,一种或多种向导RNA被设计成结合至一种或多种作为疾病病况的诊断的靶RNA序列。
在某些示例性实施方案中,基于RNA的掩蔽构建体抑制可检测的阳性信号的产生,或基于RNA的掩蔽构建体通过掩蔽可检测的阳性信号或替代地产生可检测的阴性信号来抑制可检测的阳性信号的产生,或基于RNA的掩蔽构建体包含抑制由报告构建体编码的基因产物的产生的沉默RNA,其中所述基因产物在表达时产生可检测的阳性信号。
在另一个示例性实施方案中,基于RNA的掩蔽构建体是产生阴性可检测信号的核糖酶,并且其中当使核糖酶失活时产生阳性可检测信号。在一个示例性实施方案中,核糖酶使底物转变成第一种颜色并且其中当使核糖酶失活时底物转变成第二种颜色。在另一个示例性实施方案中,基于RNA的掩蔽剂是螯合酶的适体,其中所述酶在从适体释放后通过作用于底物而产生可检测信号,或适体螯合一对剂,所述剂在从适体释放时组合产生可检测信号。
在另一个示例性实施方案中,基于RNA的掩蔽构建体包含可检测配体寡核苷酸和掩蔽组分所附接的RNA寡核苷酸。在某些示例性实施方案中,可检测配体是荧光团并且掩蔽组分是淬灭剂分子。
在另一个方面,本发明提供了一种用于检测样品中的靶RNA的方法,所述方法包括:将样品或样品组分配至一个或多个个别离散容积中,所述个别离散容积包括包含效应蛋白、一种或多种向导RNA的CRISPR系统、基于RNA的掩蔽构建体;在足以允许一种或多种向导RNA结合至一种或多种靶分子的条件下孵育样品或样品组;经由一种或多种向导RNA结合至一种或多种靶分子来活化CRISPR效应蛋白,其中活化CRISPR效应蛋白得以修饰基于RNA的掩蔽构建体以便产生可检测的阳性信号;以及检测可检测的阳性信号,其中检测到可检测的阳性信号指示样品中一种或多种靶分子的存在。
在另一个方面,本发明提供了一种用于检测样品中的肽的方法,所述方法包括:将样品或样品组分配至一组个别离散容积中,所述个别离散容积包含肽检测适体、包含效应蛋白、一种或多种向导RNA的CRISPR系统、基于RNA的掩蔽构建体,其中所述肽检测适体包含掩蔽的RNA聚合酶位点并且被构造成结合一种或多种靶分子;在足以允许肽检测适体结合至一种或多种靶分子的条件下孵育样品或样品组,其中适体结合至相应靶分子暴露RNA聚合酶结合位点,促成触发RNA的RNA合成;经由一种或多种向导RNA结合至触发RNA来活化CRISPR效应蛋白,其中活化CRISPR效应蛋白得以修饰基于RNA的掩蔽构建体以便产生可检测的阳性信号;以及检测可检测的阳性信号,其中检测到可检测的阳性信号指示样品中一种或多种靶分子的存在。
在某些示例性实施方案中,一种或多种向导RNA被设计成结合至一种或多种作为疾病病况的诊断的靶分子。在某些其它示例性实施方案中,疾病病况是感染、器官疾病、血液疾病、免疫系统疾病、癌症、脑和神经系统疾病、内分泌疾病、妊娠或分娩相关疾病、遗传性疾病或环境获得性疾病、癌症,或真菌感染、细菌感染、寄生虫感染或病毒感染。
在某些示例性实施方案中,基于RNA的掩蔽构建体抑制可检测的阳性信号的产生,或基于RNA的掩蔽构建体通过掩蔽可检测的阳性信号或替代地产生可检测的阴性信号来抑制可检测的阳性信号的产生,或基于RNA的掩蔽构建体包含抑制由报告构建体编码的基因产物的产生的沉默RNA,其中所述基因产物当表达时产生可检测的阳性信号,或基于RNA的掩蔽构建体是产生阴性可检测信号的核糖酶,并且其中当使核糖酶灭活时产生阳性可检测信号。在其它示例性实施方案中,核糖酶使底物转变至第一种状态并且其中当使核糖酶灭活时底物转变至第二种状态,或基于RNA的掩蔽剂是适体,或适体螯合酶,其中所述酶在从适体释放后通过作用于底物而产生可检测信号,或适体螯合一对剂,所述剂当从适体释放时组合产生可检测信号。在其他实施方案中,基于RNA的掩蔽构建体包含在RNA寡核苷酸的第一端上具有可检测配体并且在RNA寡核苷酸的第二端上具有掩蔽组分的RNA寡核苷酸,或可检测配体是荧光团并且掩蔽组分是淬灭剂分子。
关于CRISPR-Cas系统、其组分以及此类组件的递送,包括方法、材料、递送媒介物、载体、颗粒、AAV及其制备和使用方法(包括关于量和制剂)的一般信息都适用于实践本发明时,参考:美国专利号8,999,641、8,993,233、8,945,839、8,932,814、8,906,616、8,895,308、8,889,418、8,889,356、8,871,445、8,865,406、8,795,965、8,771,945和8,697,359;美国专利公布US 2014-0310830(美国申请序列号14/105,031)、US 2014-0287938Al(美国申请序列号14/213,991)、US 2014-0273234 Al(美国申请序列号14/293,674)、US2014-0273232 Al(美国申请序列号14/290,575)、US 2014-0273231(美国申请序列号14/259,420)、US 2014-0256046 Al(美国申请序列号14/226,274)、US 2014-0248702 Al(美国申请序列号14/258,458)、US 2014-0242700 Al(美国申请序列号14/222,930)、US 2014-0242699 Al(美国申请序列号14/183,512)、US 2014-0242664 Al(美国申请序列号14/104,990)、US 2014-0234972 Al(美国申请序列号14/183,471)、US 2014-0227787 Al(美国申请序列号14/256,912)、US 2014-0189896 Al(美国申请序列号14/105,035)、US 2014-0186958(美国申请序列号14/105,017)、US 2014-0186919 Al(美国申请序列号14/104,977)、US 2014-0186843 Al(美国申请序列号14/104,900)、US 2014-0179770 Al(美国申请序列号14/104,837)和US 2014-0179006 Al(美国申请序列号14/183,486)、US 2014-0170753(美国申请序列号14/183,429);欧洲专利EP 2 784 162 B1和EP 2 771 468 B1;欧洲专利申请EP 2 771 468(EP13818570.7)、EP 2 764 103(EP 13824232.6)和EP 2 784162(EP14170383.5);以及PCT专利公布WO 2014/093661(PCT/US 2013/074743)、WO 2014/093694(PCT/US2013/074790)、WO 2014/093595(PCT/US2013/074611)、WO 2014/093718(PCT/US2013/074825)、WO 2014/093709(PCT/US2013/074812)、WO 2014/093622(PCT/US2013/074667)、WO 2014/093635(PCT/US2013/074691)、WO 2014/093655(PCT/US2013/074736)、WO 2014/093712(PCT/US2013/074819)、WO 2014/093701(PCT/US2013/074800)、WO 2014/018423(PCT/US2013/051418)、WO 2014/204723(PCT/US2014/041790)、WO 2014/204724(PCT/US2014/041800)、WO 2014/204725(PCT/US 2014/041803)、WO 2014/204726(PCT/US2014/041804)、WO 2014/204727(PCT/US2014/041806)、WO 2014/204728(PCT/US2014/041808)、WO 2014/204729(PCT/US2014/041809)。还参考分别于2013年1月30日、2013年3月15日、2013年3月28日、2013年4月20日、2013年5月6日和2013年5月28日提交的美国临时专利申请61/758,468;61/802,174;61/806,375;61/814,263;61/819,803和61/828,130。还参考于2013年6月17日提交的美国临时专利申请61/836,123。另外参考各自于2013年6月17日提交的美国临时专利申请61/835,931、61/835,936、61/836,127、61/836,101、61/836,080和61/835,973。进一步参考2013年8月5日提交的美国临时专利申请61/862,468和61/862,355;2013年8月28日提交的美国临时专利申请61/871,301;2013年9月25日提交的美国临时专利申请61/960,777以及2013年10月28日提交的美国临时专利申请61/961,980。还进一步参考:PCT专利申请号:各自2014年6月10日(6/10/14)提交的PCT/US2014/041803、PCT/US2014/041800、PCT/US2014/041809、PCT/US2014/041804和PCT/US2014/041806;2014年6月11日提交的PCT/US2014/041808;和2014年10月28日提交的PCT/US2014/62558,以及美国临时专利申请序列号:各自2013年12月12日提交的61/915,150、61/915,301、61/915,267和61/915,260;2013年1月29日和2013年2月25日提交的61/757,972和61/768,959;2013年6月17日提交的61/835,936、61/836,127、61/836,101、61/836,080、61/835,973和61/835,931;均于2014年6月11日提交的62/010,888和62/010,879;各自2014年6月10提交的62/010,329和62/010,441;各自2014年2月12日提交的61/939,228和61/939,242;2014年4月15日提交的61/980,012;2014年8月17日提交的62/038,358;各自2014年9月25日提交的62/054,490、62/055,484、62/055,460和62/055,487;以及2014年10月27日提交的62/069,243。还参考2014年9月25日提交的美国临时专利申请号62/055,484、62/055,460和62/055,487;2014年4月15日提交的美国临时专利申请61/980,012;以及2014年2月12日提交的美国临时专利申请61/939,242。参考2014年6月10日提交的PCT申请,所述PCT申请尤其指定美国申请号PCT/US14/41806。参考2014年1月22日提交的美国临时专利申请61/930,214。参考各自于2013年12月12日提交美国临时专利申请61/915,251;61/915,260和61/915,267。参考2014年4月15日提交的美国临时专利申请USSN 61/980,012。参考2014年6月10日提交的PCT申请,所述PCT申请尤其指定美国申请号PCT/US14/41806。参考2014年1月22日提交的美国临时专利申请61/930,214。参考各自于2013年12月12日提交美国临时专利申请61/915,251;61/915,260和61/915,267。
还提及2014年12月12日提交的美国申请62/091,455,PROTECTED GUIDE RNAS(PGRNAS);2014年12月24日提交的US申请62/096,708,PROTECTED GUIDE RNAS(PGRNAS);2014年12月12日提交的US申请62/091,462,DEAD GUIDES FOR CRISPR TRANSCRIPTIONFACTORS;2014年12月23日提交的美国申请62/096,324,DEAD GUIDES FOR CRISPRTRANSCRIPTION FACTORS;2014年12月12日提交的美国申请62/091,456,ESCORTED ANDFUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS;2014年12月12日提交的美国申请62/091,461,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMSAND COMPOSITIONS FOR GENOME EDITING AS TO HEMATOPOETIC STEM CELLS(HSCs);2014年12月19日提交的美国申请62/094,903,UNBIASED IDENTIFICATION OF DOUBLE-STRANDBREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING;2014年12月24日提交的美国申请62/096,761,ENGINEERING OF SYSTEMS,METHODS ANDOPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION;2014年12月30日提交的美国申请62/098,059,RNA-TARGETING SYSTEM;2014年12月24日提交的美国申请62/096,656,CRISPR HAVING OR ASSOCIATED WITH DESTABILIZATION DOMAINS;2014年12月14日提交的US申请62/096,697,CRISPR HAVING OR ASSOCIATED WITH AAV;2014年12月30日提交的美国申请62/098,158,ENGINEERED CRISPR COMPLEX INSERTIONAL TARGETINGSYSTEMS;2015年4月22日提交的美国申请62/151,052,CELLULAR TARGETING FOREXTRACELLULAR EXOSOMAL REPORTING;2014年9月24日提交的美国申请62/054,490,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERYCOMPONENTS;2014年9月25日提交的美国申请62/055,484,SYSTEMS,METHODS ANDCOMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CASSYSTEMS;2014年12月4日提交的美国申请62/087,537,SYSTEMS,METHODS ANDCOMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CASSYSTEMS;2014年9月24日提交的美国申请62/054,651,DELIVERY,USE AND THERAPEUTICAPPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELINGCOMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO;2014年10月23日提交的美国申请62/067,886,DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CASSYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCERMUTATIONS IN VIVO;2014年9月24日提交的美国申请62/054,675,DELIVERY,USE ANDTHERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS INNEURONAL CELLS/TISSUES;2014年9月24日提交的US申请62/054,528,DELIVERY,USE ANDTHERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNEDISEASES OR DISORDERS;2014年9月25日提交的美国申请62/055,454,DELIVERY,USE ANDTHERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORTARGETING DISORDERS AND DISEASES USING CELL PENETRATION PEPTIDES(CPP);2014年9月25日提交的美国申请62/055,460,MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OROPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES;2014年12月4日提交的美国申请62/087,475,FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CASSYSTEMS;2014年9月25日提交的美国申请62/055,487,FUNCTIONAL SCREENING WITHOPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS;2014年12月4日提交的美国申请62/087,546,MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKEDFUNCTIONAL-CRISPR COMPLEXES;以及2014年12月30日提交的美国申请62/098,285,CRISPRMEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMOR GROWTH ANDMETASTASIS。
这些专利、专利公布和申请中的每一个,以及在其中或在其起诉期间引用的所有文献(“申请引用文献”)以及在申请引用文献中引用或参考的所有文献,连同在其中或在其中的任何文献中提及并以引用方式并入本文的任何产品的任何说明书、描述、产品说明和产品清单,特此以引用方式并入本文并且可以用于实践本发明。所有文献(例如,这些专利、专利公布和申请以及申请引用文献)都以相同的程度以引用方式并入本文,就好像每个单独的文献被明确地和单独地指出以引用方式并入一样。
另外,关于CRISPR-Cas系统的一般信息,还提到以下文献(特此也以引用方式并入本文):
Multiplex genome engineering using CRISPR/Cas systems.Cong,L.,Ran,F.A.,Cox,D.,Lin,S.,Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.,&Zhang,F.Science Feb15;339(6121):819-23(2013);
RNA-guided editing of bacterial genomes using CRISPR-Cassystems.Jiang W.,Bikard D.,Cox D.,Zhang F,Marraffini LA.Nat Biotechnol Mar;31(3):233-9(2013);
One-Step Generation of Mice Carrying Mutations in Multiple Genes byCRISPR/Cas-Mediated Genome Engineering.Wang H.,Yang H.,Shivalila CS.,DawlatyMM.,Cheng AW.,Zhang F.,Jaenisch R.Cell May 9;153(4):910-8(2013);
Optical control of mammalian endogenous transcription andepigenetic states.Konermann S,Brigham MD,Trevino AE,Hsu PD,Heidenreich M,CongL,Platt RJ,Scott DA,Church GM,Zhang F.Nature.Aug 22;500(7463):472-6.doi:10.1038/Naturel2466.电子版2013年8月23日(2013);
Double Nicking by RNA-Guided CRISPR Cas9 for Enhanced GenomeEditing Specificity.Ran,FA.,Hsu,PD.,Lin,CY.,Gootenberg,JS.,Konermann,S.,Trevino,AE.,Scott,DA.,Inoue,A.,Matoba,S.,Zhang,Y.,&Zhang,F.Cell Aug 28.pii:S0092-8674(13)01015-5(2013-A);
DNA targeting specificity of RNA-guided Cas9 nucleases.Hsu,P.,Scott,D.,Weinstein,J.,Ran,FA.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.,Wu,X.,Shalem,O.,Cradick,TJ.,Marraffini,LA.,Bao,G.,&Zhang,F.Nat Biotechnol doi:10.1038/nbt.2647(2013);
Genome engineering using the CRISPR-Cas9 system.Ran,FA.,Hsu,PD.,Wright,J.,Agarwala,V.,Scott,DA.,Zhang,F.Nature Protocols Nov;8(ll):2281-308(2013-B);
Genome-Scale CRISPR-Cas9 Knockout Screening in Human Cells.Shalem,O.,Sanjana,NE.,Hartenian,E.,Shi,X.,Scott,DA.,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench,JG.,Zhang,F.Science Dec 12.(2013).[印刷版之前的电子版];
Crystal structure of cas9in complex with guide RNA and targetDNA.Nishimasu,H.,Ran,FA.,Hsu,PD.,Konermann,S.,Shehata,SF,Dohmae,N.,Ishitani,R.,Zhang,F.,Nureki,O.Cell Feb 27,156(5):935-49(2014);
Genome-wide binding of the CRISPR endonuclease Cas9 in mammaliancells.Wu X.,Scott DA.,Kriz AJ.,Chiu AC.,Hsu PD.,Dadon DB.,Cheng AW.,TrevinoAE.,Konermann S.,Chen S.,Jaenisch R.,Zhang F.,Sharp PA.Nat Biotechnol.Apr20.doi:10.1038/nbt.2889(2014);
CRISPR-Cas9 Knockin Mice for Genome Editing and CancerModeling.Platt RJ,Chen S,Zhou Y,Yim MJ,Swiech L,Kempton HR,Dahlman JE,ParnasO,Eisenhaure TM,Jovanovic M,Graham DB,Jhunjhunwala S,Heidenreich M,Xavier RJ,Langer R,Anderson DG,Hacohen N,Regev A,Feng G,Sharp PA,Zhang F.Cell 159(2):440-455DOT 10.1016/j.cell.2014.09.014(2014);
Development and Applications of CRISPR-Cas9 for Genome Engineering,Hsu PD,Lander ES,Zhang F.,Cell.Jun 5;157(6):1262-78(2014)。
Genetic screens in human cells using the CRISPR/Cas9 system,Wang T,Wei JJ,Sabatini DM,Lander ES.,Science.January 3;343(6166):80-84.doi:10.1126/science.1246981(2014);
Rational design of highly active sgRNAs for CRISPR-Cas9-mediatedgene inactivation,Doench JG,Hartenian E,Graham DB,Tothova Z,Hegde M,Smith I,Sullender M,Ebert BL,Xavier RJ,Root DE.,(published online 3 September 2014)Nat Biotechnol.Dec;32(12):1262-7(2014);
In vivo interrogation of gene function in the mammalian brain usingCRISPR-Cas9,Swiech L,Heidenreich M,Banerjee A,Habib N,Li Y,Trombetta J,Sur M,Zhang F.,(published online 19 October 2014)Nat Biotechnol.Jan;33(l):102-6(2015);
Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex,Konermann S,Brigham MD,Trevino AE,Joung J,Abudayyeh OO,BarcenaC,Hsu PD,Habib N,Gootenberg JS,Nishimasu H,Nureki O,Zhang F.,Nature.Jan 29;517(7536):583-8(2015)。
A split-Cas9 architecture for inducible genome editing andtranscription modulation,Zetsche B,Volz SE,Zhang F.,(published online02February 2015)Nat Biotechnol.Feb;33(2):139-42(2015);
Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth andMetastasis,Chen S,Sanjana NE,Zheng K,Shalem O,Lee K,Shi X,Scott DA,Song J,PanJQ,Weissleder R,Lee H,Zhang F,Sharp PA.Cell 160,1246-1260,March 12,2015(在小鼠中多重筛选),以及
In vivo genome editing using Staphylococcus aureus Cas9,Ran FA,CongL,Yan WX,Scott DA,Gootenberg JS,Kriz AJ,Zetsche B,Shalem O,Wu X,Makarova KS,Koonin EV,Sharp PA,Zhang F.,(published online 01April 2015),Nature.Apr 9;520(7546):186-91(2015)。
Shalem等人,“High-throughput functional genomics using CRISPR-Cas9,”Nature Reviews Genetics 16,299-311(2015年5月)。
Parnas等人,“A Genome-wide CRISPR Screen in Primary Immune Cells toDissect Regulatory Networks,”Cell 162,675-686(2015年7月30日)。
Ramanan等人,CRISPR/Cas9 cleavage of viral DNA efficientlysuppresses hepatitis B virus,”Scientific Reports 5:10833.doi:10.1038/srepl0833(2015年6月2日)
Zetsche等人(2015),“Cpfl is a single RNA-guided endonuclease of aclass 2 CRISPR-Cas system,”Cell 163,759-771(Oct.22,2015)doi:10.1016/jcell.2015.09.038.电子版2015年9月25日
Shmakov等人(2015),“Discovery and Functional Characterization ofDiverse Class 2 CRISPR-Cas Systems,”Molecular Cell 60,385-397(2015年11月5日)doi:10.1016/j.molcel.2015.10.008.电子版2015年10月22日
Dahlman等人,“Orthogonal gene control with a catalytically activeCas9 nuclease,”Nature Biotechnology 33,1159-1161(2015年11月)
Gao等人,“Engineered Cpf1 Enzymes with Altered PAM Specificities,”bioRxiv 091611;doi:http://dx.doi.org/10.1101/091611电子版2016年11月4日
Smargon等人(2017),“Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 and Csx28,”Molecular Cell 65,618-630(2017年2月16日)doi:10.1016/j.molcel.2016.12.023.电子版2017年1月5日。
以引用方式并入本文的每个文献可在本发明的实践中加以考虑,并在下面进行简要讨论:
Cong等人工程改造了II型CRISPR-Cas系统以便在基于嗜热链球菌Cas9以及化脓链球菌Cas9的真核细胞中使用,并证明Cas9核酸酶可以被短RNA定向从而诱导人和小鼠细胞中DNA的精确裂解。他们的研究进一步表明,Cas9转化为切口酶可用于以最小的诱变活性促进真核细胞中同源指导的修复。此外,他们的研究证明可以将多个指导序列编码到单个CRISPR阵列中,以便能够同时编辑哺乳动物基因组中内源性基因座位点中的几个,从而证明了RNA指导的核酸酶技术的易编程性和广泛适用性。利用RNA来编程细胞中的序列特异性DNA裂解的能力定义了一类新的基因组工程化工具。这些研究进一步表明,其他CRISPR基因座可能被移植到哺乳动物细胞中,并且还可以介导哺乳动物基因组的裂解。重要的是,可以设想,可以进一步改善CRISPR-Cas系统的几个方面,以提高其效率和多功能性。
Jiang等人使用与双RNA复合的成簇的规律间隔的短回文重复序列(CRISPR)相关的Cas9核酸内切酶以在肺炎链球菌和大肠杆菌的基因组中引入精确突变。该方法依赖于在靶基因组位点进行双RNA:Cas9定向裂解以杀死未突变的细胞,避免了对选择性标记物或反选择系统的需求。该研究报告了通过改变短CRISPR RNA(crRNA)的序列,对双RNA:Cas9特异性进行重新编程,以使编辑模板上的单核苷酸和多核苷酸发生变化。该研究表明,同时使用两个crRNA可以进行多重诱变。此外,当与重组工程结合使用该方法时,在肺炎链球菌中,使用该方法回收的细胞中几乎100%含有所需突变;而在大肠杆菌中,回收的细胞中65%含有所述突变。
Wang等人(2013)使用CRISPR/Cas系统一步生成在多个基因中携带突变的小鼠,这些小鼠在传统上是通过在胚胎干细胞中进行顺序重组并且/或者使具有单个突变的小鼠进行耗时的相互杂交而以多个步骤生成的。CRISPR/Cas系统将大大加快功能冗余基因和上位基因相互作用的体内研究。
Ran等人(2013-A)描述了一种将Cas9切口酶突变体与成对的引导RNA结合以引入靶双链断裂的方法。这解决了来自微生物CRISPR-Cas系统的Cas9核酸酶通过引导序列靶向特定基因座的问题,所述引导序列可以耐受与DNA靶标的某些错配并由此促进不期望的脱靶诱变。由于基因组中的各个切口均以高保真度进行修复,因此双链断裂需要同时经由适当偏移的引导RNA产生缺口,并且切口扩大了靶标裂解的特异性识别的的碱基的数目。作者证明,使用配对切口可以将细胞系中的脱靶活性降低50至1,500倍,并促进小鼠受精卵中的基因敲除,而不牺牲中靶裂解效率。这种通用策略可实现要求高特异性的多种基因组编辑应用。
Hsu等人(2013)表征了人细胞中的SpCas9靶向特异性,以告知靶位点的选择并避免脱靶效应。该研究评估了293T和293FT细胞中>100个预测的基因组脱靶基因座处的>700个向导RNA变体和SpCas9诱导的插入缺失突变水平。作者认为,SpCas9以序列依赖性方式耐受不同位置的向导RNA和靶DNA之间的错配,对错配的数目、位置和分布敏感。作者进一步表明,SpCas9介导的裂解不受DNA甲基化的影响,并且可以对SpCas9和sgRNA的剂量进行滴定以使脱靶修饰降至最低。此外,为促进哺乳动物基因组工程化应用,作者报告了提供一种基于网络的软件工具,以指导靶序列的选择和验证以及脱靶分析。
Ran等人(2013-B)描述了一种用于在哺乳动物细胞中经由非同源末端接合(NHEJ)或同源指导的修复(HDR)进行Cas9介导的基因组编辑的成套工具,以及用于下游功能研究的修饰细胞系的生成。为了使脱靶裂解降至最低,作者进一步描述了一种使用Cas9切口酶突变体与成对的向导RNA的双切口策略。作者提供的方案通过实验得出了用于选择靶位点、评估裂解效率以及分析脱靶活性的指南。研究表明,从靶标设计开始,基因修饰可在短短的1-2周内完成,而修饰的克隆细胞系可在2-3周内获得。
Shalem等人描述了一种用以在全基因组规模下询问基因功能的新方法。他们的研究表明,递送具有64,751个独特的向导序列的以18,080个基因为靶标的基因组规模的CRISPR-Cas9敲除(GeCKO)文库使得可以在人细胞中进行阴性和阳性选择筛选。首先,作者展示了使用GeCKO文库来鉴定癌症和多能干细胞中细胞存活所必需的基因。接着,在黑素瘤模型中,作者筛选了其丢失与对威罗菲尼(一种抑制突变蛋白激酶BRAF的治疗剂)的抗性有关的基因。他们的研究表明,排名最高的候选物包括先前验证的基因NF1和MED12,以及新命中物NF2、CUL3、TADA2B和TADA1。作者观察到靶向相同基因的独立向导RNA之间的高度一致性和较高的命中确认率,从而证明了用Cas9进行基因组规模筛选的前景。
Nishimasu等人报告了2.5A°分辨率下的与sgRNA及其靶DNA复合的化脓链球菌Cas9的晶体结构。该结构揭示了由靶标识别叶和核酸酶叶组成的双叶架构,其将sgRNA:DNA异源双链体容纳在它们界面处带正电荷的凹槽中。识别叶对于结合sgRNA和DNA是必不可少的,而核酸酶叶则含有HNH和RuvC核酸酶结构域,这些结构域分别正确定位以分别裂解靶DNA的互补链和非互补链。核酸酶叶还含有一个羧基末端结构域,该结构域负责与原间隔区邻近基序(PAM)相互作用。这种高分辨率的结构和伴随的功能分析揭示了Cas9靶向RNA向导的DNA的分子机制,从而为合理设计新的通用基因组编辑技术铺平了道路。
Wu等人绘制了在小鼠胚胎干细胞(mESC)中载有单向导RNA(sgRNA)的化脓链球菌的催化失活Cas9(dCas9)的全基因组结合位点。作者表明,所测试的四个sgRNA中的每一个都将dCas9靶向到数十至数千个基因组位点之间,所述基因组位点通常以sgRNA中的5个核苷酸种子区和NGG原间隔区邻近基序(PAM)为特征。染色质无法进入会降低dCas9与具有匹配种子序列的其他位点的结合;因此70%的脱靶位点与基因相关。作者表明,在用催化活性Cas9转染的mESC中,对295个dCas9结合位点进行靶向测序,结果仅发现一个高于背景水平突变的位点。作者提出了Cas9结合和裂解的两种状态模型,其中种子匹配触发了结合,但裂解需要与靶DNA进行广泛配对。
Doench等人创建了一个sgRNA池,将一组六个内源性小鼠和三个内源性人基因的所有可能靶位点拼接在一起,并通过抗体染色和流式细胞术定量评定了它们产生靶基因无效等位基因的能力。作者表明,PAM的优化改善了活性,还提供了用于设计sgRNA的在线工具。
Ran等人(2015)涉及SaCas9及其编辑基因组的能力,并且证明了无法从生化分析进行外推。Shalem等人(2015)描述了使用催化失活Cas9(dCas9)融合物来合成阻遏(CRISPRi)或激活(CRISPRa)表达的方法(其显示了使用Cas9进行基因组规模筛选(包括排列和合并筛选)的进展)、灭活基因组座的敲除方法和调控转录活性的策略。
末端编辑
Shalem等人(2015)描述了使用催化失活Cas9(dCas9)融合物来合成阻遏(CRISPRi)或激活(CRISPRa)表达的方法(其显示了使用Cas9进行基因组规模筛选(包括排列和合并筛选)的进展)、灭活基因组座的敲除方法和调控转录活性的策略。
Xu等人(2015)评定了在基于CRISPR的筛选中有助于单向导RNA(sgRNA)效率的DNA序列特征。作者探索了裂解位点处CRISPR/Cas9敲除的效率和核苷酸偏好。作者还发现,CRISPRi/a的序列偏好与CRISPR/Cas9敲除的序列偏好有很大不同。
Parnas等人(2015)将全基因组合并CRISPR-Cas9文库引入树突状细胞(DC)中,以鉴定控制细菌脂多糖(LPS)的肿瘤坏死因子(Tnf)诱导的基因。确定了Tlr4信号传导的已知调节子和先前未知的候选物,并将它们分为三个功能模块,这些模块显著影响对LPS的规范响应。
Ramanan等人(2015)展示了感染细胞中病毒附加型DNA(cccDNA)的裂解。HBV基因组以所谓的共价闭合环状DNA(cccDNA)的3.2kb双链附加型DNA物质的形式存在于感染肝细胞核中,所述共价闭合环状DNA是HBV生命周期中的关键组成部分,其复制不受当前疗法的抑制。作者表明,特异性靶向HBV的高度保守区的sgRNA强烈阻遏病毒复制和cccDNA耗尽。
Nishimasu等人(2015)报告了与单向导RNA(sgRNA)及其双链DNA靶标复合的SaCas9的晶体结构,其含有5'-TTGAAT-3'PAM和5'-TTGGGT-3'PAM。SaCas9与SpCas9的结构比较突出了结构保守性和差异性,解释了它们独特的PAM特异性和直系同源sgRNA识别。
此外,“Dimeric CRISPR RNA-guided FokI nucleases for highly specificgenome editing”,Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter,JenniferA.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin,Martin J.Aryee,J.KeithJoung Nature Biotechnology 32(6):569-77(2014),涉及二聚体RNA向导FokI核酸酶,所述核酸酶识别扩展序列并且可以在人细胞中高效编辑内源性基因。另外,提及题为“DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERYCOMPONENTS”的PCT申请PCT/US14/70057,代理人参考号47627.99.2060和BI-2013/107(要求以下一项或多项或全部美国临时专利申请的优先权:2014年9月24日提交的62/054,490;2014年6月10日提交的62/010,441;以及各自在2013年12月12日提交的61/915,118、61/915,215和61/915,148)(“Particle Delivery PCT”),其以引用方式并入本文,涉及一种制备含有sgRNA和Cas9蛋白的颗粒的方法,所述方法包括将包含sgRNA和Cas9蛋白(和任选的HDR模板)的混合物与包含以下物质或基本上由以下物质组成的混合物掺混:表面活性剂、磷脂、可生物降解的聚合物、脂蛋白和醇;以及由所述过程产生的颗粒。例如,其中将Cas9蛋白和sgRNA在合适的温度(例如15-30C,例如20-25C,例如室温)下以合适的(例如3:1至1:3或2:1至1:2或1:1)摩尔比在合适的时间(例如15-45,诸如30分钟)内,有利地在无菌的无核酸酶的缓冲液(例如1X PBS)中混合。单独地,将诸如或包含以下物质的颗粒组分溶解于醇(优选Ci-6烷基醇,诸如甲醇、乙醇、异丙醇,例如100%乙醇)中:表面活性剂,例如阳离子脂质,例如1,2-二油酰基-3-三甲基铵-丙烷(DOTAP);磷脂,例如二豆蔻酰基磷脂酰胆碱(DMPC);可生物降解的聚合物(诸如乙二醇聚合物或PEG);和脂蛋白,诸如低密度脂蛋白,例如胆固醇。将两种溶液混合在一起以形成含有Cas9-sgRNA复合物的颗粒。因此,可以将sgRNA与Cas9蛋白预先复合,然后将整个复合物配制在颗粒中。可以采用不同摩尔比的已知促进核酸向细胞内递送的不同组分(例如,1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)、1,2-二肉豆蔻酰基-sn-丙三氧基-3-磷酸胆碱(DMPC)、聚乙二醇(PEG)和胆固醇)来制备制剂,例如DOTAP:DMPC:PEG:胆固醇摩尔比可为DOTAP 100,DMPC 0,PEG 0,胆固醇0;或DOTAP 90,DMPC 0,PEG 10,胆固醇0;或DOTAP 90,DMPC 0,PEG 5,胆固醇5。DOTAP 100,DMPC 0,PEG 0,胆固醇0。因此,该申请包括将sgRNA、Cas9蛋白和形成颗粒的组分掺混;以及所述掺混所产生的颗粒。本发明的各方面可以涉及颗粒;例如使用类似于Particle Delivery PCT的方法,例如通过以下方式形成的颗粒:将包含如本发明中的crRNA和/或Cas13b的混合物与形成(例如)如Particle Delivery PCT中的颗粒的组分掺混,以由所述掺混形成一个或多个颗粒(或者,当然,如本发明中的涉及crRNA和/或Cas13b的其他颗粒)。
将在以下实施例中进一步说明本发明,这些实施例仅出于说明的目的给出,而无意以任何方式限制本发明。
实施例
实施例1:Cas13b直系同源物的鉴定
下表1中所示的Cas13b蛋白有利地来自密码子优化以在哺乳动物细胞中表达。制备每个Cas13b直系同源物与mCherry和任选地NLS或NES的融合构建体,并将其克隆在哺乳动物表达载体中。将各种Cas13b直系同源物转染到HEK293T细胞中,并基于mCherry表达评估细胞定位。确定融合至C端和N端NES、融合至C端和N端NLS或无NES或NLS融合的不同Cas13b直系同源物的定位。NES融合有效地引起Cas13b蛋白的胞质定位。NLS融合有效地引起Cas13b蛋白的核定位。不定地,对于NLS融合,也可以观察到核仁定位。
本发明的表1 Cas13b效应蛋白是来自上表1或如上表1所示的这种蛋白质,或表1所示Cas13b效应蛋白,以及与之具有90、91、92、93、94、95、96、97、98、99或100同一性的蛋白质,例如在上述百分比内具有一个或多个变化的蛋白质(其中所述变化是保守取代基,包含所述保守取代基,基本由所述保守取代基组成或由所述保守取代基组成,其中保守取代可参考以下列表),或包含所述蛋白质,或基本上由所述蛋白质组成,或涉及所述蛋白质,或是有关于所述蛋白质:
或者,参照本领域有关保守取代的知识,例如French et al.“What is aConservative Substitution?”,J.Molecular Evolution,19(2):171-175(March 1983);Yampolsky et al.,“The Exchangeability of Amino Acids in Proteins,”Genetics170(4):1459-1472(Aug 2005),doi:10.1534/genetics.104.039107;Gemovic,“Feature-Based Classification of Amino Acid Substitutions outside Conserved FunctionalProtein Domains,”The Scientific World Journal,Volume 2013(2013),Article ID948617,10 pages dx.doi.org/10.1155/2013/948617。而且,本发明的表1 Cas13b效应蛋白是来自上表1或如上表1所列示的这种蛋白质,或表1所列示的生物体的Cas13b效应蛋白,包括本文讨论的突变、改变或融合,以及包括本文讨论的突变、改变或融合并且在考虑或不考虑此类突变、改变或融合的情况下与表1所示的具有90、91、92、93、94、95、96、97、98、99或100的同一性的蛋白质,或表1所列示的生物体的Cas13b效应蛋白,或包含所述蛋白质,或基本上由所述蛋白质组成,或涉及所述蛋白质,或是有关于所述蛋白质。此外,表1 Cas13b效应蛋白(可以包括本文讨论的突变、改变或融合和/或与表1所列示的具有90、91、92、93、94、95、96、97、98、99或100的同一性,表1所列示生物体的Cas13b效应蛋白)可以是如下所述的Cas13b效应蛋白:其与表1所列示的或者表1所列示的生物体的Cas13b效应蛋白具有至少85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100的同一性,并且与表1的蛋白质与表3的蛋白质之间所示的表3的C2c2蛋白具有相似性、同源性或同一性。另请参见图1、图2。
实施例2:Cas13b在真核细胞中的活性
使用针对Gluc的不同gRNA进行萤光素酶靶向测定。Cas13b直系同源物与NLS或NES融合,或者不与定位信号融合。确定了荧光素酶的标准化蛋白质表达,并与非靶向(NT)gRNA进行了比较。不同Cas13b直系同源物的结果在图11-15中提供。在图16中,使用相同的指南编译了来自最活跃直系同源物的复合数据。发现来自酿脓拟杆菌(Bacteroidespyogenes)、普雷沃菌属MA2016(Prevotella sp.MA2016)、鸭疫里默氏杆菌(Riemerellaanatipestifer)、咽喉卟啉单胞菌(Porphyromonas gulae)、牙龈卟啉单胞菌(Porphyromonas gingivalis)和卟啉单胞菌COT-052OH4946(Porphyromonas sp.COT-052OH4946)的Cas13b直系同源物在真核细胞中特别活跃。
实施例3:C2c2直系同源物
某些Cas13b直系同源物令人惊讶地类似于C2c2。图2提供了C2c2与Cas13b蛋白的树形比对。
以上C2c2种类的蛋白质序列在下表3中列出。
实施例3:Cas13b直系同源物的表征
确定了不同Cas13b直系同源物的PFS基序,如Smargon等人(2016)所述以及如图6所示。生成了安全缺失(非靶向间隔区的平均缺失以上>5σ)间隔区与屏幕中所有间隔区的比率的热图。对于某些直系同源物,在存在辅助蛋白csx27或csx28的情况下重复实验。结果如图7-10所示。以下PFS是针对不同的直系同源物得出:
实施例4:Cas13b直系同源物的附带活性
为了确定Cas13b直系同源物在真核细胞中的附带活性,在存在G-萤光素酶或C-萤光素酶报道基因构建体的情况下,在真核细胞中用靶标特异性向导进行了实验。结果在图17A-G中提供。对于不同的Cas13b直系同源物,可以有效地观察到体内附带活性。
实施例5:其他Cas13b直系同源物的鉴别
依赖于与CRISPR相关蛋白或CRISPR阵列本身的接近性,可以使用生物计算管道来鉴别其他Cas13b直系同源物。一种示例性方法可以包括(从NCBI数据库)下载所有原核基因组,在这些基因组上运行算法以鉴别CRISPR阵列,将聚集在所鉴别阵列的10kb内的蛋白质存储为推定的CRISPR系统,并进一步基于不存在大小超过700个氨基酸的蛋白质来选择候选系统。其他选择标准可以基于存在大小在900-1800个氨基酸之间的仅一个效应蛋白,以及基于功能和相容性考虑。
实施例6:
高效且精确的核酸编辑就治疗遗传性疾病而言具有广阔的前景,尤其是在RNA水平上,在RNA水平上可以挽救疾病相关转录物,以产生功能性蛋白质产品。VI型CRISPR-Cas系统含有可编程的单效应RNA指导的RNA酶Cas13。在此,我们概述了VI型系统的多样性,以工程化能够进行稳健敲低的Cas13直系同源物,并且通过使用催化失活的Cas13(dCas13)来将腺苷脱氨酶活性指导至哺乳动物细胞中的转录物来证实RNA编辑。通过将ADAR2脱氨酶结构域与dCas13融合并工程化指导RNA以产生最佳的RNA双链体底物,我们实现了从特定的单个腺苷到肌苷(在翻译过程中被读出为鸟苷)的靶向编辑,其效率常规地在20%-40%的范围内,并且最高达89%。该系统(称之为用于可编程A到I替换的RNA编辑(REPAIR))可以进一步工程化以实现高特异性。工程化变体REPAIRv2显示出的特异性增加大于170倍,同时保持了稳健的中靶A到I编辑。我们使用REPAIRv2编辑含有已知病原性突变的全长转录物,并且产生适合于包装在腺相关病毒(AAV)载体中的功能性截短形式。REPAIR提出了一个有前途的RNA编辑平台,所述平台在研究、治疗学和生物技术方面具有广泛的适用性。精确的核酸编辑技术对于研究细胞功能和作为新型疗法非常有价值。尽管当前的编辑工具(如Cas9核酸酶)可以实现对基因组基因座的可编程修改,但是由于插入或缺失或需要供体模板进行精确编辑,编辑常常是异质的。碱基编辑器(如dCas9-APOBEC融合物)允许进行编辑而不会产生双链断裂,但由于胞苷脱氨酶活性的性质(编辑靶标窗口中的任何胞苷),因此可能缺乏精确性。此外,对原型间隔区相邻基序(PAM)的要求限制了可能的编辑位点的数量。在此,我们描述了精确且灵活的RNA碱基编辑工具的开发,所述工具使用了来自VI型原核生物成簇规律间隔短回文重复序列(CRISPR)自适应免疫系统的RNA指导的RNA靶向Cas13酶。
精确的核酸编辑技术对于研究细胞功能和作为新型疗法非常有价值。当前基于可编程核酸酶(如原核生物成簇规律间隔短回文重复序列(CRISPR)相关的核酸酶Cas9(1-4)或Cpf1(5))的编辑工具已广泛采用于介导靶向DNA裂解,进而通过非同源末端连接(NHEJ)驱动靶向的基因破坏或通过模板依赖性同源直接修复(HDR)驱动精确的基因编辑(6)。NHEJ利用在分裂细胞和有丝分裂后细胞中均活跃的宿主机器,并且通过产生可导致蛋白质编码基因移码的插入或缺失(indel)突变的混合物,提供高效的基因破坏。相比之下,HDR由表达主要限于复制细胞的宿主机器介导。因此,有丝分裂后细胞中基因编辑能力的开发仍然是主要挑战。最近,DNA碱基编辑器(如使用催化失活的Cas9(dCas9)将胞苷脱氨酶活性靶向至特定的基因组靶标,以在靶标窗口内实现胞嘧啶向胸腺嘧啶的转化)允许在不产生DNA双链断裂的情况下进行编辑并显著降低indel的形成(7,8)。然而,由于Cas9在编辑位点处需要原型间隔区相邻基序(PAM),因此DNA碱基编辑器的靶向范围受到限制(9)。在此,我们描述了使用VI型CRISPR相关RNA指导的RNA酶Cas13开发精确且灵活的RNA碱基编辑技术(10-13)。
Cas13酶具有两个介导精确RNA裂解的结合高级真核生物和原核生物核苷酸(HEPN)的内切RNA酶结构域(10,11)。迄今为止,已鉴定出三个Cas13蛋白家族:Cas13a(以前称为C2c2)、Cas13bCas13b和Cas13c(12,13)。我们最近报道,Cas13a酶可以适合用作核酸检测的工具(14)以及哺乳动物和植物细胞的RNA敲低和转录物追踪(15)的工具。Cas13酶的RNA指导性质使其成为RNA结合和干扰应用的有吸引力工具。
作用于酶的RNA(ADAR)家族上的腺苷脱氨酶通过将腺苷水解脱氨成肌苷来介导转录物的内源性编辑,肌苷是在翻译和剪接中与鸟苷功能上等同的核碱基(16)。有两种功能性人ADAR直系同源物ADAR1和ADAR2,它们由N末端双链RNA结合结构域和C末端催化脱氨结构域组成。ADAR1和ADAR2的内源性靶位点含有实质性的双链同一性,并且催化结构域需要双链体区域才能在体外和体内进行高效编辑(17,18)。尽管ADAR蛋白具有优选的可能限制靶向的潜在灵活性的编辑基序,但过度活跃的突变体(如ADAR(E488Q)(19))放松了序列限制,并且提高腺苷到肌苷的编辑率。ADAR优先使RNA双链体中与胞苷碱基相对的腺苷脱氨(20),从而为精确的碱基编辑提供了有希望的机会。尽管以前的方法已经通过RNA指导工程化靶向ADAR融合物(21-24),但是尚未报道这些方法的特异性,并且它们各自的靶向机制依赖于RNA-RNA杂交,而没有可能增强靶标识别和严格性的蛋白质伴侣的帮助。
在此,我们测定了整个Cas13酶家族在哺乳动物细胞中的RNA敲低活性,并且将来自普氏菌属物种(Prevotella sp.)P5-125的Cas13bCas13b直系同源物(PspCas13b)鉴定为对于哺乳动物细胞应用而言最高且特异性的。然后,我们将ADAR2脱氨酶结构域(ADARDD)与催化失活的Cas13bPspCas13b融合,并且证实了用于对报告基因和内源性转录物以及疾病相关突变的可编程A到I(G)替换(REPAIR)的RNA编辑。最后,我们采用合理的诱变方案来改善Cas13bdCas13b-ADAR2DD融合物的特异性,以产生特异性增加超过170倍的REPAIRv2。
方法
细菌构建体的设计和克隆
在Lac启动子的控制下,将经哺乳动物密码子优化的Cas13bCas13b构建体克隆到氯霉素抗性pACYC184载体中。然后,在pJ23119启动子的控制下,将由BsaI限制性位点隔开的两个相应的正向重复(DR)序列插入Cas13bCas13b的下游。最后,使用T4PNK(New EnglandBiolabs)将用于靶向间隔区的寡核苷酸磷酸化、退火、并且使用T7连接酶(Enzymatics)连接到BsaI消化的载体中,以生成靶向Cas13bCas13b载体。
细菌PFS筛选
通过使用NEB Gibson Assembly(New England Biolabs)插入含有带有2个5'随机核苷酸和4个3'随机核苷酸的Cas13bCas13b靶标的PCR产物来克隆用于PFS筛选的氨苄青霉素抗性质粒,所述5'随机核苷酸和所述3'随机核苷酸由在紧邻氨苄青霉素抗性基因bla起始密码子下游的靶标位点隔开。然后将100ng氨苄青霉素抗性靶质粒与65-100ng氯霉素抗性Cas13bCas13b细菌靶向质粒一起电穿孔到Endura电感受态细胞中。将质粒添加到细胞中、在冰上孵育15分钟、使用制造商的方案进行电穿孔,并且然后将950uL的回收培养基添加到细胞中,之后在37C下生长一小时。将生长物铺板到氯霉素和氨苄青霉素双重选择板上。将生长物的连续稀释液用于估计cfu/ng DNA。铺板后16小时,将细胞从板上刮下,并且使用Qiagen Plasmid Plus Maxi试剂盒(Qiagen)收获存活的质粒DNA。通过PCR扩增存活的Cas13bCas13b靶序列及其侧翼区域,并且使用Illumina NextSeq进行测序。为了评估PFS偏好,提取原始文库中含有随机核苷酸的位置,并使用自定义python脚本提取存在于两个生物复制品中的仅相对于载体条件消耗的序列。然后,将Cas13bCas13b条件下的PFS丰度与仅载体对照之比的-log2用于计算优选的基序。具体地,将所有-log2(样品/载体)消耗比率高于特定阈值的序列都用于生成序列基序的weblogo(weblogo.berkeley.edu)。表9中列出了用于针对每个Cas13bCas13b直系同源物生成weblogo的特定消耗比值。
用于RNA干扰的哺乳动物构建体的设计和克隆
为了产生用于在哺乳动物细胞中测试Cas13直向同源物的载体,对经哺乳动物密码子优化的Cas13a、Cas13bCas13b和Cas13c基因进行PCR扩增,并且在EF1α启动子的控制下,将其金门(golden-gate)克隆到含有双重NLS序列和C末端msfGFP的哺乳动物表达载体中。为了进一步优化,在EF1α启动子的控制下,将Cas13直向同源物金门克隆到含有不同C末端定位标签的目的载体中。
通过扩增高斯(Gaussia)和海萤(Cypridinia)荧光素酶编码DNA、EF1α和CMV启动子的PCR和使用NEB Gibson Assembly(New England Biolabs)的组件来克隆双重荧光素酶报告基因。
为了表达Cas13a、Cas13bCas13b或Cas13c直向同源物的哺乳动物指导RNA,合成了具有金门受体位点的相应正向重复序列,并且通过限制性消化克隆将其在U6表达下克隆。然后通过金门克隆将各个指导序列克隆到每个直系同源物的相应表达主链中。
针对Cas13干预特异性的合并错配文库的克隆
通过PCR产生合并错配文库靶位点。将含有G-荧光素酶中的在靶标内每个位置处含有94%正确碱基和2%每个错误碱基的混合物的半简并靶序列的寡核苷酸用作一个引物,并且将对应于G-荧光素酶的非靶区的寡核苷酸用作PCR反应中的第二引物。然后使用NEB Gibson assembly(New England Biolabs)将错配文库靶标克隆到双重荧光素酶报道子中以代替野生型G-荧光素酶。
用于RNA编辑的哺乳动物构建体的设计和克隆
通过在HEPN结构域的催化位点处的两个组氨酸到丙氨酸突变(H133A/H1058A)使PspCas13b失去催化活性(dPspCas13b)。合成人ADAR1和ADAR2的脱氨酶结构域,并且对其进行PCR扩增以gibson克隆到pcDNA-CMV载体主链中,并且通过GS或GSGGGGS接头在C末端处与Cas13bdPspCas13b融合。对于我们测试不同接头的实验,我们在Cas13bdPspCas13b与ADAR2dd之间克隆了以下其他接头:GGGGSGGGGSGGGGS、EAAAK、GGSGGSGGSGGSGGSGGS和SGSETPGTSESATPES(XTEN)。通过将适当的突变体gibson克隆到dPspCas13b-GSGGGGS主链中来产生特异性突变体。
通过在用于敲低实验的荧光素酶报告载体中产生W85X突变(TGG>TAG),产生了用于测量RNA编辑活性的荧光素酶报告载体。该报告载体表达功能性Gluc以作为归一化对照,但是由于添加了提前终止位点,所以所述功能性Gluc是缺陷型Gluc。为了测试ADAR编辑基序偏好,我们克隆了在Cluc的第85位密码子(XAX)处腺苷周围的每个可能基序。
为了测试REPAIR的PFS偏好,我们克隆了合并的质粒文库,所述文库在靶标区域和腺苷编辑位点的上游含有6碱基对简并的PFS序列。由Integrated DNA Technologies(IDT)以超聚物形式合成所述文库,并且通过退火引物并将DNA聚合酶I的Klenow片段(NewEngland Biolabs)填充在序列中使其成为双链。然后将该含有简并序列的dsDNA片段gibson克隆到消化的报告载体中,并且然后将其沉淀并纯化。然后将克隆的文库电穿孔到Endura感受态大肠杆菌细胞(Lucigen)中并且铺板在245mm x 245mm方形生物测定板(Nunc)上。16小时后,收获菌落并且使用无内毒素的MACHEREY-NAGEL midiprep试剂盒进行中量制备。通过下一代测序验证克隆的文库。
为了克隆疾病相关突变以测试REPAIR活性,选择了与ClinVar中定义的疾病发病机理相关的34G>A突变,并且在CMV启动子下将这些突变周围的200bp区域金门克隆在mScarlett与EGFP之间。选择AVPR2和FANCC中的两个另外的G>A突变用于在EF1α表达下Gibson克隆克隆整个基因序列。
为了表达REPAIR的哺乳动物指导RNA,合成了具有金门受体位点的Cas13bPspCas13b正向重复序列,并且通过限制性消化克隆将其在U6表达下克隆。然后通过金门克隆将各个指导序列克隆到该表达主链中。
哺乳动物细胞培养
在HEK293FT品系(美国典型培养物保藏中心(ATCC))中进行了哺乳动物细胞培养实验,将所述品系在具有高葡萄糖、丙酮酸钠和GlutaMAX(Thermo Fisher Scientific)、额外补充有1x青霉素-链霉素(Thermo Fisher Scientific)和10%胎牛血清(VWR Seradigm)的杜氏改良型伊格尔培养基(Dulbecco’s Modified Eagle Medium)中生长。将细胞保持在低于80%的汇合度。
除非另有说明,否则所有转染均用Lipofectamine 2000(Thermo FisherScientific)在涂覆有聚-D-赖氨酸(BD Biocoat)的96孔板中进行。在转染前十六个小时将细胞以大约20,000个细胞/孔铺板,以确保在转染时达到90%汇合度。对于板上的每个孔,将转染质粒与Opti-MEM I还原血清培养基(Thermo Fisher)合并至总共25μl。分别地,将24.5ul的Opti-MEM与0.5ul的Lipofectamine 2000合并。然后将质粒和Lipofectamine溶液合并,并且孵育5分钟,然后将其吸移到细胞上。
RNA敲低哺乳动物细胞测定
为了评估在具有报吿基因构建体的哺乳动物细胞中的RNA靶向,将150ng的Cas13构建体与300ng的指导表达质粒和12.5ng的敲低报吿基因构建体共转染。转染后48小时,从细胞中移取出含有分泌型荧光素酶的培养基,将其在PBS中以1:5稀释,并且使用注射方案在平板读取器(Biotek Synergy Neo2)上使用BioLux海萤和Biolux高斯荧光素酶测定试剂盒(New England Biolabs)测量活性。进行的所有重复都是生物学重复。
为了靶向内源性基因,将150ng的Cas13构建体与300ng的指导表达质粒共转染。转染后48小时,将细胞裂解并且收获RNA并使用先前描述的Cells-to-Ct试剂盒(ThermoFisher Scientific)的[引用方案]修改版进行逆转录。使用针对用于KRAS转录物的TaqManqPCR探针(Thermo Fisher Scientific)、GAPDH对照探针(Thermo Fisher Scientific)和Fast Advanced预混合物(Thermo Fisher Scientific),通过qPCR测量cDNA表达。在LightCycler 480仪器II(Roche)上读取qPCR反应,以384孔格式进行四次5ul技术重复。
使用错配靶标的合并文库评估RNA特异性
使用接种在6孔板中的HEK293FT细胞测试了Cas13干扰错配靶标文库的能力。使用2400ng Cas13载体、4800ng指导序列和240ng错配的靶标文库转染约70%汇合细胞。转染后48小时,收获细胞并且使用QIAshredder(Qiagen)和Qiagen RNeasy微型试剂盒提取RNA。使用qScript Flex cDNA合成试剂盒(Quantabio)和Gluc特异性RT引物,按照制造商的基因特异性引发方案逆转录1ug提取RNA。然后扩增cDNA并在Illumina NextSeq上测序。
通过对每个序列的读数进行计数来分析测序,并且通过确定log2(-读取计数比)值来计算消耗得分,其中读取计数比是靶向指导序列条件与非靶向指导序列条件的读取计数之比。该得分值表示序列上Cas13的活性水平,较高的值表示更强的消耗,并且因此表示较高的Cas13裂解活性。确定了单错配和双错配序列的单独分布,并将其绘制为热图,所述热图具有针对每个错配身份的消耗得分。对于双错配序列,绘制了给定位置处所有可能的双错配的平均值。
通过RNA测序对哺乳动物细胞中Cas13的转录组范围分析
为了测量转录组范围内特异性,共转染了150ng Cas13构建体、300ng指导表达质粒和15ng敲低报告基因构建体;对于shRNA条件,共转染了300ng shRNA靶向质粒、15ng敲低报告基因构建体和150ng EF1α驱动的mCherry(以平衡报告基因负载)。转染后48小时,用RNeasy Plus微型试剂盒(Qiagen)纯化RNA,使用NEBNext Poly(A)mRNA磁性分离模块(NewEngland Biolabs)选择mRNA,并且将其制备用于用针对Illumina的NEBNext Ultra RNA文库制备试剂盒(New England Biolabs)测序。然后在NextSeq(Illumina)上对RNA测序文库进行测序。
为了分析转录组范围的测序数据,使用Bowtie和RSEM版本1.2.31利用默认参数参考序列GRCh38组件比对读取[引用RSEM:在用或不用参考基因组的情况下从RNA测序数据进行准确的转录定量]。将转录物表达定量为log2(TPM+1),过滤基因以使log2(TPM+1)>2.5。为了选择差异表达的基因,仅考虑差异变化>2或<.75的基因。在三个靶向性重复品与非靶向性重复品上学生T检验评价差异表达的统计显著性,并且通过Benjamini-Hochberg程序针对<0.01%的错误发现率进行过滤。
哺乳动物细胞转染中的ADAR RNA编辑
为了评估哺乳动物细胞中的REPAIR活性,我们转染了150ng REPAIR载体、300ng指导表达质粒和40ng RNA编辑报告基因。48小时后,从细胞中收获RNA并且使用先前描述的方法[引用JJ]和基因特异性逆转录引物进行反转录。然后使用NEBNext高保真度2X PCR预混合物对提取的cDNA进行两轮PCR,以添加Illumina衔接子和样品条形码。然后将文库在Illumina NextSeq或MiSeq上进行下一代测序。然后在测序窗口内评价所有腺苷处的RNA编辑率。
在荧光素酶报道基因被靶向用于RNA编辑的实验中,我们在RNA收获之前还收获了具有分泌型荧光素酶的培养基。在这种情况下,因为校正后的Cluc可能处于较低水平,因此我们没有稀释培养基。我们使用注射方案在平板读取器(Biotek Synergy Neo2)上使用BioLux海萤和Biolux高斯荧光素酶测定试剂盒(New England Biolabs)测量了荧光素酶活性。进行的所有重复都是生物学重复。
PFS结合哺乳动物筛选
为了确定PFS对编辑效率的贡献,将625ng PFS靶标文库、4.7ug指导序列和2.35ugREPAIR共转染在铺板在225cm2烧瓶中的HEK293FT细胞上。将质粒与33ul PLUS试剂(ThermoFisher Scientific)混合,用Opti-MEM调节至533ul,孵育5分钟,再与30ul Lipofectamine2000和500ul Opti-MEM合并,再孵育5分钟,然后将其吸移到细胞上。转染后48小时,使用RNeasy Plus微型试剂盒(Qiagen)收获RNA,使用基因特异性引物用qScript Flex(Quantabio)逆转录,并使用NEBNext高保真度2X PCR预混合物(New England Biolabs)以两轮PCR进行扩增以添加Illumina衔接子和样品条形码。将所述文库在Illumina NextSeq上测序,并且将靶腺苷处的RNA编辑率与PFS身份进行映射。为了增加覆盖度,PFS在计算上被折叠为4个核苷酸。计算每个PFS的REPAIR编辑率,在减去相应PFS的非靶向率的情况下将其在生物学复制品上求平均值。
全转录组测序以评价ADAR编辑特异性
为了分析整个转录组的脱靶RNA编辑位点,我们使用RNeasy Plus微型制备试剂盒(Qiagen)从转染后48小时的细胞中收获总RNA。然后使用NEBNext Poly(A)mRNA磁性分离模块(NEB)富集mRNA级分,并且然后将此RNA制备用于使用针对Illumina的NEBNext UltraRNA文库制备试剂盒(NEB)测序。然后将文库在Illumina NextSeq上进行测序并加载成使得每个样品读取至少500万次。
靶向和转录组实验的RNA编辑分析
为了分析转录组范围的RNA编辑RNA测序数据,将序列文件随机降采样至500万个读取。使用添加了Gluc和Cluc序列的参考序列GRCh38组件生成了索引,并且使用Bowtie/RSEM版本1.3.0对读取进行比对和定量。然后对比对BAM进行分类并且使用REDitools[引用]用以下参数分析RNA编辑位点:-t 8 -e -d -1 -U[AG或TC]-p -u -m20 -T6-0 -W -v 1-n 0.0。在未转染或EGFP转染的条件下发现的任何显著的编辑均视为SNP或转染伪像,并将其从脱靶分析中过滤掉。如果Fisher的精确检验得出的p值小于0.5,并且3个生物学重复中至少有2个坚定出编辑位点,则认为脱靶是显著的。
为了分析每个脱靶的预测变异效果,使用作为UCSC基因组浏览器工具套件的一部分的变异注释整合器(https://genome.ucsc.edu/cgi-bin/hgVai)使用SIFT和PolyPhen-2注释对脱靶编辑位点列表进行了分析。要声明脱靶基因是否是致癌基因,请参阅COSMIC癌症体细胞突变目录(cancer.sanger.ac.uk)中的致癌注释数据库。
为了分析REPAIR构建体是否干扰RNA水平,将从RSEM分析输出的每百万转录物(TPM)值用于表达计数,并且通过取log2(TPM+1)转化为对数空间。为了找到差异调控的基因,在三个靶向性指导序列重复品与三个非靶向性指导序列重复品上进行了学生t检验。仅对log2(TPM+1)值大于2.5的基因进行统计分析,并且只有倍数变化大于2或小于0.8的基因才被认为是差异调控的。如果基因具有小于0.01的错误发现率,则报告所述基因。
结果
对哺乳动物细胞中Cas13家族成员的综合表征
我们先前开发了LwaCas13a用于哺乳动物敲低应用,但是它需要msfGFP稳定结构域才能有效敲低,尽管特异性很高,但敲低效率并没有始终低于50%(15),我们试图通过表征一组遗传多样的Cas13家族成员以评估其在哺乳动物细胞中的RNA敲低活性(图31A)来鉴定出一种更稳健的RNA靶向CRISPR系统。我们将21个Cas13a、15个Cas13bCas13b和7个Cas13c哺乳动物密码子优化的直系同源物(表6)克隆到具有N末端和C末端核输出信号(NES)序列和C末端msfGFP的表达载体中,以增强蛋白质稳定性。为了测定在哺乳动物细胞中的干预,我们设计了双重报告基因构建体,所述构建体在单独的启动子下表达直系同源的高斯(Gluc)和海萤(Cluc)荧光素酶,从而使一种荧光素酶充当Cas13干预活性的量度,而另一种则可以作为内部对照。对于每个直系同源物,我们使用源自氨苄青霉素干预测定的Cas13bCas13b PFS基序(图55;表7;补充注解1)和来自Cas13a活性先前报道(10)的3'H PFS设计了与PFS相容的指导RNA。
我们用Casl3表达、指导RNA和报告质粒转染了HEK293FT细胞,并在48小时后定量了靶标Gluc的水平。对每个Cas13直系同源物测试两个指导RNA揭示了一系列的活性水平,包括在两个指导RNA上相对于最近表征的LwaCas13a具有相似或增加干预的五个Cas13bCas13b直系同源物。我们选择了这五个Cas13bCas13b直系同源物,以及前两个Cas13a直系同源物,以进行进一步的工程化。
接下来,我们测试了在没有msfGFP的情况下,Cas13介导的Gluc的敲低,以选择不需要稳定结构域来实现稳健活性的直向同源物。我们假设,除了msfGFP之外,Cas13活性还可能受到亚细胞定位的影响,如先前针对LwaCas13a优化所报道的(15)。因此,我们测试了在C末端与六个不带msfGFP的不同定位标签之一融合的七个选择的Cas13直向同源物的干预活性。使用荧光素酶报告基因测定,我们发现在C末端与HIV Rev基因NES融合的Cas13bPspCas13b和Cas13bPguCas13b和在C末端与MAPK NES融合的Cas13bRanCas13b具有最高水平的干预活性(图56A)。为了进一步区分热点直系同源物的活性水平,我们将三个优化的Cas13b构建体与最佳的LwaCas13a-msfGFP融合物和shRNA针对其使用位置匹配的指导序列敲低KRAS转录物的能力进行比较(图56B)。我们观察到Cas13bPspCas13b的最高水平的干预(平均敲低率为62.9%),并且因此选择了该Cas13bPspCas13b来与LwaCas13a进行进一步比较。
为了更严格地定义Cas13bPspCas13b和LwaCas13a的活性水平,我们设计了沿Gluc和Clue平铺的位置匹配指导序列,并且使用我们的荧光素酶报告基因测定测定了它们的活性。我们分别测试了靶向Gluc和Cluc的93个和20个位置匹配指导序列,发现相对于LwaCas13a,Cas13bPspCas13b具有始终增加的敲低水平(Cas13bPspCas13b的平均值为92.3%,而LwaCas13a的敲低率为40.1%)(图49C、49D)。
Cas13哺乳动物干预活性的特异性
为了表征Cas13bPspCas13b和LwaCas13a的干预特异性,我们设计了在整个靶标序列以及三个侧翼5'和3'碱基对中含有单错配和双错配的荧光素酶靶标的质粒文库(图56C)。我们用LwaCas13a或Cas13bPspCas13b、靶向未修饰靶序列的固定指导RNA以及对应于适当系统的错配靶标文库转染了HEK293FT细胞。然后,我们对未裂解的转录物进行了靶向RNA测序,以定量错配靶序列的消耗。我们发现LwaCas13a和Cas13bPspCas13b具有相对不耐受单错配的中心区域,所述中心区域对于Cas13bPspCas13b靶标从碱基对12-26扩展并且对于LwaCas13a靶标从碱基对13-24扩展(图56D)。与单突变相比,双错配的耐受性甚至更低,在较大的窗口中观察到的敲低活性很小,在各自的靶标中,所述窗口对于PspCas13b从碱基对12-29扩展并且对于LwaCas13a从碱基对8-27扩展(图56E)。另外,由于在靶序列的5'和3'端侧翼的三个核苷酸中含有错配,我们可以评估PFS对Cas13敲低活性的限制。测序表明,几乎所有PFS组合都可实现稳健的敲低,这表明对于测试的任一种酶,可能都不存在PFS对哺乳动物细胞中的干预的限制。这些结果表明Cas13a和Cas13bCas13b显示出相似的序列约束和对错配的敏感性。
接下来,我们表征了Cas13bPspCas13b和LwaCas13a在转录组的mRNA部分上的干预特异性。我们进行了转录组范围的mRNA测序,以检测显著差异表达的基因。LwaCas13a和Cas13bPspCas13b展示出稳健的Gluc敲低(图49E、49F),并且与显示出数百个脱靶位的位置匹配的shRNA相比具有高度特异性(图49G)。
Cas13-ADAR融合物实现靶向RNA编辑
鉴于Cas13bPspCas13b在哺乳动物细胞中实现了一致、稳健且特异性的mRNA敲低,我们设想可以其适合作为RNA结合平台来募集ADAR的脱氨酶结构域(ADARdd)以进行可编程RNA编辑。为了工程化缺乏核酸酶活性的Cas13bPspCas13b(Cas13bdPspCas13b,据此称之为Cas13bdCas13b),我们在HEPN结构域中突变了保守的催化残基,并且观察到荧光素酶RNA敲低活性的丧失(图57A)。我们假设Cas13bdCas13b-ADARDD融合物可以通过指导RNA募集以靶向腺苷,其中杂交的RNA产生ADAR活性所需的双链体底物(图50A)。为了提高靶腺苷脱氨率,我们在最初的RNA编辑设计中引入了另外两个修饰:我们引入了与靶腺苷相对的错配胞苷(先前据报道此举增加了脱氨频率),并将Cas13bdCas13b与含有超活化突变以增强催化活性的人ADAR1或ADAR2的脱氨酶结构域(ADAR1DD(E1008Q)(25)或ADAR2DD(E488Q)(19))融合。
为测试Cas13bdCas13b-ADARDD的活性,我们通过引入无义突变(W85X(UGG->UAG))在Clue上产生RNA编辑报告基因,所述突变可通过A->I编辑而功能上修复为野生型密码子并且然后检测为Clue荧光的恢复。我们在靶腺苷上均匀平铺其中间隔区长度为30、50、70或84个核苷酸的指导序列,以确定最佳的指导序列布置和设计(图50C)。我们发现Cas13bdCas13b-ADAR1DD需要更长的指导序列来修复Clue报告基因,而Cas13bdCas13b-ADAR2DD在测试的所有指导序列长度下均是功能性的(图50C)。我们还发现,活性过度的E488Q突变提高了编辑效率(图57B),这是因为具有野生型ADAR2DD的荧光素酶恢复减少。根据活性的该展示,我们选择Cas13bdCas13b-ADAR2DD(E488Q)用于进一步表征,并且将此方法指定为可编程A到I替换的RNA编辑版本1(REPAIRv1)。
为了验证荧光素酶活性的恢复是由于真正的编辑事件引起的,我们直接通过逆转录和靶向的下一代测序测量了直接经受REPAIRv1的Clue转录物的编辑。我们测试了在靶位点周围的30nt和50nt的间隔区,并且发现两种指导长度均导致预期的A到I编辑,而50nt的间隔区实现了更高的编辑百分比(图50D、50E,图57C)。我们还观察到,50nt间隔区增加了在非靶向腺苷处的编辑倾向,这可能是由于双链体RNA区域的增加(图50E、图57C)。
接下来我们靶向内源性基因PPIB。我们设计了平铺PPIB的50nt的间隔区,并且发现我们可以最高达28%的编辑效率编辑PPIB转录物(图57D)。为了测试REPAIR是否可以进一步优化,我们修改了Cas13bdCas13b与ADAR2DD(E488Q)之间的接头(图57E,表8),并且发现接头选择适度影响了荧光素酶活性的恢复。
定义用于RNA编辑的序列参数
鉴于我们可以在测试位点实现精确的RNA编辑,我们想要表征针对转录组中任何RNA靶标进行系统编程的序列限制。序列限制可能源自Cas13bdCas13b靶向限制(如PFS)或ADAR序列首选项(26)。为了研究对REPAIRv1的PFS限制,我们设计了质粒文库,其在Clue转录物上的靶位点的5'端带有一系列四个随机核苷酸(图51A)。我们靶向UAG或AAC基序内的中心腺苷并且发现对于这两个基序,所有PFS均展示出可检测水平的RNA编辑,其中大多数PFS在靶位点具有大于50%的编辑(图51B)。接下来,我们试图确定REPAIRV1中的ADAR2DD是否具有紧邻靶碱基侧翼的任何序列限制,如先前已关于ADAR2DD报道的(26)。我们测试了直接在靶腺苷周围的5'和3'侧翼核苷酸的每种可能组合(图51C),并且发现REPAIRv1能够编辑所有基序(图51D)。最后,我们分析了与间隔区序列中与靶标A相对的碱基的身份是否影响编辑效率,并且发现A-C错配具有最高的荧光素酶恢复率,其中A-G、A-U和A-A具有大大降低的REPAIRvl活性(图57F)。
使用REPAIRvl对与疾病相关的人类突变的校正
为证明REPAIRvl系统对于哺乳动物细胞中的RNA编辑的广泛适用性,我们针对两种与疾病相关突变设计了REPAIRvl指导序列:X连锁性肾原性糖尿病中的878G>A(AVPR2W293X)和范科尼贫血中的1517G>A(FANCC W506X)。我们将针对携带这些突变的基因的cDNA的表达构建体转染到HEK293FT细胞中,并且测试REPAIRv1是否可以校正突变。使用含有50nt间隔区的指导RNA,我们能够实现AVPR2的35%校正和FANCC的23%校正。(图52A-52D)。然后,我们测试了REPAIRv1校正34种疾病相关G>A突变的能力(表9),并且发现我们能够在33个位点处实现显著编辑,编辑效率最高达28%(图52E)。我们选择的突变只是ClinVar数据库中病原性G到A突变的一部分(5,739个),所述数据库还包括另外11,943个G到A变异(图52F和图58)。因为没有序列限制,所以REPAIRv1能够潜在地编辑所有这些疾病相关突变,尤其是考虑到无论靶基序如何,我们都观察到了显著编辑(图51C和图52G)。
将REPAIRv1系统递送至患病细胞为用于治疗性用途的先决条件,并且因此我们争取设计可包装到治疗相关病毒载体诸如腺相关病毒(AAV)载体的REPAIRv1构建体。AAV载体具有4.7kb包装限度,它不能容纳大尺寸的dCas13b-ADARDD(4473bp)连同启动子和表达调控元件。为了减小尺寸,对于RNA编辑活性我们测试了许多与ADAR2DD(E488Q)融合的dCas13的N端和C端截短。我们发现所有测试的C端截短仍有功能并且能够恢复荧光酶信号(图59),并且最大的截短C端Δ984-1090(融合蛋白4的最尺寸,152bp)足够小以适应AAV载体的包装限度。
REPAIRv1的转录物组宽的特异性
尽管具有PspCas13b的RNA敲低具有高特异性,在荧光素酶拼贴实验中,在指导物:靶标双链体内观察到脱靶腺苷编辑(图50E)。为了查看这是否是普遍存在的现象,我们拼贴内源性转录物KRAS并且测量靶腺苷附近的脱靶编辑程度(图53A)。我们发现对于KRAS而言,虽然中靶编辑率为23%,但在靶位点周围存在许多位点,其也具有可检测的A至G编辑(图53B)。
由于在指导物:靶标双链体内观察到的脱靶编辑,所以我们通过对所有mRNA进行RNA测序来评价所有可能的转录物组脱靶。RNA测序揭示存在大量A至G脱靶事件,其中在靶向条件下具有1,732个脱靶并且在非靶向条件下具有925个脱靶,其中828个脱靶重叠(图53C、53D)。在跨越转录物组的所有编辑位点中,中靶编辑位点具有最高编辑率,其中89%A转化为G。
假定Cas13靶向的高特异性,我们有理由认为脱靶可由ADAR引起。先前已描述了两个RNA指导的ADAR系统(图60A)。第一个系统利用ADAR2DD与结合至RNA发夹的小病毒蛋白的融合物(22)。具有双链发夹的指导物RNA指导ADAR2DD编辑指导RNA中编码的位点(23)。第二种设计利用全长ADAR2(ADAR2)和具有ADAR2的双链RNA结合结构域(dsRBD)识别的发夹的指导RNA(21,24)。我们分析了这两种系统与REPAIRvl相比的编辑效率并且发现BoxB-ADAR2和ADAR2系统分别证实了63%和36%编辑率,相比之下REPAIRvl实现了89%编辑率(图60B-60E)。另外,BoxB和ADAR2系统在靶向指导条件下分别形成2018和174个观察到的脱靶,相比之下在REPAIRvl靶向指导条件下形成1,229个脱靶。值得注意的是,使用两种基于ADAR2DD的系统(REPAIRvl和BoxB)的所有条件均在其脱靶中显示高重叠百分比,而ADAR2系统具有一组显著不同的脱靶(图60F)。靶向条件与非靶向条件之间以及REPAIRvl条件与BoxB条件之间的脱靶重叠表明ADAR2DD独立于dCasl3靶向而驱动脱靶(图60F)。
通过合理蛋白质工程化获得的REPAIRvl的改进的特异性
为了改进REPAIR的特异性,我们采用ADAR2DD(E488Q)的结构指导的蛋白质工程化。由于脱靶的独立于指导物的性质,我们假设不稳定ADAR2DD(E488Q)-RNA结合将选择性减少脱靶编辑,但由于从ADAR2DD(E488Q)的dCas13b黏连到靶部位的局部浓度增加而保持中靶编辑。我们在ADAR2DD(E488Q)背景下诱变处理先前确定接触靶标RNA的双链体区域的ADAR2DD(E488Q)残基(图54A)(18)。为了评定效率和特异性,我们在假设非靶向条件下检测到的背景荧光素酶恢复将指示更广泛脱靶活性的情况下使用靶向和非靶向指导物测试了17种单一突变体。我们发现在所选残基处的突变对靶向和非靶向指导物的荧光素酶活性具有显著影响(图54A、54B、图61A)。大部分突变体显著改善靶向指导物的荧光素酶活性或者增加靶向指导物与非靶向指导物的活性比率,我们将该比率称为特异性评分(图54A、54B)。我们选择这些突变体(图54B)中的一个子集用于通过下一代测序进行转录物组宽的特异性分析。正如预期,由转录物组宽的测序测量的脱靶与对于突变体的特异性评分相关(图61B)。我们发现除了ADAR2DD(E488Q/R455E),所有测序的REPAIRvl突变体都可以有效地编辑报道基因转录物(图54C),其中许多突变体显示脱靶数目减少(图61C、62)。我们进一步探索特异性突变体的脱靶的周围基序,并且发现REPAIRvl和大部分工程化突变体表现出对齐编辑的强3’G偏好,这与表征的ADAR2基序一致(图63A)(26)。我们选择突变体ADAR2DD(E488Q/T375G)进行未来的实验,因为它在四种突变体中具有最高的编辑百分比和最低数量的转录物组宽的脱靶并且将其称为REPAIRv2。与REPAIRvl相比,REPAIRv2表现出特异性增加,其中转录物组脱靶从1732个减少至10个(图54D)。在Clue的靶向腺苷周围的区域中,REPAIRv2具有减少的脱靶编辑,在测序痕迹图中可见(图54E)。在源自下一代测序的基序中,REPAIRvl呈现针对3’G的强偏好,但对所有基序均显示脱靶编辑(图63B);相比之下,REPAIRv2仅编辑最强脱靶基序(图63C)。编辑在转录物上的分布严重错位,其中高度编辑的基因具有超过60个编辑(图64A、64B),而REPAIRv2仅多次编辑一个转录物(EEF1A1)(图64D-64F)。据预测REPAIRvl脱靶产生许多变体,包括1000个错义突变(图64C),其中有93个致癌事件(图64D)。相比之下,REPAIRv2仅具有6个错义突变(图64E),这些错义突变不具有致癌结果(图64F)。预测的脱靶效应的此减小区分了REPAIRv2与其他RNA编辑方法。
我们将REPAIRv2靶向内源性基因以测试特异性增强突变是否减少靶标转录物中的附近编辑同时保持高效率中靶编辑。对于靶向KRAS或PPIB的指导物,我们发现REPAIRv2不具有可检测的脱靶编辑,与REPAIRvl不同,并且可分别有效编辑27.1%和13%的中靶腺苷(图54F、54G)。此特异性延伸至额外靶位点,包括在REPAIRvl的非靶向条件下证实高水平背景的区域,诸如其他KRAS或PPIB靶位点(图65)。总之,REPAIRv2消除了编辑的腺苷周围的双链体区域中的脱靶并且显示显著增强的转录物组宽的特异性。
结论
我们已在此表明RNA-指导的RNA-靶向的VI-B型效应物Casl3b能够进行高度有效和特异性RNA敲低,为用于询问必需基因和非编码RNA以及将细胞过程控制在转录物水平下的改进工具提供基础。无催化活性的Cas13b(dCas13b)保留可编程的RNA结合能力,我们在此通过将dCas13b融合至腺苷脱氨酶ADAR2以实现精确A至I编辑来支持此能力,我们将此系统称为REPAIRvl(可编程A至I置换的RNA编辑版本1)。对该系统进行进一步工程化产生REPAIRv2,这是相对于当前编辑平台具有相当或增加的活性和显著提高的特异性的方法。
尽管Cas13b表现出高保真度,但是使用dCas13b-ADAR2DD融合物的初始结果显示了数以千计的脱靶。为了解决这个问题,我们采用合理的诱变策略来改变接触RNA双链体的ADAR2DD残基,从而识别当融合至dCas13b时能够精确、有效且高特异性编辑的变体ADAR2DD(E488Q/T375G)。使用此变体的编辑效率相当于或好于使用两种当前可用系统BOXB-ADARDD或ADAR2编辑实现的效率。此外,REPAIRv2系统在完整转录物组种仅形成10个可观察的脱靶,至少比两种替代性编辑技术好一个数量级。
REPAIR系统与其他核酸编辑工具相比提供了许多优点。首先,可以通过将胞啶置于所需腺苷对面的指导物延伸部内以形成对于ADAR编辑活性而言理想的有利A-C错配来在指导物中编辑精确靶位点。其次,Casl3不具有靶向序列限制,诸如PFS或PAM,并且也不具有靶腺苷周围的基序偏好,从而允许转录物组中的任何腺苷被REPAIR系统潜在靶向。然而,我们注意到,DNA碱基编辑者可以靶向有义链或反义链,而REPAIR系统局限于转录的序列,从而限制我们可以靶向的可能编辑位点的总数目。然而,由于使用REPAIR靶向的更柔性性质,此系统可以影响到的ClinVar内的编辑(图52C)比Cas9-DNA碱基编辑者更多。再次,REPAIR系统直接将靶腺苷脱氨基成肌苷并且不依赖于内源性修复途径,诸如碱基切割或错配修复,以生成所需编辑结果。因此,REPAIR应在不能支持其他形式的编辑的非分裂细胞中是可能的。第四,RNA编辑可为暂时的,从而允许对编辑结果进行时序控制的可能性。此特性将可能适用于治疗由细胞状态的瞬时变化造成的疾病,诸如局部炎症。
REPAIR系统为额外工程化提供了多个机会。Cas13b具有pre-crRNA加工活性(13),从而允许多重编辑多个变体,这些变体单独地不能改变疾病风险,但一起可具有加成作用和疾病改善可能。合理设计方法的延伸部分(诸如将有前景的突变组合)可进一步增加该系统的特异性和效率,而公正的筛选方法可以识别用于改进REPAIR活性和特异性的额外残基。
目前,通过REPAIR可实现的碱基转化局限于由腺苷生成肌苷;dCas13与其他催化性RNA编辑结构域的额外融合物诸如APOBEC可实现胞啶至尿苷的编辑。另外,ADAR的诱变可放松底物偏好以靶向胞啶,从而允许C->U编辑者探索由双链RNA底物要求赋予的特异性增强。DNA底物上腺苷至肌苷的编辑使用无催化活性的DNA-靶向CRISPR效应物诸如dCas9或dCpfl,通过形成DNA-RNA异源双链体靶标(27)或诱变ADAR结构域也是可能的。
REPAIR可应用于一系列其中A至I(A至G)编辑可逆转或减慢疾病进展的治疗适应症(图66)。首先,可以使用在疾病相关组织中靶向有原因的孟德尔遗传学G至A突变的REPAIR的表达来恢复有害突变并治疗疾病。例如,在大脑组织中经由AAV进行稳定REPAIR表达可用于矫正引起局灶性癫痫的GRIN2A错义突变c.2191G>A(Asp731Asn)(28)或引起早期发作阿尔兹海默病的APP错义突变c.2149G>A(Val717Ile)(29)。其次,REPAIR可用于通过改变参与疾病相关信号转导的蛋白质的功能来治疗疾病。例如,REPAIR编辑将允许重新编码激酶的靶标,即一些丝氨酸、苏氨酸和酪氨酸残基(图66)。在疾病相关蛋白中的这些残基的磷酸化影响了许多病症的疾病进展,这些病症包括阿尔兹海默病和多发性神经变性病状(30)。再次,REPAIR可用于改变表达的改善风险的G至A变体的序列以优先减小患者进入疾病状态的机会。最引人注目的情况是‘保护性’风险改善等位基因,其显著减小进入疾病状态的机会并且在一些情况下赋予额外健康益处。例如,REPAIR可用于在功能上模拟分别预防心血管疾病和银屑病性关节炎的PCSK9和IFIH1的A至G等位基因(31)。最后,REPAIR可用于在治疗上修改用于外显子调节疗法的剪接受体和供体位点。REPAIR可将AU改变成IU或将AA改变成AI,它们分别是共有5’剪接供体或3’剪接受体位点的功能等效物,从而形成新的剪接接合部。另外,REPAIR编辑可使共有3’剪接受体位点突变为AG->IG以促进相邻下游外显子的跳读,这是已收到用于治疗DMD的显著兴趣的治疗性策略。调节剪接位点在反义寡核苷酸具有一些成效的疾病中具有广泛应用,诸如用于调节SMN2剪接以用于治疗脊髓性肌萎缩(32)。
我们证实使用Cas13bPspCas13b酶作为RNA敲低和RNA编辑工具。用于可编程RNA结合的dCas13b平台具有许多应用,包括实况转录物成像、剪接修饰、靶向定位转录物、拉下RNA-结合蛋白以及表转录物组修饰。在此,我们使用dCas13形成REPAIR,将其添加到现有成套的核酸编辑技术。REPAIR提供了用于治疗遗传疾病或模拟保护性等位基因的新方法并且建立了作为用于修改遗传功能的有用工具的RNA编辑。
参考文献
1.P.D.Hsu,E.S.Lander,F.Zhang,Development and applications of CRISPR-Cas9 for genome engineering.Cell 157,1262-1278(2014).
2.A.C.Komor,A.H.Badran,D.R.Liu,CRISPR-Based Technologies for theManipulation of Eukaryotic Genomes.Cell 168,20-36(2017).
3.L.Cong et al.,Multiplex genome engineering using CRISPR/Cassystems.Science 339,819-823(2013).
4.P.Mali et al.,RNA-guided human genome engineering via Cas9.Science339,823-826(2013).
5.B.Zetsche et al.,Cpf1 is a single RNA-guided endonuclease of aclass 2 CRISPR-Cas system.Cell 163,759-771(2015).
6.H.Kim,J.S.Kim,A guide to genome engineering with programmablenucleases.Nat Rev Genet 15,321-334(2014).
7.A.C.Komor,Y.B.Kim,M.S.Packer,J.A.Zuris,D.R.Liu,Programmable editingof a target base in genomic DNA without double-stranded DNA cleavage.Nature533,420-424(2016).
8.K.Nishida et al.,Targeted nucleotide editing using hybridprokaryotic and vertebrate adaptive immune systems.Science 353,(2016).
9.Y.B.Kim et al.,Increasing the genome-targeting scope and precisionof base editing with engineered Cas9-cytidine deaminase fusions.NatBiotechnol 35,371-376(2017).
10.O.O.Abudayyeh et al.,C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector.Science 353,aaf5573(2016).
11.S.Shmakov et al.,Discovery and Functional Characterization ofDiverse Class 2 CRISPR-Cas Systems.Mol Cell 60,385-397(2015).
12.S.Shmakov et al.,Diversity and evolution of class 2 CRISPR-Cassystems.Nat Rev Microbiol 15,169-182(2017).
13.A.A.Smargon et al.,Cas13b Is a Type VI-B CRISPR-Associated RNA-Guided RNase Differentially Regulated by Accessory Proteins Csx27 andCsx28.Mol Cell 65,618-630 e617(2017).
14.J.S.Gootenberg et al.,Nucleic acid detection with CRISPR-Cas13a/C2c2.Science 356,438-442(2017).
15.O.O.Abudayyeh et al.,RNA targeting with CRISPR-Cas13a.Nature inpress,(2017).
16.K.Nishikura,Functions and regulation of RNA editing by ADARdeaminases.Annu Rev Biochem 79,321-349(2010).
17.B.L.Bass,H.Weintraub,An unwinding activity that covalentlymodifies its double-stranded RNA substrate.Cell 55,1089-1098(1988).
18.M.M.Matthews et al.,Structures of human ADAR2 bound to dsRNAreveal base-flipping mechanism and basis for site selectivity.Nat Struct MolBiol 23,426-433(2016).
19.A.Kuttan,B.L.Bass,Mechanistic insights into editing-sitespecificity of ADARs.Proc Natl Acad Sci USA 109,E3295-3304(2012).
20.S.K.Wong,S.Sato,D.W.Lazinski,Substrate recognition by ADAR1 andADAR2.RNA 7,846-858(2001).
21.M.Fukuda et al.,Construction of a guide-RNA for site-directed RNAmutagenesis utilising intracellular A-to-I RNA editing.Sci Rep 7,41478(2017).
22.M.F.Montiel-Gonzalez,I.Vallecillo-Viejo,G.A.Yudowski,J.J.Rosenthal,Correction of mutations within the cystic fibrosistransmembrane conductance regulator by site-directed RNA editing.Proc NatlAcad Sci U S A 110,18285-18290(2013).
23.M.F.Montiel-Gonzalez,I.C.Vallecillo-Viejo,J.J.Rosenthal,Anefficient system for selectively altering genetic information withinmRNAs.Nucleic Acids Res 44,e157(2016).
24.J.Wettengel,P.Reautschnig,S.Geisler,P.J.Kahle,T.Stafforst,Harnessing human ADAR2 for RNA repair-Recoding a PINK1 mutation rescuesmitophagy.Nucleic Acids Res 45,2797-2808(2017).
25.Y.Wang,J.Havel,P.A.Beal,A Phenotypic Screen for Functional Mutantsof Human Adenosine Deaminase Acting on RNA 1.ACS Chem Biol 10,2512-2519(2015).
26.K.A.Lehmann,B.L.Bass,Double-stranded RNA adenosine deaminases ADAR1 and ADAR2 have overlapping specificities.Biochemistry39,12875-12884(2000).
27.Y.Zheng,C.Lorenzo,P.A.Beal,DNA editing in DNA/RNA hybrids byadenosine deaminases that act on RNA.Nucleic Acids Res 45,3369-3377(2017).
28.K.Gao et al.,A de novo loss-of-function GRIN2A mutation associatedwith childhood focal epilepsy and acquired epileptic aphasia.PLoS One 12,e0170818(2017).
29.H.M.Lanoiselee et al.,APP,PSEN1,and PSEN2 mutations in early-onsetAlzheimer disease:A genetic screening study of familial and sporadiccases.PLoS Med 14,e1002270(2017).
30.C.Ballatore,V.M.Lee,J.Q.Trojanowski,Tau-mediated neurodegenerationin Alzheimer′s disease and related disorders.Nat Rev Neurosci 8,663-672(2007).
31.Y.Li et al.,Carriers of rare missense variants in IFIH1 areprotected from psoriasis.J Invest Dermatol 130,2768-2772(2010)
32.R.S.Finkel et al.,Treatment of infantile-onset spinal muscularatrophy with nusinersen:a phase 2,open-label,dose-escalation study.Lancet388,3017-3026(2016).
***
尽管本文已示出和描述了本发明的优选实施方案,但对于本领域技术人员来说将显而易见,此类实施方案仅作为实例提供。本领域技术人员现在将想到许多变化、改变和替换而不偏离本发明。应当理解的是,可以在实践本发明时采用在本文中描述的本发明的实施方案的各种替代方案。所意图的是,以下权利要求限定本发明的范围以及由此涵盖这些权利要求及其等同物范围内的方法和结构。
Claims (50)
1.一种非天然存在的或经工程化的组合物,其包含:
i)来自表1A的Cas13b效应蛋白,和
ii)crRNA,
其中所述crRNA包含a)引导序列,其能够杂交至靶RNA序列,和b)正向重复序列,
从而形成包含与杂交至所述靶RNA序列的所述引导序列复合的所述Cas13b效应蛋白的CRISPR复合物。
2.如权利要求1所述的非天然存在的或经工程化的组合物,其包含增强Cas13b效应蛋白活性的辅助蛋白。
3.如权利要求2所述的非天然存在的或经工程化的组合物,其中所述增强Cas13b效应蛋白活性的辅助蛋白是csx28蛋白。
4.如权利要求1所述的非天然存在的或经工程化的组合物,其包含阻遏Cas13b效应蛋白活性的辅助蛋白。
5.如权利要求4所述的非天然存在的或经工程化的组合物,其中所述阻遏Cas13b效应蛋白活性的辅助蛋白是csx27蛋白。
6.如权利要求1至5中任一项所述的非天然存在的或经工程化的组合物,其包含两种或多种crRNA。
7.如权利要求1所述的非天然存在的或经工程化的组合物,其中所述引导序列杂交至原核细胞中的靶RNA序列。
8.如权利要求1所述的非天然存在的或经工程化的组合物,其中所述引导序列杂交至真核细胞中的靶RNA序列。
9.如权利要求1所述的非天然存在的或经工程化的组合物,其中所述Cas13b效应蛋白包含一个或多个核定位信号(NLS)。
10.如权利要求1所述的非天然存在的或经工程化的组合物,其中所述Cas13b效应蛋白与一个或多个功能结构域缔合。
11.如权利要求10所述的非天然存在的或经工程化的组合物,其中所述功能结构域切割所述靶RNA序列。
12.如权利要求10所述的非天然存在的或经工程化的组合物,其中所述功能结构域修饰所述靶RNA序列的转录或翻译。
13.如权利要求1所述的组合物,其中所述Cas13b效应蛋白与一个或多个功能结构域缔合;和所述效应蛋白含有在HEPN结构域内的一种或多种突变,从而所述复合物可递送表观遗传修饰剂或转录或翻译激活或阻遏信号。
14.如权利要求2或4所述的非天然存在的或经工程化的组合物,其中所述Cas13b效应蛋白和所述辅助蛋白来自相同的生物体。
15.如权利要求2或4所述的非天然存在的或经工程化的组合物,其中所述Cas13b效应蛋白和所述辅助蛋白来自不同的生物体。
16.一种用于提供如权利要求1所述的组合物的Cas13b载体系统,其包含一种或多种载体,所述载体包含:
第一调控元件,其可操作地连接至编码来自表1A的Cas13b效应蛋白的核苷酸序列,和
第二调控元件,其可操作地连接至编码crRNA的核苷酸序列。
17.如权利要求16所述的载体系统,其还包含:可操作地连接至辅助蛋白的核苷酸序列的调控元件。
18.如权利要求16所述的载体系统,其中编码所述Cas13b效应蛋白的核苷酸序列经密码子优化以在真核细胞中表达。
19.如权利要求17所述的载体系统,其中编码所述Cas13b效应蛋白和所述辅助蛋白的核苷酸序列经密码子优化以在真核细胞中表达。
20.如权利要求16所述的载体系统,其被包含在单个载体中。
21.如权利要求16所述的载体系统,其中所述一种或多种载体包括病毒载体。
22.如权利要求16或20所述的载体系统,其中所述一种或多种载体包括一种或多种逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。
23.一种递送系统,其经配置以递送非天然存在的或经工程化的组合物的Cas13b效应蛋白和一种或多种核酸组分,所述递送系统包含:
i)来自表1A的Cas13b效应蛋白,和
ii)crRNA,
其中所述crRNA包含a)杂交至细胞中的靶RNA序列的引导序列,和b)正向重复序列,
其中所述Cas13b效应蛋白与所述crRNA形成复合物,
其中所述引导序列指导序列特异性结合至所述靶RNA序列,
从而形成包含与杂交至所述靶RNA序列的所述引导序列复合的所述Cas13b效应蛋白的CRISPR复合物。
24.如权利要求23所述的递送系统,其包含一种或多种载体或一种或多种多核苷酸分子,所述一种或多种载体或多核苷酸分子包含编码所述非天然存在的或经工程化的组合物的Cas13b效应蛋白和一种或多种核酸组分的一种或多种多核苷酸分子。
25.如权利要求23所述的递送系统,其包含递送媒介物,所述递送媒介物包括一种或多种脂质体、一种或多种颗粒、一种或多种外泌体、一种或多种微囊泡、基因枪或一种或多种病毒载体。
26.如权利要求1至15中任一项所述的非天然存在的或经工程化的组合物,如权利要求16至22所述的载体系统,或如权利要求23至25所述的递送系统,其用于治疗的治疗性方法。
27.一种修饰目标靶基因的表达的方法,所述方法包括使靶RNA与一种或多种非天然存在的或经工程化的组合物接触,所述非天然存在的或经工程化的组合物包含
i)来自表1A的Cas13b效应蛋白,和
ii)crRNA,
其中所述crRNA包含a)杂交至细胞中的靶RNA序列的引导序列,和b)正向重复序列,
其中所述Cas13b效应蛋白与所述crRNA形成复合物,
其中所述引导序列指导序列特异性结合至细胞中的所述靶RNA序列,
从而形成包含与杂交至所述靶RNA序列的所述引导序列复合的所述Cas13b效应蛋白的CRISPR复合物,
从而修饰了目标靶基因座的表达。
28.如权利要求27所述的方法,其还包括使所述靶RNA与增强Cas13b效应蛋白活性的辅助蛋白接触。
29.如权利要求28所述的方法,其中所述增强Cas13b效应蛋白活性的辅助蛋白是csx28蛋白。
30.如权利要求27所述的方法,其还包括使所述靶RNA与阻遏Cas13b效应蛋白活性的辅助蛋白接触。
31.如权利要求30所述的方法,其中所述阻遏Cas13b效应蛋白活性的辅助蛋白是csx27蛋白。
32.如权利要求27所述的方法,其中修饰所述靶基因的表达包括切割所述靶RNA。
33.如权利要求27所述的方法,其中修饰所述靶基因的表达包括增加或减少所述靶RNA的表达。
34.如权利要求27所述的方法,其中所述靶基因是在原核细胞中。
35.如权利要求27所述的方法,其中所述靶基因是在真核细胞中。
36.一种包含经修饰的目标靶标的细胞,其中所述目标靶标已经根据权利要求27至35中任一项所述的方法进行修饰。
37.如权利要求36所述的细胞,其中所述细胞是原核细胞。
38.如权利要求36所述的细胞,其中所述细胞是真核细胞。
39.根据权利要求36所述的细胞,其中所述目标靶标的修饰导致:
所述细胞包含至少一种基因产物的表达改变;
所述细胞包含至少一种基因产物的表达改变,其中所述至少一种基因产物的表达增加;或
所述细胞包含至少一种基因产物的表达改变,其中所述至少一种基因产物的表达减少。
40.根据权利要求38或39所述的真核细胞,其中所述细胞是哺乳动物细胞或人细胞。
41.一种包含根据权利要求38-39中任一项所述的细胞的细胞系或其后代。
42.一种多细胞生物体,其包含一种或多种根据权利要求38-39中任一项所述的细胞。
43.一种植物或动物模型,其包含一种或多种根据权利要求38-39中任一项所述的细胞。
44.一种基因产物,其来自如权利要求38-39中任一项所述的细胞或如权利要求41所述的细胞系或如权利要求42所述的生物体或如权利要求43所述的植物或动物模型。
45.如权利要求44所述的基因产物,其中表达的基因产物的量大于或小于来自不具有改变的表达的细胞的基因产物的量。
46.一种经分离的Cas13b效应蛋白,其来自表1A。
47.一种经分离的核酸,其编码如权利要求46所述的Cas13b效应蛋白。
48.根据权利要求47所述的经分离的核酸,其是DNA并且还包含编码crRNA的序列。
49.一种经分离的真核细胞,其包含根据权利要求47或48所述的核酸或如权利要求46所述的Cas13b。
50.一种非天然存在的或经工程化的组合物,其包含:
i)mRNA,其编码来自表1A的Cas13b效应蛋白,和
ii)crRNA,其中所述crRNA包含a)引导序列,其能够杂交至靶RNA序列,和b)正向重复序列。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762471710P | 2017-03-15 | 2017-03-15 | |
US62/471,710 | 2017-03-15 | ||
US201762566829P | 2017-10-02 | 2017-10-02 | |
US62/566,829 | 2017-10-02 | ||
PCT/US2018/022751 WO2018170333A1 (en) | 2017-03-15 | 2018-03-15 | Novel cas13b orthologues crispr enzymes and systems |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110959039A true CN110959039A (zh) | 2020-04-03 |
Family
ID=61874014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880033145.8A Pending CN110959039A (zh) | 2017-03-15 | 2018-03-15 | 新型cas13b直向同源物crispr酶和系统 |
Country Status (8)
Country | Link |
---|---|
US (2) | US11739308B2 (zh) |
EP (2) | EP3596207B1 (zh) |
JP (2) | JP2020511141A (zh) |
KR (2) | KR102185464B1 (zh) |
CN (1) | CN110959039A (zh) |
AU (3) | AU2018234825B2 (zh) |
CA (1) | CA3056236A1 (zh) |
WO (1) | WO2018170333A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112430586A (zh) * | 2020-11-16 | 2021-03-02 | 珠海舒桐医疗科技有限公司 | 一种VI-B型CRISPR/Cas13基因编辑系统及其应用 |
CN113832180A (zh) * | 2021-08-03 | 2021-12-24 | 华中农业大学 | CRISPR/Cas13b介导的棉花RNA转录调控方法 |
WO2022253351A1 (zh) * | 2021-06-04 | 2022-12-08 | 中国科学院脑科学与智能技术卓越创新中心 | 新型Cas13蛋白及其筛选方法和应用 |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017070605A1 (en) * | 2015-10-22 | 2017-04-27 | The Broad Institute Inc. | Type vi-b crispr enzymes and systems |
US11174515B2 (en) | 2017-03-15 | 2021-11-16 | The Broad Institute, Inc. | CRISPR effector system based diagnostics |
US11104937B2 (en) | 2017-03-15 | 2021-08-31 | The Broad Institute, Inc. | CRISPR effector system based diagnostics |
EP3596207B1 (en) | 2017-03-15 | 2023-12-20 | The Broad Institute, Inc. | Novel cas13b orthologues crispr enzymes and systems |
US11963966B2 (en) | 2017-03-31 | 2024-04-23 | Dana-Farber Cancer Institute, Inc. | Compositions and methods for treating ovarian tumors |
JP2020516285A (ja) * | 2017-04-12 | 2020-06-11 | ザ・ブロード・インスティテュート・インコーポレイテッド | 新規vi型crisprオルソログ及び系 |
WO2018204777A2 (en) | 2017-05-05 | 2018-11-08 | The Broad Institute, Inc. | Methods for identification and modification of lncrna associated with target genotypes and phenotypes |
EP3638218A4 (en) | 2017-06-14 | 2021-06-09 | The Broad Institute, Inc. | COMPOSITIONS AND METHOD OF TARGETING COMPLEMENTING COMPONENT 3 FOR INHIBITION OF TUMOR GROWTH |
KR20200031618A (ko) * | 2017-06-26 | 2020-03-24 | 더 브로드 인스티튜트, 인코퍼레이티드 | 표적화된 핵산 편집을 위한 crispr/cas-아데닌 데아미나아제 기반 조성물, 시스템 및 방법 |
CN111511388A (zh) * | 2017-09-21 | 2020-08-07 | 博德研究所 | 用于靶向核酸编辑的系统、方法和组合物 |
EP3692145A4 (en) * | 2017-10-04 | 2021-11-24 | The Broad Institute, Inc. | NUCLEIC ACID TARGETED EDITING SYSTEMS, METHODS AND COMPOSITIONS |
EP3701042A4 (en) * | 2017-10-23 | 2021-08-11 | The Broad Institute, Inc. | SYSTEMS, PROCEDURES AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITING |
WO2019084062A1 (en) * | 2017-10-23 | 2019-05-02 | The Broad Institute, Inc. | SYSTEMS, METHODS AND COMPOSITIONS FOR TARGETED NUCLEIC ACID EDITION |
WO2019113506A1 (en) | 2017-12-07 | 2019-06-13 | The Broad Institute, Inc. | Methods and compositions for multiplexing single cell and single nuclei sequencing |
CN112020562A (zh) * | 2018-01-29 | 2020-12-01 | 博德研究所 | 基于crispr效应系统的诊断 |
US11957695B2 (en) | 2018-04-26 | 2024-04-16 | The Broad Institute, Inc. | Methods and compositions targeting glucocorticoid signaling for modulating immune responses |
WO2019236998A1 (en) * | 2018-06-08 | 2019-12-12 | Locana, Inc. | Compositions and methods for the modulation of adaptive immunity |
JP2021526858A (ja) | 2018-06-08 | 2021-10-11 | ロックアネイビオ, インコーポレイテッド | Rna標的化融合タンパク質組成物および使用方法 |
JP2021528091A (ja) | 2018-06-26 | 2021-10-21 | ザ・ブロード・インスティテュート・インコーポレイテッド | Crisprダブルニッカーゼに基づく増幅の組成物、システム、及び方法 |
CN112543812A (zh) | 2018-06-26 | 2021-03-23 | 麻省理工学院 | 基于crispr效应系统的扩增方法、系统和诊断 |
WO2020028729A1 (en) | 2018-08-01 | 2020-02-06 | Mammoth Biosciences, Inc. | Programmable nuclease compositions and methods of use thereof |
CN115651927B (zh) * | 2018-10-12 | 2023-06-16 | 北京大学 | 编辑rna的方法和组合物 |
CN109957568B (zh) * | 2018-10-16 | 2024-02-02 | 广州普世利华科技有限公司 | 用于靶向HBB RNA的gRNA及基于C2c2的HBB突变检测方法、检测试剂盒 |
WO2020124050A1 (en) | 2018-12-13 | 2020-06-18 | The Broad Institute, Inc. | Tiled assays using crispr-cas based detection |
JP2022516515A (ja) * | 2018-12-31 | 2022-02-28 | リサーチ インスティチュート アット ネイションワイド チルドレンズ ホスピタル | Rna標的化crispr-cas13bを使用するdux4 rna発現停止 |
EP3931313A2 (en) | 2019-01-04 | 2022-01-05 | Mammoth Biosciences, Inc. | Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection |
US20220154258A1 (en) | 2019-03-14 | 2022-05-19 | The Broad Institute, Inc. | Crispr effector system based multiplex diagnostics |
US20220177863A1 (en) | 2019-03-18 | 2022-06-09 | The Broad Institute, Inc. | Type vii crispr proteins and systems |
WO2021011493A1 (en) * | 2019-07-12 | 2021-01-21 | Duke University | 3' utr crispr-dcas 13 engineering system and methods of using same |
WO2021046155A1 (en) | 2019-09-03 | 2021-03-11 | Voyager Therapeutics, Inc. | Vectorized editing of nucleic acids to correct overt mutations |
US20220333208A1 (en) | 2019-09-03 | 2022-10-20 | The Broad Institute, Inc. | Crispr effector system based multiplex cancer diagnostics |
CA3151563A1 (en) * | 2019-09-20 | 2021-03-25 | Feng Zhang | Novel type vi crispr enzymes and systems |
US11844800B2 (en) | 2019-10-30 | 2023-12-19 | Massachusetts Institute Of Technology | Methods and compositions for predicting and preventing relapse of acute lymphoblastic leukemia |
BR112022017070A2 (pt) * | 2020-02-28 | 2022-11-16 | Huigene Therapeutics Co Ltd | Sistema crispr-cas tipo vi-e e tipo vi-f e usos do mesmo |
EP4297801A1 (en) * | 2021-02-24 | 2024-01-03 | University of Massachusetts | Inducible single aav system and uses thereof |
IL308806A (en) | 2021-06-01 | 2024-01-01 | Arbor Biotechnologies Inc | Gene editing systems including nuclease crisper and their uses |
WO2023069628A2 (en) * | 2021-10-21 | 2023-04-27 | Nanothera Biosciences, Inc. | Compositions and methods for silencing kras |
WO2023081902A1 (en) * | 2021-11-05 | 2023-05-11 | University Of Florida Research Foundation, Inc. | Systems and methods for target polynucleotide detection with crispr/cas12a using activators |
WO2023220566A1 (en) * | 2022-05-09 | 2023-11-16 | The Regents Of The University Of California | Crispr-cas effector polypeptides and methods of use thereof |
GB202214015D0 (en) * | 2022-09-26 | 2022-11-09 | Univ Oxford Innovation Ltd | RNA editing vector |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160208243A1 (en) * | 2015-06-18 | 2016-07-21 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
CN106029880A (zh) * | 2013-12-12 | 2016-10-12 | 布罗德研究所有限公司 | 核苷酸重复障碍中CRISPR-Cas系统的组合物和使用方法 |
CN106061510A (zh) * | 2013-12-12 | 2016-10-26 | 布罗德研究所有限公司 | 用于基因组编辑的crispr‑cas系统和组合物的递送、用途和治疗应用 |
Family Cites Families (103)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
ATE141646T1 (de) | 1986-04-09 | 1996-09-15 | Genzyme Corp | Genetisch transformierte tiere, die ein gewünschtes protein in milch absondern |
US4873316A (en) | 1987-06-23 | 1989-10-10 | Biogen, Inc. | Isolation of exogenous recombinant proteins from the milk of transgenic mammals |
US5703055A (en) | 1989-03-21 | 1997-12-30 | Wisconsin Alumni Research Foundation | Generation of antibodies through lipid mediated DNA delivery |
US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
AU7979491A (en) | 1990-05-03 | 1991-11-27 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
GB9114259D0 (en) | 1991-07-02 | 1991-08-21 | Ici Plc | Plant derived enzyme and dna sequences |
HUT70467A (en) | 1992-07-27 | 1995-10-30 | Pioneer Hi Bred Int | An improved method of agrobactenium-mediated transformation of cultvred soyhean cells |
US5593972A (en) | 1993-01-26 | 1997-01-14 | The Wistar Institute | Genetic immunization |
US5789156A (en) | 1993-06-14 | 1998-08-04 | Basf Ag | Tetracycline-regulated transcriptional inhibitors |
US5814618A (en) | 1993-06-14 | 1998-09-29 | Basf Aktiengesellschaft | Methods for regulating gene expression |
US5543158A (en) | 1993-07-23 | 1996-08-06 | Massachusetts Institute Of Technology | Biodegradable injectable nanoparticles |
US6007845A (en) | 1994-07-22 | 1999-12-28 | Massachusetts Institute Of Technology | Nanoparticles and microparticles of non-linear hydrophilic-hydrophobic multiblock copolymers |
AU698739B2 (en) | 1995-06-06 | 1998-11-05 | Isis Pharmaceuticals, Inc. | Oligonucleotides having phosphorothioate linkages of high chiral purity |
US5985662A (en) | 1995-07-13 | 1999-11-16 | Isis Pharmaceuticals Inc. | Antisense inhibition of hepatitis B virus replication |
US5985309A (en) | 1996-05-24 | 1999-11-16 | Massachusetts Institute Of Technology | Preparation of particles for inhalation |
US5855913A (en) | 1997-01-16 | 1999-01-05 | Massachusetts Instite Of Technology | Particles incorporating surfactants for pulmonary drug delivery |
US5846946A (en) | 1996-06-14 | 1998-12-08 | Pasteur Merieux Serums Et Vaccins | Compositions and methods for administering Borrelia DNA |
GB9907461D0 (en) | 1999-03-31 | 1999-05-26 | King S College London | Neurite regeneration |
GB9720465D0 (en) | 1997-09-25 | 1997-11-26 | Oxford Biomedica Ltd | Dual-virus vectors |
DE69836092T2 (de) | 1997-10-24 | 2007-05-10 | Invitrogen Corp., Carlsbad | Rekombinatorisches klonieren unter verwendung von nukleinsaüren mit rekombinationsstellen |
US6750059B1 (en) | 1998-07-16 | 2004-06-15 | Whatman, Inc. | Archiving of vectors |
GB0024550D0 (zh) | 2000-10-06 | 2000-11-22 | Oxford Biomedica Ltd | |
US7776321B2 (en) | 2001-09-26 | 2010-08-17 | Mayo Foundation For Medical Education And Research | Mutable vaccines |
GB0125216D0 (en) | 2001-10-19 | 2001-12-12 | Univ Strathclyde | Dendrimers for use in targeted delivery |
AU2002353231B2 (en) | 2001-12-21 | 2008-10-16 | Oxford Biomedica (Uk) Limited | Method for producing a transgenic organism using a lentiviral expression vector such as EIAV |
EP2338478B1 (en) | 2002-06-28 | 2014-07-23 | Protiva Biotherapeutics Inc. | Method for producing liposomes |
US20040058886A1 (en) | 2002-08-08 | 2004-03-25 | Dharmacon, Inc. | Short interfering RNAs having a hairpin structure containing a non-nucleotide loop |
GB0220467D0 (en) | 2002-09-03 | 2002-10-09 | Oxford Biomedica Ltd | Composition |
US20040142476A1 (en) | 2002-11-01 | 2004-07-22 | New England Biolabs, Inc. | Organellar targeting of RNA and its use in the interruption of environmental gene flow |
WO2005007196A2 (en) | 2003-07-16 | 2005-01-27 | Protiva Biotherapeutics, Inc. | Lipid encapsulated interfering rna |
NZ581166A (en) | 2003-09-15 | 2011-06-30 | Protiva Biotherapeutics Inc | Polyethyleneglycol-modified lipid compounds and uses thereof |
GB0325379D0 (en) | 2003-10-30 | 2003-12-03 | Oxford Biomedica Ltd | Vectors |
CA2569645C (en) | 2004-06-07 | 2014-10-28 | Protiva Biotherapeutics, Inc. | Cationic lipids and methods of use |
WO2005121348A1 (en) | 2004-06-07 | 2005-12-22 | Protiva Biotherapeutics, Inc. | Lipid encapsulated interfering rna |
EP1784416B1 (en) | 2004-07-16 | 2011-10-05 | GOVERNMENT OF THE UNITED STATES OF AMERICA, as represented by THE SECRETARY, DEPARTMENT OF HEALTH AND HUMAN SERVICES | Vaccines against aids comprising cmv/r nucleic acid constructs |
GB0422877D0 (en) | 2004-10-14 | 2004-11-17 | Univ Glasgow | Bioactive polymers |
WO2007048046A2 (en) | 2005-10-20 | 2007-04-26 | Protiva Biotherapeutics, Inc. | Sirna silencing of filovirus gene expression |
ES2377660T3 (es) | 2005-10-28 | 2012-03-29 | Mitsubishi Tanabe Pharma Corporation | Nuevo péptido que penetra en las células |
EP2395012B8 (en) | 2005-11-02 | 2018-06-06 | Arbutus Biopharma Corporation | Modified siRNA molecules and uses thereof |
GB0526211D0 (en) | 2005-12-22 | 2006-02-01 | Oxford Biomedica Ltd | Viral vectors |
US7915399B2 (en) | 2006-06-09 | 2011-03-29 | Protiva Biotherapeutics, Inc. | Modified siRNA molecules and uses thereof |
JP2008078613A (ja) | 2006-08-24 | 2008-04-03 | Rohm Co Ltd | 窒化物半導体の製造方法及び窒化物半導体素子 |
US20100099858A1 (en) | 2006-09-28 | 2010-04-22 | Mirkin Chad A | Maximizing Oligonucleotide Loading on Gold Nanoparticle |
WO2008064289A2 (en) | 2006-11-21 | 2008-05-29 | The Samuel Roberts Noble Foundation, Inc. | Biofuel production methods and compositions |
WO2008149176A1 (en) | 2007-06-06 | 2008-12-11 | Cellectis | Meganuclease variants cleaving a dna target sequence from the mouse rosa26 locus and uses thereof |
AU2008346801A1 (en) | 2007-12-31 | 2009-07-16 | Nanocor Therapeutics, Inc. | RNA interference for the treatment of heart failure |
PL2279254T3 (pl) | 2008-04-15 | 2017-11-30 | Protiva Biotherapeutics Inc. | Nowe preparaty lipidowe do dostarczania kwasów nukleinowych |
US8575305B2 (en) | 2008-06-04 | 2013-11-05 | Medical Research Council | Cell penetrating peptides |
WO2010001325A2 (en) | 2008-06-30 | 2010-01-07 | Silenseed Ltd | Methods, compositions and systems for local delivery of drugs |
EP2309980A1 (en) | 2008-07-08 | 2011-04-20 | S.I.F.I. Societa' Industria Farmaceutica Italiana | Ophthalmic compositions for treating pathologies of the posterior segment of the eye |
AU2009311667B2 (en) | 2008-11-07 | 2016-04-14 | Massachusetts Institute Of Technology | Aminoalcohol lipidoids and uses thereof |
GB2465749B (en) | 2008-11-25 | 2013-05-08 | Algentech Sas | Plant cell transformation method |
US20120047601A1 (en) | 2009-02-17 | 2012-02-23 | The Regents Of The University Of California | Method of Reducing Acetylation in Plants to Improve Biofuel Production |
EP2449114B9 (en) | 2009-07-01 | 2017-04-19 | Protiva Biotherapeutics Inc. | Novel lipid formulations for delivery of therapeutic agents to solid tumors |
US8236943B2 (en) | 2009-07-01 | 2012-08-07 | Protiva Biotherapeutics, Inc. | Compositions and methods for silencing apolipoprotein B |
EP2454371B1 (en) | 2009-07-13 | 2021-01-20 | Somagenics, Inc. | Chemical modification of small hairpin rnas for inhibition of gene expression |
US8889394B2 (en) | 2009-09-07 | 2014-11-18 | Empire Technology Development Llc | Multiple domain proteins |
US20120003201A1 (en) | 2010-04-21 | 2012-01-05 | Nicholas Susanne B | Vault agents for chronic kidney disease |
CA2796600C (en) | 2010-04-26 | 2019-08-13 | Sangamo Biosciences, Inc. | Genome editing of a rosa locus using zinc-finger nucleases |
US8372951B2 (en) | 2010-05-14 | 2013-02-12 | National Tsing Hua University | Cell penetrating peptides for intracellular delivery |
EP2575894B1 (en) | 2010-05-28 | 2015-02-25 | Oxford Biomedica (UK) Ltd | Delivery of lentiviral vectors to the brain |
WO2012027675A2 (en) | 2010-08-26 | 2012-03-01 | Massachusetts Institute Of Technology | Poly(beta-amino alcohols), their preparation, and uses thereof |
DK2691443T3 (da) | 2011-03-28 | 2021-05-03 | Massachusetts Inst Technology | Konjugerede lipomerer og anvendelser af disse |
CA2831613A1 (en) | 2011-03-31 | 2012-10-04 | Moderna Therapeutics, Inc. | Delivery and formulation of engineered nucleic acids |
US20120295960A1 (en) | 2011-05-20 | 2012-11-22 | Oxford Biomedica (Uk) Ltd. | Treatment regimen for parkinson's disease |
EP2791160B1 (en) | 2011-12-16 | 2022-03-02 | ModernaTX, Inc. | Modified mrna compositions |
US20130185823A1 (en) | 2012-01-16 | 2013-07-18 | Academia Sinica | Mesoporous silica nanoparticle-mediated delivery of dna into arabidopsis root |
US8614194B1 (en) | 2012-07-25 | 2013-12-24 | Kaohsiung Medical University | Anionic cell penetrating peptide and its use for intracellular delivery |
JP2015527889A (ja) | 2012-07-25 | 2015-09-24 | ザ ブロード インスティテュート, インコーポレイテッド | 誘導可能なdna結合タンパク質およびゲノム撹乱ツール、ならびにそれらの適用 |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
ES2883590T3 (es) | 2012-12-12 | 2021-12-09 | Broad Inst Inc | Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas |
US20140310830A1 (en) | 2012-12-12 | 2014-10-16 | Feng Zhang | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes |
EP3252160B1 (en) | 2012-12-12 | 2020-10-28 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
US20140242664A1 (en) | 2012-12-12 | 2014-08-28 | The Broad Institute, Inc. | Engineering of systems, methods and optimized guide compositions for sequence manipulation |
ES2701749T3 (es) | 2012-12-12 | 2019-02-25 | Broad Inst Inc | Métodos, modelos, sistemas y aparatos para identificar secuencias diana para enzimas Cas o sistemas CRISPR-Cas para secuencias diana y transmitir resultados de los mismos |
SG10201801969TA (en) | 2012-12-12 | 2018-04-27 | Broad Inst Inc | Engineering and Optimization of Improved Systems, Methods and Enzyme Compositions for Sequence Manipulation |
EP2848690B1 (en) | 2012-12-12 | 2020-08-19 | The Broad Institute, Inc. | Crispr-cas component systems, methods and compositions for sequence manipulation |
EP2931899A1 (en) | 2012-12-12 | 2015-10-21 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof |
US8993233B2 (en) | 2012-12-12 | 2015-03-31 | The Broad Institute Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
US11332719B2 (en) | 2013-03-15 | 2022-05-17 | The Broad Institute, Inc. | Recombinant virus and preparations thereof |
EP3011034B1 (en) | 2013-06-17 | 2019-08-07 | The Broad Institute, Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components |
EP3725885A1 (en) | 2013-06-17 | 2020-10-21 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
BR112015031608A2 (pt) | 2013-06-17 | 2017-08-22 | Massachusetts Inst Technology | Aplicação e uso dos sistemas crispr-cas, vetores e composições para direcionamento e terapia hepáticos |
EP3011032B1 (en) | 2013-06-17 | 2019-10-16 | The Broad Institute, Inc. | Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells |
CA2915837A1 (en) | 2013-06-17 | 2014-12-24 | The Broad Institute, Inc. | Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation |
EP3011035B1 (en) | 2013-06-17 | 2020-05-13 | The Broad Institute, Inc. | Assay for quantitative evaluation of target site cleavage by one or more crispr-cas guide sequences |
DK3011029T3 (da) | 2013-06-17 | 2020-03-16 | Broad Inst Inc | Administration, modificering og optimering af tandem-guidesystemer, fremgangsmåder og sammensætninger til sekvensmanipulering |
WO2015065964A1 (en) | 2013-10-28 | 2015-05-07 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof |
KR20160097327A (ko) | 2013-12-12 | 2016-08-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 유전자 산물, 구조 정보 및 유도성 모듈형 cas 효소의 발현의 변경을 위한 crispr-cas 시스템 및 방법 |
BR112016013213A2 (pt) | 2013-12-12 | 2017-12-05 | Massachusetts Inst Technology | administração, uso e aplicações terapêuticas dos sistemas crispr-cas e composições para visar distúrbios e doenças usando componentes de administração de partículas |
ES2780904T3 (es) | 2014-08-17 | 2020-08-27 | Broad Inst Inc | Edición genómica usando nickasas Cas9 |
WO2016049163A2 (en) | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder |
WO2016049024A2 (en) | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo |
WO2016049258A2 (en) | 2014-09-25 | 2016-03-31 | The Broad Institute Inc. | Functional screening with optimized functional crispr-cas systems |
WO2016094880A1 (en) | 2014-12-12 | 2016-06-16 | The Broad Institute Inc. | Delivery, use and therapeutic applications of crispr systems and compositions for genome editing as to hematopoietic stem cells (hscs) |
WO2016186745A1 (en) | 2015-05-15 | 2016-11-24 | Ge Healthcare Dharmacon, Inc. | Synthetic single guide rna for cas9-mediated gene editing |
WO2017070605A1 (en) | 2015-10-22 | 2017-04-27 | The Broad Institute Inc. | Type vi-b crispr enzymes and systems |
KR20230156150A (ko) * | 2016-06-17 | 2023-11-13 | 더 브로드 인스티튜트, 인코퍼레이티드 | 제vi형 crispr 오솔로그 및 시스템 |
WO2018107103A1 (en) | 2016-12-09 | 2018-06-14 | The Broad Institute, Inc. | Crispr-systems for modifying a trait of interest in a plant |
EP3596207B1 (en) | 2017-03-15 | 2023-12-20 | The Broad Institute, Inc. | Novel cas13b orthologues crispr enzymes and systems |
-
2018
- 2018-03-15 EP EP18715416.6A patent/EP3596207B1/en active Active
- 2018-03-15 KR KR1020197030158A patent/KR102185464B1/ko active IP Right Grant
- 2018-03-15 US US16/493,464 patent/US11739308B2/en active Active
- 2018-03-15 CN CN201880033145.8A patent/CN110959039A/zh active Pending
- 2018-03-15 KR KR1020207034051A patent/KR102454284B1/ko active IP Right Grant
- 2018-03-15 WO PCT/US2018/022751 patent/WO2018170333A1/en unknown
- 2018-03-15 CA CA3056236A patent/CA3056236A1/en active Pending
- 2018-03-15 AU AU2018234825A patent/AU2018234825B2/en active Active
- 2018-03-15 JP JP2019551295A patent/JP2020511141A/ja active Pending
- 2018-03-15 EP EP23213666.3A patent/EP4361261A2/en active Pending
-
2021
- 2021-03-17 AU AU2021201683A patent/AU2021201683B2/en active Active
-
2023
- 2023-03-22 JP JP2023045024A patent/JP2023088984A/ja active Pending
- 2023-07-10 US US18/349,707 patent/US20240018494A1/en active Pending
- 2023-11-23 AU AU2023270311A patent/AU2023270311A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106029880A (zh) * | 2013-12-12 | 2016-10-12 | 布罗德研究所有限公司 | 核苷酸重复障碍中CRISPR-Cas系统的组合物和使用方法 |
CN106061510A (zh) * | 2013-12-12 | 2016-10-26 | 布罗德研究所有限公司 | 用于基因组编辑的crispr‑cas系统和组合物的递送、用途和治疗应用 |
CN106103705A (zh) * | 2013-12-12 | 2016-11-09 | 布罗德研究所有限公司 | 核苷酸重复障碍中crispr‑cas系统的组合物和使用方法 |
US20160208243A1 (en) * | 2015-06-18 | 2016-07-21 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
Non-Patent Citations (3)
Title |
---|
AARON A. SMARGON ET AL.: ""Cas13b Is a Type VI-B CRISPR-Associated RNA Guided RNase Differentially Regulated by Accessory Proteins Csx27 and Csx28"", vol. 65, pages 1 * |
ANANTHARAMAN, K. ET AL.: ""MAG: hypothetical protein A2033_10205 [Bacteroidetes bacterium GWA2_31_9]",Accession Number:OFX18020.1", 《GENBANK》, 18 October 2016 (2016-10-18), pages 1 - 2 * |
ODOLPHE BARRANGOU ET AL.: ""Expanding the CRISPR Toolbox: Targeting RNA with Cas13b"", 《MOLECULAR CELL》, vol. 65, 16 February 2017 (2017-02-16), pages 582 - 584, XP029924321, DOI: 10.1016/j.molcel.2017.02.002 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112430586A (zh) * | 2020-11-16 | 2021-03-02 | 珠海舒桐医疗科技有限公司 | 一种VI-B型CRISPR/Cas13基因编辑系统及其应用 |
WO2022253351A1 (zh) * | 2021-06-04 | 2022-12-08 | 中国科学院脑科学与智能技术卓越创新中心 | 新型Cas13蛋白及其筛选方法和应用 |
CN113832180A (zh) * | 2021-08-03 | 2021-12-24 | 华中农业大学 | CRISPR/Cas13b介导的棉花RNA转录调控方法 |
Also Published As
Publication number | Publication date |
---|---|
AU2018234825A1 (en) | 2019-10-31 |
US11739308B2 (en) | 2023-08-29 |
KR20190129088A (ko) | 2019-11-19 |
JP2020511141A (ja) | 2020-04-16 |
CA3056236A1 (en) | 2018-09-20 |
WO2018170333A1 (en) | 2018-09-20 |
KR102454284B1 (ko) | 2022-10-12 |
EP3596207A1 (en) | 2020-01-22 |
EP4361261A2 (en) | 2024-05-01 |
KR102185464B1 (ko) | 2020-12-03 |
AU2021201683B2 (en) | 2023-08-24 |
JP2023088984A (ja) | 2023-06-27 |
AU2021201683A1 (en) | 2021-04-08 |
EP3596207B1 (en) | 2023-12-20 |
KR20200135581A (ko) | 2020-12-02 |
AU2023270311A1 (en) | 2024-02-15 |
US20240018494A1 (en) | 2024-01-18 |
AU2018234825B2 (en) | 2020-12-17 |
US20200131488A1 (en) | 2020-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021201683B2 (en) | Novel CAS13B orthologues CRISPR enzymes and systems | |
US20240110165A1 (en) | Novel type vi crispr orthologs and systems | |
JP7267013B2 (ja) | Vi型crisprオルソログ及び系 | |
CN109153980B (zh) | Vi-b型crispr酶和系统 | |
US20190345518A1 (en) | Novel crispr enzymes and systems | |
US20200231975A1 (en) | Novel type vi crispr orthologs and systems | |
CN113348245A (zh) | 新型crispr酶和系统 | |
EP3230451B1 (en) | Protected guide rnas (pgrnas) | |
US20200165594A1 (en) | Crispr system based antiviral therapy | |
EP3645728A1 (en) | Novel type vi crispr orthologs and systems | |
WO2016094872A9 (en) | Dead guides for crispr transcription factors | |
WO2016094874A1 (en) | Escorted and functionalized guides for crispr-cas systems | |
US20200308560A1 (en) | Novel type vi crispr orthologs and systems | |
WO2020041380A1 (en) | Methods and compositions for optochemical control of crispr-cas9 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40022746 Country of ref document: HK |