CN117693585A - Ii类v型crispr系统 - Google Patents
Ii类v型crispr系统 Download PDFInfo
- Publication number
- CN117693585A CN117693585A CN202280046084.5A CN202280046084A CN117693585A CN 117693585 A CN117693585 A CN 117693585A CN 202280046084 A CN202280046084 A CN 202280046084A CN 117693585 A CN117693585 A CN 117693585A
- Authority
- CN
- China
- Prior art keywords
- sequence
- guide rna
- seq
- hybridizes
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108091033409 CRISPR Proteins 0.000 title claims description 12
- 238000010354 CRISPR gene editing Methods 0.000 title claims description 4
- 238000000034 method Methods 0.000 claims abstract description 253
- 108020005004 Guide RNA Proteins 0.000 claims description 612
- 108010042407 Endonucleases Proteins 0.000 claims description 407
- 102000004533 Endonucleases Human genes 0.000 claims description 407
- 239000002773 nucleotide Substances 0.000 claims description 385
- 125000003729 nucleotide group Chemical group 0.000 claims description 385
- 210000004027 cell Anatomy 0.000 claims description 312
- 101710163270 Nuclease Proteins 0.000 claims description 292
- 108020004414 DNA Proteins 0.000 claims description 219
- 102000053602 DNA Human genes 0.000 claims description 213
- 108090000623 proteins and genes Proteins 0.000 claims description 178
- 125000006850 spacer group Chemical group 0.000 claims description 178
- 150000007523 nucleic acids Chemical group 0.000 claims description 151
- 102000004169 proteins and genes Human genes 0.000 claims description 126
- 230000008685 targeting Effects 0.000 claims description 104
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 85
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 77
- 230000004048 modification Effects 0.000 claims description 61
- 238000012986 modification Methods 0.000 claims description 61
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 60
- 230000014509 gene expression Effects 0.000 claims description 52
- 102000004190 Enzymes Human genes 0.000 claims description 51
- 108090000790 Enzymes Proteins 0.000 claims description 51
- 241000282414 Homo sapiens Species 0.000 claims description 51
- 229920001184 polypeptide Polymers 0.000 claims description 46
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 46
- 210000003958 hematopoietic stem cell Anatomy 0.000 claims description 45
- 150000002632 lipids Chemical class 0.000 claims description 42
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 40
- 102000040430 polynucleotide Human genes 0.000 claims description 39
- 108091033319 polynucleotide Proteins 0.000 claims description 39
- 239000002157 polynucleotide Substances 0.000 claims description 39
- 239000002243 precursor Substances 0.000 claims description 38
- -1 cationic lipid Chemical class 0.000 claims description 37
- 210000005229 liver cell Anatomy 0.000 claims description 34
- 230000000295 complement effect Effects 0.000 claims description 32
- 238000009396 hybridization Methods 0.000 claims description 31
- 230000027455 binding Effects 0.000 claims description 26
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 claims description 22
- 239000002105 nanoparticle Substances 0.000 claims description 21
- 108010088751 Albumins Proteins 0.000 claims description 15
- 101000662909 Homo sapiens T cell receptor beta constant 1 Proteins 0.000 claims description 14
- 101000662902 Homo sapiens T cell receptor beta constant 2 Proteins 0.000 claims description 14
- 102100037272 T cell receptor beta constant 1 Human genes 0.000 claims description 14
- 102100037298 T cell receptor beta constant 2 Human genes 0.000 claims description 14
- 102100031585 ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Human genes 0.000 claims description 12
- 101000777636 Homo sapiens ADP-ribosyl cyclase/cyclic ADP-ribose hydrolase 1 Proteins 0.000 claims description 12
- 102000009027 Albumins Human genes 0.000 claims description 11
- 235000012000 cholesterol Nutrition 0.000 claims description 11
- 230000002829 reductive effect Effects 0.000 claims description 11
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 claims description 9
- 210000003494 hepatocyte Anatomy 0.000 claims description 9
- 101000831007 Homo sapiens T-cell immunoreceptor with Ig and ITIM domains Proteins 0.000 claims description 8
- 101000582255 Mus musculus Nuclear receptor corepressor 2 Proteins 0.000 claims description 8
- 229930182558 Sterol Natural products 0.000 claims description 8
- 102100024834 T-cell immunoreceptor with Ig and ITIM domains Human genes 0.000 claims description 8
- 150000003432 sterols Chemical class 0.000 claims description 8
- 235000003702 sterols Nutrition 0.000 claims description 8
- 102100038837 2-Hydroxyacid oxidase 1 Human genes 0.000 claims description 7
- 102100025668 Angiopoietin-related protein 3 Human genes 0.000 claims description 7
- 101000693085 Homo sapiens Angiopoietin-related protein 3 Proteins 0.000 claims description 7
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 claims description 7
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 claims description 7
- 125000002091 cationic group Chemical group 0.000 claims description 7
- 108010062584 glycollate oxidase Proteins 0.000 claims description 7
- 101000582254 Homo sapiens Nuclear receptor corepressor 2 Proteins 0.000 claims description 6
- 230000005847 immunogenicity Effects 0.000 claims description 6
- 230000007935 neutral effect Effects 0.000 claims description 6
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 claims description 4
- 102000018251 Hypoxanthine Phosphoribosyltransferase Human genes 0.000 claims 2
- 238000010362 genome editing Methods 0.000 abstract description 73
- 239000000203 mixture Substances 0.000 abstract description 31
- 244000005700 microbiome Species 0.000 abstract description 18
- 230000000694 effects Effects 0.000 description 141
- 235000018102 proteins Nutrition 0.000 description 122
- 102000039446 nucleic acids Human genes 0.000 description 115
- 108020004707 nucleic acids Proteins 0.000 description 115
- 238000003776 cleavage reaction Methods 0.000 description 101
- 230000007017 scission Effects 0.000 description 99
- 239000012636 effector Substances 0.000 description 92
- 238000001890 transfection Methods 0.000 description 68
- 238000007385 chemical modification Methods 0.000 description 53
- 230000006870 function Effects 0.000 description 51
- 229940088598 enzyme Drugs 0.000 description 50
- 108020004999 messenger RNA Proteins 0.000 description 50
- 239000013612 plasmid Substances 0.000 description 46
- 235000001014 amino acid Nutrition 0.000 description 45
- 238000007481 next generation sequencing Methods 0.000 description 39
- 241000699666 Mus <mouse, genus> Species 0.000 description 38
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 34
- 108091079001 CRISPR RNA Proteins 0.000 description 33
- 238000000338 in vitro Methods 0.000 description 33
- 210000004962 mammalian cell Anatomy 0.000 description 30
- 229940024606 amino acid Drugs 0.000 description 29
- 150000001413 amino acids Chemical class 0.000 description 29
- 238000004458 analytical method Methods 0.000 description 29
- 230000003197 catalytic effect Effects 0.000 description 29
- 238000012163 sequencing technique Methods 0.000 description 27
- 239000000047 product Substances 0.000 description 26
- 238000006467 substitution reaction Methods 0.000 description 26
- 108091026890 Coding region Proteins 0.000 description 25
- 239000013598 vector Substances 0.000 description 25
- 108020004682 Single-Stranded DNA Proteins 0.000 description 24
- 230000005782 double-strand break Effects 0.000 description 24
- 230000037430 deletion Effects 0.000 description 23
- 238000012217 deletion Methods 0.000 description 23
- 125000003275 alpha amino acid group Chemical group 0.000 description 21
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 21
- 241000588724 Escherichia coli Species 0.000 description 19
- 101000930477 Mus musculus Albumin Proteins 0.000 description 19
- 238000005516 engineering process Methods 0.000 description 19
- 210000004185 liver Anatomy 0.000 description 19
- 238000012360 testing method Methods 0.000 description 19
- 238000012384 transportation and delivery Methods 0.000 description 19
- 108091027544 Subgenomic mRNA Proteins 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 18
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 17
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 17
- 230000000875 corresponding effect Effects 0.000 description 17
- 230000037431 insertion Effects 0.000 description 17
- 238000003780 insertion Methods 0.000 description 17
- 230000035772 mutation Effects 0.000 description 17
- 238000003556 assay Methods 0.000 description 16
- 239000012634 fragment Substances 0.000 description 16
- 125000002652 ribonucleotide group Chemical group 0.000 description 16
- 108700026244 Open Reading Frames Proteins 0.000 description 15
- 230000006780 non-homologous end joining Effects 0.000 description 15
- 229920002477 rna polymer Polymers 0.000 description 15
- 108700024394 Exon Proteins 0.000 description 14
- 101100259224 Oryctolagus cuniculus SYPL2 gene Proteins 0.000 description 14
- 108091028664 Ribonucleotide Proteins 0.000 description 14
- 239000000872 buffer Substances 0.000 description 14
- 239000002336 ribonucleotide Substances 0.000 description 14
- 238000001712 DNA sequencing Methods 0.000 description 13
- 238000012761 co-transfection Methods 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 13
- 239000000523 sample Substances 0.000 description 13
- 238000001727 in vivo Methods 0.000 description 12
- 230000037361 pathway Effects 0.000 description 12
- 238000013515 script Methods 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 12
- 108091093088 Amplicon Proteins 0.000 description 11
- 108020004705 Codon Proteins 0.000 description 11
- 241000196324 Embryophyta Species 0.000 description 11
- 108091005804 Peptidases Proteins 0.000 description 11
- 239000004365 Protease Substances 0.000 description 11
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 11
- 239000000284 extract Substances 0.000 description 11
- 239000002609 medium Substances 0.000 description 11
- 230000008439 repair process Effects 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 241000894006 Bacteria Species 0.000 description 10
- 238000013461 design Methods 0.000 description 10
- 238000001597 immobilized metal affinity chromatography Methods 0.000 description 10
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 230000033616 DNA repair Effects 0.000 description 9
- 240000000249 Morus alba Species 0.000 description 9
- 235000008708 Morus alba Nutrition 0.000 description 9
- 238000003491 array Methods 0.000 description 9
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 9
- 238000004519 manufacturing process Methods 0.000 description 9
- 238000002887 multiple sequence alignment Methods 0.000 description 9
- 239000002953 phosphate buffered saline Substances 0.000 description 9
- 210000004986 primary T-cell Anatomy 0.000 description 9
- 238000011160 research Methods 0.000 description 9
- 108020004635 Complementary DNA Proteins 0.000 description 8
- 230000010261 cell growth Effects 0.000 description 8
- 238000000684 flow cytometry Methods 0.000 description 8
- 238000009472 formulation Methods 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 229950010342 uridine triphosphate Drugs 0.000 description 8
- 238000010453 CRISPR/Cas method Methods 0.000 description 7
- 108700004991 Cas12a Proteins 0.000 description 7
- 101001123986 Homo sapiens Protein-serine O-palmitoleoyltransferase porcupine Proteins 0.000 description 7
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 7
- 102100028119 Protein-serine O-palmitoleoyltransferase porcupine Human genes 0.000 description 7
- 241000283984 Rodentia Species 0.000 description 7
- 102100029655 Tripartite motif-containing protein 72 Human genes 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000002538 fungal effect Effects 0.000 description 7
- 239000000499 gel Substances 0.000 description 7
- 210000005260 human cell Anatomy 0.000 description 7
- 230000001965 increasing effect Effects 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 229920000642 polymer Polymers 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000010845 search algorithm Methods 0.000 description 7
- 230000001225 therapeutic effect Effects 0.000 description 7
- 101150088302 trim72 gene Proteins 0.000 description 7
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 6
- 108091006905 Human Serum Albumin Proteins 0.000 description 6
- 102000008100 Human Serum Albumin Human genes 0.000 description 6
- 108091029795 Intergenic region Proteins 0.000 description 6
- 241000699670 Mus sp. Species 0.000 description 6
- 239000011324 bead Substances 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 125000001153 fluoro group Chemical group F* 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 238000002156 mixing Methods 0.000 description 6
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 6
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 5
- 241000233866 Fungi Species 0.000 description 5
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerol Natural products OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 5
- 238000012408 PCR amplification Methods 0.000 description 5
- 102000004389 Ribonucleoproteins Human genes 0.000 description 5
- 108010081734 Ribonucleoproteins Proteins 0.000 description 5
- 241000723792 Tobacco etch virus Species 0.000 description 5
- 238000002835 absorbance Methods 0.000 description 5
- 239000011543 agarose gel Substances 0.000 description 5
- 210000004102 animal cell Anatomy 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 239000003623 enhancer Substances 0.000 description 5
- VYXSBFYARXAAKO-UHFFFAOYSA-N ethyl 2-[3-(ethylamino)-6-ethylimino-2,7-dimethylxanthen-9-yl]benzoate;hydron;chloride Chemical compound [Cl-].C1=2C=C(C)C(NCC)=CC=2OC2=CC(=[NH+]CC)C(C)=CC2=C1C1=CC=CC=C1C(=O)OCC VYXSBFYARXAAKO-UHFFFAOYSA-N 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 238000003197 gene knockdown Methods 0.000 description 5
- 238000002955 isolation Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 108091070501 miRNA Proteins 0.000 description 5
- 210000004940 nucleus Anatomy 0.000 description 5
- 230000030648 nucleus localization Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 239000013641 positive control Substances 0.000 description 5
- 210000000130 stem cell Anatomy 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 239000012096 transfection reagent Substances 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- 239000001226 triphosphate Substances 0.000 description 5
- 235000011178 triphosphate Nutrition 0.000 description 5
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 description 4
- 241000702421 Dependoparvovirus Species 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 230000004570 RNA-binding Effects 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 230000006044 T cell activation Effects 0.000 description 4
- 102100029452 T cell receptor alpha chain constant Human genes 0.000 description 4
- 108091008874 T cell receptors Proteins 0.000 description 4
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 4
- ARLKCWCREKRROD-POYBYMJQSA-N [[(2s,5r)-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 ARLKCWCREKRROD-POYBYMJQSA-N 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 239000000427 antigen Substances 0.000 description 4
- 108091007433 antigens Proteins 0.000 description 4
- 102000036639 antigens Human genes 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 4
- 238000012258 culturing Methods 0.000 description 4
- 210000000805 cytoplasm Anatomy 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 239000006166 lysate Substances 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 210000003205 muscle Anatomy 0.000 description 4
- 230000008520 organization Effects 0.000 description 4
- 229920002401 polyacrylamide Polymers 0.000 description 4
- 230000003389 potentiating effect Effects 0.000 description 4
- 238000007480 sanger sequencing Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000005783 single-strand break Effects 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- NRJAVPSFFCBXDT-HUESYALOSA-N 1,2-distearoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCCCC NRJAVPSFFCBXDT-HUESYALOSA-N 0.000 description 3
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 3
- 230000008265 DNA repair mechanism Effects 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 108010054218 Factor VIII Proteins 0.000 description 3
- 102000001690 Factor VIII Human genes 0.000 description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 3
- 241000713666 Lentivirus Species 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 108010071690 Prealbumin Proteins 0.000 description 3
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 3
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 description 3
- HDRRAMINWIWTNU-NTSWFWBYSA-N [[(2s,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1CC[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HDRRAMINWIWTNU-NTSWFWBYSA-N 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 101150059443 cas12a gene Proteins 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 108091092356 cellular DNA Proteins 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 238000009295 crossflow filtration Methods 0.000 description 3
- URGJWIFLBWJRMF-JGVFFNPUSA-N ddTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 URGJWIFLBWJRMF-JGVFFNPUSA-N 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 238000010828 elution Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 239000013613 expression plasmid Substances 0.000 description 3
- 229960000301 factor viii Drugs 0.000 description 3
- 230000009368 gene silencing by RNA Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 210000000822 natural killer cell Anatomy 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 3
- 239000013049 sediment Substances 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 239000012536 storage buffer Substances 0.000 description 3
- 238000011191 terminal modification Methods 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- WCKQPPQRFNHPRJ-UHFFFAOYSA-N 4-[[4-(dimethylamino)phenyl]diazenyl]benzoic acid Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=C(C(O)=O)C=C1 WCKQPPQRFNHPRJ-UHFFFAOYSA-N 0.000 description 2
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 2
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 241001408449 Asca Species 0.000 description 2
- 108020000946 Bacterial DNA Proteins 0.000 description 2
- 108700031361 Brachyury Proteins 0.000 description 2
- 238000011740 C57BL/6 mouse Methods 0.000 description 2
- 102000017420 CD3 protein, epsilon/gamma/delta subunit Human genes 0.000 description 2
- 102100036008 CD48 antigen Human genes 0.000 description 2
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 2
- 241001478240 Coccus Species 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- 238000007399 DNA isolation Methods 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 2
- 108010013369 Enteropeptidase Proteins 0.000 description 2
- 102100029727 Enteropeptidase Human genes 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 108010074860 Factor Xa Proteins 0.000 description 2
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 2
- 208000009292 Hemophilia A Diseases 0.000 description 2
- 108091006054 His-tagged proteins Proteins 0.000 description 2
- 101000716130 Homo sapiens CD48 antigen Proteins 0.000 description 2
- 101000634853 Homo sapiens T cell receptor alpha chain constant Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 241000588621 Moraxella Species 0.000 description 2
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 102000006335 Phosphate-Binding Proteins Human genes 0.000 description 2
- 108010058514 Phosphate-Binding Proteins Proteins 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 101710191487 T cell receptor alpha chain constant Proteins 0.000 description 2
- 108090000190 Thrombin Proteins 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 2
- 108020000999 Viral RNA Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 238000012742 biochemical analysis Methods 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 108091092259 cell-free RNA Proteins 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 244000005702 human microbiome Species 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 238000000099 in vitro assay Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 210000005228 liver tissue Anatomy 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 238000009126 molecular therapy Methods 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 150000004713 phosphodiesters Chemical group 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 238000013102 re-test Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 238000013341 scale-up Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 210000000952 spleen Anatomy 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 229960004072 thrombin Drugs 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- RYQHXWDFNMMYSD-UHFFFAOYSA-O (1-methylpyridin-4-ylidene)methyl-oxoazanium Chemical group CN1C=CC(=C[NH+]=O)C=C1 RYQHXWDFNMMYSD-UHFFFAOYSA-O 0.000 description 1
- MWRBNPKJOOWZPW-NYVOMTAGSA-N 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine zwitterion Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OC[C@H](COP(O)(=O)OCCN)OC(=O)CCCCCCC\C=C/CCCCCCCC MWRBNPKJOOWZPW-NYVOMTAGSA-N 0.000 description 1
- 101150025032 13 gene Proteins 0.000 description 1
- 101150082072 14 gene Proteins 0.000 description 1
- 101150029062 15 gene Proteins 0.000 description 1
- 101150076401 16 gene Proteins 0.000 description 1
- 101150016096 17 gene Proteins 0.000 description 1
- 101150078635 18 gene Proteins 0.000 description 1
- 101150040471 19 gene Proteins 0.000 description 1
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- LAXVMANLDGWYJP-UHFFFAOYSA-N 2-amino-5-(2-aminoethyl)naphthalene-1-sulfonic acid Chemical compound NC1=CC=C2C(CCN)=CC=CC2=C1S(O)(=O)=O LAXVMANLDGWYJP-UHFFFAOYSA-N 0.000 description 1
- 101150098072 20 gene Proteins 0.000 description 1
- 101150042997 21 gene Proteins 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 101150029429 38 gene Proteins 0.000 description 1
- 101150086149 39 gene Proteins 0.000 description 1
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- SJQRQOKXQKVJGJ-UHFFFAOYSA-N 5-(2-aminoethylamino)naphthalene-1-sulfonic acid Chemical compound C1=CC=C2C(NCCN)=CC=CC2=C1S(O)(=O)=O SJQRQOKXQKVJGJ-UHFFFAOYSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- NJYVEMPWNAYQQN-UHFFFAOYSA-N 5-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C21OC(=O)C1=CC(C(=O)O)=CC=C21 NJYVEMPWNAYQQN-UHFFFAOYSA-N 0.000 description 1
- WQZIDRAQTRIQDX-UHFFFAOYSA-N 6-carboxy-x-rhodamine Chemical compound OC(=O)C1=CC=C(C([O-])=O)C=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 WQZIDRAQTRIQDX-UHFFFAOYSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- 210000002925 A-like Anatomy 0.000 description 1
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 235000001674 Agaricus brunnescens Nutrition 0.000 description 1
- 244000307697 Agrimonia eupatoria Species 0.000 description 1
- 235000016626 Agrimonia eupatoria Nutrition 0.000 description 1
- 101000860094 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) CRISPR-associated endonuclease Cas12b Proteins 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 239000000592 Artificial Cell Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 101100007857 Bacillus subtilis (strain 168) cspB gene Proteins 0.000 description 1
- 241001474374 Blennius Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241001536303 Botryococcus braunii Species 0.000 description 1
- 241001465180 Botrytis Species 0.000 description 1
- 101100121123 Caenorhabditis elegans gap-1 gene Proteins 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- 241000252229 Carassius auratus Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 241000195585 Chlamydomonas Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 244000249214 Chlorella pyrenoidosa Species 0.000 description 1
- 235000007091 Chlorella pyrenoidosa Nutrition 0.000 description 1
- 102100026735 Coagulation factor VIII Human genes 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- KQLDDLUWUFBQHP-UHFFFAOYSA-N Cordycepin Natural products C1=NC=2C(N)=NC=NC=2N1C1OCC(CO)C1O KQLDDLUWUFBQHP-UHFFFAOYSA-N 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 235000019750 Crude protein Nutrition 0.000 description 1
- 240000004244 Cucurbita moschata Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 241000258955 Echinodermata Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000266331 Eugenia Species 0.000 description 1
- 201000003542 Factor VIII deficiency Diseases 0.000 description 1
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 208000031220 Hemophilia Diseases 0.000 description 1
- 108010025076 Holoenzymes Proteins 0.000 description 1
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 1
- 101000772194 Homo sapiens Transthyretin Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 101150017040 I gene Proteins 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000904817 Lachnospiraceae bacterium Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 241000195947 Lycopodium Species 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 241001072332 Monia Species 0.000 description 1
- 241000542065 Moraxella bovoculi Species 0.000 description 1
- 101001031590 Mus musculus 2-Hydroxyacid oxidase 1 Proteins 0.000 description 1
- 101100001705 Mus musculus Angptl3 gene Proteins 0.000 description 1
- 101100338329 Mus musculus Hao1 gene Proteins 0.000 description 1
- 241001250129 Nannochloropsis gaditana Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 235000005205 Pinus Nutrition 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 241000985694 Polypodiopsida Species 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 101710086053 Putative endonuclease Proteins 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 101000650578 Salmonella phage P22 Regulatory protein C3 Proteins 0.000 description 1
- 241000195474 Sargassum Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical group [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 1
- 108010076818 TEV protease Proteins 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 102100029290 Transthyretin Human genes 0.000 description 1
- 101800005109 Triakontatetraneuropeptide Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 101001040920 Triticum aestivum Alpha-amylase inhibitor 0.28 Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 101150114976 US21 gene Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- NOXMCJDDSWCSIE-DAGMQNCNSA-N [[(2R,3S,4R,5R)-5-(2-amino-4-oxo-3H-pyrrolo[2,3-d]pyrimidin-7-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O NOXMCJDDSWCSIE-DAGMQNCNSA-N 0.000 description 1
- AZJLCKAEZFNJDI-DJLDLDEBSA-N [[(2r,3s,5r)-5-(4-aminopyrrolo[2,3-d]pyrimidin-7-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 AZJLCKAEZFNJDI-DJLDLDEBSA-N 0.000 description 1
- AZRNEVJSOSKAOC-VPHBQDTQSA-N [[(2r,3s,5r)-5-[5-[(e)-3-[6-[5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoylamino]hexanoylamino]prop-1-enyl]-2,4-dioxopyrimidin-1-yl]-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C(\C=C\CNC(=O)CCCCCNC(=O)CCCC[C@H]2[C@H]3NC(=O)N[C@H]3CS2)=C1 AZRNEVJSOSKAOC-VPHBQDTQSA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- ZXZIQGYRHQJWSY-NKWVEPMBSA-N [hydroxy-[[(2s,5r)-5-(6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy]phosphoryl] phosphono hydrogen phosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(=O)O)CC[C@@H]1N1C(NC=NC2=O)=C2N=C1 ZXZIQGYRHQJWSY-NKWVEPMBSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 150000003862 amino acid derivatives Chemical class 0.000 description 1
- 206010002022 amyloidosis Diseases 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 101150046213 araP gene Proteins 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 238000003705 background correction Methods 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 238000007622 bioinformatic analysis Methods 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- 229910002091 carbon monoxide Inorganic materials 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 238000002659 cell therapy Methods 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 235000005607 chanvre indien Nutrition 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- OFEZSBMBBKLLBJ-BAJZRUMYSA-N cordycepin Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)C[C@H]1O OFEZSBMBBKLLBJ-BAJZRUMYSA-N 0.000 description 1
- OFEZSBMBBKLLBJ-UHFFFAOYSA-N cordycepine Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)CC1O OFEZSBMBBKLLBJ-UHFFFAOYSA-N 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 101150110403 cspA gene Proteins 0.000 description 1
- 101150068339 cspLA gene Proteins 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- XLJMAIOERFSOGZ-UHFFFAOYSA-N cyanic acid Chemical compound OC#N XLJMAIOERFSOGZ-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- UFJPAQSLHAGEBL-RRKCRQDMSA-N dITP Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 UFJPAQSLHAGEBL-RRKCRQDMSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 235000021186 dishes Nutrition 0.000 description 1
- XSWSEQPWKOWORN-UHFFFAOYSA-N dodecan-2-ol Chemical compound CCCCCCCCCCC(C)O XSWSEQPWKOWORN-UHFFFAOYSA-N 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 238000011162 downstream development Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 230000012202 endocytosis Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- ZJYYHGLJYGJLLN-UHFFFAOYSA-N guanidinium thiocyanate Chemical compound SC#N.NC(N)=N ZJYYHGLJYGJLLN-UHFFFAOYSA-N 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 229910052588 hydroxylapatite Inorganic materials 0.000 description 1
- 230000003308 immunostimulating effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 238000013101 initial test Methods 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 239000004407 iron oxides and hydroxides Substances 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 238000003253 miRNA assay Methods 0.000 description 1
- 239000007758 minimum essential medium Substances 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 210000000633 nuclear envelope Anatomy 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 101150093139 ompT gene Proteins 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- XYJRXVWERLGGKC-UHFFFAOYSA-D pentacalcium;hydroxide;triphosphate Chemical compound [OH-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O XYJRXVWERLGGKC-UHFFFAOYSA-D 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000013081 phylogenetic analysis Methods 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229930000044 secondary metabolite Natural products 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 1
- 238000006557 surface reaction Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000001839 systemic circulation Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 229960000814 tetanus toxoid Drugs 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- IBVCSSOEYUMRLC-GABYNLOESA-N texas red-5-dutp Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C(C#CCNS(=O)(=O)C=2C=C(C(C=3C4=CC=5CCCN6CCCC(C=56)=C4OC4=C5C6=[N+](CCC5)CCCC6=CC4=3)=CC=2)S([O-])(=O)=O)=C1 IBVCSSOEYUMRLC-GABYNLOESA-N 0.000 description 1
- 229940126585 therapeutic drug Drugs 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- NMEHNETUFHBYEG-IHKSMFQHSA-N tttn Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 NMEHNETUFHBYEG-IHKSMFQHSA-N 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000002255 vaccination Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本文中描述了可用于基因编辑的衍生自未培养的微生物的方法、组合物和系统。
Description
相关申请交叉引用
本申请要求于2021年6月2日提交的美国临时申请第63/196,127号、于2021年8月16日提交的美国临时申请第63/233,653号、于2021年9月21日提交的美国临时申请第63/261,436号、于2021年10月6日提交的美国临时申请第63/262,169号、于2021年11月16日提交的美国临时申请第63/280,026号、于2022年1月14日提交的美国临时申请第63/299,664号、于2022年2月10日提交的美国临时申请第63/308,766号、于2022年3月23日提交的美国临时申请第63/323,014号,以及于2022年4月14日提交的美国临时申请第63/331,076号的权益,所述美国临时申请中的每一个通过引用以其整体并入本文。本申请涉及PCT申请号PCT/US21/21259,其通过全文引用的方式并入本文。
背景技术
Cas酶以及其相关的成簇的规则间隔的短回文重复序列(CRISPR)向导核糖核酸(RNA)似乎是原核免疫系统的普遍(约45%的细菌,约84%的古细菌)组分,用于通过CRISPR-RNA向导的核酸切割来保护此类微生物免受非自身核酸的侵害,如传染性病毒和质粒。虽然编码CRISPRRNA元件的脱氧核糖核酸(DNA)元件在结构和长度上可能相对保守,但其CRISPR相关(Cas)蛋白是高度多样化的,含有多种核酸相互作用结构域。虽然早在1987年就观察到CRISPR DNA元件,但CRISPR/Cas复合物的可编程核酸内切酶切割能力直到最近才被认识到,从而引起重组CRISPR/Cas系统在各种DNA操纵和基因编辑应用中的使用。
序列表
本申请含有已经以ASCII格式电子提交的序列表,并且特此通过全文引用的方式并入。创建于2021年3月5日的所述ASCII副本命名为55921-728_601_SL.txt并且大小为23,886,645字节。
发明内容
在一些方面,本公开提供了一种工程化核酸酶系统,其包括:(a)核酸内切酶,所述核酸内切酶包含RuvC结构域,其中所述核酸内切酶衍生自未培养的微生物,并且其中所述核酸内切酶是Cas12a核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,所述Cas12a核酸内切酶包括序列GWxxxK。在一些实施例中,所述工程化向导RNA包括UCUAC[N3-5]GUAGAU(N4)。在一些实施例中,所述工程化向导RNA包括CCUGC[N4]GCAGG(N3-4)。在一些方面,本公开提供了一种工程化核酸酶系统,其包括:(a)核酸内切酶,所述核酸内切酶与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,所述核酸内切酶包括RuvCI、II或III结构域。在一些实施例中,所述核酸内切酶与SEQ ID NO:1-3470中的任一者或其变体的RuvCI、II或III结构域具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%同一性。在一些实施例中,所述RuvCI结构域包括D催化残基。在一些实施例中,所述RuvCII结构域包括E催化残基。在一些实施例中,所述RuvCIII结构域包括D催化残基。在一些实施例中,所述RuvC结构域不具有核酸酶活性。在一些实施例中,所述核酸内切酶进一步包括与SEQ ID NO:1-3470中的任一者或其变体的WED II结构域具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%同一性的WED II结构域。在一些方面,本公开提供了一种工程化核酸酶系统,其包括:(a)核酸内切酶,所述核酸内切酶被配置成与包括SEQ ID NO:3862-3913中的任一者的原间隔子相邻基序(PAM)序列结合,其中所述核酸内切酶是2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,所述核酸内切酶进一步包括锌指状结构域。在一些实施例中,所述向导RNA包括与SEQ ID NO:3471、3539、3551-355MG11、MG13、MG19、MG20、MG26、MG28、MG29、MG30、MG31、MG32、MG37、9、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列。在一些方面,本公开提供了一种工程化核酸酶系统,其包括:(a)工程化向导RNA,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735或3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列,以及(b)2类V型Cas核酸内切酶,所述2类V型Cas核酸内切酶被配置成与所述工程化向导RNA结合。在一些实施例中,所述核酸内切酶被配置成与包括SEQ ID NO:3863-3913中的任一者的原间隔子相邻基序(PAM)序列结合。在一些实施例中,所述向导RNA包括与真核、真菌、植物、哺乳动物或人基因组多核苷酸序列互补的序列。在一些实施例中,所述向导RNA的长度为30-250个核苷酸。在一些实施例中,所述核酸内切酶包括接近核酸内切酶的N末端或C末端的一个或多个核定位序列(NLS)。在一些实施例中,所述NLS包括与来自由SEQ ID NO:3938-3953组成的组的序列至少80%相同的序列。在一些实施例中,所述核酸内切酶包括以下突变中的至少一个突变:当所述核酸内切酶的序列与SEQID NO:215最佳比对时,S168R、E172R、N577R或Y170R。在一些实施例中,当所述核酸内切酶的序列与SEQ ID NO:215最佳比对时,所述核酸内切酶包括所述突变S168R和E172R。在一些实施例中,当所述核酸内切酶的序列与SEQ ID NO:215最佳比对时,所述核酸内切酶包括所述突变N577R或Y170R。在一些实施例中,当所述核酸内切酶的序列与SEQ ID NO:215最佳比对时,所述核酸内切酶包括所述突变S168R。在一些实施例中,所述核酸内切酶不包括E172、N577或Y170的突变。在一些实施例中,所述工程化核酸酶系统进一步包括
单链或双链DNA修复模板,所述单链或双链DNA修复模板从5′至3′包括:第一同源臂,所述第一同源臂包括位于靶脱氧核糖核酸序列的5′的至少20个核苷酸的序列;至少10个核苷酸的合成DNA序列;以及第二同源臂,所述第二同源臂包括位于靶序列的3′的至少20个核苷酸的序列。在一些实施例中,所述第一同源臂或所述第二同源臂包括至少40个、80个、120个、150个、200个、300个、500个或1,000个核苷酸的序列。在一些实施例中,所述第一同源臂或所述第二同源臂与原核生物、细菌、真菌或真核生物的基因组序列同源。在一些实施例中,所述单链或双链DNA修复模板包括转基因供体。在一些实施例中,所述工程化核酸酶系统进一步包括包含侧接一个或两个单链DNA区段的双链DNA区段的DNA修复模板。在一些实施例中,所述单链DNA区段与所述双链DNA区段的5′端缀合。在一些实施例中,所述单链DNA区段与所述双链DNA区段的3′端缀合。在一些实施例中,所述单链DNA区段的长度为4至10个核苷酸碱基。在一些实施例中,所述单链DNA区段具有与间隔子序列内的序列互补的核苷酸序列。在一些实施例中,双链DNA序列包括条形码、开放阅读框、增强子、启动子、蛋白质编码序列、miRNA编码序列、RNA编码序列或转基因。在一些实施例中,双链DNA序列侧接核酸酶切割位点。在一些实施例中,所述核酸酶切割位点包括间隔子和PAM序列。在一些实施例中,所述系统进一步包括Mg2+的来源。在一些实施例中,所述向导RNA包括包含至少8个、至少10个或至少12个碱基配对的核糖核苷酸的发夹。在一些实施例中,所述发夹包括10个碱基配对的核糖核苷酸。在一些实施例中:(a)所述核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体至少75%、80%或90%相同的序列;以及(b)向导RNA结构包括与SEQ ID NO:3608-3609、3853或3851-3857中的任一者的非简并核苷酸至少80%或90%相同的序列。在一些实施例中,所述核酸内切酶被配置成与包括SEQ ID NO:3863-3913中的任一者的PAM结合。在一些实施例中,所述核酸内切酶被配置成与包括SEQID NO:3871的PAM结合。在一些实施例中,所述序列同一性是通过BLASTP、CLUSTALW、MUSCLE、MAFFT算法或CLUSTALW算法使用史密斯-沃特曼同源性搜索算法参数来确定的。在一些实施例中,所述序列同一性是通过BLASTP同源性搜索算法使用字长(W)为3、期望值(E)为10的参数以及BLOSUM62评分矩阵将空位罚分设置为存在为11,扩展为1并且使用条件组成评分矩阵调整来确定的。
在一些方面,本公开提供了一种工程化向导RNA,其包括:(a)DNA靶向区段,所述DNA靶向区段包括与靶DNA分子中的靶序列互补的核苷酸序列;以及(b)蛋白质结合区段,所述蛋白质结合区段包括杂交以形成双链RNA(dsRNA)双链体的两个互补核苷酸延伸段,其中所述两个互补核苷酸延伸段与中间核苷酸彼此共价连接,并且其中所述工程化向导核糖核酸多核苷酸能够与核酸内切酶形成与SEQ ID NO:1-3470中的任一者具有至少75%序列同一性的复合物,并且将所述复合物靶向所述靶DNA分子的所述靶序列。在一些实施例中,所述DNA靶向区段位于两个互补核苷酸延伸段中的两个互补核苷酸延伸段的3′处。在一些实施例中,蛋白质结合区段蛋白质结合区段包括与SEQ ID NO:3608-3609的非简并核苷酸具有至少70%、至少80%或至少90%同一性的序列。在一些实施例中,所述双链RNA(dsRNA)双链体包括至少5个、至少8个、至少10个或至少12个核糖核苷酸。
在一些方面,本公开提供了一种脱氧核糖核酸多核苷酸,其编码本文所描述的工程化向导核糖核酸多核苷酸。
在一些方面,本公开提供了一种核酸,其包括为在生物体中表达而优化的工程化核酸序列,其中所述核酸编码2类V型Cas核酸内切酶,并且其中所述核酸内切酶衍生自未培养的微生物,其中所述生物体不是所述未培养的生物体。在一些实施例中,所述核酸内切酶包括与SEQ ID NO:1-3470中的任一者具有至少70%或至少80%序列同一性的变体。在一些实施例中,所述核酸内切酶包括编码接近核酸内切酶的N末端或C末端的一个或多个核定位序列(NLS)的序列。在一些实施例中,所述NLS包括选自SEQ ID NO:3938-3953的序列。在一些实施例中,所述NLS包括SEQ ID NO:3939。在一些实施例中,所述NLS接近所述核酸内切酶的N末端。在一些实施例中,所述NLS包括SEQ ID NO:3938。在一些实施例中,所述NLS接近所述核酸内切酶的C末端。在一些实施例中,所述生物体是原核生物、细菌、真核生物、真菌、植物、哺乳动物、啮齿动物或人。
在一些方面,本公开提供了一种工程化载体,其包括编码2类V型Cas核酸内切酶或Cas12a核酸内切酶的核酸序列,其中所述核酸内切酶衍生自未培养的微生物。
在一些方面,本公开提供了一种工程化载体,其包括本文所描述的核酸。
在一些方面,本公开提供了一种工程化载体,其包括本文所描述的脱氧核糖核酸多核苷酸。在一些实施例中,所述载体是质粒、微环、CELiD、腺相关病毒(AAV)源性病毒体、慢病毒或腺病毒。
在一些方面,本公开提供了一种细胞,其包括本文所描述的载体。
在一些方面,本公开提供了一种产生核酸内切酶的方法,所述方法包括培养本文所描述的宿主细胞中的任何宿主细胞。
在一些方面,本公开提供了一种用于结合、切割、标记或修饰双链脱氧核糖核酸多核苷酸的方法,所述方法包括:(a)使所述双链脱氧核糖核酸多核苷酸和与被配置成与所述核酸内切酶和所述双链脱氧核糖核酸多核苷酸结合的工程化向导RNA复合的2类V型Cas核酸内切酶接触;(b)其中所述双链脱氧核糖核酸多核苷酸包括原间隔子相邻基序(PAM);并且(c)其中所述PAM包括包含SEQ ID NO:3863-3913中的任一者的序列。在一些实施例中,所述双链脱氧核糖核酸多核苷酸包括第一链和第二链,所述第一链包括与所述工程化向导RNA的序列互补的序列,并且所述第二链包括所述PAM。在一些实施例中,所述PAM直接邻近与所述工程化向导RNA的所述序列互补的序列的5′端。在一些实施例中,所述PAM包括SEQID NO:3871。在一些实施例中,所述2类V型Cas核酸内切酶衍生自未培养的微生物。在一些实施例中,所述双链脱氧核糖核酸多核苷酸是真核生物、植物、真菌、哺乳动物、啮齿动物或人双链脱氧核糖核酸多核苷酸。在一些实施例中,所述方法包括向靶核酸基因座递送本文所描述的工程化核酸酶系统,其中核酸内切酶被配置成与工程化向导核糖核酸结构形成复合物,并且其中所述复合物被配置成使得在所述复合物与所述靶核酸基因座结合时,所述复合物修饰所述靶核酸基因座。在一些实施例中,修饰所述靶核酸基因座包括结合、切开、切割或标记所述靶核酸基因座。在一些实施例中,所述靶核酸基因座包括脱氧核糖核酸(DNA)或核糖核酸(RNA)。在一些实施例中,所述靶核酸包括基因组DNA、病毒DNA、病毒RNA或细菌DNA。在一些实施例中,所述靶核酸基因座在体外。在一些实施例中,所述靶核酸基因座在细胞内。在一些实施例中,所述细胞是原核细胞、细菌细胞、真核细胞、真菌细胞、植物细胞、动物细胞、哺乳动物细胞、啮齿动物细胞、灵长类动物细胞、人细胞或原代细胞。在一些实施例中,所述细胞是原代细胞。在一些实施例中,所述原代细胞是T细胞。在一些实施例中,所述原代细胞是造血干细胞(HSC)。在一些实施例中,将所述工程化核酸酶系统递送到所述靶核酸基因座包括递送本文所描述的核酸或本文所描述的载体。在一些实施例中,将所述工程化核酸酶系统递送到所述靶核酸基因座包括递送包括编码所述核酸内切酶的开放阅读框的核酸。在一些实施例中,所述核酸包括编码所述核酸内切酶的所述开放阅读框可操作地连接的启动子。在一些实施例中,将所述工程化核酸酶系统递送到所述靶核酸基因座包括递送含有编码所述核酸内切酶的所述开放阅读框的封端mRNA。在一些实施例中,将所述工程化核酸酶系统递送到所述靶核酸基因座包括递送翻译的多肽。在一些实施例中,将所述工程化核酸酶系统递送到所述靶核酸基因座包括递送编码与核糖核酸(RNA)polIII启动子可操作地连接的所述工程化向导RNA的脱氧核糖核酸(DNA)。在一些实施例中,所述核酸内切酶在所述靶基因座处或附近诱导单链断裂或双链断裂。在一些实施例中,所述核酸内切酶诱导所述靶基因座内或与位于所述靶基因座3′处的交错的单链断裂。
在一些方面,本公开提供了一种编辑细胞中的TRAC基因座的方法,所述方法包括与使所述细胞与以下接触:(a)RNA向导的核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述TRAC基因座的区杂交的间隔子序列,其中所述工程化向导RNA包括与SEQ ID NO:4316-4369中的任一者的至少18个连续核苷酸具有至少85%的同一性的靶向序列。在一些实施例中,所述RNA向导的核酸酶是Cas核酸内切酶。在一些实施例中,所述Cas核酸内切酶是2类V型Cas核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括包含RuvCI子结构域、RuvCII子结构域和RuvCIII子结构域的RuvC结构域。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA进一步包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735和3851-3857中的任一者的非简并核苷酸中的至少19个非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体至少75%、80%或90%相同的序列。在一些实施例中,向导RNA结构包括与SEQ ID NO:3608-3609、3853或3851-3857中的任一者的非简并核苷酸中的至少19个非简并核苷酸至少80%或至少90%相同的序列。在一些实施例中,所述方法进一步包括与所述细胞接触或向所述细胞中引入供体核酸,所述供体核酸包括侧接于3′或5′端上的与SEQ ID NO:4424或4425中的任一者具有至少80%同一性的序列的货物序列。在一些实施例中,所述细胞是外周血单核细胞(PBMC)。在一些实施例中,所述细胞是T细胞或其前体或造血干细胞(HSC)。在一些实施例中,所述货物序列包括编码T细胞受体多肽、CAR-T多肽或其片段或衍生物的序列。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:4370-4423中的任一者具有至少80%同一性的序列。在一些实施例中,所述工程化向导RNA包括来自表5A的包括表5A中列出的对应化学修饰的sgRNA 1-54的核苷酸序列。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:4334、4350或4324中的任一者具有至少80%序列同一性的靶向序列。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:4388、4404或4378中的任一者具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA包括来自表5A的sgRNA 9、35或19的核苷酸序列。
在一些方面,本公开提供了一种工程化核酸酶系统,其包括:(a)RNA向导的核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列,其中所述工程化向导RNA包括以下修饰中的至少一个修饰:(i)所述工程化向导RNA的5′端的前4个碱基内或所述工程化向导RNA的3′端的最后4个碱基内的至少一个核苷酸的2′-O甲基或2′-氟碱基修饰;(ii)所述工程化向导RNA的5′端的前五个碱基中的至少2个碱基之间的硫代磷酸酯(PS)键,或所述工程化向导RNA的3′端的最后五个碱基中的至少两个碱基之间的硫代磷酸酯键;(iii)所述工程化向导RNA的3′茎或5′茎内的硫代磷酸酯键;(iv)所述工程化向导RNA的3′茎或5′茎内的2′-O甲基或2′碱基修饰;(v)所述工程化向导RNA的间隔子区的至少7个碱基的2′-氟碱基修饰;以及(vi)所述工程化向导RNA的环区内的硫代磷酸酯键。在一些实施例中,所述工程化向导RNA包括所述工程化向导RNA的5′端的前5个碱基或所述工程化向导RNA的3′端的最后5个碱基内的至少一个核苷酸的2′-O甲基或2′-氟碱基修饰。在一些实施例中,所述工程化向导RNA包括在所述工程化向导RNA的5′端或所述工程化向导RNA的3′端处的2′-O甲基或2′-氟碱基修饰。在一些实施例中,所述工程化向导RNA包括所述工程化向导RNA的5′端的前五个碱基中的至少2个碱基之间的硫代磷酸酯(PS)键,或所述工程化向导RNA的3′端的最后五个碱基中的至少两个碱基之间的硫代磷酸酯键。在一些实施例中,所述工程化向导RNA包括所述工程化向导RNA的3′茎或5′茎内的硫代磷酸酯键。在一些实施例中,所述工程化向导RNA包括所述工程化向导RNA的3′茎或5′茎内的2′-O甲基碱基修饰。在一些实施例中,所述工程化向导RNA包括所述工程化向导RNA的间隔子区的至少7个碱基的2′-氟碱基修饰。在一些实施例中,所述工程化向导RNA包括所述工程化向导RNA的环区内的硫代磷酸酯键。在一些实施例中,所述工程化向导RNA包括在所述工程化向导RNA的所述5′端处的至少三个2′-O甲基或2′-氟碱基、所述工程化向导RNA的所述5′端的前3个碱基之间的两个硫代磷酸酯键、在所述工程化向导RNA的所述4′端处的至少4个2′-O甲基或2′-氟碱基,以及所述工程化向导RNA的所述3′端的最后三个碱基之间的三个硫代磷酸酯键。在一些实施例中,所述工程化向导RNA包括在所述工程化向导RNA的5′端处的至少两个2′-O-甲基碱基和至少两个硫代磷酸酯键,以及在所述工程化向导RNA的3′端处的至少一个2′-O-甲基碱基和至少一个硫代磷酸酯键。在一些实施例中,所述工程化向导RNA包括在所述工程化向导RNA的所述3′茎区或所述5′茎区两者中的至少一个2′-O-甲基碱基。在一些实施例中,所述工程化向导RNA包括所述间隔子区中的至少一个至至少十四个2′-氟碱基,不包括所述工程化向导RNA的种子区。在一些实施例中,所述工程化向导RNA包括在所述工程化向导RNA的所述5′茎区中的至少一个2′-O-甲基碱基和所述间隔子区中的至少一个至至少十四个2′-氟碱基,不包括所述向导RNA的种子区。在一些实施例中,所述向导RNA包括靶向VEGF-A基因的间隔子序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3985具有至少80%同一性的间隔子序列。在一些实施例中,所述向导RNA包括来自表7的包括表7中列出的化学修饰的向导RNA 1-7的核苷酸。在一些实施例中,所述RNA向导的核酸酶是Cas核酸内切酶。在一些实施例中,所述Cas核酸内切酶是2类V型Cas核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括包含RuvCI子结构域、RuvCII子结构域和RuvCIII子结构域的RuvC结构域。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735和3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3608-3609、3853或3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列。
在一些方面,本公开提供了一种宿主细胞,其包括编码与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的异源性核酸内切酶的开放阅读框。在一些实施例中,所述核酸内切酶与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体具有至少75%序列同一性。在一些实施例中,所述宿主细胞是大肠杆菌细胞或哺乳动物细胞。在一些实施例中,所述宿主细胞是大肠杆菌细胞,其中所述大肠杆菌细胞是λDE3溶素原,或者所述大肠杆菌细胞是BL21(DE3)菌株。在一些实施例中,所述大肠杆菌细胞具有ompT lon基因型。在一些实施例中,所述开放阅读框与以下可操作地连接:T7启动子序列、T7-lac启动子序列、lac启动子序列、tac启动子序列、trc启动子序列、ParaBAD启动子序列、PrhaBAD启动子序列、T5启动子序列、cspA启动子序列、araPBAD启动子、来自噬菌体λ的强向左启动子(pL启动子)或其任何组合。在一些实施例中,所述开放阅读框包括编码使用相同读框与编码所述核酸内切酶的序列连接的亲和标签的序列。在一些实施例中,所述亲和标签是固定化金属亲和色谱法(IMAC)标签。在一些实施例中,所述IMAC标签是聚组氨酸标签。在一些实施例中,所述亲和标签是myc标签、人流感血凝素(HA)标签、麦芽糖结合蛋白(MBP)标签、谷胱甘肽S-转移酶(GST)标签、链霉亲和素标签、FLAG标签或其任何组合。在一些实施例中,所述亲和标签通过编码蛋白酶切割位点的接头序列使用相同读框与编码所述核酸内切酶的所述序列连接。在一些实施例中,所述蛋白酶切割位点是烟草蚀纹病毒(TEV)蛋白酶切割位点、蛋白酶切割位点、凝血酶切割位点、因子Xa切割位点、肠激酶切割位点或其任何组合。在一些实施例中,所述开放阅读框经密码子优化以在所述宿主细胞中表达。在一些实施例中,所述开放阅读框在载体上提供。在一些实施例中,所述开放阅读框被整合到所述宿主细胞的基因组中。
在一些方面,本公开提供了一种培养物,其包括在相容性液体培养基中的本文所描述的宿主细胞中的任何宿主细胞。
在一些方面,本公开提供了一种产生核酸内切酶的方法,所述方法包括在相容性生长培养基中培养本文所描述的宿主细胞中的任何宿主细胞。在一些实施例中,所述方法进一步包括诱导核酸内切酶的表达。在一些实施例中,通过添加另外的化学剂或增加量的营养物,或通过升高温度或降低温度来诱导所述核酸酶的表达。在一些实施例中,另外的化学剂或增加量的营养物包括异丙基β-D-1-硫代半乳糖苷(IPTG)或另外量的乳糖。在一些实施例中,所述方法进一步包括在所述培养之后分离所述宿主细胞,并且裂解所述宿主细胞以产生蛋白提取物。在一些实施例中,所述方法进一步包括分离所述核酸内切酶。在一些实施例中,所述分离包括使所述蛋白提取物经受IMAC、离子交换色谱法、阴离子交换色谱法或阳离子交换色谱法。在一些实施例中,所述开放阅读框包括编码使用相同读框与编码所述核酸内切酶的序列连接的亲和标签的序列。在一些实施例中,所述亲和标签通过编码蛋白酶切割位点的接头序列使用相同读框与编码所述核酸内切酶的所述序列连接。在一些实施例中,所述蛋白酶切割位点包括烟草蚀纹病毒(TEV)蛋白酶切割位点、蛋白酶切割位点、凝血酶切割位点、因子Xa切割位点、肠激酶切割位点或其任何组合。在一些实施例中,所述方法进一步包括通过使对应于所述蛋白酶切割位点的蛋白酶与所述核酸内切酶接触来切割所述亲和标签。在一些实施例中,所述亲和标签是IMAC亲和标签。在一些实施例中,所述方法进一步包括执行减材IMAC亲和色谱法以从包括所述核酸内切酶的组合物去除所述亲和标签。
在一些方面中,本公开提供了一种系统,其包括:(a)2类V-A型Cas核酸内切酶,所述2类V-A型Cas核酸内切酶被配置成结合3核苷酸或4核苷酸PAM序列,其中所述核酸内切酶相对于sMbCas12a具有增加的切割活性;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述2类V-A型Cas核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与包括靶核酸序列的靶核酸杂交的间隔子序列。在一些实施例中,其中通过将所述核酸内切酶连同相容性向导RNA一起引入包括所述靶核酸的细胞并检测所述细胞中所述靶核酸序列的切割来体外测量所述切割活性。在一些实施例中,所述2类V-A型Cas核酸内切酶包括与215-225中的任一者或其变体具有至少75%同一性的序列。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%同一性的序列。在一些实施例中,所述靶核酸进一步包括邻近所述靶核酸序列的YYN PAM序列。在一些实施例中,所述2类V-A型Cas核酸内切酶相对于sMbCas12a具有至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或200%或更多增加的活性。
在一些方面,本公开提供了一种系统,其包括:(a)2类V-A′型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA包括与2类V型Cas核酸内切酶的天然效应子重复序列的约19至约25个或约19至约31个连续核苷酸具有至少80%同一性的序列。在一些实施例中,所述天然效应子重复序列是SEQ ID NO:3560-3572中的任一者。在一些实施例中,所述2类V-A′型Cas核酸内切酶与SEQ ID NO:126具有至少75%同一性。
在一些方面,本公开提供了一种系统,其包括:(a)2类V-L型核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA包括与2类V型Cas核酸内切酶的天然效应子重复序列的约19至约25个或约19至约31个连续核苷酸具有至少80%同一性的序列。在一些实施例中,所述2类V-L型Cas核酸内切酶与SEQ ID NO:793-1163中的任一者具有至少75%的序列同一性。
在一些方面,本公开提供了一种破坏细胞中的VEGF-A基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述VEGF-A基因座的区杂交的间隔子序列,其中所述工程化向导RNA包括与SEQ ID NO:3985具有至少80%同一性的靶向序列;或其中所述工程化向导RNA包括来自表7的向导RNA1-7中的任一者的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ IDNO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735和3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3608-3609、3853或3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列。
在一些方面,本公开提供了一种破坏细胞中的基因座的方法,所述方法包括使所述细胞与包括以下的组合物接触:(a)2类V型Cas核酸内切酶,所述2类V型Cas核酸内切酶与SEQ ID NO:215-225中的任一者或其变体具有至少75%同一性;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述基因座的区杂交的间隔子序列,其中所述2类V型Cas核酸内切酶具有与所述细胞中的spCas9至少等效的切割活性。在一些实施例中,其中通过将所述核酸内切酶连同相容性向导RNA一起引入包括所述靶核酸的细胞并检测所述细胞中所述靶核酸序列的切割来体外测量所述切割活性。在一些实施例中,所述组合物包括20pmole或更少的所述2类V型Cas核酸内切酶。在一些实施例中,所述组合物包括1pmol或更少的所述2类V型Cas核酸内切酶。
在一些方面,本公开提供了一种破坏细胞中的CD38基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述CD38基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ IDNO:4466-4503和5686中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:4428-4465和5685中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA被配置成与具有与SEQ ID NO:4466、4467、4468、4479、4484、4490、4492、4493、4495、4498中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:4428、4429、4430、4436、4441、4446、4452、4454、4455、4460或4461中的任一者具有至少80%同一性的核苷酸序列。在一些实施例中,所述细胞是真核细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的TIGIT基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述TIGIT基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ IDNO:4521-4537中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:4504-4520中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA被配置成与具有与SEQ IDNO:4521、4527、4528、4535或4536中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:4504、4510、4511、4518或4519中的任一者具有至少80%同一性的核苷酸序列。在一些实施例中,所述细胞是真核细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的AAVS1基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述AAVS1基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ IDNO:4569-4599中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:4538-4568中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857、6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA被配置成与具有与SEQ ID NO:4574、4577、4578、4579、4582、4584、4585、4586、4587、4589、4590、4591、4592、4593、4595、4596或4598中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:4543、4546、4547、4548、4551、4553、4554、4555、4556、4558、4559、4560、4561、4562、4565或4567中的任一者具有至少80%同一性的核苷酸序列。在一些实施例中,所述细胞是真核细胞、T细胞、造血干细胞、肝细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的B2M基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述B2M基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4676-4751中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:4600-4675中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA被配置成与具有与SEQ ID NO:4676、4678-4687、4690、4692、4698-4707、4720-4723、4725-4726、4732-4733、4736-4737、4741或4750-4751中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:4600、4602-4611、4614、4616、4622-4631、4644-4647、4649-4650、4656-4657、4660-4661、4665或4674-4675中的任一者具有至少80%同一性的核苷酸序列。在一些实施例中,所述细胞是真核细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的CD2基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述CD2基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4837-4921中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:4752-4836中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA被配置成与具有与SEQ ID NO:4837、4844、4845、4848、4857-4858、4883、4887、4892-4893、4904-4909、4914、4916或4918中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中,所述工程化向导RNA与来自表14E的靶向SEQ ID NO:4837、4844、4845、4848、4857-4858、4883、4887、4892-4893、4904-4909、4914、4916或4918中的任一者的向导RNA中的任一者具有至少80%序列同一性。在一些实施例中,所述细胞是真核细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的CD5基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述CD5基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4946-4969中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:4922-4945中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA被配置成与具有与SEQ ID NO:4946-4947、4949、4951、4957-4960、4963、4967或4969中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中,所述工程化向导RNA与来自表14F的靶向SEQ ID NO:4946-4947、4949、4951、4957-4960、4963、4967或4969中的任一者的向导RNA中的任一者具有至少80%序列同一性。在一些实施例中,所述细胞是真核细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的小鼠TRAC基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述小鼠TRAC基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5126-5195、5682或5684中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:5056-5125、5681或5683中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA被配置成与具有与SEQ ID NO:5126-5130、5133-5143、5147-5150、5172-5173、5184-5189或5192-5194中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中,所述工程化向导RNA与来自表14G的靶向SEQ IDNO:5126-5130、5133-5143、5147-5150、5172-5173、5184-5189或5192-5194中的任一者的向导RNA中的任一者具有至少80%序列同一性。在一些实施例中,所述细胞是真核细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的小鼠TRBC1或TRBC2基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述小鼠TRBC1或TRBC2基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5211-5225或5247-5267中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:5196-5210或5226-5246中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中所述工程化向导RNA被配置成与具有与SEQ ID NO:5211、5213-5215、5217、5221、5223、5247、5249-5250、5252-5253、5258-5259或5264中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中,所述工程化向导RNA与来自表14H的靶向SEQ ID NO:5211、5213-5215、5217、5221、5223、5247、5249-5250、5252-5253、5258-5259或5264中的任一者的向导RNA中的任一者具有至少80%序列同一性。在一些实施例中,所述细胞是真核细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的人TRBC1或TRBC2基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述人TRBC1或TRBC2基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5661-5679中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:5642-5660中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ IDNO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中所述工程化向导RNA被配置成与具有与SEQ ID NO:5661-5663、5672-5675或5678中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中,所述工程化向导RNA与来自表14I的靶向SEQ ID NO:5661-5663、5672-5675或5678中的任一者的向导RNA中的任一者具有至少80%序列同一性。在一些实施例中,所述细胞是真核细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的HPRT基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述HPRT基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ IDNO:5562-5641中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:5482-5561中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA被配置成与具有与SEQ ID NO:5562-5564或5568中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中,所述工程化向导RNA与来自表14J的靶向SEQ ID NO:5562-5564或5568中的任一者的向导RNA中的任一者具有至少80%序列同一性。在一些实施例中,所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的APO-A1基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述APO-A1基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQID NO:5861-5874中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:5847-5860中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA被配置成与具有与SEQ ID NO:5861-5866或5868-5869中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中,所述工程化向导RNA与来自表43A的靶向SEQ ID NO:5861-5866或5868-5869中的任一者的向导RNA中的任一者具有至少80%序列同一性。在一些实施例中,所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的ANGPTL3基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述ANGPTL3基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5953-6030中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:5875-5952中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述工程化向导RNA被配置成与具有与SEQ ID NO:5955-5963、5968-5975、5979-5987、5989-5993、5997、5999、6003-6010、6014-6016、6024-6025或6027-6030中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。在一些实施例中所述工程化向导RNA与来自表43B的靶向SEQ ID NO:5955-5963、5968-5975、5979-5987、5989-5993、5997、5999、6003-6010、6014-6016、6024-6025或6027-6030中的任一者的向导RNA中的任一者具有至少80%序列同一性。在一些实施例中,所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的人Rosa26基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述人Rosa26基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5013-5055中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:4970-5012中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的FAS基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述FAS基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5367-5465中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:5268-5366中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种破坏细胞中的PD-1基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述PD-1基因座的区杂交的间隔子序列,其中所述工程化向导RNA被配置成与具有与SEQ IDNO:5474-5481中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者其中所述工程化向导RNA包括与SEQ ID NO:5466-5473中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
在一些方面,本公开提供了一种工程化核酸酶系统,其包括:(a)核酸内切酶,所述核酸内切酶与SEQ ID NO:215中的任一者或其变体具有至少75%序列同一性;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列,其中与包括Cas9酶的等效系统相比,当向人类受试者施用时,所述系统具有降低的免疫原性。在一些实施例中,所述Cas9酶是SpCas9酶。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述免疫原性是抗体免疫原性。
本公开的一方面提供了一种破坏细胞中的小鼠HAO-1基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述小鼠HAO-1基因座的区杂交的间隔子序列,其中所述工程化向导RNA包括来自表25的包括表25中所描述的核苷酸修饰的向导RNAmH29-1_37、mH29-15_37、mH29-29_37的核苷酸;或者其中所述工程化向导RNA包括SEQ ID NO:4184-4225中的任一者。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。在一些实施例中,所述工程化向导RNA包括来自表25的包括表25中所描述的核苷酸修饰的向导RNA mH29-15_37或mH29-29_37的核苷酸。在一些实施例中,所述方法进一步包括破坏来自HAO-1基因座的乙醇酸氧化酶的表达。
在一些方面,本公开提供了一种破坏细胞中的人TRAC基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述人TRAC基因座的区杂交的间隔子序列,其中所述工程化向导RNA包括来自表28B的包括表28B中所描述的核苷酸修饰的MG29-1-TRAC-sgRNA-35的核苷酸。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
本公开的一方面提供了一种破坏细胞中的白蛋白基因座的方法,所述方法包括向所述细胞中引入:(a)2类V型Cas核酸内切酶;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述白蛋白基因座的区杂交的间隔子序列,其中所述工程化向导RNA包括来自表29的包括表29中所描述的核苷酸修饰的mAlb298-37、mAlb2912-37、mAlb2918-37或mAlb298-34的核苷酸;或者其中所述工程化向导RNA包括包含表46中所描述的核苷酸修饰的mAlb29-8-44、mAlb29-8-50、mAlb29-8-50b、mAlb29-8-51b、mAlb29-8-52b、mAlb29-8-53b或mAlb29-8-54b的核苷酸。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。在一些实施例中,所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。在一些实施例中,所述工程化向导RNA包括来自表29的包括表29中所描述的核苷酸修饰的mAlb298-37、mAlb2912-37、mAlb2918-37或mAlb298-34的核苷酸。
在一些方面,本公开提供了一种工程化向导RNA,其包括:(a)DNA靶向区段,所述DNA靶向区段包括与靶DNA分子中的靶序列互补的核苷酸序列;以及(b)蛋白质结合区段,所述蛋白质结合区段被配置成与2类V型Cas核酸内切酶结合,并且其中所述向导RNA包括表34中的SEQ ID NO:5695-5701中的任一者所描绘的核苷酸修饰模式。在一些实施例中,所述向导RNA包括mAlb29-8-44、mAlb29-8-50、mAlb29-8-37或mAlb29-12-44。在一些实施例中,所述向导RNA包括hH29-4_50、hH29-21_50、hH29-23_50、hH29-41_50、hH29-4_50b、hH29-21_50b、hH29-23_50b或hH29-41_50b、mH29-1-50、mH29-15-50、mH29-29-50、mH29-1-50b、mH29-15-50b或mH29-29-50b。在一些实施例中,所述DNA靶向区段被配置成与HAO-1基因或白蛋白基因杂交。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述2类V型Cas核酸内切酶包括与SEQ ID NO:215具有至少75%序列同一性的核酸内切酶。
在一些方面,本公开提供了一种工程化核酸酶系统,其包括:(a)核酸内切酶,所述核酸内切酶与SEQ ID NO:1-3470中的任一者或其变体或编码所述核酸内切酶的核苷酸序列具有至少75%序列同一性;以及(b)编码CRISPR阵列的多核苷酸序列,其中所述CRISPR阵列被配置成由所述核酸内切酶处理成工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列,其中所述间隔子序列被配置成与白蛋白基因杂交。在一些实施例中,所述多核苷酸序列包括与SEQ ID NO:5712具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。在一些实施例中,所述核酸内切酶包括与SEQ ID NO:215具有至少75%序列同一性的核酸内切酶。
在一些方面,本公开提供了一种工程化核酸酶系统,其包括:(a)核酸内切酶,所述核酸内切酶与SEQ ID NO:470或其变体具有至少75%序列同一性;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列。在一些实施例中,所述工程化向导RNA包括与SEQ ID NO:6031具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述核酸内切酶被配置成对包括SEQ ID NO:6032的5′PAM序列具有选择性。
在一些方面,本公开提供了一种工程化核酸酶系统,其包括:(a)核酸内切酶,所述核酸内切酶与SEQ ID NO:2824、2841或2896中的任一者或其变体具有至少至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;以及(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列,其中所述工程化向导RNA包括与SEQ ID NO:6033、6034或6035中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。在一些实施例中,所述核酸内切酶与SEQ ID NO:2824具有至少80%序列同一性,并且所述工程化向导RNA与SEQ ID NO:6033具有至少80%序列同一性。在一些实施例中,所述核酸内切酶与SEQ ID NO:2841具有至少80%序列同一性,并且所述工程化向导RNA与SEQ ID NO:6034具有至少80%序列同一性。在一些实施例中,所述核酸内切酶与SEQ ID NO:2896具有至少80%序列同一性,并且所述工程化向导RNA与SEQ ID NO:6035具有至少80%序列同一性。在一些实施例中,所述核酸内切酶被配置成对包括SEQ ID NO:6037-6039中的任一者的5′PAM序列具有选择性。
在一些方面,本公开提供了一种脂质纳米颗粒,其包括:(a)本文所描述的核酸内切酶中的任何核酸内切酶;(b)本文所描述的工程化向导RNA中的任何工程化向导RNA:(c)阳离子脂质;(d)固醇;(e)中性脂质;以及(f)经PEG修饰的脂质。在一些实施例中,所述阳离子脂质包括C12-200,所述固醇包括胆固醇,所述中性脂质包括DOPE,或所述经PEG修饰的脂质包括DMG-PEG2000。在一些实施例中,所述阳离子脂质包括图109中所描绘的阳离子脂质中的任何阳离子脂质。
对于本领域技术人员而言,通过以下具体实施方式,本公开的另外的方面和优点将变得显而易见,其中仅示出和描述了本公开的说明性实施例。如将认识到,本公开能够具有其它不同的实施例,并且其若干细节能够在各种明显的方面进行修改,所有这些都不脱离本公开。因此,附图和说明书本质上被视为是说明性的而非限制性的。
通过引用并入
本说明书中所提到的所有公开、专利和专利申请均通过相同的程度引用结合在此,如同特定且单独地指示每个单独的公开、专利或专利申请是通过引用并入的。
附图说明
本发明的新颖特征在所附权利要求书中具体阐述。通过参考阐述了说明性实施例的以下详细说明,将获得对本发明的特征和优点的更好理解,在所述实施例中利用了本发明的原理,并且在其附图中:
图1描绘了先前在本公开之前记录的具有不同类别和类型的CRISPR/Cas基因座的示例性组织。
图2描绘了本文所描述的MG核酸酶的环境分布。示出了代表MG29蛋白家族的蛋白长度。圆形的阴影指示从中鉴定出每种蛋白质的环境或环境类型(深灰色圆圈指示高温环境源;浅灰色圆圈指示非高温环境源)。不可获得(N/A)表示从中收集样品的环境类型未知。
图3描绘了从本文所描述的样品类型检测到的存在于MG核酸酶中的预测催化残基的数量(例如,图)。示出了代表MG29蛋白家族的蛋白长度。针对每种蛋白质预测的催化残基的数量在图例(3.0个残基)中指示。第一催化残基、第二催化残基和第三催化残基分别位于RuvCI结构域、RuvCII结构域和RuvCIII结构域中。
图4A和4B示出了CRISPRV-A型效应子的多样性。图4A描绘了编码新V-A型效应子的重叠群的分类类别的每个家族分布。图4B描绘了从119个新和89个参考V型效应子序列的比对推断出的系统发育基因树。MG家族用括号表示。活性核酸酶的PAM要求用与家族相关的框概述。非V-A型参考序列用于根植树(*MG61家族需要具有可替代的茎环序列的crRNA)。
图1A、5B、5C和5D提供了关于本文所描述的核酸酶的各种特征信息。图5A描绘了效应蛋白长度和样品的类型的每个家族分布;图5B示出了RuvC催化残基的存在。图5C示出了具有各种重复序列基序的CRISPR阵列的数量。图5D描绘了重复序列基序的每个家族分布。
图2A和6B描绘了V-A型序列中的催化和PAM相互作用区的多序列比对。新凶手弗朗西斯菌(Francisella novicida)Cas12a(FnCas12)是参考序列。其它参考序列是氨基酸球菌(Acidaminococcus sp.)。(AsCas12a)、牛眼莫拉氏菌(Moraxella bovoculi)(MbCas12a)和毛螺菌科细菌(Lachnospiraceae bacterium)ND2006(LbCas12a)。图6A示出了RuvC-I(左)、RuvC-II(中)和RuvC-III(右)区中的DED催化残基周围的保守区块。图6B示出了含有涉及PAM识别和相互作用的残基的WED-II和PAM相互作用区。FnCas12a序列下方的灰色框鉴定结构域。比对中的较暗框指示增加的序列同一性。FnCas12a序列上的黑色框指示参考序列的催化残基(和位置)。灰色框指示在比对顶部的参考序列中的结构域(FnCas12a)。黑色框指示参考序列的催化残基(和位置)。
图3A和7B描绘了V-A型和相关的V-A′效应子。图7A示出了由指向转录方向的箭头指示的V-A型(MG26-1)和V-A′型(MG26-2)。CRISPR阵列由灰色条指示。重叠群中每种蛋白质的预测结构域由框指示。图7B示出了V-A′MG26-2型和AsCas12a型参考序列的序列比对。顶部:RuvC-I结构域。中间:含有RuvC-I和RuvC-II催化残基的区。底部:含有RuvC-III催化残基的区。催化残基由正方形指示。
图8描绘了sgRNA和靶DNA在具有AacC2C1的三元复合物中的结构的示意图(参见Yang,Hui,Pu Gao,Kanagalaghatta R.Rajashankar和Dinshaw J.Patel.2016.“通过C2c1CRISPR-Cas核酸内切酶进行的PAM依赖性靶DNA识别和切割(PAM-Dependent TargetDNA Recognition and Cleavage bv C2c1 CRISPR-Cas Endonuclease).”《细胞(Cell)》167(7):1814-28.e12,所述文献通过全文引用的方式并入本文)。
图9描绘了sgRNA的R-AR结构域中的突变或截短对AacC2c1介导的线性质粒DNA的切割的影响;WT,野生型sgRNA。sgRNA内的突变核苷酸(泳道1-5)在左图中突出显示。Δ15:从sgRNA R-AR 1区缺失15nt。Δ12:12nt已从sgRNA J2/4R-AR 1区去除(参见Liu,Liang,Peng Chen,Min Wang,Xueyan Li,Jiuyu Wang,Maolu Yin和Yanli Wang.2017.“C2c1-sgRNA复合物结构揭示了RNA向导的DNA切割机制(C2c1-sgRNA Complex StructureReveals RNA-Guided DNA Cleavage Mechanism).”《分子细胞(MolecularCell)》65(2):310-22,所述文献通过全文引用的方式并入本文)。
图10A、10B和10C证明了CRISPR RNA(crRNA)结构在V-A型系统中是保守的。图10A示出了参考crRNA序列在LbCpf1系统中的折叠结构。图10B示出了与新V-A型系统相关的CRISPR重复序列的多序列比对。LbCpf1处理位点用黑色条指示。图10C示出了具有可替代的茎环基序CCUGC[N3-4]GCAGG的MG61-2推定crRNA的折叠结构。图10D示出了CRISPR重复序列与可替代的重复序列基序序列的多序列比对。指示处理位点和环。
图11描绘了本文所利用的向导RNA的预测结构(SEQ ID NO:3608)。
图12描绘了本文所描述的MG酶的对应sgRNA的预测结构(顺时针方向,SEQ ID NO:3636、3637、3641、3640)。
图13描绘了本文所描述的MG酶的对应sgRNA的预测结构(顺时针方向,SEQ ID NO:3644、3645、3649、3648)。
图14描绘了本文所描述的MG酶的对应sgRNA的预测结构(顺时针方向,SEQ ID NO:3652、3653、3657、3656)。
图15描绘了本文所描述的MG酶的对应sgRNA的预测结构(顺时针方向,SEQ ID NO:3660、3661、3665、3664)。
图16描绘了本文所描述的MG酶的对应sgRNA的预测结构(顺时针方向,SEQ ID NO:3666、3667、3672、3671)。
图17A和17B描绘了琼脂糖凝胶,其示出了在存在含有各种MG家族核酸酶和其对应的tracrRNA或sgRNA的TXTL提取物的情况下PAM载体文库切割的结果(如在实例12中所描述的)。图17A示出了泳道1:梯状条带。带从上到下为766、500、350、300、350、200、150、100、75、50;泳道2:28-1+MGcrRNA间隔子1(SEQ ID NO:141+3860);泳道3:29-1+MGcrRNA间隔子1(SEQ ID NO:215+3860);泳道4:30-1+MGcrRNA间隔子1(SEQ ID NO:226+3860);泳道5:31-1+MGcrRNA间隔子1(SEQ ID NO:229+3860);泳道6:32-1+MGcrRNA间隔子1(SEQ ID NO:261+3860);泳道7:梯状条带。图17B示出了泳道1:梯状条带;泳道2:LbaCas12a+LbaCas12acrRNA间隔子2;泳道3:LbaCas12a+MGcrRNA间隔子2;泳道4:Apo 13-1;泳道5:28-1+MGcrRNA间隔子2(SEQ ID NO:141+3861);泳道6:29-1+MGcrRNA间隔子2(SEQ ID NO:215+3861);泳道7:30-1+MGcrRNA间隔子2(SEQ ID NO:226+3861);泳道8:31-1+MGcrRNA间隔子2(SEQ ID NO:229+3861);泳道9:32-1+MGcrRNA间隔子2(SEQ ID NO:261+3861)
图18A、18B、18C、18D和18E提供了显示本文所描述的V-A型效应子是活性核酸酶的数据。图18A描绘了确定本文所描述的三种核酸酶的PAM序列的seqLogo表示。图18B示出了根据活性核酸酶的indel编辑的频率推断出的质粒转染活性测定的箱形图。箱线图的边界指示第一四分位数值和第三四分位数值。平均值用“x”指示,并且中值由每个框内的中线表示。图18C示出了MG29-1和AsCas12a在四个靶位点处的质粒转染编辑频率。用AsCas12a进行一个并排实验。图18D示出了具有TTN或CCN PAM的14个靶基因座处的核酸酶MG29-1的质粒和RNP编辑活性。图18E示出了来自RNP转染测定的核酸酶MG29-1的编辑谱。用AsCas12a进行一个并排实验。一式两份地进行MG29-1的编辑频率和谱实验。条形图图18C和图18D示出了具有一个标准偏差误差条的平均编辑频率。
图19描绘了通过用实例12中所描述的MG29-1构建体转染HEK细胞连同其含有靶向人基因组中的各个位置的各种不同靶向序列的对应sgRNA而产生的细胞indel形成。
图20描绘了通过如本文所描述的NGS衍生的特定MG家族酶的PAM序列的seqLogo表示(如在实例13中所描述的)。
图21描绘了通过如本文所描述的NGS衍生的特定MG家族酶的PAM序列的seqLogo表示(从上到下为SEQ ID NO:3865、3867、3872)。
图22描绘了通过如本文所描述的NGS衍生的PAM序列的seqLogo表示(从上到下为SEQ ID NO:3879、3880、3881)。
图23描绘了通过如本文所描述的NGS衍生的PAM序列的seqLogo表示(从上到下为SEQ ID NO:3883、3884、3885)。
图24描绘了通过如本文所描述的NGS衍生的PAM序列的seqLogo表示(SEQ ID NO:3882)。
图25描绘了通过用实例14中所描述的MG31-1构建体转染HEK细胞连同其含有靶向人基因组中的各个位置的各种不同靶向序列的对应sgRNA而产生的细胞indel形成。
图4A、26B和26C示出了V-A型核酸酶的生物化学表征。图26A示出了具有与其端连接的衔接子的切割产物的PCR示出当与通用crRNA结合时,本文所描述的核酸酶和Cpf1(阳性对照)的活性。预期切割产物带用箭头标记。图4B示出了具有与其端连接的衔接子的切割产物的PCR示出当与其天然crRNA结合时本文所描述的核酸酶的活性。切割产物带用箭头指示。图26C示出了对NGS切割位点的分析,示出了在位置22处的靶链上的切割,有时在21或23nt后切割频率较低。
图27A和27B描绘了本文所描述的V-L型核酸酶的多序列比对,从而示出了(图27A)V-L型核酸酶的示例性基因座组织,和(图27B)多序列比对。含有推定RuvC-III结构域的区示出为浅灰色矩形。推定RuvC催化残基在每个序列上方示出为小的深灰色矩形。推定单向导RNA结合序列是小的白色矩形,推定剪式磷酸酯结合位点由序列上方的黑色矩形指示,并且预测破坏靶序列中的剪式磷酸酯附近的碱基堆叠的残基由序列上方的小的中灰色矩形指示。
图28示出了作为示例性基因座组织的标记为MG60的V-L型候选物,连同效应子重复序列结构和系统发育树,从而示出了酶在V型家族中的位置。
图29示出了较小V型效应子的实例,其中一个可以标记为MG70。
图30示出了如本文所描述的MG70的特征信息。描绘了连同系统发育树的示例性基因座组织,所述系统发育树展示了这些酶在V型家族中的位置。
图31示出了如本文所描述的小V型效应子MG81的另一实例。描绘了连同系统发育树的示例性基因座组织,所述系统发育树展示了这些酶在V型家族中的位置。
图32示出本文所鉴定的V型效应子家族的单独酶(例如MG20、MG60、MG70、其它)的活性维持在各种不同的酶长度(例如400-1200AA)上。光点(真)指示活性酶,而暗点(未知)指示未测试的酶。
图33描绘了本文所描述的MG核酸酶的序列保守性。黑色条指示推定RuvC催化残基。
图34和图35描绘了本文所描述的MG核酸酶的区在图33中的多序列比对的放大版本,其含有推定RuvC催化残基(深灰色矩形)、剪性磷酸酯结合残基(黑色矩形)和预测破坏邻近剪性磷酸酯的碱基堆叠的残基(浅灰色矩形)。
图36描绘了本文所描述的MG核酸酶的含有推定RuvC-III结构域和催化残基的区。
图37描绘了含有推定单向导RNA结合残基(序列上方的白色矩形)的MG核酸酶的区。
图38描绘了代表来自若干MG V型家族的多蛋白质序列比对。示出了含有预测涉及核酸酶活性的RuvC结构域的部分的保守区。突出显示预测的催化残基。
图39示出了用于MG29-1基因编辑的TRAC基因座的筛选。条形图示出了由用靶向原代人T细胞中的TRAC基因座的54个单独的向导RNA转染MG29-1引起的indel产生。图中所描绘的对应向导RNA在SEQ ID NO:4316-4423中鉴定。
图40描绘了在TRAC处的MG29-1编辑的优化。条形图示出了由用图39的四种最佳22nt向导RNA(9、19、25和35)转染MG29-1(以指定浓度)引起的indel产生。图例:MG29-19是MG29-1效应子(SEQ ID NO:215)和向导9(SEQ ID NO:4378)、MG29-119是MG29-1效应子(SEQID NO:215)和向导19(SEQ ID NO:4388)、MG29-125是MG29-1效应子(SEQ ID NO:215)和向导25(SEQ ID NO:4394),并且MG29-135是MG29-1效应子(SEQ ID NO:215)和向导件35(SEQID NO:4404)。
图41描绘了用于TRAC处的MG29-1编辑的剂量和向导长度的优化。线图示出了由MG29-1和向导RNA#19(SEQ ID NO:4388)或向导RNA#35(SEQ ID NO:4404)的转染引起的indel产生。使用三种不同剂量的核酸酶/向导RNA。对于每种剂量,测试六个不同的向导长度,连续的单核苷酸3′截短为SEQ ID NO:4388和4404。在这种情况下,图39和图40中使用的向导是在此情况下长度为22nt的含间隔子的向导。
图42示出了实例22的实验中TRAC处的indel产生和T细胞受体表达的损失的相关性。
图43描绘了在由MG29-1切割刺激的TRAC处的靶向转基因整合。通过AAV感染单独接受转基因供体的细胞保留TCR表达并且缺乏CAR表达;用MG29-1RNP转染并且用100,000个vg(载体基因组)感染的CAR转基因供体的细胞失去TCR表达并获得CAR表达。示出了用以下转染的细胞的CAR抗原结合相对于TCR表达的FACS图:含有含CAR-T的供体序列(“AAV”)的单独的AAV;具有MG29-1酶和sgRNA 19(SEQ ID NO:4388)(包括22个核苷酸间隔子的“AAV+MG29-1-19-22”)的含有含CAR-T的供体序列的AAV;或具有MG29-1酶和sgRNA 35(SEQ IDNO:4404)(包括22个核苷酸间隔子的“AAV+MG29-1-35-22”)的含有含CAR-T的供体序列的AAV。
图44示出了造血干细胞中TRAC处的MG29-1基因编辑。条形图示出了与模拟转染的细胞相比,用MG29-1-9-22(“MG29-19”;MG29-1加向导RNA#19)和MG29-1-35-22(“MG29-135”;MG29-1加向导RNA#35)转染后TRAC处的indel产生的程度。
图45示出了基于细胞中基因编辑结果的分析的MG29-1 PAM的细化。使用5′-NTTN-3′PAM序列设计向导RNA,并且然后根据观察到的基因编辑活性进行分选。示出了每个仓的加下划线的碱基(5′-近端N)的身份。活性大于10%的向导中的所有向导在基因组DNA中的此位置处具有T,从而指示MG29-1PAM可以最好地描述为5′-TTTN-3′。示出了每个仓在此位置处的T的过表示的统计显著性。
图46描绘了基因编辑活性相对于MG29-1间隔子序列的基础组成的分析。条形图示出了展示GC含量(%)与indel频率之间的关系的实验数据(“高”表示>50%indel(N=4);“中等”表示10-50%indel(N=15);“>1%”表示1-5%indel(N=12);“<1%”表示小于1%indel(N=82))。
图47描绘了MG29-1向导RNA化学修饰。条形图示出了相对于未经修饰的向导RNA(样品#1),来自表7的修饰对VEGF-A编辑活性的后果。
图48描绘了各种经化学修饰的MG29-1 RNA的剂量滴定。条形图示出了使用修饰模式1、4、5、7和8用向导转染RNP之后的indel产生。RNP剂量为126pmol MG29-1和160pmol向导RNA或如所指示的。全剂量(A)、1/4(B)、1/8(C)、1/16(D)和1/32(E)。
图49描绘了pMG450(lac诱导型tac启动子大肠杆菌(E.coliBL21表达载体中的MG29-1核酸酶蛋白)的质粒谱。
图50描绘了具有间隔子mALb29-1-8(SEQ ID NO:3999)的MG29-1与具有靶向小鼠白蛋白内含子1的向导的spCas9相比的indel谱。
图51是MG29-1的代表性indel谱,其中靶向小鼠白蛋白内含子1的向导通过下一代测序(分析了大约15,000个总读段)确定,如实例29所示。
图52示出了如实例29所示用RNP核感染的小鼠肝脏细胞系Hepa1-6中MG29-1与spCas9相比的编辑效率。
图53A、53B、53C和53D示出了与野生型MG29-1相比,具有单氨基酸取代和双氨基酸取代的MG29-1变体的哺乳动物细胞中的编辑效率。图53A描绘了用编码MG29-1WT或突变版本的质粒转染的Hepa 1-6细胞中的编辑效率。图53B描绘了用编码各种浓度的WT或S168R的mRNA转染的Hepa 1-6细胞中的编辑效率。图53C描绘了用具有单氨基酸取代或双氨基酸取代的MG29-1的mRNA编码版本转染的Hepa 1-6细胞中的编辑效率。图53D描绘了用MG29-1 WT相对于S168R与13个向导的组合转染的Hepa 1-6和HEK293T细胞中的编辑效率。12个向导对应于表7中的向导。向导“35(TRAC)”是靶向人基因座TRAC的向导。
图54示出了MG29-1向导mAlb29-1-8的预测次级结构。
图55示出了MG29-1 sgRNA序列的化学修饰对哺乳动物细胞的全细胞提取物中的sgRNA的稳定性的影响。
图56A、56B和56C示出了在用MG29-1蛋白、向导RNA和适当的模板进行的体外反应中使用测序来鉴定靶链上的切割位点。图56A示出了如通过下一代测序确定的核苷酸中切割位置与PAM的距离。图56B示出了使用桑格测序(Sanger Sequencing)来定义靶链上的MG29-1切割位点。图56C示出了使用桑格测序来定义非靶链上的MG29-1切割位点。对含有MG29-1的体外反应、向导和适当的模板进行失控桑格测序以评估两条链的切割。靶链上的切割位点是位置23处的切割位点,其与示出在21-23个碱基处的切割的图56A中的NGS数据一致。序列端处的“A”峰是由于聚合酶径流引起的并且是预期的。非靶链上的切割位点可见于其中预期终止碱基是“T”的反向读段中。标记的点(线)示出了在位置17处从PAM切割,并且然后从末端T切割。然而,在位置18、19和20处存在来自PAM的混合T信号,从而表明在位置17、18和19处的此链上的可变切割。
图57描绘了CD38在DNA水平下的基因编辑结果。CD38和TRAC的酿脓链球菌(S.pyogenes)(Spy)Cas9向导在右侧示出。
图58描绘了CD38在表型水平下的基因编辑结果。
图59描绘了TIGIT在DNA水平下的基因编辑结果。
图60描绘了AAVS1在DNA水平下的基因编辑结果。
图61描绘了B2M在DNA水平下的基因编辑结果。
图62描绘了CD2在DNA水平下的基因编辑结果。
图63描绘了CD5在DNA水平下的基因编辑结果。
图64A描绘了小鼠TRAC在DNA水平下的基因编辑结果。图64B描绘了小鼠TRAC的基因编辑的流式细胞术结果。
图65描绘了TRAC敲除的百分比相对于indel的百分比。
图66A描绘了小鼠TRBC1在DNA水平下的基因编辑结果。图66B描绘了小鼠TRBC2在DNA水平下的基因编辑结果。图66C描绘了用于人TRBC1/2的基因编辑的流式细胞术结果。
图67描绘了HPRT在DNA水平下的基因编辑结果。
图68描绘了当使用脂质体信使Max作为mRNA和gRNA递送时,经化学修饰的向导在Hepa1-6细胞中的活性。
图69描绘了用修饰44修饰的向导相对于端修饰的或未经修饰的向导的稳定性。
图70A和70B描绘了II型和V型系统的向导稳定性的比较。图70A描绘了未经修饰的向导的稳定性数据。图70B描绘了具有5′和3′端修饰的向导的稳定性数据。
图71描绘了MG29-1(V型)和MG3-6/3-4(II型)向导RNA的预测次级结构。示出了主链(tracr)部分。
图72描绘了与来自Hepa1-6细胞的细胞裂解物中的mAlb298-37相比,向导mAlb298-34的稳定性。
图73描绘了在体内递送之后小鼠肝脏中MG29-1的编辑效率。
图74描绘了通过NGS对T细胞中mRNA电穿孔的基因编辑结果的分析。
图75描绘了通过NGS对经化学修饰的基因编辑结果的分析。
图76描绘了来自在1∶50的血清稀释下进行的筛选的ELISA结果,以检测针对MG29-1的抗体(n=50)。由于针对此抗原的广泛接种疫苗,使用破伤风类毒素作为阳性对照。虚线上方的血清样品被认为是抗体阳性的;该线表示阴性对照(人白蛋白)的平均吸光度加与平均值的两个标准偏差。*P<0.05,**P<0.01,****P<0.0001,如通过未配对的斯图登氏t测试所确定的;ns,不显著。
图77描绘了如通过NGS测量的小鼠肝脏中的HAO-1编辑效率。每个点表示单独的小鼠。
图78A-B描绘了如通过蛋白质印迹评估的,HAO-1编辑对小鼠肝脏中的乙醇酸氧化酶(GO)蛋白水平的影响。每个样品负载10μg的总蛋白。
图79描绘了与用包封MG29-1 mRNA的脂质纳米颗粒(LNP)和向导mH29-1_37或mH29-5_37处理的两只单独的小鼠相比,未经处理的小鼠中的乙醇酸氧化酶(GO)蛋白水平的蛋白质印迹分析。将来自每只小鼠的三种不同量的总肝脏蛋白(40μg、20μg和10μg)负载到凝胶上,然后处理,用于检测小鼠乙醇酸氧化酶蛋白。
图80描绘了MG29-1和靶向小鼠肝脏中的HAO-1基因的sgRNA的示例性INDEL谱。从小鼠#17(用包封mH29-29_37和MG29-1 WT mRNA的脂质纳米颗粒处理)获取样品。
图81描绘了人外周血B细胞中TRAC在DNA水平下的基因编辑结果。
图82描绘了造血干细胞中TRAC在DNA水平下的基因编辑结果。
图83描绘了诱导性多能干细胞(iPSC)中TRAC在DNA水平下的基因编辑结果。
图84描绘了如通过下一代测序(NGS)定量的用MG29-1进行的体内基因组编辑的结果。
图85描绘了如通过下一代测序(NGS)测量的由MG29-1核酸酶和向导298-37产生的示例性INDEL谱。
图86描绘了靶向两个基因座的MG29-1向导的间隔子长度优化。
图87描绘了MG29-1和MG3-6/3-4的sgRNA的体外稳定性。
图88描绘了MG29-1和MG3-6/3-4的向导RNA的主链部分的预测次级结构。
图89描绘了具有靶向小鼠白蛋白的间隔子的MG3-6/3-4向导的预测次级结构。
图90描绘了具有来自添加到5′端的MG3-6/3-4的茎环1的MG29-1向导的预测次级结构。
图91描绘了通过mRNA转染或RNP核转染在Hepa1-6细胞中具有化学物质44或50的小鼠白蛋白向导8的MG29-1的编辑效率。
图92描绘了在给药包封MG29-1 mRNA的LNP和四种不同向导RNA中的一种向导RNA后小鼠的肝脏中的编辑。
图93描绘了RNA分子mAlb29-g8-37-阵列的预测次级结构。
图94描绘了示出在静脉内注射包封以下中的一项的LNP后5天,小鼠的全肝脏中的编辑效率的图:(1)三种不同剂量的MG29-1 mRNA和向导mAlb29-8-50(mA29-8-50);(2)三种不同剂量的spCas9 mRNA和向导mAlbR2;或(3)PBS缓冲液(对照)。每个圆圈代表一只单个小鼠,并且条指示平均值和标准偏差。
图95描绘了用MG29-1 mRNA和靶向人HAO-1的6个sgRNA转染的Hep3B细胞中的编辑活性。
图96描绘了用核糖核蛋白复合物转染的HuH7和Hep3B细胞中靶向人HAO-1的4个MG29-1 sgRNA的编辑活性。
图97描绘了具有靶向原代人肝细胞中的人HAO-1基因的sgRNA的MG29-1的编辑活性。
图98A描绘了原代人肝细胞中的MG29-1 sgRNAhH29-4-37和hH29-21-37的代表性indel谱。图98B描绘了原代人肝细胞中的MG29-1 sgRNAhH29-23-37和hH29-41-37的代表性indel谱。
图99描绘了在小鼠肝脏中的具有靶向小鼠HAO-1的22个核苷酸或20个核苷酸间隔子的MG29-1向导RNA的活性。
图100描绘了mRNA/向导RNA比率和单独的调配物或共调配物对小鼠肝脏中的编辑效率的影响。
图101描绘了在LNP中体内递送后MG29-1向导化学物质对小鼠肝脏中的编辑活性的评估。
图102描绘了Hepa1-6细胞中APO-A1在DNA水平下的基因编辑结果。
图103描绘了Hepa1-6细胞中ANGPTL3在DNA水平下的基因编辑结果。
图104A-E描绘了MG55-43的体外表征。图104A示出了MG55-43核酸酶附近的基因组区。基因由橙色箭头表示。编码候选物核酸酶的基因包含“推定转座酶DNA结合结构域”。CRISPR阵列由重复序列和间隔子表示。预测tracrRNA示出为阵列与核酸酶之间的箭头,并且标记为“预测修剪的TracrRNA-CM2”。图104B示出了活性单向导RNA设计(tracrRNA和通过四环连接的重复序列)。氮化了的碱基的颜色对应于碱基的碱基配对的概率,其中红色是高概率,并且蓝色是低概率。图104C示出了示出用sgRNA和两个不同的间隔子(U67和U40)进行的质粒靶DNA文库的体外切割的琼脂糖凝胶。未示出与MG55-43核酸酶不相关的泳道。图104D示出了示出MG55-43 PAM序列的序列标志。图104E示出了示出用MG55-43测试的间隔子序列中的切割位点位置的直方图。
图105A-C描绘了编码MG91核酸酶的基因组区的实例。基因由箭头表示,其中编码此类标记的候选物核酸酶的基因。CRISPR阵列由重复序列和间隔子表示。可能编码活性tracrRNA的基因间区突出显示为标记IG#或基因间区#的条。
图106描绘了可能含有tracrRNA的基因间区核苷酸序列的多序列比对。顶部的绿条指示基因间区的序列之间的高度相似性。图106A示出了MG91-15核酸酶附近的基因间区2和其相关物。图106B示出了MG91-32核酸酶附近的基因间区2及和其相关物。图106C示出了MG91-87核酸酶附近的基因间区2和其相关物。
图107A-D描绘了单向导RNA设计和体外切割测定结果。对于单向导RNA设计(tracrRNA和重复序列),碱基的颜色对应于所述碱基的碱基配对的概率,其中红色是高概率,并且蓝色是低概率。图107A描绘了MG91-15 sgRNA1,图107B描绘了MG91-32 sgRNA1,并且图107C描绘了MG91-87 sgRNA1。图107D描绘了示出具有不同sgRNA设计(sgRNA1和sgRNA2)和两个不同间隔子(U67和U40)的质粒靶DNA文库的体外切割的琼脂糖凝胶。未示出与这些核酸酶不相关的泳道。
图108A-F描绘了预测PAM序列的序列标志和示出切割位点位置的直方图。图108A、108B和108C描绘了分别示出MG91-15、MG91-32和MG91-87的PAM序列的序列标志。图108D、108E和108F描绘了分别示出用MG91-15、MG91-32和MG91-87测试的间隔子序列中的切割位点位置的直方图。
图109描绘了可用于本文所描述的脂质纳米颗粒的示例性阳离子脂质的结构。
序列表简要说明
随此提交的序列表提供了用于根据本公开的方法、组合物和系统的示例性多核苷酸和多肽序列。下文是其中的序列的示例性描述。
MG11
SEQ ID NO:1-37示出了MG11核酸酶的全长肽序列。
SEQ ID NO:3471示出了被设计成与MG11核酸酶一起发挥作用的crRNA 5′直接重复序列。
SEQ ID NO:3472-3538示出了MG11核酸酶的效应子重复序列基序。
SEQ ID NO:38-118示出了MG13核酸酶的全长肽序列。
SEQ ID NO:3540-3550示出了MG13核酸酶的效应子重复序列基序。
MG19
SEQ ID NO:119-124示出了MG19核酸酶的全长肽序列。
SEQ ID NO:3551-3558示出了被工程化成与MG19核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:3863-3866示出了与MG19核酸酶相容的PAM序列。
MG20
SEQ ID NO:125示出了MG20核酸酶的全长肽序列。
SEQ ID NO:3559示出了被工程化成与MG20核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:3867示出了与MG20核酸酶相容的PAM序列。
MG26
SEQ ID NO:126-140示出了MG26核酸酶的全长肽序列。
SEQ ID NO:3560-3572示出了MG26核酸酶的效应子重复序列基序。
MG28
SEQ ID NO:141-214示出了MG28核酸酶的全长肽序列。
SEQ ID NO:3573-3607示出了MG28核酸酶的效应子重复序列基序。
SEQ ID NO:3608-3609示出了被设计成与MG28核酸酶一起发挥作用的crRNA 5′直接重复序列。
SEQ ID NO:3868-3869示出了与MG28核酸酶相容的PAM序列。
MG29
SEQ ID NO:215-225示出了MG29核酸酶的全长肽序列。
SEQ ID NO:5680示出了含有5′UTR、NLS、CDS、NLS、3′UTR和polyA尾的MG29-1核酸酶的核苷酸序列。
SEQ ID NO:3610-3611示出了MG29核酸酶的效应子重复序列基序。
SEQ ID NO:3612示出了被工程化成与MG29核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:3870-3872示出了与MG29核酸酶相容的PAM序列。
SEQ ID NO:5687示出了用于产生mRNA的MG29-1编码序列。
SEQ ID NO:5830和5846示出了编码MG29-1 mRNA的DNA序列。
MG30
SEQ ID NO:226-228示出了MG30核酸酶的全长肽序列。
SEQ ID NO:3613-3615示出了MG30核酸酶的效应子重复序列基序。
SEQ ID NO:3873示出了与MG30核酸酶相容的PAM序列。
MG31
SEQ ID NO:229-260示出了MG31核酸酶的全长肽序列。
SEQ ID NO:3616-3632示出了MG31核酸酶的效应子重复序列基序。
SEQ ID NO:3874-3876示出了与MG31核酸酶相容的PAM序列。
MG32
SEQ ID NO:261示出了MG32核酸酶的全长肽序列。
SEQ ID NO:3633-3634示出了MG32核酸酶的效应子重复序列基序。
SEQ ID NO:3876示出了与MG32核酸酶相容的PAM序列。
MG37
SEQ ID NO:262-426示出了MG37核酸酶的全长肽序列。
SEQ ID NO:3635示出了MG37核酸酶的效应子重复序列基序。
SEQ ID NO:3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657和3660-3661示出了被工程化成与MG37核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:3638、3642、3646、3650、3654、3658和3662示出了衍生自与上述MG37核酸酶相同的基因座的MG37 tracrRNA的核苷酸序列。
SEQ ID NO:3639、3643、3647、3651、3655和3659示出了衍生自当将5′置于3′靶向或间隔子序列时充当crRNA的天然MG37基因座的5′直接重复序列。
MG53
SEQ ID NO:427-428示出了MG53核酸酶的全长肽序列。
SEQ ID NO:3663示出了衍生自当将5′置于3′靶向或间隔子序列时充当crRNA的天然MG53基因座的5′直接重复序列。
SEQ ID NO:3664-3667示出了被工程化成与MG53核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:3668-3669示出了衍生自与上述MG53核酸酶相同基因座的MG53tracrRNA的核苷酸序列。
MG54
SEQ ID NO:429-430示出了MG54核酸酶的全长肽序列。
SEQ ID NO:3670示出了衍生自当将5′置于3′靶向或间隔子序列时充当crRNA的天然MG54基因座的5′直接重复序列。
SEQ ID NO:3671-3672示出了被工程化成与MG54核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:3673-3676示出了衍生自与上述MG54核酸酶相同基因座的MG54tracrRNA的核苷酸序列。
MG55
SEQ ID NO:431-688示出了MG55核酸酶的全长肽序列。
SEQ ID NO:6031示出了被工程化成与MG55核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:6032示出了与MG55核酸酶相容的PAM序列。
MG56
SEQ ID NO:689-690示出了MG56核酸酶的全长肽序列。
SEQ ID NO:3678示出了被设计成与MG56核酸酶一起发挥作用的crRNA 5′直接重复序列。
SEQ ID NO:3679-3680示出了MG56核酸酶的效应子重复序列基序。
MG57
SEQ ID NO:691-721示出了MG57核酸酶的全长肽序列。
SEQ ID NO:3681-3694示出了MG57核酸酶的效应子重复序列基序。
SEQ ID NO:3695-3696示出了被工程化成与MG57核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:3879-3880示出了与MG57核酸酶相容的PAM序列。
MG58
SEQ ID NO:722-779示出了MG58核酸酶的全长肽序列。
SEQ ID NO:3697-3711示出了MG58核酸酶的效应子重复序列基序。
MG59
SEQ ID NO:780-792示出了MG59核酸酶的全长肽序列。
SEQ ID NO:3712-3728示出了MG59核酸酶的效应子重复序列基序。
SEQ ID NO:3729-3730示出了被工程化成与MG59核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:3881-3882示出了与MG59核酸酶相容的PAM序列。
MG60
SEQ ID NO:793-1163示出了MG60核酸酶的全长肽序列。
SEQ ID NO:3731-3733示出了MG60核酸酶的效应子重复序列基序。
MG61
SEQ ID NO:1164-1469示出了MG61核酸酶的全长肽序列。
SEQ ID NO:3734-3735示出了被设计成与MG61核酸酶一起发挥作用的crRNA 5′直接重复序列。
SEQ ID NO:3736-3847示出了MG61核酸酶的效应子重复序列基序。
MG62
SEQ ID NO:1470-1472示出了MG62核酸酶的全长肽序列。
SEQ ID NO:3848-3850示出了MG62核酸酶的效应子重复序列基序。
MG70
SEQ ID NO:1473-1514示出了MG70核酸酶的全长肽序列。
MG75
SEQ ID NO:1515-1710示出了MG75核酸酶的全长肽序列。
MG77
SEQ ID NO:1711-1712示出了MG77核酸酶的全长肽序列。
SEQ ID NO:3851-3852示出了被工程化成与MG77核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:3883-3884示出了与MG77核酸酶相容的PAM序列。
MG78
SEQ ID NO:1713-1717示出了MG78核酸酶的全长肽序列。
SEQ ID NO:3853示出了被工程化成与MG78核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:3885示出了与MG78核酸酶相容的PAM序列。
MG79
SEQ ID NO:1718-1722示出了MG79核酸酶的全长肽序列。
SEQ ID NO:3854-3857示出了被工程化成与MG79核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:3886-3889示出了与MG79核酸酶相容的PAM序列。
MG80
SEQ ID NO:1723示出了MG80核酸酶的全长肽序列。
MG81
SEQ ID NO:1724-2654示出了MG81核酸酶的全长肽序列。
MG82
SEQ ID NO:2655-2657示出了MG82核酸酶的全长肽序列。
MG83
SEQ ID NO:2658-2659示出了MG83核酸酶的全长肽序列。
MG84
SEQ ID NO:2660-2677示出了MG84核酸酶的全长肽序列。
MG85
SEQ ID NO:2678-2680示出了MG85核酸酶的全长肽序列。
MG90
SEQ ID NO:2681-2809示出了MG90核酸酶的全长肽序列。
MG91
SEQ ID NO:2810-3470示出了MG91核酸酶的全长肽序列。
SEQ ID NO:6033-6036示出了被工程化成与MG91核酸酶一起发挥作用的sgRNA的核苷酸序列。
SEQ ID NO:6037-6039示出了与MG91核酸酶相容的PAM序列。
SEQ ID NO:6040-6049示出了潜在编码tracrRNA的MG91基因间区。
SEQ ID NO:6050-6059示出了MG91 CRISPR重复序列。
间隔子区段
SEQ ID NO:3858-3861示出了间隔子区段的核苷酸序列。
NLS
SEQ ID NO:3938-3953示出了根据本公开的可以附加到核酸酶的示例性核定位序列(NLS)的序列。
CD38靶向
SEQ ID NO:4428-4465和5685示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向CD38的sgRNA的核苷酸序列。
SEQ ID NO:4466-4503和5686示出了CD38靶位点的DNA序列。
TIGIT靶向
SEQ ID NO:4504-4520示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向TIGIT的sgRNA的核苷酸序列。
SEQ ID NO:4521-4537示出了TIGIT靶位点的DNA序列。
AAVS1靶向
SEQ ID NO:4538-4568示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向AAVS1的sgRNA的核苷酸序列。
SEQ ID NO:4569-4599示出了AAVS1靶位点的DNA序列。
B2M靶向
SEQ ID NO:4600-4675示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向B2M的sgRNA的核苷酸序列。
SEQ ID NO:4676-4751示出了B2M靶位点的DNA序列。
CD2靶向
SEQ ID NO:4752-4836示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向CD2的sgRNA的核苷酸序列。
SEQ ID NO:4837-4921示出了CD2靶位点的DNA序列。
CD5靶向
SEQ ID NO:4922-4945示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向CD5的sgRNA的核苷酸序列。
SEQ ID NO:4946-4969示出了CD5靶位点的DNA序列。
hRosa26靶向
SEQ ID NO:4970-5012示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向hRosa26的sgRNA的核苷酸序列。
SEQ ID NO:5013-5055示出了hRosa26靶位点的DNA序列。
TRAC靶向
SEQ ID NO:5056-5125、5681和5683示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向TRAC的sgRNA的核苷酸序列。
SEQ ID NO:5126-5195、5682和5684示出了TRAC靶位点的DNA序列。
TRBC1靶向
SEQ ID NO:5196-5210示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向TRBC1的sgRNA的核苷酸序列。
SEQ ID NO:5211-5225示出了TRBC1靶位点的DNA序列。
TRBC2靶向
SEQ ID NO:5226-5246示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向TRBC2的sgRNA的核苷酸序列。
SEQ ID NO:5247-5267示出了TRBC2靶位点的DNA序列。
TRBC1/2靶向
SEQ ID NO:5642-5660示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向TRBC的sgRNA的核苷酸序列。
SEQ ID NO:5661-5679示出了TRBC靶位点的DNA序列。
FAS靶向
SEQ ID NO:5268-5366示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向FAS的sgRNA的核苷酸序列。
SEQ ID NO:5367-5465示出了FAS靶位点的DNA序列。
PD-1靶向
SEQ ID NO:5466-5473示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向PD-1的sgRNA的核苷酸序列。
SEQ ID NO:5474-5481示出了PD-1靶位点的DNA序列。
HPRT靶向
SEQ ID NO:5482-5561示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向HPRT的sgRNA的核苷酸序列。
SEQ ID NO:5562-5641示出了HPRT靶位点的DNA序列。
HAO-1靶向
SEQ ID NO:5788-5829和5831-5834示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向人HAO-1的sgRNA的核苷酸序列。
SEQ ID NO:5836-5845示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向小鼠HAO-1的sgRNA的核苷酸序列。
APO-A1靶向
SEQ ID NO:5847-5860示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向小鼠APO-A1的sgRNA的核苷酸序列。
SEQ ID NO:5861-5874示出了APO-A1靶位点的DNA序列。
ANGPTL3靶向
SEQ ID NO:5875-5952示出了被工程化成与MG29-1核酸酶一起发挥作用以便靶向小鼠ANGPTL3的sgRNA的核苷酸序列。
SEQ ID NO:5953-6030示出了ANGPTL3靶位点的DNA序列。
具体实施方式
虽然本文中已经示出并描述了本发明的各种实施例,但是对于本领域的技术人员显而易见的是,这些实施例仅作为实例提供。在不脱离本发明的情况下,本领域技术人员可以想到多种变化、改变和替换。应当理解,可以采用本文所述的本发明实施例的各种替代方案。
除非另有指示,否则本文所公开的一些方法的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的技术。参见例如,Sambrook和Green等人,《分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》,第4版(2012);丛书《当代分子生物学实验指南(Current Protocols in Molecular Biology)》(F.M.Ausubel等人编辑);丛书《酶学方法(Methods In Enzymology)》(学术出版社公司(Academic Press,Inc.)),《PCR 2:实用方法(PCR 2:A Practical Approach)》(M.J.MacPherson,B.D.Hames和G.R.Taylor编辑(1995)),Harlow和Lane编辑(1988)《抗体:实验室手册(Antibodies,A Laboratory Manual)》以及《动物细胞培养:基础技术和专门应用手册(Culture of Animal Cells:A Manual of Basic Technique and SpecializedApplications)》,第6版(R.I.Freshney编辑(2010))(所述文献通过引用整体并入本文)。
如本文所使用的,除非上下文另外清楚地指示,否则单数形式“一个/一种(a/an)”和“所述”也旨在包含复数形式。此外,在详细描述和/或权利要求中使用术语“包含(including)”、“包含(include)”、“具有(having)”、“具有(has)”、“具有(with)”或其变体的情况下,这种术语旨在以类似于术语“包括(comprising)”的方式是包含性的。
术语“约(about)”或“大约(approximately)”意指在如由本领域普通技术人员确定的特定值的可接受误差范围内,这将部分地取决于值是如何测量或确定的,即,测量系统的局限性。例如,“约”可以意指按照本领域的实践在一个或超过一个标准偏差内。可替代地,“约”可以意指给定值的至多20%、至多15%、至多10%、至多5%或至多1%的范围。
如本文所使用的,“细胞”通常是指生物细胞。细胞可以是活生物体的基本结构、功能和/或生物单位。细胞可以源自具有一个或多个细胞的任何生物体。一些非限制性实例包含:原核细胞、真核细胞、细菌细胞、古细菌细胞,单细胞真核生物体的细胞、原生动物细胞、来自植物(例如来自种植农作物、水果、蔬菜、谷物、大豆、玉米、玉蜀黍、小麦、种子、西红柿、大米、木薯、甘蔗、南瓜、干草、土豆、棉花、大麻、烟草、开花植物、针叶树、裸子植物、蕨类植物、石松、金鱼藻、地钱、苔藓的细胞)的细胞、藻细胞(例如,布朗葡萄藻(Botryococcusbraunii)、莱茵衣藻(Chlamydomonas reinhardti)、拟微球藻(Nannochloropsisgaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、C.Agardh展枝马尾藻(Sargassumpatens C.Agardh)等)、海藻(例如海带)、真菌细胞(例如酵母细胞,来自蘑菇的细胞)、动物细胞、来自无脊椎动物(例如果蝇、刺胞动物、棘皮动物、线虫等)的细胞、来自脊椎动物(例如鱼、两栖动物、爬行动物、鸟、哺乳动物)的细胞、来自哺乳动物(例如猪、牛、山羊、绵羊、啮齿动物、大鼠、小鼠、非人灵长类动物、人等)的细胞等。有时,细胞并非源自天然生物体(例如,细胞可以是合成制造的,有时称为人工细胞)。
如本文所使用的,术语“核苷酸”通常是指碱基-糖-磷酸组合。核苷酸可以包括合成核苷酸。核苷酸可以包括合成核苷酸类似物。核苷酸可以是核酸序列(例如脱氧核糖核酸(DNA)和核糖核酸(RNA))的单体单元。术语核苷酸可以包含核糖核苷三磷酸、腺苷三磷酸(ATP)、尿苷三磷酸(UTP)、胞嘧啶三磷酸(CTP)、鸟苷三磷酸(GTP)和脱氧核糖核苷三磷酸如dATP、dCTP、dITP、dUTP、dGTP、dTTP或其衍生物。此类衍生物可以包含例如[αS]dATP、7-脱氮-dGTP和7-脱氮-dATP,以及赋予含有它们的核酸分子核酸酶抗性的核苷酸衍生物。如本文所使用的,术语核苷酸可以是指双脱氧核糖核苷三磷酸(ddNTP)和其衍生物。双脱氧核糖核苷三磷酸的说明性实例可以包含但不限于:ddATP、ddCTP、ddGTP、ddITP和ddTTP。核苷酸可以是未标记的或可检测标记的,如使用包括光学可检测部分(例如荧光团)的部分。也可以用量子点进行标记。可检测标记可以包含例如放射性同位素、荧光标记、化学发光标记、生物发光标记和酶标记。核苷酸的荧光标记可以包含但不限于荧光素、5-羧基荧光素(FAM)、2′7′-二甲氧基-4′5-二氯-6-羧基荧光素(JOE)、罗丹明、6-羧基罗丹明(R6G)、N,N,N′,N′-四甲基-6-羧基罗丹明(TAMRA)、6-羧基-X-罗丹明(ROX)、4-(4′二甲氨基苯偶氮基)苯甲酸(DABCYL)、瀑布蓝、俄勒冈绿、德克萨斯红、青色素和5-(2′-氨乙基)氨基萘-1-磺酸(EDANS)。荧光标记的核苷酸的具体实例可以包含可从加利福尼亚州福斯特市的铂金埃尔默公司(Perkin Elmer,Foster City,Calif)获得的[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP和[dROX]ddTTP;可从伊利诺伊州阿灵顿高地的安玛西亚公司(Amersham,Arlington Heights,Il.)获得的FluoroLink脱氧核苷酸、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink FluorX-dCTP、FluoroLink Cy3-dUTP和FluoroLink Cy5-dUTP;可从印第安纳州印第安纳波利斯的宝灵曼公司(Boehringer Mannheim,Indianapolis,Ind.)获得的荧光素-15-dATP、荧光素-12-dUTP、四甲基-罗丹明-6-dUTP、IR770-9-dATP、荧光素-12-ddUTP、荧光素-12-UTP和荧光素-15-2′-dATP;以及可从俄勒冈州尤金的分子探针公司(Molecular Probes,Eugene,Oreg)获得的染色体标记的核苷酸、BODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、瀑布蓝-7-UTP、瀑布蓝-7-dUTP、荧光素-12-UTP、荧光素-12-dUTP、俄勒冈绿488-5-dUTP、罗丹明绿-5-UTP、罗丹明绿-5-dUTP、四甲基罗丹明-6-UTP、四甲基罗丹明-6-dUTP、德克萨斯红-5-UTP、德克萨斯红-5-dUTP和德克萨斯红-12-dUTP。核苷酸也可以通过化学修饰进行标记或标出。经化学修饰的单核苷酸可以是生物素-dNTP。生物素化dNTP的一些非限制性实例可以包含生物素-dATP(例如bio-N6-ddATP、生物素-14-dATP)、生物素-dCTP(例如生物素-11-dCTP、生物素-14-dCTP)和生物素-dUTP(例如生物素-11-dUTP、生物素-16-dUTP、生物素-20-dUTP)。
术语“多核苷酸”、“寡核苷酸”和“核酸”可互换使用以通常指代任何长度的核苷酸的聚合形式,脱氧核糖核苷酸或核糖核苷酸或其类似物,呈单链、双链或多链形式。多核苷酸对于细胞可以是外源性的或内源性的。多核苷酸可以存在于无细胞环境中。多核苷酸可以是基因或其片段。多核苷酸可以是DNA。多核苷酸可以是RNA。多核苷酸可以具有任何三维结构,并且可以进行任何功能。多核苷酸可以包括一种或多种类似物(例如,改变的主链、糖或核碱基)。如果存在,则可以在组装聚合物之前或之后赋予对核苷酸结构的修饰。类似物的一些非限制性实例包含:5-溴尿嘧啶、肽核酸、异源核酸、吗啉代、锁核酸、甘油核酸、苏糖核酸、双脱氧核苷酸、虫草素、7-脱氮-GTP、荧光团(例如,与糖连接的罗丹明或荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、CpG岛、甲基-7-鸟苷、甲基化核苷酸、肌苷、硫尿苷、假尿苷、二氢尿苷、辫苷和怀俄苷。多核苷酸的非限制性实例包含基因或基因片段的编码或非编码区、根据连接分析定义的多个基因座(一个基因座)、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的DNA、包含无细胞DNA(cfDNA)和无细胞RNA(cfRNA)的无细胞多核苷酸、核酸探针和引物。核苷酸序列可以间杂有非核苷酸组分。
术语“转染”或“转染的”通常指通过非病毒或基于病毒的方法将核酸引入细胞中。核酸分子可以是编码完整蛋白或其功能部分的基因序列。参见例如Sambrook等人(1989),《分子克隆:实验室手册》,18.1-18.88(所述文献通过引用整体并入本文)。
术语“肽”、“多肽”和“蛋白质”在本文中可互换使用以通常指代至少两个通过肽键连接的氨基酸残基的聚合物。此术语不表示聚合物的具体长度,也不旨在暗示或区分肽是使用重组技术、化学或酶促合成产生的还是天然存在的。所述术语适用于天然存在的氨基酸聚合物以及包括至少一种经修饰的氨基酸的氨基酸聚合物。在一些情况下,聚合物可以间杂有非氨基酸。所述术语包含任何长度的氨基酸链,包含全长蛋白质以及具有或不具有次级和/或三级结构(例如,结构域)的蛋白质。术语还涵盖已被修饰的氨基酸聚合物;例如通过二硫键形成、糖基化、脂化、乙酰化、磷酸化、氧化和任何其它操作,如与标记组分缀合。如本文所使用的,术语“氨基酸(amino acid)”和“氨基酸(amino acids)”通常是指天然和非天然氨基酸,包含但不限于经修饰的氨基酸和氨基酸类似物。经修饰的氨基酸可以包含已被化学修饰以包含非天然存在于氨基酸上的基团或化学部分的天然氨基酸和非天然氨基酸。氨基酸类似物可以指氨基酸衍生物。术语“氨基酸”包含D-氨基酸和L-氨基酸。
如本文所使用的,“非天然”通常可以指在天然核酸或蛋白质中未发现的核酸或多肽序列。非天然可以指亲和标签。非天然可以指融合物。非天然可以指天然存在的包括突变、插入和/或缺失的核酸或多肽序列。非天然序列可以表现出和/或编码也可以由与非天然序列融合的核酸和/或多肽序列表现出的活性(例如,酶活性、甲基转移酶活性、乙酰转移酶活性、激酶活性、泛素化活性等)。非天然核酸或多肽序列可以通过基因工程化与天然存在的核酸或多肽序列(或其变体)连接以产生嵌合核酸和/或编码嵌合核酸和/或多肽的多肽序列。
如本文所使用的,术语“启动子”通常是指控制基因转录或表达并且可以位于与启动RNA转录的核苷酸或核苷酸的区邻近或重叠的调节DNA区。启动子可以含有结合蛋白质因子(通常称为转录因子)的特定DNA序列,其促进RNA聚合酶与DNA的结合,从而导致基因转录。‘基础启动子’,也称为‘核心启动子’,通常可以指含有促进可操作连接的多核苷酸转录表达的所有基本元件的启动子。真核基础启动子可以含有TATA盒和/或CAAT盒。
如本文所使用的,术语“表达”通常是指从DNA模板转录核酸序列或多核苷酸(如转录为mRNA或其它RNA转录本)的过程和/或随后将经转录的mRNA翻译为肽、多肽、或蛋白质的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸衍生自基因组DNA,则表达可以包含在真核细胞中的mRNA的剪接。
如本文所使用的,“可操作地连接”、“可操作连接”、“操作性地连接”或其语法等效物通常是指遗传元素,例如启动子、增强子、聚腺苷酸化序列等的并置,其中所述元素处于允许其以预期方式操作的关系中。例如,如果调节元件有助于启动编码序列的转录,则可以包括启动子和/或增强子序列的调节元件可操作地连接到编码区。只要维持这种功能关系,调节元件与编码区之间就会存在插入残基。
如本文所使用的,“载体”通常是指包括多核苷酸或与多核苷酸缔合并且可以用于介导多核苷酸到细胞的递送的大分子或大分子缔合物。载体的实例包含质粒、病毒载体、脂质体和其它基因递送媒剂。载体通常包括遗传元件,例如调节元件,其可操作地连接到基因以促进基因在靶标中的表达。
如本文所使用的,“表达盒”和“核酸盒”通常可互换使用以指代一起表达或可操作地连接用于表达的核酸序列或元件的组合。在一些情况下,表达盒是指调节元件和其可操作地连接用于表达的一个或多个基因的组合。
DNA或蛋白质序列的“功能片段”通常是指保留与全长DNA或蛋白质序列的生物活性基本上类似的生物活性(功能或结构)的片段。DNA序列的生物活性可能是其以归因于全长序列的方式影响表达的能力。
如本文所使用的,“工程化”对象通常表明所述对象已通过人为干预进行修饰。根据非限制性实例:核酸可以通过将其序列改变成自然界中不存在的序列来修饰;核酸可以通过将其连接到自然界中不与其缔合的核酸来修饰,使得连接产物具有原始核酸中不存在的功能;工程化核酸可以用自然界不存在的序列在体外合成;可以通过将蛋白质的氨基酸序列改变为自然界中不存在的序列来修饰蛋白质;工程化蛋白质可以获得新的功能或特性。“工程化”系统包括至少一个工程化组分。
如本文所使用的,“合成的”和“人工的”通常可以互换使用是指代与天然存在的人蛋白质具有低序列同一性(例如小于50%序列同一性、小于25%序列同一性、小于10%序列同一性、小于5%序列同一性、小于1%序列同一性)的蛋白质或其结构域。例如,VPR和VP64结构域是合成的反式激活结构域。
如本文所使用的,术语“Cas12a”通常指属于2类V-A型Cas核酸内切酶的Cas核酸内切酶家族,并且(a)使用相对较小的向导RNA(约42-44个核苷酸),其在从CRISPR阵列转录后由核酸酶自身处理,以及(b)切割DNA以留下交错的切割位点。该酶家族的另外的特征可以在例如Zetsche B,Heidenreich M,Mohanraju P,等人《自然生物技术(Nat Biotechnol)》2017;35:31-34和Gootenberg JS,Abudayyeh OO等人,《细胞》2015;163:759-771中发现,所述文献通过引用并入本文。
如本文所使用的,“向导核酸”通常可以指可以与另一个核酸杂交的核酸。向导核酸可以是RNA。向导核酸可以是DNA。向导核酸可以被编程成与核酸序列位点特异性结合。待靶向的核酸或靶核酸可以包括核苷酸。向导核酸可以包括核苷酸。靶核酸的一部分可以与向导核酸的一部分互补。与向导核酸互补并杂交的双链靶多核苷酸的链可以称为互补链。双链靶多核苷酸的与互补链互补并且因此可能不与向导核酸互补的链可以被称为非互补链。向导核酸可以包括多核苷酸链,并且可以称为“单向导核酸”。向导核酸可以包括两条多核苷酸链,并且可以称为“双向导核酸”。如果没有另外说明,则术语“向导核酸”可以包含在内,指单一向导核酸和双向导核酸两者。向导核酸可以包括可以被称为“核酸靶向区段”或“核酸靶向序列”或“间隔子序列”的区段。核酸靶向区段可以包括子区段,所述子区段可以被称为“蛋白质结合区段”或“蛋白质结合序列”或“Cas蛋白质结合区段”。
在两个或更多个核酸或多肽序列的上下文中,术语“序列同一性”或“百分比同一性”通常是指当在局部或全局比较窗内进行比较和比对以获得最大对应性时,两个(例如,在成对比对中)或更多个(例如,在多序列比对中)相同或具有相同特定百分比的氨基酸残基或核苷酸的序列,如使用序列比较算法测量的。用于多肽序列的合适的序列比较算法包含例如使用字长(W)为3、期望值(E)为10的参数以及BLOSUM62评分矩阵将空位罚分设置为存在为11,扩展为1并且使用长于30个残基的多肽序列的条件组成评分矩阵调整的BLASTP;使用字长(W)为2、期望值(E)为1000000的参数以及PAM30评分矩阵(对于少于30个残基的序列,将空隙罚分设置为9来打开空隙,并且设置为1来扩展空隙)(这些是BLAST套件中BLASTP的默认参数,可在https://blast.ncbi.nlm.nih.gov获得)的BLASTP;具有参数的CLUSTALW;具有以下参数的CLUSTALW与Smith-Waterman同源性搜索算法:匹配为2、失配为-1并且间隙为-1;具有默认参数的MUSCLE;具有以下参数的MAFFT:retree为2并且maxiterations为1000;具有默认参数的Novafold;具有默认参数的HMMER hmmalign。
在两个或更多个核酸或多肽序列的上下文中,术语“最佳比对”通常是指已经与氨基酸残基或核苷酸的最大对应性比对的两个(例如,成对比对)或更多个(例如,在多序列比对中)序列,例如,如通过产生最高或“优化”百分比同一性评分的比对确定的。
本公开包含本文所描述的具有一个或多个保守氨基酸取代的酶中的任何酶的变体。此类保守取代可以在多肽的氨基酸序列中进行,而不破坏多肽的三维结构或功能。保守取代可以通过具有类似疏水性、极性和R链长度的氨基酸相互取代来完成。另外地或可替代地,通过比较来自不同物种的同源蛋白质的比对序列,可以通过在不改变经编码的蛋白质的基本功能的情况下定位物种(例如,非保守残基)之间突变的氨基酸残基来鉴定保守取代。此类保守取代的变体可以包含与本文所描述的核酸内切酶蛋白质序列中的任何一个核酸内切酶蛋白质序列(例如,本文所描述的MG11、MG13、MG26、MG28、MG29、MG30、MG31、MG32、MG37、MG53、MG54、MG55、MG56、MG57、MG58、MG59、MG60、MG61、MG62、MG70、MG82、MG83、MG84或MG85家族核酸内切酶,或本文所描述的任何其它家族核酸酶)具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%序列同一性的变体。在一些实施例中,此类保守取代的变体是功能变体。此类功能变体可以涵盖具有取代的序列,使得核酸内切酶的一个或多个关键活性位点残基或向导RNA结合残基的活性不被破坏。在一些实施例中,本文所描述的蛋白质中的任何蛋白质的功能变体缺乏图17、18、10、20或25中所示的保守残基或功能残基中的至少一个或1B表中所描述的残基的取代。在一些实施例中,本文所描述的蛋白质中的任何蛋白质的功能变体缺乏图17、18、10、20或25中所示的保守残基或功能残基中的全部或1B表中所描述的残基的取代。
本公开还包括本文所描述的酶中的任何酶的变体,其取代一个或多个催化残基以降低或消除酶(例如,活性降低的变体)的活性。在一些实施例中,作为本文所描述的蛋白质的活性降低的变体包括表1B中所鉴定的至少一个、至少两个或所有三个催化残基的破坏性取代。
提供功能类似氨基酸的保守取代表可从各种参考文献中获得(参见例如Creighton,《蛋白质:结构与分子特性(Proteins:Structures and MolecularProperties)》(W H弗里曼出版社(W H Freeman&Co.);第2版(1993年12月))。以下八个基团各自含有彼此保守取代的氨基酸:
1)丙氨酸(A)、甘氨酸(G);
2)天冬氨酸(D)、谷氨酸(E);
3)天冬酰胺(N)、谷氨酰胺(Q);
4)精氨酸(R)、赖氨酸(K);
5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);
6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);
7)丝氨酸(S)、苏氨酸(T);以及
8)半胱氨酸(C)、甲硫氨酸(M)
概述
具有独特功能和结构的新Cas酶的发现可能会提供进一步破坏脱氧核糖核酸(DNA)编辑技术的可能性,从而提高速度、特异性、功能和易用性。相对于微生物中成簇的规则间隔的短回文重复序列(CRISPR)系统的预测流行率和微生物物种的纯粹多样性,文献中存在功能表征的CRISPR/Cas酶相对较少。这部分是因为大量的微生物物种可能不容易在实验室条件下培养。对含有大量微生物物种的自然环境生态位进行宏基因组测序可能会提供大幅增加表征的新的CRISPR/Cas系统的数量,并且加速新寡核苷酸编辑功能的发现的可能性。这种方法富有成效的最近的实例通过2016年通过对天然微生物群落的宏基因组分析发现CasX/CasY CRISPR系统证明。
CRISPR/Cas系统是RNA引导的核酸酶复合物,其已描述为在微生物中充当适应性免疫系统。在CRISPR/Cas系统的自然背景中,所述CRISPR/Cas系统出现在CRISPR(成簇的规则间隔的短回文重复序列)操纵子或基因座中,其通常包括两部分:(i)由同样短的间隔子序列分隔的短重复序列阵列(30-40bp),其编码基于RNA的靶向元件;以及(ii)编码Cas的ORF,所述Cas编码由基于RNA的靶向元件连同辅助蛋白/酶引导的核酸酶多肽。特定靶核酸序列的有效核酸酶靶向通常需要以下两者:(i)靶标(靶种子)的前6-8个核酸与crRNA向导之间的互补杂交;以及(ii)靶种子的定义附近内存在原间隔子相邻基序(PAM)序列(PAM通常是宿主基因组内不常表示的序列)。根据系统的确切功能和组织,CRISPR-Cas系统通常基于共享的功能特征和进化类似性分为2种类别、5种类型和16种亚型(参见图)。
I类CRISPR-Cas系统具有大的多亚基效应子复合物,并且包括I、III和IV型。II类CRISPR-Cas系统通常具有单多肽多结构域核酸酶效应子,并且包括II型、V型和VI型。
II型CRISPR-Cas系统在组分方面被认为是最简单的。在II型CRISPR-Cas系统中,将CRISPR阵列处理成成熟的crRNA不需要存在特殊的核酸内切酶亚基,而是需要小的反式编码的crRNA(tracrRNA),其区与阵列重复序列互补;tracrRNA与其对应的效应子核酸酶(例如Cas9)和重复序列相互作用以形成前体dsRNA结构,所述前体dsRNA结构被内源性RNA酶III切割,从而生成负载有tracrRNA和crRNA两者的成熟的效应子酶。Cas II核酸酶被鉴定为DNA核酸酶。2型效应子通常表现出包括RuvC样核酸内切酶结构域的结构,所述RuvC样核酸内切酶结构域采用RNA酶H折叠,其中RuvC样核酸酶结构域的所述折叠内插入有不相关的HNH核酸酶结构域。RuvC样结构域负责靶(例如,crRNA互补)DNA链的切割,而HNH结构域负责置换的DNA链的切割。
V型CRISPR-Cas系统的特征在于与包括RuvC样结构域的II型效应子的结构类似的核酸酶效应子(例如Cas12)结构。类似于II型,大多数(但不是全部)V型CRISPR系统使用tracrRNA将pre-crRNA处理成成熟的crRNA;然而,与需要RNA酶III将pre-crRNA切割成多个crRNA的II型系统不同,V型系统能够使用效应子核酸酶本身来切割pre-crRNA。与II型CRISPR-Cas系统一样,V型CRISPR-Cas系统再次被鉴定为DNA核酸酶。与II型CRISPR-Cas系统不同,一些V型酶(例如Cas12a)似乎具有强大的由双链靶序列的第一个crRNA定向切割激活的单链非特异性脱氧核糖核酸酶活性。
CRISPR-Cas系统由于其靶向性和易用性,近年来已成为首选的基因编辑技术。最常用的系统是2类II型SpCas9和2类V-A型Cas12a。特别是V-A型系统正变得越来越广泛地使用,因为据其在细胞中的报告的特异性高于其它核酸酶,具有更少或没有脱靶作用。V-A系统的优点还在于,向导RNA小(42-44个核苷酸,相比之下SpCas9大约为100nt),并且在从CRISPR阵列转录后由核酸酶自身处理,从而简化了多基因编辑的多重应用。此外,V-A系统具有交错的切割位点,这可能有助于定向修复途径,如微同源性依赖性靶向整合(MITI)。
最常用的V-A型酶需要在所选靶位点旁边有一个5′原间隔子相邻基序(PAM):针对毛螺菌科细菌ND2006 LbCas12a和氨基酸球菌AsCas12a的5′-TTTV-3′;以及针对新凶手弗朗西斯菌FnCas12a的5′-TTV-3′。最近对直链同源物的探索揭示了具有较少限制性PAM序列的蛋白质,其在哺乳动物细胞培养例如,YTV、YYN或TTN中也具有活性。然而,这些酶并不完全涵盖V-A生物多样性和靶向性,并且可能不代表所有可能的活性和PAM序列要求。在此,从大量的V-A型核酸酶宏基因组中提取了数千个基因组片段。经鉴定的V-A酶的多样性可能已经扩大,并且新系统可能已经发展成为高度靶向、紧凑和精确的基因编辑剂。
MG酶
V-A型CRISPR系统正快速用于各种基因组编辑应用中。这些可编程核酸酶是适应性微生物免疫系统的一部分,其天然多样性在很大程度上尚未被探索。通过对从各种复杂环境中收集的宏基因组进行大规模分析来鉴定V-A型CRISPR酶的新家族,并将这些系统的代表开发到基因编辑平台中。核酸酶是系统发育不同的(参见图4A),并且识别具有特定基序的单向导RNA。这些系统中的大多数来自未培养的生物体,其中一些编码同一CRISPR操纵子内的发散V型效应子。生物化学分析揭示出意想不到的PAM多样性(参见图4B),从而指示这些系统将促进各种基因组工程应用。向导序列和人细胞系中的活性的简单性表明在基因和细胞疗法中是有用的。
在一些方面,本公开提供了新V-L型候选物(参见图27A-B)。V-L型可以是新亚型,并且可能已经鉴定出一些亚家族。这些核酸酶的长度为约1000-1100个氨基酸。V-L型可以在与V-A型效应子相同的CRISPR基因座中找到。RuvC催化残基可能已经鉴定为V-L型候选物,并且这些V-L型候选物可能不需要tracrRNA。V-L型的一个实例是本文所描述的MG60核酸酶(参见图28和图32)。
在一些方面,本公开提供了较小的V型效应子(参见图30)。此类效应子可以是小的推定效应子。这些效应子可以简化递送并且可以延伸治疗性应用。
在一些方面,本公开提供了新V型效应子。此类效应子可以是如本文所描述的MG70(参见图29)。MG70可以是长度为约373个氨基酸的超小酶。MG 70可以在N末端处具有单个转座酶结构域,并且可以具有预测tracrRNA(参见图30和图32)。
在一些方面,本公开提供了较小的V型效应子(参见图31)。此类效应子可以是本文所描述的MG81。MG81的长度可以为约500-700个氨基酸,并且可以含有RuvC和HTH DNA结合结构域。
一方面,本公开提供了一种通过宏基因组测序发现的工程化核酸酶系统。在一些情况下,对样品进行宏基因组测序。在一些情况下,可以从各种环境中收集样品。此类环境可以是人微生物组、动物微生物组、高温环境、低温环境。此类环境可以包含沉积物。本文所描述的工程化核酸酶系统的此类环境的类型的实例可见于图。
一方面,本公开提供了一种工程化核酸酶系统,其包括(a)核酸内切酶。在一些情况下,核酸内切酶是Cas核酸内切酶。在一些情况下,核酸内切酶是2类V型Cas核酸内切酶。在一些情况下,核酸内切酶是2类V-A型Cas核酸内切酶。在一些情况下,核酸内切酶衍生自未培养的微生物。核酸内切酶可以包括RuvC结构域。在一些情况下,工程化核酸酶系统包括(b)工程化向导RNA。在一些情况下,工程化向导RNA被配置成与核酸内切酶形成复合物。在一些情况下,工程化向导RNA包括间隔子序列。在一些情况下,间隔子序列被配置成与靶核酸序列杂交。
一方面,本公开提供了一种工程化核酸酶系统,其包括(a)核酸内切酶。在一些情况下,核酸内切酶与SEQ ID NO:1-3470中的任一者具有至少约70%序列同一性。在一些情况下,核酸内切酶与SEQ ID NO:1-3470中的任一者具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性。
在一些情况下,核酸内切酶包括与SEQ ID NO:1-3470中的任一者具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的变体。在一些情况下,核酸内切酶可以与SEQ IDNO:1-3470中的任一者基本上相同。
在一些情况下,工程化核酸酶系统包括工程化向导RNA。在一些情况下,工程化向导RNA被配置成与核酸内切酶形成复合物。在一些情况下,工程化向导RNA包括间隔子序列。在一些情况下,间隔子序列被配置成与靶核酸序列杂交。
一方面,本公开提供了一种工程化核酸酶系统,其包括(a)核酸内切酶。在一些情况下,核酸内切酶被配置成与原间隔子相邻基序(PAM)序列结合。在一些情况下,PAM序列与SEQ ID NO:3863-3913中的任一者基本上相同。在一些情况下,PAM序列SEQ ID NO:3863-3913中的任一者。在一些情况下,核酸内切酶是Cas核酸内切酶。在一些情况下,核酸内切酶是2类Cas核酸内切酶。在一些情况下,核酸内切酶是2类V型Cas核酸内切酶。在一些情况下,核酸内切酶是2类V-A型Cas核酸内切酶。在一些情况下,工程化核酸酶系统包括(b)工程化向导RNA。在一些情况下,工程化向导RNA被配置成与核酸内切酶形成复合物。在一些情况下,工程化向导RNA包括间隔子序列。在一些情况下,间隔子序列被配置成与靶核酸序列杂交。
在一些情况下,核酸内切酶是Cpf1或Cms1核酸内切酶。在一些情况下,核酸内切酶进一步包括锌指状结构域。
在一些情况下,向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735或3851-3857的前19个核苷酸或非简并核苷酸具有至少80%序列同一性的序列。在一些情况下,向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735或3851-3857的前19个核苷酸或非简并核苷酸具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735或3851-3857的前19个核苷酸或非简并核苷酸具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的变体。在一些情况下,向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735或3851-3857的前19个核苷酸或非简并核苷酸基本上相同的序列。
在一些情况下,向导RNA包括与包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735或3851-3857的前19个核苷酸或非简并核苷酸具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。在一些情况下,核酸内切酶被配置成与工程化向导RNA结合。在一些情况下,Cas核酸内切酶被配置成与工程化向导RNA结合。在一些情况下,2类Cas核酸内切酶被配置成与工程化向导RNA结合。在一些情况下,2类V型Cas核酸内切酶被配置成与工程化向导RNA结合。在一些情况下,2类V-A型Cas核酸内切酶被配置成与工程化向导RNA结合。
在一些情况下,核酸内切酶被配置成与包括SEQ ID NO:3863-3913中的任一者的原间隔子相邻基序(PAM)序列结合。
在一些情况下,向导RNA包括与真核生物、真菌、植物、哺乳动物或人基因组多核苷酸序列互补的序列。在一些情况下,向导RNA包括与真核基因组多核苷酸序列互补的序列。在一些情况下,向导RNA包括与真菌基因组多核苷酸序列互补的序列。在一些情况下,向导RNA包括与植物基因组多核苷酸序列互补的序列。在一些情况下,向导RNA包括与哺乳动物基因组多核苷酸序列互补的序列。在一些情况下,向导RNA包括与人基因组多核苷酸序列互补的序列。
在一些情况下,向导RNA的长度为30-250个核苷酸。在一些情况下,向导RNA的长度为42-44个核苷酸。在一些情况下,向导RNA的长度为42个核苷酸。在一些情况下,向导RNA的长度为43个核苷酸。在一些情况下,向导RNA的长度为44个核苷酸。在一些情况下,向导RNA的长度为85-245个核苷酸。在一些情况下,向导RNA的长度为多于90个核苷酸。在一些情况下,向导RNA的长度为少于245个核苷酸。
在一些情况下,核酸内切酶可以包括具有一个或多个核定位序列(NLS)的变体。NLS可以接近核酸内切酶的N末端或C末端。NLS可以被附加到SEQ ID NO:3938-3953中的任一者的N末端或C末端,或者附加到与SEQ ID NO:3938-3953中的任一者具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的变体。在一些情况下,NLS可以包括与SEQ ID NO:3938-3953中的任一者基本上相同的序列。
表1:可以与根据本公开的Cas效应子一起使用的示例性NLS序列。
在一些情况下,工程化核酸酶系统进一步包括单链或双链DNA修复模板。在一些情况下,工程化核酸酶系统进一步包括单链DNA修复模板。在一些情况下,工程化核酸酶系统进一步包括双链DNA修复模板。在一些情况下,单链或双链DNA修复模板从5′至3′可以包括:第一同源臂,所述第一同源臂包括位于所述靶脱氧核糖核酸序列的5′的至少20个核苷酸的序列、至少10个核苷酸的合成DNA序列,以及第二同源臂,所述第二同源臂包括位于所述靶序列的3′的至少20个核苷酸的序列。
在一些情况下,第一同源臂包括至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少175个、至少200个、至少250个、至少300个、至少400个、至少500个、至少750个或至少1000个核苷酸的序列。在一些情况下,第二同源臂包括至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少175个、至少200个、至少250个、至少300个、至少400个、至少500个、至少750个或至少1000个核苷酸的序列。
在一些情况下,第一同源臂和第二同源臂与原核生物的基因组序列同源。在一些情况下,第一同源臂和第二同源臂与细菌的基因组序列同源。在一些情况下,第一同源臂和第二同源臂与真菌的基因组序列同源。在一些情况下,第一同源臂和第二同源臂与真核生物的基因组序列同源。
在一些情况下,工程化核酸酶系统进一步包括DNA修复模板。DNA修复模板可以包括双链DNA区段。双链DNA区段可以侧接一个单链DNA区段。双链DNA区段可以侧接两个单链DNA区段。在一些情况下,单链DNA区段与双链DNA区段的5′端缀合。在一些情况下,单链DNA区段与双链DNA区段的3′端缀合。
在一些情况下,单链DNA区段的长度为1至15个核苷酸碱基。在一些情况下,单链DNA区段的长度为4至10个核苷酸碱基。在一些情况下,单链DNA区段的长度为4个核苷酸碱基。在一些情况下,单链DNA区段的长度为5个核苷酸碱基。在一些情况下,单链DNA区段的长度为6个核苷酸碱基。在一些情况下,单链DNA区段的长度为7个核苷酸碱基。在一些情况下,单链DNA区段的长度为8个核苷酸碱基。在一些情况下,单链DNA区段的长度为9个核苷酸碱基。在一些情况下,单链DNA区段的长度为10个核苷酸碱基。
在一些情况下,单链DNA区段具有与间隔子序列内的序列互补的核苷酸序列。在一些情况下,双链DNA序列包括条形码、开放阅读框、增强子、启动子、蛋白质编码序列、miRNA编码序列、RNA编码序列或转基因。
在一些情况下,工程化核酸酶系统进一步包括Mg2+的来源。
在一些情况下,向导RNA包括包含至少8个碱基配对的核糖核苷酸的发夹。在一些情况下,向导RNA包括包含至少9个碱基配对的核糖核苷酸的发夹。在一些情况下,向导RNA包括包含至少10个碱基配对的核糖核苷酸的发夹。在一些情况下,向导RNA包括包含至少11个碱基配对的核糖核苷酸的发夹。在一些情况下,向导RNA包括包含至少12个碱基配对的核糖核苷酸的发夹。
在一些情况下,核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体141、215、229、261或1711-1721或其变体的变体至少70%相同的序列。在一些情况下,核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体的变体至少75%相同的序列。在一些情况下,核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体的变体至少80%相同的序列。在一些情况下,核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体的变体至少85%相同的序列。在一些情况下,核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体的变体至少90%相同的序列。在一些情况下,核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体的变体至少95%相同的序列。
在一些情况下,向导RNA包括与SEQ ID NO:3608的前19个核苷酸或非简并核苷酸至少70%相同的序列。在一些情况下,向导RNA包括与SEQ ID NO:3608的前19个核苷酸或非简并核苷酸至少75%相同的序列。在一些情况下,向导RNA包括与SEQ ID NO:3608的前19个核苷酸或非简并核苷酸至少80%相同的序列。在一些情况下,向导RNA包括与SEQ ID NO:3608的前19个核苷酸或非简并核苷酸至少85%相同的序列。在一些情况下,向导RNA包括与SEQ ID NO:3608的前19个核苷酸或非简并核苷酸至少90%相同的序列。在一些情况下,向导RNA包括与SEQ ID NO:3608的前19个核苷酸或非简并核苷酸至少95%相同的序列。在一些情况下,核酸内切酶被配置成与包括SEQ ID NO:3863-3913中的任一者的PAM结合。
在一些情况下,序列通过BLASTP、CLUSTALW、MUSCLE或MAFFT算法,或具有Smith-Waterman同源性搜索算法参数的CLUSTALW算法来测定。可以通过所述BLASTP同源性搜索算法使用字长(W)为3、期望值(E)为10的参数以及BLOSUM62评分矩阵将空位罚分设置为存在为11,扩展为1并且使用条件组成评分矩阵调整来确定序列同一性。
一方面,本公开提供了一种工程化向导RNA,其包括(a)DNA靶向区段。在一些情况下,DNA靶向区段包括与靶序列互补的核苷酸序列。在一些情况下,靶序列在靶DNA分子中。在一些情况下,工程化向导RNA包括(b)蛋白质结合区段。在一些情况下,蛋白质结合区段包括两个互补核苷酸延伸段。在一些情况下,两个互补核苷酸延伸段杂交以形成双链RNA(dsRNA)双链体。在一些情况下,两个互补核苷酸延伸段用中间核苷酸彼此共价连接。在一些情况下,工程化向导核糖核酸多核苷酸能够与核酸内切酶形成复合物。在一些情况下,核酸内切酶与SEQ ID NO:1-3470中的任一者具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性。在一些情况下,复合物靶向靶DNA分子的靶序列。
在一些情况下,DNA靶向区段位于两个互补核苷酸延伸段中的两个互补核苷酸延伸段的3′处。在一些情况下,蛋白质结合区段包括与SEQ ID NO:3608的前19个核苷酸或非简并核苷酸具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一性的序列。
在一些情况下,双链RNA(dsRNA)双链体包括至少8个核糖核苷酸。在一些情况下,双链RNA(dsRNA)双链体包括至少9个核糖核苷酸。在一些情况下,双链RNA(dsRNA)双链体包括至少10个核糖核苷酸。在一些情况下,双链RNA(dsRNA)双链体包括至少11个核糖核苷酸。在一些情况下,双链RNA(dsRNA)双链体包括至少12个核糖核苷酸。
在一些情况下,脱氧核糖核酸多核苷酸编码工程化向导核糖核酸多核苷酸。
一方面,本公开提供了一种核酸,其包括工程化核酸序列。在一些情况下,工程化核酸序列经优化以在生物体中表达。在一些情况下,核酸编码核酸内切酶。在一些情况下,核酸内切酶是Cas核酸内切酶。在一些情况下,核酸内切酶是2类核酸内切酶。在一些情况下,核酸内切酶是2类V型Cas核酸内切酶。在一些情况下,核酸内切酶是2类V-A型Cas核酸内切酶。在一些情况下,核酸内切酶衍生自未培养的微生物。在一些情况下,生物体不是未培养的生物体。
在一些情况下,核酸内切酶包括与SEQ ID NO:1-3470中的任一者具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的变体。
在一些情况下,核酸内切酶可以包括具有一个或多个核定位序列(NLS)的变体。NLS可以接近核酸内切酶的N末端或C末端。NLS可以被附加到SEQ ID NO:3938-3953中的任一者的N末端或C末端,或者附加到与SEQ ID NO:3938-3953中的任一者具有至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的变体。
在一些情况下,生物体是原核生物。在一些情况下,生物体是细菌。在一些情况下,生物体是真核生物。在一些情况下,生物体是真菌。在一些情况下,生物体是植物。在一些情况下,生物体是哺乳动物。在一些情况下,生物体是啮齿动物。在一些情况下,生物体是人。
一方面,本公开提供了一种工程化载体。在一些情况下,工程化载体包括编码核酸内切酶的核酸序列。在一些情况下,核酸内切酶是Cas核酸内切酶。在一些情况下,核酸内切酶是2类Cas核酸内切酶。在一些情况下,核酸内切酶是2类V型Cas核酸内切酶。在一些情况下,核酸内切酶是2类V-A型Cas核酸内切酶。在一些情况下,核酸内切酶衍生自未培养的微生物。
在一些情况下,工程化载体包括本文所描述的核酸。在一些情况下,本文所描述的核酸是本文所描述的脱氧核糖核酸多核苷酸。在一些情况下,载体是质粒、微环、CELiD、腺相关病毒(AAV)源性病毒体、慢病毒或慢病毒。
一方面,本公开提供了一种包括本文所描述的载体的细胞。
一方面,本公开提供了一种产生核酸内切酶的方法。在一些情况下,所述方法包括培养细胞。
一方面,本公开提供了一种用于结合、切割、标记或修饰双链脱氧核糖核酸多核苷酸的方法。所述方法可以包括使双链脱氧核糖核酸多核苷酸与核酸内切酶接触。在一些情况下,核酸内切酶是Cas核酸内切酶。在一些情况下,核酸内切酶是2类Cas核酸内切酶。在一些情况下,核酸内切酶是2类V型Cas核酸内切酶。在一些情况下,核酸内切酶是2类V-A型Cas核酸内切酶。在一些情况下,核酸内切酶与工程化向导RNA复合。在一些情况下,工程化向导RNA被配置成与核酸内切酶结合。在一些情况下,工程化向导RNA被配置成与双链脱氧核糖核酸多核苷酸结合。在一些情况下,工程化向导RNA被配置成与核酸内切酶和与双链脱氧核糖核酸多核苷酸结合。在一些情况下,双链脱氧核糖核酸多核苷酸包括原间隔子相邻基序(PAM)。在一些情况下,PAM包括包含SEQ ID NO:3863-3913中的任一者的序列。
在一些情况下,双链脱氧核糖核酸多核苷酸包括第一链和第二链,所述第一链包含与工程化向导RNA的序列互补的序列,并且所述第二链包括PAM。在一些情况下,PAM直接邻近与工程化向导RNA的序列互补的序列的5′端。在一些情况下,核酸内切酶不是Cpf1核酸内切酶或Cms1核酸内切酶。在一些情况下,核酸内切酶衍生自未培养的微生物。在一些情况下,双链脱氧核糖核酸多核苷酸是真核生物、植物、真菌、哺乳动物、啮齿动物或人双链脱氧核糖核酸多核苷酸。在一些情况下,PAM包括SEQ ID NO:3863-3913中的任一者。
一方面,本公开提供了一种修饰靶核酸基因座的方法。所述方法可以包括将本文所描述的工程化核酸酶系统递送到靶核酸基因座。在一些情况下,核酸内切酶被配置成与工程化向导核糖核酸结构形成复合物。在一些情况下,复合物被配置成使得在复合物与靶核酸基因座结合时,复合物修饰靶核酸基因座。
在一些情况下,修饰靶核酸基因座包括结合、切开、切割或标记所述靶核酸基因座。在一些情况下,靶核酸基因座包括脱氧核糖核酸(DNA)或核糖核酸(RNA)。在一些情况下,靶核酸包括基因组DNA、病毒DNA、病毒RNA或细菌DNA。在一些情况下,靶核酸基因座在体外。在一些情况下,靶核酸基因座在细胞内。在一些情况下,细胞是原核细胞、细菌细胞、真核细胞、真菌细胞、植物细胞、动物细胞、哺乳动物细胞、啮齿动物细胞、灵长类动物细胞或人细胞。
在一些情况下,工程化核酸酶系统向靶核酸基因座的递送包括递送本文所描述的核酸或本文所描述的载体。在一些情况下,工程化核酸酶系统向靶核酸基因座的递送包括递送包含编码核酸内切酶的开放阅读框的核酸。在一些情况下,核酸包括启动子。在一些情况下,编码核酸内切酶的开放阅读框与启动子可操作地连接。
在一些情况下,工程化核酸酶系统向靶核酸基因座的递送包括递送含有编码核酸内切酶的开放阅读框的封端mRNA。在一些情况下,工程化核酸酶系统向靶核酸基因座的递送包括递送翻译的多肽。在一些情况下,工程化核酸酶系统向靶核酸基因座的递送包括递送编码与核糖核酸(RNA)pol III启动子可操作地连接的工程化向导RNA的脱氧核糖核酸(DNA)。
在一些情况下,核酸内切酶在靶基因座处或附近诱导单链断裂或双链断裂。在一些情况下,核酸内切酶诱导所述靶基因座内或位于所述靶基因座的3′处的交错的单链断裂。
在一些情况下,效应子重复序列基序用于为MG核酸酶的向导设计提供信息。例如,V-A型系统中的经处理的gRNA包括CRISPR重复序列的最后20-22个核苷酸。可以将此序列合成为crRNA(连同间隔子),并且连同合成的核酸酶一起在体外测试,用于在可能靶标的文库上切割。使用这种方法,可以确定PAM。在一些情况下,V-A型酶可以使用“通用”gRNA。在一些情况下,V型酶可以利用独特的gRNA。
脂质纳米颗粒
如本文所描述的脂质纳米颗粒可以是4组分脂质纳米颗粒。此类纳米颗粒可以被配置成用于递送RNA或其她核酸(例如,合成RNA、mRNA或体外合成的mRNA),并且可以通常如WO 2012135805A2中所描述的进行调配,所述文献出于所有目的通过引用并入本文。此类纳米颗粒通常可以包括:(a)阳离子脂质(例如,图109中所描述的脂质中的任何脂质);(b)中性脂质(例如,DSPC或DOPE);(c)固醇(例如,胆固醇或胆固醇类似物);以及(d)经PEG修饰的脂质(例如,PEG-DMG)。
本文称为“C12-200”的阳离子脂质由Love等人,《美国国家科学院院刊(Proc NatlAcad Sci USA.)》2010 107:1864-1869和Liu和Huang,《分子疗法(Molecular Therapy)》.2010 669-670公开;两个文献均通过全文引用的方式并入本文。除多核苷酸、初级构建体或RNA(例如,mRNA)之外,阳离子脂质调配物可以包含包括3或4个或更多个组分的颗粒。例如,具有某些阳离子脂质的调配物包含但不限于98N12-5(或图109中所描述的任何其它结构),并且可以含有42%的类脂质、48%的胆固醇和10%的PEG(C14或更大的烷基链长)。作为另一个实例,具有某些类脂质的调配物包含但不限于C12-200,并且可以含有50%的阳离子脂质、10%的二硬脂酰磷脂酰胆碱、38.5%的胆固醇和1.5%的PEG-DMG。
在一些实施例中,如US10709779B2中所描述的调配脂质纳米颗粒,所述文献通过全文引用的方式并入本文。在一些实施例中,阳离子脂质纳米颗粒包括阳离子脂质、经PEG修饰的脂质、固醇和非阳离子脂质。在一些实施例中,阳离子脂质选自由图109中所描绘的阳离子脂质中的任何阳离子脂质组成的组。在一些实施例中,阳离子脂质纳米颗粒的摩尔比为约20-60%的阳离子脂质、约5-25%的非阳离子脂质、约25-55%的固醇和约0.5-15%的经PEG修饰的脂质。在一些实施例中,阳离子脂质纳米颗粒包括约50%的阳离子脂质、约1.5%的经PEG修饰的脂质、约38.5%的胆固醇和约10%的非阳离子脂质的摩尔比。在一些实施例中,阳离子脂质纳米颗粒包括约55%的阳离子脂质、约2.5%的经PEG修饰的脂质、约32.5%的胆固醇和约10%的非阳离子脂质的摩尔比。在一些实施例中,阳离子脂质是可电离阳离子脂质,非阳离子脂质是中性脂质,并且固醇是胆固醇。在一些实施例中,阳离子脂质纳米颗粒的摩尔比为50∶38.5∶10∶1.5的阳离子脂质∶胆固醇∶PEG2000-DMG∶DSPC或DMG∶DOPE。在一些实施例中,如本文所描述的脂质纳米颗粒可以包括摩尔比为47.5∶16∶35∶1.5的胆固醇、1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)、1,1′-((2-(4-(2-((2-(双(2-羟基十二烷基)氨基)乙基)(2-羟基十二烷基)氨基)乙基)哌嗪-1-基)乙基)氨叉基)双(十二烷-2-醇)(C12-200)和DMG-PEG-2000。
本公开的系统可以用于各种应用,例如核酸编辑(例如基因编辑)、与核酸分子结合(例如序列特异性结合)。此类系统可以用于例如解决(例如,去除或替换)可能引起受试者的疾病的遗传突变,使基因灭活以便确定其在细胞中的功能,作为检测致病遗传元件的诊断工具(例如通过裂解逆转录病毒RNA或编码致病突变的扩增DNA序列),作为灭活酶与探针结合以靶向和检测特定核苷酸序列(例如编码细菌抗生素抗性的序列),通过靶向病毒基因组使病毒灭活或无法感染宿主细胞,添加基因或修改代谢途径来对生物体进行工程化以产生有价值的小分子、大分子或次级代谢物,建立用于进化选择的基因驱动元件,作为生物传感器检测外来小分子和核苷酸对细胞的干扰。
实例
实例1-一种新蛋白质的宏基因组分析的方法
从沉积物、土壤和动物收集宏基因组样品。用Zymobiomics DNA微量制备型试剂盒提取脱氧核糖核酸(DNA)并在Illumina2500上测序。在产权所有者同意的情况下收集样品。使用基于包含II类V型Cas效应蛋白的经鉴定的Cas蛋白质序列产生的隐马尔可夫模型(Hidden Markov Models)搜索宏基因组序列数据以鉴定新的Cas效应子(参见图,其示出了在一个从如高温样品的样品类型中鉴定的家族MG29中检测到的蛋白质的分布)。通过搜索鉴定的新效应蛋白与经鉴定的蛋白质比对以鉴定潜在活性位点(参见例如图,其示出从各种样品鉴定的所有MG29家族效应子具有来自RuvCI、RuvCII和RuvCIII催化结构域的三个催化残基并且预测为活性的)。此宏基因组工作流导致本文所描述的:3471、3539、3551-355MG11、MG13、MG19、MG20、MG26、MG28、MG29、MG30、MG31、MG32、MG37、9、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和MG91家族的描绘。推定间隔子序列通过其邻近编码效应蛋白的基因组基因座的位置来鉴定。
实例2-一种新蛋白质的宏基因组分析的方法
收集十三个动物微生物组、高温生物膜和沉积物样品,并在收集后储存在冰上或Zymo DNA/RNA Shield中。使用凯杰公司(Qiagen)DNeasy PowerSoil试剂盒或ZymoBIOMICSDNA微量制备型试剂盒从样品中提取DNA。DNA测序文库在因美纳公司(Illumina)HiSeq4000上或在加州大学伯克利分校Vendent J.Coates基因组测序实验室(Vendnt J.CoatesGenomics Sequencing Laboratory at UC Berkeley)的Novaseq机器上构建和测序,其中配对的150bp读段具有400-800bp靶插入大小(每个样品靶向10GB测序)。从NCBI SRA下载公开可用的宏基因组测序数据。使用BBMap(Bushnell B.,sourceforge.net/projects/bbmap/)修剪测序读段,并用Megahit 11组装。用Prodigal预测开放阅读框和蛋白质序列。构建经鉴定的V-A型CRISPR核酸酶的HMM谱,并使用HMMER3(hmmer.org)针对所有预测的蛋白质进行搜索,以鉴定潜在效应子。用切碎(https://github.com/ctSkennerton/minced)预测组装的重叠群上的CRISPR阵列。将分类分配给具有Kaiju的蛋白质,并且通过找到所有编码蛋白质的共有序列来确定重叠群分类。
将预测和参考(例如,LbCas12a、AsCas12a、FnCas12a)V型效应蛋白与MAFFT比对,并使用FasTree2推断系统发育树。通过鉴定由从此项研究中回收的序列组成的进化枝来描绘新家族。从家族内,如果候选物含有用于实验室分析的组分(即,在具有CRISPR阵列的良好组装和注释的重叠群上发现所述候选物),则以尽可能多地对系统发育多样性进行采样的方式选择候选物。优先考虑来自不同家族的小效应子(即,具有共享更大范围蛋白质序列的代表性家族)。使用MUSCLE和Clustal W比对所选代表性序列和参考序列,以鉴定催化残基和PAM相互作用残基。搜索CRISPR阵列重复序列以寻找与V-A型系统TCTAC-N-GTAGA(含有一至八个N个残基)相关的基序。根据此分析,如果代表性CRISPR阵列含有这些基序序列中的一个基序序列,则家族推定分类为V-A。此数据集用于鉴定与V-A家族相关的反过来用于对另外的家族进行分类的HMM谱(参见图33-图37)。尽管惯例基于编码其的生物体命名新Cas12核酸酶,但不可能针对本文所描述的核酸酶这样做。因此,为了最好地遵守惯例,将本文所描述的系统用前缀MG命名,以指示其衍生自组装的宏基因组片段。
从不同的环境(土壤、嗜热、沉积物、人和非人微生物组)中挖掘140,867Mbp的组装的宏基因组测序数据。总之,119个基因组片段编码与CRISPR阵列附近的V-A型核酸酶远处相关的CRISPR效应子,(参见图4B)。V-A型效应子被分类为彼此之间以及与参考序列(例如,LbCas12a、AsCas12a、FnCas12a)共享小于30%的平均成对氨基酸同一性的14个新家族。一些效应子含有RuvC和α螺旋识别结构域以及来自RuvCI/CII/CIII结构域的保守DED核酸酶催化残基(以多序列比对鉴定,参见例如下表1A),从而表明这些效应子是活性核酸酶(图5-图7)。新V-A型核酸酶的大小在长度<800至1,400个氨基酸的范围内(参见图5A),并且其分类类别跨越了不同的门阵列(参见图4A),从而表明可能的水平转移。
携带V-A型CRISPR系统的一些基因组片段还编码第二效应子,在本文中称为V-A型引物(V-A′,图7A)。例如,与V-A型MG26-1共享16.6%氨基酸同一性的V-A′型MG26-2在同一CRISPR Cas操纵子中编码,并且可以与MG26-1共享相同的crRNA(图7B)。尽管没有预测核酸酶结构域,但MG26-2含有从多序列比对鉴定的三个RuvC催化残基(图7B)。
表1A:通过比对鉴定的本文所描述的酶的催化残基
/>
实例3-(通用方案)PAM序列鉴定/确认
通过用crRNA和质粒文库温育效应子来鉴定可由CRISPR效应物在体外切割的PAM序列,所述质粒文库具有位于与crRNA的间隔子互补的序列的5′端邻近的8个随机核苷酸。质粒被配置成使得如果8个随机核苷酸形成功能PAM序列,则切割质粒。然后通过将衔接子连接到经切割的质粒的端,并且然后对包括衔接子的DNA片段进行测序来鉴定功能PAM序列。推定核酸内切酶在基于大肠杆菌裂解物的表达系统(myTXTL,Arbor生物科学公司(Arbor Biosciences))中表达。在T7启动子的控制下,从PCR片段体外转录和翻译编码推定核酸酶的大肠杆菌密码子优化的核苷酸序列。在相同反应中转录具有由T7启动子和随后的重复序列-间隔子-重复序列组成的最小CRISPR阵列的第二PCR片段。成功表达核酸内切酶和重复序列-间隔子-重复序列,随后进行CRISPR阵列处理,提供活性体外CRISPR核酸酶复合物。
将含有间隔子序列的靶质粒的文库与TXTL反应产物一起温育,所述间隔子序列与最小阵列中8N(简并)碱基(潜在PAM序列)之前的间隔子序列相匹配。1-3小时后,停止反应,并且通过DNA清洁试剂盒例如,Zymo DCC、AMPure XP珠、QiaQuick等回收DNA。将衔接子序列平端与具有已由核酸内切酶切割的活性PAM序列的DNA片段连接,而未切割的DNA无法接近连接。然后通过PCR用对文库和衔接子序列具有特异性的引物扩增包括活性PAM序列的DNA区段。PCR扩增产物在凝胶上解析以鉴定与切割事件相对应的扩增子。切割反应的扩增区段还用作用于制备NGS文库的模板或用作用于桑格测序的底物。对此所得文库进行测序,所述所得文库是起始8N文库的子集,揭示了具有与CRISPR复合物相容的PAM活性的序列。对于用经处理的RNA构建体进行的PAM测试,重复相同的程序,除了体外转录的RNA连同质粒文库一起添加之外,还省略了最小CRISPR阵列模板。在这些测定中使用以下序列作为靶标:
GTCGAGGCTTGCGACGTGGTGGCT(SEQ ID NO:3858);以及
实例4-本文所描述的核酸内切酶的PAM序列鉴定/确认
通过基于大肠杆菌裂解物的表达系统(myTXTL,Arbor生物科学公司)用修饰来确定PAM需求。简言之,在29℃下在T7启动子的控制下表达大肠杆菌密码子优化的效应蛋白序列16小时。然后将此粗蛋白储备液以总反应体积的20%的浓度用于体外消化反应中。将反应在37℃下与5nM的质粒文库和50nM的体外转录的crRNA一起温育3小时,所述质粒文库包括在8N混合碱基之前的恒定靶序列,并且所述体外转录的crRNA衍生自与NEB缓冲液2.1(新英格兰生物实验室(New England Biolabs);选择NEB缓冲液2.1以便将候选物与可商购获得的蛋白质进行比较)中与靶序列互补的序列连接的效应子相同的CRISPR基因座。在PAM发现测定中,蛋白质浓度未归一化(PCR扩增信号为低表达或活性提供高敏感度)。通过用AMPure SPRI珠(贝克曼库尔特公司(Beckman Coulter))清洁回收来自TXTL反应的切割产物。通过添加克列诺片段和dNTP(新英格兰生物实验室)来钝化DNA。将钝端产物用100倍过量的双链衔接子序列连接,并用作用于制备NGS文库的模板,从所述模板通过序列分析确定PAM需求。
原始NGS读段通过Phred质量评分>20过滤。代表来自邻近PAM的主链的经鉴定的DNA序列的28bp被用作寻找PAM近端区的参照,并且邻近的8bp被鉴定为推定PAM。还针对每个读段测量了PAM与连接衔接子之间的距离。排除与参考序列或衔接子序列不具有精确匹配的读段。通过切割位点频率过滤PAM序列,使得分析中包含具有最频繁切割位点±2bp的PAM。此校正去除了由于使用粗大肠杆菌裂解物而在随机位置处可能发生的低水平的背景切割。取决于候选物蛋白质的信噪比,此过滤阶段可以去除2%至40%的读段,其中活性较低的蛋白质具有更多的背景信号。对于参考MG29-1,在此阶段过滤了2%的读段。使用PAM的过滤列表来使用Logomaker产生序列标志。PAM的这些序列标志描绘在图20-24中呈现。
实例5-tracrRNA预测和向导设计
与sgRNA和靶DNA结合的AacC2c1(Cas12b)的三元复合物的晶体结构揭示了结合sgRNA中的两个单独的重复序列-抗重复序列(R-AR)基序,表示R-AR双链体1和R-AR双链体2(参见本文的图8和图9以及Yang,Hui,Pu Gao,Kanagalaghatta R.Rajashankar和DinshawJ.Patel.2016.“通过C2c1 CRISPR-Cas核酸内切酶进行的PAM依赖性靶DNA识别和切割.”《细胞》167(7):1814-28.e12和Liu,Liang,Peng Chen,Min Wang,Xueyan Li,Jiuyu Wang,Maolu Yin和Yanli Wang.2017.“C2c1-sgRNA复合物结构揭示了RNA向导的DNA切割机制.”《分子细胞》65(2):310-22,所述文献中的每一个通过全文引用的方式并入本文)。通过搜索天然CRISPR阵列的周围基因组背景中的抗重复序列来鉴定本文所公开的CRISPR效应子的推定tracrRNA序列,其中R-AR双链体2抗重复序列在R-AR双链体1抗重复序列上游(比tracrRNA的5′端更靠近)约20-90个核苷酸处出现。在tracrRNA序列鉴定之后,针对每种酶设计两个向导序列。第一个包含R-AR双链体1和2两者(参见例如,SEQ ID NO:3636、3640、3644、3648、3652、3656、3660、3671和3672),并且第二个是R-AR双链体1区缺失的较短向导序列(参见例如,SEQ ID NO:3637、3641、3645、3649、3653、3657和3661),因为此区对于切割可能不是必需的。
实例6-预测RNA折叠的方案
使用Andronescu 2007的方法(其通过全文引用的方式并入本文)计算37℃下RNA序列的预测RNA折叠。
实例7-RNA向导鉴定
对于编码V-A型效应子和CRISPR阵列的重叠群,重复序列的次级结构折叠指示新V-A型系统需要单个向导crRNA(sgRNA,图10A-D)。未鉴定tracrRNA序列。sgRNA含有来自CRISPR重复序列的3′端约19-22nt。来自测试体外活性的V-A型候选物中的六个V-A型候选物的CRISPR重复序列的多序列比对在重复序列的3′端处示出了高度保守的基序,其形成sgRNA的茎环结构(图10C)。基序UCUAC[N3-5]GUAGAU包括由三至五个核苷酸(环)分离的短回文重复序列(茎)。
sgRNA基序的保守用于揭示可能未示出与经分类的V-A型核酸酶相似的新效应子。在来自69,117个CRISPR阵列的重复序列中搜索基序。最常见的基序含有4核苷酸环,而3核苷酸环和5核苷酸环不太常见(参见图12、图13、图14、图15和图16)。对含有重复序列基序的CRISPR阵列周围的基因组背景的检查揭示了许多不同长度的效应子。例如,家族MG57的效应子是鉴定的V-A型核酸酶中最大的(平均约1400aa),并且用4-bp环编码重复序列。从HMM分析鉴定的另一个家族含有不同的重复序列基序CCUGC[N3-4]GCAGG(参见图5C、5D)。尽管序列不同,但预测结构折叠成高度相似的茎环结构。
实例8-MG CRISPR复合物的体外切割效率
在蛋白酶缺陷型大肠杆菌B菌株中,核酸内切酶被表达为来自诱导型T7启动子的His标记的融合蛋白。通过超声处理裂解表达His标记的蛋白质的细胞,并且通过AKTAAvant FPLC(通用生命科学公司(GE Lifescience))上的HisTrap FF柱(通用生命科学公司)上的Ni-NTA亲和色谱法纯化His标记的蛋白质。洗脱液通过丙烯酰胺凝胶(伯乐公司(Bio-Rad))上的SDS-PAGE解析,并用InstantBlue超高速考马斯(InstantBlue Ultrafastcoomassie)(西格玛-奥德里奇公司(Sigma-Aldrich))染色。用ImageLab软件(伯乐公司)使用蛋白质带的密度测定来确定纯度。将经纯化的核酸内切酶透析到由50mM Tris-HCl、300mM NaCl、1mM TCEP、5%甘油组成的储存缓冲液中;pH 7.5并在-80℃下储存。通过DNA合成来构建含有间隔子序列和PAM序列(例如,如在实例3或实例4中确定)的靶DNA。当PAM具有简并碱基时,选择单个代表性PAM进行测试。靶DNA由通过PCR扩增衍生自质粒的2200bp的线性DNA构成,其中PAM和间隔子从一端定位成700bp。成功的切割产生700和1500bp的片段。将靶DNA、体外转录的单RNA和经纯化的重组蛋白在含有过量蛋白质和RNA的切割缓冲液(10mMTris、100mM NaCl、10mM MgCl2)中组合,并温育5分钟至3小时,通常为1小时。通过添加RNA酶A并在60分钟下温育来停止反应。然后将反应在1.2%TAE琼脂糖凝胶上解析,并且在ImageLab软件中定量切割的靶DNA的级分。
实例9-在大肠杆菌中测试MG CRISPR复合物的基因组切割活性
大肠杆菌缺乏有效修复双DNA断裂的能力。因此,基因组DNA的切割可以是致死事件。利用这种现象,通过在靶菌株中重组表达核酸内切酶和向导RNA(例如,如在实例6中确定的)来测试大肠杆菌中的核酸内切酶活性,其中整合到其基因组DNA整合到其基因组DNA中的间隔子/靶标和PAM序列(例如,如在实例4中确定的)用编码核酸内切酶的DNA转化。然后使转化子具有化学能力,并且用50ng的对靶序列具有特异性(“在靶”)或对靶标具有非特异性(“脱靶”)的向导RNA(例如,crRNA)转化。在热冲击之后,在37℃下在SOC中回收转化2小时。然后通过在诱导培养基上生长的5倍稀释系列来确定核酸酶效率。稀释系列一式三份地定量菌落。与用脱靶向导RNA转化的菌落数相比,用在靶向导RNA转化的菌落数的减少指示核酸内切酶的特异性基因组切割。
实例10-通用程序:在哺乳动物细胞中测试MG CRISPR复合物的基因组切割活性
两种类型的哺乳动物表达载体用于检测哺乳动物细胞中的靶向和切割活性。首先,MG Cas效应子与C末端SV40NLS和与GFP标签(用于监测蛋白质的表达的2A-GFP标签)连接的病毒2A共有序列可切割肽序列融合。其次,MG Cas效应子与两个SV40NLS序列(一个在N末端上,并且另一个在C末端上)融合。NLS序列包括本文所描述的NLS序列中的任何NLS序列(例如SEQ ID NO:3938-3953)。在一些情况下,编码核酸内切酶的核苷酸序列经密码子优化以在哺乳动物细胞中表达。
将具有与哺乳动物靶DNA互补的序列融合的crRNA序列的单向导RNA克隆到第二哺乳动物表达载体中。将两个质粒共转染到HEK293T细胞中。共转染后72小时,从转化的HEK293T细胞中提取DNA并且用于制备NGS文库。通过在靶位点处定量indel测量NHEJ百分比,以证明酶在哺乳动物细胞中的靶向效率。选择至少10个不同的靶位点来测试每种蛋白质的活性。
实例11-在哺乳动物细胞中测试MG CRISPR复合物的基因组切割活性
为了示出哺乳动物细胞中的靶向和切割活性,将MG Cas效应蛋白序列克隆到哺乳动物表达载体中,所述哺乳动物表达载体具有侧接N和C末端SV40 NLS序列、C末端His标签和His标签(主链1)之后C末端处的2A-GFP(例如,与GFP连接的病毒2A共有序列可切割肽序列)标签。在一些情况下,编码核酸内切酶的核苷酸序列是天然序列,经密码子优化以在大肠杆菌细胞中表达,或经密码子优化以在哺乳动物细胞中表达。
具有所关注的基因靶标的单向导RNA序列(sgRNA)也克隆到哺乳动物表达载体中。将两个质粒共转染到HEK293T细胞中。在将表达质粒和sgRNA靶向质粒共转染到HEK293T细胞中72小时后,提取DNA并用于制备NGS文库。在靶位点的测序中通过indel测量NHEJ百分比,以证明酶在哺乳动物细胞中的靶向效率。选择7-12个不同的靶位点用于测试每种蛋白质的活性。使用5%indel的任意阈值来鉴定活性候选物。使用参数从具有CRISPResso的NGS读段评估人细胞中的基因组编辑效率:切割偏移=-4并且窗口=10。将来自CRISPResso输出的所有切割后事件的总和为±1bp indel/突变和≥2bp缺失、插入和突变。将所有结果归一化为与预期扩增子比对的总序列(参见图18A-E)。
实例12-MG29家族的表征
PAM特异性、tracrRNA/sgRNA验证<
使用实例3和实例8中所描述的myTXTL系统确认MG29家族核酸内切酶系统的靶向核酸内切酶活性。在此测定中,切割靶质粒的PCR扩增产生在凝胶中以大约170bp迁移的产物,如图17A-B中所示出的。对于具有对应于SEQ ID NO:3609的crRNA的MG29-1,观察到扩增产物(参见图17A,泳道7)。测序PCR产物揭示了这些酶的活性PAM序列,如下表2中所示出的。
表2:MG29-1在不同靶位点处的活性
哺乳动物细胞中的靶向核酸内切酶活性
选择MG29-1靶基因座以用PAM YYn(SEQ ID NO:3871)测试基因组中的位置。将对应于所选靶位点的间隔子克隆到实例9中所描述的哺乳动物载体系统主链1中的sgRNA支架中。所述位点列于下表3中。MG29-1在各个靶位点处的活性在表2和图19中示出。
表3:本文所描述的酶的5′PAM序列和crRNA
实例13-通过NGS确定的高复制PAM测定
如实例3和实例8中所描述的,使用myTXTL试剂盒中的基于大肠杆菌裂解物的表达测试V型核酸内切酶(例如MG28、MG29、MG30、MG31核酸内切酶)的切割活性。在与crRNA和含有与8个简并(“N”)碱基(5′PAM文库)之前的crRNA相匹配的间隔子测序的质粒文库一起温育时,切割具有功能PAM的质粒文库的子集。与此切割位点的连接和PCR扩增提供了活性的证据,这由在170bp下在凝胶中观察到的带证明(图17B)。凝胶1(顶图,A)泳道如下:1(梯状条带;最暗带对应于200bp);2:阳性对照(先前验证的文库);3(n/a);4(n/a);5(MG28-1);6(MG29-1);7(MG30-1);8(MG31-1);9(MG32-1);和10(梯状条带)。凝胶2(底图,B)泳道如下:1(梯状条带;最暗带对应于200bp);2(LbCpf1阳性对照);3(LbCpf1阳性对照);4(阴性对照);5(n/a);6(n/a);7(MG28-1);8(MG29-1);9(MG30-1);10(MG31-1);11(MG32-1)。
PCR产物进一步经受NGS测序,并且将PAM整理成seqLogo(参见例如Huber等人,《自然方法(NatMethods)》.2015 Feb;12(2):115-21,所述文献通过引用并入本文)表示(图20)。seqLogo表示示出了在标记为位置0-7的间隔子上游(5′)的8bp。如在图20中所示出的,PAM富含嘧啶(C和T),其中间隔子上游的大多数序列要求为2-4bp(SeqLogo中的位置4-6)。
MG候选物的PAM在下表4中示出。
表4:本文所描述的酶的5′PAM序列和crRNA
在一些情况下,紧邻间隔子的位置可以具有较弱的特异性,例如,对于“m”或“v”而不是“n”。
实例14-用MG31核酸酶在哺乳动物细胞中靶向核酸内切酶活性
哺乳动物细胞中的靶向核酸内切酶活性
选择MG31-1靶基因座以用PAM TTTR(SEQ ID NO:3875)测试基因组中的位置。将对应于所选靶位点的间隔子克隆到实例11中所描述的哺乳动物载体系统主链1中的sgRNA支架中。所述位点列于下表5中。MG31-1在各个靶位点处的活性在表5和图25中示出。
表5:MG31-1在不同靶位点处的活性
实例3-体外活性
从生物信息分析和初步筛选中选择有前景的候选物用于如此实例中所描述的另外的生物化学分析。使用保守的3′sgRNA结构,设计了包括3′20nt的CRISPR重复序列和24nt间隔子的“通用”sgRNA(图10A-D)。在七个经测试的候选物中,六个经测试的候选物示出了针对8N PAM文库的体外活性(图26A)。当用其预测内源性修剪的CRISPR重复序列测试时,剩余的失活候选物(30-1)示出活性(SEQ ID NO:3608,参见图26B),但不包含在NGS文库测定中。(图26C)
大多数经鉴定的PAM是2-3个碱基的富含胸腺嘧啶的序列(图18A)。然而,两种酶MG26-1(PAM YYn)和MG29-1(PAM YYn)对嘧啶碱基、胸腺嘧啶或胞嘧啶具有PAM特异性,从而允许更广泛的序列靶向。对推定PAM相互作用残基的分析表明,活性V-A型核酸酶含有保守的赖氨酸和GWxxxK基序,这在FnCas12a中的识别和与不同PAM的相互作用方面至关重要。
由于PAM检测测定需要在PAM富集之前连接以产生钝端片段,这表明这些酶产生交错的双链DNA断裂,类似于所报告的V-A型核酸酶。可以通过分析用于indel检测的NGS读段来鉴定靶链上的切割位点(图18B)并且示出在第22个PAM-远端碱基之后的切割。
通过对切割产物进行测序来进一步研究通过MG29-1进行的体外切割。靶链上的切割位置在大多数序列中是距离PAM 22个核苷酸,并且21或23个核苷酸不太频繁(图56A-C)。非靶链上的切割位置是来自PAM的17至19个核苷酸。组合地,这些结果指示3-5bp突出端。
实例4-基因组编辑
在确认PAM之后,在HEK293T细胞中测试本文所描述的新蛋白质的基因靶向活性。所有候选物在十个经测试的靶基因座中的至少一个经测试的靶基因座上示出超过5%NHEJ(背景校正)的活性。MG29-1在NHEJ修饰结果中示出最高的总活性(图18B),并且对最高数量的靶标具有活性。因此,选择此核酸酶用于在HEK293细胞中测试经纯化的核糖核蛋白复合物(RNP)。MG29-1全酶的RNP转染在9个靶标中的4个靶标上示出比基于质粒的转染更高的RNP编辑水平,在一些情况下,编辑效率超过80%(图18C)。对MG29-1的编辑谱的分析表明,此核酸酶比在其靶位点处的其它类型的编辑更频繁地产生多于两个bp的缺失(图18D)。在一些靶标(5和8)处,MG29-1的indel频率是AsCpf1的两倍(图18E)。
实例17-讨论
V-A型CRISPR从来自各种复杂环境中收集的宏基因组中鉴定,并且被布置成家族。这些新V-A型核酸酶在不同PAM位点的家族和切割靶标内和跨所述不同PAM位点的家族和切割靶标具有不同的序列和系统发育起源。类似于其它V-A型核酸酶(例如,LbCas12a、AsCas12a和FnCas12a),本文所描述的效应子利用单向导CRISPR RNA(sgRNA)来靶向DNA的交错的双链切割,从而简化向导设计和合成,这将促进多重编辑。对形成crRNA的茎环结构的CRISPR重复序列基序的分析表明,本文所描述的V-A型效应子具有比更短的环或更长的环更频繁的4-nt环向导。LbCpf1的sgRNA基序具有较不常见的5-nt,但也观察到已经鉴定的16个Cpf1直系同源物的4-nt环。对于V-A型效应子的MG61家族,鉴定出不寻常的茎环CRISPR重复序列基序序列CCUGC[N3-4]GCAGG。如本文所描述的蛋白质所示出的,在V-A型中具有可变环长度的sgRNA的高度保守可以提供柔性活性水平。总之,这些效应子与先前研究的酶不是紧密同源物,并且极大地扩展了V-A型样sgRNA核酸酶的多样性。
本文所描述的另外的V型效应子可能已经从V-A型样核酸酶的复制中演变,在本文中称为V-A型主要效应子(V-A’),其可以紧接Cas12a核酸酶编码。V-A型和这些V-A′型系统两者均可以共享CRISPR sgRNA,但V-A′型系统不同于Cas12a(图4)。与这些主要效应子相关的CRISPR重复序列也折叠成具有UCUAC[N3-5]GUAGAU基序的单向导crRNA。一份报告鉴定了紧接V-A型核酸酶编码的V型cms1效应子,其需要单向导crRNA用于切割植物细胞中的活性。针对每个效应子报告了不同的CRISPR阵列,而本文所描述的V-A′型系统表明,V-A型和V-A′型两者均可能需要相同的crRNA用于DNA靶向和切割。如最近在Roizmanbacterial基因组中所描述的(参见例如Chen等人,《微生物学前沿(Front Microbiol.)》2019年5月3日;10:928),基于序列同源性和系统发育分析,V-A型效应子和V-A′型效应子两者是远相关的。因此,主要效应子不属于V-A型分类,并且需要单独的V型子分类
类似于针对其它V-A型核酸酶所述描述的PAM,针对活性V-A型核酸酶确定的PAM通常富含胸腺嘧啶。相比之下,MG29-1需要较短的YYN PAM序列,这与LbCpf1的四核苷酸TTTVPAM相比增加了靶灵活性。另外地,与具有三核苷酸PAM的sMbCas12a相比,含有MG29-1的RNP在HEK293细胞中具有更高的活性。
当测试新核酸酶的体外编辑活性时,MG29-1表现出与类别中其它所报道的酶相当或更好的活性。使用Cas12a直系同源物的哺乳动物细胞中质粒转染编辑效率的报告指示富含T的PAM的向导的介于21%与26%之间的indel频率,并且18个含有CCNPAM的向导中的一者在Mb3Cas12a中示出了约10%的活性(牛眼莫拉氏菌)AAX11_00205 Cas12a,参见例如,Wang等人,《细胞科学杂志(Journal of Cell Science)》2020 133:jcs240705)。值得注意的是,质粒转染中的MG29-1活性似乎大于针对具有TTN和CCN PAM的靶标的Mb3Cas12a所报告的活性(参见例如,图18A-E)。由于质粒转染的靶位点在所有实验中具有相同的TTG PAM,因此编辑效率的差异可以归因于不同靶基因处的基因组可及性差异。MG29-1编辑作为RNP比通过质粒更有效,并且在七个靶标基因座中的两个靶标基因座上比AsCas12a更有效。因此,MG29-1可以是高活性和高效的基因编辑核酸酶。这些发现增加了经鉴定的单向导V-A型CRISPR核酸酶的多样性,并且证明了来自未培养的微生物的新酶的基因组编辑潜力。七种新核酸酶示出了具有不同PAM需求的体外活性,并且RNP数据示出了人细胞系中治疗相关靶标的编辑效率超过80%。这些新核酸酶扩展了CRISPR相关酶的工具包,并实现了不同的基因组工程应用。
实例18-MG29-1诱导的T细胞中TRAC基因座的编辑
扫描与MG29-1的初始预测的5′-TTN-3′PAM特异性相匹配的序列的T细胞受体α链恒定区(TRACA)的三个外显子,并且从IDT订购具有专有Alt-R修饰的单向导RNA。所有向导间隔子序列的长度为22nt。将向导(80pmol)与经纯化的MG29-1蛋白(63pmol)混合,在室温下温育15分钟。使用(干细胞技术公司(Stemcell Technologies)的人T细胞分离试剂盒)#17951)通过阴性选择从PBMC纯化T细胞,并通过CD2/3/28珠(美天旎公司(Miltenyi)T细胞激活/扩增试剂盒#130-091-441)激活。在细胞生长四天后,使用程序EO-115和P3缓冲液将每种MG29-1/向导RNA混合物用Lonza 4-D核转染电穿孔到200,000个T细胞中。在转染后七十二小时采集细胞,分离基因组DNA,并使用靶向TRACA基因座的引物使用高通量DNA测序对扩增PCR进行分析。使用专有的Python脚本定量基于NHEJ的基因编辑的插入和缺失特征的创建(参见图39)。
表5A:实例18中使用的向导序列
/>
/>
/>
/>
实例19-MG29-1的前导序列向导的重新测试
进行实验以重新测试MG29-1的前导序列向导。使用Alt-R修饰扫描与从IDT订购的5′-TTN-3′和单向导RNA相匹配的序列的T细胞受体α链恒定区的三个外显子。所有向导间隔子序列的长度为22nt。将向导与经纯化的MG29-1蛋白(80pmol gRNA+63pmol MG29-1;或160pmol gRNA与126pmol MG29-1)混合,在室温下温育15分钟。使用(干细胞技术公司的人T细胞分离试剂盒)#17951)通过阴性选择从PBMC纯化T细胞,并通过CD2/3/28珠(美天旎公司T细胞激活/扩增试剂盒#130-091-441)激活。在细胞生长四天后,使用程序EO-115和P3缓冲液将每种MG29-1/向导RNA混合物用Lonza 4-D核转染电穿孔到200,000个T细胞中。在转染后七十二小时,采集基因组DNA,并使用高通量DNA测序对扩增PCR进行分析。使用专有的Python脚本定量基于NHEJ的基因编辑的插入和缺失特征的创建(参见图40)。
实例20-MG29-1的向导间隔子的测试长度
进行实验以确定最佳向导间隔子长度。使用Alt-R修饰扫描与从IDT订购的5′-TTN-3′和单向导RNA相匹配的序列的T细胞受体α链恒定区的三个外显子。将向导与经纯化的MG29-1蛋白(80pmol gRNA+60pmol效应子;160pmol gRNA+120pmol效应子;或320pmolgRNA+240pmol效应子)混合,在室温下温育15分钟。使用(干细胞技术公司的人T细胞分离试剂盒)#17951)通过阴性选择从PBMC纯化T细胞,并通过CD2/3/28珠(美天旎公司T细胞激活/扩增试剂盒#130-091-441)激活。在细胞生长四天后,使用程序EO-115和P3缓冲液将每种MG29-1/向导RNA混合物用Lonza 4-D核转染电穿孔到200,000个T细胞中。在转染后七十二小时,采集基因组DNA,并使用高通量DNA测序对扩增PCR进行分析。使用专有的Python脚本定量基于NHEJ的基因编辑的插入和缺失特征的创建。结果在图41中示出,其证明20-24nt的向导间隔子长度工作良好,其中衰减为19nt。
实例21-MG29-1 indel产生相对于TCR表达的测定
来自图41的细胞的TCR表达使用APC标记的抗人TCRα/βAb(百进生物公司(Biolegend)#306718,克隆IP26)和Attune NxT流式细胞仪(赛默飞世尔公司(ThermoFisher))通过流式细胞术分析。Indel数据取自图41。
实例22-靶向CAR与MG29-1的整合
使用IDT专有的Alt-R修饰扫描与从IDT订购的5′-TTN-3′和单向导RNA相匹配的序列的T细胞受体α链恒定区的三个外显子。将向导(80pmol)与经纯化的MG29-1蛋白(63pmol)混合,在室温下温育15分钟。使用(干细胞技术公司的人T细胞分离试剂盒)#17951)通过阴性选择从PBMC纯化T细胞,并通过CD2/3/28珠(美天旎公司T细胞激活/扩增试剂盒#130-091-441)激活。在细胞生长四天后,使用程序EO-115和P3缓冲液将每种MG29-1/向导RNA混合物用Lonza4-D核转染电穿孔到200,000个T细胞中。在转染后立即将含有靶向TRAC基因的侧接5′和3′同源臂(5′臂SEQ ID NO:4424的长度为约500nt,并且3′臂SEQ ID NO:4425的长度为约500nt)的定制嵌合抗原受体的编码序列的血清型6腺相关病毒(AAV-6)的100,000个载体基因组添加到细胞中。分析TCR表达相对于TRAC indel的复制(图42),从而示出TRAC基因中的indel与TCR的表达的丧失相关。还通过流式细胞术同时分析如实例21(图42)中的细胞的TCR表达和靶抗原与CAR的结合(图43,其中图在单个活细胞上门控)。图43中的流动分析的结果表明,虽然单独的向导RNA在消除TCR表达方面是有效的(“仅RNP”),但向导RNA加AAV的添加导致新的细胞群体结合CAR抗原(图“AAV+MG29-1-19-22”和“AAV+MG29-1-35-22”的左上角)。sgRNA 35(SEQ ID NO:4404)在诱导CAR的整合方面比sgRNA 19(SEQ ID NO:4388)稍微更有效。差异的一个可能的解释是,向导19的预测核酸酶切割位点距右同源臂的端约160bp。
表5B:实例22中使用的向导RNA
实例5-HSC中的MG29-1TRAC编辑
造血干细胞购自澳赛尔斯公司(Allcells),并按照供应商的说明解冻,在DMEM+10%FBS中洗涤,并重悬于StemspanII培养基加CC110细胞因子中。将一百万个细胞在4mL培养基中的6孔培养皿中培养72小时。除了使用EO-100核转染程序之外,如实例18中那样制备、转染和基因编辑分析MG29-1 RNP。结果在图61中示出,这示出了使用下表5B中的#19(SEQ ID NO:4388)和#35(SEQ ID NO:4404)sgRNA在造血干细胞中的TRAC处的基因编辑。结果再次表明#35 sgRNA在靶向TRAC基因座方面是高度有效的。
表5C:实例23中使用的向导RNA
实例6-与MG29-1相关的PAM特异性的另外的分析
进行另外的分析以更精确地确定MG29-1的PAM特异性。使用5′-NTTN-3′PAM序列设计向导RNA,并且然后根据观察到的基因编辑活性进行分选(图45,其中示出了每个仓的加下划线的碱基----5′-近端N的身份)。活性大于10%的向导中的所有向导在基因组DNA中的此位置处具有T,从而指示MG29-1PAM可以更好地描述为5′-TTTN-3′。示出了每个仓在此位置处的T的过表示的统计显著性。在图45中,各种仓(高、中、低、>1%、<1%)表示:
■高:>50%indel(N=4)
■中:10-50%indel(N=15)
■低:5-10%indel(N=5)
■>1%:1-5%indel(N=12)
■<1%(N=82)
表2-实例24中的核苷酸特异性分析的p值
实例7-确定MG29-1 indel诱导能力相对于间隔子基础组成
对基因编辑活性相对于MG29-1间隔子序列的基础组成进行了另外的分析。相关性适中(R^2=0.23),但存在随着GC含量较高而活性更好的趋势(参见图46,其中培养的细胞中诱导的indel相对于间隔子序列的GC含量之间的相关性呈现为点图)。
实例26-MG29-1向导化学修饰
使用实例18的程序,但用所指示的靶向VEGF-A的向导RNA(参见下表7),进行实验以优化化学修饰,用于使用MG29-1靶向VEGF-A基因座。实验使用126pmol MG29-1和160pmol向导RNA。结果在图47中呈现。相对于未经修饰的向导#1,向导#4、5、6、7和8示出改善的活性,从而表明这些序列中的对应的修饰相对于未经修饰的RNA序列改善了这些向导RNA的活性。
表7-MG29-1向导修饰
实例27-来自实例26的经修饰的MG29-1向导的滴定
进行另外的实验以确定实例26中使用的经修饰的向导的活性的剂量依赖性,以鉴定可能的剂量依赖性毒性效应。实验如实例26中那样进行,但具有起始剂量的1/4(B)、1/8(C)、1/16(D)和1/32(E)(A、126pmol MG29-1和160pmol向导RNA)。结果在图48中示出。
实例28-本文所描述的核酸酶的大规模合成
项目概述
宏基因组学公司(Metagenomi)的V-A型CRISPR核酸酶MG29-1的产生被按比例放大到10L的初始培养体积。通过SDS-PAGE进行表达筛选、按比例表达、下游开发、调配物研究和经纯化的蛋白质的递送>=90%。
表达和纯化筛选
表达:
来自图49中所描绘的pMG450载体的MG29-1的表达在改变以下条件的筛选中测试:宿主菌株、表达培养基、诱导剂、诱导时间和温度。
在筛选后,用适当的表达质粒转化大肠杆菌,使培养物生长到合适的密度摇瓶,并且根据在表达筛选期间鉴定的最佳表达条件使用材料和方法诱导培养物。采集细胞糊剂,并通过SDS-PAGE验证表达。对于这些实验,将细胞培养体积限于20L。使用以下方法纯化至多1克的蛋白质,调配成储存缓冲液,并且通过A280评估产率和浓度,并通过SDS-PAGE评估纯度。
纯化:
通过SDS-PAGE分析从大肠杆菌细胞糊剂提取的总可溶性蛋白的所有条件。在前三个表达条件下进行固定金属亲和色谱法(IMAC)下拉,随后进行SDS-PAGE,以估计产率和纯度并鉴定最佳表达条件。开发了一种用于裂解的放大方法。通过IMAC和减材IMAC(包含烟草蚀刻病毒蛋白酶(TEV)切割)鉴定纯化的关键参数。使用SDS-PAGE测试柱级分。使用SDS-PAGE和280nm的光度吸光度(A280)测试洗脱池。开发了一种通过切向流过滤(TFF)进行缓冲液交换和浓缩的方法。
如果纯度低于90%,则开发另外的色谱法阶段以实现≥90%的纯度。测试一种色谱法模式(例如,陶瓷羟磷灰石色谱法)。测试至多8种独特的条件(例如,每种具有2-3缓冲液系统的2-6种树脂)。使用SDS-PAGE测试柱级分。使用SDS-PAGE和A280测试洗脱池。选择一个条件,并进行三条件负载研究。如上文所描述的分析柱级分和洗脱池。可以开发一种用于缓冲液交换的方法并通过TFF浓缩。
调配物研究
使用经纯化的蛋白质进行调配物研究以确定经纯化的蛋白质的最佳储存条件。研究可以探索浓度、储存缓冲液、储存温度、最大冷冻/解冻循环、储存时间或其它条件。
实例29-本文所描述的核酸酶编辑培养的小鼠肝脏细胞中的内含子区的能力的证明
表达的基因的内含子区是有吸引力的基因组靶标,以将所关注的治疗性蛋白质的编码序列与表达所述蛋白质以治疗或治愈疾病的目标整合。蛋白质编码序列的整合可以通过在存在外源性地供应的供体模板的情况下使用序列特异性核酸酶在内含子内产生双链断裂来实现。供体模板可以通过称为同源定向修复(HDR)和非同源端接合(NHEJ)的两个主要的细胞修复途径之一整合到双链断裂中,从而导致供体模板的靶向整合。NHEJ途径在非分裂细胞中占主导地位,而HDR途径主要在分裂细胞中起作用。由于体内递送系统的可用性以及肝脏以高效率表达和分泌蛋白质的能力,肝脏是用于蛋白质编码序列的靶向整合的特别有吸引力的组织。
为了评估MG29-1在内含子区处产生双链断裂的可能性,选择血清白蛋白的内含子1作为靶基因座。使用Geneious Prime核酸分析软件(https://www.geneious.com/prime/)中的向导查找算法鉴定间隔子长度为22nt的靶向小鼠白蛋白内含子1的单向导RNA(sgRNA)。使用位于间隔子5′处的KTTG(SEQ ID NO:3870)的PAM,在小鼠白蛋白内含子1内总共鉴定了112个潜在sgRNA。排除跨越内含子/外显子边界的向导。使用Geneious Prime,针对小鼠基因组搜索这112个向导的间隔子序列,并且由软件基于与基因组中的另外的位点的比对来分配特异性评分。由于对特异性的关注,排除了具有相同碱基的4个或更多个连续碱基的间隔子序列。总共选择了具有最高特异性评分的12个间隔子进行测试。为了产生sgRNA,将“TAATTTCTACTGTTGTAGAT”的主链序列添加到间隔子序列的3′端。将并入经化学修饰的碱基的sgRNA化学合成,所述经化学修饰的碱基经鉴定以改进sgRNA用于cpf1向导的性能(可获自整合DNA技术公司(Integrated DNA Technologies)的AltR1/AltR2化学物质)。这些向导的间隔子序列在下表8中列出。
表8-靶向小鼠白蛋白内含子1的MG29-1 sgRNA在用MG29-1/sgRNA RNP核转染或使用信使Max用MG29-1 mRNA和sgRNA转染的Hepa1-6细胞中的活性
/>
将Hepa1-6细胞,即转化的小鼠肝脏细胞系在标准条件(在5%CO2培养箱中具有10%FBS的DMEM培养基)下培养,并用通过在PBS缓冲液中混合sgRNA和经纯化的MG29-1蛋白形成的核糖核蛋白进行核转染。使用具有通过混合50pmol的MG29-1蛋白和100pmol的sgRNA形成的RNP的4D核转染装置(龙沙公司(Lonza))对悬浮于完整SF核转染试剂(龙沙公司)中的Hepa1-6细胞(1 x 105)进行核转染。在核转染之后,将细胞铺板在DMEM加10%FBS中的24孔板中,并在5%CO2培养箱中温育48至72小时。然后使用基于柱的纯化试剂盒(Purelink基因组DNA微型试剂盒,赛默飞世尔科技公司(ThermoFisher Scientific))从细胞中提取基因组DNA,并通过在260nm处的吸光度进行定量。在含有0.5微摩尔的引物mAlb90F(CTCCTCTTCGTCTCCGGC)(SEQ ID NO:4031)和mAlb1073R(CTGCCACATTGCTCAGCAC)(SEQ IDNO:4032)和1 x Pfusion快速PCR主混合物中的每一种的反应中,从50ng的基因组DNA中PCR扩增白蛋白内含子1区。
使用基于柱的纯化试剂盒(DNA清洁和浓缩器,Zymo研究公司(Zymo Research))纯化跨越小鼠白蛋白的整个内含子1的所得984bp PCR产物,并使用位于每个sgRNA的预测靶位点的150至350bp内的引物测序。使用来自未经转染的Hepa1-6细胞的引物mAlb90F(SEQID NO:4031)和mAlb1073R(SEQ ID NO:4032)产生的PCR产物作为对照并行测序。使用确定INDEL的频率以及INDEL谱的CRISPR编辑的推断(ICE)分析桑格测序色谱图(Hsiau等人,从桑格跟踪数据推断CRISPR编辑(Inference of CRISPR Edits from Sanger Trace Data).生物学预印本资料库(BioArxiv.)2018 https://www.biorxiv.org/content/early/2018/01/20/251082)。
当核酸酶在活细胞内的DNA中产生双链断裂(DSB)时,DSB由细胞DNA修复机制修复。在培养物中主动分裂细胞,如转化的哺乳动物细胞,并且在不存在修复模板的情况下,这种修复通过NHEJ途径发生。NHEJ途径是引入双链断裂位点处的碱基的插入或缺失的易错过程(Lieber,M.R,《生物化学年度评论(Annu Rev Biochem)》2010;79181-211)。因此,这些插入和缺失是发生并随后修复的双链断裂的标志,广泛用作核酸酶的编辑或切割效率的读出。插入和缺失的谱取决于产生双链断裂的核酸酶的特征,并且还取决于切割位点处的序列背景。基于体外测定,MG29-1核酸酶产生位于PAM的3′处的交错的切割。由于在端接合之前修剪单链端,因此交错的切割通常会导致更大的缺失。表8列出了在Hepa1-6细胞中测试的靶向小鼠白蛋白内含子1的19个sgRNA中的每一个产生的总INDEL频率。18个sgRNA中的十一个sgRNA在靶位点处产生可检测的INDEL,其中5个sgRNA产生大于50%的INDEL频率,并且4个sgRNA产生大于75%的indel频率。这些数据证明,MG29-1核酸酶可以编辑效率大于75%的sgRNA的预测靶位点处的培养的小鼠肝脏细胞的基因组。
通过使用基于商业脂质的转染试剂(脂质体信使MAX,英杰公司(Invitrogen))共转染sgRNA和编码MG29-1核酸酶的mRNA来评估同一组sgRNA的编辑效率。编码MG29-1的mRNA通过使用来自质粒的T7聚合酶进行体外转录来产生,其中克隆MG29-1的编码序列。使用人密码子使用表对MG29-1编码序列进行密码子优化,并且侧接衍生自N末端处的SV40和衍生自C末端处的核质蛋白的核定位信号。另外,UTR包含在编码序列的3′端以改善翻译。在编码序列的3′端处包含3′UTR,随后包含大约90至110个核苷酸的poly A轨道,以改善体内mRNA稳定性(参见例如,针对野生型MG29-1的SEQ ID NO:4426和针对S168R变体的SEQ ID NO:3327)。体外转录反应包含清洁封端试剂(三联生物技术公司(TrilinkBioTechnologies)),并且使用MEGAClearTM转录清洁试剂盒(英杰公司)纯化所得RNA,并使用TapeStation(安捷伦公司(Agilent))评估纯度,并且发现其由>90%全长RNA组成。如表1中所看到的,Hepa1-6细胞的mRNA/sgRNA脂质转染后的编辑效率与用RNP的核转染看到的编辑效率相似但不相同,但证实当以mRNA的形式递送时,MG29-1核酸酶在培养的肝脏细胞中是活性的。
图50是如通过使用mALb29-1-8作为指向导(SEQ ID NO:3999)的ICE分析确定的MG29-1的indel谱的代表性实例,并且证明了4个碱基的缺失是最频繁的事件(总序列的25%),并且1个、5个、6个或7个碱基的缺失各自占序列的约10%至15%。还检测到至多13个碱基的较长缺失,但插入是不可检测的。相比之下,具有靶向小鼠白蛋白内含子1的向导的spCas9主要产生1个碱基插入或缺失。
图51是通过小鼠白蛋白内含子1区的PCR产物的下一代测序(NGS)确定的MG29-1和sgRNA mAlb29-1-8的indel谱的代表性实例。总共获得大约15,000个序列读段。通过NGS缺失,4个碱基是最常见的indel(总共约20%),其中1个、5个、6个和7个碱基的缺失各自占indel的约10%。还检测到至多19bp的较大的缺失。通过NGS分析观察到的谱与通过ICE测量的谱紧密匹配。这些结果证明,MG29-1在靶位点产生与体外观察到的交错的切割一致的大缺失。
实例8-本文所描述的核酸酶靶向培养的人肝脏细胞(HepG2)中的内含子区的能力的证明
为了评估MG29-1在人细胞中的内含子区处产生双链断裂的可能性,选择人血清白蛋白的内含子1作为靶基因座。使用Geneious Prime核酸分析软件(https://www.geneious.com/prime/)中的向导查找算法鉴定间隔子长度为22nt的靶向人白蛋白内含子1的单向导RNA(sgRNA)。使用位于间隔子5′处的KTTG(SEQ ID NO:3870)的PAM,在人白蛋白内含子1内总共鉴定了90个潜在sgRNA。排除跨越内含子/外显子边界的向导。使用Geneious Prime,针对小鼠基因组搜索这些向导的间隔子序列,并且由软件基于与基因组中的另外的位点的比对来分配特异性评分。由于对特异性的关注,排除了具有相同碱基的4个或更多个连续碱基的间隔子序列。总共选择了具有最高特异性评分的23个间隔子进行测试。为了产生sgRNA,将“TAATTTCTACTGTTGTAGAT”的主链序列添加到间隔子序列的3′端。将并入经化学修饰的碱基的sgRNA化学合成,所述经化学修饰的碱基经鉴定以改进sgRNA用于cpf1向导的性能(可获自整合DNA技术公司的AltR1/AltR2化学物质)。这些向导的间隔子序列在表9中列出。
表9-靶向人白蛋白内含子1的MG29-1 sgRNA的间隔子序列和用MG29-1/sgRNA RNP核转染的HepG2细胞中的活性
将HepG2细胞,即转化的人肝脏细胞系在标准条件(在5%CO2培养箱中具有10%FBS的MEM培养基)下培养,并用通过在PBS缓冲液中混合sgRNA和经纯化的MG29-1蛋白形成的核糖核蛋白进行核转染。使用具有通过混合80pmol的MG29-1蛋白和160pmol的sgRNA形成的RNP的4D核转染装置(龙沙公司)对悬浮于完整SF核转染试剂(龙沙公司)中的总共1e5个HepG2细胞进行核转染。在核转染后,将细胞铺板在DMEM加10%FBS中的24孔板中,并在5%CO2培养箱中温育48至72小时。然后使用基于柱的纯化试剂盒(Purelink基因组DNA微型试剂盒,赛默飞世尔科技公司)从细胞中提取基因组DNA,并通过在260nm处的吸光度进行定量。在含有0.5微摩尔的引物hAlb 11F(TCTTCTGTCAACCCCACACGCC)(SEQ ID NO:4079)和hAlb834R(CTTGTCTGGGCAAGGGAAGA)(SEQ ID NO:4080)和1 x Pfusion快速PCR主混合物中的每一种的反应中,从50ng的基因组DNA中PCR扩增白蛋白内含子1区。使用基于柱的纯化试剂盒(DNA清洁和浓缩器,Zymo研究公司)纯化跨越小鼠白蛋白的整个内含子1的所得826bpPCR产物,并使用位于sgRNA的预测靶位点的150至350bp内的引物测序。
使用来自未经转染的HepG2细胞的引物hAlb 11F(TCTTCTGTCAACCCCACACGCC)(SEQID NO:4079)和hAlb834R(CTTGTCTGGGCAAGGGAAGA)(SEQ ID NO:4080)产生的PCR产物作为对照并行测序。使用确定INDEL的频率以及INDEL谱的CRISPR编辑的推断(ICE)分析桑格测序色谱图。当核酸酶在活细胞内的DNA中产生双链断裂(DSB)时,DSB由细胞DNA修复机制修复。在培养物中主动分裂细胞,如转化的哺乳动物细胞,并且在不存在修复模板的情况下,这种修复通过NHEJ途径发生。NHEJ途径是引入双链断裂位点处的碱基的插入或缺失的易错过程(Lieber,M.R,《生物化学年度评论》2010;79:181-211)。
因此,这些插入和缺失是发生并随后修复的双链断裂的标志,广泛用作核酸酶的编辑或切割效率的读出。插入和缺失的谱取决于产生双链断裂的核酸酶的特征,并且还取决于切割位点处的序列背景。基于体外测定,MG29-1核酸酶在来自PAM的22个核苷酸处切割靶链(在来自PAM的21个核苷酸处频率较低),并且在来自PAM的18个核苷酸处切割非靶链,因此产生位于PAM的3′的4个核苷酸交错的端。由于在端接合之前修剪单链端,因此交错的切割通常会导致更大的缺失。
表9列出了在HepG2细胞中测试的靶向人白蛋白内含子1的23个sgRNA中的每一个产生的总indel频率。23个sgRNA中的十六个sgRNA在靶位点处产生可检测的indel,其中8个sgRNA产生大于50%的INDEL,并且5个sgRNA产生大于90%的indel频率。这些数据证明,MG29-1核酸酶可以编辑效率大于90%的sgRNA的预测靶位点处的培养的人肝脏细胞系的基因组。
实例9-本文所描述的核酸酶编辑培养的小鼠肝脏细胞中的外显子区的能力的证明
序列特异性核酸酶可以用于破坏基因的编码序列,并且由此产生所关注的蛋白质的功能敲除。当特异性蛋白质的敲低在特定疾病中具有有益效果时,这可用于治疗性用途。破坏基因的编码序列的一种方法是使用序列特异性核酸酶在基因的外显子区内进行双链断裂。这些双链断裂将通过易错的修复途径进行修复以产生插入或缺失,这可能导致移码突变或氨基酸序列的变化,从而破坏蛋白质的功能。
为了评估MG29-1在肝脏细胞中表达的基因的外显子区处产生双链断裂的可能性,选择编码乙醇酸氧化酶(hao-1)的基因作为靶基因座。使用Geneious Prime核酸分析软件(https://www.geneious.com/prime/)中的向导查找算法鉴定靶向小鼠hao-1的外显子1至4的间隔子长度为22nt的单向导RNA(sgRNA)。hao-1基因的前4个外显子包括大约50%的hao-1编码序列的N末端。选择前4个外显子,因为朝向基因的编码序列的N末端产生的INDEL更有可能产生破坏蛋白质的活性的移码或错义突变。使用位于间隔子5′处的KTTG(SEQ IDNO:3870)的PAM,在小鼠hao-1外显子1至4内鉴定总共45个潜在sgRNA。包含跨越内含子/外显子边界的向导,因为此类向导可以产生干扰剪接的INDEL。使用Geneious Prime,针对小鼠基因组搜索这45个向导的间隔子序列,并且由软件基于与小鼠基因组中的另外的位点的比对来分配特异性评分。由于对特异性的关注,排除了具有相同碱基的4个或更多个连续碱基的间隔子序列。总共选择了具有最高特异性评分的45个间隔子进行测试。
为了产生sgRNA,将“TAATTTCTACTGTTGTAGAT”的主链序列添加到间隔子序列的3′端。将并入经化学修饰的碱基的sgRNA化学合成,所述经化学修饰的碱基经鉴定以改进sgRNA用于cpf1向导的性能(可获自整合DNA技术公司的AltR1/AltR2化学物质)。这些向导的间隔子序列在表3中列出。
表3-靶向小鼠hao-1外显子1至4的MG29-1 sgRNA的间隔子序列和用MG29-1/sgRNARNP核转染的Hepa1-6细胞中的活性
/>
将Hepa1-6细胞,即转化的小鼠肝脏细胞系在标准条件(在5%CO2培养箱中具有10%FBS的DMEM培养基)下培养,并用通过在PBS缓冲液中混合sgRNA和经纯化的MG29-1蛋白形成的核糖核蛋白进行核转染。使用具有通过混合50pmol的MG29-1蛋白和100pmol的sgRNA形成的RNP的4D核转染装置(龙沙公司)对悬浮于完整SF核转染试剂(龙沙公司)中的总共1e5Hepa1-6个细胞进行核转染。在核转染之后,将细胞铺板在DMEM加10%FBS中的24孔板中,并在5%CO2培养箱中温育48至72小时。然后使用基于柱的纯化试剂盒(Purelink基因组DNA微型试剂盒,赛默飞世尔科技公司)从细胞中提取基因组DNA,并通过在260nm处的吸光度进行定量。在含有对每个外显子具有特异性的0.5微摩尔对的引物的反应中,从40ng的基因组DNA中PCR扩增小鼠hao-1基因1的外显子1至4。用于外显子1的PCR引物是PCR_mHE1_F_+233(GTGACCAACCCTACCCGTTT)(SEQ ID NO:4171)、PCR_mHE1_R_-553(GCAAGCACCTACTGTCTCGT)(SEQ ID NO:4172)。用于外显子2的PCR引物是HAO1_E2_F5721(CAACGAAGGTTCCCTCCAGG)(SEQ ID NO:4173)、HAO1_E2_R6271(GGAAGGGTGTTCGAGAAGGA)(SEQ ID NO:4174)。用于外显子3的PCR引物是HAO1_E3_F23198(TGCCCTAGACAAGCTGACAC)(SEQ ID NO:4175)、HAO1_E3_R23879(CAGATTCTGGAAGTGGCCCA)(SEQ ID NO:4176)。用于外显子4的PCR引物是HAO1_E4_F31087(CCTGTAGGTGGCTGAGTACG)(SEQ ID NO:4177)、HAO1_E4_R31650(AGGTTTGGTTCCCCTCACCT)(SEQ ID NO:4178)。
除了引物和基因组DNA之外,PCR反应还含有1 x Pfusion快速PCR主混合物(赛默飞世尔公司)。当在琼脂糖凝胶上分析时,所得PCR产物包括单个带,从而证明了PCR反应是特异性的,并且使用基于柱的纯化试剂盒(DNA清洁和浓缩器,Zymo研究公司)纯化。对于测序,使用与来自每个切割位点的至少100nt的序列互补的引物。序列外显子1的引物是Seq_mHE1_F_+139(GTCTAGGCATACAATGTTTGCTCA)(SEQ ID NO:4179)。序列外显子2的引物是5938F Seq_HAO1_E2(CTATGCAAGGAAAAGATTTGGCC)(SEQ ID NO:4180)。序列外显子3的引物是HAO1_E3_F23476(TCTTCCCCCTTGAATGAAACACT)(SEQ ID NO:4181)和反向PCR引物HAO1_E3_R23879(CAGATTCTGGAAGTGGCCCA)(SEQ ID NO:4182)。序列外显子4的引物是反向PCR引物HAO1_E4_R31650(AGGTTTGGTTCCCCTCACCT)(SEQ ID NO:4183)。
PCR产物的测序示出其含有hao-1外显子的预期序列。使用位于每个sgRNA的预测靶位点的100至350bp内的引物对衍生自用不同RNP或未经处理的对照进行核转染的Hepa-16细胞的PCR产物进行测序。使用确定INDEL的频率以及INDEL谱的CRISPR编辑的推断(ICE)分析桑格测序色谱图(Hsiau等人,从桑格跟踪数据推断CRISPR编辑(Inference of CRISPREdits from Sanger Trace Data).生物学预印本资料库2018 https://www.biorxiv.org/content/early/2018/01/20/251082)。当核酸酶在活细胞内的DNA中产生双链断裂(DSB)时,DSB由细胞DNA修复机制修复。在培养物中主动分裂细胞,如转化的哺乳动物细胞,并且在不存在修复模板的情况下,这种修复通过NHEJ途径发生。NHEJ途径是引入双链断裂位点处的碱基的插入或缺失的易错过程(Lieber,M.R,《生物化学年度评论》2010;79:181-211)。因此,这些插入和缺失是发生并随后修复的双链断裂的标志,并且在本领域中广泛用作核酸酶的编辑或切割效率的读出。如在表3中所呈现的,14个向导在其预测的靶位点处显示出可检测的编辑。四个向导表现出大于90%的编辑活性。所有14种活性向导具有TTTN的PAM序列,从而证明了此PAM在体内更有效。然而,并非所有利用TTTNPAM的向导都是活性的。这些数据证明,MG29-1核酸酶可以以高效率在培养的肝脏细胞中的外显子区中产生RNA向导的、序列特异性的双链断裂。
实例10-用于破坏Hao-1基因的另外的sgRNA的设计
另外的sgRNA被设计成靶向hao-1基因的外显子部分。这些被设计成靶向前4个外显子,因为这些外显子占编码序列的大约50%,并且朝向基因的编码序列的N末端产生的indel更有可能产生破坏蛋白质的活性的移码或错义突变。使用实例9中示出的KTTG(SEQID NO:3870)的更具限制性的PAM在哺乳动物细胞中更具活性,在人hao-1外显子1至4内鉴定总共42种潜在sgRNA(表4)。
表4-在人hao-1基因的外显子1至4中鉴定的MG29-1的间隔子序列
/>
包含跨越内含子/外显子边界的向导,因为此类向导可以产生干扰剪接的indel。使用Geneious Prime,针对人基因组搜索这42个向导的间隔子序列,并且由软件基于与人基因组的比对来分配特异性评分。更高的特异性评分指示所述向导识别人基因组中除设计间隔子的位点之外的1个或更多个序列的概率较低。特异性评分在10%至100%的范围内,其中25个向导具有大于90%的特异性评分,并且33个向导具有大于80%的特异性评分。此分析证明,可以容易地鉴定靶向具有高特异性评分的人基因的外显子区的向导,并且预期鉴定多个高活性向导。
实例11-本文所描述的核酸酶与小鼠肝脏细胞中的spCas9的编辑效力的比较
来自细菌物种酿脓链球菌(Streptococcus pyogenes)(spCas9)的CRISPR Cas9核酸酶广泛用于基因组编辑,并且是鉴定的最有活性的RNA向导的核酸酶之一。通过小鼠肝脏细胞系Hepa1-6中不同剂量的RNP的核转染来评估MG29-1与spCas9相比的相对效力。靶向小鼠白蛋白的内含子1的sgRNA用于两种核酸酶。对于MG29-1,选择实例29中鉴定的sgRNAmAlb29-1-8。将并入称为AltR1/AltR2(整合DNA技术公司)的化学修饰的向导mAlb29-1-8(参见实例29)化学合成,所述化学修饰被设计成改善具有与MG29-1相似的sgRNA结构的V型核酸酶cpf1的向导的效力。对于spCas9,通过测试选自计算机(in-silico)筛选的3个向导来鉴定有效编辑小鼠白蛋白内含子1的sgRNA。这些研究中使用的spCas9蛋白从商业供应商获得(整合DNA技术公司AltR-sPCas9)。
将sgRNA mAlbR1(间隔子序列TTAGTATAGCATGGTCGAGC)化学合成并并入由2′O甲基碱基构成的化学修饰和在改善细胞中的效力的向导两端的3个碱基上的硫代磷酸酯(PS)键。当由20pmol spCas9蛋白/50pmol的向导构成的RNP被核转染到Hepa1-6细胞中时,mAlbR1 sgRNA以90%的频率产生INDEL,从而表明这是高活性向导。将具有20pmole至1pmole的一系列核酸酶蛋白和1∶2.5的蛋白质与sgRNA的恒定比率形成的RNP核转染到Hepa1-6细胞中。使用PCR扩增基因组DNA的桑格测序和ICE分析定量小鼠白蛋白内含子1中的靶位点处的INDEL。图52中示出的结果证明,当编辑不饱和时,MG29-1在较低的RNP剂量下产生比spCas9更高的INDEL的百分比。这些数据指示MG29-1在肝脏源性哺乳动物细胞中至少与spCas9一样具有活性并且可能比所述spCas9更具有活性。
实例34-本文所描述的核酸酶的工程化序列变体和对小鼠肝脏细胞的评估
为了提高MG29-1的编辑效率,在MG29-1编码区中引入了一组取代一个或两个氨基酸的突变。通过与氨基酸球菌Cas12a(AsCas12a)的比对来确定所述组的氨基酸取代。结构化向导工程化(Kleinstiver等人,《自然生物技术(Nat Biotechnol.)》2019,37 276-282)取代了AsCas12a中的不同氨基酸,目的是改变或改善PAM结合。AsCas12a中的四个氨基酸取代:S170R、E174R、N577R和K583R在规范和非规范PAM下示出更高的编辑效率。匹配这些取代的位点通过多重比对在MG29-1中鉴定,并且对应于:MG29-1中的S168R、E172R、N577R和K583R。
为了测试单个氨基酸取代,使用2质粒递送系统。使用标准分子克隆技术构建编码具有单个氨基酸取代的MG29-1的表达质粒。一种在CMV启动子下编码MG29-1的质粒,第二质粒含有mAlb29-1-8 sgRNA(参见表8),其在Hepa 1-6细胞中具有高编辑效率。向导的转录由人U6启动子驱动。使用编码MG29-1的体外转录(IVT)mRNA(关于如何制备IVT mRNA的详情,参见实例11)和并入已由整合DNA技术公司针对Cpf1优化的AltR1/AltR2化学修饰的经化学合成的向导(由整合DNA技术公司合成),确认来自使用2质粒系统的单个氨基酸取代的初始结果并测试双氨基酸取代。为了递送2质粒系统,将编码MG29-1的100ng的质粒和编码向导的400ng的质粒与脂质体3000混合,添加到Hepa1-6细胞中并在基因组DNA分离之前温育3天。
为了递送IVT mRNA和合成向导,将300ng的mRNA和120ng的合成向导与脂质体信使Max混合,添加到细胞中并在基因组DNA分离之前温育2天。使用IVT mRNA筛选的合成向导与表8中详细描述的向导对应,但为了简单起见,图53中的向导的名称已被缩短,使得向导“mAlb29-1-1”表示为g1-1,“mAlb29-1-8”表示为g1-8等。还测试了靶向人T细胞受体基因座(TRAC)的一个向导(图53D上的35TRAC)。向导35TRAC间隔子是:具有TTTG PAM的GAGTCTCTCAGCTGGTACACGG(SEQ ID NO:4268)。向导35TRAC以与如之前所提到的相同的修饰订购。如先前实例中针对小鼠白蛋白内含子1的MG29-1编辑所描述的进行基因组DNA和PCR扩增。对于向导35TRAC,用引物F扩增人TRAC基因座:TGCTTTGCTGGGCCTTTTTC(SEQ ID NO:4269),引物R:ACAGTCTGAGCAAAGGCAGG(SEQ ID NO:4270)。如之前所描述的纯化所得957bpPCR产物。使用引物ATCACGAGCAGCTGGTTTCT(SEQ ID NO:4271)通过桑格测序评估编辑。
使用PCR产物的桑格测序,随后通过CRISPR编辑的推断(ICE)定量小鼠白蛋白内含子1和人TRAC基因座的编辑效率。代表至多4个生物复制的数据在图53A-D中绘制。当在2质粒系统中使用向导mAlb29-1-8时,单个氨基酸取代S168R证明了改善的编辑效率(图53A)。突变E172R未提供对向导mAlb29-1-8的显著改善,而突变K583R完全阻止了用mAlb29-1-8向导的编辑。用MG29-1 mRNA和合成向导mAlb29-1-8转染证实了质粒转染的结果(图53B)。单个氨基酸取代S168R赋予了跨用向导mAlb29-1-8测试的不同浓度的mRNA的更高的编辑效率(图53B)。对S168R与E172R的双氨基酸取代(不损害单独的活性的取代,如在图53A中所看到的)或N577R(在MG29-1质粒转染中未经测试但赋予cpf1的较高编辑效率的取代)和Y170R(假设其可基于预测的MG29-1蛋白质结构改善编辑效率)进行测试,并与单个S168R突变体进行比较。
在经测试的条件下,没有一个双突变赋予改善的编辑效率(图53C)。将MG29-1和MG29-1 WT的S168R变体的编辑效率与靶向小鼠白蛋白内含子1的12个向导和靶向人T细胞受体基因座(TRAC)的1个向导并行比较。MG29-1的S168R变体在所有13个向导中表现出改善的编辑效率,其中一些向导比其它向导更有益(图4d)。重要的是,S168R不损害经测试的向导中的任何经测试的向导的哺乳动物编辑效率。这些结果证明,MG29-1的S168R(在氨基酸位置168处的丝氨酸变为精氨酸)变体具有改善的编辑活性,并且在鉴定用于治疗性用途的高活性向导方面是有利的。
实例35-鉴定改善哺乳动物细胞中的向导稳定性并改善编辑效率的本文所描述的核酸酶的sgRNA的化学修饰
RNA分子在生物系统中固有地不稳定,因为其对核酸酶的切割敏感。RNA的天然化学结构的修饰已被广泛用于在治疗性药物开发的背景下改善用于RNA干扰(RNAi)的稳定性RNA分子(Corey,《临床研究杂志(J Clin Invest.)》2007年12月3日;117(12):3615-3622,J.B.Bramsen,J.Kjems《基因学前沿(Frontiers in Genetics)》,3(2012),p.154)。将化学修饰引入RNA的核碱基或磷酸二酯主链在改善体内短RNA分子的稳定性,以及因此效力方面是关键的。已经开发了在针对核酸酶的稳定性和对互补DNA或RNA的亲和力方面具有不同性质的广泛范围的化学修饰。
类似的化学修饰已应用于CRISPR Cas9核酸酶的向导RNA(Hendel等人,《自然生物技术》2015年9月;33(9):985-989,Ryan等人《核酸研究(Nucleic Acids Res)》2018年1月25日;46(2):792-803,Mir等人《自然通讯(Nature Communications)》第9卷,文章编号:2641(2018),O’Reilly等人《核酸研究》201947,546-558,Yin等人《自然生物技术》第35卷,第1179-1187页(2017),所述文献中的每一个通过全文引用的方式并入本文)。
MG29-1核酸酶是一种新的核酸酶,与经鉴定的V型CRISPR酶如cpf1具有有限的氨基酸序列相似性。虽然针对MG29-1鉴定的向导RNA的结构(主链)组分的序列类似于针对MG29-1向导的cpf1化学修饰的序列,其能够在未鉴定保留活性的同时实现改善的稳定性。设计MG29-1 sgRNA的一系列化学修饰,以评估其对哺乳动物细胞中的sgRNA活性的影响以及在存在哺乳动物细胞蛋白提取物的情况下的稳定性。
选择了sgRNA mAlb29-1-8,当向导含有一组由IDT开发的被设计成改善向导RNA对cpf1的活性并且可商购获得(IDT)的称为AltR1/AltR2的专有的化学修饰时,其在小鼠肝脏细胞系Hepa1-6中具有高活性。选择测试核碱基的2个化学修饰;其中2’羟基被甲基置换的2′-O-甲基,和其中2′羟基被氟置换的2′-氟。2′-O-甲基和2′-氟修饰两者均改善对核酸酶的抗性。2′-O-甲基修饰是RNA的天然存在的转录后修饰,并且改善RNA:RNA双链体的结合亲和力,但对RNA:DNA稳定性几乎没有影响。经2′-氟修饰的碱基具有降低的免疫刺激作用,并且增加RNA:RNA和RNA:DNA杂合体两者的结合亲和力(参见例如Pallan等人《核酸研究》2011年4月;39(8):3482-95,Chen等人《科学报告(Scientific Reports)》第9卷,文章编号:6078(2019),Kawasaki,A.M.等人,《药物化学杂志(J Med Chem)》36,831-841(1993))。
还评估了硫代磷酸酯(PS)键代替碱基之间的磷酸二酯键的包含。PS键改善对核酸酶的抗性(Monia等人《核酸、蛋白质合成和分子遗传学(Nucleic Acids,ProteinSynthesis,and Molecular Genetics)》|第271卷,第24期,第14533-14540页,1996年6月14日)。
具有靶向小鼠白蛋白内含子1(mAlb29-1-8)的间隔子的MG29-1 sgRNA的预测次级结构在图54中示出。基于其它CRISPR-cas系统的序列组织,推测向导的主链部分中的茎环对于与MG29-1蛋白的相互作用是至关重要的。基于次级结构,在向导的不同结构和功能区中设计了一系列化学修饰。采用允许以更少化学修饰对向导进行初始测试的模块化方法,所述化学修饰告知向导的哪些结构区和功能区可以耐受不同的化学修饰,而不会显著丧失活性。结构区和功能区定义如下。向导的3′端和5′端是核酸外切酶的靶标,并且可以通过各种包含2′-O-甲基和PS键的化学修饰来保护,该方法已被用于提高spCas9的向导的稳定性(Hendel等人,《自然生物技术》2015年9月;33(9):985-989)。
选择包括向导的主链区中的茎和环的两半的序列以进行修饰。将间隔子分成种子区(最接近PAM的前6个核苷酸)和间隔子的剩余16个核苷酸(称为非种子区)。总共设计了43个向导并且合成了39个向导。所有43个向导都含有相同的核苷酸序列,但具有不同的化学修饰。通过RNP的核转染或通过编码MG29-1的mRNA和向导的共转染或通过两种方法,在Hepa1-6细胞中评估了向导中的39个向导的编辑活性。这两种转染方法可能由于递送到细胞的差异而影响向导的观察到的活性。
当使用RNP的核转染时,向导和MG29-1蛋白在管中预复合,并且然后使用核转染递送到细胞,其中电流在存在RNP的情况下施加到细胞的悬浮液。电流短暂地打开细胞膜(并且可能也打开核膜)中的孔,使得能够由RNP上的电荷驱动的RNP的细胞进入。RNP是通过由电流产生的孔还是通过在RNP的蛋白质组分中工程化的核定位信号,或者是两者的组合进入核尚不清楚。
当使用mRNA和向导与脂质转染试剂如信使MAX共转染时,两种RNA的混合物与带正电荷的脂质形成复合物,并且复合物通过内吞作用进入细胞并最终到达细胞质。在细胞质中,mRNA被翻译成蛋白质。在RNA向导的核酸酶如MG29-1的情况下,所得MG29-1蛋白在由工程化成MG29-1蛋白的核定位信号介导的过程中进入核之前,推测将与细胞质中的向导RNA形成复合物。
由于将mRNA翻译成足够量的MG29-1蛋白,随后MG29-1蛋白与向导RNA的结合需要有限时间量,因此向导RNA可能需要在细胞质中增加稳定性的时间比通过核转染递送预先形成的RNP的情况更长。因此,基于脂质的mRNA/sgRNA共转染可能需要比RNP核转染的情况更稳定的向导,这使得在一些向导化学物质中作为RNP起作用,但在使用阳离子脂质试剂与mRNA共转染时不起作用。
向导mAlb298-1至mAlb298-5含有使用2′-O-甲基和2′氟碱基的混合物加PS键的限于序列的5′和3′端的化学修饰。与没有化学修饰的sgRNA相比,当通过RNP递送时,这些向导的活性高7至11倍,从而证明了对向导的端修饰改善了向导活性,可能通过改善对核酸外切酶的抗性。sgRNA mAlb298-1至mAlb298-5表现出含有商业化学修饰的向导的编辑活性的64%至114%(AltR1/AltR2)。含有最大数量的化学修饰的向导4是经端修饰的向导中活性最小的向导,但仍然比未经修饰的向导的活性高7倍。向导mALB298-30在5′端处含有三个2′-O甲基碱基和2个PS键,并且在5′端处含有4个2′-O甲基碱基和3个PS键,并且还表现出比未经修饰的向导高约10倍的活性,并且在RNA共转染的情况下与mAlb298-1相比相似或略微改善。这些数据证明,与未经修饰的向导相比,在MG29-1向导的两端上2′O-甲基与PS键组合显著增强了向导活性。
2′-氟碱基和PS键的组合也在向导的3′端处耐受。向导mALb298-28在5′端上含有三个2′-氟碱基和2个PS键,并且在3′端上含有四个2′-氟碱基和三个PS键。此经端修饰的向导在两端上保留类似于具有2′-O甲基和PS修饰的向导的良好编辑活性,从而证明了2′-氟可以用于代替2′-O甲基以改善向导稳定性并保持编辑活性。
sgRNAmALb298-6、mALb298-7和mALb298-8在存在于mAlb298-1加茎的不同区中的PS键中的5′和3′端两者上含有相同的最小化学修饰。与RNP核转染测定中的mAlb298-1相比,3′茎(mALb298-6)和5′茎(mALb298-7)中的PS键使活性降低约30%,从而表明这些修饰可以耐受。通过基于脂质的转染观察到活性的更大降低。
与RNP核转染测定中的mAlb298-1相比,在3′和5′茎(mALb298-8)两者中引入PS键使活性降低约80%,并且在脂质转染测定中降低超过95%,从而表明两种PS键修饰的组合显著损害向导的功能。
sgRNA mAlb298-9在环中的存在于mAlb298-1加PS键中的5′和3′端两者上含有相同的最小化学修饰,并且表现出与mAlb298-1相似的活性,从而表明环中的PS键耐受良好。
sgRNAmAlb298-10、mAlb298-11和mAlb298-12在存在于mAlb298-1加茎的不同区中的2′-O甲基碱基中的5′和3′端两者上含有相同的最小化学修饰。与具有最具活性的向导mAlb298-12(经5′茎修饰)的mAlb298-1相比,在3′茎(mAlb298-11)或5′茎(mAlb298-12)或茎(mAlb298-10)的两半中包含2′-O甲基碱基通常耐受良好,并且活性小幅降低。
向导mAlb298-14在存在于mAlb298-1加茎的两半中的2′-O-甲基碱基和PS键的组合中的5′和3′端上含有相同的最小化学修饰,并且通过RNP核转染或通过基于脂质的RNA共转染没有编辑活性。这证实并扩展了在两个茎中仅含有PS键的mAlb298-8的结果保持最低水平的活性,并且表明茎的两半的广泛化学修饰使向导失活。
sgRNA mAlb298-13在存在于mAlb298-1加除了间隔子的种子区之外,在主链和间隔子的剩余部分中每隔一个碱基间隔开的PS键中的5′和3′端两者上含有相同的最小化学修饰。这些修饰导致编辑活性显著丧失至接近背景水平。虽然与大多数向导的>75%相比,此向导的纯度为约50%,但这不能单独解释为编辑活性的完全丧失。因此,在整个向导中以基本上随机的方式分配PS键不是改善向导稳定性同时保持编辑活性的有效方法。
向导mALb298-15和mALb298-16在存在于mAlb298-1加主链中的广泛PS键中的5′和3′端两者上含有相同的最小化学修饰。虽然两个向导通过RNP核转染保留了mAlb298-1的约35%的活性,通过基于脂质的RNA共转染保留了mAlb298-1的3%的活性,从而表明主链的广泛PS修饰显著降低了编辑活性。如在mAlb298-17和mAlb298-18中那样,将主链中的PS键与间隔子区中的PS键组合,导致与观察一致的活性的进一步丧失,PS键的随机包含阻断向导通过MG29-1直接编辑的能力。
向导mAlb298-19在间隔子中含有与mALb298-1相同的化学修饰,但在主链区中,5′端具有另外的4个2′O-甲基碱基和另外的14个PS键。通过RNP核转染,mAlb298-19的活性为mAlb298-1的活性的约40%,但通过RNA共转染,活性为其活性的22%,这再次证明在向导的主链区中的广泛化学修饰不能良好耐受。
向导mAlb298-20、mAlb298-21、mAlb298-22和mAlb298-23在主链区中具有相同的化学修饰,所述主链区由单个2′-O甲基和5′端处的2个PS键组构成,所述化学修饰与mAlb298-1中的5′端修饰相同。向导mAlb298-20、mAlb298-21、mAlb298-22和mAlb298-23的间隔子区含有2′-O-甲基和2′-氟碱基以及PS键的组合。这4个向导中最具活性的向导是mAlb298-2,其中在间隔子中的所有碱基上进行2′-氟修饰,除了最接近PAM(种子区)的7个碱基和3′端处的末端碱基之外,用2′-O-甲基和2个PS键修饰。这证明除了种子区之外,在间隔子的大部分间隔子上包含2′-氟修饰不会显著降低活性,并且因此代表用于增强向导稳定性的良好策略。
向导mAlb298-24、mAlb298-25、mAlb298-26和mAlb298-8在主链中具有相同的化学修饰。在茎上的两半中具有PS键的mAlb298-8具有显著降低的编辑活性,所述编辑活性为向导mAlb298-1的24%和2%,从而证明了这些PS键损害活性。有趣的是,虽然mALb298-24和mALb298-25也具有低编辑活性,但与mAlb298-8相比,mALb298-26的活性得到改善,从而表明在间隔子(不包括种子区)中的碱基中的14个碱基中包括2′-氟碱基的mALb298-26中的另外的修饰至少部分地挽救了由茎中的PS键引起的编辑活性降低。这提供了在编辑活性时间隔子中2′-氟碱基的有益影响的另外的证据。
向导mAlb298-27和mAlb298-29在整个主链和间隔子区中含有广泛的碱基和PS修饰,不再具有活性,从而表明并非向导的所有化学修饰都保留编辑活性。
基于从向导mALb298-1至mALb298-30的分析获得的结构活性关系,通过Hepa1-6细胞的RNP核转染和基于脂质的RNA共转染来设计和测试另外一组七个向导。这些向导组合了化学修饰,观察到所述化学修饰在向导mALb298-1至mALb298-30中保持良好的编辑活性。向导mALb298-31至mALb298-37均包含由至少一个2′-O甲基和在5′端处的2个PS键以及一个2′-O甲基和在5′端处的1个PS键构成的端修饰。除了端修饰之外,如在mAlb298-31那样,将茎的两半中的2′-O甲基碱基与间隔子(不包括种子区)的14个碱基中的2′氟碱基组合,导致编辑活性略微改善或类似于单独的端修饰,并且与未经修饰的向导相比改善10倍。如在mALb298-32那样,将仅5′茎中的2′-O甲基碱基与间隔子(不包括种子区)的14个碱基中的2′氟碱基组合,从而得到经测试的最具活性的向导。
类似地,如在mALb298-33中那样,将仅环中的PS键与间隔子(不包括种子区)的14个碱基中的2′氟碱基组合导致比未经修饰的向导高至多15倍的强效活性。向导mAlb298-37将更广泛的3′端修饰与5′茎中的2′-O甲基碱基、环中的PS键和间隔子(不包括种子区)中的14个2′氟碱基和3个PS键组合,并且仍然保持类似于AltR1/R2修饰的编辑活性,并且与未经修饰的向导相比显著改善。mALb298-37因此代表在哺乳动物细胞中保持强效编辑活性的经重修饰的MG29-1向导。向导mALb298-38在作为RNP递送时表现出强效编辑活性,但在通过基于脂质的RNA共转染递送到细胞时完全无活性,从而因此表明向导可能对核酸酶具有一些意想不到的敏感度。在考虑RNP和mRNA转染方法两者时,与向导mAlb298-37相同的向导mALb298-39除了在间隔子中具有11个更少的2′-氟碱基和1个更少的PS键之外具有最高的编辑活性,但是与其它向导设计相比,其具有更少的化学修饰,在体内性能方面可能是有害的。
化学修饰的另外的组合被设计成产生也可以保持良好的编辑活性,同时具有更广泛的化学修饰的mAlb298-40至mALb298-43。例如,在还并入一些DNA碱基的mAlb298-41中,碱基中的6个碱基是未经修饰的核糖核苷酸。类似地,mAlb298-42在整个间隔子中含有2′-氟基团,并且具有5个未经修饰的核糖核苷酸。设想这些和其它向导化学修饰的测试将产生一种或多种优化的设计。然而,在一组向导mALb298-1至mALb298-39中,并且特别是在一组向导mALb298-31至mALb298-39中,鉴定了具有保持与未经修饰的向导或仅具有端修饰的向导相似或更好的编辑活性的广泛化学修饰的向导。
为了测试经化学修饰的向导与没有化学修饰的向导(天然RNA)相比的稳定性,使用细胞提取物进行稳定性测定。选择来自哺乳动物细胞的粗细胞提取物,因为其应当含有向导RNA在体外或体内递送到哺乳动物细胞时将暴露于的核酸酶的混合物。通过每15cm培养皿添加3ml的冷PBS汇合细胞并且使用细胞刮刀从培养皿的表面释放细胞来收集Hepa 1-6细胞。将细胞以200g沉淀10分钟,并且在-80℃下冷冻以供未来使用。对于稳定性测定,将细胞重悬浮于4体积的冷PBS中(例如,对于100mg沉淀,将细胞重悬浮于400μl的冷PBS中)。将Triton X-100添加到最终浓度为0.2%(v/v),将细胞涡旋10秒,置于冰上10分钟,并且再次涡旋10秒。Triton X-100是一种破坏细胞膜,但在所用浓度下不会使蛋白质失活或变性的温和的非离子型洗涤剂。
在冰上建立稳定性反应,并且包括具有100fmole每个向导的20μl的细胞粗提取物(100nM储备液中1μl)。每个向导建立六种反应,包括:输入、15分钟、30分钟、60分钟、240分钟和540分钟(时间以分钟为单位,从而指每个样品温育的时间长度)。将样品在37℃下温育15分钟至多540分钟,同时将输入对照置于冰上5分钟。在每个温育期之后,通过添加300μl的酚和硫氰酸胍(Tri试剂,Zymo研究公司)的混合物来停止反应,这立即使所有蛋白质变性并且有效抑制核糖核酸酶并促进RNA的后续回收。添加Tri试剂后,将样品涡旋15秒,并且在-20℃下储存。使用Direct-zol RNA微量制备型试剂盒(Zymo研究公司)从样品中提取RNA,并且在100μl无核酸酶水中洗脱。使用Taqman RT-qPCR使用Taqman miRNA测定技术(赛默飞世尔公司)进行经修饰的向导的检测,并且引物和探针被设计成特异性地检测mAlb298sgRNA中的序列,这对于向导中的所有向导都相同。将数据绘制为与输入样品相关的剩余sgRNA的百分比的函数。当与细胞提取物(图55)一起温育时,没有化学修饰的向导被最快速地消除,其中超过90%的向导在30分钟内降解。在存在细胞提取物的情况下,具有AltR1/AltR2(图55中的AltR)化学修饰的向导比未经修饰的向导稍微更稳定,其中约80%的向导在30分钟内降解。除了种子区之外,在两个端处含有化学修饰以及在两个茎中含有2′O-甲基碱基和在间隔子的所有位置处含有2′-氟碱基的向导mALb298-31显著比未经修饰向导或AltR向导更稳定。
与向导mALb298-31相比,向导mAlb298-34表现出改善的稳定性。向导mALb298-34在间隔子内的化学修饰方面不同于向导mALb298-31。mALb298-34在间隔子中具有比mALb298-31少9个的2′-氟碱基,但与mALb298-31中的2个PS键相比,间隔子中含有4个PS键。由于2′-氟碱基改善了RNA的稳定性,这表明间隔子中的另外的PS键与mALb298-31相比负责mALb298-34的改善稳定性。
向导mALb298-37是所有经测试的向导中最稳定的,并且与mALb298-34为30%相比,比240分钟后(4小时)剩余的向导为80%的mALb298-34稳定得多。mALb298-37的化学修饰在间隔子区和主链区两者中不同于向导mALb298-34。mALb298-37在5′端处具有另外两个2′-O-甲基和2个另外的PS键。另外,mALb298-37的环区含有PS键,并且不含存在于mALb298-34中的茎的后半部分的2′-O-甲基。另外,mALb298-37的间隔子含有多于9个的2′-氟碱基,但PS键的数量与mALb298-34相同,尽管在不同位置。
总的来说,这些数据表明,间隔子的5′端处和主链区的环中的另外的PS键显著改善向导RNA的稳定性。在经测试的向导中的细胞提取物中表现出最大稳定性的向导mALb298-37还在Hepa1-6细胞中表现出与AltR1/Altr2修饰相比相似或改善的强效编辑活性,并且仅与5′和3′端的化学修饰相比改善。
表5-MG29-1 sgRNA序列的化学修饰对哺乳动物细胞中编辑活性的影响
/>
/>
/>
/>
/>
#:基于纯度范围为54%至64%的分析型HPLC,这些向导具有小于75%的纯度。所有其它向导的纯度均超过75%。
NT:未经测试的
化学修饰命名法:“/”用于分离具有2′-氟修饰的碱基,m;2′-O-甲基碱基(例如,具有2′-O-甲基修饰的A碱基写作mA),i2F;内部2′-氟碱基(例如,具有2′-氟修饰的内部C写作/i2FC/),52F;在序列的5′端处的2′-氟碱基(例如,具有2′-氟修饰的5′C写作/52FC/),32F;在序列的3′端处的2′-氟碱基(例如,具有2′-氟修饰的3′A碱基写作/32FA/),r;包括糖核糖的天然RNA键(例如,A碱基的核糖或RNA形式写成rA),d;脱氧核糖糖(DNA)键(例如,A碱基的脱氧核糖形式写成dA),*;在磷酸二酯键中的氧分子中的一个氧分子被硫置换的碱基之间;AltR1和AltR2是指IDT技术专有的5′和3′AltR修饰
实例12-使用本文所描述的核酸酶在小鼠中进行治疗性基因编辑
本文所描述的基因编辑平台具有在体内影响修复改变的潜力。肝脏组织是可以使用本文所描述的基因编辑组合物和系统有利地靶向以用于体内基因编辑的组织的实例,例如通过引入用以敲低有害基因的表达或用于置换缺陷基因的indel。例如,若干种遗传性疾病起源于主要在肝脏中表达的蛋白质缺陷,并且在腺相关病毒(AAV)载体的临床试验中,已证明在体内递送到肝脏是安全和有效的。脂质纳米颗粒也已经示出递送核酸和用于RNAi策略的批准药物。肝脏组织还包含用于将蛋白质有效分泌到体循环中的适当的细胞机制。
选择患有表13或表14中的病状的受试者进行基因编辑疗法。例如,使用基因编辑平台鉴定患有A型血友病的人或小鼠模型受试者以用基因置换疗法治疗。
表6-治疗性基因置换中受试者选择的一些适应症
表7-治疗性基因敲低中受试者选择的一些适应症
将包括包封本文所描述的sgRNA和编码MG核酸酶的mRNA的脂质纳米颗粒(LNP)和包括编码治疗性基因的供体模板核酸的AAV(例如,AAV血清型8)的基因编辑平台静脉内引入到受试者的肝脏中。LNP通过LNP的表面功能化靶向肝细胞。
例如,用包括含有编码本文所描述的MG29-1核酸酶的mRNA的LNP的基因置换平台治疗患有A型血友病的受试者(SEQ ID NO:214)。LNP还含有对白蛋白I具有特异性的sgRNA,其在肝脏中高表达(例如,白蛋白可以在肝脏中以约5g/dL表达,而因子VIII可以在肝脏中以约10μg/dL表达,或是白蛋白的1/1百万)。除了LNP之外,包括编码编码置换因子VIII核苷酸序列的置换模板DNA的质粒的AAV8(AAV血清型8)病毒颗粒也被递送到受试者。一旦在细胞内,mRNA、sgRNA和模板DNA就被瞬时表达。MG29-1核酸酶使用sgRNA靶向宿主肝细胞DNA的靶基因座,并且然后切割宿主DNA。从AAV8中递送到宿主肝细胞的质粒转录的供体模板DNA剪接到细胞中,并在白蛋白I基因的靶位点出稳定整合到宿主DNA中,并且插入的因子VIIIDNA在白蛋白启动子下表达。
基因编辑平台还用于选择用于基因敲低疗法的受试者。例如,用含有编码本文所描述的MG29-1核酸酶的mRNA(SEQ ID NO:214)和对甲状腺素运载蛋白基因中的靶位点具有特异性的sgRNA的LNP治疗呈现家族性ATTR淀粉样变性的受试者。MG29-1核酸酶和sgRNA被递送到受试者的肝细胞并在其中表达。在一些实施例中,sgRNA靶向甲状腺素运载蛋白基因的终止密码子,并且MG29-1核酸酶的活性去除内源性终止密码子,从而有效地敲低基因的表达。在一些实施例中,基因敲低平台包括含有编码包括终止密码子的多核苷酸的质粒的AAV8。当AAV8被递送到表达核酸酶和sgRNA的相同细胞时,外源性终止密码子被剪接到甲状腺素运载蛋白基因中,从而导致基因表达的敲低,这是由经编辑的DNA产生的RNA翻译的蛋白质的过早截短的结果。
实例13-CD38在DNA水平下的基因编辑结果
根据制造商的建议,使用NK Cloudz系统(R&D系统公司(R&D Systems))扩增原代NK细胞。使用龙沙公司4D电穿孔仪将MG29-1 RNP(212pmol蛋白质/320pmol向导)(向导SEQID NO:4428-4465)核转染到NK细胞(500,000个)中。采集细胞,并且在转染后五天制备基因组DNA。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列(SEQ ID NO:4466-4503)。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图57)。
表14A:实例37的向导RNA的序列和由此靶向的序列
/>
/>
/>
/>
/>
实例38-CD38在表型水平下的基因编辑结果
如下测定经编辑的细胞的CD38表达:将原代NK细胞(500,000个)用磷酸盐缓冲盐水(PBS)洗涤,并根据制造商的说明用LIVE/DEADTM可固定的浅绿色死细胞染色试剂盒(赛默飞世尔公司)染色。然后洗涤细胞,并用FC阻断剂-人TruStain FcXTM(百进生物公司)在冰上温育20分钟。接下来,根据制造商的建议,用抗CD56 PE和抗38 PerCP eFluor 710抗体(赛默飞世尔公司)对细胞进行染色,并且通过流式细胞术通过收集每个样本25,000个总事件进行分析(图58)。
实例39-TIGIT在DNA水平下的基因编辑结果
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PMBC中纯化原代T细胞。使用龙沙公司4D电穿孔仪将MG29-1 RNP(106pmol蛋白质/160pmol向导)(SEQ ID NO:4504-4520)核转染到T细胞(200,000个)中。采集细胞,并且在转染后五天制备基因组DNA。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列(SEQ ID NO:4521-4537)。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图59)。
表14B:实例39的向导RNA的序列和靶向的序列
/>
/>
/>
实例14-AAVS1在DNA水平下的基因编辑结果
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PMBC中纯化原代T细胞。使用龙沙公司4D电穿孔仪将MG29-1 RNP(106pmol蛋白质/160pmol向导)(SEQ ID NO:4538-4568)核转染到T细胞(200,000个)中。采集细胞,并且在转染后五天制备基因组DNA。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列(SEQ ID NO:4569-4599)。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图60)。
表14C:实例40的向导RNA的序列和靶向的序列
/>
/>
/>
/>
/>
实例15-B2M在DNA水平下的基因编辑结果
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PMBC中纯化原代T细胞。使用龙沙公司4D电穿孔仪将MG29-1 RNP(106pmol蛋白质/160pmol向导)(SEQ ID NO:4600-4675)核转染到T细胞(200,000个)中。采集细胞,并且在转染后五天制备基因组DNA。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列(SEQ ID NO:4676-4751)。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图61)。
表14D:实例41的向导RNA的序列和靶向的序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
实例16-CD2在DNA水平下的基因编辑结果
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PMBC中纯化原代T细胞。使用龙沙公司4D电穿孔仪将MG29-1 RNP(126pmol蛋白质/160pmol向导)(SEQ ID NO:4752-4836)核转染到T细胞(200,000个)中。采集细胞,并且在转染后五天制备基因组DNA。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列(SEQ ID NO:4837-4921)。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图62)。
表14E:实例42的向导RNA的序列和靶向的序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
实例17-CD5在DNA水平下的基因编辑结果
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PMBC中纯化原代T细胞。使用龙沙公司4D电穿孔仪将MG29-1 RNP(126pmol蛋白质/160pmol向导)(SEQ ID NO:4922-4945)核转染到T细胞(200,000个)中。采集细胞,并且在转染后五天制备基因组DNA。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列(SEQ ID NO:4946-4969)。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图63)。
表14F:实例43的向导RNA的序列和靶向的序列
/>
/>
/>
实例18-小鼠TRAC在DNA水平下的基因编辑结果
从C57BL/6小鼠脾脏纯化原代T细胞。使用龙沙公司4D电穿孔仪和100pmol转染增强子(IDT)将MG29-1 RNP(126pmol蛋白质/160pmol向导)(SEQ ID NO:5056-5125)核转染到T细胞(200,000个)中。采集细胞,并且在转染后五天制备基因组DNA。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列(SEQ IDNO:5126-5195)。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图64A)。
表14G:实例44的向导RNA的序列和靶向的序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
为了通过流式细胞术进行分析,核转染后3天,将100,000个小鼠T细胞用抗小鼠CD3抗体(克隆17A2,英杰公司11-0032-82)在4C下染色30分钟,并且在Attune Nxt流式细胞仪上进行分析。小鼠TRAC基因的3′端处的向导具有高水平的indel,但不能产生TRAC的敲除。令人惊讶且出乎意料的是,表型与基因端附近的基因型无关,这可能是由于截短等位基因的功能保留以及无义介导的衰变途径未能去除过早截短的框外mRNA(图65)。
实例19-小鼠TRBC1和TRBC2在DNA水平下的基因编辑结果
从C57BL/6小鼠脾脏纯化原代T细胞。使用龙沙公司4D电穿孔仪和100pmol转染增强子(IDT)将MG29-1 RNP(104pmol蛋白/120pmol向导)(TRBC1:SEQ ID NO:5196-5210;TRBC2:SEQ ID NO:5226-5246)的核转染进行到T细胞(200,000个)中。采集细胞,并且在转染后五天制备基因组DNA。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列(TRBC1:SEQ ID NO:5211-5225;TRBC2:SEQ ID NO:5247-5267)。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图66A和66B)。为了通过流式细胞术进行分析,核转染后3天,将100,000个小鼠T细胞用抗小鼠CD3抗体(克隆17A2,英杰公司11-0032-82)在4C下染色30分钟,并且在Attune Nxt流式细胞仪上进行分析。
表14H:实例45的向导RNA的序列和靶向的序列
/>
/>
/>
/>
/>
/>
实例20-人TRBC1/2在DNA水平下的基因编辑结果
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PMBC中纯化原代T细胞。使用龙沙公司4D电穿孔仪将MG29-1 RNP(106pmol蛋白质/160pmol向导)(SEQ ID NO:5642-5660)核转染到T细胞(200,000个)中。为了通过流式细胞术进行分析,核转染后3天,将100,000个T细胞用抗CD3抗体在4C下染色30分钟,并且在Attune Nxt流式细胞仪上进行分析(图66C)。
表14I:实例46的向导RNA的序列和靶向的序列
/>
/>
/>
实例21-HPRT在DNA水平下的基因编辑结果
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PMBC中纯化原代T细胞。使用龙沙公司4D电穿孔仪将MG29-1 RNP(126pmol蛋白质/160pmol向导)(SEQ ID NO:5482-5561)核转染到T细胞(200,000个)中。采集细胞,并且在转染后五天制备基因组DNA。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列(SEQ ID NO:5562-5641)。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图67)。
表14J:实例47的向导RNA的序列和靶向的序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
实例22-另外的MG29-1向导化学物质优化
通过编码MG29-1的mRNA和向导的共转染,在Hepa1-6细胞中评估了具有相同的碱基序列但不同的化学修饰的5个向导的编辑活性;结果示在表15和图68中示出。使用具有相同碱基序列和称为AltR1/AltR2的可商购获得化学修饰的向导作为对照。这些向导中的间隔子序列靶向小鼠基因组的白蛋白内含子1中的22个核苷酸区。向导mAlb298-44表现出对照AltR1/AltR2向导的编辑活性的67.5%,而其它4个向导没有产生可测量的编辑。当使用mRNA和向导与脂质转染试剂如信使MAX共转染时,两种RNA的混合物与带正电荷的脂质形成复合物,并且复合物通过内吞作用进入细胞并最终到达细胞质,其中mRNA被翻译成蛋白质。在RNA向导的核酸酶如MG29-1的情况下,所得MG29-1蛋白在由工程化成MG29-1蛋白的核定位信号介导的过程中进入核之前,推测与细胞质中的向导RNA形成复合物。由于将mRNA翻译成足够量的MG29-1蛋白,随后MG29-1蛋白与向导RNA的结合需要有限时间量,因此向导RNA可能需要在细胞质中增加稳定性的时间比通过核转染递送预先形成的RNP的情况更长。因此,基于脂质的mRNA/sgRNA共转染可能需要比RNP核转染的情况更稳定的向导,这使得在一些向导化学物质中作为RNP起作用,但在使用阳离子脂质试剂与mRNA共转染时不起作用。
表15:经化学修饰的MG29-1向导在用MG29-1 mRNA和向导RNA转染的Hepa1-6细胞中的活性
为了测试这些经化学修饰的向导与没有化学修饰的向导(天然RNA)相比的稳定性,使用粗细胞提取物进行稳定性测定。选择来自哺乳动物细胞的粗细胞提取物,因为其含有向导RNA在体外或体内递送到哺乳动物细胞时将暴露于的核酸酶的混合物。通过每15cm培养皿添加3ml的冷PBS汇合细胞并且使用细胞刮刀从培养皿的表面释放细胞来收集Hepa1-6细胞。将细胞以200g沉淀10分钟,并且在-80℃下冷冻以供未来使用。对于稳定性测定,将细胞重悬浮于4体积的冷PBS中(即,对于100mg沉淀,将细胞重悬浮于400ul的冷PBS中)。将TritonX-100添加到最终浓度为0.2%(v/v),将细胞涡旋10秒,置于冰上10分钟,并且再次涡旋10秒。Triton X-100是一种破坏细胞膜,但在所用浓度下不会使蛋白质失活或变性的温和的非离子型洗涤剂。在冰上建立稳定性反应,并且包括20ul细胞粗提取物,每个向导2pmole(2uM储备液中1ul)。每个向导建立六种反应,包括:输入、0.5小时、1小时、4小时、9小时和21小时(时间以小时为单位,从而指每个样品温育的时间长度)。将样品在37℃下温育0.5小时至多21小时,同时将输入对照置于冰上5分钟。在每个温育期之后,通过添加300ul的酚和硫氰酸胍(Tri试剂,Zymo研究公司)的混合物来停止反应,这立即使所有蛋白质变性并且有效抑制核糖核酸酶并促进RNA的后续回收。添加Tri试剂后,将样品涡旋15秒,并且在-20℃下储存。使用Direct-zol RNA微量制备型试剂盒(Zymo研究公司)从样品中提取RNA,并且在100ul的无核酸酶水中洗脱。使用Taqman RT-qPCR使用Taqman miRNA测定技术(赛默飞世尔公司)进行经修饰的向导的检测,并且引物和探针被设计成特异性地检测mAlb298 sgRNA中的序列,这对于向导中的所有向导都相同。将数据绘制为与输入样品相关的剩余sgRNA的百分比的函数(表16和图69)。
表16:经化学修饰的MG29-1向导的稳定性
与未经修饰的向导和具有AltR1/AltR2修饰的向导两者相比,向导mAlb289-44在细胞裂解物中表现出显著改善的稳定性。因此,存在于mAlb289-44向导中的化学修饰可以用于优化体内编辑。存在于mAlb289-44向导上的化学修饰在表15中详述。mAlb289-44向导化学物质与另一种称为mAlb289-37的高度稳定的向导化学物质的不同之处在于存在3个另外的硫代磷酸酯键。
实例23-通过在5′端处添加茎环来提高MG29-1的向导RNA的稳定性
将MG29-1的向导RNA的体外细胞裂解物中的稳定性与称为MG3-6/3-4的II型CRISPR核酸酶的向导RNA的体外细胞裂解物中的稳定性进行比较,示出了MG29-1向导固有地不太稳定(表17和图70A-B)。
表17:II型向导相对于V型向导的稳定性
如在图70A中所示出的,当比较没有化学修饰的向导RNA时,V型向导(MG29-1向导)比II型向导(MG3-6/3-4向导)降解得更快。如在图70B中所示出的,当将向导RNA与RNA的两端的化学修饰进行比较时,V型向导(MG29-1向导)与II型向导(MG3-6/3-4向导)之间的稳定性差异甚至更明显。经端修饰的V型向导在10小时内几乎完全降解,而40%的II型向导保持在相同的时间点。使用Geneious Prime中的折叠算法预测MG29-1(V型)向导的主链(CRISPR重复序列和tracr)和MG3-6/3-4(II型)向导的主链的次级结构,并且在图71中示出。MG29-1向导的主链长24个核苷酸,而MG3-6/3-4的主链长88个核苷酸。预测MG29-1向导的主链(CRISPR重复序列)形成具有由5个核苷酸构成的茎和-1.22kcal/mol的自由能的单茎环,而预测MG3-6/3-4的主链(CRISPR重复序列和tracr)形成具有-14.8kcal/mol的自由能的3个茎环。MG3-6/3-4向导RNA的三个茎环由具有10个核苷酸茎的茎1(在TRACR的5′端处)、具有5个核苷酸茎的茎2(在中间)和具有11个核苷酸茎的茎3(在主链的3′端处)构成。与MG29-1向导相比,MG3-6/3-4向导RNA中的较大尺寸和更广泛的茎结构可以有助于此向导的更大稳定性。在MG29-1向导的5′端处添加茎环形成RNA序列可以改善其稳定性,并且由此潜在地改善体内编辑的效率。在一个实施例中,MG3-6/3-4向导的茎1包括序列(GUUGAGAAUCGAAAGAUUCUUAAU),其中预测加下划线的碱基形成非规范G-U碱基对。为了改善茎的稳定性,将加下划线的碱基从U改变为C,以将其转化为经预测的茎中的G-C碱基对(GUUGAGAAUCGAAAGAUUCUCAAC)。在一个实施例中,在具有化学物质#37的MG29-1向导RNA的5′端处添加此茎环形成序列。另外,在向导的新5′端处复制#37化学物质的最5′-4个核苷酸(由2′O-甲基和硫代磷酸酯键构成)上的化学修饰,以便保护向导的5′端免受核酸酶攻击。这产生称为mAlb29-8-50的向导RNA序列(表18)。在可替代的向导设计中,在添加如mAlb29-8-49中的茎环序列之后,将mAlb298-37的原始5′端处的经化学修饰的碱基移动到向导的新5′端。在潜在更稳定的MG29-1向导的另一种设计中,将来自涵盖茎环1和茎环2的MG3-6/3-4主链的RNA序列添加到MG29-1向导的5′端,以产生在所包含的经化学修饰的碱基方面不同的mAlb29-8-48和mAlb29-8-47。在另一版本中,通过在环1(mALb29-8-47)或环1和环2(mALb29-8-46)中包含硫代磷酸酯和2′O-甲基碱基来进一步化学修饰向导mAlb29-8-48。这些向导的活性可以通过使用信使Max脂质试剂或其它方法转染mRNA和向导RNA混合物在哺乳动物细胞中进行测试。这些向导的稳定性可以在如上文所描述的相同哺乳动物细胞裂解物测定系统中测试。保留编辑活性并表现出稳定性改善的向导是小鼠体内测试的候选物。
表18:经化学修饰的MG29-1向导在用MG29-1 mRNA和向导RNA转染的Hepa1-6细胞中的活性
实例24-用MG29-1核酸酶进行的体内基因组编辑
为了评估MG29-1 V型核酸酶在活动物体内编辑基因组的能力,使用脂质纳米颗粒递送编码MG29-1核酸酶的mRNA和四个向导RNA中的一个向导RNA。经测试的四种向导RNA是mAlb298-37、mAlb2912-37、mAlb2918-37和mAlb298-34,其序列在表19中示出。向导mAlb298-37和mAlb298-34具有相同的核苷酸序列但具有不同的化学修饰,而向导mAlb298-37、mAlb2912-37和mAlb2918-37具有不同的间隔子序列但具有相同的化学修饰。
表19:在小鼠体内测试的向导RNA的序列和化学修饰
在Hepa1-6细胞裂解物的体外稳定性测定中,mAlb298-37向导比mAlb298-34向导更稳定(图72),从而证明了mAlb298-37向导上的化学修饰在保护向导RNA免受降解方面更有效。
编码MG29-1的mRNA使用T7 RNA聚合酶和使用购自新英格兰生物实验室或三联生物技术公司的核苷酸和酶的标准条件,通过线性化质粒模板的体外转录产生。MG29-1编码序列的序列在SEQ ID No.5680中示出。MG29-1盒的蛋白质编码序列包括以下来自5′至3′的元件:来自SV40的核定位信号、五个氨基酸接头(GGGS)、从其去除起始甲硫氨酸密码子的MG29-1核酸酶的蛋白质编码序列、3个氨基酸接头(SGG)和来自核质蛋白的核定位信号。使用可商购获得的算法针对人对此盒的DNA序列进行密码子优化。使用购自三联生物技术公司的CleanCAP(TM)试剂,在用于体外转录的质粒中编码大约100个核苷酸polyA尾,并且共转录地对mRNA进行封端。将mRNA中的尿苷用N1-甲基假尿苷置换。
用于递送MG29-1 mRNA和向导RNA的脂质纳米颗粒(LNP)调配物基于文献中所描述的LNP调配物,所述文献包含Kauffman等人,(参见例如,《纳米快报(Nano Lett)》.2015,15,11,7300-7306,所述文献通过引用并入本文)。将四种脂质组分溶解于乙醇中,并且以适当的摩尔比混合以制备脂质工作混合物。mRNA和向导RNA在调配之前以1∶1的质量比混合或者在单独的LNP中调配,之后以两种RNA的1∶1质量比共注射到小鼠体内。在任一情况下,RNA在100mM乙酸钠(pH 4.0)中稀释以制备RNA工作储备液。脂质工作储备液和RNA工作储备液在微流体装置(Ignite NanoAssembler,精密纳米系统公司(Precision Nanosystems))中分别以1∶3的流速比和12毫升/分钟的流速混合。LNP针对磷酸盐缓冲盐水(PBS)透析2至16小时,并且然后使用Amicon旋转浓缩器(密理博公司(Millipore))浓缩,直至达到最终体积。使用Ribogreen试剂(赛默飞世尔公司)测量LNP调配物中RNA的浓度。LNP的直径和多分散性(PDI)通过动态光散射测定。示例性LNP的直径在65nm至120nm的范围内,并且PDI为0.05至0.20。LNP以每kg体重1mg RNA的总RNA剂量通过尾静脉静脉内注射到8至12周龄的C57Bl6野生型小鼠中(每只小鼠0.1ml)。给药后三天处死小鼠,并且收集肝脏并使用珠磨器(欧姆尼国际公司(Omni International))在PureLink基因组DNA分离试剂盒(赛默飞世尔公司)中供应的消化缓冲液中均质化。使用PureLink基因组DNA分离试剂盒(赛默飞世尔科技公司)从所得匀浆中纯化基因组DNA,并且通过测量260nm处的吸光度进行定量。将从仅注射缓冲液的小鼠中纯化的基因组DNA用作对照。然后使用侧接向导靶向的区的引物对肝脏基因组DNA进行PCR扩增。所使用的PCR引物在表20中示出。使用Pfusion快速高保真PCR主混合物(赛默飞世尔科技公司)对50ng的基因组DNA和64℃的退火温度进行PCR。
表20:用于分析小鼠体内基因组编辑的PCR引物和测序引物的序列
引物名称 | SEQ ID NO. | 序列 |
mAlb90F | 5760 | CTCCTCTTCGTCTCCGGC |
mAlb1073 | 5761 | CTGCCACATTGCTCAGCAC |
mALb460F | 5762 | GCCTGCTCGACCATGCTATA |
所得PCR产物是通过琼脂糖凝胶电泳的单个带,并且使用DNA清洁和浓缩器-5试剂盒(Zymo研究公司)纯化,然后用位于来自不同向导的靶位点的100至300个碱基之间的引物mAlb460F进行桑格测序。通过分解追踪Indel(TIDE),分析桑格测序色谱图在每个向导的预测靶位点处的插入和缺失(INDEL),如通过Brinkman等人(《核酸研究》2014年12月16日;42(22):e168)所描述的。靶位点处INDEL的存在是DNA中双链断裂的产生的结果,然后通过引入插入和缺失的易错细胞修复机制进行修复。
TIDE分析的结果在图73和表21中示出。A组小鼠接受包封向导RNA mAlb298-37的LNP。B组小鼠接受包封向导RNA mAlb2912-37的LNP。C组小鼠接受包封向导RNA mAlb2918-37的LNP。D组小鼠接受包封向导RNA mAlb298-34的LNP。所有小鼠还接受包封MG29-1 mRNA的LNP。接受向导mAlb298-37的A组中的平均INDEL频率为21%。接受向导mAlb2912-37的B组中的平均INDEL频率为20%。接受向导mAlb2918-37的C组中的平均INDEL频率为15%。接受向导mAlb298-34的D组中的平均INDEL频率为0%。此数据证明,MG29-1核酸酶连同由经化学修饰的碱基(化学物质#37)构成的向导RNA在小鼠的肝脏中在体内具有活性。具有与向导mAlb298-37相同的核苷酸序列但具有不同化学修饰的向导mAlb298-34不具有活性。向导mAlb298-34在细胞裂解物中表现出的稳定性低于向导mAlb298-37,这与体内活性相关。
表21:在IV注射包装在LNP中的核酸酶mRNA和向导RNA后3天,在小鼠肝脏中的靶位点处进行基因编辑
实例25-使用mRNA转染对小鼠HAO-1基因进行MG29-1向导筛选
从使用与转染到Hepa1-6细胞中的向导RNA复合的MG29-1蛋白进行的小鼠HAO-1基因的外显子1至4的向导筛选中,选择5个高活性向导,通过转染编码与向导RNA混合的MG29-1的mRNA来进一步评估。如下将300ng mRNA和120ng单向导RNA转染到Hepa1-6细胞中。在转染前一天,将已在DMEM、10%FBS、1xNEAA培养基中培养少于10天的Hepa1-6细胞,在无Pen/Strep的情况下接种到经TC处理的24孔板中。对细胞进行计数,并且将相当于60,000个活细胞的体积添加到每个孔中。将另外的预平衡培养基添加到每个孔中,以使总体积达到500μL。在转染当天,将25μL的OptiMEM培养基和1.25ul的脂质体信使Max溶液(赛默飞世尔公司)在主混合溶液中混合,涡旋,并且使其在室温下静置至少5分钟。在单独的管中,将300ng的MG29-1 mRNA和120ng的sgRNA与25μL的OptiMEM培养基混合在一起,并且短暂涡旋。将适当体积的信使Max溶液添加到每个RNA溶液中,通过轻弹管混合,并且短暂低速旋转。将完整的编辑试剂溶液在室温下温育10分钟,然后直接添加到Hepa1-6细胞中。转染后两天,从Hepa1-6细胞的每个孔吸出培养基,并且通过具有MagMAXTM DNA多样品超2.0试剂盒的KingFisher Flex通过自动磁珠纯化来纯化基因组DNA。表22中概述了向导的活性,而表23中概述了所使用的引物。
表22:通过mRNA转染递送的小鼠HAO1处的MG29-1向导的平均活性
表23:针对小鼠HAO1基因设计的引物,用于前四个外显子中的每一个处的PCR和桑格测序
实例52-T细胞中mRNA电穿孔的效率
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PMBC中纯化原代T细胞。如下进行mRNA的核转染:使用龙沙公司4D电穿孔仪(DS-120)将200,000个细胞与500ng的mRNA和指定量的向导RNA共转染。采集细胞,并且在初始转染后三天制备基因组DNA。对于标记为“+gRNA”的条件:在初始转染后15小时,用指定量的另外的向导对细胞进行核转染。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图74)。
实例53-使用经化学修饰的向导进行编辑
根据制造商的建议,使用阴性选择试剂盒(美天旎公司)从PBMC中纯化原代T细胞。如下进行mRNA的核转染:使用龙沙公司4D电穿孔仪(DS-120)将200,000个细胞与500ng的mRNA和指定量的向导共转染。采集细胞,并且在初始转染后三天制备基因组DNA。通过组合120pmol蛋白质和160pmol向导RNA来进行RNP的核转染。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图75)。
实例54-ELISA测定以评估预先存在的抗体应答
使用Expi293TM表达系统试剂盒(赛默飞世尔科技公司)在人HEK293细胞中表达MG29-1并从其中纯化。简言之,用编码由强病毒启动子驱动的核酸酶的质粒对293个细胞进行脂转染。将细胞在搅拌下在悬浮培养物中生长,并在转染后两天采集所述细胞。将核酸酶蛋白与Six-His亲和标签融合,并通过金属亲和色谱法纯化至50-60%纯度之间。平行裂解物由模拟转染的细胞制备,并经受相同的金属亲和色谱法过程。Cas9购自IDT并且纯度>95%。
将ELISA板(赛默飞世尔科技公司)包被有0.5μg的在1X磷酸盐缓冲盐水(PBS)中稀释的核酸酶或对照蛋白并在室温下温育过夜。然后将板洗涤,并在室温下与1%(w/v)牛血清白蛋白(BSA)(西格玛-奥德里奇公司)/1 X PBS溶液(1%BSA-PBS)一起温育一小时。在另一洗涤操作之后,将孔在室温下与从随机选择的人供体获取的超过50个单独的血清样品一起温育1小时(1%BSA-PBS中1∶50稀释度)。然后将板洗涤,并且在室温下与过氧化物酶标记的山羊抗人(Fcγ片段特异性)次级抗体(杰克逊免疫研究公司(JacksonImmuno Research))一起温育一小时,1%BSA-PBS中以1∶50,000稀释。根据制造商的说明,使用3,3′,5,5′-四甲基联苯胺(TMB)液体底物系统试剂盒(西格玛-奥德里奇公司)开发该测定。抗体滴度报告为在450nm处测量的吸光度值(图76)。破伤风类毒素由于针对此抗原的广泛接种而用作阳性对照,并且购自西格玛-奥德里奇公司。数据表明,与SpCas9和破伤风类毒素(阳性对照)相比,MG29-1对白蛋白和293T细胞提取物具有相似的抗体应答,从而表明供体尚未暴露于MG29-1的抗原表位。这表明这种酶对于体内编辑可能更有效,因为其将不易因现有抗体应答而在体内失活。
实例55-通过脂质纳米颗粒(LNP)递送的具有MG29-1的小鼠HAO-1的体内编辑
人类遗传病I型原发性高草酸尿症(PH1)由丙氨酸-乙醛酸氨基转移酶基因(AGXT)中的突变引起,所述突变破坏肝脏中的乙醇酸代谢并导致草酸盐成过度产生。草酸盐是一种通过肾脏从体内清除并在尿液中排出的不溶性代谢物。草酸盐产生的水平升高导致草酸盐在肾脏和其它器官中的累积,从而导致肾脏功能衰竭以及对其它器官的损害。PH1的可用治愈性治疗是肝脏移植,所述肝脏移植通常与肾脏移植组合以置换缺陷型肾脏功能。HAO-1基因编码位于乙醇酸代谢途径中的AGXT上游的酶乙醇酸氧化酶(GO)。GO蛋白的量的减少减少了草酸盐的产生,并且因此是用于治疗PH1的有效方法,如在PH1的小鼠模型中(参见Martin-Higueras等人,《分子疗法》第24卷第4期,719-725(2016)doi:10.1038/mt.2015.224,所述文献通过全文引用的方式并入本文)和用靶向HAO-1的RNAi药物的临床研究中(参见Frishberg等人,《美国肾脏病学会临床杂志(CJASN)》2021年7月,16(7)1025-1036 doi:10.2215/CJN.14730920,所述文献通过全文引用的方式并入本文)所证明的。
敲低HAO-1基因的基因组编辑方法是PH1患者的治愈性疗法的有吸引力的方法。用于PH1的基因组编辑疗法的一种方法是在肝细胞中的HAO-1基因的编码区内产生双链断裂,所述双链断裂通过非同源端连接(NHEJ)DNA修复途径修复。肝细胞是肝脏中表达HAO-1基因的细胞类型,并且NHEJ途径是这些细胞中的主要DNA修复途径。NHEJ修复途径是易错的,并且在双链断裂的位点处引入插入或缺失,这可能导致移码(如果插入或缺失不是3个核苷酸的倍数)或导致氨基酸的缺失或插入。引入移码可能导致无义介导的mRNA衰变的诱导,这降低了mRNA的水平,这进一步有助于蛋白质敲低。
双链断裂可以通过RNA向导的CRISPR-Cas核酸酶以序列特异性方式产生。MG29-1是一种利用38至42个核苷酸之间的短向导RNA的V型CRISPR核酸酶。当在培养的哺乳动物细胞中测试时,MG29-1主要在切割位点处产生缺失,这使得其对于敲低基因的目的具有吸引力。为了可用于体内治疗,当使用临床上适当的递送系统递送时,MG29-1活性理想地保留在活哺乳动物中。脂质纳米颗粒代表用于肝脏中肝细胞的体内基因组编辑的有吸引力的递送系统,因为其在啮齿动物和灵长类动物中静脉内施用后有效地将mRNA和sgRNA递送到肝细胞。因此,评估了MG29-1作为基因组编辑系统用于敲低HAO-1基因作为PH1的潜在疗法。
编码MG29-1核酸酶的信使RNA通过使用T7 RNA聚合酶以及核糖核苷酸rATP、rCTP和rGTP和N1-甲基假尿苷的混合物代替rUTP和CleanCAP(三联公司(Trilink))体外转录线性化质粒模板来产生。质粒还在编码序列的3′端处编码大约100nt polyA尾。除了编码野生型MG29-1蛋白的mRNA之外,还合成了编码具有S168R的单个氨基酸变化的MG29-1蛋白的第二mRNA。在商业旋转柱上纯化mRNA,通过260nM处的吸光度确定浓度,并且通过TapeStation(安捷伦公司)确定纯度。
基于跨越小鼠肝脏细胞系Hepa1-6中的小鼠HAO-1基因的外显子1至4的多个向导的编辑效率评估来选择向导RNA。化学合成并入在统称为化学修饰#37的特定位置处的碱基的化学修饰的组合的三个向导;这些向导RNA在下表25中示出。
表25:在小鼠体内测试的向导RNA的序列和化学修饰
经修饰的碱基和键的代码:m:经2′-O甲基修饰的碱基,f:经2′-氟修饰的碱基,
*:硫代磷酸酯键
使用基本上如Kaufmann等人(《纳米快报》2015,15,11,7300-7306,PMID:26469188,DOI:10.1021/acs.nanolett.5b02497,所述文献通过全文引用的方式并入本文)所述的方法将MG29-1 mRNA和向导RNA单独包装在脂质纳米颗粒(LNP)内。脂质购自Avanti极性脂质公司(Avanti Polar Lipids)或Corden药物公司(Corden Pharma)并溶解于乙醇中。将mRNA或sgRNA在水中制备,然后在100mM乙酸钠(pH4.0)中稀释,以制备RNA工作储备液。将四种脂质组分以特定比率在乙醇中合并,以制备脂质工作储备液。示例性脂质混合物包括摩尔比为47.5∶16∶35∶1.5的胆固醇、1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)、1,1′-((2-(4-(2-((2-(双(2-羟基十二烷基)氨基)乙基)(2-羟基十二烷基)氨基)乙基)哌嗪-1-基)乙基)氨叉基)双(十二烷-2-醇)(C12-200)和DMG-PEG-2000。将脂质工作储备液和RNA工作储备液以12毫升/分钟的流速和1体积的脂质工作储备液与3体积的RNA工作储备液的比率在微流体混合装置(精密纳米系统公司)中合并。调配物中C12-200与RNA的质量比为10比1。将调配的LNP用1 x PBS以1∶1稀释,然后在1 x PBS中透析两次,每次1小时,随后在Amicon旋转浓缩器中浓缩。将所得LNP在1 x PBS缓冲液中调配,通过0.2uM过滤器进行过滤杀菌,并在4℃下储存。使用Ribogreen试剂(赛默飞世尔公司)测量LNP内外RNA的浓度。通过使用NanoBrook 90Plus(布鲁克海文仪器公司(Brookhaven Instruments))动态光散射在所得浓缩的LNP中测量LNP的平均直径和多分散性。
包封向导RNA和MG29-1 mRNA或MG29-1_S168R mRNA的LNP以1∶1的RNA质量比混合,然后通过尾静脉以1mg RNA/kg的剂量静脉内注射到野生型C57Bl/6小鼠中,每只小鼠的总体积为0.1ml。在给药后10天处死小鼠,并且收集肝脏的3个叶(左侧叶、右侧叶、中间叶),快速冷冻并在-80℃下储存。在珠磨机中使用0.4mL的缓冲液/100mg组织重量在基因组消化缓冲液(Purelink基因组DNA纯化试剂盒,赛默飞世尔公司)中均质化肝脏的整个左侧叶。使用Purelink基因组DNA纯化试剂盒(赛默飞世尔公司)从匀浆的等分试样中纯化基因组DNA。在由Q5高保真DNA聚合酶和总共29个循环构成的PCR反应中使用具有与用于下一代测序(NGS)的条形码引物互补的衔接子的基因特异性引物对每个特异性向导RNA靶向的HAO-1基因的区进行PCR扩增。使用使用总共10个循环的NGS的条形码引物对此第一PCR反应的产物进行PCR扩增。在因美纳MiSeq机器上对所得产物进行NGS,并且使用定制脚本处理结果,以生成在HAO-1基因中的靶向位点处含有插入或缺失(INDEL)的测序读段的百分比。将来自注射有PBS缓冲液的小鼠的肝脏的基因组DNA用作对照。平均测序读段计数为142,000个读段(范围为54,000个至205,000个)。NGS数据还能够预测生成移码的INDEL的百分比以及INDEL谱的确定(图80)。
通过在珠磨机中的PBS中均质化,然后在-80℃和室温下进行三轮冻融,从相同小鼠的肝脏的整个右侧叶中提取总蛋白。将裂解物离心以去除组织碎片并收集上清液。使用BCA测定确定上清液中总蛋白的浓度。在SDS-PAGE凝胶上分级等量的总蛋白并转移到硝酸纤维素膜上,然后用抗乙醇酸氧化酶抗体(R&D系统公司AF6197,绵羊抗HAO1)探测所述硝酸纤维素膜。检测利用HRP缀合的次级抗体(R&D系统公司HAF016、驴抗绵羊IgG),随后用SuperSignal West Dura化学发光底物(赛默飞世尔公司目录号34076)进行检测,并用伯乐公司(Bio-Rad)ChemiDoc MP成像仪进行可视化。
下表26中概述了经测试的向导的编辑活性。
表26:在小鼠体内测试的向导RNA的编辑活性
/>
通过核糖核蛋白复合物的核转染,这些向导RNA在Hepa1-6细胞中均具有90%或更大的编辑活性。由于转染效率较低,当使用脂转染(信使Max试剂,赛默飞世尔公司)共转染MG29-1 mRNA和向导RNA时,Hepa1-6细胞中的编辑水平较低,并且当通过这种转染方法测试时,向导mH29-15和mH29-29比mH29-1显著更强效。
包封MG29-1 mRNA的LNP和向导RNA的特征在下表27中概述。
表27:脂质纳米颗粒(LNP)的特征
包封3个向导RNA的LNP具有介于74am与85nm之间的直径,其中多分散性(PDI)为0.08至0.15。包封MG29-1 mRNA和MG29-1_S168R mRNA的LNP的直径分别为98nm和76nm,并且PDI值小于指示低多分散性的0.15。对于所有LNP,在所得LNP中回收的输入RNA的百分比在71%至97%的范围内,并且包封在LNP内的总RNA的百分比为92%或更高。这些数据证明,向导RNA和MG29-1 mRNA两者都可以有效地包封在LNP中,并且所得LNP具有小尺寸(小于100nM)和低多分散性。
在静脉内注射包封MG29-1 mRNA的LNP和向导RNA中的每一个后10天,HAO-1基因中的靶位点处的编辑水平在图77中示出。如预期的,用PBS缓冲液注射的小鼠没有编辑。用包封MG29-1 mRNA的LNP和向导RNA mH29-1_37注射的小鼠表现出在1%至52%范围内的可变编辑水平。用包封MG29-1 mRNA的LNP和向导RNA mH29-15_37注射的小鼠表现出一致的编辑水平,平均编辑水平为50.4%(范围45%至54%)。用包封MG29-1 mRNA的LNP和向导RNAmH29-29_37注射的小鼠表现出一致的编辑水平,平均编辑水平为57.7%(范围54%至63%)。用包封MG29-1_S168R mRNA和向导RNA mH29-15_37的LNP注射的小鼠表现出一致的编辑水平,平均编辑水平为50.8%(范围38%至61%)。这些结果证明,当在LNP中递送时,编码MG29-1核酸酶的mRNA连同具有优化化学物质的向导RNA可以编辑小鼠肝脏中的靶基因座。在经测试的具有不同间隔子序列的3个向导RNA中,两个向导RNA表现出始终高编辑水平,而一个向导RNA表现出更可变的编辑。因为这种类型的LNP几乎完全将其有效负载递送到肝细胞,并且因为肝细胞占大鼠肝脏中细胞总数的60%至65%(Bale等人,《科学报告(Scientific Reports)第6卷,文章编号:25329(2016)doi:10.1038/srep25329,所述文献通过全文引用的方式并入本文)和小鼠肝脏中总细胞的52%(Barratta等人,《组织化学和细胞生物学(Histochemistry and Cell Biology)》第131卷,第713-726页(2009)doi:10.1007/s00418-009-0577-1,所述文献通过全文引用的方式并入本文),如果在HAO-1基因的每个拷贝处编辑每个肝细胞,则最大编辑水平预计为60%至65%。因此,在从肝脏纯化的总基因组DNA中测量的50%编辑表示大约75%至80%的肝细胞中的编辑。MG29-1中S168R氨基酸变化的包含可以改善培养的细胞中的编辑效率,在此项研究中,在经测试的一个向导RNA的情况下未改善编辑效率。先前观察到MG29-1的S168R氨基酸变体的编辑效率的改善,其中向导RNA表现出低编辑,这可以解释为什么此处没有观察到已经选择用于高编辑水平的向导RNA的改善。INDEL谱(图80)完全由缺失构成。大多数缺失介于1至11个核苷酸之间,其中具有少量较大缺失。在用向导mH29-15和mH29-29处理的小鼠中预测的移码产生的频率在总INDEL的70%至80%的范围内,平均值为75%。因此,平均而言,预测75%的观察到的INDEL在HAO-1编码序列中产生移码,这将导致编辑位点下游的氨基酸序列的破坏和产生终止密码子的很大的机会。
分析来自相同小鼠的肝脏的另一主叶的为HAO-1基因的产物的蛋白质乙醇酸氧化酶(GO)的水平,以确定引入到HAO-1基因中的INDEL是否导致肝脏中的GO蛋白水平降低。使用针对GO蛋白的抗体进行的蛋白质印迹分析检测到预期大小的带(表28和图78A-B)。
表28:小鼠中乙醇酸氧化酶的编辑
与接受PBS缓冲液的小鼠相比,接受包封MG29-1 mRNA的LNP和各种向导RNA的小鼠表现出GO蛋白水平降低。一般来说,GO蛋白降低的幅度与如通过NGS在同一小鼠中测量的HAO-1基因处的编辑效率相关。通过在凝胶上负载3种不同量的总蛋白并重复蛋白质印迹,进一步测试来自小鼠中的2只小鼠的示出GO蛋白减少的肝脏蛋白。如在图79中所示出的,在总蛋白的不同负载下,在用包封MG29-1 mRNA的LNP和向导RNA mH29-1_37或mH29-15_37处理的2只小鼠中清楚地观察到GO蛋白的减少。这些数据证明,HAO-1基因的编辑导致小鼠肝脏中GO蛋白水平的降低。
实例56-人外周血B细胞中TRAC在DNA水平下的基因编辑结果
人外周血B细胞购自干细胞技术公司,并且在核转染之前使用ImmunoCultTM人B细胞扩增试剂盒扩增2天。使用龙沙公司4D电穿孔仪将MG29-1 RNP(126pmol蛋白质/160pmol向导)核转染到T细胞(200,000个)中。采集细胞,并且在转染后三天制备基因组DNA。对于NGS分析,使用适用于基于NGS的DNA测序的PCR引物来扩增TRAC 35向导RNA的靶序列(SEQID NO:5681)。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图81)。
表28B:实例56的向导RNA的序列和靶向的序列
实例57-造血干细胞(HSC)中TRAC在DNA水平下的基因编辑结果
从澳赛尔斯公司(AllCells)获得活化的外周血CD34+细胞,并在核转染之前在补充有StemSpanTM CC110细胞因子混合物的干细胞公司StemSpanTM SFEM II培养基中培养48小时。使用龙沙公司4D电穿孔仪将MG29-1 RNP(126pmol蛋白质/160pmol向导)核转染到HSC(200,000个)中。采集细胞,并且在转染后三天制备基因组DNA。使用适用于基于NGS的DNA测序的PCR引物来扩增MG29-1 TRAC 35 gRNA的单独的靶序列(SEQ ID NO:5681)。在因美纳MiSeq机器上对NGS扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图82)。
实例58-诱导型多能干细胞(iPSC)中TRAC在DNA水平下的基因编辑结果
在核转染之前,将ATCC-BXS0116人[非西班牙裔女性白种人]诱导的多能干(IPS)细胞在含有10μM ROCK抑制剂Y-27632的mTESR Plus(干细胞技术公司)中在康宁公司(Corning)Matrigel包被的塑料器具上培养24小时。使用龙沙公司4D电穿孔仪将MG29-1RNP(126pmol蛋白质/160pmol向导)核转染到iPSC(200,000个)中。在转染后五天用阿库酶(Accutase)采集细胞以进行基因组DNA提取。使用适用于基于NGS的DNA测序的PCR引物来扩增TRAC 35 gRNA的单独的靶序列(SEQ ID NO:5681)。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图83)。
实例59-通过下一代测序(NGS)定量的MG29-1核酸酶的体内基因组编辑
为了评估MG29-1 V型核酸酶在活动物体内编辑基因组的能力,在脂质纳米颗粒中递送编码MG29-1核酸酶的mRNA和四个向导RNA中的一个。经测试的四个向导RNA是mAlb298-37、mAlb2912-37、mAlb2918-37和mAlb298-34,其序列在下表29中示出。向导mAlb298-37和mAlb298-34具有相同的核苷酸序列但具有不同的化学修饰,而向导mAlb298-37、mAlb2912-37和mAlb2918-37具有不同的间隔子序列但具有相同的化学修饰。
表29:在小鼠体内测试的向导RNA的序列和化学修饰
M:经2′-O甲基修饰的碱基;f:经2′-氟修饰的碱基;*:硫代磷酸酯主链
在Hepa1-6细胞裂解物的体外稳定性测定中,mAlb298-37向导比mAlb298-34向导更稳定,从而证明了mAlb298-37向导上的化学修饰在保护向导RNA免受降解方面更有效。
编码MG29-1(SEQ ID NO:5687)的mRNA使用T7 RNA聚合酶、使用核苷酸和购自新英格兰生物实验室或三联生物技术公司的酶,通过线性化质粒模板的体外转录产生。MG29-1盒的蛋白质编码序列包括以下来自5′至3′的元件:来自SV40的核定位信号、五个氨基酸接头(GGGS)、从其去除起始甲硫氨酸密码子的MG29-1核酸酶的蛋白质编码序列、3个氨基酸接头(SGG)和来自核质蛋白的核定位信号。使用可商购获得的算法针对人对此盒的DNA序列进行密码子优化。使用购自三联生物技术公司的CleanCAP(TM)试剂,在用于体外转录的质粒中编码大约100个核苷酸polyA尾并且共转录地对mRNA进行封端。将mRNA中的尿苷用N1-甲基假尿苷置换。
为了产生用于递送MG29-1 mRNA和向导RNA的脂质纳米颗粒(LNP)调配物,将四种脂质组分溶解于乙醇中并以适当的摩尔比混合以制备脂质工作混合物。mRNA和向导RNA在调配前以1∶1的质量比混合或者在单独的LNP中调配,之后以两种RNA的1∶1质量比共同注射到小鼠体内。在任一情况下,RNA在100mM乙酸钠(pH4.0)中稀释以制备RNA工作储备液。脂质工作储备液和RNA工作储备液在微流体装置(Ignite NanoAssembler,精密纳米系统公司)中分别以1∶3的流速比和12毫升/分钟的流速混合。LNP针对磷酸盐缓冲盐水(PBS)透析2至16小时,并且然后使用Amicon旋转浓缩器(密理博公司)浓缩,直至达到预定体积。使用Ribogreen试剂(赛默飞世尔公司)测量LNP调配物中RNA的浓度。LNP的直径和多分散性(PDI)通过动态光散射测定。示例性LNP的直径在65nm至120nm的范围内,其中PDI为0.05至0.20。LNP以每kg体重1mg RNA的总RNA剂量通过尾静脉静脉内注射到8至12周龄的C57Bl6野生型小鼠中(每只小鼠0.1mL)。给药后三天,处死小鼠时,并且收集肝脏并使用珠磨器(欧姆尼国际公司)在PureLink基因组DNA分离试剂盒(赛默飞世尔公司)中供应的消化缓冲液中均质化。使用PureLink基因组DNA分离试剂盒(赛默飞世尔科技公司)从所得匀浆中纯化基因组DNA,并且通过测量260nm处的吸光度进行定量。将从仅注射缓冲液的小鼠中纯化的基因组DNA用作对照。
然后使用侧接向导靶向的区的第一组引物对肝脏基因组DNA进行PCR扩增。所使用的PCR引物在下表30中示出。些引物的5′端包括与第二PCR中使用的PCR引物互补的保守区,随后5N以提供序列多样性并提高MiSeq测序质量,并且以与小鼠基因组中的靶区互补的序列结束。使用热启动高保真2X主混合物(新英格兰生物实验室)对100ng的基因组DNA进行PCR,并且退火温度为60℃,持续总共30个循环。随后使用引物进行第2轮10个循环的PCR,所述引物被设计成添加唯一的双因美纳条形码(IDT)以用于在MiSeq仪器上进行下一代测序。使用150bp配对的端读段将每个样品测序到大于10,000个读段的深度。合并读段以产生单个250bp序列,其中使用专有的Python脚本计算Indel百分比和INDEL曲线。
表30:用于分析小鼠体内基因组编辑的PCR引物和下一代测序引物的序列
NGS分析的结果在图84和表31中示出。A组小鼠接受包封向导RNA mAlb298-37的LNP。B组小鼠接受包封向导RNA mAlb2912-37的LNP。C组小鼠接受包封向导RNA mAlb2918-37的LNP。D组小鼠接受包封向导RNA mAlb298-34的LNP。A至D组中的所有小鼠还接受包封在注射之前与含有1∶1 RNA质量比的向导RNA混合的MG29-1 mRNA的LNP。向两只小鼠注射PBS作为对照(E组)。
表31:在IV注射包装在LNP中的核酸酶mRNA和向导RNA后3天,在小鼠肝脏中的靶位点处进行基因编辑
/>
接受向导mAlb298-37的A组中的平均INDEL频率为53.9%。接受向导mAlb2912-37的B组中的平均INDEL频率为52.3%。接受向导mAlb2918-37的C组中的平均INDEL频率为26.5%。接受向导mAlb298-34的D组中的平均INDEL频率为12.7%。这些数据证明,MG29-1核酸酶连同由经化学修饰的碱基(化学物质#37或化学物质#34)构成的向导RNA在小鼠的肝脏中在体内具有活性。与向导mAlb298-37产生约50%编辑的向导mAlb298-34具有与mAlb298-37相同的核苷酸序列,但具有不同的化学修饰,从而证明了化学修饰#37能够实现比化学修饰#34在体内显著更高的编辑活性。与和化学物质#37的优越的体外稳定性一致的化学物质#34相比,观察到化学物质#37的改善的体内编辑。
由MG29-1核酸酶和向导298-37产生的示例性INDEL谱如通过图85中示出的NGS测量。来自用相同LNP处理的其它4只小鼠的INDEL谱基本上相同。大多数INDEL是缺失,只有很少的插入是可检测的。此INDEL谱不同于用通常产生插入和缺失的混合物,并且倾向于产生+1和-1个INDEL的spCas9看到的情况。由MG29-1的体内切割产生的缺失在-1至-30的范围内,其中大多数缺失介于-1至-10个核苷酸之间。
实例59-MG29-1单向导RNA的间隔子长度优化
经测试的向导包括靶向具有由整合DNA技术公司提供,称为“AltR1/AltR2”的化学修饰的人白蛋白内含子1的不同区的5个不同间隔子(间隔子74、83、84、78和87)。通过从向导RNA的3′端去除核苷酸,将间隔子长度从22个核苷酸(nt)滴定到17nt。评估这些向导中的每一个(每个间隔子序列6个)在人肝脏细胞系Hep3B中的编辑效率。使用Amaxa核转染装置对Hep3B细胞(1 x 105个细胞/样品)进行电穿孔,并用通过混合120pmol MG29-1蛋白和160pmol向导RNA制备的预先形成的核糖核蛋白复合物编程EH-100。在电穿孔后,将细胞铺板在24孔板中并培养3天,之后使用商业试剂盒(英杰公司的Purelink)从细胞中纯化基因组DNA。通过下一代测序(NGS)分析基因组DNA以在靶位点(人白蛋白内含子1)处进行编辑。通过定制Python脚本(IndelCalculator v1.3.1)分析NGS数据。如在图86中所示出的,当间隔子长度从22个核苷酸滴定到20个核苷酸时,所有5个向导的编辑活性不变。将间隔子缩短至19个核苷酸降低了所有5个向导的编辑活性,其中对于5个向导中的3个向导,活性更明显的降低了75%。间隔子长度减少至18个或17个核苷酸进一步降低了编辑活性,使得17个核苷酸间隔子对于所有5个向导都是失活的。针对靶向不同基因组基因座,即人HAO-1基因的4个不同向导RNA获得类似数据(图。86)。在HAO-1向导的情况下,当向导长度从20nt减小至22nt时,编辑活性下降75%至95%。这些数据证明,跨靶向不同基因组基因座的一系列不同向导间隔子序列,保留最大编辑活性的最小MG29-1间隔子长度为20nt。因为较长间隔子序列可以增加脱靶编辑的风险,所以鉴定保持完全活性的最短间隔子是有益的。
在具有靶向人HAO-1基因座的MG29-1的22nt间隔子的向导的筛选中,向导RNA(“向导29”)被鉴定为高活性向导。通过从间隔子去除3′最多2nt来将此向导的间隔子长度减小至20nt,以产生指定为mH29-29.1_37(SEQ ID NO:5710)和mH29-29.2_37(SEQ ID NO:5711)的向导,所述向导在其化学修饰方面不同。
这些向导含有与基于22nt间隔子的化学物质#37相同的化学修饰,除了必须调整间隔子缩短的5′端上的修饰。在mH29-29.1_37中,氟碱基的数量减少2,但4个PS键和5′处的1个2′-O-甲基碱基与在原始#37化学物质中保持相同。在mH29-29.2_37中,氟碱基的数量减少2,并且保留最后一个碱基上的2′-O-甲基,但是5′端处的PS键的数量从4增加至5。这些向导的相对效力将在培养物和小鼠的细胞中进行测试。
实例60-设计在5′端处具有24个核苷酸茎环结构的MG29-1的向导RNA以改善稳定性(化学物质#50)
MG29-1和MG3-6/3-4向导的体外稳定性测定证明MG29-1向导可能不太稳定(图87)。在此测定中,将向导RNA在来自含有可以降解RNA的核酸酶的哺乳动物细胞(Hepa1-6)的粗提取物中温育。在约200分钟内降解在5′和3′端上具有化学修饰的MG29-1向导(Alt-R),而具有5′和3′端的化学修饰(修饰1)的约50%的MG3-6/3-4向导在500分钟后保持完整(图87)。
MG29-1和MG3-6/3-4向导RNA的结构(图88)使用Geneious Prime软件(Turner2004算法:https://rna.urmc.rochester.edu/NNDB/index.html)预测,并且注意到显著不同。MG29-1向导是MG3-6/3-4的向导RNA长度的约三分之一。另外,MG29-1向导含有包括长度为5个核苷酸的一个茎的最小次级结构。相比之下,MG3-6/3-4的向导RNA含有3个茎长度为10个、6个和10个核苷酸的茎环(图88)。用于产生图86中的数据的含有靶向小鼠白蛋白的间隔子的高活性MG3-6/3-4向导也被预测含有与针对单独的主链预测的10nt茎环相同的10个核苷酸的茎(图89中的茎环1)。
据推测,MG29-1向导的最小次级结构使其在通过体外稳定性测定模拟的细胞环境中不太稳定。鉴于MG3-6/3-4向导RNA的体外稳定性显著更大,设计了经修饰的MG29-1sgRNA主链,其中在MG29-1向导的5′端处添加MG3-6/3-4的最大茎环(茎环1)。此经修饰的MG29-1向导的预测结构在图89中示出。先前已经证明显著改善标准MG29-1向导RNA的稳定性和活性的指定化学物质#37的化学修饰并入化学物质#50的设计中;具体地,存在于主链和化学物质#37间隔子中的相同硫代磷酸酯、2′-O-甲基和2′-氟修饰包含在化学物质#50中。为了进一步稳定这种新设计,用硫代磷酸酯键和2′-O-甲基碱基修饰5′端处的3个核苷酸。另外,硫代磷酸酯键和2′-O-甲基碱基包含在添加的茎环的环中(图90中的茎环1)。
如在下表32中所示出的,设计化学物质#50的另外的变体。任何间隔子序列的化学物质#44、#50、#51、#52、#53和#54的设计在SEQ ID NO:5695-5701中示出,其中N是间隔子中的任何核糖核苷酸碱基。
表32:化学物质#50和另外的变体的概述
实例61-用在5′端处含有24个核苷酸茎环结构的MG29-1向导化学物质#50进行体外编辑
使用Amaxa核转染装置和程序电穿孔小鼠肝脏细胞系Hepa1-6(1 x 105个细胞/样品):具有预先形成的核糖核蛋白复合物(120pmol MG29-1蛋白与160pmol向导RNA混合)或具有500ng MG29-1 mRNA和210pmol向导RNA的混合物的EH-100。经测试的向导是mAlb29-8-44(间隔子8,化学物质44)和mAlb29-8-50(间隔子8,化学物质50)。化学物质44包括MG29-1主链加22nt间隔子以及针对活性和稳定性进行了优化的碱基或主链的一组特定化学修饰。具有化学修饰的mALb29-8-44的序列在SEQ ID NO:5688中示出。mAlb29-8-50的序列在SEQID NO:5689中示出。这些向导两者含有22个核苷酸间隔子。在电穿孔后,将细胞铺板在24孔板中并培养3天,之后使用商业试剂盒(英杰公司的Purelink)从细胞中纯化基因组DNA。通过下一代测序(NGS)分析基因组DNA以在靶位点(白蛋白内含子1)处进行编辑。通过定制Python脚本(IndelCalculator v1.3.1)分析NGS数据。如在图91中所示出的,当通过mRNA转染递送MG29-1核酸酶时,化学物质50将编辑效率从46%提高到94%。当MG29-1核酸酶作为预复合到向导的蛋白质递送时,两种化学物质均表现出94%的编辑。当核酸酶作为mRNA递送时,向导理想地足够稳定以在细胞内存活,直至mRNA被翻译成蛋白质,之后核酸酶可以与向导复合并转移到核。因此,当核酸酶作为mRNA递送时,向导稳定性可能更关键。相比之下,当在电穿孔到细胞中之前与作为RNP的核酸酶复合时,向导可以是稳定的,这与化学物质44和50两者均导致通过RNP电穿孔的94%编辑的观察结果一致(图91)。这些数据表明,含有另外的茎环的MG29-1指导RNA上的化学物质50介导培养物中的细胞中的改善的编辑。
实例62-具有MG29-1向导化学物质50的小鼠的肝脏中的体内基因编辑
为了评估不同的向导化学物质对小鼠肝脏中的基因编辑的影响,使用脂质纳米颗粒(LNP)递送MG29-1 mRNA和向导RNA。编码MG29-1核酸酶的信使RNA通过使用T7 RNA聚合酶以及核糖核苷酸rATP、rCTP和rGTP和N1-甲基假尿苷的混合物代替rUTP和CleanCAP(三联公司)体外转录线性化质粒模板来产生。质粒还在编码序列的3′端处编码大约100nt polyA尾。在商业旋转柱上纯化mRNA,通过260nM处的吸光度确定浓度,并且通过Tape Station(安捷伦公司)确定纯度。在单只小鼠研究中评估了包括相同间隔子序列但具有不同化学物质/主链的三个不同的向导RNA:mAlb29-8-44(SEQ ID NO:5688)、mAlb29-8-50(SEQ ID NO:5689)和mAlb29-8-37(SEQ ID NO:5702)。还测试了含有具有化学物质44的不同间隔子(间隔子12)的向导mAlb29-12-44(SEQ ID NO:5703)。使用基本上如Kaufmann等人(PMID:26469188,DOI:10.1021/acs.nanolett.5b02497,所述文献通过全文引用的方式并入本文)所述的方法将MG29-1 mRNA和向导RNA单独包装在脂质纳米颗粒(LNP)内。脂质购自Avanti极性脂质公司或Corden药物公司并溶解于乙醇中。将mRNA或sgRNA在水中制备,然后在100mM乙酸钠(pH4.0)中稀释,以制备RNA工作储备液。将四种脂质组分以指定比率在乙醇中合并,以制备脂质工作储备液。示例性脂质混合物包括摩尔比为47.5∶16∶35∶1.5的胆固醇、DOPE、C12-200和DMG-PEG-2000。将脂质工作储备液和RNA工作储备液以12毫升/分钟的流速和1体积的脂质工作储备液与3体积的RNA工作储备液的比率在微流体混合装置(精密纳米系统公司)中合并。调配物中C12-200与RNA的质量比为10比1。将调配的LNP用1 x PBS以1∶1稀释,然后在1 x PBS中透析两次,每次1小时,随后在Amicon旋转浓缩器中浓缩。将所得LNP调配到1 x PBS缓冲液中,通过0.2uM过滤器进行过滤杀菌,并在4℃下储存。使用Ribogreen试剂(赛默飞世尔公司)测量LNP内外RNA的浓度。通过使用NanoBrook 90Plus(布鲁克海文仪器公司)动态光散射在所得浓缩的LNP中测量LNP的平均直径和多分散性。代表性LNP的大小在80至100纳米的范围内,其中PDI<0.15并且RNA包封率大于90%。包封向导RNA的LNP和MG29-1 mRNA以1∶1的RNA质量比混合,然后通过尾静脉以0.5mg RNA/kg的剂量静脉内注射到野生型C57Bl/6小鼠中,每只小鼠的总体积为0.1ml(N=5只小鼠/LNP)。在给药后4天处死小鼠,并且收集肝脏的3个叶(左侧叶、右侧叶、中间叶),快速冷冻并在-80℃下储存。在珠磨机中使用0.4mL的缓冲液/100mg组织重量在基因组消化缓冲液(Purelink基因组DNA纯化试剂盒,赛默飞世尔公司)中均质化肝脏的整个左侧叶。使用Purelink基因组DNA纯化试剂盒(赛默飞世尔公司)从匀浆的等分试样中纯化基因组DNA。在含有0.5微摩尔的引物mAlb90F(CTCCTCTTCGTCTCCGGC)和mAlb1073R(CTGCCACATTGCTCAGCAC)和1 x Pfusion快速PCR主混合物中的每一种的反应中,从50ng的基因组DNA中PCR扩增白蛋白内含子1区。使用基于柱的纯化试剂盒(DNA清洁和浓缩器,Zymo研究公司)纯化跨越小鼠白蛋白的整个内含子1的所得984bp PCR产物,并使用位于每个向导RNA的预测靶位点的150至350bp内的引物测序。使用来自PBS缓冲液注射的小鼠的引物mAlb90F和mAlb1073R产生的PCR产物作为对照并行测序。使用确定INDEL的频率以及INDEL谱的CRISPR编辑的推断(ICE)分析桑格测序色谱图(Hsiau等人,从桑格跟踪数据推断CRISPR编辑.生物学预印本资料库2018https://www.biorxiv.org/content/early/2018/01/20/251082)。
不希望受理论束缚,应当理解,当核酸酶在活细胞内的DNA中产生双链断裂(DSB)时,DSB由细胞DNA修复机制修复。在培养物中主动分裂细胞,如转化的哺乳动物细胞,并且在不存在修复模板的情况下,应当理解,这种修复通过NHEJ途径发生。不希望受理论束缚,应当理解,NHEJ途径是引入双链断裂位点处的碱基的插入或缺失的易错过程(Lieber,M.R,《生物化学年度评论》2010;79:181-211)。这些插入和缺失应理解为发生并随后修复的双链断裂的标志,并且因此广泛用作核酸酶的编辑或切割效率的读出。
小鼠肝脏中的编辑效率在图92中示出。比较具有相同间隔子序列(向导8)但具有不同化学物质或主链的向导,具有化学物质#44的向导(SEQ ID NO:5688)的活性最低(平均1.6%编辑),而具有化学物质#37的向导(SEQ ID NO:5702)的活性更高(平均4%编辑)。化学物质#44与化学物质#37的不同之处在于在间隔子区中添加2个另外的PS键(化学物质#44在间隔子区中具有6个PS键,而化学物质#37在间隔子区中具有4个PS键)。平均编辑为22%的具有化学物质#50的向导(SEQ ID NO:5689)的活性显著更大,比具有化学物质#37的向导高大约5倍,并且比具有化学物质#44的向导高10倍。当通过下一代测序(NGS)分析相同的基因组DNA进行编辑时,对于化学物质44、37和50,用向导间隔子8的进行编辑水平分别被确定为7%、7%和42%。对于具有化学物质44的向导间隔子12,当通过ICE和NGS测量时,编辑水平分别为4%和9%,从而证实了化学物质44具有与化学物质37相似的活性。这些数据证明,在LNP中全身递送后,含有来自添加到正常MG29-1向导主链的5′端的MG3-6/3-4向导的茎环的化学物质#50在小鼠的肝脏中表现出显著改善的编辑。因此,向导化学物质50提供了MG29-1核酸酶的改善的体内效力。
实例63-对MG29-1向导化学物质50的另外的改善
设想了对MG29-1向导化学物质#50的另外的改善。在一个潜在改进的版本中,添加到标准MG29-1向导主链的5′端的茎环1中的核苷酸中的所有核苷酸如化学物质53(SEQ IDNO:5700)和54(SEQ ID NO:5701)中一样在碱基和硫代磷酸酯键上用2′-O-甲基两者化学修饰。在一个潜在改进的版本中,间隔子中的所有2′-氟碱基如化学物质51(SEQ ID NO:5698)和54(SEQ ID NO:5701)中一样都改变为标准核苷酸。在另一个潜在改进的版本中,间隔子中的2′-氟碱基的数量与化学物质52(SEQ ID NO:5699)中一样减少2倍。2′-氟碱基数量的减少可能对向导特异性产生影响。
实例64-包括天然向导阵列的MG29-1单向导RNA的设计
改善MG29-1单向导RNA的稳定性并因此提高效力的可替代的方法是设计MG29-1的天然类似CRISPR阵列,模拟其中MG29-1核酸酶切割其自身CRISPR阵列以产生成熟向导的经记录的过程。阵列被指定为mAlb29-g8-37-阵列(SEQ ID NO:5712),并且其包括靶向包埋在MG29-1的天然CRISPR阵列中的小鼠白蛋白的22nt间隔子(间隔子8)的两个拷贝。
经设计的阵列长126nt,并且其包括重复序列,随后是间隔子,随后是重复序列,随后是间隔子。mAlb29-g8-37-阵列的预测次级结构在图93中示出,其中5′端以蓝色圈出,并且3′端以红色圈出。此RNA被设计成在哺乳动物细胞内被表达的MG29-1核酸酶切割以产生两个功能sgRNA。化学修饰包含在mAlb29-g8-37-阵列中以促进稳定性。间隔子和MG29-1主链部分中的修饰基于化学物质#37中使用的那些,但具有另外的修饰和一些变化。
实例65-具有靶向具有化学物质#37的人白蛋白内含子1的20nt间隔子的MG29-1核酸酶的向导
使用MG29-1核酸酶和具有22nt间隔子的单向导RNA针对人白蛋白内含子1的向导筛选鉴定出在人Hep3B细胞中具有高编辑活性的5个向导。这些向导被指定为间隔子编号87、78、74、83和84。这些具有20nt间隔子的单向导RNA的版本被设计成并入化学物质#37化学修饰,并且这些被指定为hA29-87-37B(SEQ ID NO:5713)、hA29-78-37B(SEQ ID NO:5714)、hA29-74-37B(SEQ ID NO:5715)、hA29-83-37B(SEQ ID NO:5716)和hA29-84-37B(SEQ ID NO:5717)。
实例66-具有靶向具有化学物质#37的人HAO1的20nt间隔子的MG29-1核酸酶的向导
使用MG29-1核酸酶和具有22nt间隔子的单向导RNA针对人HAO-1(编码乙醇酸氧化酶)的向导筛选鉴定出在人Hep3B细胞中具有高编辑活性的4个向导。这些向导被指定为间隔子编号4、21、23和41。这些具有20nt间隔子的单向导RNA的版本被设计成并入化学物质#37化学修饰,并且这些被指定为hH29-4_37b(SEQ ID NO:5718)、hH29-21_37b(SEQ ID NO:5719)、hH29-23_37b(SEQ ID NO:5720)和hH29-41_37b(SEQ ID NO:5721)。
实例67-具有靶向具有化学物质#50的人HAO1的22nt间隔子的MG29-1核酸酶的向导
使用MG29-1核酸酶和具有22nt间隔子的单向导RNA针对人HAO-1(编码乙醇酸氧化酶)的向导筛选鉴定出在人Hep3B细胞中具有高编辑活性的4个向导。这些向导被指定为间隔子编号4、21、23和41。这些具有22nt间隔子的单向导RNA的版本被设计成并入化学物质#50化学修饰,并且这些被指定为hH29-4_50(SEQ ID NO:5722)、hH29-21_50(SEQ ID NO:5723)、hH29-23_50(SEQ ID NO:5724)和hH29-41_50(SEQ ID NO:5725)。
实例68-具有靶向具有化学物质#50的人HAO1的20nt间隔子的MG29-1的向导
使用MG29-1核酸酶和具有22nt间隔子的单向导RNA针对人HAO-1(编码乙醇酸氧化酶)的向导筛选鉴定出在人Hep3B细胞中具有高编辑活性的4个向导。这些向导被指定为间隔子编号4、21、23和41。这些具有20nt间隔子的单向导RNA的版本被设计成并入化学物质#50化学修饰,并且这些被指定为hH29-4_50b(SEQ ID NO:5726)、hH29-21_50b(SEQ ID NO:5727)、hH29-23_50b(SEQ ID NO:5728)和hH29-41_50b(SEQ ID NO:5729)。
实例69-具有靶向具有化学物质#50的小鼠HAO1的22nt间隔子的MG29-1的向导
使用MG29-1核酸酶和具有22nt间隔子的单向导RNA针对小鼠HAO-1(编码乙醇酸氧化酶)的向导筛选鉴定出在小鼠Hepa1-6细胞中具有高编辑活性的3个向导。这些向导被指定为间隔子编号1、15和29。这些具有22nt间隔子的单向导RNA的版本被设计成并入化学物质#50化学修饰,并且这些被指定为mH29-1-50(SEQ ID NO:5730)、mH29-15-50(SEQ ID NO:5731)和mH29-29-50(SEQ ID NO:5704)。
实例70-具有靶向具有化学物质#50的小鼠HAO1的20nt间隔子的MG29-1的向导
使用MG29-1核酸酶和具有22nt间隔子的单向导RNA针对小鼠HAO-1(编码乙醇酸氧化酶)的向导筛选鉴定出在小鼠Hepa1-6细胞中具有高编辑活性的4个向导。这些向导被指定为间隔子编号1、15和29。这些具有20nt间隔子的单向导RNA的版本被设计成并入化学物质#50化学修饰,并且这些被指定为mH29-1-50b(SEQ ID NO:5732)、mH29-15-50b(SEQ IDNO:5733)和mH29-29-50b(SEQ ID NO:5705)。
实例71-MG29-1与spCas9的体内编辑效率的比较
为了比较MG29-1核酸酶与spCas9的体内编辑效率,在野生型C57Bl6小鼠中进行剂量应答。选择白蛋白内含子1作为spCas9和MG29-1两者的基因组靶基因座。使用Chop-Chop算法在计算机中搜索小鼠内含子1中的spCas9向导靶位点(参见例如Labun等人doi:10.1093/nar/gkz365,其通过全文引用的方式并入本文)鉴定了总共39个潜在向导,这些向导根据其效率评分和脱靶预测进行排序。另外,排除位于外显子1或外显子2的50bp内的向导靶位点。来自此排序的前3个向导被命名为mAlbR1(SEQ ID NO:5734)、mAlbR2(SEQ IDNO:5735)和mAlbR3(SEQ ID NO:5736),并且在5′和3′端两者处用化学修饰化学合成,所述化学修饰包括甲基化碱基(由命名法mA、mC、mG和mU表示)和硫代磷酸酯主链键(由命名法A*、C*、G*和U*表示)。通过核糖核蛋白复合物的核转染在小鼠肝脏细胞系Hepa1-6中评估这3个向导的编辑效率,所述核糖核蛋白复合物通过将向导RNA和商业来源的spCas9蛋白(购自整合DNA技术公司)以1:2.5的摩尔比混合(用于向导RNA的蛋白质)形成。将20摩尔的spCas9蛋白与50摩尔的向导RNA混合,并且随后使用具有程序设定EH100的Amaxa电穿孔装置核转染到2 x 105个Hepa1-6细胞中。将经核转染的细胞各自转移到新鲜生长培养基中的48孔板的孔中,并在5%CO2/37℃加湿培养箱中培养48小时。使用Purelink试剂盒(英杰公司,赛默飞世尔公司)从细胞中纯化基因组DNA,并且使用引物mAlb90F和mAlb1073R(SEQ IDNO:5737和5738)以及高保真PCR酶混合物,通过靶基因座的PCR扩增,分析白蛋白内含子1中的靶位点处的编辑。使用引物mAlb282F或mAlb460F对PCR产物进行桑格测序。通过分解追踪Indel(TIDE),分析桑格测序色谱图在每个向导的预测靶位点处的插入和缺失(indel),如通过Brinkman等人(《核酸研究》2014年12月16日;42(22),doi:10.1093/nar/gku936,所述文献通过全文引用的方式并入本文)所描述的。靶位点处indel的存在是DNA中双链断裂的产生的结果,然后通过引入插入和缺失的易错细胞修复机制进行修复。TIDE分析的结果在表33中示出。所有三个向导均产生大于90%的indel频率,从而证明所有三个向导都是高活性。
表33:用靶向小鼠白蛋白内含子1的spCas9和作为RNP的spCas9的向导RNA核转染的Hepa1-6细胞中的INDEL频率
样品ID | 向导 | INDEL% | R2 |
1 | mAlbR1 | 92 | 0.95 |
2 | mAlbR2 | 91 | 0.91 |
3 | mAlbR3 | 96 | 0.96 |
如之前所描述的,用广泛化学修饰合成向导mALbR2(Yin等人doi:10.1038/nbt.4005和WO 2019/079527 A1,所述文献中每一个通过全文引用的方式并入本文)。化学修饰包含用2′-O-甲基碱基修饰5′端处的3个碱基和3′端处的3个碱基,以及在5′端处的3个碱基与3′端处的3个碱基之间的硫代磷酸酯键。另外,用2′-O-甲基(SEQ ID NO:5741)修饰内部碱基中的33个内部碱基。据报道,在脂质纳米颗粒中递送spCas9的mRNA和向导RNA之后,spCas9的向导RNA的这些化学修饰能够在小鼠肝脏中在体内有效编辑(参见例如WO2019/079527 A1,所述文献通过全文引用的方式并入本文)。
进行将MG29-1核酸酶靶向小鼠白蛋白内含子1并促进切割和indel形成的向导的向导筛选。当核酸酶作为mRNA递送时,在Hepa1-6细胞中具有最高编辑活性的两个向导是mALb29-8和mAlb29-12。选择向导mALb29-8以在小鼠体内与spCas9向导mAlbR2进行比较。通过评估包含经2′O-甲基和2′-氟修饰的碱基、硫代磷酸酯键以及另外的茎环的不同化学修饰对向导的稳定性和编辑活性的影响,优化了对MG29-1的向导RNA的化学和结构修饰。
关于向导化学物质优化的实验表明,向导化学物质#50是经测试的那些向导化学物质中最具有活性的向导化学物质。当使用包封MG29-1 mRNA的LNP和靶向小鼠白蛋白内含子1的相同向导RNA序列在体内递送到小鼠时,但具有两种不同的向导化学物质(#37和#50)时,在0.5mg/kg的剂量下,化学物质#50的效力是化学物质#37的效力的约4倍。因此,选择MG29-1向导化学物质#50以在体内测试与其同源向导mALbR2(SEQ ID NO:5741)相比的spCas9。
编码MG29-1核酸酶或spCas9核酸酶的信使RNA通过使用T7 RNA聚合酶和核糖核苷酸rATP、rCTP和rGTP、N1-甲基假尿苷和CleanCAP封端试剂(三联生物技术公司)的混合物体外转录线性化质粒模板来产生。SV40源性核定位序列(PKKKRKVGGGGS),随后是短接头,包含在spCas9和MG29-1两者的编码序列的N末端处。对于spCas9和MG29-1两者,将来自短接头(SGGKRPAATKKAGQAKKKK)之前的核质蛋白的核定位信号添加到编码序列的C末端。因此,相同的核定位信号用于MG29-1和spCas9两者。质粒还在spCas9和MG29-1编码序列两者的3′端处编码大约100nt polyA尾,其在mRNA中产生polyA尾。使用相同的算法对spCas9和MG29-1两者的编码序列进行密码子优化(参见例如,Raab等人,DOI 10.1007/s11693-010-9062-3,所述文献通过全文引用的方式并入本文)。编码spCas9 mRNA的DNA序列在SEQ ID NO:5742中,并且由spCas9 mRNA编码的氨基酸序列在SEQ ID NO:5743中。在商业旋转柱上纯化mRNA,通过260nM处的吸光度确定浓度,并且通过Tape Station(安捷伦公司)确定纯度;发现spCas9 mRNA和MG29-1 mRNA两者的纯度是等效的。为了向小鼠体内递送,使用基本上如Kaufmann等人,(PMID:26469188,DOI:10.1021/acs.nanolett.5b02497,所述文献通过全文引用的方式并入本文)所描述的方法将spCas9 mRNA/mAlbR2向导或MG29-1 mRNA/mAlb29-8-50向导包装在脂质纳米颗粒(LNP)内。将向导RNA和mRNA分别包装用于spCas9和MG29-1两者。将脂质(购自Avanti极性脂质公司或Corden药物公司)溶解于乙醇中。将mRNA或向导RNA在水中制备,然后在100mM乙酸钠(pH4.0)中稀释,以制备RNA工作储备液。将四种脂质组分以指定比率在乙醇中合并,以制备脂质工作储备液。示例性脂质混合物包含摩尔比为47.5∶16∶35∶1.5的胆固醇、中性脂质如1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)、阳离子脂质如1,1′-((2-(4-(2-((2-(双(2-羟基十二烷基)氨基)乙基)(2-羟基十二烷基)氨基)乙基)哌嗪-1-基)乙基)氨叉基)双(十二烷-2-醇)(C12-200)和PEG连接的脂质如1,2-二肉豆蔻酰-rac-甘油-3-甲氧基聚乙二醇-2000(DMG-PEG-2000)。将脂质工作储备液和RNA工作储备液以12毫升/分钟的流速和1体积的脂质工作储备液与3体积的RNA工作储备液的比率在微流体混合装置(精密纳米系统公司)中合并。调配物中C12-200与RNA的质量比为10比1。将调配的LNP用1 x PBS以1∶1稀释,然后在1 x PBS中透析两次,每次1小时,随后在Amicon旋转浓缩器中浓缩。将所得LNP调配到1 x PBS缓冲液中,通过0.2μM过滤器进行过滤杀菌,并在4℃下储存。使用Ribogreen试剂(赛默飞世尔公司)测量LNP内外RNA的浓度。通过使用NanoBrook 90Plus(布鲁克海文仪器公司)动态光散射在所得浓缩的LNP中测量LNP的平均直径和多分散性。代表性LNP的大小在80至100纳米的范围内,其中PDI<0.15并且RNA包封率大于90%。平均直径、多分散性和RNA包封效率在下表34中示出。
表34:LNP特征的概述
包封向导RNA mAlb29-8-50的LNP和MG29-1 mRNA以1∶1的RNA质量比混合。包封向导RNA mAlbR1的LNP和spCas9 mRNA以1∶1的RNA质量比混合。通过尾静脉将两种LNP混合物静脉内注射到野生型C57Bl/6小鼠中,其中总RNA剂量为1mg/kg、0.5mg/kg或0.25mg/kg的RNA,每只小鼠的总体积为0.1mL(N=5只小鼠/LNP剂量)。在给药后5天处死小鼠,并将整个肝脏快速冷冻并在-80℃下储存。在珠磨机中使用0.4mL的缓冲液/100mg组织重量在基因组消化缓冲液(Purelink基因组DNA纯化试剂盒,赛默飞世尔公司)中均质化肝脏的整个左侧叶。使用Purelink基因组DNA纯化试剂盒(赛默飞世尔公司)从匀浆的等分试样中纯化基因组DNA。在含有0.5微摩尔的引物mAlb90F(SEQ ID NO:5737,CTCCTCTTCGTCTCCGGC)和mAlb1073R(SEQ ID NO:5738,CTGCCACATTGCTCAGCAC)和1 x Pfusion快速高保真PCR主混合物中的每一种的反应中,从50ng的基因组DNA中PCR扩增白蛋白内含子1区。使用基于柱的纯化试剂盒(DNA清洁和浓缩器,Zymo研究公司)纯化跨越小鼠白蛋白的整个内含子1的所得984bp PCR产物。通过下一代测序(NGS)对PCR产物进行测序,分析靶序列中indel的产生,所述indel用作Cas酶产生双链断裂和NHEJ途径的接合的指示剂。此检测方法基于以下概念:当核酸酶在活细胞内部的DNA中产生双链断裂(DSB)时,据信DSB由细胞DNA修复机制修复,所述细胞DNA修复机制在不存在修复模板的情况下由NHEJ途径发生。因为已知NHEJ途径是引入双链断裂位点处的碱基的插入或缺失的易错过程(Lieber,M.R,《生物化学年度评论》2010;79:181-211),因此这些插入和缺失(indel)是发生并随后修复的双链断裂的标志,并且因此作为核酸酶的编辑或切割效率的读出。
使用定制Python脚本(IndelCalculator v1.3.1)分析测序读段,所述定制Python脚本将每个序列读段与野生型靶序列(在这种情况下,白蛋白内含子1)比对,并且计算在窗口内含有至少一个indel的读段数量,而不管indel大小如何,所述窗口跨越核酸酶的预测在靶切割位点的任一侧的10个碱基对。每组5只小鼠中的每一只的编辑效率(indel频率)以及组的平均值和标准偏差在图94中概述。在注射有PBS缓冲液的对照小鼠中未检测到编辑。spCas9 mRNA/mAlbR2 LNP和MG29-1 mRNA/mAlb29-8-50 LNP两者均导致剂量依赖性编辑。在所有3个剂量下,MG29-1 mRNA/mAlb29-8-50 LNP的编辑效率高于spCas9 mRNA/mAlbR2LNP的编辑效率。3个剂量的平均编辑效率在表35中概述。在1mg/kg(0.5mg/kg mRNA和0.5mg/kg向导RNA)的剂量下,MG29-1比spCas9略微更强效,从而导致多于约15%的indel。在0.5mg/kg(0.25mg/kg mRNA和0.25mg/kg向导RNA)的剂量下,MG29-1导致多于约50%的indel。在0.25mg/kg(0.125mg/kg mRNA和0.125mg/kg向导RNA)的剂量下,MG29-1导致多于100%的indel。这些数据证明,使用相同的LNP进行递送和使用相同的方法产生mRNA,MG29-1核酸酶与适当优化的向导RNA组合比spCas9核酸酶和经适当修饰的向导RNA更强效。在经测试的最低剂量下,MG29-1的优越的体内编辑效率特别明显,其中在相同剂量下,MG29-1比spCas9强效2倍。这些结果表明,MG29-1核酸酶和通过化学物质#50例示的经适当修饰的向导RNA对于使用LNP递送的体内基因编辑可能具有优势。
表35.在静脉内注射包封MG29-1 mRNA和向导mAlb29-8-50(mA29-8-50)或spCas9mRNA和三种剂量的向导mAlbR2的LNP或PBS缓冲液(对照)后5天,小鼠全肝脏中的平均编辑效率。
实例72-通过Hep3B细胞中基于mRNA的转染靶向人HAO-1的外显子区的MG29-1的活性单向导RNA的鉴定
序列特异性核酸酶可以用于破坏所关注的基因的编码序列,由此产生由所述基因编码的蛋白质的功能敲除。当蛋白质的敲低在特定人类疾病中具有有益作用时,这可用于治疗用途。破坏基因的编码序列的一种方法是使用序列特异性核酸酶在基因的外显子区内进行双链断裂。双链断裂通过易错的修复途径,主要是非同源端连接(NHEJ)修复以产生插入或缺失,这可能导致移码突变或氨基酸序列的变化,从而破坏蛋白质的功能。
为了鉴定在编码人乙醇酸氧化酶(GO)的基因的外显子区处有效地产生双链断裂的MG29-1的向导RNA,使用Geneious Prime核酸分析软件(https://www.geneious.com/ prime/)中的向导寻找算法鉴定靶向人羟基酸氧化酶(HAO-1)基因(GenBank RefSeq登录号NG_046733)的外显子1至4的间隔子长度为22nt的单向导RNA(sgRNA)。
人HAO-1基因的前四个外显子编码包括大约50%的HAO-1编码序列的N末端的氨基酸。选择前4个外显子,因为朝向基因的编码序列的N末端产生的indel更有可能产生破坏蛋白质的活性的移码或错义突变。使用TTTN的MG29-1的更具限制性的PAM,在人HAO-1外显子1至4内鉴定总共42种潜在sgRNA。包含跨越内含子/外显子边界的向导,因为此类向导可以产生干扰剪接的INDEL。为了产生完全sgRNA,将主链序列(UAAUUUCUACUGUUGUAGAU)添加到间隔子序列的3′端。将并入经化学修饰的碱基的sgRNA化学合成,所述经化学修饰的碱基经记录以改进用于V型核酸酶cpf1(“AltR1/AltR2”化学物质,可在整合DNA技术公司商购获得)的sgRNA的性能。这些向导的间隔子序列在表36中示出。
表36:靶向人HAO-1的42个单向导RNA的序列,用于在人Hep3B细胞中进行测试
/>
/>
/>
将Hep3B细胞(ATCC目录号HB-8064),即经转化的人肝脏细胞系(衍生自肝细胞癌)在5%CO2培养箱中在生长培养基(具有10%FBS的EMEM培养基)中的标准条件下培养,并用编码MG29-1和单向导RNA中的每一个的mRNA的混合物转染。编码MG29-1的mRNA通过质粒的T7聚合酶体外转录产生,其中MG29-1的编码序列已被克隆。使用人密码子使用表对MG29-1编码序列进行密码子优化,并且侧接衍生自SV40(在N末端处)和衍生自核质蛋白(在C末端处)的核定位信号。另外,在编码序列的5′端处包含5′非翻译区(5′UTR)以改善翻译。在编码序列的3′端处的mRNA(在质粒中编码)中包含3′UTR,随后包含大约90至110个核苷酸polyA轨道,以改善体内mRNA稳定性。编码没有polyA尾的MG29-1 mRNA的DNA序列在SEQ ID 5830中示出。体外转录反应包含清洁封端试剂(三联生物技术公司),使用MEGAClearTM转录清洁试剂盒(英杰公司)纯化所得RNA,并使用TapeStation(安捷伦公司)评估纯度,并且发现其由>90%全长RNA组成。
当使用mRNA和具有脂质转染试剂如信使MAX的向导共转染时,两个RNA分子的混合物与带正电荷的脂质形成复合物,所述复合物通过内吞作用进入细胞,并且最终RNA中的一些RNA到达细胞质。在细胞质中,mRNA被翻译成蛋白质。在RNA向导的核酸酶如MG29-1的情况下,所得MG29-1蛋白在由工程化成MG29-1蛋白的核定位信号介导的过程中进入核之前,推测将与细胞质中的sgRNA形成复合物。此过程类似于在体内脂质纳米颗粒中递送mRNA和向导RNA的方法,方法设想用于其中HAO-1基因将通过在编码序列内引入INDEL而功能失活的治疗应用。因此,使用mRNA和sgRNA的共转染来筛选用于编辑活性的42个单向导RNA,因为此方法可能更好地表示计划的治疗用途,并且因此可能更准确地预测42个sgRNA中的哪一个在治疗应用中将最具活性。
将总共2 x 105个Hep3B细胞铺板在生长培养基(EMEM加10%FBS)中的24孔板的每个孔中,并在5%CO2/37℃加湿培养箱中温育过夜。第二天,在OPTIMEM培养基(每次转染1.25μL信使MAX加25μL OPTIMEM)中稀释脂质体信使MAX(赛默飞世尔公司)。将300ng的MG29-1 mRNA(0.22pmol)和120ng(8.4pmol)的sgRNA在25μL OPTIMEM培养基中合并,然后通过轻弹管与26μL经稀释的信使MAX混合。在室温下温育5至10分钟后,将RNA/信使MAX混合物添加到Hep3B细胞的每个孔中并通过轻轻打旋混合。将细胞温育过夜(16小时),之后将培养基交换为新鲜生长培养基。在添加RNA/信使MAX混合物后48小时,通过胰蛋白酶化或通过板上裂解收集细胞,并且使用Purelink基因组DNA提取试剂盒(赛默飞世尔公司)或MagMaxDNA提取试剂盒(赛默飞世尔公司)和KingFisher机器人系统(赛默飞世尔公司)纯化基因组DNA。通过260nm处的吸光度定量经纯化的基因组DNA。使用外显子特异性引物(表37)和Phusion快速高保真PCR主混合物(赛默飞世尔公司),通过来自经纯化的基因组DNA的PCR扩增由单个向导靶向的HAO-1基因序列。使用DNA清洁和浓缩器5试剂盒(Zymo研究公司)纯化并浓缩PCR产物,并且使用位于每个sgRNA的预测靶位点的100bp至350bp内的引物(表37)对40ng PCR产物进行桑格测序(在ELIM生物科学公司(ELIM Biosciences))。将衍生自未经处理的Hep3B细胞的PCR产物作为对照包含在内。PCR产物的序列与HAO-1外显子的预期序列相匹配。
表37:针对人HA01基因设计的引物,用于前四个外显子的PCR扩增和用于桑格测序
通过称为分解追踪Indel(TIDE)的算法,分析桑格测序色谱图在每个sgRNA的预测靶位点处的插入和缺失(indel),如Brinkman等人(参见例如,《核酸研究》2014年12月16日;42(22):e168.于2014年10月9日在线发布.doi:10.1093/nar/gku936,所述文献通过全文引用的方式并入本文)所描述的。如在表38中所呈现的,14个向导在其预测的靶位点处显示出可检测的编辑。十个向导表现出10%或更大的编辑活性。这些数据证明,MG29-1核酸酶可以在培养的肝脏细胞系中的人HAO-1基因的外显子区中产生RNA向导的、序列特异性的双链断裂。
表38:在Hep3B细胞中的靶向人HAO-1基因的外显子1至4的42个sgRNA的编辑活性。
/>
*数据是2个独立转染的平均值
使用Hep3B细胞中相同的MG29-1 mRNA/sgRNA信使Max转染方法,重新测试来自此初始筛选的具有最高编辑活性的sgRNA中的六个sgRNA(hH29-2、hH29-4、hH29-19、hH29-21、hH29-23和hH29-41)。进行两个独立转染,并且使用上文所描述的相同的桑格测序方法确定indel频率,随后使用TIDE进行分析。平均indel频率(图95)在20%至75%的范围内。编辑效率的排序顺序为hH29-21>hH29-41>hH29-4>hH29-19>hH29-23=hH29-2。还基于桑格色谱图(Sanger Chromatograms)对产生移码(框外编辑)的indel的频率进行评估,并且这些结果在图95中绘制。对于不同的sgRNA,框外编辑与总indel的比率不同,但框外编辑频率的排序顺序与总indel相同。
还通过核糖核蛋白颗粒(RNP)到Hep3B细胞和另一种人肝脏源性细胞系HuH7两者中的核转染来评估在Hep3B细胞中具有最高编辑活性的sgRNA中的四个sgRNA(hH29-21、hH29-4、hH29-41和hH29-23)的编辑活性。通过在PBS缓冲液中混合160pmol的sgRNA和126pmol经纯化的MG29-1蛋白来形成核糖核蛋白复合物。使用4D核转染装置(龙沙公司)用预先形成的核酸酶/sgRNA复合物对在完全SF核转染试剂(龙沙公司)中悬浮的总共2 x 105个Hep3B或HuH7细胞进行核转染。在核转染后,将细胞铺板在生长培养基加10%FBS中的24孔板中,并在5%CO2培养箱中温育48小时至72小时。然后使用基于柱的纯化试剂盒(Purelink基因组DNA微型试剂盒,赛默飞世尔科技公司)从细胞中提取基因组DNA并通过在260nm处的吸光度进行定量。使用相关外显子特异性引物(表37)和Phusion快速高保真PCR主混合物(赛默飞世尔公司),通过来自经纯化的基因组DNA的PCR扩增由单个向导靶向的HAO-1基因序列。使用DNA清洁和浓缩器5(Zymo研究公司)纯化并浓缩PCR产物,并使用位于每个sgRNA的预测靶位点的100至350bp内的相关引物(表37)对40ng的PCR产物进行桑格测序(在ELIM生物科学公司)。将衍生自未经转染的细胞的PCR产物作为对照包含在内。PCR产物的序列与HAO-1外显子的预期序列相匹配。通过分解追踪Indel(TIDE),分析桑格测序色谱图在每个向导的预测靶位点处的插入和缺失(indel),如通过Brinkman等人(《核酸研究》2014年12月16日;42(22):e168.于2014年10月9日在线发布.doi:10.1093/nar/gku936)所 描述的。靶位点处indel的存在是DNA中双链断裂的产生的结果,然后通过引入插入和缺失的易错细胞修复机制进行修复。结果(图96)证明,使用RNP核转染的更有效转染方法,前4个向导的编辑频率在25%至95%的范围内。这4个向导的编辑活性的排序顺序是hH29-21>hH29-4>hH29-41>hH29-23,这与在Hep3B细胞中通过信使MAX转染mRNA和sgRNA测量的编辑活性的排序顺序相似但不相同(图95)。
实例73-靶向原代人肝细胞中的人HAO-1的外显子1至4的最具活性的MG29-1向导的编辑活性
原代人肝细胞(PHH)是使用经记录的方法从已故人的肝脏分离的肝细胞,所述经记录的方法如Kegel等人,(doi:10.3791/53069)所述。PHH是人肝细胞在其体内天然状态中最接近的基于细胞的模型,并且因此表示可以用于预测基因编辑系统在人体内的性能的体外细胞系统。PHH已经经受最小操纵,不经受细胞分裂,并且在培养物中具有约7天的有限寿命。PHH从商业供应商(龙沙公司,Gibco公司(Gibco))获得,并且根据供应商所提供的方案培养。为了评估靶向人HAO-1的四个最具活性的MG29-1向导的编辑活性,通过向主链和改善sgRNA的稳定性和活性的核碱基中并入化学修饰#37来化学合成具有间隔子4、21、23和41的sgRNA。具有化学修饰#37的4个sgRNA被指定为hH29-4-37(SEQ ID 5831)、hH29-21-37(SEQID 5832)、hH29-23-37(SEQ ID 5833)和hH29-41-37(SEQ ID 5834)。如下将1028ng的MG29-1 mRNA和222ng的每个单向导RNA(1∶20摩尔比的mRNA:向导RNA)转染到原代人肝细胞(PHH)细胞中。在转染前一天,将PHH细胞解冻并接种在以1,000,000个活细胞/孔到经胶原处理的12孔板中的1.0ml HBMTM-5%FBS-HCMTMSingleQuot补充培养基中。在转染当天,将60.4μL的OptiMEM培养基和2.1μL的脂质体信使Max溶液(赛默飞世尔公司)在主混合溶液中混合,涡旋,并且使其在室温下静置至少10分钟。在单独的管中,将1028ng的MG29-1 mRNA和222ng的sgRNA混合,用OptiMEM培养基使体积达到62.5μL,并短暂移液。将适当体积的信使Max溶液添加到每种RNA溶液中,通过轻弹管混合,并且短暂低速旋转。将完整的编辑试剂溶液在室温下温育至少10分钟,然后直接添加到PHH细胞中。转染后,每天更换培养基,直到采集。在转染后三天,从PHH细胞的每个孔吸出培养培养基,并用MagMAXTM细胞和组织DNA提取缓冲液(赛默飞世尔公司)更换。将细胞刮取并转移到96孔板中,并通过具有MagMAXTM DNA多样品超2.0试剂盒(赛默飞世尔公司)的KingFisher Flex通过自动磁珠纯化来纯化基因组DNA。
用Q5高保真DNA聚合酶和外显子特异性引物(表37)对每个特异性sgRNA靶向的HAO-1基因的区进行PCR扩增,但添加与用于下一代测序(NGS)的条形码引物互补的衔接子,总共扩增29个循环。使用使用总共10个循环的NGS的条形码引物对此第一PCR反应的产物进行PCR扩增。在因美纳MiSeq机器上对所得产物进行NGS,并且使用定制脚本处理结果,以生成在HAO-1基因中的靶向位点处含有插入或缺失(indel)的测序读段的百分比。进行两次独立的PHH转染,并且在每个实验中,在通过NGS单独测定indel的一式两份孔中测试sgRNA中的每一个。然后计算2个孔中的indel频率的平均值。然后确定来自2个独立实验的indel频率的平均值(表39),并且还以图形格式(图97)示出,其中误差条表示标准偏差。
表39:靶向人HAO-1的4个MG29-1 sgRNA的PHH中的编辑活性
sgRNA | Exon | 平均总INDEL%* | 标准偏差 |
hH29-4-37 | 1 | 58.3 | 5.6 |
hH29-21-37 | 2 | 59.1 | 10.5 |
hH29-23-37 | 3 | 31.5 | 10.5 |
hH29-41-37 | 4 | 49.2 | 9.9 |
*数据是2个独立转染实验的平均值,每个独立转染实验在一式两份孔中进行
结果表明,所有四个向导编辑PHH中的HAO-1基因,其中平均INDEL频率在20%至58%的范围内(图97)。向导hH29-4-37和mH29-21-37在PHH中表现出最高编辑活性。向导hH29-41-37的活性略低于向导hH29-4-37和mH29-21-37,但差异不显著。向导hH29-23-37是PHH中4个向导中活性最小的。向导hH29-23-37也是Hep3B和HuH7细胞中这4个向导中活性最小的(表37、图95、图96)。PHH是用于体内编辑肝细胞的替代物。这些数据证明,MG29-1核酸酶和适当的sgRNA已用于在人HAO-1基因的编码序列中产生插入和缺失,这预期产生无义、错义和缺失突变的混合物,从而导致GO蛋白表达和/或活性的破坏。
使用从用MG29-1 mRNA和4个sgRNA转染的PHH中的HAO-1基因的相同NGS序列数据获得的indel谱来确定导致移码的INDEL的百分比。其中在靶位点处插入或缺失碱基的数量不是3个碱基或3个碱基的倍数的序列读段将移位HAO-1蛋白质编码序列的阅读框。移码将改变在indel下游的mRNA中编码的氨基酸序列,并且在许多情况下,将在某个点处引入框内终止密码子(这可以针对每个等位基因进行预测)。使用计算总测序读段的百分比的Python脚本分析NGS数据(包括每个样品的数千个读段),其中存在创建移码的indel,并且这被指定为框外(OOF)indel百分比。OOF indel百分比在图97中连同总indel百分比一起绘制。OOFindel百分比在20%至40%的范围内,其表示总INDEL百分比的70%至80%之间,从而证明预测大多数indel产生移码。框内indel将从mRNA缺失1个或更多个密码子,并且因此将从由HAO-1编码的乙醇酸氧化酶蛋白去除1个或更多个氨基酸。图98A和98B示出了来自经编辑的PHH的4个MGf29-1 sgRNA中的每一个的代表性indel谱。3个、6个、9个、12个、15个、18个和21个碱基的框内缺失在不同的相对频率下是明显的。框内缺失的频率和其对GO蛋白序列的影响的分析可以用于通知将导致GO蛋白功能的最大降低的sgRNA的选择。
实例74-具有靶向小鼠HAO-1的外显子区的22个和20个核苷酸间隔子的MG29-1的单向导RNA的体内编辑活性
为了评估MG29-1 V型核酸酶在活动物体内编辑基因组的能力,使用脂质纳米颗粒递送编码MG29-1核酸酶的mRNA和四个向导RNA中的一个。在实例55中证明了当在LNP中递送时MG29-1与包括22个核苷酸(nt)间隔子的sgRNA编辑小鼠肝脏中的小鼠HAO-1基因座的能力。在培养的哺乳动物细胞中的实验证明,将MG29-1 sgRNA中的间隔子区的长度从22nt降低至20nt不会改变编辑活性。将间隔子从22nt减少至20nt在使脱靶活性最小化和在sgRNA制备方面可能是有利的。为了验证间隔子长度减少为20nt的MG29-1 sgRNA在体内保留效力,在小鼠中设计和测试了四个向导RNA(mH29-29-37、mH29-29-44、mH29-29s-37和mH29-29s-44)。这些向导的序列在下表40中示出。
表40:在小鼠体内研究中测试的向导RNA的序列和化学修饰
/>
化学修饰的符号:m=2′O-甲基核糖核苷酸(例如,mC=具有2′-O甲基的胞嘧啶核糖核苷酸代替2′羟基);f=2′氟核糖核苷酸(例如,fC=具有2′氟的胞嘧啶核糖核苷酸代替2′羟基);*=硫代磷酸酯键。所有其它碱基是天然核糖核苷酸。正常类型的主链序列。粗体类型的间隔子序列。
向导mH29-29-37和mH29-29-44具有相同的nt序列(间隔子29),但具有不同的化学修饰(化学物质37和44),而向导mH29-29s-37和mH29-29s-44具有在3′端处缩短了两个nt的间隔子序列,但在其它方面在nt序列中分别与mH29-29-37和mH29-29-44相同。具有20nt间隔子的向导的间隔子区中的2′-氟、2′-O-甲基和硫代磷酸酯修饰的位置相对于具有22nt间隔子的对应向导中的那些移位。由于sgRNA中的化学修饰影响sgRNA稳定性,这对于体内效力至关重要,因此评估这些变化对体内编辑的影响是重要的。
MG29-1 mRNA的制备
编码MG29-1(SEQ ID NO:5846)的mRNA使用T7 RNA聚合酶和使用购自新英格兰生物实验室或三联生物技术公司的核苷酸和酶的标准条件,通过线性化质粒模板的体外转录产生。MG29-1盒的蛋白质编码序列包括以下来自5′至3′的元件:来自SV40的核定位信号、五个氨基酸接头(GGGS)、从其去除起始甲硫氨酸密码子的MG29-1核酸酶的蛋白质编码序列、3个氨基酸接头(SGG)和来自核质蛋白的核定位信号。使用可商购获得的算法针对人对此盒的DNA序列进行密码子优化。使用购自三联生物技术公司的CleanCAPTM试剂,在用于体外转录的质粒中编码大约100个核苷酸polyA尾并且共转录地对mRNA进行封端。将mRNA中的尿苷用N1-甲基假尿苷置换。
脂质纳米颗粒的制备
用于递送MG29-1 mRNA和向导RNA的脂质纳米颗粒(LNP)调配物基于文献中所描述的LNP调配物,所述文献包含Kauffman等人,(《纳米快报》2015,15,11,7300-7306https:// doi.org/10.1021/acs.nanolett.5b024970)。将四种脂质组分溶解于乙醇中,并且以适当的摩尔比混合以制备脂质工作混合物。将RNA在100mM乙酸钠(pH 4.0)中稀释以制备RNA工作储备液。脂质工作储备液和RNA工作储备液在微流体装置(Ignite NanoAssembler,精密纳米系统公司)中分别以1∶3的流速比和12毫升/分钟的流速混合。LNP针对磷酸盐缓冲盐水(PBS)透析2至16小时,并且然后使用Amicon旋转浓缩器(密理博公司)浓缩,直至达到所期望的体积。使用Ribogreen试剂(赛默飞世尔公司)测量LNP调配物中RNA的浓度。LNP的直径和多分散性(PDI)通过动态光散射测定。典型LNP的直径在70nm至84nm的范围内,并且PDI为0.098至0.150。
小鼠给药和采集
将mRNA和sgRNA的LNP以1∶1的质量比混合,并且以0.84mg RNA/kg体重的总RNA剂量通过尾静脉(每只小鼠0.1mL)静脉内注射到7周龄的C57Bl6野生型小鼠中。在给药后十四天,处死小鼠,并且收集肝脏的左侧叶、中间叶和右侧叶,分别制备DNA、RNA和蛋白质。通过心脏穿刺放血收集血液,并收集到BD微量容器(肝素包被)上。在离心之前,将样品保持在湿冰上不超过30分钟。将样品在2,000G下离心10分钟,并将血浆转移到1.5mL冷冻管中并在-80℃下储存。
通过下一代测序(NGS)进行基因组DNA制备和编辑分析
在PureLink基因组DNA分离试剂盒(赛默飞世尔科技公司)中供应的消化缓冲液中使用珠Ruptor(欧姆尼国际公司)使肝脏的左侧叶(100mg)均质化。使用MagMAXTM DNA多样品超2.0试剂盒(应用生物系统公司(Applied Biosystems))从所得匀浆物中纯化基因组DNA,并通过测量260nm处的吸光度进行定量。将从仅注射PBS缓冲液的小鼠中纯化的基因组DNA用作对照。用Q5高保真DNA聚合酶和具有与用于下一代测序(NGS)的条形码引物互补的衔接子的基因特异性引物(表41)对每个特异性sgRNA靶向的HAO-1基因的区进行PCR扩增,总共扩增29个循环。
表41:用于扩增HAO1向导靶位点和用于NGS的引物
使用用于总共10个循环的NGS的条形码引物对此第一PCR反应的产物进行PCR扩增。在因美纳MiSeq机器上对所得产物进行NGS,并且使用定制Python脚本处理结果,以生成在HAO-1基因中的靶向位点处含有插入或缺失(INDEL)的测序读段的百分比。
NGS分析示出,用包封MG29-1 mRNA的LNP和四个sgRNA中的每一个给药的组的编辑在总肝脏基因组DNA的42%至48%的范围内(图99)。各组之间仅存在轻微差异,从而表明具有20-nt间隔子的sgRNA与22-nt间隔子一样有效地编辑靶基因座,并且所述向导RNA具有同样编辑良好的化学物质37和44。
通过RT-ddPCR进行RNA制备和分析
肝脏的中间叶储存在RNAlater或RNAprotect(凯杰公司)中,以在均质化之前保持RNA的完整性。将最多10mg的组织转移到含有1.4mm陶瓷珠的2mL管中,并且按照软组织均质化方案使用珠Ruptor Elite(欧姆尼国际公司)均质化,5.00米/秒,持续10-15秒。然后使用RNeasy保护试剂盒(凯杰公司)用另外的45分钟柱上DNA酶I消化处理(凯杰公司)处理经均质化的组织。通过测量在260nm处的吸光度来定量RNA产物。然后,使用ezDNaseTM酶(英杰公司)对经分离的RNA样品进行另外的DNA酶处理,并使用SuperScriptTM IV Vilo主混合物(英杰公司)进行逆转录。然后通过测量在260nm处的吸光度来定量cDNA产物。
使用与管家基因GAPDH复用的定制的基于ddPCR探针的测定法定量HAO-1 mRNA水平。HAO-1用HEX探针标记,而GAPDH用FAM探针标记。两种探针均侧接对产生约115bp的扩增子的相应基因具有特异性的引物。用于测定的模板材料是来自上述过程的100ng的cDNA产物,所述cDNA产物与900nM的每种引物和250nM的每个基因测定的探针连同10μL的用于探针的ddPCR Supermix(无dUTP)(伯乐实验室(Bio-Rad Laboratories))混合,用不含核酸酶的水将最终体积升至20μL。通过AutoDG ddPCR系统(伯乐实验室)将PCR混合物解析成数千个油滴,在C1000 TouchTM深孔热循环仪(伯乐实验室)中运行,并使用QX200液滴读取器(伯乐实验室)进行分析。将结果分成四个部分:阴性液滴(无荧光)、单个阳性液滴(HEX或FAM阳性荧光)和双阳性液滴(HEX和FAM荧光两者)。使用QuantaSoft软件(伯乐实验室),针对每个样品计算HAO1和GAPDH的拷贝数/μL。比较了用mH29-29处理的小鼠与仅用缓冲液处理的小鼠的HAO1与GAPDH的比率。经mH29-29处理的组的HAO1 mRNA的GAPDH归一化水平在对照组的52%至70%的范围内(图99),并且与如由INDEL%定义的编辑效率相关,从而指示间隔子长度或化学物质对向导RNA活性的影响很小或没有影响。
表42:扩增HAO1和GAPDH ddPCR测定中使用的引物和探针
化学修饰的符号:+=锁核酸(LNA)碱基修饰
实例75-不同mRNA∶sgRNA比率和LNP调配物程序对小鼠体内编辑效率的研究
在此项体内小鼠研究中,将MG29-1 mRNA和sgRNA mH29-29-50b单独调配成LNP,然后在给药前以不同质量比混合mRNA和sgRNA。相同的mRNA和sgRNA也以1∶1的质量比在相同的LNP中共调配,然后保持在4℃下并在48小时内给药(新鲜LNP),或冷冻并在-80℃下储存,然后在2小时内解冻并给药(冷冻LNP)。mH29-29-50b sgRNA的序列在表43中示出。此向导具有20-nt间隔子序列和指定为化学物质50的化学修饰。
表43:在小鼠体内研究中测试的向导RNA的序列和化学修饰
化学修饰的符号:m=2′O-甲基核糖核苷酸(例如,mC=具有2′-O甲基的胞嘧啶核糖核苷酸代替2′羟基);f=2′氟核糖核苷酸(例如,fC=具有2′氟的胞嘧啶核糖核苷酸代替2′羟基);*=硫代磷酸酯键。所有其它碱基是天然核糖核苷酸。正常类型的主链序列。粗体类型的间隔子序列。
脂质纳米颗粒的制备
用于递送MG29-1 mRNA和向导RNA的LNP调配物通过与实例74中相同的程序制备,具有以下差异:
1.对于单独调配的LNP的不同比率,将mRNA和向导RNA LNP以1∶2、1∶1.5、1∶1、1∶0.75和1∶0.5 mRNA∶向导RNA质量比混合。
2.对于共调配的LNP,将mRNA和向导RNA在调配之前以1∶1的质量比混合,并在4℃(“新鲜”)或-80℃(“冷冻”)下储存过夜。
小鼠给药和采集
将在单独的LNP中调配的mRNA和sgRNA以如上所述的不同的质量比混合,并且以0.35mg RNA/kg体重的总RNA剂量通过尾静脉(每只小鼠0.1mL)静脉内注射到7周龄的C57Bl6野生型小鼠中。以相同剂量类似地注射共调配的LNP。在给药后七天,处死小鼠,并且通过与实例74中相同的程序收集肝脏的左侧叶、中间叶和右侧叶,分别制备DNA、RNA和蛋白质。根据实例74的程序,通过心脏穿刺放血来收集末梢血。
通过NGS进行基因组DNA制备和编辑分析
如实例74中那样,通过NGS制备和分析基因组DNA。
通过RT-ddPCR进行RNA制备和分析
如实例74中那样,通过RT-ddPCR制备和分析RNA。
结果证明,单独调配的LNP中的mRNA与向导之间的比率不会极大地影响编辑效率(图100)。尽管在中间三个比率(1∶1.5、1∶1和1∶0.75)下的编辑效率略高于极端比率(1∶2和1∶0.5),但差异在实验的变化范围内。共调配的LNP导致比单独的调配物更高的编辑,其中新鲜和冷冻的LNP表现同样良好。类似于编辑效率,在不同MG29-1 mRNA∶向导比率下存在于用单独调配的LNP处理的小鼠的肝脏中的HAO-1 mRNA的量几乎没有差异(图100)。与接受单独调配的LNP的组相似,用共调配的LNP处理的小鼠中的HAO-1 mRNA水平降低超过50%。总之,这些结果证明,MG29-1 mRNA和具有化学物质50的sgRNA可以共调配成LNP,而不降低编辑效力,并且可以使用1∶2至1∶0.5之间的一系列mRNA与sgRNA比率。
实例76-不同向导化学物质对体内编辑效率的影响的研究
脂质纳米颗粒的制备
用于递送MG29-1 mRNA和向导RNA的LNP调配物通过与实例74中相同的程序制备。向导RNA序列和化学物质在表40中列出。
小鼠给药和采集
将mRNA和sgRNA单独调配成LNP,然后如实例74中那样以1∶1的质量比混合,并且以0.25mgRNA/kg体重的总RNA剂量通过尾静脉(每只小鼠0.1mL)静脉内注射到7周龄的C57Bl6野生型小鼠中。在给药后七天,处死小鼠,并且通过与实例74中相同的程序收集肝脏的左侧叶、中间叶和右侧叶,分别制备DNA、RNA和蛋白质。根据实例74的程序,通过心脏穿刺放血来收集末梢血。
通过NGS进行基因组DNA制备和编辑分析
如实例74中那样,通过NGS制备和分析基因组DNA。
通过RT-ddPCR进行RNA制备和分析
如实例74中那样,通过RT-ddPCR制备和分析RNA。
向导名称用“b”指示的所有向导(例如,mH29-29-50b)均含有20-nt间隔子。向导mH29-29-37和mH29-29-50含有22-nt间隔子。具有化学物质51、52、53和54的向导含有与具有化学物质50的向导相同的核苷酸序列,但在向导的特异性区处的化学修饰方面具有不同。除了去除间隔子中的2′-氟修饰之外,化学物质51与化学物质50相同。除了去除间隔子中的一半2′-氟修饰之外,化学物质52与化学物质50相同。除了另外的21个硫代磷酸酯键和21个2′-O甲基修饰之外,化学物质53与化学物质50相同。除了5′茎环中的另外的21个硫代磷酸酯键和21个2′-O甲基修饰之外,化学物质53与化学物质50相同。除了5′茎环中的另外的21个硫代磷酸酯键和21个2′-O甲基修饰以及间隔子中的2′-氟修饰的去除之外,化学物质54与化学物质50相同。
结果表明具有化学物质50(50b)和化学物质52(52b)的向导RNA具有最高的编辑效率(图101)。由于阅读框移位和所得过早终止密码子,预期在HAO-1基因中引入INDEL会通过无义介导的mRNA衰变来降低HAO-1mRNA的水平。用具有化学物质50的22-nt向导(mH29-29-50b)处理导致HAO-1 mRNA的最低水平(最大降低),这与此机制一致(图101)。化学物质51(51b)的效力是化学物质50(50b)的效力的1/2,从而表明间隔子中的2′-氟修饰对效力有显著贡献。与化学物质50(50b)相比,化学物质52(52b)具有类似或略微改善的编辑效力,从而表明在此向导间隔子序列的上下文中,有可能去除间隔子中的一半2-氟修饰而不显著降低效力。化学物质53(53b)的编辑效力是化学物质50(50b)的编辑效力的约1/2,从而表明在5′茎环中添加2′-O-甲基和PS键对效力具有负面影响,这令人惊讶,因为这些另外的修饰预期会改善向导稳定性。化学物质54(54b)的效力是化学物质50(50b)的效力的约1/4并且是化学物质53(53b)的编辑效力的约1/2,从而证实了5′茎环中的另外的2′O-甲基和PS碱基以及间隔子中的2′-氟碱基的去除两者都对向导效力具有附加的负面影响。
实例77-Hepa1-6细胞中APO-A1在DNA水平的基因编辑结果
使用龙沙公司4D电穿孔仪将MG29-1RNP(126pmol蛋白质/160pmol向导)核转染到Hepa1-6细胞(200,000个)中。采集细胞,并且在转染后五天制备基因组DNA。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图102)。
表43A:实例77的向导RNA的序列和靶向的序列
/>
/>
实例78-Hepa1-6细胞中ANGPTL3在DNA水平的基因编辑结果
使用龙沙公司4D电穿孔仪将MG29-1 RNP(126pmol蛋白质/160pmol向导)核转染到Hepal-6细胞(200,000个)中。采集细胞,并且在转染后五天制备基因组DNA。产生适用于基于NGS的DNA测序的PCR引物,对其进行优化,并且用于扩增每个向导RNA的单独的靶序列。在因美纳MiSeq机器上对扩增子进行测序,并且用专有的Python脚本进行分析以测量基因编辑(图103)。
表43B:实例78的向导RNA的序列和靶向的序列
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
实例79-紧凑MG55-43核酸酶系统
鉴定推定tracrRNA的体外表征
为了鉴定tracrRNA序列,使用70主混合物试剂盒(Arbor生物科学公司)在转录翻译反应混合物中表达核酸酶(MG55-43,蛋白质SEQ ID NO:470)、基因间序列和最小阵列。最终反应混合物含有5nM核酸酶DNA模板、12nM基因间DNA模板、15nM最小阵列DNA模板、0.1nM pTXTL-P70a-T7rnap和1X的/> 70主混合物。将反应在29℃下温育16小时,然后在4℃下储存。
通过体外切割反应测试核糖核蛋白复合物。质粒DNA文库切割反应通过在37℃下混合代表所有可能的8N PAM的5nM靶质粒DNA文库、TXTL表达的5倍稀释、10nM Tris-HCl、10nM MgCl2和100mM NaCl进行2小时。将反应停止并用HighPrepTM PCR清洁珠(MAGBIO基因组公司(MAGBIO Genomics,Inc.))清洁,并在Tris EDTA pH 8.0缓冲液中洗脱。将3nM的切割产物端在25℃下用3.33μM dNTP、1X T4 DNA连接酶缓冲液和0.167U/μL的Klenow片段(新英格兰生物实验室公司(New England Biolabs Inc.))钝化15分钟。将1.5nM的切割产物与150nM衔接子、1X T4 DNA连接酶缓冲液(新英格兰生物实验室公司)和20U/μL T4 DNA连接酶(新英格兰生物实验室公司)在室温下连接20分钟。将经连接的产物用NGS引物通过PCR扩增,并且通过NGS测序以获得PAM。
为了获得tracrRNA和crRNA的序列,使用Quick-RNATM微量制备型试剂盒(Zymo研究公司)从TXTL裂解物中提取RNA,并在30-50μL的水中洗脱。在Nanodrop、Tapestation和Qubit上测量转录物的总浓度。对RNA文库进行RNA测序。
在计算机中搜索新的tracrRNA序列
为了鉴定含有潜在tracrRNA的另外的非编码区,活性tracrRNA的序列被映射到含有相同核酸酶家族中的核酸酶的其它重叠群。新鉴定的序列用于产生协方差模型以预测另外的tracrRNA。协方差模型由活性和预测的tracrRNA序列的多序列比对(MSA)构建。MSA的次级结构用RNAalifold(维也纳包装公司(Vienna Package))获得,并且协方差模型用推断包装(http://eddylab.org/infernal/)构建。使用具有推断命令‘cmsearch’的协方差模型搜索含有候选物核酸酶的重叠群。
sgRNA设计
修饰从协方差模型和相关CRISPR重复序列获得的预测tracrRNA以产生如下sgRNA(图104A,SEQ ID NO:6031):修剪预测tracrRNA序列的3′端以及重复序列的5′端,并且然后与GAAA四环连接(图104B)。
体外切割反应证实了MG55-43活性并使得能够确定PAM
使用向导进行上文所描述的靶质粒DNA文库切割反应(鉴定推定tracrRNA的体外表征)。将反应的产物用NGS引物通过PCR扩增,并且通过NGS测序以获得PAM。成功切割PAM文库的活性蛋白在琼脂糖凝胶电泳中产生约188或205bp的带(图104C)。
表44:经测试的向导的间隔子序列
代码 | 序列 |
U67间隔子 | GTCGAGGCTTGCGACGTGGT |
U40间隔子 | TGGAGATATCTTGAACCTTG |
使用Seqlogo制备器制备PAM的序列标志,并且由在每个核苷酸位置处映射的读段的计数制作示出切割位点偏好的直方图。MG55-43识别的PAM是5′-yTn序列(图104D,SEQ IDNO:6032),并且优选的切割位置是核苷酸23(图104E)。
实例80-紧凑V型核酸酶的MG91家族
基因间区中编码的tracrRNA序列的重新预测
来自不同进化枝的紧凑V型核酸酶蛋白被靶向用于编码CRISPR Cas系统的基因组区的计算机表征。为了鉴定潜在编码tracrRNA的基因间区,选择单独的蛋白质进化枝(具有经证实的催化残基)用于视觉检查编码紧凑型核酸酶基因和CRISPR阵列的重叠群。缺乏两个基因之间或基因与CRISPR阵列之间的编码序列预测的基因组区被手动注释为基因间区(图105)。来自核酸酶基因上游和下游的基因间区以及CRISPR阵列,即,在相对于核酸酶和对应的CRISPR阵列的相同位置处,跨编码同源核酸酶的重叠群一致地分配标记。比对匹配基因间区的核苷酸序列,并检查跨序列的保守基序(图106)。类似地,比对并检查来自进化枝内非匹配基因间区的核苷酸序列。相比之下,其中具有最高保守程度的基因间区被鉴定为潜在编码tracrRNA。
通过本文所描述的方法鉴定了潜在编码对应于候选物核酸酶的tracrRNA的基因间区(SEQ ID NO:6040-6049),并且是体外表征的主题。本文呈现了活性核酸酶MG91-15(SEQ ID NO:2824)、MG91-32(SEQ ID NO:2841)和MG91-87(SEQ ID NO:2896)的结果。
基因间区次级结构预测通知tracrRNA预测
使用不同的能量模型(Turner 2004或Anderonscu 2007)和参数(例如,20℃、37℃、悬垂端)将潜在编码tracrRNA的基因间区用对应的重复序列折叠。基于碱基对概率视觉检查潜在次级RNA结构的稳定性。获得MG91-15、MG91-32和MG91-87的最佳基因间区/重复序列倍数,并且用于通知单向导RNA的设计。
MG91-15、MG91-32和MG91-87 sgRNA设计
如下修饰潜在含有具有对应重复序列的tracrRNA的基因间区之间的有前途的折叠:将tracrRNA序列在3′端上修剪,并且有时在5′端上修剪,并将重复序列在5′端上修剪。如上文所描述的,两个RNA序列通过GAAA四环连接并折叠用于次级结构预测。对应于核酸酶MG91-15 sgRNA1(SEQ ID NO:6033)、MG91-32 sgRNA1(SEQ ID NO:6034)和MG91-87 sgRNA1(SEQ ID NO:6035)的活性sgRNA的次级结构在图107中示出。
MG91-15、MG91-32和MG91-87核酸酶的体外活性和PAM序列确定
将5nM核酸酶扩增的DNA模板和25nM sgRNA扩增的DNA模板在37℃下用体外蛋白质合成试剂盒(新英格兰生物实验室公司)表达3小时。质粒文库DNA切割反应通过在37℃下混合5nM代表所有可能的8N PAM的靶文库、PURExpress表达的5倍稀释、10nM Tris-HCl、10nM MgCl2和100mM NaCl 2小时来进行。将反应停止并用HighPrepTM PCR清洁珠(MAGBIO基因组公司)清洁,并在Tris EDTA pH 8.0缓冲液中洗脱。将3nM的切割产物端在25℃下用3.33μM dNTP、1X T4 DNA连接酶缓冲液和0.167U/μL的Klenow片段(新英格兰生物实验室公司)钝化15分钟。将1.5nM的切割产物与150nM衔接子、1X T4DNA连接酶缓冲液(新英格兰生物实验室公司)和20U/μL T4 DNA连接酶(新英格兰生物实验室公司)在室温下连接20分钟。将经连接的产物用NGS引物通过PCR扩增,并且通过NGS测序以获得PAM。
成功切割PAM文库的活性蛋白在琼脂糖凝胶中产生约188或205bp的带(图107D)。
使用Seqlogo制备器制备序列标志,并且由在每个核苷酸位置处的读段的计数制作直方图。MG91-15识别的PAM是5′-TtTYn序列(图108A,SEQ ID NO:6037),MG91-32识别的PAM是5′-GnYYn序列(图108B,SEQ ID NO:6038),以及MG-87识别的PAM是5′-wCCC序列(图108C,SEQ ID NO:6039)。优选的切割位置是MG91-15的核苷酸21和22(图108D)、MG91-32的核苷酸17(图108E)和MG91-87的核苷酸20(图108F)。
如上文所描述的构建协方差模型(计算机搜索新的tracrRNA序列,紧凑型MG55-43Cas核酸酶系统)来自活性tracrRNA序列,并且用于细化来自与MG91家族中的核酸酶相关的其它基因间区的tracrRNA的预测。
紧凑V型MG91核酸酶和所选基因间区的体外活性(预测性)
如前所描述的,使用70主混合物试剂盒(Arbor生物科学公司)在转录翻译反应混合物中表达核酸酶、基因间序列和最小阵列。使用TXTL表达在质粒靶DNA文库的体外切割反应中测试核糖核蛋白复合物。将产物用NGS引物通过PCR扩增,并且通过NGS测序以获得PAM序列。
预期成功切割PAM文库的活性蛋白在琼脂糖凝胶电泳中产生约188或205bp的带。序列标志使用Seqlogo制备器制备,并且从每个核苷酸位置处的读段的计数生成直方图。
为了获得活性tracrRNA和crRNA的序列,使用Quick-RNATM微量制备型试剂盒(Zymo研究公司)从TXTL裂解物中提取RNA。在Nanodrop、Tapestation和Qubit上测量转录物的总浓度;并且进行下一代测序。
活性tracrRNA和crRNA的序列用于设计sgRNA,并且随后在PURExpress中用对应的MG91核酸酶测试以确认PAM序列和切割位点。
大肠杆菌表达(紧凑V型核酸酶)(预测性)
将编码效应子的质粒、来自基因组重叠群的基因间序列、天然重复序列和具有T7启动子的通用间隔子序列转化成BL21 DE3或T7表达lysY/Iq,并在37℃下在补充有100μg/mL的氨苄西林(ampicillin)的60mL极品肉汤培养基中培养。在培养物达到0.5的OD600nm后,用0.4mM IPTG诱导表达,并将细胞在16℃下温育过夜。通过离心使25mL的细胞沉淀并重悬于1.5mL的裂解缓冲液(20mM Tris-HCl、500mM NaCl、1mM TCEP、5%甘油、具有Pierce蛋白酶抑制剂(Thermo ScientificTM)的10mM MgCl2pH 7.5)中。然后通过超声处理裂解细胞。通过离心分离上清液和细胞碎片。
经纯化的蛋白(紧凑V型核酸酶)的体外切割效率(预测性)
在T7诱导型启动子下,在大肠杆菌蛋白酶缺陷型B菌株中表达蛋白质,使用超声处理裂解细胞,并且使用HisTrap FF(通用生命科学公司)Ni-NTA亲和色谱法在AKTA AvantFPLC(通用生命科学公司)上纯化所关注的His标记的蛋白质。使用ImageLab软件(伯乐公司)中的密度测定法测定在SDS-PAGE和InstantBlue超高速(西格玛-奥德里奇公司)考马斯染色的丙烯酰胺凝胶(伯乐公司)上解析的蛋白质带的纯度。将蛋白质在由50mM Tris-HCl、300mM NaCl、1mM TCEP、5%甘油组成的储存缓冲液中脱盐;pH 7.5并在-80℃下储存。
构建含有间隔子序列和通过NGS确定的PAM的靶DNA。在PAM中的简并碱基的情况下,选择单个代表性PAM进行测试。靶DNA是通过PCR扩增衍生自质粒的2200bp的线性DNA。PAM和间隔子位于距一端700bp处。成功的切割产生700和1500bp的片段。
将靶DNA、体外转录的单RNA和经纯化的重组蛋白在含有过量蛋白质和RNA的切割缓冲液(10mM Tris、100mM NaCl、10mM MgCl2)中组合,并温育5′至3小时,通常为1小时。将反应通过添加RNA酶A并在60℃下温育来停止。将反应在1.2%TAE琼脂糖凝胶上解析,并且在ImageLab软件中定量切割的靶DNA的级分。
大肠杆菌(紧凑V型核酸酶)中的活性(预测性)
为了测试细菌细胞中的核酸酶活性,用含有具有对所关注的酶具有特异性的对应PAM序列的间隔子靶标的基因组序列构建菌株。然后用所关注的核酸酶转化工程化菌株,并且随后使转化子具有化学能力,并且用50ng的对靶序列(在靶)具有特异性或对靶标(脱靶)不具有特异性的单个向导转化。在热冲击之后,在37℃下在SOC中将转化回收2小时,并且然后通过在诱导培养基上生长的5倍稀释系列来确定核酸酶效率。稀释系列一式三份地定量菌落。通过定量活细胞在存在靶向宿主细胞染色体的向导和核酸酶的情况下的减少来评估核酸酶以及因此基因组编辑能力。
在哺乳动物细胞中的活性(紧凑V型核酸酶)(预测性)
为了示出在哺乳动物细胞中的靶向和切割活性,以及因此基因组编辑潜力,将蛋白质序列克隆到两个哺乳动物表达载体中,一个具有C末端SV40 NLS和2A-GFP标签以及一个没有GFP标签和两个NLS序列(一个在N末端上并且一个在C末端上)。还可以使用的可替代的NLS序列在表45中列出。
表45:可替代的核定位序列(NLS)
蛋白质的DNA序列可以是天然序列、大肠杆菌密码子优化序列或哺乳动物密码子优化序列。具有所关注的基因靶标的单向导RNA序列也克隆到哺乳动物表达载体中。将两个质粒共转染到HEK293T细胞中。在将表达质粒和sgRNA靶向质粒共转染到HEK293T细胞中72小时之后,提取DNA并用于制备NGS文库。在靶位点的测序中通过InDel测量NHEJ百分比,以证明酶在哺乳动物细胞中的靶向效率。选择至少10个不同的靶位点用于测试蛋白质的活性。
表46-序列列表中未包含本文所提及的另外的蛋白质和核酸序列的列表
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
mN:经2′-O甲基修饰的碱基N;fN:经2′-氟修饰的碱基N;*:硫代磷酸酯键;N:标准核糖核苷酸碱基
虽然已经在本文示出并描述了本发明的优选实施例,但是对本领域的普通技术人员而言应该显而易见是此类实施例仅以举例方式提供。本发明不旨在受说明书中提供的具体实施例的限制。虽然已参考前述说明书描述本发明,但本文实施例的描述和说明不打算以限制性意义进行。在不脱离本发明的情况下,所属领域的技术人员现在将意识到许多变型、变化和替代物。此外,应当理解,本发明的全部方面不限于本文所阐述的具体描述、配置或相对比例,其取决于各种条件和变量。应理解,本文所描述的本发明的实施例的各个替代方案都可以用于实践本发明。因此,经考虑本发明应同样涵盖任何这类替代方案、修改、变型或等效物。所附权利要求书旨在限定本发明的范围,并且由此覆盖这些权利要求和其等效物的范围内的方法和结构。
实施例
以下实施例不旨在以任何方式进行限制。
1.一种工程化核酸酶系统,其包括:
(a)核酸内切酶,所述核酸内切酶包括RuvC结构域,其中所述核酸内切酶衍生自未培养的微生物,并且其中所述核酸内切酶是Cas12a核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列。
2.一种工程化核酸酶系统,其包括:
(a)核酸内切酶,所述核酸内切酶与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列。
3.一种工程化核酸酶系统,其包括:
(a)核酸内切酶,所述核酸内切酶被配置成与包括SEQ ID NO:3862-3913中的任一者的原间隔子相邻基序(PAM)序列结合,其中所述核酸内切酶是2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列。
4.根据实施例1至3中任一项所述的工程化核酸酶系统,其中所述核酸内切酶进一步包括锌指状结构域。
5.根据实施例1至4中任一项所述的工程化核酸酶系统,其中所述向导RNA包括与SEQ ID NO:3471、3539、3551-355MG11、MG13、MG19、MG20、MG26、MG28、MG29、MG30、MG31、MG32、MG37、9、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列。
6.一种工程化核酸酶系统,其包括:
(a)工程化向导RNA,所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735和3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列,以及
(b)2类V型Cas核酸内切酶,所述2类V型Cas核酸内切酶被配置成与所述工程化向导RNA结合。
7.根据实施例1至6中任一项所述的工程化核酸酶系统,其中所述核酸内切酶被配置成与包括SEQ ID NO:3863-3913中的任一者的原间隔子相邻基序(PAM)序列结合。
8.根据实施例1至7中任一项所述的工程化核酸酶系统,其中所述向导RNA包括与真核生物、真菌、植物、哺乳动物或人基因组多核苷酸序列互补的序列。
9.根据实施例1至8中任一项所述的工程化核酸酶系统,其中所述向导RNA的长度为30-250个核苷酸。
10.根据实施例1至9中任一项所述的工程化核酸酶系统,其中所述核酸内切酶包括邻近所述核酸内切酶的N末端或C末端的一个或多个核定位序列(NLS)。
11.根据实施例1至10中任一项所述的工程化核酸酶系统,其中所述NLS包括与来自由SEQ ID NO:3938-3953组成的组的序列至少80%相同的序列。
12.根据实施例1至10中任一项所述的工程化核酸酶系统,其中所述核酸内切酶包括以下突变中的至少一个突变:当所述核酸内切酶的序列与SEQ ID NO:215最佳比对时,S168R、E172R、N577R或Y170R。
13.根据实施例1至10中任一项所述的工程化核酸酶系统,当所述核酸内切酶的序列与SEQ ID NO:215最佳比对时,所述核酸内切酶包括所述突变S168R和E172R。
14.根据实施例1至10中任一项所述的工程化核酸酶系统,当所述核酸内切酶的序列与SEQ ID NO:215最佳比对时,所述核酸内切酶包括所述突变N577R或Y170R。
15.根据实施例1至10中任一项所述的工程化核酸酶系统,当所述核酸内切酶的序列与SEQ ID NO:215最佳比对时,所述核酸内切酶包括所述突变S168R。
16.根据实施例15所述的工程化核酸酶系统,其中所述核酸内切酶不包括E172、N577或Y170的突变。
17.根据实施例1至16中任一项所述的工程化核酸酶系统,其进一步包括
单链或双链DNA修复模板,所述单链或双链DNA修复模板从5′至3′包括:第一同源臂,所述第一同源臂包括位于靶脱氧核糖核酸序列的5′的至少20个核苷酸的序列;至少10个核苷酸的合成DNA序列;以及第二同源臂,所述第二同源臂包括位于靶序列的3′的至少20个核苷酸的序列。
18.根据实施例17所述的工程化核酸酶系统,其中所述第一同源臂或所述第二同源臂包括至少40个、80个、120个、150个、200个、300个、500个或1,000个核苷酸的序列。
19.根据实施例12至18中任一项所述的工程化核酸酶系统,其中所述第一同源臂或所述第二同源臂与原核生物、细菌、真菌或真核生物的基因组序列同源。
20.根据实施例12至19所述的工程化核酸酶系统,其中所述单链或双链DNA修复模板包括转基因供体。
21.根据实施例1至20中任一项所述的工程化核酸酶系统,其进一步包括包含侧接一个或两个单链DNA区段的双链DNA区段的DNA修复模板。
22.根据实施例21所述的工程化核酸酶系统,其中单链DNA区段与所述双链DNA区段的5′端缀合。
23.根据实施例21所述的工程化核酸酶系统,其中所述单链DNA区段与所述双链DNA区段的3′端缀合。
24.根据实施例21至23中任一项所述的工程化核酸酶系统,其中所述单链DNA区段的长度为4至10个核苷酸碱基。
25.根据实施例21至24中任一项所述的工程化核酸酶系统,其中所述单链DNA区段具有与所述间隔子序列内的序列互补的核苷酸序列。
26.根据实施例21至25中任一项所述的工程化核酸酶系统,其中所述双链DNA序列包括条形码、开放阅读框、增强子、启动子、蛋白质编码序列、miRNA编码序列、RNA编码序列或转基因。
27.根据实施例21至25中任一项所述的工程化核酸酶系统,其中所述双链DNA序列侧接核酸酶切割位点。
28.根据实施例27所述的工程化核酸酶系统,其中所述核酸酶切割位点包括间隔子和PAM序列。
29.根据实施例1至28中任一项所述的工程化核酸酶系统,其中所述系统进一步包括Mg2+的来源。
30.根据实施例1至29中任一项所述的工程化核酸酶系统,其中所述向导RNA包括包含至少8个、至少10个或至少12个碱基配对的核糖核苷酸的发夹。
31.根据实施例30所述的工程化核酸酶系统,其中所述发夹包括10个碱基配对的核糖核苷酸
32.根据实施例1至31中任一项所述的工程化核酸酶系统,其中:
a)所述核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体至少75%、80%或90%相同的序列;以及
b)所述向导RNA结构包括与SEQ ID NO:3608-3609、3853或3851-3857中的任一者的非简并核苷酸至少80%或90%相同的序列。
33.根据实施例1至32中任一项所述的工程化核酸酶系统,其中所述核酸内切酶被配置成与包括SEQ ID NO:3863-3913中的任一者的PAM结合。
34.根据实施例1至32中任一项所述的工程化核酸酶系统,其中所述核酸内切酶被配置成与包括SEQ ID NO:3871的PAM结合。
35.根据实施例5至34中任一项所述的工程化核酸酶系统,其中所述序列同一性是通过BLASTP、CLUSTALW、MUSCLE、MAFFT算法或CLUSTALW算法使用史密斯-沃特曼同源性搜索算法参数来确定的。
36.根据实施例35所述的工程化核酸酶系统,其中所述序列同一性是通过所述BLASTP同源性搜索算法使用字长(W)为3、期望值(E)为10的参数以及BLOSUM62评分矩阵将空位罚分设置为存在为11,扩展为1并且使用条件组成评分矩阵调整来确定的。
37.一种工程化向导RNA,其包括:
a)DNA靶向区段,所述DNA靶向区段包括与靶DNA分子中的靶序列互补的核苷酸序列;以及
b)蛋白质结合区段,所述蛋白质结合区段包括杂交以形成双链RNA(dsRNA)双链体的两个互补核苷酸延伸段,
其中所述两个互补核苷酸延伸段与中间核苷酸彼此共价连接,并且
其中所述工程化向导核糖核酸多核苷酸能够与核酸内切酶形成与SEQ ID NO:1-3470中的任一者具有至少75%序列同一性的复合物,并且将所述复合物靶向所述靶DNA分子的所述靶序列。
38.根据实施例37所述的工程化向导核糖核酸多核苷酸,其中所述DNA靶向区段位于所述两个互补核苷酸延伸段中的两个互补核苷酸延伸段的3′处。
39.根据实施例37至38所述的工程化向导核糖核酸多核苷酸,其中所述蛋白质结合区段蛋白质结合区段包括与SEQ ID NO:3608-3609的非简并核苷酸具有至少70%、至少80%或至少90%同一性的序列。
40.根据实施例37至39中任一项所述的工程化向导核糖核酸多核苷酸,其中所述双链RNA(dsRNA)双链体包括至少5个、至少8个、至少10个或至少12个核糖核苷酸。
41.一种脱氧核糖核酸多核苷酸,其编码根据实施例1至40中任一项所述的工程化向导核糖核酸多核苷酸。
42.一种核酸,其包括为在生物体中表达而优化的工程化核酸序列,其中所述核酸编码2类V型Cas核酸内切酶,并且其中所述核酸内切酶衍生自未培养的微生物,其中所述生物体不是所述未培养的生物体。
43.根据实施例42所述的核酸,其中所述核酸内切酶包括与SEQ ID NO:1-3470中的任一者具有至少70%或至少80%序列同一性的变体。
44.根据实施例42或43所述的核酸,其中所述核酸内切酶包括编码邻近所述核酸内切酶的N末端或C末端的一个或多个核定位序列(NLS)的序列。
45.根据实施例44所述的核酸,其中所述NLS包括选自SEQ ID NO:3938-3953的序列。
46.根据实施例44或45所述的核酸,其中所述NLS包括SEQ ID NO:3939。
47.根据实施例46所述的核酸,其中所述NLS邻近所述核酸内切酶的所述N末端。
48.根据实施例44或45所述的核酸,其中所述NLS包括SEQ ID NO:3938。
49.根据实施例48所述的核酸,其中所述NLS邻近所述核酸内切酶的所述C末端。
50.根据实施例42至49中任一项所述的核酸,其中所述生物体是原核生物、细菌、真核生物、真菌、植物、哺乳动物、啮齿动物或人。
51.一种工程化载体,其包括编码2类V型Cas核酸内切酶的核酸序列,其中所述核酸内切酶衍生自未培养的微生物。
52.一种工程化载体,其包括根据实施例42至46中任一项所述的核酸。
53.一种工程化载体,其包括根据实施例41所述的脱氧核糖核酸多核苷酸。
54.根据实施例51至53中任一项所述的工程化载体,其中所述载体是质粒、微环、CELiD、腺相关病毒(AAV)源性病毒体、慢病毒或腺病毒。
55.一种细胞,其包括根据实施例51至54中任一项所述的载体。
56.一种产生核酸内切酶的方法,所述方法包括培养根据实施例55所述的所述细胞。
57.一种用于结合、切割、标记或修饰双链脱氧核糖核酸多核苷酸的方法,所述方法包括:
(a)使所述双链脱氧核糖核酸多核苷酸和与被配置成与所述核酸内切酶和所述双链脱氧核糖核酸多核苷酸结合的工程化向导RNA构复合的2类V型Cas核酸内切酶接触;
其中所述双链脱氧核糖核酸多核苷酸包括原间隔子相邻基序(PAM);并且
其中所述PAM包括包含SEQ ID NO:3863-3913中的任一者的序列。
58.根据实施例57所述的方法,其中所述双链脱氧核糖核酸多核苷酸包括第一链和第二链,所述第一链包括与所述工程化向导RNA的序列互补的序列,并且所述第二链包括所述PAM。
59.根据实施例58所述的方法,其中所述PAM直接邻近与所述工程化向导RNA的所述序列互补的序列的5′端。
60.根据实施例57至59中任一项所述的方法,其中所述PAM包括SEQ ID NO:3871。
61.根据实施例57至60中任一项所述的方法,其中所述2类V型Cas核酸内切酶衍生自未培养的微生物。
62.根据实施例57至61中任一项所述的方法,其中所述双链脱氧核糖核酸多核苷酸是真核生物、植物、真菌、哺乳动物、啮齿动物或人双链脱氧核糖核酸多核苷酸。
63.一种修饰靶核酸基因座的方法,所述方法包括向所述靶核酸基因座递送根据实施例1至36中任一项所述的所述工程化核酸酶系统,其中所述核酸内切酶被配置成与所述工程化向导核糖核酸结构形成复合物,并且其中所述复合物被配置成使得在所述复合物与所述靶核酸基因座结合时,所述复合物修饰所述靶核酸基因座。
64.根据实施例63所述的方法,其中修饰所述靶核酸基因座包括结合、切开、切割或标记所述靶核酸基因座。
65.根据实施例63或64所述的方法,其中所述靶核酸基因座包括脱氧核糖核酸(DNA)或核糖核酸(RNA)。
66.根据实施例63所述的方法,其中所述靶核酸包括基因组DNA、病毒DNA、病毒RNA或细菌DNA。
67.根据实施例63至66中任一项所述的方法,其中所述靶核酸基因座在体外。
68.根据实施例63至66中任一项所述的方法,其中所述靶核酸基因座在细胞内。
69.根据实施例68所述的方法,其中所述细胞是原核细胞、细菌细胞、真核细胞、真菌细胞、植物细胞、动物细胞、哺乳动物细胞、啮齿动物细胞、灵长类动物细胞、人细胞或原代细胞。
70.根据实施例68或69所述的方法,其中所述细胞是原代细胞。
71.根据实施例70所述的方法,其中所述原代细胞是T细胞。
72.根据实施例70所述的方法,其中所述原代细胞是造血干细胞(HSC)。
73.根据实施例63至72中的任一项所述的方法,其中将所述工程化核酸酶系统递送到所述靶核酸基因座包括递送根据实施例42至46中任一项所述的核酸或根据实施例51至54中任一项所述的载体。
74.根据实施例63至73中的任一项所述的方法,其中将所述工程化核酸酶系统递送到所述靶核酸基因座包括递送包括编码所述核酸内切酶的开放阅读框的核酸。
75.根据实施例74所述的方法,其中所述核酸包括编码所述核酸内切酶的所述开放阅读框可操作地连接的启动子。
76.根据实施例63至75中的任一项所述的方法,其中将所述工程化核酸酶系统递送到所述靶核酸基因座包括递送含有编码所述核酸内切酶的所述开放阅读框的封端mRNA。
77.根据实施例63至76中的任一项所述的方法,其中将所述工程化核酸酶系统递送到所述靶核酸基因座包括递送翻译的多肽。
78.根据实施例63至76中的任一项所述的方法,其中将所述工程化核酸酶系统递送到所述靶核酸基因座包括递送编码与核糖核酸(RNA)pol III启动子可操作地连接的所述工程化向导RNA的脱氧核糖核酸(DNA)。
79.根据实施例63至78中的任一项所述的方法,其中所述核酸内切酶在所述靶基因座处或附近诱导单链断裂或双链断裂。
80.根据实施例79所述的方法,其中所述核酸内切酶诱导所述靶基因座内或与位于所述靶基因座3′处的交错的单链断裂。
81.一种编辑细胞中的TRAC基因座的方法,所述方法包括使以下与所述细胞接触:
(a)RNA向导的核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述TRAC基因座的区杂交的间隔子序列,
其中所述工程化向导RNA包括与SEQ ID NO:4316-4369中的任一者的至少18个连续核苷酸具有至少85%的同一性的靶向序列。
82.根据实施例81所述的方法,其中所述RNA向导的核酸酶是Cas核酸内切酶。
83.根据实施例82所述的方法,其中所述Cas核酸内切酶是2类V型Cas核酸内切酶。
84.根据实施例83所述的方法,其中所述2类V型Cas核酸内切酶包括包含RuvCI子结构域、RuvCII子结构域和RuvCIII子结构域的RuvC结构域。
85.根据实施例83或84所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ IDNO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
86.根据实施例81至85中任一项所述的方法,其中所述工程化向导RNA进一步包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735和3851-3857中的任一者的非简并核苷酸中的至少19个非简并核苷酸具有至少80%序列同一性的序列。
87.根据实施例81至85中任一项所述的方法,其中所述核酸内切酶包括与SEQ IDNO:141、215、229、261或1711-1721中的任一者或其变体至少75%、80%或90%相同的序列。
88.根据实施例87所述的方法,其中所述向导RNA结构包括与SEQ ID NO:3608-3609、3853或3851-3857中的任一者的非简并核苷酸中的至少19个非简并核苷酸至少80%或至少90%相同的序列。
89.根据实施例81至88中任一项所述的方法,其中所述方法进一步包括与所述细胞接触或向所述细胞中引入供体核酸,所述供体核酸包括侧接于3′或5′端上的与SEQ IDNO:4424或4425中的任一者具有至少80%同一性的序列的货物序列。
90.根据实施例81至89中任一项所述的方法,其中所述细胞是外周血单核细胞(PBMC)。
91.根据实施例81至89中任一项所述的方法,其中所述细胞是T细胞或其前体或造血干细胞(HSC)。
92.根据实施例89至91中任一项所述的方法,其中所述货物序列包括编码T细胞受体多肽、CAR-T多肽或其片段或衍生物的序列。
93.根据实施例81至92中任一项所述的方法,其中所述工程化向导RNA包括与SEQID NO:4370-4423中的任一者具有至少80%同一性的序列。
94.根据实施例93所述的方法,其中所述工程化向导RNA包括来自表5A的包括表5A中列出的对应化学修饰的sgRNA 1-54的核苷酸序列。
95.根据实施例81至93中任一项所述的方法,其中所述工程化向导RNA包括与SEQID NO:4334、4350或4324中的任一者具有至少80%序列同一性的靶向序列。
96.根据实施例81至93中任一项所述的方法,其中所述工程化向导RNA包括与SEQID NO:4388、4404或4378中的任一者具有至少80%序列同一性的序列。
97.根据实施例96所述的方法,其中所述工程化向导RNA包括来自表5A的sgRNA 9、35或19的核苷酸序列。
98.一种工程化核酸酶系统,其包括:
(a)RNA向导的核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列,
其中所述工程化向导RNA包括以下修饰中的至少一个修饰:
(i)所述工程化向导RNA的5′端的前4个碱基内或所述工程化向导RNA的3′端的最后4个碱基内的至少一个核苷酸的2′-O甲基或2′-氟碱基修饰;
(ii)所述工程化向导RNA的5′端的前五个碱基中的至少2个碱基之间的硫代磷酸酯(PS)键,或所述工程化向导RNA的3′端的最后五个碱基中的至少两个碱基之间的硫代磷酸酯键;
(iii)所述工程化向导RNA的3′茎或5′茎内的硫代磷酸酯键;
(iv)所述工程化向导RNA的3′茎或5′茎内的2′-O甲基或2′碱基修饰;
(v)所述工程化向导RNA的间隔子区的至少7个碱基的2′-氟碱基修饰;以及
(vi)所述工程化向导RNA的环区内的硫代磷酸酯键。
99.根据实施例98所述的系统,其中所述工程化向导RNA包括所述工程化向导RNA的5′端的前5个碱基或所述工程化向导RNA的3′端的最后5个碱基内的至少一个核苷酸的2′-O甲基或2′-氟碱基修饰。
100.根据实施例98所述的系统,其中所述工程化向导RNA包括在所述工程化向导RNA的5′端或所述工程化向导RNA的3′端处的2′-O甲基或2′-氟碱基修饰。
101.根据实施例98至100中任一项所述的系统,其中所述工程化向导RNA包括所述工程化向导RNA的5′端的前五个碱基中的至少2个碱基之间的硫代磷酸酯(PS)键,或所述工程化向导RNA的3′端的最后五个碱基中的至少两个碱基之间的硫代磷酸酯键。
102.根据实施例98至101中任一项所述的系统,其中所述工程化向导RNA包括所述工程化向导RNA的3′茎或5′茎内的硫代磷酸酯键。
103.根据实施例98至102中任一项所述的系统,其中所述工程化向导RNA包括所述工程化向导RNA的3′茎或5′茎内的2′-O甲基碱基修饰。
104.根据实施例98至103中任一项所述的系统,其中所述工程化向导RNA包括所述工程化向导RNA的间隔子区的至少7个碱基的2′-氟碱基修饰。
105.根据实施例98至104中任一项所述的系统,其中所述工程化向导RNA包括所述工程化向导RNA的环区内的硫代磷酸酯键。
106.根据实施例98至105中任一项所述的系统,其中所述工程化向导RNA包括在所述工程化向导RNA的所述5′端处的至少三个2′-O甲基或2′-氟碱基、所述工程化向导RNA的所述5′端的前3个碱基之间的两个硫代磷酸酯键、在所述工程化向导RNA的所述4′端处的至少4个2′-O甲基或2′-氟碱基,以及所述工程化向导RNA的所述3′端的最后三个碱基之间的三个硫代磷酸酯键。
107.根据实施例98所述的系统,其中所述工程化向导RNA包括在所述工程化向导RNA的5′端处的至少两个2′-O-甲基碱基和至少两个硫代磷酸酯键,以及在所述工程化向导RNA的3′端处的至少一个2′-O-甲基碱基和至少一个硫代磷酸酯键。
108.根据实施例107所述的系统,其中所述工程化向导RNA包括在所述工程化向导RNA的所述3′茎区或所述5′茎区两者中的至少一个2′-O-甲基碱基。
109.根据实施例107或108所述的系统,其中所述工程化向导RNA包括所述间隔子区中的至少一个至至少十四个2′-氟碱基,不包括所述工程化向导RNA的种子区。
110.根据实施例107所述的系统,其中所述工程化向导RNA包括在所述工程化向导RNA的所述5′茎区中的至少一个2′-O-甲基碱基和所述间隔子区中的至少一个至至少十四个2′-氟碱基,不包括所述向导RNA的种子区。
111.根据实施例98至110中任一项所述的系统,其中所述向导RNA包括靶向VEGF-A基因的间隔子序列。
112.根据实施例111所述的系统,其中所述向导RNA包括与SEQ ID NO:3985具有至少80%同一性的间隔子序列。
113.根据实施例111所述的系统,其中所述向导RNA包括来自表7的包括表7中列出的化学修饰的向导RNA 1-7的核苷酸。
114.根据实施例98至113中任一项所述的方法,其中所述RNA向导的核酸酶是Cas核酸内切酶。
115.根据实施例114所述的方法,其中所述Cas核酸内切酶是2类V型Cas核酸内切酶。
116.根据实施例115所述的方法,其中所述2类V型Cas核酸内切酶包括包含RuvCI子结构域、RuvCII子结构域和RuvCIII子结构域的RuvC结构域。
117.根据实施例115至116中任一项所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
118.根据实施例115至116中任一项所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
119.根据实施例114至118中任一项所述的方法,其中所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735和3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列。
120.根据实施例111至118中任一项所述的方法,其中所述工程化向导RNA包括与SEQ ID NO:3608-3609、3853或3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列。
121.一种宿主细胞,其包括编码与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的异源性核酸内切酶的开放阅读框。
122.根据实施例121所述的宿主细胞,其中所述核酸内切酶与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体具有至少75%序列同一性。
123.根据实施例121至122中任一项所述的宿主细胞,其中所述宿主细胞是大肠杆菌细胞。
124.根据实施例123所述的宿主细胞,其中所述大肠杆菌细胞是λDE3溶素原,或者所述大肠杆菌细胞是BL21(DE3)菌株。
125.根据实施例109至110中任一项所述的宿主细胞,其中所述大肠杆菌细胞具有ompT lon基因型。
126.根据实施例121至125中任一项所述的宿主细胞,其中所述开放阅读框与以下可操作地连接:T7启动子序列、T7-lac启动子序列、lac启动子序列、tac启动子序列、trc启动子序列、ParaBAD启动子序列、PrhaBAD启动子序列、T5启动子序列、cspA启动子序列、araPBAD启动子、来自噬菌体λ的强向左启动子(pL启动子)或其任何组合。
127.根据实施例121至126中任一项所述的宿主细胞,其中所述开放阅读框包括编码使用相同读框与编码所述核酸内切酶的序列连接的亲和标签的序列。
128.根据实施例127所述的方法,其中所述亲和标签是固定化金属亲和色谱法(IMAC)标签。
129.根据实施例128所述的方法,其中所述IMAC标签是聚组氨酸标签。
130.根据实施例127所述的方法,其中所述亲和标签是myc标签、人流感血凝素(HA)标签、麦芽糖结合蛋白(MBP)标签、谷胱甘肽S-转移酶(GST)标签、链霉亲和素标签、FLAG标签或其任何组合。
131.根据实施例127至130中任一项所述的宿主细胞,其中所述亲和标签通过编码蛋白酶切割位点的接头序列使用相同读框与编码所述核酸内切酶的所述序列连接。
132.根据实施例131所述的宿主细胞,其中所述蛋白酶切割位点是烟草蚀纹病毒(TEV)蛋白酶切割位点、蛋白酶切割位点、凝血酶切割位点、因子Xa切割位点、肠激酶切割位点或其任何组合。
133.根据实施例121至132中任一项所述的宿主细胞,其中所述开放阅读框经密码子优化以在所述宿主细胞中表达。
134.根据实施例121至133中任一项所述的宿主细胞,其中所述开放阅读框在载体上提供。
135.根据实施例121至133中任一项所述的宿主细胞,其中所述开放阅读框被整合到所述宿主细胞的基因组中。
136.一种培养物,其包括在相容性液体培养基中根据实施例121至135中任一项所述的宿主细胞。
137.一种产生核酸内切酶的方法,所述方法包括在相容性生长培养基中培养根据实施例121至135中任一项所述的宿主细胞。
138.根据实施例137所述的方法,其进一步包括通过添加另外的化学剂或增加量的营养物来诱导所述核酸内切酶的表达。
139.根据实施例138所述的方法,其中另外的化学剂或增加量的营养物包括异丙基β-D-1-硫代半乳糖苷(IPTG)或另外量的乳糖。
140.根据实施例137至139中任一项所述的方法,其进一步包括在所述培养之后分离所述宿主细胞,并且裂解所述宿主细胞以产生蛋白提取物。
141.根据实施例140所述的方法,其进一步包括使所述蛋白提取物经受IMAC或离子亲和色谱法。
142.根据实施例141所述的方法,其中所述开放阅读框包括编码使用相同读框与编码所述核酸内切酶的序列连接的IMAC亲和标签的序列。
143.根据实施例142所述的方法,其中所述IMAC亲和标签通过编码蛋白酶切割位点的接头序列使用相同读框与编码所述核酸内切酶的所述序列连接。
144.根据实施例143所述的方法,其中所述蛋白酶切割位点包括烟草蚀纹病毒(TEV)蛋白酶切割位点、蛋白酶切割位点、凝血酶切割位点、因子Xa切割位点、肠激酶切割位点或其任何组合。
145.根据实施例143至144中任一项所述的方法,其进一步包括通过使对应于所述蛋白酶切割位点的蛋白酶与所述核酸内切酶接触来切割所述IMAC亲和标签。
146.根据实施例145所述的方法,其进一步包括执行减材IMAC亲和色谱法以从包括所述核酸内切酶的组合物去除所述亲和标签。
147.一种系统,其包括
(a)2类V-A型Cas核酸内切酶,所述2类V-A型Cas核酸内切酶被配置成结合3核苷酸或4核苷酸PAM序列,其中所述核酸内切酶相对于sMbCas12a具有增加的切割活性;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述2类V-A型Cas核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与包括靶核酸序列的靶核酸杂交的间隔子序列。
148.根据实施例147所述的系统,其中通过将所述核酸内切酶连同相容性向导RNA一起引入包括所述靶核酸的细胞并检测所述细胞中所述靶核酸序列的切割来体外测量所述切割活性。
149.根据实施例147至148中任一项所述的系统,其中所述2类V-A型Cas核酸内切酶包括与215-225中的任一者或其变体具有至少75%同一性的序列。
150.根据实施例149所述的系统,其中所述工程化向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%同一性的序列。
151.根据实施例149至150中任一项所述的系统,其中所述靶核酸进一步包括邻近所述靶核酸序列的YYN PAM序列。
152.根据实施例147至151中任一项所述的系统,其中所述2类V-A型Cas核酸内切酶相对于sMbCas12a具有至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或200%或更多增加的活性。
153.一种系统,其包括:
(a)2类V-A′型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA包括与2类V型Cas核酸内切酶的天然效应子重复序列的约19至约25个或约19至约31个连续核苷酸具有至少80%同一性的序列。
154.根据实施例153所述的系统,其中所述天然效应子重复序列是SEQ ID NO:3560-3572中的任一者。
155.根据实施例153至154中任一项所述的系统,其中所述2类V-A′型Cas核酸内切酶与SEQ ID NO:126具有至少75%同一性。
156.一种破坏细胞中的VEGF-A基因座的方法,所述方法包括向所述细胞中引入:
(b)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述VEGF-A基因座的区杂交的间隔子序列,
其中所述工程化向导RNA包括与SEQ ID NO:3985具有至少80%同一性的靶向序列;或
其中所述工程化向导RNA包括来自表7的向导RNA 1-7中的任一者的核苷酸序列。
157.根据实施例156所述的系统,其中所述2类V型Cas核酸内切酶包括与SEQ IDNO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
158.根据实施例156至157中任一项所述的系统,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1721中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
159.根据实施例156至158中任一项所述的系统,其中所述工程化向导RNA包括与SEQ ID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735和3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列。
160.根据实施例156至158中任一项所述的系统,其中所述工程化向导RNA包括与SEQ ID NO:3608-3609、3853或3851-3857中的任一者的非简并核苷酸具有至少80%序列同一性的序列。
161.一种破坏细胞中的基因座的方法,所述方法包括使所述细胞与包括以下的组合物接触:
(a)2类V型Cas核酸内切酶,所述2类V型Cas核酸内切酶与SEQ ID NO:215-225中的任一者或其变体具有至少75%同一性;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述基因座的区杂交的间隔子序列,
其中所述2类V型Cas核酸内切酶具有与所述细胞中的spCas9至少等效的切割活性。
162.根据实施例161所述的方法,其中通过将所述核酸内切酶连同相容性向导RNA一起引入包括所述靶核酸的细胞并检测所述细胞中所述靶核酸序列的切割来体外测量所述切割活性。
163.根据实施例161至162中任一项所述的方法,其中所述组合物包括20pmole或更少的所述2类V型Cas核酸内切酶。
164.根据实施例163所述的方法,其中所述组合物包括1pmol或更少的所述2类V型Cas核酸内切酶。
Claims (160)
1.一种破坏细胞中的CD38基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述CD38基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4466-4503和5686中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:4428-4465和5685中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
2.根据权利要求1所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
3.根据权利要求1所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
4.根据权利要求1至3中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
5.根据权利要求1至4中任一项所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
6.根据权利要求1至5中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4466、4467、4468、4479、4484、4490、4492、4493、4495、4498中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
7.根据权利要求1至6中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:4428、4429、4430、4436、4441、4446、4452、4454、4455、4460或4461中的任一者具有至少80%同一性的核苷酸序列。
8.根据权利要求1至7中任一项所述的方法,其中所述细胞是真核细胞、T细胞、造血干细胞或其前体。
9.一种破坏细胞中的TIGIT基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述TIGIT基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4521-4537中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:4504-4520中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
10.根据权利要求9所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
11.根据权利要求9所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
12.根据权利要求9至11中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
13.根据权利要求9至12中任一项所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
14.根据权利要求9至13中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4521、4527、4528、4535或4536中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
15.根据权利要求9至13中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:4504、4510、4511、4518或4519中的任一者具有至少80%同一性的核苷酸序列。
16.根据权利要求9至15中任一项所述的方法,其中所述细胞是真核细胞、T细胞、造血干细胞或其前体。
17.一种破坏细胞中的AAVS1基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述AAVS1基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4569-4599中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:4538-4568中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
18.根据权利要求17所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
19.根据权利要求18所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
20.根据权利要求17至19中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857、6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
21.根据权利要求17至20中任一项所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
22.根据权利要求17至21中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4574、4577、4578、4579、4582、4584、4585、4586、4587、4589、4590、4591、4592、4593、4595、4596或4598中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
23.根据权利要求17至21中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:4543、4546、4547、4548、4551、4553、4554、4555、4556、4558、4559、4560、4561、4562、4565或4567中的任一者具有至少80%同一性的核苷酸序列。
24.根据权利要求17至23中任一项所述的方法,其中所述细胞是真核细胞、T细胞、造血干细胞、肝细胞或其前体。
25.一种破坏细胞中的B2M基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述B2M基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4676-4751中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:4600-4675中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
26.根据权利要求25所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
27.根据权利要求26所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
28.根据权利要求25至27中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
29.根据权利要求25至28中任一项所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
30.根据权利要求25至29中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4676、4678-4687、4690、4692、4698-4707、4720-4723、4725-4726、4732-4733、4736-4737、4741或4750-4751中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
31.根据权利要求25至30中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:4600、4602-4611、4614、4616、4622-4631、4644-4647、4649-4650、4656-4657、4660-4661、4665或4674-4675中的任一者具有至少80%同一性的核苷酸序列。
32.根据权利要求25至31中任一项所述的方法,其中所述细胞是真核细胞、T细胞、造血干细胞或其前体。
33.一种破坏细胞中的CD2基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述CD2基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4837-4921中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:4752-4836中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
34.根据权利要求33所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
35.根据权利要求34所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
36.根据权利要求33至35中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
37.根据权利要求36所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
38.根据权利要求33至37中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4837、4844、4845、4848、4857-4858、4883、4887、4892-4893、4904-4909、4914、4916或4918中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
39.根据权利要求38所述的方法,其中所述工程化向导RNA与来自表14E的靶向SEQ IDNO:4837、4844、4845、4848、4857-4858、4883、4887、4892-4893、4904-4909、4914、4916或4918中的任一者的向导RNA中的任一者具有至少80%序列同一性。
40.根据权利要求33至39中任一项所述的方法,其中所述细胞是真核细胞、T细胞、造血干细胞或其前体。
41.一种破坏细胞中的CD5基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述CD5基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4946-4969中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:4922-4945中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
42.根据权利要求41所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
43.根据权利要求42所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
44.根据权利要求41至43中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857和6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
45.根据权利要求44所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
46.根据权利要求41至45中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:4946-4947、4949、4951、4957-4960、4963、4967或4969中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
47.根据权利要求41至45中任一项所述的方法,其中所述工程化向导RNA与来自表14F的靶向SEQ ID NO:4946-4947、4949、4951、4957-4960、4963、4967或4969中的任一者的向导RNA中的任一者具有至少80%序列同一性。
48.根据权利要求41至47中任一项所述的方法,其中所述细胞是真核细胞、T细胞、造血干细胞或其前体。
49.一种破坏细胞中的小鼠TRAC基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述小鼠TRAC基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5126-5195、5682或5684中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:5056-5125、5681或5683中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
50.根据权利要求49所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
51.根据权利要求50所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
52.根据权利要求49至51中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
53.根据权利要求52所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
54.根据权利要求49至53中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5126-5130、5133-5143、5147-5150、5172-5173、5184-5189或5192-5194中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
55.根据权利要求49至53中任一项所述的方法,其中所述工程化向导RNA与来自表14G的靶向SEQ ID NO:5126-5130、5133-5143、5147-5150、5172-5173、5184-5189或5192-5194中的任一者的向导RNA中的任一者具有至少80%序列同一性。
56.根据权利要求49至55中任一项所述的方法,其中所述细胞是真核细胞、T细胞、造血干细胞或其前体。
57.一种破坏细胞中的小鼠TRBC1或TRBC2基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述小鼠TRBC1或TRBC2基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5211-5225或5247-5267中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:5196-5210或5226-5246中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
58.根据权利要求57所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
59.根据权利要求58所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
60.根据权利要求57至59中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3677-3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
61.根据权利要求57至60中任一项所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
62.根据权利要求57至61中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5211、5213-5215、5217、5221、5223、5247、5249-5250、5252-5253、5258-5259或5264中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
63.根据权利要求57至61中任一项所述的方法,其中所述工程化向导RNA与来自表14H的靶向SEQ ID NO:5211、5213-5215、5217、5221、5223、5247、5249-5250、5252-5253、5258-5259或5264中的任一者的向导RNA中的任一者具有至少80%序列同一性。
64.根据权利要求57至63中任一项所述的方法,其中所述细胞是真核细胞、T细胞、造血干细胞或其前体。
65.一种破坏细胞中的人TRBC1或TRBC2基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述人TRBC1或TRBC2基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5661-5679中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:5642-5660中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
66.根据权利要求65所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
67.根据权利要求66所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
68.根据权利要求65至67中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
69.根据权利要求65至68中任一项所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
70.根据权利要求65至69中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5661-5663、5672-5675或5678中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
71.根据权利要求65至69中任一项所述的方法,其中所述工程化向导RNA与来自表14I的靶向SEQ ID NO:5661-5663、5672-5675或5678中的任一者的向导RNA中的任一者具有至少80%序列同一性。
72.根据权利要求65至71中任一项所述的方法,其中所述细胞是真核细胞、T细胞、造血干细胞或其前体。
73.一种破坏细胞中的HPRT基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述HPRT基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5562-5641中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:5482-5561中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
74.根据权利要求73所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
75.根据权利要求74所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
76.根据权利要求73至75中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
77.根据权利要求73至76中任一项所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
78.根据权利要求73至77中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5562-5564或5568中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
79.根据权利要求73至77中任一项所述的方法,其中所述工程化向导RNA与来自表14J的靶向SEQ ID NO:5562-5564或5568中的任一者的向导RNA中的任一者具有至少80%序列同一性。
80.根据权利要求73至80中任一项所述的方法,其中所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
81.一种破坏细胞中的APO-A1基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述APO-A1基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5861-5874中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:5847-5860中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
82.根据权利要求81所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
83.根据权利要求82所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
84.根据权利要求81至83中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
85.根据权利要求81至84中任一项所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
86.根据权利要求81至85中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5861-5866或5868-5869中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
87.根据权利要求81至85中任一项所述的方法,其中所述工程化向导RNA与来自表43A的靶向SEQ ID NO:5861-5866或5868-5869中的任一者的向导RNA中的任一者具有至少80%序列同一性。
88.根据权利要求81至87中任一项所述的方法,其中所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
89.一种破坏细胞中的ANGPTL3基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述ANGPTL3基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5953-6030中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:5875-5952中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
90.根据权利要求89所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
91.根据权利要求90所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
92.根据权利要求89至91中任一项所述的方法,其中所述工程化向导RNA包括与SEQ IDNO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
93.根据权利要求89至92中任一项所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
94.根据权利要求89至93中任一项所述的方法,其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5955-5963、5968-5975、5979-5987、5989-5993、5997、5999、6003-6010、6014-6016、6024-6025或6027-6030中的任一者具有至少80%同一性的至少20-22个连续核苷酸的序列杂交。
95.根据权利要求89至93中任一项所述的方法,其中所述工程化向导RNA与来自表43B的靶向SEQ ID NO:5955-5963、5968-5975、5979-5987、5989-5993、5997、5999、6003-6010、6014-6016、6024-6025或6027-6030中的任一者的向导RNA中的任一者具有至少80%序列同一性。
96.根据权利要求89至95中任一项所述的方法,其中所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
97.一种破坏细胞中的人Rosa26基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述人Rosa26基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5013-5055中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:4970-5012中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
98.根据权利要求97所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
99.根据权利要求98所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
100.根据权利要求97至99中任一项所述的方法,其中所述工程化向导RNA包括与SEQID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
101.根据权利要求97至100中任一项所述的方法,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
102.根据权利要求97至101中任一项所述的方法,其中所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
103.一种破坏细胞中的FAS基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述FAS基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5367-5465中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:5268-5366中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
104.根据权利要求103所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
105.根据权利要求104所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
106.根据权利要求103至105中任一项所述的方法,其中所述工程化向导RNA包括与SEQID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
107.根据权利要求103至106中任一项所述的方法,其中所述向导RNA包括与SEQ IDNO:3609的非简并核苷酸具有至少80%序列同一性的序列。
108.根据权利要求103至107中任一项所述的方法,其中所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
109.一种破坏细胞中的PD-1基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述PD-1基因座的区杂交的间隔子序列,
其中所述工程化向导RNA被配置成与具有与SEQ ID NO:5474-5481中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列互补的至少20-22个连续核苷酸的序列杂交;或者
其中所述工程化向导RNA包括与SEQ ID NO:5466-5473中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列。
110.根据权利要求109所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
111.根据权利要求110所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
112.根据权利要求109至111中任一项所述的方法,其中所述工程化向导RNA包括与SEQID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
113.根据权利要求109至112中任一项所述的方法,其中所述向导RNA包括与SEQ IDNO:3609的非简并核苷酸具有至少80%序列同一性的序列。
114.根据权利要求109至113中任一项所述的方法,其中所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
115.一种工程化核酸酶系统,其包括:
(a)核酸内切酶,所述核酸内切酶与SEQ ID NO:215中的任一者或其变体具有至少75%序列同一性;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列,
其中与包括Cas9酶的等效系统相比,当向人类受试者施用时,所述系统具有降低的免疫原性。
116.根据权利要求115所述的系统,其中所述Cas9酶是SpCas9酶。
117.根据权利要求115至116所述的系统,其中所述向导RNA包括与SEQ ID NO:3609的非简并核苷酸具有至少80%序列同一性的序列。
118.根据权利要求115至117中任一项所述的系统,其中所述免疫原性是抗体免疫原性。
119.一种破坏细胞中的小鼠HAO-1基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述小鼠HAO-1基因座的区杂交的间隔子序列,
其中所述工程化向导RNA包括来自表25的包括表25中所描述的核苷酸修饰的向导RNAmH29-1_37、mH29-15_37、mH29-29_37的核苷酸;
或者其中所述工程化向导RNA包括SEQ ID NO:4184-4225中的任一者。
120.根据权利要求119所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
121.根据权利要求120所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
122.根据权利要求119至121中任一项所述的方法,其中所述工程化向导RNA包括与SEQID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
123.根据权利要求119至122中任一项所述的方法,其中所述向导RNA包括与SEQ IDNO:3609的非简并核苷酸具有至少80%序列同一性的序列。
124.根据权利要求119至123中任一项所述的方法,其中所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
125.根据权利要求119至124中任一项所述的方法,其中所述工程化向导RNA包括来自表25的包括表25中所描述的核苷酸修饰的向导RNA mH29-15_37或mH29-29_37的核苷酸。
126.根据权利要求119至125中任一项所述的方法,其中所述方法进一步包括破坏来自所述HAO-1基因座的乙醇酸氧化酶的表达。
127.一种破坏细胞中的人TRAC基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述人TRAC基因座的区杂交的间隔子序列,
其中所述工程化向导RNA包括来自表28B的包括表28B中所描述的核苷酸修饰的MG29-1-TRAC-sgRNA-35的核苷酸。
128.根据权利要求127所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
129.根据权利要求128所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
130.根据权利要求127至129中任一项所述的方法,其中所述工程化向导RNA包括与SEQID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
131.根据权利要求127至130中任一项所述的方法,其中所述向导RNA包括与SEQ IDNO:3609的非简并核苷酸具有至少80%序列同一性的序列。
132.根据权利要求127至131中任一项所述的方法,其中所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
133.一种破坏细胞中的白蛋白基因座的方法,所述方法包括向所述细胞中引入:
(a)2类V型Cas核酸内切酶;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与所述白蛋白基因座的区杂交的间隔子序列,
其中所述工程化向导RNA包括来自表29的包括表29中所描述的核苷酸修饰的mAlb298-37、mAlb2912-37、mAlb2918-37或mAlb298-34的核苷酸;或者
其中所述工程化向导RNA包括包含表46中所描述的核苷酸修饰的mAlb29-8-44、mAlb29-8-50、mAlb29-8-50b、mAlb29-8-51b、mAlb29-8-52b、mAlb29-8-53b或mAlb29-8-54b的核苷酸。
134.根据权利要求133所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:1-3470中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
135.根据权利要求134所述的方法,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
136.根据权利要求133至135中任一项所述的方法,其中所述工程化向导RNA包括与SEQID NO:3471、3539、3551-3559、3608-3609、3612、3636-3637、3640-3641、3644-3645、3648-3649、3652-3653、3656-3657、3660-3661、3664-3667、3671-3672、3678、3695-3696、3729-3730、3734-3735、3851-3857或6033-6036中的任一者的非简并核苷酸具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
137.根据权利要求133至136中任一项所述的方法,其中所述向导RNA包括与SEQ IDNO:3609的非简并核苷酸具有至少80%序列同一性的序列。
138.根据权利要求133至137中任一项所述的方法,其中所述细胞是真核细胞、肝细胞、T细胞、造血干细胞或其前体。
139.根据权利要求133至138中任一项所述的方法,其中所述工程化向导RNA包括来自表29的包括表29中所描述的核苷酸修饰的mAlb298-37、mAlb2912-37、mAlb2918-37或mAlb298-34的核苷酸。
140.一种工程化向导RNA,其包括:
a)DNA靶向区段,所述DNA靶向区段包括与靶DNA分子中的靶序列互补的核苷酸序列;以及
b)蛋白质结合区段,所述蛋白质结合区段被配置成与2类V型Cas核酸内切酶结合,并且
其中所述向导RNA包括表34中的SEQ ID NO:5695-5701中的任一者所描绘的核苷酸修饰模式。
141.根据权利要求140所述的工程化向导RNA,其中所述向导RNA包括mAlb29-8-44、mAlb29-8-50、mAlb29-8-37或mAlb29-12-44。
142.根据权利要求140所述的工程化向导RNA,其中所述向导RNA包括hH29-4_50、hH29-21_50、hH29-23_50、hH29-41_50、hH29-4_50b、hH29-21_50b、hH29-23_50b或hH29-41_50b、mH29-1-50、mH29-15-50、mH29-29-50、mH29-1-50b、mH29-15-50b或mH29-29-50b。
143.根据权利要求140所述的工程化向导RNA,其中所述DNA靶向区段被配置成与HAO-1基因或白蛋白基因杂交。
144.根据权利要求140至142中任一项所述的工程化向导RNA,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
145.根据权利要求140至144中任一项所述的工程化向导RNA,其中所述2类V型Cas核酸内切酶包括与SEQ ID NO:215具有至少75%序列同一性的核酸内切酶。
146.一种工程化核酸酶系统,其包括:
(a)核酸内切酶,所述核酸内切酶与SEQ ID NO:1-3470中的任一者或其变体或编码所述核酸内切酶的核苷酸序列具有至少75%序列同一性;以及
(b)编码CRISPR阵列的多核苷酸序列,其中所述CRISPR阵列被配置成由所述核酸内切酶处理成工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列,
其中所述间隔子序列被配置成与白蛋白基因杂交。
147.根据权利要求146所述的系统,其中所述多核苷酸序列包括与SEQ ID NO:5712具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
148.根据权利要求146或147所述的系统,其中所述核酸内切酶包括与SEQ ID NO:141、215、229、261或1711-1722中的任一者或其变体具有至少75%序列同一性的核酸内切酶。
149.根据权利要求148所述的系统,其中所述核酸内切酶包括与SEQ ID NO:215具有至少75%序列同一性的核酸内切酶。
150.一种工程化核酸酶系统,其包括:
(a)核酸内切酶,所述核酸内切酶与SEQ ID NO:470或其变体具有至少75%序列同一性;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列。
151.根据权利要求150所述的工程化核酸酶系统,其中所述工程化向导RNA包括与SEQID NO:6031具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
152.根据权利要求151或152所述的工程化核酸酶系统,其中所述核酸内切酶被配置成对包括SEQ ID NO:6032的5′PAM序列具有选择性。
153.一种工程化核酸酶系统,其包括:
(a)核酸内切酶,所述核酸内切酶与SEQ ID NO:2824、2841或2896中的任一者或其变体具有至少至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;以及
(b)工程化向导RNA,其中所述工程化向导RNA被配置成与所述核酸内切酶形成复合物,并且所述工程化向导RNA包括被配置成与靶核酸序列杂交的间隔子序列,
其中所述工程化向导RNA包括与SEQ ID NO:6033、6034或6035中的任一者具有至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的序列。
154.根据权利要求153所述的工程化核酸酶系统,其中所述核酸内切酶与SEQ ID NO:2824具有至少80%序列同一性,并且所述工程化向导RNA与SEQ ID NO:6033具有至少80%序列同一性。
155.根据权利要求153所述的工程化核酸酶系统,其中所述核酸内切酶与SEQ ID NO:2841具有至少80%序列同一性,并且所述工程化向导RNA与SEQ ID NO:6034具有至少80%序列同一性。
156.根据权利要求153所述的工程化核酸酶系统,其中所述核酸内切酶与SEQ ID NO:2896具有至少80%序列同一性,并且所述工程化向导RNA与SEQ ID NO:6035具有至少80%序列同一性。
157.根据权利要求153至156中任一项所述的工程化核酸酶系统,其中所述核酸内切酶被配置成对包括SEQ ID NO:6037-6039中的任一者的5′PAM序列具有选择性。
158.一种脂质纳米颗粒,其包括:
(a)本文所描述的核酸内切酶中的任何核酸内切酶;
(b)本文所描述的工程化向导RNA中的任何工程化向导RNA:
(c)阳离子脂质;
(d)固醇;
(e)中性脂质;以及
(f)经PEG修饰的脂质。
159.根据权利要求158所述的脂质纳米颗粒,其中所述阳离子脂质包括C12-200,所述固醇包括胆固醇,所述中性脂质包括DOPE,或所述经PEG修饰的脂质包括DMG-PEG2000。
160.根据权利要求158所述的脂质纳米颗粒,其中所述阳离子脂质包括图109中所描绘的阳离子脂质中的任何阳离子脂质。
Applications Claiming Priority (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/196,127 | 2021-06-02 | ||
US63/233,653 | 2021-08-16 | ||
US63/261,436 | 2021-09-21 | ||
US63/262,169 | 2021-10-06 | ||
US63/280,026 | 2021-11-16 | ||
US63/299,664 | 2022-01-14 | ||
US63/308,766 | 2022-02-10 | ||
US63/323,014 | 2022-03-23 | ||
US202263331076P | 2022-04-14 | 2022-04-14 | |
US63/331,076 | 2022-04-14 | ||
PCT/US2022/031849 WO2022256462A1 (en) | 2021-06-02 | 2022-06-01 | Class ii, type v crispr systems |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117693585A true CN117693585A (zh) | 2024-03-12 |
Family
ID=90135780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280046084.5A Pending CN117693585A (zh) | 2021-06-02 | 2022-06-01 | Ii类v型crispr系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117693585A (zh) |
-
2022
- 2022-06-01 CN CN202280046084.5A patent/CN117693585A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11713471B2 (en) | Class II, type V CRISPR systems | |
EP3526324B1 (en) | Crispr-associated (cas) protein | |
EP3523430B1 (en) | Engineered nucleic acid-targeting nucleic acids | |
CN109415729B (zh) | 具有降低毒性的基因编辑试剂 | |
AU2016274452A1 (en) | Thermostable Cas9 nucleases | |
JP2020517299A (ja) | 縦列反復配列を有するドナーdna修復鋳型を使用する部位特異的なdna改変 | |
US20230416710A1 (en) | Engineered and chimeric nucleases | |
WO2018172798A1 (en) | Argonaute system | |
AU2022284808A1 (en) | Class ii, type v crispr systems | |
JP2024501892A (ja) | 新規の核酸誘導型ヌクレアーゼ | |
US20240218339A1 (en) | Class ii, type v crispr systems | |
CN117693585A (zh) | Ii类v型crispr系统 | |
US20230405116A1 (en) | Vectors, systems and methods for eukaryotic gene editing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |