CN117165557A - Cas蛋白、其相应的基因编辑系统及应用 - Google Patents
Cas蛋白、其相应的基因编辑系统及应用 Download PDFInfo
- Publication number
- CN117165557A CN117165557A CN202310967771.7A CN202310967771A CN117165557A CN 117165557 A CN117165557 A CN 117165557A CN 202310967771 A CN202310967771 A CN 202310967771A CN 117165557 A CN117165557 A CN 117165557A
- Authority
- CN
- China
- Prior art keywords
- protein
- sequence
- nucleic acid
- cas
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 279
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 219
- 238000010362 genome editing Methods 0.000 title claims abstract description 20
- 235000018102 proteins Nutrition 0.000 claims description 212
- 150000007523 nucleic acids Chemical class 0.000 claims description 165
- 102000039446 nucleic acids Human genes 0.000 claims description 150
- 108020004707 nucleic acids Proteins 0.000 claims description 150
- 239000000203 mixture Substances 0.000 claims description 95
- 102000053602 DNA Human genes 0.000 claims description 85
- 108020004414 DNA Proteins 0.000 claims description 85
- 108020005004 Guide RNA Proteins 0.000 claims description 78
- 108020001507 fusion proteins Proteins 0.000 claims description 69
- 102000037865 fusion proteins Human genes 0.000 claims description 69
- 239000013598 vector Substances 0.000 claims description 61
- 125000003729 nucleotide group Chemical group 0.000 claims description 56
- 125000006850 spacer group Chemical group 0.000 claims description 56
- 238000003776 cleavage reaction Methods 0.000 claims description 55
- 239000002773 nucleotide Substances 0.000 claims description 55
- 230000007017 scission Effects 0.000 claims description 54
- 238000000034 method Methods 0.000 claims description 49
- 102000040430 polynucleotide Human genes 0.000 claims description 47
- 108091033319 polynucleotide Proteins 0.000 claims description 47
- 239000002157 polynucleotide Substances 0.000 claims description 47
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 42
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 40
- 239000013604 expression vector Substances 0.000 claims description 38
- 229920001184 polypeptide Polymers 0.000 claims description 34
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 31
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 31
- 102000004190 Enzymes Human genes 0.000 claims description 29
- 108090000790 Enzymes Proteins 0.000 claims description 29
- 238000002360 preparation method Methods 0.000 claims description 29
- 230000001105 regulatory effect Effects 0.000 claims description 28
- 238000006467 substitution reaction Methods 0.000 claims description 27
- 230000014509 gene expression Effects 0.000 claims description 23
- 125000000539 amino acid group Chemical group 0.000 claims description 20
- 241000282414 Homo sapiens Species 0.000 claims description 18
- 230000000295 complement effect Effects 0.000 claims description 18
- 238000000338 in vitro Methods 0.000 claims description 18
- 238000012217 deletion Methods 0.000 claims description 17
- 230000037430 deletion Effects 0.000 claims description 17
- 239000003814 drug Substances 0.000 claims description 17
- 201000010099 disease Diseases 0.000 claims description 16
- 208000035475 disorder Diseases 0.000 claims description 15
- 230000008685 targeting Effects 0.000 claims description 14
- 230000004048 modification Effects 0.000 claims description 13
- 238000012986 modification Methods 0.000 claims description 13
- 230000027455 binding Effects 0.000 claims description 12
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 11
- 238000007792 addition Methods 0.000 claims description 11
- 230000001939 inductive effect Effects 0.000 claims description 9
- 230000008827 biological function Effects 0.000 claims description 8
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 7
- 235000004252 protein component Nutrition 0.000 claims description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 6
- 239000002243 precursor Substances 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 3
- 230000007547 defect Effects 0.000 claims description 3
- 238000001727 in vivo Methods 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 69
- 210000004027 cell Anatomy 0.000 description 133
- 229920002477 rna polymer Polymers 0.000 description 32
- 239000000047 product Substances 0.000 description 23
- 108091028043 Nucleic acid sequence Proteins 0.000 description 18
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 18
- 241000196324 Embryophyta Species 0.000 description 16
- 230000035772 mutation Effects 0.000 description 16
- 150000001413 amino acids Chemical class 0.000 description 14
- 239000011324 bead Substances 0.000 description 14
- 239000012634 fragment Substances 0.000 description 14
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 13
- 102000055025 Adenosine deaminases Human genes 0.000 description 13
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 11
- 210000003527 eukaryotic cell Anatomy 0.000 description 11
- 239000013603 viral vector Substances 0.000 description 11
- 108020004705 Codon Proteins 0.000 description 10
- 102100026846 Cytidine deaminase Human genes 0.000 description 10
- 108010031325 Cytidine deaminase Proteins 0.000 description 10
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 10
- 210000001236 prokaryotic cell Anatomy 0.000 description 10
- 230000003197 catalytic effect Effects 0.000 description 9
- 239000006228 supernatant Substances 0.000 description 9
- 210000005253 yeast cell Anatomy 0.000 description 9
- 239000000872 buffer Substances 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- 238000006481 deamination reaction Methods 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 239000007788 liquid Substances 0.000 description 8
- 239000011259 mixed solution Substances 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 210000001519 tissue Anatomy 0.000 description 8
- 230000007018 DNA scission Effects 0.000 description 7
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 7
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 7
- 101710163270 Nuclease Proteins 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 239000002245 particle Substances 0.000 description 7
- 230000010076 replication Effects 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 6
- 230000007022 RNA scission Effects 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 230000009615 deamination Effects 0.000 description 6
- -1 eCFP Proteins 0.000 description 6
- 238000009472 formulation Methods 0.000 description 6
- 238000009396 hybridization Methods 0.000 description 6
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 6
- 230000004807 localization Effects 0.000 description 6
- 230000002746 orthostatic effect Effects 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 238000001890 transfection Methods 0.000 description 6
- 239000003981 vehicle Substances 0.000 description 6
- 229930024421 Adenine Natural products 0.000 description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 5
- 230000004568 DNA-binding Effects 0.000 description 5
- 241000702421 Dependoparvovirus Species 0.000 description 5
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 208000032007 Glycogen storage disease due to acid maltase deficiency Diseases 0.000 description 5
- 206010053185 Glycogen storage disease type II Diseases 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- 102000003960 Ligases Human genes 0.000 description 5
- 108090000364 Ligases Proteins 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 5
- 229960000643 adenine Drugs 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- 239000002552 dosage form Substances 0.000 description 5
- 201000004502 glycogen storage disease II Diseases 0.000 description 5
- 210000004962 mammalian cell Anatomy 0.000 description 5
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 241000701161 unidentified adenovirus Species 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- 229920000936 Agarose Polymers 0.000 description 4
- 108091033409 CRISPR Proteins 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- 102000000311 Cytosine Deaminase Human genes 0.000 description 4
- 108010080611 Cytosine Deaminase Proteins 0.000 description 4
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 4
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 4
- 208000035150 Hypercholesterolemia Diseases 0.000 description 4
- 241000235649 Kluyveromyces Species 0.000 description 4
- 241000713666 Lentivirus Species 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 238000000246 agarose gel electrophoresis Methods 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000001962 electrophoresis Methods 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 208000015181 infectious disease Diseases 0.000 description 4
- 239000012669 liquid formulation Substances 0.000 description 4
- 230000011987 methylation Effects 0.000 description 4
- 238000007069 methylation reaction Methods 0.000 description 4
- 238000002156 mixing Methods 0.000 description 4
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 3
- 208000014697 Acute lymphocytic leukaemia Diseases 0.000 description 3
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 3
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 201000006935 Becker muscular dystrophy Diseases 0.000 description 3
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 206010008342 Cervix carcinoma Diseases 0.000 description 3
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 3
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- 206010009944 Colon cancer Diseases 0.000 description 3
- 208000035473 Communicable disease Diseases 0.000 description 3
- 201000003883 Cystic fibrosis Diseases 0.000 description 3
- 206010014733 Endometrial cancer Diseases 0.000 description 3
- 206010014759 Endometrial neoplasm Diseases 0.000 description 3
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 3
- 102100030667 Eukaryotic peptide chain release factor subunit 1 Human genes 0.000 description 3
- 208000006168 Ewing Sarcoma Diseases 0.000 description 3
- 208000001914 Fragile X syndrome Diseases 0.000 description 3
- 208000024412 Friedreich ataxia Diseases 0.000 description 3
- 201000011240 Frontotemporal dementia Diseases 0.000 description 3
- 208000032612 Glial tumor Diseases 0.000 description 3
- 206010018338 Glioma Diseases 0.000 description 3
- 108010070675 Glutathione transferase Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 3
- 102000003964 Histone deacetylase Human genes 0.000 description 3
- 108090000353 Histone deacetylase Proteins 0.000 description 3
- 208000017604 Hodgkin disease Diseases 0.000 description 3
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 3
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 3
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 3
- 208000023105 Huntington disease Diseases 0.000 description 3
- 208000031226 Hyperlipidaemia Diseases 0.000 description 3
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 3
- 208000008839 Kidney Neoplasms Diseases 0.000 description 3
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 3
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 3
- 206010025323 Lymphomas Diseases 0.000 description 3
- 102100033448 Lysosomal alpha-glucosidase Human genes 0.000 description 3
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 3
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 3
- 206010029260 Neuroblastoma Diseases 0.000 description 3
- 206010052399 Neuroendocrine tumour Diseases 0.000 description 3
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 3
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 3
- 206010033128 Ovarian cancer Diseases 0.000 description 3
- 206010061535 Ovarian neoplasm Diseases 0.000 description 3
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 3
- 206010060862 Prostate cancer Diseases 0.000 description 3
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 3
- 108700040121 Protein Methyltransferases Proteins 0.000 description 3
- 102000055027 Protein Methyltransferases Human genes 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 208000015634 Rectal Neoplasms Diseases 0.000 description 3
- 206010038389 Renal cancer Diseases 0.000 description 3
- 241000283984 Rodentia Species 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 208000000453 Skin Neoplasms Diseases 0.000 description 3
- 208000005718 Stomach Neoplasms Diseases 0.000 description 3
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 208000008383 Wilms tumor Diseases 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 3
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 208000005980 beta thalassemia Diseases 0.000 description 3
- 201000009036 biliary tract cancer Diseases 0.000 description 3
- 208000020790 biliary tract neoplasm Diseases 0.000 description 3
- 238000005251 capillar electrophoresis Methods 0.000 description 3
- 201000010881 cervical cancer Diseases 0.000 description 3
- 208000020832 chronic kidney disease Diseases 0.000 description 3
- 208000029742 colonic neoplasm Diseases 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000012258 culturing Methods 0.000 description 3
- 210000000805 cytoplasm Anatomy 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 201000004101 esophageal cancer Diseases 0.000 description 3
- 210000001808 exosome Anatomy 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000005714 functional activity Effects 0.000 description 3
- 230000002538 fungal effect Effects 0.000 description 3
- 206010017758 gastric cancer Diseases 0.000 description 3
- 208000005017 glioblastoma Diseases 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 201000010982 kidney cancer Diseases 0.000 description 3
- 208000032839 leukemia Diseases 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 201000007270 liver cancer Diseases 0.000 description 3
- 208000014018 liver neoplasm Diseases 0.000 description 3
- 201000005202 lung cancer Diseases 0.000 description 3
- 208000020816 lung neoplasm Diseases 0.000 description 3
- 230000002101 lytic effect Effects 0.000 description 3
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 3
- 201000001441 melanoma Diseases 0.000 description 3
- 201000006938 muscular dystrophy Diseases 0.000 description 3
- 201000000050 myeloid neoplasm Diseases 0.000 description 3
- 208000016065 neuroendocrine neoplasm Diseases 0.000 description 3
- 201000011519 neuroendocrine tumor Diseases 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 230000030648 nucleus localization Effects 0.000 description 3
- 201000002528 pancreatic cancer Diseases 0.000 description 3
- 208000008443 pancreatic carcinoma Diseases 0.000 description 3
- 230000000750 progressive effect Effects 0.000 description 3
- 230000018883 protein targeting Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 206010038038 rectal cancer Diseases 0.000 description 3
- 201000001275 rectum cancer Diseases 0.000 description 3
- 238000010839 reverse transcription Methods 0.000 description 3
- 208000007056 sickle cell anemia Diseases 0.000 description 3
- 201000000849 skin cancer Diseases 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 201000011549 stomach cancer Diseases 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 230000037426 transcriptional repression Effects 0.000 description 3
- 239000012096 transfection reagent Substances 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 102100026189 Beta-galactosidase Human genes 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 2
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 2
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 2
- 102100038191 Double-stranded RNA-specific editase 1 Human genes 0.000 description 2
- 102000018233 Fibroblast Growth Factor Human genes 0.000 description 2
- 108050007372 Fibroblast Growth Factor Proteins 0.000 description 2
- 102000053187 Glucuronidase Human genes 0.000 description 2
- 108010060309 Glucuronidase Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 2
- 206010019860 Hereditary angioedema Diseases 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 102000006947 Histones Human genes 0.000 description 2
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 2
- 101000742223 Homo sapiens Double-stranded RNA-specific editase 1 Proteins 0.000 description 2
- 101000878536 Homo sapiens Focal adhesion kinase 1 Proteins 0.000 description 2
- 101000653360 Homo sapiens Methylcytosine dioxygenase TET1 Proteins 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 2
- 241001138401 Kluyveromyces lactis Species 0.000 description 2
- 201000003533 Leber congenital amaurosis Diseases 0.000 description 2
- 241000270322 Lepidosauria Species 0.000 description 2
- 241000282567 Macaca fascicularis Species 0.000 description 2
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 2
- 208000009018 Medullary thyroid cancer Diseases 0.000 description 2
- 102100030819 Methylcytosine dioxygenase TET1 Human genes 0.000 description 2
- 241000244206 Nematoda Species 0.000 description 2
- 108010066154 Nuclear Export Signals Proteins 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 2
- 101710086015 RNA ligase Proteins 0.000 description 2
- 208000017442 Retinal disease Diseases 0.000 description 2
- 244000253911 Saccharomyces fragilis Species 0.000 description 2
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 101150091380 TTR gene Proteins 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 108091028113 Trans-activating crRNA Proteins 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 238000010009 beating Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 239000006285 cell suspension Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 230000022811 deglycosylation Effects 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 229940126864 fibroblast growth factor Drugs 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 201000010536 head and neck cancer Diseases 0.000 description 2
- 208000014829 head and neck neoplasm Diseases 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 230000003301 hydrolyzing effect Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 208000002780 macular degeneration Diseases 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 208000023356 medullary thyroid gland carcinoma Diseases 0.000 description 2
- 239000002923 metal particle Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 230000000051 modifying effect Effects 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000003274 myotonic effect Effects 0.000 description 2
- 239000006186 oral dosage form Substances 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004952 protein activity Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 125000006853 reporter group Chemical group 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- YGSDEFSMJLZEOE-UHFFFAOYSA-N salicylic acid Chemical compound OC(=O)C1=CC=CC=C1O YGSDEFSMJLZEOE-UHFFFAOYSA-N 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000003007 single stranded DNA break Effects 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 230000035882 stress Effects 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 201000007905 transthyretin amyloidosis Diseases 0.000 description 2
- 241000712461 unidentified influenza virus Species 0.000 description 2
- 201000005112 urinary bladder cancer Diseases 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- JLIDBLDQVAYHNE-LXGGSRJLSA-N 2-cis-abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\C1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-LXGGSRJLSA-N 0.000 description 1
- MZZYGYNZAOVRTG-UHFFFAOYSA-N 2-hydroxy-n-(1h-1,2,4-triazol-5-yl)benzamide Chemical compound OC1=CC=CC=C1C(=O)NC1=NC=NN1 MZZYGYNZAOVRTG-UHFFFAOYSA-N 0.000 description 1
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 description 1
- 108010013043 Acetylesterase Proteins 0.000 description 1
- 101710095342 Apolipoprotein B Proteins 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- 101100443354 Arabidopsis thaliana DME gene Proteins 0.000 description 1
- 101100331657 Arabidopsis thaliana DML2 gene Proteins 0.000 description 1
- 101100091498 Arabidopsis thaliana ROS1 gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 108091005950 Azurite Proteins 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 101000879203 Caenorhabditis elegans Small ubiquitin-related modifier Proteins 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108091005960 Citrine Proteins 0.000 description 1
- 206010010356 Congenital anomaly Diseases 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 101710180243 Cytidine deaminase 1 Proteins 0.000 description 1
- 101150064551 DML1 gene Proteins 0.000 description 1
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 1
- 238000010442 DNA editing Methods 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 108010024985 DNA methyltransferase 3B Proteins 0.000 description 1
- 101150117307 DRM3 gene Proteins 0.000 description 1
- 101000851802 Dictyostelium discoideum Eukaryotic peptide chain release factor GTP-binding subunit Proteins 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 101100118093 Drosophila melanogaster eEF1alpha2 gene Proteins 0.000 description 1
- 102100031780 Endonuclease Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101710175705 Eukaryotic peptide chain release factor subunit 1 Proteins 0.000 description 1
- 241000282324 Felis Species 0.000 description 1
- 108010091824 Focal Adhesion Kinase 1 Proteins 0.000 description 1
- 102000018691 Focal Adhesion Kinase 1 Human genes 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 208000016621 Hearing disease Diseases 0.000 description 1
- 108010034145 Helminth Proteins Proteins 0.000 description 1
- 208000009889 Herpes Simplex Diseases 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000756632 Homo sapiens Actin, cytoplasmic 1 Proteins 0.000 description 1
- 101000971697 Homo sapiens Kinesin-like protein KIF1B Proteins 0.000 description 1
- 101000957257 Homo sapiens MAD2L1-binding protein Proteins 0.000 description 1
- 101000635944 Homo sapiens Myelin protein P0 Proteins 0.000 description 1
- 101000579123 Homo sapiens Phosphoglycerate kinase 1 Proteins 0.000 description 1
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 description 1
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 1
- 241000701074 Human alphaherpesvirus 2 Species 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 102000008607 Integrin beta3 Human genes 0.000 description 1
- 108010020950 Integrin beta3 Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108010077991 O-GlcNAc transferase Proteins 0.000 description 1
- 102000005520 O-GlcNAc transferase Human genes 0.000 description 1
- KJWZYMMLVHIVSU-IYCNHOCDSA-N PGK1 Chemical compound CCCCC[C@H](O)\C=C\[C@@H]1[C@@H](CCCCCCC(O)=O)C(=O)CC1=O KJWZYMMLVHIVSU-IYCNHOCDSA-N 0.000 description 1
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 108010071690 Prealbumin Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108020005091 Replication Origin Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102000051619 SUMO-1 Human genes 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 102000009190 Transthyretin Human genes 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 1
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 206010052428 Wound Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 101000771024 Zea mays DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 108091006088 activator proteins Proteins 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 230000006154 adenylylation Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000033590 base-excision repair Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 238000007664 blowing Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 239000011035 citrine Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- HISOCSRUFLPKDE-KLXQUTNESA-N cmt-2 Chemical compound C1=CC=C2[C@](O)(C)C3CC4C(N(C)C)C(O)=C(C#N)C(=O)[C@@]4(O)C(O)=C3C(=O)C2=C1O HISOCSRUFLPKDE-KLXQUTNESA-N 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical group O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009504 deubiquitination Effects 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 230000005059 dormancy Effects 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 238000002003 electron diffraction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003682 fluorination reaction Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 244000000013 helminth Species 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 239000005457 ice water Substances 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 239000007972 injectable composition Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000006662 intracellular pathway Effects 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- ZNJFBWYDHIGLCU-HWKXXFMVSA-N jasmonic acid Chemical compound CC\C=C/C[C@@H]1[C@@H](CC(O)=O)CCC1=O ZNJFBWYDHIGLCU-HWKXXFMVSA-N 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 108010021853 m(5)C rRNA methyltransferase Proteins 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 210000004898 n-terminal fragment Anatomy 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008723 osmotic stress Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- FJKROLUGYXJWQN-UHFFFAOYSA-N papa-hydroxy-benzoic acid Natural products OC(=O)C1=CC=C(O)C=C1 FJKROLUGYXJWQN-UHFFFAOYSA-N 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 108010043655 penetratin Proteins 0.000 description 1
- MCYTYTUNNNZWOK-LCLOTLQISA-N penetratin Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=CC=C1 MCYTYTUNNNZWOK-LCLOTLQISA-N 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000005222 photoaffinity labeling Methods 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000003375 plant hormone Substances 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000002818 protein evolution Methods 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229960004889 salicylic acid Drugs 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 229910052594 sapphire Inorganic materials 0.000 description 1
- 239000010980 sapphire Substances 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 1
- 108010066762 sweet arrow peptide Proteins 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 208000013077 thyroid gland carcinoma Diseases 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000001256 tonic effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- GWBUNZLLLLDXMD-UHFFFAOYSA-H tricopper;dicarbonate;dihydroxide Chemical compound [OH-].[OH-].[Cu+2].[Cu+2].[Cu+2].[O-]C([O-])=O.[O-]C([O-])=O GWBUNZLLLLDXMD-UHFFFAOYSA-H 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000029812 viral genome replication Effects 0.000 description 1
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
提供了Cas蛋白、其相应的基因编辑系统及应用,具体地,本发明的Cas蛋白与已知Cas蛋白同源性较低,具有非常好的基因编辑活性,可对靶基因进行有效编辑或切割,具有广泛的应用前景。
Description
技术领域
本发明涉及基因编辑领域,具体地,涉及Cas蛋白、其相应的基因编辑系统及应用。
背景技术
Clustered regularly interspaced short palindromic repeats(CRISPR)系统是细菌和古细菌为了防御入侵噬菌体的DNA而形成的。CRISPR系统包括2个家族,1类系统进一步分为I型、I II型和IV型;2类系统分为II型、V型和VI型。其中II型最常见的为CRISPR/Cas9系统,Cas9蛋白可在反式编码小RNA(tracrRNA)的协助下将pre-crRNA加工成与tracrRNA结合的成熟crRNA。之后,人们发现通过人工构建模拟crRNA-tracrRNA复合体的单链嵌合体引导RNA(guide RNA,gRNA),即可有效的介导Cas9蛋白对靶点的识别和切割,其中与靶点3′端紧邻的3个碱基是5′-NGG-3′的形式,从而构成Cas/crRNA复合体识别靶点所需的PAM(protospacer adjacent motif)结构。
Cas蛋白是有效的DNA编辑工具,核酸序列的靶向编辑,例如,靶向切割靶基因以允许将特定修饰引入基因组DNA,以研究基因功能和基因表达。靶向编辑还可以用于靶向人类特定靶基因,以治疗遗传疾病,或用于在植物(例如农作物)或微生物(例如细菌)的基因组中引入有益突变。基因组编辑工具的开发为基于基因编辑的哺乳动物疗法和农业生物技术提供了新方法。在与脱氨酶融合时,RNA引导的Cas蛋白还可用于碱基编辑。
目前已知的CRISPR/Cas存在各自的优缺点。目前对生物技术的发展仍需要开发新的、具有多样化特征的新型CRISPR/Cas系统。
发明内容
本发明提供了一种新的、具有多样化特征的新型CRISPR/Cas系统。
本发明的第一方面提供了一种Cas蛋白,所述蛋白选自下组:
(a)具有SEQ ID NO:1或2所示氨基酸序列的多肽;
(b)具有与SEQ ID NO:1或2所示氨基酸序列≥80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或99.5%同源性(或同一性)的多肽,且所述多肽具有SEQ ID NO:1的生物学功能;
(c)将SEQ ID NO:1或2中任一所示氨基酸序列经过一个或多个(较佳地,1-20个,更佳地为1-10个、更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的,且保留SEQ IDNO:1或2的生物学功能的衍生多肽。
本发明第二方面提供了一种融合蛋白,包含本发明第一方面所述的Cas蛋白;以及一个或多个功能结构域。
在另一优选例中,所述功能结构域选自定位信号、报告蛋白、Cas蛋白靶向部分、DNA结合域、表位标签、转录激活域、转录抑制域、核酸酶、脱氨结构域、甲基化酶、脱甲基酶、转录释放因子、HDAC、裂解活性多肽、连接酶、整合酶、转座酶、重组酶、聚合酶和碱基切除修复抑制剂(如尿嘧啶-DNA糖基化酶抑制剂(UGI))。
在另一优选例中,所述功能结构域包括以下一种或多种对靶序列的酶活性:甲基化酶活性、脱甲基酶活性、乙酰基转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、脱SUMO化活性、核糖基化活性、脱核糖基化活性、豆蔻酰化活性、脱豆蔻酰化活性、糖基化活性(例如,来自O-GlcNAc转移酶)和脱糖基化活性。
在另一优选例中,所述功能结构域选自腺苷脱氨酶催化结构域或胞苷脱氨酶催化结构域。
在另一优选例中,所述腺苷脱氨酶催化结构域或胞苷脱氨酶催化结构域包括ADAR1、ADAR2、APOBEC、AID或TAD中的一种或多种。
在另一优选例中,所述定位信号包括核定位信号(NLS)和/或核输出信号(NES)。
在另一优选例中,所述核定位信号的序列位于、靠近或接近权利要求1所述的蛋白的末端(例如,N端或C端)。
在另一优选例中,所述核输出信号包括蛋白酪氨酸激酶2(如人蛋白酪氨酸激酶2)。
在另一优选例中,所述报告蛋白包括谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、自发荧光蛋白。
在另一优选例中,所述自发荧光蛋白包括绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、eGFP、CopGFP、AceGFP等)、HcRed、DsRed、青色荧光蛋白(例如,eCFP、Cerulean、CyPet、AmCyanl等)、黄色荧光蛋白(例如,(例如,YFP、eYFP、Citrine、Venus、YPet、PhiYFP等)、蓝色荧光蛋白(例如,eBFP、eBFP2、Azurite、mKalamal、GFPuv、Sapphire、T-sapphire)。
在另一优选例中,所述DNA结合域包括甲基化结合蛋白、LexADBD、Gal4DBD。
在另一优选例中,所述表位标签包括组氨酸标签、V5标签、FLAG标签、流感病毒血凝素标签、Myc标签、VSV-G标签、硫氧还蛋白标签、链霉亲和素标签。
在另一优选例中,所述转录激活域包括VP64和/或VPR。
在另一优选例中,所述转录抑制域包括KRAB和/或SID。
在另一优选例中,所述核酸酶包括FokI。
在另一优选例中,所述裂解活性多肽包括具有单链RNA裂解活性的多肽、具有双链RNA裂解活性的多肽、具有单链DNA裂解活性的多肽或具有双链DNA裂解活性的多肽。
在另一优选例中,所述连接酶包括DNA连接酶和/或RNA连接酶。
在另一优选例中,所述功能结构域连接于所述的Cas蛋白的N端,和/或C端。
在另一优选例中,所述功能结构域插入到所述Cas蛋白的N端和C端之间。
在另一优选例中,所述一个或多个功能结构域任选地通过接头连接至所述Cas蛋白的N端和/或C端。
在另一优选例中,所述功能结构域通过接头插入到所述Cas蛋白的N端和C端之间。
在另一优选例中,所述融合蛋白从N端到C端具有如下结构:
Z1-Z2(I);或
Z2-Z1(II);或
Z3-Z1-Z4(II I);
其中,Z1为胞嘧啶脱氨酶或腺苷脱氨酶;
Z2为权利要求1所述的Cas蛋白;
Z3为权利要求1所述的Cas蛋白的N端片段;
Z4为权利要求1所述的Cas蛋白的C端片段;
并且,各“-”独立地为键或接头。
本发明第三方面提供了一种分离的多核苷酸,所述的多核苷酸编码本发明第一方面所述的Cas蛋白或本发明第二方面所述的融合蛋白。
在另一优选例中,所述多核苷酸选自下组:
(a)序列如SEQ ID NO.3或4所示的多核苷酸;
(b)核苷酸序列与SEQ ID NO.3或4所示序列的同源性≥70%(较佳地≥80%,更佳地,≥90%,更佳地≥95%,最佳地≥99%),且编码SEQ ID NO.1或2所示多肽的多核苷酸;
(c)与(a)-(b)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述的多核苷酸在所述变体的ORF的侧翼还额外含有选自下组的辅助元件:信号肽、分泌肽、标签序列(如6His)、或其组合。
在另一优选例中,所述的多核苷酸选自下组:基因组序列、cDNA序列、RNA序列、或其组合。
在另一优选例中,该多核苷酸还包含与所述变体的ORF序列操作性连接的启动子。
在另一优选例中,所述的启动子选自下组:组成型启动子、组织特异性启动子、诱导型启动子、或者强启动子。
在另一优选例中,宿主细胞包括原核细胞或真核细胞。
在另一优选例中,所述的宿主细胞为真核细胞,如酵母细胞、植物细胞或哺乳动物细胞(包括人和非人哺乳动物)。
在另一优选例中,所述的宿主细胞为原核细胞,如大肠杆菌。
在另一优选例中,所述酵母细胞选自下组的一种或多种来源的酵母:毕氏酵母、克鲁维酵母、或其组合;较佳地,所述的酵母细胞包括:克鲁维酵母,更佳地为马克斯克鲁维酵母、和/或乳酸克鲁维酵母。
在另一优选例中,所述宿主细胞选自下组:大肠杆菌、麦胚细胞,昆虫细胞,SF9、Hela、HEK293、CHO、酵母细胞、或其组合。
本发明第四方面提供了一种分离的核酸分子,包含选自下列的序列,或由选自下列的序列组成:
(i)SEQ ID NO:5或6所示的序列;
(ii)与SEQ ID NO:5或6所示的序列相比具有一个或多个碱基的置换、缺失或添加(例如1个,2个,3个,4个,5个,6个,7个,8个,9个或10个碱基的置换、缺失或添加)的序列;
(iii)与SEQ ID NO:5或6所示的序列具有至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%的序列同一性的序列;
(iv)在严格条件下与(i)-(iii)任一项中所述的序列杂交的序列;或
(v)(i)-(iii)任一项中所述的序列的互补序列;
并且,(ii)-(v)中任一项所述的序列基本保留了其所源自的序列的生物学功能;
例如,所述分离的核酸分子是RNA;
例如,所述分离的核酸分子包含CRISPR/Cas系统中的同向重复序列。
在另一优选例中,所述核酸分子包含一个或多个茎环或优化的二级结构;
例如,(ii)-(v)中任一项所述的序列保留了其所源自的序列的二级结构。
在另一优选例中,所述核酸分子包含选自下列的序列,或由选自下列的序列组成:
(a)SEQ ID NO:5或6所示的核苷酸序列;
(b)在严格条件下与(a)中所述的序列杂交的序列;或
(c)SEQ ID NO:5或6所示的核苷酸序列的互补序列。
本发明第五方面提供了一种向导RNA(gRNA),所述向导RNA包括能够结合本发明第一方面所述Cas蛋白的同向重复(Direct Repeat,DR)序列和能够靶向靶序列的间隔(spacer)序列。
本发明第六方面提供了一种复合物,包含:
(i)蛋白组分,选自下组:本发明第一方面所述的Cas蛋白、本发明第二方面所述的融合蛋白、或其组合;和
(ii)核酸组分,选自下组:本发明第五方面所述的向导RNA,编码本发明第五方面所述的向导RNA的核酸,本发明第五方面所述的向导RNA的前体RNA,编码本发明第五方面所述的向导RNA的前体RNA核酸、或其组合;
其中,所述蛋白组分与核酸组分相互结合形成复合物。
在另一优选例中,所述向导RNA(gRNA)中的同向重复(Direct Repeat,DR)序列连接于所述核酸分子的3’端或5’端。
在另一优选例中,所述向导RNA(gRNA)中的间隔(spacer)序列包含所述靶序列的互补序列。
本发明第七方面提供了一种载体,包含本发明第三方面所述的多核苷酸或本发明第四方面所述的核酸分子或本发明第五方面所述的向导RNA。
在另一优选例中,所述载体包含:
(1)第一调控元件,所述第一调控元件可操作地连接至编码本发明第一方面所述的Cas蛋白的核苷酸序列或编码本发明第二方面所述的融合蛋白的核苷酸序列;和
(2)第二调控元件,所述第二调控元件可操作地连接至编码向导RNA的核苷酸序列,所述向导RNA包含:
(a)能够与靶序列杂交的间隔(spacer)序列,和
(b)同向重复(Direct Repeat,DR)序列,其连接至所述间隔(spacer)序列,能够引导本发明第一方面所述的Cas蛋白结合至所述向导RNA以形成靶向所述靶序列的本发明第六方面所述的复合物。
在另一优选例中,所述第一调控元件和所述第二调控元件位于相同或不同载体上。
在另一优选例中,所述第一调节元件和/或第二调节元件是启动子,例如诱导型启动子。
在另一优选例中,所述载体包含一个或多个启动子,所述启动子可操作地与所述核酸序列、增强子、转录终止信号、多腺苷酸化序列、复制起点、选择性标记、核酸限制性位点、和/或同源重组位点连接。
在另一优选例中,所述载体包括质粒、病毒载体。
在另一优选例中,所述的病毒载体选自下组:腺相关病毒(AAV)、腺病毒、慢病毒、逆转录病毒、疱疹病毒、SV40、痘病毒、或其组合。
在另一优选例中,所述载体包括克隆载体、转化载体、表达载体、穿梭载体、整合载体、多功能载体。
本发明第八方面提供了一种CRISPR-Cas组合物,包含:
(i)第一组分,选自下组:本发明第一方面所述的Cas蛋白、本发明第二方面所述的融合蛋白、编码本发明第一方面所述的Cas蛋白或本发明第二方面所述的融合蛋白的核苷酸序列,以及其任意组合;和
(ii)第二组分,所述第二组分为包含一种或多种本发明第五方面所述的向导RNA,或者编码所述包含一种或多种本发明第五方面所述的向导RNA的核苷酸序列;
所述向导RNA能够与(i)中所述的蛋白或蛋白变体或融合蛋白形成复合物。
在另一优选例中,所述向导RNA从5’至3’方向包含同向重复序列和间隔(spacer)序列,所述间隔(spacer)序列能够与靶序列杂交。
在另一优选例中,所述同向重复序列是本发明第四方面中所定义的核酸分子。
在另一优选例中,所述组合物还包括药学上可接受的载体。
在另一优选例中,所述组合物包括药物组合物。
在另一优选例中,所述组合物的剂型选自下组:冻干制剂、液体制剂、或其组合。
在另一优选例中,所述组合物的剂型为液体制剂。
在另一优选例中,所述组合物的剂型为注射剂型。
在另一优选例中,所述组合物为细胞制剂。
本发明第九方面提供了一种CRISPR-Cas系统,包含一种或多种载体,所述一种或多种载体包含:
(i)第一核酸,其为编码本发明第一方面所述的Cas蛋白或本发明第二方面所述的融合蛋白的核苷酸序列;任选地所述第一核酸可操作地连接至第一调节元件;以及
(ii)第二核酸,其编码包含本发明第五方面所述的向导RNA的核苷酸序列;任选地所述第二核酸可操作地连接至第二调节元件;
其中:
所述第一核酸与第二核酸存在于相同或不同的载体上;
所述向导RNA能够与(i)中所述的蛋白或融合蛋白形成复合物。
在另一优选例中,所述载体包括质粒、病毒载体。
在另一优选例中,所述向导RNA包括能够与靶序列杂交的间隔(spacer)序列;和与间隔(spacer)序列连接,并能够引导所述蛋白结合至所述向导RNA,从而形成靶向所述靶序列的CRISPR-Cas组合物或复合物的同向重复(Direct Repeat,DR)序列。
在另一优选例中,所述向导RNA包括未修饰和经修饰的向导RNA。
在另一优选例中,所述经修饰的向导RNA包括碱基的化学修饰。
在另一优选例中,所述化学修饰包括甲基化修饰、甲氧基修饰、氟化修饰或硫代修饰。
在另一优选例中,所述同向重复序列是权利要求4中所定义的核酸分子。
在另一优选例中,所述第一调节元件和/或第二调节元件是启动子,例如诱导型启动子。
在另一优选例中,所述组合物中的至少一个组分是非天然存在的或经修饰的。
在另一优选例中,所述间隔(spacer)序列连接至所述同向重复(Direct Repeat,DR)序列的3’端。
在另一优选例中,所述间隔(spacer)序列包含所述靶序列的互补序列。
在另一优选例中,当所述靶序列为DNA时,所述靶序列位于原间隔序列临近基序(PAM)的3'端,并且所述PAM具有5'-PAM为5’-TTTN所示的序列,N为A、T、C或G。
在另一优选例中,所述靶序列是来自原核细胞或真核细胞的DNA或基于RNA反转录形成的DNA序列;或者,所述靶序列是非天然存在的DNA或基于RNA反转录形成的DNA序列。
在另一优选例中,所述靶序列包括cDNA序列。
在另一优选例中,所述靶序列包括单链DNA、双链DNA序列。
在另一优选例中,所述靶序列存在于细胞内。
在另一优选例中,所述靶序列存在于细胞核内或细胞质(例如,细胞器)内。
在另一优选例中,所述细胞是真核细胞。
在另一优选例中,所述细胞是原核细胞。
在另一优选例中,所述靶序列存在于细胞外部。
在另一优选例中,本发明第一方面所述Cas蛋白连接有一个或多个NLS序列,或者,所述融合蛋白包含一个或多个NLS序列。
在另一优选例中,所述NLS序列连接至本发明第一方面所述Cas蛋白的N端或C端。
在另一优选例中,所述NLS序列融合至本发明第一方面所述Cas蛋白的N端或C端。
本发明第十方面提供了一种试剂盒,包括一种或多种选自下列的组分:本发明第一方面所述的Cas蛋白、本发明第二方面所述的融合蛋白、本发明第三方面所述的多核苷酸、本发明第六方面所述的复合物、本发明第七方面所述的载体、本发明第八方面所述的CRISPR-Cas组合物或本发明第九方面所述的系统。
在另一优选例中,所述试剂盒还包括标签或说明书。
在另一优选例中,所述试剂盒用于基因或基因组编辑、疾病治疗、靶向靶基因、切割目的基因或非目的基因的一种或多种。
本发明第十一方面提供了一种递送组合物,包含递送载体,以及选自下列的一种或多种:本发明第一方面所述的Cas蛋白、本发明第二方面所述的融合蛋白、本发明第三方面所述的多核苷酸、本发明第六方面所述的复合物、本发明第七方面所述的载体、本发明第八方面所述的CRISPR-Cas组合物或本发明第九方面所述的系统。
在另一优选例中,所述递送载体是粒子。
在另一优选例中,所述递送载体选自脂质颗粒、糖颗粒、金属颗粒、蛋白颗粒、脂质体、外泌体、微泡、基因枪或病毒载体(例如,复制缺陷型逆转录病毒、慢病毒、腺病毒或腺相关病毒)。
本发明第十二方面提供了一种宿主细胞,包含本发明第一方面所述的Cas蛋白、本发明第二方面所述的融合蛋白、本发明第三方面所述的多核苷酸、本发明第六方面所述的复合物、本发明第七方面所述的载体、本发明第八方面所述的CRISPR-Cas组合物或本发明第九方面所述的系统或本发明第十一方面所述的递送组合物。
在另一优选例中,所述的宿主细胞为真核细胞,如酵母细胞、植物细胞或哺乳动物细胞(包括人和非人哺乳动物)。
在另一优选例中,所述的宿主细胞为原核细胞,如大肠杆菌。
在另一优选例中,所述酵母细胞选自下组的一种或多种来源的酵母:毕氏酵母、克鲁维酵母、或其组合;较佳地,所述的酵母细胞包括:克鲁维酵母,更佳地为马克斯克鲁维酵母、和/或乳酸克鲁维酵母。
在另一优选例中,所述宿主细胞选自下组:大肠杆菌、麦胚细胞、昆虫细胞、SF9、Hela、HEK293、CHO、酵母细胞、或其组合。
本发明第十三方面提供了一种酶制剂,所述酶制剂包括本发明第一方面所述的Cas蛋白、本发明第二方面所述的融合蛋白、本发明第六方面所述的复合物、本发明第八方面所述的CRISPR-Cas组合物或本发明第九方面所述的系统或本发明第十一方面所述的递送组合物。
在另一优选例中,所述的酶制剂包括注射剂、和/或冻干制剂。
本发明第十四方面提供了一种药盒,包括:
第一容器,以及位于所述第一容器中的本发明第六方面所述的复合物或本发明第八方面所述的组合物或本发明第九方面所述的系统,或含有本发明第六方面所述的复合物或本发明第八方面所述的组合物或本发明第九方面所述的系统的药物。
在另一优选例中,所述的第一容器的药物是含本发明第六方面所述的复合物或本发明第八方面所述的组合物或本发明第九方面所述的系统的单方制剂。
在另一优选例中,所述药物的剂型选自下组:冻干制剂、液体制剂、或其组合。
在另一优选例中,所述药物的剂型为口服剂型或注射剂型。
在另一优选例中,所述的药盒还含有说明书。
本发明第十五方面提供了一种药盒,包括:
(a1)第一容器,以及位于所述第一容器中的本发明第一方面所述的Cas蛋白、或本发明第二方面所述的融合蛋白、或其编码基因或其表达载体,或含有本发明第一方面所述的Cas蛋白、或本发明第二方面所述的融合蛋白、或其编码基因或其表达载体的药物;
(b1)任选的第二容器,以及位于所述第二容器中的本发明第五方面所述的向导RNA或其表达载体,或含有本发明第五方面所述的向导RNA或其表达载体的药物。
在另一优选例中,所述的第一容器和第二容器为不同的容器。
在另一优选例中,所述的第一容器的药物是含有本发明第一方面所述的Cas蛋白、或本发明第二方面所述的融合蛋白、或其编码基因或其表达载体的单方制剂。
在另一优选例中,所述的第二容器的药物是含有本发明第五方面所述的向导RNA或其表达载体的单方制剂。
在另一优选例中,所述药物的剂型选自下组:冻干制剂、液体制剂、或其组合。
在另一优选例中,所述药物的剂型为口服剂型或注射剂型。
在另一优选例中,所述的药盒还含有说明书。
本发明第十六方面提供了一种靶向和编辑靶基因或切割靶基因的方法,包括:本发明第一方面所述的Cas蛋白、或本发明第二方面所述的融合蛋白、或本发明第六方面所述的复合物或本发明第八方面所述的组合物或本发明第九方面所述的系统或本发明第十一方面所述的递送组合物或本发明第十三方面所述的酶制剂或本发明第十四方面或第十五方面所述的药盒与所述靶基因接触,或者递送至包含所述靶基因的细胞中,靶序列存在于所述靶基因中。
在另一优选例中,所述靶基因存在于细胞内。
在另一优选例中,所述细胞是原核细胞。
在另一优选例中,所述细胞是真核细胞,例如哺乳动物细胞(例如人类细胞)或植物细胞。
在另一优选例中,所述靶基因存在于体外的核酸分子(例如,质粒)中。
在另一优选例中,所述编辑靶基因或切割靶基因包括靶序列的断裂,如DNA的双链断裂或RNA的单链断裂,或将外源核酸插入所述断裂中。
在另一优选例中,所述靶基因包括DNA。
在另一优选例中,所述DNA包括单链DNA、双链DNA。
本发明第十七方面提供了一种诱导细胞状态改变的方法,所述方法包括将本发明第一方面所述的Cas蛋白、或本发明第二方面所述的融合蛋白、或本发明第六方面所述的复合物或本发明第八方面所述的组合物或本发明第九方面所述的系统或本发明第十一方面所述的递送组合物或本发明第十三方面所述的酶制剂或本发明第十四方面或本发明第十五方面所述的药盒与细胞中的靶基因接触。
本发明第十八方面提供了一种改变基因产物的表达的方法,包括:将本发明第一方面所述的Cas蛋白、或本发明第二方面所述的融合蛋白、或本发明第六方面所述的复合物或本发明第八方面所述的组合物或本发明第九方面所述的系统或本发明第十一方面所述的递送组合物或本发明第十三方面所述的酶制剂或本发明第十四方面或第十五方面所述的药盒与编码所述基因产物的核酸分子接触,或者递送至包含所述核酸分子的细胞中,所述靶序列存在于所述核酸分子中。
在另一优选例中,所述核酸分子存在于体外的核酸分子(例如,质粒)中。
在另一优选例中,所述基因产物的表达被改变(例如,增强或降低)。
在另一优选例中,所述基因产物是蛋白。
在另一优选例中,所述的Cas蛋白、融合蛋白、多核苷酸、分离的核酸分子、复合物、载体或组合物包含于递送载体中。
在另一优选例中,所述递送载体选自脂质颗粒、糖颗粒、金属颗粒、蛋白颗粒、脂质体、外泌体、病毒载体(如复制缺陷型逆转录病毒、慢病毒、腺病毒或腺相关病毒)。
在另一优选例中,用于改变靶基因或编码靶基因产物的核酸分子中的一个或多个靶序列来修饰细胞、细胞系或生物体。
本发明第十九方面提供了一种由本发明第十六至第十八方面中任一方面所述的方法获得的细胞或其子代,其中所述细胞包含在其野生型中不存在的修饰。
本发明第二十方面提供了本发明第十九方面所述的细胞或其子代的细胞产物。
本发明第二十一方面提供了一种体外的、离体的或体内的细胞或细胞系或它们的子代,所述细胞或细胞系或它们的子代包含:本发明第一方面所述的Cas蛋白、或本发明第二方面所述的融合蛋白、或本发明第三方面所述的多核苷酸或本发明第六方面所述的复合物或本发明第七方面所述的载体或本发明第八方面所述的组合物或本发明第九方面所述的系统或本发明第十一方面所述的递送组合物。
在另一优选例中,所述细胞是原核细胞。
在另一优选例中,所述细胞是真核细胞,例如哺乳动物细胞(例如人类细胞)或植物细胞。
在另一优选例中,所述细胞是干细胞或干细胞系。
本发明第二十二方面提供了本发明第一方面所述的Cas蛋白、或本发明第二方面所述的融合蛋白、或本发明第三方面所述的多核苷酸或本发明第六方面所述的复合物或本发明第七方面所述的载体或本发明第八方面所述的组合物或本发明第九方面所述的系统或本发明第十方面所述的试剂盒或本发明第十一方面所述的递送组合物或本发明第十三方面所述的酶制剂或本发明第十四方面或本发明第十五方面所述的药盒的用途,用于制备药物或制剂,所述药物或制剂用于核酸编辑(例如,基因或基因组编辑)。
在另一优选例中,所述基因或基因组编辑包括修饰基因、敲除基因、改变基因产物的表达、修复突变、和/或插入多核苷酸。
本发明第二十三方面提供了本发明第一方面所述的Cas蛋白、或本发明第二方面所述的融合蛋白、或本发明第三方面所述的多核苷酸或本发明第六方面所述的复合物或本发明第七方面所述的载体或本发明第八方面所述的组合物或本发明第九方面所述的系统或本发明第十方面所述的试剂盒或本发明第十一方面所述的递送组合物或本发明第十三方面所述的酶制剂或本发明第十四方面或本发明第十五方面所述的药盒的用途,用于制备药物或制剂,所述药物或制剂用于选自下组的一种或多种:
(i)离体基因或基因组编辑;
(ii)离体单链DNA的检测;
(iii)编辑靶基因座中的靶序列来修饰生物或非人类生物;
(iv)治疗由靶基因座中的靶序列的缺陷引起的病症;
(v)治疗有需要的受试者的病症或疾病。
在另一优选例中,所述病症或疾病包括癌症、传染性疾病、神经疾病、眼科疾病、听力疾病。
在另一优选例中,所述疾病或病症包括囊性纤维化、进行性假肥大性肌营养不良(Duchenne型肌营养不良,DMD)、贝克肌营养不良、α-1-抗胰蛋白酶缺乏、庞贝病(糖原贮积病Ⅱ型)、强直性肌营养不良、亨廷顿病、脆性X综合征、弗里德赖希共济失调、肌萎缩侧索硬化、遗传性慢性肾脏病、镰状细胞病、β地中海贫血、额颞叶痴呆、莱伯氏先天性黑蒙、高脂血症、高胆固醇血症、转甲状腺素蛋白淀粉样变、视网膜疾病、黄斑变性、维尔姆斯瘤、尤文肉瘤、神经内分泌瘤、胶质母细胞瘤、神经母细胞瘤、黑色素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性髓细胞性白血病、慢性淋巴细胞白血病、慢性髓细胞性白血病、何杰金氏淋巴瘤、非何杰金氏淋巴瘤和尿膀胱癌。
在另一优选例中,所述病症或疾病是由致病性点突变引起。
本发明第二十四方面提供了一种检测样品中是否存在靶标核酸分子的方法,所述方法包括将样品与本发明第一方面所述的Cas蛋白、或本发明第二方面所述的融合蛋白、或本发明第六方面所述的复合物或本发明第八方面所述的组合物或本发明第九方面所述的系统或本发明第十方面所述的试剂盒或本发明第十一方面所述的递送组合物或本发明第十三方面所述的酶制剂和非靶序列接触,检测非靶序列被切割产生的可检测信号,从而检测靶标核酸分子,所述非靶序列不与向导RNA杂交。
在另一优选例中,所述非靶序列被复合物或CRISPR-Cas组合物或系统或递送组合物中的蛋白切割,则表示所述样本中存在靶标核酸分子;而所述非靶序列不被复合物或CRISPR-Cas组合物或系统或递送组合物中的蛋白切割,则表示所述样本中不存在靶标核酸分子。
在另一优选例中,所述靶标核酸分子为靶标DNA。
在另一优选例中,所述的靶标DNA包括基于RNA反转录形成的DNA。
在另一优选例中,所述的靶标DNA包括cDNA。
在另一优选例中,所述的靶标DNA选自下组:单链DNA、双链DNA、或其组合。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1示出了pET-28a(+)-CasW2的表达载体图谱。
图2示出了pET-28a(+)-CasW3的表达载体图谱。
图3示出了EcoRI和NotI双酶切CasW2、CasW3插入片段和pET-28a(+)载体琼脂糖凝胶电泳图。
图4示出了纯化后的CasW2及CasW3蛋白的SDS-PAGE考马斯亮蓝染色图。
图5示出了体外制备体外酶切dsDNA模板琼脂糖凝胶电泳图。
图6示出了pET-28a(+)-HED Cas12i.16的表达载体图谱。
图7示出了pET-28a(+)-S7R Cas12i.3的表达载体图谱。
图8示出了CasW2、CasW3、S7R-Cas12i3和HED Cas12i.16体外切割的毛细电泳对比图,HED Cas12i.16以及S7R-Cas12i3作为对照,从图中可以看出CasW2和CasW3的切割活性高于对照组。
图9示出了CasW2、CasW3、S7R-Cas12i3和HED Cas12i.16体外切割的单独的毛细电泳图结果,可以看出CasW2、CasW3、S7R-Cas12i3和HED Cas12i.16均可以将450bp的dsDNA模板,切割成两条dsDNA片段。
图10示出了CasW2真核表达载体图谱。
图11示出了CasW3真核表达载体图谱。
图12示出了293T细胞中CasW2、CasW3对TTR基因靶标的切割。
具体实施方式
本发明人经过广泛而深入的研究,首次意外的发现了一种新的Cas蛋白:CasW2、CasW3,本发明的Cas蛋白具有非常好的基因编辑活性,可对靶基因进行有效编辑或切割,在此基础上,本发明人完成了本发明。
术语
以下实施例仅用于描述本发明,而非限定本发明。除非特别指明,否则基本上按照本领域内熟知的以及在各种参考文献中描述的常规方法进行实施例中描述的实验和方法。
另外,实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。本领域技术人员知晓,实施例以举例方式描述本发明,且不意欲限制本发明所要求保护的范围。本文中提及的全部公开案和其他参考资料以其全文通过引用合并入本文。
为了可以更容易地理解本公开,首先定义某些术语。如本申请中所使用的,除非本文另有明确规定,否则以下术语中的每一个应具有下面给出的含义。在整个申请中阐述了其它定义。
术语“约”可以是指在本领域普通技术人员确定的特定值或组成的可接受误差范围内的值或组成,其将部分地取决于如何测量或测定值或组成。例如,如本文所用,表述“约100”包括99和101和之间的全部值(例如,99.1、99.2、99.3、99.4等)。
如本文所用,术语“含有”或“包括(包含)”可以是开放式、半封闭式和封闭式的。换言之,所述术语也包括“基本上由…构成”、或“由…构成”。
序列同一性(或同源性)通过沿着预定的比较窗(其可以是参考核苷酸序列或蛋白的长度的50%、60%、70%、80%、90%、95%或100%)比较两个对齐的序列,并且确定出现相同的残基的位置的数目来确定。通常地,这表示为百分比。核苷酸序列的序列同一性的测量是本领域技术人员熟知的方法。
Cas蛋白
在本发明中,Cas蛋白、Cas酶、Cas效应蛋白可以互换使用,Cas蛋白取其最广泛的含义,包含野生型Cas蛋白,其衍生物或变体、类似物,及其功能性片段例如寡核苷酸结合片段。
术语“野生型”具有本领域技术人员通常理解的含义,其表示生物、菌株、基因、蛋白的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征,其可从自然中的来源分离并且没有被人为有意地修饰。
术语“变体”、“衍生物”和“类似物”是指基本上保持本发明Cas蛋白的功能或活性的多肽。
通常,蛋白的衍生化不会不利影响该蛋白的期望活性(例如,与向导RNA结合的活性、核酸内切酶活性、在向导RNA引导下与靶序列特定位点结合并切割的活性),也就是说蛋白的衍生物与蛋白有相同的活性。“衍生物”的经修饰形式包括蛋白的一个或多个氨基酸可以被缺失、插入、修饰和/或取代。术语“非天然存在的”或“工程化的”可互换地使用并且表示人工的参与。
在一个方面,本发明提供了一种Cas蛋白,其包含与SEQ ID NO.1或2所示的氨基酸序列具有至少80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%同一性的氨基酸序列,并且基本保留了其源自的序列的生物学功能;
在一个实施方式中,所述Cas蛋白的氨基酸序列与SEQ ID NO.1或2所示的氨基酸序列相比,具有一个或多个氨基酸的置换、缺失或添加的序列,并且基本保留了其源自的序列的生物学功能;
在一个实施方式中,所述的Cas蛋白,其包含SEQ ID NO.1或2所示的氨基酸序列;
或与SEQ ID NO.1或2所示的序列相比,具有一个或多个氨基酸的置换、缺失或添加(例如1个,2个,3个,4个,5个,6个,7个,8个,9个或10个氨基酸的置换、缺失或添加)的序列;或与SEQ ID NO.1或2所示的氨基酸序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%的氨基酸序列同一性的序列;
在一个实施方式中,所述蛋白具有SEQ ID NO.1或2所示的氨基酸序列。
本领域技术人员清楚,可以改变蛋白质的结构而不对其活性和功能性产生不利影响,例如在蛋白质氨基酸序列中引入一个或多个保守性氨基酸取代,而不会对蛋白质分子的活性和/或三维结构产生不利影响。
本领域技术人员清楚保守性氨基酸取代的实例以及实施方式。具体的说,可以用与待取代位点属于相同组的另一氨基酸残基取代该氨基酸残基,即用非极性氨基酸残基取代另一非极性氨基酸残基,用极性不带电荷的氨基酸残基取代另一极性不带电荷的氨基酸残基,用碱性氨基酸残基取代另一碱性氨基酸残基,和用酸性氨基酸残基取代另一酸性氨基酸残基。这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的。只要取代不导致蛋白质生物活性的失活,则一种氨基酸被属于同组的其他氨基酸替换的保守取代落在本发明的范围内。因此,本发明的蛋白可以在氨基酸序列中包含一个或多个保守性取代,这些保守性取代最好根据表A进行替换而产生。另外,本发明也涵盖还包含一个或多个其他非保守取代的蛋白,只要该非保守取代不显著影响本发明的蛋白质的所需功能和生物活性即可。
保守氨基酸置换可以在一个或多个预测的非必需氨基酸残基处进行。“非必需”氨基酸残基是可以发生改变(缺失、取代或置换)而不改变生物活性的氨基酸残基,而“必需”氨基酸残基是生物活性所需的。“保守氨基酸置换”是其中氨基酸残基被具有类似侧链的氨基酸残基替代的置换。氨基酸置换可以在Cas酶的非保守区域中进行。一般而言,此类置换不对保守的氨基酸残基,或者不对位于保守基序内的氨基酸残基进行,其中此类残基是蛋白质活性所需的。然而,本领域技术人员应当理解,功能变体可以具有较少的在保守区域中的保守或非保守改变。
表A
本领域技术人员已经知晓,从蛋白质的N和/或C末端改变(置换、删除、截短或插入)一或多个氨基酸残基而仍可以保留其功能活性。因此,从本发明的Cas蛋白的N和/或C末端改变了一或多个氨基酸残基、同时保留了其所需功能活性的蛋白,也在本发明的范围内。这些改变可以包括通过现代分子方法例如PCR而引入的改变,所述方法包括借助于在PCR扩增中使用的寡核苷酸之中包含氨基酸编码序列而改变或延长蛋白质编码序列的PCR扩增。
应认识到,蛋白质可以以各种方式进行改变,包括氨基酸置换、删除、截短和插入,用于此类操作的方法是本领域技术人员通常已知晓的。
例如,可以通过对DNA的突变来制备Cas蛋白的氨基酸序列变体。还可以通过其他诱变形式和/或通过定向进化来完成,例如,使用已知的诱变、重组和/或改组方法,结合相关的筛选方法,来进行一或多个氨基酸取代;或一至多个氨基酸的缺失和/一至多个氨基酸插入。
本领域技术人员能够理解,本发明Cas蛋白中的这些微小氨基酸变化可以出现(例如,天然存在的突变)或者产生(例如,可使用r-DNA技术)而不损失蛋白质功能或活性。如果这些突变出现在蛋白的催化结构域、活性位点或其它功能结构域中,则多肽的性质可改变,但多肽可保持其活性。如果存在的突变不接近催化结构域、活性位点或其它功能结构域中,则可预期影响较小。
本领域技术人员可以根据本领域已知的方法,例如定位诱变或蛋白进化或生物信息系的分析,来鉴定Cas蛋白的必需氨基酸。蛋白的催化结构域、活性位点或其它功能结构域也能够通过结构的物理分析而确定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,结合推定的关键位点氨基酸的突变来确定。
直系同源物(orthologue,ortholog)
如本文中所使用的,术语“直系同源物(orthologue,ortholog)”具有本领域技术人员通常理解的含义。作为进一步指导,如本文中所述的蛋白质的“直系同源物”是指属于不同物种的蛋白质,该蛋白质执行与作为其直系同源物的蛋白相同或相似的功能。
本公开的核酸切割包括:由所述Cas蛋白产生的靶核酸中的DNA或RNA断裂(Cis切割)、利用Cas蛋白旁切活性导致的DNA或RNA在侧枝核酸底物(单链核酸底物)中的断裂(即非特异性或非靶向性,Trans切割)。在一些实施方式中,所述切割是双链DNA断裂。在一些实施方案中,切割是单链DNA断裂或单链RNA断裂。
Trans切割是指在某些环境中,激活的Cas12家族蛋白在结合靶序列后仍然保持活性,并继续非特异性地切割非靶寡核苷酸。该旁切活性能够使用Cas系统检测特定靶寡核苷酸的存在。例如,将Cas12i系统工程化以非特异性切割ssDNA或转录物。旁切活性被用于称为SHERLOCK的高灵敏度和特异性核酸检测平台,可用于许多临床诊断(Gootenberg,J.S.等人,Nucleic acid detection with CRISPR-Cas13a/C2c2.Science 356,438-442(2017))。
融合蛋白
在一个方面,本发明提供了一种融合蛋白,所述融合蛋白包括前述任一项所述的Cas蛋白和一个或多个功能结构域。
在一个实施方式中,所述功能结构域包括定位信号、报告蛋白、Cas蛋白靶向部分、DNA结合域、表位标签、转录激活域、转录抑制域、核酸酶、脱氨结构域、甲基化酶、脱甲基酶、转录释放因子、HDAC、裂解活性多肽、连接酶中的一种或多种;
在一个实施例中,“甲基化酶”,示例性的,例如HhaIDNA m5c-甲基转移酶(M.HhaI)、DNA甲基转移酶1(DNMT1)、DNA甲基转移酶3a(DNMT3a)、DNA甲基转移酶3b(DNMT3b)、METI、DRM3、ZMET2、CMT1、CMT2等。
“脱甲基化酶”是指从核酸、蛋白(例如,组蛋白)和其他分子中去除甲基(CH3-)基团的酶。脱甲基化酶在表观遗传修饰机制中很重要。脱甲基化酶蛋白通过控制DNA和组蛋白上发生的甲基化水平来改变基因组的转录调控,并且进而调控生物体内特定基因座处的染色质状态,例如TET1(ten-eleven translocation 1)、十-十一易位(TET)双加氧酶1(TET1CD)、DME、DML1、DML2、ROS1等。
在另一优选例中,所述转录释放因子,示例性的,例如真核释放因子1(ERF1)活性、真核释放因子3(ERF3)。
在一个实施方式中,所述功能结构域选自腺苷脱氨酶催化结构域或胞苷脱氨酶催化结构域。
在一个实施方式中,所述定位信号包括核定位信号和/或核输出信号;
优选地,所述核输出信号包括人类蛋白酪氨酸激酶2;
优选地,所述报告蛋白包括谷胱甘肽-S-转移酶、辣根过氧化物酶、氯霉素乙酰转移酶、β-半乳糖苷酶、β-葡糖醛酸糖苷酶或自发荧光蛋白中的一种或多种;
优选地,所述自发荧光蛋白包括绿色荧光蛋白、HcRed、DsRed、青色荧光蛋白、黄色荧光蛋白或蓝色荧光蛋白中的一种或多种;
优选地,所述DNA结合域包括甲基化结合蛋白、LexADBD或Gal4DBD中的一种或多种;
优选地,所述表位标签包括组氨酸标签、V5标签、FLAG标签、流感病毒血凝素标签、Myc标签、VSV-G标签或硫氧还蛋白标签中的一种或多种;
优选地,所述转录激活域包括VP64和/或VPR;
优选地,所述转录抑制域包括KRAB和/或SID;
优选地,所述核酸酶包括FokI;
优选地,所述脱氨结构域包括ADAR1、ADAR2、APOBEC、AID或TAD中的一种或多种;
优选地,所述裂解活性多肽包括具有单链RNA裂解活性的多肽、具有双链RNA裂解活性的多肽、具有单链DNA裂解活性的多肽或具有双链DNA裂解活性的多肽;
优选地,所述连接酶包括DNA连接酶和/或RNA连接酶。
在一个实施方式中,所述功能结构域是TadA8e的全长或功能性片段。
多核苷酸
在一个方面,本发明提供了一种多核苷酸,所述多核苷酸为编码所述Cas蛋白的多核苷酸序列,或编码前述所述融合蛋白的多核苷酸序列。
在一个实施方式中,所述多核苷酸(DNA分子)包括与SEQ ID NO.3或4所述的核苷酸序列具有70%以上,优选90%以上,更优选95%以上,进一步优选99%,更进一步优选为100%同一性的核苷酸。
在一个实施方式中,所述多核苷酸为根据宿主细胞的密码子偏好性进行密码子优化的DNA分子。
本公开所述的优化可能需要对编码蛋白(例如本公开的Cas蛋白)的核苷酸序列的突变以模拟预期的宿主生物体或细胞同时编码相同蛋白质时的密码子偏好。因此,密码子可改变,但编码的蛋白质保持不变。例如,如果预期的靶细胞是人细胞,可使用人密码子优化的编码蛋白的核苷酸序列。作为另一非限制性实施例,如果预期的宿主细胞是动物细胞(例如小鼠细胞、昆虫细胞),则可生成该动物密码子优化的编码蛋白的核苷酸序列。作为另一个非限制性实施例,如果预期的宿主细胞是植物细胞,则可生成植物密码子优化的编码蛋白的核苷酸序列。
密码子的选择列表很容易获得,例如,在www.kazusa.or.jp/codon上可获得的“密码子用法数据库”。在一些情况下,本公开的核酸包含编码CasW2、CasW3或其变体或其融合蛋白的核苷酸序列,所述核苷酸序列被密码子优化以在真核细胞中表达。在一些情况下,本公开的核酸包含编码CasW2、CasW3或其变体或其融合蛋白的核苷酸序列,所述核苷酸序列被密码子优化以在动物细胞中表达。在一些情况下,本公开的核酸包含编码CasW2、CasW3或其变体或其融合蛋白的核苷酸序列,所述核苷酸序列被密码子优化以在真菌细胞中表达。在一些情况下,本公开的核酸包含编码CasW2、CasW3或其变体或其融合蛋白的核苷酸序列,所述核苷酸序列被密码子优化以在植物细胞中表达。
在一个实施方式中,宿主细胞包括原核细胞或真核细胞。
CRISPR系统
术语“规律成簇的间隔短回文重复(CRISPR)-CRISPR-相关(Cas)(CRISPR-Cas)系统”或“CRISPR系统”可互换地使用并且具有本领域技术人员通常理解的含义,其通常包含与CRISPR相关(“Cas”)基因的表达有关的转录产物或其他元件,或者能够指导所述Cas基因活性的转录产物或其他元件。
CRISPR-Cas组合物
在一个方面,本发明还提供了一种CRISPR-Cas组合物,所述组合物包含:
(1)蛋白组分:前述的Cas蛋白,或前述的融合蛋白;或编码所述Cas蛋白或所述的融合蛋白的核酸分子;
(2)RNA组分:向导RNA,或一种或多种编码所述向导RNA的核酸,或向导RNA的前体RNA,或编码所述向导RNA的前体RNA的核酸;
所述蛋白组分与核酸组分相互结合形成复合物。
在一个实施方式中,所述的组合物为活化的CRISPR复合物,所述活化的CRISPR复合物进一步包含:结合在所述向导RNA上的靶核酸的靶序列。
在一个实施方式中,所述的CRISPR-Cas组合物,包括一个或多个载体,所述一个或多个载体包含:
(1)第一调控元件,所述第一调控元件可操作地连接至编码所述的Cas蛋白的核苷酸序列或编码所述的融合蛋白的核苷酸序列;和
(2)第二调控元件,所述第二调控元件可操作地连接至编码所述的向导RNA的核苷酸序列,所述向导RNA包含:
(a)能够与靶核酸的靶序列杂交的间隔(Spacer)序列,和
(b)连接至所述间隔(Spacer)序列的能够引导所述Cas蛋白结合至所述向导RNA以形成靶向所述靶序列的CRISPR-Cas复合物的直接重复(Direct Repeat,DR)序列;
其中所述第一调控元件和所述第二调控元件位于所述CRISPR-Cas载体系统的相同或不同载体上。
在一个实施方式中,所述第一调控元件或第二调控元件包括启动子,所述启动子包括诱导型启动子、组成型启动子或组织特异性启动子中的一种或多种;
在一个实施方式中,所述启动子包括T7、SP6、T3、CMV、EF1a、SV40、PGK1、humanβ-actin、CAG、U6、H1、T7、T7lac、araBAD、trp、lac或Ptac中的一种或多种;
在一个实施方式中,所述第一调控元件和第二调控元件位于相同或不同载体上。
在一个实施方式中,所述载体包括逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、单纯疱疹载体或噬菌粒载体;
在一个实施方式中,所述载体包括质粒载体。
在一个实施方式中,所述靶核酸包括来源于真核生物的DNA或来源于原核生物的DNA;
在一个实施方式中,所述真核生物包括动物或植物;
在一个实施方式中,所述靶核酸包括非人类哺乳动物DNA、人类DNA、昆虫DNA、鸟类DNA、爬行动物DNA、两栖动物DNA、啮齿动物DNA、鱼类DNA、蠕虫DNA、线虫DNA或酵母DNA;
在一个实施方式中,所述非人类哺乳动物DNA包括非人类灵长类DNA。
CRISPR/Cas复合物
术语“CRISPR/Cas复合物”是指,向导RNA、gRNA(guide RNA)或成熟crRNA(或指导RNA)与Cas蛋白结合所形成的复合体,其包含杂交到靶序列的引导序列上并且与Cas蛋白结合的同向重复序列,该复合体能够识别并切割能与该指导RNA或成熟crRNA杂交的靶核苷酸。
向导RNA(gRNA,guide RNA)
术语“向导RNA(guide RNA,gRNA)”、“成熟crRNA”、“crRNA”、“指导序列”、“指导RNA”可互换地使用并且具有本领域技术人员通常理解的含义。一般而言,指导RNA可以包含同向重复序列(direct repeat,DR)序列和间隔(spacer)序列,或者基本上由或由同向重复(DR)序列和间隔(spacer)序列组成。
在某些情况下,间隔(spacer)序列是与靶序列具有足够互补性从而与所述靶序列杂交并引导CRISPR-Cas复合物与所述靶序列的特异性结合的任何多核苷酸序列。在一个实施方式中,当最佳比对时,间隔(spacer)序列与其相应靶序列之间的互补程度为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。指导序列包含与靶核酸序列具有足够互补性以与靶核酸序列杂交并引导复合物与靶核酸序列的序列特异性结合的序列(例如直接重复(DR)序列)。
在本领域已知,在有足够的互补性发挥作用的基础上,不需要完全的互补性,因此,在需要的情况下,可以通过引入错配(例如,间隔(spacer)序列与靶核酸之间的一个或多个错配,诸如1或2个核苷酸的错配(包括沿着间隔序列/靶标序列的错配的位置))来实现对切割效率的调节。例如,如果期望靶标的小于100%的切割率(例如,在细胞群体中),则间隔序列中可以引入间隔序列与靶序列之间的1或2个错配。
在一个方面,本发明提供了一种向导RNA,所述向导RNA包括能够结合所述的Cas蛋白的同向重复(Direct Repeat,DR)序列和能够靶向靶序列的间隔(spacer)序列。
在一个实施方式中,所述同向重复序列,所述同向重复序列(Direct Repeat,DR)包含SEQ ID NO.5或6所示的序列。
在一个实施方式中,所述同向重复序列的3’端包含茎环结构,还包括由第一茎核苷酸链和第二茎核苷酸链彼此杂交形成所述茎环结构的茎,所述环核苷酸链形成所述茎环结构的环;
在一个实施方式中,所述同向重复序列包括与SEQ ID NO.5或6所述的核苷酸序列具有至少80%同一性的核苷酸序列;
在一个实施方式中,所述同向重复序列包括与SEQ ID NO.5或6所述的核苷酸序列具有至少85%以上,更优选90%以上,进一步优选95%以上同一性的核苷酸序列;
在一个实施方式中,所述同向重复序列包括SEQ ID NO.5或6所述的核苷酸序列。
在一个实施方式中,所述间隔(spacer)序列的80%以上与所述靶核酸互补;
在一个实施方式中,所述间隔(spacer)序列的90%以上,更优选95%以上,进一步优选99%以上,更进一步优选100%与所述靶核酸互补;
在一个实施方式中,所述间隔(spacer)序列的长度为18-41nt,例如18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41nt,更优选18至27个核苷酸,更优选18至24个核苷酸,最优选18至22个核苷酸。
在一个实施方式中,所述间隔(spacer)序列长度为20nt。
靶核酸
在本发明中,靶核酸与靶序列或靶核酸序列或靶标核酸分子互换使用,是指特定的核酸,其包含与向导RNA中的间隔序列全部或部分互补的核酸序列。“靶序列”是指被向导RNA中的间隔序列所靶向的多核苷酸,例如与该间隔序列具有互补性的序列,其中靶序列与间隔序列之间的杂交将促进CRISPR-Cas复合物(包括Cas蛋白和向导RNA)的形成。完全互补性不是必需的,只要存在足够互补性以引起杂交并且促进一种CRISPR-Cas复合物的形成即可。在一些实施例中,靶核酸包含非编码区(例如,启动子或终止子)。在一些实施例中,靶核酸是单链的,或双链的。
靶序列可以包含任何多核苷酸,如DNA。在某些情况下,所述靶序列位于细胞内或细胞外。在某些情况下,所述靶序列位于细胞的细胞核、细胞质、细胞器(例如线粒体或叶绿体)内。
该靶核酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用DNA)。在某些情况下,该靶序列应该与原间隔序列临近基序(PAM)相关。
供体模板
本发明中,供体模板核酸或供体模板可互换使用,是指在本文所述Cas蛋白改变了靶核酸之后,一种或多种细胞蛋白质可以使用其来改变靶核酸的结构的核酸分子。
在一些实施例中,供体模板核酸是双链核酸或单链核酸。在一些实施例中,供体模板核酸是线性的或环状的(例如,质粒)。在一些实例中,供体模板核酸是外源核酸分子。在一些实例中,供体模板核酸是内源核酸分子(例如,染色体)。在一些实施例中,可以利用供体模板实现基因重组,该重组是同源重组。
切割
切割是指由本文所述Cas蛋白产生的靶核酸中的DNA断裂。在一些实施例中,切割是双链DNA断裂。在一些实施例中,切割是单链DNA断裂。
本发明中,切割靶核酸或修饰靶核酸的含义可以重叠。修饰靶核酸不仅包括对单核苷酸的修饰,还包括核酸片段的插入或缺失。
报告核酸
报告核酸是指可被本文所述的激活的CRISPR系统蛋白切割或以其他方式减活的分子。报告核酸包含可被CRISPR蛋白切割的核酸元件(例如,采用单链非靶向核酸分子,其两端包括不同的报告基团或标记分子)。核酸元件的切割产生可检测的信号。在切割之前,或者当报告核酸处于“活性”状态时,报告核酸阻止阳性可检测信号的产生或检测。将理解的是,在某些示例实施方式中,在存在活性报告核酸的情况下可产生最小的背景信号。阳性可检测信号可以是可使用光学、荧光、化学发光、电化学或本领域已知的其他检测方法检测的任何信号。例如,在某些实施方式中,当存在报告核酸时,可检测到第一信号(即阴性可检测信号),然后在检测到靶分子以及通过激活的CRISPR蛋白切割或减活后将其转换为第二信号(例如阳性可检测信号)。报告核酸可以为单链DNA分子、单链RNA分子或单链DNA-RNA杂交体。
本发明所述的检测方法,可用于待检测靶核酸的定量检测。所述的定量检测指标可以根据报告基团的信号强弱进行定量,如根据荧光基团的发光强度,或根据显色条带的宽度等。
功能结构域
本文中功能结构域取其最广泛的含义,包括蛋白例如酶或因子本身或其具有特定功能片段/结构域。Cas蛋白与一个或多个功能结构域相连接/缔结,所述功能结构域选自定位信号、报告蛋白、Cas蛋白靶向部分、DNA结合域、表位标签、转录激活域、转录抑制域、核酸酶、脱氨结构域、甲基化酶、脱甲基酶、转录释放因子、HDAC、裂解活性多肽、连接酶中的一种或多种。当包括多于一个功能结构域时,所述功能结构域可以相同或不同。
脱氨结构域
在本发明中脱氨结构域包括脱氨酶(例如腺苷脱氨酶或胞苷脱氨酶)催化结构域,如本文所用,“腺苷脱氨酶”或“腺苷脱氨酶蛋白”是指蛋白质,多肽,或蛋白质或多肽的一个或多个功能结构域,其能够催化将腺嘌呤(或分子的腺嘌呤部分)转化为次黄嘌呤(或分子的次黄嘌呤部分)的水解脱氨反应。
在一些实施方式中,含腺嘌呤的分子是腺苷(A),并且含次黄嘌呤的分子是肌苷(I)。含腺嘌呤的分子可以是脱氧核糖核酸(DNA)或核糖核酸(RNA)。
腺苷脱氨酶包括但不限于称为作用于RNA的腺苷脱氨酶的酶家族成员(ADAR),称为作用于tRNA的腺苷脱氨酶的酶家族成员(ADAT),以及其他含腺苷脱氨酶结构域(ADAD)的家族成员。根据本公开,腺苷脱氨酶能够靶向RNA/DNA和RNA双链体中的腺嘌呤。在特定的实施方式中,腺苷脱氨酶已被修饰以增加其编辑RNA双链体的RNA/DNA异源双链体中的DNA的能力。
在一些实施例中,脱氨酶是胞苷脱氨酶。术语“胞苷脱氨酶”或“胞苷脱氨酶蛋白”是指蛋白质、多肽或者蛋白质或多肽的一个或多个功能结构域,其能够催化将胞嘧啶(或分子的胞嘧啶部分)转化为尿嘧啶(或分子的尿嘧啶部分)的水解脱氨基反应。在一些实施例中,含胞嘧啶的分子是胞苷(C),并且含尿嘧啶的分子是尿苷(U)。所述含胞嘧啶的分子可以是脱氧核糖核酸(DNA)或核糖核酸(RNA)。
胞苷脱氨酶包括但不限于被称为载脂蛋白BmRNA编辑复合物(APOBEC)家族脱氨酶的酶家族的成员,激活诱导的脱氨酶(AID),或胞苷脱氨酶1(CDA1)。在特定的实施方式中,包括APOBEC家族脱氨酶。
在一些实施例中,所述的胞苷脱氨酶包含胞嘧啶脱氨酶的野生型氨基酸序列。在一些实施例中,胞苷脱氨酶在胞嘧啶脱氨酶序列中包含一个或多个突变,使得胞嘧啶脱氨酶的编辑效率和/或底物编辑偏好根据特定需要而改变。
同一性
“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况,“同一性”表示所述多肽或核酸序列之间相同的残基的数目占残基总数的百分比,且基于突变类型确定残基总数的计算。突变类型包括在序列任一端或两端的插入(延伸)、在序列任一端或两端的缺失(截短)、一个或多个氨基酸/核苷酸的置换/替代、在序列内部的插入、在序列内部的缺失。
以多肽序列为例,如果突变类型为以下中的一种或多种:一个或多个氨基酸/核苷酸的置换/替代、在序列内部的插入和在序列内部的缺失,则残基总数以比较的分子中较大者来计算。如果突变类型还包括在序列任一端或两端的插入(延伸)或在序列任一端或两端的缺失(截短),则在任一端或两端插入或缺失的氨基酸的数量(例如,在两端插入或缺失的数量小于20个)并不计入残基总数中。在计算同一性百分数时,将正在比较的序列以产生序列之间最大匹配的方式比对,通过特定算法解决比对中的空位(如果存在的话)。核苷酸的同一性计算同理。
载体
载体为一种核酸分子,能够运送与其连接的另一种核酸分子。
载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如环状的)的核酸分子;包括DNA、RNA、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。一种载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文所述的蛋白、融合蛋白、分离的核酸分子等(例如,CRISPR转录物,如核酸转录物、蛋白或酶)。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。载体还可含有复制起始位点。
载体包括质粒、病毒载体,所述质粒是指其中可以通过例如标准分子克隆技术插入另外的DNA片段的环状双链DNA环。病毒载体,其中病毒衍生的DNA或RNA序列存在于用于包装病毒的载体中,病毒包括例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒及腺相关病毒。病毒载体还包含由用于转染到一种宿主细胞中的病毒携带的多核苷酸。一些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。
其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体被称为“表达载体”。
在一些实施方式中,可以通过例如以下方式将载体(例如,病毒载体或非病毒载体,例如慢病毒载体或质粒)递送至目的组织:肌肉内注射、静脉内施用、经皮施用、鼻内施用、口服施用或粘膜施用。上述递送可以是经由单剂量或者多剂量进行的。本领域技术人员应理解的是,本文有待递送的实际剂量可以在很大程度上根据多种因素而变化,该多种因素包括但不限于载体选择、靶细胞、生物体、组织、有待治疗的受试者的一般状况、所寻求的转化/修饰的程度、施用途径、施用方式和所寻求的转化/修饰的类型。
调控元件
本文中,“调控元件”包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号、poly-U序列),其详细描述可参考Goeddel,GENE EXPRESSIONTECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,SanDiego,Calif(1990)。在一些情况下,调控元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝、胰腺)或特殊的细胞类型(例如淋巴细胞)。在另一些情况下,调控元件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。
术语“启动子”是指一段位于基因的上游能启动下游基因表达的非编码核苷酸序列。组成型启动子是这样的核苷酸序列:当其与编码或者限定基因产物的多核苷酸可操作地相连时,在细胞的大多数或者所有生理条件下,将会导致细胞中基因产物的产生。诱导型启动子是指对内源或外源刺激的存在,例如通过化学化合物(化学诱导剂)响应,或对环境、激素、化学品、和/或发育信号响应,选择性表达编码序列或功能RNA的启动子。诱导型或调节型启动子包括例如通过光、热、胁迫、水淹或干旱、盐胁迫、渗透胁迫、植物激素、伤口或化学品(如乙醇、脱落酸(ABA)、茉莉酮酸酯、水杨酸或安全剂)诱导或调节的启动子。
宿主细胞
本文中“宿主细胞”,是指真核细胞(例如,动物细胞、植物细胞、真菌细胞等)、原核细胞(例如一些微生物细胞、大肠杆菌、枯草菌等)或来自以单细胞实体形式培养的多细胞生物体(例如细胞系)的细胞,所述细胞用作核酸的受体(例如表达载体),且包括已通过核酸遗传修饰的原始细胞的后代。
应理解,单一细胞的后代可归因于天然、偶发或故意突变而不一定与原始亲本细胞具有完全相同的形态或基因组等。“重组宿主细胞”(也称为“遗传修饰宿主细胞”)为其中已引入异源核酸,例如表达载体的宿主细胞。
本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。
在另一个方面中,本发明还提供了一种宿主细胞或其后代,所述宿主细胞包含前述Cas蛋白,或前述融合蛋白,或前述多核苷酸,或前述载体系统,或前述CRISPR-Cas系统,或前述组合物。
在一个实施方式中,所述宿主细胞包括非人类哺乳动物、人类、昆虫、鸟类、爬行动物、两栖动物、啮齿动物、鱼类、蠕虫、线虫或酵母细胞。
在一个方面,本发明还提供了一种多细胞生物体,所述多细胞生物体包含前述细胞或其后代。
在一个实施方式中,所述的多细胞生物体是用于相关疾病的动物模型或植物模型。
NLS
NLS是指“核定位序列”或“核定位信号”,是指促使蛋白质进入细胞核内的氨基酸序列。核定位序列是本领域中已知的(例如Plank等人在2000年11月23日提交的国际PCT申请PCT/EP2000/011690并且在2001年5月31日公布为WO/2001/038547中有所描述),所述专利通过引用其对于示例性核定位序列的公开内容而并入本文。在其他实施方案中,NLS是经优化的NLS,例如,Koblan等人,Nature Biotech.2018doi:10.1038/nbt.4172中所述。
可操作地连接
“可操作地连接”是指目标核苷酸序列以允许核苷酸序列表达的方式(例如,在体外转录/翻译系统中或者当载体被引入宿主细胞中时在宿主细胞中)连接至调控元件。有利的载体包括慢病毒和腺相关病毒,并且也可选择这些载体的类型以靶向特定类型的细胞。
互补
“互补性”是指一个核酸序列与另一个核酸序列借助于传统的沃森-克里克或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与另一个核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个之中有5、6、7、8、9、10个互补,则互补百分比为50%、60%、70%、80%、90%和100%)。“完全互补”表示一个核酸序列的所有连续残基与另一个核酸序列中的相同数目的连续残基均形成氢键。“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少为60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%的互补程度,或者是指在严格条件下杂交的两个核酸。
与杂交相关的术语“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的,并且取决于许多因素。一般而言,该序列越长,则该序列特异性地杂交到其靶序列上的温度就越高。
“杂交”是指其中一个或多个多核苷酸反应形成一种复合物的反应,该复合物经由这些核苷酸残基之间的碱基的氢键键合而稳定化。该复合物可包含形成一个双链体的两条链、形成多链复合物的三条或多条链、单个自我杂交链、或这些的任何组合。杂交反应可以构成一个更广泛的过程(如PCR的开始、或经由一种酶的多核苷酸的切割)中的一个步骤。能够与一个给定序列杂交的序列被称为该给定序列的“互补物”。
靶序列与gRNA的杂交,表示靶序列和gRNA的核酸序列至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的可以杂交,形成复合物;或者代表靶序列和gRNA的核酸序列至少有12个、15个、16个、17个、18个、19个、20个或更多个碱基可以互补配对,杂交形成复合物。
表达
核酸表达包括从DNA序列产生RNA模板(例如转录)、RNA转录物的加工(例如通过剪接、编辑、5′帽形成和/或3′末端加工)、将RNA翻译成多肽或蛋白质或多肽或蛋白质的翻译后修饰中的一种或多种。
递送
“递送”指向目的地提供实体(如药物),例如,本发明的CRISPR-Cas系统/组合物的组分可以各种形式递送,例如DNA/RNA或RNA/RNA或蛋白质RNA的组合。例如,Cas蛋白可作为编码DNA的多核苷酸或编码RNA的多核苷酸或作为蛋白质被递送。
在一个方面,本发明还提供了一种递送系统,所述递送系统包括所述的Cas蛋白或所述的融合蛋白,或所述的多核苷酸,或所述的CRISPR-Cas组合物。
在一个实施方式中,所述的递送系统还包括递送媒介物,所述的递送媒介物包括纳米颗粒、脂质体、外泌体、微泡、基因枪或电转装置。
此外,当递送对象为植物细胞时,还会采用诸如细胞穿透肽(CPP)进行递送的方式。例如,在一个具体实施方式中,Cas蛋白和/或至少一种向导RNA与一种或多种CPP偶联,从而有效地将偶联有Cas蛋白和/或向导RNA的CPP运输到植物细胞内(例如原生质体内)。CPP具有少于35个氨基酸的短肽,其衍生自蛋白质或衍生自嵌合序列,能够以非受体依赖性方式跨细胞膜运输生物分子。CPP可以是阳离子肽、具有疏水序列的肽、两亲性肽、具有富含脯氨酸及抗微生物序列的肽以及嵌合或二分肽。CPP能够穿透生物膜,并且因此触发不同生物分子跨细胞膜移动到细胞质中,并能改进它们的细胞内通路,并且因此促进生物分子与靶标的相互作用。
示例性的,CPP包括Tat(为通过HIV 1型进行病毒复制所需的核转录活化蛋白)、穿透素、卡波西(Kaposi)成纤维细胞生长因子(FGF)信号肽序列、整联蛋白β3信号肽序列、聚精氨酸肽Arg序列、富含鸟嘌呤分子转运体、甜箭头肽等。
接头
本文中“接头”指连接两个分子或部分,例如融合蛋白的两个域,例如Cas蛋白和脱氨酶的化学基团或分子。在一些连接方式中,接头位于两个基团、分子或其他部分之间或侧翼,并且通过共价键连接两者。
在一些实施例中,接头是氨基酸或多个氨基酸残基通过肽键连接形成的线性多肽。在一些实施方案中,接头是有机分子、基团、聚合物或化学部分。接头的长度以及类型,可以根据需要来进行设计。在一些实施例中,接头可以选择人工合成的氨基酸序列或天然存在的多肽序列。
检测
在一个方面,本发明还提供了一种靶向和编辑靶核酸的方法,所述方法包括使所述靶核酸与前述任一项CRISPR-Cas系统或组合物接触。
在一个方面,本发明还提供了一种在识别靶核酸后非特异性降解单链DNA的方法,所述方法包括使所述靶核酸与前述CRISPR-Cas组合物接触。
在一个方面,本发明还提供了一种在识别双链靶核酸的间隔(Spacer)互补链后靶向所述双链靶核酸的非间隔(Spacer)互补链并使其产生切口的方法,所述方法包括使所述双链靶核酸与前述CRISPR-Cas系统或组合物接触。
在一个方面,本发明还提供了一种靶向和切割双链靶核酸的方法,所述方法包括使所述双链靶核酸与前述CRISPR-Cas系统或组合物接触。
在一个实施方式中,在使所述双链DNA的间隔(Spacer)互补链产生切口之前,使所述双链靶核酸的非间隔(Spacer)序列互补链产生切口。
在一个方面,本发明还提供了一种特异性编辑双链核酸的方法,所述方法包括在充分的条件下使以下进行接触充分的时间量,
(1)前述所述Cas蛋白、或融合蛋白、另一具有序列特异性切口活性的酶,以及所述向导RNA,所述向导RNA指导所述Cas蛋白或所述融合蛋白,相对于所述另一序列特异性切口酶的活性使相对链产生切口;以及(2)所述双链核酸;所述方法导致双链断裂的形成。
在一个方面,本发明还提供了一种编辑双链核酸的方法,所述方法包括在充分的条件下使以下进行接触充分的时间量:
(1)前述Cas蛋白、或融合蛋白,和具有DNA修饰活性的蛋白质结构域的融合蛋白,以及靶向所述双链核酸的所述RNA指导物;以及(2)所述双链核酸;
所述融合蛋白的Cas蛋白被修饰以使所述双链核酸的非靶链产生切口。
在一个实施方式中,所述双链核酸的两条链在不同的位点被切割,导致交错切割。
在一个实施方式中,所述双链核酸的两条链在同一位点被切割,导致平双链断裂。
在一个方面,本发明还提供了一种靶向并切割单链靶核酸的方法,所述方法包括使靶核酸与前述任一项所述的CRISPR-Cas组合物接触。
在一个方面,本发明还提供了一种诱导细胞状态改变的方法,所述方法包括使前述CRISPR-Cas组合物与细胞中的所述靶核酸接触。
在一个实施方式中,所述细胞状态包括凋亡或休眠;
在一个实施方式中,所述细胞包括真核细胞或原核细胞;
在一个实施方式中,所述细胞包括哺乳动物细胞或植物病变细胞;
在一个实施方式中,所述细胞包括癌细胞;
在一个实施方式中,所述细胞包括感染性细胞或被感染原感染的细胞;
在一个实施方式中,所述细胞包括被病毒感染的细胞、被朊病毒感染的细胞;
在一个实施方式中,所述细胞包括真菌细胞、原生动物或寄生虫细胞。
在一个方面,本发明还提供了一种检测样品中靶核酸的方法,所述方法包括将样品与前述Cas蛋白、向导RNA和非靶序列接触;检测由所述Cas蛋白切割非靶序列产生的可检测信号,从而检测靶核酸;所述非靶序列不与所述向导RNA杂交。
试剂盒
在一个方面,本发明提供了一种试剂盒,所述试剂盒包括前述的Cas蛋白、前述的融合蛋白、前述多核苷酸、前述的CRISPR-Cas组合物、前述的宿主细胞在制备试剂盒的用途,所述试剂盒的组分在相同或不同的容器中。
在一个方面,本发明还提供了一种容器,所述容器包含前述试剂盒。
在一个实施方式中,所述容器包括无菌容器;
在一个实施方式中,所述容器包括注射器。
在一些实施方式中,试剂盒还包括使用该试剂盒的说明书,例如一种以上语言的说明书。试剂盒还可以包含一种或多种试剂,用于利用上述一种或多种组分的过程中。试剂可在任何合适容器中提供。例如,试剂盒可提供一种或多种反应或储存缓冲液。上述试剂可以在使用前以需要添加一种或多种其他组分的形式(例如,以浓缩或冻干形式)提供;缓冲液可以是任何缓冲液,包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液以及它们的组合。缓冲液可以具有适合的酸碱度(pH值),例如,可以是碱性的。在一些实施方案中,缓冲液的pH为约7-10之间。
治疗
“治疗”是指,治疗或治愈受试者病症,延缓病症的症状的发作,和/或延缓病症严重程度。术语“受试者”包括但不限于各种动物、植物和微生物。动物,包括哺乳动物,例如牛科动物、马科动物、羊科动物、猪科动物、犬科动物、猫科动物、兔科动物、啮齿类动物(例如,小鼠或大鼠)、非人灵长类动物(例如,猕猴或食蟹猴)或人。在某些实施方式中,所述受试者(例如人)患有病症(例如,疾病相关基因缺陷所导致的病症)。“植物”为能够进行光合作用的任何分化的多细胞生物,在包括处于任何成熟或发育阶段的作物植物。
在一个方面,本发明还提供了前述的Cas蛋白、前述的融合蛋白、前述多核苷酸、前述的CRISPR-Cas组合物、前述的宿主细胞在制备治疗有需要的受试者病症或疾病的药物中的应用。
在一个实施方式中,所述应用包括向所述受试者或所述受试者的离体细胞施用所述CRISPR-Cas组合物;
在一个实施方式中,所述间隔(spacer)序列与跟所述病症或疾病相关的所述靶核酸的至少15个核苷酸互补,所述Cas蛋白或所述融合蛋白切割所述靶核酸;
在一个实施方式中,所述病症或疾病包括有需要的受试者的病症或疾病(比如,由致病性点突变引起的病症或疾病,包括囊性纤维化、进行性假肥大性肌营养不良(Duchenne型肌营养不良,DMD)、贝克肌营养不良、α-1-抗胰蛋白酶缺乏、庞贝病(糖原贮积病Ⅱ型)、强直性肌营养不良、亨廷顿病、脆性X综合征、弗里德赖希共济失调、肌萎缩侧索硬化、遗传性慢性肾脏病、镰状细胞病、β地中海贫血、额颞叶痴呆、莱伯氏先天性黑蒙、高脂血症、高胆固醇血症、转甲状腺素蛋白淀粉样变、原发性高草酸尿症(PH1)、肺炎、肝炎、遗传性血管性水肿(HAE)、视网膜疾病、黄斑变性、维尔姆斯瘤、尤文肉瘤、神经内分泌瘤、胶质母细胞瘤、神经母细胞瘤、黑色素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性髓细胞性白血病、慢性淋巴细胞白血病、慢性髓细胞性白血病、何杰金氏淋巴瘤、非何杰金氏淋巴瘤和尿膀胱癌)。
在一个实施方式中,所述病症或疾病包括癌症或感染性疾病;
在一个实施方式中,所述癌症包括维尔姆斯瘤、尤文肉瘤、神经内分泌瘤、胶质母细胞瘤、神经母细胞瘤、黑色素瘤、皮肤癌、乳腺癌、结肠癌、直肠癌、前列腺癌、肝癌、肾癌、胰腺癌、肺癌、胆道癌、宫颈癌、子宫内膜癌、食管癌、胃癌、头颈癌、甲状腺髓样癌、卵巢癌、胶质瘤、淋巴瘤、白血病、骨髓瘤、急性淋巴细胞白血病、急性髓细胞性白血病、慢性淋巴细胞白血病、慢性髓细胞性白血病、何杰金氏淋巴瘤、非何杰金氏淋巴瘤或尿膀胱癌中的一种或多种;
在一个实施方式中,所述病症或疾病包括囊性纤维化、进行性假肥大性肌营养不良、贝克肌营养不良、α-1-抗胰蛋白酶缺乏、庞贝病、强直性肌营养不良、亨廷顿病、脆性X综合征、弗里德赖希共济失调、肌萎缩侧索硬化、额颞叶痴呆、遗传性慢性肾脏病、高脂血症、高胆固醇血症、莱伯氏先天性黑蒙、镰状细胞病、高胆固醇血症、转甲状腺素蛋白淀粉样变或β地中海贫血中的一种或多种;
在一个实施方式中,所述感染性疾病的感染原包括人类免疫缺陷病毒、单纯疱疹病毒-1或单纯疱疹病毒-2中的一种或多种。
本发明的主要优点包括:
(a)本发明首次发现一种新的Cas蛋白,与已知Cas蛋白的同源性较低。
(b)本发明的Cas蛋白为全新的Cas酶,其在体内和体外表现出较好的核酸酶的活性,具有广泛的应用前景。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
除非有特别说明,否则本发明实施例中的试剂和材料均为市售产品。
实施例1新Cas蛋白的鉴定。
发明人通过利用计算程序对宏基因组数据进行挖掘,对未培养物的宏基因组进行分析,通过对去冗余、蛋白质聚类分析,鉴定得到了两个新的Cas蛋白,将其命名为CasW2、CasW3,其氨基酸序列分别如SEQ ID No.1-2所示,核苷酸编码序列分别如SEQ ID No.3-4所示。
通过对宏基因组进行分析预测和筛选得到新型CRISPR-Cas系统相关的蛋白和相关的元件,将本发明的CRISPR-Cas效应蛋白与已有效应蛋白相比,发现其与已知Cas蛋白相似度较低。经序列比对,鉴定出CasW2、CasW3为Cas12家族。
通过分析发现,本发明所获得CasW2蛋白对应的PAM为5’-TTTN,N代表A/T/G/C;CasW3蛋白对应的PAM为5’-TTTN,N代表A/T/G/C。
通过PILER-CR对含CasW2、CasW3的样品进行CRISPR基因座进行注释,得到CasW2、CasW3对应的编码同向重复(Direct Repeat,DR)序列的DNA分别如SEQ ID No.5、6所示。
经鉴定,CasW2、CasW3为Cas12家族。
实施例2CasW2、CasW3切割活性鉴定。
为验证CasW2、CasW3是否具有双链DNA核酸酶活性,发明人对其切割活性进行了验证。
1、构建CasW2、CasW3的表达载体。
合成上述编码CasW2、CasW3的核苷酸序列片段,并将其采用限制性内切酶酶切和T4 DNA l igase连接的方法克隆到原核蛋白表达载体pET-28a(+)(百奥莱博,#QN1060),得到连接产物pET-28a(+)-CasW2表达载体和pET-28a(+)-CasW3表达载体,图谱参见图1和图2。
具体连接方式如下:
发明人对获得的CasW2片段和CasW3片段分别进行PCR,并分别采用EcoRI/NotI双酶切,同时对原核蛋白表达载体pET-28a(+)进行EcoRI/NotI双酶切。之后将CasW2片段、CasW3片段双酶切产物分别和原核蛋白表达载体pET-28a(+)双酶切产物进行琼脂糖凝胶电泳,电泳结果如图3所示,显示获得了大小正确的酶切产物CasW2、CasW3核苷酸片段以及切除EcoRI/NotI酶切位点中间11bp的pET-28a(+)载体片段。
之后发明人将pET-28a(+)-CasW2表达载体和pET-28a(+)-CasW3表达载体分别转化至大肠杆菌感受态细胞DH5a中,并将感受态细胞DH5a接种于LB固体平板(卡那抗性)。37℃恒温箱倒置培养过夜,之后挑取单菌落进行Sanger测序,序列结果显示序列正确的质粒克隆进行质粒抽提,即获得pET-28a(+)-CasW2表达载体和pET-28a(+)-CasW3表达载体。
2、CasW2、CasW3蛋白的体外纯化。
(1)转化:从-80℃冰箱取出一管感受态细胞大肠杆菌BL21(DE3)(上海唯地生物技术有限公司,EC1002)置于冰上溶解5min,然后吸取1ng pET-28a(+)-CasW2表达载体质粒加入到上述感受态细胞中,用手指轻弹管底混匀并在冰上静置25min。45℃水浴热激45sec,迅速放回冰上静置2min,向离心管加入700ul无抗LB培养基,37℃,220rpm复苏60min。待复苏完成,5000rpm离心1min收菌,弃掉600μl上清液,然后轻轻将剩余液体和感受态细胞混匀后涂布于LB平板,使用玻璃珠涂板。
(2)诱导:从转化的LB平板上挑单克隆,并将该单克隆培养至3ml含有卡那霉素(10mg/ml)的LB液体培养基,之后置于摇床上,在37℃、220rpm条件下培养8h。将3ml LB中的菌转接至300ml含有含卡那霉素的2x YT培养基,往菌液中加入150ul IPTG(终浓度0.5mM),16℃过夜诱导13-14h。
(3)收菌:将诱导后获得的菌液在4500rpm、4℃条件下,离心10min,弃掉上清。用15ml的咪唑(浓度为10mM)将菌种重悬在50ml离心管里(加入咪唑用于竞争性洗脱CasW2蛋白),再补加150μl的PMSF蛋白酶抑制剂(用于抑制蛋白降解,提高收率)。
(4)超声:将50ml离心管竖直固定在盛满冰水的烧杯中,调整位置,使超声探头在菌液液面以下。超声模式:工作3s,间歇12s,200w,60次。超声结束后补加150μl的PMSF蛋白酶抑制剂,之后在11000rpm、4℃条件下,离心25min。
(5)Beads预处理:吸取300μl Ni-NTA Agarose beads(QIAGEN,#30230)到15ml离心管里,加入10ml PBS,室温旋转5min,1000g,2min,4℃离心,用胶头滴管吸去上清,重复用PBS清洗一次。随后加入10ml咪唑(浓度为10mM),室温旋转5min,1000g,2min,4℃离心,胶头滴管小心吸去上清,将装有洗好beads的15ml离心管放置冰上备用。
(6)将步骤(4)离心后获得的菌液上清全部吸到步骤(5)得到的装有Ni-NTAAgarose beads的离心管里,4℃条件下旋转孵育1h。
(7)清洗(Wash):Ni-NTA Agarose beads用10ml咪唑(浓度为40mM)洗脱两次。每次加完咪唑,4℃旋转5min,再在4℃条件下,1000×g,离心2min。用500μl咪唑(浓度为250mM)重悬Ni-NTA Agarose beads,之后转移至预冷的亲和层析柱(MedChemExpress,#HY-K0221),平衡5min,用1.5ml的离心管收集250mM咪唑洗脱的蛋白组分,上述洗脱步骤重复三次。
(8)用NanoDrop OD280测完各管蛋白浓度后,将蛋白液收集在一起,通过30kd的超滤管将蛋白置换到PBS缓冲液里,加入终浓度为10%的甘油,分装后液氮速冻,保存在-80℃冰箱。SDS-PAGE聚丙烯酰胺凝胶电泳鉴定蛋白大小和纯度。
采用同样的方式纯化CasW3蛋白,同样采用SDS-PAGE聚丙烯酰胺凝胶电泳鉴定蛋白大小和纯度。电泳结果如图4所示,CasW3蛋白的大小约为180kd,CasW2蛋白的大小约为170kd,表明已获得纯化效果较好的CasW2和CasW3蛋白。
3、体外切割验证
3.1制备体外切割dsDNA模板。
以HepG2细胞(ATCC,货号HB-8065)基因组为模板,根据hHPRT1基因(Genebank,NG_012329.2)dsDNA模板制备正向和反向引物,上下游引物如下所示:
hHPRT1-dsDNA-F:gtagtgtcaactcattgctg(SEQ ID NO.7);
hHPRT1-dsDNA-R:gtcaagggcatatcctacaa(SEQ ID NO.8)。
采用Taq酶进行PCR扩增,反应体系如下所示:
基因组DNA(作为模板)1μl(总量100ng),2×Taq PCR mix 10μl,上、下游引物分别为0.5μl,ddH2O补齐至总体积为20μl。
PCR反应程序如下:
95℃5min;94℃30s,55℃30s,72℃20s,35个循环;72℃10min;12℃保温。
之后将PCR产物进行琼脂糖凝胶电泳,电泳结果如图5所示。之后用琼脂糖凝胶DNA回收试剂盒(TIANGEN,DP219-02)进行胶回收,最后用无酶水洗脱,得到体外切割dsDNA模板。
3.2体外酶切反应。
为检测CasW2、CasW3的切割活性,发明人设计了两组对比实验,分别对其切割活性进行了比较,第一组为CasW2、CasW3和HED Cas 12i.16的切割活性对比,第二组为CasW2、CasW3与S7R-Cas 12i.3的切割活性对比。
其中,HED Cas12i.16蛋白的氨基酸序列如SEQ ID NO.9所示,核苷酸编码序列如SEQ ID NO.10所示;S7R-Cas12i.3蛋白的氨基酸序列如SEQ ID NO.11所示,核苷酸序列如SEQ ID NO.12所示。
采用实施例2步骤1-2的方法分别构建HED Cas12i.16、S7R-Cas12i.3表达载体(所获得的重组表达载体图谱见图6、7),表达、纯化HED Cas12i.16、S7R-Cas 12i.3蛋白。
3.2.1CasW2、CasW3与HED Cas12i.16、S7R-Cas12i3的切割活性比较。
具体操作步骤如下:
(1)分别制备CasW2-crRNA、CasW3-crRNA、HED Cas12i.16-crRNA以及S7R-Cas12i3。
根据hHPRT1基因设计靶向序列(spacer),命名为hHPRT1-spacer:GGTTAAAGATGGTTAAATGAT(SEQ ID NO.13)。
根据CasW2、CasW3、HED Cas12i.16及S7R-Cas 12i3的DR序列,分别设计对应的crRNA序列,并分别命名为CasW2-hHPRT1-crRNA、CasW3-hHPRT1-crRNA、HEDCas12i.16-hHPRT1-crRNA和S7R-Cas 12i3-hHPRT1-crRNA,序列中划线部分为DR序列,具体如下:
分别化学合成(由南京金斯瑞生物科技有限公司合成)CasW2-hHPRT1-crRNA、CasW3-hHPRT1-crRNA、HED Cas12i.16-hHPRT1-crRNA和S7R-Cas12i3-hHPRT1-crRNA序列片段。
(2)分别配制各个Cas蛋白与对应的hHPRT1-crRNA混合溶液,所述混合溶液组分如下:
NEBuffer r2.1(10×,NEB,#B6002S)3μl,crRNA(CasW2-hHPRT1-crRNA)3μl(浓度为30nM),Cas蛋白1μl(浓度为30nM),无酶H2O 20μl,反应体系总体积为27μl。
采用上述方式分别配制CasW2蛋白与CasW2-hHPRT1-crRNA混合溶液、CasW3蛋白与CasW3-hHPRT1-crRNA混合溶液、HED Cas12i.16与HED Cas12i.16-hHPRT1-crRNA混合溶液以及S7R-Cas12i3与S7R-Cas12i3-hHPRT1-crRNA混合溶液,之后将各个混合溶液分别置于PCR仪中,25℃条件下反应10min。
之后分别向混合溶液中加入3uL 60nM dsDNA溶液(终浓度为6nM),总的反应体系为30μl,充分混匀,瞬离后置于PCR仪中37℃孵育10分钟。
(3)向步骤(2)各个反应体系中分别加入1uL Proteinase K充分混匀,瞬离,室温条件下孵育10分钟,消化掉反应体系中的蛋白组分;
(4)采用磁珠纯化酶切反应后的DNA片段。
提前20min将DNA分选磁珠液(诺唯赞,货号N411-02)从4℃冰箱取出,平衡至室温。上下颠倒混匀磁珠,吸取3倍体积(约150μl)的磁珠液加入至步骤(3)得到的dsDNA切割产物中,并使用移液器轻轻吹打10次混匀,室温条件下孵育10min,使dsDNA切割产物结合到磁珠上。将盛有dsDNA切割产物样品溶液的PCR管置于磁力架上,待溶液澄清后,小心移除上清。保持前述PCR管始终处于磁力架上,加入200μl新鲜配制的80%乙醇以漂洗磁珠,室温孵育30s,小心移除上清。之后重复漂洗一次。室温下开盖干燥磁珠5min,将PCR管从磁力架上取出,加入15μl无酶水,涡旋震荡或使用移液器吹打充分混匀,室温静置2min。之后再将PCR管置于磁力架上静置5min,待溶液澄清后,小心吸取上清至一个新的无核酸酶PCR管中。
(5)随后用便携式生物分析仪(厚泽生物,Qsep1)分析dsDNA切割产物,参考S1高分辨率卡夹(厚泽生物,C105102)检测方案检测酶切效果,体外切割的毛细电泳图如图9所示,切割分析对比结果如图8所示。通过Qsep1自带的Smear分析选项分析得出CasW2的切割活性为70%,CasW3的切割活性为35%,HED Cas12i.16的切割活性为14%,S7R-Cas12i3的切割活性为28%,CasW2和CasW3的切割活性均远高于HED Cas12i.16,切割活性也高于S7R-Cas12i3。
实施例3CasW2、CasW3在细胞内切割活性鉴定
1、CasW2、CasW3真核表达载体构建
(1)为了验证CasW2、CasW3在293T细胞中的切割活性,发明人构建了CasW2、CasW3真核表达载体,采用CMV启动子驱动Cas转录,采用U6启动子驱动crRNA转录。针对TTR基因设计靶向序列(SEQ ID NO.18),设计并合成CasW2、CasW3蛋白对应的TTR-crRNA序列:TTR-CasW2-crRNA(SEQ ID NO.21),TTR-CasW3-crRNA(SEQ ID NO.22),表达载体图谱如图10和11所示。
2、293T细胞准备以及CasW2、CasW3真核表达载体转染。
(1)将完全培养基DMEM(Gibco,11965092),在该培养基中加有5% FBS
(ExCell Bio FSP500)和1%双抗(Gibco 15070063),置于37℃水浴锅预热到37℃。
(2)细胞复苏:将冻存的293T细胞(约6×106个细胞量)转入37℃水浴锅中解冻,加入至前述装有预热的完全培养基DMEM的离心管中,室温条件下,400×g离心5min;离心后去上清,再次加入1ml完全培养基,吹打重悬细胞,得到细胞悬液。将细胞悬液加入至装有9ml完全培养基DMEM的新的培养皿中混匀,并置于37℃培养箱培养48h,待293T细胞密度达80-90%,进行细胞传代。
(3)细胞铺板:采用48孔板铺板,每孔1×105细胞量,每孔加入300μl完全培养基DMEM。待293T细胞密度达80-90%时进行转染操作。
配制由减血清DMEM培养基(每孔15μL,源培生物L530KJ)和Lipo3000转染试剂(每孔0.8μL,Invitrogen,L3000008)组成的转染试剂。按照每孔300ng表达质粒的量配制质粒稀释液。之后向质粒稀释液中加入等体积的转染试剂,得到转染混合液,室温静置10min。从培养箱中拿出铺有细胞的48孔板。静置结束后,将转染混合液加入对应孔中(每孔30μl),混匀后将细胞放置于37℃培养箱内继续培养48h。
3、293T细胞中CasW2、CasW3对TTR切割活性鉴定
依据TTR基因组Cas蛋白作用切口位置,设计编辑效率鉴定引物(TTR-F:
SEQ ID NO.19;TTR-R:SEQ ID NO.20)。转染48h后,采用基因组DNA抽提试剂盒(TIANGEN,DP304)抽提基因组,并以该基因组DNA为PCR模板,用编辑效率鉴定引物进行PCR扩增,将PCR产物进行Sanger测序(铂尚生物)。将测序结果采用Synthego(https://ice.synthego.com/#/)进行编辑效率分析。如图12所示,CasW2、CasW3对TTR切割活性分别为16.7%和5.4%,均具有显著的切割活性,且CasW2的切割活性远高于CasW3,均具有潜在的应用前景。
序列信息
/>
/>
/>
/>
/>
/>
/>
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
Claims (24)
1.一种Cas蛋白,其特征在于,所述蛋白选自下组:
(a)具有SEQ ID NO:1或2所示氨基酸序列的多肽;
(b)具有与SEQ ID NO:1或2所示氨基酸序列≥80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或99.5%同源性(或同一性)的多肽,且所述多肽具有SEQ ID NO:1的生物学功能;
(c)将SEQ ID NO:1或2中任一所示氨基酸序列经过一个或多个(较佳地,1-20个,更佳地为1-10个、更佳地1-5个)氨基酸残基的取代、缺失或添加而形成的,且保留SEQ ID NO:1或2的生物学功能的衍生多肽。
2.一种融合蛋白,其特征在于,包含权利要求1所述的Cas蛋白;以及一个或多个功能结构域。
3.一种分离的多核苷酸,其特征在于,所述的多核苷酸编码权利要求1所述的Cas蛋白或权利要求2所述的融合蛋白。
4.一种分离的核酸分子,其特征在于,包含选自下列的序列,或由选自下列的序列组成:
(i)SEQ ID NO:5或6所示的序列;
(ii)与SEQ ID NO:5或6所示的序列相比具有一个或多个碱基的置换、缺失或添加(例如1个,2个,3个,4个,5个,6个,7个,8个,9个或10个碱基的置换、缺失或添加)的序列;
(iii)与SEQ ID NO:5或6所示的序列具有至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%的序列同一性的序列;
(iv)在严格条件下与(i)-(iii)任一项中所述的序列杂交的序列;或
(v)(i)-(iii)任一项中所述的序列的互补序列;
并且,(ii)-(v)中任一项所述的序列基本保留了其所源自的序列的生物学功能;
例如,所述分离的核酸分子是RNA;
例如,所述分离的核酸分子包含CRISPR/Cas系统中的同向重复序列。
5.一种向导RNA(gRNA),其特征在于,所述向导RNA包括能够结合权利要求1所述Cas蛋白的同向重复(Direct Repeat,DR)序列和能够靶向靶序列的间隔(spacer)序列。
6.一种复合物,其特征在于,包含:
(i)蛋白组分,选自下组:权利要求1所述的Cas蛋白、权利要求2所述的融合蛋白、或其组合;和
(ii)核酸组分,选自下组:权利要求5所述的向导RNA,编码权利要求5所述的向导RNA的核酸,权利要求5所述的向导RNA的前体RNA,编码权利要求5所述的向导RNA的前体RNA核酸、或其组合;
其中,所述蛋白组分与核酸组分相互结合形成复合物。
7.一种载体,其特征在于,包含权利要求3所述的多核苷酸或权利要求4所述的核酸分子或权利要求5所述的向导RNA。
8.一种CRISPR-Cas组合物,其特征在于,包含:
(i)第一组分,选自下组:权利要求1所述的Cas蛋白、权利要求2所述的融合蛋白、编码权利要求1所述的Cas蛋白或权利要求2所述的融合蛋白的核苷酸序列,以及其任意组合;和
(ii)第二组分,所述第二组分为包含一种或多种权利要求5所述的向导RNA,或者编码所述包含一种或多种权利要求5所述的向导RNA的核苷酸序列;
所述向导RNA能够与(i)中所述的蛋白或蛋白变体或融合蛋白形成复合物。
9.一种CRISPR-Cas系统,其特征在于,包含一种或多种载体,所述一种或多种载体包含:
(i)第一核酸,其为编码权利要求1所述的Cas蛋白或权利要求2所述的融合蛋白的核苷酸序列;任选地所述第一核酸可操作地连接至第一调节元件;以及
(ii)第二核酸,其编码包含权利要求5所述的向导RNA的核苷酸序列;任选地所述第二核酸可操作地连接至第二调节元件;
其中:
所述第一核酸与第二核酸存在于相同或不同的载体上;
所述向导RNA能够与(i)中所述的Cas蛋白或融合蛋白形成复合物。
10.一种试剂盒,其特征在于,包括一种或多种选自下列的组分:权利要求1所述的Cas蛋白、权利要求2所述的融合蛋白、权利要求3所述的多核苷酸、权利要求6所述的复合物、权利要求7所述的载体、权利要求8所述的CRISPR-Cas组合物或权利要求9所述的系统。
11.一种递送组合物,其特征在于,包含递送载体,以及选自下列的一种或多种:权利要求1所述的Cas蛋白、权利要求2所述的融合蛋白、权利要求3所述的多核苷酸、权利要求6所述的复合物、权利要求7所述的载体、权利要求8所述的CRISPR-Cas组合物或权利要求9所述的系统。
12.一种宿主细胞,其特征在于,包含权利要求1所述的Cas蛋白、权利要求2所述的融合蛋白、权利要求3所述的多核苷酸、权利要求6所述的复合物、权利要求7所述的载体、权利要求8所述的CRISPR-Cas组合物或权利要求9所述的系统或权利要求11所述的递送组合物。
13.一种酶制剂,其特征在于,所述酶制剂包括权利要求1所述的Cas蛋白、权利要求2所述的融合蛋白、权利要求6所述的复合物、权利要求8所述的CRISPR-Cas组合物或权利要求9所述的系统或权利要求11所述的递送组合物。
14.一种药盒,其特征在于,包括:
第一容器,以及位于所述第一容器中的权利要求6所述的复合物或权利要求8所述的组合物或权利要求9所述的系统,或含有权利要求6所述的复合物或权利要求8所述的组合物或权利要求9所述的系统的药物。
15.一种药盒,其特征在于,包括:
(a1)第一容器,以及位于所述第一容器中的权利要求1所述的Cas蛋白、或权利要求2所述的融合蛋白、或其编码基因或其表达载体,或含有权利要求1所述的Cas蛋白、或权利要求2所述的融合蛋白、或其编码基因或其表达载体的药物;
(b1)任选的第二容器,以及位于所述第二容器中的权利要求5所述的向导RNA或其表达载体,或含有权利要求5所述的向导RNA或其表达载体的药物。
16.一种靶向和编辑靶基因或切割靶基因的方法,其特征在于,包括:权利要求1所述的Cas蛋白、或权利要求2所述的融合蛋白、或权利要求6所述的复合物或权利要求8所述的组合物或权利要求9所述的系统或权利要求11所述的递送组合物或权利要求13所述的酶制剂或权利要求14或15所述的药盒与所述靶基因接触,或者递送至包含所述靶基因的细胞中,靶序列存在于所述靶基因中。
17.一种诱导细胞状态改变的方法,其特征在于,所述方法包括将权利要求1所述的Cas蛋白、或权利要求2所述的融合蛋白、或权利要求6所述的复合物或权利要求8所述的组合物或权利要求9所述的系统或权利要求11所述的递送组合物或权利要求13所述的酶制剂或权利要求14或15所述的药盒与细胞中的靶基因接触。
18.一种改变基因产物的表达的方法,其特征在于,包括:将权利要求1所述的Cas蛋白、或权利要求2所述的融合蛋白、或权利要求6所述的复合物或权利要求8所述的组合物或权利要求9所述的系统或权利要求11所述的递送组合物或权利要求13所述的酶制剂或权利要求14或15所述的药盒与编码所述基因产物的核酸分子接触,或者递送至包含所述核酸分子的细胞中,所述靶序列存在于所述核酸分子中。
19.一种由权利要求16-18中任一项所述的方法获得的细胞或其子代,其中所述细胞包含在其野生型中不存在的修饰。
20.权利要求19所述的细胞或其子代的细胞产物。
21.一种体外的、离体的或体内的细胞或细胞系或它们的子代,其特征在于,所述细胞或细胞系或它们的子代包含:权利要求1所述的Cas蛋白、或权利要求2所述的融合蛋白、或权利要求3所述的多核苷酸或权利要求6所述的复合物或权利要求7所述的载体或权利要求8所述的组合物或权利要求9所述的系统或权利要求11所述的递送组合物。
22.权利要求1所述的Cas蛋白、或权利要求2所述的融合蛋白、或权利要求3所述的多核苷酸或本权利要求6所述的复合物或权利要求7所述的载体或权利要求8所述的组合物或权利要求9所述的系统或权利要求10所述的试剂盒或权利要求11所述的递送组合物或权利要求13所述的酶制剂或权利要求14或15所述的药盒的用途,其特征在于,用于制备药物或制剂,所述药物或制剂用于核酸编辑(例如,基因或基因组编辑)。
23.权利要求1所述的Cas蛋白、或权利要求2所述的融合蛋白、或权利要求3所述的多核苷酸或本权利要求6所述的复合物或权利要求7所述的载体或权利要求8所述的组合物或权利要求9所述的系统或权利要求10所述的试剂盒或权利要求11所述的递送组合物或权利要求13所述的酶制剂或权利要求14或15所述的药盒的用途,其特征在于,用于制备药物或制剂,所述药物或制剂用于选自下组的一种或多种:
(i)离体基因或基因组编辑;
(ii)离体单链DNA的检测;
(iii)编辑靶基因座中的靶序列来修饰生物或非人类生物;
(iv)治疗由靶基因座中的靶序列的缺陷引起的病症;
(v)治疗有需要的受试者的病症或疾病。
24.一种检测样品中是否存在靶标核酸分子的方法,其特征在于,所述方法包括将样品与权利要求1所述的Cas蛋白、或权利要求2所述的融合蛋白、或权利要求6所述的复合物或权利要求8所述的组合物或权利要求9所述的系统或权利要求10所述的试剂盒或权利要求11所述的递送组合物或权利要求13所述的酶制剂和非靶序列接触,检测非靶序列被切割产生的可检测信号,从而检测靶标核酸分子,所述非靶序列不与向导RNA杂交。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310967771.7A CN117165557A (zh) | 2023-08-02 | 2023-08-02 | Cas蛋白、其相应的基因编辑系统及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310967771.7A CN117165557A (zh) | 2023-08-02 | 2023-08-02 | Cas蛋白、其相应的基因编辑系统及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117165557A true CN117165557A (zh) | 2023-12-05 |
Family
ID=88945866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310967771.7A Pending CN117165557A (zh) | 2023-08-02 | 2023-08-02 | Cas蛋白、其相应的基因编辑系统及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117165557A (zh) |
-
2023
- 2023-08-02 CN CN202310967771.7A patent/CN117165557A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115651927B (zh) | 编辑rna的方法和组合物 | |
US20210316014A1 (en) | Nucleic acid constructs and methods of use | |
KR20220004674A (ko) | Rna를 편집하기 위한 방법 및 조성물 | |
JP7109547B2 (ja) | 真核ゲノム修飾のための操作されたCas9システム | |
CN114672473B (zh) | 一种优化的Cas蛋白及其应用 | |
CN110402287A (zh) | CRISPR/Cpf1系统和方法 | |
CN113881652B (zh) | 新型Cas酶和系统以及应用 | |
CN113015798B (zh) | CRISPR-Cas12a酶和系统 | |
WO2018227755A1 (zh) | 用于特异性修复人hbb基因突变的碱基编辑系统、方法、试剂盒及其应用 | |
KR20230002401A (ko) | C9orf72의 표적화를 위한 조성물 및 방법 | |
WO2019120193A1 (zh) | 拆分型单碱基基因编辑系统及其应用 | |
CN114507654B (zh) | Cas酶和系统以及应用 | |
WO2019041344A1 (en) | METHODS AND COMPOSITIONS FOR THE TRANSFECTION OF SINGLE STRANDED DNA | |
WO2020068196A2 (en) | Proteins that inhibit cas12a (cpf1), a crispr-cas nuclease | |
JP3844656B2 (ja) | 動物細胞の形質転換のための方法 | |
WO2019076651A1 (en) | MODULATED CASE INHIBITORS | |
CN116162609A (zh) | Cas13蛋白、CRISPR-Cas系统及其应用 | |
CN117165557A (zh) | Cas蛋白、其相应的基因编辑系统及应用 | |
CN116622678A (zh) | 一种基因编辑蛋白、其相应的基因编辑系统及应用 | |
CN116376874A (zh) | 一种Cas蛋白、其基因编辑系统及应用 | |
US20230323335A1 (en) | Miniaturized cytidine deaminase-containing complex for modifying double-stranded dna | |
WO2023220649A2 (en) | Effector protein compositions and methods of use thereof | |
WO2024121790A2 (en) | Cas12 protein, crispr-cas system and uses thereof | |
WO2024042479A1 (en) | Cas12 protein, crispr-cas system and uses thereof | |
CN115975986A (zh) | 突变的Cas12j蛋白及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |