CN116949011A - 经分离的Cas13蛋白、基于它的基因编辑系统及其用途 - Google Patents
经分离的Cas13蛋白、基于它的基因编辑系统及其用途 Download PDFInfo
- Publication number
- CN116949011A CN116949011A CN202310447170.3A CN202310447170A CN116949011A CN 116949011 A CN116949011 A CN 116949011A CN 202310447170 A CN202310447170 A CN 202310447170A CN 116949011 A CN116949011 A CN 116949011A
- Authority
- CN
- China
- Prior art keywords
- cas13
- protein
- sequence
- nuclease
- domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 165
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 149
- 238000010362 genome editing Methods 0.000 title claims abstract description 36
- 239000012636 effector Substances 0.000 claims abstract description 56
- 108091033409 CRISPR Proteins 0.000 claims abstract description 24
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 9
- 101710163270 Nuclease Proteins 0.000 claims description 77
- 239000013612 plasmid Substances 0.000 claims description 72
- 102000039446 nucleic acids Human genes 0.000 claims description 30
- 108020004707 nucleic acids Proteins 0.000 claims description 30
- 150000007523 nucleic acids Chemical class 0.000 claims description 30
- 230000000694 effects Effects 0.000 claims description 29
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 20
- 125000006850 spacer group Chemical group 0.000 claims description 18
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 claims description 15
- 150000001413 amino acids Chemical class 0.000 claims description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 14
- 230000035772 mutation Effects 0.000 claims description 14
- 108091033319 polynucleotide Proteins 0.000 claims description 11
- 102000040430 polynucleotide Human genes 0.000 claims description 11
- 239000002157 polynucleotide Substances 0.000 claims description 11
- 230000004048 modification Effects 0.000 claims description 10
- 238000012986 modification Methods 0.000 claims description 10
- 230000007022 RNA scission Effects 0.000 claims description 9
- 230000003197 catalytic effect Effects 0.000 claims description 8
- 201000010099 disease Diseases 0.000 claims description 7
- 208000035475 disorder Diseases 0.000 claims description 7
- 230000000295 complement effect Effects 0.000 claims description 6
- 239000003814 drug Substances 0.000 claims description 6
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 5
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 4
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 4
- 102100026846 Cytidine deaminase Human genes 0.000 claims description 4
- 108010031325 Cytidine deaminase Proteins 0.000 claims description 4
- 102100034343 Integrase Human genes 0.000 claims description 4
- 241000713666 Lentivirus Species 0.000 claims description 4
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 4
- 230000004049 epigenetic modification Effects 0.000 claims description 4
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- 230000014621 translational initiation Effects 0.000 claims description 4
- 241000700605 Viruses Species 0.000 claims description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 abstract description 27
- 230000008685 targeting Effects 0.000 abstract description 13
- 210000004027 cell Anatomy 0.000 description 64
- 238000003776 cleavage reaction Methods 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 13
- 238000011529 RT qPCR Methods 0.000 description 12
- 108020004999 messenger RNA Proteins 0.000 description 12
- 238000001890 transfection Methods 0.000 description 12
- 238000003197 gene knockdown Methods 0.000 description 10
- 101000924461 Homo sapiens Annexin A4 Proteins 0.000 description 9
- 238000003762 quantitative reverse transcription PCR Methods 0.000 description 9
- 230000007017 scission Effects 0.000 description 9
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 8
- 238000004113 cell culture Methods 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 229960005322 streptomycin Drugs 0.000 description 8
- 102100034612 Annexin A4 Human genes 0.000 description 7
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 7
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 6
- 230000009368 gene silencing by RNA Effects 0.000 description 6
- 244000005700 microbiome Species 0.000 description 6
- 238000004445 quantitative analysis Methods 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 5
- 238000001727 in vivo Methods 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 238000002123 RNA extraction Methods 0.000 description 4
- 238000003559 RNA-seq method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 239000012096 transfection reagent Substances 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 238000010357 RNA editing Methods 0.000 description 3
- 230000026279 RNA modification Effects 0.000 description 3
- 108091028113 Trans-activating crRNA Proteins 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 238000010453 CRISPR/Cas method Methods 0.000 description 2
- 102100030801 Elongation factor 1-alpha 1 Human genes 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 102100029974 GTPase HRas Human genes 0.000 description 2
- 102100039788 GTPase NRas Human genes 0.000 description 2
- 101000920078 Homo sapiens Elongation factor 1-alpha 1 Proteins 0.000 description 2
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 2
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 2
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 description 2
- 101000954986 Homo sapiens Merlin Proteins 0.000 description 2
- 101000741790 Homo sapiens Peroxisome proliferator-activated receptor gamma Proteins 0.000 description 2
- 101100385364 Listeria seeligeri serovar 1/2b (strain ATCC 35967 / DSM 20751 / CCM 3970 / CIP 100100 / NCTC 11856 / SLCC 3954 / 1120) cas13 gene Proteins 0.000 description 2
- 102100037106 Merlin Human genes 0.000 description 2
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 101150098304 cas13a gene Proteins 0.000 description 2
- 101150055766 cat gene Proteins 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 230000009437 off-target effect Effects 0.000 description 2
- 238000007427 paired t-test Methods 0.000 description 2
- 238000013081 phylogenetic analysis Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000012353 t test Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 description 1
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- 102100038825 Peroxisome proliferator-activated receptor gamma Human genes 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241000192031 Ruminococcus Species 0.000 description 1
- 108010017324 STAT3 Transcription Factor Proteins 0.000 description 1
- 102100024040 Signal transducer and activator of transcription 3 Human genes 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- BQRGNLJZBFXNCZ-UHFFFAOYSA-N calcein am Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC(CN(CC(=O)OCOC(C)=O)CC(=O)OCOC(C)=O)=C(OC(C)=O)C=C1OC1=C2C=C(CN(CC(=O)OCOC(C)=O)CC(=O)OCOC(=O)C)C(OC(C)=O)=C1 BQRGNLJZBFXNCZ-UHFFFAOYSA-N 0.000 description 1
- 238000003570 cell viability assay Methods 0.000 description 1
- 238000002856 computational phylogenetic analysis Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Enzymes And Modification Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本申请涉及经分离的新型CRISPR/Cas13蛋白,基于它的基因编辑系统以及使用它们进行RNA水平基因编辑的方法。本申请提供了非天然存在或经工程化改造的RNA靶向系统,这些系统含有一个靶向RNA的新型Cas13效应蛋白,以及至少一种向导分子。
Description
技术领域
本申请为生物技术领域,具体涉及经分离的Cas13蛋白,基于它的基因编辑系统以及使用它们进行RNA水平基因编辑的方法。
背景技术
基因编辑(gene editing)技术使得DNA序列定位点进行改造成为可能,比如第一代基因编辑工具锌指核酸酶(zinc fingernucleases,ZFNs),第二代基因编辑工具类似转录激活的小型核酸酶(transcription activator-like effector nucleases,TALENs),第三代基因编辑工具中的II型及V型的成簇的规律间隔的短回文重复序列(CRISPR,Clustered Regularly Interspaced Short Palindromic Repeat)/Cas(CRISPR-associated protein)都可以用于靶向改造基因组,但这些基因编辑系统只能靶向基因组及外来的DNA,而不能对体内RNA进行靶向编辑。
VI型的CRISPR/Cas13系统,是来自古生菌和细菌的天然免疫系统。其不同于以往基因编辑工具,利用核酸碱基互补配对原理进行目标RNA序列的识别,引导Cas效应蛋白进行靶向切割,适用性强、设计简单、效率高。
其中,VI-D型CRISPR/Cas13基因编辑系统是现下应用较为广泛的VI型CRISPR/Cas系统。这一系统在原核生物中可通过识别并切割靶向的多核苷酸上双侧的原间隔序列侧翼位点(Protospacer flanking site,PFS)序列,从而对单链RNA进行靶向编辑,而在真核生物中,VI-D型CRISPR/Cas系统对RNA的靶向编辑作用无PFS序列。同时相比于其他VI型系统,VI-D型系统具有更小的蛋白体积,在基于腺相关病毒(Adeno-associatedvirus,AAV)的基因治疗具有更好的前景。在庞大以及各色各样的宏基因组中,隐藏了尚未培养甚至尚未发现的微生物,可能存在大量的未被发现的VI型CRISPR/Cas13系统,在这些微生物中寻找和克隆获得更具优良特性的Cas蛋白是人们所期望的。
发明内容
本申请的目的就是在宏基因组中寻找新型Cas13基因编辑系统并开发其用途。具体地提供了:
1.经分离的Cas13核酸酶蛋白,所述Cas13蛋白的氨基酸序列包括:
a)如SEQ ID NO.1~28中任一项所示的氨基酸序列;或,
b)与SEQ ID NO.1~28中的任一项具有至少80%序列同一性、且具有RNA切割活性的氨基酸序列。
2.如项2所述的Cas13核酸酶蛋白,其中所述Cas13蛋白是Cas13bt1、Cas13bt2、Cas13g、Cas13h、Cas13i、Cas13j或Cas13k蛋白。
3.一种工程化的Cas13核酸酶效应蛋白,包含:
a)如SEQ ID NO.1~28中任一项所示的氨基酸序列;或,
b)与SEQ ID NO.1~28中的任一项具有80%以上序列同一性、且具有RNA切割活性的氨基酸序列。
4.项3的效应蛋白,其中所述Cas13核酸酶效应蛋白通过氨基酸突变失去催化活性,例如所述Cas13核酸酶蛋白在其C端、N端的HEPN结构域(RxxxxH基序)进行突变形成dCas13蛋白。
5.项3或4所述的效应蛋白,其还包含与所述Cas13核酸酶蛋白融合的功能结构域。
6.项5所述的效应蛋白,所述功能结构域选自如下的一项或多项:翻译起始结构域、翻译阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告分子结构域和核酸酶结构域。
7.项6所述的效应蛋白,其中所述核碱基编辑结构域为腺苷脱氨酶、胞苷脱氨酶或所述它们的催化结构域融合。
8.一种多核苷酸,其编码项1或2的Cas13核酸酶蛋白或项3-7任一项的效应蛋白。
9.包含如项8所述的多核苷酸的载体,优选所述载体为质粒或慢病毒。
10.一种工程化的CRISPR-Cas13基因编辑系统,包含:
(a)项3-7中任一项所述的工程化Cas13核酸酶效应蛋白或编码所述效应蛋白的核酸;以及
(b)crRNA,其包含与靶序列互补的间隔区序列,当分别使用如SEQ ID NO.1~28所示的工程化Cas13核酸酶效应蛋白时所述crRNA还分别包含与SEQ ID NO.29~56所示的序列具有至少80%同一性的直接重复(directrepeat,DR)序列;
其中所述工程化的Cas13核酸酶效应蛋白和所述crRNA能够形成CRISPR复合物,所述CRISPR复合物特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。
11.包含如项10所述的工程化的CRISPR-Cas13基因编辑系统的试剂盒。
12.如项3-7任一项所述的工程化的CRISPR-Cas13核酸酶效应蛋白、项10的工程化的CRISPR-Cas13基因编辑系统在制备治疗与个体的细胞中与核酸突变相关的疾病或病症的药物中的用途。
13.一种修饰细胞中包含的靶核酸的方法,包括使所述细胞与项3-7任一项所述的工程化的CRISPR-Cas13核酸酶蛋白效应蛋白、项10的工程化的CRISPR-Cas13基因编辑系统接触从而实现对细胞中所述靶核酸的修饰。
14.如项3-7任一项所述的工程化的CRISPR-Cas13核酸酶效应蛋白或项10的工程化的CRISPR-Cas13基因编辑系统的用于制备用来治疗个体中与核酸突变相关的疾病或病症的药物的用途。
本申请还提供了:
1.经分离的Cas13核酸酶蛋白,所述Cas13核酸酶蛋白的氨基酸序列为:
a)如SEQ ID NO.1~28中任一序列所示的氨基酸序列;或,
b)与SEQ ID NO.1~28中的任一序列具有至少80%的序列同一性、且具有RNA切割活性的氨基酸序列。
2.如项1所述的Cas13核酸酶蛋白,其中所述Cas13核酸酶蛋白是Cas13bt1、Cas13bt2、Cas13g、Cas13h、Cas13i、Cas13j或Cas13k蛋白,优选为Cas13g3。
3.一种工程化的Cas13核酸酶效应蛋白,包含Cas13核酸酶蛋白,该Cas13核酸酶蛋白包含:
a)如SEQ ID NO.1~28中任一序列所示的氨基酸序列;或,
b)与SEQ ID NO.1~28中的任一序列具有80%以上序列同一性、且具有RNA切割活性的氨基酸序列。
4.如项3的所述效应蛋白,其中所述Cas13核酸酶蛋白通过氨基酸突变失去催化活性,例如所述Cas13核酸酶蛋白在其C端和/或N端的HEPN结构域(RxxxxH基序)通过氨基酸突变形成dCas13蛋白。
5.项3或4所述的效应蛋白,其还包含与所述Cas13核酸酶蛋白融合的功能结构域。
6.如项5所述的效应蛋白,所述功能结构域选自如下的一项或多项:翻译起始结构域、翻译阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告分子结构域和核酸酶结构域。
7.如项6所述的效应蛋白,其中所述核碱基编辑结构域为腺苷脱氨酶、胞苷脱氨酶或它们的催化结构域。
8.一种多核苷酸,其编码项1或2的Cas13核酸酶蛋白或项3-7任一项的效应蛋白。
9.包含如项8所述的多核苷酸的载体,所述载体为质粒或病毒,所述病毒优选为慢病毒。
10.一种工程化的CRISPR-Cas13基因编辑系统,包含:
(a)如项1或2所述的核酸酶、如项3-7中任一项所述的工程化Cas13核酸酶效应蛋白或编码所述效应蛋白的核酸;以及
(b)crRNA,其包含与靶核酸中的靶序列互补的间隔区序列;
其中所述工程化的Cas13核酸酶效应蛋白和所述crRNA能够形成CRISPR复合物,所述CRISPR复合物特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。
11.如项10所述的CRISPR-Cas13基因编辑系统,其中所述crRNA还包含直接重复(DR)序列,优选所述直接重复(DR)序列包含SEQ ID NO.29~56中任一序列所示的序列,或包含与SEQ ID NO.29~56中任一序列所示的序列具有至少80%同一性的序列。
12.包含如项10或11所述的工程化的CRISPR-Cas13基因编辑系统的试剂盒。
13.如项1或2所述的Cas13核酸酶蛋白、如项3-7中任一项所述的工程化的CRISPR-Cas13核酸酶效应蛋白、如项10或11所述的工程化的CRISPR-Cas13基因编辑系统在制备治疗与个体的细胞中与核酸突变相关的疾病或病症的药物中的用途。
14.一种修饰细胞中包含靶核酸的方法,包括使所述细胞与如项1或2所述的Cas13核酸酶蛋白、如项3-7任一项所述的工程化的Cas13核酸酶效应蛋白、如项10或11所述的工程化的CRISPR-Cas13基因编辑系统接触,从而实现对所述细胞中所述靶核酸的修饰。
15.包含如项1或2所述的Cas13核酸酶蛋白、如项3-7任一项所述的工程化的Cas13核酸酶效应蛋白或如项10或11所述的工程化的CRISPR-Cas13基因编辑系统的组合物,其用于核酸的修饰。
本申请的技术方案实现的有益技术效果
本申请通过对宏基因组数据进行分析,最后鉴定出5个全新亚型共75个Cas13蛋白。全新Cas13亚型命名为Cas13g-k;其中Cas13g蛋白质大小约为800个氨基酸,Cas13h-k蛋白大小约为1100个氨基酸。这些新型蛋白都体现了良好的RNA水平的靶向切割活性。我们报道新发现的Cas13g3蛋白可以设计成可编程的RNA编辑。Cas13g3体积为767aa,被认为是目前效率最高的小Cas13蛋白,可被用作有前途的哺乳动物RNA编辑工具。
附图说明
图1示出了通过对宏基因组数据进行分析,最后鉴定出5个全新亚型共75个Cas13蛋白的流程图。
图2示出了7个亚型与4个旧亚型蛋白同源性以及每种亚型蛋白平均大小的示意图。
图3示出了7个亚型与4个旧亚型蛋白同源性的另一示意图。
图4示出了Cas13bt1-Cas13k的Loci位点的间隔-定向重复序列的示意图。
图5示出了Cas13bt1-Cas13k的在C端、N端的HEPN结构域的示意图。
图6示出了Cas13bt1-Cas13k的RxxxxH基序的比例。
图7为Cas13bt1-Cas13k的在C端、N端的HEPN结构域的RxxxxH基序序列保守性示意图。
图8示出了Cas13bt1-Cas13k的DR序列预测结构的示意图。
图9示出了Cas13a-Cas13k的在各种环境的微生物中的分布比例。
图10示出了Cas13a-Cas13k的在自然界的存在比例。
图11A和11B为分析HEK293T细胞中Cas13蛋白RNA切割活性的实验过程的示意图。
图12为使用3'-DR或5'-DR-crRNA敲低mCherrymRNA的效率比较图。
图13A和13B为敲低mCherry mRNA筛选编辑效率高的Cas13蛋白的结果图。
图14A和14B为新型Cas13介导的ANXA4 mRNA敲除的实时定量逆转录PCR(realtime quantitative reverse transcription PCR,RT-qPCR)结果图。
图15示出了RfxCas13d、Cas13X1、Cas13bt1-11和Cas13g3介导的内源mRNA敲低的定量RT-qPCR结果图。
图16为新型Cas13d介导的ANXA4 mRNA敲低的RT-qPCR结果图。
图17示出了RfxCas13d、Cas13X1、Cas13bt1-11和Cas13g3介导的ANXA4 mRNA敲低的RNA-seq分析结果图。
图18A和18B示出了RfxCas13d、Cas13X1、Cas13bt1-11和Cas13g3的反式活性评估。
图19A和19B示出了Cas13g3系统最优spacer长度分析。
图20示出了Cas13g3系统PFS偏好性分析。
图21示出了NLS对Cas13g3系统干扰活性的影响。
图22示出了Cas13g3系统与其他Cas13系统RNA干扰能力的比较。
具体实施方式
下面将参照附图更详细地描述本发明的具体实施例。虽然附图中显示了本发明的具体实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明书的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。
如本文所用,就特定组分而言“基本上不含”在本文中用于表示特定组分未被有目的地配制到组合物中和/或仅作为污染物或以痕量存在。因此,由组合物的任何意外污染导致的特定组分的总量低于0.05%,优选低于0.01%。最优选的是其中特定组分的量用标准分析方法检测不到的组合物。
如在本说明书中所使用的,“一”或“一个”可以表示一个或多个。如权利要求中所使用的,当与单词“包含”一起使用时,单词“一”或“一个”可以表示一个或多于一个。
在权利要求中使用术语“或”用于表示“和/或”,除非明确指出仅指代替代方案或者替代方案是相互排斥的,尽管本公开内容支持仅指代替代方案和“和/或”的定义。如本文所用,“另一个”可以表示至少第二个或更多个。
贯穿本申请,术语“约”用于指示值包括装置的误差的固有变化,该方法用于测定该值或存在于研究对象之间的变化。
本申请在第一方面提供了一种经分离的Cas13核酸酶蛋白。
在一个具体实施方式中,提供了一种经分离的Cas13核酸酶蛋白,所述Cas13蛋白的氨基酸序列包括:a)如SEQ ID NO.1~28中任一项所示的氨基酸序列;或,b)与SEQ IDNO.1~28中的任一项具有80%以上序列同一性、且具有RNA切割活性的氨基酸序列。在又一具体实施方式中,提供了一种Cas13核酸酶蛋白,其中所述Cas13蛋白是Cas13bt1、Cas13bt2、Cas13g、Cas13h、Cas13i、Cas13j或Cas13k蛋白。
在本说明书的上下文中,术语Cas13a和C2c2可以互换使用。它最初是由Broad研究所的研究人员发现的。2015年,Shmakov及其同事利用Cas1作为“诱饵”,来鉴定细菌基因组中与CRISPR相关联的蛋白。通过此次分析,他们鉴定出53个候选基因,总共分成三大类:C2c1、C2c2和C2c3。C2c1和C2c3与Cpf1有些类似,不过它们需要tracrRNA和crRNA才能切割DNA目标,而Cpf1仅需要crRNA。而C2c2(也就是Cas13a)与Cas9的区别在于,Cas13a结合并切割RNA,而Cas9切割DNA。Cas9利用tracrRNA和crRNA来实现与DNA目标的结合和切割。而Cas13a只需要24个碱基的crRNA,它通过富含尿嘧啶的茎环结构与Cas13a分子相互作用,并通过Cas13a的一系列构象变化来促进目标的切割。与Cas9一样,Cas13a也能容忍crRNA与目标序列之间的单个错配,不过若存在2个错配,那切割效率就大大降低。它的PFS序列(相当于PAM序列)位于间隔区的3'端,由A、U或C碱基组成。Cas13a还有一个特别之处,那就是Cas13a一旦识别并切割由crRNA序列指定的RNA目标,它就转入了一种酶促“激活”状态,这时它将结合并切割其他的RNA,而不管它们是否与crRNA同源,或是否存在PFS;这一点与Cas9截然不同。在Cas13系统中不需要tracrRNA,只需要crRNA;而crRNA由DR序列(即直接重复序列)和spacer序列(间隔序列,即与靶序列互补的核苷酸序列)构成。
本申请在第二方面提供了一种工程化的Cas13核酸酶效应蛋白
在一个具体实施方式中,提供了一种工程化的Cas13核酸酶效应蛋白,包含:a)如SEQ ID NO.1~28中任一项所示的氨基酸序列;或,b)与SEQ ID NO.1~28中的任一项具有80%以上序列同一性、且具有RNA切割活性的氨基酸序列。优选所述核酸酶效应蛋白与与SEQ ID NO.1~28中的任一项具有80%以上、81%以上、82%以上、83%以上、84%以上、85%以上、86%以上、87%以上、88%以上、89%以上、90%以上、91%以上、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、99%以上、或100%的序列同一性。
在一个具体实施方式中,提供了一种工程化的Cas13核酸酶效应蛋白,所述Cas13核酸酶效应蛋白通过氨基酸突变失去催化活性,例如所述Cas13核酸酶蛋白在其C端、N端的HEPN结构域(RxxxxH基序)进行突变形成dCas13蛋白。
在本说明书的上下文中,术语HEPN是指Cas13a含有的两个结构域,它对于Cas13的作用相当于HNH和RuvC结构域对于Cas9的作用,是来切割目标核酸。HEPN结构域对Cas13a切割RNA目标是必需的。HEPN核糖核酸酶结构域的RxxxxH基序分别位于Cas13蛋白质的N端和C端。另外,与Cas9类似,Cas13a分子中关键残基的突变可以形成核酸酶活性缺失的Cas13a(dCas13a),它能够结合RNA目标但无法切割。RxxxxH基序为6个连续氨基酸,第一个氨基酸为精氨酸R,最后一个为组氨酸H,中间可以是任意氨基酸。RxxxxH基序即HEPN基序,具有核糖核酸酶功能。
在一个具体实施方式中,提供了一种工程化的Cas13核酸酶效应蛋白,其还包含与所述Cas13核酸酶蛋白融合的功能结构域。其中,所述功能结构域选自如下的一项或多项:翻译起始结构域、翻译阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告分子结构域和核酸酶结构域;其中所述核碱基编辑结构域为腺苷脱氨酶、胞苷脱氨酶或所述它们的催化结构域融合。
本申请在第三方面涉及一种多核苷酸。
在一个具体实施方式中,提供了一种多核苷酸,其编码前述Cas13核酸酶蛋白或前述工程化效应蛋白。
本申请在第四方面涉及一种多核苷酸的载体。
在一个具体实施方式中,提供了一种多核苷酸的载体,优选所述载体为质粒或慢病毒。
本申请在第五方面涉及一种基因编辑系统。
在一个具体实施方式中,提供了一种工程化的CRISPR-Cas13基因编辑系统,包含:(a)前述的工程化Cas13核酸酶效应蛋白或编码所述效应蛋白的核酸;以及(b)crRNA,其包含与靶序列互补的间隔区序列,当分别使用如SEQ ID NO.1~28所示的工程化Cas13核酸酶效应蛋白时所述crRNA还分别包含与SEQ ID NO.29~56所示的序列具有至少80%同一性的直接重复(DR)序列;其中所述工程化的Cas13核酸酶效应蛋白和所述crRNA能够形成CRISPR复合物,所述CRISPR复合物特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。优选所述直接重复(DR)序列与SEQ ID NO.29~56所示的序列具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列同一性。
本申请在第六方面涉及一种试剂盒。
在一个具体实施方式中,提供了包含前述工程化的CRISPR-Cas13基因编辑系统的试剂盒。
本申请在第七方面涉及工程化CRISPR-Cas13核酸酶效应蛋白的用途。
在一个具体实施方式中,提供了前述的工程化的CRISPR-Cas13核酸酶效应蛋白、前述工程化的CRISPR-Cas13基因编辑系统在制备治疗与个体的细胞中与核酸突变相关的疾病或病症的药物中的用途。
本申请在第八方面涉及一种修饰细胞中包含的靶核酸的方法。
在一个具体实施方式中,提供了一种修饰细胞中包含靶核酸的方法,包括使所述细胞与前述的工程化的CRISPR-Cas13核酸酶蛋白效应蛋白、前述工程化的CRISPR-Cas13基因编辑系统接触,从而实现对所述细胞中所述靶核酸的修饰。
本申请在第九方面涉及一种治疗个体中与核酸突变相关的疾病或病症用途。
在一个具体实施方式中,提供了前述的工程化的CRISPR-Cas13核酸酶效应蛋白或前述工程化的CRISPR-Cas13基因编辑系统的用于制备用来治疗个体中与核酸突变相关的疾病或病症的药物的用途。
实施例部分
实施例1:鉴定Cas13新亚型
寻找新的Cas13
从JGI(Joint Genome Institute)数据库下载主要来自人类和动物宿主、水生、自然和农业土壤等近10Tb(Terabyte)组装的宏基因组数据。使用MinCED软件预测大约500251个CRISPR array,提取CRISPR array区域上下游20kb(kilobase)序列作为候选序列,对候选序列使用Meta-GeneMark 1进行蛋白质开放性阅读框(open reading frame,ORF),得到2596558候选蛋白。鉴于已知Cas蛋白体积,我们将蛋白体积大于400个氨基酸的蛋白作为候选蛋白,获得395847个蛋白质。从NCBI(National Center forBiotechnologyInformation)中下载已知Cas13a、Cas13b、Cas13c和Cas13d序列,使用HH-suite3软件构建已知Cas13蛋白质数据库。将395847个候选蛋白与已知Cas13蛋白质数据库通过HH-suite3软件的hhsearch进行比对,获得具有比对结果的6400个蛋白。去除候选蛋白中不完整以及含有少于2个高等真核生物和原核生物的核苷酸结合(Higher eukaryotes andprokaryotes nuceotide-binding,HEPN)结构域蛋白,得到2253个候选物。除去已知Cas13蛋白序列,得到1139个新Cas13(图1)。
系统发育分析鉴定全新Cas13亚型
对候选蛋白进行系统发育分析以及分类,2253个候选蛋白首先通过MMseqs软件的cluster--min-seq-id 0.5-c 0.7参数进行初步聚类得到聚类,之后将每个聚类通过mmseqs软件的cluster--min-seq-id 0.9-c 0.8参数去除冗余蛋白。之后将每个聚类通过MAFFT软件进行多序列比对,比对结果通过HH-suite3软件的hhmake构建隐马尔可夫模型,之后将隐马尔可夫模型文件通过HH-suite3软件的hhalign进行相互比对。蛋白质之间比对分数用来计算进化距离。其中sij表示i蛋白与j蛋白比对分数;sji表示j蛋白与i蛋白比对分数;Sij表示i蛋白与j蛋白平均比对分数;dij代表i蛋白与j蛋白的进化距离。进化距离计算方式为Sij=(sij+sji)/2,dij=(log(min(Sii,Sjj))-log(Sij))/2。进化距离结果通过非加权组平均法(UPGMA)进行聚类分析。最后鉴定出很多已知Cas13a-d同源物和7个不同分支。其中两个分支与之前鉴定的Cas13X、Cas13Y和Cas13bt同源,我们将它们命名为Cas13bt1和Cas13bt2。剩余5个分支为全新亚型,我们命名为Cas13g-k。其中Cas13g蛋白质大小约为800个氨基酸,Cas13h-k蛋白大小约为1100个氨基酸(图1、2)。
Cas13亚型进化树分析
全新Cas13亚型蛋白与部分已知Cas13蛋白通过MUSCLE软件进行多序列比对,比对结果通过FastTree软件构建进化树,最后通过ITOL网站呈现进化树(图3)。
实施例2:鉴定Cas13新亚型的特征
新Cas13亚型CRISPR
loci分析
提取CRISPR array区域上下游20kb序列进行ORF预测,获得的蛋白序列使用blast软件进行比对。Cas13i具有CRISPR保守蛋白Cas1和Cas2,而其他Cas13亚型对应的CRISPRLoci缺乏这些保守蛋白(图4)。
Cas13亚型HEPN结构域分析
对每种亚型蛋白质序列通过MUSCLE软件进行多序列比对,比对结果提取出各个蛋白的HEPN结构域信息。绘制对应HEPN结构域在每个Cas13亚型的代表蛋白分布图(图5)。对每个Cas13亚型蛋白对应的RXXXXH基序进行排序,展现前两种基序所占比例(图6)。最后对全新Cas13亚型蛋白的HEPN结构域保守性进行分析(图7)。
全新Cas13亚型CRISPR阵列分析
通过MinCED软件寻找直接重复序列(DR),具体DR序列的信息见表1。通过RNAfold网站对全新Cas13亚型的DR序列的二级结构进行预测,显示其预测的结构也与之前Cas13a和Cas13b结构类似(图8)。全新Cas13亚型对应的spacer通过CRISPRTarget进行预测,其中部分序列比对到IMG/VR数据库,说明全新Cas13亚型蛋白可能帮助微生物防御外来可动遗传因子。
表1
SEQIDNO | CAS酶 | DR序列 |
29 | Cas13bt1-2 | GCTGAAGCAACCCTGGTTTTGCGGGGTGATTACAGC |
30 | Cas13bt1-5 | GCTGTAGAAGCCTCCGATTTGTGAGGTGATGACAGC |
31 | Cas13bt1-8 | GCTGGAGCAGCCCCCGATTTGTGGGGTAATCACAGC |
32 | Cas13bt1-9 | GTTGGAGCAGCCCCCGTTTTGTGGGGTAATCACAAC |
33 | Cas13bt1-10 | GCTGGAGAAGCCTCGGATTTGCGGGGTGATTACAGC |
34 | Cas13bt1-11 | GCTGGAGCAGCCCTCGATTTGCAGGGTAATCACAGC |
35 | Cas13bt1-14 | GCTGGAGAAGCCTCGGTTTTGCGAGGTGATTACAGC |
36 | Cas13bt1-15 | GCTGGAGCAGCCCTCGATTTGCAGGGTAATCACAGC |
37 | Cas13bt1-16 | GCTGGAGCAGCCCTCGATTTGCAGGGTAATCACAGC |
38 | Cas13bt2-5 | GCTGTGATAGGCCCCGATTTGTGGGGTAGTAACAGC |
39 | Cas13g1 | GTTTTCGTCACCCCCGTTTTGGAGGGTAAGTACAAC |
40 | Cas13g2 | GTCCGGCTTACCCCCCATTTAGAGGGTGTCCCCGGC |
41 | Cas13g3 | GCTGGAGACATCCCCATTTCTGTGGGTAAGCCAGAC |
42 | Cas13g4 | GTTTTCGTCACCCTCGTTTTGGAGGGTAAGCACAAC |
43 | Cas13g5 | GTCTGGCTTACCTGCCATTTTGCAGGTGTCTCCAGC |
44 | Cas13g6 | GCTGAAGACGCCCTGTCTATGACGGGCATGTCAGCT |
45 | Cas13g7 | GTCGAAGACGCTCCGTTTTTGAGGAGCAAGTACGAC |
46 | Cas13h1 | GTTGTAACTGCCCTTATTTTAAAGGGTACAAACAAC |
47 | Cas13i1 | GTTGTGAAAGGCCGCCGAAATGGCGGTTCAAGCAAC |
48 | Cas13j1 | GTTGTAACAAGCCTAAGTTTGAAAGGTAAAAACAAC |
49 | Cas13k1 | GGTGGAAAAGCCTTTGATTTGAAAGGTAAAAGCACC |
50 | Cas13d_896aa | GAGATAGACCCTTGTTAACTCGTAAGGTTCTGTGAC |
51 | Cas13d_911aa | CTTATACAACACCCATTTTCACAGTGGGTCTATAAC |
52 | Cas13d_942aa | GATTGAAAGGATTGTAAATTTACAAGGTCTTAAAAC |
53 | Cas13d_957aa | GATTGAAAGCTATGCGAATTTGCACAGTCTTAAAAC |
54 | Cas13d_968aa | GAACTACAGCCTTAACGAATGTTAAGGTTCTGAAAC |
55 | Cas13d_982aa | GAACTACACCCGTGCAAAAATGCAGGGGTCTAAAAC |
56 | Cas13d_999aa | GTACAATAGCCCGTTGAAATAGATGGGTTCTAAGAC |
新型Cas13分布
将所有新型Cas13(1139个)分类情况以及宏基因组来源进行统计发现,80%Cas13d来源于人体微生物,Cas13c都来自于水源,超过30%Cas13a来自人体微生物或水源,Cas13b分布较分散。其中Cas13d主要分布在动物微生物中,与之前发现其主要分布在革兰氏阳性菌中的瘤胃球菌属一致。对应新型Cas亚型,Cas13i分布于人体或动物体内,Cas13g主要分布于富含甲烷环境中(图9)。同时所有新型Cas13(1139个)中Cas13a、Cas13b、Cas13d分别占总量的23.7%、46.2%、9.5%(图10)。
实施例3:鉴定新型Cas13亚型crRNA方向
质粒构建
Cas13的编码序列通过密码子优化(人类)并合成。合成的Cas13效应蛋白序列插入到pCAG-2A-eGFP载体的XmaI和NheI限制性酶切位点中,构建pCAG-Cas13-2A-eGFP质粒,使用到的蛋白质序列见表2。合成的crRNA序列(U6启动子序列+DR序列+spacer序列或U6启动子序列+spacer序列+DR序列)插入到pUC19-U6载体的EcoRI和HindIII限制性酶切位点之间,构建pUC19-U6-5'-DR crRNA或pUC19-U6-3'-DR crRNA质粒。其中对应的crRNA靶向mCherry mRNA,mCherry spacer序列信息见表3。CAG启动子表达eBFP蛋白和EF1a启动子表达mCherry蛋白构建pCAG-eBFP-EF1a-mCherry质粒(图11A)。
表2
/>
/>
/>
/>
/>
/>
/>
表3:
/>
细胞培养,转染
HEK293T细胞在含有10%FBS(Gibco)和1%Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25%Trypsin-EDTA(Gibco)消化细胞,转入24孔板中培养12小时,等细胞密度达到90%时,使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-5'-DR crRNA质粒或pUC19-U6-3'-DR crRNA质粒,以及10ng pCAG-eBFP-EF1a-mCherry质粒。对照组只转染600ng pCAG-Cas13-2A-eGFP质粒和10ng pCAG-eBFP-EF1a-mCherry质粒。48小时之后,使用0.25%Trypsin-EDTA(Gibco)消化细胞,获得的悬浮细胞进行荧光激活细胞分选(FACS)(图11A)。
靶向mCherry mRNA鉴定新型Cas13亚型crRNA方向转染2天后通过FACS分析mCherry表达情况。比较5'-DR crRNA和3'-DR crRNA对应的mCherry表达情况,发现Cas13g1、Cas13h1、Cas13i1、Cas13j1、Cas13k1对应的3'-DR crRNA敲低效率高于5'-DRcrRNA。证明Cas13g-k对应crRNA方向为3'-DR(图12),具体编辑结果信息见表4。图12每组都有3个生物学复本,使用双尾t-检验评价统计学意义。
表4:
3'-DR | 5'-DR | |
Cas13g1 | 0.889667 | 0.947 |
Cas13h1 | 0.200667 | 0.938 |
Cas13i1 | 0.943667 | 0.952333 |
Cas13j1 | 0.244333 | 0.948333 |
Cas13k1 | 0.878667 | 0.921667 |
实施例4:通过靶向体内基因或体外基因筛选编辑效率高的新型Cas13蛋白
质粒构建
Cas13的编码序列通过密码子优化(人类)并合成。合成的Cas13效应蛋白序列插入到pCAG-2A-eGFP载体的XmaI和NheI酶切位点中,构建pCAG-Cas13-2A-eGFP质粒,使用到的蛋白质序列见表2。合成的crRNA序列(U6启动子序列+spacer序列+DR序列)插入到pUC19-U6载体的EcoRI和HindIII酶切位点之间,构建pUC19-U6-3'-DR crRNA质粒。其中spacer序列信息见表3。CAG启动子表达eBFP蛋白和EF1a启动子表达mCherry蛋白构建pCAG-eBFP-EF1a-mCherry质粒(图11A)。
细胞培养,转染
HEK293T细胞在含有10%FBS(Gibco)和1%Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25%Trypsin-EDTA(Gibco)消化细胞,转入24孔板中培养12小时,等细胞密度达到90%时,使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-3'-DR crRNA质粒,以及10ng pCAG-eBFP-EF1a-mCherry质粒。对照组只转染600ng pCAG-Cas13-2A-eGFP质粒和10ng pCAG-eBFP-EF1a-mCherry质粒。600ngpCAG-Cas13-2A-eGFP质粒、300ng非靶向(non-targeting,NT)的U6-crRNA质粒和10ng pCAG-eBFP-EF1a-mCherry质粒三者共转到HEK293T细胞中作为非靶标对照组。48小时之后,使用0.25%Trypsin-EDTA(Gibco)消化细胞,获得的悬浮细胞进行荧光激活细胞分选(FACS)(图11A)。
敲低mCherry mRNA筛选编辑效率高的Cas13蛋白转染2天后通过流式分析mCherry表达情况。实验组EGFP和mCherry双阳性细胞的平均荧光强度(mean fluorescenceintensity,MFI)与对照组进行了标准化处理。初步筛选编辑效率高的Cas13蛋白(图13A),其中RfxCas13d、Cas13X1、Cas13bt1-8、Cas13bt1-10、Cas13bt1-11、Cas13bt1-14、Cas13bt1-15、Cas13g3敲低效率高于50%,这些蛋白用于接下来实验,具体编辑结果信息见表5A。
转染2天后通过流式分析mCherry表达情况。实验组EGFP和mCherry双阳性细胞的MFI与非靶标对照组进行了标准化处理。MFI结果(图13B)和具体编辑结果信息见表5B。
表5A:
mCherry-spacer-1 | mCherry-spacer-2 | |
RfxCas13d | 0.06285 | 0.08915 |
Cas13X1 | 0.2535 | 0.2475 |
Cas13bt1-8 | 0.227 | 0.2125 |
Cas13bt1-9 | 0.718 | 0.6685 |
Cas13bt1-10 | 0.3095 | 0.3785 |
Cas13bt1-11 | 0.413 | 0.359 |
Cas13bt1-14 | 0.2475 | 0.28335 |
Cas13bt1-15 | 0.387 | 0.3925 |
Cas13bt2-5 | 0.606 | 0.6025 |
Cas13g3 | 0.3625 | 0.474 |
Cas13g1 | 0.6665 | 0.7745 |
Cas13g4 | 0.6625 | 0.675 |
表5B:
细胞培养,转染
HEK293T细胞在含有10%FBS(Gibco)和1%Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25%Trypsin-EDTA(Gibco)消化细胞,转入24孔板中培养12小时,等细胞密度达到90%时,使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-3'-DR crRNA质粒。对照组只转染600ng pCAG-Cas13-2A-eGFP质粒(图11B)。非靶标对照组转染600ngpCAG-Cas13-2A-eGFP质粒和300ng非靶标的U6-crRNA质粒。
RNA提取,RNA定量分析
转染48小时后使用Reagent(Life Technologie)裂解细胞,之后使用PureLinkTMRNAMini Kit(Thermofisher)提取RNA。最后通过/>II One Step qRT-PCR SYBR Green Kit(Vazyme)进行RNA定量分析。RT-qPCR结果采用2-ΔΔCT法进行分析,利用靶基因与内参基因GAPDH在3个生物学复本中的平均CT值的差异计算靶基因的相对表达量,并以对照组的相对表达量进行标准化。
敲低体内基因ANXA4 mRNA筛选编辑效率高的Cas13蛋白通过靶向ANXA4 mRNA与对照组的标准化RT-qPCR结果,发现Cas13bt1-11,Cas13bt1-15和Cas13g3具有较高编辑效率(图14A),具体编辑结果信息见表6A。实验组与非靶标对照组的标准化RT-qPCR结果也显示Cas13bt1-8、Cas13bt1-11、Cas13bt1-15和Cas13g3具有较高编辑(图14B),具体编辑结果信息见表6B。值得注意的是,两次实验都显示Cas13g3具有最强的RNA干扰能力和超小的蛋白质分子量(767个氨基酸),我们选择Cas13g3蛋白进行进一步的特征分析。
表6A:
ANXA4-spacer-1 | ANXA4-spacer-2 | |
RfxCas13d | 0.073333 | 0.163333 |
Cas13X1 | 0.313333 | 0.473333 |
Cas13bt1-8 | 0.243333 | 0.393333 |
Cas13bt1-10 | 0.273333 | 0.166667 |
Cas13bt1-11 | 0.146667 | 0.15 |
Cas13bt1-14 | 0.42 | 0.213333 |
Cas13bt1-15 | 0.106667 | 0.136667 |
Cas13g3 | 0.186667 | 0.11 |
表6B:
ANXA4-spacer-1 | ANXA4-spacer-2 | |
RfxCas13d | 0.215066 | 0.258412 |
Cas13X1 | 0.046716667 | 0.054699333 |
Cas13bt1-8 | 0.188513333 | 0.153782667 |
Cas13bt1-10 | 0.363544667 | 0.214909 |
Cas13bt1-11 | 0.200584333 | 0.188127667 |
Cas13bt1-14 | 0.275353333 | 0.105536 |
Cas13bt1-15 | 0.086085667 | 0.146604667 |
Cas13g3 | 0.076056 | 0.150550667 |
敲低体内基因筛选编辑效率高的Cas13蛋白
通过靶向4个体内基因,发现RfxCas13d在STAT3和KRAS位点编辑效率高于Cas13g3,而在EGFR和CXCR4的编辑效果更低,整体来看,Cas13g3的编辑效果略低于RfxCas13d,但超过了Cas13X1(图15),编辑结果见表7。
表7:
STAT3-spacer | EGFR-spacer | KRAS-spacer | CXCR4-spacer | |
Cas13X1 | 0.687478 | 1.046535 | 0.525891 | 0.769662 |
Cas13bt1-11 | 0.886987 | 0.735842 | 0.284075 | 0.71624 |
Cas13g3 | 0.613047 | 0.772218 | 0.336777 | 0.598634 |
RfxCas13d | 0.435223 | 0.785867 | 0.08919 | 0.890071 |
实施例5:通过靶向体内基因验证Cas13d同源物编辑效率
质粒构建
Cas13d同源物的编码序列通过密码子优化(人类)并合成。合成的Cas13效应蛋白序列插入到pCAG-2A-eGFP载体的XmaI和NheI酶切位点中,构建pCAG-Cas13d-2A-eGFP质粒,使用到的蛋白质序列见表2。合成的crRNA序列(U6启动子序列+DR序列+spacer序列)插入到pUC19-U6载体的EcoRI和HindIII酶切位点之间,构建pUC19-U6-5'-DR crRNA质粒。其中spacer序列信息见表3。
细胞培养,转染
HEK293T细胞在含有10%FBS(Gibco)和1%Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25%Trypsin-EDTA(Gibco)消化细胞,转入24孔板中培养12小时,等细胞密度达到90%时,使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每个孔转染600ng pCAG-Cas13d-2A-eGFP质粒和300ng pUC19-U6-5'-DR crRNA质粒。对照组只转染600ng pCAG-Cas13d-2A-eGFP质粒(图11B)。
RNA提取,RNA定量分析
转染48小时后使用Reagent(Life Technologie)裂解细胞,之后使用PureLinkTMRNA Mini Kit(Thermofisher)提取RNA。最后通过/>II One Step qRT-PCR SYBR Green Kit(Vazyme)进行RNA定量分析。RT-qPCR结果采用2-ΔΔCT法进行分析,利用靶基因与内参基因GAPDH在3个生物学复本中的平均CT值的差异计算靶基因的相对表达量,并以对照组的相对表达量进行标准化。
敲低体内基因ANXA4 mRNA筛选编辑效率高的Cas13蛋白通过靶向ANXA4 mRNA的RT-qPCR结果,发现Cas13d_968aa,Cas13d_982aa和Cas13d_999aa具有较高编辑效率(图16),具体编辑结果信息见表8。
表8:
ANXA4-spacer-1 | |
RfxCas13d | 0.096407 |
Cas13d_896aa | 0.303705 |
Cas13d_911aa | 0.484585 |
Cas13d_942aa | 0.582031 |
Cas13d_957aa | 0.555765 |
Cas13d_968aa | 0.230899 |
Cas13d_982aa | 0.210199 |
Cas13d_999aa | 0.13415 |
实施例6:使用RNA-seq探究Cas13的脱靶活性
细胞培养,转染
HEK293T细胞在含有10%FBS(Gibco)和1%Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25%Trypsin-EDTA(Gibco)消化细胞,转入24孔板中培养12小时,等细胞密度达到90%时,使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-3'-DR crRNA质粒,crRNA靶向ANXA4 mRNA。对照组只转染600ng pCAG-Cas13-2A-eGFP质粒。
RNA-seq
转染2天后使用Reagent(Life Technologie)裂解细胞,之后使用PureLinkTMRNAMini Kit(Thermofisher)提取RNA。提取总RNA使用novaseq6000平台进行RNA-seq测序。获得的测序结果通过STAR软件比对到人基因组,然后通过StringTie软件计算基因表达量。与对照组相比,发现Cas13X1、Cas13g3和RfxCas13d对应的脱靶位点对应的脱靶位点分别为102、133和323。表明Cas13g3的特异性与Cas13X1相当,而其脱靶效应则低于RfxCas13d(图17)。图17中KD代表敲低效率,DG代表下调基因数目。
实施例7:探究Cas13反式切割活性
细胞培养,转染
HEK293T细胞在含有10%FBS(Gibco)和1%Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25%Trypsin-EDTA(Gibco)消化细胞,转入24孔板中培养12小时,等细胞密度达到90%时,使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。
细胞活性分析细胞活性实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-3'-DR crRNA质粒,crRNA靶向ANXA4 mRNA。对照组不转染任何质粒。使用Calcein-AM/PI double strain kit(Solarbio)对转染2天后的HEK293T进行荧光细胞活力测定。总细胞定量在490nm激发和515nm发射,死细胞定量在535nm激发和617nm发射。使用流式细胞仪进行测量。通过鉴定转染细胞活性,发现转染Cas13蛋白后,不影响细胞活性(图18A),具体细胞活性信息见表9A。图18每组都有3个生物学复本,使用双尾t-检验评价统计学意义。
表9A:
Neg | Cas13X1 | Cas13bt1-11 | Cas13g3 | RfxCas13d |
98.56 | 97.68667 | 97.40333 | 97.57333 | 97.28 |
反式切割活性反式切割实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒、10ngpCAG-eBFP-EF1a-mCherry质粒和300ng pUC19-U6-3'-DR crRNA质粒,其中crRNA靶向mCherry mRNA。反式切割对照组转染非靶向的U6-crRNA质粒。通过测量mCherry的荧光强度计算Cas13蛋白的顺式切割能力,同时通过测量EGFP的荧光强度计算反式切割能力。与之前的结果一致,Cas13X1、RfxCas13d和Cas13g3可以显著敲低mCherry mRNA(图18B)。与此同时,Cas13X.1和Cas13g3没有检测到反式切割活性,而RfxCas13d对EGFP转录本显示出显著的反式切割活性(图18B)。具体MFI结果信息见表9B。
表9B:
/>
实施例8:高编辑效率的Cas13g3系统特征鉴定
细胞培养,转染
HEK293T细胞在含有10%FBS(Gibco)和1%Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25%Trypsin-EDTA(Gibco)消化细胞,转入24孔板中培养12小时,等细胞密度达到90%时,使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。
Cas13g3系统最优spacer长度研究
为了探究Cas13g3系统的最优spacer长度,我们构建了靶向mCherrymRNA且spacer长度从5到50nt不等的U6-crRNA质粒。其中spacer长度在15-30nt之间,每隔1nt设计一条crRNA;当spacer长度为5-15nt和30-50nt时,每隔5nt设计一条crRNA。600ng pCAG-Cas13-2A-eGFP质粒、10ng pCAG-eBFP-EF1a-mCherry质粒和300ng pUC19-U6-3'-DR crRNA质粒三者共转到HEK293T细胞中作为实验组。600ng pCAG-Cas13-2A-eGFP质粒、300ng非靶向的U6-crRNA质粒和10ngpCAG-eBFP-EF1a-mCherry质粒三者共转到HEK293T细胞中作为对照组。实验组EGFP和mCherry双阳性细胞的MFI与阴性对照进行了标准化处理,标准化结果可以反映不同spacer长度对RNA干扰影响。结果显示,当使用长度为27nt的spacer时,Cas13g3在两个靶标位点的平均敲除效率最高(图19)。具体编辑结果信息见表10。
表10:
/>
Cas13g3系统PFS偏好分析
为了分析Cas13g3系统的PFS偏好性,在EF-1α-mCherry质粒的mCherry基因上游克隆了16种PFS组合的目标。实验组EGFP和mCherry双阳性细胞MFI与阴性对照的MFI进行标准化,实验组为转染600ng pCAG-Cas13-2A-eGFP质粒、10ngpCAG-eBFP-EF1a-mCherry质粒和300ng pUC19-U6-3'-DR crRNA质粒的HEK293T细胞;阴性对照为转染了600ng pCAG-Cas13-2A-eGFP质粒、300ng非靶向的U6-crRNA质粒和10ngpCAG-eBFP-EF1a-mCherry质粒的HEK293T细胞。结果显示,Cas13g3蛋白在这16种PFS序列中都展示了稳定且高效的干扰效果(图20)。具体编辑结果信息见表11(其中的spacer序列为:SEQ ID NO.81:GCCGGCACTGATGAGGGCTGCCTAATT)。
表11:
/>
NLS对Cas13g3系统干扰活性的影响
为了鉴定NLS和NES对Cas13g3系统干扰活性的影响,我们构建了3个分别融合NLS、融合NES和没有融合NLS和NES的Cas13蛋白表达质粒(图21)。600ng pCAG-Cas13-2A-eGFP质粒、10ng pCAG-eBFP-EF1a-mCherry质粒和300ng pUC19-U6-3'-DR crRNA质粒三者共转到HEK293T细胞中作为实验组。对照组只转染pCAG-eGFP质粒。分析并计算EGFP和mCherry双阳性细胞的MFI,与对照组的标准化结果显示相对于融合NES或者没有任何定位信号,NLS序列的融合可以提高Cas13g3的敲除效率(图21)。具体编辑结果信息见表12。
表12:
标准化MFI | |
NLS | 0.260501 |
noNLS | 0.274187 |
NES | 0.367439 |
因此,最佳的Cas13g3编辑器组成为27nt的spacer长度的crRNA质粒和融合NLS序列的Cas13g3蛋白质粒。
实施例9:最优的Cas13g3编辑器干扰能力验证
细胞培养,转染
HEK293T细胞在含有10%FBS(Gibco)和1%Penicillin-Streptomycin(Gibco)的DMEM(Gibco)培养基中培养。使用0.25%Trypsin-EDTA(Gibco)消化细胞,转入24孔板中培养12小时,等细胞密度达到90%时,使用LIPOFECTAMINE 3000Reagent(Invitrogen)进行转染。实验组每个孔转染600ng pCAG-Cas13-2A-eGFP质粒和300ng pUC19-U6-3'-DR crRNA质粒。非靶标对照组转染600ng pCAG-Cas13-2A-eGFP质粒和300ng非靶标的U6-crRNA质粒。
RNA提取,RNA定量分析
转染48小时后使用Reagent(Life Technologie)裂解细胞,之后使用PureLinkTMRNA Mini Kit(Thermofisher)提取RNA。最后通过/>II One Step qRT-PCR SYBR Green Kit(Vazyme)进行RNA定量分析。RT-qPCR结果采用2-ΔΔCT法进行分析,利用靶基因与内参基因GAPDH在3个生物学复本中的平均CT值的差异计算靶基因的相对表达量,并以对照组的相对表达量进行标准化。
Cas13g3系统与其他Cas13系统RNA干扰能力的比较为了系统性地比较Cas13g3蛋白与目前最常用且切割效率最高的Cas13蛋白Cas13X1和RfxCas13d在相同靶标位点的RNA干扰活性并且更大规模地研究Cas13g3蛋白的敲除效率,我们设计了靶向5个内源基因的一共15个crRNAs质粒。通过靶向5个体内基因EZH2、NF2、HRAS、NRAS和PPARG,Cas13X1、RfxCas13d和Cas13g3能够在EZH2、NF2、HRAS、NRAS和PPARG基因上展现强大的RNA干扰活性,它们的平均敲低效率分别为52.84%、54.58%和60.37%(图22),具体编辑结果见表13。干扰结果进行配对t检验(paired-t-test)统计学分析显示Cas13g3具有高效的RNA敲低活性,与Cas13X1和RfxCas13d相当。
表13:
尽管以上结合附图对本发明的实施方案进行了描述,但本发明并不局限于上述的具体实施方案和应用领域,上述的具体实施方案仅仅是示意性的、指导性的,而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下,还可以做出很多种的形式,这些均属于本发明保护之列。
Claims (15)
1.经分离的Cas13核酸酶蛋白,所述Cas13核酸酶蛋白的氨基酸序列为:
a)如SEQ ID NO.1~28中任一序列所示的氨基酸序列;或
b)与SEQ ID NO.1~28中的任一序列具有至少80%的序列同一性、且具有RNA切割活性的氨基酸序列。
2.如权利要求1所述的Cas13核酸酶蛋白,其中所述Cas13核酸酶蛋白是Cas13bt1、Cas13bt2、Cas13g、Cas13h、Cas13i、Cas13j或Cas13k蛋白,优选为Cas13g3。
3.一种工程化的Cas13核酸酶效应蛋白,包含Cas13核酸酶蛋白,该Cas13核酸酶蛋白包含:
a)如SEQ ID NO.1~28中任一序列所示的氨基酸序列;或,
b)与SEQ ID NO.1~28中的任一序列具有80%以上序列同一性、且具有RNA切割活性的氨基酸序列。
4.如权利要求3的所述效应蛋白,其中所述Cas13核酸酶蛋白通过氨基酸突变失去催化活性,例如所述Cas13核酸酶蛋白在其C端和/或N端的HEPN结构域(RxxxxH基序)通过氨基酸突变形成dCas13蛋白。
5.权利要求3或4所述的效应蛋白,其还包含与所述Cas13核酸酶蛋白融合的功能结构域。
6.如权利要求5所述的效应蛋白,所述功能结构域选自如下的一项或多项:翻译起始结构域、翻译阻遏结构域、反式激活结构域、表观遗传修饰结构域、核碱基编辑结构域、逆转录酶结构域、报告分子结构域和核酸酶结构域。
7.如权利要求6所述的效应蛋白,其中所述核碱基编辑结构域为腺苷脱氨酶、胞苷脱氨酶或它们的催化结构域。
8.一种多核苷酸,其编码权利要求1或2的Cas13核酸酶蛋白或权利要求3-7任一项的效应蛋白。
9.包含如权利要求8所述的多核苷酸的载体,所述载体为质粒或病毒,所述病毒优选为慢病毒。
10.一种工程化的CRISPR-Cas13基因编辑系统,包含:
(a)如权利要求1或2所述的核酸酶、如权利要求3-7中任一项所述的工程化Cas13核酸酶效应蛋白或编码所述效应蛋白的核酸;以及
(b)crRNA,其包含与靶核酸中的靶序列互补的间隔区序列;
其中所述工程化的Cas13核酸酶效应蛋白和所述crRNA能够形成CRISPR复合物,所述CRISPR复合物特异性结合包含所述靶序列的靶核酸并诱导所述靶核酸的修饰。
11.如权利要求10所述的CRISPR-Cas13基因编辑系统,其中所述crRNA还包含直接重复(DR)序列,优选所述直接重复(DR)序列包含SEQ ID NO.29~56中任一序列所示的序列,或包含与SEQ ID NO.29~56中任一序列所示的序列具有至少80%同一性的序列。
12.包含如权利要求10或11所述的工程化的CRISPR-Cas13基因编辑系统的试剂盒。
13.如权利要求1或2所述的Cas13核酸酶蛋白、如权利要求3-7中任一项所述的工程化的CRISPR-Cas13核酸酶效应蛋白、如权利要求10或11所述的工程化的CRISPR-Cas13基因编辑系统在制备治疗与个体的细胞中与核酸突变相关的疾病或病症的药物中的用途。
14.一种修饰细胞中包含靶核酸的方法,包括使所述细胞与如权利要求1或2所述的Cas13核酸酶蛋白、如权利要求3-7任一项所述的工程化的Cas13核酸酶效应蛋白、如权利要求10或11所述的工程化的CRISPR-Cas13基因编辑系统接触,从而实现对所述细胞中所述靶核酸的修饰。
15.包含如权利要求1或2所述的Cas13核酸酶蛋白、如权利要求3-7任一项所述的工程化的Cas13核酸酶效应蛋白或如权利要求10或11所述的工程化的CRISPR-Cas13基因编辑系统的组合物,其用于核酸的修饰。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2023/101348 WO2023208256A1 (zh) | 2022-04-26 | 2023-06-20 | 经分离的Cas13蛋白、基于它的基因编辑系统及其用途 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210446714X | 2022-04-26 | ||
CN202210446714 | 2022-04-26 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116949011A true CN116949011A (zh) | 2023-10-27 |
Family
ID=88453703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310447170.3A Pending CN116949011A (zh) | 2022-04-26 | 2023-04-24 | 经分离的Cas13蛋白、基于它的基因编辑系统及其用途 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN116949011A (zh) |
WO (1) | WO2023208256A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117625664A (zh) * | 2023-11-29 | 2024-03-01 | 上海交通大学重庆研究院 | 一种具有MS2.2-crRNA结构的RNA编辑器及其制备方法和应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11168322B2 (en) * | 2017-06-30 | 2021-11-09 | Arbor Biotechnologies, Inc. | CRISPR RNA targeting enzymes and systems and uses thereof |
US10476825B2 (en) * | 2017-08-22 | 2019-11-12 | Salk Institue for Biological Studies | RNA targeting methods and compositions |
CN112513250A (zh) * | 2018-04-20 | 2021-03-16 | 加利福尼亚大学董事会 | 用于跟踪和操纵细胞rna的融合蛋白和融合核糖核酸 |
SG11202012015YA (en) * | 2018-06-08 | 2021-01-28 | Locanabio Inc | Compositions and methods for the modulation of adaptive immunity |
SG11202012004SA (en) * | 2018-06-08 | 2021-01-28 | Locanabio Inc | Rna-targeting fusion protein compositions and methods for use |
-
2023
- 2023-04-24 CN CN202310447170.3A patent/CN116949011A/zh active Pending
- 2023-06-20 WO PCT/CN2023/101348 patent/WO2023208256A1/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117625664A (zh) * | 2023-11-29 | 2024-03-01 | 上海交通大学重庆研究院 | 一种具有MS2.2-crRNA结构的RNA编辑器及其制备方法和应用 |
Also Published As
Publication number | Publication date |
---|---|
WO2023208256A1 (zh) | 2023-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | Engineered miniature CRISPR-Cas system for mammalian genome regulation and editing | |
JP7038079B2 (ja) | Crisprハイブリッドdna/rnaポリヌクレオチドおよび使用方法 | |
Lu et al. | RNA duplex map in living cells reveals higher-order transcriptome structure | |
CN110520528A (zh) | 高保真性cas9变体及其应用 | |
CA3111432A1 (en) | Novel crispr enzymes and systems | |
JP2024050637A (ja) | Cas9ベースノックイン方針の効力を改善するための組成物及び方法 | |
KR20200006054A (ko) | 신규 타입 vi crispr 오르소로그 및 시스템 | |
US11667904B2 (en) | CRISPR-associated systems and components | |
JP2018532419A (ja) | CRISPR−Cas sgRNAライブラリー | |
CN109207515A (zh) | 一种设计和构建猪全基因组CRISPR/Cas9敲除文库的方法 | |
JP2022547524A (ja) | 新規crispr dnaターゲティング酵素及びシステム | |
WO2022199511A1 (zh) | 一种Lt1Cas13d蛋白及基因编辑系统 | |
WO2019089803A1 (en) | Methods and compositions for studying cell evolution | |
WO2023174305A1 (zh) | Rna靶向基因编辑工具的开发 | |
WO2023208256A1 (zh) | 经分离的Cas13蛋白、基于它的基因编辑系统及其用途 | |
JP2022540153A (ja) | 新規crispr dnaターゲティング酵素及びシステム | |
CN112430586B (zh) | 一种VI-B型CRISPR/Cas13基因编辑系统及其应用 | |
US20230016656A1 (en) | Novel crispr dna targeting enzymes and systems | |
CA3153005A1 (en) | Novel crispr dna targeting enzymes and systems | |
KR102567576B1 (ko) | 표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도 | |
JP2024501892A (ja) | 新規の核酸誘導型ヌクレアーゼ | |
US20240124873A1 (en) | Methods and compositions for combinatorial targeting of the cell transcriptome | |
WO2023165613A1 (zh) | 5'→3'核酸外切酶在基因编辑系统中的用途和基因编辑系统及其编辑方法 | |
CN117448300B (zh) | 一种Cas9蛋白、II型CRISPR/Cas9基因编辑系统及应用 | |
CN116286737B (zh) | 无pam限制的核酸内切酶及其介导的基因编辑系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40102047 Country of ref document: HK |