CN117821423A - RalCas13d蛋白及其编辑系统 - Google Patents
RalCas13d蛋白及其编辑系统 Download PDFInfo
- Publication number
- CN117821423A CN117821423A CN202311833185.XA CN202311833185A CN117821423A CN 117821423 A CN117821423 A CN 117821423A CN 202311833185 A CN202311833185 A CN 202311833185A CN 117821423 A CN117821423 A CN 117821423A
- Authority
- CN
- China
- Prior art keywords
- protein
- ralcas13d
- crrna
- crispr
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 125
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 108
- 108091033409 CRISPR Proteins 0.000 claims abstract description 62
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 61
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract description 58
- 238000010362 genome editing Methods 0.000 claims abstract description 29
- 125000003275 alpha amino acid group Chemical group 0.000 claims abstract description 9
- 239000002773 nucleotide Substances 0.000 claims abstract description 9
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 9
- 108010042407 Endonucleases Proteins 0.000 claims abstract description 7
- 102000004533 Endonucleases Human genes 0.000 claims abstract description 7
- 108091033319 polynucleotide Proteins 0.000 claims description 17
- 102000040430 polynucleotide Human genes 0.000 claims description 17
- 239000002157 polynucleotide Substances 0.000 claims description 17
- 239000013598 vector Substances 0.000 claims description 17
- 125000006850 spacer group Chemical group 0.000 claims description 16
- 230000000694 effects Effects 0.000 claims description 15
- 230000000295 complement effect Effects 0.000 claims description 9
- 102000040650 (ribonucleotides)n+m Human genes 0.000 claims description 8
- 108020005004 Guide RNA Proteins 0.000 claims description 6
- 241000894006 Bacteria Species 0.000 claims description 4
- 238000013461 design Methods 0.000 claims description 4
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 claims description 3
- 108020004705 Codon Proteins 0.000 claims description 3
- 101710163270 Nuclease Proteins 0.000 claims description 3
- 241000192029 Ruminococcus albus Species 0.000 claims description 3
- 108091081021 Sense strand Proteins 0.000 claims description 3
- 241000894007 species Species 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 2
- 230000035772 mutation Effects 0.000 claims description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 3
- 108091079001 CRISPR RNA Proteins 0.000 abstract 1
- 238000003776 cleavage reaction Methods 0.000 description 13
- 230000007017 scission Effects 0.000 description 12
- 210000004027 cell Anatomy 0.000 description 8
- 238000000338 in vitro Methods 0.000 description 7
- 239000013612 plasmid Substances 0.000 description 7
- 238000010453 CRISPR/Cas method Methods 0.000 description 6
- 230000008685 targeting Effects 0.000 description 6
- 239000000872 buffer Substances 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000004202 carbamide Substances 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- 238000003197 gene knockdown Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 102100036799 Adhesion G-protein coupled receptor V1 Human genes 0.000 description 3
- 101710096099 Adhesion G-protein coupled receptor V1 Proteins 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 101000982032 Homo sapiens Myosin-binding protein C, cardiac-type Proteins 0.000 description 3
- 102100026771 Myosin-binding protein C, cardiac-type Human genes 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- 238000010357 RNA editing Methods 0.000 description 2
- 230000026279 RNA modification Effects 0.000 description 2
- 230000007022 RNA scission Effects 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000012160 loading buffer Substances 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000020978 protein processing Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 241000203069 Archaea Species 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 101000993172 Homo sapiens Putative cancer susceptibility gene HEPN1 protein Proteins 0.000 description 1
- 101100385364 Listeria seeligeri serovar 1/2b (strain ATCC 35967 / DSM 20751 / CCM 3970 / CIP 100100 / NCTC 11856 / SLCC 3954 / 1120) cas13 gene Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 102100031189 Putative cancer susceptibility gene HEPN1 protein Human genes 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000003936 denaturing gel electrophoresis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000007124 immune defense Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
一种RalCas13d蛋白及其编辑系统,属于生物技术基因编辑领域,特别是涉及一种分离的Cas13d蛋白及其基因编辑系统,其包含RalCas13d蛋白的核苷酸序列和蛋白序列,以及CRISPR RNA或转录所述的一种或者多种核苷酸序列;其中,所述RalCas13d蛋白的氨基酸序列如SEQ ID NO.1所示。本发明找到一种新的靶向RNA的核酸内切酶即RalCas13d蛋白,其具有结合RNA的能力,并使用其开发了Ⅵ‑D型CRISPR/Cas13基因编辑系统,该基因编辑系统应用于编辑真核生物基因,具有很高的特异性,为基因编辑工具提供了新选择。
Description
技术领域
本发明属于生物技术基因编辑技术领域。
背景技术
基因编辑技术是允许在生物体的遗传信息上进行定点人工改造加工的一种技术手段,目前最常用的基因编辑技术即CRISPR(规律成簇间隔短回文重复序列,clusteredregularly interspaced shortpalindromic repeat)/Cas(CRISPR-associated protein)系统,其来源于古细菌和细菌的免疫防御系统,用来抵抗噬菌体病毒的入侵。CRISPR/Cas系统可以特意性识别并切割外源的DNA和/或RNA,从而达到基因编辑的目的。
发明内容
本发明的目的是高效靶向编辑RNA、脱靶率低的基因编辑系统,以丰富现有的基因编辑工具家族的RalCas13d蛋白及其编辑系统。
本发明包含RalCas13d蛋白或者编码所述RalCas13d蛋白的一种或多种核苷酸,所述的RalCas13d蛋白的氨基酸序列如SEQ ID NO.1所示的氨基酸序列;编辑系统为Ⅵ-D型CRISPR/Cas13基因编辑系统。
本发明所述的RalCas13d蛋白为RNA核酸内切酶,所述RalCas13d蛋白通过HEPN样核酸酶结构域切割与CRISPR crRNA互补的单链RNA。
本发明所述的CRISPR crRNA的设计原则包括以下一种或者多种:
a.CRISPR crRNA的间隔序列长度为10-50个碱基序列;
b.CRISPR crRNA的间隔序列与目的基因的正义链反向互补;
c.CRISPR crRNA的直接重复序列为32个碱基序列;
d.CRISPR crRNA的直接重复序列包含2个茎环结构。
本发明分离的RalCas13d蛋白来源于Ruminococcus albus。
本发明分离的Cas13蛋白的RNA酶活结构域HEPN motif突变后丧失切割RNA的活性,但所述分离的Cas13蛋白仍保留结合RNA的能力。
本发明所述分离的RalCas13d蛋白被激活后能够非特异性地切割其他RNA。
本发明CRISPR array序列经转录得到pre-crRNA,pre-crRNA经Cas13蛋白加工后形成crRNA,crRNA作为向导RNA与RalCas13d蛋白形成复合体;
CRISPR array包括多个与所述的RalCas13d蛋白相匹配的直接重复序列和间隔序列,所述的间隔序列包括靶序列;
pre-crRNA序列从5'到3'为:5'-直接重复序列-间隔序列-直接重复序列-3'。
本发明CRISPR array的直接重复序列如SEQ ID NO.2所示,或与其具有至少80%同源性。
本发明RalCas13d蛋白,或编码所述RalCas13d蛋白的多核苷酸,或者包含所述多核苷酸的载体,或者包含所述多核苷酸以及包含编码所述CRISPR crRNA的一种或多种多核苷酸的载体系统,或者包含所述的RalCas13d蛋白和所述CRISPR crRNA的复合物;
核苷酸经密码子优化用于在不同物种的目的细胞中的表达。
本发明所述的RalCas13d蛋白及其编辑系统,或所述的RalCas13d蛋白、编码所述的RalCas13d蛋白的多核苷酸、载体、载体系统、复合物在编辑原核生物或真核生物RNA方面的应用。
本发明具有适用性强,设计简单,效率高的特性。
附图说明
图1为VI-D型CRISPR/Cas13基因编辑系统组成图;
图2为RalCas13d蛋白的纯化结果图;
图3为RalCas13d蛋白体外活性验证结果图;
图4为RalCas13d蛋白加工pre-crRNA的实验结果图;
图5为RalCas13d基因编辑系统在HEK293T细胞中靶向多个内源性位点后的结果图;
图6为dRalCas13d-ADARdd单碱基编辑系统在RNA上的编辑效率结果图;
图7为RalCas13d基因编辑系统相较于RfxCas13d对荧光RNA底物的切割结果图。
具体实施方式
CRISPR/Cas系统主要分为6种类型,其中CRISPR-Cas13系统属于Ⅵ型CRISPR/Cas系统,是靶向RNA的CRISPR系统,共有A,B,C,D,X,Y六种亚型,被广泛应用于RNA敲低,RNA碱基编辑,和RNA转录后调控等。除了可以特异性切割RNA的活性外,还能够非特异性地切割其他RNA(侧枝活性)。其中,Ⅵ-D型CRISPR/Cas13系统是RNA编辑效率最高的CRISPR/Cas系统,并且没有PFS偏好(Protospacer flanking site)。
本发明提供一种分离的RalCas13d蛋白。
本发明的第一方面提供一种RalCas13d以及编码上述RalCas13d蛋白的多核苷酸。所述RalCas13d蛋白的氨基酸序列如SEQ ID NO.1所示,或与其具有至少80%的同源性。
该RalCas13d蛋白包含815个氨基酸,是属于Ⅵ-D型CRISPR/Cas系统,是一种具有多功能结构域的RNA核酸内切酶。它通过HEPN样核酸酶结构由于有效切割CRISPR crRNA互补的单链RNA。
所述多核苷酸经密码子优化后用于在不同物种的目的细胞中的表达。
在本发明的一些实施方式中,所述分离的Cas13蛋白来源于Ruminococcus albus。
本发明的第二方面是提供一种在体,所述载体包含编码所述RalCas13d蛋白的多核苷酸。
本发明的第三方面是提供一种载体系统,其包含一种或多种载体,所述一种或多种载体包含上述多核苷酸,并且在相同或不同的载体上包含转录CRISPR crRNA的一种或多种多核苷酸。
本发明的第四方面是提供一种复合物以及一种Ⅵ-D型CRISPR/Cas13基因编辑系统,所述复合物包含所述的RalCas13d蛋白,以及CRISPR crRNA。所述Ⅵ-D型CRISPR/Cas13基因编辑系统包含所述的RalCas13d蛋白或者编码所述RalCas13d蛋白的一种或多种多核苷酸,以及CRISPR crRNA或转录所述CRISPR crRNA的一种或多种多核苷酸。
本发明第五方面还提供一种CRISPR crRNA的设计原则,包括以下一种或多种:
1)CRISPR crRNA的间隔序列长度为10-50个碱基序列;
2)CRISPR crRNA的间隔序列与目的基因的正义链反向互补;
3)CRISPR crRNA的直接重复序列为32个碱基序列;
4)CRISPR crRNA的直接重复序列包含2个茎环结构。
优选地,CRISPR array转录得到pre-crRNA,后经加工形成所述的CRISPR crRNA,所述的CRISPR crRNA作为向导RNA与RalCas13d蛋白形成复合物。
所述的CRISPR array包括与所述的RalCas13d蛋白相匹配的直接重复序列以及间隔序列,所述的CRISPR array的间隔序列包括靶序列,
所述的CSISPR pre-crRNA从5'-直接重复序列-间隔序列-直接重复序列-3'。
具体地,所述的靶序列为外源的DNA的短片段转录出的RNA或针对目的基因设计并人工合成的靶RNA序列。
转录加工出来的成熟的CRISPR crRNA中的间隔序列与目的靶向基因的RNA互补,引导RalCas13d蛋白敲低目的基因的mRNA水平。成熟的CRISPR crRNA序列5'端为直接重复序列,3'端为间隔序列,成熟的CRISPR crRNA可作为向导RNA与RalCas13d形成三元复合体,直接重复序列指导RalCas13d蛋白与目的靶向基因RNA结合,间隔序列与靶向基因的RNA互补配对。
根据一种实施方式,所述的CRISPR array的直接重复序列如SEQ ID NO:4所示,或与其至少有80%同源性。
根据一种具体实施方式,当所述的Ⅵ-D型CRISPR/Cas13基因编辑系统用于靶向切割外源的RNA时,所述的靶序列如SEQ ID NO.3所示;
根据一种具体实施方式,当所述的Ⅵ-D型CRISPR/Cas13基因编辑系统用于靶向切割内源性基因时,所述的靶序列如SEQ ID NO.6-9所示。
在本发明的一些实施方式中,所述表达系统的宿主细胞选自真核细胞或者原核细胞,优选地选自人细胞。
本发明第六方面提供一种碱基编辑体系,包括所述的分离的Cas13蛋白,所述碱基编辑体系还包括gRNA。
RalCas13蛋白的发现
通过对NCBI宏基因组进行分析预测和筛选得到与VI-D型CRISPR-Cas13系统相关的蛋白和相关的元件,获得如图1所示的VI-D型CRISPR/Cas13基因编辑系统。该VI-D型CRISPR-Cas13基因编辑系统包含以下组件:核酸内切酶RalCas13d基因,CRISPR array。RalCas13d基因包含815个氨基酸,其序列如SEQ ID NO.1所;CRISPR array包括重复序列(其序列如SEQ ID NO.2所示)和间隔序列。
外源RNA的短片段经逆转录后或人工合成的序列(与靶序列反向互补的序列)作为间隔序列被整合到CRISPR array的直接重复序列中间,经转录后形成pre-crRNA,后者经过RalCas13d蛋白的加工后形成成熟的crRNA,其5′端的直接重复序列引导RalCas13d蛋白与靶序列结合,3′端的间隔序列在RalCas13d的作用下与靶RNA互补配对,从而作为crRNA引导RalCas13d切割靶向RNA。
RalCas13d蛋白的活性鉴定
为了验证RalCas13d蛋白的活性,在Pet28a-SUMO载体上插入本发明所述的新筛选的RalCas13d蛋白,在体外经过诱导表达纯化后,获得纯化的RalCas13d蛋白,纯化结果如图2所示。之后对人工合成的靶向序列(其序列如SEQ ID NO.3所示)和RalCas13d蛋白的crRNA(其序列如SEQ ID NO.4所示)进行体外转录后,与RalCas13d蛋白共同孵育进行体外切割,其体外切割反应如下。
表1
成分 | 体积 |
5×Cas13 buffer | 4μl |
ssRNA(200ng/μl) | X(4摩尔) |
crRNA/Pre-crRNA | X(1摩尔) |
RalCas13dprotein | X(2摩尔) |
酶终止液 | 1μl |
RNAasefree water | 补足至20μl |
总体系 | 20μl |
纯化好的RalCas13d蛋白首先在冰上与crRNA/pre-crRNA在5×Cas13 buffer(RNAlysis buffer)中以2:1摩尔比混合,并在37℃下孵育15分钟。其次,相对于RalCas13d蛋白量为1:2摩尔比的量在上述实验中加入靶向的ssRNA,随后在37℃下孵育45分钟,并在37℃下用1μl酶终止液(10mg/ml蛋白酶K、4M尿素、80mM EDTA、20mM Tris pH8.0)猝灭15分钟。然后,加反应后体系中加入2×RNA loadingbuffer在75℃下变性10分钟。将上述获得的样品在10%TBE尿素凝胶上进行分离,分离后用SYBR Gold对凝胶进行染色,最后用天能成像系统成像。结果可以看到RalCas13d蛋白对靶向的ssRNA具有明显的切割活性,具体结果如图3所示。
RalCas13d蛋白加工pre-crRNA的活性鉴定由于Cas13能够将pre-crRNA主动加工为成熟的crRNA,作为引导RNA,使得Cas13蛋白能够靶向切割目标序列。因此,进一步,将pre-crRNA的序列(其序列如SEQ ID NO.5所示)在经人工合成之后,进行体外转录,随后与RalCas13d蛋白在5×Cas13 buffer(RNA lysis buffer)中共同孵育,进行pre-crRNA切割实验,其反应切割体系如下。
表2
成分 | 体积 |
5×Cas13 buffer | 2μl |
RalCas13dprotein | X(2摩尔) |
Pre-crRNA | X(1摩尔) |
酶终止液 | 1μl |
RNAasefree water | 补足至10μl |
总体系 | 10μl |
将反应在37℃水浴中孵育30分钟,随后加入1μl酶终止液(10mg/ml蛋白酶K、4M尿素、80mM EDTA、20mM Tris pH8.0)孵育10分钟。然后将其与2×RNA loadingbuffer等量混合后在75℃下变性10分钟。在15%TBE尿素凝胶上通过变性凝胶电泳进行分离分析样品,并用SYBR Gold对凝胶进行染色,最后在天能成像系统上成像。结果可以看到,RalCas13d蛋白可以对pre-crRNA进行加工,自身具有相应的加工活性,具体结果如图4所示。
RalCas13d蛋白哺乳动物细胞内活性验证
Ⅵ-D型CRISPR/Cas13基因编辑系统是一种特异性靶向RNA的基因编辑工具,其可以特异性地ssRNA,目前主要将其应用到哺乳动物细胞中用于特定靶标RNA的敲低,为基因功能的研究提供了便利条件。为了验证RalCas13d蛋白在哺乳动物体内的敲低能力,我们构建了RalCas13d蛋白的表达质粒和crRNA表达质粒,所述RalCas13d蛋白表达载体为pcdna3.1载体,将编码RalCas13d蛋白的序列插入至载体的多克隆位点,插入蛋白序列见SEQ ID NO.1,所述crRNA表达载体为RalCas13d crRNA cloning backbone,随后我们在HEK293T细胞上构建了靶向多个内源性位点的crRNA载体,所述crRNA序列见SEQ ID NO.6-8,并将RalCas13d表达质粒和不同位点的crRNA表达质粒共转染至HEK293T细胞中,在37℃培养箱中培养,48h后收取细胞提取RNA,并进行RT-QPCR进行验证。与对照组(NT,所述对照组NT的序列如SEQ ID NO.9所示)相比,RalCas13d在crRNA的引导下对内源性位点均有明显的敲低效果,具体结果如图5所示。
表3
crRNA名称 | 间隔序列 | 编号 |
crRNA-EGFR | GTTTCTGGCAGTTCTCCTCTCCTGCACCCC | SEQ ID NO.6 |
crRNA-KRAS | TCCATAACTTCTTGCTAAGTCCTGAGCCTG | SEQ ID NO.7 |
crRNA-NF2 | TAGTCACCATACTTGGCCTGGACGGCGTAA | SEQ ID NO.8 |
crRNA-NT | GGGTCTTCGAGAAGACCT | SEQ ID NO.9 |
RalCas13d蛋白在单碱基编辑上的验证
Ⅵ-D型CRISPR/Cas13基因编辑系统也可用于RNA的单碱基编辑。通过突变RalCas13d蛋白的RNA酶活结构域HEPN motif,使RalCas13d蛋白丧失靶向切割RNA的活性,但是仍保留与RNA结合的能力,能够用来进行RNA标记,碱基编辑和RNA剪切调控等等。本实验为验证RalCas13d蛋白在RNA上的编辑能力,对其HEPN1和HEPN2的酶活性位点进行突变,并融合能够对RNA上的A进行脱氨的ADAR脱氨酶活性结构域(ADARdd),形成dRalCas13d-ADARdd融合蛋白,其序列如SEQ ID NO.10所示,蛋白和crRNA表达载体同实施例5。表达ADGRV1和MYBPC3的质粒、与针对ADGRV1、MYBPC3 RNA的crRNA和表达RalCas13d蛋白的质粒共同瞬转染入HEK293T细胞中,crRNA-ADGRV1序列如SEQ ID NO.11所示,crRNA-MYBPCC3序列如SEQ ID NO.12所示,在5% CO2的37℃培养箱里培养48小时,随后收取细胞提取RNA,并经过反转录后进行RT-PCR验证,PCR体系如表4所示。结果表明,dRalCas13d-ADARdd在ADGRV1和MYBPC3上具有10-20%的编辑效率,具体结果如图6所示。
crRNA的核苷酸序列如下:
表4
crRNA名称 | 序列 | 编号 |
crRNA-ADGRV1 | gacagctgggctgatcCatgatgtcatccagaaacactggggaccctcag | SEQ ID NO.11 |
crRNA-MYBPC3 | ctgcactgtgtaccccCagagctccgtgttgccgacatcctggggtggct | SEQ ID NO.12 |
表5
表6
名称 | 序列 | 编号 |
ADGRV1-F | ctgacccactttggagaactt | SEQ ID NO.13 |
ADGRV1-R | ccttgtcacaggctcatagtc | SEQ ID NO.14 |
MYBPC3-F | aacatggaggacaaggccac | SEQ ID NO.15 |
MYBPC3-R | cggtaatgctccaagacggt | SEQ ID NO.16 |
RalCas13d蛋白脱靶性的体外验证由于Cas13蛋白在经过crRNA的引导下被激活可以与靶向RNA结合并发挥其切割活性,同时还可以非特异性地切割其他RNA。因此,为了验证RalCas13d蛋白的脱靶性,我们通过验证RalCas13d蛋白和RfxCas13d蛋白切割荧光RNA底物的能力来验证RalCas13d蛋白相对于RfxCas13d蛋白的脱靶性。荧光RNA底物购买自公司Biolifesci。Cas13的反应切割体系如下。
表7
成分 | 体积 |
10×Cas13 buffer | 1μl |
Cas13dprotein | 2μl |
crRNA | 1μl |
ssRNA | 1μl |
荧光RNA底物 | 1μl |
RNAasefree water | 补足至10μl |
总体系 | 10μl |
将混合好的样品放置于荧光定量PCR仪中于37℃反应40分钟,并检测荧光值的变化。结果显示,RalCas13d相较于RfxCas13d蛋白具有较小的非特异性切割活性,具体结果如图7所示。
综上所述,本发明开发了一种新型Ⅵ-D型CRISPR/Cas13基因编辑系统。
1.通过对NCBI细菌宏基因组进行分析预测和筛选得到与VI-D型CRISPR-Cas13系统相关的蛋白和相关的元件,获得如图1所示的VI-D型CRISPR/Cas13基因编辑系统。该VI-D型CRISPR-Cas13基因编辑系统包含以下组件:核酸内切酶RalCas13d基因和CRISPR array。RalCas13d基因包含815个氨基酸,其序列如SEQ ID NO.1所;CRISPR array包括重复序列(其序列如SEQ ID NO.2所示)和间隔序列。
2.本发明RalCas13d和crRNA复合体构成CRISPR/Cas13系统,能特异性的靶向RNA序列并进行切割,使RNA断裂降解。
3.本发明RalCas13d氨基酸序列合成步骤如下:
步骤一:合成RalCas13d的氨基酸序列对应的核苷酸序列;
步骤二:将合成序列构建到骨架载体pAB1678 CMV-HIVNES-GS-Cas13bt1上,即将合成RalCas13d的核苷酸序列将骨架载体上的CAS13bt1的核苷酸序列进行替换,得到CMV-RalCas13d;
步骤三:转化、挑菌、测序,确定目标序列已正确构建到骨架载体上,CMV-RalCas13d的测序结果与我们的预期构建序列一致,得到目标质粒;
步骤四:将CMV-RalCas13d质粒转化进DH5α感受态大肠杆菌,挑取单克隆至摇菌管,后用大提质粒试剂盒提取CMV-RalCas13d质粒,完成质粒的扩增。
4.本发明array:
array由多个直接重复序列(其序列如SEQ ID NO.2所示)和多个间隔序列组成。Array序列经转录后形成pre-crRNA,后者经过RalCas13d蛋白的加工后形成成熟的crRNA,其5′端的直接重复序列引导RalCas13d蛋白与靶序列结合,3′端的间隔序列在RalCas13d的作用下与靶RNA互补配对,从而作为crRNA引导RalCas13d切割靶向RNA。
5.本发明RalCas13d/crRNA复合体:
RalCas13d需要与crRNA形成RalCas13d-crRNA二元复合体才能发挥RNA切割功能;其中crRNA与RNA进行碱基互补配对,随后将会激活RalCas13d。
SEQ ID NO.1RalCas13d氨基酸序列
MLSGIFVNAFSSKHGFESGVEINTSNPTHRSGESSPVRGDMLGLKSELEKRFFGKTFDDNIHIQLIYNILDIEKILAVYVTNIVYALNNMLGVKGSESHDDFIGYLSTNNTYDVFIDPDNSSLSDDKKANVRKSLSKFNVLLKTKRLGYFGLEEPKTKDNRVSEAYKKRVYHMLAIVGQIRQCVFHDKSGAKRFDLYSFINNIDPEYRDTLDYLVEERLKSINKDFIQGNKVNISLLIDMMKGYEADDIIRLYYDFIVLKSQKNLGFSIKKLREKMLEEYGFRFKDKQYDSVRSKMYKLMDFLLFCNYYRNDIAAGEALVRKLRFSMTDDEKEGLYADEAAKLWGKFRNDFENIADHMNGDVIKELGKADMDFDEKILDSEKKNASDLLYFSKMIYMLTYFLDGKEINDLLTTLISKFDNIKEFLKIMKSSAVNVECELTAGYKLFNDSQRITNELFIVKNIASMRKPAASAKLTMFRDALTILGID
SEQ ID NO.2RalCas13d的直接重复序列
ATTTCAACTCACACGCTCACGTGGAGCGTGAC
SEQ ID NO.3靶向外源RNA序列
TACGTACGCCATCTCATCCCTGCGTGTCTCCTACGATTTGATCTGAAATATTCAGGTCTCGTACATCACCGACTGCCCATAGAGAGGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAG
SEQ ID NO.4靶向外源RNA的crRNA序列
ATTTCAACTCACACGCTCACGTGGAGCGTGACCGAGACCTGAATATTTCAGATCAAATCGTA
SEQ ID NO.5靶向外源RNA的pre-crRNA序列
ATTTCAACTCACACGCTCACGTGGAGCGTGACGACCTGAATATTTCAGATCAAATCGTAGGAATTTCAACTCACACGCTCACGTGGAGCGTGACATTCCTTATCTAAATAGCATATGCTTCTGT
SEQ ID NO.10dRalCas13d-ADARdd基因编辑系统序列
ATGctgagcggcatcttcgtgaacgctttcagcagcaagcacggcttcgagagtggcgttgaaatcaacaccagcaatcctacccacagaagcggcgaatccagccccgtgagaggcgacatgctgggactgaagagcgagctggagaagcggttcttcggaaaaaccttcgacgacaacatccacatccagctcatctacaacatcctggacatcgagaagatcctggctgtgtacgtgaccaacatcgtgtacgccctgaacaacatgctgggcgtgaagggcagcgagagccacgatgatttcattggttatctgagcaccaacaatacctacgacgtgttcatcgaccctgacaacagcagcttgtccgatgacaagaaagccaacgtgcggaagtctctgagcaagttcaacgtgctgctgaagacaaagagactgggctacttcggcctggaagagcctaagactaaggataatagagtgtccgaggcctacaagaagagagtgtaccacatgctggccatcgtgggccagatcGCgcagtgtgtgttcGCcgacaaaagcggcgccaagagattcgacctgtacagcttcatcaacaacattgatcctgagtatagagacaccctggattacctggtggaagagcggctgaagagcatcaacaaagacttcatccaaggcaacaaggtgaacatcagcctgctgatcgacatgatgaagggatacgaggccgatgacatcatccggctgtactacgactttatcgtcctgaaatctcagaagaacctcggattcagcatcaagaagctccgcgagaagatgctggaagaatacggctttagattcaaggacaagcagtacgattctgtgcgcagcaaaatgtacaagcttatggactttctgctcttctgcaattactatagaaacgacattgctgctggcgaggccctggtcagaaagctgcgttttagcatgaccgacgacgagaaggagggcctgtacgccgatgaggccgctaagctgtggggcaaattccggaacgactttgagaacatcgccgaccatatgaacggcgatgtgatcaaggaactgggaaaggccgacatggacttcgacgagaagatcctggacagcgaaaagaagaacgcctctgacctgctgtacttcagcaagatgatctacatgctgacctacttcctggacggcaaggagatcaatgatctgctgacaacactgatcagcaagttcgacaatatcaaggaatttctgaagatcatgaagtcttccgccgtgaacgtggaatgtgaactgaccgccggctacaagctgttcaatgacagccagcggatcaccaacgagctgtttatcgtgaagaatattgctagcatgagaaaacctgccgccagcgccaagctgaccatgttcagagacgccctgacaatcctgggcatcgatgacaagattaccgatgacagaatcagcgagatcctgaaactgaaagagaaaggaaagggcatccatggactgagaaacttcatcacaaacaacgtgatcgagagctctagatttgtgtacctgatcaagtacgccaacgcccagaaaattagagaggtggccgagaatgagaaagtggtcatgttcgtgctgggcggcatcccagacacacaaatcgagagatactataagagctgcgtggaattccccgatatgaactcctccctggaagctaagagaagcgagctggccagaatgatcaagaacatacggttcgatgattttaagaacgtgaagcagcaggccaaggggagagaaaacgtcgccaaggagagagcgaaggccgtgatcggcctgtacctgaccgtgatgtacctgctggtgaagaacctggtcaacgtgaacgccagatacgtgatcgccatccactgcctggaacgggatttcggcctgtataaagaaatcatccccgagttagcttctaagaatctgaaaaatgactacagaatcctgagccaaacactgtgtgaactgtgcgacgatcgggacgagtctcctaacttgtttctgaagaagaacaagcgcctgagaaagtgcgtggaagtggacatcaacaacgccgacagcaacatgacaagaaagtacGCaaactgcatcgccGCcctgacagtggtgagagagctgaaggagtacatcggcgatatcaggaccgtggacagctacttttctatctatcactacgtgatgcagcggtgcatcaccaagcgggaagatgacaccaagcaggaggaaaaaatcaagtacgaggacgatctgctgaagaaccacggctacaccaaggacttcgtgaaggccctgaatagccctttcggatacaacatccctaggttcaagaacctgtctatcgagcagctgttcgaccggaacgagtatctgacggaaaagggaagcctgcagctgcctccacttgaaagactgacactgggatccggaggaggtggaagccagctgcatttaccgcaggttttagctgacgctgtctcacgcctggtcctgggtaagtttggtgacctgaccgacaacttctcctcccctcacgctcgcagaaaagtgctggctggagtcgtcatgacaacaggcacagatgttaaagatgccaaggtgataagtgtttctacaggaacaaaatgtattaatggtgaatacatgagtgatcgtggccttgcattaaatgactgccatgcagaaataatatctcggagatccttgctcagatttctttatacacaacttgagctttacttaaataacaaagatgatcaaaaaagatccatctttcagaaatcagagcgaggggggtttaggctgaaggagaatgtccagtttcatctgtacatcagcacctctccctgtggagatgccagaatcttctcaccacatgagccaatcctggaagaaccagcagatagacacccaaatcgtaaagcaagaggacagctacggaccaaaatagagtctggtcaggggacgattccagtgcgctccaatgcgagcatccaaacgtgggacggggtgctgcaaggggagcggctgctcaccatgtcctgcagtgacaagattgcacgctggaacgtggtgggcatccagggatcactgctcagcattttcgtggagcccatttacttctcgagcatcatcctgggcagcctttaccacggggaccacctttccagggccatgtaccagcggatctccaacatagaggacctgccacctctctacaccctcaacaagcctttgctcagtggcatcagcaatgcagaagcacggcagccagggaaggcccccaacttcagtgtcaactggacggtaggcgactccgctattgaggtcatcaacgccacgactgggaaggatgagctgggccgcgcgtcccgcctgtgtaagcacgcgttgtactgtcgctggatgcgtgtgcacggcaaggttccctcccacttactacgctccaagattaccaagcccaacgtgtaccatgagtccaagctggcggcaaaggagtaccaggccgccaaggcgcgtctgttcacagccttcatcaaggcggggctgggggcctgggtggagaagcccaccgagcaggaccagttctcactcacgtaa。
Claims (10)
1.一种RalCas13d蛋白及其编辑系统,其特征在于:包含RalCas13d蛋白或者编码所述RalCas13d蛋白的一种或多种核苷酸,所述的RalCas13d蛋白的氨基酸序列如SEQ ID NO.1所示的氨基酸序列;编辑系统为Ⅵ-D型CRISPR/Cas13基因编辑系统。
2.根据权利要求1所述的RalCas13d蛋白及其编辑系统,其特征在于:所述的RalCas13d蛋白为RNA核酸内切酶,所述RalCas13d蛋白通过HEPN样核酸酶结构域切割与CRISPR crRNA互补的单链RNA。
3.根据权利要求1所述的RalCas13d蛋白及其编辑系统,其特征在于:所述的CRISPRcrRNA的设计原则包括以下一种或者多种:
a.CRISPR crRNA的间隔序列长度为10-50个碱基序列;
b.CRISPR crRNA的间隔序列与目的基因的正义链反向互补;
c.CRISPR crRNA的直接重复序列为32个碱基序列;
d.CRISPR crRNA的直接重复序列包含2个茎环结构。
4.根据权利要求1所述的RalCas13d蛋白及其编辑系统,其特征在于:分离的RalCas13d蛋白来源于Ruminococcus albus。
5.根据权利要求1所述的RalCas13d蛋白及其编辑系统,其特征在于:分离的Cas13蛋白的RNA酶活结构域HEPN motif突变后丧失切割RNA的活性,但所述分离的Cas13蛋白仍保留结合RNA的能力。
6.根据权利要求1所述的RalCas13d蛋白及其编辑系统,其特征在于,所述分离的RalCas13d蛋白被激活后能够非特异性地切割其他RNA。
7.根据权利要求1、2、3所述的RalCas13d蛋白及其编辑系统,其特征在于:CRISPRarray序列经转录得到pre-crRNA,pre-crRNA经Cas13蛋白加工后形成crRNA,crRNA作为向导RNA与RalCas13d蛋白形成复合体;
CRISPR array包括多个与所述的RalCas13d蛋白相匹配的直接重复序列和间隔序列,所述的间隔序列包括靶序列;
pre-crRNA序列从5'到3'为:5'-直接重复序列-间隔序列-直接重复序列-3'。
8.根据权利要求6所述的RalCas13d蛋白及其编辑系统,其特征在于:CRISPR array的直接重复序列如SEQ ID NO.2所示,或与其具有至少80%同源性。
9.根据权利要求1所述的RalCas13d蛋白及其编辑系统,其特征在于:RalCas13d蛋白,或编码所述RalCas13d蛋白的多核苷酸,或者包含所述多核苷酸的载体,或者包含所述多核苷酸以及包含编码所述CRISPR crRNA的一种或多种多核苷酸的载体系统,或者包含所述的RalCas13d蛋白和所述CRISPR crRNA的复合物;
核苷酸经密码子优化用于在不同物种的目的细胞中的表达。
10.所述的RalCas13d蛋白及其编辑系统,或所述的RalCas13d蛋白、编码所述的RalCas13d蛋白的多核苷酸、载体、载体系统、复合物在编辑原核生物或真核生物RNA方面的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311833185.XA CN117821423A (zh) | 2023-12-28 | 2023-12-28 | RalCas13d蛋白及其编辑系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311833185.XA CN117821423A (zh) | 2023-12-28 | 2023-12-28 | RalCas13d蛋白及其编辑系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117821423A true CN117821423A (zh) | 2024-04-05 |
Family
ID=90512801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311833185.XA Pending CN117821423A (zh) | 2023-12-28 | 2023-12-28 | RalCas13d蛋白及其编辑系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117821423A (zh) |
-
2023
- 2023-12-28 CN CN202311833185.XA patent/CN117821423A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019204675B2 (en) | Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing | |
US9745610B2 (en) | Methods and compositions for controlling gene expression by RNA processing | |
US11713471B2 (en) | Class II, type V CRISPR systems | |
Polidoros et al. | Rolling circle amplification-RACE: a method for simultaneous isolation of 5′ and 3′ cDNA ends from amplified cDNA templates | |
US20200172935A1 (en) | Modified cpf1 mrna, modified guide rna, and uses thereof | |
US11834670B2 (en) | Site-specific DNA modification using a donor DNA repair template having tandem repeat sequences | |
WO2022199511A1 (zh) | 一种Lt1Cas13d蛋白及基因编辑系统 | |
US20190292537A1 (en) | Prokaryotic Argonaute Proteins and Uses Thereof | |
WO2009012644A1 (en) | A pcr based high throughput method for construction of full sites small interfering rna (sirna) polynucleotides and related compositions | |
Karcher et al. | Identification of the chloroplast adenosine-to-inosine tRNA editing enzyme | |
JP2021528975A (ja) | Crispr/cas及びトランスポザーゼを利用した増幅用の組成物、システム、及び方法 | |
US20090111099A1 (en) | Promoter Detection and Analysis | |
CN116694603A (zh) | 新型的Cas蛋白、Crispr-Cas系统及其在基因编辑领域中的用途 | |
CN107338241B (zh) | 一种对基因启动子进行定向进化的方法 | |
WO2023206871A1 (zh) | 一种优化的CRISPR/SpCas12f1系统、工程化向导RNA及其应用 | |
CN117821423A (zh) | RalCas13d蛋白及其编辑系统 | |
US20200239932A1 (en) | Efficient screening library preparation | |
KR20240049306A (ko) | Ruvc 도메인을 갖는 효소 | |
JP6856639B2 (ja) | ドリメノールシンターゼiii | |
Liu et al. | The function of twister ribozyme variants in non-LTR retrotransposition in Schistosoma mansoni | |
Ojha et al. | In vitro and in cellula site-directed RNA editing using the λNDD-BoxB system | |
US20110071047A1 (en) | Promoter detection and analysis | |
CN116286905B (zh) | 牛源化CRISPR/boCas9基因编辑系统、方法及应用 | |
CN116751763B (zh) | 一种Cpf1蛋白、V型基因编辑系统及应用 | |
CN115896070A (zh) | 一种新型基因组编辑工具EbCas12a-D141R及其在基因编辑中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |