CN117625577A - 一种突变的v型crispr酶及其应用 - Google Patents
一种突变的v型crispr酶及其应用 Download PDFInfo
- Publication number
- CN117625577A CN117625577A CN202311101038.3A CN202311101038A CN117625577A CN 117625577 A CN117625577 A CN 117625577A CN 202311101038 A CN202311101038 A CN 202311101038A CN 117625577 A CN117625577 A CN 117625577A
- Authority
- CN
- China
- Prior art keywords
- amino acid
- seq
- cas12
- protein
- cas12 protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108091033409 CRISPR Proteins 0.000 title abstract description 15
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 153
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 152
- 238000003776 cleavage reaction Methods 0.000 claims abstract description 48
- 230000007017 scission Effects 0.000 claims abstract description 45
- 239000003391 RNA probe Substances 0.000 claims abstract description 31
- 239000000758 substrate Substances 0.000 claims abstract description 31
- 108020004518 RNA Probes Proteins 0.000 claims abstract description 28
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 27
- 230000035772 mutation Effects 0.000 claims abstract description 10
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 78
- 150000007523 nucleic acids Chemical class 0.000 claims description 49
- 102000039446 nucleic acids Human genes 0.000 claims description 44
- 108020004707 nucleic acids Proteins 0.000 claims description 44
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical group [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 23
- 239000011701 zinc Substances 0.000 claims description 23
- 229910052725 zinc Inorganic materials 0.000 claims description 23
- 239000000523 sample Substances 0.000 claims description 21
- 238000001514 detection method Methods 0.000 claims description 20
- 108020004711 Nucleic Acid Probes Proteins 0.000 claims description 18
- 239000002853 nucleic acid probe Substances 0.000 claims description 18
- 239000003298 DNA probe Substances 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 12
- 108020005004 Guide RNA Proteins 0.000 claims description 11
- 150000001413 amino acids Chemical class 0.000 claims description 10
- 108020003215 DNA Probes Proteins 0.000 claims description 9
- 238000006467 substitution reaction Methods 0.000 claims description 7
- 230000009870 specific binding Effects 0.000 claims description 6
- 238000011144 upstream manufacturing Methods 0.000 claims description 6
- 241000713772 Human immunodeficiency virus 1 Species 0.000 claims description 3
- 108090001074 Nucleocapsid Proteins Proteins 0.000 claims description 3
- 230000004572 zinc-binding Effects 0.000 claims description 3
- 108020004414 DNA Proteins 0.000 abstract description 31
- 230000000694 effects Effects 0.000 abstract description 13
- 238000006243 chemical reaction Methods 0.000 abstract description 8
- 238000005516 engineering process Methods 0.000 abstract description 4
- 108700004991 Cas12a Proteins 0.000 abstract description 3
- 229920001184 polypeptide Polymers 0.000 description 14
- 102000004196 processed proteins & peptides Human genes 0.000 description 14
- 108090000765 processed proteins & peptides Proteins 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 10
- 238000010354 CRISPR gene editing Methods 0.000 description 9
- 108091033319 polynucleotide Proteins 0.000 description 9
- 102000040430 polynucleotide Human genes 0.000 description 9
- 239000002157 polynucleotide Substances 0.000 description 9
- 238000011529 RT qPCR Methods 0.000 description 6
- 230000003321 amplification Effects 0.000 description 6
- 238000012921 fluorescence analysis Methods 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 6
- 125000003729 nucleotide group Chemical group 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 108091027544 Subgenomic mRNA Proteins 0.000 description 5
- 102000008300 Mutant Proteins Human genes 0.000 description 4
- 108010021466 Mutant Proteins Proteins 0.000 description 4
- 239000003161 ribonuclease inhibitor Substances 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 241000711573 Coronaviridae Species 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 230000027455 binding Effects 0.000 description 2
- 101150059443 cas12a gene Proteins 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 239000012154 double-distilled water Substances 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本申请提供一种突变的V型CRISPR酶及其应用。本申请通过蛋白突变理性突变技术,把Cas12a或Cas12b中RuvC识别切割DNA底物的限制去除,使其能够高效率地识别和切割RNA底物,在实际应用中解决RNA底物识别的效率不足的问题。提高Cas12反式切割活性打开后对RNA底物反应效率,提高Cas12使用RNA探针的报告效率。
Description
技术领域
本申请属于生物技术领域,具体地,涉及一种突变的V型CRISPR酶及其应用。
背景技术
V型CRISPR-Cas系统也被称为Cas12家族,它和其它CRISPR-Cas系统区别之处在于它是由单RuvC活性中心驱动的一个RNA介导的单效应子核酶。随着越来越多的Cas12被挖掘和识别出来,该家族已存在V-A,V-B,V-C,V-D,V-E,V-F,V-G,V-H,V-I,V-J,V-K等多个类别。
其中Cas12a和Cas12b由于其优异的反应性能,被用于多个与扩增技术联合的核酸检测技术及临床检测产品中。
在继往的报道中,Cas12a或Cas12b都是具备RNA介导的顺式DNase活性和反式DNase的活性,以及应运而生的检测应用;在某些报道中虽有提及Cas12a或Cas12b具备RNA介导的反式RNase的活性,可以以比DNA底物1/10的效率进行Rna底物的切割,但其对DNA底物的优先选择性,限制了在核酸扩增体系中其进一步的应用。这种有限的一个数量级的区分度,RNA探针作为另外一种报告底物进行检测的可能性。
发明内容
针对现有技术存在的问题,本申请提供一种突变的V型CRISPR酶及其应用。
具体来说,本申请涉及如下方面:
1.一种工程化的Cas12蛋白或其功能衍生物,其包含如下突变:
将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除,
优选地,参比Cas12蛋白的氨基酸序列如SEQ ID NO:1所示。
2.根据项1所述的工程化的Cas12蛋白或其功能衍生物,其中将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除通过以下方式实现:
将参比Cas12蛋白中的守门氨基酸的α螺旋上下游的手指替换为锌指结构域。
3.根据项1或2所述的工程化的Cas12蛋白或其功能衍生物,其中将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除是针对915-945位中的部分或全部区域进行结构域的替换,其中氨基酸位置编号如SEQ ID NO:1所定义。
4.根据项2所述的工程化的Cas12蛋白或其功能衍生物,其中所述锌指结构域具有1至2个锌结合位点,所述锌结合位点选自[CxxxxC]、[CxxxxH]、[CxxxC]、[HxxxH]、[CxxC]、[CxxH]中的一种,其中x表示任意天然氨基酸。
5.根据项4所述的工程化的Cas12蛋白或其功能衍生物,其中所述锌指结构域为Cas12g或HIV-1核壳体蛋白7(Ncp7)的锌指结构域。
6.根据项5所述的工程化的Cas12蛋白或其功能衍生物,其中参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。
7.根据项5所述的工程化的Cas12蛋白或其功能衍生物,其中参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。
8.根据项1所述的工程化的Cas12蛋白或其功能衍生物,其中参比Cas12蛋白的919-944位替换为SEQ ID NO:8所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。
9.根据项1所述的工程化的Cas12蛋白或其功能衍生物,其中参比Cas12蛋白的916-944位替换为SEQ ID NO:11所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。
10.一种工程化的Cas12蛋白或其功能衍生物,其包含基于参比Cas12蛋白的如下突变中的一种:
参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列;
参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列;
参比Cas12蛋白的919-944位替换为SEQ ID NO:8所示的氨基酸序列;
参比Cas12蛋白的916-944位替换为SEQ ID NO:11所示的氨基酸序列;
其中参比Cas12蛋白的氨基酸序列如SEQ ID NO:1所示。
11.一种工程化的Cas12蛋白或其功能衍生物,其序列为如SEQ ID NO:5、7、9或12中任一项所示的氨基酸序列。
12.一种用于检测靶标核酸分子的检测体系,所述体系包含:
项1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物;
向导RNA,所述向导RNA引导Cas12蛋白或其功能衍生物特异性结合于靶标核酸分子;和核酸探针。
13.根据项12所述的检测体系,其中所述核酸探针为RNA探针。
14.一种检测样品中靶标核酸分子的方法,包括:
使样品与项1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物、向导RNA和靶标核酸分子接触;以及
测量通过所述工程化的Cas12蛋白或其功能衍生物切割核酸探针而产生的可检测信号,从而检测所述靶标核酸分子。
15.根据项14所述的方法,其中核酸探针为RNA探针。
16.一种选择性检测靶标核酸分子的检测体系,所述体系包含:
两种以上对于RNA和DNA的切割特异性有显著性差异的Cas12蛋白或其功能衍生物;
向导RNA,所述向导RNA引导Cas12蛋白或其功能衍生物特异性结合于靶标核酸分子;和
核酸探针。
17.根据项16所述的检测体系,其中至少一种所述Cas12蛋白或其功能衍生物为项1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物。
18.根据项17所述的检测体系,其中所述核酸探针为DNA探针或RNA探针。
本申请通过蛋白突变理性突变技术,把Cas12b中RuvC识别切割DNA底物的限制去除,可以特异性的识别DNA底物或特异性的识别RNA底物,在实际应用中解决DNA/RNA底物识别的区分度不足的问题。
本申请的工程化的Cas12蛋白或其功能衍生物提高Cas12反式切割活性打开后对RNA底物反应效率,提高Cas12使用RNA探针的报告效率。
附图说明
图1显示Cas12b和Cas12g的序列比对结果;
图2显示4种突变蛋白的电泳图;
图3显示野生型和突变蛋白的DNA探针CRISPR切割结果;
图4显示突变蛋白的DNA探针CRISPR切割结果;
图5显示突变蛋白的RNA探针CRISPR切割结果;
图6显示突变蛋白应用于RPA扩增反应体系CRISPR切割结果。
具体实施方式
下面结合实施例进一步说明本申请,应当理解,实施例仅用于进一步说明和阐释本申请,并非用于限制本申请。
除非另外定义,本说明书中有关技术的和科学的术语与本领域内的技术人员所通常理解的意思相同。虽然在实验或实际应用中可以应用与此间所述相似或相同的方法和材料,本文还是在下文中对材料和方法做了描述。在相冲突的情况下,以本说明书包括其中定义为准,另外,材料、方法和例子仅供说明,而不具限制性。以下结合具体实施例对本申请作进一步的说明,但不用来限制本申请的范围。
定义
如本文所用,术语“Cas12”或“Cas12蛋白”包括Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas12h、Cas12i、Cas12g等。在一些实施方案中,Cas12蛋白是Cas12b蛋白,Cas12b蛋白在其最广泛的意义上使用,并且包括亲本或参考Cas12b蛋白质(例如,氨基酸序列为SEQ ID NO:1的AaCas12b)、其衍生物或变体以及功能性片段,诸如其寡核苷酸结合片段。
如本文所用,某种蛋白的“功能衍生物”包括所述蛋白的各种变体或功能结构域,只要所述变体或功能结构域保留了所述蛋白的某个功能结构域的功能(无论是增强的所述功能或减弱的所述功能),即可称为所述蛋白的功能衍生物。例如对于Cas12蛋白,保留了其部分结构域功能的Cas12蛋白变体或截短体均属于Cas12蛋白的功能衍生物。
如本文所用,“结构域”或“蛋白质结构域”是指可以独立于该蛋白质链的其余部分而存在并且起作用的蛋白质序列的一部分。
如本文所用,“向导RNA”、“sgRNA”“gRNA”在本文中可互换使用,是指能够与Cas12蛋白和靶标核酸形成复合物的RNA。
如本文所用,术语“核酸”、“多核苷酸”和“核苷酸序列”可互换使用,是指任何长度的核苷酸的聚合形式,包括脱氧核糖核苷酸、核糖核苷酸、其组合及其类似物。“寡核苷酸”和“低聚核苷酸”可互换使用,是指具有不超过约50个核苷酸的短多核苷酸。
如本文所用,核酸的“互补”是指一条核酸通过传统的Watson-Crick碱基配对与另一条核酸形成氢键的能力。百分比互补性表示核酸分子中可与另一核酸分子形成氢键(即,Watson-Crick碱基配对)的残基的百分比(例如,10个中的约5、6、7、8、9、10个分别为约50%,60%,70%,80%,90%和100%互补)。“完全互补”是指核酸序列的所有连续残基与第二核酸序列中相同数量的连续残基形成氢键。如本文所用,“基本上互补”是指在约40、50、60、70、80、100、150、200、250或更多个核苷酸的区域内,至少约70%,75%,80%,85%,90%,95%,97%,98%,99%或100%中的任何一个的互补程度,或指在严格条件下杂交的两条核酸。对于单个碱基或单个核苷酸,按照Watson-Crick碱基配对原则,A与T或U、C与G或I配对时,被称为互补或匹配,反之亦然;而除此以外的碱基配对都称为不互补或不匹配。如非特别指出,本申请的“互补”包含“完全互补”和“基本上互补”的情况。只要两条核酸序列可以通过Walson-Crick碱基配对形成稳定的杂合双链,则称所述两条核酸序列“互补”,其形成稳定的杂合双链的过程称为“互补杂交”。
如本文所用,术语“野生型”具有本领域技术人员通常理解的含义,意指当它存在于大自然中时,将其与突变体或变体区分开的、典型形式的生物体、菌株、基因或特征。它可以与自然界中的资源隔离开来,并没有被刻意修饰。
如本文所用,术语“非天然存在”或“工程化的”可互换使用,是指人工参与。当这些术语用于描述核酸分子或多肽时,是指所述核酸分子或多肽至少基本上不含其天然缔合的或天然存在的至少一种其他组分。
如本文所用,术语“同一性”用于表示两个多肽之间或两个核酸之间的序列匹配。当两个比较序列中的一个位置被相同的碱基或氨基酸单体亚基占据时(例如,两个DNA分子的每个中的一个位置都被腺嘌呤占据,或者两个多肽的每个中的一个位置被赖氨酸占据),那么在那个位置每个分子均相同。这两个序列之间的“同一性百分比”是两个序列共有的匹配位置数除以要比较的位置数x 100的函数。例如,如果两个序列的10个位置中有6个匹配,则这两个序列具有60%的同一性。例如,DNA序列CTGACT和CAGGTT具有50%的同一性(总共6个位置中有3个匹配)。通常,当两个序列进行比对以产生最大的同一性时,进行这种比较。这种比对可以通过例如Needleman et al.(1970)J.Mol.Biol.48:443-453中的方法来实现,所述方法可方便地通过计算机程序如比对(Align)程序(DNAstar,Inc.)来进行。也可以采用PAM 120权重残基表,使用E.Meyers和W.Miller的算法(Comput.Appl Biosci.,4:11-17(1988))集成到ALIGN程序(2.0版)中。空缺长度罚分12和空缺罚分4,用于确定两个氨基酸序列之间的同一性百分比。此外,可以使用集成到GCG软件包(可从www.gcg.com获得)的GAP程序中的Needleman和Wunsch(J MoI Biol.48:444-453(1970))算法,采用Blossum 62矩阵或PAM250矩阵,空缺权重为16、14、12、10、8、6或4,长度权重为1、2、3、4、5或6,以确定两个氨基酸序列之间的同一性百分比。
如本文所用,“变体”或“突变体”解释为分别不同于参比多核苷酸或多肽但保留必要特性的多核苷酸或多肽。多核苷酸的典型变体与另一参比多核苷酸的核酸序列不同。变体核酸序列的变化可以改变或可以不改变参比多核苷酸编码的多肽的氨基酸序列。核苷酸变化可导致参比序列编码的多肽中的氨基酸替换、添加、缺失、融合和截短,如下所述。多肽的典型变体与另一参比多肽在氨基酸序列上不同。通常,差异是有限的,使得参比多肽和变体的序列总体上非常相似,并且在许多区域是相同的。变体和参比多肽的氨基酸序列可以通过一个或多个替换、添加、缺失的任何组合而不同。替换或插入的氨基酸残基可以是或可以不是遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的(诸如等位基因变体),或者可以是未知天然存在的变体。多核苷酸和多肽的非天然存在的变体可以通过诱变技术,通过直接合成,以及通过本领域技术人员已知的其他重组方法来制备。
如本文所用,术语“靶标核酸”或“靶标核酸分子”是指样品中的目标核酸,可以是靶标RNA,也可以是靶标DNA,还可以同时含有靶标RNA和靶标DNA。
本申请提供一种工程化的Cas12蛋白或其功能衍生物,其包含如下突变:
将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的特异性进行改造。其中,参比Cas12蛋白可以是已知的野生型Cas12蛋白。在一些实施方案中,参比Cas12蛋白可以是已知的野生型Cas12蛋白。在一些实施方案中,参比Cas12蛋白可以是野生型Cas12b蛋白。
在一些实施方案中,参比Cas12蛋白可以是野生型AaCas12b蛋白。其氨基酸序列如SEQ ID NO:1所示。
在一些实施方案中,将参比Cas12蛋白中RuvC活性中心识别切割DNA底物的特异性进行改造。
在一些实施方案中,将参比Cas12蛋白中Nuc活性中心识别切割DNA底物的特异性进行改造。
在一些实施方案中,将参比Cas12蛋白中RuvC和Nuc活性中心识别切割DNA底物的特异性进行改造。
在一些实施方案中,将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的特异性进行改造包括如下方式:
将参比Cas12蛋白中的守门氨基酸的α螺旋上下游的手指替换为锌指结构域。
在一些实施方案中,将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除是针对915-945位中的部分或全部区域进行结构域的替换,其中氨基酸位置编号如SEQ ID NO:1所定义。其中的部分区域可以是915-945位中的一个位点或多个位点,也可以是一段区域多段区域。例如,部分区域可以是位点P916,或位点L941,或位点P916和位点L941;部分区域可以是919-944位,或916-944位。
在一些实施方案中,将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除是针对919-944位中的部分或全部区域进行结构域的替换,其中氨基酸位置编号如SEQ ID NO:1所定义。
在一些实施方案中,将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除是针对916-944位中的部分或全部区域进行结构域的替换,例如替换为锌指结构域,其中氨基酸位置编号如SEQ ID NO:1所定义。
在一些实施方案中,所述锌指结构域具有1至2个锌结合位点,所述锌结合位点选自[CxxxxC]、[CxxxxH]、[CxxxC]、[HxxxH]、[CxxC]、[CxxH]中的一种,其中x表示任意天然氨基酸。
在一些实施方案中,所述锌指结构域为Cas12g的锌指结构域。
在一些实施方案中,所述锌指结构域为HIV-1核壳体蛋白7(Ncp7)的锌指结构域。
在一些实施方案中,参比Cas12蛋白的919-944位替换为Cas12g的锌指结构域。
在一些实施方案中,参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。得到的工程化Cas12蛋白的氨基酸序列如SEQ ID NO:5所示。
在一些实施方案中,参比Cas12蛋白的919-944位替换为Ncp7的锌指结构域。
在一些实施方案中,参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。得到的工程化Cas12蛋白的氨基酸序列如SEQ ID NO:7所示。
在一些实施方案中,对参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的特异性进行改造是通过将参比Cas12蛋白中的守门氨基酸的919-944位替换为SEQ IDNO:8所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。得到的工程化Cas12蛋白的氨基酸序列如SEQ ID NO:9所示。
在一些实施方案中,对参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的特异性进行改造是通过将参比Cas12蛋白中的守门氨基酸的916-944位替换为SEQ IDNO:11所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。得到的工程化Cas12蛋白的氨基酸序列如SEQ ID NO:12所示。
本申请还提供一种工程化的Cas12蛋白或其功能衍生物,其包含基于参比Cas12蛋白的如下突变中的一种:
参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列;
参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列;
参比Cas12蛋白的919-944位替换为SEQ ID NO:8所示的氨基酸序列;
参比Cas12蛋白的916-944位替换为SEQ ID NO:11所示的氨基酸序列;
其中参比Cas12蛋白的氨基酸序列如SEQ ID NO:1所示。
本申请还提供一种用于检测靶标核酸分子的检测体系,所述体系包含:上述任意一种或多种工程化的Cas12蛋白或其功能衍生物;向导RNA,所述向导RNA引导Cas12蛋白或其功能衍生物特异性结合于靶标核酸分子;和核酸探针。其中,靶标核酸分子可以为靶标RNA,也可以为靶标DNA。
在一些实施方案中,核酸探针为RNA探针,RNA探针的具体组成和长度可以根据实际需要进行设计。
在一些实施方案中,RNA探针的序列为5‘FAM-rUrUrUrArGrCrArGrGrArUrUrCrArGrGrUrUrU-3’BHQ1(SEQ ID NO:17)。
在一些实施方案中,RNA探针的序列为5‘FAM-rCrArUrArUrUrGrArCrGrCrArUrArCrArArArArCrArUrUrCrCrCrArCrCrArArCrArGrArGrCrCrU-3’BHQ1(SEQ ID NO:18)。
在一些实施方案中,RNA探针的序列为5‘FAM-rCrCrCrCrCrCrCrCrCrC-3’BHQ1(SEQID NO:19)。
本申请还提供一种检测样品中靶标核酸分子的方法,包括:使样品与上述任意一种或多种工程化的Cas12蛋白或其功能衍生物、向导RNA和靶标核酸分子接触;以及测量通过所述工程化的Cas12蛋白或其功能衍生物切割核酸探针而产生的可检测信号,从而检测所述靶标核酸分子。其中,靶标核酸分子可以为靶标RNA,也可以为靶标DNA。
在一些实施方案中,核酸探针为RNA探针,RNA探针的具体组成和长度可以根据实际需要进行设计。
在一些实施方案中,RNA探针的序列为5‘FAM-rUrUrUrArGrCrArGrGrArUrUrCrArGrGrUrUrU-3’BHQ1(SEQ ID NO:17)。
在一些实施方案中,RNA探针的序列为5‘FAM-rCrArUrArUrUrGrArCrGrCrArUrArCrArArArArCrArUrUrCrCrCrArCrCrArArCrArGrArGrCrCrU-3’BHQ1(SEQ ID NO:18)。
在一些实施方案中,RNA探针的序列为5‘FAM-rCrCrCrCrCrCrCrCrCrC-3’BHQ1(SEQID NO:19)。
本申请还提供一种选择性检测靶标核酸分子的检测体系,所述体系包含:两种以上对于RNA和DNA的切割特异性有显著性差异的Cas12蛋白或其功能衍生物;向导RNA,所述向导RNA引导Cas12蛋白或其功能衍生物特异性结合于靶标核酸分子;和核酸探针。其中,两种以上的Cas12蛋白或其功能衍生物可以为两种、三种、四种、或更多种。
在一些实施方案中,至少一种对于RNA和DNA的切割特异性有显著性差异的Cas12蛋白或其功能衍生物为上述任意一种工程化的Cas12蛋白或其功能衍生物。其中,靶标核酸分子可以为靶标RNA,也可以为靶标DNA。
在一些实施方案中,核酸探针为DNA探针或RNA探针,DNA探针和RNA探针的具体组成和长度可以根据实际需要进行设计。
在一些实施方案中,RNA探针的序列为5‘FAM-rUrUrUrArGrCrArGrGrArUrUrCrArGrGrUrUrU-3’BHQ1(SEQ ID NO:17)。
在一些实施方案中,RNA探针的序列为5‘FAM-rCrArUrArUrUrGrArCrGrCrArUrArCrArArArArCrArUrUrCrCrCrArCrCrArArCrArGrArGrCrCrU-3’BHQ1(SEQ ID NO:18)。
在一些实施方案中,RNA探针的序列为5‘FAM-rCrCrCrCrCrCrCrCrCrC-3’BHQ1(SEQID NO:19)。
本申请发现Cas12蛋白的特定结构域是核酸特异性俘获的结构域,影响核酸反式切割反应底物的特异性俘获的能力。因此,通过敲除该结构域,得到无论是DNA或者RNA底物反式切割反应活力大大削弱的结果。在此基础上通过回补不同的核酸特异性结合的结构域,理论上可以形成不同核酸俘获能力并呈递给RuvC进行切割的能力。在本申请中,申请人尝试置换了该区段同源性较高的Cas12g,和同源性较低的Ncp7的锌指结构。两个结构域均为对RNA有偏好性识别的结构域——Cas12g已经被证明了对RNA的切割能力远远高于对DNA的切割能力,而Ncp7则是RNA特异性结合的结构蛋白,这两者对原有Cas12b结构域的置换均在本申请中证实具有更高的RNA识别和切割能力。进一步地,置换其他特异性碱基识别的锌指结构后,得到的工程化的Cas12蛋白能获得具体碱基组合特异性识别以及切割的分辨能力。
实施例
实施例1——Cas12b和Cas12g的序列比对和偏好性分析
使用CLUSTAL 2.1Mμltiple Sequence Alignments工具,对Cas12b和Cas12g进行同源比对,结果如图1所示。
图中SEQ ID NO:13为:
RFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEF
SEQ ID NO:14为:
RGMRVVTVPYLASSKVCAECRKKQ-KDNKQWEKNKKRGLFKCEGCGS
发现二者在RuvC(Nuv)区域的相似性比较高。识别出了Cas12b中与RuvC配合的α螺旋的与Cas12g1同源的结构,以及α螺旋上下游潜在的可形成更强锌指的位点P916和L941。
实施例2——Cas12b的守门氨基酸的α螺旋上下游的手指结构突变及蛋白质获取。
对野生型AaCas12b进行以下4种方式的突变。其中,野生型AaCas12b的氨基酸序列如SEQ ID NO:1所示,野生型Cas12g1的氨基酸序列如SEQ ID NO:2所示。
SEQ ID NO:1
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCAREQNPEPFPWWLNKFVAEHKLDGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI*
SEQ ID NO:2
MAQASSTPAVSPRPRPRYREERTLVRKLLPRPGQSKQEFRENVKKLRKAFLQFNADVSGVCQWAIQFRPRYGKPAEPTETFWKFFLEPETSLPPNDSRSPEFRRLQAFEAAAGINGAAALDDPAFTNELRDSILAVASRPKTKEAQRLFSRLKDYQPAHRMILAKVAAEWIESRYRRAHQNWERNYEEWKKEKQEWEQNHPELTPEIREAFNQIFQQLEVKEKRVRICPAARLLQNKDNCQYAGKNKHSVLCNQFNEFKKNHLQGKAIKFFYKDAEKYLRCGLQSLKPNVQGPFREDWNKYLRYMNLKEETLRGKNGGRLPHCKNLGQECEFNPHTALCKQYQQQLSSRPDLVQHDELYRKWRREYWREPRKPVFRYPSVKRHSIAKIFGENYFQADFKNSVVGLRLDSMPAGQYLEFAFAPWPRNYRPQPGETEISSVHLHFVGTRPRIGFRFRVPHKRSRFDCTQEELDELRSRTFPRKAQDQKFLEAARKRLLETFPGNAEQELRLLAVDLGTDSARAAFFIGKTFQQAFPLKIVKIEKLYEQWPNQKQAGDRRDASSKQPRPGLSRDHVGRHLQKMRAQASEIAQKRQELTGTPAPETTTDQAAKKATLQPFDLRGLTVHTARMIRDWARLNARQIIQLAEENQVDLIVLESLRGFRPPGYENLDQEKKRRVAFFAHGRIRRKVTEKAVERGMRVVTVPYLASSKVCAECRKKQKDNKQWEKNKKRGLFKCEGCGSQAQVDENAARVLGRVFWGEIELPTAIP
(1)将野生型AaCas12b的氨基酸序列的919-944区段(该区段的氨基酸序列为CAREQNPEPFPWWLNKFVAEHKLDGC(SEQ ID NO:3)),替换为Cas12g1的同源区段(该区段的氨基酸序列为CARCRKKQKDNKQWEKNKKRGLFKCEGC(SEQ ID NO:4)),得到的蛋白称为AaCas12b-SCas12g,其氨基酸序列如SEQ ID NO:5所示。其中下划线部分表示替换的区段。
SEQ ID NO:5
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCARCRKKQKDNKQWEKNKKRGLFKCEGCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI*
(2)将野生型AaCas12b的氨基酸序列的919-944区段,替换为Ncp7锌指区段(该区段的氨基酸序列为CFNCGKEGHTARNCRAPRKKGCWKCGKEGHNMKDC(SEQ ID NO:6)),得到的蛋白称为AaCas12b-NCP7,其氨基酸序列如SEQ ID NO:7所示。其中下划线部分表示替换的区段。
SEQ ID NO:7
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCFNCGKEGHTARNCRAPRKKGCWKCGKEGHNMKDCPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI*
(3)将野生型AaCas12b的氨基酸序列的919-944区段,替换为5MPL蛋白的区段(该区段的氨基酸序列为SQRPGAHLTVKKIFVGGIKEDTEEHHLRDYFEQYGKIEVIEIMTDRGSGKKRGFAFVTFDDHDSVDKIVIQKYHTVNGHNCEVRKALSKQEMASASSSQRGR(SEQ ID NO:8)),得到的蛋白称为AaCas12b-5MPL,其氨基酸序列如SEQ ID NO:9所示。其中下划线部分表示替换的区段。
SEQ ID NO:9
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARSQRPGAHLTVKKIFVGGIKEDTEEHHLRDYFEQYGKIEVIEIMTDRGSGKKRGFAFVTFDDH DSVDKIVIQKYHTVNGHNCEVRKALSKQEMASASSSQRGRPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI*
(4)将野生型AaCas12b的氨基酸序列的916-944区段(该区段的氨基酸序列为CAREQNPEPFPWWLNKFVAEHKLDGCPLR(SEQ ID NO:10)),替换为GGGGGG(SEQ ID NO:11)得到的蛋白称为AaCas12b-ggg,其氨基酸序列如SEQ ID NO:12所示。其中下划线部分表示替换的区段。
SEQ ID NO:12
MAVKSMKVKLRLDNMPEIRAGLWKLHTEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECYKTAEECKAELLERLRARQVENGHCGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKAKAEARKSTDRTADVLRALADFGLKPLMRVYTDSDMSSVQWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGEAYAKLVEQKSRFEQKNFVGQEHLVQLVNQLQQDMKEASHGLESKEQTAHYLTGRALRGSDKVFEKWEKLDPDAPFDLYDTEIKNVQRRNTRRFGSHDLFAKLAEPKYQALWREDASFLTRYAVYNSIVRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGEGRHAIRFQKLLTVEDGVAKEVDDVTVPISMSAQLDDLLPRDPHELVALYFQDYGAEQHLAGEFGGAKIQYRRDQLNHLHARRGARDVYLNLSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSEGRVPFCFPIEGNENLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPMDANQMTPDWREAFEDELQKLKSLYGICGDREWTEAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYQKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELLNQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARGGGGGGPLRADDLIPTGEGEFFVSPFSAEEGDFHQIHADLNAAQNLQRRLWSDFDISQIRLRCDWGEVDGEPVLIPRTTGKRTADSYGNKVFYTKTGVTYYERERGKKRRKVFAQEELSEEEAELLVEADEAREKSVVLMRDPSGIINRGDWTRQKEFWSMVNQRIEGYLVKQIRSRVRLQESACENTGDI*
根据以上4种突变体的氨基酸序列设计相应的载体,转入pET28表达载体中在大肠杆菌菌株BL21中进行诱导表达,通过亲和层析、离子交换层析等蛋白纯化方法,得到4种相应的突变蛋白。图2为纯化好的4种蛋白的聚丙烯酰胺凝胶电泳图。
实施例3——几种突变蛋白的DNA探针切割活性验证,以野生型的AaCas12b为对照。
具体地,按照表1所示的组分构成将各组分置于qPCR仪器中进行荧光值分析,将突变型或野生型AaCas12b,靶标sgRNA(150ng,购自金斯瑞生物科技有限公司,序列为:GTCTAAAGGACAGATTTTCAACGGGTGTGCCAATGGCCACTTTCCAGGTGGCAAAGCCCGTTGAACTTCAAGCGAAGTGGCACACTCAATACTTGAGCACACT(SEQ ID NO:15)),RNase inhibitor,ssDNA探针/ssRNA探针(购自上海百力格生物技术有限公司),靶标合成模板(1E12拷贝,购自上海百力格生物技术有限公司)置于1×rCutSmart缓冲液中,使用qPCR仪在42℃下反应60min,截取前6分钟的荧光强度增长进行荧光分析,检测结果如图3和图4所示。其中,探针序列信息和样本序列信息如表2和表3所示。
表1新冠O靶的Crispr切割体系
组分名称 | 使用浓度 | 终浓度 | 1rxn/μL |
ddH2O | / | / | to 20μL |
rCutSmart | 10X | 1X | 2 |
RNase inhibitor | 20U/μL | 0.5U/μL | 0.5 |
Cas12b | 600ng/μL | 60ng/μL | 2 |
sgRNA | 300ng/μL | 7.5ng/μL | 0.5 |
probe | 5μM | 500nM | 2 |
样本 | 2E11copies/μL | 1E12copies | 5 |
表2探针序列信息
T—FAM—BHQ1 | 5’FAM—TTTTTTT—3’BHQ1 |
C—FAM—BHQ1 | 5’FAM—CCCCCCC—3’BHQ1 |
A—FAM—BHQ1 | 5’FAM—AAAAAAA—3’BHQ1 |
G—FAM—BHQ1 | 5’FAM—GGGGGGG—3’BHQ1 |
表3样本序列信息
/>
其中图3为野生型和突变蛋白的DNA探针CRISPR切割结果,结果显示,对比野生型Cas12b蛋白的DNA探针切割活力,AaCas12b-SCas12g蛋白和Cas12b-NCP7蛋白对DNA探针的切割活力下降,对各碱基切割的偏好性发生改变,两个突变体蛋白对dA探针的切割偏好性明显下降。
图4为突变蛋白的DNA探针CRISPR切割结果,结果显示,对比置换了锌指结构的AaCas12b-SCas12g蛋白和Cas12b-NCP7蛋白,置换区域截短的突变AaCas12b-ggg和置换了非锌指结构的AaCas12b-5MPL对DNA探针的切割能力更低。
实施例4—几种突变蛋白的RNA探针切割活性验证,以野生型的AaCas12b为对照。
使用实施例3的切割体系测试各种RNA探针的活性。
具体地,按照实施例3的组分构成将各组分置于qPCR仪器中进行荧光值分析,我们将突变型或野生型AaCas12b,靶标sgRNA(SEQ ID NO:15),RNase inhibitor,ssDNA探针/ssRNA探针(购自上海百力格生物技术有限公司),靶标合成模板(1E12拷贝,购自上海百力格生物技术有限公司)置于1×rCutSmart缓冲液中,使用qPCR仪在42℃下反应60min,截取前6分钟的荧光强度增长进行荧光分析,检测结果如图5所示。其中探针序列信息如表4所示。
表4探针序列信息
结果显示,野生型Cas12b对不同长度的RNA探针切割活力相近。对于12b-RNAprobe探针的反应上,突变后的AaCas12b-SCas12g和Cas12b-NCP7蛋白切割活力要比野生型Cas12b蛋白切割各种RNA探针要高。
实施例5—AaCas12b-SCas12g和Cas12b-NCP7应用RNA探针进行检测的应用
具体地,按照试剂盒(购买自安普未来)构成将RPA体系A,B buffer,RPA上下游引物(各20pM,购自上海生工生物工程有限公司),新冠实际样本置于qPCR仪器中42℃孵育30min,样本选择检测真实提取的新冠样本,按照实施例3的组分构成将RPA扩增后的组分与CRISPR切割体系组分置于qPCR仪器中进行荧光值分析,将突变型或野生型AaCas12b,靶标sgRNA(SEQ ID NO:15),RNase inhibitor,ssRNA探针(购自上海百力格生物技术有限公司),置于1×rCutSmart缓冲液中,使用qPCR仪在42℃下反应60min,截取前6分钟的荧光强度增长进行荧光分析,检测结果如图6所示。其中,引物序列信息如表5所示,RPA扩增反应体系如表6所示,CRISPR反应切割体系如表7所示。
表5 RPA引物序列信息
RPA-F | TTACTTCTTCTTCTAAAACACCTGAAGAACATT(SEQ ID NO:20) |
RPA-R | GTGTAGATTGTCCAGAATAGGACCAATCTTTAT(SEQ ID NO:21) |
表6 RPA扩增反应体系
组分 | 体积(μL) |
A buffer | 29.4 |
RPA-F(10μM) | 2 |
RPA-R(10μM) | 2 |
ddH2O和RNA模板 | 14.1 |
B buffer | 2.5 |
总体积 | 50 |
表7 CRISPR反应切割体系
结果显示,经过等温扩增后,AaCas12b-SCas12g和Cas12b-NCP7两个蛋白使用靶向新冠病毒的特异性sgRNA作为引导,应用12b-RNA probe探针,能对阳性和阴性的新冠临床样本进行正确区分。
Claims (18)
1.一种工程化的Cas12蛋白或其功能衍生物,其包含如下突变:
将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除,
优选地,参比Cas12蛋白的氨基酸序列如SEQ ID NO:1所示。
2.根据权利要求1所述的工程化的Cas12蛋白或其功能衍生物,其中将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除通过如下方式实现:
将参比Cas12蛋白中的守门氨基酸的α螺旋上下游的手指替换为锌指结构域。
3.根据权利要求1或2所述的工程化的Cas12蛋白或其功能衍生物,其中将参比Cas12蛋白中RuvC和/或Nuc活性中心识别切割DNA底物的限制去除是针对915-945位中的部分或全部区域进行结构域的替换,其中氨基酸位置编号如SEQ ID NO:1所定义。
4.根据权利要求2所述的工程化的Cas12蛋白或其功能衍生物,其中所述锌指结构域具有1至2个锌结合位点,所述锌结合位点选自[CxxxxC]、[CxxxxH]、[CxxxC]、[HxxxH]、[CxxC]、[CxxH]中的一种,其中x表示任意天然氨基酸。
5.根据权利要求4所述的工程化的Cas12蛋白或其功能衍生物,其中所述锌指结构域为Cas12g或HIV-1核壳体蛋白7(Ncp7)的锌指结构域。
6.根据权利要求5所述的工程化的Cas12蛋白或其功能衍生物,其中参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。
7.根据权利要求5所述的工程化的Cas12蛋白或其功能衍生物,其中参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。
8.根据权利要求1所述的工程化的Cas12蛋白或其功能衍生物,其中参比Cas12蛋白的919-944位替换为SEQ ID NO:8所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。
9.根据权利要求1所述的工程化的Cas12蛋白或其功能衍生物,其中参比Cas12蛋白的916-944位替换为SEQ ID NO:11所示的氨基酸序列,其中氨基酸位置编号如SEQ ID NO:1所定义。
10.一种工程化的Cas12蛋白或其功能衍生物,其包含基于参比Cas12蛋白的如下突变中的一种:
参比Cas12蛋白的919-944位替换为SEQ ID NO:4所示的氨基酸序列;
参比Cas12蛋白的919-944位替换为SEQ ID NO:6所示的氨基酸序列;
参比Cas12蛋白的919-944位替换为SEQ ID NO:8所示的氨基酸序列;
参比Cas12蛋白的916-944位替换为SEQ ID NO:11所示的氨基酸序列;
其中参比Cas12蛋白的氨基酸序列如SEQ ID NO:1所示。
11.一种工程化的Cas12蛋白或其功能衍生物,其序列为如SEQ ID NO:5、7、9或12中任一项所示的氨基酸序列。
12.一种用于检测靶标核酸分子的检测体系,所述体系包含:
权利要求1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物;
向导RNA,所述向导RNA引导Cas12蛋白或其功能衍生物特异性结合于靶标核酸分子;
和核酸探针。
13.根据权利要求12所述的检测体系,其中所述核酸探针为RNA探针。
14.一种检测样品中靶标核酸分子的方法,包括:
使样品与权利要求1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物、向导RNA和靶标核酸分子接触;以及
测量通过所述工程化的Cas12蛋白或其功能衍生物切割核酸探针而产生的可检测信号,从而检测所述靶标核酸分子。
15.根据权利要求14所述的方法,其中所述核酸探针为RNA探针。
16.一种选择性检测靶标核酸分子的检测体系,所述体系包含:
两种以上对于RNA和DNA的切割特异性有显著性差异的Cas12蛋白或其功能衍生物;
向导RNA,所述向导RNA引导Cas12蛋白或其功能衍生物特异性结合于靶标核酸分子;和
核酸探针。
17.根据权利要求16所述的检测体系,其中至少一种所述Cas12蛋白或其功能衍生物为权利要求1-11中任一项所述的工程化的Cas12蛋白或其功能衍生物。
18.根据权利要求17所述的检测体系,其中所述核酸探针为DNA探针或RNA探针。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2022110394362 | 2022-08-29 | ||
CN202211039436 | 2022-08-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117625577A true CN117625577A (zh) | 2024-03-01 |
Family
ID=90027649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311101038.3A Pending CN117625577A (zh) | 2022-08-29 | 2023-08-29 | 一种突变的v型crispr酶及其应用 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117625577A (zh) |
WO (1) | WO2024046307A1 (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113286884A (zh) * | 2018-08-07 | 2021-08-20 | 博德研究所 | 新型cas12b酶和系统 |
CA3109083A1 (en) * | 2018-08-09 | 2020-02-13 | G+Flas Life Sciences | Compositions and methods for genome engineering with cas12a proteins |
US11459552B2 (en) * | 2018-09-13 | 2022-10-04 | The Board Of Regents Of The University Of Oklahoma | Variant CAS12 proteins with improved dna cleavage selectivity and methods of use |
EP4023766B1 (en) * | 2018-09-20 | 2024-04-03 | Institute Of Zoology, Chinese Academy Of Sciences | Method for detecting nucleic acid |
CN113308451B (zh) * | 2020-12-07 | 2023-07-25 | 中国科学院动物研究所 | 工程化的Cas效应蛋白及其使用方法 |
-
2023
- 2023-08-29 CN CN202311101038.3A patent/CN117625577A/zh active Pending
- 2023-08-29 WO PCT/CN2023/115471 patent/WO2024046307A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2024046307A1 (zh) | 2024-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110959040A (zh) | 具有改进的精度和特异性的碱基编辑器 | |
EP1918370B1 (en) | Mutant pcna | |
CN101228268A (zh) | Rna扩增和/或rna标记用的rna依赖的rna聚合酶,方法及试剂盒 | |
CN113046475B (zh) | 一种快速检测突变型新型冠状病毒的引物组合物及试剂盒 | |
CN113278733A (zh) | 一种检测新冠病毒的突变毒株的引物和探针的组合 | |
CN113234701B (zh) | 一种Cpf1蛋白及基因编辑系统 | |
CN111394337A (zh) | II类V型CRISPR蛋白Lb2Cas12a及其在基因编辑的应用 | |
CN113025748A (zh) | 一种快速检测新型冠状病毒69-70del突变的引物组合物及试剂盒 | |
CN112725299B (zh) | 改善Taq DNA聚合酶耐受性的突变体及制备方法和应用 | |
CN116410955B (zh) | 两种新型核酸内切酶及其在核酸检测中的应用 | |
Yang et al. | A genome-phenome association study in native microbiomes identifies a mechanism for cytosine modification in DNA and RNA | |
CN117625577A (zh) | 一种突变的v型crispr酶及其应用 | |
CN116179512B (zh) | 靶标识别范围广的核酸内切酶及其应用 | |
CN113046476A (zh) | 一种快速检测新型冠状病毒n501y突变的引物组合物及试剂盒 | |
CN116376905A (zh) | 一种基于crispr技术检测甘薯褪绿斑病毒的方法 | |
CN117210437A (zh) | 两种基因编辑工具酶鉴定及其在核酸检测中的应用 | |
CN109486919B (zh) | 一种pcr扩增试剂及其应用 | |
CN116103286A (zh) | 一种基于crispr技术检测甘薯羽状斑驳病毒的方法 | |
CN115851714A (zh) | 一种基于crispr技术检测甘薯褪绿矮化病毒的方法 | |
CN115161316A (zh) | 一种引导编辑工具、融合rna及其用途 | |
CN116376908A (zh) | 一种基于crispr技术检测甘薯卷叶病毒的方法 | |
CN114317831B (zh) | 一种用于检测新型冠状病毒Omicron突变株的试剂盒 | |
CN116334078A (zh) | 一种基于crispr技术检测甘薯病毒病的方法 | |
CN110964850B (zh) | 一种巴戟天花叶病毒的鉴定及其核糖体rna基因和应用 | |
CN115873989A (zh) | 一种基于crispr技术检测甘薯g病毒的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |