CN116949012B - 一种融合蛋白及其应用 - Google Patents

一种融合蛋白及其应用 Download PDF

Info

Publication number
CN116949012B
CN116949012B CN202311212915.4A CN202311212915A CN116949012B CN 116949012 B CN116949012 B CN 116949012B CN 202311212915 A CN202311212915 A CN 202311212915A CN 116949012 B CN116949012 B CN 116949012B
Authority
CN
China
Prior art keywords
fusion protein
sequence
polynucleotide
nucleic acid
target nucleic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311212915.4A
Other languages
English (en)
Other versions
CN116949012A (zh
Inventor
梁峻彬
黄连成
徐辉
蔡金秀
杨正霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Ruifeng Biotechnology Co ltd
Original Assignee
Guangzhou Ruifeng Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Ruifeng Biotechnology Co ltd filed Critical Guangzhou Ruifeng Biotechnology Co ltd
Priority to CN202311212915.4A priority Critical patent/CN116949012B/zh
Publication of CN116949012A publication Critical patent/CN116949012A/zh
Application granted granted Critical
Publication of CN116949012B publication Critical patent/CN116949012B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本发明公开了一种融合蛋白及其应用。所述融合蛋白通过将氨基酸序列如SEQ ID NO:1所示的Cas9蛋白的核酸酶活性失活突变体的第943‑952位氨基酸残基替换为功能结构域而得到。本发明的融合蛋白用于基因编辑,可实现高特异性切割、高编辑效率,脱靶风险低。

Description

一种融合蛋白及其应用
技术领域
本发明属于生物技术领域,具体涉及一种融合蛋白及其应用。
背景技术
CRISPR-Cas9是细菌和古细菌在长期演化过程中形成的一种适应性免疫防御,可用来对抗入侵的病毒及外源DNA。来源于酿脓链球菌的CRISPR/Cas9系统的SpCas9由于操作简单且高效被广泛运用于基因工程。CRISPR-Cas9系统由Cas9,crRNA和tracrRNA组成,其中Cas9蛋白是一种DNA内切酶,很多细菌都可以表达该蛋白,Cas9内切酶必须在gRNA(crRNA和tracrRNA的复合物)分子引导下对DNA进行切割;Cas9、crRNA及tracrRNA首先结合形成复合物,识别并结合crRNA的互补靶序列,随后Cas9蛋白的HNH核酸酶结构域活性位点剪切crRNA的互补DNA链,Ruvc核酸酶结构域活性位点剪切非互补链,使DNA双链断裂,通过NHEJ或者HDR实现对特定DNA的编辑效应。
CRISPR/Cas9基因编辑技术已经显示巨大的应用价值,但是其在编辑效率及脱靶效应等方面尚有很多问题需要解决。
发明内容
本发明所要解决的技术问题是现有技术缺少高编辑效率及低脱靶效应的基因编辑工具的缺陷,提供了一种融合蛋白及其应用。本发明的融合蛋白用于基因编辑,可实现高特异性切割、高编辑效率,脱靶风险低。
为了提高DNA切割特异性,我们生成了无催化活性的Cas9和FokI核酸酶的融合体,并对FokI在融合蛋白中的位置做了设计、筛选和测试,最终获得一个新融合蛋白,其编辑活性优于目前已知的末端融合FokI的Cas9。
在许多情况下,本发明的dCas9-FokI联合一对gRNA的indel效率甚至高于野生型SpCas9。
且本领域技术人员应知晓,本发明的dCas9-FokI联合一对gRNA在互补的DNA双链上产生两个单链断裂,即可形成一个双链断裂。相对于野生型SpCas9直接引入双链断裂而言,预期本发明的dCas9-FokI可降低脱靶活性,例如参见Maryam Saifaldeen, et al.,CRISPR FokI Dead Cas9 System: Principles and Applications in GenomeEngineering, Cells, 2020, 9, 2518。
本发明通过以下技术方案解决上述技术问题。
本发明的第一方面提供一种融合蛋白,所述融合蛋白通过将dCas9的无规则卷曲(无规卷曲,random coil)结构的连续氨基酸残基替换为功能结构域而得到,所述dCas9为无核酸酶活性的Cas9蛋白;
可选地,所述功能结构域任选自脱氨酶域(包括但不限于胞嘧啶脱氨酶结构域、腺嘌呤脱氨酶结构域)、UGI域、UDG域、甲基化结构域、去甲基化结构域、亚细胞定位信号(包括但不限于核定位信号、核输出信号、线粒体定位信号、叶绿体定位信号)、转录激活域、转录抑制域、核酸酶域(包括但不限于FokI域)、组蛋白脱乙酰化结构域、DNA连接结构域;进一步地,所述功能结构域为核酸酶域;再进一步地,所述功能结构域为FokI域;
可选地,所述无规则卷曲结构位于dCas9的REC1-A和/或REC1-B结构域;
可选地,所述无规则卷曲结构位于dCas9的RuvC、环L2结构域和/或HNH结构域;或所述无规则卷曲结构位于dCas9的RuvC结构域;或所述无规则卷曲结构位于dCas9的RuvC-Ⅲ结构域。
本发明的第二方面提供一种融合蛋白,所述融合蛋白包括dCas9和功能结构域,所述dCas9中无规则卷曲中的连续氨基酸残基替换为功能结构域;所述dCas9为无核酸酶活性的Cas9蛋白;
可选地,所述功能结构域任选自脱氨酶域(包括但不限于胞嘧啶脱氨酶结构域、腺嘌呤脱氨酶结构域)、UGI域、UDG域、甲基化结构域、去甲基化结构域、亚细胞定位信号(包括但不限于核定位信号、核输出信号、线粒体定位信号、叶绿体定位信号)、转录激活域、转录抑制域、核酸酶域(包括但不限于FokI域)、组蛋白脱乙酰化结构域、DNA连接结构域;进一步地,所述功能结构域为核酸酶域;再进一步地,所述功能结构域为FokI域;
可选地,所述无规则卷曲结构位于dCas9的REC1-A和/或REC1-B结构域;
可选地,所述无规则卷曲结构位于dCas9的RuvC、环L2结构域和/或HNH结构域;或所述无规则卷曲结构位于dCas9的RuvC结构域;或所述无规则卷曲结构位于dCas9的RuvC-Ⅲ结构域。
本发明一些实施方案中,所述融合蛋白能够在指导多核苷酸的指导下特异性地结合至靶核酸。
本发明一些实施方案中,所述融合蛋白能够在指导多核苷酸的指导下序列特异性地结合至靶核酸,所述指导多核苷酸包含指导序列,所述指导序列与所述靶核酸杂交。
本发明一些实施方案中,所述融合蛋白能够与指导多核苷酸形成复合物,所述指导多核苷酸包含指导序列,所述指导序列被工程化以指导所述复合物序列特异性地结合至靶核酸。
本发明一些具体实施方案中,所述功能结构域为FokI域,所述融合蛋白能够在指导多核苷酸的指导下识别双链靶核酸并对所述靶核酸进行切刻;或所述融合蛋白能够与指导多核苷酸形成复合物,所述指导多核苷酸包含指导序列,所述指导序列被工程化以指导所述复合物序列特异性结合至双链靶核酸并对所述靶核酸进行切刻。
本发明一些较佳实施方案中,所述指导多核苷酸还包含骨架序列;进一步地,所述骨架序列与所述融合蛋白的dCas9部分相互作用,或所述骨架序列使所述指导多核苷酸与所述融合蛋白形成复合物。
本发明一些实施方案中,所述Cas9蛋白选自SpCas9、SaCas9、NmeCas9、StCas9和CjCas9。
本发明一些较佳实施方案中,所述Cas9蛋白为SpCas9(化脓链球菌Cas9)或SaCas9(金黄色葡萄球菌Cas9)。
本发明一些具体实施方案中,所述SpCas9的氨基酸序列如SEQ ID NO: 1所示。
本发明一些实施方案中,所述Cas9蛋白的氨基酸序列与如SEQ ID NO: 1所示的氨基酸序列具有≥80%、≥85%、≥90%、≥95%、≥96%、≥97%、≥98%、≥99%或≥99.5%的序列同一性。
本发明一些具体实施方案中,所述dCas9的氨基酸序列如SEQ ID NO: 2所示或与如SEQ ID NO: 2所示的氨基酸序列具有≥80%、≥85%、≥90%、≥95%、≥96%、≥97%、≥98%、≥99%或≥99.5%的序列同一性。
本发明一些实施方案中,所述dCas9为Cas9蛋白的RuvC结构域和/或HNH结构域上发生突变例如点突变,使Cas9蛋白无核酸酶活性。
本发明一些较佳实施方案中,所述dCas9为在SpCas9的D10和N863对应位置突变为A的Cas9;或所述dCas9为在SpCas9的D10和H840对应位置突变为A的Cas9。所述对应位置可通过所述Cas9与SpCas9的序列比对而确定。
本发明一些较佳实施方案中,所述dCas9为存在D10A和N863A突变的SpCas9、存在D10A和H840A突变的SpCas9。
本发明一些较佳实施方案中,所述dCas9为存在D10A和H557A突变的SaCas9。
本发明一些实施方案中,所述功能结构域直接或通过连接子与dCas9融合。本发明一些实施方案中,所述功能结构域直接与dCas9融合(即功能结构域的N末端残基直接与dCas9裂分的N末端残基通过肽键共价连接,功能结构域的C末端残基直接与dCas9裂分的C末端残基通过肽键共价连接),或所述功能结构域通过氨基酸序列与dCas9融合。本发明一些实施方案中,所述功能结构域直接与dCas9融合,或所述功能结构域通过长度为1-50个、1-40个、1-30个、1-20个、5-16、1-10个、10-20个、3-8个或15-20个氨基酸残基的连接子序列与dCas9融合。
本发明一些具体实施方案中,所述连接子为氨基酸残基序列GGSGS(SEQ ID NO:50)或SGSETPGTSESATPES(SEQ ID NO: 51)。
本发明一些实施方案中,所述融合蛋白通过将dCas9的无规则卷曲结构的1-20个连续氨基酸残基替换为功能结构域而得到。
本发明一些实施方案中,所述融合蛋白通过将dCas9的无规则卷曲结构的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个连续氨基酸残基替换为功能结构域而得到。
本发明一些实施方案中,所述融合蛋白通过将dCas9的无规则卷曲结构的1-15个、3-11个、3-10个或9-11个连续氨基酸残基替换为功能结构域而得到。
本发明一些实施方案中,替换的无规则卷曲结构的长度为1-15个氨基酸残基。
本发明一些具体实施方案中,替换的无规则卷曲结构的长度为3-11个氨基酸残基。
本发明另一些具体实施方案中,替换的无规则卷曲结构的长度为3-10个氨基酸残基。
本发明另一些具体实施方案中,替换的无规则卷曲结构的长度为9-11个氨基酸残基。
本发明另一些具体实施方案中,替换的无规则卷曲结构的长度为3个氨基酸残基。
本发明一些实施方案中,所述无规则卷曲结构对应于SEQ ID NO: 2所示序列的第37-41位、第107-113位、第147-149位、第169-172位、第308-314位、第792-799位、第864-871位、第906-908位、第943-952位和/或第1015-1017位。
本发明一些较佳实施方案中,当所述dCas9的氨基酸序列如SEQ ID NO: 2所示时,所述替换发生在第37-41位、第107-113位、第147-149位、第169-172位、第308-314位、第792-799位、第864-871位、第906-908位、第943-952位或第1015-1017位。
本发明中,所述无规则卷曲结构的位置可通过与SEQ ID NO: 2所示序列的序列比对而确定。
本发明一些实施方案中,所述功能结构域通过替换所述dCas9的被替换序列后直接或通过连接子与dCas9融合。
本发明一些具体实施方案中,被替换序列的长度为1-15个氨基酸残基。
本发明另一些具体实施方案中,被替换序列的长度为3-11个氨基酸残基。
本发明另一些具体实施方案中,被替换序列的长度为3-10个氨基酸残基。
本发明另一些具体实施方案中,被替换序列的长度为9-11个氨基酸残基。
本发明另一些具体实施方案中,被替换序列的长度为3个氨基酸残基。
本发明一些具体实施方案中:
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第37-41位时,被替换序列的长度为5个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第107-113位时,被替换序列的长度为7个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第147-149位时,被替换序列的长度为3个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第169-172位时,被替换序列的长度为4个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第308-314位时,被替换序列的长度为7个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第792-799位时,被替换序列的长度为8个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第864-871位时,被替换序列的长度为8个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第906-908位时,被替换序列的长度为3个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第943-952位时,被替换序列的长度为10个氨基酸残基;
当所述被替换序列位于如SEQ ID NO: 2所示的氨基酸序列的第1015-1017位时,被替换序列的长度为3个氨基酸残基。
本发明的一些实施方案中,所述FokI域包括FokI核酸内切酶的DNA结合结构域和切割结构域。
本发明的一些实施方案中,所述FokI域包括或为FokI核酸内切酶的DNA切割结构域。
本发明中,所述FokI域可以以单体或二聚体形式存在。例如FokI域可以在溶液中以单体形式存在。
本发明的一些实施方案中,所述FokI域具有核酸酶活性。
本发明的一个示例中,第一所述融合蛋白可与第一指导多核苷酸一起结合至双链靶核酸的其中一条单链,第二所述融合蛋白可与第二指导多核苷酸一起结合至所述靶核酸的另外一条单链;
第一所述融合蛋白和第二所述融合蛋白的FokI域在双链靶核酸上存在间隔序列且可形成二聚体,所述间隔序列的长度为1-100bp,所述二聚体在第一所述融合蛋白、第一指导多核苷酸、第二所述融合蛋白及第二指导多核苷酸与靶核酸结合时可对所述双链靶核酸进行切割。
本发明的一个示例中,所述FokI域可在dCas9与双链靶DNA结合后二聚化以通过其核酸酶活性实现对双链靶DNA的切割。当所述FokI域二聚化时,两个FokI域在双链靶DNA上存在间隔序列以对双链靶DNA进行切割。此处间隔序列并不是指CRISPR系统中的CRISPR阵列(CRISPR array)的spacer序列。
本发明中,所述间隔序列的长度可为1-100bp、1-90bp、1-80bp、1-70bp、1-60bp、1-50bp、1-40bp、1-30bp、1-20bp、1-10bp、1-5bp、2-100bp、2-90bp、2-80bp、2-70bp、2-60bp、2-50bp、2-40bp、2-30bp、2-20bp、2-10bp、2-5bp、3-100bp、3-90bp、3-80bp、3-70bp、3-60bp、3-50bp、3-40bp、3-30bp、3-20bp、3-10bp、3-5bp、4-100bp、4-90bp、4-80bp、4-70bp、4-60bp、4-50bp、4-40bp、4-30bp、4-20bp、4-10bp、4-5bp、5-100bp、5-90bp、5-80bp、5-70bp、5-60bp、5-50bp、5-40bp、5-30bp、5-20bp、5-10bp、10-100bp、10-90bp、10-80bp、10-70bp、10-60bp、10-50bp、10-40bp、10-30bp、10-20bp、15-100bp、15-90bp、15-80bp、15-70bp、15-60bp、15-50bp、15-40bp、15-30bp、15-20bp、20-100bp、20-90bp、20-80bp、20-70bp、20-60bp、20-50bp、20-40bp、20-30bp或20-25bp。本发明一些实施方案中,所述间隔序列的长度为4-30bp。本发明一些实施方案中,所述间隔序列的长度为6-20bp。本发明一些实施方案中,所述间隔序列的长度为1 bp、2 bp、3 bp、4 bp、5 bp、6 bp、7 bp、8 bp、9 bp、10 bp、11 bp、12bp、13 bp、14 bp、15 bp、16 bp、17 bp、18 bp、19 bp、20 bp、21 bp、22 bp、23 bp、24 bp、25bp、26 bp、27 bp、28 bp、29 bp、30 bp、31 bp、32 bp、33 bp、34 bp、35 bp、36 bp、37 bp、38bp、39 bp或40 bp。所述间隔序列的长度例如为4 bp、5 bp、6 bp、7 bp、8 bp、9 bp、10 bp、11 bp、12 bp、13 bp、14 bp、15 bp、16 bp、17 bp、18 bp、19 bp、20 bp、21 bp、22 bp、23bp、24 bp、25 bp、26 bp、27 bp、28 bp、29 bp或30 bp。
本发明一些实施方案中,所述FokI域的氨基酸序列与SEQ ID NO: 4所示序列的第6位-第201位氨基酸残基序列具有≥50%、≥60%、≥70%、≥80%、≥90%、≥95%、≥98%或≥99%的序列同一性。
本发明一些实施方案中,所述FokI域包含SEQ ID NO: 4所示序列的第6位-第201位氨基酸残基序列。
本发明一些实施方案中,所述FokI域由SEQ ID NO: 4所示序列的第6位-第201位氨基酸残基序列组成。
本发明一些实施方案中,所述FokI域的氨基酸序列如SEQ ID NO: 52所示或与如SEQ ID NO: 52所示的氨基酸序列具有≥50%、≥60%、≥70%、≥80%、≥90%、≥95%、≥98%或≥99%的序列同一性。
本发明一些实施方案中,所述指导多核苷酸为单分子指导多核苷酸或双分子指导多核苷酸。非限制性示例例如,所述指导多核苷酸由CRISPR-Cas9系统中的crRNA和tracrRNA嵌合形成单分子指导多核苷酸(sgRNA)。再例如,所述指导多核苷酸是由CRISPR-Cas9系统中的crRNA和tracrRNA这2个分离的分子组成的组,即为所述的双分子。
本发明一些实施方案中,所述融合蛋白还包含以下的任一种或更多种:亚细胞定位信号、DNA结合域、转录激活域、转录抑制域、核酸酶域、脱氨酶结构域、UDG域、UGI域、甲基化酶、去甲基化酶、组蛋白脱乙酰酶、DNA连接酶、表位标签和报告蛋白;
可选地,所述亚细胞定位信号任选自:核定位信号、核输出信号、线粒体定位信号、叶绿体定位信号。
本发明中,所述融合蛋白优选地为通过将氨基酸序列如SEQ ID NO: 1所示的Cas9蛋白的核酸酶活性失活突变体的第943-952位氨基酸残基替换为功能结构域而得到的融合蛋白;
可选地,所述失活突变体相对SEQ ID NO: 1具有D10A和N863A突变,或者,D10A和H840A突变;
可选地,所述功能结构域为FokI域;进一步地,所述FokI域为FokI核酸内切酶的DNA切割结构域;再进一步地,所述FokI域的氨基酸序列如SEQ ID NO: 52所示;
可选地,所述功能结构域通过连接子序列分别与Cas9失活突变体的N-端和C-端连接;进一步地,所述功能结构域通过氨基酸序列如SEQ ID NO: 50和SEQ ID NO: 51所示的连接子分别与Cas9失活突变体的N-端和C-端连接;
可选地,所述融合蛋白的N-末端和/或C-末端融合至少1个核定位序列;
可选地,所述融合蛋白能够与指导多核苷酸形成复合物,所述指导多核苷酸包含指导序列,所述指导序列被工程化以指导所述复合物序列特异性结合至双链靶DNA并对所述靶DNA进行切刻;进一步地,所述指导多核苷酸为单分子指导多核苷酸或双分子指导多核苷酸;进一步地,所述指导多核苷酸由CRISPR-Cas9系统中的crRNA和tracrRNA嵌合形成单分子指导多核苷酸或者所述指导多核苷酸是由CRISPR-Cas9系统中的crRNA和tracrRNA这2个分离的分子组成的组,所述crRNA由指导序列和同向重复序列组成。
本发明一些实施方案中,所述融合蛋白包含如SEQ ID NO: 3所示的氨基酸序列。
本发明一些具体实施方案中,所述融合蛋白的氨基酸序列如SEQ ID NO: 3所示。
本发明的第二方面提供一种核糖核蛋白复合物(RNP复合物),所述RNP复合物包括指导多核苷酸和如第一方面所述的融合蛋白。
本发明一些实施方案中,所述指导多核苷酸指导所述核糖核蛋白复合物序列特异性结合靶核酸。
本发明一些实施方案中,所述指导多核苷酸包含指导序列,所述指导序列通过工程化以指导所述核糖核蛋白复合物序列特异性结合靶核酸。
本发明一些较佳实施方案中,所述指导多核苷酸还包含骨架序列;所述骨架序列与所述融合蛋白的dCas9部分相互作用,或所述骨架序列使所述指导多核苷酸与所述融合蛋白形成复合物。
本发明一些实施方案中,所述指导多核苷酸为单分子指导多核苷酸或双分子指导多核苷酸。
本发明的第三方面提供一种基因编辑系统,所述基因编辑系统包括:
(1)如第一方面所述的融合蛋白,或编码其的核酸;和/或,
(2)指导多核苷酸,或编码其的核酸。
本发明一些实施方案中,所述指导多核苷酸指导所述融合蛋白序列特异性结合靶核酸。
本发明一些实施方案中,所述指导多核苷酸包含指导序列,所述指导序列通过工程化以指导所述核糖核蛋白复合物序列特异性结合靶核酸。
本发明一些较佳实施方案中,所述指导多核苷酸还包含骨架序列;所述骨架序列使所述指导多核苷酸与所述融合蛋白形成复合物。
本发明一些实施方案中,所述基因编辑系统包含1种、2种、3种、4种、5种、6种、7种、8种、9种、10种或更多种不同的融合蛋白。本发明一些实施方案中,所述基因编辑系统包含1个融合蛋白。
本发明一些实施方案中,所述基因编辑系统包含至少2种不同的指导多核苷酸。
本发明一些实施方案中,所述基因编辑系统包含1种、2种、3种、4种、5种、6种、7种、8种、9种、10种或更多种不同的指导多核苷酸。本发明一些实施方案中,所述基因编辑系统包含2种不同的指导多核苷酸。
本发明一些实施方案中,所述不同的指导多核苷酸之间指导序列不同,骨架序列相同。本发明一些实施方案中,所述不同的指导多核苷酸之间指导序列不同,骨架序列不同。
本发明一些实施方案中,所述指导多核苷酸为单分子指导多核苷酸或双分子指导多核苷酸。本发明一些实施方案中,所述指导多核苷酸为crRNA与tracrRNA嵌合得到的单分子指导多核苷酸。本发明一些实施方案中,所述指导多核苷酸为crRNA与tracrRNA通过核苷酸序列嵌合得到的单分子指导多核苷酸。本发明一些实施方案中,所述指导多核苷酸为crRNA分子与tracrRNA分子组成的双分子指导多核苷酸。
本发明的第四方面提供一种多核苷酸,所述多核苷酸编码如第一方面所述的融合蛋白或者如第二方面所述的核糖核蛋白复合物。
本发明一些实施方案中,编码所述核糖核蛋白复合物的多核苷酸中,编码指导多核苷酸的多核苷酸与编码所述融合蛋白的多核苷酸在相同或不同的核酸链上。
本发明的第五方面提供一种表达盒,所述表达盒包含启动子以及如第四方面所述的多核苷酸;所述启动子序列调控所述编码序列的表达。
本发明的第六方面提供一种重组表达载体,所述重组表达载体包含如第四方面所述的多核苷酸,以及可选的顺式作用元件和/或反式作用因子编码基因。
本发明一些实施方案中,所述顺式作用元件选自启动子、增强子和沉默子。
本发明一些实施方案中,所述反式作用因子编码基因选自编码聚合酶、转录因子和/或转录调控因子的核苷酸。
本发明的第七方面提供一种组合物,所述组合物包括递送载体,以及如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒和/或如第六方面所述的重组表达载体。
本发明的第八方面提供一种重组细胞,所述重组细胞包含如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体和/或第七方面所述的组合物。
本发明的第九方面提供一种药物组合物,所述药物组合物包含如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物和/或如第八方面所述的重组细胞,以及任选地药学上可接受的载体和/或辅料。
本发明的第十方面提供一种试剂盒,所述试剂盒包含如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物、如第八方面所述的重组细胞和/或如第九方面所述的药物组合物。
本发明的第十一方面提供一种如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物、如第八方面所述的重组细胞、如第九方面所述的药物组合物和/或如第十方面所述的试剂盒在制备诊断、预防和/或治疗与靶核酸相关的疾病或病症的药物中的应用。
本发明的第十二方面提供一种诊断、预防和/或治疗与靶核酸相关的疾病或病症的方法,所述方法包括向有需要的患者施用如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物、如第八方面所述的重组细胞、如第九方面所述的药物组合物和/或如第十方面所述的试剂盒。
本发明的第十三方面提供一种如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物、如第八方面所述的重组细胞、如第九方面所述的药物组合物和/或如第十方面所述的试剂盒,所述融合蛋白、核糖核蛋白复合物、基因编辑系统、多核苷酸、表达盒、重组表达载体、组合物、重组细胞、药物组合物或试剂盒用于诊断、预防和/或治疗与靶核酸相关的疾病或病症。
本发明的第十四方面提供一种体外、离体或体内编辑靶核酸的方法,所述方法包括将如第一方面所述的融合蛋白、如第二方面所述的核糖核蛋白复合物、如第三方面所述的基因编辑系统、如第四方面所述的多核苷酸、如第五方面所述的表达盒、如第六方面所述的重组表达载体、如第七方面所述的组合物、如第八方面所述的重组细胞、如第九方面所述的药物组合物和/或如第十方面所述的试剂盒与靶核酸接触的步骤,使所述靶核酸的序列发生变化或改变所述靶核酸的表达水平。
本发明的一个示例中,所述方法包括将如本发明所述的第一融合蛋白、第二融合蛋白、第一指导多核苷酸及第二指导多核苷酸与双链靶核酸接触的步骤,使所述靶核酸的序列发生变化或改变所述靶核酸的表达水平;
其中,第一所述融合蛋白可与第一指导多核苷酸一起结合至双链靶核酸的其中一条单链,第二所述融合蛋白可与第二指导多核苷酸一起结合至所述靶核酸的另外一条单链;
第一所述融合蛋白和第二所述融合蛋白的FokI域在双链靶核酸上存在间隔序列且可形成二聚体,所述间隔序列的长度为1-100bp,所述二聚体在第一所述融合蛋白、第一指导多核苷酸、第二所述融合蛋白及第二指导多核苷酸与靶核酸结合时可对所述双链靶核酸进行切割。
在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
本发明所用试剂和原料均市售可得。
本发明的积极进步效果在于:
含本发明的融合蛋白的基因编辑系统的编辑效率高,脱靶风险低。
附图说明
图1为在dCas9蛋白内部替换入具有单链核酸切刻能力的FokI结构域示意图。
图2为双gRNA引导dCas9-FokI靶向切割两条单链,进而形成双链断裂的示意图;
图中的核苷酸序列如SEQ ID NO: 32所示,氨基酸序列如SEQ ID NO: 33所示。
图3为dCas9-FokI融合蛋白编辑后的流式检测结果示意图。
图4为不同重组蛋白靶向报告系统的编辑效率示意图。
图5为不同重组蛋白靶向内源基因的编辑效率示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。
术语
在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的分子遗传学、核酸化学、化学、分子生物学、生物化学、细胞培养、微生物学、细胞生物学、基因组学和重组DNA等操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
在本发明中,氨基酸序列中的字母表示本领域公知的氨基酸的单字母缩写,例如J. Biol. Chem, 243, p3558(1968)中所述:丙氨酸:Ala-A、精氨酸:Arg-R、天冬氨酸:Asp-D、半胱氨酸:Cys-C、谷氨酰胺:Gln-Q、谷氨酸:Glu-E、组氨酸:His-H、甘氨酸:Gly-G、天冬酰胺:Asn-N、酪氨酸:Tyr-Y、脯氨酸:Pro-P、丝氨酸:Ser-S、甲硫氨酸:Met-M、赖氨酸:Lys-K、缬氨酸:Val-V、异亮氨酸:Ile-I、苯丙氨酸:Phe-F、亮氨酸:Leu-L、色氨酸:Trp-W、苏氨酸:Thr-T。
在本发明中,以SpCas9蛋白为例,位点所表示的数字指的是对应到野生型SpCas9蛋白氨基酸序列SEQ ID NO: 1上的氨基酸残基的位置。在本发明中,位点前的字母表示原氨基酸残基,位点后的字母表示取代后的氨基酸残基。
在本发明中,术语“同一性”(identity或percent identity)用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个DNA分子中的每一个的某个位置都被腺嘌呤占据,或两个多肽中的每一个的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分比序列同一性”(percent identity)是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100%的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的序列同一性。通常,在将两个序列比对以产生最大序列同一性时进行比较。这样的比对可通过使用已公开和可商购的比对算法和程序,诸如但不限于Clustal Ω、MAFFT、Probcons、T-Coffee、Probalign、BLAST,本领域的普通技术人员可合理选择使用。本领域技术人员能确定用于比对序列的适宜参数,例如包括对所比较序列全长实现较优比对或最佳对比所需要的任何算法,以及对所比较序列的局部实现较优比对或最佳对比所需要的任何算法。
本发明中,序列的比较和两个序列之间的百分比同一性的测定可使用数学算法来实现。在一些情况下,两个氨基酸序列之间的百分比同一性使用Needleman和Wunsch((1970) J .Mol .Biol .48:444-453)算法,使用Blossum 62评分矩阵,利用为12的缺口罚分、为4的缺口延伸罚分和为5的移码缺口罚分来测定,该算法已被整合进GCG软件包中的GAP程序。
Cas9蛋白与基因编辑
Cas9蛋白是CRISPR II型系统中常见的Cas蛋白,一些野生型的Cas9已检测到核酸酶活性,能够切割核酸或核酸链。Cas9蛋白通常能够与指导多核苷酸形成RNP复合物并被指导多核苷酸牵引至切割位点。
许多物种的Cas9分子可用于本文所述的融合蛋白。虽然化脓性链球菌和金黄色葡萄球菌Cas9分子是本文中的许多公开内容的主题,但同样地可使用本文中所列的其它物种的Cas9分子、来源于或基于所述物种的Cas9蛋白的Cas9分子。换句话说,虽然本文中的许多描述使用化脓性链球菌和金黄色葡萄球菌Cas9分子,但来自其它物种的Cas9分子可替代它们。
基因编辑是基于多种基因编辑工具实现的对单个碱基或核酸链进行的编辑,从而在分子水平上改变原始的核酸。因此,基因编辑包括了单碱基编辑,也包括核酸链的编辑。如本文所用,术语“单碱基”是指核酸序列内的一个且仅一个核苷酸。当在单碱基编辑的上下文中使用时,其是指用不同的碱基替代核酸序列内特定位置的碱基。这样的替代可以通过许多机制发生,包括但不限于取代或修饰。
如本文所使用,术语“切刻(nicking)”是指在核酸链上断开链间或核苷酸间的键,从而在单链或双链核酸上产生缺口。术语“切割”是指在双链核酸上至少断开链间的键,或者至少断开单链核酸上核苷酸间的键,从而在切割位点上下游的核酸链完全分开。
FokI域
FokI是包括DNA识别结构域和催化(内切核酸酶)结构域的II型限制性内切核酸酶。本文所述的融合蛋白可包括完整的FokI,或仅仅包括FokI的核酸酶结构域,例如,基因库登录号AAA24927 .1的氨基酸388-583或408-583,例如,如Li等,Nucleic Acids Res .39(1):359–372(2011);Cathomen和Joung ,Mol .Ther .16:1200–1207(2008)中描述的,或如Miller等Nat Biotechnol 25:778–785(2007) ;Szczepek等,Nat Biotechnol 25:786–793(2007) ;或Bitinaite等,Proc .Natl .Acad .Sci .USA .95:10570–10575(1998)中描述的FokI的突变形式。
所述FokI域可以是野生型FokI核酸内切酶的DNA切割结构域;所述FokI域可以是野生型FokI核酸内切酶的DNA切割结构域的突变体,包括但不限于单点突变体及多点突变体。在一些实施方案中,2个所述FokI域之间可形成二聚体。在一些实施方案中,2个所述FokI域之间无法形成二聚体。在一些实施方案中,2个所述FokI域之间二聚化之后才具备核酸酶活性。在一些实施方案中,2个所述FokI域之间二聚化之后才能切割靶核酸。在一些实施方案中,所述FokI域不需二聚化即可切割靶核酸。在一些实施方案中,所述FokI域不需二聚化即具备核酸酶活性。
指导多核苷酸
如本文中所使用的,术语“指导多核苷酸”用于指CRISPR-Cas系统中与Cas蛋白形成CRISPR复合物并将CRISPR复合物引导至靶核酸的分子。通常情况下,指导多核苷酸包含与指导序列连接的骨架序列,指导序列可以与靶核酸序列杂交。骨架序列通常包含同向重复序列,有时还可包含tracrRNA序列。所述同向重复序列与指导序列组成crRNA。
在一些实施方案中,所述指导多核苷酸是指导RNA。在一些实施方案中,所述指导多核苷酸是指导DNA。在一些实施方案中,所述指导多核苷酸的至少1个碱基为DNA碱基。在一些实施方案中,所述指导多核苷酸是化学修饰的指导多核苷酸。在一些实施方案中,所述指导多核苷酸包含至少一个化学修饰的核苷酸。
在一些实施方案中,所述指导多核苷酸包含与至少一个同向重复序列(directrepeat,DR)连接的至少一个指导序列(guide sequence,也称为间隔序列spacersequence)。在一些实施方案中,所述指导序列位于骨架序列的3'端。在一些实施方案中,所述指导序列位于骨架序列的5'端。
在一些实施方案中,所述同向重复序列包含至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个或至少60个核苷酸。在一些实施方案中,所述同向重复序列包含不超过70个核苷酸、不超过60个核苷酸、不超过55个核苷酸、不超过50个核苷酸、不超过45个核苷酸、不超过40个核苷酸、不超过35个核苷酸、不超过30个核苷酸、不超过25个核苷酸、不超过20个核苷酸或不超过15个核苷酸。在一些实施方案中,所述同向重复序列包含5-70个核苷酸、5-50个核苷酸、5-30个核苷酸、5-20个核苷酸、5-15个核苷酸、10-40个核苷酸、10-30个核苷酸、10-20个核苷酸或10-15个核苷酸。
在一些实施方案中,所述tracrRNA序列包含至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个或至少80个核苷酸。在一些实施方案中,所述tracrRNA序列包含不超过120个核苷酸、不超过110个核苷酸、不超过100个核苷酸、不超过90个核苷酸、不超过80个核苷酸、不超过70个核苷酸、不超过60个核苷酸、不超过55个核苷酸、不超过50个核苷酸、不超过45个核苷酸、不超过40个核苷酸、不超过35个核苷酸、不超过30个核苷酸、不超过25个核苷酸、不超过20个核苷酸或不超过15个核苷酸。在一些实施方案中,所述同向重复序列包含10-120个核苷酸、20-100个核苷酸、30-90个核苷酸、40-80个核苷酸、40-70个核苷酸、50-70个核苷酸或60-70个核苷酸。
在一些实施方案中,所述指导序列包含至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少21个核苷酸、至少22个核苷酸、至少23个核苷酸、至少24个核苷酸、至少25个核苷酸、至少26个核苷酸、至少27个核苷酸、至少28个核苷酸、至少29个核苷酸、或至少30个核苷酸。在一些实施方案中,所述指导序列包含不超过60个核苷酸、不超过55个核苷酸、不超过50个核苷酸、不超过45个核苷酸、不超过40个核苷酸、不超过35个核苷酸、不超过30个核苷酸、不超过25个核苷酸或不超过20个核苷酸。在一些实施方案中,所述指导序列包含15-60个核苷酸、15-40个核苷酸、15-30个核苷酸、15-25个核苷酸或17-25个核苷酸。
在一些实施方案中,所述指导序列与所述靶核酸具有足够的互补性以与所述靶核酸杂交并指导本发明的融合蛋白与所述靶核酸的序列特异性结合。在一些实施方案中,所述指导序列与所述靶核酸具有100%的互补性,但所述指导序列可以与所述靶核酸DNA具有小于100%的互补性,例如至少80%、至少85%、至少90%、至少95%、至少98%或至少99%的互补性。
在一些实施方案中,所述指导序列被工程化以与所述靶核酸杂交,错配不超过两个核苷酸。在一些实施方案中,所述指导序列被工程化以与所述靶核酸杂交,且错配不超过一个核苷酸。在一些实施方案中,所述指导序列被工程化以与所述靶核酸杂交,有或没有错配。
所述指导多核苷酸可以是单分子或双分子。指导多核苷酸序列可以是RNA序列、DNA序列或其组合(RNA-DNA组合序列)。任选地,指导多核苷酸可以包含至少一种核苷酸、磷酸二酯键或连接修饰,例如但不限于锁核酸(LNA)、5-甲基dC、2,6-二氨基嘌呤、2′-氟代A、2′-氟代U、2′-O-甲基RNA、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18(六乙二醇链)分子的连接、或导致环化的5′至3′共价连接。
所述指导多核苷酸可以为单分子指导多核苷酸或双分子指导多核苷酸。非限制性示例例如,所述指导多核苷酸由CRISPR-Cas9系统中的crRNA和tracrRNA嵌合(例如通过GAAA序列连接)形成单分子指导多核苷酸(sgRNA)。再例如,所述指导多核苷酸是由CRISPR-Cas9系统中的crRNA和tracrRNA这2个分离的分子组成的组,即为所述的双分子。
指导多核苷酸指导核糖核蛋白复合物与靶DNA的序列特异性结合的能力可以通过任何合适的测定来评估。例如,可以将足以形成核糖核蛋白复合物的CRISPR系统的组分,包括待测试的指导多核苷酸,提供给具有相应靶核酸DNA分子的宿主细胞,例如通过编码核糖核蛋白复合物的组分的载体的转染,然后评估靶序列内的优先切割。类似地,可以在试管中评估靶核酸DNA序列的切割,方法是提供靶核酸DNA、核糖核蛋白复合物的组分,包括待测试的指导多核苷酸和不同于测试指导多核苷酸的对照指导多核苷酸,并比较待测试和对照指导多核苷酸之间结合靶核酸DNA的能力或切割靶DNA的速率。核糖核蛋白复合物切割靶核酸或靶DNA的能力也可以通过上述的测定来评估。
基因编辑系统
本披露所述的基因编辑系统包括但不限于用于以下用途的系统:用于切割靶核酸,用于在靶核酸上引入碱基转换,抑制或降低靶核酸上特定基因的表达,激活或提高靶核酸上特定基因的表达,可视化或检测靶核酸,掩蔽靶核酸上的特定基因,沉默靶核酸上的特定基因。
载体系统
本披露的另一方面涉及包含本文所述的融合蛋白的载体系统,所述载体系统包含一个或多个载体(表达载体),所述载体包含编码所述融合蛋白的多核苷酸序列和编码所述指导多核苷酸的多核苷酸序列。或者,所述载体包含编码所述融合蛋白的多核苷酸序列。
在一些实施方案中,所述载体系统包含至少一个质粒或病毒载体(例如,逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒)。在一些实施方案中,所述编码融合蛋白的多核苷酸序列和所述编码指导多核苷酸的多核苷酸序列位于同一载体上。在一些实施方案中,所述编码融合蛋白的多核苷酸序列和所述编码指导多核苷酸的多核苷酸序列位于2个或更多个载体上。
在一些实施方案中,所述编码融合蛋白的多核苷酸序列和/或所述编码指导多核苷酸的多核苷酸序列可操作地连接至调节元件。调节元件包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如,转录终止信号,如多腺苷酸化信号和poly-U序列)。调节元件包括使核苷酸序列在许多类型的宿主细胞中组成型表达的调节元件,以及使核苷酸序列仅在某些宿主细胞中表达的调节元件(例如,组织特异性调节序列)。组织特异性启动子可以主要在所需的感兴趣组织中直接表达,例如肌肉、神经元、骨、皮肤、血液、特定器官(例如肝脏、胰腺)、或特定的细胞类型(例如淋巴细胞)。调节元件还可以以时间依赖性方式指导表达,例如以细胞周期依赖性或发育阶段依赖性方式,其也可能是或可能不是组织或细胞类型特异性的。在一些实施例中,所述调节元件是增强子元件,例如WPRE、CMV增强子、HTLV-1的LTR中的R-U5区段、SV40增强子、或兔β-珠蛋白外显子2和3之间的内含子序列。
在一些实施方案中,所述载体包含pol III启动子(例如,U6和H1启动子)、pol II启动子(例如,逆转录病毒Rous肉瘤病毒(RSV)LTR启动子(任选地带有RSV增强子)、巨细胞病毒(CMV)启动子(任选地带有CMV增强子)、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、或EF1α启动子),或pol III启动子和pol II启动子。
在一些实施方案中,所述启动子是组成型启动子,其是连续活性的并且不受外部信号或分子的调节。合适的组成型启动子包括但不限于CMV、RSV、SV40、EF1α、CAG和β-肌动蛋白启动子。在一些实施方案中,所述启动子是受外部信号或分子(例如,转录因子)调节的诱导型启动子。
在一些实施方案中,所述启动子是组织特异性启动子,其可用于驱动融合蛋白的组织特异性表达。合适的肌肉特异性启动子包括但不限于CK8、MHCK7、肌红蛋白启动子(Mb)、结蛋白(Desmin)启动子、肌肉肌酸激酶启动子(MCK)及其变体,以及SPc5-12合成启动子。合适的免疫细胞特异性启动子包括但不限于B29启动子(B细胞)、CD14启动子(单核细胞)、CD43启动子(白细胞和血小板)、CD68(巨噬细胞)和SV40/CD43启动子(白细胞和血小板)。合适的血细胞特异性启动子包括但不限于CD43启动子(白细胞和血小板)、CD45启动子(造血细胞)、INF-β(造血细胞)、WASP启动子(造血细胞)、SV40/CD43启动子(白细胞和血小板),和SV40/CD45启动子(造血细胞)。合适的胰腺特异性启动子包括但不限于弹性蛋白酶-1启动子。合适的内皮细胞特异性启动子包括但不限于Fit-1启动子和ICAM-2启动子。合适的神经元组织/细胞特异性启动子包括但不限于GFAP启动子(星形胶质细胞)、SYN1启动子(神经元)和NSE/RU5'(成熟神经元)。合适的肾特异性启动子包括但不限于NphsI启动子(足细胞)。合适的骨特异性启动子包括但不限于OG-2启动子(成骨细胞、成牙本质细胞)。合适的肺特异性启动子包括但不限于SP-B启动子(肺)。合适的肝脏特异性启动子包括但不限于SV40/Alb启动子。合适的心脏特异性启动子包括但不限于α-MHC。
AAV载体
本披露的另一方面涉及包含本文所述的融合蛋白或基因编辑系统的腺相关病毒(AAV)载体,其中所述腺相关病毒(AAV)载体包含编码本文所述的融合蛋白和指导多核苷酸的DNA。
通过AAV载体递送CRISPR-Cas系统在Maeder et al., Nature Medicine 25:229-233 (2019) 中进行了描述,经临床证明视网膜下递送AAV安全性和有效性,通过视网膜下注射的局部递送、AAV5对光感受器细胞的自然嗜性以及光感受体特异性GRK1启动子的使用都用于将CRISPR/Cas系统的表达仅限于治疗靶组织和细胞类型,其通过引用整体并入本文。在一些实施方案中,所述AAV载体包含ssDNA基因组,该基因组包含侧接ITR的融合蛋白和指导多核苷酸的编码序列。
在一些实施方案中,本文所述的融合蛋白或基因编辑系统被包装在AAV载体中,例如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9和AAVrh74。在一些实施方案中,本文所述的融合蛋白或基因编辑系统被包装在AAV载体中,该AAV载体包含具有组织嗜性的工程化衣壳,例如工程化肌肉嗜性衣壳。Tabebordbar et al., Cell 184:4919-4938 (2021)中描述了通过定向进化对具有组织趋向性的AAV衣壳进行工程改造,鉴定了一类含RGD基序的衣壳,全身注射MyoAAV可高效转导灵长类动物肌肉,该文献通过引用整体并入本文。
脂质纳米粒
本披露的另一方面涉及脂质纳米粒(LNP),其包含本文所述的基因编辑系统,其中所述LNP包含本文所述的指导多核苷酸和编码本文所述的融合蛋白的mRNA。
Gillmore et al., N. Engl. J. Med., 385:493-502 (2021)中描述了CRISPR-Cas系统的LNP递送,脂质纳米颗粒(LNP)由4种脂质组成,所述4种脂质包括专有的可离子化脂质LP000001;DSPC;胆固醇和DMG-PEG2k,LNP悬浮液配制在Tris、NaCl和蔗糖的水性缓冲液中,pH 7.4,其全文以引用方式并入本文。在一些实施方案中,除了RNA有效负载(mRNA和指导多核苷酸)之外,脂质纳米粒(LNP)还包含四种组分:阳离子或可电离脂质、胆固醇、辅助脂质和PEG-脂质。在一些实施方案中,所述阳离子或可电离脂质包括 cKK-E12、C12-200、ALC-0315、DLin-MC3-DMA、DLin-KC2-DMA、FTT5、Moderna SM-102和Intellia LP01。在一些实施方案中,所述PEG-脂质包含PEG-2000-C-DMG、PEG-2000-DMG或ALC-0159。在一些实施方案中,所述辅助脂质包括DSPC。LNP的组分在Paunovska et al., Nature ReviewsGenetics 23:265-280 (2022)中进行了描述,FDA批准的LNP含有四种基本成分的变体:阳离子或可电离脂质、胆固醇、辅助脂质和聚乙二醇(PEG)脂质,该文献通过引用整体并入本文。
慢病毒载体
本披露的另一方面涉及包含本文所述基因编辑系统的慢病毒载体,其中所述慢病毒载体包含本文所述的指导多核苷酸和编码本文所述的融合蛋白的mRNA。在一些实施方案中,所述慢病毒载体是用同源或异源包膜蛋白如VSV-G假型化的。在一些实施方案中,所述编码融合蛋白的mRNA与适体序列连接。
RNP复合物
本披露的另一方面涉及包含本文所述的核糖核蛋白复合物,其中所述核糖核蛋白复合物由本文所述的指导多核苷酸和融合蛋白形成。在一些实施方案中,可以通过显微注射或电穿孔将所述核糖核蛋白复合物递送至真核细胞、哺乳动物细胞或人类细胞。在一些实施方案中,所述核糖核蛋白复合物可以包装在病毒样颗粒中并在体内递送至哺乳动物或人类受试者。
病毒样颗粒
本披露的另一方面涉及包含本文所述的基因编辑系统的病毒样颗粒(VLP),其中所述病毒样颗粒包含本文所述的指导多核苷酸和融合蛋白或由所述指导多核苷酸和融合蛋白组成的核糖核蛋白复合物。
Banskota et al. Cell 185(2):250-265 (2022)报道了高效包装和递送碱基编辑器或Cas9核糖核蛋白的无DNA病毒样颗粒(eVLPs)的开发和应用;Mangeot et al.,Nature Communications 10(1):1-15 (2019)使用负载Cas9-sgRNA核糖核蛋白的经过工程改造的小鼠白血病病毒样颗粒(Nanoblades)在细胞系和原代细胞(包括人诱导多能干细胞、人造血干细胞和小鼠骨髓细胞)中诱导高效的基因组编辑;Campbell, et al.,Molecular Therapy 27:151-163 (2019)利用一种被称为“gesicle”的特化细胞外囊泡,以核糖核蛋白形式有效但短暂地递送靶向HIV长末端重复序列(LTR)的Cas9,Gesicles是通过表达水疱性口炎病毒糖蛋白和包装蛋白(作为其货物)来产生,因此无需进行转基因递送,从而可以更精细地控制Cas9表达和Mangeot et al. Molecular Therapy, 19(9):1656-1666 (2011)报道了水泡性口腔炎病毒(VSV-G)的刺突糖蛋白在人类细胞中的过表达诱导了名为gesicles的融合性小泡的释放,生物化学和功能研究表明,神经胶质细胞结合了来自生产细胞的蛋白质,并可以将其输送到受体细胞,这种蛋白质转导方法允许靶细胞中细胞质、细胞核或表面蛋白质的直接转运。这些文献均描述了工程化VLP,其全文以引用方式并入本文。
在一些实施方案中,工程化的病毒样颗粒(VLP)是用同源或异源包膜蛋白例如VSV-G假型化的。在一些实施方案中,所述融合蛋白通过可切割连接子与gag蛋白(例如MLVgag)融合,其中靶细胞中接头的切割暴露了位于连接子和融合蛋白之间的NLS。在一些实施方案中,所述融合蛋白或缀合物包含(例如,从5'到3')gag蛋白(例如,MLVgag)、一种或多种NES、可切割连接子、一种或多种NLS、和Cas12,如Banskota et al. Cell 185(2):250-265(2022)所述。
在一些实施方案中,所述融合蛋白与第一二聚化结构域融合,所述第一二聚化结构域能够与融合至膜蛋白的第二二聚化结构域二聚化或异二聚化,其中配体的存在促进所述二聚化并富集Cas12蛋白或融合蛋白或缀合物至VLP中,如Campbell, et al.,Molecular Therapy 27:151-163 (2019)中所述。
细胞
本披露的另一方面涉及包含本文所述的融合蛋白及含其的基因编辑系统的细胞。细胞(例如,其可用于产生无细胞系统)可以是真核或原核的。此类细胞的实例包括但不限于细菌、古细菌、植物、真菌、酵母、昆虫和哺乳动物细胞,例如乳杆菌、乳球菌、芽孢杆菌(例如枯草芽孢杆菌)、埃希氏菌属(例如大肠杆菌)、梭菌属、酵母菌属或毕赤酵母属(如酿酒酵母或巴斯德毕赤酵母),乳酸克鲁维酵母、鼠伤寒沙门氏菌、果蝇细胞、秀丽隐杆线虫细胞、非洲爪蟾细胞、SF9细胞、C129细胞、293细胞、脉孢菌和永生化哺乳动物细胞系(例如,Hela细胞、骨髓细胞系和淋巴样细胞系)。
在一些实施方案中,所述细胞是原核细胞,例如细菌细胞,例如大肠杆菌。在一些实施方案中,细胞是真核细胞,例如哺乳动物细胞或人类细胞。在一些实施方案中,细胞是原代真核细胞、干细胞、肿瘤/癌细胞、循环肿瘤细胞(CTC)、血细胞(例如,T细胞、B细胞、NK细胞、Tregs等)、造血干细胞、特化免疫细胞(如肿瘤浸润淋巴细胞或肿瘤抑制淋巴细胞)、肿瘤微环境中的基质细胞(如癌症相关成纤维细胞等)。在一些实施方案中,细胞是中枢或外周神经系统的脑或神经元细胞(例如,神经元、星形胶质细胞、小胶质细胞、视网膜神经节细胞、视杆/视锥细胞等)。
靶核酸或靶DNA
本文所述的融合蛋白及含其的基因编辑系统可用于靶向一种或多种靶核酸,例如靶DNA分子,例如存在于生物样品、环境样品(例如土壤、空气或水样品)等中的靶DNA分子。
在一些实施方案中,所述靶核酸为疾病相关基因或信号传导生化途径相关基因,或所述靶核酸为报告基因。此类靶核酸的非限制性实例,包括分别提交于2012年12月12日和2013年1月2日的美国临时专利申请61/736,527和61/748,427、提交于2013年12月12日的国际申请PCT/US2013/074667中所列举的那些,其全部通过引用并入本文。
治疗应用
本发明公开了包含所述融合蛋白或基因编辑系统的组合物和药物组合物。在一些实施方案中,将药物组合物体内递送至人类受试者。所述药物组合物可以通过任何有效途径递送。示例性给药途径包括但不限于静脉内输注、静脉内注射、腹膜内注射、肌肉内注射、瘤内注射、皮下注射、皮内注射、心室内注射、血管内注射、小脑内注射、眼内注射、视网膜下注射、玻璃体内注射、前房内注射、鼓室内注射、鼻内给药和吸入。
如本文所用,术语“有效量”是指包含达到临床有益结果(即,例如,减轻症状)的治疗剂的药物组合物的特定量。这样的组合物的毒性和治疗功效可通过细胞培养或实验动物中的标准药学程序来确定,例如用于确定LD50(使群体的50%死亡的剂量)和ED50(在50%的群体中治疗有效的剂量)。毒性和治疗效果之间的剂量比是治疗指数,并且其可以表示为比率LD50/ED50。表现出高治疗指数的化合物是优选的。从这些细胞培养测定和其他动物研究中获得的数据可用于配制用于人类使用的一系列剂量。这样的化合物的剂量优选在包括几乎没有或没有毒性的ED50的循环浓度的范围内。取决于所采用的剂型、患者的敏感性和施用途径,剂量在此范围内变化。
如本文所用,术语“疾病”或“病症”是指活动物体或植物体或其部分之一的正常状态的任何中断或改变重要功能的执行的损害。通常表现为明显的体征和症状,其通常是针对以下的反应:i)环境因素(如营养不良、工业危害或气候);ii)特定的传染物(如蠕虫、细菌或病毒);iii)有机体的固有缺陷(如遗传异常);和/或iv)这些因素的组合。
如本文所用,术语“施用”或“给药”是指向患者提供组合物以使该组合物对患者具有预期作用的任何方法。示例性的施用方法是通过直接机制例如局部组织施用(即,例如血管外放置)、口服、透皮贴剂、局部、吸入、栓剂等。
如本文所用,术语“患者”或“受试者”是人或动物,并且不需要是住院的。例如,门诊患者、疗养院中的人是“患者”。患者可以包括任何年龄的人类或非人类动物,因此包括成年和未成年人(即儿童)。术语“患者”并不意味着需要医学治疗,因此,患者可以自愿或非自愿地参与实验,无论是临床的还是支持基础科学研究。
实施例1:不同dCas9-FokI融合蛋白的设计及载体质粒构建
为将FokI核酸酶结构域插入到dCas9蛋白内部,通过生物信息学分析以及AI手段预测和模拟dCas9蛋白可能的不同插入位点,在预测可能不影响dCas9结合DNA能力的前提下插入或替换入具有单链核酸切刻能力的FokI结构域。具体而言,在PyMOL上标记SpCas9的无规则卷曲,将标记无规则卷曲区域大于3aa位置进行统计,然后再标记对应的结构域。将dSpCas9的无规则卷曲序列替换为FokI域。第一优先级考虑在RuvC区域内将氨基酸序列替换为FokI域;第二优先级考虑无规则卷曲的长度越长时,插入的FokI域对于SpCas9的整体结构的潜在影响可能越小,因此优先级越高。据此设计得到dCas9-FokI-S1-S10融合蛋白。
如图1和表1所示。利用分子生物学方法构建不同dCas9-FokI融合蛋白的载体质粒。
本实施例基于SpCas9(SEQ ID NO: 1)确定dCas9的氨基酸序列,如SEQ ID NO: 2所示。
* 表示在所述位置替换入带linker的FokI结构域(SEQ ID NO: 4),SEQ ID NO :4
所示序列的第6位-第201位氨基酸序列为FokI结构域(SEQ ID NO: 52)。
** SpCas9(SEQ ID NO: 1)的结构域划分参考文章Zhu, X., et al. Cryo-EMstructures reveal coordinated domain motions that govern DNA cleavage byCas9. Nat Struct Mol Biol 26, 679–685 (2019). https://doi.org/10.1038/s41594-019-0258-2。
表达载体pCDNA3.1(+)(淼灵生物,P0157)质粒经Acc65I和EcoRI双酶切后,琼脂糖凝胶电泳切胶回收线性化的载体。
以FokI-dCas9(淼灵生物,P5109)为模板,使用表2中FokI-PF1和FokI-PR1引物对进行PCR扩增,获得FokI编码序列(SEQ ID NO: 5),该序列编码所述带linker的FokI结构域。
以pCDNA3.1-dCas9(淼灵生物,P15213)为模板,以表3中不同融合蛋白编码序列片段的扩增引物组合(引物序列如表2所示)进行PCR扩增,获得不同的片段。
将不同的融合蛋白编码序列、FokI编码序列以及线性化的载体利用GibsonAssembly® Master Mix(NEB)进行同源重组,将融合蛋白编码序列整合到载体pCDNA3.1(+)的克隆区,构建得到编码表1中不同结构融合蛋白(dCas9-FokI-S1至dCas9-FokI-S10)的重组载体。比如pCDNA3.1(+)线性化载体+片段S1-F2+FokI编码序列+片段S1-F1同源重组构建得到dCas9-FokI-S1载体。
反应液转化Stbl3感受态,涂布氨苄青霉素抗性的LB平板,37℃过夜培养后,挑取克隆测序鉴定,分别获得融合蛋白dCas9-FokI-S1至dCas9-FokI-S10的质粒载体。
dCas9-FokI-S9融合蛋白的氨基酸序列为:
MKRPAATKKAGQAKKKKDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKARGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKGGSGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFSGSETPGTSESATPESVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSAGGGGSGGGGSGGGGSGPKKKRKVAAAGS(SEQ ID NO:3)
dCas9-FokI-S1至dCas9-FokI-S8,和dCas9-FokI-S10的氨基酸序列仅是在表1所示的不同位置替换入带linker的FokI结构域,因此可类推得到。
实施例2:pCDH-CMV-EGFP-Reporter3-EF1a-Puro细胞系构建
a. 用于GFP报告系统的慢病毒表达质粒pCDH-CMV-EGFP-Reporter3-EF1a-Puro的构建
基因合成包含检测系统的EGFP编码序列,利用XbaI+NotI酶切合成片段,然后与pCDH-CMV-MCS-EF1-Puro(优宝生物,VT1480)XbaI+NotI酶切的载体利用T4 DNA连接酶(Thermo Scientific™,EL0012)进行连接,转化Stbl3,涂布含氨苄青霉素的平板,37℃过夜培养后,挑取克隆测序鉴定,获得pCDH-CMV-EGFP-Reporter3-EF1a-Puro载体(SEQ IDNO: 30)。
合成的EGFP编码序列如下:
Tctagagcgagaaaagccttgtttgccaccatggaacggctcggagatcatcattgcgtcgcgaggtg agcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccaagctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtaagcggccgc(SEQ ID NO: 31)
划线部分即为两个gRNA的靶向位点。
b. 慢病毒包装
测序鉴定的pCDH-CMV-EGFP-Reporter3-EF1a-Puro质粒与病毒包装辅助质粒pMD2.G(淼灵生物,P0262)以及psPAX2(淼灵生物,P0261)按照1:1:1的摩尔比混合,利用PEI转染293T细胞。转染48h,取培养上清,0.45µm滤膜过滤后获得pCDH-CMV-EGFP-Reporter3-EF1a-Puro粗病毒。
c. 病毒感染293T细胞构建检测细胞系
向培养基中添加1/4体积的pCDH-CMV-EGFP-Reporter3-EF1a-Puro粗病毒对293T细胞进行感染,感染48h后换液,添加2ug/ml的Puromycin进行筛选。筛选后的细胞利用有限稀释进行单克隆筛选,筛选到的单克隆即为检测用细胞系。
实施例3:不同结构dCas9-FokI融合蛋白编辑效率测试
由于FokI只能针对DNA单链进行切刻,发明人利用双gRNA指导dCas9与FokI的融合蛋白针对DNA双链进行切割。切割后的DNA在细胞内发生NHEJ修复,从而导致部分细胞GFP基因产生正常的读码框(如图2所示),从而发出荧光,通过流式细胞仪检测发出绿色荧光的细胞比例即可表征不同dCas9与FokI的融合蛋白的编辑效率。
gRNA载体构建
通过酶切-连接酶连接的方法,引入指导序列编码序列,获得gRNA1-SpCas9-pUC57Kan(SEQ ID NO: 34)以及gRNA2-SpCas9-pUC57Kan(SEQ ID NO: 35)2个gRNA表达载体,可由U6启动子驱动表达gRNA1或gRNA2。所述gRNA包含靶向EGFP的指导序列,以及SpCas9对应的gRNA骨架序列。
取实施例1的dCas9-FokI-S1至S9重组质粒载体各250ng,分别与gRNA1-SpCas9-pUC57Kan质粒125ng以及gRNA2-SpCas9-pUC57Kan质粒125ng一起与100µl opti-MEM(Gibco)混合,然后添加1.5µl PEI(YEASEN)混合均匀,静置20min。然后添加至实施例2构建的检测细胞系中进行细胞转染,转染72h后收集细胞,进行流式检测。
阴性对照(NC)组为实施例2的检测细胞系,不转染CRISPR系统相关质粒。
结果如图3和表4所示。
流式结果显示,dCas9-FokI-S9编辑效率远高于dCas9-FokI-S1至dCas9-FokI-S8,以及dCas9-FokI-S10。
实施例4:dCas9-FokI-S9对照质粒以及PAMless质粒构建
采用与实施例1类似的方法构建得到dCas9-FokI-953-01质粒(SEQ ID NO: 36)、dCas9-FOKI-953-02质粒(SEQ ID NO: 37),均用于表达在dSpCas9内部融合FokI的融合蛋白。两者区别在于,dCas9-FOKI-953-01质粒表达的重组蛋白是直接在953aa-954aa之间插入FokI域;dCas9-FOKI-953-02质粒表达的重组蛋白是在953aa-954aa之间插入FokI域且FokI域末端带有连接序列,用于与Cas9序列连接。
采用与实施例1类似的方法构建得到dCas9PAMless-FokI-S9质粒(SEQ ID NO:38),用于表达在dead PAMless Cas9(SpRY变体)的内部插入FokI域的重组蛋白。
实施例5:不同结构dCas9-FokI融合蛋白编辑报告系统
将Cas9与FokI融合后得到不同的融合蛋白,按照实施例3中描述的实验方案,在报告系统上初步验证编辑效果。不同融合蛋白与gRNA组合后编辑EGFP基因,产生indel后恢复可产生荧光的EGFP的表达。通过检测eGFP的比例,从而判断融合蛋白编辑效果。
dCas9-FokI阳性对照组转染dCas9-FokI质粒(淼灵生物P5109,表达N-端融合FokI的dCas9)250ng,及gRNA1质粒和gRNA2质粒各125ng。
Cas9 nickase阳性对照组转染Cas9 nickase质粒(SEQ ID NO: 39,表达Cas9nickase)250ng,及gRNA1质粒和gRNA2质粒各125ng。
dCas9-FokI-S9组、dCas9PAMless-FokI-S9实验组、dCas9-FokI-953-01组、dCas9-FokI-953-02组转染对应的重组蛋白质粒250ng,及gRNA1质粒和gRNA2质粒各125ng。
SpCas9-gRNA1+2对照组转染pX459 V2.0质粒(表达野生型SpCas9)250ng,及gRNA1质粒和gRNA2质粒各125ng。
SpCas9-gRNA1对照组转染pX459 V2.0质粒(表达野生型SpCas9)250ng,及gRNA1质粒250ng。
SpCas9-gRNA2对照组转染pX459 V2.0质粒(表达野生型SpCas9)250ng,及gRNA2质粒250ng。
阴性对照(NC)组为实施例2的检测细胞系,不转染CRISPR系统相关质粒。
分别使用PEI、EndoFectin、Lipo2000三种转染试剂进行测试。
具体结果如表5和图4所示。可以看出,dCas9-FokI-S9融合蛋白对此报告系统的编辑效率与Cas9 nickase相当,甚至优于SpCas9,也远高于953aa位置插入或替换入FokI的融合蛋白,并优于dCas9末端融合FokI域的融合蛋白。
实施例6:dCas9-FokI-S9内源基因编辑效率测试
分别构建表达靶向HBB基因和VEGFA基因的gRNA(含SpCas9对应的gRNA骨架序列,即SEQ ID NO: 40)的质粒,U6启动子驱动表达。
gRNA的指导序列如表6所示。
取前述实施例的重组蛋白质粒250ng和本实施例的gRNA质粒250ng(使用一种gRNA质粒时用量250ng,使用两种gRNA质粒时用量各约125ng)混合好后添加1.5µl PEI,转染293T细胞。
转染72h后PBS清洗细胞一次,利用胰酶消化细胞,300 rcf离心5min收集细胞,500µl PBS重悬。取重悬的细胞50µl,添加48ul DirectPCR Lysis Reagent(Cell)以及2ul蛋白酶K进行处理,处理完的裂解液取1ul进行PCR扩增,扩增引物序列见表7。
扩增的产物进行Sanger测序,测序结果进行TIDE分析,确认编辑效率,结果见表8、图5。
TIDE分析结果显示dCas9-FokI-S9针对内源基因有较好的编辑效果,编辑效率与SpCas9相当(部分情况略优),明显优于末端融合FokI的dCas9-FokI、953aa位置插入或替换入FokI的dCas9-FokI-953-01和dCas9-FokI-953-02、以及PAMless Cas9,优于Cas9nickase。

Claims (23)

1.一种融合蛋白,其特征在于,所述融合蛋白通过将氨基酸序列如SEQ ID NO: 1所示的Cas9蛋白的核酸酶活性失活突变体的第943-952位氨基酸残基替换为功能结构域而得到;所述功能结构域为FokI域;
所述失活突变体相对SEQ ID NO: 1具有D10A和N863A突变,或D10A和H840A突变;
所述FokI域为FokI核酸内切酶的DNA切割结构域。
2.如权利要求1所述的融合蛋白,其特征在于,所述FokI域的氨基酸序列如SEQ ID NO:52所示。
3.如权利要求1所述的融合蛋白,其特征在于,所述功能结构域通过连接子序列分别与Cas9失活突变体的N-端和C-端连接。
4. 如权利要求3所述的融合蛋白,其特征在于,所述功能结构域通过氨基酸序列如SEQID NO: 50和SEQ ID NO: 51所示的连接子分别与Cas9失活突变体的N-端和C-端连接。
5.如权利要求4所述的融合蛋白,其特征在于,所述融合蛋白的N-末端和/或C-末端融合至少1个核定位序列。
6.如权利要求5所述的融合蛋白,其特征在于,所述融合蛋白能够与指导多核苷酸形成复合物,所述指导多核苷酸包含指导序列,所述指导序列被工程化以指导所述复合物序列特异性结合至双链靶DNA并对所述靶DNA进行切刻。
7.如权利要求6所述的融合蛋白,其特征在于,所述指导多核苷酸为单分子指导多核苷酸或双分子指导多核苷酸。
8.如权利要求7所述的融合蛋白,其特征在于,所述指导多核苷酸由CRISPR-Cas9系统中的crRNA和tracrRNA嵌合形成单分子指导多核苷酸或者所述指导多核苷酸是由CRISPR-Cas9系统中的crRNA和tracrRNA这2个分离的分子组成的组,所述crRNA由指导序列和同向重复序列组成。
9. 一种融合蛋白,其特征在于,所述融合蛋白的氨基酸序列如SEQ ID NO: 3所示。
10.一种核糖核蛋白复合物,其特征在于,所述核糖核蛋白复合物包括指导多核苷酸和如权利要求1~9任一项所述的融合蛋白。
11.一种基因编辑系统,其特征在于,所述基因编辑系统包括:
(1)如权利要求1~9任一项所述的融合蛋白,或编码其的核酸;和,
(2)指导多核苷酸。
12.一种多核苷酸,其特征在于,所述多核苷酸编码如权利要求1~9任一项所述的融合蛋白或者如权利要求10所述的核糖核蛋白复合物。
13.一种表达盒,其特征在于,所述表达盒包含启动子以及如权利要求12所述的多核苷酸;所述启动子调控编码序列的表达。
14.一种重组表达载体,其特征在于,所述重组表达载体包含如权利要求12所述的多核苷酸。
15.如权利要求14所述的重组表达载体,其特征在于,所述重组表达载体还包含顺式作用元件和/或反式作用因子的编码基因。
16.如权利要求15所述的重组表达载体,其特征在于,所述顺式作用元件选自启动子、增强子和沉默子;
和/或,所述反式作用因子的编码基因选自编码聚合酶、转录因子和/或转录调控因子的核苷酸。
17.一种组合物,其特征在于,所述组合物包括递送载体,以及如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒或如权利要求14~16任一项所述的重组表达载体。
18.一种重组细胞,其特征在于,所述重组细胞包含如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体或如权利要求17所述的组合物;
所述重组细胞为非动物品种或非植物品种细胞。
19.一种药物组合物,其特征在于,所述药物组合物包含如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体或如权利要求18所述的重组细胞,以及药学上可接受的载体和/或辅料。
20.一种试剂盒,其特征在于,所述试剂盒包含如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体、如权利要求17所述的组合物、如权利要求18所述的重组细胞或如权利要求19所述的药物组合物。
21.一种如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体、如权利要求17所述的组合物、如权利要求18所述的重组细胞、如权利要求19所述的药物组合物或者如权利要求20所述的试剂盒在制备诊断、预防或治疗与靶核酸相关的疾病的药物中的应用。
22.一种体外编辑靶核酸的方法,所述方法包括将如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体、如权利要求17所述的组合物、如权利要求18所述的重组细胞、如权利要求19所述的药物组合物或者如权利要求20所述的试剂盒与靶核酸接触的步骤,使所述靶核酸的序列发生变化或改变所述靶核酸的表达水平。
23.一种离体编辑靶核酸的方法,所述方法包括将如权利要求1~9任一项所述的融合蛋白、如权利要求10所述的核糖核蛋白复合物、如权利要求11所述的基因编辑系统、如权利要求12所述的多核苷酸、如权利要求13所述的表达盒、如权利要求14~16任一项所述的重组表达载体、如权利要求17所述的组合物、如权利要求18所述的重组细胞、如权利要求19所述的药物组合物或者如权利要求20所述的试剂盒与靶核酸接触的步骤,使所述靶核酸的序列发生变化或改变所述靶核酸的表达水平。
CN202311212915.4A 2023-09-20 2023-09-20 一种融合蛋白及其应用 Active CN116949012B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311212915.4A CN116949012B (zh) 2023-09-20 2023-09-20 一种融合蛋白及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311212915.4A CN116949012B (zh) 2023-09-20 2023-09-20 一种融合蛋白及其应用

Publications (2)

Publication Number Publication Date
CN116949012A CN116949012A (zh) 2023-10-27
CN116949012B true CN116949012B (zh) 2024-01-02

Family

ID=88460525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311212915.4A Active CN116949012B (zh) 2023-09-20 2023-09-20 一种融合蛋白及其应用

Country Status (1)

Country Link
CN (1) CN116949012B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114934031A (zh) * 2022-05-25 2022-08-23 广州瑞风生物科技有限公司 新型Cas效应蛋白、基因编辑系统及用途
WO2022182959A1 (en) * 2021-02-26 2022-09-01 Vertex Pharmaceuticals Incorporated Compositions and methods for treatment of myotonic dystrophy type 1 with crispr/slucas9
CN116004716A (zh) * 2022-09-09 2023-04-25 华中农业大学 一种复制型dCas9-FokI系统进行高效基因编辑的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9322037B2 (en) * 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
JP7423520B2 (ja) * 2017-11-16 2024-01-29 アストラゼネカ・アクチエボラーグ Cas9ベースノックイン方針の効力を改善するための組成物及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022182959A1 (en) * 2021-02-26 2022-09-01 Vertex Pharmaceuticals Incorporated Compositions and methods for treatment of myotonic dystrophy type 1 with crispr/slucas9
CN114934031A (zh) * 2022-05-25 2022-08-23 广州瑞风生物科技有限公司 新型Cas效应蛋白、基因编辑系统及用途
CN116004716A (zh) * 2022-09-09 2023-04-25 华中农业大学 一种复制型dCas9-FokI系统进行高效基因编辑的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CRISPR/Cas技术在核酸检测中的应用进展;史铠 等;《分析测试学报》;第37卷(第10期);1217-1220 *
Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification;John P Guilinger et al.;《nature biotechnology》;第32卷(第6期);577-582 *
Paving the way towards precise and safe CRISPR genome editing;Pawel Sledzinski et al.;《Biotechnology Advances》;第49卷;1-20 *

Also Published As

Publication number Publication date
CN116949012A (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
US11608503B2 (en) RNA targeting of mutations via suppressor tRNAs and deaminases
US11208652B2 (en) Mitochondrial genome editing and regulation
WO2021158999A1 (en) Gene editing methods for treating spinal muscular atrophy
KR20160089530A (ko) Hbv 및 바이러스 질병 및 질환을 위한 crispr­cas 시스템 및 조성물의 전달,용도 및 치료적 적용
AU2022349627A1 (en) Engineered casx repressor systems
TW202028461A (zh) 核酸構築體及使用方法
KR20230002401A (ko) C9orf72의 표적화를 위한 조성물 및 방법
US11649444B1 (en) CRISPR-CAS12i systems
JP2022516647A (ja) 非毒性cas9酵素およびその用途
JP2021512649A (ja) 転写調節要素及びその使用
KR20230129230A (ko) Bcl11a의 표적화를 위한 조성물 및 방법
WO2020214613A1 (en) Crispr/cas-based genome editing composition for restoring dystrophin function
US20220298495A1 (en) Novel genome editing tool
CA3116452A1 (en) Genome editing methods and constructs
US20230059368A1 (en) Polynucleotide editors and methods of using the same
KR20210129108A (ko) 글리코겐 저장 질환 1a형을 치료하기 위한 조성물 및 방법
WO2021230385A1 (en) Method for treating muscular dystrophy by targeting utrophin gene
CN116949012B (zh) 一种融合蛋白及其应用
AU2022245243A1 (en) Novel crispr enzymes, methods, systems and uses thereof
CN117230043B (zh) Cas13蛋白及其应用
WO2024041653A1 (zh) 一种CRISPR-Cas13系统及其应用
US20230279398A1 (en) Treating human t-cell leukemia virus by gene editing
WO2020187268A1 (zh) 一种增强基因编辑的融合蛋白及其应用
WO2023220649A2 (en) Effector protein compositions and methods of use thereof
CA3218209A1 (en) Multiplex crispr/cas9-mediated target gene activation system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant