CN113564145A - 用于胞嘧啶碱基编辑的融合蛋白及其应用 - Google Patents

用于胞嘧啶碱基编辑的融合蛋白及其应用 Download PDF

Info

Publication number
CN113564145A
CN113564145A CN202110626828.8A CN202110626828A CN113564145A CN 113564145 A CN113564145 A CN 113564145A CN 202110626828 A CN202110626828 A CN 202110626828A CN 113564145 A CN113564145 A CN 113564145A
Authority
CN
China
Prior art keywords
leu
lys
glu
ile
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110626828.8A
Other languages
English (en)
Other versions
CN113564145B (zh
Inventor
李潇飒
孙晓东
刘舒
段晓悦
彭凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai First Peoples Hospital
Original Assignee
Shanghai First Peoples Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai First Peoples Hospital filed Critical Shanghai First Peoples Hospital
Priority to CN202110626828.8A priority Critical patent/CN113564145B/zh
Publication of CN113564145A publication Critical patent/CN113564145A/zh
Application granted granted Critical
Publication of CN113564145B publication Critical patent/CN113564145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04001Cytosine deaminase (3.5.4.1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明涉及分子生物学领域,具体而言,涉及一种用于胞嘧啶碱基编辑的融合蛋白及其应用。该融合蛋白包含a)Cas9酶域;b)不稳定结构域(DD);c)胞嘧啶脱氨酶域(CDA)以及d)尿嘧啶糖苷酶抑制剂(UGI)域。其能够在各种真核生物的基因组中实现高效率、高精度、可调控的碱基编辑。并能够在不引入缺失和插入的情况下,在各种真核生物的基因组中实施高精度高功效的C‑T碱基编辑。

Description

用于胞嘧啶碱基编辑的融合蛋白及其应用
技术领域
本发明涉及分子生物学领域,具体而言,涉及一种用于胞嘧啶碱基编辑的融合蛋白及其应用。
背景技术
CRISPR/Cas系统以其方便、高效的优势成为近些年来应用最广的基因编辑工具。在sgRNA的引导下,Cas蛋白到达靶位点处切割产生双链断裂,联合后续的DNA修复过程,借助于非同源末端连接实现基因敲除,或给予一段DNA模板,借助于同源重组实现基因修复。
然而同源重组介导的基因修复效率普遍不高,且会引入大量的插入与缺失。将胞嘧啶脱氨酶与Cas蛋白融合而成的胞嘧啶碱基编辑器(cytosine base editor,CBE)可以在不产生双链断裂的情况下在内源基因组上引入高效率的C到T(G到A)的突变,是进行基因突变纠正的有效工具,也成为基因治疗研究的热门选择。然而最常用的治疗用载体腺相关病毒AAV会造成其携带的碱基编辑器在体内的长期表达,理论上会增加全基因组内随机脱靶的风险。
有鉴于此,特提出本发明。
发明内容
本发明将Destablizing Domain(DD)与CBE融合表达构建了调控型的CBE,在不加外源小分子药物情况下,CBE表达产物被立即降解,理论上不引起编辑和脱靶;加入外源小分子药物,可以控制CBE表达时间,引起靶位点处有效碱基编辑的同时,理论上可以大大降低随机脱靶效应,提高临床治疗的安全性。
具体的:
本发明的第一方面涉及融合蛋白,其包含a)Cas酶域;b)不稳定结构域(DD);c)胞嘧啶脱氨酶域(CDA)以及d)尿嘧啶糖苷酶抑制剂(UGI)域。
本发明的第二方面涉及一种组合物,其包含如上所述融合蛋白、与所述Cas酶域结合的引导RNA以及trimethoprim。
本发明的第三方面涉及宿主细胞,其含有如上所述的组合物,并且其基因组中含有所述引导RNA所识别的靶序列。
本发明的第三方面涉及分离的核酸,其表达如上所述融合蛋白。
本发明的第四方面涉及载体,其含有如上所述的核酸,以及任选的引导RNA。
本发明的第五方面涉及改变基因产物表达的方法,其包括:
将如上所述的核酸,或如上所述载体导入宿主细胞并在trimethoprim存在的条件下表达出所述融合蛋白并与引导RNA配合以改变基因产物的表达。
本发明的第六方面涉及递送系统,其包括i)如上所述融合蛋白、或如上所述的核酸,或如上所述载体;ii)引导RNA以及iii)递送媒介物。
本发明的第七方面涉及药物组合物,其包含如上所述的递送系统以及药学上可接受的载体。
与现有技术相比,本发明的有益效果为:
本发明所提供的融合表达Destablizing Domain与CBE的方法,可以在各种真核生物的基因组中实现高效率、高精度、可调控的碱基编辑。能够在不引入缺失和插入的情况下,在各种真核生物的基因组中实施高精度高功效的C-T碱基编辑。
本发明理论上可用于在体基因治疗,为CBE更加安全的应用于临床提供了新的方法和思路。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的调控型CBE结构示意图;A)双载体表达pCMV-Target-AID-ND结构示意图;B)双载体表达pCMV-Target-AID-CD结构示意图;C)双载体表达pCMV-Target-AID-NCD结构示意图;
图2为本发明一个实施例中调控型CBE在RNF2位点上引起了高效的碱基编辑;双载体表达的Target-AID、Target-AID-ND、Target-AID-CD和Target-AID-NCD在含有TMP(TMP+)和不含TMP(TMP-)的条件下在RNF2靶位点内所有胞嘧啶上引起的碱基编辑结果;EDITSITE,主要编辑位点;
图3为本发明一个实施例中调控型CBE在HEK293_SITE2位点上引起了高效的碱基编辑;双载体表达的Target-AID、Target-AID-ND、Target-AID-CD和Target-AID-NCD在含有TMP(TMP+)和不含TMP(TMP-)的条件下在HEK293_SITE2靶位点内所有胞嘧啶上引起的碱基编辑结果;EDIT SITE,主要编辑位点;
图4为本发明一个实施例中调控型CBE在HEK293_SITE3位点上引起了高效的碱基编辑;双载体表达的Target-AID、Target-AID-ND、Target-AID-CD和Target-AID-NCD在含有TMP(TMP+)和不含TMP(TMP-)的条件下在HEK293_SITE3靶位点内所有胞嘧啶上引起的碱基编辑结果;EDIT SITE,主要编辑位点。
具体实施方式
现将详细地提供本发明实施方式的参考,其一个或多个实例描述于下文。提供每一实例作为解释而非限制本发明。实际上,对本领域技术人员而言,显而易见的是,可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
本发明涉及融合蛋白,其包含a)Cas酶域;b)不稳定结构域(DD);c)胞嘧啶脱氨酶域(CDA)以及d)尿嘧啶糖苷酶抑制剂(UGI)域。
容易理解,上述a)~d)均是蛋白全长或具有功能的蛋白片段,例如Cas酶具有切合靶核酸的能力,UGI包含能够抑制尿嘧啶DNA糖基化酶(UDG)活性的域。
在一些实施方式中,所述的融合蛋白从N端到C端,其选自以下融合方式中的任意一种:
(1)Cas-DD-CDA-UGI;
(2)Cas-CDA-DD-UGI;
(3)Cas-DD-CDA-DD-UGI;
其中“-”代表任选的连接肽。
在一些实施方式中,所述连接肽的氨基酸数目为1~30个;可以是1,2,3,4,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个。
在一些实施方式中,所述连接肽为柔性连接肽;
在一些实施方式中,所述连接肽的氨基酸序列选自Gly、Ser、Pro、Ala以及Glu中的一种或多种。
在一些实施方式中,所述连接肽的氨基酸序列选自(GGGGS)n、(EAAAK)n、(GGGS)n、(GGS)n、(GS)n或(G)n,其中n选自1,2,3,4,5或6。
所述Cas酶域为具有DNA或RNA切割活性的Cas酶域,例如Cas1、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cas11、Cas12、Cas13,其同源物、或其修饰形式。优选为II、V、VI型CRISPR系统,更优选为Cas9、Cas12、Cas13。
在一些实施方式中,所述Cas酶域的氨基酸序列如SEQ ID NO:1所示。
在一些实施方式中,胞嘧啶脱氨酶域是所述活化诱导的脱氨酶(AID)。
在一些实施方式中,所述胞嘧啶脱氨酶域是来自载脂蛋白B mRNA-编辑复合物(APOBEC)家族脱氨酶的脱氨酶,例如选自APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶、APOBEC3D脱氨酶、APOBEC3F脱氨酶、APOBEC3G脱氨酶和APOBEC3H脱氨酶。
在一些实施方案中,脱氨酶来自人、黑猩猩、大猩猩、猴、牛、狗、大鼠或小鼠。在一些实施方案中,脱氨酶来自人。
在一些实施方式中,所述胞嘧啶脱氨酶域是来自海七鳃鳗(Petromyzonmarinus)的胞苷脱氨酶1(pmCDA1)。进一步的,所述pmCDA1的氨基酸序列如SEQ ID NO:6所示。
在一些实施方式中,所述不稳定结构域(DD)的氨基酸序列如SEQ ID NO:7所示。
在一些实施方式中,所述尿嘧啶糖苷酶抑制剂(UGI)的氨基酸序列如SEQ ID NO:8所示。
根据本发明的再一方面,还涉及一种组合物,其包含如上所述融合蛋白、与所述Cas9酶域结合的引导RNA以及trimethoprim。
根据本发明的再一方面,还涉及宿主细胞,其含有如上所述的组合物,并且其基因组中含有所述引导RNA所识别的靶序列。
在一些实施方式中,所述的宿主细胞为真核细胞。
在一些实施方式中,所述细胞为真菌细胞。
在一些实施方式中,所述细胞为植物细胞或动物细胞;在一些国家中,细胞是不具有全能性的细胞,例如,不是受精卵、胚胎、生殖细胞。或者是不能发育为可以借助光合作用,以水、二氧化碳和无机盐等无机物合成碳水化合物、蛋白质来维系生存的植物。
在一些实施方式中,所述细胞为非人的哺乳动物细胞。
在一些实施方案中,所述细胞非限制性地包括牛、马、乳牛、猪、绵羊、山羊、大鼠、小鼠、狗、猫、兔、骆驼、驴、鹿、貂、鸡、鸭、鹅、火鸡、斗鸡等。
在一些实施方式中,所述细胞为人类细胞。
在一些实施方案中,所述细胞衍生自细胞系。用于组织培养的多种细胞系是本领域已知的。细胞系的实例包括但不限于C8161,CCRF-CEM,MOLT,mIMCD-3,NHDF,HeLa-S3,Huh1,Huh4,Huh7,HUVEC,HASMC,HEKn,HEKa,MiaPaCell,Panel,PC-3,TF1,CTLL-2,C1R,Rat6,CV1,RPTE,A10,T24,J82,A375,ARH-77,Calu1,SW480,SW620,SKOV3,SK-UT,CaCo2,P388D1,SEM-K2,WEHI-231,HB56,TIB55,Jurkat,J45.01,LRMB,Bcl-1,BC-3,IC21,DLD2,Raw264.7,NRK,NRK-52E,MRC5,MEF,Hep G2,HeLa B,HeLa T4,COS,COS-1,COS-6,COS-M6A,BS-C-1猴肾上皮细胞,BALB/3T3小鼠胚胎成纤维细胞,3T3 Swiss,3T3-L1,132-d5人胎儿成纤维细胞;小鼠成纤维细胞,293-T,3T3,721,9L,A2780,A2780ADR,A2780cis,A172,A20,A253,A431,A-549,ALC,B16,B35,BCP-1细胞,BEAS-2B,bEnd.3,BHK-21,BR 293,BxPC3,C3H-10T1/2,C6/36,Cal-27,CHO,CHO-7,CHO-IR,CHO-K1,CHO-K2,CHO-T,CHO Dhfr-/-,COR-L23,COR-L23/CPR,COR-L23/5010,COR-L23/R23,COS-7,COV-434,CMLT1,CMT,CT26,D17,DH82,DU145,DuCaP,EL4,EM2,EM3,EMT6/AR1,EMT6/AR10.0,FM3,H1299,H69,HB54,HB55,HCA2,HEK-293,HeLa,Hepa1c1c7,HL-60,HMEC,HT-29,Jurkat,JY细胞,K562细胞,Ku812,KCL22,KG1,KYO1,LNCap,Ma-MeI 1-48,MC-38,MCF-7,MCF-10A,MDA-MB-231,MDA-MB-468,MDA-MB-435,MDCK II,MDCK II,MOR/0.2R,MONO-MAC 6,MTD-1A,MyEnd,NCI-H69/CPR,NCI-H69/LX10,NCI-H69/LX20,NCI-H69/LX4,NIH-3T3,NALM-1,NW-145,OPCN/OPCT细胞系,Peer,PNT-1A/PNT 2,RenCa,RIN-5F,RMA/RMAS,Saos-2细胞,Sf-9,SkBr3,T2,T-47D,T84,THP1细胞系,U373,U87,U937,VCaP,Vero细胞,WM39,WT-49,X63,YAC-1,YAR及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得,例如保藏中心。
根据本发明的再一方面,还涉及分离的核酸,其表达如上所述融合蛋白。
在一些实施方式中,所述核酸还具有核定位序列(NLS)。优选NLS与Cas酶核酸相连。
核酸可以为DNA或RNA,根据需要,核酸是密码子优化的,用于在所述细胞中更为高效地表达。
在一些实施方式中,所述核酸由至少两段独立的核酸片段A和B组成,并包含用于表达intein内含肽的核酸片段;
其中片段A中,SEQ ID NO:2所示核酸序列的3'端与用于表达intein内含肽N端的核酸片段的核酸片段连接;
片段B中,SEQ ID NO:3所示核酸序列的5'端与用于表达intein内含肽C端的核酸片段的核酸片段连接;
当所述核酸在真核细胞表达时,所述intein内含肽可以被切除,并且片段A和片段B连接得到所述融合蛋白。
优选的,用于表达intein内含肽N端的核酸片段如SEQ ID NO:4所示,用于表达intein内含肽C端的核酸片段如SEQ ID NO:5所示。
上述两个片段核酸能够满足AAV包装大小限制条件,理论上可用于在体基因治疗,提高基因治疗安全性。
根据本发明的再一方面,还涉及载体,其含有如上所述的核酸,以及任选的引导RNA。
术语“载体(vector)”是指,可将多聚核苷酸插入其中的一种核酸运载工具。当载体能使插入的多核苷酸编码的蛋白获得表达时,载体称为表达载体。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌粒;柯斯质粒;人工染色体,例如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1来源的人工染色体(PAC);噬菌体如λ噬菌体或M13噬菌体及动物病毒等。可用作载体的动物病毒包括但不限于,逆转录酶病毒(包括慢病毒)、腺病毒、腺相关病毒、疱疹病毒(如单纯疱疹病毒)、痘病毒、杆状病毒、乳头瘤病毒、乳头多瘤空泡病毒(如SV40)。在一些实施方式中,本发明所述载体中包含基因工程中常用的调控元件,例如增强子、启动子、内部核糖体进入位点(IRES)和其他表达控制元件(例如转录终止信号,或者多腺苷酸化信号和多聚U序列等)。在一些实施方式中,本发明所述载体、转录物中还可以包含筛选所用的基因(例如抗生素抗性基因)、用于生成荧光蛋白的核酸等片段。
载体可以包含一个或多个单元,例如由多个质粒组成,特别优选至少包含2个质粒,分别包装上述片段A和片段B,优选还包含具有引导RNA的质粒。
在一些实施方式中,所述载体中包含AAV载体。其可以为任何血清型,例如AAV1~AAV12。
根据本发明的再一方面,还涉及改变基因产物表达的方法,其包括:
将如上所述的核酸,或如上所述载体导入宿主细胞并在trimethoprim存在的条件下表达出所述融合蛋白并与引导RNA配合以改变基因产物的表达。
根据本发明的再一方面,还涉及递送系统,其包括i)如上所述融合蛋白、或如上所述的核酸,或如上所述载体;ii)引导RNA以及iii)递送媒介物。
常规的基于病毒和非病毒的基因转移方法可用于在细胞或靶组织中引入核酸。这种方法可用于将编码CRISPR系统组分的核酸施用到培养中或宿主生物体中的细胞。非病毒载体递送系统包括DNA质粒,RNA,裸核酸和与递送媒介物(例如脂质体)复合的核酸。病毒载体递送系统包括DNA和RNA病毒,其在递送至细胞后具有附加或整合的基因组。
非病毒递送核酸的方法包括脂转染,核转染,微注射,生物射弹,病毒体,脂质体,免疫脂质体,聚阳离子或脂质:核酸缀合物,裸DNA,人工病毒粒子和DNA的试剂增强摄取。
病毒递送核酸的方法可以直接施用到所述主体或可以用于体外处理细胞,且可以任选地将修饰的细胞施用到所述主体。用载体转染方法可以在宿主基因组中整合,通常导致插入的转基因的长期表达。另外,已经在许多不同细胞类型和靶组织中观察到高转导效率。
根据本发明的再一方面,还涉及药物组合物,其包含如上所述的递送系统以及药学上可接受的载体。
下面将结合实施例对本发明的实施方案进行详细描述。
本发明首先公开了一种利用融合Destablizing Domain与胞嘧啶碱基编辑器的方法实现了对碱基编辑的实时调控。通过将Destablizing Domain,七鳃鳗来源的胞嘧啶脱氨酶pmCDA与nCas9(D10A)同框融合表达得到了nCas9-DD-pmCDA、nCas9-pmCDA-DD以及包含两拷贝DD的nCas9-DD-pmCDA-DD共三种可调控的CBE;同时为便于AAV包装,本发明进一步在nCas9蛋白713-714位氨基酸处融合intein内含肽(可从前体蛋白中切除并将两侧肽段连接起来成为成熟蛋白质),得到了Target-AID-N(nCas91-713-intein-N)、Target-AID-C(intein-C-nCas9714-1368-pmCDA)、Target-AID-ND-C(intein-C-nCas9714-1368-DD-pmCDA)、Target-AID-CD-C(intein-C-nCas9714-1368-pmCDA-DD)和Target-AID-NCD-C(intein-C-nCas9714-1368-DD-pmCDA-DD)四个表达载体。将sgRNA表达载体、Target-AID-N和Target-AID-C(Target-AID-ND-C表达载体、Target-AID-CD-C或Target-AID-NCD-C)共转染真核动物细胞,24小时后,加入10uM小分子抑制剂TMP抑制CBE降解,使其在靶位点基因组DNA发生C-T碱基编辑,PCR扩增靶位点上下游后,Sanger测序检测靶位点处发生的C-T碱基编辑效率。和原始的Target-AID相比,三个新系统在TMP存在的情况下,在靶基因组位点上引起了有效的编辑效率(多数略低于、少数高于原始Target-AID效率),在TMP不存在的条件下,基本不引起有效编辑。其中Target-AID-CD(Target-AID-N和Target-AID-CD-C组合)引起的编辑效率最高,Target-AID-NCD(Target-AID-N和Target-AID-NCD-C组合)背景最低。
实施例1
人基因组RNF2位点利用双载体融合表达Destablizing Domain与CBE实施可调控的高精度高功效的碱基编辑
1.实验材料
1)试剂
引物合成自上海生工生物有限公司;限制性内切酶、DNA连接酶、高保真DNA聚合酶
Figure BDA0003101642900000091
购自NEB公司;质粒重组试剂盒Clone
Figure BDA0003101642900000092
购自Vazyme公司;pcDNA3.1_pCMV-nCas-PmCDA1-ugi pH1-gRNA来自addgene网站;
Figure BDA0003101642900000093
DNA胶回收试剂盒购自Corning公司;转染试剂
Figure BDA0003101642900000094
LTX,
Figure BDA0003101642900000095
购自Thermo Fisher公司;QuickExtractTM基因组DNA抽提试剂。
2)细胞株
人胎肾细胞HEK293FT培养在加入了10%胎牛血清(Gbico),1%双抗的DMEM培养基(Gibco)中贴壁培养。
2.实验方法
2.1pCMV-Target-AID表达质粒的构建
分别使用以下引物1和引物2以pCMV-nCas-PmCDA1-ugi-pH1-gRNA(addgene#79620)为模板进行PCR,以引物3和引物4以pCMV-BE3为模版进行PCR得到pCMV空载体,将上述PCR产物用质粒重组试剂盒Clone
Figure BDA0003101642900000106
重组至pCMV表达载体中,得到pCMV-Target-AID表达质粒。
2.2pCMV-Target-AID-N、pCMV-Target-AID-C、pCMV-Target-AID-ND-C、pCMV-Target-AID-CD-C和pCMV-Target-AID-NCD-C表达质粒的构建
利用以下引物1和引物5以pCMV-Target-AID为模版进行PCR得到nCas91-713片段,引物6和引物7以工业合成的intein整合素蛋白为模板进行PCR得到intein-N,将上述2个PCR片段用质粒重组试剂盒Clone
Figure BDA0003101642900000101
重组至pCMV载体中得到Target-AID-N的表达质粒pCMV-nCas91-713-intein-N;
利用以下引物8和引物9以intein整合素蛋白为模板进行PCR得到intein-C,引物10和引物11以Target-AID为模版进行PCR得到nCas9714-1368,将两段PCR产物用质粒重组试剂盒Clone
Figure BDA0003101642900000102
重组至pCMV载体中得到Target-AID-C的表达质粒pCMV-intein-C-nCas9714-1368-pmCDA1;
利用以下引物12和引物13以工业合成的DHFR为模版进行PCR,将PCR产物用质粒重组试剂盒Clone
Figure BDA0003101642900000103
重组至Target-AID-C表达载体中PmCDA1的N端,得到Target-AID-ND-C表达质粒pCMV-intein-C-nCas9714-1368-DD-pmCDA;
利用以下引物14和引物15以工业合成的DHFR为模版进行PCR,将PCR产物用质粒重组试剂盒Clone
Figure BDA0003101642900000104
重组至Target-AID-C表达载体中PmCDA1的C端,得到Target-AID-CD-C表达质粒pCMV-intein-C-nCas9714-1368-pmCDA-DD。
利用以下引物14和引物15以工业合成的DHFR为模版进行PCR,将PCR产物用质粒重组试剂盒Clone
Figure BDA0003101642900000105
重组至Target-AID-ND-C表达载体中PmCDA1的C端,得到Target-AID-NCD-C表达质粒pCMV-intein-C-nCas9714-1368-DD-pmCDA-DD。
2.3sgRNA表达质粒的构建
分别将以下引物:16和17进行退火,将退火产物连入经限制性内切酶BsaI消化后的sgRNA表达载体pGL3-U6-sgRNA-PGK-puromycin(addgene#51133)后,得到靶向人基因组RNF2位点的sgRNA表达质粒psgRNF2。
表1引物
Figure BDA0003101642900000111
质粒构建实验中扩增各种片段使用PCR体系如下:
dNTP 4μl;5×PS Buffer 10μl;Forward Primer 1μl;Reverse Primer 1μl;Template 10ng;PrimeSTAR(Takara)0.5μl;RNase-free water补至50μl
PCR程序如下:95℃,3min;95℃,10sec,58℃,15sec,72℃,1min,30循环;72℃,3min
2.4真核细胞转染
将psgRNF2、pCMV-Target-AID-N和pCMV-Target-AID-C(pCMV-Target-AID-ND-C,pCMV-Target-AID-CD-C或pCMV-Target-AID-NCD-C)质粒分别按照0.34μg:0.5μg:0.5μg的比例混合入250μl opti-MEM中,震荡混匀后分别加入1.34μl
Figure BDA0003101642900000121
plus试剂,涡旋混匀后分别加入2.68μl
Figure BDA0003101642900000122
LTX转染试剂,轻柔吹打混匀,室温放置5分钟后加入含有500μl DMEM+10%FBS培养基和十五万HEK293T细胞的24孔板中进行转染。转染24h后换含有10μM TMP和2μg/ml puromycine抗生素的新鲜培养基,继续培养48小时。
2.5基因组DNA抽提和PCR扩增
QuickExtractTM试剂抽提转染后HEK293FT细胞的基因组DNA,将抽提得到的基因组DNA分别利用以下引物18和19进行PCR扩增,并利用
Figure BDA0003101642900000123
DNA胶回收试剂对PCR产物进行切胶回收,后续对其进行一代测序,检测基因编辑效率。
表2引物
编号 引物名 序列
18 RNF2-G1F CTCTGTGTCAGAACATGCTGG
19 RNF2-G1R CACCACTGTTCACCCAGTAC
扩增基因组DNA使用PCR体系如下:
dNTP 4μl;5×PS buffer 10μl;Forward Primer 1μl;Reverse Primer 1μl;Template 10ng;PrimeSTAR(Takara)0.5μl;RNase-free water补至50μl。
PCR程序如下:95℃,3min;95℃,10sec,58℃,15sec,72℃,1min,30循环;72℃,3min。
实施例2
人基因组HEK293_SITE2位点利用双载体融合表达Destablizing Domain与CBE实施可调控的高精度高功效的碱基编辑
1.实验材料
1)试剂
同实施例1。
2)细胞株
同实施例1。
2.实验方法
2.1pCMV-Target-AID表达质粒的构建
同实施例1。
2.2pCMV-Target-AID-N、pCMV-Target-AID-C、pCMV-Target-AID-ND-C、pCMV-Target-AID-CD-C和pCMV-Target-AID-NCD-C表达质粒的构建
同实施例1。
2.3sgRNA表达质粒的构建
分别将以下引物:20和21进行退火,将退火产物连入经限制性内切酶BsaI消化后的sgRNA表达载体pGL3-U6-sgRNA-PGK-puromycin(addgene#51133)后,得到靶向人基因组HEK293_SITE2位点的sgRNA表达质粒psgHEK2。
表3引物
编号 引物名 序列
20 HEK293_site 2-FOR ACCGGAACACAAAGCATAGACTGC
21 HEK293_site 2-REV AAACGCAGTCTATGCTTTGTGTTC
质粒构建实验中扩增各种片段使用PCR体系如下:
dNTP 4μl;5×PS Buffer 10μl;Forward Primer 1μl;Reverse Primer 1μl;Template 10ng;PrimeSTAR(Takara)0.5μl;RNase-free water补至50μl。
PCR程序如下:95℃,3min;95℃,10sec,58℃,15sec,72℃,1min,30循环;72℃,3min。
2.4真核细胞转染
将psgHEK2、pCMV-Target-AID-N和pCMV-Target-AID-C(pCMV-Target-AID-ND-C,pCMV-Target-AID-CD-C或pCMV-Target-AID-NCD-C)质粒分别按照0.34μg:0.5μg:0.5μg的比例混合入250μl opti-MEM中,震荡混匀后分别加入1.34μl
Figure BDA0003101642900000131
plus试剂,涡旋混匀后分别加入2.68μl
Figure BDA0003101642900000132
LTX转染试剂,轻柔吹打混匀,室温放置5分钟后加入含有500μl DMEM+10%FBS培养基和十五万HEK293T细胞的24孔板中进行转染。转染24h后换含有10μM TMP和2μg/ml puromycine抗生素的新鲜培养基,继续培养48小时。
2.5基因组DNA抽提和PCR扩增
QuickExtractTM试剂抽提转染后HEK293FT细胞的基因组DNA,将抽提得到的基因组DNA分别利用以下引物22和23进行PCR扩增,并利用
Figure BDA0003101642900000141
DNA胶回收试剂对PCR产物进行切胶回收,后续对其进行一代测序,检测基因编辑效率。
表4引物
编号 引物名 序列
22 HEK293_2-G1F ATCCACAGCAACACCCTCTC
23 HEK293_2-G1R CTTCACAGGCTACCCCCTAA
扩增基因组DNA使用PCR体系如下:
dNTP 4μl;5×PS buffer 10μl;Forward Primer 1μl;Reverse Primer 1μl;Template 10ng;PrimeSTAR(Takara)0.5μl;RNase-free water补至50μl。
PCR程序如下:95℃,3min;95℃,10sec,58℃,15sec,72℃,1min,30循环;72℃,3min。
实施例3
人基因组HEK293_SITE3位点利用双载体融合表达Destablizing Domain与CBE实施可调控的高精度高功效的碱基编辑
1.实验材料
1)试剂
同实施例1。
2)细胞株
同实施例1。
2.实验方法
2.1pCMV-Target-AID表达质粒的构建
同实施例1。
2.2pCMV-Target-AID-N、pCMV-Target-AID-C、pCMV-Target-AID-ND-C、pCMV-Target-AID-CD-C和pCMV-Target-AID-NCD-C表达质粒的构建
同实施例1。
2.3sgRNA表达质粒的构建
分别将以下引物:24和25进行退火,将退火产物连入经限制性内切酶BsaI消化后的sgRNA表达载体pGL3-U6-sgRNA-PGK-puromycin(addgene#51133)后,得到靶向人基因组HEK293_SITE3位点的sgRNA表达质粒psgHEK3。
表5引物
编号 引物名 序列
24 HEK293_site 3-FOR ACCGGGCCCAGACTGAGCACGTGA
25 HEK293_site 3-REV AAACTCACGTGCTCAGTCTGGGCC
质粒构建实验中扩增各种片段使用PCR体系如下:
dNTP 4μl;5×PS Buffer 10μl;Forward Primer 1μl;Reverse Primer 1μl;Template 10ng;PrimeSTAR(Takara)0.5μl;RNase-free water补至50μl
PCR程序如下:95℃,3min;95℃,10sec,58℃,15sec,72℃,1min,30循环;72℃,3min。
2.4真核细胞转染
将psgHEK3、pCMV-Target-AID-N和pCMV-Target-AID-C(pCMV-Target-AID-ND-C,pCMV-Target-AID-CD-C或pCMV-Target-AID-NCD-C)质粒分别按照0.34μg:0.5μg:0.5μg的比例混合入250μl opti-MEM中,震荡混匀后分别加入1.34μl
Figure BDA0003101642900000151
plus试剂,涡旋混匀后分别加入2.68μl
Figure BDA0003101642900000152
LTX转染试剂,轻柔吹打混匀,室温放置5分钟后加入含有500μl DMEM+10%FBS培养基和十五万HEK293T细胞的24孔板中进行转染。转染24h后换含有10μM TMP和2μg/ml puromycine抗生素的新鲜培养基,继续培养48小时。
2.5基因组DNA抽提和PCR扩增
QuickExtractTM试剂抽提转染后HEK293FT细胞的基因组DNA,将抽提得到的基因组DNA分别利用以下引物26和27进行PCR扩增,并利用
Figure BDA0003101642900000153
DNA胶回收试剂对PCR产物进行切胶回收,后续对其进行一代测序,检测基因编辑效率。
表6引物
Figure BDA0003101642900000154
Figure BDA0003101642900000161
扩增基因组DNA使用PCR体系如下:
dNTP 4μl;5×PS buffer 10μl;Forward Primer 1μl;Reverse Primer 1μl;Template 10ng;PrimeSTAR(Takara)0.5μl;RNase-free water补至50μl。
PCR程序如下:95℃,3min;95℃,10sec,58℃,15sec,72℃,1min,30循环;72℃,3min。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 上海市第一人民医院
<120> 用于胞嘧啶碱基编辑的融合蛋白及其应用
<160> 8
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1368
<212> PRT
<213> artificial sequence
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser
1025 1030 1035 1040
Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1045 1050 1055
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile
1060 1065 1070
Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1075 1080 1085
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1090 1095 1100
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1105 1110 1115 1120
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1125 1130 1135
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly
1140 1145 1150
Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1155 1160 1165
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala
1170 1175 1180
Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1185 1190 1195 1200
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser
1205 1210 1215
Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1220 1225 1230
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val
1265 1270 1275 1280
Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1285 1290 1295
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu
1300 1305 1310
Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1315 1320 1325
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1330 1335 1340
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1345 1350 1355 1360
Asp Leu Ser Gln Leu Gly Gly Asp
1365
<210> 2
<211> 2139
<212> DNA
<213> artificial sequence
<400> 2
atggacaaga agtactccat tgggctcgct atcggcacaa acagcgtcgg ttgggccgtc 60
attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 120
cacagcataa agaagaacct cattggcgcc ctcctgttcg actccgggga gacggccgaa 180
gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 240
tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 300
ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 360
aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 420
aagcttgtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcat 480
atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 540
gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga agagaacccg 600
atcaacgcat ccggagttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 660
cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 720
cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 780
gatgccaagc ttcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 840
cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 900
ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 960
atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1020
cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1080
ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1140
gaaaaaatgg acggcaccga ggagctgctg gtaaagctta acagagaaga tctgttgcgc 1200
aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 1260
gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 1320
gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgcccg gggaaattcc 1380
agattcgcgt ggatgactcg caaatcagaa gagaccatca ctccctggaa cttcgaggaa 1440
gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 1500
aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 1560
tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 1620
tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 1680
gtgaaacagc tcaaagaaga ctatttcaaa aagattgaat gtttcgactc tgttgaaatc 1740
agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 1800
attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 1860
ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 1920
catctcttcg acgacaaagt catgaaacag ctcaagaggc gccgatatac aggatggggg 1980
cggctgtcaa gaaaactgat caatgggatc cgagacaagc agagtggaaa gacaatcctg 2040
gattttctta agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac 2100
tctctcacct ttaaggagga catccagaaa gcacaagtt 2139
<210> 3
<211> 1965
<212> DNA
<213> artificial sequence
<400> 3
tctggccagg gggacagtct tcacgagcac atcgctaatc ttgcaggtag cccagctatc 60
aaaaagggaa tactgcagac cgttaaggtc gtggatgaac tcgtcaaagt aatgggaagg 120
cataagcccg agaatatcgt tatcgagatg gcccgagaga accaaactac ccagaaggga 180
cagaagaaca gtagggaaag gatgaagagg attgaagagg gtataaaaga actggggtcc 240
caaatcctta aggaacaccc agttgaaaac acccagcttc agaatgagaa gctctacctg 300
tactacctgc agaacggcag ggacatgtac gtggatcagg aactggacat caatcggctc 360
tccgactacg acgtggatca tatcgtgccc cagtcttttc tcaaagatga ttctattgat 420
aataaagtgt tgacaagatc cgataaaaat agagggaaga gtgataacgt cccctcagaa 480
gaagttgtca agaaaatgaa aaattattgg cggcagctgc tgaacgccaa actgatcaca 540
caacggaagt tcgataatct gactaaggct gaacgaggtg gcctgtctga gttggataaa 600
gccggcttca tcaaaaggca gcttgttgag acacgccaga tcaccaagca cgtggcccaa 660
attctcgatt cacgcatgaa caccaagtac gatgaaaatg acaaactgat tcgagaggtg 720
aaagttatta ctctgaagtc taagctggtc tcagatttca gaaaggactt tcagttttat 780
aaggtgagag agatcaacaa ttaccaccat gcgcatgatg cctacctgaa tgcagtggta 840
ggcactgcac ttatcaaaaa atatcccaag cttgaatctg aatttgttta cggagactat 900
aaagtgtacg atgttaggaa aatgatcgca aagtctgagc aggaaatagg caaggccacc 960
gctaagtact tcttttacag caatattatg aattttttca agaccgagat tacactggcc 1020
aatggagaga ttcggaagcg accacttatc gaaacaaacg gagaaacagg agaaatcgtg 1080
tgggacaagg gtagggattt cgcgacagtc cggaaggtcc tgtccatgcc gcaggtgaac 1140
atcgttaaaa agaccgaagt acagaccgga ggcttctcca aggaaagtat cctcccgaaa 1200
aggaacagcg acaagctgat cgcacgcaaa aaagattggg accccaagaa atacggcgga 1260
ttcgattctc ctacagtcgc ttacagtgta ctggttgtgg ccaaagtgga gaaagggaag 1320
tctaaaaaac tcaaaagcgt caaggaactg ctgggcatca caatcatgga gcgatcaagc 1380
ttcgaaaaaa accccatcga ctttctcgag gcgaaaggat ataaagaggt caaaaaagac 1440
ctcatcatta agcttcccaa gtactctctc tttgagcttg aaaacggccg gaaacgaatg 1500
ctcgctagtg cgggcgagct gcagaaaggt aacgagctgg cactgccctc taaatacgtt 1560
aatttcttgt atctggccag ccactatgaa aagctcaaag ggtctcccga agataatgag 1620
cagaagcagc tgttcgtgga acaacacaaa cactaccttg atgagatcat cgagcaaata 1680
agcgaattct ccaaaagagt gatcctcgcc gacgctaacc tcgataaggt gctttctgct 1740
tacaataagc acagggataa gcccatcagg gagcaggcag aaaacattat ccacttgttt 1800
actctgacca acttgggcgc gcctgcagcc ttcaagtact tcgacaccac catagacaga 1860
aagcggtaca cctctacaaa ggaggtcctg gacgccacac tgattcatca gtcaattacg 1920
gggctctatg aaacaagaat cgacctctct cagctcggtg gagac 1965
<210> 4
<211> 306
<212> DNA
<213> artificial sequence
<400> 4
tgtctggctg gcgatactct cattaccctg gccgatggac gacgagtgcc tattagagaa 60
ctggtgtcac agcagaattt ttccgtgtgg gctctgaatc ctcagactta ccgcctggag 120
agggctagag tgagtagagc tttctgtacc ggcatcaaac ctgtgtaccg cctcaccact 180
agactgggga gatccattag ggccactgcc aaccaccgat ttctcacacc tcagggctgg 240
aaacgagtcg atgaactcca gcctggagat tacctggctc tgcctaggag aatccctact 300
gcctcc 306
<210> 5
<211> 156
<212> DNA
<213> artificial sequence
<400> 5
atggcggcgg cgtgcccgga actgcgtcag ctggcgcaga gcgatgtgta ttgggatccg 60
attgtgagca ttgaaccgga tggcgtggaa gaagtgtttg atctgaccgt gccgggcccg 120
cataactttg tggcgaacga tattattgcg cataac 156
<210> 6
<211> 208
<212> PRT
<213> artificial sequence
<400> 6
Met Thr Asp Ala Glu Tyr Val Arg Ile His Glu Lys Leu Asp Ile Tyr
1 5 10 15
Thr Phe Lys Lys Gln Phe Phe Asn Asn Lys Lys Ser Val Ser His Arg
20 25 30
Cys Tyr Val Leu Phe Glu Leu Lys Arg Arg Gly Glu Arg Arg Ala Cys
35 40 45
Phe Trp Gly Tyr Ala Val Asn Lys Pro Gln Ser Gly Thr Glu Arg Gly
50 55 60
Ile His Ala Glu Ile Phe Ser Ile Arg Lys Val Glu Glu Tyr Leu Arg
65 70 75 80
Asp Asn Pro Gly Gln Phe Thr Ile Asn Trp Tyr Ser Ser Trp Ser Pro
85 90 95
Cys Ala Asp Cys Ala Glu Lys Ile Leu Glu Trp Tyr Asn Gln Glu Leu
100 105 110
Arg Gly Asn Gly His Thr Leu Lys Ile Trp Ala Cys Lys Leu Tyr Tyr
115 120 125
Glu Lys Asn Ala Arg Asn Gln Ile Gly Leu Trp Asn Leu Arg Asp Asn
130 135 140
Gly Val Gly Leu Asn Val Met Val Ser Glu His Tyr Gln Cys Cys Arg
145 150 155 160
Lys Ile Phe Ile Gln Ser Ser His Asn Gln Leu Asn Glu Asn Arg Trp
165 170 175
Leu Glu Lys Thr Leu Lys Arg Ala Glu Lys Trp Arg Ser Glu Leu Ser
180 185 190
Ile Met Ile Gln Val Lys Ile Leu His Thr Thr Lys Ser Pro Ala Val
195 200 205
<210> 7
<211> 159
<212> PRT
<213> artificial sequence
<400> 7
Met Ile Ser Leu Ile Ala Ala Leu Ala Val Asp Tyr Val Ile Gly Met
1 5 10 15
Glu Asn Ala Met Pro Trp Asn Leu Pro Ala Asp Leu Ala Trp Phe Lys
20 25 30
Arg Asn Thr Leu Asn Lys Pro Val Ile Met Gly Arg His Thr Trp Glu
35 40 45
Ser Ile Gly Arg Pro Leu Pro Gly Arg Lys Asn Ile Ile Leu Ser Ser
50 55 60
Gln Pro Ser Thr Asp Asp Arg Val Thr Trp Val Lys Ser Val Asp Glu
65 70 75 80
Ala Ile Ala Ala Cys Gly Asp Val Pro Glu Ile Met Val Ile Gly Gly
85 90 95
Gly Arg Val Ile Glu Gln Phe Leu Pro Lys Ala Gln Lys Leu Tyr Leu
100 105 110
Thr His Ile Asp Ala Glu Val Glu Gly Asp Thr His Phe Pro Asp Tyr
115 120 125
Glu Pro Asp Asp Trp Glu Ser Val Phe Ser Glu Phe His Asp Ala Asp
130 135 140
Ala Gln Asn Ser His Ser Tyr Cys Phe Glu Ile Leu Glu Arg Arg
145 150 155
<210> 8
<211> 84
<212> PRT
<213> artificial sequence
<400> 8
Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1 5 10 15
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
20 25 30
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
35 40 45
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
50 55 60
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
65 70 75 80
Ile Lys Met Leu

Claims (16)

1.融合蛋白,其包含a)Cas酶域;b)不稳定结构域(DD);c)胞嘧啶脱氨酶域(CDA)以及d)尿嘧啶糖苷酶抑制剂(UGI)域。
2.根据权利要求1所述的融合蛋白,从N端到C端,其选自以下融合方式中的任意一种:
(1)Cas-DD-CDA-UGI;
(2)Cas-CDA-DD-UGI;
(3)Cas-DD-CDA-DD-UGI;
其中“-”代表任选的连接肽。
3.根据权利要求1或2所述的融合蛋白,所述Cas酶域为Cas1、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cas11、Cas12、Cas13中的任一种。
4.根据权利要求3所述的融合蛋白,所述Cas酶域的氨基酸序列如SEQ ID NO:1所示。
5.根据权利要求1或2所述的融合蛋白,胞嘧啶脱氨酶域是所述活化诱导的脱氨酶(AID)。
6.根据权利要求5所述的融合蛋白,所述胞嘧啶脱氨酶域是来自海七鳃鳗(Petromyzonmarinus)的胞苷脱氨酶1(pmCDA1)。
7.组合物,其包含权利要求1~6任一项所述融合蛋白、与所述Cas酶域结合的引导RNA以及trimethoprim。
8.宿主细胞,其含有权利要求7所述的组合物,并且其基因组中含有所述引导RNA所识别的靶序列。
9.根据权利要求8所述的宿主细胞,其为真核细胞。
10.分离的核酸,其表达权利要求1~6任一项所述融合蛋白。
11.根据权利要求10所述核酸,其由至少两段独立的核酸片段A和B组成,并包含用于表达intein内含肽的核酸片段;
其中片段A中,SEQ ID NO:2所示核酸序列的3'端与用于表达intein内含肽N端的核酸片段的核酸片段连接;
片段B中,SEQ ID NO:3所示核酸序列的5'端与用于表达intein内含肽C端的核酸片段的核酸片段连接;
当所述核酸在真核细胞表达时,所述intein内含肽可以被切除,并且片段A和片段B连接得到所述融合蛋白。
12.载体,其含有权利要求10或11所述的核酸,以及任选的引导RNA。
13.根据权利要求12所述的载体,所述载体中包含AAV载体。
14.改变基因产物表达的方法,其包括:
将权利要求10或11所述的核酸,或权利要求12或13所述载体导入宿主细胞并在trimethoprim存在的条件下表达出所述融合蛋白并与引导RNA配合以改变基因产物的表达。
15.递送系统,其包括i)权利要求1~6任一项所述融合蛋白、或权利要求10或11所述的核酸,或权利要求12或13所述载体;ii)引导RNA以及iii)递送媒介物。
16.药物组合物,其包含权利要求15所述的递送系统以及药学上可接受的载体。
CN202110626828.8A 2021-06-04 2021-06-04 用于胞嘧啶碱基编辑的融合蛋白及其应用 Active CN113564145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110626828.8A CN113564145B (zh) 2021-06-04 2021-06-04 用于胞嘧啶碱基编辑的融合蛋白及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110626828.8A CN113564145B (zh) 2021-06-04 2021-06-04 用于胞嘧啶碱基编辑的融合蛋白及其应用

Publications (2)

Publication Number Publication Date
CN113564145A true CN113564145A (zh) 2021-10-29
CN113564145B CN113564145B (zh) 2023-07-28

Family

ID=78161015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110626828.8A Active CN113564145B (zh) 2021-06-04 2021-06-04 用于胞嘧啶碱基编辑的融合蛋白及其应用

Country Status (1)

Country Link
CN (1) CN113564145B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114507683A (zh) * 2021-11-19 2022-05-17 杭州嘉因生物科技有限公司 一种敲除Kan抗性基因的SURE菌株及其构建方法和应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180179503A1 (en) * 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
CN108822217A (zh) * 2018-02-23 2018-11-16 上海科技大学 一种基因碱基编辑器
CN110423736A (zh) * 2019-08-16 2019-11-08 中国人民解放军陆军军医大学第一附属医院 碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法
CN112048493A (zh) * 2020-09-22 2020-12-08 中山大学 一种增强Cas9及其衍生蛋白介导的基因操纵系统的方法及应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180179503A1 (en) * 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
CN108822217A (zh) * 2018-02-23 2018-11-16 上海科技大学 一种基因碱基编辑器
CN110423736A (zh) * 2019-08-16 2019-11-08 中国人民解放军陆军军医大学第一附属医院 碱基编辑工具及其应用以及在真核细胞内进行宽窗口和无序列偏好性碱基编辑的方法
CN112048493A (zh) * 2020-09-22 2020-12-08 中山大学 一种增强Cas9及其衍生蛋白介导的基因操纵系统的方法及应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李广栋等: "单碱基水平上胞嘧啶碱基编辑器(CBE)的研究进展", 《畜牧兽医学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114507683A (zh) * 2021-11-19 2022-05-17 杭州嘉因生物科技有限公司 一种敲除Kan抗性基因的SURE菌株及其构建方法和应用

Also Published As

Publication number Publication date
CN113564145B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
US10781432B1 (en) Engineered cascade components and cascade complexes
JP2022512982A (ja) 新規なCRISPR/Cas12f酵素およびシステム
EP3744844A1 (en) Extended single guide rna and use thereof
JP2022518329A (ja) CRISPR-Cas12j酵素およびシステム
CA3009727A1 (en) Compositions and methods for the treatment of hemoglobinopathies
JP6965466B2 (ja) 操作されたカスケード構成要素およびカスケード複合体
CN109929839B (zh) 拆分型单碱基基因编辑系统及其应用
CN112159801B (zh) SlugCas9-HF蛋白、含有SlugCas9-HF蛋白的基因编辑系统及应用
EP3954774A1 (en) Rna site-directed editing using artificially constructed rna editing enzymes and related uses
JP7361109B2 (ja) C2c1ヌクレアーゼに基づくゲノム編集のためのシステムおよび方法
CN113564145A (zh) 用于胞嘧啶碱基编辑的融合蛋白及其应用
CN110551762B (zh) CRISPR/ShaCas9基因编辑系统及其应用
US20220162648A1 (en) Compositions and methods for improved gene editing
KR102151064B1 (ko) 매칭된 5&#39; 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
CN110499335B (zh) CRISPR/SauriCas9基因编辑系统及其应用
CN114560946A (zh) 无pam限制的腺嘌呤单碱基编辑产品、方法和应用
KR20200135225A (ko) 단일염기 치환 단백질 및 이를 포함하는 조성물
JP2010522549A (ja) 目的のポリヌクレオチドの発現を増強するためのポリヌクレオチド
CN114990093A (zh) 氨基酸序列小的蛋白序列mini rfx-cas13d
CN110577972B (zh) CRISPR/Sa-ShaCas9基因编辑系统及其应用
CN110551763B (zh) CRISPR/SlutCas9基因编辑系统及其应用
CN116217733A (zh) 编辑碱基的融合蛋白及其应用
CN110577970B (zh) CRISPR/Sa-SlutCas9基因编辑系统及其应用
WO2019028686A1 (zh) 基因敲除方法
CN115703842A (zh) 高效率高精度的胞嘧啶c到鸟嘌呤g转变的碱基编辑器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant