CN117965505A - 工程化的腺苷脱氨酶及碱基编辑器 - Google Patents

工程化的腺苷脱氨酶及碱基编辑器 Download PDF

Info

Publication number
CN117965505A
CN117965505A CN202410206824.8A CN202410206824A CN117965505A CN 117965505 A CN117965505 A CN 117965505A CN 202410206824 A CN202410206824 A CN 202410206824A CN 117965505 A CN117965505 A CN 117965505A
Authority
CN
China
Prior art keywords
amino acid
acid sequence
adenosine deaminase
seq
nls
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410206824.8A
Other languages
English (en)
Inventor
陈柏洪
胡洋
余宇霖
林少芸
谭文琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microlight Gene Suzhou Co ltd
Original Assignee
Microlight Gene Suzhou Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microlight Gene Suzhou Co ltd filed Critical Microlight Gene Suzhou Co ltd
Priority to CN202410206824.8A priority Critical patent/CN117965505A/zh
Publication of CN117965505A publication Critical patent/CN117965505A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04004Adenosine deaminase (3.5.4.4)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本文公开了工程化的腺苷脱氨酶、基于这些腺苷脱氨酶的碱基编辑器以及包含这些碱基编辑器的复合物。所述腺苷脱氨酶及碱基编辑器显示出良好的腺嘌呤编辑效果,实现DNA水平A·T碱基对向G·C碱基对的转变。

Description

工程化的腺苷脱氨酶及碱基编辑器
本申请是申请号为202310776962.5、申请日为2023年6月28日、发明名称为“工程化的腺苷脱氨酶及碱基编辑器”的发明专利申请的分案申请。
技术领域
本公开涉及工程化的腺苷脱氨酶、基于这些腺苷脱氨酶的碱基编辑器以及包含这些碱基编辑器的复合物。本公开还涉及编码工程化的腺苷脱氨酶的多核苷酸、密码子优化的多核苷酸、包含这些核苷酸的载体以及包含这些载体的细胞。本公开还涉及包含所述碱基编辑器、复合物、载体或细胞的药物组合物,以及使用所述碱基编辑器、复合物、载体、细胞或药物组合物治疗疾病的方法和用途。
背景技术
2016年,科学家首次基于CRISPR-Cas9系统结合化学生物学和基因编辑的方法,开发出单碱基编辑(BE)技术,可以在不产生DNA双链断裂(double strand breaks,DsBs)的情况下精确实现单个碱基的转换,从而有效地规避了由于双链DNA断裂后非同源末端连接修复(non-homologous end joining,NHEJ)和同源重组修复(homology directed repair,HDR)所带来的基因编辑技术的不足。随后,科学家开发出基于E.coli TadA(ecTadA)的新型单碱基编辑器——腺嘌呤单碱基编辑技术(adenine base editor,ABE),实现了靶位点A到G和互补链的T到C的精确转换。目前,ABE系统在基础生物学和医学领域应用广泛,主要体现在以下几个方面:(1)实现非分裂细胞的精准编辑;(2)基因功能筛选;(3)提前终止密码子的创建和纠正;(4)保守功能氨基酸的鉴定;(5)剪接位点变体的创建;(6)加速单个碱基位点处的功能缺失或功能获得性研究;(7)单碱基突变引起的遗传性疾病的临床治疗及基础理论研究。
目前的腺嘌呤碱基编辑器(ABE),由RNA引导的Cas蛋白与作用于单链DNA(ssDNA)的腺苷脱氨酶融合而成。当融合蛋白在引导RNA(如sgRNA)的引导下靶向基因组DNA时,腺苷脱氨酶可结合到ssDNA上,将特定位置的腺嘌呤(A)脱氨变成肌苷(I),I在DNA水平会被当做G进行读码与复制,最终实现A·T碱基对至G·C碱基对的直接替换。目前的ABE7.10和miniABEmax,需要较长时间才能完成反应,效率都很低,运行缓慢;科学家在ABE7.10的基础上进一步改进,得到包含单个脱氨酶结构(TadA-8e)而能同时对多个腺嘌呤进行脱氨的ABE8e。但是,目前此类能高效对多个腺嘌呤进行脱氨的腺苷脱氨酶和碱基编辑器种类较少,限制了其在商业上的应用。
发明内容
本发明的一个方面提供一种腺苷脱氨酶,其相对于SEQ ID NO:1所示序列在以下位点中的一个、多个或全部具有氨基酸取代:W23、Y36、P48、H51、L84、A106、D108、V109、K110、T111、D119、G122、H123、S146、F149、R152、H156、K157、E168和E169,并且其氨基酸序列与SEQ ID NO:1所示序列具有约70%至约99.5%的序列同一性。
本发明的一个方面提供一种腺苷脱氨酶,其包含选自SEQ ID NO:2至10任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列。
本发明的一个方面提供一种腺苷脱氨酶,其相对于SEQ ID NO:12所示序列在以下位点中的一个、多个或全部具有氨基酸取代:E22、T47、L83、A105、D107、F108、T110、D118、R121、S145、F148、R151、E154、K156、V167和E168,并且其氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99.5%的序列同一性。
本发明的一个方面提供一种腺苷脱氨酶,其包含选自SEQ ID NO:13至16任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列。
本发明的一个方面提供一种腺苷脱氨酶,其相对于SEQ ID NO:17所示序列在以下位点中的一个、多个或全部具有氨基酸取代:W22、Q35、P47、Y50、L83、A105、D107、E108、T110、D118、G121、H122、S145、F148、R151、E154、K155和K156,并且其氨基酸序列与SEQ IDNO:17所示序列具有约70%至约99.5%的序列同一性。
本发明的一个方面提供一种腺苷脱氨酶,其包含选自SEQ ID NO:18至21任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列。
本发明的一个方面提供一种碱基编辑器,其包含本发明提供的任何一种腺苷脱氨酶;以及所述碱基编辑器与引导RNA形成的复合物。
本发明的其他方面提供编码本发明提供的任何一种腺苷脱氨酶或碱基编辑器的多核苷酸;包含所述多核苷酸的载体;包含所述载体的细胞;以及包含所述碱基编辑器、所述复合物、所述载体或所述细胞的药物组合物。
本发明还提供了使用本发明提供的任何一种腺苷脱氨酶或碱基编辑器的多核苷酸;包含所述多核苷酸的载体;包含所述载体的细胞;或包含所述碱基编辑器、所述复合物、所述载体或所述细胞的药物组合物治疗疾病的方法。
本发明还提供了本发明提供的任何一种腺苷脱氨酶或碱基编辑器的多核苷酸;包含所述多核苷酸的载体;包含所述载体的细胞;或包含所述碱基编辑器、所述复合物、所述载体或所述细胞的药物组合物在制备治疗疾病中的药物中的应用。
本发明还提供了用于治疗疾病的本发明提供的任何一种腺苷脱氨酶或碱基编辑器的多核苷酸;包含所述多核苷酸的载体;包含所述载体的细胞;或包含所述碱基编辑器、所述复合物、所述载体或所述细胞的药物组合物。
附图说明
图1.通过观察大肠杆菌是否能在固体培养基上生长显示本发明的一些腺嘌呤碱基编辑器对ccdB基因的起始密码子的编辑效果。
图2.通过观察大肠杆菌是否能在固体培养基上生长显示本发明的一些腺嘌呤碱基编辑器对ccdB基因的终止密码子的编辑效果。
图3.通过测序显示本发明的一些腺嘌呤碱基编辑器对ccdB基因的起始密码子的编辑效果。
图4.通过测序显示本发明的一些腺嘌呤碱基编辑器对ccdB基因的终止密码子的编辑效果。
图5.通过测序显示本发明的另一些腺嘌呤碱基编辑器对ccdB基因的起始密码子的编辑效果。
图6至10显示各种腺嘌呤碱基编辑器在293T细胞中编辑HEK2基因的测序图。
图11至15显示各种腺嘌呤碱基编辑器在293T细胞中编辑p992L基因的测序图。
图16至22显示根据本发明的实施例构建的各种碱基编辑器质粒的结构示意图。
具体实施方式
定义
本文使用的术语“碱基编辑器(BE)”是指包含能够对核酸序列(如DNA或RNA)内的碱基(如A、T、C、G或U)进行修饰的多肽的试剂。在一些实施方案中,碱基编辑器能够使核酸(例如DNA分子)内的碱基脱氨基。在腺嘌呤碱基编辑器(或称腺苷编辑器)的情况下,碱基编辑器能够使DNA中的腺嘌呤(A)脱氨基。这样的碱基编辑器可以包括与腺苷脱氨酶融合的可编程DNA结合蛋白。可编程DNA结合蛋白包括CRISPR介导的Cas效应蛋白。在一些实施方案中,碱基编辑器包含与脱氨酶融合的核酸酶非活性Cas9(dCas9),其结合核酸但不切割核酸。例如,碱基编辑器的dCas9结构域可以包括D10A和H840A突变。脓杆菌Cas9的DNA切割结构域包括两个亚结构域,即HNH核酸酶亚结构域和RuvC I亚结构域。HNH亚结构域切割与gRNA互补的链(“靶向链”,或发生编辑或脱氨基的链),而RuvC I亚结构域则切割含有PAM序列的非互补链(“非编辑链”)。RuvC I突变体D10A在靶向链中产生缺口,而HNH突变体H840A在未编辑的链上产生缺口。在本发明中,术语“碱基编辑器”是指包含腺苷脱氨酶结构域的碱基编辑器,例如腺嘌呤碱基编辑器(ABE)或胞嘧啶及腺嘌呤碱基编辑器(CABE)
术语“Cas9”或“Cas9核酸酶”或“Cas9结构域”是指CRISPR相关蛋白9或其变体,包括来自任何生物体的任何天然Cas9、任何天然Cas9等同体或其片段、来自任何生物的任何Cas9同源物、直向同源物或旁系同源物,以及任何天然存在或工程化的Cas9的任何变体。术语Cas9不限于任何具体的Cas9,可以称为“Cas9或其变体”。本文描述了示例性的Cas9蛋白。
如本文所使用的,术语“dCas9”是指核酸酶无活性的Cas9或核酸酶死亡的Cas9,或其变体,并包括来自任何生物体的任何天然存在的dCas9、任何天然存在dCas9等同体或其功能片段、来自任何生物的任何dCas9同源物、直系同源物或旁系同源物,以及任何天然存在或工程化的dCas 9变体。本文将描述示例性的dCas9蛋白。任何使Cas9核酸内切酶失活的合适突变都可以用于形成dCas9,例如野生型化脓性链球菌Cas9氨基酸序列中的D10A和H840A突变,或野生型金黄色葡萄球菌Cas9氨基酸序列中的D10A和N580A突变。
如本文所用,术语“nCas9”、“Cas9切口酶”或“Cas9缺口酶”是指仅切割靶切割位点的一条链,从而在双链DNA分子中引入缺口而不是产生双链断裂的Cas9或其变体。这可以通过在野生型Cas9中引入适当的突变来实现,以使Cas9的两个核酸内切酶之一单独活性失活。任何使Cas9核酸内切酶活性的一个失活但使另一个保持不变的合适突变都可用于形成nCas9,例如野生型化脓性链球菌Cas9氨基酸序列中的D10A或H840A突变之一,或野生型金黄色葡萄球菌Cas9氨基酸序列中的D10A突变。
术语“脱氨酶”或“脱氨酶结构域”是指对脱氨基反应进行催化的蛋白质或酶。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化核碱基腺嘌呤的水解脱氨基。在一些实施方案中,腺苷脱氨酶催化脱氧核糖核酸(DNA)中的腺嘌呤水解脱氨基为次黄嘌呤。本文提供的脱氨酶可以来自任何生物体,例如细菌。在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体的天然存在的脱氨酶的变体。在一些实施方案中,脱氨酶或脱氨酶结构域不是天然存在的。例如,在一些实施方案中,脱氨酶或脱氨酶结构域不是天然存在的,但与天然存在的脱氨酶至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。
如本文所用,术语“腺苷脱氨酶结构域”是指包含一种或多种腺苷脱氨蛋白酶的碱基编辑器内的结构域。例如,腺苷脱氨酶结构域可以包括单个腺苷脱氨蛋白酶。在其它实施方案中,腺苷脱氨酶结构域可包含第一腺苷脱氨蛋白酶和第二脱氨酶的异二聚体,例如,其中两种脱氨酶通过连接体连接。本文提供的腺苷脱氨酶(例如,工程化的腺苷脱氨化酶)可以包括将DNA中的腺苷(A)转化为肌苷(I)的酶。这种腺苷脱氨化酶可以引起A:T到G:C碱基对的转化。在一些实施方案中,腺苷脱氨酶来源于细菌,例如Mangrovibacter sp.
(如Mangrovibacter sp.MFB070)、Zophobihabitans entericus或Erwinia sp.
(如Erwinia sp.198)。
如本文所用,术语“DNA结合蛋白”或“DNA结合蛋白结构域”是指定位并结合特定靶DNA核苷酸序列(例如,基因组的基因座)的任何蛋白质。这个术语包括RNA可编程蛋白,其与一种或多种核酸分子(即,在Cas系统的情况下包括例如引导RNA)结合(例如,形成复合物),所述核酸分子引导或以其他方式编程蛋白质定位到与一种或更多种核酸分子(或其一部分或区域)互补的特定靶核苷酸序列(例如,DNA序列)。示例性的RNA可编程蛋白是CRISPR-Cas9蛋白,以及Cas9等同物、同源物、直链同源物或旁系同源物,无论是天然存在的还是非天然存在的(例如,工程化或修饰的),并且可以包括来自任何类型的CRISPR系统(例如II型、V型、VI型)的Cas9等价物,包括Cpfl(V型CRISPR-Cas系统)、C2c1(V型CRISPR-Cas系统)、C2c2(VI型CRISPR-Cas系统)、C2c3(V型CRISPR-Cass系统)、dCas9、GeoCas9、CjCas9、Cas12a、Cas12b、Cas12c、Cas12d、Cas12f、Cas12g、Cas12h、Cas12i、Cas12m、Cas13d、Cas14、Argonaute和nCas9。
本文使用的术语“有效量”是指足以引发所需生物反应的生物活性剂的量。例如,在一些实施方案中,组合物的有效量可以指足以编辑核苷酸序列(例如基因组)的靶位点的组合物的量。在一些实施方案中,本文提供的组合物的有效量,例如,包含核酸酶无活性的可编程DNA结合蛋白结构域、脱氨酶结构域、gRNA的组合物,可以指足以诱导由碱基编辑器特异性结合和编辑的靶位点的编辑的组合物的量。在一些实施方案中,本文提供的组合物的有效量可指足以诱导编辑的组合物的量,其具有以下特征:>50%的产物纯度、<5%的indel和2-8个核苷酸的编辑窗口。如本领域技术人员所理解的,试剂(例如组合物或碱基编辑器-gRNA复合物)的有效量可以根据各种因素而变化,包括但不限于所需的生物反应、待编辑的特定等位基因、基因组或靶位点、待靶向的细胞或组织和/或所使用的碱基编辑器。
本文所用的术语“融合蛋白”是指包含至少两种蛋白质的蛋白质结构域的杂交多肽。一种蛋白质可能位于融合蛋白的氨基末端(N-末端)部分或羧基末端(C-末端)。本文提供的任何蛋白质都可以通过本领域已知的任何方法生产。例如,本文提供的蛋白质可以通过重组蛋白质表达和纯化生产,这特别适用于包含肽接头的融合蛋白。
本文中使用的术语“连接体”或“接头”是指连接两个分子或结构域的化学基团或分子,例如连接dCas9和脱氨酶的连接体。通常,连接体位于两个基团、分子或其他结构域之间或两侧,并通过共价键相互连接,从而连接两者。在一些实施方案中,连接体是一种氨基酸或多种氨基酸(例如肽或蛋白质)。在一些实施方案中,连接体是有机分子、基团、聚合物或化学结构域。化学基团包括但不限于二硫化物、腙和叠氮化物结构域。在一些实施方案中,接头的长度为5-100个氨基酸,例如,长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200个氨基酸。也可以考虑更长或更短的连接体。在一些实施方案中,所述连接体是XTEN连接体。在一些实施方案中,连接体是由甘氨酸和丝氨酸构成的32个氨基酸的连接体。在其它实施方案中,连接体是由甘氨酸和丝氨酸构成的30、31、33或34个氨基酸的连接体。
“非天然的”或“工程化的”这两个术语可以互换使用,表示人工参与,当提及核酸分子或多肽(例如脱氨酶)时,意指核酸分子或肽至少基本上不含它们在自然界中天然结合和/或在自然界中发现的至少一种其它组分(例如,在自然界中未发现的氨基酸序列)。
术语“可编程DNA结合蛋白”是指可以与一个或多个核酸分子结合(例如,形成复合物)并指导或以其他方式编程蛋白质定位到特异性靶核苷酸序列(例如,基因组的基因座)的任何蛋白质,该核酸分子与与该蛋白相关的一个或多个核酸分子(或其一部分或区域)互补,从而使蛋白质在特异性靶位点与核苷酸序列结合。示例性的可编程DNA结合蛋白包括CRISPR-Cas9蛋白及其功能性变体。
核定位信号或序列(NLS)是一种标记、指定或以其他方式标记蛋白质以通过核转运输入细胞核的氨基酸序列。通常,该信号由暴露在蛋白质表面的带正电荷的赖氨酸或精氨酸的一个或多个短序列组成。不同的核定位蛋白可能共享相同的NLS。NLS具有与核输出信号(NES)相反的功能,后者靶向细胞核外的蛋白质。因此,单个细胞核定位信号可以将与其相关联的实体引导到细胞的细胞核。这样的序列可以是任何大小和组成,例如超过25、25、15、12、10、8、7、6、5或4个氨基酸。
本文中使用的术语“对象”或“受试者”是指个体生物体,例如个体哺乳动物。在一些实施例中,对象是人。
如本文所用,术语“变体”是指与所参考的对象相比具有变化但仍保留至少一种功能或特性(如结合、相互作用和/或酶活性)的对象等同体。“变体”与参考对象(例如野生型蛋白)可至少约70%相同、至少约80%相同、至少大约90%相同、至少大致95%相同、至少至少大约96%相同、至少大体97%相同、至少基本98%相同、至少99%相同、至少99.5%相同或至少约99.9%相同。例如,与野生型Cas9氨基酸序列相比,Cas9的变体可以包括在氨基酸残基上具有一个或多个变化的Cas9。作为另一个例子,脱氨酶的变体可以包括与野生型脱氨酶氨基酸序列相比具有一个或多个氨基酸残基变化的脱氨酶。这些变化包括化学修饰,例如不同氨基酸残基的取代、截短、共价连接标签和任何其他突变。该术语也包括野生型蛋白质的片段。该特性或功能的保留水平或程度可以相对于野生型蛋白质降低或提高,但通常是相同或相似的。通常,变体总体上非常相似,并且在许多区域中与本文所述的蛋白质的氨基酸序列相同。变体蛋白可以包含与例如野生型蛋白的氨基酸序列或本文提供的任何蛋白(例如腺嘌呤碱基编辑器的腺苷脱氨酶结构域)至少80%、85%、90%、95%、96%、97%、98%、99%或100%相同的氨基酸序列,或由其组成。对于多核苷酸分子,其变体包括在严格的杂交条件下与该多核苷酸分子的互补物杂交的多核苷酸分子,所述严格的杂交条件例如是约45℃、6x氯化钠/柠檬酸钠(SSC)中过滤结合的DNA,随后在约50-65℃再0.2xSSC、0.1%SDS中洗涤一次或多次。
具有与参考氨基酸序列具有至少例如是95%“同一性”的氨基酸序列的多肽,是指该多肽的氨基酸序列与参考序列相比,可以在该多肽的氨基酸序列的每100个氨基酸中包括至多5个氨基酸改变。换言之,为了获得具有与参考氨基酸序列至少95%相同的氨基酸序列的多肽,可以插入、删除或取代参考序列中高达5%的氨基酸残基。参考序列的这些改变可以发生在参考氨基酸序列的氨基或羧基末端位置处,或者发生在这些末端位置之间的任何地方,或者单独地散布在参考序列中的残基之间,或者在参考序列内的一个或多个连续残基中。
任何特定的多肽是否与参考蛋白的氨基酸序列(例如本发明的示例性的脱氨酶中的任何一个)至少80%、85%、90%、95%、96%、97%、98%或99%相同,可以使用已知的计算机程序常规地确定。用于确定查询序列(例如本发明的脱氨酶序列)和主题序列之间的最佳总体匹配(也称为全局序列比对)的优选方法,可以使用FASTDB计算机程序,其基于Brutlag等人在(Comp.App.Biosci.6:237-245(1990))中描述的算法。在序列比对中,查询序列和主题序列可以是核苷酸序列或者氨基酸序列。所述全局序列比对的结果表示为同一性百分比。FASTDB氨基酸比对中使用的优选参数为:Matrix=PAM 0,k-tupie=2,MismatchPenalty=1,Joining Penalty=20,Randomization Group Length=0,Cutoff Score=1,Window Size=sequence length,Gap Penalty=5,Gap Size Penalty=0.05,WindowSize=500与主题氨基酸序列的长度中择其短者。如果主题序列比查询序列短是由于N或C端缺失,而不是因为内部缺失,则必须对结果进行手动更正。这是因为FASTDB程序在计算全局同一性百分比时没有考虑主题序列的N端和C端截短。对于在N端和C端被截短的主题序列,相对于查询序列,通过计算作为主题序列的N端和C-端的查询序列的未与相应主题残基匹配/对齐的残基的数量作为查询序列的总碱基的百分比来校正同一性百分比。残基是否匹配/对齐由FASTDB序列比对的结果来确定。然后从上述FASTDB程序使用指定参数计算的同一性百分比中减去该百分比,得出最终的同一性百分比分数。这个最终的同一性百分比分数是用于本发明目的的分数。对于手动调整同一性百分比分数,只考虑与查询序列不匹配/对齐的主题序列的N-和C-末端的残基。也就是说,只查询主题序列的最远N端和C端残基之外的残基位置。
如本文所用,术语“野生型”是本领域技术人员所理解的术语,是指在自然界中出现的生物体、菌株、基因或特征的典型形式,与突变或变体形式不同。
腺苷脱氨酶
本发明的一个方面提供腺苷脱氨酶。
在一些实施方式中,本发明提供一种腺苷脱氨酶,其相对于SEQ ID NO:1所示序列在以下位点中的一个、多个或全部具有氨基酸取代:W23、Y36、P48、H51、L84、A106、D108、V109、K110、T111、D119、G122、H123、S146、F149、R152、H156、K157、E168和E169,并且其氨基酸序列与SEQ ID NO:1所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:1所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个具有氨基酸取代:W23、Y36、P48、H51、L84、A106、D108、V109、K110、T111、D119、G122、H123、S146、F149、R152、H156、K157、E168和E169,并且其氨基酸序列与SEQ ID NO:1所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:1所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个具有氨基酸取代:W23、Y36、P48、H51、L84、A106、D108、V109、K110、T111、D119、G122、H123、S146、F149、R152、H156、K157、E168和E169,并且其氨基酸序列与SEQ ID NO:1所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:1所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含选自以下取代组成的群组中的一个或多个取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:1所示序列具有约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含全部以下取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23K;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36V;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36I;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51V;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51I;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84W;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106I;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106L;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111K;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119R;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149H;R152P;H156F、H156W或H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156F;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156W;K157N;E168I;和E169N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:1所示序列上包括一个、多个或全部选自以下的取代:W23R、W23K或W23H;Y36L、Y36V、Y36I或Y36P;P48A;H51L、H51V、H51I或H51P;L84F、L84W或L84Y;A106V、A106I、A106L或A106P;D108N;V109S;K110R;T111R、T111K或T111H;D119N、D119R或D119Q;G122N;H123Y;S146C;F149Y或F149H;R152P;H156Y;K157N;E168I;和E169N。
在一些实施方式中,提供的任一腺苷脱氨酶相对于SEQ ID NO:1不含F149Q取代。
在一些实施方式中,提供的腺苷脱氨酶包含选自SEQ ID NO:2至10任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:2所示的氨基酸序列,或与SEQ ID NO:2所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:3所示的氨基酸序列,或与SEQ ID NO:3所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:4所示的氨基酸序列,或与SEQ ID NO:4所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:5所示的氨基酸序列,或与SEQ ID NO:5所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:6所示的氨基酸序列,或与SEQ ID NO:6所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:7所示的氨基酸序列,或与SEQ ID NO:7所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:8所示的氨基酸序列,或与SEQ ID NO:8所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:9所示的氨基酸序列,或与SEQ ID NO:9所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:10所示的氨基酸序列,或与SEQ ID NO:10所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:2至10任一项所示的氨基酸序列组成,或实质上由SEQ ID NO:2至10任一项所示的氨基酸序列组成。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:2所示的氨基酸序列组成,或实质上由SEQ ID NO:2所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:3所示的氨基酸序列组成,或实质上由SEQ ID NO:3所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ IDNO:4所示的氨基酸序列组成,或实质上由SEQ ID NO:4所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:5所示的氨基酸序列组成,或实质上由SEQ ID NO:5所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:6所示的氨基酸序列组成,或实质上由SEQ ID NO:6所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:7所示的氨基酸序列组成,或实质上由SEQ ID NO:7所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:8所示的氨基酸序列组成,或实质上由SEQ ID NO:8所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:9所示的氨基酸序列组成,或实质上由SEQ ID NO:9所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:10所示的氨基酸序列组成,或实质上由SEQID NO:10所示的氨基酸序列组成。在一些实施方式中,本发明提供一种腺苷脱氨酶,其相对于SEQ ID NO:12所示序列在以下位点中的一个、多个或全部具有氨基酸取代:E22、T47、L83、A105、D107、F108、T110、D118、R121、S145、F148、R151、E154、K156、V167和E168,并且其氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:12所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15或16个具有氨基酸取代:E22、T47、L83、A105、D107、F108、T110、D118、R121、S145、F148、R151、E154、K156、V167和E168,并且其氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:12所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15或16个具有氨基酸取代:E22、T47、L83、A105、D107、F108、T110、D118、R121、S145、F148、R151、E154、K156、V167和E168,并且其氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含选自以下取代组成的群组中的一个或多个取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:12所示序列具有约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含全部以下取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22K;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83W;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105I;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105L;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108I;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108L;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110K;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110H;D118N;R121N;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154V;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154I;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154L;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:12所示序列上包括一个、多个或全部选自以下的取代:E22R、E22K和E22H;T47A;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;F108V、F108I、F108L和F108P;T110R、T110K和T110H;D118N;R121N;S145C;F148Y;R151P;E154P;K156N;V167I;和E168N。
在一些实施方式中,提供的腺苷脱氨酶包含选自SEQ ID NO:13至16任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:13所示的氨基酸序列,或与SEQ ID NO:13所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:14所示的氨基酸序列,或与SEQ ID NO:14所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:15所示的氨基酸序列,或与SEQ ID NO:15所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:16所示的氨基酸序列,或与SEQ ID NO:16所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:13至16任一项所示的氨基酸序列组成,或实质上由SEQ ID NO:13至16任一项所示的氨基酸序列组成。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:13所示的氨基酸序列组成,或实质上由SEQ ID NO:13所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:14所示的氨基酸序列组成,或实质上由SEQ ID NO:14所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ IDNO:15所示的氨基酸序列组成,或实质上由SEQ ID NO:15所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:16所示的氨基酸序列组成,或实质上由SEQ ID NO:16所示的氨基酸序列组成。
在一些实施方式中,本发明提供一种腺苷脱氨酶,其相对于SEQ ID NO:17所示序列在以下位点中的一个、多个或全部具有氨基酸取代:W22、Q35、P47、Y50、L83、A105、D107、E108、T110、D118、G121、H122、S145、F148、R151、E154、K155和K156,并且其氨基酸序列与SEQID NO:17所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:17所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个具有氨基酸取代:W22、Q35、P47、Y50、L83、A105、D107、E108、T110、D118、G121、H122、S145、F148、R151、E154、K155和K156,并且其氨基酸序列与SEQ ID NO:17所示序列具有约70%至约99.5%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶相对于SEQ ID NO:17所示序列在以下位点中的1个、2个、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个具有氨基酸取代:W22、Q35、P47、Y50、L83、A105、D107、E108、T110、D118、G121、H122、S145、F148、R151、E154、K155和K156,并且其氨基酸序列与SEQ ID NO:17所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:17所示序列具有约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约70%至约95%、约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含选自以下取代组成的群组中的一个或多个取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列与SEQ ID NO:17所示序列具有约70%至约90%、约70%至约89%、约70%至约88%、约70%至约87%、约70%至约86%、约70%至约85%、约70%至约84%、约70%至约83%、约70%至约82%、约70%至约81%、约70%至约80%、约70%至约75%的序列同一性,并且包含全部以下取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22K;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35V;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35I;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50V;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50I;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83W;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105I;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105L;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110K;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154I;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154L;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154P;K155F、K155W和K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155F;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155W;和K156N。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列为在SEQ ID NO:17所示序列上包括一个、多个或全部选自以下的取代:W22R、W22K和W22H;Q35L、Q35V、Q35I和Q35P;P47A;Y50L、Y50V、Y50I和Y50P;L83F、L83W和L83Y;A105V、A105I、A105L和A105P;D107N;E108S;T110R、T110K和T110H;D118N;G121N;H122Y;S145C;F148Y;R151P;E154V、E154I、E154L和E154P;K155Y;和K156N。
在一些实施方式中,提供的腺苷脱氨酶包含选自SEQ ID NO:18至21任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:18所示的氨基酸序列,或与SEQ ID NO:18所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:19所示的氨基酸序列,或与SEQ ID NO:19所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:20所示的氨基酸序列,或与SEQ ID NO:20所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,提供的腺苷脱氨酶包含SEQ ID NO:21所示的氨基酸序列,或与SEQ ID NO:21所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:18至21任一项所示的氨基酸序列组成,或实质上由SEQ ID NO:18至21任一项所示的氨基酸序列组成。
在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:18所示的氨基酸序列组成,或实质上由SEQ ID NO:18所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:19所示的氨基酸序列组成,或实质上由SEQ ID NO:19所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ IDNO:20所示的氨基酸序列组成,或实质上由SEQ ID NO:20所示的氨基酸序列组成。在一些实施方式中,提供的腺苷脱氨酶的氨基酸序列由SEQ ID NO:21所示的氨基酸序列组成,或实质上由SEQ ID NO:21所示的氨基酸序列组成。
如本领域技术人员可以意识到的,本发明提供的任何一个腺苷脱氨酶可以是独立的,或者与其他部分共价结合从而以腺苷脱氨酶结构域形式出现,该腺苷脱氨酶结构域与所述其他部分一起构成包含该腺苷脱氨酶结构域的分子,例如碱基编辑器。本文所使用的术语“腺苷脱氨酶”意在包括该腺苷脱氨酶结构域形式。腺苷脱氨酶结构域可是通过在N端、C端或两者之间的任何位置中的一个、多个或全部共价连接至其他部分。例如,腺苷脱氨酶的N端共价连接至核定位序列的C端(例如通过腺苷脱氨酶最N端的氨基酸残基的-NH2与核定位序列的最C端的氨基酸残基的-COOH形成肽键),而腺苷脱氨酶的C端可保持游离状态(即包含游离-COOH)。又例如,腺苷脱氨酶的C端共价连接至核定位序列的N端(例如通过-NH2与-COOH形成肽键),而腺苷脱氨酶的N端可保持游离状态(即包含游离-NH2)。又例如,腺苷脱氨酶的N端共价连接至核定位序列的C端,腺苷脱氨酶的C端共价连接至DNA结合蛋白的N端。因此,本发明提供的任何一个腺苷脱氨酶可被包括在更大的蛋白分子中而形成腺苷脱氨酶结构域,其保留腺苷脱氨酶活性并与所述其他结构域一起使所述更大的蛋白分子中发挥功能,例如碱基编辑功能。下文将更详细描述。
碱基编辑器
本发明的另一个方面提供碱基编辑器。
在一些实施方式中,本发明提供一种碱基编辑器,其包含本发明以上任何一种腺苷脱氨酶。在一些实施方式中,所述碱基编辑器是腺嘌呤碱基编辑器。在另一些实施方式中,所述碱基编辑器是腺嘌呤及胞嘧啶碱基编辑器,其同时包含腺苷脱氨酶和胞苷脱氨酶,从而实现腺嘌呤和胞嘧啶的同时编辑。在本发明中,碱基编辑器在细胞中以融合蛋白形式起作用。
因此,在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,该腺苷脱氨酶结构域由本发明以上任何一种腺苷脱氨酶形成。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含选自SEQ ID NO:2至10、13至16以及18至21中的任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:1、12或17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含选自SEQ ID NO:2至10、13至16以及18至21中的任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:1、12或17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:2所示的氨基酸序列或与SEQ ID NO:2所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:3所示的氨基酸序列或与SEQ ID NO:3所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:4所示的氨基酸序列或与SEQ ID NO:4所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:5所示的氨基酸序列或与SEQ ID NO:5所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:6所示的氨基酸序列或与SEQ ID NO:6所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:7所示的氨基酸序列或与SEQ ID NO:7所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:8所示的氨基酸序列或与SEQ ID NO:8所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:9所示的氨基酸序列或与SEQ ID NO:9所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:10所示的氨基酸序列或与SEQ ID NO:10所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:1所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:13所示的氨基酸序列或与SEQ ID NO:13所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:14所示的氨基酸序列或与SEQ ID NO:14所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:15所示的氨基酸序列或与SEQ ID NO:15所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:16所示的氨基酸序列或与SEQ ID NO:16所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:12所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:18所示的氨基酸序列或与SEQ ID NO:18所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:19所示的氨基酸序列或与SEQ ID NO:19所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:20所示的氨基酸序列或与SEQ ID NO:20所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含SEQ ID NO:21所示的氨基酸序列或与SEQ ID NO:21所示的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述腺苷脱氨酶的氨基酸序列不是SEQ ID NO:17所示的序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含第一脱氨酶结构域与第二脱氨酶结构域的异聚体,所述第一脱氨酶结构域包含选自SEQ ID NO:2至10、13至16以及18至21中的任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述第一腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:1、12或17所示的序列;所述第二脱氨酶结构域包含选自SEQ ID NO:1、12和17中的任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含第一脱氨酶结构域与第二脱氨酶结构域的异聚体,所述第一脱氨酶结构域包含选自SEQ ID NO:2至10任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述第一腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:1所示的序列;所述第二脱氨酶结构域包含SEQ ID NO:1所示的氨基酸序列或与SEQ ID NO:1具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含第一脱氨酶结构域与第二脱氨酶结构域的异聚体,所述第一脱氨酶结构域包含选自SEQ ID NO:13至16任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述第一腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:12所示的序列;所述第二脱氨酶结构域包含SEQ ID NO:12所示的氨基酸序列或与SEQ ID NO:12具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列。
在一些实施方式中,本发明提供一种碱基编辑器,其包含腺苷脱氨酶结构域,所述腺苷脱氨酶结构域包含第一脱氨酶结构域与第二脱氨酶结构域的异聚体,所述第一脱氨酶结构域包含选自SEQ ID NO:18至21任一项所示的氨基酸序列或与它们各自具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,条件是所述第一腺苷脱氨酶结构域的氨基酸序列不是SEQ ID NO:17所示的序列;所述第二脱氨酶结构域包含SEQ ID NO:17所示的氨基酸序列或与SEQ ID NO:12具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列。
在一些实施方式中,在上述任一碱基编辑器的实施方式中,所述碱基编辑器包含可编程DNA结合结构域。在这样的实施方式中,所述可编程DNA结合结构域可以是CRISPR相关核酸酶。示例性的CRISPR相关核酸酶包括Cas9核酸酶及其任何变体。在各种实施方案中,可编程DNA结合结构域具有切口酶活性,即仅切割靶DNA序列的一条链(如nCas9)。在其他实施方案中,所述可编程DNA结合结构域具有非活性核酸酶,例如,“死”蛋白(如dCas9)。本文所述的碱基编辑器也可包含Cas9等同物,包括Cas12a、Cas12b、Cas12f、Cas12i和Cas12m蛋白。本文中使用的可编程DNA结合结构域(例如,SpCas9、SaCas9、SaCas9变体或SpCas9变体)也可以包含改变/增强其PAM特异性的各种修饰。本公开涉及与参考Cas9序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.9%序列同一性的任何Cas9、Cas9变体或Cas9等效物,所述参考序列例如是SEQ ID NO:22或23中所示的dCas9和nCas9核酸酶。
在一些实施方案中,可编程DNA结合结构域可以包含多于一种的可编程DNA结合蛋白。因此,在一些实施方案中,上述任一碱基编辑器可以包含第一可编程DNA结合结构域和第二可编程DNA结合结构域。在一些实施方案中,所述可编程DNA结合结构域(或分别为所述第一和第二可编程DNA结合结构域)包含第一Cas同源物或变体和第二Cas同源体或变体(例如,第一Cas变体包含Cas9-NG,而第二Cas变体包含Cas9-CP1041,例如“SpCas9-NG-CPI041”)。在一些实施方案中,第一Cas变体包括Cas9-NG,第二Cas变体包含SpCas9-VRQR。
在一些实施方式中,在上述任一碱基编辑器的实施方式中,所述碱基编辑器包含一个或多个核定位序列(或称核定位信号)。在一些实施方式中,所述碱基编辑器包含一个核定位序列(NLS)。在另一些实施方式中,所述碱基编辑器包含两个核定位序列。在另一些实施方式中,每个所述核定位序列可已是单组分(monopartite)或双组分(bipartite)NLS。在一些实施方式中,所述碱基编辑器包含两个双组分核定位序列。
在一些实施方式中,所述核定位序列包含SEQ ID NO:32至36任一个所示的核苷酸序列或氨基酸序列。在一些实施方式中,所述核定位序列包含SEQ ID NO:32所示的核苷酸序列。在一些实施方式中,所述核定位序列包含SEQ ID NO:33所示的氨基酸序列。在一些实施方式中,所述核定位序列包含SEQ ID NO:34所示的氨基酸序列。在一些实施方式中,所述核定位序列包含SEQ ID NO:35所示的氨基酸序列。在一些实施方式中,所述核定位序列包含SEQ ID NO:36所示的氨基酸序列。
在一些实施方式中,在上述任一碱基编辑器的实施方式中,所述碱基编辑器包含胞嘧啶脱氨酶,以形成可以同时编辑胞嘧啶和腺嘌呤的碱基编辑器(CABE)。示例性的胞嘧啶脱氨酶包括AID、APOBEC3A、APOBEC1、PmCDA1、LjCDA1或其同源物。
在某些实施方案中,连接体可用于连接任何肽或肽结构域或碱基编辑器的结构域(例如,腺苷脱氨酶结构域共价连接至可编程DNA结合结构域,其又共价连接至NLS结构域)。本文所述的碱基编辑器可以包括长度为32个氨基酸的连接体。在一些实施方案中,连接体能连接Cas9与脱氨酶。在一些实施方案中,连接体能连接dCas9与脱氨酶。在一些实施方案中,连接体能连接nCas9与脱氨酶。连接体可位于两个基团、分子、或其它部分之间,或侧翼有两个基团、分子、或其它部分,且通过共价键或非共价交互作用彼此连结。在一些实施方案中,连接体可以是多核苷酸。在一些实施方案中,连接体可以是DNA连接序列。示例性的连接体包含如SEQ ID NO:11、26、27、37至41的任何一个所示的氨基酸序列或核苷酸序列。在一些实施方案中,所述碱基编辑器可以包含多个连接体,每个连接体相同或不同。
本公开进一步提供了根据所公开的编辑方法使用的引导RNA。本公开提供了被设计用于识别靶序列的引导RNA。这样的gRNA可以被设计为具有与靶序列内的原间隔区互补的引导序列(或“间隔区”)。还提供了与一种或多种公开的碱基编辑器一起使用的引导RNA。这样的gRNA可以被设计为具有与待编辑的靶序列内的原间隔区互补的引导序列,并且具有与任何公开的碱基编辑器的可编程DNA结合结构域(例如公开的碱基编辑的Cas9切口酶结构域)特异性相互作用的主链序列。
在一些实施方案中,引导序列的长度为约5个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、35个、40个、45个、50个、75个或更多个核苷酸。在一些实施方案中,每个gRNA包含至少与靶序列互补的10个连续核苷酸(例如,10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个连续核苷酸)。编码引导RNA的DNA序列可以是线性的也可以是环状。在一些实施方案中,核酸酶Cas9或Cas9结构域与一个或多个gRNA一起使用。
在一些实施方式中,示意性的碱基编辑器包括以下结构:
NH2-[腺苷脱氨酶结构域]-[可编程DNA结合结构域]-COOH;或
NH2-[可编程DNA结合结构域]-[腺苷脱氨酶结构域]-COOH,
其中]-[表示可任选地存在的根据上文定义的连接体(下同)。
在一些实施方式中,包含第一和第二腺苷脱氨酶的碱基编辑器的示意性结构包括:
NH2-[第一腺苷脱氨酶结构域]-[第二腺苷脱氨酶结构域]-[可编程DNA结合结构域]-COOH;
NH2-[第一腺苷脱氨酶结构域]-[可编程DNA结合结构域]-[第二腺苷脱氨酶结构域]-COOH;
NH2-[可编程DNA结合结构域]-[第一腺苷脱氨酶结构域]-[第二腺苷脱氨酶结构域]-COOH;
NH2-[第二腺苷脱氨酶结构域]-[第一腺苷脱氨酶结构域]-[可编程DNA结合结构域]-COOH;
NH2-[第二腺苷脱氨酶结构域]-[可编程DNA结合结构域]-[第一腺苷脱氨酶结构域]-COOH;和
NH2-[可编程DNA结合结构域]-[第二腺苷脱氨酶结构域]-[第一腺苷脱氨酶结构域]-COOH。
在一些实施方式中,包含NLS的碱基编辑器的示意性结构包括:
NH2-[腺苷脱氨酶结构域]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[可编程DNA结合结构域]-[腺苷脱氨酶结构域]-[NLS]-COOH;
NH2-[NLS]-[腺苷脱氨酶结构域]-[可编程DNA结合结构域]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[腺苷脱氨酶结构域]-COOH;
NH2-[NLS]-[腺苷脱氨酶结构域]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[腺苷脱氨酶结构域]-[NLS]-COOH;
NH2-[NLS]-[腺苷脱氨酶结构域]-[可编程DNA结合结构域]-[NLS]-COOH;和
NH2-[NLS]-[可编程DNA结合结构域]-[腺苷脱氨酶结构域]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[MaTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-1]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-2]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-3]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.0-3]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.1]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.1]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.2]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.2]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.3]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.3]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.4]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.4]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.5]-[可编程DNA结合结构域]-[NLS]-COOH;或
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.5]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[ZoTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTada1.0]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-1]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-2]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-3]-[可编程DNA结合结构域]-[NLS]-COOH;或
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTadA1.0-3]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[ErTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ErTada1.0]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0-1]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ErTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0-2]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ErTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0-3]-[可编程DNA结合结构域]-[NLS]-COOH;或
NH2-[NLS]-[可编程DNA结合结构域]-[ErTadA1.0-3]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[MaTadA-WT]-[MaTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0]-[MaTadA-WT]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.0]-[MaTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA-WT]-[MaTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0]-[可编程DNA结合结构域]-[MaTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[MaTadA-WT]-[MaTadA1.1]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.1]-[MaTadA-WT]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA1.1]-[MaTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[MaTadA-WT]-[MaTadA1.1]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.1]-[可编程DNA结合结构域]-[MaTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA-WT]-[ZoTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0]-[ZoTadA-WT]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTadA1.0]-[ZoTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ZoTadA-WT]-[ZoTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-1]-[可编程DNA结合结构域]-[ZoTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[ErTadA-WT]-[ErTadA1.0]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0]-[ErTadA-WT]-[可编程DNA结合结构域]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ErTadA1.0]-[ErTadA-WT]-[NLS]-COOH;
NH2-[NLS]-[可编程DNA结合结构域]-[ErTadA-WT]-[ErTadA1.0]-[NLS]-COOH;或
NH2-[NLS]-[ErTadA1.0-1]-[可编程DNA结合结构域]-[ErTadA-WT]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[MaTadA1.0]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-1]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-2]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.0-3]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.0-3]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.1]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.1]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.2]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.2]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.3]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.3]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.4]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.4]-[NLS]-COOH;
NH2-[NLS]-[MaTadA1.5]-[dCas9/nCas9]-[NLS]-COOH;或
NH2-[NLS]-[dCas9/nCas9]-[MaTadA1.5]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[ZoTadA1.0]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ZoTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-1]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ZoTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.0-2]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ZoTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[ZoTadA1.00-3]-[dCas9/nCas9]-[NLS]-COOH;或
NH2-[NLS]-[dCas9/nCas9]-[ZoTadA1.0-3]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器的示意性结构包括:
NH2-[NLS]-[ErTadA1.0]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ErTadA1.0]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0-1]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ErTadA1.0-1]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.0-2]-[dCas9/nCas9]-[NLS]-COOH;
NH2-[NLS]-[dCas9/nCas9]-[ErTadA1.0-2]-[NLS]-COOH;
NH2-[NLS]-[ErTadA1.00-3]-[dCas9/nCas9]-[NLS]-COOH;或
NH2-[NLS]-[dCas9/nCas9]-[ErTadA1.0-3]-[NLS]-COOH。
在具体的实施方式中,本发明提供的碱基编辑器可包含如SEQ ID NO:46至54的任一个所示的氨基酸序列,或与SEQ ID NO:46至54的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由所述任何一个氨基酸序列组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:46所示的氨基酸序列或与SEQ ID NO:46的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:47所示的氨基酸序列或与SEQ ID NO:47的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:48所示的氨基酸序列或与SEQ ID NO:48的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:49所示的氨基酸序列或与SEQ ID NO:49的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:50所示的氨基酸序列或与SEQ ID NO:50的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:51所示的氨基酸序列或与SEQ ID NO:51的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:52所示的氨基酸序列或与SEQ ID NO:52的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:53所示的氨基酸序列或与SEQ ID NO:53的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
在一些实施方式中,本发明提供的碱基编辑器包含如SEQ ID NO:54所示的氨基酸序列或与SEQ ID NO:54的氨基酸序列具有至少约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%的序列同一性的氨基酸序列,或实质上由其组成。
多核苷酸、载体、细胞
本发明的另一个方面提供编码本发明提供的腺苷脱氨酶或包含所述腺苷脱氨酶的碱基编辑器的多核苷酸。
在一些实施方式中,所述编码腺苷脱氨酶的多核苷酸是DNA或RNA序列。在一些实施方式中,所述多核苷酸是密码子优化的,例如用于在真核细胞(例如人细胞)中表达。
示例性的编码本发明的腺苷脱氨酶的多核苷酸的序列包含SEQ ID NO:24、25、28至31中的任何一个所述的核酸序列。
本发明的另一个方面提供载体,其包含上述任何一个多核苷酸,特别是编码本发明的任何一个碱基编辑器的多核苷酸。载体可以被设计为克隆和/或表达本发明的碱基编辑器。载体还可以被设计成将本发明的腺嘌呤碱基编辑器转染到一个或多个细胞中,例如靶病变真核细胞中,用于用本文发明的碱基编辑器和方法进行治疗。载体可以被设计用于在原核或真核细胞中表达碱基编辑转录物(例如核酸转录物、蛋白质或酶)。例如,碱基编辑器转录物可以在细菌细胞如大肠杆菌、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、植物细胞或哺乳动物细胞中表达。或者,编码本文所述的一种或多种碱基编辑器的表达载体可以在体外转录和翻译,例如使用T7启动子调控序列和T7聚合酶。
载体可以被引入到原核细胞中并在其中复制。在一些实施方案中,原核生物用于扩增将被引入真核细胞的载体的拷贝,或用于生产将被引入到真核细胞中的载体的中间载体(例如扩增质粒作为病毒载体包装系统的一部分)。在一些实施方案中,原核生物用于扩增载体的拷贝并表达一个或多个核酸,例如提供一种或多种蛋白质的来源以递送至宿主细胞或宿主生物体。蛋白质在原核生物中的表达通常在大肠杆菌中用含有组成型或诱导型启动子的载体进行。
在一些实施方案中,载体能够使用哺乳动物表达载体驱动一个或多个序列在哺乳动物细胞中的表达。哺乳动物表达载体的实例包括pCDM8和pMT2PC。当在哺乳动物细胞中使用时,表达载体的控制功能通常由一种或多种调节元件提供。例如,常用的启动子来源于多瘤病毒、腺病毒2、巨细胞病毒、猴病毒40,以及本领域已知的其它启动子。
本发明的一些实施例提供了包含本文提供的任何碱基编辑器或复合体的细胞。在一些实施方案中,细胞包含编码本文提供的任何碱基编辑器的核苷酸构建体。在一些实施方案中,细胞包括本文提供的任何核苷酸或载体。在一些实施方案中,所述细胞是干细胞。在一些实施方案中,细胞是人干细胞,例如人干和祖细胞(HSPC)。在一些实施方案中,所述细胞是激活的(例如plerixafor激活的)外周血HSPC。
在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染宿主细胞。在一些实施方案中,细胞在受试者中自然地被转染。在一些实施方案中,被转染的细胞取自受试者。在一些实施方案中,细胞来源于取自受试者的细胞,例如细胞系。本领域已知多种用于组织培养的细胞系。在一些实施方案中,从受试者身上取出细胞,并与任何公开的碱基编辑器、复合物、载体或多核苷酸进行体外接触。
药物组合物、治疗方法、用途
本发明的另一个方面提供了用于治疗被诊断患有与点突变相关或由点突变引起的疾病的受试者的方法,所述点突变可以通过本文提供的碱基编辑器来校正。例如,在一些实施例中,提供了一种方法,包括向患有这种疾病的受试者(例如,与如上所述的点突变相关联的癌症)施用有效量的腺苷碱基编辑器,该编辑器纠正点突变或将失活突变引入疾病相关基因。在一些实施方案中,该疾病是增殖性疾病。在一些实施方案中,该疾病是遗传性疾病。在一些实施方案中,该疾病是肿瘤性疾病。在一些实施方案中,该疾病是一种代谢性疾病。在一些实施方案中,该疾病是溶酶体贮积病。可以通过校正点突变或将失活突变引入疾病相关基因中来治疗的其他疾病将是本领域技术人员已知的。
在一些实施方案中,突变的A的脱氨作用导致编码野生型氨基酸的密码子。在一些实施方案中,接触是在受试者体内进行的。在一些实施方案中,受试者已经或已经被诊断患有疾病或病症。在一些实施方案中,所述疾病或病症是血红蛋白病。在一些实施方案中,所述疾病或病症是镰状细胞病。在一些实施方案中,该疾病或病症是地中海贫血。在一些实施方案中,该疾病或病症是与葡萄糖-6-磷酸酶-α(G6PC)酶中的R83C突变相关的1A型糖原储存病,以及与ATP结合盒A亚家族成员4(ABCA4)蛋白中的G1961E突变相关的Stargardt黄斑营养不良。在一些实施方案中,该疾病或病症是苯丙酮尿症、von Willebrand病(vWD)、与突变PTEN或BRCA1相关的肿瘤性疾病或Li-Fraumeni综合征。
一些实施例提供了使用本文提供的碱基编辑器的方法。在一些实施方案中,碱基编辑器用于通过将靶核碱基(例如A碱基)脱氨基而将点突变引入核酸。在一些实施方案中,靶核碱基的脱氨基导致遗传缺陷的校正,例如导致基因产物中引起功能丧失的点突变的校正。在一些实施方案中,本文提供的方法用于将失活点突变引入编码与疾病或病症相关的基因产物的基因或等位基因中。例如,在一些实施方案中,本文提供了使用碱基编辑器将失活点突变引入癌基因的方法(例如,在治疗增殖性疾病中)。在一些实施方案中,失活突变可以在编码序列中产生过早终止密码子,其导致截短的基因产物(例如缺乏全长蛋白功能的截短的蛋白)的表达。
在一些实施方案中,本文提供的方法的目的是通过基因组编辑恢复功能失调基因的功能。本文提供的碱基编辑器可以在体外验证用于基于基因编辑的人类治疗,例如,通过校正人类细胞培养中的疾病相关突变。本领域技术人员将理解,本文提供的碱基编辑器可用于校正任何单点G至A或C至T突变。
本发明的其他方面涉及包含本文所述的腺苷脱氨酶、碱基编辑器或碱基编辑器-gRNA复合物中的任何一种的药物组合物。本发明的其它方面涉及包含任何所述多核苷酸或载体的药物组合物,所述多核苷酸或载体包含编码本文所述腺苷脱氨酶、碱基编辑器或碱基编辑器-gRNA复合物的核酸片段。
在一些实施方案中,本文所述的任何碱基编辑器、gRNA和/或复合物作为药物组合物的一部分提供。在一些实施方案中,药物组合物包含本文提供的任何碱基编辑器。在一些实施方案中,药物组合物包含本文提供的任何复合物。在一些实施方案中,药物组合物包含gRNA、碱基编辑器和药学上可接受的赋形剂。药物组合物可以任选地包含一种或多种额外的治疗活性物质。
在一些实施方案中,本文提供的组合物被配制用于递送至受试者,例如递送至人类受试者以在受试者内实现靶向基因组修饰。在一些实施方案中,从受试者获得细胞并与本文提供的任何药物组合物接触。在一些实施方案中,任选地在细胞中实现或检测到所需的基因组修饰之后,将从受试者移除并与药物组合物离体接触的细胞重新引入受试者中。
本文所述的药物组合物的制剂可以通过药理学领域中已知的任何方法制备。通常,这种制备方法包括使活性成分与赋形剂和/或一种或多种其他辅助成分结合,然后,如果必要和/或需要,将产品成型和/或包装成所需的单剂量或多剂量单元的步骤。
在一些实施方案中,药物组合物被配制用于递送至受试者,例如用于基因编辑。施用本文所述药物组合物的合适途径包括但不限于:局部、皮下、透皮、皮内、病变内、关节内、腹膜内、膀胱内、透粘膜、牙龈、颏内、耳蜗内、经鼓室、耳内、硬膜外、鞘内、肌内、静脉内、血管内、骨内、眼周、肿瘤内、脑内和侧脑室给药。
在各种实施方案中,碱基编辑器构建体(包括分裂构建体)可以被设计用于在一个或多个rAAV载体中递送。与本文提供的任何方法和组合物相关的rAAV可以是任何血清型,包括任何衍生物或假型(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、2/1、2/5、2/8、2/9、3/1、3/5、3/8或3/9)。rAAV可以包括将被递送到细胞的遗传负载(即,表达感兴趣基因的重组核酸载体,例如由rAAV携带到细胞中的全碱基或分裂碱基编辑器)。rAAV可以是嵌合的。如本文所用,rAAV的血清型是指重组病毒衣壳蛋白的血清型。衍生物和假型的非限制性实例包括rAAV2/1、rAAV2/5、rAAV2/8、rAAV2/9、AAV2-AAV3杂合体、AAVrh.10、AAVrh.74、AAVhu.14、AAV3a/3b、AAVrh32.33、AAV-HSC15、AAV-HSC17、AAVhu.37、AAVrh.8、CHt-P6、AAV2.5、AAV6.2、AAV2i8、AAV-HSC15/17、AAVM41、AAV9.45、AAV6(Y445F/Y731F)、AAV2.5T、AAV-HAE1/2、AAV32/83、AAVShH10、AAV2(Y->F)、AAV 8(Y733F),AAV2.15、AAV2.4、AAVM41和AAVr3.45。
在各种实施方案中,所公开的编辑方法在靶核碱基对处产生至少约35%、40%、50%、60%、70%、80%、85%、90%、95%、98%或99%的靶上DNA碱基编辑效率。接触步骤可导致至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%或75%的DNA碱基编辑效率。特别地,接触的步骤导致大于75%的基于目标的编辑效率。在某些实施例中,可以实现99%的碱基编辑效率。
在一些实施方案中,所公开的碱基编辑器的编辑方法导致在一些实施例中约2.0%或更小、1.75%或更小、1.5%或更小、1.2%或更小、1%或更小、0.9%或更小、0.8%或更小、0.75%或更小、0.7%或更小、0.65%或更小或0.6%或更小的实际或平均脱靶DNA编辑频率,公开的编辑方法产生0.5%、小于0.5%、小于0.4%、小于0.35%、小于0.3%、小于0.25%、小于0.2%或小于0.1%的实际或平均脱靶DNA编辑频率。
在一些实施方案中,预期编辑的碱基对是PAM位点上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施例中,预期编辑的碱基对在PAM位点的下游。在一些实施方案中,预期编辑的碱基对是PAM位点下游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,该方法不需要正统的(例如,NGG)PAM位点。在一些实施方案中,靶区包括靶窗口,其中靶窗口包括靶核碱基对。在一些实施例中,靶窗口包括1-10个核苷酸。在一些实施方案中,靶窗口的长度为1-9、1-8、1-7、1-6、1-5、1-4、1-3、1-2或1个核苷酸。在一些实施方案中,靶窗口的长度为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施例中,预期编辑的碱基对在靶窗口内。在一些实施方案中,使用本文提供的任何碱基编辑器来执行该方法。在一些实施例中,靶窗口是脱氨基窗口。
在一些实施例中,腺嘌呤碱基编辑器的腺苷脱氨酶对活性窗口的第3、4、5、6、7、8或9位腺嘌呤A编辑效率较高,第3、4、5或6位腺嘌呤A编辑效率更高。在一些实施例中,MaTadA1.0、ZoTadA1.0、ErTadA1.0的编辑窗口为3-9位(编辑窗口更窄,特异性更高),更优选的是4-8位;其中,MaTadA1.0在真核中的编辑效率最高。
本发明的再一方面提供本文提供的腺苷脱氨酶、碱基编辑器、多核苷酸、载体、复合物、细胞或药物组合物在制备用于治疗核碱基A突变介导的疾病中的应用。本发明的再一方面还提供用于治疗核碱基A突变介导的疾病的本文提供的腺苷脱氨酶、碱基编辑器、多核苷酸、载体、复合物、细胞或药物组合物。核碱基A突变介导的疾病可以是上文所提及的任何一种可治疗的疾病。
序列表
/>
/>
/>
/>
/>
/>
/>
/>
/>
实施例
实施例1.腺苷脱氨酶在原核细胞中脱氨作用的验证(作用于ccdB的起始密码子)
1.1多个实验组和对照组碱基编辑器质粒的构建
实验组碱基编辑器质粒:包括两种,一种是将含有启动子的sgRNA-ccdB1(可靶向ccdB毒素基因反义链的起始密码子,序列为5’-CTGCATTTATGTCAGACTTG-3’,SEQ ID NO:42)构建在含有阿拉伯糖诱导启动子的ccdB毒素基因的商用载体中,ccdB和sgRNA构建得到质粒A,标记为pBR322-ccdB-sgRNA-KanaR-ATG-1-gRNA1(图16A)。另一种是分别将本发明提供的腺嘌呤脱氨酶(MaTadA1.0、ZoTadA1.0、ErTadA1.0)和dCas9通过接头构建在商用载体中,重组形成腺苷脱氨酶-dCas9的重组质粒B,分别标记为MaTadA1.0-dCas9、ZoTadA1.0-dCas9和ErTadA1.0-dCas9(图16B至D)。
对照组碱基编辑器质粒:按照上述方法,构建二种质粒,一种是将现有常规腺嘌呤脱氨酶TadA-8e和dCas9通过接头构建在商用载体中,重组形成TadA-8e-dCas9的重组质粒C,标记为TadA-8e-dCas9(图17A);另一种是将未突变的野生型蛋白(MaTadA-WT、ZoTadA-WT或ErTadA-WT)和dCas9通过接头构建在商用载体中,重组形成阴性对照质粒D,分别标记为MaTadA-WT-dCas9、ZoTadA-WT-dCas9和ErTadA-WT-dCas9(图17A至D)。
1.2上述碱基编辑器在原核系统中脱氨活性的验证
本实验采用的ccdB毒性基因检测腺苷脱氨酶的脱氨活性原理:ccdB毒性基因的表达受到AraBAD操纵子的调控:当培养环境中含有大量葡萄糖(终浓度100mM)时,ccdB的表达受到抑制;当培养环境中含有阿拉伯糖时,ccdB被诱导表达(阿拉伯糖浓度越高,表达量越高),ccdB被诱导表达后,会与DNA解旋酶相互作用,破坏宿主双链DNA的结构。
若腺嘌呤脱氨酶(MaTadA1.0、ZoTadA1.0、ErTadA1.0)有腺苷脱氨活性,dCas9在sgRNA作用下靶向结合ccdB基因的起始密码子区域,在腺苷脱氨酶脱氨作用下,其ccdB基因的反义链的起始密码子被编辑(即从原来的TAC突变为TGC),导致ccdB基因的正义链的起始密码子由ATG被编辑为ACG,使得ccdB基因的表达发生移码,无法诱导表达正确的ccdB,重组质粒表达的蛋白失去破坏宿主双链DNA结构的能力,宿主菌体能够正常繁殖;若腺嘌呤脱氨酶(MaTadA1.0、ZoTadA1.0、ErTadA1.0)没有腺苷脱氨活性,该碱基编辑器不能正常工作,宿主菌体能诱导表达正常的ccdB蛋白,其会与DNA解旋酶相互作用,破坏宿主双链DNA的结构,宿主菌体被杀死,从大肠杆菌是否生长即可判断碱基编辑器是否有脱氨作用。
本实验方案为将上述重组质粒pBR322-ccdB-sgRNA-KanaR-ATG-1-gRNA1转化到大肠杆菌感受态细胞中,形成稳定感受态株,然后分别将MaTadA1.0-dCas9、ZoTadA1.0-dCas9、ErTadA1.0-dCas9、TadA-8e-dCas9、MaTadA-WT-dCas9、ZoTadA-WT-dCas9或ErTadA-WT-dCas9转入该含有质粒的稳定感受态株中。然后将大肠杆菌涂布至含有添加了100nM的葡萄糖和不同浓度的阿拉伯糖(0nM、20nM和40nM)的含有抗生素(卡那霉素)的LB固体培养基上,37℃培养过夜,然后观察大肠杆菌是否能在固体培养基上生长,结果如图1和图3A所示。结果显示,本发明的腺嘌呤脱氨酶(MaTadA1.0、ZoTadA1.0、ErTadA1.0)和TadA-8e对ccdB基因的起始密码子有编辑效果。所有组在不添加阿拉伯糖添加葡萄糖的条件下,大肠杆菌正常生长;dCas9 control对照组、MaTadA-WT-dCas9组、ZoTadA-WT-dCas9组和ErTadA-WT-dCas9组在添加不同浓度阿拉伯糖且添加葡萄糖的条件下,均不生长,说明大肠杆菌内碱基编辑器不起作用,阿拉伯糖诱导ccdB蛋白正常表达,导致大肠杆菌死亡;TadA-8e-dCas9组、MaTadA1.0-dCas9组、ZoTadA1.0-dCas9组和ErTadA1.0-dCas9组在添加不同浓度阿拉伯糖且添加葡萄糖的条件下,均可以生长,说明碱基编辑器的腺苷脱氨酶具有脱氨作用,导致ccdB表达时移码,菌体内不产生正常的ccdB蛋白,导致大肠杆菌存活。
实施例2.其他腺嘌呤脱氨酶在原核细胞中的功能性验证
按照上述实施例1的方法验证腺嘌呤脱氨酶MaTadA1.0-1、MaTadA1.0-2、MaTadA1.0-3、ZoTadA1.0-1、ZoTadA1.0-2、ZoTadA1.0-3、ErTadA1.0-1、ErTadA1.0-2和ErTadA1.0-3与dCas9构建的ABE的碱基编辑作用(在原核细胞中编辑起始密码子区域),结果如图5A至C所示。
实施例3.腺嘌呤脱氨酶MaTadA1.0与TadA-8e在原核系统中编辑位点效率的比较(作用于ccdB的终止密码子)
3.1实验组和对照组碱基编辑器质粒的构建
实验组碱基编辑器质粒:包括两种,一种是将含有启动子的sgRNA-ccdB2(可靶向ccdB毒素基因反义链的终止密码子,序列为5’-atatagctaagatgtcacgg-3’,SEQ ID NO:43)构建在含有阿拉伯糖诱导启动子的ccdB毒素基因的商用载体中,ccdB和sgRNA构建得到质粒E,标记为pBR322-CcdB-sgRNA-KanaR-TAG-gRNA1(图18)。另一种为实施例1中步骤1.1的MaTadA1.0-dCas9(图16B)。
对照组碱基编辑器质粒:为上述实施例1中步骤1.1构建的TadA-8e-dCas9(图17A)。
3.2上述碱基编辑器在原核系统中的腺嘌呤A的脱氨作用验证(作用于ccdB的终止密码子)
本实验采用的ccdB毒性基因检测腺苷脱氨酶的脱氨活性原理:ccdB的主要活性域位于其肽链的末端的氨基酸WGI。上述实验证明:腺嘌呤脱氨酶MaTadA1.0有腺苷脱氨活性,dCas9在sgRNA作用下靶向结合ccdB基因的终止密码子区域,在腺苷脱氨酶脱氨作用下,其ccdB基因的反义链的终止密码子被编辑(即从原来的ATC突变为GTC),导致ccdB基因的正义链的终止密码子由TAG被编辑为CAG,使得ccdB基因的表达发生移码,不能正确的终止表达,无法表达正确的ccdB蛋白,重组质粒表达的蛋白失去破坏宿主双链DNA结构的能力,宿主菌体能够正常繁殖,从大肠杆菌是否生长即可判断碱基编辑器是否有脱氨作用。
本实验方案为将上述重组质粒pBR322-CcdB-sgRNA-KanaR-TAG-gRNA1转化到大肠杆菌感受态细胞中,形成稳定感受态株,然后分别将MaTadA1.0-dCas9、TadA-8e-dCas9转入该含有质粒的稳定感受态株中。然后将大肠杆菌涂布至含有添加了100nM的葡萄糖和不同浓度的阿拉伯糖(0nM、20nM和40nM)的含有抗生素的LB固体培养基上,37℃培养过夜,然后观察大肠杆菌是否能在固体培养基上生长,结果如图2和图4所示。所有组在不添加阿拉伯糖添加葡萄糖的条件下,大肠杆菌正常生长;dCas9 control对照组、MaTadA-WT-dCas9组在添加不同浓度阿拉伯糖且添加葡萄糖的条件下,均不生长,说明大肠杆菌内碱基编辑器不起作用,阿拉伯糖诱导ccdB蛋白正常表达,导致大肠杆菌死亡;TadA-8e-dCas9组、MaTadA1.0-dCas9组在添加不同浓度阿拉伯糖且添加葡萄糖的条件下,均可以生长,说明碱基编辑器的腺苷脱氨酶具有脱氨作用,导致ccdB表达时移码,菌体内不产生正常的ccdB蛋白,导致大肠杆菌存活。结果显示,本发明提供的MaTadA1.0与TadA-8e对ccdB基因的终止密码子有编辑效果,但较起始密码子编辑效果稍弱。
实施例4.其他腺嘌呤脱氨酶MaTadA1.1、MaTadA1.2、MaTadA1.3、MaTadA1.4和MaTadA1.5在原核细胞中的功能性验证
按照上述实施例1的方法验证腺嘌呤脱氨酶MaTadA1.1、MaTadA1.2、MaTadA1.3、MaTadA1.4和MaTadA1.5与dCas9构建的ABE的碱基编辑作用(在原核细胞中编辑起始密码子区域),结果如图1C、图1D、图3B和图3C所示。图3B和3C可知,所验证的腺嘌呤脱氨酶均具有编辑效果,其中MaTadA1.1编辑效果最优,MaTadA1.2、MaTadA1.3和MaTadA1.5次之,MaTadA1.4编辑效率再次之。
实施例5.腺苷脱氨酶在293T人类细胞系中脱氨作用的验证
分别将腺嘌呤脱氨酶(MaTadA1.0、ZoTadA1.0、ErTadA1.0、TadA-8e和MaTadA-WT)构建在含有chickenβ-actin promoter启动子与nCas9基因、和含有U6启动子和sgRNA序列(sgRNA序列包含两个区段,即靶向区段((在内源性CRISPR系统背景下也称为间隔序列(spacer))和蛋白质结合区段(含同向(direct)重复序列),该sgRNA的靶向区段作用的靶基因为Hek-2位点和ATP7B基因P992L位点)的真核表达载体中形成重组腺嘌呤碱基编辑器载体,分别标记为:pX330-MaTadA1.0-HeK2(图20A)、pX330-ZoTadA1.0-HeK2(图20B)、pX330-ErTadA1.0-HeK2(图20C)、pX330-TadA-8e-HeK2(图19B),pX330-MaTadA1.0-P992L(图21B)、pX330-ErTadA1.0-P992L(图22A)、pX330-TadA-8e-P992L(图21A)、pX330-MaTadA-WT-P992L(图22B);同时构建不含有腺嘌呤脱氨酶序列的空白对照质粒(该sgRNA序列只含有蛋白质结合区段scaffold,不含有靶向区段),标记为px330(图19A)。靶向Hek-2位点的sgRNA为5’-gaacacaaagcatagactgc-3’(SEQ ID NO:44)。靶向p992L位点的sgRNA为5’-gcgtgagcgtggccagcccca-3’(SEQ ID NO:45)。
然后,将腺嘌呤碱基编辑器载体通过脂质体转染的方法转入到人类细胞中,在37℃、5%二氧化碳浓度下培养72h。提取全部细胞的DNA,并对包含靶位点的序列进行扩增,将PCR产物进行一代测序,将测序结果比对到人类基因组对应的基因,测定到腺嘌呤碱基编辑器对目标靶基因的编辑效率。结果显示,本发明提供的腺嘌呤碱基编辑器载体对Hek-2位点和ATP7B基因P992L位点的编辑效率能达到50%以上,部分原始测序数据如图6至15所示。
图6显示pX330-MaTadA1.0-HeK2在293T细胞中编辑HEK2基因的测序图,结果显示其具有编辑效果,编辑窗口为第3、5、7位。下方表格中的数据为每个核苷酸位点测序的数值化结果,数值低于10的为噪声,第三位A→G效率约为13%、第五位A→G效率约为54%、第七位A→G效率约为53%。
图7显示pX330-ZoTadA1.0-HeK2在293T细胞中编辑HEK2基因的测序图,结果显示其具有编辑效果,编辑窗口为第5位。下方表格中的数据为每个核苷酸位点测序的数值化结果,数值低于10的为噪声,第五位A→G效率约为31%。
图8显示pX330-ErTadA1.0-HEK2在293T细胞中编辑HEK2基因的测序图,结果显示其具有编辑效果,编辑窗口为第3、5、7、8位。下方表格中的数据为每个核苷酸位点测序的数值化结果,数值低于10的为噪声,第三位A→G效率约为16%、第五位A→G效率约为51%、第七位A→G效率约为40%、第八位A→G效率约为42%。其中第七、八和九位均为A,测序图上明显为腺苷酸A连峰,其他碱基没有出峰,但是软件读数被连峰干扰,显示有其他碱基的比例,这是软件读数的错误,以测序图为准,测序图可知,A8位点编辑效率很高。
图9显示pX330-TadA-8e-HeK2在293T细胞中编辑HEK2基因的测序图,结果显示其具有编辑效果,编辑窗口为第5、7位。下方表格中的数据为每个核苷酸位点测序的数值化结果,数值低于10的为噪声,第五位A→G效率约为41%、第七位A→G效率约为41%。
图10显示pX330空白载体在293T细胞中编辑HEK2基因的测序图,结果显示无编辑效果。
图11显示pX330-MaTadA1.0-P992L在293T细胞中编辑p992L基因的测序图,结果显示其具有编辑效果(套峰)。第六位A→G效率约为29%。测序图因为引物原因测的是sgRNA的反义链(方向为3’→5’),下同。
图12显示pX330-MaTadA-WT-nCas9-P992L在293T细胞中编辑p992L基因的测序图,结果显示其无编辑效果(无套峰)。
图13显示pX330-ErTadA1.0-nCas9-P992L在293T细胞中编辑p992L基因的测序图,结果显示其具有编辑效果(套峰)。第六位A→G效率约为31%。
图14显示pX330-TadA-8e-P992L在293T细胞中编辑p992L基因的测序图,结果显示其具有编辑效果。第六位A→G效率约为26%,该位点的编辑效果比HEK2基因编辑效率低。
图15显示pX330空白载体在293T细胞中编辑p992L基因的测序图,结果显示无编辑效果。

Claims (17)

1.腺苷脱氨酶,其相对于SEQ ID NO:12所示序列在以下位点中的一个、多个或全部具有氨基酸取代:E22、T47、L83、A105、D107、F108、T110、D118、R121、S145、F148、R151、E154、K156、V167和E168,并且其氨基酸序列与SEQ ID NO:12所示序列具有约70%至约99.5%的序列同一性。
2.根据权利要求1所述的腺苷脱氨酶,其中:
(a)E22的取代选自:E22R、E22K和E22H;
(b)T47的取代为T47A;
(c)L83的取代选自:L83F、L83W和L83Y;
(d)A105的取代选自:A105V、A105I、A105L和A105P;
(e)D107的取代为D107N;
(f)F108的取代选自:F108V、F108I、F108L和F108P;
(g)T110的取代选自:T110R、T110K和T110H;
(h)D118的取代位D118N;
(i)R121的取代为R121N;
(j)S145的取代为S145C;
(k)F148的取代为F148Y;
(l)R151的取代为R151P;
(m)E154的取代选自:E154V、E154I、E154L和E154P;
(n)K156的取代为K156N;
(o)V167的取代为V167I;或
(p)E168的取代为E168N。
3.根据权利要求1或2所述的腺苷脱氨酶,其中腺苷脱氨酶包含选自SEQ ID NO:13至16任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列。
4.腺苷脱氨酶,其相对于SEQ ID NO:17所示序列在以下位点中的一个、多个或全部具有氨基酸取代:W22、Q35、P47、Y50、L83、A105、D107、E108、T110、D118、G121、H122、S145、F148、R151、E154、K155和K156,并且其氨基酸序列与SEQ ID NO:17所示序列具有约70%至约99.5%的序列同一性。
5.根据权利要求4所述的腺苷脱氨酶,其中:
(a)W22的取代选自:W22R、W22K和W22H;
(b)Q35的取代选自:Q35L、Q35V、Q35I和Q35P;
(c)P47的取代为P47A;
(d)Y50的取代选自:Y50L、Y50V、Y50I和Y50P;
(e)L83的取代选自:L83F、L83W和L83Y;
(f)A105的取代选自:A105V、A105I、A105L和A105P;
(g)D107的取代为D107N;
(h)E108的取代为E108S;
(i)T110的取代选自:T110R、T110K和T110H;
(j)D118的取代位D118N;
(k)G121的取代为G121N;
(l)H122的取代为H122Y;
(m)S145的取代为S145C;
(n)F148的取代为F148Y;
(o)R151的取代为R151P;
(p)E154的取代选自:E154V、E154I、E154L和E154P;
(q)K155的取代选自:K155F、K155W和K155Y;
(r)K156的取代为K156N。
6.根据权利要求4或5所述的腺苷脱氨酶,其中腺苷脱氨酶包含选自SEQ ID NO:18至21任一项所示的氨基酸序列或与它们各自具有至少约80%的序列同一性的氨基酸序列。
7.包含权利要求1至6任一项所述的腺苷脱氨酶的碱基编辑器。
8.根据权利要求7所述的碱基编辑器,其进一步包含胞苷脱氨酶结构域。
9.根据权利要求7所述的碱基编辑器,其进一步包含第二腺苷脱氨酶结构域,所述第二腺苷脱氨酶结构域与权利要求1至6任一项所述的腺苷脱氨酶相同或不同。
10.根据权利要求7至9任一项所述的碱基编辑器,其中所述碱基编辑器进一步包含一个或多个核定位序列。
11.根据权利要求7至10任一项所述的碱基编辑器,其中所述碱基编辑器进一步包括可编程的DNA结合结构域,所述可编程的DNA结合结构域优选地选自Cas9结构域或Cas12结构域;更优选为dCas9结构域或nCas9结构域。
12.根据权利要求7至11任一项所述的碱基编辑器,其中所述碱基编辑器包含选自SEQID NO:49至54的氨基酸序列或与SEQ ID NO:49至54的氨基酸序列具有至少80%序列同一性的氨基酸序列。
13.包含权利要求11或12所述的碱基编辑器和引导RNA的复合物,所述引导RNA连接至碱基编辑器的可编程的DNA结合结构域。
14.编码权利要求1至6任一项所述的腺苷脱氨酶或权利要求7至12任一项所述的碱基编辑器的多核苷酸。
15.包含权利要求14所述的多核苷酸的载体。
16.包含权利要求15所述的载体的细胞。
17.一种药物组合物,其包含权利要求7至12任一项所述的碱基编辑器、权利要求13所述的复合物、权利要求14所述的载体或权利要求15所述的细胞。
CN202410206824.8A 2023-06-28 2023-06-28 工程化的腺苷脱氨酶及碱基编辑器 Pending CN117965505A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410206824.8A CN117965505A (zh) 2023-06-28 2023-06-28 工程化的腺苷脱氨酶及碱基编辑器

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202310776962.5A CN116836962B (zh) 2023-06-28 2023-06-28 工程化的腺苷脱氨酶及碱基编辑器
CN202410206824.8A CN117965505A (zh) 2023-06-28 2023-06-28 工程化的腺苷脱氨酶及碱基编辑器

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202310776962.5A Division CN116836962B (zh) 2023-06-28 2023-06-28 工程化的腺苷脱氨酶及碱基编辑器

Publications (1)

Publication Number Publication Date
CN117965505A true CN117965505A (zh) 2024-05-03

Family

ID=88173710

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310776962.5A Active CN116836962B (zh) 2023-06-28 2023-06-28 工程化的腺苷脱氨酶及碱基编辑器
CN202410206824.8A Pending CN117965505A (zh) 2023-06-28 2023-06-28 工程化的腺苷脱氨酶及碱基编辑器

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202310776962.5A Active CN116836962B (zh) 2023-06-28 2023-06-28 工程化的腺苷脱氨酶及碱基编辑器

Country Status (1)

Country Link
CN (2) CN116836962B (zh)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7231935B2 (ja) * 2016-08-03 2023-03-08 プレジデント アンド フェローズ オブ ハーバード カレッジ アデノシン核酸塩基編集因子およびそれらの使用
CN109957569B (zh) * 2017-12-22 2022-10-25 苏州齐禾生科生物科技有限公司 基于cpf1蛋白的碱基编辑系统和方法
CN112805379A (zh) * 2018-08-03 2021-05-14 比姆医疗股份有限公司 多效应核碱基编辑器和使用其修饰核酸靶序列的方法
WO2020181195A1 (en) * 2019-03-06 2020-09-10 The Broad Institute, Inc. T:a to a:t base editing through adenine excision
CA3140093A1 (en) * 2019-05-21 2020-11-26 Beam Therapeutics Inc. Methods of editing a single nucleotide polymorphism using programmable base editor systems
US20230075877A1 (en) * 2019-09-09 2023-03-09 Beam Therapeutics Inc. Novel nucleobase editors and methods of using same
CA3170326A1 (en) * 2020-02-13 2021-08-19 Beam Therapeutics Inc. Compositions and methods for engraftment of base edited cells
CN117925585A (zh) * 2022-04-07 2024-04-26 尧唐(上海)生物科技有限公司 腺苷脱氨酶、碱基编辑器融合蛋白、碱基编辑器系统及用途
CN115927271A (zh) * 2022-09-29 2023-04-07 复旦大学 一种小型化碱基编辑器及其构建方法与应用

Also Published As

Publication number Publication date
CN116836962A (zh) 2023-10-03
CN116836962B (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
US20230108687A1 (en) Gene editing methods for treating spinal muscular atrophy
US20240173430A1 (en) Base editing for treating hutchinson-gilford progeria syndrome
EP3114227B1 (en) Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa
US11344609B2 (en) Compositions and methods for treating hemoglobinopathies
US20190345490A1 (en) Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
WO2021050571A1 (en) Novel nucleobase editors and methods of using same
KR20210023831A (ko) 프로그래밍가능한 염기 편집기 시스템을 이용하여 병원성 아미노산을 치환하는 방법
EP4010474A1 (en) Base editors with diversified targeting scope
AU2015330699A1 (en) Compositions and methods for promoting homology directed repair
WO2020168051A9 (en) Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease
EP3972654A1 (en) Methods of editing a single nucleotide polymorphism using programmable base editor systems
WO2023193536A1 (zh) 一种腺苷脱氨酶、碱基编辑器及应用
JP2024504981A (ja) 新規の操作されたヌクレアーゼおよびキメラヌクレアーゼ
WO2020168088A1 (en) Compositions and methods for treating glycogen storage disease type 1a
CN116836962B (zh) 工程化的腺苷脱氨酶及碱基编辑器
KR20240017367A (ko) 클래스 ii, v형 crispr 시스템
WO2019194320A1 (ja) エンジニアリングされたBlCas9ヌクレアーゼ
WO2024026478A1 (en) Compositions and methods for treating a congenital eye disease
CN118147120A (zh) 胞苷脱氨酶及碱基编辑器
WO2023227669A2 (en) Novel nucleic acid-editing proteins
KR20230016751A (ko) 염기 편집기 및 이의 용도
BR112021013605B1 (pt) Sistemas de edição de base, célula ou um progenitor da mesma,população de células, composição farmacêutica, e métodos para editar um polinucleotídeo de beta globina (hbb) associado à anemia falciforme e para produzir um glóbulo vermelho ou progenitor do mesmo
CA3237317A1 (en) Direct replacement genome editing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination