CN113717961B - 一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用 - Google Patents

一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用 Download PDF

Info

Publication number
CN113717961B
CN113717961B CN202111062182.1A CN202111062182A CN113717961B CN 113717961 B CN113717961 B CN 113717961B CN 202111062182 A CN202111062182 A CN 202111062182A CN 113717961 B CN113717961 B CN 113717961B
Authority
CN
China
Prior art keywords
lys
leu
glu
ile
asn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111062182.1A
Other languages
English (en)
Other versions
CN113717961A (zh
Inventor
姚少华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Saiengino Biotechnology Co ltd
Original Assignee
Chengdu Saiengino Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Saiengino Biotechnology Co ltd filed Critical Chengdu Saiengino Biotechnology Co ltd
Priority to CN202111062182.1A priority Critical patent/CN113717961B/zh
Publication of CN113717961A publication Critical patent/CN113717961A/zh
Application granted granted Critical
Publication of CN113717961B publication Critical patent/CN113717961B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/50Hydrolases (3) acting on carbon-nitrogen bonds, other than peptide bonds (3.5), e.g. asparaginase
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0025Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/06Antianaemics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04001Cytosine deaminase (3.5.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
    • C12Y305/04002Adenine deaminase (3.5.4.2)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

本发明公开了一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用。该融合蛋白包括saCas9核酸酶,以及插入在其第118~133位,和/或第685~702位氨基酸插入位点之间的脱氨酶;具体可以是在第125和126位氨基酸之间或者第693和694位氨基酸之间插入脱氨酶。本发明利用SaCas9/sgRNA/DNA复合物的晶体结构设计了一系列碱基编辑器,其中将胞嘧啶或腺苷脱氨酶镶嵌在SaCas9蛋白内部的不同位置,与现有N端融合胞嘧啶或腺苷脱氨酶的碱基编辑器,125位和693位融合的碱基编辑器具有近似或者更高的编辑活性以及不同的编辑窗口,极大地改善了碱基编辑器的编辑范围,为优化编辑结果提供了更多选择;本发明在基因修饰细胞治疗和基于基因编辑的基因治疗药物中具有重要价值。

Description

一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用
技术领域
本发明属于生物技术领域,具体涉及一种融合蛋白及其多核苷酸、碱基编辑器和在制备治疗β-血红蛋白病的药物中的应用。
背景技术
CRISPR/Cas9衍生的碱基编辑器可在目标基因组DNA中将一个碱基对精确有效地转换为另一对碱基(C/G→T/A或A/T→G/C),而很少引起双链断裂(DSB)。碱基编辑器通常由具单链切割活性的Cas9蛋白(nCas9)和对ssDNA底物具有活性的胞苷或腺苷脱氨酶组成。Cas9通过特定的引导RNA(singleguide RNA)引导与其靶DNA结合,形成蛋白质-RNA-DNA三元“R环”复合物。与sgRNA同义的DNA链(也即非互补链,non-target strand,NTS)被解离形成相对游离的单链DNA(single-strand DNA,ssDNA),这为脱氨酶提供了ssDNA底物。
传统的碱基编辑器中,胞苷或腺苷脱氨酶被直接融合到nCas9的N末端,这种融合方式造成脱氨酶对NTS的编辑范围小且相对固定,使得脱氨酶只能在NTS小窗口范围(称为编辑窗口)内转换碱基。例如,最广泛使用的spCas9衍生的胞嘧啶碱基编辑器之一,BE3,通常催化4到8位内的碱基转化(将NGG PAM计为21-23)。如何进一步优化碱基编辑器以提高其编辑效率、或者扩大编辑窗口、或者提高特异性,是提高碱基编辑器效率、拓展其应用范围的关键。
发明内容
针对现有技术中的上述不足,本发明提供一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用,本发明提供了SaCas9的融合蛋白,它是将胞嘧啶脱氨酶和/或腺嘌呤脱氨酶插入到SaCas9的第118~133位,和/或第685~702位氨基酸插入位点之间,具体可以是第125和126位氨基酸之间或者第693和694位氨基酸之间得到的。
本发明利用SaCas9/sgRNA/DNA复合物的晶体结构设计了一系列碱基编辑器,其中将胞嘧啶或腺苷脱氨酶镶嵌在SaCas9n内部的不同位置。对所得碱基编辑器的性能进行表征后发现,它们具有不同的编辑范围,且相较于N端融合胞嘧啶或腺苷脱氨酶的碱基编辑器,125位和693位融合的碱基编辑器在碱基编辑的效果上各有优势。上述内部镶嵌的SaCas9碱基编辑器极大地改善了目标范围,为特定目的位点编辑方案的优化提供了更多选择。
为实现上述目的,本发明解决其技术问题所采用的技术方案是:
一种融合蛋白,该融合蛋白包括核酸酶,以及插入在其第118~133位,和/或第685~702位氨基酸插入位点之间的脱氨酶。
进一步地,该融合蛋白核酸酶,以及插入在其第125和126位,和/或插入在第693和694位氨基酸之间的脱氨酶。
进一步地,核酸酶为SaCas9蛋白,或与其具有至少80%同源性的蛋白。
进一步地,SaCas9蛋白含有D10A突变,其氨基酸序列如SEQ ID NO.1所示,所述SaCas9蛋白的插入位点可以同时插入不同种类的脱氨酶。
进一步地,脱氨酶为胞嘧啶脱氨酶和腺嘌呤脱氨酶中的至少一种。
进一步地,胞嘧啶脱氨酶含有Y130F突变,其氨基酸序列如SEQ DI NO.2所示。
进一步地,腺嘌呤脱氨酶为TadA-8e,其氨基酸序列如SEQ DI NO.3所示。
进一步地,脱氨酶通过接头与SaCas9蛋白连接,所述接头为XTEN。
进一步地,该融合蛋白融合了1个胞嘧啶脱氨酶,且将胞嘧啶脱氨酶插入到所述SaCas9的第125和126位氨基酸之间或者第693和694位氨基酸之间。
进一步地,该融合蛋白融合了1个腺嘌呤脱氨酶,且将腺嘌呤脱氨酶插入到所述SaCas9的第125和126位氨基酸之间或者第693和694位氨基酸之间。
进一步地,该融合蛋白融合了1个胞嘧啶脱氨酶和1个腺嘌呤脱氨酶,且将胞嘧啶脱氨酶和腺嘌呤脱氨酶插入到所述SaCas9的第693和694位氨基酸之间。
进一步地,腺嘌呤脱氨酶融合于胞嘧啶脱氨酶的N端。
进一步地,融合蛋白还包括嘧啶糖苷酶抑制蛋白和核定位信号,嘧啶糖苷酶抑制蛋白融合于SaCas9蛋白的C端;核定位信号融合于融合蛋白的C端。
上述融合蛋白的氨基酸序列如SEQ ID No.4、SEQ ID No.5、SEQ ID No.6中任意一项所示。
一种多核苷酸,多核苷酸能编码上述融合蛋白。
一种向导RNA/核酸酶复合物,复合物包括至少一种向导RNA以及上述融合蛋白;所述复合物能够识别、结合靶序列的全部或部分并任选地使靶序列的全部或部分产生切口、解旋或切割靶序列的全部或部分。
一种载体,其包括上述多核苷酸。
一种宿主细胞,其包括上述多核苷酸,或载体,并能表达上述融合蛋白。
“宿主细胞”通常是指生物学细胞。细胞可以是活的生物的基本结构、功能和/或生物学单元。细胞可源自具有一个或多个细胞的任何生物。宿主细胞的实例包括但不限于:原核细胞、真核细胞、细菌细胞、古细菌细胞、单细胞真核生物的细胞、原生动物细胞、来自植物的细胞、动物细胞、哺乳动物(例如,猪、牛、山羊、绵羊、啮齿动物、大鼠、小鼠、非人灵长类动物、人等)的细胞。此外,细胞可以是干细胞或祖细胞。
一种碱基编辑器,碱基编辑器包括上述融合蛋白或多核苷酸,以及载体质粒。
上述融合蛋白、多核苷酸或碱基编辑器在药物筛选及基因修饰中的应用。
上述融合蛋白、多核苷酸、复合物、载体或碱基编辑器在制备基因治疗药物或细胞治疗药物中的应用。
一种用于修饰宿主细胞基因组的方法,该方法包括:向包含有至少一个待修饰靶序列的宿主细胞提供至少一种向导RNA和上述融合蛋白或碱基编辑器;所述向导RNA和融合蛋白或碱基编辑器能够形成复合物;所述复合物能够识别、结合至少一个靶序列的全部或部分并任选地使所述至少一个靶序列的全部或部分产生切口、解旋或切割所述至少一个靶序列的全部或部分。
一种药物组合物,包括上述多核苷酸、复合物、载体或碱基编辑器,以及药学上可接受的辅助成分。
上述融合蛋白、多核苷酸、复合物或碱基编辑器在制备治疗β-血红蛋白病的药物中的应用。
一种用于治疗β-血红蛋白病的药物,该药物包括靶向BCL11A基因+58位红系增强子中TGN 7-9WGATAR E-box/GATA结合基序的sgRNA,以及上述融合蛋白或N端融合脱氨酶的碱基编辑器;
sgRNA间隔序列如SEQ ID NO.7所示;或在SEQ ID NO.7所示序列的基础上增加、删减或替换一个或多个碱基后,但同样具有相同功能的序列。
进一步地,还包含引导SaCas9识别目的基因的PAM序列,其具体序列为AAGGGT。
进一步地,脱氨酶为胞嘧啶脱氨酶和腺嘌呤脱氨酶中的至少一种。
本发明实施案例中使用的SaCas9为D10A突变的SaCas9,氨基酸序列如SEQ IDNo.1所示。A3A为Y130F突变的A3A,氨基酸序列如SEQ ID No.2所示。使用的TadA为TadA-8e,氨基酸序列如SEQ ID No.3所示,接头为XTEN。
基于SaCas9的CBE融合蛋白:SaCBE-125的氨基酸序列如SEQ ID No.4所示;SaCBE-693的氨基酸序列如SEQ ID No.5所示。
基于SaCas9的CABE融合蛋白:Sa-CABE-693的氨基酸序列如SEQ ID No.6所示。
此外,还可设计更多的融合蛋白,如SaCBE-269、SaCBE-593、N端融合胞嘧啶脱氨酶的编辑器Sa-CBE-N、N端融合的双碱基编辑器Sa-CABE-N、SaABE-125、SaABE-269、SaABE-593、SaABE-693、N端融合腺嘌呤脱氨酶的编辑器,即Sa-ABE-N等。
本发明的有益效果:
1、通过将胞嘧啶脱氨酶嵌入SaCas9内部,本发明获得了一系列具有不同窗口范围的碱基编辑器。与N端融合的碱基编辑工具(Sa-CBE-N)相比,SaCBE-125将编辑窗口由原来的3-14缩小至8-15,SaCBE-693将拓宽至3-18;并且具有更低的DNA脱靶编辑。
2、对PKU小鼠模型突变位点的体外验证,证明了本发明中具有狭窄窗口的SaCBE-125为苯丙酮尿症(PKU)中PAH突变热点H263Y中C→T的突变提供了更加有效而精确的碱基编辑方案。并通过优化sgRNA长度,进一步提高了功能性编辑的比例。
3、通过将两种碱基脱氨酶嵌入SaCas9内部693aa位置,开发了一种双功能的碱基编辑器Sa-CABE-693。与单个碱基编辑工具相比,Sa-CABE-693可纠正更多的突变组合,即对A&C同时编辑。与N端融合的双碱基编辑工具相比,其展现出C-to-T窗口进一步的拓宽,以及在某些靶点稍微提高了A→G的编辑。
4、通过对BCL11A基因+58位红系增强子的编辑,证明了本发明开发的双碱基编辑工具,Sa-CABE-693比传统的双碱基编辑工具更有效的引入治疗β-血红蛋白病的突变。因此,Sa-CABE-693不仅是一个单碱基编辑工具,也是一个两种碱基同时编辑的碱基编辑器。对于基因治疗而言,这种特性,为基因组多样化的需要提供了更多的选择。
附图说明
图1为实施例1中SaCas9域内嵌合A3A的Sa-CBEs构建及活性验证图;
图2为实施例2中SaCas9域内嵌合TadA-8e的Sa-ABEs构建及活性验证图;
图3为实施例3的脱靶检测结果图;
图4为实施例4中SaCBE-125对PKU靶点的编辑及优化图;
图5为实施例5中Sa-CABE-693设计及A&C的编辑窗口图;
图6为实施例6中Sa-CABE-693靶向BCL11A基因的+58位增强子的sgRNA设计及结果图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
实施例1 SaCas9域内嵌合A3A的Sa-CBEs构建及活性验证
1、SaCas9域内嵌入脱氨酶的CBE编辑器的设计与构建
通过可视化分析SaCas9/sgRNA/DNA复合物的晶体结构(其参考的PDB编号为:5XAW),在SaCas9的REC结构域125aa、269aa位置和HNH结构域593aa位置以及RUVC结构域中693aa的位置设计插入位点,其相对于NTS的位置如图1a所示,分别构建了SaCBE-125、SaCBE-269、SaCBE-593、SaCBE-693等内部嵌入脱氨酶的Sa-CBEs编辑器,构建方案如图1b所示,XTEN为连接脱氨酶(A3A)与SaCas9之间的接头序列,UGI为尿嘧啶糖苷酶抑制蛋白,NLS为核定位信号。
2、SaCas9域内嵌入脱氨酶的CBE编辑器的活性窗口
在8个内源性靶点中转染上述碱基编辑器,发现他们与SaCas9的N端融合脱氨酶的编辑器(Sa-CBE-N)相比,具有不同的编辑范围,如图1c所示。在大部分靶点中,SaCBE-125编辑窗口明显的有近PAM端偏移并缩小趋势,SaCBE-693编辑窗口有拓宽倾向并且在所有靶点中编辑效率都比较高,SaCBE-593编辑窗口同样有拓宽倾向但在某些靶点上效率较低,SaCBE-269编辑窗口则没有明显变化。
为了更直观具体的分析其编辑窗口,本发明汇总了所有sgRNA上的编辑效率,总结了这些编辑器的窗口特点,如图1d所示。首先,SaCBE-693编辑效率最高,与Sa-CBE-N相比,将窗口由原来的3-14拓宽至3-18,扩宽了约3~4位碱基。其次,SaCBE-125编辑窗口为8-15,其编辑窗口明显缩小并且在C12和C13位的编辑有集中的趋势。此外,SaCBE-593虽然同样拓宽了编辑窗口(3-18),但其编辑活性在某些靶点上很低,而SaCBE-269的编辑窗口(3-14)未发生明显的变化。
实施例2 SaCas9域内嵌入腺嘌呤脱氨酶的ABE编辑器的活性验证
以上将胞嘧啶脱氨酶A3A嵌入SaCas9,获得了一系列不同编辑窗口的Sa-CBEs。但对于ABE系统,尚未清楚是否具有同样的窗口特性。本发明选用TadA-8e嵌入SaCas9同样的125aa、269aa、593aa、693aa位置,验证Sa-ABE系统的窗口特性。
如图2a所示,构建了SaABE-125、SaABE-269、SaABE-593、SaABE-693。接下来,在6个内源性靶点测试了编辑活性。如图2b所示,发现与N端融合的Sa-ABE-N编辑器相比,SaABE-125在大部分靶点(RUNX#14、EXMI#6、site1、site6)上编辑更少的C或者近PAM端的偏移,但在Site11靶点两者窗口显示一致的范围。此前在CBE上验证的窗口拓宽的编辑器,SaCBE-693和SaCBE-593在ABE系统中均未明显的扩宽编辑范围,除了在RUNX1#14、FANCF#2上显示出近PAM端的1-2位碱基的扩宽。SaABE-269仍然与Sa-ABE-N显示出一致的窗口范围。因此,尽管SaCas9域内嵌合的ABE编辑器与前面CBE系统有相似的窗口特性。即,与Sa-ABE-N相比,Sa-ABE-125编辑窗口更窄,SaABE-593、SaABE-693在某些靶点拓宽了近PAM端1-2位碱基的编辑,Sa-ABE-269则显示出一致的编辑窗口。但总体而言,SaCas9域内嵌合脱氨酶的ABE系统不如在CBE系统那样十分明显的扩大编辑范围。
实施例3 SaCas9域内嵌入脱氨酶的CBE编辑器的脱靶检测
脱靶效应的测定是对一个新的碱基编辑工具的安全性评价的重要指标。R-人工环正交法是一种测定非sgRNA序列依赖性DNA脱靶编辑的稳定而可靠的方法。但是,该技术中的已知人工R环结构由dSaCas9和SaCas9sgRNA组成,用来测定SpCas9非序列依赖性的脱靶编辑。为了测定SaCas9派生的编辑器的非序列依赖性的脱靶编辑,本发明将该人工R环结构替换为dSpCas9和SpCas9 sgRNA,用以测定SaCas9派生的编辑器的DNA脱靶编辑(图3a)。
如图3b所示,在内源性靶点HEK4中评估了上述编辑器的总脱靶编辑,即靶点上所有C的脱靶编辑总和的平均值。发现Sa-CBE-N相比,在C3和C5位的脱靶效率为30%-40%左右;而本发明域内嵌入的编辑器虽然在C5位显示出30%左右脱靶编辑,但大大降低了在C3位的脱靶编辑。可见,本发明设计的新型碱基编辑器的总脱靶编辑更低。
实施例4 SaCBE-125编辑器应用于PKU
具有较窄窗口的SaCBE-125更有利于由单核苷酸变异引起的疾病位点的纠正,因此本实验以SaCBE-125为例验证本发明编辑器在基因治疗方面的潜力。苯丙酮尿症(PKU)中PAH突变热点H263Y中C→T的突变,是已知的在小鼠模型中可通过碱基编辑恢复表型及血苯丙氨酸水平的非常有前景的治疗方案。本实验分析了PKU位点中的C替换为T后,其氨基酸的编码情况,如图4a所示。C828的编辑会导致终止密码子(无义突变),C836的编辑会引起H→Y的氨基酸突变(错义突变),其余的C对编码无影响。发明人前期研究已经证明,该错义突变不会影响PAH酶的活性。
为了比较SaCBE-125和Sa-CBE-N在PKU位点的编辑情况,我们首先构建了含有PAH基因F263S突变的HEK293细胞株。如图4b,转染细胞后发现,两者对C835的编辑一致(Sa-CBE和Sa-CBE-125分别为33%和34%),Sa-CBE-N对非目标C828有10%左右的编辑,而SaCBE-125则几乎不编辑C828。因此,与Sa-CBE-N相比,我们的方案对PKU位点的编辑不会导致终止密码子的产生,而集中编辑目标C835,从而更有效的引入治疗PKU的PAH的有益突变
为了对PKU靶点的编辑结果进一步优化,本实验构建了含18bp、19bp、20bp、21bp间隔序列(spacer)长度的PKU-sgRNA,测试sgRNA间隔序列(spacer)长度的改变对编辑器编辑窗口或编辑效率的影响。结果如图4c所示:间隔序列(spacer)长度的改变明显影响了SaCBE-125编辑效率,而编辑窗口影响较小,随着间隔序列(spacer)的缩短,目标C835编辑进一步提高,而仍不编辑非目标C828,从而提高了功能性编辑的比例;而对于Sa-CBE-N,间隔序列(spacer)长度的改变既显著影响了编辑效率,也改变了其编辑窗口,对于18bp、19bpPKU-sgRNA而言,反而提高了非目标C828的编辑,从而降低功能性编辑的比例。可见,通过优化sgRNA间隔序列(spacer)的长度为18bp、19bp,能够提高SaCBE-125对PKU位点功能性编辑的比例。
以上结果表明,本发明编辑器能够适用于窗口范围内有多个碱基C,即除了目标C,还有非目标C的复杂位点的编辑。
实施例5 A&C双碱基编辑器Sa-CABE-693的构建及活性验证
前述实施例表明,本发明开发的SaCBE-693编辑器极大拓宽了编辑窗口,即可以编辑窗口内更多的碱基C。但是,该CBE系统也只能编辑单一的碱基类型,即对胞嘧啶进行脱氨。为了进一步扩宽编辑范围,本发明进一步优化该编辑器以编辑更多的碱基类型,实现同一间隔序列(spacer)内不同的碱基类型的同时编辑。
因此,将两种脱氨酶TadA-8e和A3A嵌入该SaCas9的693aa位置,构建了Sa-CABE-693,如图5a。本实验进一步比较了SaCas9域内嵌入脱氨酶的双碱基编辑方案(Sa-CABE-693)和传统的N端融合的双碱基编辑方案(Sa-CABE-N)。如图5b所示,在HEK4-4、C5-5等内源性靶点中:与Sa-CABE-N相比,本发明Sa-CABE-693具有更广的C→T编辑范围。除了在EXM1-2靶点中,Sa-CABE-693略微提高了对A→G编辑比例,而对A→G的编辑几乎在所有靶点中都保持一致。
以上结果表明,本发明Sa-CABE-693相比传统的N端融合双碱基编辑方案(Sa-CABE-N),具有更广的C→T编辑范围,并且在某些靶点上略微提高了A→G转换比例,可产生更多突变组合。
实施例6本发明Sa-CABE-693靶向BLC11A基因的+58位增强子能更有效的引入治疗β-血红蛋白病的突变
本实施例进一步验证了Sa-CABE-693在基因治疗方面的潜力。在β-血红蛋白病人中,抑制BCL11A的表达是已知的治疗该疾病的非常有前景的治疗方法。突变+58位BCL11A红系增强子上的TGN 7-9WGATAR E-box/GATA结合基序会导致BCL11A表达下降,从而诱导胎儿血红蛋白上调。
首先,本发明设计BCL11A sgRNA以靶向TGN 7-9WGATAR E-box/GATA结合基序,如图6a。接下来,比较了Sa-CABE-693和Sa-CABE-N对BCL11A sgRNA靶向位点的编辑能力。结果如图6b所示,图示为Sa-CABE-693和Sa-CABE-N转染HEK293T细胞72小时后在BCL11A基因+58位增强子处碱基编辑效率的对比,其中横坐标为不同As或Cs的靶点位中的位置,纵坐标为A到G或C到T编辑效率,数据和误差线代表三次独立实验的平均值和标准差。
从图6b可以看出,与Sa-CABE-N相比,本发明Sa-CABE-693对C→T具有更广的编辑窗口:Sa-CABE-693能高效编辑到C17,而Sa-CABE-N对C17几乎无编辑效果。另外,两者对A→G编辑显示出一致结果。
以上结果表明,与N端融合脱氨酶的Sa-CABE-N相比,本发明的方案靶向BLC11A基因+58位增强子能更有效的引入治疗β-血红蛋白病的突变。
需要说明的是,本说明书中描述的具体特征、结构、材料或者特点可以在任一个或多个实施例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例以及不同实施例的特征进行结合和组合。
序列表
<110> 四川大学
<120> 一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用
<160> 7
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1051
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly
1               5                   10                  15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
            20                  25                  30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
        35                  40                  45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
    50                  55                  60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65                  70                  75                  80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
                85                  90                  95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
            100                 105                 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
        115                 120                 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
    130                 135                 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145                 150                 155                 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
                165                 170                 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
            180                 185                 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
        195                 200                 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
    210                 215                 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225                 230                 235                 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
                245                 250                 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
            260                 265                 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
        275                 280                 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
    290                 295                 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305                 310                 315                 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
                325                 330                 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
            340                 345                 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
        355                 360                 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
    370                 375                 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385                 390                 395                 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
                405                 410                 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
            420                 425                 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
        435                 440                 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
    450                 455                 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465                 470                 475                 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
                485                 490                 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
            500                 505                 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
        515                 520                 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
    530                 535                 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545                 550                 555                 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
                565                 570                 575
Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
            580                 585                 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
        595                 600                 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
    610                 615                 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625                 630                 635                 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
                645                 650                 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
            660                 665                 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
        675                 680                 685
Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala
    690                 695                 700
Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu
705                 710                 715                 720
Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln
                725                 730                 735
Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile
            740                 745                 750
Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr
        755                 760                 765
Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu Ile Asn
    770                 775                 780
Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile
785                 790                 795                 800
Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys
                805                 810                 815
Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp
            820                 825                 830
Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp
        835                 840                 845
Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu
    850                 855                 860
Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys
865                 870                 875                 880
Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr
                885                 890                 895
Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg
            900                 905                 910
Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys
        915                 920                 925
Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys
    930                 935                 940
Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu
945                 950                 955                 960
Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn Gly Glu
                965                 970                 975
Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu
            980                 985                 990
Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn
        995                 1000                1005
Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln
    1010                1015                1020
Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val
1025                1030                1035                1040
Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys
                1045                1050
<210> 2
<211> 199
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His
1               5                   10                  15
Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr
            20                  25                  30
Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met
        35                  40                  45
Asp Gln His Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys
    50                  55                  60
Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro
65                  70                  75                  80
Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile
                85                  90                  95
Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala
            100                 105                 110
Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg
        115                 120                 125
Ile Phe Asp Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg
    130                 135                 140
Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His
145                 150                 155                 160
Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp
                165                 170                 175
Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala
            180                 185                 190
Ile Leu Gln Asn Gln Gly Asn
        195
<210> 3
<211> 166
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr
1               5                   10                  15
Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val
            20                  25                  30
Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile
        35                  40                  45
Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln
    50                  55                  60
Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr
65                  70                  75                  80
Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser
                85                  90                  95
Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ser Lys Arg Gly Ala
            100                 105                 110
Ala Gly Ser Leu Met Asn Val Leu Asn Tyr Pro Gly Met Asn His Arg
        115                 120                 125
Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu
    130                 135                 140
Cys Asp Phe Tyr Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys
145                 150                 155                 160
Ala Gln Ser Ser Ile Asn
                165
<210> 4
<211> 1414
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly
1               5                   10                  15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
            20                  25                  30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
        35                  40                  45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
    50                  55                  60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65                  70                  75                  80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
                85                  90                  95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
            100                 105                 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Ser Gly Ser
        115                 120                 125
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Met Glu Ala
    130                 135                 140
Ser Pro Ala Ser Gly Pro Arg His Leu Met Asp Pro His Ile Phe Thr
145                 150                 155                 160
Ser Asn Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr Leu Cys Tyr
                165                 170                 175
Glu Val Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met Asp Gln His
            180                 185                 190
Arg Gly Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys Gly Phe Tyr
        195                 200                 205
Gly Arg His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro Ser Leu Gln
    210                 215                 220
Leu Asp Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser
225                 230                 235                 240
Pro Cys Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala Phe Leu Gln
                245                 250                 255
Glu Asn Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg Ile Phe Asp
            260                 265                 270
Tyr Asp Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg Asp Ala Gly
        275                 280                 285
Ala Gln Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His Cys Trp Asp
    290                 295                 300
Thr Phe Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu
305                 310                 315                 320
Asp Glu His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln
                325                 330                 335
Asn Gln Gly Asn Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala
            340                 345                 350
Thr Pro Glu Ser Asp Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile
        355                 360                 365
Ser Arg Asn Ser Lys Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln
    370                 375                 380
Leu Glu Arg Leu Lys Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg
385                 390                 395                 400
Phe Lys Thr Ser Asp Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val
                405                 410                 415
Gln Lys Ala Tyr His Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile
            420                 425                 430
Asp Leu Leu Glu Thr Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly
        435                 440                 445
Ser Pro Phe Gly Trp Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met
    450                 455                 460
Gly His Cys Thr Tyr Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala
465                 470                 475                 480
Tyr Asn Ala Asp Leu Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val
                485                 490                 495
Ile Thr Arg Asp Glu Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln
            500                 505                 510
Ile Ile Glu Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln
        515                 520                 525
Ile Ala Lys Glu Ile Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg
    530                 535                 540
Val Thr Ser Thr Gly Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His
545                 550                 555                 560
Asp Ile Lys Asp Ile Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu
                565                 570                 575
Leu Leu Asp Gln Ile Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu
            580                 585                 590
Asp Ile Gln Glu Glu Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu
        595                 600                 605
Glu Ile Glu Gln Ile Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn
    610                 615                 620
Leu Ser Leu Lys Ala Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr
625                 630                 635                 640
Asn Asp Asn Gln Ile Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys
                645                 650                 655
Lys Val Asp Leu Ser Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp
            660                 665                 670
Asp Phe Ile Leu Ser Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile
        675                 680                 685
Lys Val Ile Asn Ala Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile
    690                 695                 700
Ile Ile Glu Leu Ala Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met
705                 710                 715                 720
Ile Asn Glu Met Gln Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu
                725                 730                 735
Glu Ile Ile Arg Thr Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu
            740                 745                 750
Lys Ile Lys Leu His Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu
        755                 760                 765
Glu Ala Ile Pro Leu Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu
    770                 775                 780
Val Asp His Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn
785                 790                 795                 800
Asn Lys Val Leu Val Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg
                805                 810                 815
Thr Pro Phe Gln Tyr Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu
            820                 825                 830
Thr Phe Lys Lys His Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile
        835                 840                 845
Ser Lys Thr Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg
    850                 855                 860
Phe Ser Val Gln Lys Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg
865                 870                 875                 880
Tyr Ala Thr Arg Gly Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val
                885                 890                 895
Asn Asn Leu Asp Val Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser
            900                 905                 910
Phe Leu Arg Arg Lys Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr
        915                 920                 925
Lys His His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile
    930                 935                 940
Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn
945                 950                 955                 960
Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr
                965                 970                 975
Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His
            980                 985                 990
Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys
        995                 1000                1005
Pro Asn Arg Lys Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp
    1010                1015                1020
Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp
1025                1030                1035                1040
Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys
                1045                1050                1055
Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu
            1060                1065                1070
Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr
        1075                1080                1085
Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
    1090                1095                1100
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His
1105                1110                1115                1120
Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val Val Lys
                1125                1130                1135
Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly Val
            1140                1145                1150
Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys Lys Glu Asn
        1155                1160                1165
Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys
    1170                1175                1180
Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr Lys Asn Asp
1185                1190                1195                1200
Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly Val Asn Asn
                1205                1210                1215
Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile Thr Tyr Arg
            1220                1225                1230
Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro His Ile Ile Lys
        1235                1240                1245
Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile
    1250                1255                1260
Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile
1265                1270                1275                1280
Lys Lys Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Ser Asp Tyr
                1285                1290                1295
Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp
            1300                1305                1310
Asp Asp Asp Lys Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu
        1315                1320                1325
Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu
    1330                1335                1340
Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile
1345                1350                1355                1360
Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu
                1365                1370                1375
Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln
            1380                1385                1390
Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro
        1395                1400                1405
Lys Lys Lys Arg Lys Val
    1410
<210> 5
<211> 1414
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly
1               5                   10                  15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
            20                  25                  30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
        35                  40                  45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
    50                  55                  60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65                  70                  75                  80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
                85                  90                  95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
            100                 105                 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
        115                 120                 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
    130                 135                 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145                 150                 155                 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
                165                 170                 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
            180                 185                 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
        195                 200                 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
    210                 215                 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225                 230                 235                 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
                245                 250                 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
            260                 265                 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
        275                 280                 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
    290                 295                 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305                 310                 315                 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
                325                 330                 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
            340                 345                 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
        355                 360                 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
    370                 375                 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385                 390                 395                 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
                405                 410                 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
            420                 425                 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
        435                 440                 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
    450                 455                 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465                 470                 475                 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
                485                 490                 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
            500                 505                 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
        515                 520                 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
    530                 535                 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545                 550                 555                 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
                565                 570                 575
Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
            580                 585                 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
        595                 600                 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
    610                 615                 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625                 630                 635                 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
                645                 650                 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
            660                 665                 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
        675                 680                 685
Phe Lys Lys Glu Arg Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
    690                 695                 700
Ala Thr Pro Glu Ser Met Glu Ala Ser Pro Ala Ser Gly Pro Arg His
705                 710                 715                 720
Leu Met Asp Pro His Ile Phe Thr Ser Asn Phe Asn Asn Gly Ile Gly
                725                 730                 735
Arg His Lys Thr Tyr Leu Cys Tyr Glu Val Glu Arg Leu Asp Asn Gly
            740                 745                 750
Thr Ser Val Lys Met Asp Gln His Arg Gly Phe Leu His Asn Gln Ala
        755                 760                 765
Lys Asn Leu Leu Cys Gly Phe Tyr Gly Arg His Ala Glu Leu Arg Phe
    770                 775                 780
Leu Asp Leu Val Pro Ser Leu Gln Leu Asp Pro Ala Gln Ile Tyr Arg
785                 790                 795                 800
Val Thr Trp Phe Ile Ser Trp Ser Pro Cys Phe Ser Trp Gly Cys Ala
                805                 810                 815
Gly Glu Val Arg Ala Phe Leu Gln Glu Asn Thr His Val Arg Leu Arg
            820                 825                 830
Ile Phe Ala Ala Arg Ile Phe Asp Tyr Asp Pro Leu Tyr Lys Glu Ala
        835                 840                 845
Leu Gln Met Leu Arg Asp Ala Gly Ala Gln Val Ser Ile Met Thr Tyr
    850                 855                 860
Asp Glu Phe Lys His Cys Trp Asp Thr Phe Val Asp His Gln Gly Cys
865                 870                 875                 880
Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu His Ser Gln Ala Leu Ser
                885                 890                 895
Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln Gly Asn Ser Gly Ser Glu
            900                 905                 910
Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asn Lys Gly Tyr
        915                 920                 925
Lys His His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile
    930                 935                 940
Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn
945                 950                 955                 960
Gln Met Phe Glu Glu Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr
                965                 970                 975
Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr Pro His Gln Ile Lys His
            980                 985                 990
Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys
        995                 1000                1005
Pro Asn Arg Lys Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp
    1010                1015                1020
Asp Lys Gly Asn Thr Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp
1025                1030                1035                1040
Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys
                1045                1050                1055
Leu Leu Met Tyr His His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu
            1060                1065                1070
Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr
        1075                1080                1085
Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly
    1090                1095                1100
Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His
1105                1110                1115                1120
Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser Arg Asn Lys Val Val Lys
                1125                1130                1135
Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly Val
            1140                1145                1150
Tyr Lys Phe Val Thr Val Lys Asn Leu Asp Val Ile Lys Lys Glu Asn
        1155                1160                1165
Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys
    1170                1175                1180
Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala Ser Phe Tyr Lys Asn Asp
1185                1190                1195                1200
Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg Val Ile Gly Val Asn Asn
                1205                1210                1215
Asp Leu Leu Asn Arg Ile Glu Val Asn Met Ile Asp Ile Thr Tyr Arg
            1220                1225                1230
Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg Pro Pro His Ile Ile Lys
        1235                1240                1245
Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile
    1250                1255                1260
Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile
1265                1270                1275                1280
Lys Lys Gly Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Ser Asp Tyr
                1285                1290                1295
Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp Tyr Lys Asp
            1300                1305                1310
Asp Asp Asp Lys Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu
        1315                1320                1325
Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu
    1330                1335                1340
Pro Glu Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile
1345                1350                1355                1360
Leu Val His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu
                1365                1370                1375
Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln
            1380                1385                1390
Asp Ser Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro
        1395                1400                1405
Lys Lys Lys Arg Lys Val
    1410
<210> 6
<211> 1596
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val Gly
1               5                   10                  15
Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly Val
            20                  25                  30
Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg Ser
        35                  40                  45
Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile Gln
    50                  55                  60
Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His Ser
65                  70                  75                  80
Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu Ser
                85                  90                  95
Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu Ala
            100                 105                 110
Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr Gly
        115                 120                 125
Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala Leu
    130                 135                 140
Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys Asp
145                 150                 155                 160
Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr Val
                165                 170                 175
Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln Leu
            180                 185                 190
Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg Arg
        195                 200                 205
Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys Asp
    210                 215                 220
Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe Pro
225                 230                 235                 240
Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr Asn
                245                 250                 255
Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn Glu
            260                 265                 270
Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe Lys
        275                 280                 285
Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu Val
    290                 295                 300
Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys Pro
305                 310                 315                 320
Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr Ala
                325                 330                 335
Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala Lys
            340                 345                 350
Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu Thr
        355                 360                 365
Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser Asn
    370                 375                 380
Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile Asn
385                 390                 395                 400
Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala Ile
                405                 410                 415
Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln Gln
            420                 425                 430
Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro Val
        435                 440                 445
Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile Ile
    450                 455                 460
Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg Glu
465                 470                 475                 480
Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys Arg
                485                 490                 495
Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr Gly
            500                 505                 510
Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp Met
        515                 520                 525
Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu Asp
    530                 535                 540
Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro Arg
545                 550                 555                 560
Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys Gln
                565                 570                 575
Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu Ser
            580                 585                 590
Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile Leu
        595                 600                 605
Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu Tyr
    610                 615                 620
Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp Phe
625                 630                 635                 640
Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu Met
                645                 650                 655
Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys Val
            660                 665                 670
Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp Lys
        675                 680                 685
Phe Lys Lys Glu Arg Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
    690                 695                 700
Ala Thr Pro Glu Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met
705                 710                 715                 720
Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val
                725                 730                 735
Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly
            740                 745                 750
Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala Glu Ile
        755                 760                 765
Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile
    770                 775                 780
Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly
785                 790                 795                 800
Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn
                805                 810                 815
Ser Lys Arg Gly Ala Ala Gly Ser Leu Met Asn Val Leu Asn Tyr Pro
            820                 825                 830
Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu
        835                 840                 845
Cys Ala Ala Leu Leu Cys Asp Phe Tyr Arg Met Pro Arg Gln Val Phe
    850                 855                 860
Asn Ala Gln Lys Lys Ala Gln Ser Ser Ile Asn Ser Gly Ser Glu Thr
865                 870                 875                 880
Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Met Glu Ala Ser Pro
                885                 890                 895
Ala Ser Gly Pro Arg His Leu Met Asp Pro His Ile Phe Thr Ser Asn
            900                 905                 910
Phe Asn Asn Gly Ile Gly Arg His Lys Thr Tyr Leu Cys Tyr Glu Val
        915                 920                 925
Glu Arg Leu Asp Asn Gly Thr Ser Val Lys Met Asp Gln His Arg Gly
    930                 935                 940
Phe Leu His Asn Gln Ala Lys Asn Leu Leu Cys Gly Phe Tyr Gly Arg
945                 950                 955                 960
His Ala Glu Leu Arg Phe Leu Asp Leu Val Pro Ser Leu Gln Leu Asp
                965                 970                 975
Pro Ala Gln Ile Tyr Arg Val Thr Trp Phe Ile Ser Trp Ser Pro Cys
            980                 985                 990
Phe Ser Trp Gly Cys Ala Gly Glu Val Arg Ala Phe Leu Gln Glu Asn
        995                 1000                1005
Thr His Val Arg Leu Arg Ile Phe Ala Ala Arg Ile Phe Asp Tyr Asp
    1010                1015                1020
Pro Leu Tyr Lys Glu Ala Leu Gln Met Leu Arg Asp Ala Gly Ala Gln
1025                1030                1035                1040
Val Ser Ile Met Thr Tyr Asp Glu Phe Lys His Cys Trp Asp Thr Phe
                1045                1050                1055
Val Asp His Gln Gly Cys Pro Phe Gln Pro Trp Asp Gly Leu Asp Glu
            1060                1065                1070
His Ser Gln Ala Leu Ser Gly Arg Leu Arg Ala Ile Leu Gln Asn Gln
        1075                1080                1085
Gly Asn Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro
    1090                1095                1100
Glu Ser Asn Lys Gly Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile
1105                1110                1115                1120
Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys Leu Asp Lys Ala
                1125                1130                1135
Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys Gln Ala Glu Ser
            1140                1145                1150
Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu Ile Phe Ile Thr
        1155                1160                1165
Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp Tyr Lys Tyr Ser
    1170                1175                1180
His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu Ile Asn Asp Thr Leu
1185                1190                1195                1200
Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu Ile Val Asn Asn
                1205                1210                1215
Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu Lys Lys Leu Ile
            1220                1225                1230
Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His Asp Pro Gln Thr
        1235                1240                1245
Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly Asp Glu Lys Asn
    1250                1255                1260
Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr Leu Thr Lys Tyr
1265                1270                1275                1280
Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile Lys Tyr Tyr Gly
                1285                1290                1295
Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp Tyr Pro Asn Ser
            1300                1305                1310
Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr Arg Phe Asp Val
        1315                1320                1325
Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val Lys Asn Leu Asp
    1330                1335                1340
Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser Lys Cys Tyr Glu
1345                1350                1355                1360
Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala Glu Phe Ile Ala
                1365                1370                1375
Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn Gly Glu Leu Tyr Arg
            1380                1385                1390
Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile Glu Val Asn Met
        1395                1400                1405
Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met Asn Asp Lys Arg
    1410                1415                1420
Pro Pro His Ile Ile Lys Thr Ile Ala Ser Lys Thr Gln Ser Ile Lys
1425                1430                1435                1440
Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu Tyr Glu Val Lys Ser Lys
                1445                1450                1455
Lys His Pro Gln Ile Ile Lys Lys Gly Gly Ser Pro Lys Lys Lys Arg
            1460                1465                1470
Lys Val Ser Ser Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His
        1475                1480                1485
Asp Ile Asp Tyr Lys Asp Asp Asp Asp Lys Ser Gly Gly Ser Thr Asn
    1490                1495                1500
Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln
1505                1510                1515                1520
Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn
                1525                1530                1535
Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser Thr
            1540                1545                1550
Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr Lys Pro
        1555                1560                1565
Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys Ile Lys Met
    1570                1575                1580
Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1585                1590                1595
<210> 7
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
cttttatcac aggctccagg

Claims (12)

1.一种融合蛋白,其特征在于,所述融合蛋白包括核酸酶,以及插入在其第125和126位氨基酸之间或插入在其第693和694位氨基酸之间的脱氨酶,所述核酸酶为SaCas9蛋白,所述脱氨酶为胞嘧啶脱氨酶和/或腺嘌呤脱氨酶,所述核酸酶的氨基酸序列如SEQ ID NO .1所示。
2.根据权利要求1所述的融合蛋白,其特征在于,所述脱氨酶包括TadA-8e和Y130F突变的A3A。
3.根据权利要求1所述的融合蛋白,其特征在于,所述融合蛋白还包括嘧啶糖苷酶抑制蛋白和核定位信号;所述嘧啶糖苷酶抑制蛋白融合于所述SaCas9蛋白的C端;所述核定位信号融合于所述融合蛋白的C端。
4.如权利要求1~3任一项所述的融合蛋白,其特征在于,所述融合蛋白的氨基酸序列如SEQ ID NO .4、SEQ ID NO .5、SEQ ID NO .6中任意一项所示。
5.一种多核苷酸,其特征在于,所述多核苷酸能编码权利要求1~4任一项所述的融合蛋白。
6.一种向导RNA/核酸酶复合物,其特征在于,所述复合物包括至少一种向导RNA以及权利要求1~4任一项所述的融合蛋白;所述复合物能够识别、结合靶序列的全部或部分并进行切割和脱氨反应。
7.一种载体,其特征在于,其包括权利要求5所述的多核苷酸。
8.权利要求1~4任一项所述的融合蛋白或权利要求5所述的多核苷酸在药物筛选或非疾病诊断或治疗目的的基因修饰中的应用。
9.如权利要求1~4任一项所述的融合蛋白、权利要求5所述的多核苷酸、权利要求6所述的复合物或权利要求7所述的载体在制备基因治疗药物或细胞治疗药物中的应用。
10.一种非疾病诊断或治疗目的的用于修饰宿主细胞基因组的方法,其特征在于,所述方法包括:向包含有至少一个待修饰靶序列的宿主细胞提供至少一种向导RNA和权利要求1~4任一项所述的融合蛋白;所述融合蛋白能够与所述向导RNA形成复合物;所述复合物能够识别、结合所述至少一个待修饰靶序列的全部或部分并任选地使所述至少一个待修饰靶序列的全部或部分产生切口、解旋或切割所述至少一个待修饰靶序列的全部或部分。
11.一种药物组合物,其特征在于,包括权利要求1~4任一项所述的融合蛋白、权利要求5所述的多核苷酸、权利要求6所述的复合物或权利要求7所述的载体,以及药学上可接受的辅助成分。
12.一种用于治疗β-血红蛋白病的药物,其特征在于,所述药物包括靶向BCL11A基因+58位红系增强子中TGN 7-9WGATAR E-box/GATA结合基序的sgRNA,以及与所述sgRNA结合的权利要求1~4任一项所述的融合蛋白;
所述sgRNA的间隔序列的序列为SEQ ID NO .7或与SEQ ID NO .7具有相同功能的序列。
CN202111062182.1A 2021-09-10 2021-09-10 一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用 Active CN113717961B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111062182.1A CN113717961B (zh) 2021-09-10 2021-09-10 一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111062182.1A CN113717961B (zh) 2021-09-10 2021-09-10 一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用

Publications (2)

Publication Number Publication Date
CN113717961A CN113717961A (zh) 2021-11-30
CN113717961B true CN113717961B (zh) 2023-05-05

Family

ID=78683162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111062182.1A Active CN113717961B (zh) 2021-09-10 2021-09-10 一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用

Country Status (1)

Country Link
CN (1) CN113717961B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019042284A1 (en) * 2017-09-01 2019-03-07 Shanghaitech University FUSION PROTEINS FOR ENHANCED PRECISION IN THE BASIC EDITION

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2835861T3 (es) * 2015-05-08 2021-06-23 Childrens Medical Ct Corp Direccionamiento de regiones funcionales del potenciador de BCL11A para la reinducción de hemoglobina fetal
WO2018209712A1 (en) * 2017-05-19 2018-11-22 Tsinghua University Engineering of a minimal sacas9 crispr/cas system for gene editing and transcriptional regulation optimized by enhanced guide rna
WO2019153902A1 (zh) * 2018-02-11 2019-08-15 中国科学院上海生命科学研究院 植物基因组定点替换的方法
WO2019161783A1 (en) * 2018-02-23 2019-08-29 Shanghaitech University Fusion proteins for base editing
CN110835629B (zh) * 2018-08-15 2022-07-26 华东师范大学 一种新型碱基转换编辑系统的构建方法及其应用
CN110835632B (zh) * 2018-08-15 2022-01-11 华东师范大学 新型碱基转换编辑系统用于基因治疗的应用
CN112280771A (zh) * 2019-07-10 2021-01-29 中国科学院遗传与发育生物学研究所 双功能基因组编辑系统及其用途
CN112746072A (zh) * 2019-10-31 2021-05-04 广州瑞风生物科技有限公司 用于β-血红蛋白病基因编辑的sgRNA及应用
CN112979821B (zh) * 2019-12-18 2022-02-08 华东师范大学 一种提高基因编辑效率的融合蛋白及其应用
CN112251464B (zh) * 2020-10-19 2023-09-12 复旦大学附属中山医院 一种基因点突变的诱导方法
CN112608948A (zh) * 2020-12-23 2021-04-06 神拓生物技术(无锡)有限公司 两种多功能基因编辑工具的构造及其使用方法
CN112877314B (zh) * 2021-03-08 2023-06-13 四川大学 一种诱导型碱基编辑系统及其应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019042284A1 (en) * 2017-09-01 2019-03-07 Shanghaitech University FUSION PROTEINS FOR ENHANCED PRECISION IN THE BASIC EDITION
CN111065647A (zh) * 2017-09-01 2020-04-24 上海科技大学 用于提高碱基编辑精度的融合蛋白

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Engineering domain-inlaid SaCas9 adenine base editors with reduced RNA off-targets and increased on-target DNA editing;Minh Thuan Nguyen Tran et al.;《NATURE COMMUNICATIONS》;第11卷;1-10 *

Also Published As

Publication number Publication date
CN113717961A (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
EP3858990A1 (en) Engineered crispr-cas9 nucleases with altered pam specificity
KR20170063399A (ko) F. novicida 유래 Cas9을 포함하는 유전체 교정용 조성물
KR20210023831A (ko) 프로그래밍가능한 염기 편집기 시스템을 이용하여 병원성 아미노산을 치환하는 방법
CA3002827A1 (en) Nucleobase editors and uses thereof
Lang et al. Structural organization of the human TOP2A and TOP2B genes
CA3128755A1 (en) Compositions and methods for treating hemoglobinopathies
JPWO2020191234A5 (zh)
JP7001272B2 (ja) ゲノム配列改変技術における変異導入効率の向上方法、及びそれに用いる分子複合体
CN116209755A (zh) 可编程核酸酶和使用方法
US20230374482A1 (en) Base editing enzymes
US20230203481A1 (en) Effector proteins and methods of use
Willis et al. Compact zinc finger base editors that edit mitochondrial or nuclear DNA in vitro and in vivo
CN113717961B (zh) 一种融合蛋白及其多核苷酸、碱基编辑器及其在药物制备中的应用
Burnett et al. Examination of the cell cycle dependence of cytosine and adenine base editors
CN116656649A (zh) 一种is200/is60s转座子iscb突变蛋白及其应用
KR20200135225A (ko) 단일염기 치환 단백질 및 이를 포함하는 조성물
WO2023081855A1 (en) Base editing enzymes
CN112877314B (zh) 一种诱导型碱基编辑系统及其应用
US20200347441A1 (en) Transposase compositions, methods of making, and methods of screening
KR102151064B1 (ko) 매칭된 5&#39; 뉴클레오타이드를 포함하는 가이드 rna를 포함하는 유전자 교정용 조성물 및 이를 이용한 유전자 교정 방법
CN113564145A (zh) 用于胞嘧啶碱基编辑的融合蛋白及其应用
CN115772523A (zh) 一种碱基编辑工具
WO2019194320A1 (ja) エンジニアリングされたBlCas9ヌクレアーゼ
CN116836962B (zh) 工程化的腺苷脱氨酶及碱基编辑器
WO2022045169A1 (ja) エンジニアリングされたCjCas9タンパク質

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20221024

Address after: Room 401 and 402, Floor 4, Building 2, No. 366, Hemin Street, High tech Zone, Chengdu, Sichuan 610065

Applicant after: Chengdu Saiengino Biotechnology Co.,Ltd.

Address before: 610041, No. 24, south section of first ring road, Chengdu, Sichuan, Wuhou District

Applicant before: SICHUAN University

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant