CN109689693B - 提高基因编辑效率的方法和系统 - Google Patents

提高基因编辑效率的方法和系统 Download PDF

Info

Publication number
CN109689693B
CN109689693B CN201680088506.XA CN201680088506A CN109689693B CN 109689693 B CN109689693 B CN 109689693B CN 201680088506 A CN201680088506 A CN 201680088506A CN 109689693 B CN109689693 B CN 109689693B
Authority
CN
China
Prior art keywords
lys
leu
glu
asp
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680088506.XA
Other languages
English (en)
Other versions
CN109689693A (zh
Inventor
王健
胡莹莹
罗舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Publication of CN109689693A publication Critical patent/CN109689693A/zh
Application granted granted Critical
Publication of CN109689693B publication Critical patent/CN109689693B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供了一种提高基因编辑效率的方法和系统,具体地,本发明公开了将PEST短肽和Cas9蛋白融合后形成的融合蛋白能够显著提高基因编辑的效率。

Description

提高基因编辑效率的方法和系统
技术领域
本发明属于生物技术领域,具体地说,本发明涉及提高基因编辑效率的方法和系统。
背景技术
CRISPR/Cas9或CRISPR-Cas9系统是近年来兴起的用于基因编辑的工具。该系统由能够特异性识别DNA序列的sgRNA和能够切割DNA序列的Cas9核酸酶组成。通过Cas9对基因组上特定序列的切割,可以实现定点突变、片段删除或倒位等修饰。在加入外源供体DNA的条件下,还能够实现定点插入或替换,包括同源重组介导的精确的遗传修饰。除了对基因组进行编辑,工程化的Cas9还可以对RNA、转录水平、以及表观遗传进行调控。尽管CRISPR/Cas9技术具有简便、快速、特异等优点,但在细胞、动物、植物的应用中,其效率尚不能充分满足基因编辑,尤其是定点插入或替换的需求。提高这一系统的效率是基因编辑技术领域关注的重点。
因此,本领域技术人员致力于开发提高基因编辑效率的方法及其应用。
发明内容
本发明的目的在于提供一种提高基因编辑效率的方法和系统。
在本发明的第一方面,提供了一种融合蛋白,所述的融合蛋白具有式Ia或Ib所述结构:
E-P (Ia)
P-E (Ib)
其中,
E为核酸内切酶蛋白元件;
P为PEST蛋白元件;
“-”表示连接上述各元件的肽键或肽接头。
在另一优选例中,所述的核酸内切酶蛋白元件选自下组:Cas9蛋白(包括SpCas9、SaCas9、NmCas9、St1Cas9)及其变体(如SpCas9的VQR、EQR、VRER等变体)、Cpf1蛋白(包括AsCpf1、FnCpf1、LbCpf1)、C2c2蛋白、Argonaute蛋白家族;TALE蛋白、锌指蛋白、dCas9等与FokI融合构成的人工核酸内切酶。
在另一优选例中,所述核酸内切酶蛋白元件为Cas9蛋白。
在另一优选例中,所述SpCas9蛋白的氨基酸序列如SEQ ID NO.1所示。
在另一优选例中,所述PEST蛋白元件选自下组:
ODC1蛋白的PEST序列、GCN4蛋白的PEST序列、CLN2/CLN3蛋白的PEST序列、NIMA蛋白的PEST序列、Cactus蛋白的PEST序列、HDC蛋白的PEST序列、CPEB蛋白的PEST序列、NPDC1蛋白的PEST序列、FOS蛋白的PEST序列、NFKBIA蛋白的PEST序列等。
在另一优选例中,所述PEST蛋白元件的氨基酸序列如SEQ ID NO.2所示。
在另一优选例中,所述融合蛋白的氨基酸序列选自下组:
(A)具有SEQ ID NO.2所示氨基酸序列的多肽;
(B)具有与SEQ ID NO.2所示氨基酸序列≥80%同源性(优选地,≥90%的同源性;等优选地≥95%的同源性;最优选地,≥97%的同源性,如98%以上,99%以上)的多肽,且所述多肽具有基因编辑活性;
(C)将SEQ ID NO.3所示氨基酸序列经过1-10个氨基酸残基的取代、缺失或添加而形成的,且保留基因编辑活性的衍生多肽。
在另一优选例中,所述融合蛋白(E-P or P-E)中的肽键或肽接头的长度为0-30个氨基酸。
在另一优选例中,所述融合蛋白还包括任选地核定位信号元件(Nuclearlocation signal,NLS);优选地所述核定位信号元件添加在融合蛋白的N端或者C端,或者同时添加在N端和C端。
在本发明的第二方面,提供了一种分离的多核苷酸,所述的多核苷酸编码本发明第一方面所述的融合蛋白。
在另一优选例中,所述多核苷酸包括适于原核或真核细胞表达的密码子优化序列。
在另一优选例中,所述多核苷酸为DNA或RNA。
在另一优选例中,所述多核苷酸为mRNA。
在本发明的第三方面,提供了一种载体,所述载体含有本发明第二方面所述的多核苷酸。
在另一优选例中,所述的载体包括质粒、病毒载体等。
在另一优选例中,所述的病毒载体包括:慢病毒载体、腺病毒载体、腺相关病毒载体、逆转录病毒载体、黄热病毒载体和疱疹病毒载体等。
在另一优选例中,所述的载体包括原核和真核表达载体。
在本发明的第四方面提供了一种基因工程细胞,所述基因工程细胞含有本发明第三方面所述的载体,或含有本发明第二方面所述的多核苷酸,或含有本发明第一方面所述的融合蛋白。
在另一优选例中,所述基因工程细胞包括原核细胞和真核细胞。
在另一优选例中,所述基因工程细胞为动物细胞、植物细胞、或微生物细胞。
在另一优选例中,所述细胞为生殖细胞或受精卵。
在本发明的第五方面,提供了一种基因编辑系统,所述基因编辑系统包括本发明第一方面所述的融合蛋白、或本发明第二方面所述的多核苷酸、或本发明第三方面的载体。
在另一优选例中,所述基因编辑系统选自下组:CRISPR/Cas基因编辑系统、CRISPR/Cpf1基因编辑系统、CRISPR/C2c2基因编辑系统、Argonaute/gDNA基因编辑系统、锌指核酸酶基因编辑系统(ZFNs)、和类转录激活因子核酸酶基因编辑系统(TALENs)。
本发明的第六方面,提供了一种核酸内切酶介导的基因编辑方法,所述方法包括步骤:
使用本发明第一方面所述的融合蛋白对靶基因进行编辑。
在本发明的第七方面,提供了一种提高核酸内切酶介导的基因编辑系统的基因编辑效率的方法,所述方法包括步骤:
在靶细胞中,表达PEST蛋白和核酸内切酶的融合蛋白。
在另一优选例中,所述方法中将所述PEST蛋白的编码序列融合至所述核酸内切酶基因的5’或3’端。
在另一优选例中,所述方法包括步骤:
在靶细胞中,表达本发明第一方面所述的融合蛋白。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了核酸内切酶蛋白元件与PEST蛋白元件融合的方式。PEST元件可以位于核酸内切酶元件的C端或者N端,其中的短线代表两者之间的肽键或肽接头,为0-30个氨基酸残基。
图2a和图2b分别显示了示范SpCas9蛋白的氨基酸序列(SEQ NO:1)和编码多核苷酸序列(SEQ ID NO.4)。
图3显示了示范小鼠ODC1蛋白的PEST结构域的氨基酸序列(SEQ ID NO.2)和编码多核苷酸序列(SEQ ID NO.5)。
图4a和图4b分别显示了一例将小鼠ODC1蛋白的PEST结构域融合至SpCas9蛋白C端所得融合蛋白的氨基酸序列(SEQ ID NO.3)和编码多核苷酸序列(SEQ ID NO.6)。
图5显示了示范Cas9-PEST质粒图谱。在原有的pGH-T7-Cas9载体上,Cas9编码序列与核定位信号(NLS)序列之间加入PEST编码序列的完整的质粒图谱。方框标记了PEST编码序列的位置。
图6显示了斑马鱼gata1a基因的结构和CRISPR/Cas9靶位点信息。该基因具有6个外显子(方框所示,实心部分代表编码区,空心部分代表非编码区),本发明实施例中所选择的CRISPR/Cas9靶位点位于第5个外显子上(背景为灰色的序列),可用SpeI酶切位点来检测该靶位点的效率。
图7显示了通过PCR制备gata1a靶位点的sgRNA模板的电泳检测结果,模板大小为120bp。
图8显示了Cas9-PEST提高了斑马鱼gata1a基因靶位点的定点突变效率。选择斑马鱼gata1a基因上的已知靶位点,注射相同剂量的Cas9和Cas9-PEST,使用限制性内切酶法检测定点突变效率(最上面的条带为突变的条带,黑色三角指示。该条带的亮度占三条带总亮度的比值即为突变效率。ImageJ软件可以量化条带的亮度),计算两组各6个样品的平均效率分别为22.5%和35.2%(对照组为未注射的样品),表明PEST有助于提高Cas9的工作效率。
图9显示了斑马鱼mstnb基因的结构和CRISPR/Cas9靶位点信息。该基因具有3个外显子(方框所示,实心部分代表编码区,空心部分代表非编码区),本发明实施例中所选择的CRISPR/Cas9靶位点位于第1个外显子上(背景为灰色的序列),可用BslI酶切位点来检测该靶位点的效率。
图10显示了Cas9-PEST可将斑马鱼mstnb基因靶位点的定点突变效率从13.4%提高至56.1%。
具体实施方式
本发明人通过广泛而深入的研究后发现,将PEST短肽和Cas9蛋白融合后形成的融合蛋白能够显著提高基因编辑效率,在此基础上,完成了本发明。
在描述本发明之前,应当理解本发明不限于所述的具体方法和实验条件,因为这类方法和条件可以变动。还应当理解本文所用的术语其目的仅在于描述具体实施方案,并且不意图是限制性的,本发明的范围将仅由所附的权利要求书限制。
除非另外定义,否则本文中所用的全部技术与科学术语均具有如本发明所属领域的普通技术人员通常理解的相同含义。如本文所用,在提到具体列举的数值中使用时,术语“约”意指该值可以从列举的值变动不多于1%。例如,如本文所用,表述“约100”包括99和101和之间的全部值(例如,99.1、99.2、99.3、99.4等)。
虽然在本发明的实施或测试中可以使用与本发明中所述相似或等价的任何方法和材料,本文在此处例举优选的方法和材料。
本发明要解决的问题是提高CRISPR系统在受精卵分裂早期的编辑效率,从而增加在动物成体的编辑效率。本方法通过提高Cas9 mRNA翻译的速率,促使Cas9蛋白能够在受精卵发育早期中尽早地发挥功能,且更有效地编辑靶向基因。
通过在Cas9编码区域的3’端融合小鼠ODC1蛋白中PEST序列的编码序列,可有效提高Cas9mRNA翻译成为蛋白的速率,从而提高基因编辑的效率。
本发明中选择将ODC1蛋白中的PEST序列与Cas9进行融合,其他可以有效提高Cas9mRNA翻译效率的序列或者结构域,比如其他蛋白的PEST序列,与Cas9进行融合后,都有可能提高在动物中CRISPR/Cas9介导的基因编辑效率。
另外需指出,作为本发明的一个例子使用的Cas9是经过斑马鱼密码子优化的SpCas9。本发明还可能用于改造SaCas9、NmCas9、St1Cas9、Cpf1、C2c2、Argonaute、TALEN、ZFN等任何用于基因编辑的内切酶。
PEST蛋白
PEST蛋白(PEST短肽)是一类特殊的信号肽,富含脯氨酸(P)、谷氨酸(E)、丝氨酸(S)和苏氨酸(T),可使蛋白的半衰期缩短。
已知自然界中的多种蛋白如ODC1、HDC、NPDC、CPEB、NFKBIA等含有PEST短肽(结构域),实验表明它们与蛋白的快速降解有关,降解的途径可能是通过蛋白酶体或者钙蛋白酶。PEST短肽的序列、长度、位置和二级结构在不同蛋白中都有所变化,有些蛋白含有多个PEST结构域。
在本发明的一个优选地实施方式中,所述PEST蛋白元件选自下组:
ODC1蛋白的PEST序列、GCN4蛋白的PEST序列、CLN2/CLN3蛋白的PEST序列、NIMA蛋白的PEST序列、Cactus蛋白的PEST序列、HDC蛋白的PEST序列、CPEB蛋白的PEST序列、NPDC1蛋白的PEST序列、FOS蛋白的PEST序列、NFKBIA蛋白的PEST序列等(具体可参考文献:Rogerset al.1986,Rechsteiner and Rogers 1996,Fleming and Wang 2000,Reverte etal.2001,Spencer et al.2004)
在本发明的一个优选的实施方式中,所述PEST蛋白的氨基酸序列如SEQ ID NO.2所示;其编码核苷酸序列(来自小鼠Odc1的cDNA)如SEQ ID NO.5所示。
核酸内切酶蛋白元件
本发明中所述的核酸内切酶蛋白元件是指可以用于基因编辑的核酸内切酶、其变体、及其活性片段。
典型的核酸内切酶包括:Cas9蛋白(包括SpCas9、SaCas9、NmCas9、St1Cas9)及其变体(如SpCas9的VQR、EQR、VRER等变体)(Cong et al.2013,Hou et al.2013,Mali etal.2013,Kleinstiver et al.2015,Ran et al.2015)、Cpf1蛋白(包括AsCpf1、FnCpf1、LbCpf1)(Zetsche et al.2015,Kim et al.2016,Kleinstiver et al.2016)、C2c2蛋白(Abudayyeh et al.2016)、Argonaute蛋白家族(Gao et al.2016);TALE蛋白、锌指蛋白、dCas9等与FokI融合构成的人工核酸内切酶(Kim et al.1996,Bibikova et al.2002,Miller et al.2011,Tsai et al.2014)。
CRISPR/Cas系统
CRISPR/Cas系统为目前发现存在于大多数细菌与所有的古菌中的一种后天免疫系统,以消灭外来的质体或者噬菌体,并在自身基因组中留下外来基因片段作为“记忆”。全名为常间回文重复序列丛集/常间回文重复序列丛集关联蛋白系统(clustered regularlyinterspaced short palindromic repeats/CRISPR-associated proteins)。
目前已发现三种不同类型的CRISPR/Cas系统,存在于大约40%和90%已测序的细菌和古菌中。其中第二型的组成较为简单,以Cas9蛋白以及向导RNA(gRNA)为核心的组成,由于其对DNA干扰(DNAi)的特性,目前被积极地应用于遗传工程中,作为基因体剪辑工具,与锌指核酸酶(ZFN)及类转录活化因子核酸酶(TALEN)同样利用非同源性末端接合(NHEJ)的机制,于基因体中产生去氧核糖核酸的双股断裂以利剪辑。二型CRISPR/Cas并经由遗传工程的改造应用于哺乳类细胞及斑马鱼的基因体剪辑。其设计简单以及操作容易的特性为最大的优点。未来将可应用在各种不同的模式生物当中。
称为CRISPR的基因组重复丛集,即原核生物拟核DNA链中的丛生重复序列,在1987关于E.coli的一份研究报告中被首次描述。2000年,相似的重复序列在其它真细菌和古细菌中被发现并被命名为短间隔重复序列(Short Regularly Spaced Repeats,SRSR)。2002年SRSR被重命名为CRISPR。其中一部分基因编码的蛋白为核酸酶和解旋酶。这些关联蛋白(CAS,CRISPR-associated proteins)与CRISPR组成了CRISPR/Cas系统。
CRISPR/Cas技术
本发明所称的“CRISPR/Cas技术”、“CRISPR/Cas基因编辑”、“CRISPR/Cas基因编辑技术”、“CRISPR/Cas基因编辑方法”均指利用CRISPR/Cas系统的原理对目的基因进行改造的基因编辑技术。
Cas9蛋白及其变体
CRISPR/Cas的核心就是Cas9蛋白以及向导RNA(gRNA)。在不同物种中能够利用CRISPR/Cas系统进行基因编辑的核心技术,首要一步即在该物种中异源表达有DNA剪切酶活性的Cas9蛋白,第二步则是获得gRNA和靶点同源序列将Cas9引导至靶点进行DNA剪切。其中第二步中,具体的操作方法是本领域技术人员所熟知的。
来源于Streptococcus pyogenes的Cas9蛋白是一种多结构域多功能的Cas蛋白,其N端具有类RuvC核酸酶的结构域,其中部具有HNH核酸酶结构域。Cas9蛋白与gRNA结合能够实现在特异位点处切割DNA,来源于Streptococcus pyogenes的CRISPR/Cas系统识别序列为23bp,并能靶向20bp,其识别位点最末3位NGG序列被称作PAM(protospacer adjacentmotif)序列,其对于DNA切割非常重要。目前大多数真核生物(包括家蚕、拟南芥、酵母、线虫等)的CRISPR/Cas系统最初均源自Streptococcus pyogenes,Cas9蛋白则多是经过人源化改造或其它物种的密码子优化。
较佳地,本发明所提供的Cas9来源于化脓链球菌(Streptococcus pyogenes)。在本发明的一个优选地实施方式中,所述Cas9蛋白的氨基酸序列如SEQ ID NO.1所示;
其编码核酸序列(经过斑马鱼密码子优化)如SEQ ID NO.4所示。
融合蛋白
本发明提供了PEST蛋白和Cas9蛋白的融合蛋白及其编码序列(包括DNA、mRNA)。
本发明的融合蛋白,可任选地含有连接肽。连接肽大小和复杂性可能会影响蛋白的活性。通常,连接肽应当具有足够的长度和柔韧性,以保证连接的两个蛋白在空间上有足够的自由度以发挥其功能。同时避免连接肽中形成α螺旋或β折叠等对融合蛋白的稳定性的影响。连接肽的长度一般为0-30个氨基酸,较佳地1-5个氨基酸。
应理解,所述术语还包括本发明融合蛋白的衍生物,指本发明融合蛋白在经过1-3个氨基酸添加或替换、1-2个氨基酸缺失并仍具有基因编辑活性的多肽。这些保守性变异多肽最好根据表1进行氨基酸替换而产生。
表1
Figure GPA0000263056150000071
Figure GPA0000263056150000081
一旦鉴定获得了相关的肽序列,就可以用重组法来大批量地获得相关肽序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到相关肽(融合蛋白)。
此外,还可用化学方法直接合成相关肽序列。
在本发明的一个优选地实施方式中,所述融合蛋白的氨基酸序列如SEQ ID NO.3所示,其编码多核苷酸序列如SEQ ID NO.6所示。
多核苷酸
本发明的多核苷酸,是编码本发明融合蛋白的DNA或RNA序列,可以全序列人工合成。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。RNA形式包括mRNA。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的蛋白质片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码多肽的功能。
如本文所用,术语“引物”指的是在与模板配对,在DNA聚合酶的作用下能以其为起点进行合成与模板互补的DNA链的寡聚核苷酸的总称。引物可以是天然的RNA、DNA,也可以是任何形式的天然核苷酸。引物甚至可以是非天然的核苷酸如LNA或ZNA等。引物“大致上”(或“基本上”)与模板上一条链上的一个特殊的序列互补。引物必须与模板上的一条链充分互补才能开始延伸,但引物的序列不必与模板的序列完全互补。比如,在一个3’端与模板互补的引物的5’端加上一段与模板不互补的序列,这样的引物仍大致上与模板互补。只要有足够长的引物能与模板充分的结合,非完全互补的引物也可以与模板形成引物-模板复合物,从而进行扩增。
本发明融合蛋白或其元件的核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据已公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如本文所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列地转录,那么它就是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般“可操作地连于”意味着相邻近,而对于分泌前导序列则意味着在阅读框中相邻。
如本文所用,术语“载体”包括质粒、粘粒、表达载体、克隆载体等。
在本发明中,可选用本领域已知的各种载体如市售的载体。比如,选用市售的载体,然后将编码本发明新免疫毒素的核苷酸序列可操作地连于表达调控序列,形成蛋白表达载体。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或融合蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述蛋白质的方法。
本领域的技术人员熟知的方法能用于构建含本发明蛋白的编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞(基因工程细胞)可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、NSO、COS7、或293细胞的动物细胞等。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的蛋白质可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
在基因编辑过程中,可以对编码本发明融合蛋白的基因进行体外转录,获得对应的mRNA,然后将mRNA注射入靶细胞中翻译产生本发明的融合蛋白,在gRNA配合下对靶基因进行编辑。
基因编辑方法
本发明通过无缝克隆的方法将编码PEST短肽的DNA序列融合至Cas9编码序列的3’端,然后体外转录得到Cas9-PEST mRNA用于受精卵注射。具体的方案如下:
1.将pGH-T7-Cas9载体(该载体参考文献(Liu et al.2014),此处Cas9为经过斑马鱼密码子优化的Cas9编码序列)用SphI和XbaI两种限制性内切酶进行双酶切,切除Cas9C端编码区及核定位信号(NLS),电泳后回收载体骨架。
2.从小鼠cDNA文库中扩增ODC1蛋白所含的PEST编码序列,在扩增的上、下游引物外侧分别加入与Cas9、NLS重叠的约20bp序列,扩增的产物命名为片段A。
3.从原载体上分别扩增Cas9C端编码区及NLS,扩增时也需要在引物外侧加上与载体骨架或PEST编码序列重叠的约20bp序列,扩增的产物命名为片段B和片段C。
4.使用诺维赞公司的无缝克隆试剂盒(ClonExpressMultiS One Step CloningKit)将A、B、C三个片段与载体骨架连接,由于片段间的重叠序列的设置,三个片段会按照B→A→C的顺序连入载体骨架,即成功将PEST编码序列插入Cas9和NLS之间(图5),获得Cas9-PEST质粒。
5.质粒经测序验证后,使用XbaI进行线性化。回收线性化产物作为模板,利用T7RNA聚合酶进行体外转录,获得Cas9-PEST mRNA。可将此mRNA与sgRNA按照终浓度分别为200~300ng/μL和40~60ng/μL混合,注射斑马鱼受精卵,每枚受精卵注射2nL。
本发明的主要优点在于:
(1)本发明提供了能够显著提高基因编辑效率的CRISPR/Cas9系统。
(2)与使用Cas9蛋白相比,本发明成本更低,灵活性更高。
(3)本发明可以应用于其他的内切酶,不受合成蛋白的限制。
下面结合具体实施例,进一步详陈本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明详细条件的实验方法,通常按照常规条件如美国Sambrook.J等著《分子克隆实验室指南》(黄培堂等译,北京:科学出版社,2002年)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。以下实施例中所用的实验材料和试剂如无特别说明均可从市售渠道获得。
实施例1
以斑马鱼gata1a基因第5个外显子中的CRISPR/Cas9靶位点(图6)为例,比较Cas9mRNA和Cas9-PEST mRNA在斑马鱼胚胎中的基因编辑效率。步骤如下:
1.制备sgRNA:首先以pMD19-gRNA scaffold质粒(Chang et al.2013)为模板,PCR扩增用于体外转录的sgRNA模板。PCR的正向引物T7-gata1aE5-sfd:5’-taatacgactcactataGTAGTGTTGTAGTACTAGTGgttttagagctagaaatagc-3’(其中小写部分为T7启动子序列和scaffold,固定不变;大写部分为靶位点序列);反向引物tracr rev:5’-aaaaaaagcaccgactcggtgccac-3’。使用2×TaqPlatiumMix(TIANGEN公司)进行PCR,电泳检测为单一条带后(图7),使用超薄DNA产物纯化试剂盒(TIANGEN公司)对PCR产物进行纯化,得到用于体外转录sgRNA的模板。该模板的全序列为:
5’-taatacgactcactataGTAGTGTTGTAGTACTAGTGgttttagagctagaaatagcaagtta(SEQ ID NO.7);
aaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt-3’(SEQ IDNO.8)。
然后使用T7 RNA聚合酶体系(Takara公司)体外转录sgRNA,反应体系一般为20μL。转录完成后加入1μL DNase I(Takara公司)去除模板。
最后通过乙醇沉淀法纯化sgRNA:用RNase-free H2O将反应体系稀释至200μL,再加入550μL无水乙醇和20μL3M醋酸钠,混合均匀后于冰上放置10分钟。接着在4℃离心机以13000g的转速离心15分钟,小心弃去上清后,加入500μL RNase-free的70%乙醇,以4℃,13000g离心5分钟,再次弃去上清。室温晾干后,加入30μL RNase-free H2O溶解,得到sgRNA储液。Nanodrop测定浓度后于-20℃保存,注射时进行稀释。
2.制备Cas9 mRNA和Cas9-PEST mRNA:将改造前的pGH-T7-Cas9质粒和改造的Cas9-PEST质粒都用XbaI(NEB公司)进行线性化,电泳检测后使用普通DNA产物纯化试剂盒(TIANGEN公司)回收线性化产物。以各1μg线性化产物为模板,用T7 mMESSAGE mMACHINE试剂盒(Ambion公司)体外转录两种mRNA,反应体系一般为20μL。转录完成后加入1μL TURBODNase(Ambion公司)去除模板。
通过氯化锂沉淀法纯化两种mRNA:向20μL反应体系中加入30μL氯化锂和30μLRNase-free H2O,混合均匀后于-20℃放置2小时以上。接着在4℃离心机以13000g的转速离心15分钟,小心弃去上清后,加入500μL RNase-free的70%乙醇,以4℃,13000g离心5分钟,再次弃去上清。室温晾干后,加入30μL RNase-free H2O溶解,得到Cas9 mRNA储液和Cas9-PEST mRNA储液。Nanodrop测定浓度后于-20℃保存,注射时进行稀释。
3.显微注射:配置两种注射液各5μL,Cas9 mRNA(或Cas9-PEST mRNA)的终浓度为200ng/μL,sgRNA的终浓度为50ng/μL,注射液中加入约5%体积的酚红溶液作为指示剂。将斑马鱼的受精卵分为三组,第一组注射Cas9 mRNA+sgRNA,第二组注射Cas9-PEST mRNA+sgRNA,第三组不注射作为对照。确保注射的时期都是单细胞期,注射量都是每枚卵2nL。
4.检测基因编辑效率:待受精卵发育至24小时,从两个实验组中各取6×3枚,对照组中取2×3枚提取基因组。用gata1a基因靶位点的上、下游引物,通过PCR扩增基因组上覆盖靶位点的序列。引物序列信息见表2。
表2实施例中所用基因靶位点的检测引物
Figure GPA0000263056150000121
使用2×HotstartTaq PCR StarMix(GenStar公司)进行PCR,电泳检测为单一条带后,用SpeI(NEB公司)(靶位点上含有的限制性内切酶位点且在PCR产物上是唯一的)对PCR产物进行酶切,再通过电泳检测酶切产物。由于Cas9在靶位点的切割引发定点突变,可能破坏SpeI酶切位点,因此实验组的PCR产物不能完全被SpeI切开,未酶切的比例可代表定点突变的效率,即Cas9的基因编辑效率,而对照组的PCR产物则能完全被切开。
通过计算,注射400pg Cas9 mRNA+100pg sgRNA引起的定点突变效率为22.5%,而注射相同剂量的Cas9-PEST mRNA+sgRNA可将定点突变效率提升至35.2%(图8),基因编辑效率提高了约56%。
实施例2
以斑马鱼mstnb基因第1个外显子中的CRISPR/Cas9靶位点(图9)为例,比较Cas9mRNA和Cas9-PEST mRNA在斑马鱼胚胎中的基因编辑效率。步骤与实施例1相似。经计算,注射400pg Cas9 mRNA+100pg sgRNA引起的定点突变效率为13.4%,而注射相同剂量的Cas9-PEST mRNA+sgRNA可将定点突变效率提升至56.1%(图10),与对照组相比突变效率提高了约4倍。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
参考文献
Abudayyeh,O.O.,J.S.Gootenberg,S.Konermann,J.Joung,I.M.Slaymaker,D.B.Cox,S.Shmakov,K.S.Makarova,E.Semenova,L.Minakhin,K.Severinov,A.Regev,E.S.Lander,E.V.Koonin and F.Zhang(2016).″C2c2 is a single-componentprogrammable RNA-guided RNA-targeting CRISPR effector.″Science 353(6299):aaf5573.
Bibikova,M.,M.Golic,K.G.Golic and D.Carroll(2002).″Targetedchromosomal cleavage and mutagenesis in Drosophila using zinc-fingernucleases.″Genetics 161(3):1169-1175.
Chang,N.,C.Sun,L.Gao,D.Zhu,X.Xu,X.Zhu,J.W.Xiong and J.J.Xi(2013).″Genome editing with RNA-guided Cas9 nuclease in zebrafish embryos.″Cell Res23(4):465-472.
Cong,L.,F.A.Ran,D.Cox,S.Lin,R.Barretto,N.Habib,P.D.Hsu,X.Wu,W.Jiang,L.A.Marraffini and F.Zhang(2013).″Multiplex genome engineering using CRISPR/Cas systems.″Science 339(6121):819-823.
Fleming,J.V.and T.C.Wang(2000).″Amino-and carboxy-terminal PESTdomains mediate gastrin stabilization of rat L-histidine decarboxylaseisoforms.″Mol Cell Biol 20(13):4932-4947.
Gao,F.,X.Z.Shen,F.Jiang,Y.Wu and C.Han(2016).″DNA-guided genomeediting using the Natronobacterium gregoryi Argonaute.″Nat Biotechnol 34(7):768-773.
Hou,Z.,Y.Zhang,N.E.Propson,S.E.Howden,L.F.Chu,E.J.Sontheimer andJ.A.Thomson(2013).″Efficient genome engineering in human pluripotent stemcells using Cas9 from Neisseria meningitidis.″Proc Natl Acad Sci U S A 110(39):15644-15649.
Kim,D.,J.Kim,J.K.Hur,K.W.Been,S.H.Yoon and J.S.Kim(2016).″Genome-wideanalysis reveals specificities of Cpf1 endonucleases in human cells.″Nat Biotechnol 34(8):863-868.
Kim,Y.G.,J.Cha and S.Chandrasegaran(1996).″Hybrid restrictionenzymes:zinc finger fusions to Fok I cleavage domain.″Proc Natl Acad Sci U S A 93(3):1156-1160.
Kleinstiver,B.P.,M.S.Prew,S.Q.Tsai,V.V.Topkar,N.T.Nguyen,Z.Zheng,A.P.Gonzales,Z.Li,R.T.Peterson,J.R.Yeh,M.J.Aryee and J.K.Joung(2015).″Engineered CRISPR-Cas9 nucleases with altered PAM specificities.″Nature 523(7561):481-485.
Kleinstiver,B.P.,S.Q.Tsai,M.S.Prew,N.T.Nguyen,M.M.Welch,J.M.Lopez,Z.R.McCaw,M.J.Aryee and J.K.Joung(2016).″Genome-wide specificities of CRISPR-Cas Cpf1 nucleases in human cells.″Nat Biotechnol 34(8):869-874.
Liu,D.,Z.Wang,A.Xiao,Y.Zhang,W.Li,Y.Zu,S.Yao,S.Lin and B.Zhang(2014).″Efficient gene targeting in zebrafish mediated by a zebrafish-codon-optimized cas9 and evaluation of off-targeting effect.″J Genet Genomics 41(1):43-46.
Mali,P.,L.Yang,K.M.Esvelt,J.Aach,M.Guell,J.E.DiCarlo,J.E.Norville andG.M.Church (2013).″RNA-guided human genome engineering via Cas9.″Science 339(6121):823-826.
Miller,J.C.,S.Tan,G.Qiao,K.A.Barlow,J.Wang,D.F.Xia,X.Meng,D.E.Paschon,E.Leung,S.J.Hinkley,et al.(2011).″A TALE nuclease architecturefor efficient genome editing.″Nat Biotechnol 29(2):143-148.
Ran,F.A.,L.Cong,W.X.Yan,D.A.Scott,J.S.Gootenberg,A.J.Kriz,B.Zetsche,O.Shalem,X.Wu,K.S.Makarova,E.V.Koonin,P.A.Sharp and F.Zhang(2015).″In vivogenome editing using Staphylococcus aureus Cas9.″Nature 520(7546):186-191.
Rechsteiner,M.and S.W.Rogers(1996).″PEST sequences and regulation byproteolysis.″Trends Biochem Sci 21(7):267-271.
Reverte,C.G.,M.D.Ahearn and L.E.Hake(2001).″CPEB degradation duringXenopus oocyte maturation requires a PEST domain and the 26S proteasome.″Dev Biol 231(2):447-458.
Rogers,S.,R.Wells and M.Rechsteiner(1986).″Amino acid sequencescommon to rapidly degraded proteins:the PEST hypothesis.″Science 234(4774):364-368.
Spencer,M.L.,M.Theodosiou and D.J.Noonan(2004).″NPDC-1,a novelregulator of neuronal proliferation,is degraded by the ubiquitin/proteasomesystem through a PEST degradation motif.″J Biol Chem 279(35):37069-37078.
Tsai,S.Q.,N.Wyvekens,C.Khayter,J.A.Foden,V.Thapar,D.Reyon,M.J.Goodwin,M.J.Aryee and J.K.Joung(2014).″Dimeric CRISPR RNA-guided FokInucleases for highly specific genome editing.″Nat Biotechnol 32(6):569-576.
Zetsche,B.,J.S.Gootenberg,O.O.Abudayyeh,I.M.Slaymaker,K.S.Makarova,P.Essletzbichler,S.E.Volz,J.Joung,J.van der Oost,A.Regev,E.V.Koonin andF.Zhang(2015).″Cpfl is a single RNA-guided endonuclease of a class 2 CRISPR-Cas system.″Cell 163(3):759-771.
序列表
<110> 深圳华大生命科学研究院
<120> 提高基因编辑效率的方法和系统
<130> P2019-0043
<160> 16
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1367
<212> PRT
<213> 人工序列(artificial sequence)
<400> 1
Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1010 1015 1020
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1025 1030 1035 1040
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile
1045 1050 1055
Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1060 1065 1070
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1075 1080 1085
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1090 1095 1100
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1105 1110 1115 1120
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1125 1130 1135
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1140 1145 1150
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1155 1160 1165
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1170 1175 1180
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr
1185 1190 1195 1200
Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1205 1210 1215
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1250 1255 1260
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1265 1270 1275 1280
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His
1285 1290 1295
Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
1300 1305 1310
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1315 1320 1325
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1330 1335 1340
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1345 1350 1355 1360
Leu Ser Gln Leu Gly Gly Asp
1365
<210> 2
<211> 40
<212> PRT
<213> 人工序列(artificial sequence)
<400> 2
Ser His Gly Phe Pro Pro Glu Val Glu Glu Gln Asp Asp Gly Thr Leu
1 5 10 15
Pro Met Ser Cys Ala Gln Glu Ser Gly Met Asp Arg His Pro Ala Ala
20 25 30
Cys Ala Ser Ala Arg Ile Asn Val
35 40
<210> 3
<211> 1407
<212> PRT
<213> 人工序列(artificial sequence)
<400> 3
Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser
1010 1015 1020
Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1025 1030 1035 1040
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile
1045 1050 1055
Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1060 1065 1070
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1075 1080 1085
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1090 1095 1100
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1105 1110 1115 1120
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro
1125 1130 1135
Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1140 1145 1150
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met
1155 1160 1165
Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1170 1175 1180
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr
1185 1190 1195 1200
Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1205 1210 1215
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr
1250 1255 1260
Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1265 1270 1275 1280
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His
1285 1290 1295
Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
1300 1305 1310
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1315 1320 1325
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1330 1335 1340
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1345 1350 1355 1360
Leu Ser Gln Leu Gly Gly Asp Ser His Gly Phe Pro Pro Glu Val Glu
1365 1370 1375
Glu Gln Asp Asp Gly Thr Leu Pro Met Ser Cys Ala Gln Glu Ser Gly
1380 1385 1390
Met Asp Arg His Pro Ala Ala Cys Ala Ser Ala Arg Ile Asn Val
1395 1400 1405
<210> 4
<211> 4101
<212> DNA
<213> 人工序列(artificial sequence)
<400> 4
gataaaaagt acagcattgg actggacatc ggaacaaata gcgtgggctg ggctgtgatt 60
actgacgaat ataaggtgcc tagcaaaaag tttaaagtgc tgggaaacac cgacagacac 120
agcatcaaaa aaaacctgat cggcgctctg ctgtttgata gcggtgaaac tgccgaggct 180
actagactga agagaactgc tagaagaaga tataccagaa gaaagaatag aatttgttac 240
ctgcaagaaa tctttagcaa tgagatggca aaggttgacg atagcttctt tcatagactg 300
gaggagagct tcctggtcga ggaggacaag aagcacgaga gacaccccat cttcggaaat 360
atcgtggacg aggtggcata ccatgaaaag tatcctacca tttaccacct gagaaaaaag 420
ctggtggaca gcacagacaa ggccgatctg agactgatct acctggcact ggcccacatg 480
atcaaattta gaggccattt cctgattgaa ggagacctga accccgataa cagcgatgtt 540
gataaactgt tcatccaact ggttcagacc tataaccaac tgtttgagga gaaccctatt 600
aacgccagcg gagtggatgc aaaggccatc ctgagcgcta gactgagcaa aagcagaaga 660
ctggaaaatc tgatcgccca gctgcccggc gaaaaaaaga atggactgtt cggcaatctg 720
attgcactga gcctgggact gacacctaac ttcaagagca atttcgatct ggctgaggac 780
gccaaactgc agctgagcaa agacacatat gatgacgacc tggataacct gctggcacaa 840
attggtgacc aatacgctga cctgttcctg gctgctaaga atctgagcga tgccattctg 900
ctgagcgaca tcctgagagt gaacacagag attaccaagg cacccctgag cgcaagcatg 960
attaagagat acgacgagca ccaccaagat ctgaccctgc tgaaggccct ggtcagacaa 1020
caactgccag agaagtataa agaaattttc tttgaccaaa gcaagaacgg ttacgctggc 1080
tacattgacg gcggtgcaag ccaagaggag ttctataagt tcattaagcc aatcctggag 1140
aaaatggatg gaactgagga gctgctggtt aagctgaata gagaggatct gctgagaaaa 1200
caaagaacat tcgacaacgg tagcatccca caccagattc atctgggtga gctgcacgca 1260
attctgagaa gacaggaaga cttttatcca ttcctgaagg acaacagaga aaagatcgag 1320
aagattctga catttagaat cccctactac gtgggacctc tggctagagg caatagcaga 1380
ttcgcatgga tgactagaaa gagcgaggag acaattaccc cttggaactt tgaagaagtg 1440
gtggataagg gagcaagcgc ccaaagcttc attgagagaa tgacaaactt cgataagaac 1500
ctgcctaacg agaaggttct gcccaagcat agcctgctgt atgaatattt cacagtgtac 1560
aacgagctga caaaggtcaa gtacgtcaca gagggcatga gaaagcccgc ctttctgagc 1620
ggagaacaaa agaaggctat tgttgacctg ctgttcaaga ccaacagaaa agttacagtt 1680
aaacagctga aagaggacta cttcaaaaag attgaatgtt ttgacagcgt ggaaatcagc 1740
ggcgttgagg acagatttaa cgctagcctg ggcacctacc acgatctgct gaaaatcatc 1800
aaagataagg actttctgga caacgaagaa aacgaggaca ttctggaaga cattgtgctg 1860
acactgactc tgttcgaaga tagagaaatg atcgaggaaa gactgaaaac ttatgcacat 1920
ctgttcgacg acaaagtgat gaagcaactg aagagaagaa gatacactgg atggggcaga 1980
ctgagcagaa agctgatcaa cggaatcaga gacaagcaaa gcggaaaaac tattctggat 2040
tttctgaaaa gcgacggttt cgccaataga aacttcatgc aactgattca cgatgacagc 2100
ctgactttca aggaggatat tcaaaaggca caggtgagcg gccagggcga tagcctgcac 2160
gaacacatcg caaatctggc cggtagccct gccattaaga agggcatcct gcagacagtg 2220
aaggttgttg atgaactggt caaggtgatg ggtagacaca agcccgagaa tattgtgatc 2280
gagatggcta gagagaacca aacaacacaa aagggacaga agaatagcag agaaagaatg 2340
aaaagaattg aggagggaat caaggagctg ggtagccaga tcctgaaaga acaccctgtc 2400
gagaatacac aactgcaaaa cgaaaagctg tacctgtact acctgcaaaa tggcagagac 2460
atgtacgtgg accaagagct ggatattaac agactgagcg actacgatgt cgaccacatc 2520
gtgcctcaaa gcttcctgaa ggatgacagc atcgacaata aagtgctgac tagaagcgac 2580
aagaacagag gaaaaagcga caacgtgccc agcgaggaag tggttaaaaa gatgaagaac 2640
tactggagac agctgctgaa tgccaagctg atcacacaaa gaaaattcga caacctgacc 2700
aaagccgaga gaggaggtct gagcgaactg gacaaggctg gattcattaa gagacaactg 2760
gttgaaacca gacagattac aaagcacgtg gctcaaatcc tggacagcag aatgaatacc 2820
aaatatgacg agaacgacaa actgattaga gaggtgaagg ttattactct gaagagcaaa 2880
ctggtcagcg acttcagaaa ggacttccaa ttctacaagg tgagagagat caacaattac 2940
caccacgcac acgacgctta cctgaacgct gtggtgggca cagctctgat caaaaagtat 3000
ccaaaactgg aaagcgagtt tgtgtacggt gactataaag tttatgatgt gagaaaaatg 3060
atcgctaaga gcgagcagga gatcggaaag gctacagcca agtatttctt ttacagcaac 3120
attatgaact ttttcaagac tgaaatcacc ctggcaaacg gtgagatcag aaaaagacca 3180
ctgatcgaaa caaatggcga gacaggcgag atcgtgtggg ataagggaag agacttcgct 3240
accgttagaa aggttctgag catgccacag gttaacattg tgaagaaaac tgaggtgcag 3300
acaggaggtt tcagcaagga gagcatcctg cctaagagaa acagcgataa gctgattgca 3360
agaaaaaagg attgggaccc taagaagtac ggcggttttg acagccctac tgtggcttac 3420
agcgtgctgg tggtggctaa agtggagaag ggcaaaagca agaagctgaa aagcgtgaag 3480
gaactgctgg gaattacaat catggagaga agcagcttcg agaagaaccc aatcgacttc 3540
ctggaggcta agggatacaa ggaagttaag aaggacctga tcatcaagct gcccaagtac 3600
agcctgttcg agctggaaaa tggtagaaag agaatgctgg ctagcgctgg tgagctgcag 3660
aagggaaatg aactggcact gcctagcaag tacgttaact ttctgtatct ggcaagccat 3720
tacgagaaac tgaaaggaag ccccgaggac aatgagcaga aacaactgtt cgtggaacag 3780
cacaaacact atctggacga gattatcgag cagatcagcg aatttagcaa aagagtgatc 3840
ctggctgatg ctaacctgga taaagtcctg agcgcttaca acaaacatag agataagcct 3900
atcagagagc aggccgaaaa catcatccac ctgttcacac tgacaaacct gggcgctcct 3960
gccgctttca agtactttga taccactatt gatagaaaga gatatactag caccaaagag 4020
gtgctggacg ccaccctgat tcaccagagc attaccggac tgtacgaaac tagaatcgac 4080
ctgagccaac tgggaggaga c 4101
<210> 5
<211> 120
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
agccatggct tcccgccgga ggtggaggag caggatgatg gcacgctgcc catgtcttgt 60
gcccaggaga gcgggatgga ccgtcaccct gcagcctgtg cttctgctag gatcaatgtg 120
<210> 6
<211> 4221
<212> DNA
<213> 人工序列(artificial sequence)
<400> 6
gataaaaagt acagcattgg actggacatc ggaacaaata gcgtgggctg ggctgtgatt 60
actgacgaat ataaggtgcc tagcaaaaag tttaaagtgc tgggaaacac cgacagacac 120
agcatcaaaa aaaacctgat cggcgctctg ctgtttgata gcggtgaaac tgccgaggct 180
actagactga agagaactgc tagaagaaga tataccagaa gaaagaatag aatttgttac 240
ctgcaagaaa tctttagcaa tgagatggca aaggttgacg atagcttctt tcatagactg 300
gaggagagct tcctggtcga ggaggacaag aagcacgaga gacaccccat cttcggaaat 360
atcgtggacg aggtggcata ccatgaaaag tatcctacca tttaccacct gagaaaaaag 420
ctggtggaca gcacagacaa ggccgatctg agactgatct acctggcact ggcccacatg 480
atcaaattta gaggccattt cctgattgaa ggagacctga accccgataa cagcgatgtt 540
gataaactgt tcatccaact ggttcagacc tataaccaac tgtttgagga gaaccctatt 600
aacgccagcg gagtggatgc aaaggccatc ctgagcgcta gactgagcaa aagcagaaga 660
ctggaaaatc tgatcgccca gctgcccggc gaaaaaaaga atggactgtt cggcaatctg 720
attgcactga gcctgggact gacacctaac ttcaagagca atttcgatct ggctgaggac 780
gccaaactgc agctgagcaa agacacatat gatgacgacc tggataacct gctggcacaa 840
attggtgacc aatacgctga cctgttcctg gctgctaaga atctgagcga tgccattctg 900
ctgagcgaca tcctgagagt gaacacagag attaccaagg cacccctgag cgcaagcatg 960
attaagagat acgacgagca ccaccaagat ctgaccctgc tgaaggccct ggtcagacaa 1020
caactgccag agaagtataa agaaattttc tttgaccaaa gcaagaacgg ttacgctggc 1080
tacattgacg gcggtgcaag ccaagaggag ttctataagt tcattaagcc aatcctggag 1140
aaaatggatg gaactgagga gctgctggtt aagctgaata gagaggatct gctgagaaaa 1200
caaagaacat tcgacaacgg tagcatccca caccagattc atctgggtga gctgcacgca 1260
attctgagaa gacaggaaga cttttatcca ttcctgaagg acaacagaga aaagatcgag 1320
aagattctga catttagaat cccctactac gtgggacctc tggctagagg caatagcaga 1380
ttcgcatgga tgactagaaa gagcgaggag acaattaccc cttggaactt tgaagaagtg 1440
gtggataagg gagcaagcgc ccaaagcttc attgagagaa tgacaaactt cgataagaac 1500
ctgcctaacg agaaggttct gcccaagcat agcctgctgt atgaatattt cacagtgtac 1560
aacgagctga caaaggtcaa gtacgtcaca gagggcatga gaaagcccgc ctttctgagc 1620
ggagaacaaa agaaggctat tgttgacctg ctgttcaaga ccaacagaaa agttacagtt 1680
aaacagctga aagaggacta cttcaaaaag attgaatgtt ttgacagcgt ggaaatcagc 1740
ggcgttgagg acagatttaa cgctagcctg ggcacctacc acgatctgct gaaaatcatc 1800
aaagataagg actttctgga caacgaagaa aacgaggaca ttctggaaga cattgtgctg 1860
acactgactc tgttcgaaga tagagaaatg atcgaggaaa gactgaaaac ttatgcacat 1920
ctgttcgacg acaaagtgat gaagcaactg aagagaagaa gatacactgg atggggcaga 1980
ctgagcagaa agctgatcaa cggaatcaga gacaagcaaa gcggaaaaac tattctggat 2040
tttctgaaaa gcgacggttt cgccaataga aacttcatgc aactgattca cgatgacagc 2100
ctgactttca aggaggatat tcaaaaggca caggtgagcg gccagggcga tagcctgcac 2160
gaacacatcg caaatctggc cggtagccct gccattaaga agggcatcct gcagacagtg 2220
aaggttgttg atgaactggt caaggtgatg ggtagacaca agcccgagaa tattgtgatc 2280
gagatggcta gagagaacca aacaacacaa aagggacaga agaatagcag agaaagaatg 2340
aaaagaattg aggagggaat caaggagctg ggtagccaga tcctgaaaga acaccctgtc 2400
gagaatacac aactgcaaaa cgaaaagctg tacctgtact acctgcaaaa tggcagagac 2460
atgtacgtgg accaagagct ggatattaac agactgagcg actacgatgt cgaccacatc 2520
gtgcctcaaa gcttcctgaa ggatgacagc atcgacaata aagtgctgac tagaagcgac 2580
aagaacagag gaaaaagcga caacgtgccc agcgaggaag tggttaaaaa gatgaagaac 2640
tactggagac agctgctgaa tgccaagctg atcacacaaa gaaaattcga caacctgacc 2700
aaagccgaga gaggaggtct gagcgaactg gacaaggctg gattcattaa gagacaactg 2760
gttgaaacca gacagattac aaagcacgtg gctcaaatcc tggacagcag aatgaatacc 2820
aaatatgacg agaacgacaa actgattaga gaggtgaagg ttattactct gaagagcaaa 2880
ctggtcagcg acttcagaaa ggacttccaa ttctacaagg tgagagagat caacaattac 2940
caccacgcac acgacgctta cctgaacgct gtggtgggca cagctctgat caaaaagtat 3000
ccaaaactgg aaagcgagtt tgtgtacggt gactataaag tttatgatgt gagaaaaatg 3060
atcgctaaga gcgagcagga gatcggaaag gctacagcca agtatttctt ttacagcaac 3120
attatgaact ttttcaagac tgaaatcacc ctggcaaacg gtgagatcag aaaaagacca 3180
ctgatcgaaa caaatggcga gacaggcgag atcgtgtggg ataagggaag agacttcgct 3240
accgttagaa aggttctgag catgccacag gttaacattg tgaagaaaac tgaggtgcag 3300
acaggaggtt tcagcaagga gagcatcctg cctaagagaa acagcgataa gctgattgca 3360
agaaaaaagg attgggaccc taagaagtac ggcggttttg acagccctac tgtggcttac 3420
agcgtgctgg tggtggctaa agtggagaag ggcaaaagca agaagctgaa aagcgtgaag 3480
gaactgctgg gaattacaat catggagaga agcagcttcg agaagaaccc aatcgacttc 3540
ctggaggcta agggatacaa ggaagttaag aaggacctga tcatcaagct gcccaagtac 3600
agcctgttcg agctggaaaa tggtagaaag agaatgctgg ctagcgctgg tgagctgcag 3660
aagggaaatg aactggcact gcctagcaag tacgttaact ttctgtatct ggcaagccat 3720
tacgagaaac tgaaaggaag ccccgaggac aatgagcaga aacaactgtt cgtggaacag 3780
cacaaacact atctggacga gattatcgag cagatcagcg aatttagcaa aagagtgatc 3840
ctggctgatg ctaacctgga taaagtcctg agcgcttaca acaaacatag agataagcct 3900
atcagagagc aggccgaaaa catcatccac ctgttcacac tgacaaacct gggcgctcct 3960
gccgctttca agtactttga taccactatt gatagaaaga gatatactag caccaaagag 4020
gtgctggacg ccaccctgat tcaccagagc attaccggac tgtacgaaac tagaatcgac 4080
ctgagccaac tgggaggaga cagccatggc ttcccgccgg aggtggagga gcaggatgat 4140
ggcacgctgc ccatgtcttg tgcccaggag agcgggatgg accgtcaccc tgcagcctgt 4200
gcttctgcta ggatcaatgt g 4221
<210> 7
<211> 63
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
taatacgact cactatagta gtgttgtagt actagtggtt ttagagctag aaatagcaag 60
tta 63
<210> 8
<211> 57
<212> DNA
<213> 人工序列(artificial sequence)
<400> 8
aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc ttttttt 57
<210> 9
<211> 53
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
gcagtgcgcc aactgccaca ctagtactac aacactatgg agacgcaatg cca 53
<210> 10
<211> 53
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
tggcattgcg tctccatagt gttgtagtac tagtgtggca gttggcgcac tgc 53
<210> 11
<211> 53
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
ccgactcaag caggctccaa acatcagccg ggacgtggtc aagcagctgt tac 53
<210> 12
<211> 53
<212> DNA
<213> 人工序列(artificial sequence)
<400> 12
gtaacagctg cttgaccacg tcccggctga tgtttggagc ctgcttgagt cgg 53
<210> 13
<211> 21
<212> DNA
<213> 人工序列(artificial sequence)
<400> 13
gcatttagtt caccagaagc g 21
<210> 14
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 14
cctgggttca gagaatacgc 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 15
atggagatat aacggcgcac 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列(artificial sequence)
<400> 16
atgcgtaaaa ttgctgtggc 20

Claims (9)

1.一种融合蛋白,其特征在于,所述的融合蛋白具有式Ia或Ib所述结构:
E-P (Ia)
P-E (Ib)
其中,
E为核酸内切酶蛋白元件;
P为PEST蛋白元件;
“-”表示连接上述各元件的肽键或肽接头,
所述融合蛋白的氨基酸序列如SEQ ID NO.3所示。
2.一种分离的多核苷酸,所述的多核苷酸编码权利要求1所述的融合蛋白。
3.一种载体,所述载体含有权利要求2所述的多核苷酸。
4.一种基因工程细胞,其特征在于,所述基因工程细胞含有权利要求3所述的载体,或含有权利要求2所述的多核苷酸,或含有权利要求1所述的融合蛋白,所述基因工程细胞不包含植物细胞。
5.如权利要求4所述的基因工程细胞,其特征在于,所述基因工程细胞为动物细胞或微生物细胞。
6.一种基因编辑系统,其特征在于,所述基因编辑系统包括权利要求1所述的融合蛋白、或权利要求2所述的多核苷酸、或权利要求3的载体。
7.如权利要求6所述的基因编辑系统,其特征在于,所述基因编辑系统选自下组:CRISPR/Cas基因编辑系统、CRISPR/Cpf1基因编辑系统、CRISPR/C2c2基因编辑系统、Argonaute/gDNA基因编辑系统、锌指核酸酶基因编辑系统 (ZFNs)、和类转录激活因子核酸酶基因编辑系统(TALENs)。
8.一种核酸内切酶介导的基因编辑方法,其特征在于,所述方法包括步骤:
使用权利要求1所述的融合蛋白对靶基因进行编辑。
9.一种提高核酸内切酶介导的基因编辑系统的基因编辑效率的方法,其特征在于,所述方法包括步骤:
在靶细胞中,表达PEST蛋白和核酸内切酶的权利要求1所述的融合蛋白。
CN201680088506.XA 2016-11-03 2016-11-03 提高基因编辑效率的方法和系统 Active CN109689693B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2016/104450 WO2018081978A1 (zh) 2016-11-03 2016-11-03 提高基因编辑效率的方法和系统

Publications (2)

Publication Number Publication Date
CN109689693A CN109689693A (zh) 2019-04-26
CN109689693B true CN109689693B (zh) 2022-06-28

Family

ID=62076310

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680088506.XA Active CN109689693B (zh) 2016-11-03 2016-11-03 提高基因编辑效率的方法和系统

Country Status (2)

Country Link
CN (1) CN109689693B (zh)
WO (1) WO2018081978A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112080517A (zh) * 2020-09-08 2020-12-15 南京农业大学 一种提高获得基因编辑植株概率的筛选系统、构建方法及其应用
CN112430622A (zh) * 2020-10-26 2021-03-02 扬州大学 一种FokI和dCpf1融合蛋白表达载体及其介导的定点基因编辑方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014204578A1 (en) * 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
CN104531632A (zh) * 2014-11-18 2015-04-22 李云英 快速降解的Cas9-ODC422-461融合蛋白及其应用
CN104854241A (zh) * 2012-05-25 2015-08-19 埃玛纽埃尔·沙尔庞捷 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物
WO2016126213A1 (en) * 2015-02-06 2016-08-11 National University Of Singapore Methods for enhancing efficacy of therapeutic immune cells

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2013312538B2 (en) * 2012-09-07 2019-01-24 Corteva Agriscience Llc FAD3 performance loci and corresponding target site specific binding proteins capable of inducing targeted breaks
UA118090C2 (uk) * 2012-09-07 2018-11-26 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив
JP7085716B2 (ja) * 2013-06-05 2022-06-17 デューク ユニバーシティ Rnaガイド遺伝子編集及び遺伝子調節
CN104805099B (zh) * 2015-03-02 2018-04-13 中国人民解放军第二军医大学 一种安全编码Cas9蛋白的核酸分子及其表达载体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104854241A (zh) * 2012-05-25 2015-08-19 埃玛纽埃尔·沙尔庞捷 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物
WO2014204578A1 (en) * 2013-06-21 2014-12-24 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
CN104531632A (zh) * 2014-11-18 2015-04-22 李云英 快速降解的Cas9-ODC422-461融合蛋白及其应用
WO2016126213A1 (en) * 2015-02-06 2016-08-11 National University Of Singapore Methods for enhancing efficacy of therapeutic immune cells

Also Published As

Publication number Publication date
WO2018081978A1 (zh) 2018-05-11
CN109689693A (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
CN106957831B (zh) 一种Cas9核酸酶K918A及其用途
JP7430358B2 (ja) Dnaが編集された真核細胞を製造する方法、および当該方法に用いられるキット
CN106967697B (zh) 一种Cas9核酸酶G915F及其用途
CN106957830B (zh) 一种Cas9核酸酶ΔF916及其用途
CN106947750B (zh) 一种Cas9核酸酶Q920P及其用途
CN106939303B (zh) 一种Cas9核酸酶R919P及其用途
CN107794272B (zh) 一种高特异性的crispr基因组编辑体系
CN107922931B (zh) 热稳定的Cas9核酸酶
US10858662B2 (en) Genome editing with split Cas9 expressed from two vectors
EP3152312B1 (en) Methods and compositions for modifying a targeted locus
EP1504092B1 (en) Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
EP3536796A1 (en) Gene knockout method
KR20180127339A (ko) 복제 트랜스포존 시스템
KR20230021657A (ko) Ruvc 도메인을 포함하는 효소
US20200208146A1 (en) Materials and methods for efficient targeted knock in or gene replacement
CN109689693B (zh) 提高基因编辑效率的方法和系统
Zhang et al. Rapid assembly of customized TALENs into multiple delivery systems
CN104212778A (zh) 基于TALEN和pMD18载体的定点突变系统及应用
CN113564145B (zh) 用于胞嘧啶碱基编辑的融合蛋白及其应用
EP3666898A1 (en) Gene knockout method
WO2024044673A1 (en) Dual cut retron editors for genomic insertions and deletions
WO2023215399A1 (en) Assembling synthetic dna constructs from natural dna
WO2023235879A1 (en) Methods of genome editing oocytes
AU2007201617B2 (en) Methods and Compositions for using Zinc Finger Endonucleases to Enhance Homologous Recombination
CN116926112A (zh) 一种小立碗藓中dna大片段的转化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20190426

Assignee: Hainan Huada Life Technology Co.,Ltd.

Assignor: BGI SHENZHEN

Contract record no.: X2023440020001

Denomination of invention: Methods and systems for improving the efficiency of gene editing

Granted publication date: 20220628

License type: Common License

Record date: 20230104

EE01 Entry into force of recordation of patent licensing contract