CN114317492A - 一种改造的人工核酸酶系统及其应用 - Google Patents

一种改造的人工核酸酶系统及其应用 Download PDF

Info

Publication number
CN114317492A
CN114317492A CN202111480072.7A CN202111480072A CN114317492A CN 114317492 A CN114317492 A CN 114317492A CN 202111480072 A CN202111480072 A CN 202111480072A CN 114317492 A CN114317492 A CN 114317492A
Authority
CN
China
Prior art keywords
lys
ile
glu
leu
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111480072.7A
Other languages
English (en)
Inventor
韩冰舟
张亚鸽
周阳
张博
张彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN202111480072.7A priority Critical patent/CN114317492A/zh
Publication of CN114317492A publication Critical patent/CN114317492A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

本发明涉及核酸编辑领域。具体而言,本发明提供了人工改造的Cas蛋白以及编码蛋白的核酸分子。本发明还提供了用于核酸编辑的复合物和组合物,例如基因组编辑的组合物,其包含人工改造的Cas蛋白以及编码蛋白的核酸分子。本发明还提供了用于核酸编辑的方法,例如基因敲除或基因敲入的方法,其使用包含本发明的人工改造的Cas蛋白或编码蛋白的核酸分子。

Description

一种改造的人工核酸酶系统及其应用
技术领域
本发明涉及核酸编辑领域。具体而言,本发明涉及人工改造的Cas蛋白以及编码蛋白的核酸分子。本发明还涉及用于核酸编辑的复合物和组合物。本发明还涉及用于核酸编辑的方法,其使用包含本发明的蛋白或编码蛋白的核酸分子。
背景技术
CRISPR/Cas技术是一种被广泛使用的基因编辑技术,它通过RNA引导对基因组上的靶序列进行特异性结合并切割DNA产生双链断裂,利用生物非同源末端连接或同源重组进行定点基因编辑。
目前已知的CRISPR/Cas系统分为两个大类,6个类型。第二大类包括了II型、V型和VI型,其中V型的特征在于仅有一个RuvC核酸酶结构域,两次切割形成双链断裂,切割位点远离PAM。V型Cas核酸酶是一种庞大的类型,可分为多个亚型,分别为Cas12a(又名Cpf1)、Cas12b、Cas12c、Cas12d和Cas12e等。其中CRISPR/Cas12a系统的双链DNA酶活性最高,被广泛开发并应用。与Cas9不同的是,Cas12a同时具有RNA内切酶活性,可结合crRNA(CRISPRRNA)前体,即pre-crRNA,并将其加工成熟。另外,相较于SpCas9,CRISPR/Cas12a系统也表现出更高的基因组靶向特异性。
目前,在哺乳动物模型内效果良好的CRISPR/LbCas12a和CRISPR/AsCas12a系统,在斑马鱼模型内仅能够通过蛋白形式递送以发挥作用,极大地限制了CRISPR/Cas12系统的进一步发展应用。而且在斑马鱼中报道使用的各类CRISPR/Cas12系统均需要热激过程,来有效地提升基因敲除或敲入的效率。但是热激过程影响胚胎正常发育,使得胚胎死亡率及畸形率升高。上述技术缺陷极大地限制了CRISPR/Cas12系统在斑马鱼模型以及各类低温(低于37℃)动物中的应用。
发明内容
为了解决上述问题,本发明提供了一种能够避免热激过程,并对斑马鱼等低温动物(低于37℃)基因组能够进行简便高效敲除及敲入的新型CRISPR/Cas12a系统以及基于该系统的基因编辑方法。
本发明提供了一种融合蛋白,所述融合蛋白包括来源于直肠真杆菌(Eubacteriumrectale)的ErCas12a蛋白及融合于其N端的T5外切酶(T5exo)。
作为优选,所述T5外切酶和ErCas12a蛋白通过接头连接,其中接头优选为(GGGS)n、(EAAAK)n、SGGS-XTEN-SGGSS和Xten-linker。
作为本发明的一种优选技术方案,所述接头为Xten-linker。
作为优选,所述融合蛋白还包含一个或多个核定位信号序列(NLS)。
作为本发明的一种优选技术方案,所述融合蛋白的序列如SEQ ID NO.1所示,或者与SEQ ID NO.1所示的氨基酸序列具有一个或者更多个氨基酸的替换、缺失或插入,但是具有相同功能的变体。
进一步地,本发明提供了一种核酸分子,其能够编码上述融合蛋白。
作为本发明的一种优选技术方案,所述的核酸分子具有以下任一核苷酸序列:
(1)SEQ ID NO.2所示的核苷酸序列;所述SEQ ID NO.2编码T5exo-Xten-ErCas12a;或,
(2)SEQ ID NO.2所示的核苷酸序列经过一个或多个核苷酸的替换、缺失或插入获得的具有相同功能蛋白的编码核苷酸序列;或,
(3)在严格条件下可以与SEQ ID NO.2所示的核苷酸序列进行杂交的核苷酸序列;或,
(4)与SEQ ID NO.2所示的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。
作为本发明的一种最优选技术方案,所述的核酸分子具有以下任一核苷酸序列:
(1)SEQ ID NO.3所示的核苷酸序列;所述SEQ ID NO.3编码NLS-T5exo-Xten-ErCas12a-NLS;或,
(2)SEQ ID NO.3所示的核苷酸序列经过一个或多个核苷酸的替换、缺失或插入获得的具有相同功能蛋白的编码核苷酸序列;或,
(3)在严格条件下可以与SEQ ID NO.3所示的核苷酸序列进行杂交的核苷酸序列;或,
(4)与SEQ ID NO.3所示的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。
本发明中所述核酸分子在某些方案中是DNA,在某些方案中是RNA。
进一步地,本发明还提供了一种生物材料,所述生物材料包含上述融合蛋白和/或上述核酸分子。
进一步地,本发明提供了一种组合物,所述组合物包括:
1)第一核酸,其为编码上述融合蛋白的核酸分子;和
2)第二核酸,其为导向RNA,即本发明中所述的pre-crRNA或crRNA,所述pre-crRNA或crRNA根据靶基因序列设计构建。
作为优选,本发明提供了一种组合物,所述组合物包括T5exo-ErCas12a mRNA和pre-crRNA(或crRNA);所述T5exo-ErCas12a mRNA为SEQ ID NO.3的转录本;SEQ ID NO.3在SEQ ID NO.2的基础上增加了两侧的NLS序列。
作为优选,本发明提供了一种组合物,所述组合物包括T5exo-ErCas12a mRNA、pre-crRNA(或crRNA)和供体。所述供体为一种核酸分子。
作为优选,本发明还提供了一种组合物,所述组合物包括T5exo-ErCas12a mRNA、靶向基因组靶位点的pre-crRNA(或crRNA)、供体以及靶向供体线性化位点的gRNA(或pre-crRNA,或crRNA)。
进一步地,本发明提供了一种复合物,包括:
a)第一组分,其为上述融合蛋白;和
b)第二组分,其为导向RNA,即本发明中所述的pre-crRNA或crRNA,所述pre-crRNA或crRNA根据靶基因序列设计构建。
进一步地,本发明提供了上述融合蛋白、上述核酸分子、上述生物材料、上述组合物、上述复合物在非治疗目的的基因修饰中的应用。
作为优选,上述融合蛋白、上述核酸分子、上述生物材料、上述组合物、上述复合物在基因敲除和基因敲入中的应用。
作为优选,上述融合蛋白、上述核酸分子、上述生物材料、上述组合物、上述复合物在动物中进行的基因敲除和基因敲入。
更优选的,上述融合蛋白、上述核酸分子、上述生物材料、上述组合物、上述复合物在低温动物中进行的基因敲除和基因敲入,所述低温为低于37℃。
最优选的,上述融合蛋白、上述核酸分子、上述生物材料、上述组合物、上述复合物在斑马鱼中进行的基因敲除和基因敲入。
作为本发明的一种优选技术方案,将所述组合物T5exo-ErCas12a mRNA与pre-crRNA注射入斑马鱼胚胎实现基因敲除。
作为本发明的一种优选技术方案,将所述组合物T5exo-ErCas12a mRNA、pre-crRNA、供体和供体线性化位点gRNA注射入斑马鱼胚胎实现基因敲入。
进一步地,本发明提供了上述融合蛋白、上述核酸分子、上述生物材料、上述组合物、上述复合物在制备制剂中的用途,所述制剂用于:
(i)离体基因或基因组编辑;
(ii)离体单链DNA的检测;
(iii)编辑靶基因座中的靶序列来修饰生物;
(iv)治疗由靶基因座中的靶序列的缺陷引起的病症。
进一步地,本发明还提供了一种利用CRISPR/Cas12a系统进行基因组修饰/基因组编辑的方法,其包括将上述融合蛋白、上述核酸分子、上述生物材料、上述组合物或上述复合物与目标个体的基因组接触的步骤,并且所述方法不包括热激的步骤或者所述方法在低于37℃的条件下进行;优选的,所述目标个体为动物,更优选为斑马鱼。
本发明的有益效果在于:
(1)CRISPR/T5exo-Cas12a系统能够在较低温度(相对ErCas12a的工作温度37℃)进行高效的基因敲除及基因敲入,特别是应用于斑马鱼模型中时,可以避免胚胎热激受损,增加胚胎存活率的同时实现基因高效编辑。
(2)CRISPR/T5exo-Cas12a系统以mRNA形式注射到斑马鱼胚胎中,实现对斑马鱼基因组特定位点的高效基因编辑操作,便于相关应用技术的推广。
附图说明
图1为T5exo-ErCas12a介导斑马鱼基因组的高效基因敲除结果。A为N端融合T5外切酶的ErCas12a示意图,融合蛋白间以Xten-linker分隔。B为使用T5exo-ErCas12a mRNA于热激或非热激条件下在tyr位点的编辑效率及与ErCas12a mRNA注射后效率的对比情况。C为使用T5exo-ErCas12a mRNA于热激或非热激条件下在alb第2位点的编辑效率及与ErCas12a mRNA注射后效率的对比情况。
图2为T5exo-ErCas12a mRNA在tyr exon1实现MMEJ介导的基因敲入示意图。
图3为T5exo-ErCas12a mRNA在tbx2b intron3实现NHEJ介导的基因敲入示意图。
图4为T5exo-ErCas12a在非热激条件下通过MMEJ和NHEJ介导高效基因敲入结果。A为敲入成功后胚胎荧光表达情况。比例尺为200微米。B为使用T5exo-ErCas12a和Cas9 mRNA在非热激条件下在tyr exon1进行MMEJ敲入实验得到的胚胎中表达荧光胚胎的比例统计,以及使用ErCas12a mRNA在热激(HS)或非热激条件下敲入的比例统计。n代表胚胎数目。C为使用T5exo-ErCas12a和Cas9 mRNA在非热激条件下在tbx2b intron3进行NHEJ敲入实验得到的胚胎中表达荧光胚胎的比例统计,以及使用ErCas12a mRNA在热激(HS)或非热激条件下敲入的比例统计。n代表胚胎数目。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
除非特别指明,否则基本上按照本领域内熟知的以及在各种参考文献中描述的常规方法进行实施例中描述的实验和方法。
另外,实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
具体地,本发明将来自于T5噬菌体的T5外切酶(T5exo)融合在ErCas12a蛋白的N端,中间使用Xten-linker连接两者,构建得到T5exo-ErCas12a。本发明通过双引物退火拼接延伸的方式制备pre-crRNA转录模板。正向引物带有T7启动子序列(17+GG)与全部的scaffold编码序列(35nt),作为通用引物搭配不同的反向引物一起使用。反向引物含有反向互补的protospacer序列(21~23nt)以及与正向引物scaffold编码序列反向互补的21nt序列,使两引物能够通过碱基配对实现退火拼接。两引物配对并延伸后得到的双链DNA即可作为pre-crRNA的转录模板。该转录模版可通过T7启动子进行体外转录,以得到pre-crRNA。之后,在斑马鱼单细胞期胚胎的动物极注射T5exo-ErCas12a mRNA和靶点的pre-crRNA,可实现对基因组上特定位点的切割以及突变,从而实现对靶基因的高效敲除(图1)。
除此之外,在筛选得到较高效率的靶点后,可设计并构建相应用途的供体,进行基因敲入。用于基因敲入的供体的内部均含有体内线性化的位点,一般为ErCas12a或Cas9的靶向序列。通过MMEJ途径整合进入基因组的供体,在线性化位点两端分别带有与基因组靶序列切割位点两端24-30bp的同源序列,并在5’端同源序列后带有需整合入基因组的序列(图2)。而通过NHEJ途径整合进入基因组的供体,在线性化位点后带有需整合入基因组的序列,例如剪接受体等(图3)。供体设计并构建完成后,在斑马鱼单细胞期胚胎动物极注射供体、线性化位点sgRNA或crRNA、基因组靶位点crRNA、Cas9 mRNA和T5exo-ErCas12a mRNA,可实现供体的基因组敲入。
实施例1、gRNA和pre-crRNA的获取
本发明通过在引物上引入protospacer序列,并以质粒为模板进行PCR的方式,制备gRNA体外转录用的模板;通过双引物退火拼接延伸的方式制备pre-crRNA转录模板,F引物带有T7启动子序列(17+GG)与全部的scaffold编码序列(35nt),作为通用引物搭配不同的R引物一起使用;R引物含有反向互补的protospacer序列(21~23nt)以及与F引物scaffold编码序列反向互补的21nt序列,使两引物能够通过碱基配对实现退火拼接。两引物配对并延伸后得到的双链DNA即可作为pre-crRNA的转录模板。得到转录模板后进行体外转录,使用氯化锂沉淀法沉淀用于供体体内线性化的gRNA,对长度更小的pre-crRNA则采用产率更高的T7 RiboMax expression kit(Promega)试剂盒进行沉淀,且需要沉淀更长时间以及多次离心沉淀,获得的gRNA和pre-crRNA进行电泳确认有无产物,-80℃保存。
实施例2、mRNA的获取
本发明中使用的T5外切酶(T5exo)和ErCas12a序列均经过斑马鱼密码子优化,并通过化学合成得到相应DNA。在使用Nco I和Sac II对nCas9体外转录载体pT3TS-nCas9质粒进行双酶切后,通过Gibson Assembly的方式构建pT3TS-T5exo-ErCas12a质粒。对得到的质粒单酶切使其线性化作为体外转录的模板。使用T3 mMESSAGE mMACHINE试剂盒(Ambion)进行体外转录所有mRNA,得到的mRNA置于-80℃保存。
实施例3、T5exo-ErCas12a介导进行斑马鱼基因组的高效基因敲除
在斑马鱼基因组中选择分别位于tyr exon1和alb exon1上的两个位点测试T5exo-ErCas12a的编辑效率。位点序列分别为CCACCCCAGAAGTCCTCCAGTCCAAA和TTTGGAAGGGAATTCTGCTACGCTGTT(序列末尾的“CAAA”和序列首端“TTTG”为PAM区序列),向单细胞期胚胎进行显微注射。注射体系终浓度配比为:Cas9 mRNA或Cas12a mRNA 400ng/μL(若使用Cas9蛋白(Novo protein)则为500ng/μL,补充1/10体积的Cas9buffer)、gRNA(或crRNA-tracrRNA对)或Cas12a crRNA 100ng/μL。每枚受精卵注射量为1~2nL。待胚胎发育至24hpf,随机取部分胚胎提取基因组,对靶点周围序列进行PCR扩增,TIDE法检测靶点效率,与ErCas12a对比,结果显示使用T5exo-ErCas12a注射时,热激与未热激组的indel突变效率相当,且均能达到ErCas12a注射时热激组的效率(图1B,C)。这说明N端融合T5exo-ErCas12a能够在非热激的条件下达到较高的靶向编辑效率。
实施例4、利用T5exo-ErCas12a在非热激条件下实现MMEJ介导的高效基因敲入
使用T5exo-ErCas12a在tyr exon1上进行MMEJ途径介导的报告基因敲入(图2)。注射体系为Cas9 mRNA 250~300ng/μL,ErCas12a mRNA或T5exo-ErCas12a mRNA 250~300ng/μL,靶基因pre-crRNA250ng/μL,供体线性化gRNA100ng/μL,供体质粒15ng/μL。注射后于2dpf观察胚胎荧光表达情况,发现有38.38%(38/99)的胚胎有红色(黑白色下呈现为与黑色背景反差较大的颜色)荧光表达(图4A),其中有19.19%(19/99)的表达较为广泛(图4B),其效率接近于使用ErCas12a mRNA在热激条件下的敲入效率,且胚胎的发育情况相比注射后热激的更好(图4B)。该结果说明,T5exo-ErCas12a mRNA能够在非热激条件下高效地实现MMEJ途径介导的基因敲入,这一点与其能够在非热激条件下使靶点产生高效的indel突变的结果相符合。
实施例5、利用T5exo-ErCas12a在非热激条件下实现NHEJ介导的高效基因敲入
使用T5exo-ErCas12a mRNA在tbx2b intron3上进行NHEJ途径介导的基因敲入实验(图3)。将tbx2b Cas12a R295H供体与Cas9 mRNA,T5exo-ErCas12a mRNA,tbx2b pre-crRNA和lamgolden gRNA共同注射,随后观察胚胎的荧光表达情况。在2dpf时,145枚胚胎中,有77枚有正确的红色荧光表达,其比例高达53.10%(图4C),其中,表达较广的有38枚,占26.21%(图4C),这一效率同样接近于使用ErCas12a mRNA在热激条件下的敲入效率。因此,上述实验结果说明,T5exo-ErCas12a能在非热激条件下,通过NHEJ途径高效地实现大片段基因敲入。
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110> 北京大学
<120> 一种改造的人工核酸酶系统及其应用
<130> KHP211122648.7
<160> 3
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1590
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
Met Pro Lys Lys Lys Arg Lys Val Ser Lys Ser Trp Gly Lys Phe Ile
1 5 10 15
Glu Glu Glu Glu Ala Glu Met Ala Ser Arg Arg Asn Leu Met Ile Val
20 25 30
Asp Gly Thr Asn Leu Gly Phe Arg Phe Lys His Asn Asn Ser Lys Lys
35 40 45
Pro Phe Ala Ser Ser Tyr Val Ser Thr Ile Gln Ser Leu Ala Lys Ser
50 55 60
Tyr Ser Ala Arg Thr Thr Ile Val Leu Gly Asp Lys Gly Lys Ser Val
65 70 75 80
Phe Arg Leu Glu His Leu Pro Glu Tyr Lys Gly Asn Arg Asp Glu Lys
85 90 95
Tyr Ala Gln Arg Thr Glu Glu Glu Lys Ala Leu Asp Glu Gln Phe Phe
100 105 110
Glu Tyr Leu Lys Asp Ala Phe Glu Leu Cys Lys Thr Thr Phe Pro Thr
115 120 125
Phe Thr Ile Arg Gly Val Glu Ala Asp Asp Met Ala Ala Tyr Ile Val
130 135 140
Lys Leu Ile Gly His Leu Tyr Asp His Val Trp Leu Ile Ser Thr Asp
145 150 155 160
Gly Asp Trp Asp Thr Leu Leu Thr Asp Lys Val Ser Arg Phe Ser Phe
165 170 175
Thr Thr Arg Arg Glu Tyr His Leu Arg Asp Met Tyr Glu His His Asn
180 185 190
Val Asp Asp Val Glu Gln Phe Ile Ser Leu Lys Ala Ile Met Gly Asp
195 200 205
Leu Gly Asp Asn Ile Arg Gly Val Glu Gly Ile Gly Ala Lys Arg Gly
210 215 220
Tyr Asn Ile Ile Arg Glu Phe Gly Asn Val Leu Asp Ile Ile Asp Gln
225 230 235 240
Leu Pro Leu Pro Gly Lys Gln Lys Tyr Ile Gln Asn Leu Asn Ala Ser
245 250 255
Glu Glu Leu Leu Phe Arg Asn Leu Ile Leu Val Asp Leu Pro Thr Tyr
260 265 270
Cys Val Asp Ala Ile Ala Ala Val Gly Gln Asp Val Leu Asp Lys Phe
275 280 285
Thr Lys Asp Ile Leu Glu Ile Ala Glu Gln Ser Gly Ser Glu Thr Pro
290 295 300
Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Ser Asn Asn Gly Thr
305 310 315 320
Asn Asn Phe Gln Asn Phe Ile Gly Ile Ser Ser Leu Gln Lys Thr Leu
325 330 335
Arg Asn Ala Leu Ile Pro Thr Glu Thr Thr Gln Gln Phe Ile Val Lys
340 345 350
Asn Gly Ile Ile Lys Glu Asp Glu Leu Arg Gly Glu Asn Arg Gln Ile
355 360 365
Leu Lys Asp Ile Met Asp Asp Tyr Tyr Arg Gly Phe Ile Ser Glu Thr
370 375 380
Leu Ser Ser Ile Asp Asp Ile Asp Trp Thr Ser Leu Phe Glu Lys Met
385 390 395 400
Glu Ile Gln Leu Lys Asn Gly Asp Asn Lys Asp Thr Leu Ile Lys Glu
405 410 415
Gln Thr Glu Tyr Arg Lys Ala Ile His Lys Lys Phe Ala Asn Asp Asp
420 425 430
Arg Phe Lys Asn Met Phe Ser Ala Lys Leu Ile Ser Asp Ile Leu Pro
435 440 445
Glu Phe Val Ile His Asn Asn Asn Tyr Ser Ala Ser Glu Lys Glu Glu
450 455 460
Lys Thr Gln Val Ile Lys Leu Phe Ser Arg Phe Ala Thr Ser Phe Lys
465 470 475 480
Asp Tyr Phe Lys Asn Arg Ala Asn Cys Phe Ser Ala Asp Asp Ile Ser
485 490 495
Ser Ser Ser Cys His Arg Ile Val Asn Asp Asn Ala Glu Ile Phe Phe
500 505 510
Ser Asn Ala Leu Val Tyr Arg Arg Ile Val Lys Ser Leu Ser Asn Asp
515 520 525
Asp Ile Asn Lys Ile Ser Gly Asp Met Lys Asp Ser Leu Lys Glu Met
530 535 540
Ser Leu Glu Glu Ile Tyr Ser Tyr Glu Lys Tyr Gly Glu Phe Ile Thr
545 550 555 560
Gln Glu Gly Ile Ser Phe Tyr Asn Asp Ile Cys Gly Lys Val Asn Ser
565 570 575
Phe Met Asn Leu Tyr Cys Gln Lys Asn Lys Glu Asn Lys Asn Leu Tyr
580 585 590
Lys Leu Gln Lys Leu His Lys Gln Ile Leu Cys Ile Ala Asp Thr Ser
595 600 605
Tyr Glu Val Pro Tyr Lys Phe Glu Ser Asp Glu Glu Val Tyr Gln Ser
610 615 620
Val Asn Gly Phe Leu Asp Asn Ile Ser Ser Lys His Ile Val Glu Arg
625 630 635 640
Leu Arg Lys Ile Gly Asp Asn Tyr Asn Gly Tyr Asn Leu Asp Lys Ile
645 650 655
Tyr Ile Val Ser Lys Phe Tyr Glu Ser Val Ser Gln Lys Thr Tyr Arg
660 665 670
Asp Trp Glu Thr Ile Asn Thr Ala Leu Glu Ile His Tyr Asn Asn Ile
675 680 685
Leu Pro Gly Asn Gly Lys Ser Lys Ala Asp Lys Val Lys Lys Ala Val
690 695 700
Lys Asn Asp Leu Gln Lys Ser Ile Thr Glu Ile Asn Glu Leu Val Ser
705 710 715 720
Asn Tyr Lys Leu Cys Ser Asp Asp Asn Ile Lys Ala Glu Thr Tyr Ile
725 730 735
His Glu Ile Ser His Ile Leu Asn Asn Phe Glu Ala Gln Glu Leu Lys
740 745 750
Tyr Asn Pro Glu Ile His Leu Val Glu Ser Glu Leu Lys Ala Ser Glu
755 760 765
Leu Lys Asn Val Leu Asp Val Ile Met Asn Ala Phe His Trp Cys Ser
770 775 780
Val Phe Met Thr Glu Glu Leu Val Asp Lys Asp Asn Asn Phe Tyr Ala
785 790 795 800
Glu Leu Glu Glu Ile Tyr Asp Glu Ile Tyr Pro Val Ile Ser Leu Tyr
805 810 815
Asn Leu Val Arg Asn Tyr Val Thr Gln Lys Pro Tyr Ser Thr Lys Lys
820 825 830
Ile Lys Leu Asn Phe Gly Ile Pro Thr Leu Ala Asp Gly Trp Ser Lys
835 840 845
Ser Lys Glu Tyr Ser Asn Asn Ala Ile Ile Leu Met Arg Asp Asn Leu
850 855 860
Tyr Tyr Leu Gly Ile Phe Asn Ala Lys Asn Lys Pro Asp Lys Lys Ile
865 870 875 880
Ile Glu Gly Asn Thr Ser Glu Asn Lys Gly Asp Tyr Lys Lys Met Ile
885 890 895
Tyr Asn Leu Leu Pro Gly Pro Asn Lys Met Ile Pro Lys Val Phe Leu
900 905 910
Ser Ser Lys Thr Gly Val Glu Thr Tyr Lys Pro Ser Ala Tyr Ile Leu
915 920 925
Glu Gly Tyr Lys Gln Asn Lys His Ile Lys Ser Ser Lys Asp Phe Asp
930 935 940
Ile Thr Phe Cys His Asp Leu Ile Asp Tyr Phe Lys Asn Cys Ile Ala
945 950 955 960
Ile His Pro Glu Trp Lys Asn Phe Gly Phe Asp Phe Ser Asp Thr Ser
965 970 975
Thr Tyr Glu Asp Ile Ser Gly Phe Tyr Arg Glu Val Glu Leu Gln Gly
980 985 990
Tyr Lys Ile Asp Trp Thr Tyr Ile Ser Glu Lys Asp Ile Asp Leu Leu
995 1000 1005
Gln Glu Lys Gly Gln Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe
1010 1015 1020
Ser Lys Lys Ser Thr Gly Asn Asp Asn Leu His Thr Met Tyr Leu Lys
1025 1030 1035 1040
Asn Leu Phe Ser Glu Glu Asn Leu Lys Asp Ile Val Leu Lys Leu Asn
1045 1050 1055
Gly Glu Ala Glu Ile Phe Phe Arg Lys Ser Ser Ile Lys Asn Pro Ile
1060 1065 1070
Ile His Lys Lys Gly Ser Ile Leu Val Asn Arg Thr Tyr Glu Ala Glu
1075 1080 1085
Glu Lys Asp Gln Phe Gly Asn Ile Gln Ile Val Arg Lys Asn Ile Pro
1090 1095 1100
Glu Asn Ile Tyr Gln Glu Leu Tyr Lys Tyr Phe Asn Asp Lys Ser Asp
1105 1110 1115 1120
Lys Glu Leu Ser Asp Glu Ala Ala Lys Leu Lys Asn Val Val Gly His
1125 1130 1135
His Glu Ala Ala Thr Asn Ile Val Lys Asp Tyr Arg Tyr Thr Tyr Asp
1140 1145 1150
Lys Tyr Phe Leu His Met Pro Ile Thr Ile Asn Phe Lys Ala Asn Lys
1155 1160 1165
Thr Gly Phe Ile Asn Asp Arg Ile Leu Gln Tyr Ile Ala Lys Glu Lys
1170 1175 1180
Asp Leu His Val Ile Gly Ile Asp Arg Gly Glu Arg Asn Leu Ile Tyr
1185 1190 1195 1200
Val Ser Val Ile Asp Thr Cys Gly Asn Ile Val Glu Gln Lys Ser Phe
1205 1210 1215
Asn Ile Val Asn Gly Tyr Asp Tyr Gln Ile Lys Leu Lys Gln Gln Glu
1220 1225 1230
Gly Ala Arg Gln Ile Ala Arg Lys Glu Trp Lys Glu Ile Gly Lys Ile
1235 1240 1245
Lys Glu Ile Lys Glu Gly Tyr Leu Ser Leu Val Ile His Glu Ile Ser
1250 1255 1260
Lys Met Val Ile Lys Tyr Asn Ala Ile Ile Ala Met Glu Asp Leu Ser
1265 1270 1275 1280
Tyr Gly Phe Lys Lys Gly Arg Phe Lys Val Glu Arg Gln Val Tyr Gln
1285 1290 1295
Lys Phe Glu Thr Met Leu Ile Asn Lys Leu Asn Tyr Leu Val Phe Lys
1300 1305 1310
Asp Ile Ser Ile Thr Glu Asn Gly Gly Leu Leu Lys Gly Tyr Gln Leu
1315 1320 1325
Thr Tyr Ile Pro Asp Lys Leu Lys Asn Val Gly His Gln Cys Gly Cys
1330 1335 1340
Ile Phe Tyr Val Pro Ala Ala Tyr Thr Ser Lys Ile Asp Pro Thr Thr
1345 1350 1355 1360
Gly Phe Val Asn Ile Phe Lys Phe Lys Asp Leu Thr Val Asp Ala Lys
1365 1370 1375
Arg Glu Phe Ile Lys Lys Phe Asp Ser Ile Arg Tyr Asp Ser Glu Lys
1380 1385 1390
Asn Leu Phe Cys Phe Thr Phe Asp Tyr Asn Asn Phe Ile Thr Gln Asn
1395 1400 1405
Thr Val Met Ser Lys Ser Ser Trp Ser Val Tyr Thr Tyr Gly Val Arg
1410 1415 1420
Ile Lys Arg Arg Phe Val Asn Gly Arg Phe Ser Asn Glu Ser Asp Thr
1425 1430 1435 1440
Ile Asp Ile Thr Lys Asp Met Glu Lys Thr Leu Glu Met Thr Asp Ile
1445 1450 1455
Asn Trp Arg Asp Gly His Asp Leu Arg Gln Asp Ile Ile Asp Tyr Glu
1460 1465 1470
Ile Val Gln His Ile Phe Glu Ile Phe Arg Leu Thr Val Gln Met Arg
1475 1480 1485
Asn Ser Leu Ser Glu Leu Glu Asp Arg Asp Tyr Asp Arg Leu Ile Ser
1490 1495 1500
Pro Val Leu Asn Glu Asn Asn Ile Phe Tyr Asp Ser Ala Lys Ala Gly
1505 1510 1515 1520
Asp Ala Leu Pro Lys Asp Ala Asp Ala Asn Gly Ala Tyr Cys Ile Ala
1525 1530 1535
Leu Lys Gly Leu Tyr Glu Ile Lys Gln Ile Thr Glu Asn Trp Lys Glu
1540 1545 1550
Asp Gly Lys Phe Ser Arg Asp Lys Leu Lys Ile Ser Asn Lys Asp Trp
1555 1560 1565
Phe Asp Phe Ile Gln Asn Lys Arg Tyr Leu Ser Pro Val Arg Ser Pro
1570 1575 1580
Lys Lys Lys Arg Lys Val
1585 1590
<210> 2
<211> 4731
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atgtctaaaa gttggggcaa gttcatagag gaggaagagg cagaaatggc gtccagaaga 60
aatctcatga ttgtagatgg gacgaatctc ggtttccgtt tcaagcacaa taactctaag 120
aaacctttcg catctagcta tgttagcaca atccagagtc tcgcgaagag ctactctgcg 180
cgtacaacta tcgttctggg agacaagggg aagtctgtgt ttcgccttga gcatttgccc 240
gagtacaaag gtaaccgcga cgagaagtac gctcagagga ctgaagaaga aaaagctctc 300
gacgaacaat tctttgaata cctgaaggac gctttcgagc tttgcaagac aacatttcct 360
acgtttacga tacgtggggt ggaagcggat gacatggcag catacattgt aaaattgata 420
ggacacctgt acgaccatgt atggttgata tctactgacg gggattggga tactcttttg 480
accgacaagg tgagccggtt ttcattcaca acccgtagag agtaccattt gcgagatatg 540
tacgaacatc ataatgttga cgatgtggag caattcataa gcctcaaagc aataatgggc 600
gatctgggcg ataacattcg cggagtagaa ggcatcggag cgaaacgggg ttacaatatt 660
ataagggaat tcggcaacgt actggatatc atcgaccaac tccctttgcc agggaagcaa 720
aagtacatac agaatctcaa cgcgtctgag gagctgctgt ttcgtaatct tatcctcgtc 780
gatctgccta cttattgtgt tgatgcgata gcagcggtag gtcaggatgt cctggacaag 840
ttcacgaaag acatcttgga aatcgcagag cagagtggca gcgagacacc gggcacctcc 900
gaatctgcta cccccgagtc gggaagtaac aacggaacta ataattttca aaacttcatt 960
gggattagtt ctctgcagaa gacccttcgg aatgccctca ttcccactga gacgactcaa 1020
cagtttatcg taaaaaatgg aattattaag gaggatgagt tgcgggggga gaataggcag 1080
attttgaaag acatcatgga tgactattac cggggtttta tctccgagac cctgtcctct 1140
atcgatgata ttgattggac gtctcttttt gagaagatgg agattcagct gaaaaatggt 1200
gataacaaag ataccctcat taaggagcaa accgagtacc ggaaggcgat ccacaagaag 1260
ttcgccaacg atgatcgttt taagaatatg ttctcagcca aactcatcag tgacatcctt 1320
ccagaatttg taattcataa taataactac tctgcgtctg agaaagaaga aaaaactcaa 1380
gtcatcaagc tcttttcacg gtttgcaacg agctttaagg attactttaa aaaccgcgct 1440
aattgttttt ctgcggacga catcagctca tccagctgcc acagaatcgt caatgacaat 1500
gcggagatct tcttctccaa tgctctggta tataggcgca ttgtaaagtc cttgtccaat 1560
gacgatatta ataagataag tggtgatatg aaggattctc tcaaggaaat gtcattggag 1620
gagatctaca gctatgagaa atacggtgaa tttattacac aagaaggaat atccttttat 1680
aatgacatct gtgggaaggt gaattctttc atgaatttgt actgtcaaaa aaacaaggag 1740
aacaaaaacc tctacaaatt gcaaaaactg cataagcaaa ttctttgtat agcggacact 1800
agctacgagg tcccctacaa gtttgagtct gacgaggagg tataccagtc cgtcaacgga 1860
ttcctcgaca acatttccag taagcatatc gtggaacggc tcaggaagat aggggataac 1920
tataatggct ataaccttga caagatctat atcgtgagta aattctatga aagtgtatct 1980
caaaagacct atcgagattg ggaaaccata aacacagctc ttgagattca ttacaataat 2040
attcttcctg gtaacgggaa aagtaaagcc gataaagtga agaaggccgt caaaaacgac 2100
ctgcagaaga gcataacgga aatcaatgaa ttggtgtcta actacaagct gtgctcagat 2160
gacaacataa aagctgagac atatatccat gagatcagcc acatactgaa taactttgag 2220
gcgcaagagc tgaaatataa tcctgagatc caccttgtag agtctgaact caaggcttcc 2280
gaactgaaaa atgtacttga cgtaatcatg aatgcttttc actggtgtag tgtattcatg 2340
actgaggaac tggttgataa ggataataat ttttatgcgg aacttgaaga aatatacgat 2400
gagatttatc ccgttatctc actctataat ttggtccgaa attatgtaac tcaaaaacca 2460
tactccacaa agaaaatcaa gctcaatttc ggtatcccga ccttggctga cggatggtct 2520
aaaagcaagg agtactccaa taacgcgata atcttgatgc gagataatct ttactatctc 2580
ggaattttta atgctaaaaa taagcccgat aaaaagatta ttgaaggaaa cacatctgag 2640
aacaaaggcg attataaaaa gatgatttat aatttgctcc ctggaccaaa caaaatgatc 2700
cctaaagttt tcctcagttc caagaccggg gttgagacgt acaagcctag tgcatatatc 2760
ttggaaggtt ataagcaaaa caagcacatc aaaagttcta aggactttga catcactttt 2820
tgtcatgatt tgattgacta ttttaaaaac tgtattgcaa ttcacccaga gtggaagaat 2880
tttggatttg acttctcaga cacgtctacc tatgaagata tatcaggatt ttatcgcgag 2940
gttgagctcc agggttacaa gattgattgg acttatatca gcgagaagga tattgatctt 3000
ttgcaggaaa aaggccaact ttatttgttc caaatctaca acaaggactt ttctaagaaa 3060
tcaactggca acgataacct tcatactatg tacctcaaaa atctcttttc cgaagagaat 3120
cttaaggata tcgtgctcaa gctgaacggt gaggcagaga tatttttccg aaagagttct 3180
atcaaaaacc caattatcca caaaaaaggc agcatcctgg ttaacaggac gtacgaggcc 3240
gaagagaaag atcagttcgg caacatacag atagtgcgga agaatatacc agagaatatc 3300
taccaagagc tttataagta ttttaatgat aagtccgaca aggaattgag tgacgaggcg 3360
gcgaagttga aaaatgtagt gggacatcac gaagccgcca caaacatcgt gaaggactat 3420
cggtatacct atgataagta cttccttcac atgccaatca cgatcaattt taaagcgaat 3480
aagaccgggt tcataaatga ccggattctg cagtacatag caaaggagaa agatcttcat 3540
gttataggca ttgatcgcgg cgaaagaaac cttatttatg tctccgttat agacacatgt 3600
gggaacatcg ttgaacaaaa atcctttaat atcgttaatg gatacgacta tcagataaag 3660
ctcaaacaac aggagggggc gcgccagatt gctcgtaaag aatggaagga aataggaaaa 3720
ataaaagaaa tcaaggaggg ttacctgagc cttgtaattc atgaaatctc caaaatggtt 3780
ataaagtaca acgcgattat tgccatggaa gatctctcat acggttttaa aaaagggagg 3840
ttcaaggtgg agcgacaggt gtaccaaaag tttgaaacga tgcttattaa taaactcaat 3900
tacctcgtgt tcaaggatat aagcataaca gaaaatggag ggctccttaa gggataccag 3960
ctcacataca taccggacaa gcttaaaaac gtgggacacc agtgcgggtg tatattttac 4020
gttcctgccg cgtatacatc aaagatagac cccaccacag ggttcgtgaa tatcttcaag 4080
tttaaggact tgacagtcga tgcaaaacgt gagttcatca agaaattcga ttcaatccgg 4140
tacgattcag aaaagaatct gttctgtttt acgttcgatt ataacaactt tattacgcaa 4200
aatacagtga tgtcaaagag ctcatggagt gtctacacat acggggttag gataaagcgc 4260
aggttcgtta acggtcggtt ctcaaacgaa tcagacacga ttgacattac gaaggatatg 4320
gaaaagactc tggagatgac cgacataaat tggcgagacg gccacgacct ccgacaagat 4380
atcattgact acgagatcgt ccaacacatt tttgaaatct tccggttgac cgtccagatg 4440
cgaaacagtc tttctgaatt ggaagaccgg gattacgaca gattgatcag tcctgtattg 4500
aacgaaaaca acatattcta tgattccgcc aaagctggcg atgctttgcc aaaagacgcc 4560
gacgcgaatg gagcatattg tatcgccctt aaaggccttt acgaaatcaa acaaataaca 4620
gagaactgga aagaggatgg gaaatttagc cgagataagc tcaagatcag caacaaagac 4680
tggtttgact ttattcaaaa caaacggtac ctctcccccg ttcgaagttg a 4731
<210> 3
<211> 4773
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
atgcctaaga agaagagaaa ggtgtctaaa agttggggca agttcataga ggaggaagag 60
gcagaaatgg cgtccagaag aaatctcatg attgtagatg ggacgaatct cggtttccgt 120
ttcaagcaca ataactctaa gaaacctttc gcatctagct atgttagcac aatccagagt 180
ctcgcgaaga gctactctgc gcgtacaact atcgttctgg gagacaaggg gaagtctgtg 240
tttcgccttg agcatttgcc cgagtacaaa ggtaaccgcg acgagaagta cgctcagagg 300
actgaagaag aaaaagctct cgacgaacaa ttctttgaat acctgaagga cgctttcgag 360
ctttgcaaga caacatttcc tacgtttacg atacgtgggg tggaagcgga tgacatggca 420
gcatacattg taaaattgat aggacacctg tacgaccatg tatggttgat atctactgac 480
ggggattggg atactctttt gaccgacaag gtgagccggt tttcattcac aacccgtaga 540
gagtaccatt tgcgagatat gtacgaacat cataatgttg acgatgtgga gcaattcata 600
agcctcaaag caataatggg cgatctgggc gataacattc gcggagtaga aggcatcgga 660
gcgaaacggg gttacaatat tataagggaa ttcggcaacg tactggatat catcgaccaa 720
ctccctttgc cagggaagca aaagtacata cagaatctca acgcgtctga ggagctgctg 780
tttcgtaatc ttatcctcgt cgatctgcct acttattgtg ttgatgcgat agcagcggta 840
ggtcaggatg tcctggacaa gttcacgaaa gacatcttgg aaatcgcaga gcagagtggc 900
agcgagacac cgggcacctc cgaatctgct acccccgagt cgggaagtaa caacggaact 960
aataattttc aaaacttcat tgggattagt tctctgcaga agacccttcg gaatgccctc 1020
attcccactg agacgactca acagtttatc gtaaaaaatg gaattattaa ggaggatgag 1080
ttgcgggggg agaataggca gattttgaaa gacatcatgg atgactatta ccggggtttt 1140
atctccgaga ccctgtcctc tatcgatgat attgattgga cgtctctttt tgagaagatg 1200
gagattcagc tgaaaaatgg tgataacaaa gataccctca ttaaggagca aaccgagtac 1260
cggaaggcga tccacaagaa gttcgccaac gatgatcgtt ttaagaatat gttctcagcc 1320
aaactcatca gtgacatcct tccagaattt gtaattcata ataataacta ctctgcgtct 1380
gagaaagaag aaaaaactca agtcatcaag ctcttttcac ggtttgcaac gagctttaag 1440
gattacttta aaaaccgcgc taattgtttt tctgcggacg acatcagctc atccagctgc 1500
cacagaatcg tcaatgacaa tgcggagatc ttcttctcca atgctctggt atataggcgc 1560
attgtaaagt ccttgtccaa tgacgatatt aataagataa gtggtgatat gaaggattct 1620
ctcaaggaaa tgtcattgga ggagatctac agctatgaga aatacggtga atttattaca 1680
caagaaggaa tatcctttta taatgacatc tgtgggaagg tgaattcttt catgaatttg 1740
tactgtcaaa aaaacaagga gaacaaaaac ctctacaaat tgcaaaaact gcataagcaa 1800
attctttgta tagcggacac tagctacgag gtcccctaca agtttgagtc tgacgaggag 1860
gtataccagt ccgtcaacgg attcctcgac aacatttcca gtaagcatat cgtggaacgg 1920
ctcaggaaga taggggataa ctataatggc tataaccttg acaagatcta tatcgtgagt 1980
aaattctatg aaagtgtatc tcaaaagacc tatcgagatt gggaaaccat aaacacagct 2040
cttgagattc attacaataa tattcttcct ggtaacggga aaagtaaagc cgataaagtg 2100
aagaaggccg tcaaaaacga cctgcagaag agcataacgg aaatcaatga attggtgtct 2160
aactacaagc tgtgctcaga tgacaacata aaagctgaga catatatcca tgagatcagc 2220
cacatactga ataactttga ggcgcaagag ctgaaatata atcctgagat ccaccttgta 2280
gagtctgaac tcaaggcttc cgaactgaaa aatgtacttg acgtaatcat gaatgctttt 2340
cactggtgta gtgtattcat gactgaggaa ctggttgata aggataataa tttttatgcg 2400
gaacttgaag aaatatacga tgagatttat cccgttatct cactctataa tttggtccga 2460
aattatgtaa ctcaaaaacc atactccaca aagaaaatca agctcaattt cggtatcccg 2520
accttggctg acggatggtc taaaagcaag gagtactcca ataacgcgat aatcttgatg 2580
cgagataatc tttactatct cggaattttt aatgctaaaa ataagcccga taaaaagatt 2640
attgaaggaa acacatctga gaacaaaggc gattataaaa agatgattta taatttgctc 2700
cctggaccaa acaaaatgat ccctaaagtt ttcctcagtt ccaagaccgg ggttgagacg 2760
tacaagccta gtgcatatat cttggaaggt tataagcaaa acaagcacat caaaagttct 2820
aaggactttg acatcacttt ttgtcatgat ttgattgact attttaaaaa ctgtattgca 2880
attcacccag agtggaagaa ttttggattt gacttctcag acacgtctac ctatgaagat 2940
atatcaggat tttatcgcga ggttgagctc cagggttaca agattgattg gacttatatc 3000
agcgagaagg atattgatct tttgcaggaa aaaggccaac tttatttgtt ccaaatctac 3060
aacaaggact tttctaagaa atcaactggc aacgataacc ttcatactat gtacctcaaa 3120
aatctctttt ccgaagagaa tcttaaggat atcgtgctca agctgaacgg tgaggcagag 3180
atatttttcc gaaagagttc tatcaaaaac ccaattatcc acaaaaaagg cagcatcctg 3240
gttaacagga cgtacgaggc cgaagagaaa gatcagttcg gcaacataca gatagtgcgg 3300
aagaatatac cagagaatat ctaccaagag ctttataagt attttaatga taagtccgac 3360
aaggaattga gtgacgaggc ggcgaagttg aaaaatgtag tgggacatca cgaagccgcc 3420
acaaacatcg tgaaggacta tcggtatacc tatgataagt acttccttca catgccaatc 3480
acgatcaatt ttaaagcgaa taagaccggg ttcataaatg accggattct gcagtacata 3540
gcaaaggaga aagatcttca tgttataggc attgatcgcg gcgaaagaaa ccttatttat 3600
gtctccgtta tagacacatg tgggaacatc gttgaacaaa aatcctttaa tatcgttaat 3660
ggatacgact atcagataaa gctcaaacaa caggaggggg cgcgccagat tgctcgtaaa 3720
gaatggaagg aaataggaaa aataaaagaa atcaaggagg gttacctgag ccttgtaatt 3780
catgaaatct ccaaaatggt tataaagtac aacgcgatta ttgccatgga agatctctca 3840
tacggtttta aaaaagggag gttcaaggtg gagcgacagg tgtaccaaaa gtttgaaacg 3900
atgcttatta ataaactcaa ttacctcgtg ttcaaggata taagcataac agaaaatgga 3960
gggctcctta agggatacca gctcacatac ataccggaca agcttaaaaa cgtgggacac 4020
cagtgcgggt gtatatttta cgttcctgcc gcgtatacat caaagataga ccccaccaca 4080
gggttcgtga atatcttcaa gtttaaggac ttgacagtcg atgcaaaacg tgagttcatc 4140
aagaaattcg attcaatccg gtacgattca gaaaagaatc tgttctgttt tacgttcgat 4200
tataacaact ttattacgca aaatacagtg atgtcaaaga gctcatggag tgtctacaca 4260
tacggggtta ggataaagcg caggttcgtt aacggtcggt tctcaaacga atcagacacg 4320
attgacatta cgaaggatat ggaaaagact ctggagatga ccgacataaa ttggcgagac 4380
ggccacgacc tccgacaaga tatcattgac tacgagatcg tccaacacat ttttgaaatc 4440
ttccggttga ccgtccagat gcgaaacagt ctttctgaat tggaagaccg ggattacgac 4500
agattgatca gtcctgtatt gaacgaaaac aacatattct atgattccgc caaagctggc 4560
gatgctttgc caaaagacgc cgacgcgaat ggagcatatt gtatcgccct taaaggcctt 4620
tacgaaatca aacaaataac agagaactgg aaagaggatg ggaaatttag ccgagataag 4680
ctcaagatca gcaacaaaga ctggtttgac tttattcaaa acaaacggta cctctccccc 4740
gttcgaagtc ccaagaagaa gcgtaaggtc tga 4773

Claims (15)

1.一种融合蛋白,其特征在于,包括ErCas12a蛋白及融合于其N端的T5外切酶。
2.根据权利要求1所述的融合蛋白,其特征在于,其中所述T5外切酶和ErCas12a蛋白通过接头连接,所述接头优选为(GGGS)n、(EAAAK)n、SGGS-XTEN-SGGSS和Xten-linker,优选地,所述接头为Xten-linker。
3.根据权利要求1或2所述的融合蛋白,其特征在于,其中所述融合蛋白还包含一个或多个核定位信号序列。
4.根据权利要求1至3中任一项所述的融合蛋白,其特征在于,其中所述融合蛋白的序列如SEQ ID NO.1所示,或者与SEQ ID NO.1所示的氨基酸序列具有一个或者更多个氨基酸的替换、缺失或插入,但是具有相同功能的变体。
5.一种核酸分子,其特征在于,其能够编码权利要求1至4中任一项所述的融合蛋白。
6.根据权利要求5所述的核酸分子,其特征在于,所述的核酸分子具有以下任一核苷酸序列:
(1)SEQ ID NO.2所示的核苷酸序列;或,
(2)SEQ ID NO.2所示的核苷酸序列经过一个或多个核苷酸的替换、缺失或插入获得的具有相同功能蛋白的编码核苷酸序列;或,
(3)在严格条件下可以与SEQ ID NO.2所示的核苷酸序列进行杂交的核苷酸序列;或,
(4)与SEQ ID NO.2所示的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性的序列。
7.一种生物材料,其特征在于,包含权利要求1至4中任一项所述的蛋白和/或权利要求5或6所述的核酸分子。
8.一种组合物,其特征在于,包括:
1)第一核酸,其为权利要求5或6的核酸分子;和
2)第二核酸,其为靶向目标基因的pre-crRNA或crRNA。
9.根据权利要求8所述的组合物,其特征在于,还包括:
3)供体分子。
10.一种复合物,其特征在于,包括:
a)第一组分,其为权利要求1至4中任一项所述融合蛋白;和
b)第二组分,其为pre-crRNA或crRNA。
11.权利要求1至4中任一项所述的融合蛋白或、权利要求5或6所述的核酸分子、权利要求7所述的生物材料、权利要求8或9所述的组合物或权利要求10所述的复合物在非治疗目的的基因修饰中的应用。
12.根据权利要求11所述的应用,其特征在于,所述基因修饰包括基因敲除和基因敲入。
13.根据权利要求11所述的应用,其特征在于,所述应用包括在动物中的应用;优选所述动物为低温动物,所述低温为低于37℃;最优选所述动物为斑马鱼。
14.权利要求1至4中任一项所述的融合蛋白、权利要求5或6所述的核酸分子、权利要求7所述的生物材料、权利要求8或9所述的组合物、权利要求10所述的复合物在制备制剂中的用途,所述制剂用于:
(i)离体基因或基因组编辑;
(ii)离体单链DNA的检测;
(iii)编辑靶基因座中的靶序列来修饰生物;
(iv)治疗由靶基因座中的靶序列的缺陷引起的病症。
15.一种利用CRISPR/Cas12a系统进行基因组修饰/基因组编辑的方法,其包括将权利要求1至4中任一项所述的融合蛋白、权利要求5或6所述的核酸分子、权利要求7所述的生物材料、权利要求8或9所述的组合物或权利要求10所述的复合物与目标个体的基因组接触的步骤,并且所述方法不包括热激的步骤或者所述方法在低于37℃的条件下进行;优选的,所述目标个体为动物,更优选为斑马鱼。
CN202111480072.7A 2021-12-06 2021-12-06 一种改造的人工核酸酶系统及其应用 Pending CN114317492A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111480072.7A CN114317492A (zh) 2021-12-06 2021-12-06 一种改造的人工核酸酶系统及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111480072.7A CN114317492A (zh) 2021-12-06 2021-12-06 一种改造的人工核酸酶系统及其应用

Publications (1)

Publication Number Publication Date
CN114317492A true CN114317492A (zh) 2022-04-12

Family

ID=81049497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111480072.7A Pending CN114317492A (zh) 2021-12-06 2021-12-06 一种改造的人工核酸酶系统及其应用

Country Status (1)

Country Link
CN (1) CN114317492A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210130835A1 (en) * 2019-11-05 2021-05-06 Pairwise Plants Services, Inc. Compositions and methods for rna-encoded dna-replacement of alleles
CN113025597A (zh) * 2019-12-24 2021-06-25 中国科学院微生物研究所 改进的基因组编辑系统
CN113481184A (zh) * 2021-08-06 2021-10-08 北京大学 融合蛋白以及其使用方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210130835A1 (en) * 2019-11-05 2021-05-06 Pairwise Plants Services, Inc. Compositions and methods for rna-encoded dna-replacement of alleles
CN113025597A (zh) * 2019-12-24 2021-06-25 中国科学院微生物研究所 改进的基因组编辑系统
CN113481184A (zh) * 2021-08-06 2021-10-08 北京大学 融合蛋白以及其使用方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
WIERSON等: "Expanding the CRISPR Toolbox with ErCas12a in Zebrafish and Human Cells", 《CRISPR J》, vol. 2, no. 6, pages 3 - 4 *

Similar Documents

Publication Publication Date Title
US20240117330A1 (en) Enzymes with ruvc domains
US10982200B2 (en) Enzymes with RuvC domains
CN107922931B (zh) 热稳定的Cas9核酸酶
KR102339365B1 (ko) 키메라 게놈 조작 분자 및 방법
US11713471B2 (en) Class II, type V CRISPR systems
EP4146800A1 (en) Enzymes with ruvc domains
CN110300802A (zh) 用于动物胚胎碱基编辑的组合物和碱基编辑方法
WO2021178934A1 (en) Class ii, type v crispr systems
KR20240055073A (ko) 클래스 ii, v형 crispr 시스템
KR20230074207A (ko) 카고 뉴클레오타이드 서열을 전위시키기 위한 시스템 및 방법
US20220298494A1 (en) Enzymes with ruvc domains
US20220220460A1 (en) Enzymes with ruvc domains
CN114317492A (zh) 一种改造的人工核酸酶系统及其应用
EP4165177A1 (en) Enzymes with ruvc domains
US12024727B2 (en) Enzymes with RuvC domains
US20240110167A1 (en) Enzymes with ruvc domains
US20240209332A1 (en) Enzymes with ruvc domains
GB2617659A (en) Enzymes with RUVC domains
CN116615547A (zh) 用于对货物核苷酸序列转座的系统和方法
WO2023039434A1 (en) Systems and methods for transposing cargo nucleotide sequences
WO2023164590A2 (en) Fusion proteins

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination