CN114277047B - 一种使大肠杆菌获得有效nhej系统的高通量筛选工具在大肠杆菌基因编辑中的应用 - Google Patents

一种使大肠杆菌获得有效nhej系统的高通量筛选工具在大肠杆菌基因编辑中的应用 Download PDF

Info

Publication number
CN114277047B
CN114277047B CN202111629910.2A CN202111629910A CN114277047B CN 114277047 B CN114277047 B CN 114277047B CN 202111629910 A CN202111629910 A CN 202111629910A CN 114277047 B CN114277047 B CN 114277047B
Authority
CN
China
Prior art keywords
ligd
gene
nhej
escherichia coli
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111629910.2A
Other languages
English (en)
Other versions
CN114277047A (zh
Inventor
薛高旭
夏立军
方其
张艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genewiz Suzhou Ltd
Original Assignee
Genewiz Suzhou Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genewiz Suzhou Ltd filed Critical Genewiz Suzhou Ltd
Priority to CN202111629910.2A priority Critical patent/CN114277047B/zh
Publication of CN114277047A publication Critical patent/CN114277047A/zh
Application granted granted Critical
Publication of CN114277047B publication Critical patent/CN114277047B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种使大肠杆菌获得有效NHEJ系统的高通量筛选工具在大肠杆菌基因编辑中的应用,所述使大肠杆菌获得有效NHEJ系统的高通量筛选工具包括:pDual‑Cas9‑Parental质粒载体:含有DNA解旋酶基因、复制子、抗生素抗性基因、核酸酶基因、araC基因、阿拉伯糖启动子和Ⅱs型限制酶识别位点;和pDual‑sgRNA‑lacZ质粒载体:含有靶向lacZ基因的sgRNA序列、组成型表达的强启动子、复制子和抗生素抗性基因。本发明筛选得到的NHEJ系统在大肠杆菌中具有良好的连接效率,并可以进行高效的基因编辑,应用前景广阔。

Description

一种使大肠杆菌获得有效NHEJ系统的高通量筛选工具在大肠 杆菌基因编辑中的应用
技术领域
本发明属于基因编辑技术领域,尤其涉及一种使大肠杆菌获得有效NHEJ系统的高通量筛选工具在大肠杆菌基因编辑中的应用。
背景技术
CRISPR-Cas9是细菌和古细菌在长期演化过程中形成的一种适应性免疫防御系统,可用来对抗入侵的病毒及外源DNA。该系统能够识别靶序列并对靶序列进行切割,形成DSB(double-stranded breaks,双链断裂)。生物体基因组发生断裂形成DSB后,会通过NHEJ(non-homologous end joining,非同源末端连接)途径或在有同源模板存在的情况下通过HR(homologous recombination,同源重组)途径启动DNA修复。CRISPR-Cas9技术已经被广泛用于真核和原核生物的基因组编辑,包括人、小鼠、斑马鱼以及大肠杆菌等,是迄今为止基因组编辑中最有效的革命性工具。
基因敲除是研究基因的生物学功能的常用方法。真核生物本身具有NHEJ系统,因此在真核细胞中,可以通过在基因中引入一个DSB,经过易错的NHEJ系统修复得到单基因突变体;或通过引入两个DSB,基因组外侧的末端可以通过NHEJ系统连接起来,得到删除两个DSB中间序列的突变体。真核生物NHEJ系统比较复杂,由Ku70/Ku80异源二聚体、聚合酶、核酸酶以及连接酶组成,此外可能还需要多种辅助蛋白参与处理DSB末端,使DSB易于修复。
在原核生物中,仅在少数几种细菌被鉴定发现有NHEJ系统,如Mycobacteriumtuberculosis、Mycobacterium smegmatis、Bacillus subtilis以及Pseudomonasaeruginosa等。原核生物的NHEJ系统构成简单,仅由Ku和ligD组成,NHEJ系统修复DSB的过程常常伴随着在DNA断裂处删除或插入不同长度的DNA。
多数原核生物,譬如大肠杆菌,因缺乏NHEJ系统,当基因组发生断裂时,只能通过同源重组的方式修复DSB。基于同源重组的基因组编辑技术以其高效、精确的特点已经被广泛应用于原核生物。目前,主要有三种方法进行大肠杆菌的基因编辑,均使用噬菌体的Rac或Red同源重组系统。(1)经典的基于双链DNA(double-stranded DNA,缩写dsDNA)的重组技术构建的基因敲除或敲入突变体,通常需要向生物体引入选择性的标记用于区分正确的突变体,抗生素抗性基因是常用的选择性标记,但是构建的突变体通常不希望引入额外的序列,因此,该方法往往需要额外的步骤从基因组中消除选择性标记序列,最终获得基因组“无痕”的突变体。(2)在基因组复制过程中,使用人工合成的单链DNA(single-strandedDNA,缩写ssDNA)或双链DNA与染色体互补区域退火,可以在不引入选择性标记的情况下进行基因重组构建突变体。尽管这两种方法能够进行基因组编辑,但是突变率通常比较低。(3)使用CRISPR-Cas9系统,同时表达Red系统的三种蛋白,在同源模板存在的情况下进行同源重组基因编辑,该方法具有基因编辑效率高的优点,但是该方法应用于基因组规模的基因编辑时因其模板质粒构建极其复杂而受到限制。
Tianyuan Su等(T.Su,F.Liu,P.Gu,H.Jin,Y.Chang,Q.Wang,Q.Liang,Q.Qi,ACRISPR-cas9 assisted non-homologous end-joining strategy for one-stepengineering of bacterial genome,Sci.Rep.6(2016)37895.)通过使大肠杆菌异源表达Mycobacterium tuberculosis H37Rv NHEJ蛋白,首次将NHEJ系统成功引入大肠杆菌,成功对线性质粒和断裂的基因组进行了末端连接。尽管大肠杆菌可以通过表达外源NHEJ系统获得非同源末端连接的能力,但是大肠杆菌本身固有的同源重组与引入的NHEJ系统是一种竞争关系,如果NHEJ系统连接效率较低,同源重组修复就会占主导作用,导致NHEJ系统的连接“失效”。
尽管Tianyuan Su等、Xuan Zheng等(X.Zheng,S.Li,G.Zhao,J.Wang.(2017).Anefficient system for deletion of large DNA fragments in Escherichia coli viaintroduction of both Cas9 and the non-homologous end joining system fromMycobacterium smegmatis,BBRC.(2017)1-7)通过使大肠杆菌表达其它微生物来源的Ku和ligD蛋白,成功将NHEJ系统引入大肠杆菌,但是迄今仍然没有高效的能使大肠杆菌获得NHEJ系统并进行基因编辑的方法。
高效的NHEJ系统是基因组规模的基因编辑技术的基础。因此,如何提供一种可在大肠杆菌中对基因组进行高效编辑的系统及方法,已成为亟待解决的问题。
发明内容
针对现有技术的不足和实际需求,本发明提供一种使大肠杆菌获得有效NHEJ系统的高通量筛选工具在大肠杆菌基因编辑中的应用,筛选得到的NHEJ系统在大肠杆菌中的连接效率很高,在基因编辑的相关研究中具有广阔的应用前景。
为达此目的,本发明采用如下技术方案:
第一方面,本发明提供了一种使大肠杆菌获得有效NHEJ系统的高通量筛选工具在大肠杆菌基因编辑中的应用,所述使大肠杆菌获得有效NHEJ系统的高通量筛选工具包括:
pDual-Cas9-Parental质粒载体:含有DNA解旋酶基因、复制子、抗生素抗性基因、核酸酶基因、araC基因、阿拉伯糖启动子和Ⅱs型限制酶识别位点;
和pDual-sgRNA-lacZ质粒载体:含有靶向lacZ基因的sgRNA序列、组成型表达的强启动子、复制子和抗生素抗性基因。
本发明中,通过所述高通量筛选工具可以快速高效地筛选出在大肠杆菌中有效的NHEJ系统,进而将其引入大肠杆菌,提高了基因断裂后的非同源末端连接效率,进而提升了基因编辑的效率,具有很高的应用价值。
优选地,所述DNA解旋酶基因包括Rep101基因。
优选地,所述复制子包括pSC101复制子。
优选地,所述核酸酶基因包括Cas9基因。
优选地,所述阿拉伯糖启动子的数量为2个。
优选地,所述Ⅱs型限制酶识别位点为至少2个,例如可以是2个、3个、4个或5个等,该数值范围内的其他具体点值均可选择,在此便不再一一赘述。
优选地,所述Ⅱs型限制酶识别位点包括BsaⅠ和/或BbsⅠ。
优选地,所述组成型表达的强启动子包括J23119启动子。
优选地,所述pDual-Cas9-Parental质粒载体和pDual-sgRNA-lacZ质粒载体的抗生素抗性基因不同。
优选地,所述pDual-Cas9-Parental质粒载体的抗生素抗性基因为卡那霉素抗性基因,所述pDual-sgRNA-lacZ质粒载体的抗生素抗性基因为氨苄青霉素抗性基因。
优选地,所述pDual-Cas9-Parental质粒载体顺次连接有DNA解旋酶基因、复制子、抗生素抗性基因、核酸酶基因、araC基因、阿拉伯糖启动子和Ⅱs型限制酶识别位点。
优选地,所述pDual-sgRNA-lacZ质粒载体顺次连接有靶向lacZ基因的sgRNA序列、组成型表达的强启动子、复制子和抗生素抗性基因。
作为优选技术方案,本发明中所述使大肠杆菌获得有效NHEJ系统的高通量筛选工具,包括:
pDual-Cas9-Parental质粒载体:顺次连接有Rep101基因、pSC101复制子、卡那霉素抗性基因、Cas9基因、araC基因、2个阿拉伯糖启动子、用于克隆Ku基因的BsaⅠ限制酶识别位点和用于克隆ligD基因的BbsⅠ限制酶识别位点;
和pDual-sgRNA-lacZ质粒载体:顺次连接有靶向lacZ基因的sgRNA序列、J23119启动子、复制子和氨苄青霉素抗性基因。
第二方面,本发明提供了一种计算NHEJ系统连接效率的方法,所述计算NHEJ系统连接效率的方法包括:
将NHEJ系统转化大肠杆菌,挑取单克隆培养后,制备感受态细胞;
将酶切后与未酶切的质粒分别转染制备的感受态细胞,培养;
统计平板上的克隆数,计算NHEJ系统的连接效率。
优选地,所述NHEJ系统为经过第一方面中所述的使大肠杆菌获得有效NHEJ系统的高通量筛选工具筛选后的NHEJ系统。
优选地,所述NHEJ系统为同时连接有Ku蛋白和ligD蛋白的CDS编码序列的pDual-Cas9-Ku+ligD质粒载体。
优选地,所述酶切包括限制酶酶切。
优选地,所述酶切包括EcoRⅤ限制酶酶切。
优选地,所述质粒包括pUC57-Amp。
优选地,所述NHEJ系统的连接效率的计算公式为:转化1ng酶切后的质粒的克隆数与转化1ng未酶切的质粒的克隆数的比值。
作为优选技术方案,本发明所述计算NHEJ系统连接效率的方法,包括以下步骤:
(1)将pDual-Cas9-Ku+ligD质粒转化大肠杆菌感受态细胞,涂布卡那霉素抗性LB平板,30℃培养过夜;
(2)挑取单克隆至LB培养基于30℃、220rpm条件下培养,当菌液OD600值达到0.6时,按照标准的电转感受态细胞制备方法制备感受态细胞;
(3)使用EcoRⅤ限制酶酶切pUC57-Amp质粒,酶切产物使用磁珠回收纯化;
(4)分别转化pUC57-Amp质粒以及EcoRⅤ酶切的pUC57-Amp质粒至步骤(2)制备的感受态细胞,涂布卡那霉素、氨苄青霉素LB平板,30℃培养过夜,同时将EcoRⅤ酶切的pUC57-Amp质粒转化MG1655感受态细胞,菌液离心后涂布氨苄青霉素的LB平板,30℃培养过夜(作为对照);
(5)统计每个平板的克隆数,计算NHEJ系统的连接效率,其中,所述NHEJ系统的连接效率的计算公式为:转化1ng EcoRⅤ酶切的pUC57-Amp质粒的克隆数与转化1ng pUC57-Amp质粒的克隆数的比值。
第三方面,本发明提供了一种通过NHEJ系统对大肠杆菌进行基因编辑的方法,所述基因编辑的方法包括:
将NHEJ系统转化大肠杆菌,挑取单克隆培养后,制备感受态细胞;
构建靶向目的基因的pDual-sgRNA质粒;
将构建的所述靶向目的基因的pDual-sgRNA质粒转化制备的感受态细胞,培养;
挑取克隆进行验证,分析基因编辑的情况。
优选地,所述NHEJ系统为经过第一方面中所述的使大肠杆菌获得有效NHEJ系统的高通量筛选工具筛选后的NHEJ系统。
优选地,所述NHEJ系统为同时连接有Ku蛋白和ligD蛋白的CDS编码序列的pDual-Cas9-Ku+ligD质粒载体。
优选地,所述感受态细胞包括电转感受态细胞。
优选地,所述靶向目的基因的pDual-sgRNA质粒转化制备的感受态细胞的方法包括电转化。
优选地,所述验证包括PCR扩增验证和/或测序验证。
作为优选技术方案,本发明所述通过NHEJ系统对大肠杆菌进行基因编辑的方法,包括以下步骤:
(1)将pDual-Cas9-Ku+ligD质粒转化大肠杆菌感受态细胞,涂布卡那霉素抗性LB平板,30℃培养过夜,次日,挑取单克隆至LB培养基于30℃、220rpm条件下培养,当菌液OD600值达到0.6时,按照标准的电转感受态细胞制备方法制备感受态细胞;
(2)构建靶向目的基因的pDual-sgRNA质粒;
(3)将构建的所述靶向目的基因的pDual-sgRNA质粒电转化步骤(1)制备的感受态细胞,涂布卡那霉素、氨苄青霉素LB平板,30℃培养过夜;
(4)挑单克隆至LB平板培养8小时,通过菌落PCR扩增目的基因,将扩增成功的PCR产物进行Sanger测序验证,并分析基因编辑情况。
相比于现有技术,本发明具有如下有益效果:
本发明通过使大肠杆菌获得有效NHEJ系统的高通量筛选工具,筛选出在大肠杆菌中有效的NHEJ系统,成功将外源NHEJ系统引入大肠杆菌中,促进了断裂后DNA双链的非同源末端连接,进而提高了基因编辑的效率,为大肠杆菌的基因编辑及基因功能的研究创造了条件。
附图说明
图1为本发明实施例3中lacZ基因的扩增结果图片,图中,M-标准DNA分子量Marker,1~192-编号为1~192的菌落的扩增结果;
图2为本发明实施例3中Ku基因的扩增结果图片,图中,M-标准DNA分子量Marker,1~192-编号为1~192的菌落的扩增结果;
图3为本发明实施例3中ligD基因的扩增结果图片,图中,M-标准DNA分子量Marker,1~192-编号为1~192的菌落的扩增结果;
图4为本发明实施例4中不同组别的平板菌落生长情况的结果图片;
图5为本发明实施例5中pcnB基因的PCR扩增的结果图片,图中,M-标准DNA分子量Marker,1~24-转化了pDual-Cas9-Mno-Ku+Mfo-ligD质粒的24个菌落的扩增结果,25~48-转化了pDual-Cas9-Mbr-Ku+Mfo-ligD质粒的24个菌落的扩增结果,49~72-转化了pDual-Cas9-Mno-Ku+Msm-ligD质粒的24个菌落的扩增结果。
具体实施方式
为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。
材料:
Top10感受态细胞购自天根生化科技(北京)有限公司;
BsaⅠ、SpeⅠ、EcoRⅤ和Gibson Master Mix试剂盒购自NEB公司;
T4 DNA连接酶购自赛默飞世尔科技(中国)有限公司;
MG1655大肠杆菌感受态细胞购自ATCC公司;
X-gal和IPTG购自默克公司;
pUC57-Amp质粒来自安升达生物科技有限公司。
实施例1构建使大肠杆菌获得有效NHEJ系统的高通量筛选工具
本实施例提供一种使大肠杆菌获得有效NHEJ系统的高通量筛选工具,所述使大肠杆菌获得有效NHEJ系统的高通量筛选工具包括:
pDual-Cas9-Parental质粒载体:顺次连接有Rep101基因、pSC101复制子、卡那霉素抗性基因、Cas9基因、araC基因、2个阿拉伯糖启动子、用于克隆Ku基因的BsaⅠ限制酶识别位点和用于克隆ligD基因的BbsⅠ限制酶识别位点;
和pDual-sgRNA-lacZ质粒载体:顺次连接有靶向lacZ基因的sgRNA序列、组成型表达的强启动子J23119启动子、复制子和氨苄青霉素抗性基因。
所述使大肠杆菌获得有效NHEJ系统的高通量筛选工具通过如下方法进行构建:
(1)基因合成pDual-Cas9-Parental质粒载体。
将所述pDual-Cas9-Parental质粒载体的功能原件通过基因合成顺次连接,得到所述pDual-Cas9-Parental质粒载体。
所述质粒具有SEQ ID NO.1所示的核苷酸序列,由苏州金唯智生物科技有限公司合成。
所述质粒自5’端151~1101bp为Rep101基因,1149~1371bp为pSC101复制子,2023~2838bp为卡那霉素抗性基因,3368~7471bp为Cas9基因,7604~8482bp为araC基因,8509~8793bp和9243~9527bp为阿拉伯糖启动子,8838~8843bp的反向互补序列和8854~8859bp为BsaⅠ限制酶识别位点,用于克隆Ku基因,9573~9578bp的反向互补序列和9589~9594bp为BbsⅠ限制酶识别位点,用于克隆ligD基因。
SEQ ID NO.1:
aaacagacgaagaatccatgggtatggacatgccgctcgccttccatgggtatggacagttttccctttgatatgtaacggtgaacagttgttctacttttgtttgttagtcttgatgcttcactgatagatacaagagccataagaacctcagatccttccgtatttagccagtatgttctctagtgtggttcgttgtttttgcgtgagccatgagaacgaaccattgagatcatacttactttgcatgtcactcaaaaattttgcctcaaaactggtgagctgaatttttgcagttaaagcatcgtgtagtgtttttcttagtccgttatgtaggtaggaatctgatgtaatggttgttggtattttgtcaccattcatttttatctggttgttctcaagttcggttacgagatccatttgtctatctagttcaacttggaaaatcaacgtatcagtcgggcggcctcgcttatcaaccaccaatttcatattgctgtaagtgtttaaatctttacttattggtttcaaaacccattggttaagccttttaaactcatggtagttattttcaagcattaacatgaacttaaattcatcaaggctaatctctatatttgccttgtgagttttcttttgtgttagttcttttaataaccactcataaatcctcatagagtatttgttttcaaaagacttaacatgttccagattatattttatgaatttttttaactggaaaagataaggcaatatctcttcactaaaaactaattctaatttttcgcttgagaacttggcatagtttgtccactggaaaatctcaaagcctttaaccaaaggattcctgatttccacagttctcgtcatcagctctctggttgctttagctaatacaccataagcattttccctactgatgttcatcatctgaacgtattggttataagtgaacgataccgtccgttctttccttgtagggttttcaatcgtggggttgagtagtgccacacagcataaaattagcttggtttcatgctccgttaagtcatagcgactaatcgctagttcatttgctttgaaaacaactaattcagacatacatctcaattggtctaggtgattttaatcactataccaattgagatgggctagtcaatgataattactagtccttttcctttgagttgtgggtatctgtaaattctgctagacctttgctggaaaacttgtaaattctgctagaccctctgtaaattccgctagacctttgtgtgttttttttgtttatattcaagtggttataatttatagaataaagaaagaataaaaaaagataaaaagaatagatcccagccctgtgtataactcactactttagtcagttccgcagtattacaaaaggatgtcgcaaacgctgtttgctcctctacaaaacagaccttaaaaccctaaaggcttaagtagcaccctcgcaagctcggttgcggccgcaatcgggcaaatcgctgaatattccttttgtctccgaccatcaggcacctgagtcgctgtctttttcgtgacattcagttcgctgcgctcacggctctggcagtgaatgggggtaaatggcactacaggcgccttttatggattcatgcaaggaaactacccataatacaagaaaagcccgtcacgggcttctcagggcgttttatggcgggtctgctatgtggtgctatctgactttttgctgttcagcagttcctgccctctgattttccagtctgaccacttcggattatcccgtgacaggtcattcagactggctaatgcacccagtaaggcagcggtatcatcaacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttacgtttccaaccaattaaccaattctgattagaaaaactcatcgagcatcaaatgaaactgcaatttattcatatcaggattatcaataccatatttttgaaaaagccgtttctgtaatgaaggagaaaactcaccgaggcagttccataggatggcaagatcctggtatcggtctgcgattccgactcgtccaacatcaatacaacctattaatttcccctcgtcaaaaataaggttatcaagtgagaaatcaccatgagtgacgactgaatccggtgagaatggcaaaagcttatgcatttctttccagacttgttcaacaggccagccattacgctcgtcatcaaaatcactcgcatcaaccaaaccgttattcattcgtgattgcgcctgagcgagacgaaatacgcgatcgctgttaaaaggacaattacaaacaggaatcgaatgcaaccggcgcaggaacactgccagcgcatcaacaatattttcacctgaatcaggatattcttctaatacctggaatgctgttttcccggggatcgcagtggtgagtaaccatgcatcatcaggagtacggataaaatgcttgatggtcggaagaggcataaattccgtcagccagtttagtctgaccatctcatctgtaacatcattggcaacgctacctttgccatgtttcagaaacaactctggcgcatcgggcttcccatacaatcgatagattgtcgcacctgattgcccgacattatcgcgagcccatttatacccatataaatcagcatccatgttggaatttaatcgcggcctcgagcaagacgtttcccgttgaatatggctcataacaccccttgtattactgtttatgtaagcagacagttttattgttcatgatgatatatttttatcttgtgcaatgtaacatcagagattttgagacacaacgtggctttccctgcagggtttgcagtcagagtagaatagaagtatcaaaaaaagcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgctatgctgttttgaatggttccaacaagattattttataacttttataacaaataatcaaggagaaattcaaagaaatttatcagccataaaacaatacttaatactatagaatgataacaaaataaactactttttaaaagaattttgtgttataatctatttattattaagtattgggtaatattttttgaagagatattttgaaaaagaaaaattaaagcatattaaactaatttcggaggtcattaaaactattattgaaatcatcaaactcattatggatttaatttaaactttttattttaggaggcaaaaatggataaaaaatacagtatcggcttagatattggcactaatagcgtgggttgggccgttattaccgatgaatataaagttccgagcaagaaattcaaagttctgggtaataccgatcgccacagtattaagaagaatctgatcggtgcactgctgtttgatagcggcgagacagccgaagccacacgtctgaaacgtaccgcacgtcgccgttatacccgtcgtaaaaatcgtatttgttacctgcaagagatttttagcaatgaaatggccaaagttgatgacagttttttccaccgtctggaagaaagttttttagtggaagaagataagaaacacgaacgccatccgatcttcggcaacatcgttgacgaagttgcctaccacgaaaagtaccctacaatttatcacctgcgcaaaaaactggttgatagcaccgacaaagccgacctgcgcttaatctatctggccctggcccacatgatcaaatttcgcggccactttctgattgaaggtgacttaaaccctgataacagtgacgttgacaaattattcattcagttagttcaaacctataaccagctgtttgaagaaaacccgatcaacgccagtggtgttgacgcaaaagccatcctgagtgcccgcctgagtaaaagccgccgtttagaaaacttaatcgcacaattaccgggtgagaagaaaaatggcttattcggcaacctgattgccctgagtctgggcttaacccctaatttcaaaagtaacttcgacctggccgaggacgccaagttacaactgagtaaagacacttatgatgacgatctggataatttactggcccaaatcggtgaccagtacgccgatctgtttttagccgccaagaatttaagcgatgccatcctgctgagtgatattctgcgtgtgaatacagaaattacaaaagccccgctgagcgcaagcatgattaagcgctatgacgagcaccatcaggacttaaccctgctgaaggccttagttcgccaacagctgccggagaagtataaagaaatcttttttgatcagagcaagaacggttacgccggttatattgacggcggtgccagccaggaagagttttacaagttcatcaaaccgatcctggagaaaatggatggcacagaggaactgttagtgaagctgaaccgtgaagatttactgcgcaagcagcgcaccttcgacaatggcagcattccgcatcaaattcatctgggtgaattacatgccattttacgtcgtcaggaagatttttatccgttcctgaaagacaaccgtgagaagatcgagaagattctgaccttccgcatcccgtactatgtgggcccgttagcacgcggtaacagccgtttcgcatggatgacacgtaaaagtgaagagacaattaccccttggaatttcgaagaggtggtggacaaaggtgccagcgcccagtcttttatcgagcgcatgacaaacttcgataagaatttacctaatgagaaagttttacctaaacatagcctgctgtatgaatacttcacagtttacaatgagttaaccaaagtgaaatatgtgaccgaaggtatgcgtaaaccggccttcttaagcggcgagcaaaagaaggcaatcgtggatctgttattcaaaaccaatcgcaaagttacagtgaaacaactgaaagaggactatttcaagaaaattgaatgcttcgatagcgtggagattagtggcgtggaggaccgttttaatgccagcttaggtacataccatgatctgttaaaaattattaaagataaagattttctggataacgaagaaaatgaagatattctggaagatatcgtgctgaccctgaccctgtttgaagatcgcgaaatgatcgaagagcgtctgaaaacctatgcccatctgttcgacgacaaagtgatgaaacagctgaagcgtcgccgctacaccggttggggtcgcttaagtcgcaagctgatcaacggtattcgtgacaaacagagcggtaaaaccatcctggattttctgaaaagcgatggtttcgccaaccgtaactttatgcagttaatccatgacgatagcctgacatttaaagaagatattcaaaaggcccaggttagcggccaaggtgatagcttacacgaacacattgccaatctggcaggcagtccggccattaaaaaaggtattttacaaaccgttaaggtggttgatgaattagtgaaagtgatgggccgccacaagcctgaaaatatcgtgattgaaatggcccgtgagaaccagaccacccaaaaaggccagaaaaacagtcgtgaacgcatgaagcgtatcgaagaaggtattaaagaactgggcagccaaatcctgaaagagcatccggttgagaacacacagttacaaaacgaaaaactgtatttatactatctgcaaaatggccgcgatatgtatgtggaccaggagctggatattaaccgcctgagtgattatgatgttgatcacattgttccgcagtcttttttaaaggatgatagcatcgacaataaggtgctgacccgtagcgacaagaatcgcggcaagagcgataacgttccgagcgaagaagttgtgaagaaaatgaaaaattactggcgccagttactgaacgccaagctgatcacccaacgcaagttcgacaatctgaccaaagcagagcgtggtggtttaagcgaactggacaaggccggcttcatcaagcgtcagttagtggaaacccgtcagatcacaaaacacgtggcccagattctggatagccgtatgaataccaaatacgacgagaatgataaactgattcgtgaagttaaagttatcaccctgaagagtaagctggtgagcgacttccgtaaagactttcagttctacaaagttcgcgaaattaataattatcatcatgcacatgatgcatacctgaacgccgttgttggcacagccctgatcaagaagtatcctaaactggaaagcgagtttgtttatggcgattacaaggtgtatgatgtgcgcaaaatgatcgccaagagtgagcaggaaatcggtaaagccaccgccaaatactttttctacagtaacattatgaattttttcaagaccgaaatcaccttagcaaacggcgagatccgcaaacgcccgctgatcgaaaccaatggtgaaaccggcgagattgtttgggataagggtcgcgactttgcaaccgttcgcaaggtgctgtctatgcctcaggtgaatattgttaagaaaaccgaagtgcaaaccggcggctttagtaaagaaagcatcctgccgaaacgcaatagcgacaaactgattgcccgtaaaaaagactgggaccctaagaagtacggcggttttgatagccctaccgtggcatacagcgttctggttgtggccaaagtggaaaagggcaagagtaagaagctgaagagtgttaaagagctgctgggcatcaccatcatggaacgtagcagcttcgagaaaaatccgatcgatttcctggaggcaaaaggttacaaagaagttaaaaaagatttaatcatcaaattacctaaatacagcctgttcgagctggagaatggtcgcaaacgtatgctggcaagcgccggcgaattacaaaaaggtaatgaactggcactgccgagcaagtacgttaacttcttatatttagcaagccattacgagaaattaaaaggtagtccggaggataacgagcagaagcagttatttgttgagcagcataaacattacctggatgagattattgagcagattagtgagttcagcaagcgcgtgattctggcagatgccaacctggataaggttctgagcgcctataacaaacaccgcgacaagccgattcgcgaacaagcagagaacattattcatctgttcacactgaccaacctgggcgccccggcagccttcaagtattttgataccaccatcgaccgcaaacgctatacaagcaccaaagaggttctggacgccaccctgattcaccaaagcattaccggcttatatgaaacccgcatcgacctgagtcagttaggcggtgactaaagtatattttagatgaagattatttcttaatctagacatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgcatcgatttattatgacaacttgacggctacatcattcactttttcttcacaaccggcacggaactcgctcgggctggccccggtgcattttttaaatacccgcgagaagtagagttgatcgtcaaaaccaacattgcgaccgacggtggcgataggcatccgggtggtgctcaaaagcagcttcgcctggctgatacgttggtcctcgcgccagcttaagacgctaatccctaactgctggcggaaaagatgtgacagacgcgacggcgacaagcaaacatgctgtgcgacgctggcgatatcaaaattgctgtctgccaggtgatcgctgatgtactgacaagcctcgcgtacccgattatccatcggtggatggagcgactcgttaatcgcttccatgtgccgcagtaacaattgctcaagcagatttatcgccagcagctccgaatagcgcccttccccttgcccggcgttaatgatttgcccaaacaggtcgctgaaatgcggctggtgcgcttcatccgggcgaaagaaccccgtattggcaaatattgacggccagttaagccattcatgccagtaggcgcgcggacgaaagtaaacccactggtgataccattcgcgagcctccggatgacgaccgtagtgatgaatctctcctggcgggaacagcaaaatatcacccggtcggcaaacaaattctcgtccctgatttttcaccaccccctgaccgcgaatggtgagattgagaatataacctttcattcccagcggtcggtcgataaaaaaatcgagataaccgttggcctcaatcggcgttaaacccgccaccagatgggcattaaacgagtatcccggcagcaggggatcattttgcgcttcagccatacttttcatactcccgccattcagagaagaaaccaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctcttctcgctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggaccaaagccatgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattgattatttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcggatcctacctgacgctttttatcgcaactctctactgtttctccatacccgtttttttgggaattcgagctctaaggaggttataaaaaagagaccattccattccggtctcaaagcttgggcccgaacaaaaactcatctcagaagaggatctgaatagcgccgtcgaccatcatcatcatcatcattgagtttaaacggtgtccagcttggctgttttggcggatgagagaagattttcagcctgatacagattaaatcagaacgcagaagcggtctgataaaacagaatttgcctggcggcagtagcgcggtggtcccacctgaccccatgccgaactcagaagtgaaacgccgtagcgccgatggtagtgtggggtgtccccatgcgagagtagggaactgccaggcatcaaataaaacgaaaggctcagtcgaaagactgggcctttcgttttatctgttgtttgtcggtgaactggatccttactcgagaagaaaccaattgtccatattgcatcagacattgccgtcactgcgtcttttactggctcttctcgctaaccaaaccggtaaccccgcttattaaaagcattctgtaacaaagcgggaccaaagccatgacaaaaacgcgtaacaaaagtgtctataatcacggcagaaaagtccacattgattatttgcacggcgtcacactttgctatgccatagcatttttatccataagattagcggatcctacctgacgctttttatcgcaactctctactgtttctccatacccgtttttttgggaattcgagctctaaggaggttataaaaaaagtcttcattccattccgaagacaacacaaagcatcttctgttgagttaagaacgagtatcgagatggcacatagccttgctcaaattggaatcaggtttgtgccaataccagtag。
(2)基因合成pDual-sgRNA-lacZ质粒载体。
将所述pDual-sgRNA-lacZ质粒载体的功能原件通过基因合成顺次连接,得到所述pDual-sgRNA-lacZ质粒载体。
所述质粒具有SEQ ID NO.2所示的核苷酸序列,由苏州金唯智生物科技有限公司合成。
所述质粒自5’端259~278bp为靶向lacZ基因的sgRNA序列,279~313bp为J23119启动子,584~1172bp为复制子,1343~2203bp为氨苄青霉素抗性基因。
SEQ ID NO.2:
tcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaaaagcttctgcaggtcgactctagagaattcaaaaaaagcaccgactcggtgccactttttcaagttgataacggactagccttattttaacttgctatttctagctctaaaactcgttttacaacgtcgtgacactagtattatacctaggactgagctagctgtcaaggatccagcatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccctttcgtc。
实施例2以pDual-Cas9-Parental为骨架载体构建Ku+ligD质粒文库
本实施例以pDual-Cas9-Parental为骨架载体构建Ku+ligD质粒文库,包括如下步骤:
(1)从NCBI获得微生物来源的Ku蛋白和ligD蛋白的CDS编码序列各11种,GenBank登录号分别为WP_010886496(Bsu-Ku)、ADN57538(Buh-Ku)、GAS86454(Mbr-Ku)、ADU06008(Mms-Ku)、GAT12817(Mno-Ku)、YP_889815(Msm-Ku)、NP_215452(Mtb-Ku)、ACV76561(Nmu-Ku)、ADH67668(Nda-Ku)、ADG15500(Pbh-Ku)、CCQ47782(Psi-Ku)、NP_389223(Bsu-ligD)、ATD76462(Bve-ligD)、CCE75978(Cne-ligD)、SJM32621(Mde-ligD)、ALI25184(Mfo-ligD)、WP_011730625(Msm-ligD)、NP_215453(Mtb-ligD)、BAR68071(Pae-ligD)、AKJ29816(Pbr-ligD)、SUD78454(Ppu-ligD)和SMS10934(Pvi-ligD)。
(2)针对大肠杆菌宿主对Ku蛋白和ligD蛋白的CDS编码序列进行密码子优化,优化后的Ku蛋白的CDS编码序列不含BbsⅠ和BsaⅠ识别序列,序列5’端添加SEQ ID NO.34所示的核苷酸序列,3’端添加SEQ ID NO.35所示的核苷酸序列;优化的ligD蛋白的CDS编码序列不含BbsⅠ识别序列,序列5’端添加SEQ ID NO.36所示的核苷酸序列,3’端添加SEQ ID NO.37所示的核苷酸序列。
SEQ ID NO.34:CCCAGTCACGACGGTCTCAAAAA(BsaⅠ识别位点);
SEQ ID NO.35:AAGCCGAGACCTCCTGTGTGAAA(BsaⅠ识别位点);
SEQ ID NO.36:CCCAGTCACGACGAAGACGCAAAA(BbsⅠ识别位点);
SEQ ID NO.37:CACAAGGTCTTCTCCTGTGTGAAA(BbsⅠ识别位点)。
优化后的Ku蛋白的CDS编码序列具有SEQ ID NO.3~13所示的核苷酸序列,由苏州金唯智生物科技有限公司合成。
SEQ ID NO.3(Bsu-Ku):
CCCAGTCACGACGGTCTCAAAAAatgaatcgcacaccgtctttacacaccaaagagaaaaaaggcttcatcgacatgcacaccatgtggaaaggcagcatcagctttggtttagtgaacatcccgattaagctgtacgcagccaccgaagataaagatattaaattacgctctttacataaagaagatcatgccccgattaaatatgaaaaagtgtgtaccaactgcgagaaaactttaagccccgatgagatcgtgaaaggctatgagtatgtgaaaggcaagtatgtggtgctgaccgatgaggatctgaagagtctgaagcaagaacatgaggaaaaggccgttgagatcgtggacttcgttcagctgcaagaaatcgacccgatctacttcaaccgcagctactttgtgggccccggtgataacggcaccaaagcctataccttactgcgcgaagctttacgcagcaccggtaaaatcggcattgccaacatgaccattcgcagcaagcaacagctggccattctgcgtgtgtacgagaactgcatcgtgatggagagcatccattatccggacgaagtgcgtagcgcagcacaagttccgggtgttccggaccagagcaacgtgaacgacaaagagctgcagaccgcaattactttaattgatgagctgaccgccaagttcgagccggaaaaatacgaggacacctaccgtcaagctttactgcagcgcgtgaacgataagctggaaaacaaggaaaccgcagtgaccccggataaagcaccgccgcgcgaagatgttatcgatctggtgagtgctttacaagctagcattgatcgtacccgtcgcccgaatcgtgaaacacccgctgcagcaccggcacaagctgcagaaccgaagggtgccggtgacaaaaaacagaaaaccacccgcaaaaaagcaagcggcaccagctaaAAGCCGAGACCTCCTGTGTGAAA;
SEQ ID NO.4(Buh-Ku):
CCCAGTCACGACGGTCTCAAAAAatggcccatatgatctggaaaggcgccattagttttggtttagttcacgtgccggttcagctgtatccggccacccgtagcgagaaagtgggcttcaatttactggacaaacgcaccatcgatccggtgggttataaacagatcaataaacgtaccggtaaagacgtgacccgcgataacattgtgcgcggttttgaatatgaaaaagataaatatgtggtgctgaccgatgaagaaatccgcgccgccaatccggaaagtacccagaccgtggatattctggccttcgttgatgcaccggacatcagctttctgtatttagataccccgtactttctgacaccggaccgcaaaggcgaaaaagtgtacgcactgctgcgtgaggccatgaaaagtagcggcaaagttggtgtggccagcgttgttctgcacaacaaacagcatctggccgctttaattcccgttggtccggttttagctttaaatacactgcgctgggcagaagaagtgcgtgactttgatgagtttaaactgccggccgagggtgcaaaagccgctggtgttagcgcccgcgaactggacatggcccagaaactgatcgatgacatgagcgacacttgggatccgagtaagtatcacgacacctttcgcgacgacatcatggctttagttgatcgtaaggttcgcgagggcaaaaccgaagagatcaccgatattgaagccccgcgtgaggcacgtcaaagcgcagatattctggatttaagcgatctgctgaagcgttctttaggtcgcggcaaaaataaaccggccagcggcagtcgcaaacgtgccgcagatgatgaagccgacgacggcaatgccgatgcagaagatgatggcggtagcaccccggcacgcaagaaacctcgcacagcccgcagtaccggtagcgcacgtacaagccgtagcagcagcggcagtagtagcggtggtcgcgcagcaaccaaaagcacaaccgccgcacgcaaacgtcgtgcagcagcctaaAAGCCGAGACCTCCTGTGTGAAA;
SEQ ID NO.5(Mbr-Ku):
CCCAGTCACGACGGTCTCAAAAAatgcgcagcatctggaaaggcagtatcgcattcggtttagttaacgtgccggtgaaagtttacagcgccaccgaggatcacgacatcaagttccaccaagttcatgccaaagacaatggccgcatccgctataaacgcgtgtgcgaagtgtgcggcgaagtggtggaatttcgcgatattaataaagcctatgaaagcgacgacggtcagatggtggtgattaccgacgaggatattgctactttaccggaagaacgtagtcgcgagattgaggtggtggagtttatcccggccgaacaactggatccgctgatgtacgataagagctactttctggagccggatagcaaaagcagcaagagctacgtgctgctggcaaaaactttagccgaaactgaacgcgttgccattgtgcacttcagcttacgcaataaaacccgtttagcagcactgcgcgttaaggatttcagcaagcgcaacgtgatggtgatccatactttactgtggccggatgaaattcgtgacccggattttccggtgctggacaaggaagtggagatcaaaccggccgaactgaagatggccggccaagttgtggaaagcatgaccgacgatttccacccggaccagtttcgcgatgattatcaagctcagctgtatgagctggttcaagccaaactggaaggcggcgaagcattcagtgtggaagaacagccggccgatctggatgaaaccgaggatgtttctgatctgctggccaagctggaagccagcgtgaaagcccgtaaaggcggtggtagcgcaaaaagcgataaggacagcgacgaggatagcgataaggatagcgatgacgaggaagcaaagccggccaaaaaggcaccggctaaaaaagcagcagccaagaaagccccggctaaaaaagccgccgccaaaaaataaAAGCCGAGACCTCCTGTGTGAAA;
SEQ ID NO.6(Mms-Ku):
CCCAGTCACGACGGTCTCAAAAAatgcgcgcaatttggaaaggcgccgttagctttggtttagttagcattggcgtgaaagtgtacagcgccaccgaggaaaaggacatccgtttccaccaagttcatcgtgaagatggcggccgcatccgctataagcgcacatgtagcgtgtgcggcgaagaggttacctacgacgacatcgccaaaggctatgacattggcggtggtgagatggtgattttaaccgacgaggattttgcagatctgccgctgagcaccagtcatgccatcgatgtgctggaattcgtgccggccgagcaagtggacccgattttatacaataaggcctactttttagagccggagggcagcgcaaccaaaccgtacgttctgctgcgtgacgctttaagcgatagcgaacgcgtggccattgtgaaggttgcactgcgtcagcgcgaacagttagccactttacgcgttcgtgagggtgtgctgctgctgaacacaatgctgtggccggatgaaattcgccgcccggatttcggctttctggatgaggatctgaaggtgcgtccgccggaactggcaatggcaagctctttaatcgatagcatggctggtgaatttgaaccggatgccttcaccgatgactatcgcgccgctttacaagaagttattgacgcaaaagtggaaggccgtgaagttgtgcagccggaagaagaagaggccgcacccgctgccgcagttgatctgatggccgcactgaaagccagcgttgaacgtgcacgtgcagcccgcggtgaagcacctagtggtggcggtgccgaaccgacaccgattagcagcgcacgcagcgctaaaaaagctgccaaaaaagcccccgctaaaaaggccgaaccggccaaaaagaccaccgccaaaaaggcaccggcaaagaaaaccgcagccaagaaagccgagccggctaagaaaactgccgccaaaaagactcccgctaagaaaaagaccgcctaaAAGCCGAGACCTCCTGTGTGAAA;
SEQ ID NO.7(Mno-Ku):
CCCAGTCACGACGGTCTCAAAAAatgcgcagtatttggaagggtagcattgccttcggtttagtgaatgttccggtgaaggtgtatagcgcccagcaagatcacgacgtgaagttccaccaagttcacgccaaagataatggccgcatccgctataagcgtgtgtgcgaaatcgacggtgaagaagttgagtatcgcgatattgcccgcgcctatgaaagcgacgatggtcagaccgtgatcatcacagatgaggacatcgccacactgccggaagagcgtagtcgcgagatcgaggtgctggaatttgttccggccgccgacattgacccgatgatgtacgatcgcagctactttttagagccggaaggtaaaagcagcaagagctacgtgctgctgaccaaaactttaaaggaaaccgatcgcgttgccatcgttcactttgctttacgcaataagacacgtctggcagcactgcgcgtgcaagatttcagcaagcgcgatgtgatggtgatccagactttactgtggccggatgaaatccgtgatccggatttcccggttctggacaaagaagtggatattaaaccggcagaactgaaaatggccacacaagttgtggacagcatgaccgacgactttaacccggatcgctatcacgacgactatcaagaacagctgcgcgaactgattcaagctaaactggaaggcggtgaagcctttacaacagaggaacagccgcaagaactggacgaaaccgaggatgtttctgatctgctggcaaaactggaagccagcgttaaagcacgccgcgaaggtcgtggtggtagcaaaagcagcgacgacgacgataaacccgccaaaaaagctcccgctaagaaatctgccgctaagaaaactgccgccaagaaaactccggctaaaaaagctgccaagaagagtaccgccaaaaagagtccggccaagaagagcgcagccaaaaaataaAAGCCGAGACCTCCTGTGTGAAA;
SEQ ID NO.8(Msm-Ku):
CCCAGTCACGACGGTCTCAAAAAatgaatcgtgcagtgcgccataccggtctgatgcgcagcatctggaaaggtagcatcgcatttggtttagtgaatgtgccggtgaaagtgtacagcgccaccgaagatcacgatatcaaatttcatcaagttcatgccaaggataacggccgcatccgttacaaacgtgtgtgcgaggtgtgcggcgaagtggtggaatatcgtgatatcaataaagcctttgaaagtgatgacggccagatggtggtgattaccgatgaggacatcgcaactttacccgaagaacgcagccgtgagattgaagtggtggagttcatcccggcagagcaactggatccgctgatgtacgacaagagctacttcttagagccggacagcaagagcagcaagagttatgtgctgctggccaaaaccttagccgaaaccgaccgcatcgcaatcgtgcacttttctttacgcaataaaagccgtttagcagctttacgcgtgaaagacttcagcaagcgcgacgtgatgatgattcacactttactgtggccggatgagatccgcgacccggattttccgattttagataaagaagttcagatcaaaccggccgagctgaaaatggctggtcaagttgtggagagcatgaccgacgacttcaagcccgatctgtaccacgatgactaccaagaacagttacgtgaactggtgcaagctaaactggaaggtggcgaagcattcagcgtggaagaacagccggccgaactggatgaaggtaccgaggacgtgagcgatctgttagccaagctggaagcaagcgtgaaagcccgtaagggcggcaaaagcgatagcaaggacgatagcgacagcgagagcgacagcaaagagagcaaaagcgacagtaagccggccaaaaaagcccccgctaagaaagccgcagccaagaaaagcaccgctaaaaaagccccggctaaaaaagcagccgccaagaaatcttaaAAGCCGAGACCTCCTGTGTGAAA;
SEQ ID NO.9(Mtb-Ku):
CCCAGTCACGACGGTCTCAAAAAatgcgtgccatttggaccggcagcattgcatttggtttagtgaatgtgccggtgaaagtttacagcgccaccgcagatcacgatattcgtttccaccaagttcatgccaaggataatggccgcatccgctataaacgcgtttgcgaggcatgtggcgaagtggtggattatcgcgatctggcacgtgcctatgagagcggtgatggccagatggtggccattaccgatgacgacattgcctctttaccggaagagcgtagccgcgaaattgaggtgctggagttcgttccggccgccgatgtggacccgatgatgttcgaccgcagctattttttagaaccggacagcaagagcagcaaaagctacgtgttactggccaaaactttagccgaaaccgatcgtatggccatcgtgcattttactttacgcaataaaacccgtttagccgctttacgcgtgaaagacttcggcaaacgtgaagtgatgatggtgcacaccttactgtggccggatgagattcgcgatccggattttccggtgctggaccagaaggtggaaatcaaaccggccgagctgaaaatggctggtcaagttgtggatagcatggcagacgactttaacccggatcgctatcacgacacctatcaagaacagctgcaagaactgattgatacaaagctggagggtggccaagcttttaccgccgaagatcagccgcgtttactggatgaaccggaggatgtgagtgatctgctggctaaactggaagcaagcgtgaaggcccgcagcaaagcaaacagcaatgtgcctaccccgccgtaaAAGCCGAGACCTCCTGTGTGAAA;
SEQ ID NO.10(Nmu-Ku):
CCCAGTCACGACGGTCTCAAAAAatgcgcagcatctggaaaggcagcgtggcctttggtttagttaatgtgccggtgaaactgtacagcgcaaccgaagagaaggacatccgctttcatcaagttcatgcccaagatggtggccgcatcaaatataaacgcgtgtgcgatctggacggcgaggaagtgccgtatgccgatattgccaaagcctacgaaagcgacgatggtcgcacaatcatgctgaccgatgaggattttgctcagctgccggccagcagcagccgcgaaatcgatgttgtgagctttgtgcctagtgaccaagttgatcccgttctgtatgataaaacctactatctggagcccgctagcaccagcaccaaagcctatgtgttactgcgccagactttagaacagaccgaccgtattgccatcgtgaacttcgcactgcgccagaaaacccgtttagcagctttacgtgttcgtgatgatgtgctggtgatccagacactgctgtggccggatgaagtgcgcgccgcagaatttgcctctttagaggaaagcgtgagcattaaaccggccgaactgaagatggccagcatgctggtggatagtttcgccgatgacttccacccggaggactataccgatgagtatcgcgaagagctgcagcaactgatcgaagccaaactggaaggcggcgaagcctttgaaactccggaaaaaccggatgaaggtgaggatgctgaagtggttgatctgctggcagctctgcagcgcagcgttgagcgccataaaaaagctggtgcaagcaccggcgatgatagtggcgatggcgccgatgatagtccgaaaaagagcccgcgcaccagcagcgcaaaaacccgcaccaaagccaccgatgaaaccggtgaccaagataaagacgaggcaaaaccgccgacacgccgtcgtagtccggcacgtaaaaccggttaaAAGCCGAGACCTCCTGTGTGAAA;
SEQ ID NO.11(Nda-Ku):
CCCAGTCACGACGGTCTCAAAAAatggttaatccggtgtgggtgggcacactgatgtttggtcgcgtgccggtgggtgtgcgtttatatagcgcacgtgagcgtcgtggcccggttctgcaccagtttgaacgcggtaccgccgatcgcattcgttatgtgcgcgtgaacgaacgtaccggcgaagaagtggctggtgaagatgtggtgcgtggtgcacgtaccggcgtggaggatgagtacgttgtgctggagccggaagaactggaagaaattttaccgcatggtagccgcacaatggaactgaccggctttttaagtcaaggtgccgttgacgcactgtggtacgccagtacatactatgtggcaccgcgtgccgccgcagatgccaaagcctatcagctgctgtataccgctttagaacagacccgccgtaccggtgtggccaccatcgttctgcgcgatcgcgaataccccgttctgatcgaaccgaatcgcggtgtgctgagcgccagtacactgtggtggccggatgaggttcgcgaaccggatgatgtgatgccgcccgttgcccatgccgcactggccaagagcgaactggaactggcccgcgaactggtgcgtagtctgagcattgagtgggatccggaagattacagcgacagctacggccagcgtctgacagaactggtgcgcgcaaaagcacgtggccgcaccttcacccatcgtccggagcaagctgtgccgcccgaagatgccgatggtctgggtgaagcactgcgccagtctttacccgctcaacgcacacgcggtgcacgtagtcgtggccctcgtgcaagtaccggtgcagaaggtgccggtcgcgcacgtgaacctcgtggtaccggtgcacgtggcgcacgtgtggaacgtcgcggtgaaggtcgcgccaccaaacgcgaactgctgcaacgcgcaagcgagctggatgttcccggtcgtagcaaaatgagccgtgagcagctggaagaagccgttggtttaaatggcgccgaagcccgtcgttaaAAGCCGAGACCTCCTGTGTGAAA;
SEQ ID NO.12(Pbh-Ku):
CCCAGTCACGACGGTCTCAAAAAatggcacatatgatctggaaaggcgccatcagctttggtctggtgcatgtgccggtgcagctgtaccccgctaccaaaagcgagaaggtgggctttaatctgctggacaaacgcaccatcgacccgatcggctataagcagatcaacaaacgcaccggcaaagacgtgacccgtgagaatatcgtgcgcggctttgaatatgaaaaagatcattatgtggttctgagcgacgatgagatccgcagcgccaatccggagagcacccagaccgtggacattctggcctttgtggatgccaccgatatcagctttttatatttagacacaccgtattttttaacaccggatcgcaagggtgaaaaagtgtacgctttactgcgcgaagccatgacagccagcggtaaaatcggtgtggccagcgtggtgctgcataataaacagcatttagccgcactgattcctctgggcccgatgctggctttaaatactttacgttgggccgatgaggttcgcggtctggacgagtttaaagtgccgccggaaggcatgaaagcagccggtgtgagcgccaaagagctggatatggctaaaaaactgatttatgatatgtctgaaacttgggatccgatgcagtatcatgataccttccgcgacgacatcatggcactggtggaacgcaagattcaagctggtaaaaccgaggaagtgaccgaagtggaagccccgcacgaaagccgtaaaagcgccgacattttagatctgagcgatctgctgaaacgttctttaggccgtggcaaaggtaaacaagctgcaactggtcgcaaacgcgctgccgatgaggatgaggatcagaccgatagcgaagccgacgaggaacccgctgcaccggcccgtaaacgtgcacgtgcaaccagcaccgcccgtagccgtagcggtagtggtggtagcgcccgcgttaccagcaaaacaaccgccacaagccgcaaacgccgtgcagcagcctaaAAGCCGAGACCTCCTGTGTGAAA;
SEQ ID NO.13(Psi-Ku):
CCCAGTCACGACGGTCTCAAAAAatgcgcgccatttggaaaggtgccatcgcctttggtttagtgaacgtgccggtgaaagtgtacagtgcaaccgaggaccacgatatctctttacaccaagttcacaacgccgacggtggtcgtatccgctatcagcgccgctgcgaggtgtgcagccaagtgattgattacagcgacatcgagaaggcatacgaagaggatggtaaaaccgtggtgttaagcaaggatgagctgcaagctattccggccgaaaacagccacgaaatcgaggtggtgcaatttgtgcctagcgaacagctggaaccgatgatgttcgagaagagctattatctggaaccggacagcaagagcccgaaagcctacgttctgctgcgtcgcgctttagaggataccgatcgcgtggccattgtgcagttcgctttacgtgagaaaacccgtctgggcgctttacgcatcaaagacgacgtgctggtgctgcagtctttactgtggccggatgaagttcgtgaggccaatttcccgtctttagatgtgagcatcaagatcagcccgcaagaacgtgatatgagcgccgcactggttgaaagcatggccgccgacttcgacccggaacacttcaccgatgattatcaagttcagctgcgccagctgatcgaagccaaactggaacaaggtgatgcactggacaccgatgaaacttttggcgttgaagccggtgagggtggcaaaggtgaggttatcgatttaatggaagctttaaaacgctctttagatcgcaaacgcggtggtggtagcggtacagctggtagtggcagcggtgaagaagcagcagacagcgacgatgaagaagaaggcaaaccggcccctaaacgtgcaaccgctggtaaaaccgccgcagccaaaagcgatggtaccaagagtaccgccgcacgtagcaccgccgcaaaaactggtaccggcaagaccgccaccaagtctaccagcaaagccgcagataccaaaaccggcgcagccaaaaccaccgccgccaaaagcaccgccaagtctaccgccggcaaaaccgcagataaaccggcagccaagaccacagctggtaaagcaaccggcacccgcgcacgtaaaccggcctaaAAGCCGAGACCTCCTGTGTGAAA。
优化后的ligD蛋白的CDS编码序列具有SEQ ID NO.14~24所示的核苷酸序列,由苏州金唯智生物科技有限公司合成。
SEQ ID NO.14(Bsu-ligD):
CCCAGTCACGACGAAGACGCAAAAatggcattcaccatgcagccggtgttaacaagcagcccgcctatcggtgcagagtggcgctatgaggtgaagtacgacggttaccgctgcattctgcgtattcatagcagcggcgtgactttaaccagtcgtaacggtgttgagctgagcagtacattcccggagatcacccagttcgccaaaaccgcatttcagcatctggaaaaggaactgccgctgactttagatggtgaaattgtgtgtctggtgaacccgtgtcgcgcagatttcgagcatctgcaagttcgtggtcgtttaaagcgcccggataaaatccaagaaagtgccaacgcccgcccgtgttgttttctggccttcgatttactggaacgtagcggcgaagatgtgactttactgagctatttagaccgcaagaaatctctgcgtgagctgatcagcgccgcaaaactgccggccagccccgatccgtacgccaaggaaaccatccaaagcatcccgtgctacgaccatttcgatcagctgtgggagatggtgatcaagtacgacggcgaaggcatcgtggcaaagaaaaccaacagcaagtggctggaaaagaaacgcagcagcgattggctgaaatacaaaaactttaaacaagcttacgtttgtattaccggctttaatcctaataatggctttttaaccgtgagcgttctgaaaaacggcatcatgacaccgattgcaagcgtgagtcacggcatgcgcgatgaggagaaaagtgcaattcgcgagattatggaacagcacggtcaccagacaccgagcggcgagttcactttagaaccgagtatttgtgccgcagtgcagtatttaaccattctgcaaggtaccttacgtgaagtgagcttcatcggctttgagttccagatggactggacagagtgcacctatgcccaagttatccgccatagcaaaccggtgcaccctaagctgcagtttaccagtctggataagattatctttgagaaaaataagaaaaccaaagaagatttcattcaatatatgatcgaggtgagtgattatctgctgccgtttctgaagaatcgcgccgtgaccgtgatccgttatccgcacggcagtcgcagcgaaagcttttttcagaagaacaaaccggactacgcccccgattttgtgcagagcttttacgatggcagccacgagcacatcgtttgcgaagatatgagcacactgctgtggctgtgcaatcagctggcactggagttccatgtgccgtttcagacaatcaagagccgccgtccggcagagattgttatcgatttagacccgcctagccgcgacgattttttaatggccgtgcaagctgccaatgagctgaaacgtctgctggatagcttcggtatcaccagttacccgaagctgagcggtaacaagggcatccagctgtatatccctctgagcccggaggcatttacctacgaagaaacccgccagttcacacagctgattgccgagtactgcaccaacgcatttcccgaactgttcacaaccgagcgtttaatcaaaaaccgtcattgcaaactgtatctggattatttacagcacgccgaaggcaaaaccattatctgcccgtacagcacccgtggtaatgagttaggtaccgtggccgcaccgctgtattggcatgaagttcagagtagtctgaccccggctttattcacaattgacaccgttattgatcgtattaaaaaacaaggttgcccgttttttgatttctatcgcaacccgcaagatgaaccgctgagcgccattctgcaccagttaaagaagaaatcttaaCACAAGGTCTTCTCCTGTGTGAAA;
SEQ ID NO.15(Bve-ligD):
CCCAGTCACGACGAAGACGCAAAAatggttctgacaatgcagccgattttaaccagcgagccccccgaaggtagtgaatggcgttacgaggtgaagtacgacggtttccgctgtttactgcgtatcgacgaaagtggtgttactttaacaagccgcaatggtcagactttaaccaaccagttcccggaaattaccgcattcgccgcccgctgcttccagcatatgaaggatcgttttccgatcactttagacggtgagctggtgtatctgatcaatccgtatcgcgccgactttgaacatttacagattcgcggccgcttaaaacgtacagaaagcatcgaaagcacagccgatcgccgtccgtgtcgttttctggcctttgatttactggtgttagagggcgccggtaccgtttctttaccgtatgtgaaacgcaagcgcgcactgagcaaactgttcaaagaggccaatctgccggcttgtccgcaccatctggcagaagaggccatccagtacattccggaacataccgatttcgacgctttatgggataaagtggtgcgccatgatggtgaaggcgttgtggccaaacgcgccagtagtggttgggcagagaacaagcgtagcccggactggcaaaaatacaaacatatgaaaactgctcatgttctgctgaccggctttaaccctaagaacggctacgtgaccgcaagcgtgctgaaagatggcaccgccattcctattgccagcgtgagccatggtatgcaagctgaggaaaagaatgcagtgcgcaccattatggaaactcacggcaaaaagcagaagagtggtgaatatactttagagccgagcatttgcatgaccgtgcaatatttaaccattttacaagatactttacgcgaggtgagctttgtgagcttccaatttgaaatggattggacagagtgcacctaccagcaactgattctgcgcagcaagactttaccgccgaaactgcagtttacctctttagacaaaattgtttttaaaaaacgcgaaaaaaccaaagcagatttcttaagctacatggtgaaaatgagcgattttttaatgccttttctgaaagaccgcgccgtgaccgttatccgctatccgcatggtgcacccggtgaaagtttcttccagaaaaataagccggactacaccccggactttgttagtagcgtgtttgacggcagccacgaacacatcgtttgtagtagcattccgtctttactgtggctggcaaaccagctggctttagagtttcacgttccgtttcagaccgtgcatagcgaacgcccggccgaaatcgttattgatttagatccgcctagccgcaacgatttcccgatggccgtggaagcagcacacgttctgaagcagctgtttgacagcttcagcatcaccagtttcccgaaactgagcggcaacaagggcattcagctgtacattcctctgagcccggaggcctttacctacgaagaaacccgcgcctttaccatgctgatcgcagactactgtgttcgcacacgccccgatttatttacaaccgagcgcttcatcaaaaaccgcaatggccgtctgtatctggactatctgcagcacgccgagggtaagacaattattgccccgtatagtacccgcggtaacgaactgggcacagttgccgcaccgctgtactggagcgaggtgaacagctctttaacccccgatgactatactatcgacacagtggtgaaccgcgtgcgcaccgaaggcgatccgttctacgacttctatcgcaatccgcaagatggcccgctgagcatcgtgttagagcagattaagcgtaaaagctaaCACAAGGTCTTCTCCTGTGTGAAA;
SEQ ID NO.16(Cne-ligD):
CCCAGTCACGACGAAGACGCAAAAatggccggcgcaaaacagcaagtggaggtggaaggtcgccgcattactttaaccaatttagataaggtgttatatccggccaccggtaccacaaaaggtgacgttattgcctattacgcagccatcgccccgcacatgattcctcatttacgtgatcgtccggtgacccgtaaacgctgggtggatggtgttggcaccgatgaacacccggccaaaatgttttttcagaaggatctggatgcccacacacccgaatgggttctgcgccgtgcaatccagcatcgtgaccatgcaaacgactatccgctggccaatgacgtggccacactgacttggctgggccagatcgcagccttagaactgcatgtgcctcagtggcgctttggtcgtaccggtgatgttcgtcgccccgatcgcttagtgctggatctggatccgggtccgggtgctggtctgcccgaatgtgtggaagttgccaaagccgcccgtgcaattctgcgtgatatgggtttagaaccgtaccccgttacaagcggcagcaaaggcattcatctgtatgccgcactggatggcagtcatgatgcagacgcaatcagcgaagttgcccatgaactggcccgtgctttagaagcagatcatccggatttagtggttagcgatatgcgcaaagctttacgtgaaggtaaggttctggtggactggagtcagaacaatccggccaaaacaaccgtggccccgtattctttacgcggtcgtagccgtccgacagttgcagttccgcgtacttggcgtgagctggcaagtccgacactgcgtcatctggaactggatgaagtggttgcccgtatgcgcacacgtgaggatcctttagccccggttgaagaaggccaccgtgaatctttagaaccgacacgcgaacgtttagccggtttcgcacataaggacgccgatgcagctggtgatcgtctggccacctatcgcagtaagcgcgacgccgcaaaaacaagcgagccggtgccggccgatgcaccggcaccgagcgatggcagcagctttgtgatccaagaacaccatgcacgcgctttacattgggatttccgtttagagcatgatggcgttctggtgagctgggctttacctaagggtgtgccgacagagcatggcaccaatcatttagcagtgcagacagaagatcatccgctggagtacggcagcttcgaaggcaccattccggccggcgaatatggtggcggcgaagttaccatctgggacgctggtacctttgagttagagaaatggcgcgatggccatgaagtgattgccacactgcatggccgcggccatggtaccggcattgatggtccgcgtcgctacgcactgatccataccggtggtcacggcaaggcagacgcaaattggctgatccatttaatggaaccggcagatgccccggccgcacatcacccgaaacccgctcgccccgctgcactggccaaagctggtggccgcacacgtgttggcgcccgtcgtaaaggtcgtgccgcctttgccgcagccccgatgttagccacagccgcaaccggcgctggtttagatagcgatgaggaatgggcagtggagatgaagtgggatggttatcgtgccattgcagcagtggccgacggtcgtgccaccattacaagccgtaatggtgtggatttaaccgccgcatttccggaactggccgatctgccggatcagctggcagccgacgccgttctggatggtgagattgttgttctgggcgatggtggccgcccggattttggtttactgcagacccgtttaggtctgactggtgaaaaggatattgcccgtgcccgcaaagcagcaccggtgcatttaatgctgttcgatgctttagccattggtgatcgcgtgctggttggcgaaccgtatcgcgaacgccgcgcagcactgttagatgcagttacaagccccggtcgcggccgcattcaagttccgccggcatttgatggtgatctggatggtgctttagcaacaagtcgcgagctgggtctggaaggcgttgttgccaaacgcgttgacgcaccgtacgaaagcggtcgccgcagcagcgcttggatcaaaatcaaacaccaccgtgcccaagaagtggtggtgggtggttggcgtccgggtagcggtagtcgtagcagcggtattggctctttactggttggtgttccgggtccggatggtttaatgtatgccggccgcgttggtaccggctttacagaacgcgatctggccgacgcactgcgtcgtttccgccctctggcccgtaaaaccagcccgttcgccgatgttcccgctgccgaagcacgtgatgcacactggatcacacctcgtttagtgggcgaagttgaattcgcagagtggaccagcaccggtcgtttacgtcaagctagttggcgcggctggcgtcatgataagagtccggacgaggtggttcgtgaggattaaCACAAGGTCTTCTCCTGTGTGAAA;
SEQ ID NO.17(Mde-ligD):
CCCAGTCACGACGAAGACGCAAAAatggcactggagacataccgtaagaagcgcgattttagcgttacaccggaacctcaaggtcgtcgtgcccctaaagctggtaacagctttgtgatccaaaaacatgatgcccgccgtttacactatgatttccgtctggagatggacggcgttctgaaaagttgggccgtgacaaaaggcccgagcttaatccccggtgaaaaacgtttagccgtgcacgttgaggatcatccgctggagtacggtggtttcgaaggcacaattccgaaaggcgaatacggtggtggtaccgttattttatgggaccgcggtacatggacccctatcggcgatgcacgccgcggctatgcaaaaggccatctggatttcgaattacatggcgagaaactgggcggtagctggcatttagttcgcatggctggtaaaccgcgcgagaaacgtgagaactggctgctgattaagggtgatgacgatgccgcccgcacagaggatgacccggacattttagacgaacgcccggaaagtattgccaccggccgtaagatcgaagatgttgctggtgaggaaccgggttggagcagtaaaaccggtcgtatccgcaagcgtcgtggtggtcgcactggtgccgcaccccccgaagagcagccggcaaccgtgagtgttccggaaccgagcaaaattaagggcgcaaagaaagccgctttaccggatttcgtggaaccgacactggccactttagttagtagcgccccgagtggtcaacgctggctgcacgagatcaaattcgatggctatcgtttacaagctcgcgtggaggctggtcgtgttaaactgctgacccgtagcggtttagattggacaaaaaagttcggtaaagccatcgttagtgctttagcagatttaccggttggtaccgcactgatcgacggtgagttagtggttgagacaagcgctggtgccagcgacttcagtgaattacaagctgatctgagtgagggccgtagcgatcgcttccgtttatacgttttcgatttactgcatttagatggttatgatctgcgcgatgtggcaagcatccagcgcaaggaactgctggagaagattatcggcagcggcagcggcatcattagctacagtggtcactttgaagaagatggtccgctggttctgcgtcatgcttgtcgtctgtctttagaaggtgtggtgagtaaactgcgcgatgcaccttaccgtgctggtcgtagcaagaactgggtgaaaagcaagtgcagcgcccgccaagaatttgtggtggccggctatgtgcctagcaccaccagccgtaatgcaattggcagtctggtgctgggcgtgtatgacgatggcaaactgcaccacgttggccgtgtgggtaccggctacacagcagccgttgccgaaggtttattcaagaagctggaacgcatccgtattccgagtagcccgttcgatgaacgtttaagcgccgaagaaactcgccaagttcgttatgtgcgtccggagctggttgccgagattgaattccgtgcttggacagcagatggcaatttacgccacgcaagcttccgtggcttacgcgaggacaagccggcaaaggagattgtgcgtgaaactccgaaaacaaaagcagccgcaaaaccgcagcgtcgtaccgtgaagctgacccacccggatcgtttatattggccggaccaaggtgttaccaaagagggtttagccgactactataccgaagtgtggcgctacgccagcccttatctggtgggtcgcgcactggcactgttacgttgtcctagtggcattagcggcgagcaattcttccagaaacatgcatggaaaggtttaaacccgaacatcgtgctggtgcatgatccgaaggatcctccggacgaacgtctgattagcatcaatgatttagacggcttaattggcttagtgcagagcgcagccttagaaatccatccgtggggcagtatggttagcgactgggagcgtccggataccattatcatggatctggatccgggcgaggatgtttcttgggaggcagtgattgcagcagccgtggaaacccgcgatcgtttaaaagatgccggtttagtgccgtttattaagaccagtggcggcaaaggtctgcacgtggttgcaccgctgaagccgaaggcagagtggccggcagcaaaagcctttaccaaggccatcgcagatgccatggcagccgatagcccgggtcgctatgttagtaccatcaccaaaagcaaacgccgcggcaagattctggtggattatttacgcaatcagcgtggtgccaccgcagttgcaccttatagtacccgcgcccgtcccggtgcagcagtgagtatgcctctggcatgggatgaactgggcccgggtattggcccggcatattttaccgtggagaacaccccgacacgtttagcatctttaagcagtgatccgtggcaagactttcgtgccgccgccgtgccgattgaagatcgcgccaatcgtcgcgaaaaagccgcctaaCACAAGGTCTTCTCCTGTGTGAAA;
SEQ ID NO.18(Mfo-ligD):
CCCAGTCACGACGAAGACGCAAAAatggaacgctatgaacgtgtgcgtttaaccaaccccgataaggttctgtaccccgctagcagcaccaccaaagcagaggtgtttgattattatctgagcatcgccgaagttatgctgccgcatattgccggtcgtccggttacccgtaaacgttggccgaatggtgtggcagaagccagcttcttcgaaaagcaactggccagtagtgcaccggattggctggaacgtggcaccattgtgcataagagcggcaccaccacctaccctatcgttaacacccgcgaaggcttagcatggatcgcccagcaagcttctttagagctgcatgttccgcaatggcgctttagcagcgatggcagccaaggtccggcaacccgtatcgtgttcgatttagatccgggtgaaggcgttacaatgcctcagctgtgcgaggttgcccaagccgtgcgcgaactgatgagcgacatcggcttaatgacctatccgctgaccagtggtagcaaaggtttacatttatacgttccgctggcagaccctatcagcagccgcggtgcaagcgttctggccaagcgcgttgcagtgcagctggagcaagctatgccgaagctggttaccgcaaccatgacccgcagtctgcgcgcccagaaagtgtttttagactggagtcagaataatgcagccaagaccacaatcgcaccgtattctttacgcggtcgtgattacccgaccgttgcagcaccgcgtacatgggatgaaattggcgacccggatttacgccatctgcgtttcgacgaagttctgcagcgcatcagtgacgatggcgatttattagctggtttagatgacgatgccccggttgccgataaactgaccacctatcgcagcatgcgcgatgcaacaaaaaccccggaacccgttccgcgcgatatcccggttcgcggtaacaacgatcgtttcgttattcaagaacatcacgcacgtcgtttacattatgatctgcgtctggaacgtgatggcgtgctggttagctgggcagttccgaaaaatttaccggacaccaccgccgttaatcatttagccgtgcacacagaagatcaccctatcgagtatttaacctttcacggcacaattccgaagggcgagtatggtgctggtaatatggtgatctgggacaccggtacctatgaggccgagaaattccgcgttccggccgatccggatgacagcgatgcaccgaagggtgaagttatcttcactttaaatggtaaccgcatcgatggccgttacgcactgatccagaccgaaggtaagaactggctggcacatcgcatgaaggatcagagcagcgccgcacccgaaccgaaagacttcgccccgatgttagcaaccgaaggcagtgtggccaagctgaaggccacccagtgggccttcgaaggtaaatgggacggctaccgcttactggtggaggccgaacatggtcgcttacaactgcgtagtcgccgcggccgtgatgttaccgccgagtatccgcagtttgaagcactggccgccgatctggccgatcatcatgtggtgctggatggtgaagccgttgccttagacgatcacggcatgccgagcttccgcgagatgcagaaccgcgcacgcagtacacgtgttgagttctgggcctttgatattttatggctggatggtcgctctttactgcgcgcaaaatacacagaccgccgcaaactgctggaagcactggcagctggtggtggtctgattgtgccggaacagctggctggtgatggtccggaggccatggaacacgcacgtgagcacaaattcgagggcgtggtggctaaaaaacgcgatagcacctaccagcccggtcgtcgtagtgccagctggatcaaagacaaaatctggaacacccaagaagttgttatcggcggttggcgccaaggcgaaggtggccgtagcagtggcattggcgctttagttctgggtgtgccgggtcctcatggtttacaatttgctggtcgtgttggcaccggcttcaccgaaaaggaactgaccaaactgaaaggtatgctgaaaccgctgcacaccaaagagagcccgtttgataagccgctgccgaaactggatgccaaaggcgtgaccttcgtgcgccccgaactggttggcgaggtgcgctatagtgaacgtacaaccgaccaccgtttacgccagcctagttggcgtggtctgcgtccggacaaagcaccggacgaagtggtgtgggagtaaCACAAGGTCTTCTCCTGTGTGAAA;
SEQ ID NO.19(Msm-ligD):
CCCAGTCACGACGAAGACGCAAAAatggaacgctacgaacgtgtgcgtttaaccaaccccgataaggtgctgtaccccgctaccggcaccaccaaagccgaagtgtttgattattatttaagcattgcacaagttatggtgccgcacatcgccggtcgtccggttacacgtaaacgctggccgaatggcgtggccgaagaagcattctttgagaagcagctggccagcagtgccccgagttggttagaacgcggcagcattacccataaaagcggcaccaccacctaccctatcattaacacccgcgaaggtctggcatgggttgcccagcaagcttctttagaagtgcatgtgccgcagtggcgctttgaagatggtgaccaaggtccggcaacccgtatcgttttcgatttagacccgggtgagggcgtgaccatgacccagctgtgcgaaatcgcccacgaagtgcgcgctttaatgaccgatctggatttagagacatacccgctgacaagcggcagcaaaggtttacatctgtacgttccgctggcagaaccgattagcagccgtggtgcaagcgttctggcacgccgtgtggcacagcagctggaacaagctatgccgaaactggttaccgccaccatgaccaaatctttacgtgctggtaaggtgtttctggattggagccagaacaacgcagcaaaaaccaccatcgccccgtatagtttacgcggtcgtgaccatcctacagtggccgcccctcgcacttgggacgaaattgccgatccggaactgcgccatttacgctttgatgaggtgctggaccgtctggacgaatacggtgatctgctggcacctctggacgcagacgccccgattgccgataagctgacaacctaccgtagtatgcgcgacgcaagtaaaaccccggaaccggtgccgaaagaaattccgaaaactggtaataatgacaaattcgtgatccaagaacatcatgcccgtcgtttacactacgacttacgtttagagcgcgacggcgtgctggttagtttcgccgtgcctaaaaatttaccggaaaccaccgcagaaaaccgtttagccgttcacaccgaagatcacccgattgaatatttagccttccacggtagcatccctaaaggcgagtatggtgccggcgatatggtgatttgggacagcggcagttatgaaaccgagaaattccgcgtgccggaagaactggataacccggacgacagccacggtgaaatcatcgtgactttacacggcgaaaaggttgacggccgttacgctttaattcaaaccaagggcaaaaactggctggcccaccgtatgaaagaccagaaaaacgcccgtccggaggattttgcccctatgctggccaccgaaggcagtgtggccaaatacaaggccaaacaatgggccttcgagggtaaatgggatggctaccgtgtgattatcgacgccgatcatggtcagctgcagatccgtagccgtaccggccgtgaagttaccggcgagtatccgcagtttaaagctttagccgcagatctggcagagcatcacgttgttctggacggcgaggccgttgccttagatgagagcggcgtgccgagttttggccagatgcagaatcgcgcccgtagcacccgtgtggagttttgggccttcgatattttatggttagacggtcgttctttactgcgtgcaaagtatagcgatcgccgtaaaattttagaagctttagcagacggtggtggtctgattgtgcccgatcaactgccgggtgacggccccgaagccatggaacacgtgcgtaaaaagcgcttcgagggtgtggttgccaaaaagtgggatagcacctaccagcccggtcgtcgcagcagcagctggatcaaagataaaatttggaatacccaagaagttgttattggcggttggcgtcaaggtgagggtggtcgcagcagtggtattggcgctttagttctgggcattccgggtcccgaaggtttacagttcgtgggtcgtgttggcaccggttttaccgaaaaagaactgagtaagctgaaagatatgctgaagccgctgcataccgatgaaagcccgttcaacgcaccgctgccgaaagtggatgcccgtggcgtgacctttgtgcgccccgaactggtgggcgaagtgcgttatagcgagcgcaccagcgatggtcgtttacgtcaacctagttggcgtggtttacgcccggataagacaccggatgaggtggtttgggaataaCACAAGGTCTTCTCCTGTGTGAAA;
SEQ ID NO.20(Mtb-ligD):
CCCAGTCACGACGAAGACGCAAAAatgggcagcgcaagcgaacagcgcgttaccttaaccaacgccgacaaagtgctgtatccggcaaccggtaccaccaaaagcgacattttcgactactatgctggtgtggcagaggtgatgctgggtcatattgccggtcgcccggcaacccgtaaacgctggccgaatggcgttgatcagccggcatttttcgagaagcagctggctttaagtgcacccccttggctgagccgtgccaccgttgcacaccgtagtggtaccaccacctaccctatcattgatagcgccaccggtctggcttggattgcacagcaagccgcactggaagtgcacgtgccgcagtggcgtttcgtggccgaaccgggtagtggcgaattaaatcccggtccggctacccgtttagtgttcgatctggatccgggcgagggtgtgatgatggcacagctggccgaagttgcacgcgcagtgcgtgacttactggcagacattggcttagtgacctttccggtgacaagcggcagtaaaggtctgcatttatacaccccgctggatgaaccggtgagtagtcgcggcgccacagtgctggcaaaacgtgttgcacagcgtttagagcaagcaatgcccgctctggtgaccagcacaatgaccaaaagtctgcgcgccggcaaggtgtttgtggattggagtcagaacagcggcagcaagaccacaattgcaccttatagtctgcgcggtcgtacccatccgaccgttgcagccccgcgtacatgggcagaactggacgatcccgctctgcgccagctgagctatgacgaagttctgacacgcattgcccgcgatggcgatctgctggaacgtttagatgcagatgcaccggttgcagatcgtttaacccgctaccgtcgtatgcgtgatgcaagcaaaacccccgaaccgatcccgaccgccaagcccgttaccggtgacggtaacacattcgtgattcaagaacatcatgcccgtcgcccgcactatgattttcgtttagaacgtgatggcgtgctggtgagttgggccgttccgaaaaatctgccggataacaccagcgttaaccatttagccattcacaccgaggatcacccgctggagtatgccacctttgagggcgcaattcctagcggtgaatatggtgccggcaaagtgatcatctgggacagtggcacctatgataccgagaaatttcatgatgacccgcacaccggtgaggtgatcgttaatttacatggtggccgtatcagcggtcgctacgcactgattcgcaccaatggcgaccgctggctggcccatcgtttaaagaatcagaaagatcagaaagtgttcgagtttgataatctggcccctatgctggcaacccacggtacagtggccggtctgaaggccagccagtgggcatttgaaggcaaatgggatggctaccgcttactggttgaagcagatcacggtgcagtgcgtctgcgcagtcgtagcggccgtgatgtgaccgccgaatatccgcagctgcgcgctttagcagaagatttagcagatcatcacgttgtgctggatggtgaggccgtggttctggacagcagcggcgtgccgagtttcagccagatgcaaaaccgcggtcgtgacacacgcgtggaattctgggcctttgacttactgtatctggatggccgtgcactgctgggcacccgttatcaagatcgccgtaaactgttagaaactttagcaaacgcaacctctttaaccgttccggaactgttaccgggcgacggtgcccaagcttttgcttgtagtcgtaaacacggttgggaaggtgtgattgccaaacgtcgtgacagccgttatcagcccggtcgccgttgtgccagctgggttaaagataaacattggaatacccaagaagtggtgatcggtggctggcgtgctggtgaaggcggtcgtagcagcggtgtgggtagtttactgatgggcatcccgggtccgggtggtctgcagtttgctggtcgtgtgggtaccggcttaagcgaacgtgaactggccaatctgaaggagatgctggcaccgctgcacaccgatgagagtcctttcgacgtgccgttacccgctcgtgatgccaaaggcatcacctacgttaagccggcactggtggccgaagttcgctatagcgaatggacaccggaaggccgtttacgccagagtagctggcgtggtttacgtccggacaaaaaaccgagcgaggtggttcgcgagtaaCACAAGGTCTTCTCCTGTGTGAAA;
SEQ ID NO.21(Pae-ligD):
CCCAGTCACGACGAAGACGCAAAAatgcctagtagcaagccgctggcagaatacgcacgcaaacgcgattttcgccagaccccggaacctagtggccgtaaacctcgcaaagacagcaccggtttactgcgttactgcgtgcagaagcatgatgcaagccgtctgcactatgacttccgtttagagttagacggtactttaaaaagctgggcagtgcctaaaggtccgtgtttagatccggccgtgaaacgtttagcagtgcaagttgaggatcatcctctggattacgccgattttgaaggcagcatcccgcaaggtcattatggcgctggtgacgttatcgtttgggatcgtggtgcttggaccccgctggatgatccgcgcgaaggtctggaaaagggccatttaagtttcgccttagatggtgagaaattaagcggccgctggcatttaatccgcacaaacttacgcggcaaacaacctcagtggtttctggttaaagccaaggacggcgaggcacgttctttagatcgcttcgacgtgttaaaggaacgtccggacagcgttctgagcgagcgcactttattacctcgccatggtgaaaccgccacccccgctgcacgtccggcacgtcgtggcaaaagtggcggcaaaaccccgatgccggagtggattgccccggaactggccagcttagttgaacagcctccgcgcggcgaatgggcctacgaactgaagttagacggctatcgtttaatgagccgcattgaggatggccacgttcgtctgctgacccgtaacggccatgactggaccgagcgcttaccgcatctggaaaaagcattagccggtttaggtctgcagcgtagctggctggatggcgagctggttgttctggacgaagagggccgccccgattttcaagctttacagaatgcattcgaagaaggtcgcggtgaaaatattttatacgtgctgttcgatttaccgtaccatgaaggcgaggatttacgcgatgttgctttagaggagcgtcgcgcacgcttagaggccttactggaaggtcgcgatgaagatccgctgcgcttcagtgccacactggcagaagatccgcgtgatctgctggcaagcgcttgtaagctgggcttagagggcgttattggcaagcgcttaggcagtgcataccgcagccgccgcagcaacgattggatcaaattaaagtgccagctgcgtcaagaattcgtgatcgtgggctatacagagccgaaaggtagccgccgtcatatcggtgctttactgttaggtctgtacagtccggacgaagaacgccgtttacgctatgctggtaaggtgggcagtggtttcaccgccgccagtctgaaaaaggtgcgcgaacgcttagaaccgctggccgttcgcagtagcccgttagccaaagttccgcccgctcgcgagactggtagtgtgcaatgggtgcgtccgcaacagctgtgcgaggtgagctacgcacagatgacccgcggtggtatcattcgccaagctgtttttcacggtctgcgtgaggataaaccggcacgtgaggtgaccggtgaacgtcccgctggtcctccgcctttacgcggcgcacgtaaagccggtagcggtgcaagccgtgcagcaaccgccggcgttcgtattagccacccgcaacgtttaatcgatccgagtatccaagcaagcaaactggagctggccgaatttcatgcccgctacgcagatctgctgctgcgcgatctgcgtgagcgtcccgttagtctggttcgtggcccggatggtatcggtggcgaactgtttttccaaaaacacgccgcacgtctgaaaatccccggtattgtgcagctggatccggcattagatccgggtcacccgccgctgttacagattcgtagcgccgaagctttagtgggtgcagtgcagatgggcagcatcgaatttcatacatggaacgccagtctggcaaatctggaacgcccggatcgtttcgtgctggatctggatccggatccggctttaccttggaagcgtatgctggaggcaacccagttatctttaactttactggatgagttaggcttacgcgcatttttaaaaacttctggtggtaaaggcatgcatttactggtgccgttagagcgtcgccatggttgggacgaagtgaaagacttcgcccaagctatcagccaacatctggcccgcttaatgccggaacgttttagcgccgttagtggtccgcgcaaccgtgttggcaaaattttcgtggactatttacgcaacagccgtggtgccagcaccgttgccgcctatagtgtgcgtgcccgtgaaggtttacccgttagcgtgccggtgtttcgtgaggagttagattctttacaaggtgccaaccagtggaatctgcgtagcttaccgcaacgcttagatgaactggccggcgatgatccgtgggcagattatgccggtacccgccagcgtatcagtgcagcaatgcgtcgtcagctgggtcgcggttaaCACAAGGTCTTCTCCTGTGTGAAA;
SEQ ID NO.22(Pbr-ligD):
CCCAGTCACGACGAAGACGCAAAAatgggtcgtgaccaccctctgagtgcctaccacgccaaacgtgattttgcacacacccccgaaccggctggtgagaaacgcgtggccaaacgccgtggtaaggccgttcagcccgctttacagtttgttattcagcgccatcatgcccgtcgtctgcactacgattttcgtttagaatggggcggcacactgaaaagctgggcagttcctcgcggtcctagcttagatcccgatattcagcgtttagcagttgaagttgaagatcatccgctggattacgctggtttcgagggtacaattccgaaaggtcactatggcgctggtgatgtggcaatttgggatcgcggcgaatggattccggagggtgatgcagaagagggtttacgtcgtggcaagctgcatttcgaactgcgcggtacacgtctgcacggtgcttgggttttatttcgtctggccggcgagggtgaccaatggatgctgcgtaagcgccgcgatcagcatgcccgtatcggtgatggtgatgccgttctgcacgatcctccggaagcagaagcaccgcccgctcccgctcccgctcccgttgcagcaaagagcccgcgtagtagcgcagcaagtagccgtcgtcgtcgtgtgccggtgccggaatttgtggagccgcagttagccactttagtggatcgcccgcccgttagcgatgcatgggtgtacgagatcaaatacgacggctaccgcatgctggtgcgttgcgatggccgtcaagttcgtttattcagccgtaacggcattgaatggaccgaacgtttaccgagtctggttcaacgtctgagcgctttacaaagccatagcggctggctggacggcgagattgttgtgatggacgagcatggccataccgatttccatgctttacaagctacactggatagtggcgccccgcaagttgagtatgtggtgttcgacgtgccgtggtgggatggtgaagatttacgcgaccgtccgctgagtcatcgtttacaagctttagatgagatctttgccgcactgccggcacaacccggtttaagtcgtagtaaaccgctggatccgggttatgttggccaagctgttctgcaagctgcatgccagctgggtctggaaggtctgatcggcaagcgtctggatgcaccttatcgcagcggccgtagcccgcattggattaagctgaaatgccgcagcgaacaagaagttgttattggtggttacaccgagccgcgtggcagtcgcggccacttaggtgcactgttagtgggcgtgtggggtaaagatggccagctggattatgccggccgtgttggcagtggttttgatcaagctggtttacaagctatgcgtgaacgtctggcaccggatgaaaccgcacgctgtccgtttcgtagcaaaccttctttaccgggtgcccctaccgtgcattgggtggagccggtgcatgtggttcaagttcgctatgcaagttggacccaagaaggtttactgcgtcaagctagctttgtgggtgtgcgcgaggacaaaccggtgcgcaaggttgtgcgtgagctgccgcagaccgtggcacaagaagataccccgatgcgtcctagcgccacacgtctggctggtcgtccggcaagtccggcagccacagcagcacgcgcaagtctgcgccgtagtggtgccagcagcgacccgaaagcaaacagtgttggcggcgttcgtgttacacatccggagcgtctggtgttcagcgttcctcgcattaccaaactggaagttgttcgctatcatgaagatatcggtgaatatctgctgcctcatttagcagcccgccctctgagcttactgcgctgtccgcaaggcaccggcggtgagtgcttcttccaaaaacatgtggaaaccactttaccgagcggtgtggaaagcgttgaagttcccgctagtgacggtaccgacacactggtgatggtgaacagcgtggaaggtattgttgctttagcccagtacggcaacgttgaatttcacacttggggcgcacgtgcacctcgtcccgatcgtccggaccgtatcaccatggatctggatcccgatcccgatttaccgtgggcccaagttgtggaagccgcccagctgacccgtgttttactggaagaactgggtctggccgcctttttaaaaaccaccggcggcaagggtttacatatcgtgaccccgatcaaagccacccgtagttgggacgaagtgaaagccttcacaaagggtctggccagccgtctggccagtgttgcccctcagcgttttaccgcccgtctgagtaagagcagccgcggtggtcgtatttttattgactatttacgtaatggccgcggtgccacagcagtggcaagttattctttacgcgcacgtgaaggtgcaccggtgagcgttccgctgcattgggatgagttaagcgccaagaaagacgtgcgtgccgaacacttcaacttacgcaatgccgttgcccgtgcaccggagagtgaaaccgcatggcaagattatgccgcccagcgccgtaccttaacagttaagatgtttcgcgctttaggtgtggatccgggtagcgcagaaagctaaCACAAGGTCTTCTCCTGTGTGAAA;
SEQ ID NO.23(Ppu-ligD):
CCCAGTCACGACGAAGACGCAAAAatggccaagccgctgcaagaatatgcacgcaagcgtgactttaacgcaaccccggaaccgagcggcaaacgcagtcgtggcaagaaggcacacgcactgcagttctgcatccagaaacacgatgccagccatttacattatgacttccgtttagaactgggcggcactttaaaaagctgggccattccgaagggcccgagcttagaccctaatgtgcgtcgtctggccgttcatgtggaagatcatccgctggactatgccgatttcgaaggccatattccggagggccactatggcgccggtgatgtgatcgtttgggaccgtggtatctgggaaccggagggcgatgcccaccaaggttatgccaaaggcaaattaaagttccgtttacaaggtgagaaactgagcggtgtttggcatttattccgtacacatttagctggtaaaaaagagcagtggatgctggtgaagagccatgatgcccaagctcgcagcgaggccgagtacagtattgttaacgcacagccggacagcgttctgagcgaccgtactttaattcctcgtaaaccggccgccaaacaagctgcagccaaacctcgtgccacacgtaaacgtcccggtaaggttcgccaagcagcattaccgaaccagctgcagccgcaattagccactttagttgatacacctccgcaaggtgactggcgttacgaggtgaagtttgatggctatcgcattctggcccgcatcgatggtgacgacgtgcgtctgtttacccgcaatggccacgattggagtagtaaaatgccgcgccagctggcagctttacgtgcactgggtatcgatagcgcttggctggatggcgaaatggtggtggccgatgaaaacggtgcagcagatttccaagctttacaaaatgcctttgataccgagcaagatgaacacatcacctactatgtgtttgatttaccgtttttaggcggtcaagatctgcgccatgcaccgctgcaagatcgtcgtgaaactttaaaaacattactggaccacgacgccagcgatgttctgaaatatagcgccgattttgatgagcccgttgatgcactgctggccagtgcatgccgtctggaactggagggtttaattggcaagcgcgccgacagcccgtatagtggtcgtcgcagtggcgactggattaaactgaagtgtaagcgccgccaagaattcgtgctggttggttacaccgacccgaaaggcagccgcagcggtttcggtgctttattactggctttacatgatcccgataacggcgaactgcgttatgccggcaaggttggcaccggttttacagcagcaactttagcaagcatccacacacgtttacaaccgctggagattgccaaaccggcagttacccgtcctccgagtggtgccgaagcacgcggcgttcactggctgaagccgcaattactggcagaagtggcctacgcccaaatgacacgcgacggtattgtgcgtcatagcgtgttccacggtctgcgtgacgacaaaccggccaccgcaattgatctggaacgccctatgagtaccaacaccacacctcgtcgtaaacgtggtaaagcagcacctctgagcgaggatttacatctgacccatccggatcgtgttattgacgccaccactggtgttacaaagcgtgatgtggccgagtactacgccgccgttagccagtggctgctgcctcagattcagcatcgtccggtggccttagttcgtgcaccggatggtctggctggtgagctgttcttccaaaagaacgccagccagctgcatttaccgaacgtgctggagtatgacaaagcccaagctggtcaagctgcaatggtgatcaatcgcgccgatactttactgggtgcagttcagatgaatatgctggaactgcacagctggaatgcaaccgacaaggatttcgacaagccggatcgctttgtgctggatttagatccggaccccgctttaccttggaaggcaatgctggaagcaacccagttaacactgactttattagacgagctgggtttaaaagtgttcatcaagaccagcggtggcaagggtattcatttagtggtgccgttaacccgtcgcgctggttgggatgaggttaaagcctttagccacgccatcgtggaatatctggccaagctgttccccgatcgtttaagcgccgttagtggtccgaaaaatcgtattggtcgtatttttattgactatctgcgtaatgcccgtggtgcaacaacagcttgtgcctactctttacgcgcacgtgaaggtatgccggtgagcgtgcctatttggcgtgaggagctgaccgcactgaaggccgcaaatcagtggaatatcgcaaatttacccgctcgtttagccgaagttgacgatccgtgggccgatctgggccgtgtgcgtcagagcatcacagcccgcatgcgtaagcaactgggtttagcctaaCACAAGGTCTTCTCCTGTGTGAAA;
SEQ ID NO.24(Pvi-ligD):
CCCAGTCACGACGAAGACGCAAAAatggcaaagccggtgagtgaatatacccgcaagcgcaacttcgacattaccagcgagcccgctgaggctggtagtaaaatgcgcagcgccaaagcccacgcactgagcttcgttatccagaagcacgatgccagccatctgcactatgatttccgtctggagctggacggtacactgaagagctgggccgtgcctaagggccctagcttagatcctacccagaaacgtttagccgtgcatgttgaggatcatcctctgggttatgcaagcttcgaaggcagcattccgaagggccagtatggtggtggcgacgttattgtgtgggatcgcggtgtgtgggagccgcacggtgatcctcgcaaaacctacgccgaaggcaagctgaaattcacactgattggtgaaaagctgactggtgattgggctttagttcgtacccgtctgaagggtagcggtagcaaagagcagtggctgctgattaaggagaaggatagcgttgcccgcccggccgatgagtatgatatcattgaacagcagcctcaaagtgtgattagtggcgcccatgtgggcgttggtcgcgttccggcaagcaaagccaagccgcgcagcacaaaaaccaaaaccgataccgcaccggcaaaaccgagccgcatgagcagccgtaccaaggccaaagccgcactgcccgaactgttaaccccgcaactggcaacactggttgatgcccctccggctggtgaatggctgtacgagatcaaatttgatggctaccgcattctgacacgcatccaaggcgacgatgttcgtctgttcacccgcaatggtcacgattggaccgaacgtctgccggagctggcaaaagcaatcaaagctttaaaactgcaagatacttggttcgacggcgaagtggttgtgttaaacgatcaaggtttaccggattttcaagctttacagaacgccttcgaaatcggtcgcagcaaggatattttatattatttattcgatatgccgtatctgaccggcgaagatctgcgcgaggtgccgatcgaacaacgtcgcgatgctttaaagcaagttctgggtaagcagcgtagccgtttactgcgctttagcgatgcattccgtagcggccacaaagacattgttgagagcgccagcgcaatgggtctggagggcgtgattggcaaacgcgctggtagtccttatgtgagcaaacgcaatgccgactggatcaagctgaaatgtcgtctgcgccaagagttcgtgattgttggctatacagcccctcaaggtagccgcagtgcattcggcgcactgctgctggccgttaatgatgacgacggtctggtgtatgccggccgtgtgggcactggtttcaccagccagactttaaaacaactgcatgaccaactgcaacctttagagcgcgataccagtccgctggacaagaaactgaccagcgcacaagctcgtggcgtgcaatgggtggaaccgcgtttaatctgcgaagccgagtttgcagagtggacccgcgaaggcattctgcgccaagcagcctttgtgggtttacgcagcgacaaaccggcaagcgaggtggttcgcgaatatccgcagcccgctgacattgccagccgtccgaaagcagcaaaaagcagcaagaccaaggcattagaggcccccgttgcccgcaaaaccgcacgtggcaaagtgaatgtggctggtgtgggtattagccacagcgaccgcgtgattgatagcaagagcggcacccagaagatcgaactggcacaattctacgaaagcatcgccgattggattttaccgtatttaaacaatcgcccggttgcactgctgcgctgtccggaaggcattgacggcgagcaatttttccagaagcatagcgagcgtttagcaattccgcacattcgccagctggatcgcaaactggatccgggtcatgcagcactgatggaaatcgacaccgtgcaagctttagtgggtgccgcacagatgggtgccatcgaatttcacacttggggcgccaccagtgatcgtatcgagacacccgatcatctggtgctggatttagaccccgatccggccttaccgtggcgcagcatgatcgaagcaacccagatggtgctggccgttttagaggagctgggcttagaagcctttttaaaaaccagcggcggcaaaggcatgcatatcatcgtgcctttagcccgccacgcagattgggataccgtgaaaggcttcgccaaagccatcgccgaatttgttacccagcagctgccggaacgcttcaccgccacaatgggtcctaaaaaccgtgtgggccgcatcttcgttgattatctgcgtaatagccgtggcggcagtacagtgaccgcatacagcgttcgcgcccgccccggtctgcccgttagtgttccgatcgctttagacgaactggctggtttaacaagcagcgcccagtgggatgttacaaatttagagcagcgtctgcgcgaactgaagggcgacccgtgggagggttatcgtaatcgtcagcgcatcacacagaaaatgtggaagcagctgggtgcaaagcgtagttaaCACAAGGTCTTCTCCTGTGTGAAA。
(3)酶切pDual-Cas9-Parental质粒。
酶切反应体系如下:
37℃反应1h,反应结束后使用磁珠对酶切产物进行纯化。
(4)酶切11种Ku蛋白的CDS编码序列。
酶切反应体系如下:
37℃反应1h,反应结束后使用磁珠对酶切产物进行纯化。
(5)连接。
将步骤(4)纯化后的Ku蛋白的CDS编码序列按等分子数混合,再与步骤(3)纯化的酶切载体片段混合,进行连接。
连接反应体系如下:
22℃反应1h,反应结束后将连接产物转化Top10感受态细胞,涂布卡那霉素抗性LB平板,30℃培养过夜,次日将平板所有克隆刮板抽提质粒,将质粒进行NGS测序分析Ku蛋白的CDS编码序列的克隆情况,测序结果显示质粒文库含有11种Ku蛋白的CDS编码序列。
(6)酶切。
将步骤(5)中刮板抽提的质粒使用BbsⅠ进行酶切。
酶切反应体系如下:
37℃反应1h,反应结束后使用酚/氯仿/异丙醇沉淀的方法对酶切产物进行纯化。
(7)酶切11种ligD蛋白的CDS编码序列。
酶切反应体系如下:
37℃反应1h,反应结束后使用磁珠对酶切产物进行纯化。
(8)连接。
将步骤(7)纯化的ligD蛋白的CDS编码序列按等分子数混合,再与步骤(6)纯化后的载体片段混合,进行连接。
连接反应体系如下:
22℃反应1h,反应结束后将连接产物转化Top10感受态细胞,涂布卡那霉素抗性LB平板,30℃培养过夜,次日将平板所有克隆刮板抽提质粒,得到Ku+ligD质粒文库,将质粒进行NGS测序分析ligD蛋白的CDS编码序列的克隆情况、文库Ku+ligD组合的覆盖度情况,测序结果显示质粒文库含有121种Ku+ligD质粒,即Ku+ligD质粒文库构建成功。
实施例3从Ku+ligD质粒文库筛选在大肠杆菌体内有效的NHEJ系统
本实施例对在大肠杆菌中有效的NHEJ系统进行筛选,包括如下步骤:
(1)将实施例2构建的Ku+ligD质粒文库电转至MG1655大肠杆菌感受态细胞中,涂布卡那霉素抗性LB平板,30℃培养过夜。
(2)将平板所有克隆刮板并将菌液接种至LB培养基,于30℃、220rpm条件下培养,当菌液OD600值达到0.6时,按照标准的电转感受态细胞制备方法制备感受态细胞。
(3)电转pDual-sgRNA-lacZ质粒至步骤(2)制备的电转感受态细胞,涂布含IPTG、X-gal、卡那霉素和氨苄青霉素的LB平板,30℃培养过夜。
(4)挑取192个白色单克隆至LB培养平板培养8小时,使用菌落PCR的方法扩增每个单克隆的Ku、ligD以及lacZ基因序列。
PCR扩增体系如下:
其中,lacZ基因的PCR扩增引物如SEQ ID NO.25和SEQ ID NO.26所示。
SEQ ID NO.25:AGCATCTGGTCGCATTGGGTCACCAGC;
SEQ ID NO.26:CTTCCAGATAACTGCCGTCACTCCAGCGC。
Ku基因的PCR扩增引物如SEQ ID NO.27和SEQ ID NO.28所示。
SEQ ID NO.27:CTTCAGCCATACTTTTCATACTC;
SEQ ID NO.28:AGCTGGACACCGTTTAAACTCAATG。
ligD基因的PCR扩增引物如SEQ ID NO.29和SEQ ID NO.30所示。
SEQ ID NO.29:TCTGTTGTTTGTCGGTGAACTG;
SEQ ID NO.30:CTGGTATTGGCACAAACCTGAT。
反应程序如下:
预变性:96℃,6min;
循环扩增:94℃,30s;58℃,30s;72℃,50/120s;循环35次;
循环外延伸:72℃,5min。
扩增产物于4℃保存。
其中,扩增lacZ和Ku基因,PCR延伸时间为50s;扩增ligD基因,PCR延伸时间为120s。
lacZ基因的扩增结果如图1所示,Ku基因的扩增结果如图2所示,ligD基因的扩增结果如图3所示,由上述图片可以看出,挑取的192个菌株中共有132个克隆的lacZ、Ku和ligD基因均扩增成功。
将lacZ、Ku和ligD基因均PCR扩增成功的克隆对应的PCR产物纯化后进行Sanger测序分析,lacZ基因的PCR产物使用SEQ ID NO.25和SEQ ID NO.26进行测序,Ku基因的PCR产物使用SEQ ID NO.28进行测序,ligD基因的PCR产物使用SEQ ID NO.30进行测序。
测序结果显示,132个克隆的lacZ基因均发生基因编辑,有不同长度的序列缺失或插入,132个克隆对应的Ku+ligD组合的结果如表1所示:
表1
由表1可知,共有24种Ku+ligD组合可以作为大肠杆菌的NHEJ系统,其中Mno-Ku+Mfo-ligD频数最高,达到32,Mbr-Ku+Mfo-ligD频数为18,均高于现有文献报道的Msm-Ku+Msm-ligD组合频数,表明Mno-Ku+Mfo-ligD、Mbr-Ku+Mfo-ligD作为大肠杆菌NHEJ系统,基因编辑效率优于Msm-Ku+Msm-ligD。此外,Mno-Ku+Msm-ligD频数和Msm-Ku+Msm-ligD相近。
实施例4计算NHEJ系统末端连接效率
本实施例分别以Mno-Ku+Mfo-ligD、Mbr-Ku+Mfo-ligD、Mno-Ku+Msm-ligD以及Msm-Ku+Msm-ligD作为大肠杆菌的NHEJ系统,计算四种NHEJ系统的连接效率,包括如下步骤:
(1)参考“实施例2”,使用BsaⅠ分别酶切pDual-Cas9-Parental质粒以及Mno-Ku、Mbr-Ku和Msm-Ku蛋白的CDS编码序列,使用T4 DNA连接酶分别将Mno-Ku、Mbr-Ku和Msm-Ku蛋白的CDS编码序列连接到pDual-Cas9-Parental质粒,最终得到pDual-Cas9-Mno-Ku、pDual-Cas9-Mbr-Ku和pDual-Cas9-Msm-Ku质粒,然后使用BbsⅠ分别酶切pDual-Cas9-Mno-Ku、pDual-Cas9-Mbr-Ku和pDual-Cas9-Msm-Ku质粒以及Mfo-ligD和Msm-ligD蛋白的CDS编码序列,通过T4 DNA连接酶分别将Mfo-ligD和pDual-Cas9-Mno-Ku、Mfo-ligD和pDual-Cas9-Mbr-Ku、Msm-ligD和pDual-Cas9-Mno-Ku、Msm-ligD和pDual-Cas9-Msm-Ku进行连接,最终得到pDual-Cas9-Mno-Ku+Mfo-ligD、pDual-Cas9-Mbr-Ku+Mfo-ligD、pDual-Cas9-Mno-Ku+Msm-ligD以及pDual-Cas9-Msm-Ku+Msm-ligD质粒。
(2)将pDual-Cas9-Mno-Ku+Mfo-ligD、pDual-Cas9-Mbr-Ku+Mfo-ligD、pDual-Cas9-Mno-Ku+Msm-ligD以及pDual-Cas9-Msm-Ku+Msm-ligD质粒分别电转MG1655大肠杆菌感受态细胞,涂布卡那霉素抗性LB平板,30℃培养过夜。
(3)分别挑取单克隆至LB培养基于30℃、220rpm条件下培养,当菌液OD600值达到0.6时,按照标准的电转感受态细胞制备方法制备感受态细胞。
(4)使用EcoRⅤ限制酶酶切pUC57-Amp质粒。
酶切反应体系如下:
37℃反应1h,反应结束后使用磁珠对酶切产物进行纯化。
(5)分别电转50ng pUC57-Amp质粒以及50ng EcoRⅤ酶切后的pUC57-Amp质粒至步骤(3)制备的的100μL感受态细胞,加入500μL SOC培养基震荡培养,吸取1μL电转pUC57-Amp质粒的菌液至100μL LB培养基、100μL电转EcoRⅤ限制酶酶切后的pUC57-Amp质粒的菌液,涂布卡那霉素、氨苄青霉素LB平板,30℃培养过夜。同时将50ng EcoRⅤ酶切的pUC57-Amp质粒电转100μL MG1655感受态细胞,加入500μL SOC培养基震荡培养,菌液离心后全部涂布氨苄青霉素LB平板,30℃培养过夜(作为对照)。
(6)平板菌落生长情况如图4所示,统计每个平板的克隆数,计算NHEJ系统的连接效率,计算公式为:转化1ng EcoRⅤ酶切的pUC57-Amp质粒的克隆数与转化1ng pUC57-Amp质粒的克隆数的比值。
连接效率计算结果如表2所示。
表2
由表2可知,Mno-Ku+Mfo-ligD、Mbr-Ku+Mfo-ligD和Mno-Ku+Msm-ligD作为NHEJ系统,末端连接效率分别是Msm-Ku+Msm-ligD系统的4.6倍、2.5倍以及1.5倍,连接效率高,应用范围广。
实施例5使用筛选的NHEJ系统对大肠杆菌进行基因编辑
本实施例以Mno-Ku+Mfo-ligD、Mbr-Ku+Mfo-ligD和Mno-Ku+Msm-ligD分别作为大肠杆菌的NHEJ系统,对大肠杆菌的pcnB基因进行基因编辑,包括如下步骤:
(1)将pDual-Cas9-Mno-Ku+Mfo-ligD、pDual-Cas9-Mbr-Ku+Mfo-ligD以及pDual-Cas9-Mno-Ku+Msm-ligD质粒分别电转MG1655大肠杆菌感受态细胞,涂布卡那霉素抗性LB平板,30℃培养过夜。
(2)分别挑取单克隆至LB培养基于30℃、220rpm条件下培养,当菌液OD600值达到0.6时,按照标准的电转感受态细胞制备方法制备感受态细胞。
(3)使用SpeⅠ限制酶酶切pDual-sgRNA-lacZ质粒。
酶切反应体系如下:
基因合成pcnB-sgRNA-for-Gibson序列,序列如SEQ ID NO.31所示。
SEQ ID NO.31(pcnB):
tttaacttgctatttctagctctaaaacGGTTCACGCGCATATCGTTAactagtattatacctaggactgagctagctgtca。
使用Gibson Master Mix试剂盒将SpeⅠ酶切后的pDual-sgRNA-lacZ质粒和pcnB-sgRNA-for-Gibson序列进行连接反应,连接反应体系如下:
反应条件为50℃连接反应1h。
连接产物转化Top10感受态细胞,涂布氨苄青霉素抗性LB平板,37℃培养过夜,次日挑8个单克隆测序,将测序正确的质粒命名为pDual-sgRNA-pcnB。
(4)分别电转pDual-sgRNA-pcnB质粒至步骤(2)制备的三种电转感受态细胞,涂布卡那霉素、氨苄青霉素的LB平板,30℃培养过夜。
(5)挑单克隆至LB平板培养8小时,通过菌落PCR扩增pcnB基因,PCR扩增体系及反应程序参考实施例3的步骤(4),延伸时间为50s。
pcnB基因的PCR扩增引物如SEQ ID NO.32和SEQ ID NO.33所示。
SEQ ID NO.32:GCCGCAAGGTGCTAAGCCGCGAGGAAAG;
SEQ ID NO.33:CAGGGCAGCATTGACCTGCTCCAGC。
PCR扩增结果如图5所示,将扩增成功的PCR产物纯化后进行Sanger测序分析。
pcnB基因的PCR产物使用SEQ ID NO.32和SEQ ID NO.33进行测序,测序结果显示:所有克隆的pcnB基因均出现不同长度的序列缺失或插入,基因编辑后的pcnB部分测序结果比对结果如下:
/>
/>
/>
/>
/>
其中,pcnB-1、pcnB-2和pcnB-3:转化pDual-Cas9-Mno-Ku+Mfo-ligD质粒的pcnB基因的编辑后的序列;
pcnB-4、pcnB-5和pcnB-6:转化pDual-Cas9-Mbr-Ku+Mfo-ligD质粒的pcnB基因的编辑后的序列;
pcnB-7、pcnB-8和pcnB-9:转化pDual-Cas9-Mno-Ku+Msm-ligD质粒的pcnB基因的编辑后的序列;
pcnB-Ref:MG1655大肠杆菌pcnB基因原始序列。
上述实验结果证明本发明筛选的Mno-Ku+Mfo-ligD、Mbr-Ku+Mfo-ligD以及Mno-Ku+Msm-ligD可以作为大肠杆菌的NHEJ系统,并用于大肠杆菌基因编辑中。
综上所述,本发明通过使大肠杆菌获得有效NHEJ系统的高通量筛选工具,可以迅速筛选出在大肠杆菌中有效的NHEJ系统,末端连接效率计算实验证明所述NHEJ系统具有良好的末端连接效率。本发明成功将外源NHEJ系统引入大肠杆菌,并可以进行高效的基因编辑,具有实际应用的价值。
申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。
序列表
<110> 苏州金唯智生物科技有限公司
<120> 一种使大肠杆菌获得有效NHEJ系统的高通量筛选工具在大肠杆菌基因编辑中
的应用
<130> 2021
<160> 37
<170> PatentIn version 3.3
<210> 1
<211> 9687
<212> DNA
<213> 人工序列
<400> 1
aaacagacga agaatccatg ggtatggaca tgccgctcgc cttccatggg tatggacagt 60
tttccctttg atatgtaacg gtgaacagtt gttctacttt tgtttgttag tcttgatgct 120
tcactgatag atacaagagc cataagaacc tcagatcctt ccgtatttag ccagtatgtt 180
ctctagtgtg gttcgttgtt tttgcgtgag ccatgagaac gaaccattga gatcatactt 240
actttgcatg tcactcaaaa attttgcctc aaaactggtg agctgaattt ttgcagttaa 300
agcatcgtgt agtgtttttc ttagtccgtt atgtaggtag gaatctgatg taatggttgt 360
tggtattttg tcaccattca tttttatctg gttgttctca agttcggtta cgagatccat 420
ttgtctatct agttcaactt ggaaaatcaa cgtatcagtc gggcggcctc gcttatcaac 480
caccaatttc atattgctgt aagtgtttaa atctttactt attggtttca aaacccattg 540
gttaagcctt ttaaactcat ggtagttatt ttcaagcatt aacatgaact taaattcatc 600
aaggctaatc tctatatttg ccttgtgagt tttcttttgt gttagttctt ttaataacca 660
ctcataaatc ctcatagagt atttgttttc aaaagactta acatgttcca gattatattt 720
tatgaatttt tttaactgga aaagataagg caatatctct tcactaaaaa ctaattctaa 780
tttttcgctt gagaacttgg catagtttgt ccactggaaa atctcaaagc ctttaaccaa 840
aggattcctg atttccacag ttctcgtcat cagctctctg gttgctttag ctaatacacc 900
ataagcattt tccctactga tgttcatcat ctgaacgtat tggttataag tgaacgatac 960
cgtccgttct ttccttgtag ggttttcaat cgtggggttg agtagtgcca cacagcataa 1020
aattagcttg gtttcatgct ccgttaagtc atagcgacta atcgctagtt catttgcttt 1080
gaaaacaact aattcagaca tacatctcaa ttggtctagg tgattttaat cactatacca 1140
attgagatgg gctagtcaat gataattact agtccttttc ctttgagttg tgggtatctg 1200
taaattctgc tagacctttg ctggaaaact tgtaaattct gctagaccct ctgtaaattc 1260
cgctagacct ttgtgtgttt tttttgttta tattcaagtg gttataattt atagaataaa 1320
gaaagaataa aaaaagataa aaagaataga tcccagccct gtgtataact cactacttta 1380
gtcagttccg cagtattaca aaaggatgtc gcaaacgctg tttgctcctc tacaaaacag 1440
accttaaaac cctaaaggct taagtagcac cctcgcaagc tcggttgcgg ccgcaatcgg 1500
gcaaatcgct gaatattcct tttgtctccg accatcaggc acctgagtcg ctgtcttttt 1560
cgtgacattc agttcgctgc gctcacggct ctggcagtga atgggggtaa atggcactac 1620
aggcgccttt tatggattca tgcaaggaaa ctacccataa tacaagaaaa gcccgtcacg 1680
ggcttctcag ggcgttttat ggcgggtctg ctatgtggtg ctatctgact ttttgctgtt 1740
cagcagttcc tgccctctga ttttccagtc tgaccacttc ggattatccc gtgacaggtc 1800
attcagactg gctaatgcac ccagtaaggc agcggtatca tcaacggggt ctgacgctca 1860
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 1920
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 1980
ttggtctgac agttacgttt ccaaccaatt aaccaattct gattagaaaa actcatcgag 2040
catcaaatga aactgcaatt tattcatatc aggattatca ataccatatt tttgaaaaag 2100
ccgtttctgt aatgaaggag aaaactcacc gaggcagttc cataggatgg caagatcctg 2160
gtatcggtct gcgattccga ctcgtccaac atcaatacaa cctattaatt tcccctcgtc 2220
aaaaataagg ttatcaagtg agaaatcacc atgagtgacg actgaatccg gtgagaatgg 2280
caaaagctta tgcatttctt tccagacttg ttcaacaggc cagccattac gctcgtcatc 2340
aaaatcactc gcatcaacca aaccgttatt cattcgtgat tgcgcctgag cgagacgaaa 2400
tacgcgatcg ctgttaaaag gacaattaca aacaggaatc gaatgcaacc ggcgcaggaa 2460
cactgccagc gcatcaacaa tattttcacc tgaatcagga tattcttcta atacctggaa 2520
tgctgttttc ccggggatcg cagtggtgag taaccatgca tcatcaggag tacggataaa 2580
atgcttgatg gtcggaagag gcataaattc cgtcagccag tttagtctga ccatctcatc 2640
tgtaacatca ttggcaacgc tacctttgcc atgtttcaga aacaactctg gcgcatcggg 2700
cttcccatac aatcgataga ttgtcgcacc tgattgcccg acattatcgc gagcccattt 2760
atacccatat aaatcagcat ccatgttgga atttaatcgc ggcctcgagc aagacgtttc 2820
ccgttgaata tggctcataa caccccttgt attactgttt atgtaagcag acagttttat 2880
tgttcatgat gatatatttt tatcttgtgc aatgtaacat cagagatttt gagacacaac 2940
gtggctttcc ctgcagggtt tgcagtcaga gtagaataga agtatcaaaa aaagcaccga 3000
ctcggtgcca ctttttcaag ttgataacgg actagcctta ttttaacttg ctatgctgtt 3060
ttgaatggtt ccaacaagat tattttataa cttttataac aaataatcaa ggagaaattc 3120
aaagaaattt atcagccata aaacaatact taatactata gaatgataac aaaataaact 3180
actttttaaa agaattttgt gttataatct atttattatt aagtattggg taatattttt 3240
tgaagagata ttttgaaaaa gaaaaattaa agcatattaa actaatttcg gaggtcatta 3300
aaactattat tgaaatcatc aaactcatta tggatttaat ttaaactttt tattttagga 3360
ggcaaaaatg gataaaaaat acagtatcgg cttagatatt ggcactaata gcgtgggttg 3420
ggccgttatt accgatgaat ataaagttcc gagcaagaaa ttcaaagttc tgggtaatac 3480
cgatcgccac agtattaaga agaatctgat cggtgcactg ctgtttgata gcggcgagac 3540
agccgaagcc acacgtctga aacgtaccgc acgtcgccgt tatacccgtc gtaaaaatcg 3600
tatttgttac ctgcaagaga tttttagcaa tgaaatggcc aaagttgatg acagtttttt 3660
ccaccgtctg gaagaaagtt ttttagtgga agaagataag aaacacgaac gccatccgat 3720
cttcggcaac atcgttgacg aagttgccta ccacgaaaag taccctacaa tttatcacct 3780
gcgcaaaaaa ctggttgata gcaccgacaa agccgacctg cgcttaatct atctggccct 3840
ggcccacatg atcaaatttc gcggccactt tctgattgaa ggtgacttaa accctgataa 3900
cagtgacgtt gacaaattat tcattcagtt agttcaaacc tataaccagc tgtttgaaga 3960
aaacccgatc aacgccagtg gtgttgacgc aaaagccatc ctgagtgccc gcctgagtaa 4020
aagccgccgt ttagaaaact taatcgcaca attaccgggt gagaagaaaa atggcttatt 4080
cggcaacctg attgccctga gtctgggctt aacccctaat ttcaaaagta acttcgacct 4140
ggccgaggac gccaagttac aactgagtaa agacacttat gatgacgatc tggataattt 4200
actggcccaa atcggtgacc agtacgccga tctgttttta gccgccaaga atttaagcga 4260
tgccatcctg ctgagtgata ttctgcgtgt gaatacagaa attacaaaag ccccgctgag 4320
cgcaagcatg attaagcgct atgacgagca ccatcaggac ttaaccctgc tgaaggcctt 4380
agttcgccaa cagctgccgg agaagtataa agaaatcttt tttgatcaga gcaagaacgg 4440
ttacgccggt tatattgacg gcggtgccag ccaggaagag ttttacaagt tcatcaaacc 4500
gatcctggag aaaatggatg gcacagagga actgttagtg aagctgaacc gtgaagattt 4560
actgcgcaag cagcgcacct tcgacaatgg cagcattccg catcaaattc atctgggtga 4620
attacatgcc attttacgtc gtcaggaaga tttttatccg ttcctgaaag acaaccgtga 4680
gaagatcgag aagattctga ccttccgcat cccgtactat gtgggcccgt tagcacgcgg 4740
taacagccgt ttcgcatgga tgacacgtaa aagtgaagag acaattaccc cttggaattt 4800
cgaagaggtg gtggacaaag gtgccagcgc ccagtctttt atcgagcgca tgacaaactt 4860
cgataagaat ttacctaatg agaaagtttt acctaaacat agcctgctgt atgaatactt 4920
cacagtttac aatgagttaa ccaaagtgaa atatgtgacc gaaggtatgc gtaaaccggc 4980
cttcttaagc ggcgagcaaa agaaggcaat cgtggatctg ttattcaaaa ccaatcgcaa 5040
agttacagtg aaacaactga aagaggacta tttcaagaaa attgaatgct tcgatagcgt 5100
ggagattagt ggcgtggagg accgttttaa tgccagctta ggtacatacc atgatctgtt 5160
aaaaattatt aaagataaag attttctgga taacgaagaa aatgaagata ttctggaaga 5220
tatcgtgctg accctgaccc tgtttgaaga tcgcgaaatg atcgaagagc gtctgaaaac 5280
ctatgcccat ctgttcgacg acaaagtgat gaaacagctg aagcgtcgcc gctacaccgg 5340
ttggggtcgc ttaagtcgca agctgatcaa cggtattcgt gacaaacaga gcggtaaaac 5400
catcctggat tttctgaaaa gcgatggttt cgccaaccgt aactttatgc agttaatcca 5460
tgacgatagc ctgacattta aagaagatat tcaaaaggcc caggttagcg gccaaggtga 5520
tagcttacac gaacacattg ccaatctggc aggcagtccg gccattaaaa aaggtatttt 5580
acaaaccgtt aaggtggttg atgaattagt gaaagtgatg ggccgccaca agcctgaaaa 5640
tatcgtgatt gaaatggccc gtgagaacca gaccacccaa aaaggccaga aaaacagtcg 5700
tgaacgcatg aagcgtatcg aagaaggtat taaagaactg ggcagccaaa tcctgaaaga 5760
gcatccggtt gagaacacac agttacaaaa cgaaaaactg tatttatact atctgcaaaa 5820
tggccgcgat atgtatgtgg accaggagct ggatattaac cgcctgagtg attatgatgt 5880
tgatcacatt gttccgcagt cttttttaaa ggatgatagc atcgacaata aggtgctgac 5940
ccgtagcgac aagaatcgcg gcaagagcga taacgttccg agcgaagaag ttgtgaagaa 6000
aatgaaaaat tactggcgcc agttactgaa cgccaagctg atcacccaac gcaagttcga 6060
caatctgacc aaagcagagc gtggtggttt aagcgaactg gacaaggccg gcttcatcaa 6120
gcgtcagtta gtggaaaccc gtcagatcac aaaacacgtg gcccagattc tggatagccg 6180
tatgaatacc aaatacgacg agaatgataa actgattcgt gaagttaaag ttatcaccct 6240
gaagagtaag ctggtgagcg acttccgtaa agactttcag ttctacaaag ttcgcgaaat 6300
taataattat catcatgcac atgatgcata cctgaacgcc gttgttggca cagccctgat 6360
caagaagtat cctaaactgg aaagcgagtt tgtttatggc gattacaagg tgtatgatgt 6420
gcgcaaaatg atcgccaaga gtgagcagga aatcggtaaa gccaccgcca aatacttttt 6480
ctacagtaac attatgaatt ttttcaagac cgaaatcacc ttagcaaacg gcgagatccg 6540
caaacgcccg ctgatcgaaa ccaatggtga aaccggcgag attgtttggg ataagggtcg 6600
cgactttgca accgttcgca aggtgctgtc tatgcctcag gtgaatattg ttaagaaaac 6660
cgaagtgcaa accggcggct ttagtaaaga aagcatcctg ccgaaacgca atagcgacaa 6720
actgattgcc cgtaaaaaag actgggaccc taagaagtac ggcggttttg atagccctac 6780
cgtggcatac agcgttctgg ttgtggccaa agtggaaaag ggcaagagta agaagctgaa 6840
gagtgttaaa gagctgctgg gcatcaccat catggaacgt agcagcttcg agaaaaatcc 6900
gatcgatttc ctggaggcaa aaggttacaa agaagttaaa aaagatttaa tcatcaaatt 6960
acctaaatac agcctgttcg agctggagaa tggtcgcaaa cgtatgctgg caagcgccgg 7020
cgaattacaa aaaggtaatg aactggcact gccgagcaag tacgttaact tcttatattt 7080
agcaagccat tacgagaaat taaaaggtag tccggaggat aacgagcaga agcagttatt 7140
tgttgagcag cataaacatt acctggatga gattattgag cagattagtg agttcagcaa 7200
gcgcgtgatt ctggcagatg ccaacctgga taaggttctg agcgcctata acaaacaccg 7260
cgacaagccg attcgcgaac aagcagagaa cattattcat ctgttcacac tgaccaacct 7320
gggcgccccg gcagccttca agtattttga taccaccatc gaccgcaaac gctatacaag 7380
caccaaagag gttctggacg ccaccctgat tcaccaaagc attaccggct tatatgaaac 7440
ccgcatcgac ctgagtcagt taggcggtga ctaaagtata ttttagatga agattatttc 7500
ttaatctaga catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 7560
ttccgcgcac atttccccga aaagtgccac ctgcatcgat ttattatgac aacttgacgg 7620
ctacatcatt cactttttct tcacaaccgg cacggaactc gctcgggctg gccccggtgc 7680
attttttaaa tacccgcgag aagtagagtt gatcgtcaaa accaacattg cgaccgacgg 7740
tggcgatagg catccgggtg gtgctcaaaa gcagcttcgc ctggctgata cgttggtcct 7800
cgcgccagct taagacgcta atccctaact gctggcggaa aagatgtgac agacgcgacg 7860
gcgacaagca aacatgctgt gcgacgctgg cgatatcaaa attgctgtct gccaggtgat 7920
cgctgatgta ctgacaagcc tcgcgtaccc gattatccat cggtggatgg agcgactcgt 7980
taatcgcttc catgtgccgc agtaacaatt gctcaagcag atttatcgcc agcagctccg 8040
aatagcgccc ttccccttgc ccggcgttaa tgatttgccc aaacaggtcg ctgaaatgcg 8100
gctggtgcgc ttcatccggg cgaaagaacc ccgtattggc aaatattgac ggccagttaa 8160
gccattcatg ccagtaggcg cgcggacgaa agtaaaccca ctggtgatac cattcgcgag 8220
cctccggatg acgaccgtag tgatgaatct ctcctggcgg gaacagcaaa atatcacccg 8280
gtcggcaaac aaattctcgt ccctgatttt tcaccacccc ctgaccgcga atggtgagat 8340
tgagaatata acctttcatt cccagcggtc ggtcgataaa aaaatcgaga taaccgttgg 8400
cctcaatcgg cgttaaaccc gccaccagat gggcattaaa cgagtatccc ggcagcaggg 8460
gatcattttg cgcttcagcc atacttttca tactcccgcc attcagagaa gaaaccaatt 8520
gtccatattg catcagacat tgccgtcact gcgtctttta ctggctcttc tcgctaacca 8580
aaccggtaac cccgcttatt aaaagcattc tgtaacaaag cgggaccaaa gccatgacaa 8640
aaacgcgtaa caaaagtgtc tataatcacg gcagaaaagt ccacattgat tatttgcacg 8700
gcgtcacact ttgctatgcc atagcatttt tatccataag attagcggat cctacctgac 8760
gctttttatc gcaactctct actgtttctc catacccgtt tttttgggaa ttcgagctct 8820
aaggaggtta taaaaaagag accattccat tccggtctca aagcttgggc ccgaacaaaa 8880
actcatctca gaagaggatc tgaatagcgc cgtcgaccat catcatcatc atcattgagt 8940
ttaaacggtg tccagcttgg ctgttttggc ggatgagaga agattttcag cctgatacag 9000
attaaatcag aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg 9060
gtggtcccac ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt 9120
gtggggtgtc cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca 9180
gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaactgga tccttactcg 9240
agaagaaacc aattgtccat attgcatcag acattgccgt cactgcgtct tttactggct 9300
cttctcgcta accaaaccgg taaccccgct tattaaaagc attctgtaac aaagcgggac 9360
caaagccatg acaaaaacgc gtaacaaaag tgtctataat cacggcagaa aagtccacat 9420
tgattatttg cacggcgtca cactttgcta tgccatagca tttttatcca taagattagc 9480
ggatcctacc tgacgctttt tatcgcaact ctctactgtt tctccatacc cgtttttttg 9540
ggaattcgag ctctaaggag gttataaaaa aagtcttcat tccattccga agacaacaca 9600
aagcatcttc tgttgagtta agaacgagta tcgagatggc acatagcctt gctcaaattg 9660
gaatcaggtt tgtgccaata ccagtag 9687
<210> 2
<211> 2403
<212> DNA
<213> 人工序列
<400> 2
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaaaagct tctgcaggtc gactctagag aattcaaaaa 180
aagcaccgac tcggtgccac tttttcaagt tgataacgga ctagccttat tttaacttgc 240
tatttctagc tctaaaactc gttttacaac gtcgtgacac tagtattata cctaggactg 300
agctagctgt caaggatcca gcatatgcgg tgtgaaatac cgcacagatg cgtaaggaga 360
aaataccgca tcaggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 420
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 480
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 540
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 600
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 660
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 720
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 780
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 840
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 900
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 960
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 1020
gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 1080
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 1140
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 1200
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 1260
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 1320
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 1380
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 1440
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 1500
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 1560
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 1620
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 1680
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 1740
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 1800
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 1860
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 1920
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 1980
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 2040
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 2100
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 2160
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 2220
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 2280
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 2340
aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 2400
gtc 2403
<210> 3
<211> 982
<212> DNA
<213> 人工序列
<400> 3
cccagtcacg acggtctcaa aaaatgaatc gcacaccgtc tttacacacc aaagagaaaa 60
aaggcttcat cgacatgcac accatgtgga aaggcagcat cagctttggt ttagtgaaca 120
tcccgattaa gctgtacgca gccaccgaag ataaagatat taaattacgc tctttacata 180
aagaagatca tgccccgatt aaatatgaaa aagtgtgtac caactgcgag aaaactttaa 240
gccccgatga gatcgtgaaa ggctatgagt atgtgaaagg caagtatgtg gtgctgaccg 300
atgaggatct gaagagtctg aagcaagaac atgaggaaaa ggccgttgag atcgtggact 360
tcgttcagct gcaagaaatc gacccgatct acttcaaccg cagctacttt gtgggccccg 420
gtgataacgg caccaaagcc tataccttac tgcgcgaagc tttacgcagc accggtaaaa 480
tcggcattgc caacatgacc attcgcagca agcaacagct ggccattctg cgtgtgtacg 540
agaactgcat cgtgatggag agcatccatt atccggacga agtgcgtagc gcagcacaag 600
ttccgggtgt tccggaccag agcaacgtga acgacaaaga gctgcagacc gcaattactt 660
taattgatga gctgaccgcc aagttcgagc cggaaaaata cgaggacacc taccgtcaag 720
ctttactgca gcgcgtgaac gataagctgg aaaacaagga aaccgcagtg accccggata 780
aagcaccgcc gcgcgaagat gttatcgatc tggtgagtgc tttacaagct agcattgatc 840
gtacccgtcg cccgaatcgt gaaacacccg ctgcagcacc ggcacaagct gcagaaccga 900
agggtgccgg tgacaaaaaa cagaaaacca cccgcaaaaa agcaagcggc accagctaaa 960
agccgagacc tcctgtgtga aa 982
<210> 4
<211> 1072
<212> DNA
<213> 人工序列
<400> 4
cccagtcacg acggtctcaa aaaatggccc atatgatctg gaaaggcgcc attagttttg 60
gtttagttca cgtgccggtt cagctgtatc cggccacccg tagcgagaaa gtgggcttca 120
atttactgga caaacgcacc atcgatccgg tgggttataa acagatcaat aaacgtaccg 180
gtaaagacgt gacccgcgat aacattgtgc gcggttttga atatgaaaaa gataaatatg 240
tggtgctgac cgatgaagaa atccgcgccg ccaatccgga aagtacccag accgtggata 300
ttctggcctt cgttgatgca ccggacatca gctttctgta tttagatacc ccgtactttc 360
tgacaccgga ccgcaaaggc gaaaaagtgt acgcactgct gcgtgaggcc atgaaaagta 420
gcggcaaagt tggtgtggcc agcgttgttc tgcacaacaa acagcatctg gccgctttaa 480
ttcccgttgg tccggtttta gctttaaata cactgcgctg ggcagaagaa gtgcgtgact 540
ttgatgagtt taaactgccg gccgagggtg caaaagccgc tggtgttagc gcccgcgaac 600
tggacatggc ccagaaactg atcgatgaca tgagcgacac ttgggatccg agtaagtatc 660
acgacacctt tcgcgacgac atcatggctt tagttgatcg taaggttcgc gagggcaaaa 720
ccgaagagat caccgatatt gaagccccgc gtgaggcacg tcaaagcgca gatattctgg 780
atttaagcga tctgctgaag cgttctttag gtcgcggcaa aaataaaccg gccagcggca 840
gtcgcaaacg tgccgcagat gatgaagccg acgacggcaa tgccgatgca gaagatgatg 900
gcggtagcac cccggcacgc aagaaacctc gcacagcccg cagtaccggt agcgcacgta 960
caagccgtag cagcagcggc agtagtagcg gtggtcgcgc agcaaccaaa agcacaaccg 1020
ccgcacgcaa acgtcgtgca gcagcctaaa agccgagacc tcctgtgtga aa 1072
<210> 5
<211> 985
<212> DNA
<213> 人工序列
<400> 5
cccagtcacg acggtctcaa aaaatgcgca gcatctggaa aggcagtatc gcattcggtt 60
tagttaacgt gccggtgaaa gtttacagcg ccaccgagga tcacgacatc aagttccacc 120
aagttcatgc caaagacaat ggccgcatcc gctataaacg cgtgtgcgaa gtgtgcggcg 180
aagtggtgga atttcgcgat attaataaag cctatgaaag cgacgacggt cagatggtgg 240
tgattaccga cgaggatatt gctactttac cggaagaacg tagtcgcgag attgaggtgg 300
tggagtttat cccggccgaa caactggatc cgctgatgta cgataagagc tactttctgg 360
agccggatag caaaagcagc aagagctacg tgctgctggc aaaaacttta gccgaaactg 420
aacgcgttgc cattgtgcac ttcagcttac gcaataaaac ccgtttagca gcactgcgcg 480
ttaaggattt cagcaagcgc aacgtgatgg tgatccatac tttactgtgg ccggatgaaa 540
ttcgtgaccc ggattttccg gtgctggaca aggaagtgga gatcaaaccg gccgaactga 600
agatggccgg ccaagttgtg gaaagcatga ccgacgattt ccacccggac cagtttcgcg 660
atgattatca agctcagctg tatgagctgg ttcaagccaa actggaaggc ggcgaagcat 720
tcagtgtgga agaacagccg gccgatctgg atgaaaccga ggatgtttct gatctgctgg 780
ccaagctgga agccagcgtg aaagcccgta aaggcggtgg tagcgcaaaa agcgataagg 840
acagcgacga ggatagcgat aaggatagcg atgacgagga agcaaagccg gccaaaaagg 900
caccggctaa aaaagcagca gccaagaaag ccccggctaa aaaagccgcc gccaaaaaat 960
aaaagccgag acctcctgtg tgaaa 985
<210> 6
<211> 1039
<212> DNA
<213> 人工序列
<400> 6
cccagtcacg acggtctcaa aaaatgcgcg caatttggaa aggcgccgtt agctttggtt 60
tagttagcat tggcgtgaaa gtgtacagcg ccaccgagga aaaggacatc cgtttccacc 120
aagttcatcg tgaagatggc ggccgcatcc gctataagcg cacatgtagc gtgtgcggcg 180
aagaggttac ctacgacgac atcgccaaag gctatgacat tggcggtggt gagatggtga 240
ttttaaccga cgaggatttt gcagatctgc cgctgagcac cagtcatgcc atcgatgtgc 300
tggaattcgt gccggccgag caagtggacc cgattttata caataaggcc tactttttag 360
agccggaggg cagcgcaacc aaaccgtacg ttctgctgcg tgacgcttta agcgatagcg 420
aacgcgtggc cattgtgaag gttgcactgc gtcagcgcga acagttagcc actttacgcg 480
ttcgtgaggg tgtgctgctg ctgaacacaa tgctgtggcc ggatgaaatt cgccgcccgg 540
atttcggctt tctggatgag gatctgaagg tgcgtccgcc ggaactggca atggcaagct 600
ctttaatcga tagcatggct ggtgaatttg aaccggatgc cttcaccgat gactatcgcg 660
ccgctttaca agaagttatt gacgcaaaag tggaaggccg tgaagttgtg cagccggaag 720
aagaagaggc cgcacccgct gccgcagttg atctgatggc cgcactgaaa gccagcgttg 780
aacgtgcacg tgcagcccgc ggtgaagcac ctagtggtgg cggtgccgaa ccgacaccga 840
ttagcagcgc acgcagcgct aaaaaagctg ccaaaaaagc ccccgctaaa aaggccgaac 900
cggccaaaaa gaccaccgcc aaaaaggcac cggcaaagaa aaccgcagcc aagaaagccg 960
agccggctaa gaaaactgcc gccaaaaaga ctcccgctaa gaaaaagacc gcctaaaagc 1020
cgagacctcc tgtgtgaaa 1039
<210> 7
<211> 1009
<212> DNA
<213> 人工序列
<400> 7
cccagtcacg acggtctcaa aaaatgcgca gtatttggaa gggtagcatt gccttcggtt 60
tagtgaatgt tccggtgaag gtgtatagcg cccagcaaga tcacgacgtg aagttccacc 120
aagttcacgc caaagataat ggccgcatcc gctataagcg tgtgtgcgaa atcgacggtg 180
aagaagttga gtatcgcgat attgcccgcg cctatgaaag cgacgatggt cagaccgtga 240
tcatcacaga tgaggacatc gccacactgc cggaagagcg tagtcgcgag atcgaggtgc 300
tggaatttgt tccggccgcc gacattgacc cgatgatgta cgatcgcagc tactttttag 360
agccggaagg taaaagcagc aagagctacg tgctgctgac caaaacttta aaggaaaccg 420
atcgcgttgc catcgttcac tttgctttac gcaataagac acgtctggca gcactgcgcg 480
tgcaagattt cagcaagcgc gatgtgatgg tgatccagac tttactgtgg ccggatgaaa 540
tccgtgatcc ggatttcccg gttctggaca aagaagtgga tattaaaccg gcagaactga 600
aaatggccac acaagttgtg gacagcatga ccgacgactt taacccggat cgctatcacg 660
acgactatca agaacagctg cgcgaactga ttcaagctaa actggaaggc ggtgaagcct 720
ttacaacaga ggaacagccg caagaactgg acgaaaccga ggatgtttct gatctgctgg 780
caaaactgga agccagcgtt aaagcacgcc gcgaaggtcg tggtggtagc aaaagcagcg 840
acgacgacga taaacccgcc aaaaaagctc ccgctaagaa atctgccgct aagaaaactg 900
ccgccaagaa aactccggct aaaaaagctg ccaagaagag taccgccaaa aagagtccgg 960
ccaagaagag cgcagccaaa aaataaaagc cgagacctcc tgtgtgaaa 1009
<210> 8
<211> 1033
<212> DNA
<213> 人工序列
<400> 8
cccagtcacg acggtctcaa aaaatgaatc gtgcagtgcg ccataccggt ctgatgcgca 60
gcatctggaa aggtagcatc gcatttggtt tagtgaatgt gccggtgaaa gtgtacagcg 120
ccaccgaaga tcacgatatc aaatttcatc aagttcatgc caaggataac ggccgcatcc 180
gttacaaacg tgtgtgcgag gtgtgcggcg aagtggtgga atatcgtgat atcaataaag 240
cctttgaaag tgatgacggc cagatggtgg tgattaccga tgaggacatc gcaactttac 300
ccgaagaacg cagccgtgag attgaagtgg tggagttcat cccggcagag caactggatc 360
cgctgatgta cgacaagagc tacttcttag agccggacag caagagcagc aagagttatg 420
tgctgctggc caaaacctta gccgaaaccg accgcatcgc aatcgtgcac ttttctttac 480
gcaataaaag ccgtttagca gctttacgcg tgaaagactt cagcaagcgc gacgtgatga 540
tgattcacac tttactgtgg ccggatgaga tccgcgaccc ggattttccg attttagata 600
aagaagttca gatcaaaccg gccgagctga aaatggctgg tcaagttgtg gagagcatga 660
ccgacgactt caagcccgat ctgtaccacg atgactacca agaacagtta cgtgaactgg 720
tgcaagctaa actggaaggt ggcgaagcat tcagcgtgga agaacagccg gccgaactgg 780
atgaaggtac cgaggacgtg agcgatctgt tagccaagct ggaagcaagc gtgaaagccc 840
gtaagggcgg caaaagcgat agcaaggacg atagcgacag cgagagcgac agcaaagaga 900
gcaaaagcga cagtaagccg gccaaaaaag cccccgctaa gaaagccgca gccaagaaaa 960
gcaccgctaa aaaagccccg gctaaaaaag cagccgccaa gaaatcttaa aagccgagac 1020
ctcctgtgtg aaa 1033
<210> 9
<211> 868
<212> DNA
<213> 人工序列
<400> 9
cccagtcacg acggtctcaa aaaatgcgtg ccatttggac cggcagcatt gcatttggtt 60
tagtgaatgt gccggtgaaa gtttacagcg ccaccgcaga tcacgatatt cgtttccacc 120
aagttcatgc caaggataat ggccgcatcc gctataaacg cgtttgcgag gcatgtggcg 180
aagtggtgga ttatcgcgat ctggcacgtg cctatgagag cggtgatggc cagatggtgg 240
ccattaccga tgacgacatt gcctctttac cggaagagcg tagccgcgaa attgaggtgc 300
tggagttcgt tccggccgcc gatgtggacc cgatgatgtt cgaccgcagc tattttttag 360
aaccggacag caagagcagc aaaagctacg tgttactggc caaaacttta gccgaaaccg 420
atcgtatggc catcgtgcat tttactttac gcaataaaac ccgtttagcc gctttacgcg 480
tgaaagactt cggcaaacgt gaagtgatga tggtgcacac cttactgtgg ccggatgaga 540
ttcgcgatcc ggattttccg gtgctggacc agaaggtgga aatcaaaccg gccgagctga 600
aaatggctgg tcaagttgtg gatagcatgg cagacgactt taacccggat cgctatcacg 660
acacctatca agaacagctg caagaactga ttgatacaaa gctggagggt ggccaagctt 720
ttaccgccga agatcagccg cgtttactgg atgaaccgga ggatgtgagt gatctgctgg 780
ctaaactgga agcaagcgtg aaggcccgca gcaaagcaaa cagcaatgtg cctaccccgc 840
cgtaaaagcc gagacctcct gtgtgaaa 868
<210> 10
<211> 1000
<212> DNA
<213> 人工序列
<400> 10
cccagtcacg acggtctcaa aaaatgcgca gcatctggaa aggcagcgtg gcctttggtt 60
tagttaatgt gccggtgaaa ctgtacagcg caaccgaaga gaaggacatc cgctttcatc 120
aagttcatgc ccaagatggt ggccgcatca aatataaacg cgtgtgcgat ctggacggcg 180
aggaagtgcc gtatgccgat attgccaaag cctacgaaag cgacgatggt cgcacaatca 240
tgctgaccga tgaggatttt gctcagctgc cggccagcag cagccgcgaa atcgatgttg 300
tgagctttgt gcctagtgac caagttgatc ccgttctgta tgataaaacc tactatctgg 360
agcccgctag caccagcacc aaagcctatg tgttactgcg ccagacttta gaacagaccg 420
accgtattgc catcgtgaac ttcgcactgc gccagaaaac ccgtttagca gctttacgtg 480
ttcgtgatga tgtgctggtg atccagacac tgctgtggcc ggatgaagtg cgcgccgcag 540
aatttgcctc tttagaggaa agcgtgagca ttaaaccggc cgaactgaag atggccagca 600
tgctggtgga tagtttcgcc gatgacttcc acccggagga ctataccgat gagtatcgcg 660
aagagctgca gcaactgatc gaagccaaac tggaaggcgg cgaagccttt gaaactccgg 720
aaaaaccgga tgaaggtgag gatgctgaag tggttgatct gctggcagct ctgcagcgca 780
gcgttgagcg ccataaaaaa gctggtgcaa gcaccggcga tgatagtggc gatggcgccg 840
atgatagtcc gaaaaagagc ccgcgcacca gcagcgcaaa aacccgcacc aaagccaccg 900
atgaaaccgg tgaccaagat aaagacgagg caaaaccgcc gacacgccgt cgtagtccgg 960
cacgtaaaac cggttaaaag ccgagacctc ctgtgtgaaa 1000
<210> 11
<211> 1069
<212> DNA
<213> 人工序列
<400> 11
cccagtcacg acggtctcaa aaaatggtta atccggtgtg ggtgggcaca ctgatgtttg 60
gtcgcgtgcc ggtgggtgtg cgtttatata gcgcacgtga gcgtcgtggc ccggttctgc 120
accagtttga acgcggtacc gccgatcgca ttcgttatgt gcgcgtgaac gaacgtaccg 180
gcgaagaagt ggctggtgaa gatgtggtgc gtggtgcacg taccggcgtg gaggatgagt 240
acgttgtgct ggagccggaa gaactggaag aaattttacc gcatggtagc cgcacaatgg 300
aactgaccgg ctttttaagt caaggtgccg ttgacgcact gtggtacgcc agtacatact 360
atgtggcacc gcgtgccgcc gcagatgcca aagcctatca gctgctgtat accgctttag 420
aacagacccg ccgtaccggt gtggccacca tcgttctgcg cgatcgcgaa taccccgttc 480
tgatcgaacc gaatcgcggt gtgctgagcg ccagtacact gtggtggccg gatgaggttc 540
gcgaaccgga tgatgtgatg ccgcccgttg cccatgccgc actggccaag agcgaactgg 600
aactggcccg cgaactggtg cgtagtctga gcattgagtg ggatccggaa gattacagcg 660
acagctacgg ccagcgtctg acagaactgg tgcgcgcaaa agcacgtggc cgcaccttca 720
cccatcgtcc ggagcaagct gtgccgcccg aagatgccga tggtctgggt gaagcactgc 780
gccagtcttt acccgctcaa cgcacacgcg gtgcacgtag tcgtggccct cgtgcaagta 840
ccggtgcaga aggtgccggt cgcgcacgtg aacctcgtgg taccggtgca cgtggcgcac 900
gtgtggaacg tcgcggtgaa ggtcgcgcca ccaaacgcga actgctgcaa cgcgcaagcg 960
agctggatgt tcccggtcgt agcaaaatga gccgtgagca gctggaagaa gccgttggtt 1020
taaatggcgc cgaagcccgt cgttaaaagc cgagacctcc tgtgtgaaa 1069
<210> 12
<211> 1051
<212> DNA
<213> 人工序列
<400> 12
cccagtcacg acggtctcaa aaaatggcac atatgatctg gaaaggcgcc atcagctttg 60
gtctggtgca tgtgccggtg cagctgtacc ccgctaccaa aagcgagaag gtgggcttta 120
atctgctgga caaacgcacc atcgacccga tcggctataa gcagatcaac aaacgcaccg 180
gcaaagacgt gacccgtgag aatatcgtgc gcggctttga atatgaaaaa gatcattatg 240
tggttctgag cgacgatgag atccgcagcg ccaatccgga gagcacccag accgtggaca 300
ttctggcctt tgtggatgcc accgatatca gctttttata tttagacaca ccgtattttt 360
taacaccgga tcgcaagggt gaaaaagtgt acgctttact gcgcgaagcc atgacagcca 420
gcggtaaaat cggtgtggcc agcgtggtgc tgcataataa acagcattta gccgcactga 480
ttcctctggg cccgatgctg gctttaaata ctttacgttg ggccgatgag gttcgcggtc 540
tggacgagtt taaagtgccg ccggaaggca tgaaagcagc cggtgtgagc gccaaagagc 600
tggatatggc taaaaaactg atttatgata tgtctgaaac ttgggatccg atgcagtatc 660
atgatacctt ccgcgacgac atcatggcac tggtggaacg caagattcaa gctggtaaaa 720
ccgaggaagt gaccgaagtg gaagccccgc acgaaagccg taaaagcgcc gacattttag 780
atctgagcga tctgctgaaa cgttctttag gccgtggcaa aggtaaacaa gctgcaactg 840
gtcgcaaacg cgctgccgat gaggatgagg atcagaccga tagcgaagcc gacgaggaac 900
ccgctgcacc ggcccgtaaa cgtgcacgtg caaccagcac cgcccgtagc cgtagcggta 960
gtggtggtag cgcccgcgtt accagcaaaa caaccgccac aagccgcaaa cgccgtgcag 1020
cagcctaaaa gccgagacct cctgtgtgaa a 1051
<210> 13
<211> 1177
<212> DNA
<213> 人工序列
<400> 13
cccagtcacg acggtctcaa aaaatgcgcg ccatttggaa aggtgccatc gcctttggtt 60
tagtgaacgt gccggtgaaa gtgtacagtg caaccgagga ccacgatatc tctttacacc 120
aagttcacaa cgccgacggt ggtcgtatcc gctatcagcg ccgctgcgag gtgtgcagcc 180
aagtgattga ttacagcgac atcgagaagg catacgaaga ggatggtaaa accgtggtgt 240
taagcaagga tgagctgcaa gctattccgg ccgaaaacag ccacgaaatc gaggtggtgc 300
aatttgtgcc tagcgaacag ctggaaccga tgatgttcga gaagagctat tatctggaac 360
cggacagcaa gagcccgaaa gcctacgttc tgctgcgtcg cgctttagag gataccgatc 420
gcgtggccat tgtgcagttc gctttacgtg agaaaacccg tctgggcgct ttacgcatca 480
aagacgacgt gctggtgctg cagtctttac tgtggccgga tgaagttcgt gaggccaatt 540
tcccgtcttt agatgtgagc atcaagatca gcccgcaaga acgtgatatg agcgccgcac 600
tggttgaaag catggccgcc gacttcgacc cggaacactt caccgatgat tatcaagttc 660
agctgcgcca gctgatcgaa gccaaactgg aacaaggtga tgcactggac accgatgaaa 720
cttttggcgt tgaagccggt gagggtggca aaggtgaggt tatcgattta atggaagctt 780
taaaacgctc tttagatcgc aaacgcggtg gtggtagcgg tacagctggt agtggcagcg 840
gtgaagaagc agcagacagc gacgatgaag aagaaggcaa accggcccct aaacgtgcaa 900
ccgctggtaa aaccgccgca gccaaaagcg atggtaccaa gagtaccgcc gcacgtagca 960
ccgccgcaaa aactggtacc ggcaagaccg ccaccaagtc taccagcaaa gccgcagata 1020
ccaaaaccgg cgcagccaaa accaccgccg ccaaaagcac cgccaagtct accgccggca 1080
aaaccgcaga taaaccggca gccaagacca cagctggtaa agcaaccggc acccgcgcac 1140
gtaaaccggc ctaaaagccg agacctcctg tgtgaaa 1177
<210> 14
<211> 1884
<212> DNA
<213> 人工序列
<400> 14
cccagtcacg acgaagacgc aaaaatggca ttcaccatgc agccggtgtt aacaagcagc 60
ccgcctatcg gtgcagagtg gcgctatgag gtgaagtacg acggttaccg ctgcattctg 120
cgtattcata gcagcggcgt gactttaacc agtcgtaacg gtgttgagct gagcagtaca 180
ttcccggaga tcacccagtt cgccaaaacc gcatttcagc atctggaaaa ggaactgccg 240
ctgactttag atggtgaaat tgtgtgtctg gtgaacccgt gtcgcgcaga tttcgagcat 300
ctgcaagttc gtggtcgttt aaagcgcccg gataaaatcc aagaaagtgc caacgcccgc 360
ccgtgttgtt ttctggcctt cgatttactg gaacgtagcg gcgaagatgt gactttactg 420
agctatttag accgcaagaa atctctgcgt gagctgatca gcgccgcaaa actgccggcc 480
agccccgatc cgtacgccaa ggaaaccatc caaagcatcc cgtgctacga ccatttcgat 540
cagctgtggg agatggtgat caagtacgac ggcgaaggca tcgtggcaaa gaaaaccaac 600
agcaagtggc tggaaaagaa acgcagcagc gattggctga aatacaaaaa ctttaaacaa 660
gcttacgttt gtattaccgg ctttaatcct aataatggct ttttaaccgt gagcgttctg 720
aaaaacggca tcatgacacc gattgcaagc gtgagtcacg gcatgcgcga tgaggagaaa 780
agtgcaattc gcgagattat ggaacagcac ggtcaccaga caccgagcgg cgagttcact 840
ttagaaccga gtatttgtgc cgcagtgcag tatttaacca ttctgcaagg taccttacgt 900
gaagtgagct tcatcggctt tgagttccag atggactgga cagagtgcac ctatgcccaa 960
gttatccgcc atagcaaacc ggtgcaccct aagctgcagt ttaccagtct ggataagatt 1020
atctttgaga aaaataagaa aaccaaagaa gatttcattc aatatatgat cgaggtgagt 1080
gattatctgc tgccgtttct gaagaatcgc gccgtgaccg tgatccgtta tccgcacggc 1140
agtcgcagcg aaagcttttt tcagaagaac aaaccggact acgcccccga ttttgtgcag 1200
agcttttacg atggcagcca cgagcacatc gtttgcgaag atatgagcac actgctgtgg 1260
ctgtgcaatc agctggcact ggagttccat gtgccgtttc agacaatcaa gagccgccgt 1320
ccggcagaga ttgttatcga tttagacccg cctagccgcg acgatttttt aatggccgtg 1380
caagctgcca atgagctgaa acgtctgctg gatagcttcg gtatcaccag ttacccgaag 1440
ctgagcggta acaagggcat ccagctgtat atccctctga gcccggaggc atttacctac 1500
gaagaaaccc gccagttcac acagctgatt gccgagtact gcaccaacgc atttcccgaa 1560
ctgttcacaa ccgagcgttt aatcaaaaac cgtcattgca aactgtatct ggattattta 1620
cagcacgccg aaggcaaaac cattatctgc ccgtacagca cccgtggtaa tgagttaggt 1680
accgtggccg caccgctgta ttggcatgaa gttcagagta gtctgacccc ggctttattc 1740
acaattgaca ccgttattga tcgtattaaa aaacaaggtt gcccgttttt tgatttctat 1800
cgcaacccgc aagatgaacc gctgagcgcc attctgcacc agttaaagaa gaaatcttaa 1860
cacaaggtct tctcctgtgt gaaa 1884
<210> 15
<211> 1884
<212> DNA
<213> 人工序列
<400> 15
cccagtcacg acgaagacgc aaaaatggtt ctgacaatgc agccgatttt aaccagcgag 60
ccccccgaag gtagtgaatg gcgttacgag gtgaagtacg acggtttccg ctgtttactg 120
cgtatcgacg aaagtggtgt tactttaaca agccgcaatg gtcagacttt aaccaaccag 180
ttcccggaaa ttaccgcatt cgccgcccgc tgcttccagc atatgaagga tcgttttccg 240
atcactttag acggtgagct ggtgtatctg atcaatccgt atcgcgccga ctttgaacat 300
ttacagattc gcggccgctt aaaacgtaca gaaagcatcg aaagcacagc cgatcgccgt 360
ccgtgtcgtt ttctggcctt tgatttactg gtgttagagg gcgccggtac cgtttcttta 420
ccgtatgtga aacgcaagcg cgcactgagc aaactgttca aagaggccaa tctgccggct 480
tgtccgcacc atctggcaga agaggccatc cagtacattc cggaacatac cgatttcgac 540
gctttatggg ataaagtggt gcgccatgat ggtgaaggcg ttgtggccaa acgcgccagt 600
agtggttggg cagagaacaa gcgtagcccg gactggcaaa aatacaaaca tatgaaaact 660
gctcatgttc tgctgaccgg ctttaaccct aagaacggct acgtgaccgc aagcgtgctg 720
aaagatggca ccgccattcc tattgccagc gtgagccatg gtatgcaagc tgaggaaaag 780
aatgcagtgc gcaccattat ggaaactcac ggcaaaaagc agaagagtgg tgaatatact 840
ttagagccga gcatttgcat gaccgtgcaa tatttaacca ttttacaaga tactttacgc 900
gaggtgagct ttgtgagctt ccaatttgaa atggattgga cagagtgcac ctaccagcaa 960
ctgattctgc gcagcaagac tttaccgccg aaactgcagt ttacctcttt agacaaaatt 1020
gtttttaaaa aacgcgaaaa aaccaaagca gatttcttaa gctacatggt gaaaatgagc 1080
gattttttaa tgccttttct gaaagaccgc gccgtgaccg ttatccgcta tccgcatggt 1140
gcacccggtg aaagtttctt ccagaaaaat aagccggact acaccccgga ctttgttagt 1200
agcgtgtttg acggcagcca cgaacacatc gtttgtagta gcattccgtc tttactgtgg 1260
ctggcaaacc agctggcttt agagtttcac gttccgtttc agaccgtgca tagcgaacgc 1320
ccggccgaaa tcgttattga tttagatccg cctagccgca acgatttccc gatggccgtg 1380
gaagcagcac acgttctgaa gcagctgttt gacagcttca gcatcaccag tttcccgaaa 1440
ctgagcggca acaagggcat tcagctgtac attcctctga gcccggaggc ctttacctac 1500
gaagaaaccc gcgcctttac catgctgatc gcagactact gtgttcgcac acgccccgat 1560
ttatttacaa ccgagcgctt catcaaaaac cgcaatggcc gtctgtatct ggactatctg 1620
cagcacgccg agggtaagac aattattgcc ccgtatagta cccgcggtaa cgaactgggc 1680
acagttgccg caccgctgta ctggagcgag gtgaacagct ctttaacccc cgatgactat 1740
actatcgaca cagtggtgaa ccgcgtgcgc accgaaggcg atccgttcta cgacttctat 1800
cgcaatccgc aagatggccc gctgagcatc gtgttagagc agattaagcg taaaagctaa 1860
cacaaggtct tctcctgtgt gaaa 1884
<210> 16
<211> 2553
<212> DNA
<213> 人工序列
<400> 16
cccagtcacg acgaagacgc aaaaatggcc ggcgcaaaac agcaagtgga ggtggaaggt 60
cgccgcatta ctttaaccaa tttagataag gtgttatatc cggccaccgg taccacaaaa 120
ggtgacgtta ttgcctatta cgcagccatc gccccgcaca tgattcctca tttacgtgat 180
cgtccggtga cccgtaaacg ctgggtggat ggtgttggca ccgatgaaca cccggccaaa 240
atgttttttc agaaggatct ggatgcccac acacccgaat gggttctgcg ccgtgcaatc 300
cagcatcgtg accatgcaaa cgactatccg ctggccaatg acgtggccac actgacttgg 360
ctgggccaga tcgcagcctt agaactgcat gtgcctcagt ggcgctttgg tcgtaccggt 420
gatgttcgtc gccccgatcg cttagtgctg gatctggatc cgggtccggg tgctggtctg 480
cccgaatgtg tggaagttgc caaagccgcc cgtgcaattc tgcgtgatat gggtttagaa 540
ccgtaccccg ttacaagcgg cagcaaaggc attcatctgt atgccgcact ggatggcagt 600
catgatgcag acgcaatcag cgaagttgcc catgaactgg cccgtgcttt agaagcagat 660
catccggatt tagtggttag cgatatgcgc aaagctttac gtgaaggtaa ggttctggtg 720
gactggagtc agaacaatcc ggccaaaaca accgtggccc cgtattcttt acgcggtcgt 780
agccgtccga cagttgcagt tccgcgtact tggcgtgagc tggcaagtcc gacactgcgt 840
catctggaac tggatgaagt ggttgcccgt atgcgcacac gtgaggatcc tttagccccg 900
gttgaagaag gccaccgtga atctttagaa ccgacacgcg aacgtttagc cggtttcgca 960
cataaggacg ccgatgcagc tggtgatcgt ctggccacct atcgcagtaa gcgcgacgcc 1020
gcaaaaacaa gcgagccggt gccggccgat gcaccggcac cgagcgatgg cagcagcttt 1080
gtgatccaag aacaccatgc acgcgcttta cattgggatt tccgtttaga gcatgatggc 1140
gttctggtga gctgggcttt acctaagggt gtgccgacag agcatggcac caatcattta 1200
gcagtgcaga cagaagatca tccgctggag tacggcagct tcgaaggcac cattccggcc 1260
ggcgaatatg gtggcggcga agttaccatc tgggacgctg gtacctttga gttagagaaa 1320
tggcgcgatg gccatgaagt gattgccaca ctgcatggcc gcggccatgg taccggcatt 1380
gatggtccgc gtcgctacgc actgatccat accggtggtc acggcaaggc agacgcaaat 1440
tggctgatcc atttaatgga accggcagat gccccggccg cacatcaccc gaaacccgct 1500
cgccccgctg cactggccaa agctggtggc cgcacacgtg ttggcgcccg tcgtaaaggt 1560
cgtgccgcct ttgccgcagc cccgatgtta gccacagccg caaccggcgc tggtttagat 1620
agcgatgagg aatgggcagt ggagatgaag tgggatggtt atcgtgccat tgcagcagtg 1680
gccgacggtc gtgccaccat tacaagccgt aatggtgtgg atttaaccgc cgcatttccg 1740
gaactggccg atctgccgga tcagctggca gccgacgccg ttctggatgg tgagattgtt 1800
gttctgggcg atggtggccg cccggatttt ggtttactgc agacccgttt aggtctgact 1860
ggtgaaaagg atattgcccg tgcccgcaaa gcagcaccgg tgcatttaat gctgttcgat 1920
gctttagcca ttggtgatcg cgtgctggtt ggcgaaccgt atcgcgaacg ccgcgcagca 1980
ctgttagatg cagttacaag ccccggtcgc ggccgcattc aagttccgcc ggcatttgat 2040
ggtgatctgg atggtgcttt agcaacaagt cgcgagctgg gtctggaagg cgttgttgcc 2100
aaacgcgttg acgcaccgta cgaaagcggt cgccgcagca gcgcttggat caaaatcaaa 2160
caccaccgtg cccaagaagt ggtggtgggt ggttggcgtc cgggtagcgg tagtcgtagc 2220
agcggtattg gctctttact ggttggtgtt ccgggtccgg atggtttaat gtatgccggc 2280
cgcgttggta ccggctttac agaacgcgat ctggccgacg cactgcgtcg tttccgccct 2340
ctggcccgta aaaccagccc gttcgccgat gttcccgctg ccgaagcacg tgatgcacac 2400
tggatcacac ctcgtttagt gggcgaagtt gaattcgcag agtggaccag caccggtcgt 2460
ttacgtcaag ctagttggcg cggctggcgt catgataaga gtccggacga ggtggttcgt 2520
gaggattaac acaaggtctt ctcctgtgtg aaa 2553
<210> 17
<211> 2595
<212> DNA
<213> 人工序列
<400> 17
cccagtcacg acgaagacgc aaaaatggca ctggagacat accgtaagaa gcgcgatttt 60
agcgttacac cggaacctca aggtcgtcgt gcccctaaag ctggtaacag ctttgtgatc 120
caaaaacatg atgcccgccg tttacactat gatttccgtc tggagatgga cggcgttctg 180
aaaagttggg ccgtgacaaa aggcccgagc ttaatccccg gtgaaaaacg tttagccgtg 240
cacgttgagg atcatccgct ggagtacggt ggtttcgaag gcacaattcc gaaaggcgaa 300
tacggtggtg gtaccgttat tttatgggac cgcggtacat ggacccctat cggcgatgca 360
cgccgcggct atgcaaaagg ccatctggat ttcgaattac atggcgagaa actgggcggt 420
agctggcatt tagttcgcat ggctggtaaa ccgcgcgaga aacgtgagaa ctggctgctg 480
attaagggtg atgacgatgc cgcccgcaca gaggatgacc cggacatttt agacgaacgc 540
ccggaaagta ttgccaccgg ccgtaagatc gaagatgttg ctggtgagga accgggttgg 600
agcagtaaaa ccggtcgtat ccgcaagcgt cgtggtggtc gcactggtgc cgcacccccc 660
gaagagcagc cggcaaccgt gagtgttccg gaaccgagca aaattaaggg cgcaaagaaa 720
gccgctttac cggatttcgt ggaaccgaca ctggccactt tagttagtag cgccccgagt 780
ggtcaacgct ggctgcacga gatcaaattc gatggctatc gtttacaagc tcgcgtggag 840
gctggtcgtg ttaaactgct gacccgtagc ggtttagatt ggacaaaaaa gttcggtaaa 900
gccatcgtta gtgctttagc agatttaccg gttggtaccg cactgatcga cggtgagtta 960
gtggttgaga caagcgctgg tgccagcgac ttcagtgaat tacaagctga tctgagtgag 1020
ggccgtagcg atcgcttccg tttatacgtt ttcgatttac tgcatttaga tggttatgat 1080
ctgcgcgatg tggcaagcat ccagcgcaag gaactgctgg agaagattat cggcagcggc 1140
agcggcatca ttagctacag tggtcacttt gaagaagatg gtccgctggt tctgcgtcat 1200
gcttgtcgtc tgtctttaga aggtgtggtg agtaaactgc gcgatgcacc ttaccgtgct 1260
ggtcgtagca agaactgggt gaaaagcaag tgcagcgccc gccaagaatt tgtggtggcc 1320
ggctatgtgc ctagcaccac cagccgtaat gcaattggca gtctggtgct gggcgtgtat 1380
gacgatggca aactgcacca cgttggccgt gtgggtaccg gctacacagc agccgttgcc 1440
gaaggtttat tcaagaagct ggaacgcatc cgtattccga gtagcccgtt cgatgaacgt 1500
ttaagcgccg aagaaactcg ccaagttcgt tatgtgcgtc cggagctggt tgccgagatt 1560
gaattccgtg cttggacagc agatggcaat ttacgccacg caagcttccg tggcttacgc 1620
gaggacaagc cggcaaagga gattgtgcgt gaaactccga aaacaaaagc agccgcaaaa 1680
ccgcagcgtc gtaccgtgaa gctgacccac ccggatcgtt tatattggcc ggaccaaggt 1740
gttaccaaag agggtttagc cgactactat accgaagtgt ggcgctacgc cagcccttat 1800
ctggtgggtc gcgcactggc actgttacgt tgtcctagtg gcattagcgg cgagcaattc 1860
ttccagaaac atgcatggaa aggtttaaac ccgaacatcg tgctggtgca tgatccgaag 1920
gatcctccgg acgaacgtct gattagcatc aatgatttag acggcttaat tggcttagtg 1980
cagagcgcag ccttagaaat ccatccgtgg ggcagtatgg ttagcgactg ggagcgtccg 2040
gataccatta tcatggatct ggatccgggc gaggatgttt cttgggaggc agtgattgca 2100
gcagccgtgg aaacccgcga tcgtttaaaa gatgccggtt tagtgccgtt tattaagacc 2160
agtggcggca aaggtctgca cgtggttgca ccgctgaagc cgaaggcaga gtggccggca 2220
gcaaaagcct ttaccaaggc catcgcagat gccatggcag ccgatagccc gggtcgctat 2280
gttagtacca tcaccaaaag caaacgccgc ggcaagattc tggtggatta tttacgcaat 2340
cagcgtggtg ccaccgcagt tgcaccttat agtacccgcg cccgtcccgg tgcagcagtg 2400
agtatgcctc tggcatggga tgaactgggc ccgggtattg gcccggcata ttttaccgtg 2460
gagaacaccc cgacacgttt agcatcttta agcagtgatc cgtggcaaga ctttcgtgcc 2520
gccgccgtgc cgattgaaga tcgcgccaat cgtcgcgaaa aagccgccta acacaaggtc 2580
ttctcctgtg tgaaa 2595
<210> 18
<211> 2325
<212> DNA
<213> 人工序列
<400> 18
cccagtcacg acgaagacgc aaaaatggaa cgctatgaac gtgtgcgttt aaccaacccc 60
gataaggttc tgtaccccgc tagcagcacc accaaagcag aggtgtttga ttattatctg 120
agcatcgccg aagttatgct gccgcatatt gccggtcgtc cggttacccg taaacgttgg 180
ccgaatggtg tggcagaagc cagcttcttc gaaaagcaac tggccagtag tgcaccggat 240
tggctggaac gtggcaccat tgtgcataag agcggcacca ccacctaccc tatcgttaac 300
acccgcgaag gcttagcatg gatcgcccag caagcttctt tagagctgca tgttccgcaa 360
tggcgcttta gcagcgatgg cagccaaggt ccggcaaccc gtatcgtgtt cgatttagat 420
ccgggtgaag gcgttacaat gcctcagctg tgcgaggttg cccaagccgt gcgcgaactg 480
atgagcgaca tcggcttaat gacctatccg ctgaccagtg gtagcaaagg tttacattta 540
tacgttccgc tggcagaccc tatcagcagc cgcggtgcaa gcgttctggc caagcgcgtt 600
gcagtgcagc tggagcaagc tatgccgaag ctggttaccg caaccatgac ccgcagtctg 660
cgcgcccaga aagtgttttt agactggagt cagaataatg cagccaagac cacaatcgca 720
ccgtattctt tacgcggtcg tgattacccg accgttgcag caccgcgtac atgggatgaa 780
attggcgacc cggatttacg ccatctgcgt ttcgacgaag ttctgcagcg catcagtgac 840
gatggcgatt tattagctgg tttagatgac gatgccccgg ttgccgataa actgaccacc 900
tatcgcagca tgcgcgatgc aacaaaaacc ccggaacccg ttccgcgcga tatcccggtt 960
cgcggtaaca acgatcgttt cgttattcaa gaacatcacg cacgtcgttt acattatgat 1020
ctgcgtctgg aacgtgatgg cgtgctggtt agctgggcag ttccgaaaaa tttaccggac 1080
accaccgccg ttaatcattt agccgtgcac acagaagatc accctatcga gtatttaacc 1140
tttcacggca caattccgaa gggcgagtat ggtgctggta atatggtgat ctgggacacc 1200
ggtacctatg aggccgagaa attccgcgtt ccggccgatc cggatgacag cgatgcaccg 1260
aagggtgaag ttatcttcac tttaaatggt aaccgcatcg atggccgtta cgcactgatc 1320
cagaccgaag gtaagaactg gctggcacat cgcatgaagg atcagagcag cgccgcaccc 1380
gaaccgaaag acttcgcccc gatgttagca accgaaggca gtgtggccaa gctgaaggcc 1440
acccagtggg ccttcgaagg taaatgggac ggctaccgct tactggtgga ggccgaacat 1500
ggtcgcttac aactgcgtag tcgccgcggc cgtgatgtta ccgccgagta tccgcagttt 1560
gaagcactgg ccgccgatct ggccgatcat catgtggtgc tggatggtga agccgttgcc 1620
ttagacgatc acggcatgcc gagcttccgc gagatgcaga accgcgcacg cagtacacgt 1680
gttgagttct gggcctttga tattttatgg ctggatggtc gctctttact gcgcgcaaaa 1740
tacacagacc gccgcaaact gctggaagca ctggcagctg gtggtggtct gattgtgccg 1800
gaacagctgg ctggtgatgg tccggaggcc atggaacacg cacgtgagca caaattcgag 1860
ggcgtggtgg ctaaaaaacg cgatagcacc taccagcccg gtcgtcgtag tgccagctgg 1920
atcaaagaca aaatctggaa cacccaagaa gttgttatcg gcggttggcg ccaaggcgaa 1980
ggtggccgta gcagtggcat tggcgcttta gttctgggtg tgccgggtcc tcatggttta 2040
caatttgctg gtcgtgttgg caccggcttc accgaaaagg aactgaccaa actgaaaggt 2100
atgctgaaac cgctgcacac caaagagagc ccgtttgata agccgctgcc gaaactggat 2160
gccaaaggcg tgaccttcgt gcgccccgaa ctggttggcg aggtgcgcta tagtgaacgt 2220
acaaccgacc accgtttacg ccagcctagt tggcgtggtc tgcgtccgga caaagcaccg 2280
gacgaagtgg tgtgggagta acacaaggtc ttctcctgtg tgaaa 2325
<210> 19
<211> 2316
<212> DNA
<213> 人工序列
<400> 19
cccagtcacg acgaagacgc aaaaatggaa cgctacgaac gtgtgcgttt aaccaacccc 60
gataaggtgc tgtaccccgc taccggcacc accaaagccg aagtgtttga ttattattta 120
agcattgcac aagttatggt gccgcacatc gccggtcgtc cggttacacg taaacgctgg 180
ccgaatggcg tggccgaaga agcattcttt gagaagcagc tggccagcag tgccccgagt 240
tggttagaac gcggcagcat tacccataaa agcggcacca ccacctaccc tatcattaac 300
acccgcgaag gtctggcatg ggttgcccag caagcttctt tagaagtgca tgtgccgcag 360
tggcgctttg aagatggtga ccaaggtccg gcaacccgta tcgttttcga tttagacccg 420
ggtgagggcg tgaccatgac ccagctgtgc gaaatcgccc acgaagtgcg cgctttaatg 480
accgatctgg atttagagac atacccgctg acaagcggca gcaaaggttt acatctgtac 540
gttccgctgg cagaaccgat tagcagccgt ggtgcaagcg ttctggcacg ccgtgtggca 600
cagcagctgg aacaagctat gccgaaactg gttaccgcca ccatgaccaa atctttacgt 660
gctggtaagg tgtttctgga ttggagccag aacaacgcag caaaaaccac catcgccccg 720
tatagtttac gcggtcgtga ccatcctaca gtggccgccc ctcgcacttg ggacgaaatt 780
gccgatccgg aactgcgcca tttacgcttt gatgaggtgc tggaccgtct ggacgaatac 840
ggtgatctgc tggcacctct ggacgcagac gccccgattg ccgataagct gacaacctac 900
cgtagtatgc gcgacgcaag taaaaccccg gaaccggtgc cgaaagaaat tccgaaaact 960
ggtaataatg acaaattcgt gatccaagaa catcatgccc gtcgtttaca ctacgactta 1020
cgtttagagc gcgacggcgt gctggttagt ttcgccgtgc ctaaaaattt accggaaacc 1080
accgcagaaa accgtttagc cgttcacacc gaagatcacc cgattgaata tttagccttc 1140
cacggtagca tccctaaagg cgagtatggt gccggcgata tggtgatttg ggacagcggc 1200
agttatgaaa ccgagaaatt ccgcgtgccg gaagaactgg ataacccgga cgacagccac 1260
ggtgaaatca tcgtgacttt acacggcgaa aaggttgacg gccgttacgc tttaattcaa 1320
accaagggca aaaactggct ggcccaccgt atgaaagacc agaaaaacgc ccgtccggag 1380
gattttgccc ctatgctggc caccgaaggc agtgtggcca aatacaaggc caaacaatgg 1440
gccttcgagg gtaaatggga tggctaccgt gtgattatcg acgccgatca tggtcagctg 1500
cagatccgta gccgtaccgg ccgtgaagtt accggcgagt atccgcagtt taaagcttta 1560
gccgcagatc tggcagagca tcacgttgtt ctggacggcg aggccgttgc cttagatgag 1620
agcggcgtgc cgagttttgg ccagatgcag aatcgcgccc gtagcacccg tgtggagttt 1680
tgggccttcg atattttatg gttagacggt cgttctttac tgcgtgcaaa gtatagcgat 1740
cgccgtaaaa ttttagaagc tttagcagac ggtggtggtc tgattgtgcc cgatcaactg 1800
ccgggtgacg gccccgaagc catggaacac gtgcgtaaaa agcgcttcga gggtgtggtt 1860
gccaaaaagt gggatagcac ctaccagccc ggtcgtcgca gcagcagctg gatcaaagat 1920
aaaatttgga atacccaaga agttgttatt ggcggttggc gtcaaggtga gggtggtcgc 1980
agcagtggta ttggcgcttt agttctgggc attccgggtc ccgaaggttt acagttcgtg 2040
ggtcgtgttg gcaccggttt taccgaaaaa gaactgagta agctgaaaga tatgctgaag 2100
ccgctgcata ccgatgaaag cccgttcaac gcaccgctgc cgaaagtgga tgcccgtggc 2160
gtgacctttg tgcgccccga actggtgggc gaagtgcgtt atagcgagcg caccagcgat 2220
ggtcgtttac gtcaacctag ttggcgtggt ttacgcccgg ataagacacc ggatgaggtg 2280
gtttgggaat aacacaaggt cttctcctgt gtgaaa 2316
<210> 20
<211> 2328
<212> DNA
<213> 人工序列
<400> 20
cccagtcacg acgaagacgc aaaaatgggc agcgcaagcg aacagcgcgt taccttaacc 60
aacgccgaca aagtgctgta tccggcaacc ggtaccacca aaagcgacat tttcgactac 120
tatgctggtg tggcagaggt gatgctgggt catattgccg gtcgcccggc aacccgtaaa 180
cgctggccga atggcgttga tcagccggca tttttcgaga agcagctggc tttaagtgca 240
cccccttggc tgagccgtgc caccgttgca caccgtagtg gtaccaccac ctaccctatc 300
attgatagcg ccaccggtct ggcttggatt gcacagcaag ccgcactgga agtgcacgtg 360
ccgcagtggc gtttcgtggc cgaaccgggt agtggcgaat taaatcccgg tccggctacc 420
cgtttagtgt tcgatctgga tccgggcgag ggtgtgatga tggcacagct ggccgaagtt 480
gcacgcgcag tgcgtgactt actggcagac attggcttag tgacctttcc ggtgacaagc 540
ggcagtaaag gtctgcattt atacaccccg ctggatgaac cggtgagtag tcgcggcgcc 600
acagtgctgg caaaacgtgt tgcacagcgt ttagagcaag caatgcccgc tctggtgacc 660
agcacaatga ccaaaagtct gcgcgccggc aaggtgtttg tggattggag tcagaacagc 720
ggcagcaaga ccacaattgc accttatagt ctgcgcggtc gtacccatcc gaccgttgca 780
gccccgcgta catgggcaga actggacgat cccgctctgc gccagctgag ctatgacgaa 840
gttctgacac gcattgcccg cgatggcgat ctgctggaac gtttagatgc agatgcaccg 900
gttgcagatc gtttaacccg ctaccgtcgt atgcgtgatg caagcaaaac ccccgaaccg 960
atcccgaccg ccaagcccgt taccggtgac ggtaacacat tcgtgattca agaacatcat 1020
gcccgtcgcc cgcactatga ttttcgttta gaacgtgatg gcgtgctggt gagttgggcc 1080
gttccgaaaa atctgccgga taacaccagc gttaaccatt tagccattca caccgaggat 1140
cacccgctgg agtatgccac ctttgagggc gcaattccta gcggtgaata tggtgccggc 1200
aaagtgatca tctgggacag tggcacctat gataccgaga aatttcatga tgacccgcac 1260
accggtgagg tgatcgttaa tttacatggt ggccgtatca gcggtcgcta cgcactgatt 1320
cgcaccaatg gcgaccgctg gctggcccat cgtttaaaga atcagaaaga tcagaaagtg 1380
ttcgagtttg ataatctggc ccctatgctg gcaacccacg gtacagtggc cggtctgaag 1440
gccagccagt gggcatttga aggcaaatgg gatggctacc gcttactggt tgaagcagat 1500
cacggtgcag tgcgtctgcg cagtcgtagc ggccgtgatg tgaccgccga atatccgcag 1560
ctgcgcgctt tagcagaaga tttagcagat catcacgttg tgctggatgg tgaggccgtg 1620
gttctggaca gcagcggcgt gccgagtttc agccagatgc aaaaccgcgg tcgtgacaca 1680
cgcgtggaat tctgggcctt tgacttactg tatctggatg gccgtgcact gctgggcacc 1740
cgttatcaag atcgccgtaa actgttagaa actttagcaa acgcaacctc tttaaccgtt 1800
ccggaactgt taccgggcga cggtgcccaa gcttttgctt gtagtcgtaa acacggttgg 1860
gaaggtgtga ttgccaaacg tcgtgacagc cgttatcagc ccggtcgccg ttgtgccagc 1920
tgggttaaag ataaacattg gaatacccaa gaagtggtga tcggtggctg gcgtgctggt 1980
gaaggcggtc gtagcagcgg tgtgggtagt ttactgatgg gcatcccggg tccgggtggt 2040
ctgcagtttg ctggtcgtgt gggtaccggc ttaagcgaac gtgaactggc caatctgaag 2100
gagatgctgg caccgctgca caccgatgag agtcctttcg acgtgccgtt acccgctcgt 2160
gatgccaaag gcatcaccta cgttaagccg gcactggtgg ccgaagttcg ctatagcgaa 2220
tggacaccgg aaggccgttt acgccagagt agctggcgtg gtttacgtcc ggacaaaaaa 2280
ccgagcgagg tggttcgcga gtaacacaag gtcttctcct gtgtgaaa 2328
<210> 21
<211> 2571
<212> DNA
<213> 人工序列
<400> 21
cccagtcacg acgaagacgc aaaaatgcct agtagcaagc cgctggcaga atacgcacgc 60
aaacgcgatt ttcgccagac cccggaacct agtggccgta aacctcgcaa agacagcacc 120
ggtttactgc gttactgcgt gcagaagcat gatgcaagcc gtctgcacta tgacttccgt 180
ttagagttag acggtacttt aaaaagctgg gcagtgccta aaggtccgtg tttagatccg 240
gccgtgaaac gtttagcagt gcaagttgag gatcatcctc tggattacgc cgattttgaa 300
ggcagcatcc cgcaaggtca ttatggcgct ggtgacgtta tcgtttggga tcgtggtgct 360
tggaccccgc tggatgatcc gcgcgaaggt ctggaaaagg gccatttaag tttcgcctta 420
gatggtgaga aattaagcgg ccgctggcat ttaatccgca caaacttacg cggcaaacaa 480
cctcagtggt ttctggttaa agccaaggac ggcgaggcac gttctttaga tcgcttcgac 540
gtgttaaagg aacgtccgga cagcgttctg agcgagcgca ctttattacc tcgccatggt 600
gaaaccgcca cccccgctgc acgtccggca cgtcgtggca aaagtggcgg caaaaccccg 660
atgccggagt ggattgcccc ggaactggcc agcttagttg aacagcctcc gcgcggcgaa 720
tgggcctacg aactgaagtt agacggctat cgtttaatga gccgcattga ggatggccac 780
gttcgtctgc tgacccgtaa cggccatgac tggaccgagc gcttaccgca tctggaaaaa 840
gcattagccg gtttaggtct gcagcgtagc tggctggatg gcgagctggt tgttctggac 900
gaagagggcc gccccgattt tcaagcttta cagaatgcat tcgaagaagg tcgcggtgaa 960
aatattttat acgtgctgtt cgatttaccg taccatgaag gcgaggattt acgcgatgtt 1020
gctttagagg agcgtcgcgc acgcttagag gccttactgg aaggtcgcga tgaagatccg 1080
ctgcgcttca gtgccacact ggcagaagat ccgcgtgatc tgctggcaag cgcttgtaag 1140
ctgggcttag agggcgttat tggcaagcgc ttaggcagtg cataccgcag ccgccgcagc 1200
aacgattgga tcaaattaaa gtgccagctg cgtcaagaat tcgtgatcgt gggctataca 1260
gagccgaaag gtagccgccg tcatatcggt gctttactgt taggtctgta cagtccggac 1320
gaagaacgcc gtttacgcta tgctggtaag gtgggcagtg gtttcaccgc cgccagtctg 1380
aaaaaggtgc gcgaacgctt agaaccgctg gccgttcgca gtagcccgtt agccaaagtt 1440
ccgcccgctc gcgagactgg tagtgtgcaa tgggtgcgtc cgcaacagct gtgcgaggtg 1500
agctacgcac agatgacccg cggtggtatc attcgccaag ctgtttttca cggtctgcgt 1560
gaggataaac cggcacgtga ggtgaccggt gaacgtcccg ctggtcctcc gcctttacgc 1620
ggcgcacgta aagccggtag cggtgcaagc cgtgcagcaa ccgccggcgt tcgtattagc 1680
cacccgcaac gtttaatcga tccgagtatc caagcaagca aactggagct ggccgaattt 1740
catgcccgct acgcagatct gctgctgcgc gatctgcgtg agcgtcccgt tagtctggtt 1800
cgtggcccgg atggtatcgg tggcgaactg tttttccaaa aacacgccgc acgtctgaaa 1860
atccccggta ttgtgcagct ggatccggca ttagatccgg gtcacccgcc gctgttacag 1920
attcgtagcg ccgaagcttt agtgggtgca gtgcagatgg gcagcatcga atttcataca 1980
tggaacgcca gtctggcaaa tctggaacgc ccggatcgtt tcgtgctgga tctggatccg 2040
gatccggctt taccttggaa gcgtatgctg gaggcaaccc agttatcttt aactttactg 2100
gatgagttag gcttacgcgc atttttaaaa acttctggtg gtaaaggcat gcatttactg 2160
gtgccgttag agcgtcgcca tggttgggac gaagtgaaag acttcgccca agctatcagc 2220
caacatctgg cccgcttaat gccggaacgt tttagcgccg ttagtggtcc gcgcaaccgt 2280
gttggcaaaa ttttcgtgga ctatttacgc aacagccgtg gtgccagcac cgttgccgcc 2340
tatagtgtgc gtgcccgtga aggtttaccc gttagcgtgc cggtgtttcg tgaggagtta 2400
gattctttac aaggtgccaa ccagtggaat ctgcgtagct taccgcaacg cttagatgaa 2460
ctggccggcg atgatccgtg ggcagattat gccggtaccc gccagcgtat cagtgcagca 2520
atgcgtcgtc agctgggtcg cggttaacac aaggtcttct cctgtgtgaa a 2571
<210> 22
<211> 2670
<212> DNA
<213> 人工序列
<400> 22
cccagtcacg acgaagacgc aaaaatgggt cgtgaccacc ctctgagtgc ctaccacgcc 60
aaacgtgatt ttgcacacac ccccgaaccg gctggtgaga aacgcgtggc caaacgccgt 120
ggtaaggccg ttcagcccgc tttacagttt gttattcagc gccatcatgc ccgtcgtctg 180
cactacgatt ttcgtttaga atggggcggc acactgaaaa gctgggcagt tcctcgcggt 240
cctagcttag atcccgatat tcagcgttta gcagttgaag ttgaagatca tccgctggat 300
tacgctggtt tcgagggtac aattccgaaa ggtcactatg gcgctggtga tgtggcaatt 360
tgggatcgcg gcgaatggat tccggagggt gatgcagaag agggtttacg tcgtggcaag 420
ctgcatttcg aactgcgcgg tacacgtctg cacggtgctt gggttttatt tcgtctggcc 480
ggcgagggtg accaatggat gctgcgtaag cgccgcgatc agcatgcccg tatcggtgat 540
ggtgatgccg ttctgcacga tcctccggaa gcagaagcac cgcccgctcc cgctcccgct 600
cccgttgcag caaagagccc gcgtagtagc gcagcaagta gccgtcgtcg tcgtgtgccg 660
gtgccggaat ttgtggagcc gcagttagcc actttagtgg atcgcccgcc cgttagcgat 720
gcatgggtgt acgagatcaa atacgacggc taccgcatgc tggtgcgttg cgatggccgt 780
caagttcgtt tattcagccg taacggcatt gaatggaccg aacgtttacc gagtctggtt 840
caacgtctga gcgctttaca aagccatagc ggctggctgg acggcgagat tgttgtgatg 900
gacgagcatg gccataccga tttccatgct ttacaagcta cactggatag tggcgccccg 960
caagttgagt atgtggtgtt cgacgtgccg tggtgggatg gtgaagattt acgcgaccgt 1020
ccgctgagtc atcgtttaca agctttagat gagatctttg ccgcactgcc ggcacaaccc 1080
ggtttaagtc gtagtaaacc gctggatccg ggttatgttg gccaagctgt tctgcaagct 1140
gcatgccagc tgggtctgga aggtctgatc ggcaagcgtc tggatgcacc ttatcgcagc 1200
ggccgtagcc cgcattggat taagctgaaa tgccgcagcg aacaagaagt tgttattggt 1260
ggttacaccg agccgcgtgg cagtcgcggc cacttaggtg cactgttagt gggcgtgtgg 1320
ggtaaagatg gccagctgga ttatgccggc cgtgttggca gtggttttga tcaagctggt 1380
ttacaagcta tgcgtgaacg tctggcaccg gatgaaaccg cacgctgtcc gtttcgtagc 1440
aaaccttctt taccgggtgc ccctaccgtg cattgggtgg agccggtgca tgtggttcaa 1500
gttcgctatg caagttggac ccaagaaggt ttactgcgtc aagctagctt tgtgggtgtg 1560
cgcgaggaca aaccggtgcg caaggttgtg cgtgagctgc cgcagaccgt ggcacaagaa 1620
gataccccga tgcgtcctag cgccacacgt ctggctggtc gtccggcaag tccggcagcc 1680
acagcagcac gcgcaagtct gcgccgtagt ggtgccagca gcgacccgaa agcaaacagt 1740
gttggcggcg ttcgtgttac acatccggag cgtctggtgt tcagcgttcc tcgcattacc 1800
aaactggaag ttgttcgcta tcatgaagat atcggtgaat atctgctgcc tcatttagca 1860
gcccgccctc tgagcttact gcgctgtccg caaggcaccg gcggtgagtg cttcttccaa 1920
aaacatgtgg aaaccacttt accgagcggt gtggaaagcg ttgaagttcc cgctagtgac 1980
ggtaccgaca cactggtgat ggtgaacagc gtggaaggta ttgttgcttt agcccagtac 2040
ggcaacgttg aatttcacac ttggggcgca cgtgcacctc gtcccgatcg tccggaccgt 2100
atcaccatgg atctggatcc cgatcccgat ttaccgtggg cccaagttgt ggaagccgcc 2160
cagctgaccc gtgttttact ggaagaactg ggtctggccg cctttttaaa aaccaccggc 2220
ggcaagggtt tacatatcgt gaccccgatc aaagccaccc gtagttggga cgaagtgaaa 2280
gccttcacaa agggtctggc cagccgtctg gccagtgttg cccctcagcg ttttaccgcc 2340
cgtctgagta agagcagccg cggtggtcgt atttttattg actatttacg taatggccgc 2400
ggtgccacag cagtggcaag ttattcttta cgcgcacgtg aaggtgcacc ggtgagcgtt 2460
ccgctgcatt gggatgagtt aagcgccaag aaagacgtgc gtgccgaaca cttcaactta 2520
cgcaatgccg ttgcccgtgc accggagagt gaaaccgcat ggcaagatta tgccgcccag 2580
cgccgtacct taacagttaa gatgtttcgc gctttaggtg tggatccggg tagcgcagaa 2640
agctaacaca aggtcttctc ctgtgtgaaa 2670
<210> 23
<211> 2550
<212> DNA
<213> 人工序列
<400> 23
cccagtcacg acgaagacgc aaaaatggcc aagccgctgc aagaatatgc acgcaagcgt 60
gactttaacg caaccccgga accgagcggc aaacgcagtc gtggcaagaa ggcacacgca 120
ctgcagttct gcatccagaa acacgatgcc agccatttac attatgactt ccgtttagaa 180
ctgggcggca ctttaaaaag ctgggccatt ccgaagggcc cgagcttaga ccctaatgtg 240
cgtcgtctgg ccgttcatgt ggaagatcat ccgctggact atgccgattt cgaaggccat 300
attccggagg gccactatgg cgccggtgat gtgatcgttt gggaccgtgg tatctgggaa 360
ccggagggcg atgcccacca aggttatgcc aaaggcaaat taaagttccg tttacaaggt 420
gagaaactga gcggtgtttg gcatttattc cgtacacatt tagctggtaa aaaagagcag 480
tggatgctgg tgaagagcca tgatgcccaa gctcgcagcg aggccgagta cagtattgtt 540
aacgcacagc cggacagcgt tctgagcgac cgtactttaa ttcctcgtaa accggccgcc 600
aaacaagctg cagccaaacc tcgtgccaca cgtaaacgtc ccggtaaggt tcgccaagca 660
gcattaccga accagctgca gccgcaatta gccactttag ttgatacacc tccgcaaggt 720
gactggcgtt acgaggtgaa gtttgatggc tatcgcattc tggcccgcat cgatggtgac 780
gacgtgcgtc tgtttacccg caatggccac gattggagta gtaaaatgcc gcgccagctg 840
gcagctttac gtgcactggg tatcgatagc gcttggctgg atggcgaaat ggtggtggcc 900
gatgaaaacg gtgcagcaga tttccaagct ttacaaaatg cctttgatac cgagcaagat 960
gaacacatca cctactatgt gtttgattta ccgtttttag gcggtcaaga tctgcgccat 1020
gcaccgctgc aagatcgtcg tgaaacttta aaaacattac tggaccacga cgccagcgat 1080
gttctgaaat atagcgccga ttttgatgag cccgttgatg cactgctggc cagtgcatgc 1140
cgtctggaac tggagggttt aattggcaag cgcgccgaca gcccgtatag tggtcgtcgc 1200
agtggcgact ggattaaact gaagtgtaag cgccgccaag aattcgtgct ggttggttac 1260
accgacccga aaggcagccg cagcggtttc ggtgctttat tactggcttt acatgatccc 1320
gataacggcg aactgcgtta tgccggcaag gttggcaccg gttttacagc agcaacttta 1380
gcaagcatcc acacacgttt acaaccgctg gagattgcca aaccggcagt tacccgtcct 1440
ccgagtggtg ccgaagcacg cggcgttcac tggctgaagc cgcaattact ggcagaagtg 1500
gcctacgccc aaatgacacg cgacggtatt gtgcgtcata gcgtgttcca cggtctgcgt 1560
gacgacaaac cggccaccgc aattgatctg gaacgcccta tgagtaccaa caccacacct 1620
cgtcgtaaac gtggtaaagc agcacctctg agcgaggatt tacatctgac ccatccggat 1680
cgtgttattg acgccaccac tggtgttaca aagcgtgatg tggccgagta ctacgccgcc 1740
gttagccagt ggctgctgcc tcagattcag catcgtccgg tggccttagt tcgtgcaccg 1800
gatggtctgg ctggtgagct gttcttccaa aagaacgcca gccagctgca tttaccgaac 1860
gtgctggagt atgacaaagc ccaagctggt caagctgcaa tggtgatcaa tcgcgccgat 1920
actttactgg gtgcagttca gatgaatatg ctggaactgc acagctggaa tgcaaccgac 1980
aaggatttcg acaagccgga tcgctttgtg ctggatttag atccggaccc cgctttacct 2040
tggaaggcaa tgctggaagc aacccagtta acactgactt tattagacga gctgggttta 2100
aaagtgttca tcaagaccag cggtggcaag ggtattcatt tagtggtgcc gttaacccgt 2160
cgcgctggtt gggatgaggt taaagccttt agccacgcca tcgtggaata tctggccaag 2220
ctgttccccg atcgtttaag cgccgttagt ggtccgaaaa atcgtattgg tcgtattttt 2280
attgactatc tgcgtaatgc ccgtggtgca acaacagctt gtgcctactc tttacgcgca 2340
cgtgaaggta tgccggtgag cgtgcctatt tggcgtgagg agctgaccgc actgaaggcc 2400
gcaaatcagt ggaatatcgc aaatttaccc gctcgtttag ccgaagttga cgatccgtgg 2460
gccgatctgg gccgtgtgcg tcagagcatc acagcccgca tgcgtaagca actgggttta 2520
gcctaacaca aggtcttctc ctgtgtgaaa 2550
<210> 24
<211> 2649
<212> DNA
<213> 人工序列
<400> 24
cccagtcacg acgaagacgc aaaaatggca aagccggtga gtgaatatac ccgcaagcgc 60
aacttcgaca ttaccagcga gcccgctgag gctggtagta aaatgcgcag cgccaaagcc 120
cacgcactga gcttcgttat ccagaagcac gatgccagcc atctgcacta tgatttccgt 180
ctggagctgg acggtacact gaagagctgg gccgtgccta agggccctag cttagatcct 240
acccagaaac gtttagccgt gcatgttgag gatcatcctc tgggttatgc aagcttcgaa 300
ggcagcattc cgaagggcca gtatggtggt ggcgacgtta ttgtgtggga tcgcggtgtg 360
tgggagccgc acggtgatcc tcgcaaaacc tacgccgaag gcaagctgaa attcacactg 420
attggtgaaa agctgactgg tgattgggct ttagttcgta cccgtctgaa gggtagcggt 480
agcaaagagc agtggctgct gattaaggag aaggatagcg ttgcccgccc ggccgatgag 540
tatgatatca ttgaacagca gcctcaaagt gtgattagtg gcgcccatgt gggcgttggt 600
cgcgttccgg caagcaaagc caagccgcgc agcacaaaaa ccaaaaccga taccgcaccg 660
gcaaaaccga gccgcatgag cagccgtacc aaggccaaag ccgcactgcc cgaactgtta 720
accccgcaac tggcaacact ggttgatgcc cctccggctg gtgaatggct gtacgagatc 780
aaatttgatg gctaccgcat tctgacacgc atccaaggcg acgatgttcg tctgttcacc 840
cgcaatggtc acgattggac cgaacgtctg ccggagctgg caaaagcaat caaagcttta 900
aaactgcaag atacttggtt cgacggcgaa gtggttgtgt taaacgatca aggtttaccg 960
gattttcaag ctttacagaa cgccttcgaa atcggtcgca gcaaggatat tttatattat 1020
ttattcgata tgccgtatct gaccggcgaa gatctgcgcg aggtgccgat cgaacaacgt 1080
cgcgatgctt taaagcaagt tctgggtaag cagcgtagcc gtttactgcg ctttagcgat 1140
gcattccgta gcggccacaa agacattgtt gagagcgcca gcgcaatggg tctggagggc 1200
gtgattggca aacgcgctgg tagtccttat gtgagcaaac gcaatgccga ctggatcaag 1260
ctgaaatgtc gtctgcgcca agagttcgtg attgttggct atacagcccc tcaaggtagc 1320
cgcagtgcat tcggcgcact gctgctggcc gttaatgatg acgacggtct ggtgtatgcc 1380
ggccgtgtgg gcactggttt caccagccag actttaaaac aactgcatga ccaactgcaa 1440
cctttagagc gcgataccag tccgctggac aagaaactga ccagcgcaca agctcgtggc 1500
gtgcaatggg tggaaccgcg tttaatctgc gaagccgagt ttgcagagtg gacccgcgaa 1560
ggcattctgc gccaagcagc ctttgtgggt ttacgcagcg acaaaccggc aagcgaggtg 1620
gttcgcgaat atccgcagcc cgctgacatt gccagccgtc cgaaagcagc aaaaagcagc 1680
aagaccaagg cattagaggc ccccgttgcc cgcaaaaccg cacgtggcaa agtgaatgtg 1740
gctggtgtgg gtattagcca cagcgaccgc gtgattgata gcaagagcgg cacccagaag 1800
atcgaactgg cacaattcta cgaaagcatc gccgattgga ttttaccgta tttaaacaat 1860
cgcccggttg cactgctgcg ctgtccggaa ggcattgacg gcgagcaatt tttccagaag 1920
catagcgagc gtttagcaat tccgcacatt cgccagctgg atcgcaaact ggatccgggt 1980
catgcagcac tgatggaaat cgacaccgtg caagctttag tgggtgccgc acagatgggt 2040
gccatcgaat ttcacacttg gggcgccacc agtgatcgta tcgagacacc cgatcatctg 2100
gtgctggatt tagaccccga tccggcctta ccgtggcgca gcatgatcga agcaacccag 2160
atggtgctgg ccgttttaga ggagctgggc ttagaagcct ttttaaaaac cagcggcggc 2220
aaaggcatgc atatcatcgt gcctttagcc cgccacgcag attgggatac cgtgaaaggc 2280
ttcgccaaag ccatcgccga atttgttacc cagcagctgc cggaacgctt caccgccaca 2340
atgggtccta aaaaccgtgt gggccgcatc ttcgttgatt atctgcgtaa tagccgtggc 2400
ggcagtacag tgaccgcata cagcgttcgc gcccgccccg gtctgcccgt tagtgttccg 2460
atcgctttag acgaactggc tggtttaaca agcagcgccc agtgggatgt tacaaattta 2520
gagcagcgtc tgcgcgaact gaagggcgac ccgtgggagg gttatcgtaa tcgtcagcgc 2580
atcacacaga aaatgtggaa gcagctgggt gcaaagcgta gttaacacaa ggtcttctcc 2640
tgtgtgaaa 2649
<210> 25
<211> 27
<212> DNA
<213> 人工序列
<400> 25
agcatctggt cgcattgggt caccagc 27
<210> 26
<211> 29
<212> DNA
<213> 人工序列
<400> 26
cttccagata actgccgtca ctccagcgc 29
<210> 27
<211> 23
<212> DNA
<213> 人工序列
<400> 27
cttcagccat acttttcata ctc 23
<210> 28
<211> 25
<212> DNA
<213> 人工序列
<400> 28
agctggacac cgtttaaact caatg 25
<210> 29
<211> 22
<212> DNA
<213> 人工序列
<400> 29
tctgttgttt gtcggtgaac tg 22
<210> 30
<211> 22
<212> DNA
<213> 人工序列
<400> 30
ctggtattgg cacaaacctg at 22
<210> 31
<211> 82
<212> DNA
<213> 人工序列
<400> 31
tttaacttgc tatttctagc tctaaaacgg ttcacgcgca tatcgttaac tagtattata 60
cctaggactg agctagctgt ca 82
<210> 32
<211> 28
<212> DNA
<213> 人工序列
<400> 32
gccgcaaggt gctaagccgc gaggaaag 28
<210> 33
<211> 25
<212> DNA
<213> 人工序列
<400> 33
cagggcagca ttgacctgct ccagc 25
<210> 34
<211> 23
<212> DNA
<213> 人工序列
<400> 34
cccagtcacg acggtctcaa aaa 23
<210> 35
<211> 23
<212> DNA
<213> 人工序列
<400> 35
aagccgagac ctcctgtgtg aaa 23
<210> 36
<211> 24
<212> DNA
<213> 人工序列
<400> 36
cccagtcacg acgaagacgc aaaa 24
<210> 37
<211> 24
<212> DNA
<213> 人工序列
<400> 37
cacaaggtct tctcctgtgt gaaa 24

Claims (5)

1.一种在大肠杆菌中有效的NHEJ系统在大肠杆菌基因编辑中的应用,其特征在于,所述NHEJ系统包括:
同时连接有Ku蛋白和ligD蛋白的CDS编码序列的pDual-Cas9-Ku-ligD质粒载体,和靶向目的基因的pDual-sgRNA质粒载体;
所述pDual-sgRNA质粒载体:顺次连接有靶向目的基因的sgRNA序列、组成型表达的强启动子J23119启动子、复制子和氨苄青霉素抗性基因;
所述pDual-Cas9-Ku-ligD质粒载体的骨架载体:顺次连接有Rep101基因、pSC101复制子、卡那霉素抗性基因、Cas9基因、araC基因、2个阿拉伯糖启动子、用于克隆Ku基因的BsaⅠ限制酶识别位点和用于克隆ligD基因的BbsⅠ限制酶识别位点;
所述Ku蛋白和ligD蛋白的CDS编码序列选自:Mno-Ku+Mfo-ligD的组合、Mbr-Ku+Mfo-ligD的组合或Mno-Ku+Msm-ligD的组合中任意一种;
所述Mno-Ku+Mfo-ligD的组合中Ku蛋白的CDS编码序列如SEQ ID NO.7所示,ligD蛋白的CDS编码序列如SEQ ID NO.18所示;
所述Mbr-Ku+Mfo-ligD的组合中的Ku蛋白的CDS编码序列如SEQ ID NO.5所示,ligD蛋白的CDS编码序列如SEQ ID NO.18所示;
所述Mno-Ku+Msm-ligD的组合中的Ku蛋白的CDS编码序列如SEQ ID NO.7所示,ligD蛋白的CDS编码序列如SEQ ID NO.19所示。
2.一种计算NHEJ系统连接效率的方法,其特征在于,所述计算NHEJ系统连接效率的方法包括:
将权利要求1中的NHEJ系统转化大肠杆菌,挑取单克隆培养后,制备感受态细胞;
将酶切后与未酶切的质粒分别转染制备的感受态细胞,培养;
统计平板上的克隆数,计算NHEJ系统的连接效率;所述NHEJ系统的连接效率的计算公式为:转化1 ng酶切后的质粒的克隆数与转化1 ng未酶切的质粒的克隆数的比值。
3.根据权利要求2所述的计算NHEJ系统连接效率的方法,其特征在于,所述酶切包括限制酶酶切。
4.根据权利要求3所述的计算NHEJ系统连接效率的方法,其特征在于,所述酶切包括EcoRⅤ限制酶酶切。
5.一种通过NHEJ系统对大肠杆菌进行基因编辑的方法,其特征在于,所述基因编辑的方法包括:
将权利要求1中的同时连接有Ku蛋白和ligD蛋白的CDS编码序列的pDual-Cas9-Ku-ligD质粒载体转化大肠杆菌,挑取单克隆培养后,制备感受态细胞;
构建靶向目的基因的pDual-sgRNA质粒载体;
将构建的所述靶向目的基因的pDual-sgRNA质粒载体转化制备的感受态细胞,培养;
挑取克隆进行验证,分析基因编辑的情况。
CN202111629910.2A 2021-12-28 2021-12-28 一种使大肠杆菌获得有效nhej系统的高通量筛选工具在大肠杆菌基因编辑中的应用 Active CN114277047B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111629910.2A CN114277047B (zh) 2021-12-28 2021-12-28 一种使大肠杆菌获得有效nhej系统的高通量筛选工具在大肠杆菌基因编辑中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111629910.2A CN114277047B (zh) 2021-12-28 2021-12-28 一种使大肠杆菌获得有效nhej系统的高通量筛选工具在大肠杆菌基因编辑中的应用

Publications (2)

Publication Number Publication Date
CN114277047A CN114277047A (zh) 2022-04-05
CN114277047B true CN114277047B (zh) 2023-10-03

Family

ID=80877300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111629910.2A Active CN114277047B (zh) 2021-12-28 2021-12-28 一种使大肠杆菌获得有效nhej系统的高通量筛选工具在大肠杆菌基因编辑中的应用

Country Status (1)

Country Link
CN (1) CN114277047B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104673816A (zh) * 2015-03-05 2015-06-03 广东医学院 一种pCr-NHEJ载体及其构建方法及其用于细菌基因定点敲除的应用
CN110066829A (zh) * 2019-04-30 2019-07-30 江南大学 一种CRISPR/Cas9基因编辑系统及其应用
CN111850025A (zh) * 2019-04-26 2020-10-30 中国医学科学院病原生物学研究所 一种应用于结核分枝杆菌的基因编辑系统及方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210207134A1 (en) * 2015-12-24 2021-07-08 B.R.A I.N. Ag Reconstitution of dna-end repair pathway in prokaryotes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104673816A (zh) * 2015-03-05 2015-06-03 广东医学院 一种pCr-NHEJ载体及其构建方法及其用于细菌基因定点敲除的应用
CN111850025A (zh) * 2019-04-26 2020-10-30 中国医学科学院病原生物学研究所 一种应用于结核分枝杆菌的基因编辑系统及方法
CN110066829A (zh) * 2019-04-30 2019-07-30 江南大学 一种CRISPR/Cas9基因编辑系统及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
An efficient system for deletion of large DNA fragments in Escherichia coli via introduction of both Cas9 and the non-homologous end joining system from Mycobacterium smegmatis;Xuan Zheng等;《Biochemical and Biophysical Research Communications》;第485卷;第768-774页 *
Ku基因在微生物中的研究进展;张小娟等;《生物技术进展 》;第1卷(第1期);第26-31页 *

Also Published As

Publication number Publication date
CN114277047A (zh) 2022-04-05

Similar Documents

Publication Publication Date Title
Alting-Mees et al. [42] pBluescriptII: Multifunctional cloning and mapping vectors
CN109777761B (zh) 一种分泌表达几丁二糖脱乙酰酶的工程菌构建及其应用
US6372457B1 (en) Process and materials for production of glucosamine
CA2520811C (en) Method of cdna synthesis
CN111088405A (zh) 用于检测冠状病毒2019-nCoV的引物探针组合物、试剂盒及方法
CN107604004A (zh) 用于痘苗病毒天坛株tk基因的示踪打靶质粒及其制备方法
CN103215372A (zh) 基于dpo引物检测布氏杆菌的引物序列及其检测试剂盒
CN102002509B (zh) 一种大肠杆菌-枯草芽孢杆菌穿梭表达载体及其应用
CN108718529B (zh) 用于产生l-半胱氨酸的突变微生物以及使用其产生l-半胱氨酸的方法
WO1992017581A1 (en) Mammalian expression vector
CN114277047B (zh) 一种使大肠杆菌获得有效nhej系统的高通量筛选工具在大肠杆菌基因编辑中的应用
CN114164225B (zh) 一种使大肠杆菌获得有效nhej系统的高通量筛选工具及其应用
CN101463362B (zh) 融合表达绿色荧光蛋白的表达载体及其构建方法与应用
CN111718953B (zh) 一种针对甘蔗的CRISPR/Cas9载体及其构建方法和应用
CN101538611B (zh) Rna和dna双外参实时定量荧光pcr检测方法及其应用
CN113862235B (zh) 一种嵌合酶及其在体外一步反应合成Cap0 mRNA的用途和方法
US20030186266A1 (en) Highly sensitive nucleic acid hybridization method and gene analysis method by using the same
CN100429309C (zh) 一种100bp梯度核糖核酸分子量标志物及其制备
KR102454110B1 (ko) ppGpp 생합성 관련 유전자 발현의 저해물질 탐색용 재조합 플라스미드 및 돌연변이 균주
CN108385170B (zh) 枯草芽孢杆菌f4启动子的调控序列文库
CN110607267B (zh) 一种绵羊李斯特菌平衡致死系统、构建方法及应用
CN114574467B (zh) 一种基因表达调控系统及其应用
CN114457113B (zh) 一种抑制单倍体胚胎干细胞二倍化的方法
CN113862235A (zh) 一种嵌合酶及其在体外一步反应合成Cap0 mRNA的用途和方法
CN111560392B (zh) miRNA表达载体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant