CN115667519A - 含i型聚酮合酶基因的质粒的制备方法 - Google Patents

含i型聚酮合酶基因的质粒的制备方法 Download PDF

Info

Publication number
CN115667519A
CN115667519A CN202180037678.5A CN202180037678A CN115667519A CN 115667519 A CN115667519 A CN 115667519A CN 202180037678 A CN202180037678 A CN 202180037678A CN 115667519 A CN115667519 A CN 115667519A
Authority
CN
China
Prior art keywords
dna
pks
plasmid
sequence
preparing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180037678.5A
Other languages
English (en)
Inventor
大卫·利普斯
海斯·韦尔卡雷吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spiber Inc
Original Assignee
Spiber Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spiber Inc filed Critical Spiber Inc
Publication of CN115667519A publication Critical patent/CN115667519A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/76Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/010946-Deoxyerythronolide-B synthase (2.3.1.94)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/04Actinomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/07Bacillus
    • C12R2001/125Bacillus subtilis ; Hay bacillus; Grass bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/185Escherichia
    • C12R2001/19Escherichia coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/465Streptomyces

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及一种制备包含编码PKS的DNA在内的质粒的方法,其包括以下工序:在枯草芽孢杆菌感受态细胞中导入包含编码I型聚酮合酶(PKS)的DNA串联重复序列在内的DNA构建体的工序。

Description

含I型聚酮合酶基因的质粒的制备方法
技术领域
本发明涉及一种含I型聚酮合酶(PKS)基因的质粒的制方法。
背景技术
已知由放线菌和丝状菌等微生物产生的天然化合物是具有多种结构和生物活性的有用物质。目前,通过解读基因组,可以很容易地确定用于生物合成有用物质的基因簇。此外,还明确了存在大量用于生物合成人类未利用的有用物质的基因簇。在微生物的次级代谢产物中,重要研究了用于对具有产业重要性的聚酮类化合物和肽类化合物进行生物合成的基因簇。例如,可以列举出I型聚酮合酶(PolyKetideSynthase;PKS),其用于在放线菌产生的二级代谢产物中临床应用的erythromycin、FK-506(tacrolimus)、rapamycin及avermectin等大环内酯类化合物的生物合成。
考虑到通过传统的化学方法生产聚酮化合物等的难度、以及野生型细胞中的聚酮通常的低生产性,寻找用于生产聚酮化合物的改良或替代方法成为备受瞩目的焦点。由于这些原因,通过将生物合成所需的基因簇从原始菌株引入到其他细胞中来尝试化合物的异源生产。实际上,异源表达的传统方法大多限定于小的基因簇(<40kb),而很多PKS基因簇都比它大得多,其为从数千碱基到100千碱基以上的DNA。
作为组装DNA的方法,已知有金门(Golden Gate)法、吉布森(Gibson)法等连接多个DNA片段的方法(非专利文献1)。
Golden Gate法是准备一个或两个末端包含由IIs型限制性核酸内切酶识别的碱基序列的多个DNA片段,并用IIs型限制性核酸内切酶和DNA连接酶进行处理的方法。可以通过由IIs型限制性核酸内切酶切割产生的粘性末端(sticky end),来使多个DNA片段杂交,接着利用DNA连接酶连接缺口,来制造出具有所需碱基序列的DNA片段。通过设计由IIs型限制性核酸内切酶识别的碱基序列的类型和排列,可以将由IIs型限制性核酸内切酶切割的多个DNA片段连接起来以使限制性核酸内切酶的识别位点消除,从而制造出具有所需碱基序列的DNA片段。报告了一种通过利用Golden Gate法来将具有所需碱基序列的DNA片段导入克隆载体的方法等(专利文献1和非专利文献1)。
Gibson法是准备以相邻连接的DNA片段的各自末端部的连接区域重叠15~80个碱基对(bp)左右的方式(以成为相同碱基序列的方式)进行设计的多个DNA片段,用5'核酸外切酶、DNA聚合酶和DNA连接酶进行处理的方法。通过5'核酸外切酶从DNA片段末端部分地产生单链DNA。所产生的单链DNA在重复的碱基序列部分中杂交。然后,通过DNA聚合酶填充间隙,并通过DNA连接酶来连接缺口,从而可以制造出具有所需碱基序列的DNA片段。
在Gibson法中,由于不需要包含由限制性核酸内切酶识别的碱基序列等,因此没有碱基序列的限制,并且也适用于长DNA片段的构建(非专利文献2、专利文献2以及专利文献3)。
现有技术文献
专利文献
专利文献1:美国专利申请公开第2010/0291633号说明书
专利文献2:美国专利第7723077号说明书
专利文献3:日本特表2011-512140号公报
非专利文献
非专利文献1:PLoS One,2009年,4(5),e5553
非专利文献2:化学和生物,2016年,Vol.54,No.10,pp.740~746
发明内容
发明所要解决的问题
据说在Golden Gate法中,可一次性连接的DNA片段的数量约为20左右,如果超过该数量,效率会降低。如PKS基因簇这样的序列是重复序列及GC含量高的碱基序列,因此错误连接的频率存在提高的倾向,因此很难一次性地准确连接多个DNA片段。
在Gibson法中,当组装包含重复序列或GC含量高的碱基序列的PKS基因簇的情况下,由于单链DNA杂交的准确性降低,因此错误连接的频率会变得极高。实际上,其受限于最多15个片段的组装规模。
本发明的目的在于高效地合成聚酮合酶基因。
用于解决问题的方法
本发明提供一种包含以下I型聚酮合酶基因的质粒及其制备方法、制备PKS酶的方法。
〔1〕一种制备包含编码PKS的DNA在内的质粒的方法,其包括以下工序:在枯草芽孢杆菌感受态细胞中导入包含编码I型聚酮合酶(PKS)的DNA串联重复序列在内的DNA构建体的工序。
〔2〕根据〔1〕所述的方法,其包括以下工序:通过用TypeII限制性核酸内切酶切割多个DNA片段前体,来制备两端具有粘性末端的多个DNA片段的工序;通过连接多个所述DNA片段,来制备所述DNA构建体的工序。
〔3〕根据〔2〕所述的方法,其包括以下工序:通过将包含不同种类的多个所述DNA片段的溶液进行混合以使得各溶液中的DNA片段的摩尔浓度比为0.8~1.2,来制备编码I型聚酮合酶(PKS)的DNA串联重复序列的工序。
〔4〕根据〔2〕或〔3〕所述的方法,其中,所述DNA片段前体的GC含量为65%以下。
〔5〕根据〔1〕至〔4〕中任一项所述的方法,其中,所述导入工序是将所述DNA构建体与枯草芽孢杆菌感受态细胞共培养的工序。
〔6〕根据〔1〕至〔5〕中任一项所述的方法,其中,其还包括从导入了所述DNA构建体的枯草芽孢杆菌中回收质粒DNA的工序。
〔7〕一种包含编码I型聚酮合酶(PKS)的DNA在内的质粒,其中,其通过根据〔1〕至〔6〕中任一项所述的方法而得到。
〔8〕一种制备PKS酶的方法,其包括以下工序:用质粒转化宿主细胞的工序;培养转化后的所述宿主细胞的工序;其中,所述质粒是通过根据〔1〕至〔6〕中任一项所述的方法而得到的、且包含编码I型聚酮合酶(PKS)的DNA在内的质粒。
〔9〕根据〔8〕所述的方法,其中,所述宿主细胞是Streptomyces属细菌。
发明效果
可以提供一种准确且有效地对编码如PKS这样的巨大基因簇的长链DNA进行组装的方法。
附图说明
图1是示出连接3个DEBS PKS基因编码序列,并在其各自的前面插入启动子、RBS,而在其后面插入终止子序列的靶序列的概略图。
图2示出了在使用大肠杆菌的比较例1中得到的质粒所包含的PKS基因的限制性核酸内切酶降解产物的电泳结果。
图3示出了在使用枯草芽孢杆菌的实施例1中得到的质粒所包含的PKS基因的限制性核酸内切酶降解产物的电泳结果。图3中的检查示出了获得所需的DEBS PKS基因编码序列。
具体实施方式
以下,对本发明具体实施方式详细进行说明。但是,本发明并不限于以下实施方式。
本实施方式所涉及的制备包含编码PKS的DNA在内的质粒的方法,其包括以下工序:在枯草芽孢杆菌感受态细胞中导入包含编码I型聚酮合酶(有时仅仅记载为“PKS”或“I型PKS”)的DNA串联重复序列在内的DNA构建体的工序。
在本说明书中,所谓包含编码PKS的DNA(下面,有时记载为“PKS基因”。)串联重复序列在内的DNA构建体,是指在枯草芽孢杆菌细胞内能够转换成包含1个或多个PKS基因在内的质粒的构建体。例如,通过将上述DNA构建体与枯草芽孢杆菌感受态细胞共培养,来将上述DNA构建体导入到枯草芽孢杆菌细胞内。接下来,在枯草芽孢杆菌细胞内,利用包含编码PKS的DNA在内的重复单元的同源性,使上述DNA构建体环状化,并将其转换成包含编码1个或多个PKS的DNA在内的质粒。因此,可以从该枯草芽孢杆菌中获得包含编码PKS的DNA在内的质粒。
作为枯草芽孢杆菌感受态细胞的制备方法,优选使用Anagnostopoulou,C.andSpizizen,J.,J.Bacteriol.,81,741-746(1961)中记载的方法。
加入到枯草芽孢杆菌感受态细胞中的DNA构建体溶液的液量并没有特别限制。相对于枯草芽孢杆菌感受态细胞的培养液的液量,DNA构建体溶液的液量优选为1/20至等量的范围内,更优选为半量。
编码PKS的DNA串联重复序列在形成质粒时,将编码PKS的DNA中的至少1个、优选地将编码1个PKS的DNA整合到质粒中。作为从枯草芽孢杆菌中纯化质粒的方法,可以使用公知的方法。
通过上述方法而得到的质粒具有编码目标PKS的DNA,这可以通过限制性核酸内切酶切割而产生的片段的大小模式、PCR法、碱基序列确定法来确认。
上述DNA构建体只要是包含编码I型聚酮合酶(PKS)的DNA(例如,编码PKS中包含的结构域的DNA)在内的构建体即可,而PKS的类型并没有特别限定。此外,DNA构建体的大小也没有特别限定。编码PKS的DNA(例如,编码PKS中包含的结构域的DNA)的类型不仅可以是具有微生物等天然来源序列的DNA,也可以是具有人工设计序列的DNA等,并没有特别限制。在天然来源序列中,为了表达对应的氨基酸,不同的生物物种主要使用一个密码子,但在进行异源表达时,优选使用与宿主的密码子使用频率相匹配的人工设计序列。可能影响异源表达结果的其他因素可以列举出GC含量(碱基序列内鸟嘌呤和胞嘧啶的总含量)、重复序列等。重复序列会降低遗传稳定性,存在错误杂交的风险,并阻碍重复片段的合成。因此,在异源表达的情况下,编码PKS的DNA优选地与密码子使用量和GC含量相关联进行地优化。然而,这些要求通常很难同时得到最佳满足。例如,作为优化密码子的结果,可能会导致非常重复的DNA序列或高GC含量。
在本发明中,编码PKS的DNA的GC含量为30~70%。编码PKS的DNA的GC含量优选为70%以下、68%以下、65%以下、60%以下。通过使用本发明所涉及的方法,即使编码PKS的DNA的GC含量为50%以上、52%以上、55%以上、58%以上、60%以上,也可以高效率地合成目的质粒。在本发明中,编码PKS的DNA优选地优化密码子,以使得其不会出现20bp以上的碱基序列的重复。优选地避免编码PKS的DNA中GC含量出现极端差异。例如,最高和最低的50bp长度间的GC含量的差异优选为52%以下。最好尽量减少均聚物。最好尽可能地使分散在编码PKS的DNA内的小重复序列的数量/长度最小化。重复序列的长度小,且5~10bp的重复数的总和优选为150以下、120以下、100以下、80以下、60以下。通过使用本发明,编码PKS的基因中所含的5~10bp长度的重复数可以为40以上、45以上、50以上。
本发明中得到的包含PKS基因的质粒通过与特定的宿主组合,可以高效地产生聚酮。在一个优选的实施方式中,本发明可以利用天然产生的PKS基因实质上缺失的、且进行了基因操作的宿主细胞。这些宿主细胞可以用包含各种PKS基因的质粒进行转化,以产生活性聚酮。本发明提供在生长周期的适当阶段大量产生的产物。这样产生的聚酮取决于聚酮的类型,并且可以作为治疗剂用于治疗多种疾病。例如,已发现由本发明的质粒转化而成的宿主所产生的一些聚酮可用于免疫抑制剂、抗肿瘤剂、以及治疗病毒、细菌和寄生虫感染。通过重组产生聚酮的能力也提供了一种表征PKS及其作用机制的强力工具。
更优选地,用于重组目标聚酮的宿主细胞可以来源于可由本发明的质粒转化而成的任何生物。因此,本发明的宿主细胞可以来源于原核生物或真核生物。然而,优选的宿主细胞由放线菌构成,更优选为Streptomyces属的宿主。使用Streptomyces属的宿主的最大优点在于,与使用大肠杆菌的异源表达生产相比,生产效价高,并且存在I型PKS的活性表达所必需的翻译后修饰体系。具体而言,可以列举出S.albus、S.ambofaciens、S.avermitilis、S.azureus、S.cinnamonensis、S.coelicolor、S.curacoi、S.erythraeus、S.fradiae、S.galilaeus、S.glaucescens、S.hygroscopicus、S.lividans、S.parvulus、S.peucetius、S.rimosus、S.roseofulvus、S.thermotolerans、S.violaceoruber等,优选S.albus。
上述宿主细胞可以通过使用标准技术(例如同源重组)使来源于该宿主细胞的天然产生的PKS基因缺失来进行基因操作。
编码PKS的DNA可以是天然型的,也可以是改变了密码子用法的DNA,还可以是改变了1个或2个以上氨基酸的DNA。在一个优选实施方式中,Streptomyces PKS包括3个开放阅读框(ORF1、ORF2、ORF3)的产物。PKS包含酮合成酶(KS)结构域、酰基转移酶(AT)结构域、酰基载体蛋白(ACP)结构域这3种结构域,通过这3种结构域可以延长聚酮链。PKS还可以具有酮还原酶(KR)结构域、脱水酶(DH)结构域、烯醇还原酶(ER)结构域等与主链修饰相关的结构域。作为由PKS制备的化合物,可以列举出6-脱氧红霉内酯B(6-dEB)、富伦菌素、榴菌素、曲霉素、6-甲基水杨酸、土霉素、四环素、红霉素、甘油霉素、七尾霉素、美达霉素、柔红霉素、酪氨酸、卡波霉素、螺旋霉素、阿维菌素、莫能菌素、无活菌素、克拉霉素、利福霉素、脂霉素和杀念菌素。
质粒包含与编码所需PKS的DNA可操作地连接的控制序列。用于本发明的合适的表达系统包括在真核生物宿主细胞和原核生物宿主细胞中发挥作用的系统。然而,如上所述,原核生物系统是优选的,而且与Streptomyces属细菌兼容的系统尤其重要。用于这种系统的控制序列包括启动子、核糖体结合位点、终止子、增强子等。有用的启动子在Streptomyces属的宿主细胞中发挥功能,例如,可以列举出pGapdh、pErmE、pKasO等,但并不限定于此。
选择标记也可以包含在质粒中。已知各种标记在转化细胞系的选择中是有用的,而且,通常,当细胞在适当的选择培养基中生长时,其表达包括赋予转化细胞上可选择的表型的基因。例如,这些标记包括赋予质粒以抗生素抗性或敏感性的基因。或者,一些聚酮本身是有颜色的,其特征在于提供一种用于对由本发明的构建物成功转化而成的细胞进行选择与生俱来的(built-in)标记。
质粒可以包含在宿主细胞中发挥功能的功能序列。作为功能序列,例如,可以列举出质粒复制起点序列、编码用于将质粒整合在宿主基因组中的酶的序列、接合(conjugation)起始点序列等。
可以通过将控制序列、选择标记以及功能序列等事先嵌入到DNA构建体的重复单位中,来使其包含在质粒中。
将本发明的质粒导入适当的宿主细胞中的方法对于本领域的技术人员来说是公知的,而且代表性地包括使用CaCl2或2价阳离子和如DMSO那样的其他药剂。质粒也可以通过电穿孔导入宿主细胞中。一旦表达PKS,则可鉴定聚酮产生菌落,而且可使用公知的技术进行分离。本发明的质粒可以使用细菌间的接合转移导入到宿主细胞中。在本发明的一个优选实施方式中,将包含编码PKS的DNA在内的区域从本发明的质粒转移到大肠杆菌的质粒中以改造质粒骨架(亚克隆),接着通过接合(conjugation)从大肠杆菌转移到Streptomyces属微生物中,由此实施向宿主细胞的导入。由此,将编码PKS的DNA整合到如Streptomyces属微生物那样的宿主细胞基因组中。
在一个实施方式中,本发明的质粒可以包含枯草芽孢杆菌、大肠杆菌和Streptomyces属微生物中的复制起点序列、用于从大肠杆菌到Streptomyces属微生物的接合转移的接合起始点序列(OriT)以及编码将Streptomyces属微生物整合到基因组中所需的整合酶的序列。这样的质粒从枯草芽孢杆菌中回收后,可以在无需进行用于改造质粒骨架的亚克隆的情况下,转化大肠杆菌,然后通过接合从大肠杆菌转移至Streptomyces属微生物。
本发明的另一个优选实施方案是包含编码大模块PKS的DNA在内的质粒。例如,6-脱氧红霉素B合酶(DEBS)催化作为红霉素糖苷配基的6-脱氧红霉素B的生物合成。三个开放阅读框编码DEBS多肽,而且在Saccharopolyspora erythraea基因组的ery簇中跨越32kb。该基因由分别被称为“模块”的、6个重复单元组织而成。各模块编码一组活性位点,该活性位点在聚酮生物合成期间催化附加单体在生长链上的缩合。每个模块可包含酰基转移酶(AT)、β-酮酰基载体蛋白合酶(KS)、酰基载体蛋白(ACP)、以及还原活性位点的亚群(β-酮酰还原酶(KR)、脱水酶(DH)、烯酰还原酶(ER))。模块内的还原位点的数量与各缩合循环中的β-酮还原的程度相对应。
DNA构建体例如可以通过用DNA连接酶连接两个末端为粘性末端的多个DNA片段而得到。具体而言,作为DNA片段,例如,可以列举出具有末端的片段,该末端利用粘性末端的碱基序列的互补性,能够在相互保持顺序的状态下重复连接。该粘性末端的结构只要是除回文结构(palindrome)以外的结构即可,还包括5'末端突出、3'末端突出的形状的不同,并没有特别限制。但是,在制备DNA片段时,优选地通过限制性核酸内切酶的消化来制备突出末端。作为限制性核酸内切酶,当使用用于可识别特定的序列并在其附近制作任意序列的突出末端的酶时,由于DNA片段的粘性末端在各连接位点会有所不同,因此可保持其连接顺序。通过适当地设计各DNA片段的粘性末端的序列,可以得到各DNA片段以预定的顺序进行排列的DNA构建体。作为这些限制性核酸内切酶的例子,除了通常的分子生物学中使用的限制性核酸内切酶以外,还可以列举出人工限制性核酸内切酶的TALEN或ZNF、或者CRISPR-Cpf1等可生成粘性末端的CRISPR技术的相关酶等,优选使用如AarI、AlwNI、BbsI、BbvI、BcoDI、BfuAI、BglI、BsaI、BsaXI、BsmAI、BsmBI、BsmFI、BspMI、BspQI、BtgZI、DraIII、FokI、PflMI、SfaNI、SfiI等这样的TypeII限制性核酸内切酶。通过使用NEBetaTM Tools,可以确定最佳的粘性末端。粘性末端的碱基数优选为3~6,更优选为3~4。1个DNA片段中所含的碱基数优选为1~5kb。也可以是2kb以上、3kb以上、4kb以上。对于用于生成粘性末端的1个DNA片段的剪切,优选利用1种限制性核酸内切酶进行切割。未必需要通过同一种的限制性核酸内切酶的消化来得到所有的DNA片段,但使用的限制性核酸内切酶的类型的总数越少越好,优选为3种以下,更优选为2种以下,进一步优选为1种。
例如,DNA片段可以通过包含以下工序的方法来进行制备:通过TypeII限制性核酸内切酶切割DNA片段前体(通过TypeII限制性核酸内切酶的切割而产生对应的DNA片段的DNA片段。例如,也可以是质粒)来制备两端具有粘性末端的多个DNA片段的工序;以及通过连接多个DNA片段来制备DNA构建体的工序。
通过连接多个DNA片段来制备DNA构建体的工序例如可以是通过DNA连接酶连接多个DNA片段来制备DNA构建体的工序。
通过连接多个DNA片段来制备DNA构建体的工序可以是通过混合包含不同类型的多个前DNA片段在内的溶液来制备编码I型聚酮合酶(PKS)的DNA串联重复序列的工序。进行混合以使得所有DNA片段的摩尔浓度比为0.8~1.2,优选为0.9~1.1,更优选为0.95~1.05,进一步优选为约1.0。DNA片段的混合也可以根据需要在存在合成用质粒的情况下进行,从而使DNA片段合成。
作为DNA连接酶,可以列举出T4噬菌体和大肠杆菌的DNA连接酶。
DNA构建体除了编码PKS的DNA(例如,编码PKS中包含的结构域的DNA)以外,还可以包含其他基因。例如,当DNA构建体包含PKS基因的情况下,除了PKS基因以外,为了1)修饰最终的聚酮产物、2)将聚酮输送到细胞外、或3)赋予对抗生素聚酮的抗性,优选地还包含其他非PKS基因。换言之,PKS基因的部分是靶簇的核心生物合成部分,但许多情况下也需要上述非PKS基因。
作为DNA片段的类型,为3~60(种),优选为5~50(种),更优选为8~40(种),进一步优选为10~30(种)。
各DNA片段的GC含量可以为65%以下。优选地,不会出现20bp以上的碱基序列的重复。
例如,当编码PKS的DNA由按照P、Q、R、S的顺序连接了4个结构域的P-Q-R-S进行表示的情况下,DNA构建体包括由-(P-Q-R-S)n-表示的串联重复序列(n为2以上的整数)。优选地,在DNA构建体的各ORF(P-Q-R-S)的5'末端或3'末端上附加在宿主细胞中发挥功能的启动子、核糖体结合序列(RBS序列)、增强子等控制序列。此外,也可以在DNA构建体的各ORF(P-Q-R-S)的5'末端或3'末端上附加在宿主细胞中发挥功能的功能序列、以及选择标记等序列。此外,DNA构建体优选地包括对枯草芽孢杆菌有效的复制起点。
通过将枯草芽孢杆菌感受态细胞与DNA构建体一起培养,来将DNA构建体摄入至枯草芽孢杆菌内,从而形成包含编码PKS的DNA在内的质粒。
编码PKS的DNA串联重复序列在形成质粒时,将包含编码串联重复序列PKS的DNA在内的重复单元(包含ORF、根据需要的控制序列、在宿主细胞中发挥功能的功能序列以及选择标记等。)整合到质粒中。
优选地,在质粒中附加在宿主细胞中发挥功能的启动子、核糖体结合序列(RBS序列)、增强子等控制序列。此外,优选地,质粒中包含对枯草芽孢杆菌有效的复制起点。例如,在枯草芽孢杆菌的情况下,具有θ型复制机制,具体而言,可以列举出pTB19(Imanaka,T.,etal.,J.Gen.Microbioi.,130,1399-1408.(1984))和pLS32(Tanaka,T and Ogra,M.FEBSLett.,422,243-246.(1998)、pAMβ1(Swinfield,T.J.,etal.,Gene,87,79-90.(1990))等质粒中含有的复制起点等序列。
终止子只要是在宿主细胞中发挥功能的终止子即可,并没有特别限定,例如可以优选地列举出来源于fd噬菌体的终止子(fd-ter)、来源于T4噬菌体的终止子(T4-ter)及来源于T7噬菌体的终止子(T7-ter)等。其中,从上述稳定化效果更佳的观点出发,特别优选为来源于fd噬菌体的终止子。
可以使用公知的核糖体结合序列(RBS)。
在本发明的一个实施方式中,可以培养将包含编码PKS的DNA在内的质粒导入宿主细胞的转化子,并通过该培养物得到聚酮。所谓“培养物”,是指培养上清、培养细胞、培养菌体、或细胞或菌体的破碎物中的任一种。培养本发明的转化子的方法可以按照宿主培养中使用的常规方法来进行。
培养本发明的转化子的培养基只要是含有宿主可同化的碳源、氮源、无机盐类等且能够有效地培养转化子的培养基即可,也可以使用天然培养基、合成培养基中的任一种。作为碳源,可以列举出葡萄糖、半乳糖、果糖、蔗糖、棉子糖、淀粉等碳水化合物、乙酸、丙酸等有机酸、乙醇、丙醇等醇类。作为氮源,可以列举出氨、氯化铵、硫酸铵、醋酸铵、磷酸铵等无机酸或有机酸的铵盐或其他含氮化合物。除此之外,也可以使用蛋白胨、肉提取物、玉米浆、各种氨基酸等。作为无机物,可以列举出磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠、硫酸亚铁、硫酸锰、硫酸铜、碳酸钙等。
培养通常在温度28~38℃、振荡培养或通气搅拌培养等好氧的条件下进行。pH的调整通过使用无机或有机酸、碱溶液等来进行。
在上述培养条件下培养时,可以高收率地生产聚酮。
培养后,当在菌体内或细胞内生产聚酮的情况下,可以通过实施均质器处理等来使菌体或细胞破碎,从而提取该表达产物。另一方面,当将聚酮输送到菌体外或细胞外的情况下,直接使用培养液、或通过离心分离等去除菌体或细胞。然后,通过硫酸铵沉淀提取等从所述培养物中提取该表达产物,根据需要进一步使用各种色谱等进行分离纯化。
实施例
下面,根据实施例对本发明进行说明,但本发明并不限定于这些实施例。
实施例1和比较例1
<DNA片段的设计>
作为靶序列,设计了3个DEBS PKS基因排列的序列(图1)。3个DEBS PKS基因编码序列从Saccharopolyspora erythraea的红霉素基因簇中获得。对于这3个DEBS PKS基因编码序列,为了在宿主(大肠杆菌)中表达,制备了密码子优化后的DNA。
密码子优化前的GC含量(%):
EryAI:74.2%
EryAII:74.0%
EryAIII:73.9%
密码子优化后的GC含量(%):
EryAI(序列号1):61.7%
EryAII(序列号2):61.5%
EryAIII(序列号3):61.1%
密码子优化后的3个DEBS PKS基因编码序列如序列号1~3所示。将用于在宿主(大肠杆菌)中表达的控制序列(启动子和RBS序列)追加在各CDS之前。将终止子(T)和间隔序列追加在各CDS之后(图1)。通过修改同义密码子,删除了BsaI和AarI的限制位点。
将靶序列分割为28个DNA片段(各~1.1kb),在各片段的两侧邻接BsaI限制位点。28个DNA片段如序列号4~31所示。
为了确认正确的组装,用Genious软件模拟了1pot Golden Gate反应。
<DNA组装>
序列号4~31所示的DNA片段由Twist Biosciences订购,并作为标准克隆载体的克隆DNA提供。
<<大肠杆菌中的Golden Gate组装(比较例1)>>:
在最适合用于大规模组装的反应条件下的1pot Golden Gate反应中,连接使用28个DNA片段。1Pot Golden Gate实验方法参照ACS Synth.Biol.2018、7、11、2665-2674。
具体按照以下顺序来实施。
1)用UV分光光度计(Thermofisher Nanodrop)测量所有的DNA片段的浓度,并调整为制备等摩尔的DNA片段混合物。以1:1和2:1的插入片段:载体的比率添加目标载体(pET-24+)。
2)使用反应容量为25μl的1.5μl的BsaI-HFv2限制性核酸内切酶和0.5μl的连接酶进行组装。
3)长DNA组装的热循环方案使用了以下程序。
(37℃下5分钟→16℃下5分钟)×30循环,接着60℃下5分钟
4)将2μl的组装反应混合物转化为NEB 10-beta电感受态E.coli细胞。
5)从得到的菌落中提取质粒以进行限制模式的验证。
在以下条件下验证了在提取的质粒中是否正确地制备了靶序列。结果如图2所示。
<DEBS PKS Assembly with Golded Gate and E.coli的实验条件>
分取得到的质粒100-500ng,并与2μl的10×CutSmart缓冲液、0.5μl的BamHI(10单位)以及无核酸酶水(最大20μl)进行混合,在37℃下孵育1小时,将靶序列分解为图2所示的片段。
将含1μg/ml的溴化乙锭(Sigma)的100ml的1×TAE缓冲液在120V下进行30分钟电泳,并将凝胶染色20分钟。用长波长紫外线(366mm)照射凝胶,并使分解的DNA片段可视化。
<<枯草芽孢杆菌中的组装(实施例1)>>
1)将所有的DNA片段(序列号4~31)在大肠杆菌中扩增,并进行再提取。
2)用UV分光光度计(Thermofisher Nanodrop)测量所有的DNA片段(序列号4~31)的浓度,并调整为制备等摩尔的片段混合物。
3)利用DNase(Lucigen Corporation)进行处理,并去除混入的线状DNA。
4)相对于各DNA片段,浓度标准化为100ng/μl。
5)将500ng的各DNA片段集中放于管中,用BsaI-HFv2限制性核酸内切酶(NEB)进行处理。
6)为了纯化用限制性核酸内切酶消化的DNA,进行苯酚氯仿处理、丁醇处理、乙醇沉淀。
7)使用透析管进行凝胶提取,从消化的质粒混合物中去除靶片段,并将得到的消化后的靶片段用乙醇沉淀法进行纯化。
8)将消化后的片段与消化的载体(pET-24载体)、1μl的T4 DNA Ligase(TAKARABIO)以及连接酶缓冲液混合,在37℃下孵育3小时后,完成连接,并得到包含编码DEBS PKS的DNA串联重复序列在内的DNA构建体。
9)将包含所述DNA构建体的DNA连接酶溶液与枯草芽孢杆菌感受态细胞混合,将细胞在37℃下进行短时间的孵育后铺展在四环素选择板上。
10)菌落增殖一段时间后,从板上拾起转化子,并在37℃下于2ml LB中增殖一晚。
11)质粒提取按照以往的方案进行,在与<DEBS PKS Assembly with Golded Gateand E.coli的实验条件>相同的条件下验证是否按照预想的那样对得到的DNA进行了组装(图3)。
<结果>
大肠杆菌中的Golden Gate法
如果是用pET-24载体组装的DEBS,则用BamHI进行处理时,可以看到图2左侧所示的图案,但即使反复尝试用大肠杆菌进行组装,在一系列的反应条件和浓度下也不会成功(图2)。
组装
如果是用pET-24载体组装的DEBS,则用BamHI进行处理时,可以看到图3右侧所示的图案。绿色的复选标记表示这样的模式,在枯草芽孢杆菌中的DEBS PKS簇的组装成功,并以高效率进行了证实(图3)。
序列表
<110>丝芭博株式会社
<120>含I型聚酮合酶基因的质粒的制备方法
<130> FP21-0414-00
<150> JP2020-091798
<151> 2020-05-26
<160> 31
<170>PatentIn 3.5版
<210> 1
<211> 10638
<212> DNA
<213>人工序列
<220>
<223>密码子优化后的EryAI
<400> 1
atggccgact tatcgaaact gtcagattcg cgtaccgccc aacccggccg cattgtgcgc 60
ccttggccac ttagtggttg taacgaatct gcccttcgtg cccgcgcgcg ccaactgcgt 120
gcccacttag accgctttcc ggacgccggc gtggaaggcg tgggtgcagc gctggcacat 180
gatgaacaag cagatgcagg cccccatcgt gctgttgtgg tggcaagctc tactagcgaa 240
ctgttagacg gtctggcggc cgtggcggat gggcgcccac atgcctcagt agttcgtggc 300
gtagctcgcc cgtcagcacc tgttgttttc gtatttccgg gtcaaggagc ccaatgggcg 360
ggcatggccg gtgagttgct gggtgagtcc cgcgtgttcg cagcggcgat ggatgcttgc 420
gcacgtgcct tcgaacccgt gacagattgg accctcgcgc aagtactgga ttcaccggaa 480
caaagtcgcc gcgtagaagt agtacagccg gcgctgttcg cagtgcagac gagcctcgca 540
gccttatggc gcagtttcgg ggtgacgcca gacgccgtgg ttggccactc cattggcgag 600
ctggcggcag cacacgtttg tggcgcagcg ggtgcagccg atgcagctcg cgcagcggct 660
ctctggagtc gcgaaatgat tccgttagta ggtaatggag acatggcagc cgttgcgctg 720
tctgcagacg aaattgagcc ccgcatcgcc cgctgggacg acgatgttgt tttagcaggg 780
gtcaacggcc cgcgctccgt tcttcttacg ggctcgccgg agccggtcgc acgtcgcgtg 840
caagaacttt cggccgaggg tgtgcgcgca caggttatta atgtgagcat ggcggcccat 900
tccgcgcagg ttgatgacat tgcggaaggc atgcgctcgg ccctggcatg gtttgcaccg 960
ggtgggagcg aggtgccgtt ttacgccagt ctgaccggtg gtgccgtaga cacccgtgag 1020
ctggttgcgg attactggcg tcgcagcttt cgtctccccg tgcgttttga tgaggccatt 1080
cgtagtgcac ttgaagtggg cccggggacg tttgtagagg catcacccca ccccgtgctt 1140
gccgcagcat tacagcagac cctcgacgcc gaaggctcgt cagccgcggt agtgccaacg 1200
ttacaacgcg gccaaggtgg gatgcgccgt ttcctgctcg ctgccgcgca agcgtttacg 1260
ggcggcgtgg cggtggactg gaccgcggcg tacgatgacg ttggggcgga acctggtagt 1320
ctgccagagt ttgccccagc cgaagaagag gacgaaccgg cagagagcgg tgtggactgg 1380
aacgcaccgc cacacgtgct ccgcgaacgt ctccttgcgg tcgtgaacgg tgaaacggcg 1440
gcattagctg gtcgcgaggc tgatgcagag gcaaccttcc gcgaactcgg cttggatagc 1500
gtcttagcgg cccagttacg tgcgaaggta tcagccgcca ttggacgtga ggtcaatatc 1560
gcactgttat acgaccaccc aacccctcgt gctctggctg aagcgctggc ggcagggacc 1620
gaggttgccc aacgtgagac acgcgcacgt accaacgagg cggcgcctgg cgagccggtg 1680
gccgtcgttg cgatggcctg tcgccttccg ggcggtgtat ccacaccgga agagttttgg 1740
gagttgctct ccgagggtcg tgatgccgtt gcggggttac cgacagatcg cggctgggac 1800
ctggactcgc tgtttcatcc ggatccgact cgtagtggaa ccgcgcatca gcgtggagga 1860
gggtttctga ctgaggccac ggcgttcgac ccggccttct tcggtatgag cccgcgcgaa 1920
gctcttgctg ttgacccgca gcagcgcctg atgcttgagc tctcttggga agtgttggag 1980
cgcgcgggca ttcccccgac ctcacttcaa gcttcaccta caggggtatt tgttggcctg 2040
attccgcaag agtacggccc gcgtttagcg gaaggcggag agggagttga gggctacctg 2100
atgaccggga cgacgacgag cgtggcgagt ggccgcatcg cgtatacgct gggcttagag 2160
ggccctgcta tcagcgtaga caccgcgtgc agtagttcat tggttgccgt acatttggcc 2220
tgtcagagcc ttcgtcgcgg tgagagctct ttagcgatgg ccggtggggt gaccgtgatg 2280
cctacgcctg ggatgctcgt tgacttttca cgtatgaact ctctggcacc cgatggtcgt 2340
tgtaaagcct ttagcgcagg agctaacggt tttggcatgg ccgagggtgc ggggatgctc 2400
ttgttagaac gcttatcgga tgcgcgtcgt aatggtcatc cagtactggc ggttctgcgt 2460
ggcaccgcgg taaattctga cggcgcctca aacggcttga gtgcacctaa tggtcgcgcg 2520
caggtacgtg tgattcagca agctctggcg gaaagtggct tgggtccggc cgacattgat 2580
gcggtggaag cgcatggaac aggtacgcgc ctgggcgatc cgattgaagc acgcgctctg 2640
tttgaagcct atggccgcga ccgtgaacaa ccgttacacc tcggcagcgt caaatccaac 2700
ctgggccaca cccaggcggc ggctggcgtc gcgggtgtca ttaaaatggt cctcgctatg 2760
cgcgccggta cgctgcctcg tacgttacat gcttcggaac gttctaaaga gatcgattgg 2820
tcgtcgggcg caatttctct gttagacgag ccggaaccgt ggccggcggg agctcgtcca 2880
cgtcgtgcgg gcgttagctc attcggcatc tccggcacga acgcccacgc catcatcgaa 2940
gaagcgcctc aagttgtaga gggcgaacgc gtcgaagcag gagatgttgt tgcaccctgg 3000
gttctctcag ccagcagcgc cgagggctta cgtgcgcagg cggcccgtct tgccgcgcat 3060
ctgcgtgaac acccgggcca ggacccacgc gatattgcgt atagtcttgc aactggacgc 3120
gcggccctgc cacaccgcgc cgcatttgca cccgtggatg aaagcgccgc cctgcgcgtg 3180
cttgatggtc tggccacagg gaatgccgac ggcgcggcag ttggtaccag tcgcgcacag 3240
caacgcgccg tgtttgtatt tcctggtcag ggttggcagt gggctggcat ggccgtggat 3300
ttgctggata caagccctgt gttcgccgct gcattacgtg agtgtgcgga cgcactggaa 3360
ccgcaccttg actttgaagt aattccgttc ctgcgtgccg aggcagcacg tcgtgaacag 3420
gatgcggcgt tatctactga acgtgtggat gtcgtgcagc cagttatgtt cgcggtgatg 3480
gtatcgttag ccagcatgtg gcgcgcccac ggggttgaac cggccgcagt gattggtcac 3540
agccaagggg aaatcgcagc agcttgcgtt gccggcgcgt taagtctgga cgacgcagcc 3600
cgtgtggtag ccttacgtag ccgcgtgatc gccactatgc cgggcaacaa agggatggca 3660
agcattgcgg caccagcggg cgaggttcgt gcccgcattg gagatcgcgt cgaaatcgcg 3720
gcggtaaacg ggccgcgtag tgtggttgtg gccggtgact ccgatgagtt agatcgcctc 3780
gtggcatcct gcaccacgga atgtattcgc gcaaaacgtc tcgcagttga ctacgcgtca 3840
cattccagcc atgtcgagac tattcgtgac gcgctgcatg cagaattagg tgaagatttt 3900
catccgcttc ccgggtttgt gccgttcttc tccacggtaa ccggccgctg gacgcagcct 3960
gacgaacttg acgccgggta ttggtatcgt aacctgcgtc gtaccgtgcg tttcgcggat 4020
gccgtacgtg cccttgcaga gcaaggatat cgtacgttct tagaagtgag cgcacacccg 4080
attctcacag cggcgatcga agagattggt gatggcagcg gagcggactt gagcgcaatt 4140
cattccttac gtcgtggcga cggctcatta gccgattttg gcgaggcgct gagccgcgcg 4200
tttgccgccg gtgtcgccgt ggattgggag tccgttcatc ttggtaccgg ggcgcgtcgc 4260
gttccactgc ctacctatcc ctttcaacgc gagcgtgtgt ggttggaacc taaacctgtc 4320
gcgcgccgca gcacggaagt ggatgaagtt tcagcactgc gttatcgtat tgaatggcgt 4380
cctaccggcg cgggcgaacc ggcgcgcctt gacggcacct ggctggtagc taaatatgcc 4440
ggcacggcgg atgagacgtc aacagcggcc cgtgaagccc tggagagcgc gggcgcccgt 4500
gttcgcgagc ttgttgttga tgcccgttgt ggccgtgacg aactcgccga acgtctgcgc 4560
agtgtcggcg aggtagccgg tgtactttca ctgttagcgg tggacgaagc cgaaccggaa 4620
gaagcgccgc tcgcgctggc cagtcttgcg gatactctgt cactggttca agccatggtg 4680
tcagcggaac ttggttgtcc tttatggact gttactgaga gtgccgtagc gaccggtccc 4740
tttgagcgcg tacgtaacgc ggctcacggc gcactttggg gagtgggtcg tgtcattgcc 4800
ttagagaacc cggccgtctg gggcggcctg gttgacgttc ccgccggctc ggttgcggaa 4860
cttgctcgcc acttagcggc ggtggttagt ggtggagcgg gtgaagatca actggcgctc 4920
cgtgcggatg gagtgtacgg ccgccgctgg gtgcgcgcgg cggcccctgc gaccgatgat 4980
gaatggaaac cgaccggaac cgtgcttgtg acaggcggta ccggtggggt aggtggccag 5040
attgcacgct ggctggcacg tcgtggggcg ccgcatctgt tactggtatc ccgctccgga 5100
ccggacgcag atggcgctgg cgagctggtt gcggaattgg aagcacttgg ggcacgcacg 5160
accgtagctg cgtgcgatgt gacggaccgt gaatcggtcc gtgagcttct gggcggcatc 5220
ggtgacgatg tacctctctc ggccgttttc catgcggcag caactctgga cgacggtacg 5280
gtggatactt taaccggcga acgcatcgaa cgtgcgagcc gcgccaaagt gctgggtgcc 5340
cgtaatttgc acgagcttac ccgcgagctt gacttaactg cgttcgtttt atttagtagc 5400
ttcgcgagcg cctttggggc cccgggcttg ggtggatacg cgccgggtaa cgcctatctg 5460
gatggattag cccagcaacg ccgttcagac ggcttgccgg cgacggcagt ggcctggggc 5520
acctgggccg gctccgggat ggccgaaggt ccggttgcgg atcgcttccg ccgtcacggc 5580
gtaattgaaa tgcccccgga aaccgcgtgt cgcgctctgc aaaacgcact cgaccgtgcc 5640
gaggtatgtc cgatcgtaat cgatgtgcgt tgggaccgtt tcttactggc ctataccgca 5700
caacgcccga cgcgcctgtt cgacgagatc gatgatgcgc gccgcgcggc cccgcaggcg 5760
gcggccgagc ctcgtgttgg agctttggcc agtctgcctg caccggagcg cgagaaagcc 5820
ctgttcgaac tcgtgcgcag ccatgctgcg gcagtactgg gccacgcgag cgccgagcgt 5880
gtccctgcgg accaagcatt cgccgaactt ggcgtggact cgttatcggc gcttgaactg 5940
cgtaatcgcc ttggcgcggc caccggcgta cgtctgccga cgacgaccgt gtttgaccat 6000
ccggatgttc gcaccctggc ggcccatctg gcggccgaac ttggtggtgc cactggagcc 6060
gaacaggcgg cgccggccac caccgcgccg gtagatgagc cgatcgcaat tgttggcatg 6120
gcgtgtcgcc ttccgggtga agtcgactcg ccggagcgtc tttgggagtt aatcacaagt 6180
gggcgtgatt ccgctgccga agtacccgat gatcgcggct gggtgccaga tgagctgatg 6240
gcctctgacg cagcaggtac ccgccgtgcg cacggtaact ttatggcggg cgcaggagac 6300
tttgatgctg cattctttgg aatttctcca cgtgaagcat tggcaatgga cccacaacaa 6360
cgtcaagcct tagagactac ctgggaagca cttgaaagtg ctggtattcc gccagagacg 6420
ttacgcggct cggacacagg cgtattcgtc ggcatgagcc atcaggggta cgccacaggc 6480
cgtccgcgtc cagaagatgg tgttgatggc tatctcttga ccggcaatac agccagcgtg 6540
gcaagcgggc gcatcgccta tgtgctgggc ctcgaaggac cggcgttaac tgttgatact 6600
gcatgtagtt cgtctctggt ggctctgcac accgcatgcg gcagcttacg cgacggcgac 6660
tgtggcttgg cagttgcagg cggtgtgtca gtgatggccg ggcctgaagt tttcaccgaa 6720
ttttcgcgtc aaggtgccct ttctcctgac ggacgctgca aaccctttag cgatgaggcc 6780
gacggctttg gtcttggtga aggtagcgct ttcgtcgtcc tgcaacgtct tagtgatgca 6840
cgccgtgaag gccgccgcgt gttaggcgtg gtggcgggca gtgctgtgaa tcaggacggt 6900
gcatcgaacg gattaagcgc gcccagcgga gtggcgcagc aacgcgtcat tcgtcgcgca 6960
tgggctcgtg caggtattac aggtgcagat gtcgcggtgg tcgaggcgca cggtacaggc 7020
acccgccttg gtgaccctgt ggaagcctca gcccttttgg ccacgtacgg taaaagccgt 7080
ggctcgtctg gcccggtttt actcggatct gtgaaaagca acattggaca tgctcaggcc 7140
gcagccggcg ttgctggtgt gattaaagtc ctgcttgggc ttgagcgtgg agtagtgccg 7200
cccatgctgt gccgtggcga gcgttccggt ctgattgatt ggtctagcgg tgagattgaa 7260
cttgccgacg gtgtccgcga gtggtcccct gcagccgacg gggttcgtcg cgcgggagta 7320
agtgcattcg gtgtaagtgg taccaacgct cacgtgatta ttgcagaacc gccagaaccc 7380
gagccggtcc cgcaacctcg tcgcatgtta ccggcgactg gcgtcgtgcc tgtcgtgctg 7440
tctgcccgta caggggcggc actgcgcgcc caagctggac gcttagctga tcacttagcc 7500
gcgcacccgg gcattgctcc agccgacgtc agctggacca tggctcgtgc acgccaacac 7560
ttcgaagaac gcgccgccgt attggccgcg gacaccgcag aggccgtgca tcgtttgcgc 7620
gccgttgccg acggagcagt cgttcctggc gtggtcacag gtagcgcctc tgacggtggt 7680
tcggttttcg ttttccccgg ccagggcgcc caatgggaag gcatggcccg cgagctcctg 7740
ccagtaccgg tgttcgcaga aagtattgcg gaatgcgatg ctgtgctgag cgaagtggcc 7800
ggattttccg tctctgaagt actggagcct cgtccggatg cgccgtctct ggagcgtgtt 7860
gacgtagtgc aacctgtgct tttcgccgtg atggtgtcac tggcccgcct gtggcgcgca 7920
tgtggcgcag tcccatctgc cgtgattggc cattcacagg gcgagattgc tgcagcagtt 7980
gtagctggtg cgttgtcctt agaggacggc atgcgcgttg ttgcgcgccg ctcgcgtgcc 8040
gtccgcgctg tagcggggcg cggctccatg ctgtcggtcc gtggtgggcg ctcagacgtt 8100
gagaaactgt tagccgatga cagctggacc ggccgcctgg aagtagccgc cgtcaacggt 8160
cctgatgcag tggtcgtggc cggcgacgcg caggcagcgc gcgaatttct ggagtactgc 8220
gaaggcgtag gcattcgcgc ccgtgcaatc ccggtggact atgcatcgca cacggctcat 8280
gtggaaccgg ttcgtgatga gttagtacaa gccctcgcgg ggattacacc tcgtcgcgca 8340
gaagtacctt tcttctcgac cttgactggt gacttcctgg acggcacgga gcttgacgcc 8400
ggctactggt atcgcaatct gcgccatccg gtcgaatttc actctgcagt ccaagcttta 8460
acggatcaag ggtacgcgac ctttattgag gtgagtccgc atcctgtgct cgcatcaagc 8520
gtgcaggaaa cccttgatga tgcagaatcc gacgccgcag tacttggaac cctggagcgc 8580
gacgctggtg atgcggatcg ctttctgact gcacttgcgg atgcgcacac gcgcggagtc 8640
gcagtcgact gggaagcggt actgggacgc gcagggttgg tggatcttcc tggataccct 8700
ttccaaggta aacgcttctg gctgctgccg gatcgtacga ctccgcgcga tgaattggat 8760
gggtggttct accgcgtaga ttggacagaa gttccgcgta gcgaacccgc cgcgctgcgc 8820
ggccgttggc ttgtggttgt gccggaagga cacgaagaag atggctggac ggtggaagta 8880
cgctcggcat tagccgaggc aggagcggaa ccagaggtta cgcgtggagt gggtgggctg 8940
gttggtgatt gcgcaggggt cgtcagcctg ctggccctcg aaggggacgg cgccgttcaa 9000
acgctcgtac tggtgcgcga attagatgcg gaaggcattg atgcgccact ctggacggtt 9060
actttcggtg cagttgatgc ggggagcccg gtcgcacgtc ctgaccaggc caaactctgg 9120
ggtctgggcc aagtggcgtc attagaacgt ggcccgcgct ggactggtct ggttgacctg 9180
ccgcacatgc cagaccctga gcttcgtgga cgcctgacgg ccgtccttgc cggaagcgag 9240
gaccaagttg cggttcgcgc tgacgccgtg cgtgcccgcc gtctgtcacc ggctcacgtt 9300
acagcaacgt cagaatatgc tgtcccgggc ggcacgatct tagtgacagg cggcacggca 9360
ggattaggtg ccgaggttgc tcgctggtta gctggccgcg gggccgaaca tttggcactg 9420
gttagccgcc gcgggcctga taccgaaggc gtaggtgact taaccgccga gctgacacgc 9480
ctgggtgcgc gcgtgagtgt gcatgcatgt gatgttagct cacgtgagcc ggtgcgcgag 9540
cttgttcatg gcctgattga acaaggcgat gtagttcgcg gagttgtgca tgcagcaggt 9600
ttaccccaac aagtggccat caatgacatg gatgaggcag cgtttgacga agtagttgca 9660
gcgaaagcgg gcggggccgt gcacctggac gaattatgct cagatgcgga actgtttctc 9720
ttatttagct ccggtgccgg tgtatggggc tctgcccgcc agggagcgta tgcggcgggc 9780
aacgcctttc tggacgcgtt cgctcgccac cgccgtggtc gtggtttacc cgcgactagc 9840
gtggcgtggg gactctgggc ggcgggcggg atgaccggcg acgaggaagc cgtctcattc 9900
ttgcgtgaac gtggagtccg tgcgatgccg gtaccgcgcg ccctggcggc gctcgaccgt 9960
gttctggcga gtggggaaac tgcagtcgtg gtaactgacg tcgactggcc ggcgttcgcc 10020
gaatcataca ccgcggcacg cccgcgtcct ctgttagatc gcattgtgac caccgcacca 10080
tcagagcgtg cgggtgagcc agaaacggaa tcgcttcgcg atcgtctcgc tggattacca 10140
cgcgctgagc gcaccgcgga actggtacgc ttagtacgta ctagtaccgc gaccgtcttg 10200
ggccacgatg atccaaaggc ggtccgcgcc acgaccccgt ttaaagaatt aggcttcgat 10260
agcttagccg ctgttcgttt acgcaactta ctcaatgcag ccaccggcct gcgtctgcct 10320
agtacgctgg tattcgacca cccgaacgcg agtgccgtgg ctggtttcct ggacgccgag 10380
cttggtactg aagtgcgtgg cgaggctcca tcggctctgg ccggacttga tgcactggaa 10440
gcggcccttc ctgaggtacc tgccaccgaa cgtgaagagc tggtgcaacg cttagaacgt 10500
atgttagcgg ctttacgtcc agtcgcacag gctgcagacg caagcggtac aggtgcaaat 10560
ccgagcggag atgatctggg tgaagcaggc gttgacgagc tccttgaggc cctcggccgc 10620
gagttagacg gggactaa 10638
<210> 2
<211> 10704
<212> DNA
<213>人工序列
<220>
<223>密码子优化后的EryAII
<400> 2
atgacagatt cagagaaagt tgcagagtac ttgcgccgcg ccacgcttga ccttcgtgcc 60
gcgcgccaac gcattcgtga gctggaaagc gatcccattg cgatcgtctc gatggcgtgt 120
cgtctgccgg gtggtgtgaa caccccacaa cgtttatggg agctgctccg tgagggcggg 180
gaaaccttgt cgggctttcc caccgatcgt ggctgggacc ttgctcgttt gcatcacccg 240
gacccggata atccaggaac gtcttatgtt gataagggcg gtttcctgga tgacgccgca 300
ggatttgacg ccgagttctt cggcgttagc ccgcgtgaag ccgccgccat ggatccccaa 360
caacgtttac ttctcgaaac gagctgggaa ttagtggaga acgcgggtat tgaccctcat 420
agtctgcgcg gaaccgcgac gggtgtgttt ctgggcgtgg cgaagttcgg gtacggagaa 480
gatacagccg cggctgaaga tgttgaaggc tacagcgtga ctggcgtcgc acccgcggtt 540
gcctctggtc gtattagcta tacgatgggc ctggaagggc cgagcatcag cgtggacact 600
gcgtgcagca gctcgctggt ggcgttgcac ctggccgttg agagtctgcg caaaggtgag 660
agtagtatgg cggtagtggg tggtgccgcc gtcatggcga cgcccggagt ctttgtcgac 720
ttctcccgtc agcgcgcact cgccgcagat ggacgtagta aagcgtttgg cgccggtgcc 780
gatggtttcg ggttctcaga gggtgtcact cttgtgttac tggagcgtct ttcagaggca 840
cgtcgtaatg gacacgaagt tttagctgtt gtgcgtggat cggcgttaaa ccaggatggc 900
gcatccaacg gattgagcgc gccatcgggc ccggcccaac gccgcgtaat tcgccaagcg 960
ttagaatcgt gtggtcttga acctggcgat gttgatgcgg ttgaggccca cggcaccggc 1020
actgctttag gcgacccgat cgaagcgaac gccctgctgg acacctatgg acgcgatcgc 1080
gatgcagatc gcccgctttg gttaggctca gtcaagagta atattggaca cacccaggca 1140
gcagcgggtg ttaccggctt acttaaggtg gtcctggcat tacgtaacgg cgagctgcca 1200
gccaccttac atgttgagga gcccacaccg cacgtcgatt ggtcatctgg cggtgtggcc 1260
ctgttagccg ggaaccagcc gtggcgccgc ggggagcgta cccgtcgtgc ggcagtgtca 1320
gcatttggca tctcgggtac caatgcccat gttatcgtag aagaggcccc ggaacgcgag 1380
catcgtgaaa ccactgccca cgatggtcgc ccagtgccgt tagtggtgag cgcgcgtagc 1440
acggcggcac ttcgcgccca agcggcacaa attgccgaac tcttagaacg cccggacgca 1500
gatcttgctg gcgttggatt aggcctggcc actacccgtg cgcgccatga acaccgcgcg 1560
gctgtcgtgg cgtccacacg tgaagaagcg gttcgcggtc tgcgcgaaat cgcagccggt 1620
gcggccactg cggatgccgt agtggaaggc gttaccgagg tggacggtcg caatgtggtt 1680
ttcctctttc ctggtcaggg ctcgcagtgg gcgggcatgg gcgcagaact cctttcaagc 1740
agtcctgttt tcgcaggaaa gattcgtgcg tgcgacgaaa gcatggcgcc gatgcaagat 1800
tggaaggttt ctgatgtgtt acgccaagca ccaggagcgc caggcctcga ccgcgtagac 1860
gtagttcaac ccgtgctgtt tgctgtcatg gtgtcgttag ctgagctttg gcgctcatac 1920
ggcgtggagc cggcggctgt cgtgggccat tctcaaggtg aaattgcagc ggcccacgtg 1980
gcaggagcac tgaccttgga agatgcggca aaactcgtcg tgggtcgcag ccgcctgatg 2040
cgctcattgt ccggagaggg cggcatggcg gcggtggcgc ttggtgaagc ggcggtgcgt 2100
gagcgtctcc gtccgtggca agatcgcctg tcagtagctg cagttaatgg ccctcgcagc 2160
gttgtagtaa gtggcgagcc gggtgcgctt cgcgcctttt cagaggactg tgcggccgag 2220
ggcatccgcg tccgtgacat cgacgtcgat tatgccagcc attcacctca gatcgagcgc 2280
gtccgtgaag agctgctgga aaccactgga gacattgccc cgcgccccgc gcgcgtgacg 2340
tttcattcaa ctgtggaatc ccgctcgatg gacggcaccg aactggatgc ccgctactgg 2400
taccgcaatc tgcgtgagac ggtgcgcttt gcggacgcgg tgactcgttt ggccgagagc 2460
ggttatgatg cgtttatcga ggtttctccg cacccggtgg ttgtgcaggc cgtggaagag 2520
gctgtggaag aggcggatgg ggcggaagat gccgtggttg ttggatctct gcatcgtgac 2580
ggtggcgatc tgagcgcgtt cttacgtagc atggccaccg cccacgtttc aggggtcgac 2640
atccgttggg acgtagcatt gccgggtgct gcgccgttcg cactgccgac gtacccgttc 2700
caacgcaaac gctattggct tcagcctgcg gcaccggcgg ccgccagcga tgagcttgcg 2760
taccgtgtga gctggacccc tattgaaaag ccggaatctg gcaacctgga cggcgattgg 2820
ctcgttgtta cgccgctgat tagcccagag tggacagaaa tgttatgtga agccatcaat 2880
gccaatggcg gccgcgcctt acgctgtgag gtggacacca gcgcgtcccg tactgaaatg 2940
gctcaagccg tggcccaggc cggtaccggc ttccgtggag ttctgtcatt attaagcagt 3000
gatgagagcg cctgtcgtcc gggcgtgccg gcgggcgccg tagggcttct cactttggtc 3060
caagccctcg gcgacgcagg cgtcgatgcg cccgtttggt gtctgaccca aggagccgtt 3120
cgtaccccgg cagatgacga tctggcccgc ccggcccaga caaccgcaca tggattcgcc 3180
caagttgccg gcctcgaatt accgggccgt tggggtggcg tcgttgatct tccggagagc 3240
gtggacgatg cggcactgcg tttattagtg gctgtgttgc gcggtggcgg ccgcgcagag 3300
gaccacctgg ccgtacgtga tggccgtttg catggccgcc gcgtcgtacg tgctagcctg 3360
ccgcagagcg ggtcacgttc ttggactccc cacggcactg tattggtcac tggggctgct 3420
tcgcccgtcg gtgaccaact cgtgcgttgg ctcgccgacc gtggcgctga acgtttagtc 3480
cttgcaggcg cgtgcccggg agacgatctg ctggccgccg tggaagaagc tggcgcctca 3540
gcagtagtgt gtgcccaaga cgccgcggcc ctgcgcgaag cgctcggcga tgaacccgtt 3600
accgcccttg tacacgcggg taccttgacc aattttggta gcatctcaga ggtggcgccg 3660
gaagaatttg cggaaaccat tgcggcgaaa accgccctct tagccgtact ggatgaagtc 3720
cttggtgacc gtgcagtcga gcgtgaagtg tactgttcgt ctgtggcggg tatttggggc 3780
ggtgcgggta tggcggcgta cgcggcgggt agtgcgtacc tcgacgcatt agctgagcat 3840
caccgtgctc gtggtcgtag ctgcacgtca gtggcatgga cgccgtgggc attacccggc 3900
ggcgcggtgg acgacggtta tctccgtgag cgcggcctgc gcagcttgag cgctgatcgc 3960
gcgatgcgta cctgggagcg tgtcttggca gcgggtcccg ttagcgtggc ggtcgccgac 4020
gtcgattggc cggtactgag cgaaggattc gcagcgacgc gcccgaccgc cttattcgcc 4080
gaattagccg gccgcggcgg acaagctgaa gccgagcccg atagtggccc cactggcgag 4140
ccggcgcagc gcttggcggg cctctcacct gacgagcagc aggagaactt acttgagtta 4200
gtcgcaaatg ccgtggcaga ggttttaggc catgagtcgg cagccgaaat caatgttcgt 4260
cgcgcgttct ctgagcttgg attggattct ctgaatgcta tggctcttcg taaacgttta 4320
tctgccagca ccggattacg ccttcctgcg agcttggttt tcgaccaccc gacagttact 4380
gccctggcgc agcacttacg cgcccgtctt gtcggtgacg cggatcaagc tgcggtacgc 4440
gtagttggtg cagcggacga atccgaaccg atcgctattg ttggtatcgg ttgtcgtttt 4500
ccgggcggca ttggatcgcc cgagcaatta tggcgcgttc ttgctgaggg tgcgaatctg 4560
acaaccggtt tcccggctga ccgcgggtgg gatatcggcc gtttatatca tcctgatccg 4620
gataatccgg gcacatccta cgttgataag ggcggcttcc ttacggatgc cgcagatttt 4680
gacccggggt tcttcggtat tacccctcgc gaggcgctgg ccatggatcc gcagcagcgc 4740
cttatgcttg agacggcctg ggaagccgta gagcgtgcag gcatcgaccc cgacgcctta 4800
cgcggaacgg acacaggagt tttcgtgggc atgaacggac aatcttatat gcaattactt 4860
gcgggtgagg cggaacgcgt cgacggctac cagggcttgg gtaacagcgc gagcgtcctc 4920
agcggccgca ttgcctacac gttcggttgg gaaggtcctg cgttaacagt ggatactgca 4980
tgttctagca gtttggtggg tattcattta gcgatgcaag cccttcgtcg cggcgaatgc 5040
tcactcgctt tggcgggtgg cgtaacggtc atgtctgacc cgtacacctt cgttgatttc 5100
agcacgcagc gtggccttgc gagtgacggt cgctgtaagg ccttcagtgc gcgtgcagac 5160
ggtttcgcct tatcagaggg tgtcgcggcc ttagtgttgg agcccctcag tcgtgcgcgt 5220
gctaatggcc accaagtgct tgccgtcttg cgcggcagcg cggtcaatca ggacggtgcc 5280
agcaacgggc tggcggcccc taatggtccg agccaggaac gtgtgattcg ccaagcctta 5340
gccgcgagcg gagtgccggc ggcagatgtg gacgtggtag aggcccacgg tacaggcaca 5400
gaactgggtg acccgattga ggccggagcg ttgattgcca cgtatgggca ggaccgcgat 5460
cgtccactgc gtctgggaag cgtgaaaacc aatattggcc atacgcaagc cgctgcaggg 5520
gcggctggtg tcatcaaagt cgtgctcgca atgcgccacg gtatgttgcc acgctcgctt 5580
cacgcagatg agttaagccc tcatattgac tgggaatctg gcgccgtgga agtgctccgt 5640
gaggaagttc cgtggccggc cggggagcgt ccacgccgcg caggcgttag ctcgtttggc 5700
gttagcggaa ctaatgccca tgtgattgtt gaagaagccc cggcggaaca agaggccgcc 5760
cgcaccgaac gcggtccgct gccgtttgtg ctctcgggcc gctccgaggc ggttgtcgcg 5820
gcgcaggcac gtgccttagc cgaacatctg cgtgatacac ctgagttagg cctgactgat 5880
gcggcctgga cgctggccac gggtcgtgcc cgttttgacg tacgcgccgc ggttttaggc 5940
gacgaccgtg cgggtgtgtg tgccgagtta gatgccttag cggaagggcg tccctcagcg 6000
gatgccgtag cgccggtcac ttccgccccg cgcaaacctg tactcgtctt tccgggtcag 6060
ggtgcgcaat gggtcggtat ggcccgtgat ctgctggaga gtagcgaagt tttcgcggag 6120
tccatgagcc gttgcgcaga ggccctgtca ccccataccg attggaagct cttggatgtt 6180
gttcgcggtg atggcggacc ggatcctcac gagcgtgtcg atgtgttaca gccggtgctg 6240
ttcagcatca tggtttctct tgcagagctg tggcgcgcgc acggcgtaac cccggcagcg 6300
gtcgtaggtc actcacaagg cgaaatcgct gcggctcatg tagcgggcgc gcttagtctt 6360
gaggccgcag ccaaagtggt ggcgctccgc tcccaggtat tgcgtgaact ggacgatcag 6420
ggtggcatgg tgtcggtggg cgcaagccgt gacgaactgg aaaccgtgct tgcgcgttgg 6480
gatgggcgtg tcgccgtggc agcggtcaac gggccgggta cctcggtggt cgccgggcca 6540
acggccgaat tggatgagtt cttcgccgaa gccgaggctc gcgaaatgaa gccccgtcgt 6600
atcgccgtac gctacgccag tcattcgcca gaggtagccc gtattgagga ccgtcttgca 6660
gcagagctgg gtacaatcac cgcggtccgt ggttcagtgc cgctgcatag cactgtaacc 6720
ggggaagtaa tcgatacctc agcgatggac gcgtcctatt ggtatcgtaa cttacgccgc 6780
ccggttttat tcgagcaagc agttcgtgga ctcgttgagc agggcttcga caccttcgtc 6840
gaggtcagtc ctcatcccgt gctcttgatg gctgtagaag aaaccgcgga gcacgcgggt 6900
gccgaggtaa cttgtgtacc cacattacgt cgtgagcaaa gcggccctca tgagttctta 6960
cgtaacttat tacgtgcgca cgtgcacgga gttggcgccg atcttcgtcc agccgttgct 7020
ggtggccgcc ccgccgaact tcctacatat ccatttgaac atcaacgctt ttggccgcgc 7080
ccgcatcgcc ctgcggacgt gagcgcattg ggtgtacgcg gggccgagca tccgttgctg 7140
ctggctgcgg tagatgtccc aggccatggc ggtgcggtgt tcacgggccg tctgagtaca 7200
gacgagcaac cgtggctcgc tgagcatgtg gtaggcggcc gcaccttagt tccgggttct 7260
gtgctggttg acctggcact cgcagcgggt gaagatgtag gtttacctgt gttggaagag 7320
ttggtgcttc agcgcccgtt agtgttagca ggggccgggg cgcttctccg catgtcggtg 7380
ggagcccccg acgaaagcgg acgtcgcaca atcgacgttc atgcggcgga agatgtagcg 7440
gacttagctg atgcgcaatg gtcacaacac gcaacgggca cgctggccca aggcgtggcc 7500
gcgggtccgc gtgacaccga acagtggccc ccggaagatg cggtgcgcat cccgcttgac 7560
gatcactatg acggactcgc ggaacagggc tatgaatacg gaccttcgtt ccaagcctta 7620
cgcgcggcgt ggcgcaagga tgatagtgtc tatgcagagg tttcgattgc ggcagacgaa 7680
gaaggttatg ccttccatcc ggtccttttg gatgcggttg cccaaacctt gtcgttaggg 7740
gctttaggcg agccgggtgg cggcaaattg ccgtttgcat ggaacactgt gacactccac 7800
gcgtccgggg ctactagtgt tcgtgtggtg gcgacgccag cgggcgcgga cgcaatggcg 7860
ctccgcgtga cagaccccgc agggcatctg gtcgcgacgg tcgattcatt ggtggtgcgc 7920
agcaccggtg agaaatggga acagcccgag ccgcgtggcg gtgagggcga attacatgca 7980
ctggactggg tgcgtctcgc ggaaccgggg tcgaccggac gcgttgttgc agcggacgcc 8040
agtgatttag acgcagtcct tcgcagtgga gagccggagc cggatgccgt gctggtacgc 8100
tacgaaccag agggtgatga cccgcgcgca gccgctcgcc acggcgtatt atgggcagcc 8160
gcgttggtcc gccgctggct tgaacaggaa gagttaccgg gcgccactct ggttatcgcg 8220
actagcggcg cggtcacagt ctctgatgac gactcggtgc cggagccggg cgcggcggcc 8280
atgtggggcg tgatccgttg tgcacaagcg gagtcaccgg atcgctttgt tctgctcgat 8340
acagatgccg agcccggaat gctgccggcg gtgccggaca atccccaact ggcgttgcgt 8400
ggtgacgatg tatttgtgcc gcgtttatcc ccgctcgcac cttcggcact gactttaccg 8460
gcgggtaccc agcgtcttgt acccggagat ggggccattg attccgtagc cttcgagccg 8520
gcgcctgacg ttgagcaacc gctccgtgcc ggcgaagtgc gtgtagatgt ccgcgcgacc 8580
ggtgttaact tccgcgacgt tcttcttgca ctgggcatgt acccgcagaa ggcagatatg 8640
ggaacagagg ccgcgggcgt agtaacggca gttggcccgg acgtggacgc tttcgccccc 8700
ggcgatcgtg tactgggact tttccaaggc gcctttgcgc cgattgcggt aacggaccat 8760
cgcctgttgg cacgtgttcc agacggatgg agcgacgcag acgctgctgc ggtacctatt 8820
gcgtacacca cagcgcatta cgccctgcac gatttagccg gccttcgtgc aggccagtca 8880
gtgcttatcc atgccgcggc cggtggcgtt ggtatggctg ccgtggccct tgcgcgccgt 8940
gccggcgcgg aagttttagc cacagcgggt ccagccaaac atggcacgtt acgtgcgctg 9000
ggcttagacg atgaacacat tgcgagttct cgcgagacag gttttgcgcg taaattccgt 9060
gagcgtaccg gtggacgcgg cgtcgatgta gtgttgaaca gtttaaccgg cgaactctta 9120
gacgagagcg ccgaccttct tgcagaggac ggtgtattcg tagaaatggg taaaaccgat 9180
ctgcgcgacg caggcgattt ccgcggccgt tacgcgccgt ttgacttggg cgaggcgggc 9240
gatgaccgcc tcggcgaaat tcttcgcgaa gtggtgggcc tgcttggcgc tggagaactg 9300
gatcgtctgc cggtttcagc ctgggaatta ggcagcgcac ccgcagcgct tcagcacatg 9360
agccgcggac gccacgtcgg caaactggtc ttgacccaac cggctccggt agatccagac 9420
ggcactgtgc tgattactgg cggaacagga actctgggtc gcttactggc ccgccacttg 9480
gtcacggaac acggcgtgcg tcatctgctt ctggtttcac gtcgcggcgc agacgcccct 9540
gggagtgatg aacttcgcgc agaaatcgag gacttaggtg cgagcgcaga aatcgcagcg 9600
tgcgatactg cagatcgcga cgccctgtcg gcgcttcttg atggcctgcc tcgtccctta 9660
accggagtcg tgcatgcagc cggtgtcctg gccgatggcc tggtcacaag catcgatgaa 9720
ccggcggtcg agcaagtact tcgcgcaaaa gtggatgcgg catggaatct gcacgagtta 9780
accgccaata cgggcctctc cttctttgtt ctgttcagtt ccgcggcgtc ggttctcgcg 9840
ggaccgggac agggtgtata tgcagccgct aacgaaagcc tgaatgccct ggccgcgctt 9900
cgccgcacac gtgggttacc ggccaaagcg ctcggatggg gcttgtgggc acaggcgtcg 9960
gagatgacgt ccggccttgg cgaccgcatc gcgcgtactg gtgtagcggc gctgccaacg 10020
gaacgcgccc tggccttgtt tgatagcgcg ttacgtcgcg gcggtgaagt agttttccct 10080
ctgtcaatta accgcagcgc attgcgtcgc gcggaattcg tgccggaagt gctgcgtggt 10140
atggtccgcg cgaagttgcg cgcggcgggc caagccgaag cggcgggccc gaacgtcgtg 10200
gatcgcctcg ccggccgttc cgaatcagac caggtcgcgg gtcttgcgga gcttgtgcgt 10260
tcacatgcag cggctgtctc cggctatggc agcgcggatc aattaccgga gcgtaaagca 10320
tttaaggacc ttggctttga cagccttgcg gccgtagagc tgcgcaatcg tctgggcact 10380
gcgaccggtg tacgtttgcc ttcaacgctg gtgtttgacc acccgacgcc cctcgctgta 10440
gcggagcacc ttcgcgaccg cctcttcgca gcgagtccgg cggttgacat tggtgaccgt 10500
ctcgacgaac ttgaaaaggc attagaggct ctcagcgcag aagatgggca cgatgatgtt 10560
ggtcaacgcc tggagagcct gctccgtcgc tggaattccc gccgtgctga tgcaccgagc 10620
accagcgcga tctctgaaga tgcatctgac gatgaactgt ttagcatgtt ggaccagcgt 10680
tttggcggcg gcgaagatct ctaa 10704
<210> 3
<211> 9516
<212> DNA
<213>人工序列
<220>
<223>密码子优化后的EryAIII
<400> 3
atgagtggag acaatggcat gacggaagag aaactgcgtc gttatctgaa acgtactgtc 60
actgaattgg atagtgtgac agcgcgcctg cgtgaagtcg aacaccgcgc cggcgaaccg 120
attgcgattg tggggatggc atgccgtttc ccaggtgacg tagattcgcc ggagagtttc 180
tgggagtttg taagcggcgg cggtgacgcg attgcggaag cgcctgcgga tcgtggctgg 240
gagcctgatc cggatgcacg tcttggtgga atgctggcgg cggcagggga ttttgatgcc 300
ggcttcttcg gcattagccc acgtgaagca ttggccatgg atccgcaaca acgtattatg 360
ttggaaattt cgtgggaagc gctggagcgc gctggtcatg accctgtgag tttgcgcggg 420
agtgcgaccg gggtgttcac cggagtgggg accgtggact atggcccccg tccagatgaa 480
gcacctgacg aagttttagg ttatgtgggc acgggaactg ctagcagtgt agcctcgggg 540
cgcgtggcgt attgcctggg acttgagggc ccagccatga ctgtagatac agcctgcagc 600
agtggcttaa ctgctctgca ccttgcaatg gagagtttac gccgcgatga atgtggtctt 660
gcgttagcag gcggtgttac tgttatgtct agtccaggcg cgttcacgga atttcgttcg 720
cagggtggac tcgcggccga cggccgttgc aaaccatttt cgaaagccgc ggatggtttc 780
ggcttagccg aaggcgcggg tgtccttgta ctgcagcgtc tgagcgctgc gcgtcgcgag 840
ggtcgcccgg tattggcagt cctgcgcggt agcgcggtaa accaagatgg agcatcgaat 900
ggtcttacgg cgccgtcagg cccggcccag cagcgtgtta tccgtcgtgc tctggaaaat 960
gcgggcgtcc gcgcaggcga tgtggattat gtcgaagctc acggaacggg cacgcgctta 1020
ggcgacccca tcgaggttca cgcgctctta tctacttatg gcgccgagcg cgatccggat 1080
gacccgcttt ggatcggctc cgtgaagagc aacatcggtc acacccaggc ggctgcgggt 1140
gtggccggtg ttatgaaggc agtgttagcg ctgcgccatg gcgagatgcc tcgcacgctg 1200
catttcgacg aaccgtcacc gcagatcgag tgggacttag gtgccgtttc tgtggtgtca 1260
caagcgcgca gctggccagc gggcgagcgc ccgcgccgcg caggagtgtc atcttttggt 1320
atctctggca ctaacgcaca cgtcatcgtg gaagaggcgc cggaagcaga tgagccggaa 1380
cccgctccgg acagtggccc agttccactt gtgctcagcg ggcgcgacga gcaagcaatg 1440
cgtgctcaag cgggccgtct ggcggaccac ctggcgcgtg aaccacgcaa ctcgctgcgt 1500
gatacgggat ttacattagc aacccgccgc agcgcgtggg agcatcgcgc agtcgttgtg 1560
ggagatcgcg acgatgccct ggcgggtttg cgcgctgttg ctgatggccg tatcgccgat 1620
cgcaccgcga ccggtcaggc tcgcacccgt cgcggcgttg ccatggtgtt tccgggtcaa 1680
ggtgcgcagt ggcaagggat ggcgcgcgac ctgcttcgtg agagccaggt gtttgccgat 1740
tcaattcgtg actgcgagcg tgctttagct ccacatgtcg actggtcatt aacggacttg 1800
ctctctggcg cccgcccgct ggatcgcgtg gacgtggtgc agcctgcgct ctttgcagtg 1860
atggtgtcat tagcggcctt atggcgttct cacggggtcg agcctgccgc cgttgtaggc 1920
cattcgcaag gtgagattgc ggctgcccac gtagcgggtg cacttacgtt ggaagatgct 1980
gctaaacttg ttgcagttcg ttcgcgtgtg ttacgtcgtt taggcggcca gggcgggatg 2040
gcaagcttcg gcctcggtac cgaacaagcg gccgagcgta tcggccgctt tgcgggtgcc 2100
ttatctattg cctcggttaa tggaccgcgt tcggtggtgg tagccggaga gagcggcccg 2160
ctggacgaat taatcgccga gtgtgaggct gagggcatta ccgcgcgtcg tatcccggtg 2220
gattacgcct cgcattcacc gcaggtagag agcctgcgcg aagagctctt aacggagtta 2280
gccggtattt caccggtttc cgctgacgta gccttatatt caacgaccac aggccagcct 2340
attgatacag caacaatgga caccgcctat tggtacgcga acttacgcga gcaagtgcgc 2400
ttccaagatg cgacccgcca attagcagag gcaggctttg acgctttcgt tgaggtaagt 2460
ccgcacccgg ttttgaccgt gggaattgag gccaccttag acagcgcact gccggcagac 2520
gcgggtgcat gtgtcgtggg cactctgcgc cgcgaccgcg gcggtttagc cgattttcac 2580
acagccctgg gcgaagccta tgcccagggt gtagaagttg attggtcgcc tgcgtttgca 2640
gacgcgcgcc ctgtggaact gccggtttac cctttccagc gccaacgtta ttggcttccg 2700
attccaactg gtggccgcgc gcgcgatgag gacgatgact ggcgctacca ggtggtttgg 2760
cgcgaggccg aatgggaatc agcatctctg gcgggtcgcg ttctgttagt aaccggtccg 2820
ggtgtcccgt ccgaactgtc ggatgcgatc cgctctgggc tcgaacagtc aggagcgacc 2880
gtgttaacct gtgacgtgga aagccgtagt acgattggta ccgctcttga agccgcggat 2940
acagatgccc tgagcaccgt agtaagcctg ctttcgcgcg atggcgaagc cgtggatcca 3000
tcgctggacg cgttagctct cgtgcaagcg ttgggcgctg cgggagtaga ggccccgtta 3060
tgggtgttga cccgtaacgc ggtgcaggtt gcggatgggg aattagtgga cccggcgcaa 3120
gcaatggttg gcggtcttgg tcgcgttgtt ggaatcgaac aacctggccg ctggggtggt 3180
ttagtagact tagtcgacgc ggatgccgca agcattcgta gccttgcggc agtactggcg 3240
gaccctcgtg gtgaagagca agtcgctatt cgtgcagacg gtattaaagt tgcccgtctg 3300
gtgccggccc ctgcccgcgc cgcacgtacg cgctggagcc ctcgcggaac cgtgttagta 3360
accggtggca ccggtggtat cggcgcccac gtggcgcgct ggttagcgcg ttcgggtgcc 3420
gagcatttag tgctgttggg ccgccgcggc gctgatgccc ctggggcttc agaactgcgt 3480
gaagaactta ctgccttggg gaccggtgtt accatcgcag cctgcgatgt cgcggatcgc 3540
gcgcgcttag aagctgtttt agccgcggaa cgtgcggaag gccgtactgt gagtgcggtc 3600
atgcatgccg caggcgtttc tacgtctaca ccccttgatg acctcaccga ggcggaattc 3660
accgagatcg ccgatgtgaa ggtccgcggc actgtgaacc tggatgaact ttgcccggac 3720
ctggacgcgt ttgtgttatt ctccagcaac gcgggcgtat ggggctctcc gggcctggcg 3780
agctacgcgg ctgcgaacgc tttcctggac ggttttgccc gtcgtcgtcg ttcggaaggg 3840
gcccctgtga cttcgattgc atggggcctg tgggcgggac agaatatggc gggcgacgag 3900
ggcggagagt acttacgtag ccagggcctg cgcgctatgg acccggaccg cgcagtagaa 3960
gaattacata ttactctgga tcatggccag acgagcgtaa gtgtggtgga catggatcgc 4020
cgccgcttcg ttgaactctt tacagcggcc cgtcatcgtc cgcttttcga tgaaatcgcc 4080
ggagcacgcg cggaagcccg tcagtcagaa gaaggtcctg ccctcgcaca gcgtttagcg 4140
gcactgagca cagcggagcg ccgcgagcac ttggcgcacc tgatccgcgc tgaggtggcc 4200
gctgtgctgg gacatgggga tgacgcggca attgatcgcg atcgtgcttt ccgtgacctc 4260
ggctttgaca gcatgaccgc ggtggactta cgcaatcgcc ttgcggccgt cacgggtgtt 4320
cgcgaggcgg cgaccgtggt atttgatcac ccgacgatca ctcgcctcgc agaccactat 4380
cttgaacgcc tggtcggcgc agccgaggcg gagcaggcgc ctgcgttggt gcgcgaagtt 4440
cccaaagatg ccgatgaccc gattgcaatt gtgggaatgg cctgccgctt tccgggcggt 4500
gtgcataatc cgggtgaact gtgggagttt atcgtgggcg gcggcgacgc cgtcactgaa 4560
atgcctaccg atcgtggctg ggacttagac gcgttattcg atccagatcc gcagcgccac 4620
ggtaccagct attcccgtca cggcgcattc ttagatggcg cagccgactt tgacgcggcg 4680
ttctttggta tctccccgcg cgaagcgctg gccatggatc cacaacaacg ccaggtgctg 4740
gagacaacat gggaactgtt cgaaaatgca ggaattgatc cgcatagtct gcgcggtagt 4800
gataccggcg tgtttcttgg tgccgcctac cagggatacg gtcaagacgc ggttgtcccc 4860
gaggacagcg aaggttatct gctcactggt aattcatcgg ccgtcgtttc gggtcgcgtg 4920
gcgtatgttc tcggtttaga gggccctgcc gtaaccgtag acactgcctg ttcgtcgagt 4980
ttggttgccc tgcactcggc atgcggttct ttacgtgatg gtgattgtgg cctcgctgta 5040
gctggtggcg ttagcgtaat ggcggggccc gaggtattca cggaatttag ccgtcagggt 5100
gggctggcgg tggacggacg ttgtaaggct ttctcagcag aggcagatgg ctttgggttt 5160
gcggaaggag tggccgtcgt attattgcag cgcttatcgg acgctcgtcg tgcaggtcgc 5220
caggttctgg gcgtggtggc cgggtcggcg atcaatcaag atggtgcgtc aaatggcctt 5280
gcggcccctt caggagtcgc tcagcaacgc gtgattcgca aggcgtgggc tcgcgcgggc 5340
attactggcg cagacgttgc agtggtggaa gcccacggta caggcacccg ccttggcgat 5400
ccagttgagg cgtcagccct gctggccacc tacggcaagt cgcgtggtag tagcggcccg 5460
gtactcctgg gtagcgttaa atccaatatc ggtcatgcac aagccgcggc cggtgttgca 5520
ggggtaatca aggtggtcct gggattaaac cgtggactgg tgccgccaat gctgtgtcgc 5580
ggtgagcgtt ccccgctgat tgagtggtcg tccggcggtg tcgagctggc cgaggcagtt 5640
tctccgtggc cgccggcggc agacggagtt cgtcgtgcgg gtgtttcagc cttcggggtg 5700
tcaggcacta atgcacatgt cattattgca gagccgccgg aaccggagcc gttaccggaa 5760
ccgggtccgg taggtgtttt ggcggcggca aactctgtac ctgtgttact tagcgcccgt 5820
accgagacgg cgttggccgc ccaagcgcgc ctgctggaat ctgccgtaga tgattcggtg 5880
ccgctcacgg cgctggcgtc ggctcttgcg accggtcgcg cccaccttcc gcgtcgtgcc 5940
gcacttttgg cgggcgatca tgaacagctg cgtggtcaat tacgcgctgt cgctgaaggc 6000
gttgcggcac ctggtgcaac caccggcacc gcatctgccg gtggagtggt ctttgttttc 6060
cctgggcaag gcgcacagtg ggaaggcatg gcccgcggtc tgcttagcgt tcccgtgttc 6120
gccgaatcta ttgccgagtg cgatgcggtc ctgagtgagg tcgcgggatt ttccgcgtca 6180
gaagtgctgg agcaacgccc cgatgcgccc agcctggaac gtgtggacgt agtacagcca 6240
gtgttattct ccgtgatggt ttcgttagcg cgcttgtggg gcgcttgcgg agtcagtccg 6300
agcgctgtga tcggacacag ccagggtgaa atcgccgccg ccgtggtagc cggcgtgttg 6360
tcattagagg acggagttcg tgttgtggca ttgcgcgcga aggcactgcg cgctctcgcg 6420
ggtaaaggcg gcatggtgtc cctcgcagcg ccaggtgagc gtgcacgcgc gcttattgcc 6480
ccttgggaag atcgtatcag tgtagctgcc gtaaattccc catcgtcggt tgttgtttca 6540
ggtgatcctg aggcgctggc ggaacttgtc gcgcgctgtg aagatgaggg tgttcgcgcc 6600
aagacactgc cagttgatta cgctagccat agtcgtcatg ttgaagagat tcgtgagacg 6660
attctggccg acttggatgg gattagcgcc cgccgcgcgg ccatccctct ttacagcacg 6720
ctgcacggcg aacgtcgcga cggcgcggac atgggcccgc gctattggta cgataatctt 6780
cgtagtcagg tccgctttga tgaggccgtg tccgcggcag ttgcagatgg ccacgctaca 6840
tttgttgaga tgtctccaca tcctgtgctc actgcggcgg ttcaggaaat tgcggcagac 6900
gcggtagcta ttggtagcct tcatcgcgat acagctgaag aacatctgat tgcagaactg 6960
gcgcgcgccc atgtccatgg cgtggccgtg gactggcgta acgtgttccc cgcggccccg 7020
cccgttgcgc tgccgaacta cccattcgag ccgcaacgct actggcttgc ccctgaagtt 7080
agtgaccagc ttgcggattc ccgctaccgt gtggactggc gtcctttagc cacgaccccg 7140
gtggatttgg aaggcggatt ccttgtacat ggctccgccc cggaatcgtt gacctcggca 7200
gtcgagaaag ccggcggtcg tgtggtcccc gtggcatcag cagatcgcga agccttagcc 7260
gcagcccttc gtgaggttcc aggtgaagtg gccggggtgc tgagtgtgca caccggtgcg 7320
gcgacccact tagccttgca tcaatccttg ggagaggctg gtgttcgtgc gccgctgtgg 7380
cttgtcacat ctcgtgccgt cgctttgggt gaaagtgagc cggtggatcc ggaacaggca 7440
atggtttggg gccttggccg tgtgatgggc ttagaaacac cggagcgctg gggcggcttg 7500
gttgaccttc cggcggagcc tgctccaggc gatggggaag cttttgttgc ctgcctcggg 7560
gccgacgggc acgaagatca ggtggctatt cgtgatcacg cacgctacgg ccgtcgttta 7620
gtgcgtgcgc cgctgggaac acgtgagtcg tcgtgggagc cggccggcac ggcgctggtt 7680
acgggtggca ccggggcgct gggcggtcat gtcgcacgcc acctggcacg ctgtggagtg 7740
gaagatttag tgttggtcag ccgtcgtggc gttgacgcac cgggcgctgc agaactggaa 7800
gcggagctgg tggccctggg agcgaaaacg acaattacag cttgtgacgt cgcagaccgc 7860
gagcaattgt cgaagttgct ggaagagctt cgtggtcaag gccgtcccgt gcgcactgtt 7920
gtacatacag cgggcgtgcc cgagtcccgt ccgctgcacg agattggtga gctcgaaagt 7980
gtatgcgcgg ccaaagtaac cggcgcgcgc ttgcttgatg aactctgccc ggacgccgaa 8040
acctttgttc tgttctcgtc gggagctggg gtgtggggct cggctaatct gggcgcgtac 8100
tccgcggcga acgcttattt agatgcgttg gcgcaccgtc gccgtgcgga aggtcgcgcg 8160
gcaacgtcgg tggcctgggg tgcgtgggca ggcgaaggta tggccaccgg tgatttagaa 8220
ggcctcactc gccgtggctt gcgcccgatg gctcccgagc gcgcgatccg cgccctgcat 8280
caagcactgg ataatgggga tacctgtgtt agtatcgcgg atgttgactg ggaacgcttc 8340
gcagtcggct tcacggcagc tcgtccgcgt ccgctcctcg atgaattagt gactcccgcc 8400
gtgggagccg ttccggccgt tcaagcagcg cctgcacgtg aaatgactag ccaagagctt 8460
ttagagttta cgcatagcca tgtggctgcc attttgggac atagttctcc cgatgcagtc 8520
gggcaagatc aaccgtttac cgaattaggc tttgactcgt tgacagcagt ggggcttcgc 8580
aaccaactcc agcaggcaac gggcttggcc cttccagcaa cccttgtctt tgagcacccg 8640
acggtgcgtc gcttagccga ccacattggt cagcagttgg actctggtac gcctgcgcgt 8700
gaagcatcga gcgctctgcg tgatggctac cgccaagccg gggtttccgg tcgtgtacgc 8760
tcgtacctgg acttattggc gggcttgagc gactttcgtg agcacttcga cggttcggac 8820
gggtttagcc ttgacctggt cgacatggcg gacggacccg gtgaagttac cgtaatctgt 8880
tgcgcgggaa cagctgcgat ttcaggccct cacgagttta cgcgtttggc cggtgcttta 8940
cgcggaatcg ccccagtacg cgccgttccg cagccgggtt atgaggaagg ggaaccgctt 9000
ccgtcgtcca tggcagcagt ggcagcagtg caggccgatg cagtgatccg cacccaaggc 9060
gataaacctt ttgttgtagc gggccattct gccggcgcct taatggcgta tgcccttgcg 9120
acagaactct tagatcgcgg ccacccgccg cgtggagtag tcttgattga cgtctacccg 9180
ccagggcatc aagacgccat gaacgcgtgg ttagaggaac tcaccgcgac gttatttgac 9240
cgtgaaacgg tgcgtatgga tgatacgcgc ttgaccgcac ttggcgccta tgatcgcctg 9300
accggccaat ggcgtccgcg tgagacaggt ttgcctactt tgcttgtgtc ggccggcgag 9360
cccatgggtc cctggcccga cgattcgtgg aaaccgacct ggccgttcga acatgacacc 9420
gtggccgtgc ctggggacca ttttaccatg gtgcaggaac acgcagatgc tatcgcccgc 9480
cacattgatg cgtggcttgg cggtggtaat agctaa 9516
<210> 4
<211> 1151
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 4
tagggtctca ctcagcagag gcagatggct ttgggtttgc ggaaggagtg gccgtcgtat 60
tattgcagcg cttatcggac gctcgtcgtg caggtcgcca ggttctgggc gtggtggccg 120
ggtcggcgat caatcaagat ggtgcgtcaa atggccttgc ggccccttca ggagtcgctc 180
agcaacgcgt gattcgcaag gcgtgggctc gcgcgggcat tactggcgca gacgttgcag 240
tggtggaagc ccacggtaca ggcacccgcc ttggcgatcc agttgaggcg tcagccctgc 300
tggccaccta cggcaagtcg cgtggtagta gcggcccggt actcctgggt agcgttaaat 360
ccaatatcgg tcatgcacaa gccgcggccg gtgttgcagg ggtaatcaag gtggtcctgg 420
gattaaaccg tggactggtg ccgccaatgc tgtgtcgcgg tgagcgttcc ccgctgattg 480
agtggtcgtc cggcggtgtc gagctggccg aggcagtttc tccgtggccg ccggcggcag 540
acggagttcg tcgtgcgggt gtttcagcct tcggggtgtc aggcactaat gcacatgtca 600
ttattgcaga gccgccggaa ccggagccgt taccggaacc gggtccggta ggtgttttgg 660
cggcggcaaa ctctgtacct gtgttactta gcgcccgtac cgagacggcg ttggccgccc 720
aagcgcgcct gctggaatct gccgtagatg attcggtgcc gctcacggcg ctggcgtcgg 780
ctcttgcgac cggtcgcgcc caccttccgc gtcgtgccgc acttttggcg ggcgatcatg 840
aacagctgcg tggtcaatta cgcgctgtcg ctgaaggcgt tgcggcacct ggtgcaacca 900
ccggcaccgc atctgccggt ggagtggtct ttgttttccc tgggcaaggc gcacagtggg 960
aaggcatggc ccgcggtctg cttagcgttc ccgtgttcgc cgaatctatt gccgagtgcg 1020
atgcggtcct gagtgaggtc gcgggatttt ccgcgtcaga agtgctggag caacgccccg 1080
atgcgcccag cctggaacgt gtggacgtag tacagccagt gttattctcc gtgatggttt 1140
cagagaccct a 1151
<210> 5
<211> 1139
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 5
tagggtctca tttcgttagc gcgcttgtgg ggcgcttgcg gagtcagtcc gagcgctgtg 60
atcggacaca gccagggtga aatcgccgcc gccgtggtag ccggcgtgtt gtcattagag 120
gacggagttc gtgttgtggc attgcgcgcg aaggcactgc gcgctctcgc gggtaaaggc 180
ggcatggtgt ccctcgcagc gccaggtgag cgtgcacgcg cgcttattgc cccttgggaa 240
gatcgtatca gtgtagctgc cgtaaattcc ccatcgtcgg ttgttgtttc aggtgatcct 300
gaggcgctgg cggaacttgt cgcgcgctgt gaagatgagg gtgttcgcgc caagacactg 360
ccagttgatt acgctagcca tagtcgtcat gttgaagaga ttcgtgagac gattctggcc 420
gacttggatg ggattagcgc ccgccgcgcg gccatccctc tttacagcac gctgcacggc 480
gaacgtcgcg acggcgcgga catgggcccg cgctattggt acgataatct tcgtagtcag 540
gtccgctttg atgaggccgt gtccgcggca gttgcagatg gccacgctac atttgttgag 600
atgtctccac atcctgtgct cactgcggcg gttcaggaaa ttgcggcaga cgcggtagct 660
attggtagcc ttcatcgcga tacagctgaa gaacatctga ttgcagaact ggcgcgcgcc 720
catgtccatg gcgtggccgt ggactggcgt aacgtgttcc ccgcggcccc gcccgttgcg 780
ctgccgaact acccattcga gccgcaacgc tactggcttg cccctgaagt tagtgaccag 840
cttgcggatt cccgctaccg tgtggactgg cgtcctttag ccacgacccc ggtggatttg 900
gaaggcggat tccttgtaca tggctccgcc ccggaatcgt tgacctcggc agtcgagaaa 960
gccggcggtc gtgtggtccc cgtggcatca gcagatcgcg aagccttagc cgcagccctt 1020
cgtgaggttc caggtgaagt ggccggggtg ctgagtgtgc acaccggtgc ggcgacccac 1080
ttagccttgc atcaatcctt gggagaggct ggtgttcgtg cgccgctgta gagacccta 1139
<210> 6
<211> 1145
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 6
tagggtctca ctgtggcttg tcacatctcg tgccgtcgct ttgggtgaaa gtgagccggt 60
ggatccggaa caggcaatgg tttggggcct tggccgtgtg atgggcttag aaacaccgga 120
gcgctggggc ggcttggttg accttccggc ggagcctgct ccaggcgatg gggaagcttt 180
tgttgcctgc ctcggggccg acgggcacga agatcaggtg gctattcgtg atcacgcacg 240
ctacggccgt cgtttagtgc gtgcgccgct gggaacacgt gagtcgtcgt gggagccggc 300
cggcacggcg ctggttacgg gtggcaccgg ggcgctgggc ggtcatgtcg cacgccacct 360
ggcacgctgt ggagtggaag atttagtgtt ggtcagccgt cgtggcgttg acgcaccggg 420
cgctgcagaa ctggaagcgg agctggtggc cctgggagcg aaaacgacaa ttacagcttg 480
tgacgtcgca gaccgcgagc aattgtcgaa gttgctggaa gagcttcgtg gtcaaggccg 540
tcccgtgcgc actgttgtac atacagcggg cgtgcccgag tcccgtccgc tgcacgagat 600
tggtgagctc gaaagtgtat gcgcggccaa agtaaccggc gcgcgcttgc ttgatgaact 660
ctgcccggac gccgaaacct ttgttctgtt ctcgtcggga gctggggtgt ggggctcggc 720
taatctgggc gcgtactccg cggcgaacgc ttatttagat gcgttggcgc accgtcgccg 780
tgcggaaggt cgcgcggcaa cgtcggtggc ctggggtgcg tgggcaggcg aaggtatggc 840
caccggtgat ttagaaggcc tcactcgccg tggcttgcgc ccgatggctc ccgagcgcgc 900
gatccgcgcc ctgcatcaag cactggataa tggggatacc tgtgttagta tcgcggatgt 960
tgactgggaa cgcttcgcag tcggcttcac ggcagctcgt ccgcgtccgc tcctcgatga 1020
attagtgact cccgccgtgg gagccgttcc ggccgttcaa gcagcgcctg cacgtgaaat 1080
gactagccaa gagcttttag agtttacgca tagccatgtg gctgccattt tgggaagaga 1140
cccta 1145
<210> 7
<211> 1157
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 7
tagggtctca gggacatagt tctcccgatg cagtcgggca agatcaaccg tttaccgaat 60
taggctttga ctcgttgaca gcagtggggc ttcgcaacca actccagcag gcaacgggct 120
tggcccttcc agcaaccctt gtctttgagc acccgacggt gcgtcgctta gccgaccaca 180
ttggtcagca gttggactct ggtacgcctg cgcgtgaagc atcgagcgct ctgcgtgatg 240
gctaccgcca agccggggtt tccggtcgtg tacgctcgta cctggactta ttggcgggct 300
tgagcgactt tcgtgagcac ttcgacggtt cggacgggtt tagccttgac ctggtcgaca 360
tggcggacgg acccggtgaa gttaccgtaa tctgttgcgc gggaacagct gcgatttcag 420
gccctcacga gtttacgcgt ttggccggtg ctttacgcgg aatcgcccca gtacgcgccg 480
ttccgcagcc gggttatgag gaaggggaac cgcttccgtc gtccatggca gcagtggcag 540
cagtgcaggc cgatgcagtg atccgcaccc aaggcgataa accttttgtt gtagcgggcc 600
attctgccgg cgccttaatg gcgtatgccc ttgcgacaga actcttagat cgcggccacc 660
cgccgcgtgg agtagtcttg attgacgtct acccgccagg gcatcaagac gccatgaacg 720
cgtggttaga ggaactcacc gcgacgttat ttgaccgtga aacggtgcgt atggatgata 780
cgcgcttgac cgcacttggc gcctatgatc gcctgaccgg ccaatggcgt ccgcgtgaga 840
caggtttgcc tactttgctt gtgtcggccg gcgagcccat gggtccctgg cccgacgatt 900
cgtggaaacc gacctggccg ttcgaacatg acaccgtggc cgtgcctggg gaccatttta 960
ccatggtgca ggaacacgca gatgctatcg cccgccacat tgatgcgtgg cttggcggtg 1020
gtaatagcta gtagcataac cccttggggc ctctaaacgg gtcttgaggg gttttttgcg 1080
cgacttccag agaagatgac tactgacttg agcgttccaa aacttagcag gtggtcttgg 1140
gccaaaatga gacccta 1157
<210> 8
<211> 1150
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 8
tagggtctca tcgtccagcc gttgctggtg gccgccccgc cgaacttcct acatatccat 60
ttgaacatca acgcttttgg ccgcgcccgc atcgccctgc ggacgtgagc gcattgggtg 120
tacgcggggc cgagcatccg ttgctgctgg ctgcggtaga tgtcccaggc catggcggtg 180
cggtgttcac gggccgtctg agtacagacg agcaaccgtg gctcgctgag catgtggtag 240
gcggccgcac cttagttccg ggttctgtgc tggttgacct ggcactcgca gcgggtgaag 300
atgtaggttt acctgtgttg gaagagttgg tgcttcagcg cccgttagtg ttagcagggg 360
ccggggcgct tctccgcatg tcggtgggag cccccgacga aagcggacgt cgcacaatcg 420
acgttcatgc ggcggaagat gtagcggact tagctgatgc gcaatggtca caacacgcaa 480
cgggcacgct ggcccaaggc gtggccgcgg gtccgcgtga caccgaacag tggcccccgg 540
aagatgcggt gcgcatcccg cttgacgatc actatgacgg actcgcggaa cagggctatg 600
aatacggacc ttcgttccaa gccttacgcg cggcgtggcg caaggatgat agtgtctatg 660
cagaggtttc gattgcggca gacgaagaag gttatgcctt ccatccggtc cttttggatg 720
cggttgccca aaccttgtcg ttaggggctt taggcgagcc gggtggcggc aaattgccgt 780
ttgcatggaa cactgtgaca ctccacgcgt ccggggctac tagtgttcgt gtggtggcga 840
cgccagcggg cgcggacgca atggcgctcc gcgtgacaga ccccgcaggg catctggtcg 900
cgacggtcga ttcattggtg gtgcgcagca ccggtgagaa atgggaacag cccgagccgc 960
gtggcggtga gggcgaatta catgcactgg actgggtgcg tctcgcggaa ccggggtcga 1020
ccggacgcgt tgttgcagcg gacgccagtg atttagacgc agtccttcgc agtggagagc 1080
cggagccgga tgccgtgctg gtacgctacg aaccagaggg tgatgacccg cgcgcagccg 1140
agagacccta 1150
<210> 9
<211> 1133
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 9
tagggtctca gaacgcgagc atcgtgaaac cactgcccac gatggtcgcc cagtgccgtt 60
agtggtgagc gcgcgtagca cggcggcact tcgcgcccaa gcggcacaaa ttgccgaact 120
cttagaacgc ccggacgcag atcttgctgg cgttggatta ggcctggcca ctacccgtgc 180
gcgccatgaa caccgcgcgg ctgtcgtggc gtccacacgt gaagaagcgg ttcgcggtct 240
gcgcgaaatc gcagccggtg cggccactgc ggatgccgta gtggaaggcg ttaccgaggt 300
ggacggtcgc aatgtggttt tcctctttcc tggtcagggc tcgcagtggg cgggcatggg 360
cgcagaactc ctttcaagca gtcctgtttt cgcaggaaag attcgtgcgt gcgacgaaag 420
catggcgccg atgcaagatt ggaaggtttc tgatgtgtta cgccaagcac caggagcgcc 480
aggcctcgac cgcgtagacg tagttcaacc cgtgctgttt gctgtcatgg tgtcgttagc 540
tgagctttgg cgctcatacg gcgtggagcc ggcggctgtc gtgggccatt ctcaaggtga 600
aattgcagcg gcccacgtgg caggagcact gaccttggaa gatgcggcaa aactcgtcgt 660
gggtcgcagc cgcctgatgc gctcattgtc cggagagggc ggcatggcgg cggtggcgct 720
tggtgaagcg gcggtgcgtg agcgtctccg tccgtggcaa gatcgcctgt cagtagctgc 780
agttaatggc cctcgcagcg ttgtagtaag tggcgagccg ggtgcgcttc gcgccttttc 840
agaggactgt gcggccgagg gcatccgcgt ccgtgacatc gacgtcgatt atgccagcca 900
ttcacctcag atcgagcgcg tccgtgaaga gctgctggaa accactggag acattgcccc 960
gcgccccgcg cgcgtgacgt ttcattcaac tgtggaatcc cgctcgatgg acggcaccga 1020
actggatgcc cgctactggt accgcaatct gcgtgagacg gtgcgctttg cggacgcggt 1080
gactcgtttg gccgagagcg gttatgatgc gtttatcgag gttagagacc cta 1133
<210> 10
<211> 1134
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 10
tagggtctca tcttatgttg ataagggcgg tttcctggat gacgccgcag gatttgacgc 60
cgagttcttc ggcgttagcc cgcgtgaagc cgccgccatg gatccccaac aacgtttact 120
tctcgaaacg agctgggaat tagtggagaa cgcgggtatt gaccctcata gtctgcgcgg 180
aaccgcgacg ggtgtgtttc tgggcgtggc gaagttcggg tacggagaag atacagccgc 240
ggctgaagat gttgaaggct acagcgtgac tggcgtcgca cccgcggttg cctctggtcg 300
tattagctat acgatgggcc tggaagggcc gagcatcagc gtggacactg cgtgcagcag 360
ctcgctggtg gcgttgcacc tggccgttga gagtctgcgc aaaggtgaga gtagtatggc 420
ggtagtgggt ggtgccgccg tcatggcgac gcccggagtc tttgtcgact tctcccgtca 480
gcgcgcactc gccgcagatg gacgtagtaa agcgtttggc gccggtgccg atggtttcgg 540
gttctcagag ggtgtcactc ttgtgttact ggagcgtctt tcagaggcac gtcgtaatgg 600
acacgaagtt ttagctgttg tgcgtggatc ggcgttaaac caggatggcg catccaacgg 660
attgagcgcg ccatcgggcc cggcccaacg ccgcgtaatt cgccaagcgt tagaatcgtg 720
tggtcttgaa cctggcgatg ttgatgcggt tgaggcccac ggcaccggca ctgctttagg 780
cgacccgatc gaagcgaacg ccctgctgga cacctatgga cgcgatcgcg atgcagatcg 840
cccgctttgg ttaggctcag tcaagagtaa tattggacac acccaggcag cagcgggtgt 900
taccggctta cttaaggtgg tcctggcatt acgtaacggc gagctgccag ccaccttaca 960
tgttgaggag cccacaccgc acgtcgattg gtcatctggc ggtgtggccc tgttagccgg 1020
gaaccagccg tggcgccgcg gggagcgtac ccgtcgtgcg gcagtgtcag catttggcat 1080
ctcgggtacc aatgcccatg ttatcgtaga agaggccccg gaacagagac ccta 1134
<210> 11
<211> 1173
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 11
tagggtctca aaattcttcg cgaagtggtg ggcctgcttg gcgctggaga actggatcgt 60
ctgccggttt cagcctggga attaggcagc gcacccgcag cgcttcagca catgagccgc 120
ggacgccacg tcggcaaact ggtcttgacc caaccggctc cggtagatcc agacggcact 180
gtgctgatta ctggcggaac aggaactctg ggtcgcttac tggcccgcca cttggtcacg 240
gaacacggcg tgcgtcatct gcttctggtt tcacgtcgcg gcgcagacgc ccctgggagt 300
gatgaacttc gcgcagaaat cgaggactta ggtgcgagcg cagaaatcgc agcgtgcgat 360
actgcagatc gcgacgccct gtcggcgctt cttgatggcc tgcctcgtcc cttaaccgga 420
gtcgtgcatg cagccggtgt cctggccgat ggcctggtca caagcatcga tgaaccggcg 480
gtcgagcaag tacttcgcgc aaaagtggat gcggcatgga atctgcacga gttaaccgcc 540
aatacgggcc tctccttctt tgttctgttc agttccgcgg cgtcggttct cgcgggaccg 600
ggacagggtg tatatgcagc cgctaacgaa agcctgaatg ccctggccgc gcttcgccgc 660
acacgtgggt taccggccaa agcgctcgga tggggcttgt gggcacaggc gtcggagatg 720
acgtccggcc ttggcgaccg catcgcgcgt actggtgtag cggcgctgcc aacggaacgc 780
gccctggcct tgtttgatag cgcgttacgt cgcggcggtg aagtagtttt ccctctgtca 840
attaaccgca gcgcattgcg tcgcgcggaa ttcgtgccgg aagtgctgcg tggtatggtc 900
cgcgcgaagt tgcgcgcggc gggccaagcc gaagcggcgg gcccgaacgt cgtggatcgc 960
ctcgccggcc gttccgaatc agaccaggtc gcgggtcttg cggagcttgt gcgttcacat 1020
gcagcggctg tctccggcta tggcagcgcg gatcaattac cggagcgtaa agcatttaag 1080
gaccttggct ttgacagcct tgcggccgta gagctgcgca atcgtctggg cactgcgacc 1140
ggtgtacgtt tgccttcaac gctagagacc cta 1173
<210> 12
<211> 1150
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 12
tagggtctca gccgctcgcc acggcgtatt atgggcagcc gcgttggtcc gccgctggct 60
tgaacaggaa gagttaccgg gcgccactct ggttatcgcg actagcggcg cggtcacagt 120
ctctgatgac gactcggtgc cggagccggg cgcggcggcc atgtggggcg tgatccgttg 180
tgcacaagcg gagtcaccgg atcgctttgt tctgctcgat acagatgccg agcccggaat 240
gctgccggcg gtgccggaca atccccaact ggcgttgcgt ggtgacgatg tatttgtgcc 300
gcgtttatcc ccgctcgcac cttcggcact gactttaccg gcgggtaccc agcgtcttgt 360
acccggagat ggggccattg attccgtagc cttcgagccg gcgcctgacg ttgagcaacc 420
gctccgtgcc ggcgaagtgc gtgtagatgt ccgcgcgacc ggtgttaact tccgcgacgt 480
tcttcttgca ctgggcatgt acccgcagaa ggcagatatg ggaacagagg ccgcgggcgt 540
agtaacggca gttggcccgg acgtggacgc tttcgccccc ggcgatcgtg tactgggact 600
tttccaaggc gcctttgcgc cgattgcggt aacggaccat cgcctgttgg cacgtgttcc 660
agacggatgg agcgacgcag acgctgctgc ggtacctatt gcgtacacca cagcgcatta 720
cgccctgcac gatttagccg gccttcgtgc aggccagtca gtgcttatcc atgccgcggc 780
cggtggcgtt ggtatggctg ccgtggccct tgcgcgccgt gccggcgcgg aagttttagc 840
cacagcgggt ccagccaaac atggcacgtt acgtgcgctg ggcttagacg atgaacacat 900
tgcgagttct cgcgagacag gttttgcgcg taaattccgt gagcgtaccg gtggacgcgg 960
cgtcgatgta gtgttgaaca gtttaaccgg cgaactctta gacgagagcg ccgaccttct 1020
tgcagaggac ggtgtattcg tagaaatggg taaaaccgat ctgcgcgacg caggcgattt 1080
ccgcggccgt tacgcgccgt ttgacttggg cgaggcgggc gatgaccgcc tcggcgaaat 1140
agagacccta 1150
<210> 13
<211> 1141
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 13
tagggtctca ttgaccaatt ttggtagcat ctcagaggtg gcgccggaag aatttgcgga 60
aaccattgcg gcgaaaaccg ccctcttagc cgtactggat gaagtccttg gtgaccgtgc 120
agtcgagcgt gaagtgtact gttcgtctgt ggcgggtatt tggggcggtg cgggtatggc 180
ggcgtacgcg gcgggtagtg cgtacctcga cgcattagct gagcatcacc gtgctcgtgg 240
tcgtagctgc acgtcagtgg catggacgcc gtgggcatta cccggcggcg cggtggacga 300
cggttatctc cgtgagcgcg gcctgcgcag cttgagcgct gatcgcgcga tgcgtacctg 360
ggagcgtgtc ttggcagcgg gtcccgttag cgtggcggtc gccgacgtcg attggccggt 420
actgagcgaa ggattcgcag cgacgcgccc gaccgcctta ttcgccgaat tagccggccg 480
cggcggacaa gctgaagccg agcccgatag tggccccact ggcgagccgg cgcagcgctt 540
ggcgggcctc tcacctgacg agcagcagga gaacttactt gagttagtcg caaatgccgt 600
ggcagaggtt ttaggccatg agtcggcagc cgaaatcaat gttcgtcgcg cgttctctga 660
gcttggattg gattctctga atgctatggc tcttcgtaaa cgtttatctg ccagcaccgg 720
attacgcctt cctgcgagct tggttttcga ccacccgaca gttactgccc tggcgcagca 780
cttacgcgcc cgtcttgtcg gtgacgcgga tcaagctgcg gtacgcgtag ttggtgcagc 840
ggacgaatcc gaaccgatcg ctattgttgg tatcggttgt cgttttccgg gcggcattgg 900
atcgcccgag caattatggc gcgttcttgc tgagggtgcg aatctgacaa ccggtttccc 960
ggctgaccgc gggtgggata tcggccgttt atatcatcct gatccggata atccgggcac 1020
atcctacgtt gataagggcg gcttccttac ggatgccgca gattttgacc cggggttctt 1080
cggtattacc cctcgcgagg cgctggccat ggatccgcag cagcgcctta tagagaccct 1140
a 1141
<210> 14
<211> 1168
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 14
tagggtctca ggtttctccg cacccggtgg ttgtgcaggc cgtggaagag gctgtggaag 60
aggcggatgg ggcggaagat gccgtggttg ttggatctct gcatcgtgac ggtggcgatc 120
tgagcgcgtt cttacgtagc atggccaccg cccacgtttc aggggtcgac atccgttggg 180
acgtagcatt gccgggtgct gcgccgttcg cactgccgac gtacccgttc caacgcaaac 240
gctattggct tcagcctgcg gcaccggcgg ccgccagcga tgagcttgcg taccgtgtga 300
gctggacccc tattgaaaag ccggaatctg gcaacctgga cggcgattgg ctcgttgtta 360
cgccgctgat tagcccagag tggacagaaa tgttatgtga agccatcaat gccaatggcg 420
gccgcgcctt acgctgtgag gtggacacca gcgcgtcccg tactgaaatg gctcaagccg 480
tggcccaggc cggtaccggc ttccgtggag ttctgtcatt attaagcagt gatgagagcg 540
cctgtcgtcc gggcgtgccg gcgggcgccg tagggcttct cactttggtc caagccctcg 600
gcgacgcagg cgtcgatgcg cccgtttggt gtctgaccca aggagccgtt cgtaccccgg 660
cagatgacga tctggcccgc ccggcccaga caaccgcaca tggattcgcc caagttgccg 720
gcctcgaatt accgggccgt tggggtggcg tcgttgatct tccggagagc gtggacgatg 780
cggcactgcg tttattagtg gctgtgttgc gcggtggcgg ccgcgcagag gaccacctgg 840
ccgtacgtga tggccgtttg catggccgcc gcgtcgtacg tgctagcctg ccgcagagcg 900
ggtcacgttc ttggactccc cacggcactg tattggtcac tggggctgct tcgcccgtcg 960
gtgaccaact cgtgcgttgg ctcgccgacc gtggcgctga acgtttagtc cttgcaggcg 1020
cgtgcccggg agacgatctg ctggccgccg tggaagaagc tggcgcctca gcagtagtgt 1080
gtgcccaaga cgccgcggcc ctgcgcgaag cgctcggcga tgaacccgtt accgcccttg 1140
tacacgcggg taccttgaag agacccta 1168
<210> 15
<211> 1152
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 15
tagggtctca tgatgcggcc tggacgctgg ccacgggtcg tgcccgtttt gacgtacgcg 60
ccgcggtttt aggcgacgac cgtgcgggtg tgtgtgccga gttagatgcc ttagcggaag 120
ggcgtccctc agcggatgcc gtagcgccgg tcacttccgc cccgcgcaaa cctgtactcg 180
tctttccggg tcagggtgcg caatgggtcg gtatggcccg tgatctgctg gagagtagcg 240
aagttttcgc ggagtccatg agccgttgcg cagaggccct gtcaccccat accgattgga 300
agctcttgga tgttgttcgc ggtgatggcg gaccggatcc tcacgagcgt gtcgatgtgt 360
tacagccggt gctgttcagc atcatggttt ctcttgcaga gctgtggcgc gcgcacggcg 420
taaccccggc agcggtcgta ggtcactcac aaggcgaaat cgctgcggct catgtagcgg 480
gcgcgcttag tcttgaggcc gcagccaaag tggtggcgct ccgctcccag gtattgcgtg 540
aactggacga tcagggtggc atggtgtcgg tgggcgcaag ccgtgacgaa ctggaaaccg 600
tgcttgcgcg ttgggatggg cgtgtcgccg tggcagcggt caacgggccg ggtacctcgg 660
tggtcgccgg gccaacggcc gaattggatg agttcttcgc cgaagccgag gctcgcgaaa 720
tgaagccccg tcgtatcgcc gtacgctacg ccagtcattc gccagaggta gcccgtattg 780
aggaccgtct tgcagcagag ctgggtacaa tcaccgcggt ccgtggttca gtgccgctgc 840
atagcactgt aaccggggaa gtaatcgata cctcagcgat ggacgcgtcc tattggtatc 900
gtaacttacg ccgcccggtt ttattcgagc aagcagttcg tggactcgtt gagcagggct 960
tcgacacctt cgtcgaggtc agtcctcatc ccgtgctctt gatggctgta gaagaaaccg 1020
cggagcacgc gggtgccgag gtaacttgtg tacccacatt acgtcgtgag caaagcggcc 1080
ctcatgagtt cttacgtaac ttattacgtg cgcacgtgca cggagttggc gccgatcttc 1140
gtagagaccc ta 1152
<210> 16
<211> 1159
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 16
tagggtctca ttatgcttga gacggcctgg gaagccgtag agcgtgcagg catcgacccc 60
gacgccttac gcggaacgga cacaggagtt ttcgtgggca tgaacggaca atcttatatg 120
caattacttg cgggtgaggc ggaacgcgtc gacggctacc agggcttggg taacagcgcg 180
agcgtcctca gcggccgcat tgcctacacg ttcggttggg aaggtcctgc gttaacagtg 240
gatactgcat gttctagcag tttggtgggt attcatttag cgatgcaagc ccttcgtcgc 300
ggcgaatgct cactcgcttt ggcgggtggc gtaacggtca tgtctgaccc gtacaccttc 360
gttgatttca gcacgcagcg tggccttgcg agtgacggtc gctgtaaggc cttcagtgcg 420
cgtgcagacg gtttcgcctt atcagagggt gtcgcggcct tagtgttgga gcccctcagt 480
cgtgcgcgtg ctaatggcca ccaagtgctt gccgtcttgc gcggcagcgc ggtcaatcag 540
gacggtgcca gcaacgggct ggcggcccct aatggtccga gccaggaacg tgtgattcgc 600
caagccttag ccgcgagcgg agtgccggcg gcagatgtgg acgtggtaga ggcccacggt 660
acaggcacag aactgggtga cccgattgag gccggagcgt tgattgccac gtatgggcag 720
gaccgcgatc gtccactgcg tctgggaagc gtgaaaacca atattggcca tacgcaagcc 780
gctgcagggg cggctggtgt catcaaagtc gtgctcgcaa tgcgccacgg tatgttgcca 840
cgctcgcttc acgcagatga gttaagccct catattgact gggaatctgg cgccgtggaa 900
gtgctccgtg aggaagttcc gtggccggcc ggggagcgtc cacgccgcgc aggcgttagc 960
tcgtttggcg ttagcggaac taatgcccat gtgattgttg aagaagcccc ggcggaacaa 1020
gaggccgccc gcaccgaacg cggtccgctg ccgtttgtgc tctcgggccg ctccgaggcg 1080
gttgtcgcgg cgcaggcacg tgccttagcc gaacatctgc gtgatacacc tgagttaggc 1140
ctgactgata gagacccta 1159
<210> 17
<211> 1131
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 17
tagggtctca agaagatggc tggacggtgg aagtacgctc ggcattagcc gaggcaggag 60
cggaaccaga ggttacgcgt ggagtgggtg ggctggttgg tgattgcgca ggggtcgtca 120
gcctgctggc cctcgaaggg gacggcgccg ttcaaacgct cgtactggtg cgcgaattag 180
atgcggaagg cattgatgcg ccactctgga cggttacttt cggtgcagtt gatgcgggga 240
gcccggtcgc acgtcctgac caggccaaac tctggggtct gggccaagtg gcgtcattag 300
aacgtggccc gcgctggact ggtctggttg acctgccgca catgccagac cctgagcttc 360
gtggacgcct gacggccgtc cttgccggaa gcgaggacca agttgcggtt cgcgctgacg 420
ccgtgcgtgc ccgccgtctg tcaccggctc acgttacagc aacgtcagaa tatgctgtcc 480
cgggcggcac gatcttagtg acaggcggca cggcaggatt aggtgccgag gttgctcgct 540
ggttagctgg ccgcggggcc gaacatttgg cactggttag ccgccgcggg cctgataccg 600
aaggcgtagg tgacttaacc gccgagctga cacgcctggg tgcgcgcgtg agtgtgcatg 660
catgtgatgt tagctcacgt gagccggtgc gcgagcttgt tcatggcctg attgaacaag 720
gcgatgtagt tcgcggagtt gtgcatgcag caggtttacc ccaacaagtg gccatcaatg 780
acatggatga ggcagcgttt gacgaagtag ttgcagcgaa agcgggcggg gccgtgcacc 840
tggacgaatt atgctcagat gcggaactgt ttctcttatt tagctccggt gccggtgtat 900
ggggctctgc ccgccaggga gcgtatgcgg cgggcaacgc ctttctggac gcgttcgctc 960
gccaccgccg tggtcgtggt ttacccgcga ctagcgtggc gtggggactc tgggcggcgg 1020
gcgggatgac cggcgacgag gaagccgtct cattcttgcg tgaacgtgga gtccgtgcga 1080
tgccggtacc gcgcgccctg gcggcgctcg accgtgttct gagagaccct a 1131
<210> 18
<211> 1167
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 18
tagggtctca atgggaaggc atggcccgcg agctcctgcc agtaccggtg ttcgcagaaa 60
gtattgcgga atgcgatgct gtgctgagcg aagtggccgg attttccgtc tctgaagtac 120
tggagcctcg tccggatgcg ccgtctctgg agcgtgttga cgtagtgcaa cctgtgcttt 180
tcgccgtgat ggtgtcactg gcccgcctgt ggcgcgcatg tggcgcagtc ccatctgccg 240
tgattggcca ttcacagggc gagattgctg cagcagttgt agctggtgcg ttgtccttag 300
aggacggcat gcgcgttgtt gcgcgccgct cgcgtgccgt ccgcgctgta gcggggcgcg 360
gctccatgct gtcggtccgt ggtgggcgct cagacgttga gaaactgtta gccgatgaca 420
gctggaccgg ccgcctggaa gtagccgccg tcaacggtcc tgatgcagtg gtcgtggccg 480
gcgacgcgca ggcagcgcgc gaatttctgg agtactgcga aggcgtaggc attcgcgccc 540
gtgcaatccc ggtggactat gcatcgcaca cggctcatgt ggaaccggtt cgtgatgagt 600
tagtacaagc cctcgcgggg attacacctc gtcgcgcaga agtacctttc ttctcgacct 660
tgactggtga cttcctggac ggcacggagc ttgacgccgg ctactggtat cgcaatctgc 720
gccatccggt cgaatttcac tctgcagtcc aagctttaac ggatcaaggg tacgcgacct 780
ttattgaggt gagtccgcat cctgtgctcg catcaagcgt gcaggaaacc cttgatgatg 840
cagaatccga cgccgcagta cttggaaccc tggagcgcga cgctggtgat gcggatcgct 900
ttctgactgc acttgcggat gcgcacacgc gcggagtcgc agtcgactgg gaagcggtac 960
tgggacgcgc agggttggtg gatcttcctg gatacccttt ccaaggtaaa cgcttctggc 1020
tgctgccgga tcgtacgact ccgcgcgatg aattggatgg gtggttctac cgcgtagatt 1080
ggacagaagt tccgcgtagc gaacccgccg cgctgcgcgg ccgttggctt gtggttgtgc 1140
cggaaggaca cgaagaaaga gacccta 1167
<210> 19
<211> 1133
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 19
tagggtctca tgtagttcgt ctctggtggc tctgcacacc gcatgcggca gcttacgcga 60
cggcgactgt ggcttggcag ttgcaggcgg tgtgtcagtg atggccgggc ctgaagtttt 120
caccgaattt tcgcgtcaag gtgccctttc tcctgacgga cgctgcaaac cctttagcga 180
tgaggccgac ggctttggtc ttggtgaagg tagcgctttc gtcgtcctgc aacgtcttag 240
tgatgcacgc cgtgaaggcc gccgcgtgtt aggcgtggtg gcgggcagtg ctgtgaatca 300
ggacggtgca tcgaacggat taagcgcgcc cagcggagtg gcgcagcaac gcgtcattcg 360
tcgcgcatgg gctcgtgcag gtattacagg tgcagatgtc gcggtggtcg aggcgcacgg 420
tacaggcacc cgccttggtg accctgtgga agcctcagcc cttttggcca cgtacggtaa 480
aagccgtggc tcgtctggcc cggttttact cggatctgtg aaaagcaaca ttggacatgc 540
tcaggccgca gccggcgttg ctggtgtgat taaagtcctg cttgggcttg agcgtggagt 600
agtgccgccc atgctgtgcc gtggcgagcg ttccggtctg attgattggt ctagcggtga 660
gattgaactt gccgacggtg tccgcgagtg gtcccctgca gccgacgggg ttcgtcgcgc 720
gggagtaagt gcattcggtg taagtggtac caacgctcac gtgattattg cagaaccgcc 780
agaacccgag ccggtcccgc aacctcgtcg catgttaccg gcgactggcg tcgtgcctgt 840
cgtgctgtct gcccgtacag gggcggcact gcgcgcccaa gctggacgct tagctgatca 900
cttagccgcg cacccgggca ttgctccagc cgacgtcagc tggaccatgg ctcgtgcacg 960
ccaacacttc gaagaacgcg ccgccgtatt ggccgcggac accgcagagg ccgtgcatcg 1020
tttgcgcgcc gttgccgacg gagcagtcgt tcctggcgtg gtcacaggta gcgcctctga 1080
cggtggttcg gttttcgttt tccccggcca gggcgcccaa tggagagacc cta 1133
<210> 20
<211> 1184
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 20
tagggtctca actctggatc atggccagac gagcgtaagt gtggtggaca tggatcgccg 60
ccgcttcgtt gaactcttta cagcggcccg tcatcgtccg cttttcgatg aaatcgccgg 120
agcacgcgcg gaagcccgtc agtcagaaga aggtcctgcc ctcgcacagc gtttagcggc 180
actgagcaca gcggagcgcc gcgagcactt ggcgcacctg atccgcgctg aggtggccgc 240
tgtgctggga catggggatg acgcggcaat tgatcgcgat cgtgctttcc gtgacctcgg 300
ctttgacagc atgaccgcgg tggacttacg caatcgcctt gcggccgtca cgggtgttcg 360
cgaggcggcg accgtggtat ttgatcaccc gacgatcact cgcctcgcag accactatct 420
tgaacgcctg gtcggcgcag ccgaggcgga gcaggcgcct gcgttggtgc gcgaagttcc 480
caaagatgcc gatgacccga ttgcaattgt gggaatggcc tgccgctttc cgggcggtgt 540
gcataatccg ggtgaactgt gggagtttat cgtgggcggc ggcgacgccg tcactgaaat 600
gcctaccgat cgtggctggg acttagacgc gttattcgat ccagatccgc agcgccacgg 660
taccagctat tcccgtcacg gcgcattctt agatggcgca gccgactttg acgcggcgtt 720
ctttggtatc tccccgcgcg aagcgctggc catggatcca caacaacgcc aggtgctgga 780
gacaacatgg gaactgttcg aaaatgcagg aattgatccg catagtctgc gcggtagtga 840
taccggcgtg tttcttggtg ccgcctacca gggatacggt caagacgcgg ttgtccccga 900
ggacagcgaa ggttatctgc tcactggtaa ttcatcggcc gtcgtttcgg gtcgcgtggc 960
gtatgttctc ggtttagagg gccctgccgt aaccgtagac actgcctgtt cgtcgagttt 1020
ggttgccctg cactcggcat gcggttcttt acgtgatggt gattgtggcc tcgctgtagc 1080
tggtggcgtt agcgtaatgg cggggcccga ggtattcacg gaatttagcc gtcagggtgg 1140
gctggcggtg gacggacgtt gtaaggcttt ctcaagagac ccta 1184
<210> 21
<211> 1165
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 21
tagggtctca cgaactgtcg gatgcgatcc gctctgggct cgaacagtca ggagcgaccg 60
tgttaacctg tgacgtggaa agccgtagta cgattggtac cgctcttgaa gccgcggata 120
cagatgccct gagcaccgta gtaagcctgc tttcgcgcga tggcgaagcc gtggatccat 180
cgctggacgc gttagctctc gtgcaagcgt tgggcgctgc gggagtagag gccccgttat 240
gggtgttgac ccgtaacgcg gtgcaggttg cggatgggga attagtggac ccggcgcaag 300
caatggttgg cggtcttggt cgcgttgttg gaatcgaaca acctggccgc tggggtggtt 360
tagtagactt agtcgacgcg gatgccgcaa gcattcgtag ccttgcggca gtactggcgg 420
accctcgtgg tgaagagcaa gtcgctattc gtgcagacgg tattaaagtt gcccgtctgg 480
tgccggcccc tgcccgcgcc gcacgtacgc gctggagccc tcgcggaacc gtgttagtaa 540
ccggtggcac cggtggtatc ggcgcccacg tggcgcgctg gttagcgcgt tcgggtgccg 600
agcatttagt gctgttgggc cgccgcggcg ctgatgcccc tggggcttca gaactgcgtg 660
aagaacttac tgccttgggg accggtgtta ccatcgcagc ctgcgatgtc gcggatcgcg 720
cgcgcttaga agctgtttta gccgcggaac gtgcggaagg ccgtactgtg agtgcggtca 780
tgcatgccgc aggcgtttct acgtctacac cccttgatga cctcaccgag gcggaattca 840
ccgagatcgc cgatgtgaag gtccgcggca ctgtgaacct ggatgaactt tgcccggacc 900
tggacgcgtt tgtgttattc tccagcaacg cgggcgtatg gggctctccg ggcctggcga 960
gctacgcggc tgcgaacgct ttcctggacg gttttgcccg tcgtcgtcgt tcggaagggg 1020
cccctgtgac ttcgattgca tggggcctgt gggcgggaca gaatatggcg ggcgacgagg 1080
gcggagagta cttacgtagc cagggcctgc gcgctatgga cccggaccgc gcagtagaag 1140
aattacatat tactcagaga cccta 1165
<210> 22
<211> 1129
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 22
tagggtctca aggtgtttgc cgattcaatt cgtgactgcg agcgtgcttt agctccacat 60
gtcgactggt cattaacgga cttgctctct ggcgcccgcc cgctggatcg cgtggacgtg 120
gtgcagcctg cgctctttgc agtgatggtg tcattagcgg ccttatggcg ttctcacggg 180
gtcgagcctg ccgccgttgt aggccattcg caaggtgaga ttgcggctgc ccacgtagcg 240
ggtgcactta cgttggaaga tgctgctaaa cttgttgcag ttcgttcgcg tgtgttacgt 300
cgtttaggcg gccagggcgg gatggcaagc ttcggcctcg gtaccgaaca agcggccgag 360
cgtatcggcc gctttgcggg tgccttatct attgcctcgg ttaatggacc gcgttcggtg 420
gtggtagccg gagagagcgg cccgctggac gaattaatcg ccgagtgtga ggctgagggc 480
attaccgcgc gtcgtatccc ggtggattac gcctcgcatt caccgcaggt agagagcctg 540
cgcgaagagc tcttaacgga gttagccggt atttcaccgg tttccgctga cgtagcctta 600
tattcaacga ccacaggcca gcctattgat acagcaacaa tggacaccgc ctattggtac 660
gcgaacttac gcgagcaagt gcgcttccaa gatgcgaccc gccaattagc agaggcaggc 720
tttgacgctt tcgttgaggt aagtccgcac ccggttttga ccgtgggaat tgaggccacc 780
ttagacagcg cactgccggc agacgcgggt gcatgtgtcg tgggcactct gcgccgcgac 840
cgcggcggtt tagccgattt tcacacagcc ctgggcgaag cctatgccca gggtgtagaa 900
gttgattggt cgcctgcgtt tgcagacgcg cgccctgtgg aactgccggt ttaccctttc 960
cagcgccaac gttattggct tccgattcca actggtggcc gcgcgcgcga tgaggacgat 1020
gactggcgct accaggtggt ttggcgcgag gccgaatggg aatcagcatc tctggcgggt 1080
cgcgttctgt tagtaaccgg tccgggtgtc ccgtccgaaa gagacccta 1129
<210> 23
<211> 1165
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 23
tagggtctca gatacagcct gcagcagtgg cttaactgct ctgcaccttg caatggagag 60
tttacgccgc gatgaatgtg gtcttgcgtt agcaggcggt gttactgtta tgtctagtcc 120
aggcgcgttc acggaatttc gttcgcaggg tggactcgcg gccgacggcc gttgcaaacc 180
attttcgaaa gccgcggatg gtttcggctt agccgaaggc gcgggtgtcc ttgtactgca 240
gcgtctgagc gctgcgcgtc gcgagggtcg cccggtattg gcagtcctgc gcggtagcgc 300
ggtaaaccaa gatggagcat cgaatggtct tacggcgccg tcaggcccgg cccagcagcg 360
tgttatccgt cgtgctctgg aaaatgcggg cgtccgcgca ggcgatgtgg attatgtcga 420
agctcacgga acgggcacgc gcttaggcga ccccatcgag gttcacgcgc tcttatctac 480
ttatggcgcc gagcgcgatc cggatgaccc gctttggatc ggctccgtga agagcaacat 540
cggtcacacc caggcggctg cgggtgtggc cggtgttatg aaggcagtgt tagcgctgcg 600
ccatggcgag atgcctcgca cgctgcattt cgacgaaccg tcaccgcaga tcgagtggga 660
cttaggtgcc gtttctgtgg tgtcacaagc gcgcagctgg ccagcgggcg agcgcccgcg 720
ccgcgcagga gtgtcatctt ttggtatctc tggcactaac gcacacgtca tcgtggaaga 780
ggcgccggaa gcagatgagc cggaacccgc tccggacagt ggcccagttc cacttgtgct 840
cagcgggcgc gacgagcaag caatgcgtgc tcaagcgggc cgtctggcgg accacctggc 900
gcgtgaacca cgcaactcgc tgcgtgatac gggatttaca ttagcaaccc gccgcagcgc 960
gtgggagcat cgcgcagtcg ttgtgggaga tcgcgacgat gccctggcgg gtttgcgcgc 1020
tgttgctgat ggccgtatcg ccgatcgcac cgcgaccggt caggctcgca cccgtcgcgg 1080
cgttgccatg gtgtttccgg gtcaaggtgc gcagtggcaa gggatggcgc gcgacctgct 1140
tcgtgagagc caggtagaga cccta 1165
<210> 24
<211> 1160
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 24
tagggtctca tagcccagca acgccgttca gacggcttgc cggcgacggc agtggcctgg 60
ggcacctggg ccggctccgg gatggccgaa ggtccggttg cggatcgctt ccgccgtcac 120
ggcgtaattg aaatgccccc ggaaaccgcg tgtcgcgctc tgcaaaacgc actcgaccgt 180
gccgaggtat gtccgatcgt aatcgatgtg cgttgggacc gtttcttact ggcctatacc 240
gcacaacgcc cgacgcgcct gttcgacgag atcgatgatg cgcgccgcgc ggccccgcag 300
gcggcggccg agcctcgtgt tggagctttg gccagtctgc ctgcaccgga gcgcgagaaa 360
gccctgttcg aactcgtgcg cagccatgct gcggcagtac tgggccacgc gagcgccgag 420
cgtgtccctg cggaccaagc attcgccgaa cttggcgtgg actcgttatc ggcgcttgaa 480
ctgcgtaatc gccttggcgc ggccaccggc gtacgtctgc cgacgacgac cgtgtttgac 540
catccggatg ttcgcaccct ggcggcccat ctggcggccg aacttggtgg tgccactgga 600
gccgaacagg cggcgccggc caccaccgcg ccggtagatg agccgatcgc aattgttggc 660
atggcgtgtc gccttccggg tgaagtcgac tcgccggagc gtctttggga gttaatcaca 720
agtgggcgtg attccgctgc cgaagtaccc gatgatcgcg gctgggtgcc agatgagctg 780
atggcctctg acgcagcagg tacccgccgt gcgcacggta actttatggc gggcgcagga 840
gactttgatg ctgcattctt tggaatttct ccacgtgaag cattggcaat ggacccacaa 900
caacgtcaag ccttagagac tacctgggaa gcacttgaaa gtgctggtat tccgccagag 960
acgttacgcg gctcggacac aggcgtattc gtcggcatga gccatcaggg gtacgccaca 1020
ggccgtccgc gtccagaaga tggtgttgat ggctatctct tgaccggcaa tacagccagc 1080
gtggcaagcg ggcgcatcgc ctatgtgctg ggcctcgaag gaccggcgtt aactgttgat 1140
actgcatgta agagacccta 1160
<210> 25
<211> 1181
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 25
tagggtctca taaacctgtc gcgcgccgca gcacggaagt ggatgaagtt tcagcactgc 60
gttatcgtat tgaatggcgt cctaccggcg cgggcgaacc ggcgcgcctt gacggcacct 120
ggctggtagc taaatatgcc ggcacggcgg atgagacgtc aacagcggcc cgtgaagccc 180
tggagagcgc gggcgcccgt gttcgcgagc ttgttgttga tgcccgttgt ggccgtgacg 240
aactcgccga acgtctgcgc agtgtcggcg aggtagccgg tgtactttca ctgttagcgg 300
tggacgaagc cgaaccggaa gaagcgccgc tcgcgctggc cagtcttgcg gatactctgt 360
cactggttca agccatggtg tcagcggaac ttggttgtcc tttatggact gttactgaga 420
gtgccgtagc gaccggtccc tttgagcgcg tacgtaacgc ggctcacggc gcactttggg 480
gagtgggtcg tgtcattgcc ttagagaacc cggccgtctg gggcggcctg gttgacgttc 540
ccgccggctc ggttgcggaa cttgctcgcc acttagcggc ggtggttagt ggtggagcgg 600
gtgaagatca actggcgctc cgtgcggatg gagtgtacgg ccgccgctgg gtgcgcgcgg 660
cggcccctgc gaccgatgat gaatggaaac cgaccggaac cgtgcttgtg acaggcggta 720
ccggtggggt aggtggccag attgcacgct ggctggcacg tcgtggggcg ccgcatctgt 780
tactggtatc ccgctccgga ccggacgcag atggcgctgg cgagctggtt gcggaattgg 840
aagcacttgg ggcacgcacg accgtagctg cgtgcgatgt gacggaccgt gaatcggtcc 900
gtgagcttct gggcggcatc ggtgacgatg tacctctctc ggccgttttc catgcggcag 960
caactctgga cgacggtacg gtggatactt taaccggcga acgcatcgaa cgtgcgagcc 1020
gcgccaaagt gctgggtgcc cgtaatttgc acgagcttac ccgcgagctt gacttaactg 1080
cgttcgtttt atttagtagc ttcgcgagcg cctttggggc cccgggcttg ggtggatacg 1140
cgccgggtaa cgcctatctg gatggattag cagagaccct a 1181
<210> 26
<211> 1171
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 26
tagggtctca cattgcggaa ggcatgcgct cggccctggc atggtttgca ccgggtggga 60
gcgaggtgcc gttttacgcc agtctgaccg gtggtgccgt agacacccgt gagctggttg 120
cggattactg gcgtcgcagc tttcgtctcc ccgtgcgttt tgatgaggcc attcgtagtg 180
cacttgaagt gggcccgggg acgtttgtag aggcatcacc ccaccccgtg cttgccgcag 240
cattacagca gaccctcgac gccgaaggct cgtcagccgc ggtagtgcca acgttacaac 300
gcggccaagg tgggatgcgc cgtttcctgc tcgctgccgc gcaagcgttt acgggcggcg 360
tggcggtgga ctggaccgcg gcgtacgatg acgttggggc ggaacctggt agtctgccag 420
agtttgcccc agccgaagaa gaggacgaac cggcagagag cggtgtggac tggaacgcac 480
cgccacacgt gctccgcgaa cgtctccttg cggtcgtgaa cggtgaaacg gcggcattag 540
ctggtcgcga ggctgatgca gaggcaacct tccgcgaact cggcttggat agcgtcttag 600
cggcccagtt acgtgcgaag gtatcagccg ccattggacg tgaggtcaat atcgcactgt 660
tatacgacca cccaacccct cgtgctctgg ctgaagcgct ggcggcaggg accgaggttg 720
cccaacgtga gacacgcgca cgtaccaacg aggcggcgcc tggcgagccg gtggccgtcg 780
ttgcgatggc ctgtcgcctt ccgggcggtg tatccacacc ggaagagttt tgggagttgc 840
tctccgaggg tcgtgatgcc gttgcggggt taccgacaga tcgcggctgg gacctggact 900
cgctgtttca tccggatccg actcgtagtg gaaccgcgca tcagcgtgga ggagggtttc 960
tgactgaggc cacggcgttc gacccggcct tcttcggtat gagcccgcgc gaagctcttg 1020
ctgttgaccc gcagcagcgc ctgatgcttg agctctcttg ggaagtgttg gagcgcgcgg 1080
gcattccccc gacctcactt caagcttcac ctacaggggt atttgttggc ctgattccgc 1140
aagagtacgg cccgcgttta gagagaccct a 1171
<210> 27
<211> 1136
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 27
tagggtctca ttagcggaag gcggagaggg agttgagggc tacctgatga ccgggacgac 60
gacgagcgtg gcgagtggcc gcatcgcgta tacgctgggc ttagagggcc ctgctatcag 120
cgtagacacc gcgtgcagta gttcattggt tgccgtacat ttggcctgtc agagccttcg 180
tcgcggtgag agctctttag cgatggccgg tggggtgacc gtgatgccta cgcctgggat 240
gctcgttgac ttttcacgta tgaactctct ggcacccgat ggtcgttgta aagcctttag 300
cgcaggagct aacggttttg gcatggccga gggtgcgggg atgctcttgt tagaacgctt 360
atcggatgcg cgtcgtaatg gtcatccagt actggcggtt ctgcgtggca ccgcggtaaa 420
ttctgacggc gcctcaaacg gcttgagtgc acctaatggt cgcgcgcagg tacgtgtgat 480
tcagcaagct ctggcggaaa gtggcttggg tccggccgac attgatgcgg tggaagcgca 540
tggaacaggt acgcgcctgg gcgatccgat tgaagcacgc gctctgtttg aagcctatgg 600
ccgcgaccgt gaacaaccgt tacacctcgg cagcgtcaaa tccaacctgg gccacaccca 660
ggcggcggct ggcgtcgcgg gtgtcattaa aatggtcctc gctatgcgcg ccggtacgct 720
gcctcgtacg ttacatgctt cggaacgttc taaagagatc gattggtcgt cgggcgcaat 780
ttctctgtta gacgagccgg aaccgtggcc ggcgggagct cgtccacgtc gtgcgggcgt 840
tagctcattc ggcatctccg gcacgaacgc ccacgccatc atcgaagaag cgcctcaagt 900
tgtagagggc gaacgcgtcg aagcaggaga tgttgttgca ccctgggttc tctcagccag 960
cagcgccgag ggcttacgtg cgcaggcggc ccgtcttgcc gcgcatctgc gtgaacaccc 1020
gggccaggac ccacgcgata ttgcgtatag tcttgcaact ggacgcgcgg ccctgccaca 1080
ccgcgccgca tttgcacccg tggatgaaag cgccgccctg cgcgtgagag acccta 1136
<210> 28
<211> 1158
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 28
tagggtctca cgtgcttgat ggtctggcca cagggaatgc cgacggcgcg gcagttggta 60
ccagtcgcgc acagcaacgc gccgtgtttg tatttcctgg tcagggttgg cagtgggctg 120
gcatggccgt ggatttgctg gatacaagcc ctgtgttcgc cgctgcatta cgtgagtgtg 180
cggacgcact ggaaccgcac cttgactttg aagtaattcc gttcctgcgt gccgaggcag 240
cacgtcgtga acaggatgcg gcgttatcta ctgaacgtgt ggatgtcgtg cagccagtta 300
tgttcgcggt gatggtatcg ttagccagca tgtggcgcgc ccacggggtt gaaccggccg 360
cagtgattgg tcacagccaa ggggaaatcg cagcagcttg cgttgccggc gcgttaagtc 420
tggacgacgc agcccgtgtg gtagccttac gtagccgcgt gatcgccact atgccgggca 480
acaaagggat ggcaagcatt gcggcaccag cgggcgaggt tcgtgcccgc attggagatc 540
gcgtcgaaat cgcggcggta aacgggccgc gtagtgtggt tgtggccggt gactccgatg 600
agttagatcg cctcgtggca tcctgcacca cggaatgtat tcgcgcaaaa cgtctcgcag 660
ttgactacgc gtcacattcc agccatgtcg agactattcg tgacgcgctg catgcagaat 720
taggtgaaga ttttcatccg cttcccgggt ttgtgccgtt cttctccacg gtaaccggcc 780
gctggacgca gcctgacgaa cttgacgccg ggtattggta tcgtaacctg cgtcgtaccg 840
tgcgtttcgc ggatgccgta cgtgcccttg cagagcaagg atatcgtacg ttcttagaag 900
tgagcgcaca cccgattctc acagcggcga tcgaagagat tggtgatggc agcggagcgg 960
acttgagcgc aattcattcc ttacgtcgtg gcgacggctc attagccgat tttggcgagg 1020
cgctgagccg cgcgtttgcc gccggtgtcg ccgtggattg ggagtccgtt catcttggta 1080
ccggggcgcg tcgcgttcca ctgcctacct atccctttca acgcgagcgt gtgtggttgg 1140
aacctaaaag agacccta 1158
<210> 29
<211> 1126
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 29
tagggtctca cgctggtgtt tgaccacccg acgcccctcg ctgtagcgga gcaccttcgc 60
gaccgcctct tcgcagcgag tccggcggtt gacattggtg accgtctcga cgaacttgaa 120
aaggcattag aggctctcag cgcagaagat gggcacgatg atgttggtca acgcctggag 180
agcctgctcc gtcgctggaa ttcccgccgt gctgatgcac cgagcaccag cgcgatctct 240
gaagatgcat ctgacgatga actgtttagc atgttggacc agcgttttgg cggcggcgaa 300
gatctctagt agcataaccc cttggggcct ctaaacgggt cttgaggggt tttttgagga 360
cgcgttgcgc agatgtacga caatatctcc gcttctagta cctcactaat acgactcact 420
atagggagaa gctgtcaccg gatgtgcttt ccggtctgat gagtccgtga ggacgaaaca 480
gcctctacaa ataattttgt ttaatttgtt taactttaag aaggagaatg agtggagaca 540
atggcatgac ggaagagaaa ctgcgtcgtt atctgaaacg tactgtcact gaattggata 600
gtgtgacagc gcgcctgcgt gaagtcgaac accgcgccgg cgaaccgatt gcgattgtgg 660
ggatggcatg ccgtttccca ggtgacgtag attcgccgga gagtttctgg gagtttgtaa 720
gcggcggcgg tgacgcgatt gcggaagcgc ctgcggatcg tggctgggag cctgatccgg 780
atgcacgtct tggtggaatg ctggcggcgg caggggattt tgatgccggc ttcttcggca 840
ttagcccacg tgaagcattg gccatggatc cgcaacaacg tattatgttg gaaatttcgt 900
gggaagcgct ggagcgcgct ggtcatgacc ctgtgagttt gcgcgggagt gcgaccgggg 960
tgttcaccgg agtggggacc gtggactatg gcccccgtcc agatgaagca cctgacgaag 1020
ttttaggtta tgtgggcacg ggaactgcta gcagtgtagc ctcggggcgc gtggcgtatt 1080
gcctgggact tgagggccca gccatgactg tagataagag acccta 1126
<210> 30
<211> 1169
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 30
tagggtctca tctggcgagt ggggaaactg cagtcgtggt aactgacgtc gactggccgg 60
cgttcgccga atcatacacc gcggcacgcc cgcgtcctct gttagatcgc attgtgacca 120
ccgcaccatc agagcgtgcg ggtgagccag aaacggaatc gcttcgcgat cgtctcgctg 180
gattaccacg cgctgagcgc accgcggaac tggtacgctt agtacgtact agtaccgcga 240
ccgtcttggg ccacgatgat ccaaaggcgg tccgcgccac gaccccgttt aaagaattag 300
gcttcgatag cttagccgct gttcgtttac gcaacttact caatgcagcc accggcctgc 360
gtctgcctag tacgctggta ttcgaccacc cgaacgcgag tgccgtggct ggtttcctgg 420
acgccgagct tggtactgaa gtgcgtggcg aggctccatc ggctctggcc ggacttgatg 480
cactggaagc ggcccttcct gaggtacctg ccaccgaacg tgaagagctg gtgcaacgct 540
tagaacgtat gttagcggct ttacgtccag tcgcgcaggc tgccgacgcc agcggtacag 600
gcgcgaatcc gagcggagat gatctgggtg aagcaggcgt tgacgagctc cttgaggccc 660
tcggccgcga gttagacggg gactagtagc ataacccctt ggggcctcta aacgggtctt 720
gaggggtttt ttgactacga gatttgaggt aatctccgct tctagtacct cactaatacg 780
actcactata gggagaagct gtcaccggat gtgctttccg gtctgatgag tccgtgagga 840
cgaaacagcc tctacaaata attttgttta atttgtttaa ctttaagaag gagaatgaca 900
gattcagaga aagttgcaga gtacttgcgc cgcgccacgc ttgaccttcg tgccgcgcgc 960
caacgcattc gtgagctgga aagcgatccc attgcgatcg tctcgatggc gtgtcgtctg 1020
ccgggtggtg tgaacacccc acaacgttta tgggagctgc tccgtgaggg cggggaaacc 1080
ttgtcgggct ttcccaccga tcgtggctgg gaccttgctc gtttgcatca cccggacccg 1140
gataatccag gaacgtctta gagacccta 1169
<210> 31
<211> 780
<212> DNA
<213>人工序列
<220>
<223>DNA片段
<400> 31
tagggtctca attatcgagc acctgcttgg attaccgtgg ttgtctccgc ttctagtacc 60
tcactaatac gactcactat agggagaagc tgtcaccgga tgtgctttcc ggtctgatga 120
gtccgtgagg acgaaacagc ctctacaaat aattttgttt aatttgttta actttaagaa 180
ggagaatggc cgacttatcg aaactgtcag attcgcgtac cgcccaaccc ggccgcattg 240
tgcgcccttg gccacttagt ggttgtaacg aatctgccct tcgtgcccgc gcgcgccaac 300
tgcgtgccca cttagaccgc tttccggacg ccggcgtgga aggcgtgggt gcagcgctgg 360
cacatgatga acaagcagat gcaggccccc atcgtgctgt tgtggtggca agctctacta 420
gcgaactgtt agacggtctg gcggccgtgg cggatgggcg cccacatgcc tcagtagttc 480
gtggcgtagc tcgcccgtca gcacctgttg ttttcgtatt tccgggtcaa ggagcccaat 540
gggcgggcat ggccggtgag ttgctgggtg agtcccgcgt gttcgcagcg gcgatggatg 600
cttgcgcacg tgccttcgaa cccgtgacag attggaccct cgcgcaagta ctggattcac 660
cggaacaaag tcgccgcgta gaagtagtac agccggcgct gttcgcagtg cagacgagcc 720
tcgcagcctt atggcgcagt ttcggggtga cgccagacgc cgtggttggc cactccattg 780

Claims (9)

1.一种制备包含编码PKS的DNA在内的质粒的方法,其包括以下工序:在枯草芽孢杆菌感受态细胞中导入包含编码I型聚酮合酶(PKS)的DNA串联重复序列在内的DNA构建体的工序。
2.根据权利要求1所述的方法,其包括以下工序:通过用TypeII限制性核酸内切酶切割多个DNA片段前体,来制备两端具有粘性末端的多个DNA片段的工序;通过连接多个所述DNA片段,来制备所述DNA构建体的工序。
3.根据权利要求2所述的方法,其包括以下工序:通过将包含不同种类的多个所述DNA片段的溶液进行混合以使得各溶液中的DNA片段的摩尔浓度比为0.8~1.2,来制备编码I型聚酮合酶(PKS)的DNA串联重复序列的工序。
4.根据权利要求2或3所述的方法,其中,所述DNA片段前体的GC含量为65%以下。
5.根据权利要求1至4中任一项所述的方法,其中,所述导入工序是将所述DNA构建体与枯草芽孢杆菌感受态细胞共培养的工序。
6.根据权利要求1至5中任一项所述的方法,其中,其还包括从导入了所述DNA构建体的枯草芽孢杆菌中回收质粒DNA的工序。
7.一种包含编码I型聚酮合酶(PKS)的DNA在内的质粒,其中,其通过根据权利要求1至6中任一项所述的方法而得到。
8.一种制备PKS的方法,其包括以下工序:用质粒转化宿主细胞的工序;培养转化后的所述宿主细胞的工序;其中,所述质粒是通过根据权利要求1至6中任一项所述的方法而得到的、且包含编码I型聚酮合酶(PKS)的DNA在内的质粒。
9.根据权利要求8所述的方法,其中,所述宿主细胞是Streptomyces属细菌。
CN202180037678.5A 2020-05-26 2021-05-25 含i型聚酮合酶基因的质粒的制备方法 Pending CN115667519A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020-091798 2020-05-26
JP2020091798 2020-05-26
PCT/JP2021/019819 WO2021241584A1 (ja) 2020-05-26 2021-05-25 I型ポリケチドシンターゼ遺伝子を含むプラスミドの調製方法

Publications (1)

Publication Number Publication Date
CN115667519A true CN115667519A (zh) 2023-01-31

Family

ID=78744095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180037678.5A Pending CN115667519A (zh) 2020-05-26 2021-05-25 含i型聚酮合酶基因的质粒的制备方法

Country Status (5)

Country Link
US (1) US20230174997A1 (zh)
EP (1) EP4159861A4 (zh)
JP (1) JPWO2021241584A1 (zh)
CN (1) CN115667519A (zh)
WO (1) WO2021241584A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4349988A1 (en) * 2021-05-25 2024-04-10 Spiber Inc. Method for producing plasmid, and plasmid

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2618699C (en) 2005-08-11 2012-10-02 J. Craig Venter Institute, Inc. In vitro recombination method
WO2008095927A1 (en) 2007-02-05 2008-08-14 Philipps-Universität Marburg Method of cloning at least one nucleic acid molecule of interest using type iis restriction endonucleases, and corresponding cloning vectors, kits and system using type iis restriction endonucleases
EP3064599B1 (en) 2008-02-15 2018-12-12 Synthetic Genomics, Inc. Methods for in vitro joining and combinatorial assembly of nucleic acid molecules
JP6440636B2 (ja) * 2014-01-21 2018-12-19 株式会社シンプロジェン 単位dna組成物の調製方法及びdna連結体の作製方法

Also Published As

Publication number Publication date
WO2021241584A1 (ja) 2021-12-02
EP4159861A4 (en) 2024-06-05
JPWO2021241584A1 (zh) 2021-12-02
US20230174997A1 (en) 2023-06-08
EP4159861A1 (en) 2023-04-05

Similar Documents

Publication Publication Date Title
US20040166567A1 (en) Synthetic genes
Rodriguez et al. Rapid engineering of polyketide overproduction by gene transfer to industrially optimized strains
EP4159862A1 (en) Method for preparing combinatorial library of multi-modular biosynthetic enzyme gene
Wu et al. Toward improvement of erythromycin A production in an industrial Saccharopolyspora erythraea strain via facilitation of genetic manipulation with an artificial attB site for specific recombination
US6265202B1 (en) DNA encoding methymycin and pikromycin
WO2005103279A2 (en) Synthetic genes
US6838265B2 (en) Overproduction hosts for biosynthesis of polyketides
CN115667519A (zh) 含i型聚酮合酶基因的质粒的制备方法
Wilkinson et al. Biocatalysis in pharmaceutical preparation and alteration
CN112080454B (zh) 一株产柔红霉素的工程链霉菌及其构建方法
CA2547560A1 (en) Polyketides and their synthesis
WO2003033699A2 (en) Production, detection and use of transformant cells
JP7370121B2 (ja) プラスミドの製造方法及びプラスミド
WO2024062992A1 (ja) Dna配列のスクリーニング方法
KR100636653B1 (ko) 신규한 올리보실 피크로마이신 유도체 및 그 제조방법
CA2376559A1 (en) Dna manipulation methods, applications for synthetic enzymes and use for polyketide production
KR100649394B1 (ko) 신규한 올리보실 메티마이신 유도체 및 그 제조방법
US20040241799A1 (en) Methods of directing C-O bond formation utilizing a type II polyketide synthase system
Zhao et al. Pathway and enzyme engineering and applications for glycodiversification
US20050208629A1 (en) Plasmids for polyketide production
US20030073824A1 (en) DNA encoding methymycin and pikromycin
KR100989238B1 (ko) 안트라사이클린 계열 항암제 에피루비신의 생합성 방법,안트라사이클린 계열 신규 당치환체 및 그 제조 방법
US20030194784A1 (en) DNA encoding methymycin and pikromycin
KR20090101150A (ko) 안트라사이클린 계열 항암제 에피루비신의 생합성 방법, 안트라사이클린 계열 신규 당치환체 및 그 제조 방법
JP2004089156A (ja) ビセニスタチン合成酵素遺伝子クラスター、ビセニサミン糖転移酵素ポリペプチドおよび当該ポリペプチドをコードする遺伝子

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination