CN114981428A - 用于修饰芽孢杆菌属基因组的无选择标记方法及其组合物 - Google Patents

用于修饰芽孢杆菌属基因组的无选择标记方法及其组合物 Download PDF

Info

Publication number
CN114981428A
CN114981428A CN202080093883.9A CN202080093883A CN114981428A CN 114981428 A CN114981428 A CN 114981428A CN 202080093883 A CN202080093883 A CN 202080093883A CN 114981428 A CN114981428 A CN 114981428A
Authority
CN
China
Prior art keywords
bacillus
sequence
cell
dna
bacillus species
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202080093883.9A
Other languages
English (en)
Inventor
F·O·本德苏
S·I·R·斯塔布斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Danisco US Inc
Original Assignee
Danisco US Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Danisco US Inc filed Critical Danisco US Inc
Publication of CN114981428A publication Critical patent/CN114981428A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/24Vectors characterised by the absence of particular element, e.g. selectable marker, viral origin of replication

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

提供了用于在不使用可选择标记和不使用受指导的Cas内切核酸酶的情况下修饰芽孢杆菌属物种(Bacillus sp.)细胞的基因组的方法和组合物。本公开包括用于在不使用可选择标记和不使用Cas内切核酸酶进入芽孢杆菌属物种细胞的基因组的情况下将供体DNA序列整合进所述基因组中的方法、以及用于缺失目的基因和/或向芽孢杆菌属物种细胞的基因组中提供点突变的方法。

Description

用于修饰芽孢杆菌属基因组的无选择标记方法及其组合物
技术领域
本发明涉及细菌分子生物学领域,特别地涉及用于在不使用可选择标记和不使用Cas内切核酸酶的情况下修饰芽孢杆菌属物种(Bacillus sp.)细胞的基因组的组合物和方法。
相关申请的交叉引用
本申请要求于2019年11月19日提交的美国临时专利申请号62/937,372的权益,将该申请通过引用以其全文并入本文。
以电子方式递交的序列表的引用
该序列表的官方副本经由EFS-Web作为ASCII格式的序列表以电子方式递交,文件名为NB41425-WO-PCT_SequenceListing.txt,创建于2020年11月02日,且具有188千字节大小,并与本说明书同时提交。包含在此ASCII格式的文件中的序列表是本说明书的一部分并且通过引用以其全文并入本文。
背景技术
酶在芽孢杆菌属物种(Bacillus species,Bacillus sp.)中的商业生产需要用于构建无抗生素抗性标记的菌株的方法。这些方法应该符合几个标准:(i)可用于插入目的基因和宿主修饰二者,(ii)快速且有效,以及(iii)易于使用。
一种广泛使用的已知用于改变芽孢杆菌属物种的染色体的方法涉及构造质粒构建体并将它们转化进大肠杆菌(Escherichia coli,E.coli)中。随后,将这些质粒从大肠杆菌中分离出来并使用可选择标记转化进芽孢杆菌属物种中。这种方法的广泛使用可至少部分归因于大肠杆菌比芽孢杆菌属(Bacillus)更容易转化的观念。在这方面,质粒的体外连接产生可以转化大肠杆菌但不能转化芽孢杆菌属的带切口的产物。在芽孢杆菌属物种中引入供体DNA的常规方法是基于复制质粒。不幸的是,这种方法通常与许多缺点相关,包括需要抗生素或其他可选择标记来维持质粒在细胞中。这对于生产菌株来说是不希望的并且它限制了筛选条件的选择。使用复制质粒的另一个缺点是质粒上的基因通常以多个拷贝存在,影响基因调节和表达。
可替代地,可以使用整合质粒或载体。整合载体不包含复制起点,因此需要插入到宿主染色体中才能稳定维持。然而,这些并非没有问题。整合经由坎贝尔型重组事件(Campbell-type recombination event)发生,在插入的(现在是线性)载体任一端处产生克隆区域的重复。取决于整合的位置,基因可能会被破坏,导致转化效率较差。
非抗生素选择盒目前可用于构建无ARM菌株(Ferrari等人1985,Nat.Biotechnol.[自然生物技术]第3卷:1003-1007)。然而,这很耗时,并且需要去除盒才能在同一菌株中使用。
以前用于基因修饰和基因整合进芽孢杆菌属物种细胞的基因组中的方法依赖于自发的双链断裂事件和可选择标记的使用,这些可选择标记共定位于具有短同源臂的线性DNA片段(包含待插入到基因组中的目的基因(GOI)以及也插入到基因组中以能够鉴定已将目的基因整合进其基因组中的芽孢杆菌属物种细胞的可选择标记二者)上(WO 02/14490,2002年2月21日公开)。典型地,可选择标记和GOI侧翼有两个短同源臂,这样使得在与细胞内的DNA重组时,将GOI和可选择标记二者整合到细胞的DNA中。需要在转化此类具有短同源臂的线性片段以将基因组整合进芽孢杆菌属物种细胞中的过程中使用可选择标记以选择基因组的特定基因座的有效修饰。可选择标记必须整合进正确的基因座才能表达,并且这种整合依赖于在群体和基因组内以随机方式发生的罕见的、自发的DNA损伤。这种罕见的事件只能通过结合使用标记和染色体整合来选择。(WO 02/14490,2002年2月21日公开)。
在枯草芽孢杆菌(Bacillus subtilis)中,已经描述了将单个质粒系统与Cas内切核酸酶/RNA指导的系统结合使用,以允许基因缺失和在基因中引入点突变(AltenbuchnerJ.,2016,Applied and Environmental Microbiology[应用与环境微生物学],第82卷(17)第5421页-第5427页)。尽管基于Cas的基因组工程技术已经应用于许多不同的宿主细胞类型,但这些技术都有已知的局限性。CRISPR/Cas9方法已用于构建无ARM无标记菌株(So等人2017,Front Microbiol[微生物前沿],第8卷:1167,Zhang等人2016,Sci Rep[科技报告],第6卷:27943)。这种方法需要使用Cas9技术,构建编码Cas9以及针对基因组上每个待修饰位点的指导RNA的质粒或线性片段。在程序结束时,它还需要去除Cas9。虽然是对以前的方法的改进,但基于Cas9的方法仍然涉及许多步骤。
因此,仍然需要开发有效、高效或在其他方面更稳健的,用于在不使用可选择标记和/或Cas内切核酸酶的情况下进行基因组修饰、以及将供体DNA序列的基因(例如但不限于目的多核苷酸、单拷贝基因表达盒或多拷贝基因表达盒)整合进芽孢杆菌属物种细胞的基因组中的方法。
发明内容
本公开包括用于在不使用可选择标记和不使用受指导的Cas内切核酸酶系统的情况下修饰芽孢杆菌属物种细胞的基因组的方法和组合物。本公开包括用于在不使用可选择标记和不使用Cas内切核酸酶进入芽孢杆菌属物种细胞的基因组的情况下将供体DNA序列整合进所述基因组中的方法、以及用于缺失目的基因和/或向芽孢杆菌属物种细胞的基因组中提供突变的方法。
在不希望受任何特定理论、作用机制或方式约束的情况下,申请人令人惊讶且出乎意料地发现:当将在其末端处包含长同源臂(每个同源臂具有至少900个核苷酸)的线性DNA构建体引入感受态芽孢杆菌属物种细胞中时,观察到高效率的基因组修饰(例如但不限于供体DNA序列整合、核苷酸缺失、突变),其中引入和基因组修饰在不使用可选择标记或受指导的Cas内切核酸酶系统的情况下发生。
这些方法采用将线性DNA构建体引入感受态芽孢杆菌属物种细胞中,其中所述线性DNA构建体侧翼有至少900bp的同源臂,任选地包含侧翼是所述同源臂的供体DNA,其中所述DNA构建体不包含编码内切核酸酶的DNA片段并且其中所述DNA构建体不包含编码可选择标记的DNA序列。
在一个实施例中,所述方法是用于在不使用可选择标记的情况下将供体DNA整合进芽孢杆菌属物种(Bacillus sp.)细胞的基因组中的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含侧翼为上游同源臂(HR1)和下游同源臂(HR2)的供体DNA,其中每个同源臂长度是至少900个核苷酸,其中所述DNA构建体不包含可选择标记,并且所述方法任选地进一步包括使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,和鉴定已将所述供体DNA序列稳定地整合进其基因组中的芽孢杆菌属物种子代细胞。
在一个实施例中,所述方法是用于在不使用可选择标记的情况下缺失芽孢杆菌属物种细胞的基因组中的核苷酸序列的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含上游同源臂(HR1)和下游同源臂(HR2),其中每个同源臂长度是至少900个核苷酸并且与侧翼于所述待缺失的核苷酸序列的基因组DNA区域具有序列同源性,其中所述DNA构建体不包含可选择标记。
在一些实施例中,每个同源臂长度是至少900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、5000、6000个核苷酸和高达7000个核苷酸。
如本文所述的线性DNA构建体可以是双链DNA。
在一个实施例中,该感受态芽孢杆菌属物种细胞是选自由以下组成的组的芽孢杆菌属物种细胞:枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacilluslicheniformis)、迟缓芽孢杆菌(Bacillus lentus)、短小芽孢杆菌(Bacillus brevis)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、嗜碱芽孢杆菌(Bacillusalkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、克劳氏芽孢杆菌(Bacillus clausii)、耐盐芽孢杆菌(Bacillus halodurans)、巨大芽孢杆菌(Bacillusmegaterium)、凝结芽孢杆菌(Bacillus coagulans)、环状芽孢杆菌(Bacilluscirculans)、灿烂芽孢杆菌(Bacillus lautus)、和苏云金芽孢杆菌(Bacillusthuringiensis)。
在一个实施例中,这些感受态芽孢杆菌属物种细胞通过引入的核酸构建体的至少一个拷贝而成为感受态,所述引入的核酸构建体包含与编码选自由ComK、ComS或其任一种组合组成的组的多肽的多核苷酸可操作地连接的启动子。
在一个实施例中,这些感受态芽孢杆菌属物种细胞来自超级感受态芽孢杆菌属物种菌株,例如但不限于Pxyl-ComK菌株。
在一个实施例中,所述方法是用于在不使用可选择标记的情况下将突变引入芽孢杆菌属物种细胞的基因组中的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含具有希望的突变的核苷酸序列,所述具有希望的突变的核苷酸序列侧翼为上游同源臂(HR1)和下游同源臂(HR2),并且其中每个同源臂长度是至少900个核苷酸,其中所述DNA构建体不包含可选择标记。
附图和序列的说明
图1描绘了使用在其末端处包含长同源臂(HR1和HR2,每个同源臂具有至少900个核苷酸(≥0.9kb))的线性DNA构建体、将该构建体引入感受态芽孢杆菌属物种细胞中来修饰芽孢杆菌属物种细胞的基因组的方法。在顶部图示(图1)中,该线性DNA构建体包含供体DNA,该供体DNA侧翼有两个长度为至少900个核苷酸的同源臂(一个5’上游臂HR1和一个3’下游臂HR2)。该供体DNA可以包含表达目的基因的表达盒。一旦将供体构建体引入细胞中,就会发生同源重组,将供体DNA整合进目的基因组基因座中。在底部图示(图1)中,该线性DNA构建体包含两个长度为至少900个核苷酸的同源臂(一个5’上游臂HR1和一个3’下游臂HR2),这两个HR臂之间没有另外的DNA。一旦将此线性DNA构建体引入细胞中,就会发生同源重组,从而产生核苷酸缺失(基因缺失)。可以通过本领域技术人员已知的任何机制将这些线性DNA构建体引入芽孢杆菌属物种细胞中。
具体实施方式
本公开包括用于在不使用可选择标记和指导RNA/Cas内切核酸酶系统的情况下修饰芽孢杆菌属物种细胞的基因组的方法和组合物。本公开包括用于在不将可选择标记整合进感受态芽孢杆菌属物种细胞的基因组的情况下将供体DNA序列整合进所述基因组中的方法和组合物。在一个方面,这些方法采用包含侧翼为长同源臂(长度≥900个核苷酸)的供体DNA序列的线性DNA构建体用于将所述供体DNA引入感受态芽孢杆菌属物种细胞的基因组中,并且因此提供用于将供体DNA序列整合进所述感受态芽孢杆菌属物种细胞的基因组中的高效系统,无需将可选择标记整合进所述芽孢杆菌属物种细胞的基因组中,也无需受指导的Cas系统。
本公开进一步包括用于在不使用可选择标记的情况下缺失芽孢杆菌属物种细胞的基因组中的核苷酸序列的方法和组合物,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含上游同源臂(HR1)和下游同源臂(HR2),其中每个同源臂长度是至少900个核苷酸并且与侧翼于所述待缺失的核苷酸序列的基因组DNA区域具有序列同源性,其中所述DNA构建体不包含可选择标记。
将本文件组织成若干部分以便于阅读;然而,读者将领会的是,在一个部分中进行的陈述可能适用于其他部分。以这种方式,用于本公开的不同部分的标题不应被解释为限制。
本文提供的标题并非对本发明的组合物和方法的各个方面或实施例进行限制,这些方面或实施例可通过将说明书作为一个整体来参考而得到。因此,把说明书作为一个整体参考时,以下即将定义的术语得以更全面地定义。
除非另有定义,本文使用的所有技术和科学术语具有与本发明组合物和方法所属领域的普通技术人员通常理解的相同含义。虽然类似于或等同于本文描述的那些的任何方法和材料也可以用于本发明的组合物和方法的实践或测试中,但现在将对代表性示例方法和材料进行描述。
在本说明书中引用的所有出版物和专利都通过引用并入本文,就好像每个单独的出版物或专利被具体地并单独地指示为通过引用并入,并且通过引用并入本文从而结合引用的出版物来公开和描述这些方法和/或材料。
如本文使用的,术语“公开”或“所公开的公开内容”不旨在是限制性的,而是广泛适用于权利要求书中限定的或本文所述的任何公开内容。这些术语在本文中可互换使用。
Cas基因和蛋白质
CRISPR(成簇的规律间隔的短回文重复序列)基因座是指DNA切割系统的某些遗传基因座编码组分,例如被细菌和古细胞用来破坏外源DNA的那些(Horvath和Barrangou,2010,Science[科学]327:167-170;2007年3月1日公开的WO 2007/025097)。CRISPR基因座可以由CRISPR阵列组成,包含由短的可变DNA序列(称为‘间隔子’)分开的短的正向重复序列(CRISPR重复序列),其可以侧翼是不同Cas(CRISPR关)基因。在给定的CRISPR基因座处的CRISPR相关基因的数目在物种之间可以不同。已经描述了包括具有多亚基效应子复合物(包括I型、III型和IV型亚型)的1类系统和具有单一蛋白质效应子(包括II型和V型亚型,例如但不限于Cas9、Cpf1、C2c1、C2c2、C2c3)的2类系统的多重CRISPR/Cas系统。1类系统(Makarova等人2015,Nature Reviews;Microbiology[自然综述微生物学]第13卷:1-15;Zetsche等人,2015,Cell[细胞]163,1-13;和WO 2013/176772 A1,2013年11月23日公开,将这些文献通过引用并入本文)。来自细菌的II型CRISPR/Cas系统采用crRNA(CRISPR RNA)和tracrRNA(反式激活CRISPR RNA)来将Cas内切核酸酶指导到其DNA靶标上。该crRNA含有与双链DNA靶标的一条链互补的间隔子区域和与tracrRNA(反式激活CRISPR RNA)碱基配对的区域,该tracrRNA形成指导Cas内切核酸酶切割DNA靶标的RNA双链体。通过未完全理解的涉及Cas1和Cas2蛋白的过程获得间隔子。除cas9基因之外,所有的II型CRISPR/Cas基因座含有cas1和cas2基因(Chylinski等人,2013,RNA Biology[RNA生物学]10:726-737;Makarova等人2015,Nature Reviews Microbiology[自然综述微生物学]第13卷:1-15)。II型CRISPR-Cas基因座可以编码tracrRNA,该tracrRNA与重复序列在对应的CRISPR阵列内部分互补,并且可以包含其他蛋白质(如Csn1和Csn2)。在Cas 1和cas2基因附近cas9的存在是II型基因座的标志(Makarova等人2015,Nature Reviews Microbiology[自然综述微生物学]第13卷:1-15)。I型CRISPR-Cas(CRISPR关)系统由称为Cascade(用于抗病毒防御的CRISPR-相关复合物(CRISPR-associated complex for antiviral defense))的蛋白质复合物组成,该复合物与单个CRISPR RNA(crRNA)和Cas3一起发挥功能以防御入侵的病毒DNA(Brouns,S.J.J.等人Science[科学]321:960-964;Makarova等人2015,Nature Reviews;Microbiology[自然综述微生物学]第13卷:1-15,将这些文献以其全文并入本文)。
本文的术语“Cas基因”是指通常与侧翼CRISPR基因座联接的、相关的、或接近的、或邻近的基因。术语“Cas基因”、“cas基因”“CRISPR关(Cas)基因”和“成簇的规律间隔的短回文重复序列相关基因”在本文中可互换使用。
术语“Cas蛋白”或“Cas多肽”是指由Cas(CRISPR关)基因编码的多肽。Cas蛋白包括Cas内切核酸酶。
Cas蛋白可以是细菌或古细菌蛋白。例如,本文中的I-III型CRISPR Cas蛋白典型地起源于原核生物;I型和III型Cas蛋白可以衍生自细菌或古细菌物种,而II型Cas蛋白(即Cas9)可以衍生自细菌物种。在其他方面,Cas蛋白包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4中的一种或多种,其同系物或其经修饰的版本。Cas蛋白包括Cas9蛋白、Cpf1蛋白、C2c1蛋白、C2c2蛋白、C2c3蛋白、Cas3、Cas3-HD、Cas5、Cas7、Cas8、Cas10或这些的组合或复合物。
术语“Cas内切核酸酶”是指当与适合的多核苷酸组分复合时能够识别、结合特定DNA靶序列的全部或部分、并任选地使特定DNA靶序列的全部或部分产生切口或切割特定DNA靶序列的全部或部分的Cas多肽(Cas蛋白)。Cas内切核酸酶由该指导多核苷酸指导以识别、结合双链DNA中的特定靶位点的全部或部分并任选地使双链DNA中的特定靶位点的全部或部分产生切口或切割双链DNA中的特定靶位点的全部或部分(例如,在细胞基因组中的靶位点处)。本文描述的Cas内切核酸酶包含一个或多个核酸酶结构域。在本文所述的供体DNA插入方法中采用的Cas内切核酸酶是在靶位点处向DNA中引入单链或双链断裂的内切核酸酶。可替代地,Cas内切核酸酶可能缺乏DNA切割或切口活性,但是当与适合的RNA组分复合时,仍然可以特异性结合DNA靶序列。
如本文使用的,称为“Cas9”(以前称为Cas5、Csn1或Csx12)或“Cas9内切核酸酶”或具有“Cas9内切核酸酶活性”的多肽是指Cas内切核酸酶,该Cas内切核酸酶与cr核苷酸和tracr核苷酸、或与单个指导多核苷酸形成复合物,用于特异性地结合DNA靶序列的全部或部分并任选地使DNA靶序列的全部或部分产生切口或切割DNA靶序列的全部或部分。Cas9内切核酸酶包含RuvC核酸酶结构域和HNH(H-N-H)核酸酶结构域,它们各自可以在靶序列处切割单DNA链(两个结构域的协同作用导致DNA双链切割,而一个结构域的活性导致切口)。通常,RuvC结构域包含亚结构域I、II和III,其中结构域I位于Cas9的N-末端附近,并且亚结构域II和III位于蛋白质的中间,即位于HNH结构域的侧翼(Makarova等人2015,NatureReviews Microbiology[自然综述微生物学]第13卷:1-15,Hsu等人,2013,Cell[细胞]157:1262-1278)。Cas9内切核酸酶典型地来源于II型CRISPR系统,该系统包括利用与至少一种多核苷酸组分复合的Cas9内切核酸酶的DNA切割系统。例如,Cas9可以与CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)复合。在另一个实例中,Cas9可以与单指导RNA复合(Makarova等人2015,Nature Reviews Microbiology[自然综述微生物学]第13卷:1-15)。
受指导的Cas系统
术语“指导RNA/Cas内切核酸酶复合物”、“指导RNA/Cas内切核酸酶系统”、“指导RNA/Cas复合物”、“指导RNA/Cas系统”、“gRNA/Cas复合物”、“gRNA/Cas系统”、“RNA指导的内切核酸酶”、“RGEN”在本文中可互换地使用并且是指能够形成复合物的至少一种RNA组分和至少一种Cas内切核酸酶,其中所述指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶指导至DNA靶位点,使Cas内切核酸酶能够识别、结合DNA靶位点并任选地使DNA靶位点产生切口或切割(引入单链或双链断裂)DNA靶位点。
DNA构建体和供体DNA
同源-定向修复(HDR)是在细胞中用来修复双链DNA和单链DNA断裂的机制。同源-定向修复包括同源重组(HR)和单链退火(SSA)(Lieber,2010Annu.Rev.Biochem.[生物化学年鉴]79:181-211)。HDR的最常见形式称为同源重组(HR),其在供体和受体DNA之间具有最长的序列同源性要求。HDR的其他形式包括单链退火(SSA)和断裂诱导的复制,并且这些需要相对于HR更短的序列同源性。缺口(单链断裂)处的同源-定向修复可以经由与在双链断裂处的HDR不同的机制发生(Davis和Maizels.PNAS[美国科学院院报](0027-8424),111(10),第E924页-第E932页)。
同源重组包括两个DNA分子之间在同源的位点处的DNA片段交换。同源重组的频率受多个因素影响。不同的生物体相对于同源重组的量和同源与非同源重组的相对比例而变化。为观察同源重组而需要的同源区域(同源臂)的长度因生物体而异。原核生物体(细胞)的基因组的改变,例如通过同源重组(HR),是对于基因工程而言的有力工具。在其他生物体中也可以实现同源重组。例如,在寄生原生动物利什曼原虫中,至少需要150-200bp的同源性进行同源重组(Papadopoulou和Dumas,(1997)Nucleic Acids Res[核酸研究]25:4278-86)并且在变形菌门大肠杆菌中,需要150-200bp的同源性进行有效重组(Lovett等人(2002)Genetics[遗传学]160:851-859)。
“同源”意指DNA序列是相似的。例如,在本文所述的DNA构建体上发现的“与基因组区域同源的区域”是与细胞或生物体基因组中给定的“基因组区域”具有类似序列的DNA的区域。同源的区域可以具有足以促进同源重组的任何长度。例如,本文所述的线性DNA构建体上的同源的区域的长度可以包含至少约900个碱基对(bp)至2000bp;900个碱基对(bp)至3000bp;1000个碱基对(bp)至2000bp;1000个碱基对(bp)至3000bp;1000个碱基对(bp)至4000bp;2000bp至3000bp;2000bp至4000bp;2000bp至5000bp;2000bp至6000bp,3000bp至4000bp;3000bp至5000bp;3000bp至6000bp,4000bp至5000bp;4000bp至6000bp,5000bp至高达6000bp,这样使得该同源的区域具有足够的同源性以与相应的基因组区域进行同源重组。“足够的同源性”表示两个多核苷酸序列具有足够的结构相似性以充当同源重组反应的底物。结构相似性包括每个多核苷酸片段的总长度以及多核苷酸的序列相似性。序列相似性可以通过在序列的整个长度上的百分比序列同一性和/或通过包含局部相似性(例如具有100%序列同一性的连续核苷酸)的保守区域以及在序列长度的一部分上的百分比序列同一性来描述。
同源性的量也可以通过在两个多核苷酸的完整比对长度上的百分比序列同一性来描述,其包括约至少50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的百分比序列同一性。足够的同源性包括多核苷酸长度、总体百分比序列同一性,和任选地连续核苷酸的保守区域或局部百分比序列同一性的任何组合,例如,足够的同源性可以被描述为与基因组的区域具有至少80%序列同一性的900-7000bp的区域。还可以通过用来在高严格条件下特异性杂交的两个多核苷酸的预测能力来描述足够的同源性,参见例如Sambrook等人,(1989)MolecularCloning:A Laboratory Manual[分子克隆:实验室手册],(Cold Spring HarborLaboratory Press,NY[纽约冷泉港实验室出版社]);Current Protocols in MolecularBiology[分子生物学现代方案],Ausubel等人,编辑(1994)Current Protocols[实验室指南](Greene Publishing Associates,Inc.[格林出版合伙公司]和John Wiley&Sons,Inc.[约翰威利父子公司]);以及Tijssen(1993)Laboratory Techniques in Biochemistryand Molecular Biology--Hybridization with Nucleic Acid Probes[生物化学和分子生物学中的实验室技术--与核酸探针杂交],(Elsevier[爱思唯尔出版社],纽约)。
如本文使用的,“基因组区域”是细胞的基因组中的存在于待修饰的基因组序列任一侧上的染色体的区段,或者可替代地,还包含待修饰的基因组区域的一部分。如本文所述的基因组区域的长度可以是至少900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、5000、6000个核苷酸和高达7000个核苷酸。
如本文所述的基因组区域的长度可以包含至少约900个碱基对(bp)至2000bp,900个碱基对(bp)至3000bp;1000个碱基对(bp)至2000bp、1000个碱基对(bp)至3000bp、1000个碱基对(bp)至4000bp、2000bp至3000bp;2000bp至4000bp;2000bp至5000bp;2000bp至6000bp,3000bp至4000bp;3000bp至5000bp;3000bp至6000bp,4000bp至5000bp;4000bp至6000bp,5000bp至高达6000bp或更多碱基,这样使得基因组区域具有足够的同源性以与相应的同源的区域进行同源重组。
如本文所述,待修饰的基因组序列包括待修饰的单碱基(例如本文所述的点突变)和待缺失的基因或染色体片段。在希望将供体DNA整合进芽孢杆菌属物种细胞的基因组中的方面,这些基因组区域直接彼此相邻地位于芽孢杆菌属物种基因组上。
在给定的基因组区域和在DNA构建体上发现的相应的同源的区域(HR1、HR2)之间的结构相似性可以是允许同源重组发生的任何程度的序列同一性。例如,由DNA构建体的“同源的区域”和生物体基因组的“基因组区域”共享的同源性或序列同一性的量可以是至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,这样使得序列进行同源重组。
如本文使用的,“DNA构建体”是指至少包含第一同源臂(HR1,也称为5’同源臂,5’HR)和第二同源臂(HR2,也称为3’同源臂,3’HR)的DNA序列。该DNA构建体可以进一步包含第一同源臂和第二同源臂之间的供体DNA(供体DNA的侧翼是同源臂)。
如本文使用的,“线性DNA构建体”是指线性的单链或双链DNA构建体。
如本文使用的,“同源臂”是指与芽孢杆菌属物种基因组中的基因组区域同源的核酸序列。在给定的基因组区域和在DNA构建体上发现的相应的同源臂(HR1、HR2)之间的结构相似性可以是允许同源重组发生的任何程度的序列同一性。例如,由DNA构建体的HR1和/或HR2的“同源的区域”和生物体基因组的“基因组区域”共享的同源性或序列同一性的量可以是至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,这样使得序列进行同源重组。
在一个方面,本公开的同源臂(侧翼于包含待整合进芽孢杆菌属物种基因组中的目的核苷酸序列的双链供体DNA并且位于本文所述的线性双链DNA构建体上)包括约900个碱基对(bp)至2000bp,900个碱基对(bp)至3000bp,1000个碱基对(bp)至2000bp,1000个碱基对(bp)至3000bp,1000个碱基对(bp)至4000bp,900个碱基对(bp)至2000bp;2000bp至3000bp;2000bp至4000bp;2000bp至5000bp;2000bp至6000bp,3000bp至4000bp;3000bp至5000bp;3000bp至6000bp,4000bp至5000bp;4000bp和6000bp,5000bp至高达7000bp。
在一个方面,本公开的同源臂(包含侧翼于待整合进芽孢杆菌属物种基因组中的目的核苷酸序列的单链供体DNA并且位于线性单链DNA构建体上)包括约900个核苷酸至2000个核苷酸,900个核苷酸至3000个核苷酸,1000个核苷酸至2000个核苷酸,1000个核苷酸至3000个核苷酸,1000个核苷酸至4000个核苷酸,900个核苷酸至2000个核苷酸;2000个核苷酸至3000个核苷酸;2000个核苷酸至4000个核苷酸;2000个核苷酸至5000个核苷酸;2000个核苷酸至6000个核苷酸;3000个核苷酸至4000个核苷酸;3000个核苷酸至5000个核苷酸;3000个核苷酸至6000个核苷酸;4000个核苷酸至5000个核苷酸;4000个核苷酸至6000个核苷酸;5000个核苷酸之间,6000个核苷酸至高达7000个核苷酸。
如本文使用的,“供体DNA”和“供体DNA序列”是指包含待插入到芽孢杆菌属物种细胞的基因组中的目的核苷酸序列的DNA序列。
如本文所述的供体DNA侧翼为第一同源臂(HR1,也称为5’同源臂,5’HR)和第二同源臂(HR2,也称为3’同源臂,3’HR),这些同源臂决定将供体DNA整合进感受态芽孢杆菌属物种基因组中的位置。
在一个方面,供体DNA序列的目的核苷酸序列包括目的多核苷酸,重组DNA,目的合成序列,目的异源序列,目的同源序列,目的基因,一个或多个表达盒,一个或多个重组DNA构建体,一个或多个表达盒,当与天然非转化的基因组序列相比时具有希望的修饰/突变(例如碱基取代)的核苷酸序列(例如但不限于单碱基),转录调节序列,翻译调节序列,启动子序列,终止子序列,转基因核酸序列,与信使RNA的至少一部分互补的反义序列,异源序列,或其任一种组合。
本文所述的目的多核苷酸可以在表达盒中提供用于在目的生物体中表达。
如本文使用的,术语“表达”是指产生功能性终产物(例如,crRNA、tracrRNA、mRNA、指导RNA、sRNA、siRNA、反义RNA、或处于前体或成熟形式的多肽(蛋白质))。术语“表达”包括涉及多肽的生产的任何步骤,这些步骤包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达盒可以包括可操作地连接到如本文所公开的多核苷酸的5’和3’调节序列和/或标签和合成序列。
本文公开的表达盒可以5’-3’转录的方向包含转录和翻译起始区(即启动子)、5’非翻译区、编码各种蛋白质标签和序列的多核苷酸、目的多核苷酸、和在芽孢杆菌属物种(宿主)细胞中起作用的转录和翻译终止区(即终止区)。还提供具有多个限制位点和/或重组位点的表达盒,用于使多核苷酸的插入处于本文别处所述的调节区的转录调节之下。这些调节区(即启动子、转录调节区和翻译终止区)和/或目的多核苷酸对于宿主细胞或彼此之间可以是天然的/类似的。编码各种蛋白质序列的其他多核苷酸序列可以附加到目的多核苷酸的5’或3’末端。可替代地,这些调节区和/或目的多核苷酸对于宿主细胞或彼此之间可以是异源的。
在某些实施例中,本文公开的多核苷酸可与如本文别处公开的或本领域已知的目的多核苷酸序列或表达盒的任何组合堆叠。堆叠的多核苷酸可可操作地连接到与初始多核苷酸相同的启动子,或可可操作地连接到单独的启动子多核苷酸。
表达盒可以包含与目的多核苷酸可操作地连接的启动子,任选地以及相应的终止区。该终止区对于转录起始区可以是天然的,对于有效连接的目的多核苷酸或对于启动子序列可以是天然的,对于宿主生物体可以是天然的,或者可以衍生自另一种来源(即外源或异源)。从噬菌体序列可以获得方便的终止区,例如λ噬菌体t0终止区,或来自原核核糖体RNA操纵子或参与细胞外蛋白分泌的基因(例如,来自枯草芽孢杆菌的aprE、来自地衣芽孢杆菌的aprL)的强终止子。方便的终止区可获自根癌农杆菌(A.tumefaciens)的Ti质粒,如章鱼碱合酶和胭脂碱合酶终止区。还参见Guerineau等人(1991)Mol.Gen.Genet.[分子与普通遗传学]262:141-144;Proudfoot(1991)Cell[细胞]64:671-674;Sanfacon等人(1991)Genes Dev.[基因与发育]5:141-149;Mogen等人(1990)Plant Cell[植物细胞]2:1261-1272;Munroe等人(1990)Gene[基因],91:151-158;Ballas等人(1989)Nucleic Acids Res.[核酸研究]17:7891-7903;以及Joshi等人(1987)Nucleic Acid Res.[核酸研究]15:9627-9639。
适当时,可以优化目的多核苷酸以增加在转化的或靶向的宿主生物体中的表达。例如,可以合成或改变多核苷酸以使用生物体偏好的密码子来实现改善的表达。
已知有另外的序列修饰能增强细胞宿主中的基因表达。这些序列修饰包括消除:编码假聚腺苷酸化信号的序列、外显子-内含子剪接位点信号、转座子样重复序列、及可能不利于基因表达的其他经充分表征的序列。可将序列的G-C含量调整至通过参照宿主细胞中表达的已知基因而计算出的给定细胞宿主的平均水平。当可能时,修饰序列以避免出现可预见的发夹二级mRNA结构。
表达盒可以另外包含5’前导序列。这样的前导序列可以起到增强翻译或RNA稳定性水平的作用。与5’非翻译区互换使用的5’前导序列可以来自已知且良好表征的细菌UTR,例如来自枯草芽孢杆菌aprE基因或地衣芽孢杆菌amyL基因或任何细菌核糖体蛋白基因的那些。翻译前导子在本领域是已知的,并且包括:小核糖核酸病毒前导子,例如EMCV前导子(脑心肌炎5’非编码区)(Elroy-Stein等人(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]86:6126-6130);马铃薯Y病毒(potyvirus)前导子,例如,TEV前导子(烟草蚀刻病毒)(Gallie等人(1995)Gene[基因]165(2):233-238),MDMV前导子(玉蜀黍矮花叶病毒)(Johnson等人(1986)Virology[病毒学]154:9-20),和人免疫球蛋白重链结合蛋白(BiP)(Macejak等人(1991)Nature[自然]353:90-94);来自苜蓿花叶病毒的外壳蛋白mRNA的非翻译前导子(AMV RNA 4)(Jobling等人(1987)Nature[自然]325:622-625);烟草花叶病毒前导子(TMV)(Gallie等人(1989)Molecular Biology of RNA[RNA的分子生物学],Cech编(Liss[丽丝公司],纽约),第237页-第256页);以及玉蜀黍褪绿斑驳病毒前导子(MCMV)(Lommel等人(1991)Virology[病毒学]81:382-385)。还参见,Della-Cioppa等人(1987)Plant Physiol.[植物生理学]84:965-968。还可以利用已知增强翻译的其他方法,例如内含子等。
在制备表达盒时,可以操作各种DNA片段,以提供处于适当方向以及合适时,处于适当阅读框中的DNA序列。为此,可采用衔接子(adapter)或接头以连接DNA片段,或可以涉及其他操作以提供方便的限制位点、去除多余的DNA、去除限制位点等。为此目的,可以涉及体外诱变、引物修复、限制性酶切(restriction)、退火、再取代(例如转换和颠换)。
在一些实施例中,编码脂肪酶或蛋白酶蛋白的核苷酸序列可操作地连接至控制元件,例如,转录控制元件,如启动子。转录控制元件可在真核细胞或原核细胞(例如,细菌或芽孢杆菌属物种细胞)中起作用。
通常本领域技术人员已知用于在芽孢杆菌属物种细胞中表达基因、其可读框(ORF)和/或其变体序列的适合的原核启动子(在原核细胞中起作用的启动子)和启动子序列区的非限制性实例。通常选择本公开的启动子序列,使得它们在芽孢杆菌属物种细胞(例如,地衣芽孢杆菌细胞、枯草芽孢杆菌属细胞等)中起作用。同样地,用于驱动芽孢杆菌属物种细胞中基因表达的启动子包括但不限于地衣芽孢杆菌淀粉酶基因(amyL)的启动子、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)的启动子、解淀粉芽孢杆菌淀粉酶(amyQ)的启动子、枯草芽孢杆菌xylA和xylB基因的启动子、枯草芽孢杆菌碱性蛋白酶(aprE)启动子(Stahl等人,1984)、枯草芽孢杆菌的α-淀粉酶启动子(Yang等人,1983)、解淀粉芽孢杆菌的α-淀粉酶启动子(Tarkinen等人,1983)、来自枯草芽孢杆菌的中性蛋白酶(nprE)启动子(Yang等人,1984)、突变体aprE启动子(PCT公开号WO 2001/51643)或来自地衣芽孢杆菌或其他相关的芽孢杆菌属的任何其他启动子。在某些其他实施例中,启动子是美国专利公开号2014/0329309中公开的核糖体蛋白质启动子或核糖体RNA启动子(例如,rrnI启动子)。类如spac的合成启动子可以是组成型的或诱导型的,这取决于其他辅助因子。以同样的方式,如n25、λpL或λpR的噬菌体启动子可以是组成型的或诱导型的。在PCT公开号WO2003/089604中描述了用于在芽孢杆菌属物种细胞中筛选和产生具有一系列活性(启动子强度)的启动子文库的方法。
在芽孢杆菌属物种中起作用的组成型启动子包括但不限于地衣芽孢杆菌淀粉酶基因(amyL)的启动子、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)的启动子、解淀粉芽孢杆菌粉酶(amyQ)的启动子、枯草芽孢杆菌碱性蛋白酶(aprE)启动子、枯草芽孢杆菌的α-淀粉酶启动子(Yang等人,1983)、解淀粉芽孢杆菌的α-淀粉酶启动子(Tarkinen等人,1983)、来自枯草芽孢杆菌的中性蛋白酶(nprE)启动子(Yang等人,1984)。
在一个方面,该供体DNA包含待整合进芽孢杆菌属物种基因组中的重组DNA。
如本文使用的,术语“重组”是指例如通过化学合成或者通过基因工程技术操纵分离的核酸区段来将两个原本分开的序列区段进行人工组合。当用于提及生物组分或组合物(例如细胞、核酸、多肽/酶、载体等)时,术语“重组”表示生物组分或组合物处于自然界中未发现的状态。换句话说,生物组分或组合物已经通过人类干预从其天然状态进行了修饰。例如,重组细胞涵盖表达在其天然(即非重组)细胞中未发现的一种或多种基因的细胞、以不同于其天然细胞的量表达一种或多种天然基因的细胞、和/或在不同于其天然细胞的条件下表达一种或多种天然基因的细胞。重组核酸可以与天然序列相差一个或多个核苷酸,可操作地连接到异源序列(例如异源启动子、编码非天然或变体信号序列的序列等),缺乏内含子序列,和/或处于分离的形式。重组多肽/酶可以与天然序列相差一个或多个氨基酸,可以与异源序列融合,可以被截短或具有氨基酸的内部缺失,能以在天然细胞中未发现的方式表达(例如,来自由于细胞中存在编码多肽的表达载体而过量表达多肽的重组细胞),和/或处于分离的形式。需要强调的是,在一些实施例中,重组多核苷酸或多肽/酶具有与其野生型对应物同一但处于非天然形式(例如,处于分离或富集的形式)的序列。
如本文使用的,“重组DNA”是指包含至少一个表达盒的DNA序列,该表达盒包含核酸片段的人工组合。重组DNA可以包括可操作地连接至如本文公开的目的多核苷酸的5’和3’调节序列。例如,重组DNA可以包含源自不同来源的调节序列和编码序列。
本文使用的标准重组DNA和分子克隆技术是在本领域熟知的,并且更全面地描述于Sambrook等人,Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册];Cold Spring Harbor Laboratory[冷泉港实验室]:纽约州冷泉港(1989)中。
可以使用多种方法来鉴定具有改变的基因组的那些细胞而不使用可筛选标记表型。此类方法可被认为是直接分析靶序列以检测基因组序列中的任何变化,包括但不限于PCR方法、测序方法、核酸酶消化、DNA印迹法、及其任何组合。
使用包含长度为至少900个核苷酸的长同源臂的线性DNA构建体用于在感受态芽 孢杆菌属物种中进行有效基因组修饰
本公开包括用于在不使用或整合可选择标记和不使用或整合Cas内切核酸酶的情况下修饰芽孢杆菌属物种细胞的基因组的方法。
在不希望受任何特定理论、作用机制或方式约束的情况下,申请人令人惊讶且出乎意料地发现:当将包含长同源臂(每个同源臂具有至少900个核苷酸)的线性DNA构建体引入感受态芽孢杆菌属物种细胞中时,观察到高效率的基因组修饰(例如但不限于供体DNA序列整合、基因缺失、和突变,取决于使用的线性DNA构建体的类型),其中引入和基因组修饰在不使用可选择标记或受指导的Cas内切核酸酶系统的情况下发生。
本公开包括用于将供体DNA序列整合进感受态芽孢杆菌属物种细胞的基因组中的方法和组合物,这些方法和组合物使用包含供体DNA的线性DNA构建体,不使用受指导的Cas内切核酸酶系统并且不将可选择标记整合进所述基因组中。
在一个实施例中,所述方法是用于在不使用可选择标记的情况下将供体DNA整合进芽孢杆菌属物种(Bacillus sp.)细胞的基因组中的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含侧翼为上游同源臂(HR1)和下游同源臂(HR2)的供体DNA,其中每个同源臂长度是至少900个核苷酸,其中所述DNA构建体不包含可选择标记,并且所述方法任选地进一步包括使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,和鉴定已将所述供体DNA序列稳定地整合进其基因组中的芽孢杆菌属物种子代细胞。
如本文所述,在不使用可选择标记和受指导的Cas系统的情况下将供体DNA整合进芽孢杆菌属物种细胞的基因组中可以通过将包含侧翼为上游同源臂(HR1)和下游同源臂(HR2)(其中每个同源臂长度是至少900个核苷酸)的供体DNA的线性DNA构建体引入感受态芽孢杆菌属物种细胞中来以高频率发生。
本公开包括用于缺失芽孢杆菌属物种细胞的基因组中的目的基因的方法。
在一个实施例中,所述方法是用于在不使用可选择标记的情况下缺失芽孢杆菌属物种细胞的基因组中的核苷酸序列的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含上游同源臂(HR1)和下游同源臂(HR2),其中每个同源臂长度是至少900个核苷酸并且与侧翼于所述待缺失的核苷酸序列的基因组DNA区域具有序列同源性,其中所述DNA构建体不包含可选择标记。
本公开包括用于在芽孢杆菌属物种细胞的基因组中提供突变(例如但不限于点突变)的方法。
在一个实施例中,所述方法是用于在不使用可选择标记的情况下将突变引入芽孢杆菌属物种细胞的基因组中的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含具有希望的突变的核苷酸序列,所述具有希望的突变的核苷酸序列侧翼为上游同源臂(HR1)和下游同源臂(HR2),其中每个同源臂长度是至少900个核苷酸,并且其中所述DNA构建体不包含可选择标记。在一个实施例中,上述方法进一步包括:使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,和鉴定在其基因组中具有所述突变的芽孢杆菌属物种子代细胞。在一个方面,相比于芽孢杆菌属物种细胞的天然序列(修饰之前的基因组芽孢杆菌属物种DNA序列),该具有希望的突变的核苷酸序列包含至少1、2、3、4、5、6、7、8、9、或10个碱基修饰或取代。在一个方面,该具有希望的突变(碱基取代)的核苷酸序列由1、2、3、4、5、6、7、8、9、或10个碱基组成。
本公开包括用于引入基因表达盒的多个拷贝的方法。用于酶生产的芽孢杆菌属物种宿主发展的瓶颈之一是多拷贝酶表达盒在染色体中的无抗生素抗性标记(ARM)整合。现有的方法例如整合载体、Cre/loxP系统、和营养缺陷型标记耗时长,并且编辑效率较低。
本文所述的方法允许使用侧翼为上游同源臂(HR1)和下游同源臂(HR2)(其中每个同源臂的长度是至少900个核苷酸)的供体DNA整合目的基因(目的基因表达盒)的多个拷贝,从而产生了高效率的基因整合。
多拷贝基因表达盒或多拷贝表达盒在本文中可互换使用并且是指包含至少一个目的基因的相同表达盒的多个拷贝。在一个方面,所述基因表达盒的该多个拷贝选自由以下组成的组:2个拷贝、3个拷贝、4个拷贝、5个拷贝、6个拷贝、7个拷贝、8个拷贝、9个拷贝、和高达10个拷贝。
定义
除非另有定义,本文使用的所有技术和科学术语具有与本发明组合物和方法所用领域的普通技术人员通常理解的相同含义。
“等位基因”或“等位基因变体”是占据染色体上给定基因座的基因的几种替代形式中的一种。当染色体上在给定基因座处存在的所有等位基因都相同时,则生物体在该基因座处是纯合的。如果染色体上在给定基因座处存在的等位基因不同,则生物体在此基因座处是杂合的。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
如本文使用的,“宿主细胞”是指具有作为新引入的DNA序列的宿主或表达媒介物的能力的细胞。因此,在本公开的某些实施例中,宿主细胞是芽孢杆菌属物种细胞。
“重组宿主细胞”(也称为“基因修饰的宿主细胞”)是已引入异源核酸(例如重组DNA构建体)的宿主细胞,或已引入并包含基因组修饰系统(例如本文所述的指导RNA/Cas内切核酸酶系统)的宿主细胞。例如,主题细菌宿主细胞包括通过将外源核酸(例如,质粒或环状重组DNA构建体)引入适合的芽孢杆菌属物种细胞中进行基因修饰的芽孢杆菌属物种细胞。
如本文所定义的,“亲本细胞”、或“亲本(宿主)细胞”可以互换地使用,并且是指“未经修饰的”亲本细胞。例如,“亲本”细胞是指其中“亲本”细胞的基因组被改变(例如,经由引入亲本细胞中的一个或多个突变/修饰)以产生其经修饰的“子代”细胞的微生物的任何细胞或菌株。
如本文使用的,“经修饰的细胞”或“经修饰的(宿主)细胞”可互换地使用,并且是指包含至少一个遗传修饰的重组(宿主)细胞,该遗传修饰不存在于经修饰的细胞所来源的“亲本”宿主细胞中。
如本文使用的,“芽孢杆菌属”或“芽孢杆菌属物种”细胞包括如本领域技术人员已知的“芽孢杆菌”属内的所有物种,包括但不限于:枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌和苏云金芽孢杆菌。应认识到,芽孢杆菌属不断进行分类学重组。因此,该属旨在包括已重新分类的物种,包括但不限于:例如嗜热脂肪芽孢杆菌(现在称为“嗜热脂肪土芽孢杆菌(Geobacillusstearothermophilus)”)的生物体。
如本文使用的“感受态芽孢杆菌属物种细胞”或“来自感受态芽孢杆菌属物种菌株的细胞”可互换使用并且是指通过本领域已知的任何方法成为感受态的芽孢杆菌属物种细胞。在一个方面,这些芽孢杆菌属物种细胞通过引入的核酸构建体的至少一个拷贝而成为感受态,该引入的核酸构建体包含可操作地连接至多核苷酸的启动子,该多核苷酸编码选自ComK、ComS、ComS1、ComG、ComC、ComDE、Spo0H、AbrB、Spo0A、Spo0K、Sin、DegU、Com A、ComP、ComQ、COmB、srfA、ComK或其任一种组合的组的多肽(Dubnau D.,1991,MicrobiologicalReviews[微生物学评论],第55卷,第3期,第395页-第424页;Hamoen等人,2003,Microbiology[微生物学],149,第9页-第17页)。
在一个方面,这些芽孢杆菌属物种细胞通过自然感受态、人工感受态或诱导感受态而成为感受态(Dubnau D.,1991,Microbiological Reviews[微生物学评论],第55卷,第3期,第395页-第424页;Hamoen等人,2003,Microbiology[微生物学],149,第9页-第17页;Jarmer Hanne等人FEMS Microbiology Letters[FEMS微生物学快报]206,第197页-第200页)。
在一个方面,用于使非感受态芽孢杆菌属物种细胞成为感受态的方法包括在芽孢杆菌属物种细胞中引入和表达ComS、ComS1、ComK或这些多肽的任一种组合(或编码这些多肽的基因),这样使得这些细胞更加具有用于摄取DNA的感受态。
在一个方面,用于使非感受态芽孢杆菌属物种细胞成为感受态的方法包括在非感受态芽孢杆菌属物种细胞中引入核酸构建体的至少一个拷贝,该核酸构建体包含可操作地连接至多核苷酸的诱导型启动子,该多核苷酸编码选自ComK、ComS、ComS1、ComG、ComC、ComDE、Spo0H、AbrB、Spo0A、Spo0K、Sin、DegU、Com A、ComP、ComQ、COmB、srfA、ComK或其任一种组合的组的多肽。
此类诱导型启动子的实例包括但不限于xylAp;用糖类例如麦芽糖、甘露醇或阿拉伯糖诱导的启动子;小分子例如tetA或spac启动子;温度诱导型启动子例如ydhI启动子;串联型启动子(参见WO 99/043835和05/098016),优选地,该串联型启动子是PconsensusamyQ-PcryIIIA-cryIIIA、或PamyL4199-Pconsensus amyQ-PcryIIIA-cryIIIA(参见PCT/US2007/088186);或其任一组合。
如本文使用的,“超级感受态芽孢杆菌属物种细胞”或“来自感受态芽孢杆菌属物种菌株的细胞”可互换使用并且是指如下的感受态芽孢杆菌属物种细胞,其中细胞群的大于1%可用染色体芽孢杆菌属物种DNA转化。可替代地,超级感受态意味着细胞群的大于10%可用自我复制的芽孢杆菌属质粒转化。优选地,这些超级感受态芽孢杆菌属物种细胞将以比在野生型或亲本细胞群中所观察到的更大的比率转化。
在一个方面,芽孢杆菌属物种细胞通过包含可操作地连接至编码ComK多肽的多核苷酸的木糖-诱导型启动子(Pxyl)(Pxyl-ComK)的引入的核酸构建体的至少一个拷贝成为超级感受态,从而产生超级感受态芽孢杆菌属物种Pxyl-ComK菌株。
在一个方面,超级感受态芽孢杆菌属物种菌株是如下的菌株,其通过在芽孢杆菌属物种细胞中引入包含可操作地连接至多核苷酸的启动子(例如但不限于诱导型启动子)的核酸构建体的至少一个拷贝而成为感受态,该多核苷酸编码选自ComK、ComS、ComS1、ComG、ComC、ComDE、Spo0H、AbrB、Spo0A、Spo0K、Sin、DegU、Com A、ComP、ComQ、COmB、srfA、ComK或其任一种组合的组的多肽。
在一个方面,感受态或超级感受态芽孢杆菌属物种菌株选自由以下组成的组:枯草芽孢杆菌168(BGSC1A1)、缺失spoIIAC、aprE、nprE和amyE基因的枯草芽孢杆菌168δ4、枯草芽孢杆菌A164δ5(如上但另外缺失srfAC USPTO 5891701)、枯草芽孢杆菌MDT101(表达枯草芽孢杆菌SJ1904的DNA甲基转移酶)和枯草芽孢杆菌SJ1904(USPTO5733753)。
如本文使用的术语“增加的”可以指比被比较的增加的数量或活性的数量或活性多至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、100%或至少约2、3、4、5、6、7、8、9、10、11、12、13,14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390,400、410、420,430、440、440、450、460、470、480、490或500倍的数量或活性。术语“增加的”、“大于”和“改善的”在本文中可互换使用。术语“增加的”可用于表征当与本文所述的对照或参考方法相比时,通过本文所述的多组分方法获得的转化或基因编辑效率。
如本文使用的,术语“整合效率”通过将具有整合到其基因组中的所需目的基因的转化细胞的数量除以转化细胞的总数来定义。这个数字可以乘以100表示为%。
整合效率(%)=(具有整合到其基因组中的目的基因的转化细胞的数量/转化细胞的总数)*100
术语“保守结构域”或“基序”是指沿进化相关蛋白的比对序列在特定位置处保守的一组氨基酸。虽然同源蛋白质之间在其他位置处的氨基酸可以发生变化,但在特定位置处高度保守的氨基酸表明对蛋白质的结构、稳定性或活性来说是必需的氨基酸。因为它们通过蛋白质同系物家族的比对序列中的高度保守性而被鉴定,所以它们可以用作标识符或“特征”,以确定具有新确定的序列的蛋白质是否属于先前鉴定的蛋白质家族。
如本文使用的,“核酸”意指多核苷酸,并且包括脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。核酸还可以包括片段和修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”和“核酸片段”可互换使用以表示单链或双链的RNA和/或DNA和/或RNA-DNA的聚合物,任选地包含合成的、非天然的或改变的核苷酸碱基。核苷酸(通常发现处于其5’-单磷酸形式)可以通过其单字母名称表示如下:“A”用于腺苷或脱氧腺苷(分别针对RNA或DNA),“C”用于胞嘧啶或脱氧胞嘧啶,“G”用于鸟苷或脱氧鸟苷,“U”用于尿苷,“T”用于脱氧胸苷,“R”用于嘌呤(A或G),“Y”用于嘧啶(C或T),“K”用于G或T,“H”用于A或C或T,“I”用于肌苷,并且“N”用于任何核苷酸(核苷酸(例如,如果指的是DNA序列,则N可以是A、C、T或G;如果指的是RNA序列,则N可以是A、C、U或G))。
应该理解,本文所述的多核苷酸(或核酸分子)包括“基因”、“载体”和“质粒”。
术语“基因”是指编码功能分子(例如但不限于特定的氨基酸序列)的多核苷酸,其包含所有或部分蛋白编码序列,并且可以包括调节(非转录的)序列,如启动子序列,该启动子序列决定例如基因在其下表达的条件。基因的转录区可以包括非翻译区(UTR)(该非翻译区包括内含子、5’-非翻译区(UTR)、和3’-UTR),以及编码序列。“天然基因”是指自然界中发现的具有其自身调控序列的基因。
“密码子修饰的基因”或“密码子偏好的基因”或“密码子优化的基因”是其密码子使用的频率被设计为模拟宿主细胞的偏好的密码子使用的频率的基因。进行核酸改变以密码子优化基因是“同义的”,这意味着它们不改变亲本基因的编码多肽的氨基酸序列。然而,天然基因和变体基因二者都可以针对特定宿主细胞进行密码子优化,因此在这方面不意图限制。合成密码子偏好性基因的方法在本领域中是可用的。参见,例如,美国专利号5,380,831和5,436,391,以及Murray等人(1989)Nucleic Acids Res.[核酸研究]17:477-498,通过引用并入本文。
已知另外的序列修饰可以增强宿主生物体中的基因表达。例如,这些序列修饰包括消除:编码假聚腺苷酸化信号的一个或多个序列、一个或多个外显子-内含子剪接位点信号、一个或多个转座子样重复序列、及可能不利于基因表达的其他经充分表征的序列。序列的G-C含量可以调整到给定宿主生物体的平均水平,如通过参考宿主细胞中表达的已知基因计算的。当可能时,修饰序列以避免出现一个或多个预测的发夹二级mRNA结构。
如本文使用的,术语“编码序列”是指直接明确指出其(编码的)蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界一般由通常以ATG起始密码子开始的可读框(下文称为“ORF”)确定的。编码序列典型地包括DNA、cDNA和重组核苷酸序列。
如本文定义的,术语“可读框”(下文称为“ORF”)意指包含不中断阅读框的核酸或核酸序列(无论是天然存在的、非天然存在的、或合成的),该不中断阅读框由以下组成:(i)起始密码子,(ii)一系列代表氨基酸的两(2)个或更多个密码子,和(iii)终止密码子,该ORF以5’至3’方向阅读(或翻译)。
如本文使用的术语“染色体整合”是指将目的多核苷酸整合进芽孢杆菌属物种染色体中的过程。将使线性供体DNA构建体的同源臂(线性供体DNA侧翼是同源臂)与芽孢杆菌属物种染色体的同源区域对齐。随后,在双交换(即同源重组)中,将同源臂之间的序列用目的多核苷酸替代。
“调节序列”是指位于编码序列的上游(5’非编码序列)、内部或下游(3’非编码序列)的核苷酸序列,并且其影响相关的编码序列的转录、RNA加工或稳定性、或翻译。调节序列包括但不限于:启动子、翻译前导序列、5’非翻译序列、3’非翻译序列、内含子、聚腺苷酸化靶序列、RNA加工位点、效应子结合位点、和茎环结构。
如本文使用的,术语“启动子”是指能够控制编码序列或功能性RNA表达的核酸序列。通常,编码序列位于启动子序列3’(下游)。启动子可以全部源自天然基因,或者由源自在自然界中发现的不同启动子的不同元件构成,或者甚至包含合成的核酸区段。本领域技术人员应该理解,不同启动子可以在不同细胞类型中、或在不同发育阶段、或响应于不同环境条件或生理条件来指导基因表达。引起基因在大多数细胞类型中表达的启动子大多数时候通常被称为“组成型启动子”。还认识到,由于在大多数情况下还不能完全确定调节序列的确切边界,不同长度的DNA片段可具有同一的启动子活性。
“可操作地连接”旨在表示两个或更多个元件之间的功能性连接。例如,目的多核苷酸和调节序列(例如启动子)之间的有效连接是允许目的多核苷酸表达的功能性连接(即,目的多核苷酸在启动子的转录控制下)。可操作地连接的元件可以是连续的或非连续的。编码序列(例如,ORF)可以在有义或反义方向上可操作地连接到调节序列上。当用于指两个蛋白质编码区域的连接时,可操作地连接意指这些编码区域处于相同的阅读框中。
当核酸置于与另一核酸序列的功能关系时,该核酸与另一核酸序列“可操作地连接”。例如,如果编码分泌性前导子(即信号肽)的DNA表达为参与多肽分泌的前蛋白,那么该编码分泌性前导子的DNA可操作地连接到该多肽的DNA;如果启动子或增强子影响编码序列的转录,那么该启动子或增强子可操作地连接到该序列;或者如果核糖体结合位点被定位以便促进翻译,那么该核糖体结合位点可操作地连接到编码序列。通常,“可操作地连接”意指被连接的DNA序列是连续的,并且在分泌性前导子的情况下,是连续的并且处于阅读相中。然而,增强子不必是连续的。通过在方便的限制位点处连接来实现连接。如果这样的位点不存在,则按照常规实践使用合成的寡核苷酸衔接子或接头。
如本文使用的,“控制与目的基因的蛋白质编码序列连接的目的基因(或其可读框)的表达的功能性启动子序列”是指控制芽孢杆菌属中编码序列的转录和翻译的启动子序列。例如,在某些实施例中,本公开涉及包含5′启动子(或5′启动子区、或串联5′启动子等)的多核苷酸,其中启动子区可操作地连接到编码目的蛋白的核酸序列。因此,在某些实施例中,功能性启动子序列控制编码目的蛋白的目的基因的表达。在其他实施例中,功能性启动子序列控制编码目的蛋白的异源基因或内源基因在芽孢杆菌属物种细胞中的表达。
启动子序列由近端元件和较远端上游元件组成,后一元件通常称为增强子。“增强子”是可以刺激启动子活性的DNA序列,并且可以是该启动子的固有元件或被插入以增强启动子的水平或组织特异性的异源元件。
可以使用本领域已知的任何方法将本文公开的线性重组DNA和环状重组DNA引入芽孢杆菌属物种细胞中。
如本文定义的,如在例如将至少一个线性DNA构建体、多核苷酸、或其基因或其载体“引入细菌细胞中”或“引入芽孢杆菌属物种细胞中”的短语中使用的,术语“引入”包括本领域已知的用于将DNA构建体引入感受态芽孢杆菌属物种细胞中的方法,包括但不限于将待引入芽孢杆菌属物种细胞中的线性DNA构建体与感受态芽孢杆菌属物种细胞群混合。
“引入”旨在表示以这样一种方式将本文公开的线性DNA构建体提供于生物体,如细胞或生物体中,以致于这一种或多种组分得以进入该生物体的细胞的内部或进入细胞自身。这些方法和组合物不取决于用于将序列引入生物体或细胞中的具体方法,只要本文公开的线性DNA构建体得以进入生物体的至少一个细胞的内部即可。引入包括提到将核酸并入感受态芽孢杆菌属物种细胞中,其中核酸可以被并入(整合进)细胞的基因组中,并且包括提及核酸被瞬时(直接)提供至细胞中。
“稳定转化”旨在表示经引入生物体中的核苷酸构建体整合到该生物体的基因组中,并且能够被其子代遗传。“瞬时转化”旨在表示将多核苷酸引入(直接或间接地)该生物体中并且不整合到该生物体的基因组中,或者将多肽引入生物体中。瞬时转化指示所引入的组合物仅在生物体中暂时表达或存在。
有多种方法可用于鉴定那些在芽孢杆菌属物种细胞的基因组中具有修饰和/或插入的细胞。具有希望的目的修饰的转化细胞的鉴定可以通过本领域技术人员已知的任何方法确定。例如,在其基因组中具有修饰(通过本文所述方法获得)的芽孢杆菌属物种细胞的鉴定可以通过本领域已知的任何表型或基因型筛选来鉴定。可筛选表型包括表型筛选(其中在含有脱脂奶的LB琼脂上生长的菌落周围的晕圈的存在说明表达盒整合进芽孢杆菌属物种细胞的基因组中(如本文实例中所述));抗微生物易感性筛选;导致琼脂中甘油三酯水解从而产生指示剂的颜色变化的表达盒整合;导致指示剂底物水解从而产生颜色变化的表达盒整合;缺失影响菌落表型的基因(由此菌落形态变化可用作基因组修饰);导致荧光蛋白表达的表达盒整合;或其任一种组合。
可筛选基因型方法包括用于确定转化的芽孢杆菌属物种细胞的基因组序列的方法。此类方法可被认为是直接分析基因组序列以检测基因组核苷酸序列中的任何变化,包括但不限于PCR方法、测序方法、核酸酶消化、DNA印迹法、及其任何组合。参见,例如,美国专利申请12/147,834,将该申请通过引用并入本文至本文所述方法所需的程度。所述方法还包括从包含整合至其基因组中的目的多核苷酸的细胞回收生物体。
术语“基因组”、细菌(宿主)细胞“基因组”或芽孢杆菌属(宿主)细胞“基因组”不仅包括在细胞核内发现的染色体DNA,还包括在细胞的亚细胞组分中发现的细胞器DNA(染色体外DNA)。
如本文使用的,术语“质粒”、“载体”和“盒”是指染色体外元件,其通常携带典型地不是细胞的中心代谢的一部分的基因,并且通常呈双链DNA分子的形式。此类元件可以是源自任何来源的单链或双链DNA或RNA的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中许多核苷酸序列已连接或重组到单一结构中,该单一结构能够将针对选定基因产物的启动子片段和DNA序列连同适当3’未翻译序列引入到细胞中。
术语“载体”包括可以在细胞中复制(传播)并且可以携带新基因或DNA区段到细胞中的任何核酸。载体包括为“附加体(episome)”(即,其自主复制或可以整合到宿主生物体的染色体中)的病毒、噬菌体、前病毒、质粒、噬菌粒、转座子、和人工染色体如BAC(细菌人工染色体)等。
术语“表达盒”或“表达载体”是指重组或合成产生的具有允许特定核酸在细胞中转录的一系列特定核酸元件的核酸构建体。重组表达盒可以并入质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括(除了其他序列之外)待转录的核酸序列和启动子。在一些实施例中,DNA构建体还包括一系列允许靶细胞中特定核酸转录的特定核酸元件。在某些实施例中,本公开的DNA构建体包含如本文定义的选择性标记和灭活的染色体或基因或DNA区段。许多原核表达载体可商购获得并且是本领域技术人员已知的。适当的表达载体的选择在本领域技术人员的知识范围内。
如本文使用的,“靶向载体”是如下载体,该载体包括与该靶向载体转化至其中的宿主细胞的染色体中的区同源的多核苷酸序列,并且该载体可以驱动在该区处的同源重组。例如,靶向载体可用于通过同源重组将突变引入宿主细胞的染色体中。在一些实施例中,靶向载体包含其他非同源序列,例如添加到末端(即,填充序列或侧翼序列)。末端可以闭合,这样使得靶向载体形成闭环,诸如像,插入载体中。适当的载体的选择和/或构建完全在本领域技术人员的知识范围内。
如本文使用的,术语“质粒”是指用作克隆载体的环状双链(ds)DNA构建体,并且其在许多细菌和一些真核生物中形成染色体外的自我复制遗传元件。在一些实施例中,将质粒并入宿主细胞的基因组中。
本文进一步描述了目的多核苷酸,并且目的多核苷酸包括反映商业市场和涉及酶生产(例如,但不限于,通过细菌发酵从而生产酶)的那些的利益的多核苷酸。
目的多核苷酸可以编码一种或多种目的蛋白。它可以具有其他生物学功能。目的多核苷酸可能已经存在或可能不存在于待转化的芽孢杆菌属物种细胞的基因组中,即,是同源或异源序列。
目的核苷酸可以包含与针对目的靶向基因序列的信使RNA(mRNA)的至少一部分互补的反义序列。构建反义核苷酸以与相应的mRNA杂交。可以对该反义序列作出修饰,只要该序列与相应的mRNA杂交并干扰相应的mRNA的表达。在该方式中,可以使用与相应的反义序列具有70%、80%、或85%序列同一性的反义构建体。此外,反义核苷酸的部分可以用来破坏该靶基因的表达。通常,可以使用至少50个核苷酸、100个核苷酸、200个核苷酸、或更多个核苷酸的序列。
此外,目的多核苷酸还可以在有义方向上使用以抑制生物体中内源基因的表达。以有义方向使用多核苷酸用于抑制生物体中基因表达的方法是本领域已知的。这些方法通常涉及用包含启动子的DNA构建体转化生物体,该启动子可操作地连接到至少一部分的对应于内源基因的转录物的核苷酸序列上,驱动在生物体中的表达。通常,此类核苷酸序列与内源基因的转录物的序列具有实质性的序列同一性,通常大于约65%序列同一性、约85%序列同一性、或大于约95%序列同一性。参见美国专利号5,283,184和5,034,323;通过引用并入本文。
表型标记是可筛选或可选择标记,其包括视觉标记和可选择标记,无论它是阳性还是阴性可选择标记。可以使用任何表型标记。具体地,可选择或可筛选标记包含允许人们通常在特定条件下鉴定或选择包含它的分子或细胞或对其进行选择的DNA区段。这些标记可以编码活性,例如但不限于RNA、肽或蛋白质的产生,或可以提供RNA、肽、蛋白质、无机和有机化合物或组合物等的结合位点。
术语“可选择标记”和“编码可选择标记的核苷酸序列”是指核苷酸序列,该核苷酸序列能够在(宿主)细胞中表达并且其中可选择标记的表达赋予含有表达的基因的细胞在存在对应的选择性试剂或缺乏必需营养素的情况下生长的能力。在一个方面,选择性标记是指能够在宿主细胞中表达的核酸(例如,基因),其允许容易地选择包含载体的那些宿主。此类可选择标记的实例包括但不限于抗微生物剂。
术语“可选择标记”包括提供宿主细胞已经摄取了输入性目的DNA或者已经发生了一些其他反应的指示的基因。典型地,可选择标记是赋予宿主细胞抗微生物抗性或代谢优势的基因,以允许在转化期间将包含外源DNA的细胞与未接受任何外源序列的细胞区分开来。
“驻留可选择标记(residing selectable marker)”是位于待转化微生物的染色体上的标记。驻留可选择标记编码与转化DNA构建体上的可选择标记不同的基因。选择性标记是本领域技术人员所熟知的。如上所述,标记可以是抗微生物抗性标记(例如,ampR、phleoR、specR、kanR、eryR、tetR、cmpR和neoR)(参见例如,Guerot-Fleury,1995;Palmeros等人,2000;和Trieu-Cuot等人,1983)。在一些实施例中,本发明提供氯霉素抗性基因(例如,存在于pC194上的基因,以及存在于地衣芽孢杆菌基因组中的抗性基因)。此抗性基因在本发明中以及涉及染色体整合的盒和整合质粒的染色体扩增的实施例中特别有用(参见例如,Albertini和Galizzi,1985;Stahl和Ferrari,1984)。根据本发明有用的其他标记包括但不限于营养缺陷型标记,如丝氨酸、赖氨酸、色氨酸;和检测标记,如β-半乳糖苷酶。
目的多核苷酸包括可以堆叠或可以与其他形状结合使用的基因。
如本文使用的,术语“多肽”和“蛋白质”可互换地使用,并且是指包含通过肽键连接的氨基酸残基的任何长度的聚合物。本文使用用于氨基酸残基的常规单(1)字母或三(3)字母代码。多肽可以是线性的或支化的,它可以包含经修饰的氨基酸,并且它可以被非氨基酸中断。术语多肽还涵盖已经天然地或通过干预修饰例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作或修饰,诸如与标记组分缀合而修饰的氨基酸聚合物。这些定义内还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。
术语“目的蛋白”或“POI”是指希望在经修饰的芽孢杆菌属(子代)细胞中表达的目的多肽。因此,如本文使用的,POI可以是酶、底物结合蛋白、表面活性蛋白、结构蛋白、受体蛋白、抗体等。
如本文使用的,“目的基因”或“GOI”是指编码POI的核酸序列(例如,多核苷酸、基因或ORF)。编码“目的蛋白”的“目的基因”可以是天然存在的基因、突变基因或合成的基因。
在某些实施例中,本公开的目的基因编码商业上相关的工业目的蛋白,例如酶(例如,乙酰酯酶、氨肽酶、淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合)。
“突变”是指核酸序列中的任何变化或改变。存在几种类型的突变,包括点突变、缺失突变、沉默突变、移码突变、剪接突变等。突变可以特异性地(例如,经由定点诱变)或随机地(例如,经由化学试剂、通过修复减去细菌菌株传代)进行。
本文所述的“点突变”是指仅影响基因序列中的一个或极少数核苷酸的突变。点突变最常涉及用一个碱基替换另一个碱基(这也会改变DNA中的互补碱基)。术语点突变还包括单个碱基对的插入或缺失。点突变或取代包括从DNA或RNA序列中改变、插入或缺失单个核苷酸碱基的基因突变。
本文描述了将突变引入感受态芽孢杆菌属物种细胞的基因组中的方法。
在一个实施例中,所述方法是用于在不使用可选择标记的情况下将突变引入芽孢杆菌属物种细胞的基因组中的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含具有希望的突变的核苷酸序列,所述具有希望的突变的核苷酸序列侧翼为上游同源臂(HR1)和下游同源臂(HR2),其中每个同源臂长度是至少900个核苷酸,并且其中所述DNA构建体不包含可选择标记。在一个实施例中,上述方法进一步包括:使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,和鉴定在其基因组中具有所述突变的芽孢杆菌属物种子代细胞。在一个方面,相比于芽孢杆菌属物种细胞的天然序列(修饰之前的基因组芽孢杆菌属物种DNA序列),该具有希望的突变的核苷酸序列包含至少1、2、3、4、5、6、7、8、9、或10个碱基修饰或取代。在一个方面,该具有希望的突变(碱基取代)的核苷酸序列由1、2、3、4、5、6、7、8、9、或10个碱基组成。
在本公开的一个方面,供体DNA包含具有希望的突变的核苷酸序列,该核苷酸序列的侧翼是两个长度为至少900个核苷酸的同源臂(一个5’上游臂HR1和一个3’下游臂HR2)。一旦将此供体构建体引入细胞中,就会发生同源重组,从而导致原始基因组序列发生突变。
“突变基因”是通过人为干预已经改变的基因。这样的“突变基因”具有通过至少一个核苷酸添加、缺失或取代而与相应的非突变基因的序列不同的序列。在本公开的某些实施例中,该突变的基因包含由如本文公开的方法产生的改变。突变的细胞或生物体是包含突变基因的细胞或生物体。
如本文使用的,在多肽或其序列的上下文中,术语“取代”意指一个氨基酸被另一个氨基酸替代(即,取代)。
如本文定义的,“内源基因”是指位于生物体基因组的其天然位置中的基因。
如本文使用的,关于多核苷酸或多肽序列的“异源性”是指该序列源于外来物种,或者,如果源于相同物种的话,则是通过蓄意人为干预从其在组合物和/或基因组基因座中的天然形式进行实质性修饰得到的。例如,可操作地连接至异源多核苷酸的启动子来自与该多核苷酸所源自的物种不同的物种,或者,如果来自相同/类似的物种,那么一方或双方基本上由它们的原来形式和/或基因组基因座修饰得到,或者该启动子不是被可操作地连接的多核苷酸的天然启动子。如本文使用的,除非另有说明,嵌合多核苷酸包含与转录起始区可操作地连接的编码序列,该转录起始区对于该编码序列是异源的。
如本文定义的,“异源”基因、“非内源”基因、或“外源”基因是指通常不在宿主生物体中被发现,但通过基因转移引入宿主生物体中的基因(或ORF)。如本文使用的,术语一个或多个“外源”基因包含插入非天然生物体中的天然基因(或ORF)和/或插入天然或非天然生物体中的嵌合基因。
如本文定义的,“异源”核酸构建体或“异源”核酸序列具有不是其被表达的细胞的天然的序列的一部分。
如本文定义的,“异源控制序列”是指在自然界中不起调节(控制)目的基因表达的作用的基因表达控制序列(例如,启动子或增强子)。通常,异源核酸序列对于它们存在的细胞或基因组的一部分而言不是内源(天然)的,并且已经通过感染、转染、转化、显微注射、电穿孔等添加到细胞中。“异源”核酸构建体可以含有与在天然宿主细胞中发现的控制序列/DNA编码(ORF)序列组合相同或不同的控制序列/DNA编码序列组合。
如本文使用的,术语“信号序列”和“信号肽”是指可以参与成熟蛋白或蛋白质的前体形式的分泌或定向转运的氨基酸残基的序列。典型地,信号序列位于前体或成熟蛋白序列的N-末端。信号序列可以是内源的或外源的。成熟蛋白中一般不存在信号序列。典型地,在蛋白转运后,信号序列通过信号肽酶从该蛋白质切割。
术语“源自的”涵盖术语“起源的”、“获得的”“可获得的”和“创建的”,并且通常表示一种指定的材料或组合物在另一种指定的材料或组合物中找到它的起源或具有可以参照另一种指定材料或组合物描述的特征。
如本文使用的,“侧翼序列”是指正在讨论的序列的上游或下游的任何序列(例如,针对基因A-B-C,基因B以A和C基因序列为侧翼)。在某些实施例中,输入序列在每侧侧翼有同源臂。在一些实施例中,侧翼序列仅存在于单侧(3’或5’),而在其他实施例中,序列的每侧均有侧翼序列。每个同源臂的序列与芽孢杆菌属物种基因组(例如芽孢杆菌属染色体)中的序列同源。
如本文使用的,术语“填充序列”是指侧翼是同源臂(通常为载体序列)的任何额外的DNA。然而,该术语涵盖任何非同源DNA序列。不受任何理论的限制,填充序列为细胞启动DNA摄取提供非关键的靶。
在核酸的或多肽序列的上下文中,“序列同一性”或“同一性”是指在两个序列中的核酸碱基或氨基酸残基当在指定的比较窗口上比对最大对应度时是相同的。
“序列同一性的百分比”是指通过在比较窗口上比较两个最佳比对的序列所确定的值,其中与参考序列(其不包含添加或缺失)比较两个序列的最佳比对时,该多核苷酸或多肽序列在比较窗口中的部分可以包含添加或缺失(即空位)。通过以下方式计算该百分比:确定在两个序列中存在相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将这些结果乘以100以产生序列同一性的百分比。百分比序列同一性的有用实例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或从50%至100%的任何整数百分比。可以使用本文描述的任何程序确定这些同一性。
序列比对和百分比同一性或相似性计算可以使用设计用于检测同源序列的多种比较方法来确定,这些方法包括但不限于LASERGENE生物信息计算包(DNASTAR公司(DNASTAR Inc.),麦迪逊(Madison),威斯康星州)的MegAlignTM程序。在此申请的上下文中,应当理解的是,在使用序列分析软件来分析的情况下,分析的结果将基于参考的程序的“默认值”,除非另有说明。如本文使用的,“默认值”将意指当第一次初始化时,最初加载该软件的任何一组值或参数。
“比对的Clustal V方法”对应于标记为Clustal V的比对方法(由以下描述:Higgins和Sharp,(1989)CABIOS 5:151-153;Higgins等人,(1992)Comput Appl Biosci[生物科学中的计算机应用]8:189-191),并且见于LASERGENE生物信息计算包(DNASTAR公司,麦迪逊,威斯康星州)的MegAlignTM程序中。对于多重比对,默认值对应于空位罚分(GAPPENALTY)=10和空位长度罚分(GAP LENGTH PENALTY)=10。使用Clustal方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE=1、空位罚分=3、窗口(WINDOW)=5、以及存储的对角线(DIAGONALS SAVED)=5。对于核酸,这些参数是KTUPLE=2、空位罚分=5、窗口=4、以及存储的对角线=4。使用Clustal V程序比对序列后,可能通过查看同一程序中的“序列距离”表来获得“百分比同一性”。
“Clustal W比对方法”对应于标记为Clustal W的比对方法(由以下描述:Higgins和Sharp,(1989)CABIOS 5:151-153;Higgins等人,(1992)Comput Appl Biosci[生物科学中的计算机应用]8:189-191),并且见于LASERGENE生物信息计算包(DNASTAR公司,麦迪逊,威斯康星州)的MegAlignTM v6.1程序中。用于多重比对的默认参数(空位罚分=10、空位长度罚分=0.2、延迟发散序列(Delay Divergen Seqs,%)=30、DNA转换权重=0.5、蛋白质权重矩阵=Gonnet系列、DNA权重矩阵=IUB)。使用Clustal W程序比对序列后,可能通过查看同一程序中的“序列距离”表来获得“百分比同一性”。
除非另有说明,本文中提供的序列同一性/相似性值是指使用GAP版本10(GCG,Accelrys公司,圣迭戈,加利福尼亚州)使用以下参数获得的值:核苷酸序列的%同一性和%相似性采用50的空位产生罚分权重和3的空位长度延伸罚分权重以及nwsgapdna.cmp评分矩阵;氨基酸序列的%同一性和%相似性采用8的空位产生罚分权重和2的空位长度延伸罚分权重以及BLOSUM62评分矩阵(Henikoff和Henikoff,(1989)Proc.Natl.Acad.Sci.USA[美国科学院院报]89:10915)。GAP使用Needleman和Wunsch,(1970)J Mol Biol[分子生物学杂志]48:443-53的算法来找到使匹配数目最大化并且使空位数目最小化的两个完整序列的比对。GAP考虑所有可能的比对和空位位置,并且使用匹配碱基的单位中的空位产生罚分和空位延伸罚分,产生具有最大数目的匹配碱基和最少的空位的比对。
“BLAST”是美国国家生物技术信息中心(National Center for BiotechnologyInformation,NCBI)提供的用于寻找生物序列之间的相似性的区域的搜索算法。该程序将核苷酸或者蛋白质序列与序列数据库比较,并计算匹配的统计显著性以鉴定出与查询序列具有足够的相似性的序列,这样使得相似性不会被预测为已经随机发生。BLAST报告鉴定的序列和它们与查询序列的局部比对。
本领域技术人员很清楚地理解,许多水平的序列同一性在鉴定来自其他物种的多肽或修饰的天然的或合成的多肽中是有用的,其中这样的多肽具有相同或相似的功能或活性。百分比同一性的有用实例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或从50%至100%的任何整数百分比。实际上,在描述本公开中,从50%至100%的任何整数氨基酸同一性会是有用的,例如51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。
“翻译前导序列”是指位于基因的启动子序列和编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列的mRNA上游。翻译前导序列可以影响初级转录物对mRNA的加工、mRNA稳定性、或翻译效率。已经描述了翻译前导序列的实例(例如,Turner和Foster,(1995)Mol Biotechnol[分子生物技术]3:225-236)。
“3’非编码序列”、“转录终止子”、或“终止序列”是指位于编码序列的下游的DNA序列,并且包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。聚腺苷酸化信号通常特征在于影响聚腺苷酸片添加到mRNA前体的3’末端。由Ingelbrecht等人,(1989)Plant Cell[植物细胞]1:671-680示例了不同的3’非编码序列的用途。
如本文使用的,“RNA转录物”是指由DNA序列的RNA聚合酶催化的转录产生的产物。当RNA转录物是DNA序列的完全互补拷贝时,RNA转录物被称为初级转录物或前mRNA。当RNA转录物是源自初级转录物前mRNA的转录后加工的RNA序列时,RNA转录物被称为成熟RNA或mRNA。“信使RNA”或“mRNA”是指不含内含子并且可以被细胞翻译成蛋白质的RNA。“cDNA”是指与mRNA模板互补并且使用逆转录酶从mRNA模板合成的DNA。cDNA可以是单链的或者可以使用DNA聚合成酶I的Klenow片段转化成双链形式。“有义”RNA是指包含mRNA并且可以在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”是指与靶初级转录物或mRNA的全部或部分互补、并且阻断靶基因的表达的RNA转录物(参见,例如美国专利号5,107,065)。反义RNA可与特定基因转录物的任何部分,即5’非编码序列、3’非编码序列、内含子或编码序列互补。“功能性RNA”是指反义RNA、核糖酶RNA、或可以不进行翻译但是仍对细胞过程具有作用的其他RNA。术语“互补序列”和“反向互补序列”在本文中关于mRNA转录物可互换使用,并且意在限定信使的反义RNA。
“成熟”蛋白质是指翻译后加工的多肽(即,从其中已经去除存在于初级翻译产物中的任何前肽(pre-peptide)或原肽(propeptide)的一种多肽)。“前体”蛋白质是指mRNA的翻译的初级产物(即,仍存在前肽或原肽)。前肽和原肽可以是但不限于细胞内定位信号。
可以按不同方式改变蛋白质,这些方式包括氨基酸取代、缺失、截短、和插入。用于此类操作的方法通常是已知的。例如,可以通过在DNA中的突变制备一种或多种蛋白质的氨基酸序列变体。用于诱变和核苷酸序列改变的方法包括,例如,Kunkel,(1985)Proc.Natl.Acad.Sci.USA[美国科学院院报]82:488-92;Kunkel等人,(1987)Meth Enzymol[酶学方法]154:367-82;美国专利号4,873,192;Walker和Gaastra编辑(1983)Techniquesin Molecular Biology[分子生物学技术](MacMillan Publishing Company,New York[麦克米伦出版公司,纽约]),以及其中所引用的文献。关于不太可能影响蛋白质生物学活性的氨基酸取代的引导见于例如,Dayhoff等人,(1978)Atlas of Protein Sequence andStructure[蛋白质序列和结构图谱集](Natl Biomed Res Found,Washington,D.C.[国家生物医学研究基金会,美国华盛顿哥伦比亚特区])的模型中。保守取代,例如将一个氨基酸与具有相似特性的另一个氨基酸交换,会是优选的。未预期保守缺失、插入、和氨基酸取代会产生在蛋白质特征中的根本变化,并且可以通过常规筛选测定来评价任何取代、缺失、插入、或其组合的作用。
标准的DNA分离、纯化、分子克隆、载体构建、和验证/表征方法是完善确立的,参见,例如Sambrook等人,(1989)Molecular Cloning:ALaboratory Manual[分子克隆:实验室手册],(Cold Spring Harbor Laboratory Press[冷泉港实验室出版社],纽约州)。载体和构建体包括环状质粒和包含目的多核苷酸以及任选地其他组分(包括接头、衔接子、用于调节或分析的组分)的线性多核苷酸。在一些实例中,目的核苷酸可以包含在内含子、编码序列、5’UTR、3’UTR、和/或调节区内。
缩写的含义如下:“sec”意指秒、“min”意指分钟、“h”意指小时、“d”意指天、“μL”意指微升、“mL”意指毫升、“L”意指升、“μM”意指微摩尔、“mM”意指毫摩尔、“M”意指摩尔、“mmol”意指毫摩尔、“μmole”意指微摩尔、“g”意指克、“μg”意指微克、“ng”意指纳克、“U”意指单位、“bp”意指碱基对、并且“kb”意指千碱基。
本文公开的组合物和方法的非限制性实施例如下:
1.一种用于在不使用可选择标记的情况下将供体DNA整合进芽孢杆菌属物种(Bacillus sp.)细胞的基因组中的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含侧翼为上游同源臂(HR1)和下游同源臂(HR2)的供体DNA,其中每个同源臂长度是900个核苷酸、或长度是大于900个核苷酸,其中所述DNA构建体不包含可选择标记。
2.一种用于在不使用可选择标记的情况下将供体DNA整合进芽孢杆菌属物种(Bacillus sp.)细胞的基因组中的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群以及将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含侧翼为上游同源臂(HR1)和下游同源臂(HR2)的供体DNA,其中每个同源臂长度是至少900个核苷酸,其中所述DNA构建体不包含可选择标记。
3.一种用于在不使用可选择标记的情况下缺失芽孢杆菌属物种细胞的基因组中的核苷酸序列的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含上游同源臂(HR1)和下游同源臂(HR2),其中每个同源臂长度是至少900个核苷酸并且与侧翼于所述待缺失的核苷酸序列的基因组DNA区域具有序列同源性,其中所述DNA构建体不包含可选择标记。
4.一种用于在不使用可选择标记的情况下缺失芽孢杆菌属物种细胞的基因组中的核苷酸序列的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体由上游同源臂(HR1)和下游同源臂(HR2)组成,其中每个同源臂长度是至少900个核苷酸并且与侧翼于所述待缺失的核苷酸序列的基因组DNA区域具有序列同源性,其中所述DNA构建体不包含可选择标记。
5.如实施例1-4中任一项所述的方法,其中每个同源臂长度是至少900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、5000、6000个核苷酸和高达7000个核苷酸。
6.如实施例1-4中任一项所述的方法,其中该线性DNA构建体是双链DNA。
7.如实施例1-4中任一项所述的方法,其中该感受态芽孢杆菌属物种细胞选自由以下组成的组:枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌、和苏云金芽孢杆菌。
8.如实施例1-4中任一项所述的方法,其中所述感受态芽孢杆菌属物种细胞通过引入的核酸构建体的至少一个拷贝而成为感受态,所述引入的核酸构建体包含与编码选自由ComK、ComS或其任一种组合组成的组的多肽的多核苷酸可操作地连接的启动子
9.如实施例1-4中任一项所述的方法,其中所述感受态芽孢杆菌属物种细胞来自超级感受态芽孢杆菌属物种菌株。
10.如实施例7所述的方法,其中所述超级感受态芽孢杆菌属物种菌株是Pxyl-ComK菌株。
11.如实施例1或2所述的方法,其中所述供体DNA包含选自由以下组成的组的核苷酸序列:目的多核苷酸、目的基因、目的基因的多个拷贝、一种或多种重组DNA、转录调节序列、翻译调节序列、启动子序列、终止子序列、转基因核酸序列、与信使RNA的至少一部分互补的反义序列、异源序列、包含待引入到该基因组中的点突变的核苷酸序列、或其任一种组合。
12.如实施例1或2所述的方法,其进一步包括使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,和鉴定已将所述供体DNA序列稳定地整合进其基因组中的芽孢杆菌属物种子代细胞。
13.如实施例3或4所述的方法,其进一步包括使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,和鉴定已从其基因组中缺失所述核苷酸序列的芽孢杆菌属物种子代细胞。
14.如实施例3或4所述的方法,其中所述线性DNA构建体进一步包含侧翼为所述上游同源臂(HR1)和下游同源臂(HR2)的供体DNA,其中将所述供体DNA插入到所述芽孢杆菌属物种细胞的基因组中而将所述核苷酸序列在所述芽孢杆菌属物种细胞的所述基因组中缺失。
15.如实施例14所述的方法,其进一步包括使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,和鉴定已从其基因组中缺失所述核苷酸序列且已将所述供体DNA整合进其基因组中的芽孢杆菌属物种子代细胞。
16.一种用于在不使用可选择标记的情况下将突变引入芽孢杆菌属物种细胞的基因组中的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群和将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含具有希望的突变的核苷酸序列,所述具有希望的突变的核苷酸序列侧翼为上游同源臂(HR1)和下游同源臂(HR2),其中所述DNA构建体的所述单碱基不同于所述至少一个芽孢杆菌属物种的基因组中的相应的单碱基,并且其中每个同源臂长度是至少1200个核苷酸,其中所述DNA构建体不包含可选择标记。
17.如实施例16所述的方法,其进一步包括使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,和鉴定在其基因组中具有该单碱基突变的芽孢杆菌属物种子代细胞。
18.如权利要求16所述的方法,其中所述具有希望的突变的核苷酸序列包含至少1、2、3、4、5、6、7、8、9、或10个碱基修饰或取代。
19.如权利要求16所述的方法,其中所述具有希望的突变的核苷酸序列由1、2、3、4、5、6、7、8、9、或10个碱基组成。
实例
所公开的公开内容在下面的实例中进一步定义。应该理解,这些实例,尽管说明了本公开的某些优选方面,但仅是通过说明的方式给出的。从以上的讨论和这些实例中,本领域的技术人员能够确定本公开的本质特性,并且在不脱离本公开的精神和范围的情况下,可进行本公开的各种变化和修改以使其适应各种用途和条件。
实例1
在不进行选择的情况下将线性供体DNA整合进枯草芽孢杆菌的染色体中
本实例描述了包含侧翼为同源区的供体DNA(编码目的基因)(HR1-aprE和HR2-aprE)的线性DNA构建体的组装和随后的转化,以及整合进枯草芽孢杆菌细胞(诱导以表达ComK)的染色体中的频率。目的基因(GOI)是脂肪酶和蛋白酶。
如下,从基因组DNA扩增线性DNA构建体。使用寡核苷酸(SEQ ID NO:5)和(SEQ IDNO:6),通过PCR扩增编码HR1-aprE1(SEQ ID NO:1)、来自普通变形杆菌(Proteusvulgaris)的脂肪酶(SEQ ID NO:2)、BPN’终止子(SEQ ID NO:3)和HR2-aprE1(SEQ ID NO:4)的第一构建体,产生产物(SEQ ID NO:7)。使用寡核苷酸(SEQ ID NO:12)和(SEQ ID NO:13),通过PCR扩增编码HR1-aprE2(SEQ ID NO:8)、P2启动子(SEQ ID NO:9)、来自吉氏芽孢杆菌(Bacillus gibsonii)的蛋白酶(SEQ ID NO:10)、BPN’终止子(SEQ ID NO:3)和HR2-aprE2(SEQ ID NO:11)的第二构建体,产生产物(SEQ ID NO:14)。
如下,将这些用于整合编码脂肪酶(SEQ ID NO:7)或蛋白酶(SEQ ID NO:14)的供体DNA的合成线性DNA构建体转化进枯草芽孢杆菌中。使含有枯草芽孢杆菌comK基因(SEQID NO:15;在amyE基因座处引入使用PxylA诱导型启动子以表达)的枯草芽孢杆菌细胞在125ml带挡板的烧瓶中在15ml的L培养液(1%w·v-1胰蛋白胨、0.5%酵母提取物w·v-1、1%NaCl w·v-1)中于37℃并以250RPM生长过夜。将过夜培养物在一百二十五(125)ml带挡板的烧瓶中在10ml新鲜L培养液中稀释至0.2(OD600单位)。使细胞在37℃(250RPM)生长直至培养物达到0.9(OD600单位)。将D-木糖从10%(w/v)储液添加到0.1%(w/v)。使细胞在37℃(250RPM)生长另外的2小时,然后添加4ml在0.5X L-培养液中的50%甘油,混合并于-80℃保存直到准备转化。转化的准备如下:将100ng(SEQ ID NO:7)和(SEQ ID NO:14)DNA添加至100μl感受态细胞中,于37℃1000RPM孵育1小时,随后通过添加900μlLB将细胞稀释10倍(这是10-1稀释)。将细胞再四次稀释10倍至10-5。然后将来自稀释10-4和10-5的100μl铺板到罗丹明橄榄油琼脂(ROA)上(对于(SEQ ID NO:7))或含有1.6%脱脂奶的LB琼脂上(对于(SEQ IDNO:14))。将板在37℃孵育过夜。表达脂肪酶的细胞在ROA上表现为带有深粉红色晕圈的粉红色菌落而亲本细胞表现为白色菌落。表达蛋白酶的细胞在LB-脱脂奶琼脂上形成清晰的晕圈。
为确定编码脂肪酶的供体DNA的整合频率,对在ROA上非选择性地生长的粉红色菌落的百分比进行评分(表1)。使用含有脱脂奶的非选择性LB琼脂上菌落周围存在的晕圈来确定蛋白酶整合的频率。如表1所示,发现46%的菌落含有晕圈,晕圈说明蛋白酶整合。
表1在不进行选择的情况下供体DNA的整合频率
Figure BDA0003744347600000471
实例2
使用包含不同长度的同源臂的线性DNA构建体并且在不进行选择的情况下将线性 供体DNA整合进枯草芽孢杆菌的染色体中
本实例描述了包含侧翼为不同长度的同源区的供体DNA(编码目的基因)的线性DNA构建体的组装和随后的转化,以及整合进枯草芽孢杆菌细胞(诱导以表达ComK)的染色体中的频率。
将包含供体DNA的用于脂肪酶在aprE基因座(SEQ ID NO:7)处整合和蛋白酶(SEQID NO:14)整合的DNA构建体用作模板进行PCR以扩增具有不同长度的同源臂的产物。表2中列出了模板、引物和HR1和HR2同源长度。
表2构建具有不同长度HR的供体DNA
Figure BDA0003744347600000481
如下,将上文所述的线性供体DNA构建体(SEQ ID NO:22、SEQ ID NO:23、SEQ IDNO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30、SEQ ID NO:31、SEQ ID NO:32和SEQ ID NO:33)转化进枯草芽孢杆菌中。使含有枯草芽孢杆菌comK基因(SEQ ID NO:15;在amyE基因座处引入使用PxylA诱导型启动子以表达)的枯草芽孢杆菌细胞在125ml带挡板的烧瓶中在15ml的L培养液(1%w·v-1胰蛋白胨、0.5%酵母提取物w·v-1、1%NaCl w·v-1)中于37℃并以250RPM生长过夜。将过夜培养物在一百二十五(125)ml带挡板的烧瓶中在10ml新鲜L培养液中稀释至0.2(OD600单位)。使细胞在37℃(250RPM)生长直至培养物达到0.9(OD600单位)。将D-木糖从10%(w/v)储液添加到0.1%(w/v)。使细胞在37℃(250RPM)生长另外的2小时,然后添加4ml在0.5X L-培养液中的50%甘油,混合并于-80℃保存直到准备转化。转化的准备如下:将80ng DNA添加至100μl感受态细胞中,于37℃1000RPM孵育1小时,随后通过添加900μl LB将细胞稀释10倍(这是10-1稀释)。将细胞再四次稀释10倍至10-5。然后将来自稀释10-3、10-4和10-5的100μl铺板到LB琼脂上。将板在37℃孵育过夜。
为确定编码脂肪酶的供体DNA的整合频率,对在ROA上非选择性地生长的粉红色菌落的百分比进行评分(表3)。使用含有脱脂奶的非选择性LB琼脂上菌落周围存在的晕圈来确定蛋白酶整合的频率。如表3中所示,少于900bp的同源臂长度不产生高频率整合。
表3在不进行选择的情况下供体DNA的整合频率需要长同源臂
Figure BDA0003744347600000491
实例3
使用包含不同长度的同源臂的线性DNA构建体并且在不进行选择的情况下在枯草 芽孢杆菌的染色体中进行无标记缺失和点突变
本实例描述了包含约3kb长度的同源区的用于产生缺失和点突变的线性DNA构建体的组装和随后的转化,以及在枯草芽孢杆菌细胞(诱导以表达ComK)的染色体中产生缺失或点突变的频率。
为了在枯草芽孢杆菌中缺失skf基因座,通过PCR扩增含有HR1-skf(SEQ ID NO:35)和HR2-skf(SEQ ID NO:36)的线性DNA构建体(SEQ ID NO:34)。
为了在枯草芽孢杆菌中缺失lipA基因座,通过PCR扩增含有HR1-lipA(SEQ ID NO:38)和HR2-lipA(SEQ ID NO:39)序列的线性DNA构建体(SEQ ID NO:37)。
为了在枯草芽孢杆菌基因组中整合的变形杆菌属(Proteus)HR2脂肪酶(SEQ IDNO:40)的拷贝中引入氨基酸变化S79,使用了诱变PCR策略。首先,将受合成P4启动子(SEQID NO:42)驱动的编码脂肪酶的基因组序列(SEQ ID NO:41)用作模板,使用正向引物(SEQID NO:12)和反向引物(SEQ ID NO:43)进行PCR,以产生SEQ ID NO:44。接着,将序列SEQ IDNO:41用作模板,使用正向引物(SEQ ID NO:45)和反向引物(SEQ ID NO:46)进行PCR,以产生SEQ ID NO:47。为产生最终线性DNA构建体,将10ng的两种片段混合在一起并且以以下条件孵育:98℃30秒,98℃10秒、70℃(-0.5/循环)30秒、72℃3.5min的24个循环,随后72℃持续3min。将所得产物通过PCR,使用寡核苷酸(SEQ ID NO:12)和(SEQ ID NO:13)扩增,产生SEQ ID NO:48的线性DNA构建体。
如下,将线性DNA构建体(SEQ ID NO:34)、(SEQ ID NO:37)和(SEQ ID NO:48)转化进枯草芽孢杆菌中。使含有枯草芽孢杆菌comK基因(SEQ ID NO:15;在amyE基因座处引入使用PxylA诱导型启动子以表达)的枯草芽孢杆菌细胞在125ml带挡板的烧瓶中在15ml的L培养液(1%w·v-1胰蛋白胨、0.5%酵母提取物w·v-1、1%NaCl w·v-1)中于37℃并以250RPM生长过夜。将过夜培养物在一百二十五(125)ml带挡板的烧瓶中在10ml新鲜L培养液中稀释至0.2(OD600单位)。使细胞在37℃(250RPM)生长直至培养物达到0.9(OD600单位)。将D-木糖从10%(w/v)储液添加到0.1%(w/v)。使细胞在37℃(250RPM)生长另外的2小时,然后添加4ml在0.5X L-培养液中的50%甘油,混合并于-80℃保存直到准备转化。转化的准备如下:将100ng DNA添加至100μl感受态细胞中,于37℃1000RPM孵育1小时,随后通过添加900μlLB将细胞稀释10倍(这是10-1稀释)。将细胞再四次稀释10倍至10-5。然后将来自稀释10-3、10-4和10-5的100μl铺板到LB琼脂上用于缺失skf(SEQ ID NO:34),或铺板到罗丹明橄榄油琼脂(ROA)上用于缺失lipA(SEQ ID NO:37)和进行脂肪酶点突变(SEQ ID NO:48)。将板在37℃孵育过夜。
为了确定skf缺失的频率,使用对于枯草芽孢杆菌中的skf基因座特异性的引物,通过PCR从菌落扩增DNA。如果成功将skf基因座缺失,引物(SEQ ID NO:49)和(SEQ ID NO:50)产生1200bp产物。对转化体的菌落PCR发现,全部菌落的31%具有skf基因座缺失(表4)。
通过ROA板上的白色菌落的频率来确定枯草芽孢杆菌lipA基因的缺失或异源脂肪酶中的点突变的频率。对于lipA缺失,25%的菌落可见为白色并且对于点突变,32%为白色(表4)。针对每种转化的白色菌落的实例进一步通过以下来验证含有缺失或点突变:扩增染色体区域并寻找针对缺失而言的期望大小变化,以及对点突变的位点进行测序。
表4在不进行选择的情况下高频率的缺失和点突变
Figure BDA0003744347600000511
Figure BDA0003744347600000521
<110> 美国丹尼斯科公司(Danisco US Inc.)
<120> 用于修饰芽孢杆菌属基因组的无选择标记方法及其组合物
<130> NB41425-WO-PCT
<160> 50
<170> PatentIn 3.5版
<210> 1
<211> 3275
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 1
ccctgctgac agaaatatcc ggcggtgacc cggagcttca aagcacccgt ctcgtcaacg 60
cctgcctcag caacattgaa tttgcagaag aaaaatggcg gataaaagac tataatatca 120
acagccactt atccggcttt atcaaataag aaaaagacag gcgtttgcct gtcttttctt 180
ttatttctta gcagccggca tctctttttg aagctcgtcc aaaatggcat tcgccccgtc 240
tacactgcgg cgcagagacc acaccgcacg atccacgtgg tatacatgcc cgtttttcac 300
tgccttcagt tttttccaaa ggacattctt ttcgatcggg cgtttaccgt cggcgtcgag 360
gtcatctgtt tttcctgtca tcaggatgat cacatccgga tctgttttca gcagctgctc 420
cagtgtcatt ttcatattca cagagtcgcc gccattgctt gaatcgctat tgcctgacgt 480
actgattgca tatcggtagc cgacctgtgt taaaagtctc gatgtaaaga agttttcatc 540
cctggccata atggtatcat ttgtatttcc gatcaaaagc acggactggc tgttcgcgct 600
gattttctgc tttgtctcgc taagcttttc ttcatgcgcc gtcagctttt tctccatttc 660
cttctccttg ccgactgctt ttgcaatcgt aagcgaagcg tcaattgtat cctgataatc 720
agcatttaaa ttattaagtg caatcgtcgg cgctattttt ttcagctgat cgtacacctt 780
cttatgccgg gtcgtgtcag caataattaa atcgggtttt aatgaagcga ttttttccat 840
gcttggctgt gagcgagtgc cgacagatgt gtagccgtca attttcttca gcacatcctt 900
gttgatcagc tgcttcgctt tgttgtcatc ggcaaccccg acaggcgtaa tgccgagatc 960
aagcagtgta tcaataaaac ctagctcaag aacaacaacc cgcttcggat gctcaggcac 1020
atttgtcttc cctaaatcat gtgttaccgc cactttatgt tctttactgt tttgattgcc 1080
gcttgaagac gagcaagcag ccgttaagac agaaagaagt aaaactgtaa gaataatcag 1140
tgtttttttc atatgttcca gtctctcctg ttggtagttt ctatggttaa gatgtccaag 1200
agtagtataa cacggaatga gaatcattat caccaattat ttttaaaatg agaagagaaa 1260
gttcggctta caggaaaatc ttgtttcgcg acacagcagt tcagcagctg atcatcctgt 1320
ccacaaaaaa gcttgcagaa aaataacatt ctctgcaagc tgatcctgtt aaagcttcac 1380
aatcactctt ccttgaatgc gattttgcaa aatatctttt aacgcacccg gcgtttcttc 1440
caatgatact tccctgtcca cgatggtcag cagctgatca ggcttgagat cagaagacat 1500
gcgctcccaa acagcggctc tgacgtccat cggacaatat actgaatcga ttccgagcag 1560
gcttactccg cgaagaataa aaggatacac ggttgccgga acttctcctc cgccggttaa 1620
gccgctcact gcgacagatc cgccgtattg aattttgctt aaaagcgagg caagctgttt 1680
tccgccgact ggatcaaccg ctccctgcca ttgctgcttg gacagcgcct taagcgttcc 1740
gtcatagaca tcttccctgc tgattacttc gcttgcacca agctgtttca aataatcagc 1800
cgcctcccgg tttccggtac ttgccaccac atcataaccc cgcttgttca gcatcgatac 1860
cgcaattccg ccgacaccgc cggttgctcc tgtgactagc acgctgcctt tttccggaga 1920
cagaccgttc tgttcaagcc gatgcactga taacgccgca gtaaatcccg ccgttccgta 1980
caccatcgct tcttttaacg aaagattctg tggcaaaggc accagccagt caccaggcac 2040
cgaagcgtat tcacttaatc cgccatcacg tgagacaccg agctcatagc ttgtcgcgat 2100
cacctcatcc ccctccgcaa aacgcggatc attggaagag acgaccgtac ccgcagcatc 2160
aatgcctaaa ataagcggat actctctgac gatattgcct cctgcttttc cggccagacc 2220
atctttgtaa ttaatgccgg aataagcaac tttaatcagg acaccatcct tcggcaaatc 2280
ctctgttgat atggttttca catggactga aacatcatcg gcattttttt ctgcctgcaa 2340
ggcttgaaat aacgttgaca ttcggcacac tccttttcat ttatatcgta accgaagaac 2400
gttcaaaaaa ccaaatcatc aagccgccat tttcacttcg ccggcacatt gagacaataa 2460
tggacaaatc cggtatcctc ttcatagccg ttttgctcat acaagcttct tgccttccgg 2520
ttgtggtgct cagtctgaag tgttaaacat tttgccccgt tttgccctgc ataatccttt 2580
gcggcagaaa gcagccggcc gccggctccc tttgtacgcg catgaggaac gacaaataag 2640
tcatttaata tgtatatcct tttcattgac acagaagaaa acgttggata gagctgggta 2700
aagcctatga attctccatt ttcttctgct atcaaaataa cagactcgtg attttccaaa 2760
cgagctttca aaaaagcctc tgccccttgc aaatcggatg cctgtctata aaattcccga 2820
tattggttaa acagcggcgc aatggcggcc gcatctgatg tctttgcttg gcgaatgttc 2880
atcttatttc ttcctccctc tcaataattt tttcattcta tcccttttct gtaaagttta 2940
tttttcagaa tacttttatc atcatgcttt gaaaaaatat cacgataata tccattgttc 3000
tcacggaagc acacgcaggt catttgaacg aattttttcg acaggaattt gccgggactc 3060
aggagcattt aacctaaaaa agcatgacat ttcagcataa tgaacattta ctcatgtcta 3120
ttttcgttct tttctgtatg aaaatagtta tttcgagtct ctacggaaat agcgagagat 3180
gatataccta aatagagata aaatcatctc aaaaaaatgg gtctactaaa atattattcc 3240
atctattaca ataaattcac agaatagtct tttaa 3275
<210> 2
<211> 864
<212> DNA
<213> 人工序列
<220>
<223> 合成序列 - 针对普通变形杆菌(Proteus vulgaris,WP099659650.1)脂肪酶优化
的编码序列
<400> 2
gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 60
ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 120
acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 180
gtgcaaaaga ttctcaaaga gactaaagca aaaaaggtga atttgatcgg gcactcccaa 240
ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 300
tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 360
aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 420
agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 480
acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 540
gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 600
cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 660
gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 720
cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 780
gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 840
tttttagcgt caaaaaagct ctaa 864
<210> 3
<211> 254
<212> DNA
<213> 解淀粉芽孢杆菌(Bacillus amyloliquefaciens)
<400> 3
tctagataca taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg 60
catgttcaat ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg 120
gcgggttgac ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt 180
cccggtttcc ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga 240
cggcattcgt aatc 254
<210> 4
<211> 2912
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 4
aacgcctcac tcctcacatc aacccgttac ttctattgta atcataaatt caaattctta 60
gaaccaagct gtgttccgca cttttccacc cttttaagca tggaaacccc gatcgctggg 120
aaaactaaca atgtttggag tgatgcaaat gaaaaaaata gtggcagcca tcgtggtaat 180
cggtcttgtg tttatcgcat ttttttatct ttacagccga tcaggcgatg tgtatcaatc 240
ggtagacgcg gatttgatca cactgtcttc aagcggccag gaagatatcg agattgaaaa 300
aagacagcac gtcaaagata tgctggatat tatgaatcag ggaaaacagg tgaagacaga 360
aaaaacatca gcccctgatt acgaagggac aatcaagttt cataaagacc ggtatgactc 420
attcagacta tggattgacg gcagccagca agccgttttt ttgaaggatg gcacatacta 480
caaattaagc aaaaatgata caaaggcgct gctaaatatt attaaaaaag aagcaaagga 540
ttgaaaatga aaaagcgaag ctaaccgctt cgctttttca ttttattggg gcaaaatatc 600
tctcagtgcc cgtctgagca ttttccccgt cgcatttttc ggaatatcgt caagaaacgt 660
aatggcggca ggccgcttgt attttgccag atgcttttcg cagtgctgca tgatgtcctc 720
ctctgttacc ccagagcgtt tcggcaccac atatcccttt accgcttccc cgctttgggg 780
gtccggcacg ccgatgacaa ccgcctcctt gacgtccgga tggctgtaca gcacctcctc 840
cacctcccgc ggatacacat tgtatcctcc tacaatgatc atgtcttttt tccggtcaac 900
aatgtaaaaa tagccgtcct catcccgtct tgccaagtcc cccgtataaa gccacccgtc 960
ttttaatgca tgctctgttt ccatcggcat tttataatag cccttcatca cattggggcc 1020
tttcacgatc aattcgccga cctggtgagc gggcagctcg cgtccgagcg gatctacgac 1080
cttgttttcg acatgtaaga tacttgtccc gatggagccc ggctttctgc ccctgtcaaa 1140
cgggttaaag cacgtgacgg gtgatgcttc cgagagcccg tagccttcca aaatggtaac 1200
accgaatttt tcttcaaacg ccgtcagcaa cgcgactggc atggacgcgc ctcccgaaat 1260
gcacagccgg atcgaagaaa aatcatcttt ctttccgttt tcatgctgaa acaagtagtt 1320
atacattgta ggcacaccgg caaaaatggt cgcctgctgc tgcttaacaa gcttaaaaac 1380
agatgccgga ctgaattgag gctcaatcaa tacagttgcg ccgctcatca gcggtgcatt 1440
catacagacg gttaaacaaa acacgtgaaa catgggaaga gcgcagacca cattgtccct 1500
ctcatccatt cccaaatagc ctgcgacatc gttggcattg ctgtacaaat tctgatgtgt 1560
cagcatcgcg cctttcggtt ttccagtcgt tcctgacgta tataaaataa ccgcggtatc 1620
atcaggtaca ggttcttggt tttgtttagc ggcagatgtc ggccgcaata tttttgcaaa 1680
cgttgtcatt ttcatcctga cctctgggtc cgcagcttcc ggctcggcct cccccgtctg 1740
gcataaaatg acgagctcaa cctttggcag cgattcatgc atgctctcat aaagcggcaa 1800
aagctggcta acgcccacga ttgcctttac atcgccattt gtcagcatat aaccaatttc 1860
tgtcggcgtg tacaacggat tgatgggaac aactacgatc ccagctttta aagcgccaaa 1920
aaacgcgatg ataaaatcag gcgaattgcc aagcagcaaa gctaaatggt cccctttctc 1980
cataccggct tcctgaaggc cgtccgcaaa tcgctgaata tattcattca gctcttgata 2040
cgtcatcatg tgatctttaa acctgcatgc gatgctgtcg ggcttctcag atgctgtttc 2100
ttccaatttt gaaacaagat tcattctccc accccttaag tgaatgaata gtcattcatt 2160
attgaagcca agctttcttc tccattatag agaaacagaa aaaaacactc aagagcaaaa 2220
agccctgagt gtcagtactg tcatagtttc ttcaatgctt cggcaatcgg cgtatctcct 2280
tctgtcagat caaaggcccg attttccgta ttcttctcat ctaaagaggc aatgaccgtt 2340
tttgcaacgt catcacggga aataaatccc cgctccagat ccttcgctgc tgaaacagtt 2400
cccgttccag gctcattgcg aaggcctccc ggacggataa tcgtataggt taaaccgctc 2460
gcttccagaa ttttatcagc ataatgcttg gccacataat aaggcttgag tgcctcattc 2520
caattttcac ggttatgggc ttgcagggcg ctgaccataa taaaccgttt gattccggca 2580
atggccgcag cttcaatggc ttttgccgct ccatcaagat ccaccagcag cgttttatca 2640
tagcctgtgc tgccgccgga accggctgtg aaaatgatcg cgtcacaacc ttttgccgca 2700
gcggcgattt cttccgggct gccctccaga ttcgcaagca cagcttctgc accggcagct 2760
tcaagagacg ctttctgttc ttcttttctg accatcgctc tgatggaatg atcaggatta 2820
tcttggaata aagagacgag tctttgcccg atttgtccgt tcgctccgat taaaaacact 2880
ttcatgtgaa tccctcctgc ctccattatt tc 2912
<210> 5
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成序列 - F引物
<400> 5
ccctgctgac agaaatatcc ggcgg 25
<210> 6
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成序列 - R引物
<400> 6
gaaataatgg aggcaggagg g 21
<210> 7
<211> 7346
<212> DNA
<213> 人工序列
<220>
<223> 合成序列 - HR1-aprE、aprE启动子、普通变形杆菌(Proteus vulgaris)
脂肪酶、BPN’终止子、HR2-aprE
<400> 7
ccctgctgac agaaatatcc ggcggtgacc cggagcttca aagcacccgt ctcgtcaacg 60
cctgcctcag caacattgaa tttgcagaag aaaaatggcg gataaaagac tataatatca 120
acagccactt atccggcttt atcaaataag aaaaagacag gcgtttgcct gtcttttctt 180
ttatttctta gcagccggca tctctttttg aagctcgtcc aaaatggcat tcgccccgtc 240
tacactgcgg cgcagagacc acaccgcacg atccacgtgg tatacatgcc cgtttttcac 300
tgccttcagt tttttccaaa ggacattctt ttcgatcggg cgtttaccgt cggcgtcgag 360
gtcatctgtt tttcctgtca tcaggatgat cacatccgga tctgttttca gcagctgctc 420
cagtgtcatt ttcatattca cagagtcgcc gccattgctt gaatcgctat tgcctgacgt 480
actgattgca tatcggtagc cgacctgtgt taaaagtctc gatgtaaaga agttttcatc 540
cctggccata atggtatcat ttgtatttcc gatcaaaagc acggactggc tgttcgcgct 600
gattttctgc tttgtctcgc taagcttttc ttcatgcgcc gtcagctttt tctccatttc 660
cttctccttg ccgactgctt ttgcaatcgt aagcgaagcg tcaattgtat cctgataatc 720
agcatttaaa ttattaagtg caatcgtcgg cgctattttt ttcagctgat cgtacacctt 780
cttatgccgg gtcgtgtcag caataattaa atcgggtttt aatgaagcga ttttttccat 840
gcttggctgt gagcgagtgc cgacagatgt gtagccgtca attttcttca gcacatcctt 900
gttgatcagc tgcttcgctt tgttgtcatc ggcaaccccg acaggcgtaa tgccgagatc 960
aagcagtgta tcaataaaac ctagctcaag aacaacaacc cgcttcggat gctcaggcac 1020
atttgtcttc cctaaatcat gtgttaccgc cactttatgt tctttactgt tttgattgcc 1080
gcttgaagac gagcaagcag ccgttaagac agaaagaagt aaaactgtaa gaataatcag 1140
tgtttttttc atatgttcca gtctctcctg ttggtagttt ctatggttaa gatgtccaag 1200
agtagtataa cacggaatga gaatcattat caccaattat ttttaaaatg agaagagaaa 1260
gttcggctta caggaaaatc ttgtttcgcg acacagcagt tcagcagctg atcatcctgt 1320
ccacaaaaaa gcttgcagaa aaataacatt ctctgcaagc tgatcctgtt aaagcttcac 1380
aatcactctt ccttgaatgc gattttgcaa aatatctttt aacgcacccg gcgtttcttc 1440
caatgatact tccctgtcca cgatggtcag cagctgatca ggcttgagat cagaagacat 1500
gcgctcccaa acagcggctc tgacgtccat cggacaatat actgaatcga ttccgagcag 1560
gcttactccg cgaagaataa aaggatacac ggttgccgga acttctcctc cgccggttaa 1620
gccgctcact gcgacagatc cgccgtattg aattttgctt aaaagcgagg caagctgttt 1680
tccgccgact ggatcaaccg ctccctgcca ttgctgcttg gacagcgcct taagcgttcc 1740
gtcatagaca tcttccctgc tgattacttc gcttgcacca agctgtttca aataatcagc 1800
cgcctcccgg tttccggtac ttgccaccac atcataaccc cgcttgttca gcatcgatac 1860
cgcaattccg ccgacaccgc cggttgctcc tgtgactagc acgctgcctt tttccggaga 1920
cagaccgttc tgttcaagcc gatgcactga taacgccgca gtaaatcccg ccgttccgta 1980
caccatcgct tcttttaacg aaagattctg tggcaaaggc accagccagt caccaggcac 2040
cgaagcgtat tcacttaatc cgccatcacg tgagacaccg agctcatagc ttgtcgcgat 2100
cacctcatcc ccctccgcaa aacgcggatc attggaagag acgaccgtac ccgcagcatc 2160
aatgcctaaa ataagcggat actctctgac gatattgcct cctgcttttc cggccagacc 2220
atctttgtaa ttaatgccgg aataagcaac tttaatcagg acaccatcct tcggcaaatc 2280
ctctgttgat atggttttca catggactga aacatcatcg gcattttttt ctgcctgcaa 2340
ggcttgaaat aacgttgaca ttcggcacac tccttttcat ttatatcgta accgaagaac 2400
gttcaaaaaa ccaaatcatc aagccgccat tttcacttcg ccggcacatt gagacaataa 2460
tggacaaatc cggtatcctc ttcatagccg ttttgctcat acaagcttct tgccttccgg 2520
ttgtggtgct cagtctgaag tgttaaacat tttgccccgt tttgccctgc ataatccttt 2580
gcggcagaaa gcagccggcc gccggctccc tttgtacgcg catgaggaac gacaaataag 2640
tcatttaata tgtatatcct tttcattgac acagaagaaa acgttggata gagctgggta 2700
aagcctatga attctccatt ttcttctgct atcaaaataa cagactcgtg attttccaaa 2760
cgagctttca aaaaagcctc tgccccttgc aaatcggatg cctgtctata aaattcccga 2820
tattggttaa acagcggcgc aatggcggcc gcatctgatg tctttgcttg gcgaatgttc 2880
atcttatttc ttcctccctc tcaataattt tttcattcta tcccttttct gtaaagttta 2940
tttttcagaa tacttttatc atcatgcttt gaaaaaatat cacgataata tccattgttc 3000
tcacggaagc acacgcaggt catttgaacg aattttttcg acaggaattt gccgggactc 3060
aggagcattt aacctaaaaa agcatgacat ttcagcataa tgaacattta ctcatgtcta 3120
ttttcgttct tttctgtatg aaaatagtta tttcgagtct ctacggaaat agcgagagat 3180
gatataccta aatagagata aaatcatctc aaaaaaatgg gtctactaaa atattattcc 3240
atctattaca ataaattcac agaatagtct tttaagtaag tctactctga atttttttaa 3300
aaggagaggg taaagagtgt caacaacata tcctattgtc ctggtacacg gcctttctgg 3360
tttcgatgac atcgtaggat acccttattt ttatgggatt gccgacgccc tggagaaaga 3420
tggccacaaa gtttttacag cctcactctc tgcattcaat tccaacgaag tccgtggcga 3480
gcaattatgg gagttcgtgc aaaagattct caaagagact aaagcaaaaa aggtgaattt 3540
gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg gcggccaagc atgctaaaag 3600
tattgcaagt gttacatctg tgaatggagt gaatcacggt agcgaaatcg ccgatcttgt 3660
cagacggatt atgagaaaag attctgtccc tgagtatatc gcggacgcgg taatgaaggc 3720
tattggcact ataatcagta cttttagcgg aaatagagga aaccctcaag acgctatagc 3780
agctctggag gccttaacga cggaaaacgt gatggaattt aacaaaaaat atcctcaggg 3840
actgccagca attcgtgggg gtgaaggtaa agaagtcgtg aacggcgtac actactatag 3900
ctttggttct tacatacagg gtctcatcgc tggcgagaag ggaaacttgc tcgatcctac 3960
ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa cgtgagaacg atggtttagt 4020
aggacggact tcaatgcggc tcggcaagtt aattaaagac gactacgctg aggatcattt 4080
agatatggtc aatcaagttg cggggttagt tggacgcggg gaggatataa ttgctatata 4140
tacgaatcat gccaattttt tagcgtcaaa aaagctctaa tctagataca taaaaaaccg 4200
gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat ccgctccata 4260
atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac ccggctcagt 4320
cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc ggtcagctca 4380
atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt aatcaacgcc 4440
tcactcctca catcaacccg ttacttctat tgtaatcata aattcaaatt cttagaacca 4500
agctgtgttc cgcacttttc caccctttta agcatggaaa ccccgatcgc tgggaaaact 4560
aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca gccatcgtgg taatcggtct 4620
tgtgtttatc gcattttttt atctttacag ccgatcaggc gatgtgtatc aatcggtaga 4680
cgcggatttg atcacactgt cttcaagcgg ccaggaagat atcgagattg aaaaaagaca 4740
gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa caggtgaaga cagaaaaaac 4800
atcagcccct gattacgaag ggacaatcaa gtttcataaa gaccggtatg actcattcag 4860
actatggatt gacggcagcc agcaagccgt ttttttgaag gatggcacat actacaaatt 4920
aagcaaaaat gatacaaagg cgctgctaaa tattattaaa aaagaagcaa aggattgaaa 4980
atgaaaaagc gaagctaacc gcttcgcttt ttcattttat tggggcaaaa tatctctcag 5040
tgcccgtctg agcattttcc ccgtcgcatt tttcggaata tcgtcaagaa acgtaatggc 5100
ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc tgcatgatgt cctcctctgt 5160
taccccagag cgtttcggca ccacatatcc ctttaccgct tccccgcttt gggggtccgg 5220
cacgccgatg acaaccgcct ccttgacgtc cggatggctg tacagcacct cctccacctc 5280
ccgcggatac acattgtatc ctcctacaat gatcatgtct tttttccggt caacaatgta 5340
aaaatagccg tcctcatccc gtcttgccaa gtcccccgta taaagccacc cgtcttttaa 5400
tgcatgctct gtttccatcg gcattttata atagcccttc atcacattgg ggcctttcac 5460
gatcaattcg ccgacctggt gagcgggcag ctcgcgtccg agcggatcta cgaccttgtt 5520
ttcgacatgt aagatacttg tcccgatgga gcccggcttt ctgcccctgt caaacgggtt 5580
aaagcacgtg acgggtgatg cttccgagag cccgtagcct tccaaaatgg taacaccgaa 5640
tttttcttca aacgccgtca gcaacgcgac tggcatggac gcgcctcccg aaatgcacag 5700
ccggatcgaa gaaaaatcat ctttctttcc gttttcatgc tgaaacaagt agttatacat 5760
tgtaggcaca ccggcaaaaa tggtcgcctg ctgctgctta acaagcttaa aaacagatgc 5820
cggactgaat tgaggctcaa tcaatacagt tgcgccgctc atcagcggtg cattcataca 5880
gacggttaaa caaaacacgt gaaacatggg aagagcgcag accacattgt ccctctcatc 5940
cattcccaaa tagcctgcga catcgttggc attgctgtac aaattctgat gtgtcagcat 6000
cgcgcctttc ggttttccag tcgttcctga cgtatataaa ataaccgcgg tatcatcagg 6060
tacaggttct tggttttgtt tagcggcaga tgtcggccgc aatatttttg caaacgttgt 6120
cattttcatc ctgacctctg ggtccgcagc ttccggctcg gcctcccccg tctggcataa 6180
aatgacgagc tcaacctttg gcagcgattc atgcatgctc tcataaagcg gcaaaagctg 6240
gctaacgccc acgattgcct ttacatcgcc atttgtcagc atataaccaa tttctgtcgg 6300
cgtgtacaac ggattgatgg gaacaactac gatcccagct tttaaagcgc caaaaaacgc 6360
gatgataaaa tcaggcgaat tgccaagcag caaagctaaa tggtcccctt tctccatacc 6420
ggcttcctga aggccgtccg caaatcgctg aatatattca ttcagctctt gatacgtcat 6480
catgtgatct ttaaacctgc atgcgatgct gtcgggcttc tcagatgctg tttcttccaa 6540
ttttgaaaca agattcattc tcccacccct taagtgaatg aatagtcatt cattattgaa 6600
gccaagcttt cttctccatt atagagaaac agaaaaaaac actcaagagc aaaaagccct 6660
gagtgtcagt actgtcatag tttcttcaat gcttcggcaa tcggcgtatc tccttctgtc 6720
agatcaaagg cccgattttc cgtattcttc tcatctaaag aggcaatgac cgtttttgca 6780
acgtcatcac gggaaataaa tccccgctcc agatccttcg ctgctgaaac agttcccgtt 6840
ccaggctcat tgcgaaggcc tcccggacgg ataatcgtat aggttaaacc gctcgcttcc 6900
agaattttat cagcataatg cttggccaca taataaggct tgagtgcctc attccaattt 6960
tcacggttat gggcttgcag ggcgctgacc ataataaacc gtttgattcc ggcaatggcc 7020
gcagcttcaa tggcttttgc cgctccatca agatccacca gcagcgtttt atcatagcct 7080
gtgctgccgc cggaaccggc tgtgaaaatg atcgcgtcac aaccttttgc cgcagcggcg 7140
atttcttccg ggctgccctc cagattcgca agcacagctt ctgcaccggc agcttcaaga 7200
gacgctttct gttcttcttt tctgaccatc gctctgatgg aatgatcagg attatcttgg 7260
aataaagaga cgagtctttg cccgatttgt ccgttcgctc cgattaaaaa cactttcatg 7320
tgaatccctc ctgcctccat tatttc 7346
<210> 8
<211> 2965
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 8
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgc 2965
<210> 9
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 合成序列- P2启动子
<400> 9
gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 60
cttaaaagaa gctaaatgtt atagtaattg taca 94
<210> 10
<211> 339
<212> DNA
<213> 吉氏芽孢杆菌(Bacillus gibsonii)
<400> 10
gtgagaagca aaaaattgtg gatcagcttg ttgtttgcgt taacgttaat ctttacgatg 60
gcgttcagca acatgtctgc gcaggctgct gaagaagcaa aagaaaaata tttaattggc 120
tttaatgagc aggaagctgt cagtgagttt gtagaacaag tagaggcaaa tgacgaggtc 180
gccattctct ctgaggaaga ggaagtcgaa attgaattgc ttcatgaatt tgaaacgatt 240
cctgttttat ccgttgagtt aagcccagaa gatgtggacg cgcttgaact cgatccagcg 300
atttcttata ttgaagagga tgcagaagta acgacaatg 339
<210> 11
<211> 2971
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 11
aacgcctcac tcctcacatc aacccgttac ttctattgta atcataaatt caaattctta 60
gaaccaagct gtgttccgca cttttccacc cttttaagca tggaaacccc gatcgctggg 120
aaaactaaca atgtttggag tgatgcaaat gaaaaaaata gtggcagcca tcgtggtaat 180
cggtcttgtg tttatcgcat ttttttatct ttacagccga tcaggcgatg tgtatcaatc 240
ggtagacgcg gatttgatca cactgtcttc aagcggccag gaagatatcg agattgaaaa 300
aagacagcac gtcaaagata tgctggatat tatgaatcag ggaaaacagg tgaagacaga 360
aaaaacatca gcccctgatt acgaagggac aatcaagttt cataaagacc ggtatgactc 420
attcagacta tggattgacg gcagccagca agccgttttt ttgaaggatg gcacatacta 480
caaattaagc aaaaatgata caaaggcgct gctaaatatt attaaaaaag aagcaaagga 540
ttgaaaatga aaaagcgaag ctaaccgctt cgctttttca ttttattggg gcaaaatatc 600
tctcagtgcc cgtctgagca ttttccccgt cgcatttttc ggaatatcgt caagaaacgt 660
aatggcggca ggccgcttgt attttgccag atgcttttcg cagtgctgca tgatgtcctc 720
ctctgttacc ccagagcgtt tcggcaccac atatcccttt accgcttccc cgctttgggg 780
gtccggcacg ccgatgacaa ccgcctcctt gacgtccgga tggctgtaca gcacctcctc 840
cacctcccgc ggatacacat tgtatcctcc tacaatgatc atgtcttttt tccggtcaac 900
aatgtaaaaa tagccgtcct catcccgtct tgccaagtcc cccgtataaa gccacccgtc 960
ttttaatgca tgctctgttt ccatcggcat tttataatag cccttcatca cattggggcc 1020
tttcacgatc aattcgccga cctggtgagc gggcagctcg cgtccgagcg gatctacgac 1080
cttgttttcg acatgtaaga tacttgtccc gatggagccc ggctttctgc ccctgtcaaa 1140
cgggttaaag cacgtgacgg gtgatgcttc cgagagcccg tagccttcca aaatggtaac 1200
accgaatttt tcttcaaacg ccgtcagcaa cgcgactggc atggacgcgc ctcccgaaat 1260
gcacagccgg atcgaagaaa aatcatcttt ctttccgttt tcatgctgaa acaagtagtt 1320
atacattgta ggcacaccgg caaaaatggt cgcctgctgc tgcttaacaa gcttaaaaac 1380
agatgccgga ctgaattgag gctcaatcaa tacagttgcg ccgctcatca gcggtgcatt 1440
catacagacg gttaaacaaa acacgtgaaa catgggaaga gcgcagacca cattgtccct 1500
ctcatccatt cccaaatagc ctgcgacatc gttggcattg ctgtacaaat tctgatgtgt 1560
cagcatcgcg cctttcggtt ttccagtcgt tcctgacgta tataaaataa ccgcggtatc 1620
atcaggtaca ggttcttggt tttgtttagc ggcagatgtc ggccgcaata tttttgcaaa 1680
cgttgtcatt ttcatcctga cctctgggtc cgcagcttcc ggctcggcct cccccgtctg 1740
gcataaaatg acgagctcaa cctttggcag cgattcatgc atgctctcat aaagcggcaa 1800
aagctggcta acgcccacga ttgcctttac atcgccattt gtcagcatat aaccaatttc 1860
tgtcggcgtg tacaacggat tgatgggaac aactacgatc ccagctttta aagcgccaaa 1920
aaacgcgatg ataaaatcag gcgaattgcc aagcagcaaa gctaaatggt cccctttctc 1980
cataccggct tcctgaaggc cgtccgcaaa tcgctgaata tattcattca gctcttgata 2040
cgtcatcatg tgatctttaa acctgcatgc gatgctgtcg ggcttctcag atgctgtttc 2100
ttccaatttt gaaacaagat tcattctccc accccttaag tgaatgaata gtcattcatt 2160
attgaagcca agctttcttc tccattatag agaaacagaa aaaaacactc aagagcaaaa 2220
agccctgagt gtcagtactg tcatagtttc ttcaatgctt cggcaatcgg cgtatctcct 2280
tctgtcagat caaaggcccg attttccgta ttcttctcat ctaaagaggc aatgaccgtt 2340
tttgcaacgt catcacggga aataaatccc cgctccagat ccttcgctgc tgaaacagtt 2400
cccgttccag gctcattgcg aaggcctccc ggacggataa tcgtataggt taaaccgctc 2460
gcttccagaa ttttatcagc ataatgcttg gccacataat aaggcttgag tgcctcattc 2520
caattttcac ggttatgggc ttgcagggcg ctgaccataa taaaccgttt gattccggca 2580
atggccgcag cttcaatggc ttttgccgct ccatcaagat ccaccagcag cgttttatca 2640
tagcctgtgc tgccgccgga accggctgtg aaaatgatcg cgtcacaacc ttttgccgca 2700
gcggcgattt cttccgggct gccctccaga ttcgcaagca cagcttctgc accggcagct 2760
tcaagagacg ctttctgttc ttcttttctg accatcgctc tgatggaatg atcaggatta 2820
tcttggaata aagagacgag tctttgcccg atttgtccgt tcgctccgat taaaaacact 2880
ttcatgtgaa tccctcctgc ctccattatt tcaaaaacac aaccgctctt tcaaacgatg 2940
tgttttgcct tagtaaatca gatcaaggaa a 2971
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成序列-引物
<400> 12
tcgtcaacgc ctgcctcagc 20
<210> 13
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成序列-引物
<400> 13
tttccttgat ctgatttact aaggc 25
<210> 14
<211> 7488
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 14
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcgctga taaacagctg acatcaacta aaagtttcat 3000
taaatacttt gaaaaaagtt gttgacttaa aagaagctaa atgttatagt aattgtacag 3060
aatagtcttt taagtaagtc tactctgaat ttttttaaaa ggagagggta aagagtgaga 3120
agcaaaaaat tgtggatcag cttgttgttt gcgttaacgt taatctttac gatggcgttc 3180
agcaacatgt ctgcgcaggc tgctgaagaa gcaaaagaaa aatatttaat tggctttaat 3240
gagcaggaag ctgtcagtga gtttgtagaa caagtagagg caaatgacga ggtcgccatt 3300
ctctctgagg aagaggaagt cgaaattgaa ttgcttcatg aatttgaaac gattcctgtt 3360
ttatccgttg agttaagccc agaagatgtg gacgcgcttg aactcgatcc agcgatttct 3420
tatattgaag aggatgcaga agtaacgaca atgcaacaaa cagtgccatg gggaattact 3480
cgtgtgcaag ccccagctgt tcataaccgt ggaattacag gttctggtgt aagagttgct 3540
atcctcgatt caggtatttc cacacatgaa gacttaaatg ttcgtggtgg cgttagcttt 3600
gtaccagggg aaccaacgta tgctgattta aatgggcatg gcacgcatgt ggctgggacg 3660
gtagctgctt taaacaattc gattggcgtt gttggcgtag caccgtcagc ggatctatac 3720
gctgttaaag tattaggggc gaatggtaga ggttcggtca gcgggattgc ccaaggattg 3780
gaatgggcag cacaaaataa catgcacatt gctaatatga gtttaggaac agatgcacca 3840
agttctacac ttgagcgtgc tgttaattat gcgacttcta gagatgttct tgttattgcg 3900
gcaactggga ataacggttc tggctcagta ggctatccgg cccgttatgc gaacgcaatg 3960
gcagtcggag ctactgacca aaacaacaga cgcgccaact tttcacagta tggcacgggg 4020
attgacattg tcgcaccagg tgtaaacgtg cagagcacat acccaggtaa ccgttatgtg 4080
agcatgaacg gtacatcgat ggctactcct catgttgcag gtgcagcagc ccttgttaaa 4140
caacgctatc catcttggaa tgcgactcaa atccgcgacc atctaaagaa tacggcaacg 4200
aatttaggaa actcttcaca atttggaagc ggacttgtca atgcagaagc ggcaacacgc 4260
taatctagat acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4320
ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4380
acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4440
cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 4500
agacggcatt cgtaatcaac gcctcactcc tcacatcaac ccgttacttc tattgtaatc 4560
ataaattcaa attcttagaa ccaagctgtg ttccgcactt ttccaccctt ttaagcatgg 4620
aaaccccgat cgctgggaaa actaacaatg tttggagtga tgcaaatgaa aaaaatagtg 4680
gcagccatcg tggtaatcgg tcttgtgttt atcgcatttt tttatcttta cagccgatca 4740
ggcgatgtgt atcaatcggt agacgcggat ttgatcacac tgtcttcaag cggccaggaa 4800
gatatcgaga ttgaaaaaag acagcacgtc aaagatatgc tggatattat gaatcaggga 4860
aaacaggtga agacagaaaa aacatcagcc cctgattacg aagggacaat caagtttcat 4920
aaagaccggt atgactcatt cagactatgg attgacggca gccagcaagc cgtttttttg 4980
aaggatggca catactacaa attaagcaaa aatgatacaa aggcgctgct aaatattatt 5040
aaaaaagaag caaaggattg aaaatgaaaa agcgaagcta accgcttcgc tttttcattt 5100
tattggggca aaatatctct cagtgcccgt ctgagcattt tccccgtcgc atttttcgga 5160
atatcgtcaa gaaacgtaat ggcggcaggc cgcttgtatt ttgccagatg cttttcgcag 5220
tgctgcatga tgtcctcctc tgttacccca gagcgtttcg gcaccacata tccctttacc 5280
gcttccccgc tttgggggtc cggcacgccg atgacaaccg cctccttgac gtccggatgg 5340
ctgtacagca cctcctccac ctcccgcgga tacacattgt atcctcctac aatgatcatg 5400
tcttttttcc ggtcaacaat gtaaaaatag ccgtcctcat cccgtcttgc caagtccccc 5460
gtataaagcc acccgtcttt taatgcatgc tctgtttcca tcggcatttt ataatagccc 5520
ttcatcacat tggggccttt cacgatcaat tcgccgacct ggtgagcggg cagctcgcgt 5580
ccgagcggat ctacgacctt gttttcgaca tgtaagatac ttgtcccgat ggagcccggc 5640
tttctgcccc tgtcaaacgg gttaaagcac gtgacgggtg atgcttccga gagcccgtag 5700
ccttccaaaa tggtaacacc gaatttttct tcaaacgccg tcagcaacgc gactggcatg 5760
gacgcgcctc ccgaaatgca cagccggatc gaagaaaaat catctttctt tccgttttca 5820
tgctgaaaca agtagttata cattgtaggc acaccggcaa aaatggtcgc ctgctgctgc 5880
ttaacaagct taaaaacaga tgccggactg aattgaggct caatcaatac agttgcgccg 5940
ctcatcagcg gtgcattcat acagacggtt aaacaaaaca cgtgaaacat gggaagagcg 6000
cagaccacat tgtccctctc atccattccc aaatagcctg cgacatcgtt ggcattgctg 6060
tacaaattct gatgtgtcag catcgcgcct ttcggttttc cagtcgttcc tgacgtatat 6120
aaaataaccg cggtatcatc aggtacaggt tcttggtttt gtttagcggc agatgtcggc 6180
cgcaatattt ttgcaaacgt tgtcattttc atcctgacct ctgggtccgc agcttccggc 6240
tcggcctccc ccgtctggca taaaatgacg agctcaacct ttggcagcga ttcatgcatg 6300
ctctcataaa gcggcaaaag ctggctaacg cccacgattg cctttacatc gccatttgtc 6360
agcatataac caatttctgt cggcgtgtac aacggattga tgggaacaac tacgatccca 6420
gcttttaaag cgccaaaaaa cgcgatgata aaatcaggcg aattgccaag cagcaaagct 6480
aaatggtccc ctttctccat accggcttcc tgaaggccgt ccgcaaatcg ctgaatatat 6540
tcattcagct cttgatacgt catcatgtga tctttaaacc tgcatgcgat gctgtcgggc 6600
ttctcagatg ctgtttcttc caattttgaa acaagattca ttctcccacc ccttaagtga 6660
atgaatagtc attcattatt gaagccaagc tttcttctcc attatagaga aacagaaaaa 6720
aacactcaag agcaaaaagc cctgagtgtc agtactgtca tagtttcttc aatgcttcgg 6780
caatcggcgt atctccttct gtcagatcaa aggcccgatt ttccgtattc ttctcatcta 6840
aagaggcaat gaccgttttt gcaacgtcat cacgggaaat aaatccccgc tccagatcct 6900
tcgctgctga aacagttccc gttccaggct cattgcgaag gcctcccgga cggataatcg 6960
tataggttaa accgctcgct tccagaattt tatcagcata atgcttggcc acataataag 7020
gcttgagtgc ctcattccaa ttttcacggt tatgggcttg cagggcgctg accataataa 7080
accgtttgat tccggcaatg gccgcagctt caatggcttt tgccgctcca tcaagatcca 7140
ccagcagcgt tttatcatag cctgtgctgc cgccggaacc ggctgtgaaa atgatcgcgt 7200
cacaaccttt tgccgcagcg gcgatttctt ccgggctgcc ctccagattc gcaagcacag 7260
cttctgcacc ggcagcttca agagacgctt tctgttcttc ttttctgacc atcgctctga 7320
tggaatgatc aggattatct tggaataaag agacgagtct ttgcccgatt tgtccgttcg 7380
ctccgattaa aaacactttc atgtgaatcc ctcctgcctc cattatttca aaaacacaac 7440
cgctctttca aacgatgtgt tttgccttag taaatcagat caaggaaa 7488
<210> 15
<211> 576
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 15
atgagtcaga aaacagacgc acctttagaa tcgtatgaag tgaacggcgc aacaattgcc 60
gtgctgccag aagaaataga cggcaaaatc tgttccaaaa ttattgaaaa agattgcgtg 120
ttttatgtaa acatgaagcc gctgcaaatt gtcgacagaa gctgccgatt ttttggatca 180
agctatgcgg gaagaaaagc aggaacttat gaagtgacaa aaatttcaca caagccgccg 240
atcatggtgg acccttcgaa ccaaatcttt ttattcccta cactttcttc gacaagaccc 300
caatgcggct ggatttccca tgtgcatgta aaagaattca aagcgactga attcgacgat 360
acggaagtga cgttttccaa tgggaaaacg atggagctgc cgatctctta taattcgttc 420
gagaaccagg tataccgaac agcgtggctc agaaccaaat tccaagacag aatcgaccac 480
cgcgtgccga aaagacagga atttatgctg tacccgaaag aagagcggac gaagatgatt 540
tatgatttta ttttgcgtga gctcggggaa cggtat 576
<210> 16
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成序列-引物
<400> 16
cacgataata tccattgttc tcacgg 26
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成序列-引物
<400> 17
gatatgtggt gccgaaacgc 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成序列-引物
<400> 18
gcaaaacgcg gatcattgga 20
<210> 19
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成序列-引物
<400> 19
gtttgcaaaa atattgcggc cg 22
<210> 20
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成序列-引物
<400> 20
ccatgatacg cggaagaacc g 21
<210> 21
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 21
gctatcaaaa taacagactc g 21
<210> 22
<211> 2209
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 22
cacgataata tccattgttc tcacggaagc acacgcaggt catttgaacg aattttttcg 60
acaggaattt gccgggactc aggagcattt aacctaaaaa agcatgacat ttcagcataa 120
tgaacattta ctcatgtcta ttttcgttct tttctgtatg aaaatagtta tttcgagtct 180
ctacggaaat agcgagagat gatataccta aatagagata aaatcatctc aaaaaaatgg 240
gtctactaaa atattattcc atctattaca ataaattcac agaatagtct tttaagtaag 300
tctactctga atttttttaa aaggagaggg taaagagtgt caacaacata tcctattgtc 360
ctggtacacg gcctttctgg tttcgatgac atcgtaggat acccttattt ttatgggatt 420
gccgacgccc tggagaaaga tggccacaaa gtttttacag cctcactctc tgcattcaat 480
tccaacgaag tccgtggcga gcaattatgg gagttcgtgc aaaagattct caaagagact 540
aaagcaaaaa aggtgaattt gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg 600
gcggccaagc atgctaaaag tattgcaagt gttacatctg tgaatggagt gaatcacggt 660
agcgaaatcg ccgatcttgt cagacggatt atgagaaaag attctgtccc tgagtatatc 720
gcggacgcgg taatgaaggc tattggcact ataatcagta cttttagcgg aaatagagga 780
aaccctcaag acgctatagc agctctggag gccttaacga cggaaaacgt gatggaattt 840
aacaaaaaat atcctcaggg actgccagca attcgtgggg gtgaaggtaa agaagtcgtg 900
aacggcgtac actactatag ctttggttct tacatacagg gtctcatcgc tggcgagaag 960
ggaaacttgc tcgatcctac ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa 1020
cgtgagaacg atggtttagt aggacggact tcaatgcggc tcggcaagtt aattaaagac 1080
gactacgctg aggatcattt agatatggtc aatcaagttg cggggttagt tggacgcggg 1140
gaggatataa ttgctatata tacgaatcat gccaattttt tagcgtcaaa aaagctctaa 1200
tctagataca taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg 1260
catgttcaat ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg 1320
gcgggttgac ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt 1380
cccggtttcc ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga 1440
cggcattcgt aatcaacgcc tcactcctca catcaacccg ttacttctat tgtaatcata 1500
aattcaaatt cttagaacca agctgtgttc cgcacttttc caccctttta agcatggaaa 1560
ccccgatcgc tgggaaaact aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca 1620
gccatcgtgg taatcggtct tgtgtttatc gcattttttt atctttacag ccgatcaggc 1680
gatgtgtatc aatcggtaga cgcggatttg atcacactgt cttcaagcgg ccaggaagat 1740
atcgagattg aaaaaagaca gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa 1800
caggtgaaga cagaaaaaac atcagcccct gattacgaag ggacaatcaa gtttcataaa 1860
gaccggtatg actcattcag actatggatt gacggcagcc agcaagccgt ttttttgaag 1920
gatggcacat actacaaatt aagcaaaaat gatacaaagg cgctgctaaa tattattaaa 1980
aaagaagcaa aggattgaaa atgaaaaagc gaagctaacc gcttcgcttt ttcattttat 2040
tggggcaaaa tatctctcag tgcccgtctg agcattttcc ccgtcgcatt tttcggaata 2100
tcgtcaagaa acgtaatggc ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc 2160
tgcatgatgt cctcctctgt taccccagag cgtttcggca ccacatatc 2209
<210> 23
<211> 3999
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 23
gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60
ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120
ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180
ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240
gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300
catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360
cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420
gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480
ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540
tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600
cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660
cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720
gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780
cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840
tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900
aggtcatttg aacgaatttt ttcgacagga atttgccggg actcaggagc atttaaccta 960
aaaaagcatg acatttcagc ataatgaaca tttactcatg tctattttcg ttcttttctg 1020
tatgaaaata gttatttcga gtctctacgg aaatagcgag agatgatata cctaaataga 1080
gataaaatca tctcaaaaaa atgggtctac taaaatatta ttccatctat tacaataaat 1140
tcacagaata gtcttttaag taagtctact ctgaattttt ttaaaaggag agggtaaaga 1200
gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 1260
ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 1320
acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 1380
gtgcaaaaga ttctcaaaga gactaaagca aaaaaggtga atttgatcgg gcactcccaa 1440
ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 1500
tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 1560
aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 1620
agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 1680
acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 1740
gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 1800
cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 1860
gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 1920
cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 1980
gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 2040
tttttagcgt caaaaaagct ctaatctaga tacataaaaa accggccttg gccccgccgg 2100
ttttttatta tttttcttcc tccgcatgtt caatccgctc cataatcgac ggatggctcc 2160
ctctgaaaat tttaacgaga aacggcgggt tgacccggct cagtcccgta acggccaagt 2220
cctgaaacgt ctcaatcgcc gcttcccggt ttccggtcag ctcaatgccg taacggtcgg 2280
cggcgttttc ctgataccgg gagacggcat tcgtaatcaa cgcctcactc ctcacatcaa 2340
cccgttactt ctattgtaat cataaattca aattcttaga accaagctgt gttccgcact 2400
tttccaccct tttaagcatg gaaaccccga tcgctgggaa aactaacaat gtttggagtg 2460
atgcaaatga aaaaaatagt ggcagccatc gtggtaatcg gtcttgtgtt tatcgcattt 2520
ttttatcttt acagccgatc aggcgatgtg tatcaatcgg tagacgcgga tttgatcaca 2580
ctgtcttcaa gcggccagga agatatcgag attgaaaaaa gacagcacgt caaagatatg 2640
ctggatatta tgaatcaggg aaaacaggtg aagacagaaa aaacatcagc ccctgattac 2700
gaagggacaa tcaagtttca taaagaccgg tatgactcat tcagactatg gattgacggc 2760
agccagcaag ccgttttttt gaaggatggc acatactaca aattaagcaa aaatgataca 2820
aaggcgctgc taaatattat taaaaaagaa gcaaaggatt gaaaatgaaa aagcgaagct 2880
aaccgcttcg ctttttcatt ttattggggc aaaatatctc tcagtgcccg tctgagcatt 2940
ttccccgtcg catttttcgg aatatcgtca agaaacgtaa tggcggcagg ccgcttgtat 3000
tttgccagat gcttttcgca gtgctgcatg atgtcctcct ctgttacccc agagcgtttc 3060
ggcaccacat atccctttac cgcttccccg ctttgggggt ccggcacgcc gatgacaacc 3120
gcctccttga cgtccggatg gctgtacagc acctcctcca cctcccgcgg atacacattg 3180
tatcctccta caatgatcat gtcttttttc cggtcaacaa tgtaaaaata gccgtcctca 3240
tcccgtcttg ccaagtcccc cgtataaagc cacccgtctt ttaatgcatg ctctgtttcc 3300
atcggcattt tataatagcc cttcatcaca ttggggcctt tcacgatcaa ttcgccgacc 3360
tggtgagcgg gcagctcgcg tccgagcgga tctacgacct tgttttcgac atgtaagata 3420
cttgtcccga tggagcccgg ctttctgccc ctgtcaaacg ggttaaagca cgtgacgggt 3480
gatgcttccg agagcccgta gccttccaaa atggtaacac cgaatttttc ttcaaacgcc 3540
gtcagcaacg cgactggcat ggacgcgcct cccgaaatgc acagccggat cgaagaaaaa 3600
tcatctttct ttccgttttc atgctgaaac aagtagttat acattgtagg cacaccggca 3660
aaaatggtcg cctgctgctg cttaacaagc ttaaaaacag atgccggact gaattgaggc 3720
tcaatcaata cagttgcgcc gctcatcagc ggtgcattca tacagacggt taaacaaaac 3780
acgtgaaaca tgggaagagc gcagaccaca ttgtccctct catccattcc caaatagcct 3840
gcgacatcgt tggcattgct gtacaaattc tgatgtgtca gcatcgcgcc tttcggtttt 3900
ccagtcgttc ctgacgtata taaaataacc gcggtatcat caggtacagg ttcttggttt 3960
tgtttagcgg cagatgtcgg ccgcaatatt tttgcaaac 3999
<210> 24
<211> 5289
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 24
gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60
ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120
ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180
ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240
gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300
catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360
cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420
gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480
ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540
tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600
cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660
cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720
gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780
cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840
tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900
aggtcatttg aacgaatttt ttcgacagga atttgccggg actcaggagc atttaaccta 960
aaaaagcatg acatttcagc ataatgaaca tttactcatg tctattttcg ttcttttctg 1020
tatgaaaata gttatttcga gtctctacgg aaatagcgag agatgatata cctaaataga 1080
gataaaatca tctcaaaaaa atgggtctac taaaatatta ttccatctat tacaataaat 1140
tcacagaata gtcttttaag taagtctact ctgaattttt ttaaaaggag agggtaaaga 1200
gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 1260
ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 1320
acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 1380
gtgcaaaaga ttctcaaaga gactaaagca aaaaaggtga atttgatcgg gcactcccaa 1440
ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 1500
tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 1560
aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 1620
agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 1680
acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 1740
gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 1800
cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 1860
gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 1920
cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 1980
gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 2040
tttttagcgt caaaaaagct ctaatctaga tacataaaaa accggccttg gccccgccgg 2100
ttttttatta tttttcttcc tccgcatgtt caatccgctc cataatcgac ggatggctcc 2160
ctctgaaaat tttaacgaga aacggcgggt tgacccggct cagtcccgta acggccaagt 2220
cctgaaacgt ctcaatcgcc gcttcccggt ttccggtcag ctcaatgccg taacggtcgg 2280
cggcgttttc ctgataccgg gagacggcat tcgtaatcaa cgcctcactc ctcacatcaa 2340
cccgttactt ctattgtaat cataaattca aattcttaga accaagctgt gttccgcact 2400
tttccaccct tttaagcatg gaaaccccga tcgctgggaa aactaacaat gtttggagtg 2460
atgcaaatga aaaaaatagt ggcagccatc gtggtaatcg gtcttgtgtt tatcgcattt 2520
ttttatcttt acagccgatc aggcgatgtg tatcaatcgg tagacgcgga tttgatcaca 2580
ctgtcttcaa gcggccagga agatatcgag attgaaaaaa gacagcacgt caaagatatg 2640
ctggatatta tgaatcaggg aaaacaggtg aagacagaaa aaacatcagc ccctgattac 2700
gaagggacaa tcaagtttca taaagaccgg tatgactcat tcagactatg gattgacggc 2760
agccagcaag ccgttttttt gaaggatggc acatactaca aattaagcaa aaatgataca 2820
aaggcgctgc taaatattat taaaaaagaa gcaaaggatt gaaaatgaaa aagcgaagct 2880
aaccgcttcg ctttttcatt ttattggggc aaaatatctc tcagtgcccg tctgagcatt 2940
ttccccgtcg catttttcgg aatatcgtca agaaacgtaa tggcggcagg ccgcttgtat 3000
tttgccagat gcttttcgca gtgctgcatg atgtcctcct ctgttacccc agagcgtttc 3060
ggcaccacat atccctttac cgcttccccg ctttgggggt ccggcacgcc gatgacaacc 3120
gcctccttga cgtccggatg gctgtacagc acctcctcca cctcccgcgg atacacattg 3180
tatcctccta caatgatcat gtcttttttc cggtcaacaa tgtaaaaata gccgtcctca 3240
tcccgtcttg ccaagtcccc cgtataaagc cacccgtctt ttaatgcatg ctctgtttcc 3300
atcggcattt tataatagcc cttcatcaca ttggggcctt tcacgatcaa ttcgccgacc 3360
tggtgagcgg gcagctcgcg tccgagcgga tctacgacct tgttttcgac atgtaagata 3420
cttgtcccga tggagcccgg ctttctgccc ctgtcaaacg ggttaaagca cgtgacgggt 3480
gatgcttccg agagcccgta gccttccaaa atggtaacac cgaatttttc ttcaaacgcc 3540
gtcagcaacg cgactggcat ggacgcgcct cccgaaatgc acagccggat cgaagaaaaa 3600
tcatctttct ttccgttttc atgctgaaac aagtagttat acattgtagg cacaccggca 3660
aaaatggtcg cctgctgctg cttaacaagc ttaaaaacag atgccggact gaattgaggc 3720
tcaatcaata cagttgcgcc gctcatcagc ggtgcattca tacagacggt taaacaaaac 3780
acgtgaaaca tgggaagagc gcagaccaca ttgtccctct catccattcc caaatagcct 3840
gcgacatcgt tggcattgct gtacaaattc tgatgtgtca gcatcgcgcc tttcggtttt 3900
ccagtcgttc ctgacgtata taaaataacc gcggtatcat caggtacagg ttcttggttt 3960
tgtttagcgg cagatgtcgg ccgcaatatt tttgcaaacg ttgtcatttt catcctgacc 4020
tctgggtccg cagcttccgg ctcggcctcc cccgtctggc ataaaatgac gagctcaacc 4080
tttggcagcg attcatgcat gctctcataa agcggcaaaa gctggctaac gcccacgatt 4140
gcctttacat cgccatttgt cagcatataa ccaatttctg tcggcgtgta caacggattg 4200
atgggaacaa ctacgatccc agcttttaaa gcgccaaaaa acgcgatgat aaaatcaggc 4260
gaattgccaa gcagcaaagc taaatggtcc cctttctcca taccggcttc ctgaaggccg 4320
tccgcaaatc gctgaatata ttcattcagc tcttgatacg tcatcatgtg atctttaaac 4380
ctgcatgcga tgctgtcggg cttctcagat gctgtttctt ccaattttga aacaagattc 4440
attctcccac cccttaagtg aatgaatagt cattcattat tgaagccaag ctttcttctc 4500
cattatagag aaacagaaaa aaacactcaa gagcaaaaag ccctgagtgt cagtactgtc 4560
atagtttctt caatgcttcg gcaatcggcg tatctccttc tgtcagatca aaggcccgat 4620
tttccgtatt cttctcatct aaagaggcaa tgaccgtttt tgcaacgtca tcacgggaaa 4680
taaatccccg ctccagatcc ttcgctgctg aaacagttcc cgttccaggc tcattgcgaa 4740
ggcctcccgg acggataatc gtataggtta aaccgctcgc ttccagaatt ttatcagcat 4800
aatgcttggc cacataataa ggcttgagtg cctcattcca attttcacgg ttatgggctt 4860
gcagggcgct gaccataata aaccgtttga ttccggcaat ggccgcagct tcaatggctt 4920
ttgccgctcc atcaagatcc accagcagcg ttttatcata gcctgtgctg ccgccggaac 4980
cggctgtgaa aatgatcgcg tcacaacctt ttgccgcagc ggcgatttct tccgggctgc 5040
cctccagatt cgcaagcaca gcttctgcac cggcagcttc aagagacgct ttctgttctt 5100
cttttctgac catcgctctg atggaatgat caggattatc ttggaataaa gagacgagtc 5160
tttgcccgat ttgtccgttc gctccgatta aaaacacttt catgtgaatc cctcctgcct 5220
ccattatttc aaaaacacaa ccgctctttc aaacgatgtg ttttgcctta gtaaatcaga 5280
tcaaggaaa 5289
<210> 25
<211> 6064
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 25
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcaggtc atttgaacga attttttcga caggaatttg 3000
ccgggactca ggagcattta acctaaaaaa gcatgacatt tcagcataat gaacatttac 3060
tcatgtctat tttcgttctt ttctgtatga aaatagttat ttcgagtctc tacggaaata 3120
gcgagagatg atatacctaa atagagataa aatcatctca aaaaaatggg tctactaaaa 3180
tattattcca tctattacaa taaattcaca gaatagtctt ttaagtaagt ctactctgaa 3240
tttttttaaa aggagagggt aaagagtgtc aacaacatat cctattgtcc tggtacacgg 3300
cctttctggt ttcgatgaca tcgtaggata cccttatttt tatgggattg ccgacgccct 3360
ggagaaagat ggccacaaag tttttacagc ctcactctct gcattcaatt ccaacgaagt 3420
ccgtggcgag caattatggg agttcgtgca aaagattctc aaagagacta aagcaaaaaa 3480
ggtgaatttg atcgggcact cccaaggtcc tcttgcgtgt cgttatgtgg cggccaagca 3540
tgctaaaagt attgcaagtg ttacatctgt gaatggagtg aatcacggta gcgaaatcgc 3600
cgatcttgtc agacggatta tgagaaaaga ttctgtccct gagtatatcg cggacgcggt 3660
aatgaaggct attggcacta taatcagtac ttttagcgga aatagaggaa accctcaaga 3720
cgctatagca gctctggagg ccttaacgac ggaaaacgtg atggaattta acaaaaaata 3780
tcctcaggga ctgccagcaa ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca 3840
ctactatagc tttggttctt acatacaggg tctcatcgct ggcgagaagg gaaacttgct 3900
cgatcctacc cacgccgcta tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga 3960
tggtttagta ggacggactt caatgcggct cggcaagtta attaaagacg actacgctga 4020
ggatcattta gatatggtca atcaagttgc ggggttagtt ggacgcgggg aggatataat 4080
tgctatatat acgaatcatg ccaatttttt agcgtcaaaa aagctctaat ctagatacat 4140
aaaaaaccgg ccttggcccc gccggttttt tattattttt cttcctccgc atgttcaatc 4200
cgctccataa tcgacggatg gctccctctg aaaattttaa cgagaaacgg cgggttgacc 4260
cggctcagtc ccgtaacggc caagtcctga aacgtctcaa tcgccgcttc ccggtttccg 4320
gtcagctcaa tgccgtaacg gtcggcggcg ttttcctgat accgggagac ggcattcgta 4380
atcaacgcct cactcctcac atcaacccgt tacttctatt gtaatcataa attcaaattc 4440
ttagaaccaa gctgtgttcc gcacttttcc acccttttaa gcatggaaac cccgatcgct 4500
gggaaaacta acaatgtttg gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt 4560
aatcggtctt gtgtttatcg cattttttta tctttacagc cgatcaggcg atgtgtatca 4620
atcggtagac gcggatttga tcacactgtc ttcaagcggc caggaagata tcgagattga 4680
aaaaagacag cacgtcaaag atatgctgga tattatgaat cagggaaaac aggtgaagac 4740
agaaaaaaca tcagcccctg attacgaagg gacaatcaag tttcataaag accggtatga 4800
ctcattcaga ctatggattg acggcagcca gcaagccgtt tttttgaagg atggcacata 4860
ctacaaatta agcaaaaatg atacaaaggc gctgctaaat attattaaaa aagaagcaaa 4920
ggattgaaaa tgaaaaagcg aagctaaccg cttcgctttt tcattttatt ggggcaaaat 4980
atctctcagt gcccgtctga gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa 5040
cgtaatggcg gcaggccgct tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc 5100
ctcctctgtt accccagagc gtttcggcac cacatatccc tttaccgctt ccccgctttg 5160
ggggtccggc acgccgatga caaccgcctc cttgacgtcc ggatggctgt acagcacctc 5220
ctccacctcc cgcggataca cattgtatcc tcctacaatg atcatgtctt ttttccggtc 5280
aacaatgtaa aaatagccgt cctcatcccg tcttgccaag tcccccgtat aaagccaccc 5340
gtcttttaat gcatgctctg tttccatcgg cattttataa tagcccttca tcacattggg 5400
gcctttcacg atcaattcgc cgacctggtg agcgggcagc tcgcgtccga gcggatctac 5460
gaccttgttt tcgacatgta agatacttgt cccgatggag cccggctttc tgcccctgtc 5520
aaacgggtta aagcacgtga cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt 5580
aacaccgaat ttttcttcaa acgccgtcag caacgcgact ggcatggacg cgcctcccga 5640
aatgcacagc cggatcgaag aaaaatcatc tttctttccg ttttcatgct gaaacaagta 5700
gttatacatt gtaggcacac cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa 5760
aacagatgcc ggactgaatt gaggctcaat caatacagtt gcgccgctca tcagcggtgc 5820
attcatacag acggttaaac aaaacacgtg aaacatggga agagcgcaga ccacattgtc 5880
cctctcatcc attcccaaat agcctgcgac atcgttggca ttgctgtaca aattctgatg 5940
tgtcagcatc gcgcctttcg gttttccagt cgttcctgac gtatataaaa taaccgcggt 6000
atcatcaggt acaggttctt ggttttgttt agcggcagat gtcggccgca atatttttgc 6060
aaac 6064
<210> 26
<211> 7346
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 26
ccctgctgac agaaatatcc ggcggtgacc cggagcttca aagcacccgt ctcgtcaacg 60
cctgcctcag caacattgaa tttgcagaag aaaaatggcg gataaaagac tataatatca 120
acagccactt atccggcttt atcaaataag aaaaagacag gcgtttgcct gtcttttctt 180
ttatttctta gcagccggca tctctttttg aagctcgtcc aaaatggcat tcgccccgtc 240
tacactgcgg cgcagagacc acaccgcacg atccacgtgg tatacatgcc cgtttttcac 300
tgccttcagt tttttccaaa ggacattctt ttcgatcggg cgtttaccgt cggcgtcgag 360
gtcatctgtt tttcctgtca tcaggatgat cacatccgga tctgttttca gcagctgctc 420
cagtgtcatt ttcatattca cagagtcgcc gccattgctt gaatcgctat tgcctgacgt 480
actgattgca tatcggtagc cgacctgtgt taaaagtctc gatgtaaaga agttttcatc 540
cctggccata atggtatcat ttgtatttcc gatcaaaagc acggactggc tgttcgcgct 600
gattttctgc tttgtctcgc taagcttttc ttcatgcgcc gtcagctttt tctccatttc 660
cttctccttg ccgactgctt ttgcaatcgt aagcgaagcg tcaattgtat cctgataatc 720
agcatttaaa ttattaagtg caatcgtcgg cgctattttt ttcagctgat cgtacacctt 780
cttatgccgg gtcgtgtcag caataattaa atcgggtttt aatgaagcga ttttttccat 840
gcttggctgt gagcgagtgc cgacagatgt gtagccgtca attttcttca gcacatcctt 900
gttgatcagc tgcttcgctt tgttgtcatc ggcaaccccg acaggcgtaa tgccgagatc 960
aagcagtgta tcaataaaac ctagctcaag aacaacaacc cgcttcggat gctcaggcac 1020
atttgtcttc cctaaatcat gtgttaccgc cactttatgt tctttactgt tttgattgcc 1080
gcttgaagac gagcaagcag ccgttaagac agaaagaagt aaaactgtaa gaataatcag 1140
tgtttttttc atatgttcca gtctctcctg ttggtagttt ctatggttaa gatgtccaag 1200
agtagtataa cacggaatga gaatcattat caccaattat ttttaaaatg agaagagaaa 1260
gttcggctta caggaaaatc ttgtttcgcg acacagcagt tcagcagctg atcatcctgt 1320
ccacaaaaaa gcttgcagaa aaataacatt ctctgcaagc tgatcctgtt aaagcttcac 1380
aatcactctt ccttgaatgc gattttgcaa aatatctttt aacgcacccg gcgtttcttc 1440
caatgatact tccctgtcca cgatggtcag cagctgatca ggcttgagat cagaagacat 1500
gcgctcccaa acagcggctc tgacgtccat cggacaatat actgaatcga ttccgagcag 1560
gcttactccg cgaagaataa aaggatacac ggttgccgga acttctcctc cgccggttaa 1620
gccgctcact gcgacagatc cgccgtattg aattttgctt aaaagcgagg caagctgttt 1680
tccgccgact ggatcaaccg ctccctgcca ttgctgcttg gacagcgcct taagcgttcc 1740
gtcatagaca tcttccctgc tgattacttc gcttgcacca agctgtttca aataatcagc 1800
cgcctcccgg tttccggtac ttgccaccac atcataaccc cgcttgttca gcatcgatac 1860
cgcaattccg ccgacaccgc cggttgctcc tgtgactagc acgctgcctt tttccggaga 1920
cagaccgttc tgttcaagcc gatgcactga taacgccgca gtaaatcccg ccgttccgta 1980
caccatcgct tcttttaacg aaagattctg tggcaaaggc accagccagt caccaggcac 2040
cgaagcgtat tcacttaatc cgccatcacg tgagacaccg agctcatagc ttgtcgcgat 2100
cacctcatcc ccctccgcaa aacgcggatc attggaagag acgaccgtac ccgcagcatc 2160
aatgcctaaa ataagcggat actctctgac gatattgcct cctgcttttc cggccagacc 2220
atctttgtaa ttaatgccgg aataagcaac tttaatcagg acaccatcct tcggcaaatc 2280
ctctgttgat atggttttca catggactga aacatcatcg gcattttttt ctgcctgcaa 2340
ggcttgaaat aacgttgaca ttcggcacac tccttttcat ttatatcgta accgaagaac 2400
gttcaaaaaa ccaaatcatc aagccgccat tttcacttcg ccggcacatt gagacaataa 2460
tggacaaatc cggtatcctc ttcatagccg ttttgctcat acaagcttct tgccttccgg 2520
ttgtggtgct cagtctgaag tgttaaacat tttgccccgt tttgccctgc ataatccttt 2580
gcggcagaaa gcagccggcc gccggctccc tttgtacgcg catgaggaac gacaaataag 2640
tcatttaata tgtatatcct tttcattgac acagaagaaa acgttggata gagctgggta 2700
aagcctatga attctccatt ttcttctgct atcaaaataa cagactcgtg attttccaaa 2760
cgagctttca aaaaagcctc tgccccttgc aaatcggatg cctgtctata aaattcccga 2820
tattggttaa acagcggcgc aatggcggcc gcatctgatg tctttgcttg gcgaatgttc 2880
atcttatttc ttcctccctc tcaataattt tttcattcta tcccttttct gtaaagttta 2940
tttttcagaa tacttttatc atcatgcttt gaaaaaatat cacgataata tccattgttc 3000
tcacggaagc acacgcaggt catttgaacg aattttttcg acaggaattt gccgggactc 3060
aggagcattt aacctaaaaa agcatgacat ttcagcataa tgaacattta ctcatgtcta 3120
ttttcgttct tttctgtatg aaaatagtta tttcgagtct ctacggaaat agcgagagat 3180
gatataccta aatagagata aaatcatctc aaaaaaatgg gtctactaaa atattattcc 3240
atctattaca ataaattcac agaatagtct tttaagtaag tctactctga atttttttaa 3300
aaggagaggg taaagagtgt caacaacata tcctattgtc ctggtacacg gcctttctgg 3360
tttcgatgac atcgtaggat acccttattt ttatgggatt gccgacgccc tggagaaaga 3420
tggccacaaa gtttttacag cctcactctc tgcattcaat tccaacgaag tccgtggcga 3480
gcaattatgg gagttcgtgc aaaagattct caaagagact aaagcaaaaa aggtgaattt 3540
gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg gcggccaagc atgctaaaag 3600
tattgcaagt gttacatctg tgaatggagt gaatcacggt agcgaaatcg ccgatcttgt 3660
cagacggatt atgagaaaag attctgtccc tgagtatatc gcggacgcgg taatgaaggc 3720
tattggcact ataatcagta cttttagcgg aaatagagga aaccctcaag acgctatagc 3780
agctctggag gccttaacga cggaaaacgt gatggaattt aacaaaaaat atcctcaggg 3840
actgccagca attcgtgggg gtgaaggtaa agaagtcgtg aacggcgtac actactatag 3900
ctttggttct tacatacagg gtctcatcgc tggcgagaag ggaaacttgc tcgatcctac 3960
ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa cgtgagaacg atggtttagt 4020
aggacggact tcaatgcggc tcggcaagtt aattaaagac gactacgctg aggatcattt 4080
agatatggtc aatcaagttg cggggttagt tggacgcggg gaggatataa ttgctatata 4140
tacgaatcat gccaattttt tagcgtcaaa aaagctctaa tctagataca taaaaaaccg 4200
gccttggccc cgccggtttt ttattatttt tcttcctccg catgttcaat ccgctccata 4260
atcgacggat ggctccctct gaaaatttta acgagaaacg gcgggttgac ccggctcagt 4320
cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt cccggtttcc ggtcagctca 4380
atgccgtaac ggtcggcggc gttttcctga taccgggaga cggcattcgt aatcaacgcc 4440
tcactcctca catcaacccg ttacttctat tgtaatcata aattcaaatt cttagaacca 4500
agctgtgttc cgcacttttc caccctttta agcatggaaa ccccgatcgc tgggaaaact 4560
aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca gccatcgtgg taatcggtct 4620
tgtgtttatc gcattttttt atctttacag ccgatcaggc gatgtgtatc aatcggtaga 4680
cgcggatttg atcacactgt cttcaagcgg ccaggaagat atcgagattg aaaaaagaca 4740
gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa caggtgaaga cagaaaaaac 4800
atcagcccct gattacgaag ggacaatcaa gtttcataaa gaccggtatg actcattcag 4860
actatggatt gacggcagcc agcaagccgt ttttttgaag gatggcacat actacaaatt 4920
aagcaaaaat gatacaaagg cgctgctaaa tattattaaa aaagaagcaa aggattgaaa 4980
atgaaaaagc gaagctaacc gcttcgcttt ttcattttat tggggcaaaa tatctctcag 5040
tgcccgtctg agcattttcc ccgtcgcatt tttcggaata tcgtcaagaa acgtaatggc 5100
ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc tgcatgatgt cctcctctgt 5160
taccccagag cgtttcggca ccacatatcc ctttaccgct tccccgcttt gggggtccgg 5220
cacgccgatg acaaccgcct ccttgacgtc cggatggctg tacagcacct cctccacctc 5280
ccgcggatac acattgtatc ctcctacaat gatcatgtct tttttccggt caacaatgta 5340
aaaatagccg tcctcatccc gtcttgccaa gtcccccgta taaagccacc cgtcttttaa 5400
tgcatgctct gtttccatcg gcattttata atagcccttc atcacattgg ggcctttcac 5460
gatcaattcg ccgacctggt gagcgggcag ctcgcgtccg agcggatcta cgaccttgtt 5520
ttcgacatgt aagatacttg tcccgatgga gcccggcttt ctgcccctgt caaacgggtt 5580
aaagcacgtg acgggtgatg cttccgagag cccgtagcct tccaaaatgg taacaccgaa 5640
tttttcttca aacgccgtca gcaacgcgac tggcatggac gcgcctcccg aaatgcacag 5700
ccggatcgaa gaaaaatcat ctttctttcc gttttcatgc tgaaacaagt agttatacat 5760
tgtaggcaca ccggcaaaaa tggtcgcctg ctgctgctta acaagcttaa aaacagatgc 5820
cggactgaat tgaggctcaa tcaatacagt tgcgccgctc atcagcggtg cattcataca 5880
gacggttaaa caaaacacgt gaaacatggg aagagcgcag accacattgt ccctctcatc 5940
cattcccaaa tagcctgcga catcgttggc attgctgtac aaattctgat gtgtcagcat 6000
cgcgcctttc ggttttccag tcgttcctga cgtatataaa ataaccgcgg tatcatcagg 6060
tacaggttct tggttttgtt tagcggcaga tgtcggccgc aatatttttg caaacgttgt 6120
cattttcatc ctgacctctg ggtccgcagc ttccggctcg gcctcccccg tctggcataa 6180
aatgacgagc tcaacctttg gcagcgattc atgcatgctc tcataaagcg gcaaaagctg 6240
gctaacgccc acgattgcct ttacatcgcc atttgtcagc atataaccaa tttctgtcgg 6300
cgtgtacaac ggattgatgg gaacaactac gatcccagct tttaaagcgc caaaaaacgc 6360
gatgataaaa tcaggcgaat tgccaagcag caaagctaaa tggtcccctt tctccatacc 6420
ggcttcctga aggccgtccg caaatcgctg aatatattca ttcagctctt gatacgtcat 6480
catgtgatct ttaaacctgc atgcgatgct gtcgggcttc tcagatgctg tttcttccaa 6540
ttttgaaaca agattcattc tcccacccct taagtgaatg aatagtcatt cattattgaa 6600
gccaagcttt cttctccatt atagagaaac agaaaaaaac actcaagagc aaaaagccct 6660
gagtgtcagt actgtcatag tttcttcaat gcttcggcaa tcggcgtatc tccttctgtc 6720
agatcaaagg cccgattttc cgtattcttc tcatctaaag aggcaatgac cgtttttgca 6780
acgtcatcac gggaaataaa tccccgctcc agatccttcg ctgctgaaac agttcccgtt 6840
ccaggctcat tgcgaaggcc tcccggacgg ataatcgtat aggttaaacc gctcgcttcc 6900
agaattttat cagcataatg cttggccaca taataaggct tgagtgcctc attccaattt 6960
tcacggttat gggcttgcag ggcgctgacc ataataaacc gtttgattcc ggcaatggcc 7020
gcagcttcaa tggcttttgc cgctccatca agatccacca gcagcgtttt atcatagcct 7080
gtgctgccgc cggaaccggc tgtgaaaatg atcgcgtcac aaccttttgc cgcagcggcg 7140
atttcttccg ggctgccctc cagattcgca agcacagctt ctgcaccggc agcttcaaga 7200
gacgctttct gttcttcttt tctgaccatc gctctgatgg aatgatcagg attatcttgg 7260
aataaagaga cgagtctttg cccgatttgt ccgttcgctc cgattaaaaa cactttcatg 7320
tgaatccctc ctgcctccat tatttc 7346
<210> 27
<211> 10478
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 27
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcaggtc atttgaacga attttttcga caggaatttg 3000
ccgggactca ggagcattta acctaaaaaa gcatgacatt tcagcataat gaacatttac 3060
tcatgtctat tttcgttctt ttctgtatga aaatagttat ttcgagtctc tacggaaata 3120
gcgagagatg atatacctaa atagagataa aatcatctca aaaaaatggg tctactaaaa 3180
tattattcca tctattacaa taaattcaca gaatagtctt ttaagtaagt ctactctgaa 3240
tttttttaaa aggagagggt aaagagtgtc aacaacatat cctattgtcc tggtacacgg 3300
cctttctggt ttcgatgaca tcgtaggata cccttatttt tatgggattg ccgacgccct 3360
ggagaaagat ggccacaaag tttttacagc ctcactctct gcattcaatt ccaacgaagt 3420
ccgtggcgag caattatggg agttcgtgca aaagattctc aaagagacta aagcaaaaaa 3480
ggtgaatttg atcgggcact cccaaggtcc tcttgcgtgt cgttatgtgg cggccaagca 3540
tgctaaaagt attgcaagtg ttacatctgt gaatggagtg aatcacggta gcgaaatcgc 3600
cgatcttgtc agacggatta tgagaaaaga ttctgtccct gagtatatcg cggacgcggt 3660
aatgaaggct attggcacta taatcagtac ttttagcgga aatagaggaa accctcaaga 3720
cgctatagca gctctggagg ccttaacgac ggaaaacgtg atggaattta acaaaaaata 3780
tcctcaggga ctgccagcaa ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca 3840
ctactatagc tttggttctt acatacaggg tctcatcgct ggcgagaagg gaaacttgct 3900
cgatcctacc cacgccgcta tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga 3960
tggtttagta ggacggactt caatgcggct cggcaagtta attaaagacg actacgctga 4020
ggatcattta gatatggtca atcaagttgc ggggttagtt ggacgcgggg aggatataat 4080
tgctatatat acgaatcatg ccaatttttt agcgtcaaaa aagctctaat ctagatacat 4140
aaaaaaccgg ccttggcccc gccggttttt tattattttt cttcctccgc atgttcaatc 4200
cgctccataa tcgacggatg gctccctctg aaaattttaa cgagaaacgg cgggttgacc 4260
cggctcagtc ccgtaacggc caagtcctga aacgtctcaa tcgccgcttc ccggtttccg 4320
gtcagctcaa tgccgtaacg gtcggcggcg ttttcctgat accgggagac ggcattcgta 4380
atcaacgcct cactcctcac atcaacccgt tacttctatt gtaatcataa attcaaattc 4440
ttagaaccaa gctgtgttcc gcacttttcc acccttttaa gcatggaaac cccgatcgct 4500
gggaaaacta acaatgtttg gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt 4560
aatcggtctt gtgtttatcg cattttttta tctttacagc cgatcaggcg atgtgtatca 4620
atcggtagac gcggatttga tcacactgtc ttcaagcggc caggaagata tcgagattga 4680
aaaaagacag cacgtcaaag atatgctgga tattatgaat cagggaaaac aggtgaagac 4740
agaaaaaaca tcagcccctg attacgaagg gacaatcaag tttcataaag accggtatga 4800
ctcattcaga ctatggattg acggcagcca gcaagccgtt tttttgaagg atggcacata 4860
ctacaaatta agcaaaaatg atacaaaggc gctgctaaat attattaaaa aagaagcaaa 4920
ggattgaaaa tgaaaaagcg aagctaaccg cttcgctttt tcattttatt ggggcaaaat 4980
atctctcagt gcccgtctga gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa 5040
cgtaatggcg gcaggccgct tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc 5100
ctcctctgtt accccagagc gtttcggcac cacatatccc tttaccgctt ccccgctttg 5160
ggggtccggc acgccgatga caaccgcctc cttgacgtcc ggatggctgt acagcacctc 5220
ctccacctcc cgcggataca cattgtatcc tcctacaatg atcatgtctt ttttccggtc 5280
aacaatgtaa aaatagccgt cctcatcccg tcttgccaag tcccccgtat aaagccaccc 5340
gtcttttaat gcatgctctg tttccatcgg cattttataa tagcccttca tcacattggg 5400
gcctttcacg atcaattcgc cgacctggtg agcgggcagc tcgcgtccga gcggatctac 5460
gaccttgttt tcgacatgta agatacttgt cccgatggag cccggctttc tgcccctgtc 5520
aaacgggtta aagcacgtga cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt 5580
aacaccgaat ttttcttcaa acgccgtcag caacgcgact ggcatggacg cgcctcccga 5640
aatgcacagc cggatcgaag aaaaatcatc tttctttccg ttttcatgct gaaacaagta 5700
gttatacatt gtaggcacac cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa 5760
aacagatgcc ggactgaatt gaggctcaat caatacagtt gcgccgctca tcagcggtgc 5820
attcatacag acggttaaac aaaacacgtg aaacatggga agagcgcaga ccacattgtc 5880
cctctcatcc attcccaaat agcctgcgac atcgttggca ttgctgtaca aattctgatg 5940
tgtcagcatc gcgcctttcg gttttccagt cgttcctgac gtatataaaa taaccgcggt 6000
atcatcaggt acaggttctt ggttttgttt agcggcagat gtcggccgca atatttttgc 6060
aaacgttgtc attttcatcc tgacctctgg gtccgcagct tccggctcgg cctcccccgt 6120
ctggcataaa atgacgagct caacctttgg cagcgattca tgcatgctct cataaagcgg 6180
caaaagctgg ctaacgccca cgattgcctt tacatcgcca tttgtcagca tataaccaat 6240
ttctgtcggc gtgtacaacg gattgatggg aacaactacg atcccagctt ttaaagcgcc 6300
aaaaaacgcg atgataaaat caggcgaatt gccaagcagc aaagctaaat ggtccccttt 6360
ctccataccg gcttcctgaa ggccgtccgc aaatcgctga atatattcat tcagctcttg 6420
atacgtcatc atgtgatctt taaacctgca tgcgatgctg tcgggcttct cagatgctgt 6480
ttcttccaat tttgaaacaa gattcattct cccacccctt aagtgaatga atagtcattc 6540
attattgaag ccaagctttc ttctccatta tagagaaaca gaaaaaaaca ctcaagagca 6600
aaaagccctg agtgtcagta ctgtcatagt ttcttcaatg cttcggcaat cggcgtatct 6660
ccttctgtca gatcaaaggc ccgattttcc gtattcttct catctaaaga ggcaatgacc 6720
gtttttgcaa cgtcatcacg ggaaataaat ccccgctcca gatccttcgc tgctgaaaca 6780
gttcccgttc caggctcatt gcgaaggcct cccggacgga taatcgtata ggttaaaccg 6840
ctcgcttcca gaattttatc agcataatgc ttggccacat aataaggctt gagtgcctca 6900
ttccaatttt cacggttatg ggcttgcagg gcgctgacca taataaaccg tttgattccg 6960
gcaatggccg cagcttcaat ggcttttgcc gctccatcaa gatccaccag cagcgtttta 7020
tcatagcctg tgctgccgcc ggaaccggct gtgaaaatga tcgcgtcaca accttttgcc 7080
gcagcggcga tttcttccgg gctgccctcc agattcgcaa gcacagcttc tgcaccggca 7140
gcttcaagag acgctttctg ttcttctttt ctgaccatcg ctctgatgga atgatcagga 7200
ttatcttgga ataaagagac gagtctttgc ccgatttgtc cgttcgctcc gattaaaaac 7260
actttcatgt gaatccctcc tgcctccatt atttcaaaaa cacaaccgct ctttcaaacg 7320
atgtgttttg ccttagtaaa tcagatcaag gaaatcctct ttcgtaatgt tcccaaagta 7380
atgcttgaga ttcacacctt cgagcacatc agcgatgacg ctgcgttcgt attgttttcc 7440
gaccagcagg ttttcaattt cagatacatc accgacaccg aagaaatctc cgaagatttt 7500
gcagtcctcg attttgcctt tcttgacttc caggtgcaaa tcgatcgatc caaccggata 7560
acgcttcgaa tgattaaggt taaattttgg tgagcggccg tagttccaat cccaattctg 7620
atagcgctct ttcgaaattt gatgaatggt ctcccaatct ttttccgtca gcttatactc 7680
cggcacgttt ccaacgtcgt ttgtgttaaa aatatggcga agcaaatggc tgcggaattc 7740
ttcggtggtc attttatcat cgagaaactc actgatgttt gccactcggc ttctgatcga 7800
tttgatgcct tttgattcaa ttttatcctt tttcaccttt aatgctgata caacatgatc 7860
aatggctgaa tcaaacatga gggtgccgtg gctgaaaata cggcctttcg ttgcaaactg 7920
agcgtttccg gatattttcc ggccatctac tacaatgtcg ttccggccgc ttaattcggc 7980
ttcaacccca agctgatgta acgcctgaat cactggctca gtgaattttt taaagttatg 8040
aaagctgtcc ccgtcatcct tggtaataaa gctgaagttc aagttcccca gatcatggta 8100
cacagcgccc ccgcctgata aacggcggac gacgataatc ccgttttcct caacatattt 8160
tgtattgatt tcttctattg tattttggtt tttcccaatg ataatagacg gttgattcac 8220
ataaaagagc aaatattgct gttcagggtc taaatgcttt acacagtact cctcgatagc 8280
aagattgatc cgcggatcat tgatattttg attgtctata aataacatgg tgctcctcct 8340
ttatccttcc cacacaaaac ctgatttcgc aatattcact tctccgttaa aaacggtttt 8400
cgcttctttg cgaaggttgt catgcacgcc aaaatgcggc aaatgtgtca gcagcagttc 8460
tcccgctccg gcttcttttg caatgcgccc agcttccagg ctgttcatat ggcctgcact 8520
tgttccgtct tgatcggcat aaaaattgca ttctgagatc aataaatcag catctttcga 8580
aaacggtata aatgaatcct gatagctgga atcagcagta taaacgacag tgtggctgcc 8640
gtcagtaatc cgcatggcat agcacgtcac cgggtgaatc gtttttaaaa aggtgatcgt 8700
aaacggaccg gcagtcagcg gctgatccgg ctgataggcg atcccttttg tatgtgtttt 8760
atatgtaagc ttttgaaact gttctatatc agcatcatgt ccgtaaatcg gaagcgtatg 8820
ctctcctttg ccgagaaacg aaccgacttg cttggcaaat tgcagcggtc cgatatcagc 8880
gatatggtca tggtgataat gagacagaac gaccgcatcc agcttttccg ccggcacata 8940
tccgaacagc ttagacaata cggcactgcc gcaatcaaca agcagagagt aatcacctga 9000
ctgaaacaaa tagcctgacg tcgcttcatt tgcggccgga aaaccgccat agcatccgat 9060
aactgtaact ttcataatgt cctcctatct tttcaaaaaa attggtcctc cttcaatata 9120
cccatttttc ttgaaaaaag catgttttaa acattgtatc aaaacagtta ttgatttttg 9180
taatctgtta tattacaatg aaatcactac aaaggggaaa gagggattgg ttatgctggg 9240
gaaaatcaca gaatttttta gaaacctgcc ttcgaaaaag tgtgcggaat gcggaaaaaa 9300
gatagaagag cagcatgagt gttatggtaa tatctgcaat gactgtataa aagtaaacga 9360
tttgtaatga gcgaaaatcc cgcgccttac gcgtgggatt ttcttatttt ttcacatatc 9420
tcttaatttt gaaataatag tcaggttagg tcaaagctca cctgttttta gataattctg 9480
gtgattatca taatgtcatt gaatattctt tattttcgaa atataattta ctatagacga 9540
attgatttct tatctattat aatttgatct aatagtgaga ttaaatatat gtctattcat 9600
gatatatgtt gatactttgt tttttgggag gtaatctatg aaaagaatta agtttggatt 9660
agccacacaa atattcgttg gacttattct aggtgtcatt gttggcgtca tttggtatgg 9720
caacccagca ttgcctactt acctgcagcc aatcggggat ctctttttac gcttaatcaa 9780
aatgatagtg attcctattg ttgtctccag cttaatcatc ggtgtagccg gtgcaggaaa 9840
tggaaagcaa gtcggtaaat taggcttcag aacgattctg tacttcgaga tcatcacgac 9900
ttttgccatt attctcggac tagcccttgc aaacatcttc catccgggta caggagttaa 9960
tatacacgaa gctcaaaaat cggacatcag tcaatatgtt gaaactgaaa aagaacaaag 10020
taataaatca gtggcggaaa cgttcctcca tattgtgccg acaaacttct tccagtcatt 10080
ggtcgaaggg gatcttctag ccatcatctg ctttacagta ctatttgcat tgggtatttc 10140
cgcgatcggt gaaagaggca agcctgtatt agcctttttt gaaggtgtat cccatgccat 10200
gttccacgtt gtaaaccttg tgatgaaagt ggcgccattc ggcgttttcg ctcttatcgg 10260
agtgactgtg tctaaattcg gactcggttc tcttatctct ctcggaaagc tcgtcggatt 10320
ggtttatgtc gcgcttgctt tcttcttaat tgttattttc gggattgtcg caaaaattgc 10380
cggcatcagc atcttcaagt tccttgctta catgaaggac gaaatcttac tggcgttcag 10440
tacgtccagc tctgaaacgg ttcttccgcg tatcatgg 10478
<210> 28
<211> 7549
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 28
cacgataata tccattgttc tcacggaagc acacgcaggt catttgaacg aattttttcg 60
acaggaattt gccgggactc aggagcattt aacctaaaaa agcatgacat ttcagcataa 120
tgaacattta ctcatgtcta ttttcgttct tttctgtatg aaaatagtta tttcgagtct 180
ctacggaaat agcgagagat gatataccta aatagagata aaatcatctc aaaaaaatgg 240
gtctactaaa atattattcc atctattaca ataaattcac agaatagtct tttaagtaag 300
tctactctga atttttttaa aaggagaggg taaagagtgt caacaacata tcctattgtc 360
ctggtacacg gcctttctgg tttcgatgac atcgtaggat acccttattt ttatgggatt 420
gccgacgccc tggagaaaga tggccacaaa gtttttacag cctcactctc tgcattcaat 480
tccaacgaag tccgtggcga gcaattatgg gagttcgtgc aaaagattct caaagagact 540
aaagcaaaaa aggtgaattt gatcgggcac tcccaaggtc ctcttgcgtg tcgttatgtg 600
gcggccaagc atgctaaaag tattgcaagt gttacatctg tgaatggagt gaatcacggt 660
agcgaaatcg ccgatcttgt cagacggatt atgagaaaag attctgtccc tgagtatatc 720
gcggacgcgg taatgaaggc tattggcact ataatcagta cttttagcgg aaatagagga 780
aaccctcaag acgctatagc agctctggag gccttaacga cggaaaacgt gatggaattt 840
aacaaaaaat atcctcaggg actgccagca attcgtgggg gtgaaggtaa agaagtcgtg 900
aacggcgtac actactatag ctttggttct tacatacagg gtctcatcgc tggcgagaag 960
ggaaacttgc tcgatcctac ccacgccgct atgcgcgttt tatccgcgtt tttttcagaa 1020
cgtgagaacg atggtttagt aggacggact tcaatgcggc tcggcaagtt aattaaagac 1080
gactacgctg aggatcattt agatatggtc aatcaagttg cggggttagt tggacgcggg 1140
gaggatataa ttgctatata tacgaatcat gccaattttt tagcgtcaaa aaagctctaa 1200
tctagataca taaaaaaccg gccttggccc cgccggtttt ttattatttt tcttcctccg 1260
catgttcaat ccgctccata atcgacggat ggctccctct gaaaatttta acgagaaacg 1320
gcgggttgac ccggctcagt cccgtaacgg ccaagtcctg aaacgtctca atcgccgctt 1380
cccggtttcc ggtcagctca atgccgtaac ggtcggcggc gttttcctga taccgggaga 1440
cggcattcgt aatcaacgcc tcactcctca catcaacccg ttacttctat tgtaatcata 1500
aattcaaatt cttagaacca agctgtgttc cgcacttttc caccctttta agcatggaaa 1560
ccccgatcgc tgggaaaact aacaatgttt ggagtgatgc aaatgaaaaa aatagtggca 1620
gccatcgtgg taatcggtct tgtgtttatc gcattttttt atctttacag ccgatcaggc 1680
gatgtgtatc aatcggtaga cgcggatttg atcacactgt cttcaagcgg ccaggaagat 1740
atcgagattg aaaaaagaca gcacgtcaaa gatatgctgg atattatgaa tcagggaaaa 1800
caggtgaaga cagaaaaaac atcagcccct gattacgaag ggacaatcaa gtttcataaa 1860
gaccggtatg actcattcag actatggatt gacggcagcc agcaagccgt ttttttgaag 1920
gatggcacat actacaaatt aagcaaaaat gatacaaagg cgctgctaaa tattattaaa 1980
aaagaagcaa aggattgaaa atgaaaaagc gaagctaacc gcttcgcttt ttcattttat 2040
tggggcaaaa tatctctcag tgcccgtctg agcattttcc ccgtcgcatt tttcggaata 2100
tcgtcaagaa acgtaatggc ggcaggccgc ttgtattttg ccagatgctt ttcgcagtgc 2160
tgcatgatgt cctcctctgt taccccagag cgtttcggca ccacatatcc ctttaccgct 2220
tccccgcttt gggggtccgg cacgccgatg acaaccgcct ccttgacgtc cggatggctg 2280
tacagcacct cctccacctc ccgcggatac acattgtatc ctcctacaat gatcatgtct 2340
tttttccggt caacaatgta aaaatagccg tcctcatccc gtcttgccaa gtcccccgta 2400
taaagccacc cgtcttttaa tgcatgctct gtttccatcg gcattttata atagcccttc 2460
atcacattgg ggcctttcac gatcaattcg ccgacctggt gagcgggcag ctcgcgtccg 2520
agcggatcta cgaccttgtt ttcgacatgt aagatacttg tcccgatgga gcccggcttt 2580
ctgcccctgt caaacgggtt aaagcacgtg acgggtgatg cttccgagag cccgtagcct 2640
tccaaaatgg taacaccgaa tttttcttca aacgccgtca gcaacgcgac tggcatggac 2700
gcgcctcccg aaatgcacag ccggatcgaa gaaaaatcat ctttctttcc gttttcatgc 2760
tgaaacaagt agttatacat tgtaggcaca ccggcaaaaa tggtcgcctg ctgctgctta 2820
acaagcttaa aaacagatgc cggactgaat tgaggctcaa tcaatacagt tgcgccgctc 2880
atcagcggtg cattcataca gacggttaaa caaaacacgt gaaacatggg aagagcgcag 2940
accacattgt ccctctcatc cattcccaaa tagcctgcga catcgttggc attgctgtac 3000
aaattctgat gtgtcagcat cgcgcctttc ggttttccag tcgttcctga cgtatataaa 3060
ataaccgcgg tatcatcagg tacaggttct tggttttgtt tagcggcaga tgtcggccgc 3120
aatatttttg caaacgttgt cattttcatc ctgacctctg ggtccgcagc ttccggctcg 3180
gcctcccccg tctggcataa aatgacgagc tcaacctttg gcagcgattc atgcatgctc 3240
tcataaagcg gcaaaagctg gctaacgccc acgattgcct ttacatcgcc atttgtcagc 3300
atataaccaa tttctgtcgg cgtgtacaac ggattgatgg gaacaactac gatcccagct 3360
tttaaagcgc caaaaaacgc gatgataaaa tcaggcgaat tgccaagcag caaagctaaa 3420
tggtcccctt tctccatacc ggcttcctga aggccgtccg caaatcgctg aatatattca 3480
ttcagctctt gatacgtcat catgtgatct ttaaacctgc atgcgatgct gtcgggcttc 3540
tcagatgctg tttcttccaa ttttgaaaca agattcattc tcccacccct taagtgaatg 3600
aatagtcatt cattattgaa gccaagcttt cttctccatt atagagaaac agaaaaaaac 3660
actcaagagc aaaaagccct gagtgtcagt actgtcatag tttcttcaat gcttcggcaa 3720
tcggcgtatc tccttctgtc agatcaaagg cccgattttc cgtattcttc tcatctaaag 3780
aggcaatgac cgtttttgca acgtcatcac gggaaataaa tccccgctcc agatccttcg 3840
ctgctgaaac agttcccgtt ccaggctcat tgcgaaggcc tcccggacgg ataatcgtat 3900
aggttaaacc gctcgcttcc agaattttat cagcataatg cttggccaca taataaggct 3960
tgagtgcctc attccaattt tcacggttat gggcttgcag ggcgctgacc ataataaacc 4020
gtttgattcc ggcaatggcc gcagcttcaa tggcttttgc cgctccatca agatccacca 4080
gcagcgtttt atcatagcct gtgctgccgc cggaaccggc tgtgaaaatg atcgcgtcac 4140
aaccttttgc cgcagcggcg atttcttccg ggctgccctc cagattcgca agcacagctt 4200
ctgcaccggc agcttcaaga gacgctttct gttcttcttt tctgaccatc gctctgatgg 4260
aatgatcagg attatcttgg aataaagaga cgagtctttg cccgatttgt ccgttcgctc 4320
cgattaaaaa cactttcatg tgaatccctc ctgcctccat tatttcaaaa acacaaccgc 4380
tctttcaaac gatgtgtttt gccttagtaa atcagatcaa ggaaatcctc tttcgtaatg 4440
ttcccaaagt aatgcttgag attcacacct tcgagcacat cagcgatgac gctgcgttcg 4500
tattgttttc cgaccagcag gttttcaatt tcagatacat caccgacacc gaagaaatct 4560
ccgaagattt tgcagtcctc gattttgcct ttcttgactt ccaggtgcaa atcgatcgat 4620
ccaaccggat aacgcttcga atgattaagg ttaaattttg gtgagcggcc gtagttccaa 4680
tcccaattct gatagcgctc tttcgaaatt tgatgaatgg tctcccaatc tttttccgtc 4740
agcttatact ccggcacgtt tccaacgtcg tttgtgttaa aaatatggcg aagcaaatgg 4800
ctgcggaatt cttcggtggt cattttatca tcgagaaact cactgatgtt tgccactcgg 4860
cttctgatcg atttgatgcc ttttgattca attttatcct ttttcacctt taatgctgat 4920
acaacatgat caatggctga atcaaacatg agggtgccgt ggctgaaaat acggcctttc 4980
gttgcaaact gagcgtttcc ggatattttc cggccatcta ctacaatgtc gttccggccg 5040
cttaattcgg cttcaacccc aagctgatgt aacgcctgaa tcactggctc agtgaatttt 5100
ttaaagttat gaaagctgtc cccgtcatcc ttggtaataa agctgaagtt caagttcccc 5160
agatcatggt acacagcgcc cccgcctgat aaacggcgga cgacgataat cccgttttcc 5220
tcaacatatt ttgtattgat ttcttctatt gtattttggt ttttcccaat gataatagac 5280
ggttgattca cataaaagag caaatattgc tgttcagggt ctaaatgctt tacacagtac 5340
tcctcgatag caagattgat ccgcggatca ttgatatttt gattgtctat aaataacatg 5400
gtgctcctcc tttatccttc ccacacaaaa cctgatttcg caatattcac ttctccgtta 5460
aaaacggttt tcgcttcttt gcgaaggttg tcatgcacgc caaaatgcgg caaatgtgtc 5520
agcagcagtt ctcccgctcc ggcttctttt gcaatgcgcc cagcttccag gctgttcata 5580
tggcctgcac ttgttccgtc ttgatcggca taaaaattgc attctgagat caataaatca 5640
gcatctttcg aaaacggtat aaatgaatcc tgatagctgg aatcagcagt ataaacgaca 5700
gtgtggctgc cgtcagtaat ccgcatggca tagcacgtca ccgggtgaat cgtttttaaa 5760
aaggtgatcg taaacggacc ggcagtcagc ggctgatccg gctgataggc gatccctttt 5820
gtatgtgttt tatatgtaag cttttgaaac tgttctatat cagcatcatg tccgtaaatc 5880
ggaagcgtat gctctccttt gccgagaaac gaaccgactt gcttggcaaa ttgcagcggt 5940
ccgatatcag cgatatggtc atggtgataa tgagacagaa cgaccgcatc cagcttttcc 6000
gccggcacat atccgaacag cttagacaat acggcactgc cgcaatcaac aagcagagag 6060
taatcacctg actgaaacaa atagcctgac gtcgcttcat ttgcggccgg aaaaccgcca 6120
tagcatccga taactgtaac tttcataatg tcctcctatc ttttcaaaaa aattggtcct 6180
ccttcaatat acccattttt cttgaaaaaa gcatgtttta aacattgtat caaaacagtt 6240
attgattttt gtaatctgtt atattacaat gaaatcacta caaaggggaa agagggattg 6300
gttatgctgg ggaaaatcac agaatttttt agaaacctgc cttcgaaaaa gtgtgcggaa 6360
tgcggaaaaa agatagaaga gcagcatgag tgttatggta atatctgcaa tgactgtata 6420
aaagtaaacg atttgtaatg agcgaaaatc ccgcgcctta cgcgtgggat tttcttattt 6480
tttcacatat ctcttaattt tgaaataata gtcaggttag gtcaaagctc acctgttttt 6540
agataattct ggtgattatc ataatgtcat tgaatattct ttattttcga aatataattt 6600
actatagacg aattgatttc ttatctatta taatttgatc taatagtgag attaaatata 6660
tgtctattca tgatatatgt tgatactttg ttttttggga ggtaatctat gaaaagaatt 6720
aagtttggat tagccacaca aatattcgtt ggacttattc taggtgtcat tgttggcgtc 6780
atttggtatg gcaacccagc attgcctact tacctgcagc caatcgggga tctcttttta 6840
cgcttaatca aaatgatagt gattcctatt gttgtctcca gcttaatcat cggtgtagcc 6900
ggtgcaggaa atggaaagca agtcggtaaa ttaggcttca gaacgattct gtacttcgag 6960
atcatcacga cttttgccat tattctcgga ctagcccttg caaacatctt ccatccgggt 7020
acaggagtta atatacacga agctcaaaaa tcggacatca gtcaatatgt tgaaactgaa 7080
aaagaacaaa gtaataaatc agtggcggaa acgttcctcc atattgtgcc gacaaacttc 7140
ttccagtcat tggtcgaagg ggatcttcta gccatcatct gctttacagt actatttgca 7200
ttgggtattt ccgcgatcgg tgaaagaggc aagcctgtat tagccttttt tgaaggtgta 7260
tcccatgcca tgttccacgt tgtaaacctt gtgatgaaag tggcgccatt cggcgttttc 7320
gctcttatcg gagtgactgt gtctaaattc ggactcggtt ctcttatctc tctcggaaag 7380
ctcgtcggat tggtttatgt cgcgcttgct ttcttcttaa ttgttatttt cgggattgtc 7440
gcaaaaattg ccggcatcag catcttcaag ttccttgctt acatgaagga cgaaatctta 7500
ctggcgttca gtacgtccag ctctgaaacg gttcttccgc gtatcatgg 7549
<210> 29
<211> 2596
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 29
gctatcaaaa taacagactc gtgattttcc aaacgagctt tcaaaaaagc ctctgcccct 60
tgcaaatcgg atgcctgtct ataaaattcc cgatattggt taaacagcgg cgcaatggcg 120
gccgcatctg atgtctttgc ttggcgaatg ttcatcttat ttcttcctcc ctctcaataa 180
ttttttcatt ctatcccttt tctgtaaagt ttatttttca gaatactttt atcatcatgc 240
tttgaaaaaa tatcacgata atatccattg ttctcacgga agcacacgcg ctgataaaca 300
gctgacatca actaaaagtt tcattaaata ctttgaaaaa agttgttgac ttaaaagaag 360
ctaaatgtta tagtaattgt acagaatagt cttttaagta agtctactct gaattttttt 420
aaaaggagag ggtaaagagt gagaagcaaa aaattgtgga tcagcttgtt gtttgcgtta 480
acgttaatct ttacgatggc gttcagcaac atgtctgcgc aggctgctga agaagcaaaa 540
gaaaaatatt taattggctt taatgagcag gaagctgtca gtgagtttgt agaacaagta 600
gaggcaaatg acgaggtcgc cattctctct gaggaagagg aagtcgaaat tgaattgctt 660
catgaatttg aaacgattcc tgttttatcc gttgagttaa gcccagaaga tgtggacgcg 720
cttgaactcg atccagcgat ttcttatatt gaagaggatg cagaagtaac gacaatgcaa 780
caaacagtgc catggggaat tactcgtgtg caagccccag ctgttcataa ccgtggaatt 840
acaggttctg gtgtaagagt tgctatcctc gattcaggta tttccacaca tgaagactta 900
aatgttcgtg gtggcgttag ctttgtacca ggggaaccaa cgtatgctga tttaaatggg 960
catggcacgc atgtggctgg gacggtagct gctttaaaca attcgattgg cgttgttggc 1020
gtagcaccgt cagcggatct atacgctgtt aaagtattag gggcgaatgg tagaggttcg 1080
gtcagcggga ttgcccaagg attggaatgg gcagcacaaa ataacatgca cattgctaat 1140
atgagtttag gaacagatgc accaagttct acacttgagc gtgctgttaa ttatgcgact 1200
tctagagatg ttcttgttat tgcggcaact gggaataacg gttctggctc agtaggctat 1260
ccggcccgtt atgcgaacgc aatggcagtc ggagctactg accaaaacaa cagacgcgcc 1320
aacttttcac agtatggcac ggggattgac attgtcgcac caggtgtaaa cgtgcagagc 1380
acatacccag gtaaccgtta tgtgagcatg aacggtacat cgatggctac tcctcatgtt 1440
gcaggtgcag cagcccttgt taaacaacgc tatccatctt ggaatgcgac tcaaatccgc 1500
gaccatctaa agaatacggc aacgaattta ggaaactctt cacaatttgg aagcggactt 1560
gtcaatgcag aagcggcaac acgctaatct agatacataa aaaaccggcc ttggccccgc 1620
cggtttttta ttatttttct tcctccgcat gttcaatccg ctccataatc gacggatggc 1680
tccctctgaa aattttaacg agaaacggcg ggttgacccg gctcagtccc gtaacggcca 1740
agtcctgaaa cgtctcaatc gccgcttccc ggtttccggt cagctcaatg ccgtaacggt 1800
cggcggcgtt ttcctgatac cgggagacgg cattcgtaat caacgcctca ctcctcacat 1860
caacccgtta cttctattgt aatcataaat tcaaattctt agaaccaagc tgtgttccgc 1920
acttttccac ccttttaagc atggaaaccc cgatcgctgg gaaaactaac aatgtttgga 1980
gtgatgcaaa tgaaaaaaat agtggcagcc atcgtggtaa tcggtcttgt gtttatcgca 2040
tttttttatc tttacagccg atcaggcgat gtgtatcaat cggtagacgc ggatttgatc 2100
acactgtctt caagcggcca ggaagatatc gagattgaaa aaagacagca cgtcaaagat 2160
atgctggata ttatgaatca gggaaaacag gtgaagacag aaaaaacatc agcccctgat 2220
tacgaaggga caatcaagtt tcataaagac cggtatgact cattcagact atggattgac 2280
ggcagccagc aagccgtttt tttgaaggat ggcacatact acaaattaag caaaaatgat 2340
acaaaggcgc tgctaaatat tattaaaaaa gaagcaaagg attgaaaatg aaaaagcgaa 2400
gctaaccgct tcgctttttc attttattgg ggcaaaatat ctctcagtgc ccgtctgagc 2460
attttccccg tcgcattttt cggaatatcg tcaagaaacg taatggcggc aggccgcttg 2520
tattttgcca gatgcttttc gcagtgctgc atgatgtcct cctctgttac cccagagcgt 2580
ttcggcacca catatc 2596
<210> 30
<211> 4133
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 30
gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60
ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120
ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180
ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240
gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300
catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360
cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420
gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480
ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540
tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600
cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660
cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720
gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780
cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840
tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900
gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 960
cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt aagtctactc 1020
tgaatttttt taaaaggaga gggtaaagag tgagaagcaa aaaattgtgg atcagcttgt 1080
tgtttgcgtt aacgttaatc tttacgatgg cgttcagcaa catgtctgcg caggctgctg 1140
aagaagcaaa agaaaaatat ttaattggct ttaatgagca ggaagctgtc agtgagtttg 1200
tagaacaagt agaggcaaat gacgaggtcg ccattctctc tgaggaagag gaagtcgaaa 1260
ttgaattgct tcatgaattt gaaacgattc ctgttttatc cgttgagtta agcccagaag 1320
atgtggacgc gcttgaactc gatccagcga tttcttatat tgaagaggat gcagaagtaa 1380
cgacaatgca acaaacagtg ccatggggaa ttactcgtgt gcaagcccca gctgttcata 1440
accgtggaat tacaggttct ggtgtaagag ttgctatcct cgattcaggt atttccacac 1500
atgaagactt aaatgttcgt ggtggcgtta gctttgtacc aggggaacca acgtatgctg 1560
atttaaatgg gcatggcacg catgtggctg ggacggtagc tgctttaaac aattcgattg 1620
gcgttgttgg cgtagcaccg tcagcggatc tatacgctgt taaagtatta ggggcgaatg 1680
gtagaggttc ggtcagcggg attgcccaag gattggaatg ggcagcacaa aataacatgc 1740
acattgctaa tatgagttta ggaacagatg caccaagttc tacacttgag cgtgctgtta 1800
attatgcgac ttctagagat gttcttgtta ttgcggcaac tgggaataac ggttctggct 1860
cagtaggcta tccggcccgt tatgcgaacg caatggcagt cggagctact gaccaaaaca 1920
acagacgcgc caacttttca cagtatggca cggggattga cattgtcgca ccaggtgtaa 1980
acgtgcagag cacataccca ggtaaccgtt atgtgagcat gaacggtaca tcgatggcta 2040
ctcctcatgt tgcaggtgca gcagcccttg ttaaacaacg ctatccatct tggaatgcga 2100
ctcaaatccg cgaccatcta aagaatacgg caacgaattt aggaaactct tcacaatttg 2160
gaagcggact tgtcaatgca gaagcggcaa cacgctaatc tagatacata aaaaaccggc 2220
cttggccccg ccggtttttt attatttttc ttcctccgca tgttcaatcc gctccataat 2280
cgacggatgg ctccctctga aaattttaac gagaaacggc gggttgaccc ggctcagtcc 2340
cgtaacggcc aagtcctgaa acgtctcaat cgccgcttcc cggtttccgg tcagctcaat 2400
gccgtaacgg tcggcggcgt tttcctgata ccgggagacg gcattcgtaa tcaacgcctc 2460
actcctcaca tcaacccgtt acttctattg taatcataaa ttcaaattct tagaaccaag 2520
ctgtgttccg cacttttcca cccttttaag catggaaacc ccgatcgctg ggaaaactaa 2580
caatgtttgg agtgatgcaa atgaaaaaaa tagtggcagc catcgtggta atcggtcttg 2640
tgtttatcgc atttttttat ctttacagcc gatcaggcga tgtgtatcaa tcggtagacg 2700
cggatttgat cacactgtct tcaagcggcc aggaagatat cgagattgaa aaaagacagc 2760
acgtcaaaga tatgctggat attatgaatc agggaaaaca ggtgaagaca gaaaaaacat 2820
cagcccctga ttacgaaggg acaatcaagt ttcataaaga ccggtatgac tcattcagac 2880
tatggattga cggcagccag caagccgttt ttttgaagga tggcacatac tacaaattaa 2940
gcaaaaatga tacaaaggcg ctgctaaata ttattaaaaa agaagcaaag gattgaaaat 3000
gaaaaagcga agctaaccgc ttcgcttttt cattttattg gggcaaaata tctctcagtg 3060
cccgtctgag cattttcccc gtcgcatttt tcggaatatc gtcaagaaac gtaatggcgg 3120
caggccgctt gtattttgcc agatgctttt cgcagtgctg catgatgtcc tcctctgtta 3180
ccccagagcg tttcggcacc acatatccct ttaccgcttc cccgctttgg gggtccggca 3240
cgccgatgac aaccgcctcc ttgacgtccg gatggctgta cagcacctcc tccacctccc 3300
gcggatacac attgtatcct cctacaatga tcatgtcttt tttccggtca acaatgtaaa 3360
aatagccgtc ctcatcccgt cttgccaagt cccccgtata aagccacccg tcttttaatg 3420
catgctctgt ttccatcggc attttataat agcccttcat cacattgggg cctttcacga 3480
tcaattcgcc gacctggtga gcgggcagct cgcgtccgag cggatctacg accttgtttt 3540
cgacatgtaa gatacttgtc ccgatggagc ccggctttct gcccctgtca aacgggttaa 3600
agcacgtgac gggtgatgct tccgagagcc cgtagccttc caaaatggta acaccgaatt 3660
tttcttcaaa cgccgtcagc aacgcgactg gcatggacgc gcctcccgaa atgcacagcc 3720
ggatcgaaga aaaatcatct ttctttccgt tttcatgctg aaacaagtag ttatacattg 3780
taggcacacc ggcaaaaatg gtcgcctgct gctgcttaac aagcttaaaa acagatgccg 3840
gactgaattg aggctcaatc aatacagttg cgccgctcat cagcggtgca ttcatacaga 3900
cggttaaaca aaacacgtga aacatgggaa gagcgcagac cacattgtcc ctctcatcca 3960
ttcccaaata gcctgcgaca tcgttggcat tgctgtacaa attctgatgt gtcagcatcg 4020
cgcctttcgg ttttccagtc gttcctgacg tatataaaat aaccgcggta tcatcaggta 4080
caggttcttg gttttgttta gcggcagatg tcggccgcaa tatttttgca aac 4133
<210> 31
<211> 5423
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 31
gcaaaacgcg gatcattgga agagacgacc gtacccgcag catcaatgcc taaaataagc 60
ggatactctc tgacgatatt gcctcctgct tttccggcca gaccatcttt gtaattaatg 120
ccggaataag caactttaat caggacacca tccttcggca aatcctctgt tgatatggtt 180
ttcacatgga ctgaaacatc atcggcattt ttttctgcct gcaaggcttg aaataacgtt 240
gacattcggc acactccttt tcatttatat cgtaaccgaa gaacgttcaa aaaaccaaat 300
catcaagccg ccattttcac ttcgccggca cattgagaca ataatggaca aatccggtat 360
cctcttcata gccgttttgc tcatacaagc ttcttgcctt ccggttgtgg tgctcagtct 420
gaagtgttaa acattttgcc ccgttttgcc ctgcataatc ctttgcggca gaaagcagcc 480
ggccgccggc tccctttgta cgcgcatgag gaacgacaaa taagtcattt aatatgtata 540
tccttttcat tgacacagaa gaaaacgttg gatagagctg ggtaaagcct atgaattctc 600
cattttcttc tgctatcaaa ataacagact cgtgattttc caaacgagct ttcaaaaaag 660
cctctgcccc ttgcaaatcg gatgcctgtc tataaaattc ccgatattgg ttaaacagcg 720
gcgcaatggc ggccgcatct gatgtctttg cttggcgaat gttcatctta tttcttcctc 780
cctctcaata attttttcat tctatccctt ttctgtaaag tttatttttc agaatacttt 840
tatcatcatg ctttgaaaaa atatcacgat aatatccatt gttctcacgg aagcacacgc 900
gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 960
cttaaaagaa gctaaatgtt atagtaattg tacagaatag tcttttaagt aagtctactc 1020
tgaatttttt taaaaggaga gggtaaagag tgagaagcaa aaaattgtgg atcagcttgt 1080
tgtttgcgtt aacgttaatc tttacgatgg cgttcagcaa catgtctgcg caggctgctg 1140
aagaagcaaa agaaaaatat ttaattggct ttaatgagca ggaagctgtc agtgagtttg 1200
tagaacaagt agaggcaaat gacgaggtcg ccattctctc tgaggaagag gaagtcgaaa 1260
ttgaattgct tcatgaattt gaaacgattc ctgttttatc cgttgagtta agcccagaag 1320
atgtggacgc gcttgaactc gatccagcga tttcttatat tgaagaggat gcagaagtaa 1380
cgacaatgca acaaacagtg ccatggggaa ttactcgtgt gcaagcccca gctgttcata 1440
accgtggaat tacaggttct ggtgtaagag ttgctatcct cgattcaggt atttccacac 1500
atgaagactt aaatgttcgt ggtggcgtta gctttgtacc aggggaacca acgtatgctg 1560
atttaaatgg gcatggcacg catgtggctg ggacggtagc tgctttaaac aattcgattg 1620
gcgttgttgg cgtagcaccg tcagcggatc tatacgctgt taaagtatta ggggcgaatg 1680
gtagaggttc ggtcagcggg attgcccaag gattggaatg ggcagcacaa aataacatgc 1740
acattgctaa tatgagttta ggaacagatg caccaagttc tacacttgag cgtgctgtta 1800
attatgcgac ttctagagat gttcttgtta ttgcggcaac tgggaataac ggttctggct 1860
cagtaggcta tccggcccgt tatgcgaacg caatggcagt cggagctact gaccaaaaca 1920
acagacgcgc caacttttca cagtatggca cggggattga cattgtcgca ccaggtgtaa 1980
acgtgcagag cacataccca ggtaaccgtt atgtgagcat gaacggtaca tcgatggcta 2040
ctcctcatgt tgcaggtgca gcagcccttg ttaaacaacg ctatccatct tggaatgcga 2100
ctcaaatccg cgaccatcta aagaatacgg caacgaattt aggaaactct tcacaatttg 2160
gaagcggact tgtcaatgca gaagcggcaa cacgctaatc tagatacata aaaaaccggc 2220
cttggccccg ccggtttttt attatttttc ttcctccgca tgttcaatcc gctccataat 2280
cgacggatgg ctccctctga aaattttaac gagaaacggc gggttgaccc ggctcagtcc 2340
cgtaacggcc aagtcctgaa acgtctcaat cgccgcttcc cggtttccgg tcagctcaat 2400
gccgtaacgg tcggcggcgt tttcctgata ccgggagacg gcattcgtaa tcaacgcctc 2460
actcctcaca tcaacccgtt acttctattg taatcataaa ttcaaattct tagaaccaag 2520
ctgtgttccg cacttttcca cccttttaag catggaaacc ccgatcgctg ggaaaactaa 2580
caatgtttgg agtgatgcaa atgaaaaaaa tagtggcagc catcgtggta atcggtcttg 2640
tgtttatcgc atttttttat ctttacagcc gatcaggcga tgtgtatcaa tcggtagacg 2700
cggatttgat cacactgtct tcaagcggcc aggaagatat cgagattgaa aaaagacagc 2760
acgtcaaaga tatgctggat attatgaatc agggaaaaca ggtgaagaca gaaaaaacat 2820
cagcccctga ttacgaaggg acaatcaagt ttcataaaga ccggtatgac tcattcagac 2880
tatggattga cggcagccag caagccgttt ttttgaagga tggcacatac tacaaattaa 2940
gcaaaaatga tacaaaggcg ctgctaaata ttattaaaaa agaagcaaag gattgaaaat 3000
gaaaaagcga agctaaccgc ttcgcttttt cattttattg gggcaaaata tctctcagtg 3060
cccgtctgag cattttcccc gtcgcatttt tcggaatatc gtcaagaaac gtaatggcgg 3120
caggccgctt gtattttgcc agatgctttt cgcagtgctg catgatgtcc tcctctgtta 3180
ccccagagcg tttcggcacc acatatccct ttaccgcttc cccgctttgg gggtccggca 3240
cgccgatgac aaccgcctcc ttgacgtccg gatggctgta cagcacctcc tccacctccc 3300
gcggatacac attgtatcct cctacaatga tcatgtcttt tttccggtca acaatgtaaa 3360
aatagccgtc ctcatcccgt cttgccaagt cccccgtata aagccacccg tcttttaatg 3420
catgctctgt ttccatcggc attttataat agcccttcat cacattgggg cctttcacga 3480
tcaattcgcc gacctggtga gcgggcagct cgcgtccgag cggatctacg accttgtttt 3540
cgacatgtaa gatacttgtc ccgatggagc ccggctttct gcccctgtca aacgggttaa 3600
agcacgtgac gggtgatgct tccgagagcc cgtagccttc caaaatggta acaccgaatt 3660
tttcttcaaa cgccgtcagc aacgcgactg gcatggacgc gcctcccgaa atgcacagcc 3720
ggatcgaaga aaaatcatct ttctttccgt tttcatgctg aaacaagtag ttatacattg 3780
taggcacacc ggcaaaaatg gtcgcctgct gctgcttaac aagcttaaaa acagatgccg 3840
gactgaattg aggctcaatc aatacagttg cgccgctcat cagcggtgca ttcatacaga 3900
cggttaaaca aaacacgtga aacatgggaa gagcgcagac cacattgtcc ctctcatcca 3960
ttcccaaata gcctgcgaca tcgttggcat tgctgtacaa attctgatgt gtcagcatcg 4020
cgcctttcgg ttttccagtc gttcctgacg tatataaaat aaccgcggta tcatcaggta 4080
caggttcttg gttttgttta gcggcagatg tcggccgcaa tatttttgca aacgttgtca 4140
ttttcatcct gacctctggg tccgcagctt ccggctcggc ctcccccgtc tggcataaaa 4200
tgacgagctc aacctttggc agcgattcat gcatgctctc ataaagcggc aaaagctggc 4260
taacgcccac gattgccttt acatcgccat ttgtcagcat ataaccaatt tctgtcggcg 4320
tgtacaacgg attgatggga acaactacga tcccagcttt taaagcgcca aaaaacgcga 4380
tgataaaatc aggcgaattg ccaagcagca aagctaaatg gtcccctttc tccataccgg 4440
cttcctgaag gccgtccgca aatcgctgaa tatattcatt cagctcttga tacgtcatca 4500
tgtgatcttt aaacctgcat gcgatgctgt cgggcttctc agatgctgtt tcttccaatt 4560
ttgaaacaag attcattctc ccacccctta agtgaatgaa tagtcattca ttattgaagc 4620
caagctttct tctccattat agagaaacag aaaaaaacac tcaagagcaa aaagccctga 4680
gtgtcagtac tgtcatagtt tcttcaatgc ttcggcaatc ggcgtatctc cttctgtcag 4740
atcaaaggcc cgattttccg tattcttctc atctaaagag gcaatgaccg tttttgcaac 4800
gtcatcacgg gaaataaatc cccgctccag atccttcgct gctgaaacag ttcccgttcc 4860
aggctcattg cgaaggcctc ccggacggat aatcgtatag gttaaaccgc tcgcttccag 4920
aattttatca gcataatgct tggccacata ataaggcttg agtgcctcat tccaattttc 4980
acggttatgg gcttgcaggg cgctgaccat aataaaccgt ttgattccgg caatggccgc 5040
agcttcaatg gcttttgccg ctccatcaag atccaccagc agcgttttat catagcctgt 5100
gctgccgccg gaaccggctg tgaaaatgat cgcgtcacaa ccttttgccg cagcggcgat 5160
ttcttccggg ctgccctcca gattcgcaag cacagcttct gcaccggcag cttcaagaga 5220
cgctttctgt tcttcttttc tgaccatcgc tctgatggaa tgatcaggat tatcttggaa 5280
taaagagacg agtctttgcc cgatttgtcc gttcgctccg attaaaaaca ctttcatgtg 5340
aatccctcct gcctccatta tttcaaaaac acaaccgctc tttcaaacga tgtgttttgc 5400
cttagtaaat cagatcaagg aaa 5423
<210> 32
<211> 6198
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 32
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcgctga taaacagctg acatcaacta aaagtttcat 3000
taaatacttt gaaaaaagtt gttgacttaa aagaagctaa atgttatagt aattgtacag 3060
aatagtcttt taagtaagtc tactctgaat ttttttaaaa ggagagggta aagagtgaga 3120
agcaaaaaat tgtggatcag cttgttgttt gcgttaacgt taatctttac gatggcgttc 3180
agcaacatgt ctgcgcaggc tgctgaagaa gcaaaagaaa aatatttaat tggctttaat 3240
gagcaggaag ctgtcagtga gtttgtagaa caagtagagg caaatgacga ggtcgccatt 3300
ctctctgagg aagaggaagt cgaaattgaa ttgcttcatg aatttgaaac gattcctgtt 3360
ttatccgttg agttaagccc agaagatgtg gacgcgcttg aactcgatcc agcgatttct 3420
tatattgaag aggatgcaga agtaacgaca atgcaacaaa cagtgccatg gggaattact 3480
cgtgtgcaag ccccagctgt tcataaccgt ggaattacag gttctggtgt aagagttgct 3540
atcctcgatt caggtatttc cacacatgaa gacttaaatg ttcgtggtgg cgttagcttt 3600
gtaccagggg aaccaacgta tgctgattta aatgggcatg gcacgcatgt ggctgggacg 3660
gtagctgctt taaacaattc gattggcgtt gttggcgtag caccgtcagc ggatctatac 3720
gctgttaaag tattaggggc gaatggtaga ggttcggtca gcgggattgc ccaaggattg 3780
gaatgggcag cacaaaataa catgcacatt gctaatatga gtttaggaac agatgcacca 3840
agttctacac ttgagcgtgc tgttaattat gcgacttcta gagatgttct tgttattgcg 3900
gcaactggga ataacggttc tggctcagta ggctatccgg cccgttatgc gaacgcaatg 3960
gcagtcggag ctactgacca aaacaacaga cgcgccaact tttcacagta tggcacgggg 4020
attgacattg tcgcaccagg tgtaaacgtg cagagcacat acccaggtaa ccgttatgtg 4080
agcatgaacg gtacatcgat ggctactcct catgttgcag gtgcagcagc ccttgttaaa 4140
caacgctatc catcttggaa tgcgactcaa atccgcgacc atctaaagaa tacggcaacg 4200
aatttaggaa actcttcaca atttggaagc ggacttgtca atgcagaagc ggcaacacgc 4260
taatctagat acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4320
ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4380
acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4440
cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 4500
agacggcatt cgtaatcaac gcctcactcc tcacatcaac ccgttacttc tattgtaatc 4560
ataaattcaa attcttagaa ccaagctgtg ttccgcactt ttccaccctt ttaagcatgg 4620
aaaccccgat cgctgggaaa actaacaatg tttggagtga tgcaaatgaa aaaaatagtg 4680
gcagccatcg tggtaatcgg tcttgtgttt atcgcatttt tttatcttta cagccgatca 4740
ggcgatgtgt atcaatcggt agacgcggat ttgatcacac tgtcttcaag cggccaggaa 4800
gatatcgaga ttgaaaaaag acagcacgtc aaagatatgc tggatattat gaatcaggga 4860
aaacaggtga agacagaaaa aacatcagcc cctgattacg aagggacaat caagtttcat 4920
aaagaccggt atgactcatt cagactatgg attgacggca gccagcaagc cgtttttttg 4980
aaggatggca catactacaa attaagcaaa aatgatacaa aggcgctgct aaatattatt 5040
aaaaaagaag caaaggattg aaaatgaaaa agcgaagcta accgcttcgc tttttcattt 5100
tattggggca aaatatctct cagtgcccgt ctgagcattt tccccgtcgc atttttcgga 5160
atatcgtcaa gaaacgtaat ggcggcaggc cgcttgtatt ttgccagatg cttttcgcag 5220
tgctgcatga tgtcctcctc tgttacccca gagcgtttcg gcaccacata tccctttacc 5280
gcttccccgc tttgggggtc cggcacgccg atgacaaccg cctccttgac gtccggatgg 5340
ctgtacagca cctcctccac ctcccgcgga tacacattgt atcctcctac aatgatcatg 5400
tcttttttcc ggtcaacaat gtaaaaatag ccgtcctcat cccgtcttgc caagtccccc 5460
gtataaagcc acccgtcttt taatgcatgc tctgtttcca tcggcatttt ataatagccc 5520
ttcatcacat tggggccttt cacgatcaat tcgccgacct ggtgagcggg cagctcgcgt 5580
ccgagcggat ctacgacctt gttttcgaca tgtaagatac ttgtcccgat ggagcccggc 5640
tttctgcccc tgtcaaacgg gttaaagcac gtgacgggtg atgcttccga gagcccgtag 5700
ccttccaaaa tggtaacacc gaatttttct tcaaacgccg tcagcaacgc gactggcatg 5760
gacgcgcctc ccgaaatgca cagccggatc gaagaaaaat catctttctt tccgttttca 5820
tgctgaaaca agtagttata cattgtaggc acaccggcaa aaatggtcgc ctgctgctgc 5880
ttaacaagct taaaaacaga tgccggactg aattgaggct caatcaatac agttgcgccg 5940
ctcatcagcg gtgcattcat acagacggtt aaacaaaaca cgtgaaacat gggaagagcg 6000
cagaccacat tgtccctctc atccattccc aaatagcctg cgacatcgtt ggcattgctg 6060
tacaaattct gatgtgtcag catcgcgcct ttcggttttc cagtcgttcc tgacgtatat 6120
aaaataaccg cggtatcatc aggtacaggt tcttggtttt gtttagcggc agatgtcggc 6180
cgcaatattt ttgcaaac 6198
<210> 33
<211> 7488
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 33
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcgctga taaacagctg acatcaacta aaagtttcat 3000
taaatacttt gaaaaaagtt gttgacttaa aagaagctaa atgttatagt aattgtacag 3060
aatagtcttt taagtaagtc tactctgaat ttttttaaaa ggagagggta aagagtgaga 3120
agcaaaaaat tgtggatcag cttgttgttt gcgttaacgt taatctttac gatggcgttc 3180
agcaacatgt ctgcgcaggc tgctgaagaa gcaaaagaaa aatatttaat tggctttaat 3240
gagcaggaag ctgtcagtga gtttgtagaa caagtagagg caaatgacga ggtcgccatt 3300
ctctctgagg aagaggaagt cgaaattgaa ttgcttcatg aatttgaaac gattcctgtt 3360
ttatccgttg agttaagccc agaagatgtg gacgcgcttg aactcgatcc agcgatttct 3420
tatattgaag aggatgcaga agtaacgaca atgcaacaaa cagtgccatg gggaattact 3480
cgtgtgcaag ccccagctgt tcataaccgt ggaattacag gttctggtgt aagagttgct 3540
atcctcgatt caggtatttc cacacatgaa gacttaaatg ttcgtggtgg cgttagcttt 3600
gtaccagggg aaccaacgta tgctgattta aatgggcatg gcacgcatgt ggctgggacg 3660
gtagctgctt taaacaattc gattggcgtt gttggcgtag caccgtcagc ggatctatac 3720
gctgttaaag tattaggggc gaatggtaga ggttcggtca gcgggattgc ccaaggattg 3780
gaatgggcag cacaaaataa catgcacatt gctaatatga gtttaggaac agatgcacca 3840
agttctacac ttgagcgtgc tgttaattat gcgacttcta gagatgttct tgttattgcg 3900
gcaactggga ataacggttc tggctcagta ggctatccgg cccgttatgc gaacgcaatg 3960
gcagtcggag ctactgacca aaacaacaga cgcgccaact tttcacagta tggcacgggg 4020
attgacattg tcgcaccagg tgtaaacgtg cagagcacat acccaggtaa ccgttatgtg 4080
agcatgaacg gtacatcgat ggctactcct catgttgcag gtgcagcagc ccttgttaaa 4140
caacgctatc catcttggaa tgcgactcaa atccgcgacc atctaaagaa tacggcaacg 4200
aatttaggaa actcttcaca atttggaagc ggacttgtca atgcagaagc ggcaacacgc 4260
taatctagat acataaaaaa ccggccttgg ccccgccggt tttttattat ttttcttcct 4320
ccgcatgttc aatccgctcc ataatcgacg gatggctccc tctgaaaatt ttaacgagaa 4380
acggcgggtt gacccggctc agtcccgtaa cggccaagtc ctgaaacgtc tcaatcgccg 4440
cttcccggtt tccggtcagc tcaatgccgt aacggtcggc ggcgttttcc tgataccggg 4500
agacggcatt cgtaatcaac gcctcactcc tcacatcaac ccgttacttc tattgtaatc 4560
ataaattcaa attcttagaa ccaagctgtg ttccgcactt ttccaccctt ttaagcatgg 4620
aaaccccgat cgctgggaaa actaacaatg tttggagtga tgcaaatgaa aaaaatagtg 4680
gcagccatcg tggtaatcgg tcttgtgttt atcgcatttt tttatcttta cagccgatca 4740
ggcgatgtgt atcaatcggt agacgcggat ttgatcacac tgtcttcaag cggccaggaa 4800
gatatcgaga ttgaaaaaag acagcacgtc aaagatatgc tggatattat gaatcaggga 4860
aaacaggtga agacagaaaa aacatcagcc cctgattacg aagggacaat caagtttcat 4920
aaagaccggt atgactcatt cagactatgg attgacggca gccagcaagc cgtttttttg 4980
aaggatggca catactacaa attaagcaaa aatgatacaa aggcgctgct aaatattatt 5040
aaaaaagaag caaaggattg aaaatgaaaa agcgaagcta accgcttcgc tttttcattt 5100
tattggggca aaatatctct cagtgcccgt ctgagcattt tccccgtcgc atttttcgga 5160
atatcgtcaa gaaacgtaat ggcggcaggc cgcttgtatt ttgccagatg cttttcgcag 5220
tgctgcatga tgtcctcctc tgttacccca gagcgtttcg gcaccacata tccctttacc 5280
gcttccccgc tttgggggtc cggcacgccg atgacaaccg cctccttgac gtccggatgg 5340
ctgtacagca cctcctccac ctcccgcgga tacacattgt atcctcctac aatgatcatg 5400
tcttttttcc ggtcaacaat gtaaaaatag ccgtcctcat cccgtcttgc caagtccccc 5460
gtataaagcc acccgtcttt taatgcatgc tctgtttcca tcggcatttt ataatagccc 5520
ttcatcacat tggggccttt cacgatcaat tcgccgacct ggtgagcggg cagctcgcgt 5580
ccgagcggat ctacgacctt gttttcgaca tgtaagatac ttgtcccgat ggagcccggc 5640
tttctgcccc tgtcaaacgg gttaaagcac gtgacgggtg atgcttccga gagcccgtag 5700
ccttccaaaa tggtaacacc gaatttttct tcaaacgccg tcagcaacgc gactggcatg 5760
gacgcgcctc ccgaaatgca cagccggatc gaagaaaaat catctttctt tccgttttca 5820
tgctgaaaca agtagttata cattgtaggc acaccggcaa aaatggtcgc ctgctgctgc 5880
ttaacaagct taaaaacaga tgccggactg aattgaggct caatcaatac agttgcgccg 5940
ctcatcagcg gtgcattcat acagacggtt aaacaaaaca cgtgaaacat gggaagagcg 6000
cagaccacat tgtccctctc atccattccc aaatagcctg cgacatcgtt ggcattgctg 6060
tacaaattct gatgtgtcag catcgcgcct ttcggttttc cagtcgttcc tgacgtatat 6120
aaaataaccg cggtatcatc aggtacaggt tcttggtttt gtttagcggc agatgtcggc 6180
cgcaatattt ttgcaaacgt tgtcattttc atcctgacct ctgggtccgc agcttccggc 6240
tcggcctccc ccgtctggca taaaatgacg agctcaacct ttggcagcga ttcatgcatg 6300
ctctcataaa gcggcaaaag ctggctaacg cccacgattg cctttacatc gccatttgtc 6360
agcatataac caatttctgt cggcgtgtac aacggattga tgggaacaac tacgatccca 6420
gcttttaaag cgccaaaaaa cgcgatgata aaatcaggcg aattgccaag cagcaaagct 6480
aaatggtccc ctttctccat accggcttcc tgaaggccgt ccgcaaatcg ctgaatatat 6540
tcattcagct cttgatacgt catcatgtga tctttaaacc tgcatgcgat gctgtcgggc 6600
ttctcagatg ctgtttcttc caattttgaa acaagattca ttctcccacc ccttaagtga 6660
atgaatagtc attcattatt gaagccaagc tttcttctcc attatagaga aacagaaaaa 6720
aacactcaag agcaaaaagc cctgagtgtc agtactgtca tagtttcttc aatgcttcgg 6780
caatcggcgt atctccttct gtcagatcaa aggcccgatt ttccgtattc ttctcatcta 6840
aagaggcaat gaccgttttt gcaacgtcat cacgggaaat aaatccccgc tccagatcct 6900
tcgctgctga aacagttccc gttccaggct cattgcgaag gcctcccgga cggataatcg 6960
tataggttaa accgctcgct tccagaattt tatcagcata atgcttggcc acataataag 7020
gcttgagtgc ctcattccaa ttttcacggt tatgggcttg cagggcgctg accataataa 7080
accgtttgat tccggcaatg gccgcagctt caatggcttt tgccgctcca tcaagatcca 7140
ccagcagcgt tttatcatag cctgtgctgc cgccggaacc ggctgtgaaa atgatcgcgt 7200
cacaaccttt tgccgcagcg gcgatttctt ccgggctgcc ctccagattc gcaagcacag 7260
cttctgcacc ggcagcttca agagacgctt tctgttcttc ttttctgacc atcgctctga 7320
tggaatgatc aggattatct tggaataaag agacgagtct ttgcccgatt tgtccgttcg 7380
ctccgattaa aaacactttc atgtgaatcc ctcctgcctc cattatttca aaaacacaac 7440
cgctctttca aacgatgtgt tttgccttag taaatcagat caaggaaa 7488
<210> 34
<211> 6017
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 34
gatcaaaaga gggtatgtta tctatcaaac aaactcgttc agagttagtc gaatcaggta 60
tagaaggcct taaggatatt atcttaaaaa taaccggaga aaaagtgaaa agttttcata 120
ctgatttaag ctcccggaca ggtgaacgag tgatggtatt taaattatgt aatgatctag 180
agaaaaattt ggaaaagatc ttataatcta aagaaaataa atgttttgac ggtgtggaat 240
ttgttgtgaa ttgaacataa agaactgccg attcttttgt tttacaatta tggtatcatt 300
gataactttt attcatatcc taagcggaca taaagagatg tcaattcata gtacactgtc 360
atgttattcc tgtcgaaaga tctaacatcc gctgttgtta tgagcggatg tttttttaca 420
tctattttaa atacatgaat ttgatgctgg tgattagtca cttgaacaat atttgaaaac 480
atccttgtca cctgccgggt ttccccaagt gtttagtgac atgattatga gaccaacttc 540
gtaaagcttg ctgataaatt taagcggtga acaaaattga tatgctgtct tcagtttcat 600
ttcacggaat tagtcagaga taaaccttta attaaatata tccaaaaaac ggattgacat 660
atcgaaatat aacgatataa taatcgatat ggaaccaatt gaagtattca aagccttatc 720
aaatgaatca aggctgcaaa ttttacaatg gctgaaggag cccgatcgtc attttgcacc 780
ccatgaaggg attgatatga acacaatcgg ggtatgtgtc agtcaaataa cagacaaatt 840
gaaaatgacg caatcgacag cttctcaata tcttaccatc cttttaagag ccggcctaat 900
taaggcggag cgaatcggaa agtacacgta ttataaaaga gatgaagaag ccattgggaa 960
acttgctgac tttcttaaaa cagagatata aaaataaaca tcaaaagatg tttattttta 1020
caccatacat atcgacatat tacgatgtgt ttattttttt ataataacat atcgataatt 1080
cgtgatatgt ttattaataa ttaaggagtg aatgttttat gtctaacact tggaaaattt 1140
atattttagc cattgtcagc tttttagttg gaacctcaga gtacatcatt tccggaattt 1200
tggatcaaat tgctcatact ctcgggatca ctttagctgc cgcgggccag cttattacca 1260
ttttctcact tgtatatgct ctttctacac ccgtacttat ggcgttgaca gcaagtatgg 1320
atagacgcaa attgatgatg tatgccctag gtttgtttgt gttcggtaat gtcctggctt 1380
ttgtactgcc tggttatgga tggtttattg cagcgcggat cattatggcg atgggagcag 1440
gtgtggttgt tgtcaccgca ttaacgattg ccgctaagat tgcatcggaa gggaagcagg 1500
gcagtgccat cgctacggtc gtgatgggat ttaccgcttc tttaatcatt ggtgttccgc 1560
ttggaagaat gatagcagta gcattaggct ggaagtctgt atttggagcc attgctttgt 1620
tgggattgat cgcaatggtc gttattttct ttactcttcc gtatactgaa ggggataagc 1680
ctgtgccttt gcttcaacag cttgctcttt tcaaaaaacg gaaagtggct atgggattat 1740
caatcacttt cttctggctc gggggatatt ctgttgctta cacttatttg tcaccgtatc 1800
tcttgaacat ctcaggtata aatggcaagc tgctcagcgg tgttttgctt atatttggaa 1860
ttgccagttt ggttggatcg aagtttgggg gatatagcac cgataaatgg ggagtgccct 1920
ttacactcgt tggcgggatg acgttgcata tcgtcacact gattctgctg tcacttgtta 1980
ctcattccta tatcggagtg ttggtgattc tcatattatg gtcgtttgcc gcatggtcca 2040
ccggtccgac acagcaattt cacctggcta caatagaacc ggaaatgtca ggtgttttgc 2100
ttagcatgaa tcagtcaatg atgcaattcg ccatggcggt cggcgcaggt ataggagggg 2160
tttttgtgga aaacgtatca ttggcctcga ttacctgggt tggtgcgtta ggggttatga 2220
ttgcaattat tgcatcattg ctgattttca attcgcaacc gaaacaagcg ctaaaagata 2280
tcaatcaata atttcgaaag ttctaacatc cgctcgttat acaagcgggt gtttttttta 2340
gcgtagtcag tccatgcatg agtcttccaa gggccgacat cgttctgtat gtgtcgaagg 2400
tgcactgaag ctgaatgaga tttcttaagg ctttgccgcg gcgagctgaa gtacagtacg 2460
attgccttga tcgaacactg gaaacacaag agaacgtaaa cctgaacatc cgcgtaaacg 2520
tcaaggaagt tgccacttgg ggagtaaaca cttgcatcat ctcgctgaaa ggcctagaca 2580
atgcggatga cagattcgta ttgccggaag taaacacagc gcttgctctg tttccgttgt 2640
cgattgcagc tgattgctta ctaatgctgc cctgcatctc ggttgtgatg tcgataagca 2700
gcgtaatgaa gagtgttact gtggagtaag atgtttaacc cctctggata ttttagccga 2760
aggggttttt agtatagata tttgatttaa attacaggag acttcattca tttaaccaaa 2820
gtcattgctt tcttaatcac taaagtttat ttgaaaataa tctcttgatt taatttcctc 2880
gaagagattt tttgtcaatc tattaggcat cagaattttt ataacataat ggaccgtctt 2940
tttgacgttt tgtttataga acaagaaaat attcaaaaca taagtggaaa attaggggtg 3000
agctccggtc cttcctataa gcaggaaggt tttttaatga aatatttttt tattagtagg 3060
taaattcatc aaatgttctg ctatgctcca aatgtacacc tttccgtaag ggcaaagtca 3120
aatgtgaaaa aaaactgttc caaagttaat cagaaattta ttttcatatt gtatccttcg 3180
gtatcaagtg aaaggagcat catatgaaaa cattatggaa agtcctcaaa attgtttttg 3240
tcagcttggc tgctttggtt ttgcttgtat ccgtctcggt atttatttat caccatttcc 3300
agctaaataa ggaggcggca ctgctgaaag gtaaaggcac agtagtcgat gttgacggta 3360
aaaagatgaa tgtgtatcaa gagggaagcg ggaaggatac gtttgtgttt atgtccggtt 3420
cgggtattgc tgcgcctgct tatgaaatga aggggctgta cagcaagttt tcaaaagaaa 3480
ataagattgc tgttgtagat cgggcaggtt atggatacag tgaagtgtct cacgatgaca 3540
gagatattga tacggtattg gaacagacga ggaaagcgct tatgaaaagc ggaaataagc 3600
ctccttatat tttaatgcct cattcgatat ccgggattga agcgatgtat tgggcacaga 3660
aatatcctaa ggaaatcaag gccattattg cgatggatat tggattgccc cagcagtacg 3720
tcacgtataa attgagcgga gttgaccgat tgaaagtgag agggttccac ctgttaacct 3780
cgattggttt tcatcggttt ataccttccg ctgtatataa tcctgaggtg attcgacagt 3840
cgtttttaac tgatgaagaa aaagaaatct ataaagccat taactttaag caatttttta 3900
atgcagatat ggagcatgag cttttacagt cttaccaaaa cggcagcaaa tctgtgaatc 3960
tgcctgcgcc aaaggaaact cccgtcttga ttttagatgc agtctctgac caaaatagac 4020
attcaaagta tgctatacaa aaccgaaaag actatgaagc gtttgcggct caattcaata 4080
ctgccgatat aaaggaactg aggggaacac acagtattta tttatatcag cctgatcaaa 4140
tatataaact gtccatggag tttatgagaa aggttcgcta ggatgaaggg ttatcgtatt 4200
ttaatcgttg aggacgatgt gatgattggt gatttgctgc aaaagatttt gcagcgcgag 4260
ggatatcgtg tgatatggaa aacagatgga gcggatgtgc tttcggtgat tcagaaggtg 4320
gatttggtca ttatggatgt gatgctgccg ggtgaagacg ggtatcaaat gtctgcaaaa 4380
atcaaaaagc tggggctggg cattccggtt atttttctct cagcccgcaa tgacatggac 4440
agcaagcttc aaggtttgca gatcggcgag gattatatgg taaagccctt tgatccgaga 4500
gagctgctat taagaatgcg gaatatgctt gagcatcatt atgggacctt tacgcaaatc 4560
aaacatttgt atattgatgc ggtaacgaaa aaagtgttca atgaaagcct gcatgatgag 4620
gtattattta ctgcgattga gcggaaaatt ttcttttatt tatatgaaaa tagagacagt 4680
atcctgacaa aggaacattt ctttgaatat ctatggcagc tcgaagatag aaacccgaat 4740
attgtcaatg tgcatattaa aaaaattaga gctaaaatca atgatcaagc gggtgagatg 4800
attgaaaata tatatggaga agggtatcgg ctgaataccg ttgtgaagaa atgaagctca 4860
agacaaaata tcagttgtta ttgtttacgg ccgtcattag tgttccgatg ctattgctgg 4920
cggtcagtgt tttgatgtcg gtgatttatg acagcatgtt taaaccgatg aatcatggta 4980
tgccctttca caggtcgttt gcatacccgg caatgatcgt tgtatttttg atatcactct 5040
tattgttagc ttttttattt tcaaagtcga ttcattctct gttgcataaa atcaatctat 5100
taaatcaaac cattcggcat ttggcgagtg atcaaagggt gcccgataaa attgaagtga 5160
agcgtgctga tgaaatcggg gaactgatca agtcggtcaa tttgttaatt gaacggacga 5220
catatcgtga actggagctg agacagcagg aggaaatcaa aaaggagctt ttgcaaaaac 5280
tgcggcatga cattaataca cctttaacgg ctctcaggct gcagttattt tatttggaag 5340
accaatgtca tggtcaggct gtattcgaat cattgtatca gcaaatcgaa tatatctcgg 5400
aattaactaa tgaattcaat ctatattccg ctgagacgct ggaaagctct tatattgtaa 5460
atgaagaagt gcgtctaaac gagctattag aaacagcggt gaaaaagtgg gattatttat 5520
acagtatgag tgggattgag ctgcactata agccggcaga tcaagatgtg atatggatga 5580
gcaacacgtt atggatggaa aggctgtttg ataatatttt tcaaaatacg ttaaggcatt 5640
caaaagctaa aaagatggaa gtcacgattg aacatggcga tgtttttatt cgtgatgacg 5700
gtattggatt tgatcggaat gagagcagtg agggacttgg gttaaagatt attgaggata 5760
catgcaggct gcttgcgatt acttatgagc tgcatacaaa tgataacgga acggggttct 5820
tgttttcaaa agagtgaccc cgctgatgtt tttctttctc ctataaaatt tatataatag 5880
ggagaaagaa atggggtgaa catcatatgt ttaaaaaaat catcaaaacg attaagtacc 5940
tctcaagcag ttctagtgac cgatatcgca gacaccggca ttacagcagc agccggcgca 6000
gacattatcg cagctac 6017
<210> 35
<211> 3006
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 35
gatcaaaaga gggtatgtta tctatcaaac aaactcgttc agagttagtc gaatcaggta 60
tagaaggcct taaggatatt atcttaaaaa taaccggaga aaaagtgaaa agttttcata 120
ctgatttaag ctcccggaca ggtgaacgag tgatggtatt taaattatgt aatgatctag 180
agaaaaattt ggaaaagatc ttataatcta aagaaaataa atgttttgac ggtgtggaat 240
ttgttgtgaa ttgaacataa agaactgccg attcttttgt tttacaatta tggtatcatt 300
gataactttt attcatatcc taagcggaca taaagagatg tcaattcata gtacactgtc 360
atgttattcc tgtcgaaaga tctaacatcc gctgttgtta tgagcggatg tttttttaca 420
tctattttaa atacatgaat ttgatgctgg tgattagtca cttgaacaat atttgaaaac 480
atccttgtca cctgccgggt ttccccaagt gtttagtgac atgattatga gaccaacttc 540
gtaaagcttg ctgataaatt taagcggtga acaaaattga tatgctgtct tcagtttcat 600
ttcacggaat tagtcagaga taaaccttta attaaatata tccaaaaaac ggattgacat 660
atcgaaatat aacgatataa taatcgatat ggaaccaatt gaagtattca aagccttatc 720
aaatgaatca aggctgcaaa ttttacaatg gctgaaggag cccgatcgtc attttgcacc 780
ccatgaaggg attgatatga acacaatcgg ggtatgtgtc agtcaaataa cagacaaatt 840
gaaaatgacg caatcgacag cttctcaata tcttaccatc cttttaagag ccggcctaat 900
taaggcggag cgaatcggaa agtacacgta ttataaaaga gatgaagaag ccattgggaa 960
acttgctgac tttcttaaaa cagagatata aaaataaaca tcaaaagatg tttattttta 1020
caccatacat atcgacatat tacgatgtgt ttattttttt ataataacat atcgataatt 1080
cgtgatatgt ttattaataa ttaaggagtg aatgttttat gtctaacact tggaaaattt 1140
atattttagc cattgtcagc tttttagttg gaacctcaga gtacatcatt tccggaattt 1200
tggatcaaat tgctcatact ctcgggatca ctttagctgc cgcgggccag cttattacca 1260
ttttctcact tgtatatgct ctttctacac ccgtacttat ggcgttgaca gcaagtatgg 1320
atagacgcaa attgatgatg tatgccctag gtttgtttgt gttcggtaat gtcctggctt 1380
ttgtactgcc tggttatgga tggtttattg cagcgcggat cattatggcg atgggagcag 1440
gtgtggttgt tgtcaccgca ttaacgattg ccgctaagat tgcatcggaa gggaagcagg 1500
gcagtgccat cgctacggtc gtgatgggat ttaccgcttc tttaatcatt ggtgttccgc 1560
ttggaagaat gatagcagta gcattaggct ggaagtctgt atttggagcc attgctttgt 1620
tgggattgat cgcaatggtc gttattttct ttactcttcc gtatactgaa ggggataagc 1680
ctgtgccttt gcttcaacag cttgctcttt tcaaaaaacg gaaagtggct atgggattat 1740
caatcacttt cttctggctc gggggatatt ctgttgctta cacttatttg tcaccgtatc 1800
tcttgaacat ctcaggtata aatggcaagc tgctcagcgg tgttttgctt atatttggaa 1860
ttgccagttt ggttggatcg aagtttgggg gatatagcac cgataaatgg ggagtgccct 1920
ttacactcgt tggcgggatg acgttgcata tcgtcacact gattctgctg tcacttgtta 1980
ctcattccta tatcggagtg ttggtgattc tcatattatg gtcgtttgcc gcatggtcca 2040
ccggtccgac acagcaattt cacctggcta caatagaacc ggaaatgtca ggtgttttgc 2100
ttagcatgaa tcagtcaatg atgcaattcg ccatggcggt cggcgcaggt ataggagggg 2160
tttttgtgga aaacgtatca ttggcctcga ttacctgggt tggtgcgtta ggggttatga 2220
ttgcaattat tgcatcattg ctgattttca attcgcaacc gaaacaagcg ctaaaagata 2280
tcaatcaata atttcgaaag ttctaacatc cgctcgttat acaagcgggt gtttttttta 2340
gcgtagtcag tccatgcatg agtcttccaa gggccgacat cgttctgtat gtgtcgaagg 2400
tgcactgaag ctgaatgaga tttcttaagg ctttgccgcg gcgagctgaa gtacagtacg 2460
attgccttga tcgaacactg gaaacacaag agaacgtaaa cctgaacatc cgcgtaaacg 2520
tcaaggaagt tgccacttgg ggagtaaaca cttgcatcat ctcgctgaaa ggcctagaca 2580
atgcggatga cagattcgta ttgccggaag taaacacagc gcttgctctg tttccgttgt 2640
cgattgcagc tgattgctta ctaatgctgc cctgcatctc ggttgtgatg tcgataagca 2700
gcgtaatgaa gagtgttact gtggagtaag atgtttaacc cctctggata ttttagccga 2760
aggggttttt agtatagata tttgatttaa attacaggag acttcattca tttaaccaaa 2820
gtcattgctt tcttaatcac taaagtttat ttgaaaataa tctcttgatt taatttcctc 2880
gaagagattt tttgtcaatc tattaggcat cagaattttt ataacataat ggaccgtctt 2940
tttgacgttt tgtttataga acaagaaaat attcaaaaca taagtggaaa attaggggtg 3000
agctcc 3006
<210> 36
<211> 3032
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 36
ggaaaattag gggtgagctc cggtccttcc tataagcagg aaggtttttt aatgaaatat 60
ttttttatta gtaggtaaat tcatcaaatg ttctgctatg ctccaaatgt acacctttcc 120
gtaagggcaa agtcaaatgt gaaaaaaaac tgttccaaag ttaatcagaa atttattttc 180
atattgtatc cttcggtatc aagtgaaagg agcatcatat gaaaacatta tggaaagtcc 240
tcaaaattgt ttttgtcagc ttggctgctt tggttttgct tgtatccgtc tcggtattta 300
tttatcacca tttccagcta aataaggagg cggcactgct gaaaggtaaa ggcacagtag 360
tcgatgttga cggtaaaaag atgaatgtgt atcaagaggg aagcgggaag gatacgtttg 420
tgtttatgtc cggttcgggt attgctgcgc ctgcttatga aatgaagggg ctgtacagca 480
agttttcaaa agaaaataag attgctgttg tagatcgggc aggttatgga tacagtgaag 540
tgtctcacga tgacagagat attgatacgg tattggaaca gacgaggaaa gcgcttatga 600
aaagcggaaa taagcctcct tatattttaa tgcctcattc gatatccggg attgaagcga 660
tgtattgggc acagaaatat cctaaggaaa tcaaggccat tattgcgatg gatattggat 720
tgccccagca gtacgtcacg tataaattga gcggagttga ccgattgaaa gtgagagggt 780
tccacctgtt aacctcgatt ggttttcatc ggtttatacc ttccgctgta tataatcctg 840
aggtgattcg acagtcgttt ttaactgatg aagaaaaaga aatctataaa gccattaact 900
ttaagcaatt ttttaatgca gatatggagc atgagctttt acagtcttac caaaacggca 960
gcaaatctgt gaatctgcct gcgccaaagg aaactcccgt cttgatttta gatgcagtct 1020
ctgaccaaaa tagacattca aagtatgcta tacaaaaccg aaaagactat gaagcgtttg 1080
cggctcaatt caatactgcc gatataaagg aactgagggg aacacacagt atttatttat 1140
atcagcctga tcaaatatat aaactgtcca tggagtttat gagaaaggtt cgctaggatg 1200
aagggttatc gtattttaat cgttgaggac gatgtgatga ttggtgattt gctgcaaaag 1260
attttgcagc gcgagggata tcgtgtgata tggaaaacag atggagcgga tgtgctttcg 1320
gtgattcaga aggtggattt ggtcattatg gatgtgatgc tgccgggtga agacgggtat 1380
caaatgtctg caaaaatcaa aaagctgggg ctgggcattc cggttatttt tctctcagcc 1440
cgcaatgaca tggacagcaa gcttcaaggt ttgcagatcg gcgaggatta tatggtaaag 1500
ccctttgatc cgagagagct gctattaaga atgcggaata tgcttgagca tcattatggg 1560
acctttacgc aaatcaaaca tttgtatatt gatgcggtaa cgaaaaaagt gttcaatgaa 1620
agcctgcatg atgaggtatt atttactgcg attgagcgga aaattttctt ttatttatat 1680
gaaaatagag acagtatcct gacaaaggaa catttctttg aatatctatg gcagctcgaa 1740
gatagaaacc cgaatattgt caatgtgcat attaaaaaaa ttagagctaa aatcaatgat 1800
caagcgggtg agatgattga aaatatatat ggagaagggt atcggctgaa taccgttgtg 1860
aagaaatgaa gctcaagaca aaatatcagt tgttattgtt tacggccgtc attagtgttc 1920
cgatgctatt gctggcggtc agtgttttga tgtcggtgat ttatgacagc atgtttaaac 1980
cgatgaatca tggtatgccc tttcacaggt cgtttgcata cccggcaatg atcgttgtat 2040
ttttgatatc actcttattg ttagcttttt tattttcaaa gtcgattcat tctctgttgc 2100
ataaaatcaa tctattaaat caaaccattc ggcatttggc gagtgatcaa agggtgcccg 2160
ataaaattga agtgaagcgt gctgatgaaa tcggggaact gatcaagtcg gtcaatttgt 2220
taattgaacg gacgacatat cgtgaactgg agctgagaca gcaggaggaa atcaaaaagg 2280
agcttttgca aaaactgcgg catgacatta atacaccttt aacggctctc aggctgcagt 2340
tattttattt ggaagaccaa tgtcatggtc aggctgtatt cgaatcattg tatcagcaaa 2400
tcgaatatat ctcggaatta actaatgaat tcaatctata ttccgctgag acgctggaaa 2460
gctcttatat tgtaaatgaa gaagtgcgtc taaacgagct attagaaaca gcggtgaaaa 2520
agtgggatta tttatacagt atgagtggga ttgagctgca ctataagccg gcagatcaag 2580
atgtgatatg gatgagcaac acgttatgga tggaaaggct gtttgataat atttttcaaa 2640
atacgttaag gcattcaaaa gctaaaaaga tggaagtcac gattgaacat ggcgatgttt 2700
ttattcgtga tgacggtatt ggatttgatc ggaatgagag cagtgaggga cttgggttaa 2760
agattattga ggatacatgc aggctgcttg cgattactta tgagctgcat acaaatgata 2820
acggaacggg gttcttgttt tcaaaagagt gaccccgctg atgtttttct ttctcctata 2880
aaatttatat aatagggaga aagaaatggg gtgaacatca tatgtttaaa aaaatcatca 2940
aaacgattaa gtacctctca agcagttcta gtgaccgata tcgcagacac cggcattaca 3000
gcagcagccg gcgcagacat tatcgcagct ac 3032
<210> 37
<211> 6087
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 37
cgcccggcaa gagaacaaga ccagatgcaa atgcagtgag gactaagccg ccttgcagat 60
acatcggcag aagcagcata gatgacagaa tgaccatcat acaaatgaac accatgatca 120
cacccaaaat aaacatcggg tatttgaacg cacggaggtt catcataggc tgcttcattg 180
tcagctggcg gattgaaaat aagataaggc cgacaacgcc gacaatcagc gacacgataa 240
cagtcgggct ggaccatccc ccggagcctt cacccgcgtt gctgaatccg aatacaatgc 300
cgccgaagcc aatcgtcgac aggatgatag acaatacatc gattttcggc tttgtcgttt 360
cagatacatt ttgcatatat gcgataccga aaacaagcgc cagcacaagg aatggaagag 420
agatccagaa aatccagtgc cagttgagat gctccagaac caatcctgag aaagttgggc 480
cgatggcggg cgcgaacata atgacaagcc cgatcgttcc cattgcggca ccccgtttat 540
gaggcgggaa aatcaccaag attgtgttaa acatcagcgg cagtaaaaga ccggttccaa 600
gtgcctgaac gatccttgcc gctaataaaa acgagaagct cggcgcaagc gccgcaatga 660
atgtacctaa aattgaaaag ataagtgaca cggtaaaaag ctgtcttgtt gtgaaccact 720
gcaacagcag tcctgaaaca ggaacaagga taccgagtac aagcaggtag cccgtcgtta 780
accattggac ggttgccgct gtaatgttca attccttcat aaggtcggtt aacgcaatat 840
tcagcgctgt ttcactgaac atgccgataa aaccggccaa cagcaaggaa atcataatcg 900
gcatcacttt gtattgctga gatgctttag ctgttgtttc caaaatcatt tcccctctct 960
atcaactgca tgtagtatgt cgtttttttt atctcttcag caggtcagga atgcagctgg 1020
agatatgaag gagcggcgta ctgttttttg ccgtcaaaga taaaaggatg ccgccttcaa 1080
tcatcgcgtt aaccacagtg ctggcttctt ttgcacggct ctcgctgcag ccagtctgcc 1140
gcagtttttc ctcatacaca gaggcccatt ctttgtaggc ttcatgacag gcttcgcgca 1200
acggttcgct tttcaatgac gtctcagccg ctagcaagcc cacaggcaag ccttcaatgt 1260
cttccgtaca tgaaaactgg caggagagct ccttcaaaaa ggcttgaatg ccttccgctg 1320
gatcggtgca ggcttccatg cagtccgcga ttttctgacg gatatactcc ttcatctcat 1380
tcacggcttc gatcgcaagc tgttctttac ccccgggaaa gtggtagtaa agagagcctt 1440
taggcgcgcc gctttccttt ataatctggt tcagccccgt gccgtaatac ccttgcagct 1500
gaaaaagccg ggtagctgcc gaaaggattt tctcacggga atctccataa ctcataacat 1560
tcccacctta ctgaattgca atcaaaaata tagtgactgg tctattatct tgattcaatc 1620
atcaattgtc aagaaaaatt cattgtatga aaagacaaaa aaagaaggat atgacaacaa 1680
aaaatactga gagaaaagct gactgatctt ttgactgaat agataaaatg tacaatgatt 1740
aatcatcata tggatgtaag gagagaaata gatgaaaaaa caacgaatgc tcgtactttt 1800
taccgcacta ttgtttgttt ttaccggatg ttcacattct cctgaaacaa aagaatcccc 1860
gaaagaaaaa gctcagacac aaaaagtctc ttcggcttct gcctctgaaa aaaaggatct 1920
gccaaacatt agaattttag cgacaggagg cacgatagct ggtgccgatc aatcgaaaac 1980
ctcaacaact gaatataaag caggtgttgt cggcgttgaa tcactgatcg aggcagttcc 2040
agaaatgaag gacattgcaa acgtcagcgg cgagcagatt gttaacgtcg gcagcacaaa 2100
tattgataat aaaatattgc tgaagctggc gaaacgcatc aaccacttgc tcgcttcaga 2160
tgatgtagac ggaatcgtcg tgactcatgg aacagataca ttggaggaaa ccgcttattt 2220
tttgaatctt accgtgaaaa gtgataaacc ggttgttatt gtcggttcga tgagaccttc 2280
cacagccatc agcgctgatg ggccttctaa cctgtacaat gcagtgaaag tggcaggtgc 2340
ccctgaggca aaagggaaag ggacgcttgt tgttcttaac gaccggattg cctcagcccg 2400
atatgtcacc aaaacaaaca caactacaac agatacattt aaatcagaag aaatgggctt 2460
cgtcggaaca attgcagatg atatctattt taataatgag attacccgta agcatacgaa 2520
ggacacggat ttctcggttt ctaatcttga tgagctgccg caggttgaca ttatctatgg 2580
ataccaaaat gacggaagct acctgtttga cgctgctgta aaagccggag caaaggggat 2640
tgtatttgcc ggttctggga acgggtcttt atctgatgca gccgaaaaag gggcggacag 2700
cgcagtcaaa aaaggcgtta cagtggtgcg ctctacccgc acgggaaatg gtgtcgtcac 2760
accaaaccaa gactatgcgg aaaaggactt gctggcatcg aactctttaa acccccaaaa 2820
agcacggatg ttgctgatgc ttgcgcttac caaaacaaat gatcctcaaa aaatccaagc 2880
ttatttcaat gagtattgaa gaaaagaagg cgaataagcc ttcttttttt tggcttttta 2940
ggaccaataa tgacctctga atcttaaaat ttctttaaaa ataagccaaa attacccttt 3000
acttaattaa tttggtaacg taatataatt ggagaatttg gttattctgc tttcagcaca 3060
atggttttcg cagccatatc atgaacggtt tgttttttct tcgtaaatgc ggcagtcaaa 3120
tagatcaggc gggagaacac atgcacccac gctatcaggt aacggacaat ggcttgcggg 3180
aaggatattt ttttatatgt ttcgtccctc acgatttgca gcccgatgat ttttttgccc 3240
agtgtgccct tccaatttgt cagcggcatc agcaaagggt acacaatcag catcaatatg 3300
gcgacaataa tgacaccggc ggacccatcg ccaaacgtaa atccggctgc caaaatcact 3360
gctgcggcaa tgattacatc aagtaaaaga gcgcaggcgc gcagcatgaa accagctagt 3420
tccaatagaa acactcctta aaatgttaaa taaacaccta atgattgtaa aaaagaaggg 3480
cctaaagtgg gaataggtga taagccttaa atcacaaaag ttggtgaaaa tgtcataggt 3540
aaattggcat aatcagccag cttatcacat taccaaattc ttttttagcc cgaaaccaag 3600
ccctcagaag ttatttttgt taaaatagaa aagttacaac agaattcgga gggtttattg 3660
tgggaaaagt gaaacgaaat gccccttgcc catgcggcag cggcaagaaa tataaaaaat 3720
gctgcggaag taaagttgtc gacttcccgg cggaactagc ggcaaaagaa gcgaaacaaa 3780
ttcaggaaga cttagtggag tatgccttca cagtacatag agaaagcatt tcaggcttta 3840
tcaaccagca tgattttctt tctgctatgg acagacagac gaaagacatc agcgtattta 3900
acttaggaat ctggggaatc ttcttccacc cgcttgctgg tgagaagaca atcttcgaag 3960
agtaccttca gaaaaaaggc gattcgatca ctcgtccgaa aacgcgtgag atcgtagaat 4020
catggcagag catgacgcct gctttattgc tgctgaagga cctgaaggaa ggcatcattc 4080
actttgaaga tgtcattacg gcaaaacaat tcgaagtgga aatggacgcc agcaatcaag 4140
accttcctcc agtgggaagc ctgattcttg gatacccaat ccacgaagcg gaaaaagcag 4200
aattcttcat gcagttcacg atcttcccgg tgaagagaac agaagcgctg atcagcaagg 4260
tgaagaaata tgcggatgcc gctgtgaagg acggcaaaac gccggaggac ttcatgaagc 4320
aggaattcaa caacgttctg ttcgcgttgt tagctgagaa agatgaagag ccacaagcag 4380
agaaagcgga agtaagcact gttgagtggg caaacgactt ggagaaagaa accgctgcgg 4440
ctattgaaga aggcatgagc ggggaagagt atccgactga attgatccca gctgttattg 4500
acatctggaa aacattctgc gagaaaaaat cacctgtcat cagaaagccg gaagcttttg 4560
cggcggcagt tgaatattat gtaaacgcaa tttctcttaa cggcgcgtcc gtttcccagg 4620
ctaaactggc gaaaaaatac ggcgttagcg catcaacgat ttccagccgt tacaaagaaa 4680
ttgaaagcac gctgcaagat gaagcagatc gttttgcaca agcgttatcc tcataatgga 4740
aaaaaccttg aaaagccagg cttttcaagg tttttttatt tctgaaacgg aattttgatt 4800
tctaaccgga agatggggtg gcggtaggta aaatccagcc tgccaaaagc gcccttcacc 4860
agtttttgaa tgatatatgt gcccatgcct tcatgagcgc cgtttttcgt tgagcggcca 4920
aacgattgat aaattgtatc gagcactttt gggtccatcc cgggagtgct gttttcacaa 4980
gtcagtacat aaagcccgct gcgcagtgaa gtctccagtt taatctctgc tttttctcgg 5040
gcctccgccg cgctgtcgag cgcattttct aatatgttgc cgaccaagct gacctgatca 5100
gcaggcgaaa acggaaggga agaaagcggt gtatgcatat gcagcgaaac actcacattc 5160
gaggcgcggg ctttttctaa aaaatcataa agcacccctg caacgtacgc gttctctcct 5220
ttcaaaaaac ggtcatattg gctgtattga tccgcccagt tttgaatata tgcttgtgta 5280
tctgccttgg gctgagctga tttgattgca gtgatatgtt tcattgtgtc atgattccgg 5340
cttctgacat caatcagcat ttgattggcg tgctgttcag cttgagtcag cttatcaatt 5400
tgatcagaaa gccttgcctg caaagcagac tgtccgatac ggagcccttc acaccctgca 5460
aatatcgcga ttacacataa taccggcatg atgtctgtgc caatcaacac cactcccacc 5520
gacatcactt gaatcaccgc aatccacgca caaagccctg aggaacagtg tttccacacc 5580
cgcttcgtat tccaaatgta caatcctgca gcagctgcgc ctaaagcagc ggcgagccaa 5640
gaggcggctg tgctgtgtga aaaagcagca gctccctgat aacatatgaa actaaataaa 5700
atcagataaa gacattgaaa aagggtaatc acgtactaaa ctcctcaaaa atagtagttt 5760
tgaaaataat caagctgctg cttagtgatc atcgcttttt tagacgttcc ctcaaaggaa 5820
actgtgaatg aatgcttggt ataagcggaa aaatgcttta tgtaatgaat gttgataata 5880
aaggaacgat gcgaacgaag aaaatctttt tcgggcaggt cgcctttaat atcatttaat 5940
gtttgatacg tttgcacctc ttcggcggtt gtcacaatcg tcgtcgaacg tcccgtccgt 6000
tctgcgaaaa taatatcctt cttttgcagg acgtgcattt cagacttttg ctttatcaat 6060
atacgcccat tcaaactcgt ttccgtt 6087
<210> 38
<211> 3040
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 38
cgcccggcaa gagaacaaga ccagatgcaa atgcagtgag gactaagccg ccttgcagat 60
acatcggcag aagcagcata gatgacagaa tgaccatcat acaaatgaac accatgatca 120
cacccaaaat aaacatcggg tatttgaacg cacggaggtt catcataggc tgcttcattg 180
tcagctggcg gattgaaaat aagataaggc cgacaacgcc gacaatcagc gacacgataa 240
cagtcgggct ggaccatccc ccggagcctt cacccgcgtt gctgaatccg aatacaatgc 300
cgccgaagcc aatcgtcgac aggatgatag acaatacatc gattttcggc tttgtcgttt 360
cagatacatt ttgcatatat gcgataccga aaacaagcgc cagcacaagg aatggaagag 420
agatccagaa aatccagtgc cagttgagat gctccagaac caatcctgag aaagttgggc 480
cgatggcggg cgcgaacata atgacaagcc cgatcgttcc cattgcggca ccccgtttat 540
gaggcgggaa aatcaccaag attgtgttaa acatcagcgg cagtaaaaga ccggttccaa 600
gtgcctgaac gatccttgcc gctaataaaa acgagaagct cggcgcaagc gccgcaatga 660
atgtacctaa aattgaaaag ataagtgaca cggtaaaaag ctgtcttgtt gtgaaccact 720
gcaacagcag tcctgaaaca ggaacaagga taccgagtac aagcaggtag cccgtcgtta 780
accattggac ggttgccgct gtaatgttca attccttcat aaggtcggtt aacgcaatat 840
tcagcgctgt ttcactgaac atgccgataa aaccggccaa cagcaaggaa atcataatcg 900
gcatcacttt gtattgctga gatgctttag ctgttgtttc caaaatcatt tcccctctct 960
atcaactgca tgtagtatgt cgtttttttt atctcttcag caggtcagga atgcagctgg 1020
agatatgaag gagcggcgta ctgttttttg ccgtcaaaga taaaaggatg ccgccttcaa 1080
tcatcgcgtt aaccacagtg ctggcttctt ttgcacggct ctcgctgcag ccagtctgcc 1140
gcagtttttc ctcatacaca gaggcccatt ctttgtaggc ttcatgacag gcttcgcgca 1200
acggttcgct tttcaatgac gtctcagccg ctagcaagcc cacaggcaag ccttcaatgt 1260
cttccgtaca tgaaaactgg caggagagct ccttcaaaaa ggcttgaatg ccttccgctg 1320
gatcggtgca ggcttccatg cagtccgcga ttttctgacg gatatactcc ttcatctcat 1380
tcacggcttc gatcgcaagc tgttctttac ccccgggaaa gtggtagtaa agagagcctt 1440
taggcgcgcc gctttccttt ataatctggt tcagccccgt gccgtaatac ccttgcagct 1500
gaaaaagccg ggtagctgcc gaaaggattt tctcacggga atctccataa ctcataacat 1560
tcccacctta ctgaattgca atcaaaaata tagtgactgg tctattatct tgattcaatc 1620
atcaattgtc aagaaaaatt cattgtatga aaagacaaaa aaagaaggat atgacaacaa 1680
aaaatactga gagaaaagct gactgatctt ttgactgaat agataaaatg tacaatgatt 1740
aatcatcata tggatgtaag gagagaaata gatgaaaaaa caacgaatgc tcgtactttt 1800
taccgcacta ttgtttgttt ttaccggatg ttcacattct cctgaaacaa aagaatcccc 1860
gaaagaaaaa gctcagacac aaaaagtctc ttcggcttct gcctctgaaa aaaaggatct 1920
gccaaacatt agaattttag cgacaggagg cacgatagct ggtgccgatc aatcgaaaac 1980
ctcaacaact gaatataaag caggtgttgt cggcgttgaa tcactgatcg aggcagttcc 2040
agaaatgaag gacattgcaa acgtcagcgg cgagcagatt gttaacgtcg gcagcacaaa 2100
tattgataat aaaatattgc tgaagctggc gaaacgcatc aaccacttgc tcgcttcaga 2160
tgatgtagac ggaatcgtcg tgactcatgg aacagataca ttggaggaaa ccgcttattt 2220
tttgaatctt accgtgaaaa gtgataaacc ggttgttatt gtcggttcga tgagaccttc 2280
cacagccatc agcgctgatg ggccttctaa cctgtacaat gcagtgaaag tggcaggtgc 2340
ccctgaggca aaagggaaag ggacgcttgt tgttcttaac gaccggattg cctcagcccg 2400
atatgtcacc aaaacaaaca caactacaac agatacattt aaatcagaag aaatgggctt 2460
cgtcggaaca attgcagatg atatctattt taataatgag attacccgta agcatacgaa 2520
ggacacggat ttctcggttt ctaatcttga tgagctgccg caggttgaca ttatctatgg 2580
ataccaaaat gacggaagct acctgtttga cgctgctgta aaagccggag caaaggggat 2640
tgtatttgcc ggttctggga acgggtcttt atctgatgca gccgaaaaag gggcggacag 2700
cgcagtcaaa aaaggcgtta cagtggtgcg ctctacccgc acgggaaatg gtgtcgtcac 2760
accaaaccaa gactatgcgg aaaaggactt gctggcatcg aactctttaa acccccaaaa 2820
agcacggatg ttgctgatgc ttgcgcttac caaaacaaat gatcctcaaa aaatccaagc 2880
ttatttcaat gagtattgaa gaaaagaagg cgaataagcc ttcttttttt tggcttttta 2940
ggaccaataa tgacctctga atcttaaaat ttctttaaaa ataagccaaa attacccttt 3000
acttaattaa tttggtaacg taatataatt ggagaatttg 3040
<210> 39
<211> 3047
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 39
gttattctgc tttcagcaca atggttttcg cagccatatc atgaacggtt tgttttttct 60
tcgtaaatgc ggcagtcaaa tagatcaggc gggagaacac atgcacccac gctatcaggt 120
aacggacaat ggcttgcggg aaggatattt ttttatatgt ttcgtccctc acgatttgca 180
gcccgatgat ttttttgccc agtgtgccct tccaatttgt cagcggcatc agcaaagggt 240
acacaatcag catcaatatg gcgacaataa tgacaccggc ggacccatcg ccaaacgtaa 300
atccggctgc caaaatcact gctgcggcaa tgattacatc aagtaaaaga gcgcaggcgc 360
gcagcatgaa accagctagt tccaatagaa acactcctta aaatgttaaa taaacaccta 420
atgattgtaa aaaagaaggg cctaaagtgg gaataggtga taagccttaa atcacaaaag 480
ttggtgaaaa tgtcataggt aaattggcat aatcagccag cttatcacat taccaaattc 540
ttttttagcc cgaaaccaag ccctcagaag ttatttttgt taaaatagaa aagttacaac 600
agaattcgga gggtttattg tgggaaaagt gaaacgaaat gccccttgcc catgcggcag 660
cggcaagaaa tataaaaaat gctgcggaag taaagttgtc gacttcccgg cggaactagc 720
ggcaaaagaa gcgaaacaaa ttcaggaaga cttagtggag tatgccttca cagtacatag 780
agaaagcatt tcaggcttta tcaaccagca tgattttctt tctgctatgg acagacagac 840
gaaagacatc agcgtattta acttaggaat ctggggaatc ttcttccacc cgcttgctgg 900
tgagaagaca atcttcgaag agtaccttca gaaaaaaggc gattcgatca ctcgtccgaa 960
aacgcgtgag atcgtagaat catggcagag catgacgcct gctttattgc tgctgaagga 1020
cctgaaggaa ggcatcattc actttgaaga tgtcattacg gcaaaacaat tcgaagtgga 1080
aatggacgcc agcaatcaag accttcctcc agtgggaagc ctgattcttg gatacccaat 1140
ccacgaagcg gaaaaagcag aattcttcat gcagttcacg atcttcccgg tgaagagaac 1200
agaagcgctg atcagcaagg tgaagaaata tgcggatgcc gctgtgaagg acggcaaaac 1260
gccggaggac ttcatgaagc aggaattcaa caacgttctg ttcgcgttgt tagctgagaa 1320
agatgaagag ccacaagcag agaaagcgga agtaagcact gttgagtggg caaacgactt 1380
ggagaaagaa accgctgcgg ctattgaaga aggcatgagc ggggaagagt atccgactga 1440
attgatccca gctgttattg acatctggaa aacattctgc gagaaaaaat cacctgtcat 1500
cagaaagccg gaagcttttg cggcggcagt tgaatattat gtaaacgcaa tttctcttaa 1560
cggcgcgtcc gtttcccagg ctaaactggc gaaaaaatac ggcgttagcg catcaacgat 1620
ttccagccgt tacaaagaaa ttgaaagcac gctgcaagat gaagcagatc gttttgcaca 1680
agcgttatcc tcataatgga aaaaaccttg aaaagccagg cttttcaagg tttttttatt 1740
tctgaaacgg aattttgatt tctaaccgga agatggggtg gcggtaggta aaatccagcc 1800
tgccaaaagc gcccttcacc agtttttgaa tgatatatgt gcccatgcct tcatgagcgc 1860
cgtttttcgt tgagcggcca aacgattgat aaattgtatc gagcactttt gggtccatcc 1920
cgggagtgct gttttcacaa gtcagtacat aaagcccgct gcgcagtgaa gtctccagtt 1980
taatctctgc tttttctcgg gcctccgccg cgctgtcgag cgcattttct aatatgttgc 2040
cgaccaagct gacctgatca gcaggcgaaa acggaaggga agaaagcggt gtatgcatat 2100
gcagcgaaac actcacattc gaggcgcggg ctttttctaa aaaatcataa agcacccctg 2160
caacgtacgc gttctctcct ttcaaaaaac ggtcatattg gctgtattga tccgcccagt 2220
tttgaatata tgcttgtgta tctgccttgg gctgagctga tttgattgca gtgatatgtt 2280
tcattgtgtc atgattccgg cttctgacat caatcagcat ttgattggcg tgctgttcag 2340
cttgagtcag cttatcaatt tgatcagaaa gccttgcctg caaagcagac tgtccgatac 2400
ggagcccttc acaccctgca aatatcgcga ttacacataa taccggcatg atgtctgtgc 2460
caatcaacac cactcccacc gacatcactt gaatcaccgc aatccacgca caaagccctg 2520
aggaacagtg tttccacacc cgcttcgtat tccaaatgta caatcctgca gcagctgcgc 2580
ctaaagcagc ggcgagccaa gaggcggctg tgctgtgtga aaaagcagca gctccctgat 2640
aacatatgaa actaaataaa atcagataaa gacattgaaa aagggtaatc acgtactaaa 2700
ctcctcaaaa atagtagttt tgaaaataat caagctgctg cttagtgatc atcgcttttt 2760
tagacgttcc ctcaaaggaa actgtgaatg aatgcttggt ataagcggaa aaatgcttta 2820
tgtaatgaat gttgataata aaggaacgat gcgaacgaag aaaatctttt tcgggcaggt 2880
cgcctttaat atcatttaat gtttgatacg tttgcacctc ttcggcggtt gtcacaatcg 2940
tcgtcgaacg tcccgtccgt tctgcgaaaa taatatcctt cttttgcagg acgtgcattt 3000
cagacttttg ctttatcaat atacgcccat tcaaactcgt ttccgtt 3047
<210> 40
<211> 864
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 40
gtgtcaacaa catatcctat tgtcctggta cacggccttt ctggtttcga tgacatcgta 60
ggataccctt atttttatgg gattgccgac gccctggaga aagatggcca caaagttttt 120
acagcctcac tctctgcatt caattccaac gaagtccgtg gcgagcaatt atgggagttc 180
gtgcaaaaga ttctcaaaga gactaaagtc aaaaaggtga atttgatcgg gcactcccaa 240
ggtcctcttg cgtgtcgtta tgtggcggcc aagcatgcta aaagtattgc aagtgttaca 300
tctgtgaatg gagtgaatca cggtagcgaa atcgccgatc ttgtcagacg gattatgaga 360
aaagattctg tccctgagta tatcgcggac gcggtaatga aggctattgg cactataatc 420
agtactttta gcggaaatag aggaaaccct caagacgcta tagcagctct ggaggcctta 480
acgacggaaa acgtgatgga atttaacaaa aaatatcctc agggactgcc agcaattcgt 540
gggggtgaag gtaaagaagt cgtgaacggc gtacactact atagctttgg ttcttacata 600
cagggtctca tcgctggcga gaagggaaac ttgctcgatc ctacccacgc cgctatgcgc 660
gttttatccg cgtttttttc agaacgtgag aacgatggtt tagtaggacg gacttcaatg 720
cggctcggca agttaattaa agacgactac gctgaggatc atttagatat ggtcaatcaa 780
gttgcggggt tagttggacg cggggaggat ataattgcta tatatacgaa tcatgccaat 840
tttttagcgt caaaaaagct ctaa 864
<210> 41
<211> 7380
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 41
gcttcaaagc acccgtctcg tcaacgcctg cctcagcaac attgaatttg cagaagaaaa 60
atggcggata aaagactata atatcaacag ccacttatcc ggctttatca aataagaaaa 120
agacaggcgt ttgcctgtct tttcttttat ttcttagcag ccggcatctc tttttgaagc 180
tcgtccaaaa tggcattcgc cccgtctaca ctgcggcgca gagaccacac cgcacgatcc 240
acgtggtata catgcccgtt tttcactgcc ttcagttttt tccaaaggac attcttttcg 300
atcgggcgtt taccgtcggc gtcgaggtca tctgtttttc ctgtcatcag gatgatcaca 360
tccggatctg ttttcagcag ctgctccagt gtcattttca tattcacaga gtcgccgcca 420
ttgcttgaat cgctattgcc tgacgtactg attgcatatc ggtagccgac ctgtgttaaa 480
agtctcgatg taaagaagtt ttcatccctg gccataatgg tatcatttgt atttccgatc 540
aaaagcacgg actggctgtt cgcgctgatt ttctgctttg tctcgctaag cttttcttca 600
tgcgccgtca gctttttctc catttccttc tccttgccga ctgcttttgc aatcgtaagc 660
gaagcgtcaa ttgtatcctg ataatcagca tttaaattat taagtgcaat cgtcggcgct 720
atttttttca gctgatcgta caccttctta tgccgggtcg tgtcagcaat aattaaatcg 780
ggttttaatg aagcgatttt ttccatgctt ggctgtgagc gagtgccgac agatgtgtag 840
ccgtcaattt tcttcagcac atccttgttg atcagctgct tcgctttgtt gtcatcggca 900
accccgacag gcgtaatgcc gagatcaagc agtgtatcaa taaaacctag ctcaagaaca 960
acaacccgct tcggatgctc aggcacattt gtcttcccta aatcatgtgt taccgccact 1020
ttatgttctt tactgttttg attgccgctt gaagacgagc aagcagccgt taagacagaa 1080
agaagtaaaa ctgtaagaat aatcagtgtt tttttcatat gttccagtct ctcctgttgg 1140
tagtttctat ggttaagatg tccaagagta gtataacacg gaatgagaat cattatcacc 1200
aattattttt aaaatgagaa gagaaagttc ggcttacagg aaaatcttgt ttcgcgacac 1260
agcagttcag cagctgatca tcctgtccac aaaaaagctt gcagaaaaat aacattctct 1320
gcaagctgat cctgttaaag cttcacaatc actcttcctt gaatgcgatt ttgcaaaata 1380
tcttttaacg cacccggcgt ttcttccaat gatacttccc tgtccacgat ggtcagcagc 1440
tgatcaggct tgagatcaga agacatgcgc tcccaaacag cggctctgac gtccatcgga 1500
caatatactg aatcgattcc gagcaggctt actccgcgaa gaataaaagg atacacggtt 1560
gccggaactt ctcctccgcc ggttaagccg ctcactgcga cagatccgcc gtattgaatt 1620
ttgcttaaaa gcgaggcaag ctgttttccg ccgactggat caaccgctcc ctgccattgc 1680
tgcttggaca gcgccttaag cgttccgtca tagacatctt ccctgctgat tacttcgctt 1740
gcaccaagct gtttcaaata atcagccgcc tcccggtttc cggtacttgc caccacatca 1800
taaccccgct tgttcagcat cgataccgca attccgccga caccgccggt tgctcctgtg 1860
actagcacgc tgcctttttc cggagacaga ccgttctgtt caagccgatg cactgataac 1920
gccgcagtaa atcccgccgt tccgtacacc atcgcttctt ttaacgaaag attctgtggc 1980
aaaggcacca gccagtcacc aggcaccgaa gcgtattcac ttaatccgcc atcacgtgag 2040
acaccgagct catagcttgt cgcgatcacc tcatccccct ccgcaaaacg cggatcattg 2100
gaagagacga ccgtacccgc agcatcaatg cctaaaataa gcggatactc tctgacgata 2160
ttgcctcctg cttttccggc cagaccatct ttgtaattaa tgccggaata agcaacttta 2220
atcaggacac catccttcgg caaatcctct gttgatatgg ttttcacatg gactgaaaca 2280
tcatcggcat ttttttctgc ctgcaaggct tgaaataacg ttgacattcg gcacactcct 2340
tttcatttat atcgtaaccg aagaacgttc aaaaaaccaa atcatcaagc cgccattttc 2400
acttcgccgg cacattgaga caataatgga caaatccggt atcctcttca tagccgtttt 2460
gctcatacaa gcttcttgcc ttccggttgt ggtgctcagt ctgaagtgtt aaacattttg 2520
ccccgttttg ccctgcataa tcctttgcgg cagaaagcag ccggccgccg gctccctttg 2580
tacgcgcatg aggaacgaca aataagtcat ttaatatgta tatccttttc attgacacag 2640
aagaaaacgt tggatagagc tgggtaaagc ctatgaattc tccattttct tctgctatca 2700
aaataacaga ctcgtgattt tccaaacgag ctttcaaaaa agcctctgcc ccttgcaaat 2760
cggatgcctg tctataaaat tcccgatatt ggttaaacag cggcgcaatg gcggccgcat 2820
ctgatgtctt tgcttggcga atgttcatct tatttcttcc tccctctcaa taattttttc 2880
attctatccc ttttctgtaa agtttatttt tcagaatact tttatcatca tgctttgaaa 2940
aaatatcacg ataatatcca ttgttctcac ggaagcacac gcgtcgctga taaacagctg 3000
acatcaatat cctatttttt caaaaaatat tttaaaagtt gttgacttaa aagaagctaa 3060
atgttatagt aataaaacag aatagtcttt taagtaagtc tactctgaat ttttttaaaa 3120
ggagagggta aagaaagccg ccaggaaaaa cttgtctgaa tagtacggtt gcaattttta 3180
ggggaaacag atatacttaa gtgtacagaa tagtctttta agtaagtcta ctctgaattt 3240
ttttaaaagg agagggtaaa gagtgtcaac aacatatcct attgtcctgg tacacggcct 3300
ttctggtttc gatgacatcg taggataccc ttatttttat gggattgccg acgccctgga 3360
gaaagatggc cacaaagttt ttacagcctc actctctgca ttcaattcca acgaagtccg 3420
tggcgagcaa ttatgggagt tcgtgcaaaa gattctcaaa gagactaaag tcaaaaaggt 3480
gaatttgatc gggcacgcgc aaggtcctct tgcgtgtcgt tatgtggcgg ccaagcatgc 3540
taaaagtatt gcaagtgtta catctgtgaa tggagtgaat cacggtagcg aaatcgccga 3600
tcttgtcaga cggattatga gaaaagattc tgtccctgag tatatcgcgg acgcggtaat 3660
gaaggctatt ggcactataa tcagtacttt tagcggaaat agaggaaacc ctcaagacgc 3720
tatagcagct ctggaggcct taacgacgga aaacgtgatg gaatttaaca aaaaatatcc 3780
tcagggactg ccagcaattc gtgggggtga aggtaaagaa gtcgtgaacg gcgtacacta 3840
ctatagcttt ggttcttaca tacagggtct catcgctggc gagaagggaa acttgctcga 3900
tcctacccac gccgctatgc gcgttttatc cgcgtttttt tcagaacgtg agaacgatgg 3960
tttagtagga cggacttcaa tgcggctcgg caagttaatt aaagacgact acgctgagga 4020
tcatttagat atggtcaatc aagttgcggg gttagttgga cgcggggagg atataattgc 4080
tatatatacg aatcatgcca attttttagc gtcaaaaaag ctctaatcta gatacataaa 4140
aaaccggcct tggccccgcc ggttttttat tatttttctt cctccgcatg ttcaatccgc 4200
tccataatcg acggatggct ccctctgaaa attttaacga gaaacggcgg gttgacccgg 4260
ctcagtcccg taacggccaa gtcctgaaac gtctcaatcg ccgcttcccg gtttccggtc 4320
agctcaatgc cgtaacggtc ggcggcgttt tcctgatacc gggagacggc attcgtaatc 4380
aacgcctcac tcctcacatc aacccgttac ttctattgta atcataaatt caaattctta 4440
gaaccaagct gtgttccgca cttttccacc cttttaagca tggaaacccc gatcgctggg 4500
aaaactaaca atgtttggag tgatgcaaat gaaaaaaata gtggcagcca tcgtggtaat 4560
cggtcttgtg tttatcgcat ttttttatct ttacagccga tcaggcgatg tgtatcaatc 4620
ggtagacgcg gatttgatca cactgtcttc aagcggccag gaagatatcg agattgaaaa 4680
aagacagcac gtcaaagata tgctggatat tatgaatcag ggaaaacagg tgaagacaga 4740
aaaaacatca gcccctgatt acgaagggac aatcaagttt cataaagacc ggtatgactc 4800
attcagacta tggattgacg gcagccagca agccgttttt ttgaaggatg gcacatacta 4860
caaattaagc aaaaatgata caaaggcgct gctaaatatt attaaaaaag aagcaaagga 4920
ttgaaaatga aaaagcgaag ctaaccgctt cgctttttca ttttattggg gcaaaatatc 4980
tctcagtgcc cgtctgagca ttttccccgt cgcatttttc ggaatatcgt caagaaacgt 5040
aatggcggca ggccgcttgt attttgccag atgcttttcg cagtgctgca tgatgtcctc 5100
ctctgttacc ccagagcgtt tcggcaccac atatcccttt accgcttccc cgctttgggg 5160
gtccggcacg ccgatgacaa ccgcctcctt gacgtccgga tggctgtaca gcacctcctc 5220
cacctcccgc ggatacacat tgtatcctcc tacaatgatc atgtcttttt tccggtcaac 5280
aatgtaaaaa tagccgtcct catcccgtct tgccaagtcc cccgtataaa gccacccgtc 5340
ttttaatgca tgctctgttt ccatcggcat tttataatag cccttcatca cattggggcc 5400
tttcacgatc aattcgccga cctggtgagc gggcagctcg cgtccgagcg gatctacgac 5460
cttgttttcg acatgtaaga tacttgtccc gatggagccc ggctttctgc ccctgtcaaa 5520
cgggttaaag cacgtgacgg gtgatgcttc cgagagcccg tagccttcca aaatggtaac 5580
accgaatttt tcttcaaacg ccgtcagcaa cgcgactggc atggacgcgc ctcccgaaat 5640
gcacagccgg atcgaagaaa aatcatcttt ctttccgttt tcatgctgaa acaagtagtt 5700
atacattgta ggcacaccgg caaaaatggt cgcctgctgc tgcttaacaa gcttaaaaac 5760
agatgccgga ctgaattgag gctcaatcaa tacagttgcg ccgctcatca gcggtgcatt 5820
catacagacg gttaaacaaa acacgtgaaa catgggaaga gcgcagacca cattgtccct 5880
ctcatccatt cccaaatagc ctgcgacatc gttggcattg ctgtacaaat tctgatgtgt 5940
cagcatcgcg cctttcggtt ttccagtcgt tcctgacgta tataaaataa ccgcggtatc 6000
atcaggtaca ggttcttggt tttgtttagc ggcagatgtc ggccgcaata tttttgcaaa 6060
cgttgtcatt ttcatcctga cctctgggtc cgcagcttcc ggctcggcct cccccgtctg 6120
gcataaaatg acgagctcaa cctttggcag cgattcatgc atgctctcat aaagcggcaa 6180
aagctggcta acgcccacga ttgcctttac atcgccattt gtcagcatat aaccaatttc 6240
tgtcggcgtg tacaacggat tgatgggaac aactacgatc ccagctttta aagcgccaaa 6300
aaacgcgatg ataaaatcag gcgaattgcc aagcagcaaa gctaaatggt cccctttctc 6360
cataccggct tcctgaaggc cgtccgcaaa tcgctgaata tattcattca gctcttgata 6420
cgtcatcatg tgatctttaa acctgcatgc gatgctgtcg ggcttctcag atgctgtttc 6480
ttccaatttt gaaacaagat tcattctccc accccttaag tgaatgaata gtcattcatt 6540
attgaagcca agctttcttc tccattatag agaaacagaa aaaaacactc aagagcaaaa 6600
agccctgagt gtcagtactg tcatagtttc ttcaatgctt cggcaatcgg cgtatctcct 6660
tctgtcagat caaaggcccg attttccgta ttcttctcat ctaaagaggc aatgaccgtt 6720
tttgcaacgt catcacggga aataaatccc cgctccagat ccttcgctgc tgaaacagtt 6780
cccgttccag gctcattgcg aaggcctccc ggacggataa tcgtataggt taaaccgctc 6840
gcttccagaa ttttatcagc ataatgcttg gccacataat aaggcttgag tgcctcattc 6900
caattttcac ggttatgggc ttgcagggcg ctgaccataa taaaccgttt gattccggca 6960
atggccgcag cttcaatggc ttttgccgct ccatcaagat ccaccagcag cgttttatca 7020
tagcctgtgc tgccgccgga accggctgtg aaaatgatcg cgtcacaacc ttttgccgca 7080
gcggcgattt cttccgggct gccctccaga ttcgcaagca cagcttctgc accggcagct 7140
tcaagagacg ctttctgttc ttcttttctg accatcgctc tgatggaatg atcaggatta 7200
tcttggaata aagagacgag tctttgcccg atttgtccgt tcgctccgat taaaaacact 7260
ttcatgtgaa tccctcctgc ctccattatt tcaaaaacac aaccgctctt tcaaacgatg 7320
tgttttgcct tagtaaatca gatcaaggaa atcctctttc gtaatgttcc caaagtaatg 7380
<210> 42
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 42
gtcgctgata aacagctgac atcaatatcc tattttttca aaaaatattt taaaagttgt 60
tgacttaaaa gaagctaaat gttatagtaa taaa 94
<210> 43
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 43
cacgcaagag gaccttgcgc gtgcccgatc aaattcacc 39
<210> 44
<211> 3516
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 44
gcttcaaagc acccgtctcg tcaacgcctg cctcagcaac attgaatttg cagaagaaaa 60
atggcggata aaagactata atatcaacag ccacttatcc ggctttatca aataagaaaa 120
agacaggcgt ttgcctgtct tttcttttat ttcttagcag ccggcatctc tttttgaagc 180
tcgtccaaaa tggcattcgc cccgtctaca ctgcggcgca gagaccacac cgcacgatcc 240
acgtggtata catgcccgtt tttcactgcc ttcagttttt tccaaaggac attcttttcg 300
atcgggcgtt taccgtcggc gtcgaggtca tctgtttttc ctgtcatcag gatgatcaca 360
tccggatctg ttttcagcag ctgctccagt gtcattttca tattcacaga gtcgccgcca 420
ttgcttgaat cgctattgcc tgacgtactg attgcatatc ggtagccgac ctgtgttaaa 480
agtctcgatg taaagaagtt ttcatccctg gccataatgg tatcatttgt atttccgatc 540
aaaagcacgg actggctgtt cgcgctgatt ttctgctttg tctcgctaag cttttcttca 600
tgcgccgtca gctttttctc catttccttc tccttgccga ctgcttttgc aatcgtaagc 660
gaagcgtcaa ttgtatcctg ataatcagca tttaaattat taagtgcaat cgtcggcgct 720
atttttttca gctgatcgta caccttctta tgccgggtcg tgtcagcaat aattaaatcg 780
ggttttaatg aagcgatttt ttccatgctt ggctgtgagc gagtgccgac agatgtgtag 840
ccgtcaattt tcttcagcac atccttgttg atcagctgct tcgctttgtt gtcatcggca 900
accccgacag gcgtaatgcc gagatcaagc agtgtatcaa taaaacctag ctcaagaaca 960
acaacccgct tcggatgctc aggcacattt gtcttcccta aatcatgtgt taccgccact 1020
ttatgttctt tactgttttg attgccgctt gaagacgagc aagcagccgt taagacagaa 1080
agaagtaaaa ctgtaagaat aatcagtgtt tttttcatat gttccagtct ctcctgttgg 1140
tagtttctat ggttaagatg tccaagagta gtataacacg gaatgagaat cattatcacc 1200
aattattttt aaaatgagaa gagaaagttc ggcttacagg aaaatcttgt ttcgcgacac 1260
agcagttcag cagctgatca tcctgtccac aaaaaagctt gcagaaaaat aacattctct 1320
gcaagctgat cctgttaaag cttcacaatc actcttcctt gaatgcgatt ttgcaaaata 1380
tcttttaacg cacccggcgt ttcttccaat gatacttccc tgtccacgat ggtcagcagc 1440
tgatcaggct tgagatcaga agacatgcgc tcccaaacag cggctctgac gtccatcgga 1500
caatatactg aatcgattcc gagcaggctt actccgcgaa gaataaaagg atacacggtt 1560
gccggaactt ctcctccgcc ggttaagccg ctcactgcga cagatccgcc gtattgaatt 1620
ttgcttaaaa gcgaggcaag ctgttttccg ccgactggat caaccgctcc ctgccattgc 1680
tgcttggaca gcgccttaag cgttccgtca tagacatctt ccctgctgat tacttcgctt 1740
gcaccaagct gtttcaaata atcagccgcc tcccggtttc cggtacttgc caccacatca 1800
taaccccgct tgttcagcat cgataccgca attccgccga caccgccggt tgctcctgtg 1860
actagcacgc tgcctttttc cggagacaga ccgttctgtt caagccgatg cactgataac 1920
gccgcagtaa atcccgccgt tccgtacacc atcgcttctt ttaacgaaag attctgtggc 1980
aaaggcacca gccagtcacc aggcaccgaa gcgtattcac ttaatccgcc atcacgtgag 2040
acaccgagct catagcttgt cgcgatcacc tcatccccct ccgcaaaacg cggatcattg 2100
gaagagacga ccgtacccgc agcatcaatg cctaaaataa gcggatactc tctgacgata 2160
ttgcctcctg cttttccggc cagaccatct ttgtaattaa tgccggaata agcaacttta 2220
atcaggacac catccttcgg caaatcctct gttgatatgg ttttcacatg gactgaaaca 2280
tcatcggcat ttttttctgc ctgcaaggct tgaaataacg ttgacattcg gcacactcct 2340
tttcatttat atcgtaaccg aagaacgttc aaaaaaccaa atcatcaagc cgccattttc 2400
acttcgccgg cacattgaga caataatgga caaatccggt atcctcttca tagccgtttt 2460
gctcatacaa gcttcttgcc ttccggttgt ggtgctcagt ctgaagtgtt aaacattttg 2520
ccccgttttg ccctgcataa tcctttgcgg cagaaagcag ccggccgccg gctccctttg 2580
tacgcgcatg aggaacgaca aataagtcat ttaatatgta tatccttttc attgacacag 2640
aagaaaacgt tggatagagc tgggtaaagc ctatgaattc tccattttct tctgctatca 2700
aaataacaga ctcgtgattt tccaaacgag ctttcaaaaa agcctctgcc ccttgcaaat 2760
cggatgcctg tctataaaat tcccgatatt ggttaaacag cggcgcaatg gcggccgcat 2820
ctgatgtctt tgcttggcga atgttcatct tatttcttcc tccctctcaa taattttttc 2880
attctatccc ttttctgtaa agtttatttt tcagaatact tttatcatca tgctttgaaa 2940
aaatatcacg ataatatcca ttgttctcac ggaagcacac gcgtcgctga taaacagctg 3000
acatcaatat cctatttttt caaaaaatat tttaaaagtt gttgacttaa aagaagctaa 3060
atgttatagt aataaaacag aatagtcttt taagtaagtc tactctgaat ttttttaaaa 3120
ggagagggta aagaaagccg ccaggaaaaa cttgtctgaa tagtacggtt gcaattttta 3180
ggggaaacag atatacttaa gtgtacagaa tagtctttta agtaagtcta ctctgaattt 3240
ttttaaaagg agagggtaaa gagtgtcaac aacatatcct attgtcctgg tacacggcct 3300
ttctggtttc gatgacatcg taggataccc ttatttttat gggattgccg acgccctgga 3360
gaaagatggc cacaaagttt ttacagcctc actctctgca ttcaattcca acgaagtccg 3420
tggcgagcaa ttatgggagt tcgtgcaaaa gattctcaaa gagactaaag tcaaaaaggt 3480
gaatttgatc gggcacgcgc aaggtcctct tgcgtg 3516
<210> 45
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 45
ggtgaatttg atcgggcacg cgcaaggtcc tcttgcgtg 39
<210> 46
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 46
cattactttg ggaacattac gaaagagg 28
<210> 47
<211> 3903
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 47
ggtgaatttg atcgggcacg cgcaaggtcc tcttgcgtgt cgttatgtgg cggccaagca 60
tgctaaaagt attgcaagtg ttacatctgt gaatggagtg aatcacggta gcgaaatcgc 120
cgatcttgtc agacggatta tgagaaaaga ttctgtccct gagtatatcg cggacgcggt 180
aatgaaggct attggcacta taatcagtac ttttagcgga aatagaggaa accctcaaga 240
cgctatagca gctctggagg ccttaacgac ggaaaacgtg atggaattta acaaaaaata 300
tcctcaggga ctgccagcaa ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca 360
ctactatagc tttggttctt acatacaggg tctcatcgct ggcgagaagg gaaacttgct 420
cgatcctacc cacgccgcta tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga 480
tggtttagta ggacggactt caatgcggct cggcaagtta attaaagacg actacgctga 540
ggatcattta gatatggtca atcaagttgc ggggttagtt ggacgcgggg aggatataat 600
tgctatatat acgaatcatg ccaatttttt agcgtcaaaa aagctctaat ctagatacat 660
aaaaaaccgg ccttggcccc gccggttttt tattattttt cttcctccgc atgttcaatc 720
cgctccataa tcgacggatg gctccctctg aaaattttaa cgagaaacgg cgggttgacc 780
cggctcagtc ccgtaacggc caagtcctga aacgtctcaa tcgccgcttc ccggtttccg 840
gtcagctcaa tgccgtaacg gtcggcggcg ttttcctgat accgggagac ggcattcgta 900
atcaacgcct cactcctcac atcaacccgt tacttctatt gtaatcataa attcaaattc 960
ttagaaccaa gctgtgttcc gcacttttcc acccttttaa gcatggaaac cccgatcgct 1020
gggaaaacta acaatgtttg gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt 1080
aatcggtctt gtgtttatcg cattttttta tctttacagc cgatcaggcg atgtgtatca 1140
atcggtagac gcggatttga tcacactgtc ttcaagcggc caggaagata tcgagattga 1200
aaaaagacag cacgtcaaag atatgctgga tattatgaat cagggaaaac aggtgaagac 1260
agaaaaaaca tcagcccctg attacgaagg gacaatcaag tttcataaag accggtatga 1320
ctcattcaga ctatggattg acggcagcca gcaagccgtt tttttgaagg atggcacata 1380
ctacaaatta agcaaaaatg atacaaaggc gctgctaaat attattaaaa aagaagcaaa 1440
ggattgaaaa tgaaaaagcg aagctaaccg cttcgctttt tcattttatt ggggcaaaat 1500
atctctcagt gcccgtctga gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa 1560
cgtaatggcg gcaggccgct tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc 1620
ctcctctgtt accccagagc gtttcggcac cacatatccc tttaccgctt ccccgctttg 1680
ggggtccggc acgccgatga caaccgcctc cttgacgtcc ggatggctgt acagcacctc 1740
ctccacctcc cgcggataca cattgtatcc tcctacaatg atcatgtctt ttttccggtc 1800
aacaatgtaa aaatagccgt cctcatcccg tcttgccaag tcccccgtat aaagccaccc 1860
gtcttttaat gcatgctctg tttccatcgg cattttataa tagcccttca tcacattggg 1920
gcctttcacg atcaattcgc cgacctggtg agcgggcagc tcgcgtccga gcggatctac 1980
gaccttgttt tcgacatgta agatacttgt cccgatggag cccggctttc tgcccctgtc 2040
aaacgggtta aagcacgtga cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt 2100
aacaccgaat ttttcttcaa acgccgtcag caacgcgact ggcatggacg cgcctcccga 2160
aatgcacagc cggatcgaag aaaaatcatc tttctttccg ttttcatgct gaaacaagta 2220
gttatacatt gtaggcacac cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa 2280
aacagatgcc ggactgaatt gaggctcaat caatacagtt gcgccgctca tcagcggtgc 2340
attcatacag acggttaaac aaaacacgtg aaacatggga agagcgcaga ccacattgtc 2400
cctctcatcc attcccaaat agcctgcgac atcgttggca ttgctgtaca aattctgatg 2460
tgtcagcatc gcgcctttcg gttttccagt cgttcctgac gtatataaaa taaccgcggt 2520
atcatcaggt acaggttctt ggttttgttt agcggcagat gtcggccgca atatttttgc 2580
aaacgttgtc attttcatcc tgacctctgg gtccgcagct tccggctcgg cctcccccgt 2640
ctggcataaa atgacgagct caacctttgg cagcgattca tgcatgctct cataaagcgg 2700
caaaagctgg ctaacgccca cgattgcctt tacatcgcca tttgtcagca tataaccaat 2760
ttctgtcggc gtgtacaacg gattgatggg aacaactacg atcccagctt ttaaagcgcc 2820
aaaaaacgcg atgataaaat caggcgaatt gccaagcagc aaagctaaat ggtccccttt 2880
ctccataccg gcttcctgaa ggccgtccgc aaatcgctga atatattcat tcagctcttg 2940
atacgtcatc atgtgatctt taaacctgca tgcgatgctg tcgggcttct cagatgctgt 3000
ttcttccaat tttgaaacaa gattcattct cccacccctt aagtgaatga atagtcattc 3060
attattgaag ccaagctttc ttctccatta tagagaaaca gaaaaaaaca ctcaagagca 3120
aaaagccctg agtgtcagta ctgtcatagt ttcttcaatg cttcggcaat cggcgtatct 3180
ccttctgtca gatcaaaggc ccgattttcc gtattcttct catctaaaga ggcaatgacc 3240
gtttttgcaa cgtcatcacg ggaaataaat ccccgctcca gatccttcgc tgctgaaaca 3300
gttcccgttc caggctcatt gcgaaggcct cccggacgga taatcgtata ggttaaaccg 3360
ctcgcttcca gaattttatc agcataatgc ttggccacat aataaggctt gagtgcctca 3420
ttccaatttt cacggttatg ggcttgcagg gcgctgacca taataaaccg tttgattccg 3480
gcaatggccg cagcttcaat ggcttttgcc gctccatcaa gatccaccag cagcgtttta 3540
tcatagcctg tgctgccgcc ggaaccggct gtgaaaatga tcgcgtcaca accttttgcc 3600
gcagcggcga tttcttccgg gctgccctcc agattcgcaa gcacagcttc tgcaccggca 3660
gcttcaagag acgctttctg ttcttctttt ctgaccatcg ctctgatgga atgatcagga 3720
ttatcttgga ataaagagac gagtctttgc ccgatttgtc cgttcgctcc gattaaaaac 3780
actttcatgt gaatccctcc tgcctccatt atttcaaaaa cacaaccgct ctttcaaacg 3840
atgtgttttg ccttagtaaa tcagatcaag gaaatcctct ttcgtaatgt tcccaaagta 3900
atg 3903
<210> 48
<211> 7334
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 48
tcgtcaacgc ctgcctcagc aacattgaat ttgcagaaga aaaatggcgg ataaaagact 60
ataatatcaa cagccactta tccggcttta tcaaataaga aaaagacagg cgtttgcctg 120
tcttttcttt tatttcttag cagccggcat ctctttttga agctcgtcca aaatggcatt 180
cgccccgtct acactgcggc gcagagacca caccgcacga tccacgtggt atacatgccc 240
gtttttcact gccttcagtt ttttccaaag gacattcttt tcgatcgggc gtttaccgtc 300
ggcgtcgagg tcatctgttt ttcctgtcat caggatgatc acatccggat ctgttttcag 360
cagctgctcc agtgtcattt tcatattcac agagtcgccg ccattgcttg aatcgctatt 420
gcctgacgta ctgattgcat atcggtagcc gacctgtgtt aaaagtctcg atgtaaagaa 480
gttttcatcc ctggccataa tggtatcatt tgtatttccg atcaaaagca cggactggct 540
gttcgcgctg attttctgct ttgtctcgct aagcttttct tcatgcgccg tcagcttttt 600
ctccatttcc ttctccttgc cgactgcttt tgcaatcgta agcgaagcgt caattgtatc 660
ctgataatca gcatttaaat tattaagtgc aatcgtcggc gctatttttt tcagctgatc 720
gtacaccttc ttatgccggg tcgtgtcagc aataattaaa tcgggtttta atgaagcgat 780
tttttccatg cttggctgtg agcgagtgcc gacagatgtg tagccgtcaa ttttcttcag 840
cacatccttg ttgatcagct gcttcgcttt gttgtcatcg gcaaccccga caggcgtaat 900
gccgagatca agcagtgtat caataaaacc tagctcaaga acaacaaccc gcttcggatg 960
ctcaggcaca tttgtcttcc ctaaatcatg tgttaccgcc actttatgtt ctttactgtt 1020
ttgattgccg cttgaagacg agcaagcagc cgttaagaca gaaagaagta aaactgtaag 1080
aataatcagt gtttttttca tatgttccag tctctcctgt tggtagtttc tatggttaag 1140
atgtccaaga gtagtataac acggaatgag aatcattatc accaattatt tttaaaatga 1200
gaagagaaag ttcggcttac aggaaaatct tgtttcgcga cacagcagtt cagcagctga 1260
tcatcctgtc cacaaaaaag cttgcagaaa aataacattc tctgcaagct gatcctgtta 1320
aagcttcaca atcactcttc cttgaatgcg attttgcaaa atatctttta acgcacccgg 1380
cgtttcttcc aatgatactt ccctgtccac gatggtcagc agctgatcag gcttgagatc 1440
agaagacatg cgctcccaaa cagcggctct gacgtccatc ggacaatata ctgaatcgat 1500
tccgagcagg cttactccgc gaagaataaa aggatacacg gttgccggaa cttctcctcc 1560
gccggttaag ccgctcactg cgacagatcc gccgtattga attttgctta aaagcgaggc 1620
aagctgtttt ccgccgactg gatcaaccgc tccctgccat tgctgcttgg acagcgcctt 1680
aagcgttccg tcatagacat cttccctgct gattacttcg cttgcaccaa gctgtttcaa 1740
ataatcagcc gcctcccggt ttccggtact tgccaccaca tcataacccc gcttgttcag 1800
catcgatacc gcaattccgc cgacaccgcc ggttgctcct gtgactagca cgctgccttt 1860
ttccggagac agaccgttct gttcaagccg atgcactgat aacgccgcag taaatcccgc 1920
cgttccgtac accatcgctt cttttaacga aagattctgt ggcaaaggca ccagccagtc 1980
accaggcacc gaagcgtatt cacttaatcc gccatcacgt gagacaccga gctcatagct 2040
tgtcgcgatc acctcatccc cctccgcaaa acgcggatca ttggaagaga cgaccgtacc 2100
cgcagcatca atgcctaaaa taagcggata ctctctgacg atattgcctc ctgcttttcc 2160
ggccagacca tctttgtaat taatgccgga ataagcaact ttaatcagga caccatcctt 2220
cggcaaatcc tctgttgata tggttttcac atggactgaa acatcatcgg catttttttc 2280
tgcctgcaag gcttgaaata acgttgacat tcggcacact ccttttcatt tatatcgtaa 2340
ccgaagaacg ttcaaaaaac caaatcatca agccgccatt ttcacttcgc cggcacattg 2400
agacaataat ggacaaatcc ggtatcctct tcatagccgt tttgctcata caagcttctt 2460
gccttccggt tgtggtgctc agtctgaagt gttaaacatt ttgccccgtt ttgccctgca 2520
taatcctttg cggcagaaag cagccggccg ccggctccct ttgtacgcgc atgaggaacg 2580
acaaataagt catttaatat gtatatcctt ttcattgaca cagaagaaaa cgttggatag 2640
agctgggtaa agcctatgaa ttctccattt tcttctgcta tcaaaataac agactcgtga 2700
ttttccaaac gagctttcaa aaaagcctct gccccttgca aatcggatgc ctgtctataa 2760
aattcccgat attggttaaa cagcggcgca atggcggccg catctgatgt ctttgcttgg 2820
cgaatgttca tcttatttct tcctccctct caataatttt ttcattctat cccttttctg 2880
taaagtttat ttttcagaat acttttatca tcatgctttg aaaaaatatc acgataatat 2940
ccattgttct cacggaagca cacgcgtcgc tgataaacag ctgacatcaa tatcctattt 3000
tttcaaaaaa tattttaaaa gttgttgact taaaagaagc taaatgttat agtaataaaa 3060
cagaatagtc ttttaagtaa gtctactctg aattttttta aaaggagagg gtaaagaaag 3120
ccgccaggaa aaacttgtct gaatagtacg gttgcaattt ttaggggaaa cagatatact 3180
taagtgtaca gaatagtctt ttaagtaagt ctactctgaa tttttttaaa aggagagggt 3240
aaagagtgtc aacaacatat cctattgtcc tggtacacgg cctttctggt ttcgatgaca 3300
tcgtaggata cccttatttt tatgggattg ccgacgccct ggagaaagat ggccacaaag 3360
tttttacagc ctcactctct gcattcaatt ccaacgaagt ccgtggcgag caattatggg 3420
agttcgtgca aaagattctc aaagagacta aagtcaaaaa ggtgaatttg atcgggcacg 3480
cgcaaggtcc tcttgcgtgt cgttatgtgg cggccaagca tgctaaaagt attgcaagtg 3540
ttacatctgt gaatggagtg aatcacggta gcgaaatcgc cgatcttgtc agacggatta 3600
tgagaaaaga ttctgtccct gagtatatcg cggacgcggt aatgaaggct attggcacta 3660
taatcagtac ttttagcgga aatagaggaa accctcaaga cgctatagca gctctggagg 3720
ccttaacgac ggaaaacgtg atggaattta acaaaaaata tcctcaggga ctgccagcaa 3780
ttcgtggggg tgaaggtaaa gaagtcgtga acggcgtaca ctactatagc tttggttctt 3840
acatacaggg tctcatcgct ggcgagaagg gaaacttgct cgatcctacc cacgccgcta 3900
tgcgcgtttt atccgcgttt ttttcagaac gtgagaacga tggtttagta ggacggactt 3960
caatgcggct cggcaagtta attaaagacg actacgctga ggatcattta gatatggtca 4020
atcaagttgc ggggttagtt ggacgcgggg aggatataat tgctatatat acgaatcatg 4080
ccaatttttt agcgtcaaaa aagctctaat ctagatacat aaaaaaccgg ccttggcccc 4140
gccggttttt tattattttt cttcctccgc atgttcaatc cgctccataa tcgacggatg 4200
gctccctctg aaaattttaa cgagaaacgg cgggttgacc cggctcagtc ccgtaacggc 4260
caagtcctga aacgtctcaa tcgccgcttc ccggtttccg gtcagctcaa tgccgtaacg 4320
gtcggcggcg ttttcctgat accgggagac ggcattcgta atcaacgcct cactcctcac 4380
atcaacccgt tacttctatt gtaatcataa attcaaattc ttagaaccaa gctgtgttcc 4440
gcacttttcc acccttttaa gcatggaaac cccgatcgct gggaaaacta acaatgtttg 4500
gagtgatgca aatgaaaaaa atagtggcag ccatcgtggt aatcggtctt gtgtttatcg 4560
cattttttta tctttacagc cgatcaggcg atgtgtatca atcggtagac gcggatttga 4620
tcacactgtc ttcaagcggc caggaagata tcgagattga aaaaagacag cacgtcaaag 4680
atatgctgga tattatgaat cagggaaaac aggtgaagac agaaaaaaca tcagcccctg 4740
attacgaagg gacaatcaag tttcataaag accggtatga ctcattcaga ctatggattg 4800
acggcagcca gcaagccgtt tttttgaagg atggcacata ctacaaatta agcaaaaatg 4860
atacaaaggc gctgctaaat attattaaaa aagaagcaaa ggattgaaaa tgaaaaagcg 4920
aagctaaccg cttcgctttt tcattttatt ggggcaaaat atctctcagt gcccgtctga 4980
gcattttccc cgtcgcattt ttcggaatat cgtcaagaaa cgtaatggcg gcaggccgct 5040
tgtattttgc cagatgcttt tcgcagtgct gcatgatgtc ctcctctgtt accccagagc 5100
gtttcggcac cacatatccc tttaccgctt ccccgctttg ggggtccggc acgccgatga 5160
caaccgcctc cttgacgtcc ggatggctgt acagcacctc ctccacctcc cgcggataca 5220
cattgtatcc tcctacaatg atcatgtctt ttttccggtc aacaatgtaa aaatagccgt 5280
cctcatcccg tcttgccaag tcccccgtat aaagccaccc gtcttttaat gcatgctctg 5340
tttccatcgg cattttataa tagcccttca tcacattggg gcctttcacg atcaattcgc 5400
cgacctggtg agcgggcagc tcgcgtccga gcggatctac gaccttgttt tcgacatgta 5460
agatacttgt cccgatggag cccggctttc tgcccctgtc aaacgggtta aagcacgtga 5520
cgggtgatgc ttccgagagc ccgtagcctt ccaaaatggt aacaccgaat ttttcttcaa 5580
acgccgtcag caacgcgact ggcatggacg cgcctcccga aatgcacagc cggatcgaag 5640
aaaaatcatc tttctttccg ttttcatgct gaaacaagta gttatacatt gtaggcacac 5700
cggcaaaaat ggtcgcctgc tgctgcttaa caagcttaaa aacagatgcc ggactgaatt 5760
gaggctcaat caatacagtt gcgccgctca tcagcggtgc attcatacag acggttaaac 5820
aaaacacgtg aaacatggga agagcgcaga ccacattgtc cctctcatcc attcccaaat 5880
agcctgcgac atcgttggca ttgctgtaca aattctgatg tgtcagcatc gcgcctttcg 5940
gttttccagt cgttcctgac gtatataaaa taaccgcggt atcatcaggt acaggttctt 6000
ggttttgttt agcggcagat gtcggccgca atatttttgc aaacgttgtc attttcatcc 6060
tgacctctgg gtccgcagct tccggctcgg cctcccccgt ctggcataaa atgacgagct 6120
caacctttgg cagcgattca tgcatgctct cataaagcgg caaaagctgg ctaacgccca 6180
cgattgcctt tacatcgcca tttgtcagca tataaccaat ttctgtcggc gtgtacaacg 6240
gattgatggg aacaactacg atcccagctt ttaaagcgcc aaaaaacgcg atgataaaat 6300
caggcgaatt gccaagcagc aaagctaaat ggtccccttt ctccataccg gcttcctgaa 6360
ggccgtccgc aaatcgctga atatattcat tcagctcttg atacgtcatc atgtgatctt 6420
taaacctgca tgcgatgctg tcgggcttct cagatgctgt ttcttccaat tttgaaacaa 6480
gattcattct cccacccctt aagtgaatga atagtcattc attattgaag ccaagctttc 6540
ttctccatta tagagaaaca gaaaaaaaca ctcaagagca aaaagccctg agtgtcagta 6600
ctgtcatagt ttcttcaatg cttcggcaat cggcgtatct ccttctgtca gatcaaaggc 6660
ccgattttcc gtattcttct catctaaaga ggcaatgacc gtttttgcaa cgtcatcacg 6720
ggaaataaat ccccgctcca gatccttcgc tgctgaaaca gttcccgttc caggctcatt 6780
gcgaaggcct cccggacgga taatcgtata ggttaaaccg ctcgcttcca gaattttatc 6840
agcataatgc ttggccacat aataaggctt gagtgcctca ttccaatttt cacggttatg 6900
ggcttgcagg gcgctgacca taataaaccg tttgattccg gcaatggccg cagcttcaat 6960
ggcttttgcc gctccatcaa gatccaccag cagcgtttta tcatagcctg tgctgccgcc 7020
ggaaccggct gtgaaaatga tcgcgtcaca accttttgcc gcagcggcga tttcttccgg 7080
gctgccctcc agattcgcaa gcacagcttc tgcaccggca gcttcaagag acgctttctg 7140
ttcttctttt ctgaccatcg ctctgatgga atgatcagga ttatcttgga ataaagagac 7200
gagtctttgc ccgatttgtc cgttcgctcc gattaaaaac actttcatgt gaatccctcc 7260
tgcctccatt atttcaaaaa cacaaccgct ctttcaaacg atgtgttttg ccttagtaaa 7320
tcagatcaag gaaa 7334
<210> 49
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 49
gaagctgaat gagatttctt aaggc 25
<210> 50
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<400> 50
aaggaggctt atttccgctt ttc 23

Claims (16)

1.一种用于在不使用可选择标记的情况下将供体DNA整合进芽孢杆菌属物种(Bacillus sp.)细胞的基因组中的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群以及将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含侧翼为上游同源臂(HR1)和下游同源臂(HR2)的供体DNA,其中每个同源臂长度是至少900个核苷酸,其中所述DNA构建体不包含可选择标记。
2.一种用于在不使用可选择标记的情况下缺失芽孢杆菌属物种细胞的基因组中的核苷酸序列的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群以及将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含上游同源臂(HR1)和下游同源臂(HR2),其中每个同源臂长度是至少900个核苷酸并且与侧翼于所述待缺失的核苷酸序列的基因组DNA区域具有序列同源性,其中所述DNA构建体不包含可选择标记。
3.如权利要求1或2所述的方法,其中每个同源臂长度是至少900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、5000、6000个核苷酸和高达7000个核苷酸。
4.如权利要求1或2所述的方法,其中所述线性DNA构建体是双链DNA。
5.如权利要求1或2所述的方法,其中所述感受态芽孢杆菌属物种细胞选自由以下组成的组:枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacillus licheniformis)、迟缓芽孢杆菌(Bacillus lentus)、短小芽孢杆菌(Bacillus brevis)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、克劳氏芽孢杆菌(Bacillus clausii)、耐盐芽孢杆菌(Bacillus halodurans)、巨大芽孢杆菌(Bacillus megaterium)、凝结芽孢杆菌(Bacillus coagulans)、环状芽孢杆菌(Bacillus circulans)、灿烂芽孢杆菌(Bacilluslautus)、和苏云金芽孢杆菌(Bacillus thuringiensis)。
6.如权利要求1或2所述的方法,其中所述感受态芽孢杆菌属物种细胞通过引入的核酸构建体的至少一个拷贝而成为感受态,所述引入的核酸构建体包含与编码选自由ComK、ComS或其任一种组合组成的组的多肽的多核苷酸可操作地连接的启动子。
7.如权利要求1或2所述的方法,其中所述感受态芽孢杆菌属物种细胞来自超级感受态芽孢杆菌属物种菌株。
8.如权利要求8所述的方法,其中所述超级感受态芽孢杆菌属物种菌株是Pxyl-ComK菌株。
9.如权利要求1所述的方法,其中所述供体DNA包含选自由以下组成的组的核苷酸序列:目的多核苷酸、目的基因、目的基因的多个拷贝、一种或多种重组DNA、转录调节序列、翻译调节序列、启动子序列、终止子序列、转基因核酸序列、与信使RNA的至少一部分互补的反义序列、异源序列、或其任一种组合。
10.如权利要求1所述的方法,其进一步包括使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,以及鉴定已将所述供体DNA序列稳定地整合进其基因组中的芽孢杆菌属物种子代细胞。
11.如权利要求2所述的方法,其进一步包括使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,以及鉴定已从其基因组中缺失所述核苷酸序列的芽孢杆菌属物种子代细胞。
12.如权利要求2所述的方法,其中所述线性DNA构建体进一步包含侧翼为所述上游同源臂(HR1)和下游同源臂(HR2)的供体DNA,其中将所述供体DNA插入到所述芽孢杆菌属物种细胞的基因组中而将所述核苷酸序列在所述芽孢杆菌属物种细胞的所述基因组中缺失。
13.如权利要求12所述的方法,其进一步包括使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,以及鉴定已从其基因组中缺失所述核苷酸序列且已将所述供体DNA整合进其基因组中的芽孢杆菌属物种子代细胞。
14.一种用于在不使用可选择标记的情况下将突变引入芽孢杆菌属物种细胞的基因组中的方法,所述方法包括提供感受态芽孢杆菌属物种细胞群以及将线性DNA构建体引入所述细胞群的至少一个芽孢杆菌属物种细胞中,其中所述DNA构建体包含具有希望的突变的核苷酸序列,所述具有希望的突变的核苷酸序列侧翼为上游同源臂(HR1)和下游同源臂(HR2),并且其中每个同源臂长度是至少900个核苷酸,其中所述DNA构建体不包含可选择标记。
15.如权利要求14所述的方法,其进一步包括使来自所述至少一个芽孢杆菌属物种细胞的不包含可选择标记的子代细胞在培养基上生长,以及鉴定在其基因组中具有所述突变的芽孢杆菌属物种子代细胞。
16.一种分离的芽孢杆菌属物种细胞,其由如权利要求1、2或14中任一项所述的方法产生。
CN202080093883.9A 2019-11-19 2020-11-18 用于修饰芽孢杆菌属基因组的无选择标记方法及其组合物 Withdrawn CN114981428A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962937372P 2019-11-19 2019-11-19
US62/937,372 2019-11-19
PCT/US2020/060988 WO2021101950A1 (en) 2019-11-19 2020-11-18 Selection marker free methods for modifying the genome of bacillus and compositions thereof

Publications (1)

Publication Number Publication Date
CN114981428A true CN114981428A (zh) 2022-08-30

Family

ID=73793838

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080093883.9A Withdrawn CN114981428A (zh) 2019-11-19 2020-11-18 用于修饰芽孢杆菌属基因组的无选择标记方法及其组合物

Country Status (6)

Country Link
US (1) US20220389459A1 (zh)
EP (1) EP4061939A1 (zh)
JP (1) JP2023502967A (zh)
KR (1) KR20220098245A (zh)
CN (1) CN114981428A (zh)
WO (1) WO2021101950A1 (zh)

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5380831A (en) 1986-04-04 1995-01-10 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene
US5107065A (en) 1986-03-28 1992-04-21 Calgene, Inc. Anti-sense regulation of gene expression in plant cells
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US5231020A (en) 1989-03-30 1993-07-27 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
US5034323A (en) 1989-03-30 1991-07-23 Dna Plant Technology Corporation Genetic engineering of novel plant phenotypes
TW261517B (zh) 1991-11-29 1995-11-01 Mitsubishi Shozi Kk
US5955310A (en) 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
US6509185B1 (en) 2000-01-07 2003-01-21 Genencor International, Inc. Mutant aprE promotor
DK1309677T4 (da) 2000-08-11 2012-06-25 Genencor Int Bacillustransformation, transformanter og mutantbiblioteker
US20060057633A1 (en) 2002-04-22 2006-03-16 Cervin Marguerite A Methods of creating modified promoters resulting in varying levels of gene expression
US20050221446A1 (en) 2004-03-31 2005-10-06 Novozymes Biopolymer A/S. Methods for producing hyaluronic acid in a Bacillus cell
EP3284833B1 (en) 2005-08-26 2021-12-01 DuPont Nutrition Biosciences ApS Use of crispr associated genes (cas)
US20140329309A1 (en) 2011-12-09 2014-11-06 Danisco Us Inc. Ribosomal Promoters for Production in Microorganisms
EP4289948A3 (en) 2012-05-25 2024-04-17 The Regents of the University of California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
CN104232674A (zh) * 2014-07-15 2014-12-24 广东肇庆星湖生物科技股份有限公司 一种提高解淀粉芽孢杆菌生产鸟苷产量的方法

Also Published As

Publication number Publication date
WO2021101950A1 (en) 2021-05-27
JP2023502967A (ja) 2023-01-26
EP4061939A1 (en) 2022-09-28
US20220389459A1 (en) 2022-12-08
KR20220098245A (ko) 2022-07-11

Similar Documents

Publication Publication Date Title
KR102375732B1 (ko) 바실러스 리체니포르미스에서 단백질 생산을 증가시키기 위한 조성물 및 방법
US6808896B2 (en) Method for stable chromosomal multi-copy integration of genes
JP4571304B2 (ja) バチルス細胞内でのポリペプチドの製法
EP2235176B1 (en) Enhanced protein production in bacillus
EP2029732B1 (en) Chloramphenicol resistance selection in bacillus licheniformis
JP2005523015A (ja) 種々の遺伝子発現レベルを有する細菌クローンのライブラリーを構築する方法。
US20220162621A1 (en) Methods For Polynucleotide Integration Into The Genome Of Bacillus Using Dual Circular Recombinant DNA Constructs And Compositions Thereof
US20220177923A1 (en) Methods for integrating a donor DNA sequence into the genome of bacillus using linear recombinant DNA constructs and compositions thereof
CN115605597A (zh) 用于产生赋予低至中等表达的组成型细菌启动子的方法
CN114981428A (zh) 用于修饰芽孢杆菌属基因组的无选择标记方法及其组合物
CN116897160A (zh) 在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组合物
CN115176018A (zh) 用于大肠杆菌和芽孢杆菌中表达的穿梭载体
US20130217097A1 (en) Cell with improved secretion mediated by mrga protein or homologue
CN115335503A (zh) 用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法
DK1297170T3 (en) A process for stable chromosomal integration of multiple copies of the genes
CN111630165A (zh) 通过抑制条件性必需基因进行反向选择
JP4749060B2 (ja) 新規プロモーターdna及び該dnaを用いたタンパク質の生産方法
JP2001008686A (ja) 自然形質転換能を有する納豆菌
Lee et al. Cloning and mulecular characterization of a nprX gene of bacillus subtilis NS15-4 encoding a neutral protease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220830

WW01 Invention patent application withdrawn after publication