CN112119164A

CN112119164A - 糖苷酶在低聚糖生产中的用途

Info

Publication number: CN112119164A
Application number: CN201980032286.2A
Authority: CN
Inventors: S·詹尼温; D·瓦滕伯格
Original assignee: Jennewein Biotechnologie GmbH
Current assignee: Chr Hansen HMO GmbH
Priority date: 2018-05-16
Filing date: 2019-05-13
Publication date: 2020-12-22
Also published as: JP2021524232A; WO2019219578A1; JP2024081772A; SG11202010730SA; PH12020551940A1; BR112020023228A2; EP3569713A1; AU2019270211B2; EP3794134A1; AU2025200092A1; JP2024081773A; AU2019270211A1; KR20210010472A; MX2020012152A; US20210363557A1; JP2024081771A

Abstract

公开了一种使用基因工程微生物宿主细胞生产所需低聚糖的方法，所述基因工程微生物宿主细胞已被基因工程改造以表达异源糖苷酶，其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物。

Description

糖苷酶在低聚糖生产中的用途

本发明涉及通过微生物发酵生产低聚糖。更具体地，本发明涉及糖苷酶通过微生物发酵改善所需低聚糖的生产的用途。

背景技术

人乳含有称为人乳低聚糖(HMO)的不同低聚糖的独特混合物。迄今为止，已在人乳中鉴定出150多种结构不同的低聚糖。除极少数例外以外，HMO的特征在于在其还原端为乳糖部分，许多HMO在其非还原端含有岩藻糖残基和/或N-乙酰神经氨酸残基。通常，HMO的单糖残基来源于D-葡萄糖、D-半乳糖、N-乙酰葡糖胺、L-岩藻糖和N-乙酰神经氨酸。HMO对婴儿营养的重要性与其独特的生物活性直接相关，所述生物活性包括保护新生儿免受病原体的侵害，支持婴儿免疫系统和认知能力的发育。因此，人们对以商业规模制备HMO具有强烈的兴趣。

除了单个HMO的化学合成外，在使用过表达异源糖基转移酶的基因修饰的微生物通过微生物发酵生产HMO的开发中也取得了相当大的进展。在允许微生物表达所述异源糖基转移酶的培养基中和条件下培养此类微生物时，所述微生物可以产生HMO，并从培养基或细胞裂解物中回收。

然而，糖基转移酶通常具有酶的副活性，使得它们产生所需低聚糖的过表达通常会导致不需要的副产物。通常，这些副产物也是低聚糖，但必须从所需低聚糖的制备中去除，以用于产品的商业用途。然而，从所需低聚糖中去除此类副产物是困难和麻烦的。去除此类副产物的一种方法涉及使用糖苷酶，其是外源添加到含有所需和不需要的低聚糖的反应混合物/细胞培养基中，或者是由基因工程微生物在用于生产所需低聚糖的发酵过程结束时经在特定时间点诱导产生的。

国际公布号WO 2015/032412 A1涉及岩藻糖的用途，并公开了一种方法，其中在乳糖存在下培养表达异源岩藻糖基转移酶的基因修饰细胞，以高产率产生和分泌2’-岩藻糖基乳糖(2’-FL)和二岩藻糖基乳糖(DFL)的混合物至培养基的细胞外空间。分离糖，并通过酸或岩藻糖苷酶进行水解以高产率产生岩藻糖。

国际公布号WO 2104/090261 A1公开了一种形成含有2’-FL和3-岩藻糖基乳糖(3-FL)的至少一种的混合物的方法，其中将DFL部分水解，例如酶水解或酸水解。在酶水解中，将DFL暴露于岩藻糖苷酶中，该酶可从DFL中释放一个岩藻糖残基。将DFL(10mM)与来自曼尼霍蒂斯黄单胞菌(Xanthomonas manihotis)的1,2-α-L-岩藻糖苷酶在37℃下在孵育缓冲液中孵育，水解DFL，然后通过HPLC。在18小时后，DFL被部分水解为3-FL和岩藻糖。未检出乳糖。

欧洲专利申请号EP 2 845 905 A1涉及低聚糖的生产，并公开了在生产和/或纯化低聚糖的方法中使用一种或多种糖苷酶。所述方法包括：a)在允许生产所述所需低聚糖的条件下和培养基中培育适合生产所需低聚糖的宿主微生物，从而生产低聚糖，并在适用的情况下生产生物合成糖中间体和/或副产物；b)在培养宿主微生物的培养基中使用糖苷酶，以降解生物合成的糖中间体和/或糖副产物和/或未使用的糖底物；和c)回收所需低聚糖。在实施方案中，所述糖苷酶是在宿主微生物中内源生产的，其中所述糖苷酶是在宿主微生物中非天然存在的糖苷酶，并且其中所述糖苷酶在所述宿主微生物中的表达是可诱导的，使得在宿主微生物的培养过程中已经产生了足够和/或基本上最大量的所需低聚糖后，可以启动该表达。

总之，现有技术公开了糖苷酶在反应混合物/细胞培养基中通过水解不需要的低聚糖从所需和不需要的低聚糖的混合物中去除不需要的低聚糖的用途。然而，这些方法包括通过微生物(包括使用底物和能量)对不需要的低聚糖的生物合成，并且这些方法需要从所需低聚糖中去除不需要的低聚糖的降解产物。

因此，本发明的目的是提供一种生产所需低聚糖的方法，其在含有待发酵的微生物的细胞培养基中通过微生物发酵进行，而不同时产生/积累不需要的糖副产物，即不需要的低聚糖。

所述目的是通过提供能够产生所需低聚糖的基因工程微生物宿主细胞来解决的，其中所述微生物宿主细胞表达异源糖苷酶，其能够降解细胞内生物合成所需低聚糖过程中产生的胞内代谢产物，从而防止在培养基中形成所需和不需要的糖的混合物。然后，所述降解产物可通过微生物宿主细胞的代谢利用，例如用于生物合成所需低聚糖。

表1提供了所需低聚糖和在生产所需低聚糖的过程中添加的可想到的前体和/或产生的不需要的糖副产物的综合概述。

表1：所需低聚糖和在生产所需低聚糖的过程中添加的可想到的前体和/或产生的不需要的糖副产物的概述。

发明内容

在第一方面，公开了一种使用能够产生所需低聚糖的基因工程微生物宿主细胞生产所需低聚糖的方法，所述微生物宿主细胞表达异源糖苷酶，其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物。

在第二方面，公开了一种用于生产所需低聚糖的基因工程微生物宿主细胞，其中所述微生物宿主细胞能够产生所需低聚糖，并且其中所述微生物宿主细胞已被基因工程改造以表达异源糖苷酶，其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物。

在第三方面，公开了根据第二方面的基因工程微生物宿主细胞用于生产所需低聚糖的用途。

在第四方面，公开了由根据第一方面的方法和/或使用根据第二方面的基因工程微生物宿主细胞生产的低聚糖，即所需低聚糖。

在第五方面，公开了根据第四方面的所需低聚糖用于生产营养组合物的用途。

在第六方面，公开了包含根据第四方面的所需低聚糖的营养组合物。

附图说明

图1示出了表达异源糖苷酶(如α-1,3-岩藻糖苷酶)的微生物宿主细胞的实施方案的示意图，所述异源糖苷酶能够降解在所需低聚糖(2’-岩藻糖基乳糖)的细胞内生物合成过程中产生的代谢糖副产物(例如3-岩藻糖基乳糖和2’3-二岩藻糖基乳糖)，其中微生物宿主细胞能够回收由所述糖苷酶的酶活性产生的降解产物(例如岩藻糖和乳糖)，用于产生所需低聚糖。

具体实施方式

根据第一方面，提供了一种使用基因工程微生物宿主细胞生产所需低聚糖的方法，所述方法包括以下步骤：

(i)提供能够产生所需低聚糖的基因工程微生物宿主细胞，其中微生物宿主细胞已被基因工程改造以表达异源糖苷酶，其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物，其中微生物宿主细胞能够回收由所述糖苷酶的酶活性产生的降解产物；

(ii)在允许产生所需低聚糖的条件下和培养基中培养基因工程微生物宿主细胞，从而产生所需低聚糖；和

(iii)任选地，回收所需低聚糖。

本文使用的关于低聚糖的术语“所需”是指旨在由微生物宿主细胞产生的低聚糖。术语“所需”用于区分有意产生的低聚糖和微生物宿主细胞可能产生的其他低聚糖。所述其他低聚糖被认为是“不需要的”，无论这些其他低聚糖是否具有生物功能，是否参与其他细胞化合物(如糖脂、糖蛋白或多糖)的生物合成，或者是否是在所需低聚糖的细胞内生物合成过程中产生的代谢糖产物，这些代谢糖产物要么是由于参与所需低聚糖的生物合成的一种或多种酶的次要(不需要的)酶活性而产生的，要么是由于一种或多种不直接参与所需低聚糖的生物合成，而是使用低聚糖——在产生所需低聚糖的代谢途径中作为中间体而生成的——作为底物的酶的酶活性而产生的。

本文使用的术语“低聚糖”是指由三至二十个单糖残基组成的糖分子，其中每个所述单糖残基通过糖苷键与所述单糖单元中的至少另一个结合。低聚糖可为单糖残基的直链，或单糖残基的支链。

在另一个和/或替代的实施方案中，所需低聚糖为人乳低聚糖(HMO)。

在另一个和/或替代的实施方案中，所需低聚糖为选自以下的HMO：2’-岩藻糖基乳糖(2’-FL)、3-岩藻糖基乳糖(3-FL)、2’3-二岩藻糖基乳糖(DFL)、乳-N-三糖II、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、乳-N-岩藻戊糖I(LNFP-I)、乳-N-新岩藻戊糖I(LNnFP-I)、乳-N-岩藻戊糖II(LNFP-II)、乳-N-岩藻戊糖III(LNFP-III)、乳-N-岩藻戊糖V(LNFP-V)、乳-N-新岩藻戊糖V(LNnFP-V)、乳-N-二岩藻己糖I、乳-N-二岩藻糖基己糖II、对-乳-N-岩藻糖基己糖、岩藻糖基-乳-N-唾液酸戊糖b、岩藻糖基-乳-N-唾液酸戊糖c、岩藻糖基-乳-N-唾液酸戊糖c、二唾液酸-乳-N-岩藻戊糖、3-岩藻糖基-3’-唾液酸乳糖、3-岩藻糖基-6’-唾液酸乳糖、乳-N-新二岩藻己糖I、3’-唾液酸乳糖(3-SL)、6’-唾液酸乳糖(6-SL)、唾液酸乳-N-四糖a(LST-a)、唾液酸乳-N-四糖b(LST-b)、唾液酸乳-N-四糖c(LST-c)和二唾液酸乳-N-四糖。

所述方法包括提供能够产生所需低聚糖的基因工程微生物宿主细胞。

本文使用的术语“基因工程(genetically-engineered)”是指使用分子生物学方法进行的对细胞遗传组成的修饰。细胞遗传组成的修饰可包括基因在物种界限内和/或跨越物种界限的转移、插入、缺失、替换和/或修饰核苷酸、三联体、基因、开放阅读框、启动子、增强子、终止子和其他介导和/或控制基因表达的核苷酸序列。细胞遗传组成的修饰旨在产生具有特定的、所需特性的基因修饰生物体。基因工程微生物宿主细胞可以含有一个或多个在天然(非基因工程)形式的细胞中不存在的基因。本领域技术人员已知用于将外源核酸分子引入和/或将外源核酸分子(重组、异源)插入到细胞的遗传信息中来插入、缺失或改变细胞遗传信息的核甘酸序列的技术。基因工程细胞可以含有一个或多个存在于天然形式的细胞中的基因，其中所述基因通过人工手段被修饰并重新导入到细胞中。术语“基因工程”还涵盖这样的细胞，其含有对于细胞而言是内源性的核酸分子，并且已经被修饰而未将核酸分子从细胞中移除。此类修饰包括通过基因替换、位点特异性突变和包括通常称为“基因编辑”的相关技术获得的那些修饰。

基因工程微生物宿主细胞可为原核细胞或真核细胞。合适的微生物宿主细胞包括酵母细胞、细菌细胞、古细菌细胞和真菌细胞。

在另一个和/或替代的实施方案中，原核细胞是细菌细胞，优选选自以下细菌属的细菌细胞：芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、微球菌属(Micrococcus)、小单孢菌属(Micromonospora)、假单胞菌属(Pseudomonas)、红球菌属(Rhodococcus)和芽胞乳杆菌属(Sporolactobacillus)。适合的细菌种为枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(B.licheniformis)、凝结芽孢杆菌(B.coagulans)、嗜热芽孢杆菌(B.thermophilus)、侧孢芽孢杆菌(B.laterosporus)、巨大芽孢杆菌(B.megaterium)、蕈状芽孢杆菌(B.mycoides)、短小芽孢杆菌(B.pumilus)、迟缓芽孢杆菌(B.lentus)、蜡样芽孢杆菌(B.cereus)、环状芽孢杆菌(B.circulans)、长双歧杆菌(Bifidobacterium longum)、婴儿双歧杆菌(B.infantis)、两歧双歧杆菌(B.bifidum)、弗氏柠檬酸杆菌(Citrobacterfreundii)、解纤维素梭菌(Clostridium cellulolyticum)、永达尔梭菌(C.ljungdahlii)、自产乙醇梭菌(C.autoethanogenum)、丙酮丁醇梭菌(C.acetobutylicum)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、屎肠球菌(Enterococcus faecium)、嗜热肠球菌(E.thermophiles)、大肠杆菌(Escherichia coli)、草生欧文氏菌(Erwinia herbicola)(成团泛菌(Pantoea agglomerans))、嗜酸乳杆菌(Lactobacillus acidophilus)、唾液乳杆菌(L.salivarius)、胚牙乳杆菌(L.plantarum)、瑞士乳杆菌(L.helveticus)、德氏乳杆菌(L.delbrueckii)、鼠李糖乳杆菌(L.rhamnosus)、保加利亚乳杆菌(L.bulgaricus)、卷曲乳杆菌(L.crispatus)、加氏乳杆菌(L.gasseri)、干酪乳杆菌(L.casei)、罗伊氏乳杆菌(L.reuteri)、詹氏乳杆菌(L.jensenii)、乳酸乳球菌(L.lactis)、柠檬泛菌(Pantoeacitrea)、胡萝卜软腐果胶杆菌(Pectobacterium carotovorum)、费氏丙酸杆菌(Proprionibacterium freudenreichii)、荧光假单胞菌(Pseudomonas fluorescens)、铜绿假单胞菌(P.aeruginosa)、嗜热链球菌(Streptococcus thermophiles)和野油菜黄单胞菌(Xanthomonas campestris)。

在另一个和/或替代的实施方案中，真核细胞是酵母细胞，优选选自以下的酵母细胞：酵母属某些种(Saccharomyces sp.)，特别是酿酒酵母(Saccharomyces cerevisiae)；复膜孢酵母属某些种(Saccharomycopsis sp.)；毕赤酵母属某些种(Pichia sp.)，特别是巴斯德毕赤酵母(Pichia pastoris)；汉森酵母属某些种(Hansenula sp.)、克鲁维酵母属种(Kluyveromyces sp.)；亚罗酵母属某些种(Yarrowia sp.)；红酵母属某些种(Rhodotorula sp.)和裂殖酵母属某些种(Schizosaccharomyces sp.)。

基因工程微生物宿主细胞能够产生所需低聚糖。本文使用的术语“能够产生”是指基因工程微生物宿主细胞产生所需低聚糖的能力，条件是微生物宿主细胞是在允许微生物宿主细胞产生所需低聚糖的条件下和培养基中培养的。因此，培养基必须含有在规定范围内的pH值、离子和营养物的组合物以及维持微生物宿主细胞活力和代谢活性所需的化合物。如果对于产生所需低聚糖是必需的，则培养基还必须含有足够量的用于通过微生物宿主细胞生物合成所需低聚糖所需要的任何前体。同样，必须保持用于培养产生所需低聚糖的微生物宿主细胞的条件(例如温度、pH、供氧、搅拌、营养物供应等)，使得微生物宿主细胞能够为代谢活性的或保持代谢活性以产生所需低聚糖。

在另一个和/或替代的实施方案中，能够生产所需低聚糖的基因工程微生物宿主细胞为已被基因工程改造以能够产生所需低聚糖的微生物宿主细胞。在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以表达异源糖基转移酶。异源糖苷酶在发酵过程中(即在所需低聚糖的产生或生物合成过程中)在基因工程微生物宿主细胞中表达。在另一个和/或替代的实施方案中，异源糖苷酶的表达在基因工程微生物宿主中为组成型。

本文使用的术语“异源”是指对于细胞或生物体而言是外来的核苷酸序列、核酸分子或多肽，即是指非天然存在于所述细胞或生物体中的核苷酸序列、核酸分子或多肽。本文所用的“异源序列”或“异源核酸”或“异源多肽”是源自特定宿主细胞以外的来源(例如来自不同物种)的序列、核酸分子或多肽，或如果来自同一来源，则从其原始形式被修饰的序列、核酸分子或多肽。因此，可操作地连接到启动子的异源核酸来自不同于该启动子的来源，或者，如果来自同一来源，则从其原始形式被修饰。所述异源序列可以例如通过转染、转化、接合或转导稳定地引入宿主微生物宿主细胞的基因组中，从而代表基因工程宿主细胞。可以应用技术，这些技术将取决于将要引入序列的宿主细胞。各种技术对于本领域的技术人员来说是已知的并且例如公开于Sambrook et al.,Molecular Cloning:A LaboratoryManual,2nd Ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989)。因此，“异源多肽”是一种非天然存在于基因工程细胞所源自的野生型细胞中的多肽，“异源糖基转移酶”是一种非天然存在于基因工程细胞所源自的野生型细胞中的糖基转移酶。

在另一个和/或替代的实施方案中，异源糖基转移酶选自岩藻糖基转移酶(优选α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶)、葡糖基转移酶、半乳糖基转移酶(优选β-1,3-半乳糖基转移酶和β-1,4-半乳糖基转移酶)、唾液酸转移酶(优选α-2,3-唾液酸转移酶和α-2,6-唾液酸转移酶)和N-乙酰葡糖胺基转移酶。

岩藻糖基转移酶催化岩藻糖残基从供体鸟苷二磷酸活化的L-岩藻糖(GDP-岩藻糖)转移到几个受体分子。岩藻糖基转移酶在动物、植物、真菌和细菌中表达，并根据受体底物上的岩藻糖键进行分类。因此，α-1,2-岩藻糖基转移酶、α-1,3/4-岩藻糖基转移酶和α-1,6-岩藻糖基转移酶是彼此区别的。例如，在欧洲专利申请号17 180 176中公开了合适的用于在基因工程微生物宿主细胞中异源表达的岩藻糖基转移酶。

唾液酸转移酶催化N-乙酰神经氨酸(Neu5Ac)残基从供体CMP-Neu5Ac转移到受体分子。发现唾液酸转移酶在动物、植物、真菌和细菌中表达。唾液酸转移酶根据Neu5Ac与受体分子之间形成的键进行分类。因此，α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和α-2,8-唾液酸转移酶是彼此区别的。例如，在欧洲专利申请号17 183 391中公开了合适的用于在基因工程微生物宿主细胞中异源表达的唾液酸转移酶。

半乳糖基转移酶催化半乳糖残基从供体UDP-半乳糖转移到受体底物。根据半乳糖和受体分子之间形成的键来区分半乳糖基转移酶。因此，β-1,3-半乳糖基转移酶和β-1,4-半乳糖基转移酶是彼此区别的。合适的用于在基因工程微生物宿主细胞中异源表达的β-1,3-半乳糖基转移酶由肠道沙门氏菌(Salmonella enterica)wbdO基因编码。合适的用于在基因工程微生物宿主细胞中异源表达的β-1,4-半乳糖基转移酶由嗜沫聚集杆菌(Aggregatibacter aphrophilus)的lex1基因编码的。

基因工程微生物宿主细胞已被基因工程改造以表达异源糖苷酶，其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物。合适的糖苷酶是相对于被酶活性水解的糖苷键和/或相对于被糖苷酶水解的底物具有特异性的糖苷酶。由于所述特异性，糖苷酶水解不需要的副产物，但不水解要生产的所需低聚糖。在另一个和/或替代的实施方案中，糖苷酶不水解由微生物宿主细胞内化或合成以产生所需低聚糖的一种或多种前体。优选地，所述糖苷酶为外切糖苷酶。

外切糖苷酶为糖苷水解酶，其破坏了低聚糖结构末端残基处的糖苷键。

在另一个和/或替代的实施方案中，异源糖苷酶选自岩藻糖苷酶(包括α-1,2-岩藻糖苷酶和α-1,3-岩藻糖苷酶)、唾液酸酶(如α-2,3-唾液酸酶、α-2,6-唾液酸酶、α-2,8-唾液酸酶)、半乳糖苷酶(如β-1,3-半乳糖苷酶、β-1,4-半乳糖苷酶和β-1,6-半乳糖苷酶)、β-N-乙酰己糖胺酶和葡糖苷酶(如β-1,3-葡糖苷酶)。

合适的岩藻糖苷酶为α-1,2-岩藻糖苷酶。α-1,2-岩藻糖苷酶是高度特异性的外切糖苷酶，其催化低聚糖中线性α-1,2-连接的L-岩藻吡喃糖基残基的水解。优选的α-1,2-岩藻糖苷酶为两岐双岐杆菌的AfcA(SEQ ID NO:2)。

在另一个和/或替代的实施方案中，提供了能够产生3-FL的基因工程微生物宿主细胞，其中所述基因工程微生物宿主细胞表达α-1,2-岩藻糖苷酶。为了能够产生3-FL，基因工程微生物宿主细胞表达α-1,3-岩藻糖基转移酶。所述α-1,3-岩藻糖基转移酶能够将岩藻糖残基从GDP-岩藻糖转移到乳糖(作为受体底物)的葡萄糖部分，从而合成3-FL，作为所需低聚糖。2’-FL和2’3-DFL是3-FL生产中不需要的糖副产物。

通过在能够产生3-FL的基因工程微生物宿主细胞中表达异源α-1,2-岩藻糖苷酶，可以消除或至少减少副产物2’-FL和2’3-DFL的产生，因为这些副产物在基因工程微生物宿主细胞内被异源α-1,2-岩藻糖苷酶水解。得到的降解产物为岩藻糖和乳糖。岩藻糖和乳糖都可以被基因工程微生物宿主细胞利用以产生所需的3-FL。

在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以表达α-1,2-岩藻糖苷酶。在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以含有包含编码α-1,2-岩藻糖苷酶用于其表达的核苷酸序列的核酸分子。优选地，编码α-1,2-岩藻糖苷酶的核苷酸序列为选自以下的核苷酸序列：

-由SEQ ID NO:1表示的核苷酸序列；

-与在严格的条件下与由SEQ ID NO:1表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列；

-与由SEQ ID NO:1表示的核苷酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性的核苷酸序列；

-编码具有由SEQ ID NO:2表示的氨基酸序列的多肽的核苷酸序列；和

-编码由SEQ ID NO:2表示的多肽序列的功能性变体的核苷酸序列，其中功能性变体的氨基酸序列与由SEQ ID NO:2表示的氨基酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性。

本文使用的术语“杂交(hybridize)”或“杂交(hybridizing)”是指在常规条件下杂交，如Sambrook et al.(1989)"Molecular Cloning,A Laboratory Manual"(ColdSpring Harbor Laboratory Press,New York)中描述的，优选在严格条件下。严格的杂交条件为例如：在65℃下在4x SSC中杂交，随后在65℃下在0.1x SSC中进行多次洗涤，共持续约1小时。较不严格的杂交条件为例如：在37℃下在4x SSC中杂交，随后在室温(约21℃)下在1x SSC中多次洗涤。“严格的杂交条件”还指：在68℃下在0.25M磷酸钠、pH 7.2、7％SDS、1mM EDTA和1％BSA中杂交16小时，随后在68℃下用2x SSC和01％SDS洗涤两次。

为了表达编码α-1,2-岩藻糖苷酶或其功能性变体的核苷酸序列，所述核苷酸序列可操作地连接到表达控制序列，其介导编码α-1,2-岩藻糖苷酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。

“表达控制序列”为不是编码蛋白质的核苷酸序列的一部分，而是介导编码蛋白质的核苷酸序列的表达的调控核苷酸序列。调控元件核苷酸序列包括启动子、顺式调控元件、增强子、内含子和终止子。根据调控元件的类型，它在编码蛋白质的核苷酸序列之前(即3’)或编码蛋白质的核苷酸序列之后(即5’)存在于核酸分子上。调控元件在微生物宿主细胞中是功能性的。

术语“可操作地连接”是指调控元件以这种方式与编码蛋白质的核苷酸序列连接，即相对于编码蛋白质的核苷酸序列以这种方式定位在例如核酸分子上，在调控元件的控制下，编码蛋白质的核苷酸序列的表达可以发生在活细胞中。

为了本发明的目的，“启动子”是调控核苷酸序列的表达基因，其通常位于基因的5’端，并通过与特定的DNA结合蛋白的相互作用介导RNA聚合酶转录启动。

此外，合适的启动子包括合成启动子。这些是通过分子生物学技术创建的的启动子，在自然界中没有发现这种构型的启动子。合成启动子是除了最小启动子之外只包含一个或多个选择的、定义的顺式元件的极简启动子。这些顺式元件是DNA结合蛋白(如转录因子)的结合位点，分离自天然启动子，源自先前分离的顺式元件，或通过随机重组技术技术性产生，并通过适当的方法选择；与天然启动子相比，由于合成启动子的结构不太复杂，其仅由少数外源和内源因子激活，因此受到更具体的调控。

“最小启动子”或“核心”启动子是含有基础转录因子复合物的结合位点，并允许通过RNA聚合酶II准确启动转录的核苷酸序列。最小启动子的特征序列基序为TATA盒、启动子元件(Inr)、“TFBII识别元件”(BRE)和“下游核心启动子元件”(OPE)。在最小启动子中，这些元件可以单独或组合存在。最小启动子或其序列基序是例如可从细菌、真菌或病毒基因中获得的。

“顺式元件”是指与待表达的编码蛋白质的核苷酸序列位于同一核酸分子上的核苷酸序列。顺式元件不必编码RNA或蛋白质，在转录方向上可以位于待表达的编码蛋白质的核苷酸序列之前或之后。在待表达的编码蛋白质的核苷酸序列之前的上游顺式元件通常提供必要的结合基序，特别是对于转录因子而言是必要的，所述转录因子在分子水平上从另一端作为(Lat.trans,'beyond'的)反式作用元件参与该基因的转录调控。此外，如果顺式元件导致转录受到抑制，那么它们称为沉默子。导致转录增强的顺式元件称为增强子。启动子中顺式/反式活性的总和决定了RNA聚合酶进行转录的强度。

此外，启动子可为嵌合启动子和/或已被顺式元件修饰的启动子。启动子的修饰还可指在启动子中额外引入顺式元件，所述启动子例如已经天然具有顺式元件。此外，修饰还包括顺式元件的多聚化，特别是天然存在的顺式元件的多聚化。与天然形式相比，这种修饰的启动子的特性例如关于特异性、表达水平或背景活性方面可能已发生了改变。

终止子为DNA上的核苷酸序列，其通常标记基因末端，导致转录终止。

另一种合适的岩藻糖苷酶为α-1,3-岩藻糖苷酶。α-1,3-岩藻糖苷酶为高度特异性糖苷酶，其催化低聚糖中α-1,3-连接的L-岩藻吡喃糖基残基的水解。优选的α-1,3-岩藻糖苷酶为来自两歧双歧杆菌的AfcB(SEQ ID NO:4)。

在另一个和/或替代的实施方案中，提供了能够产生2’-FL的基因工程微生物宿主细胞，其中所述基因工程微生物宿主生物体表达α-1,3-岩藻糖苷酶。为了能够产生2’-FL，基因工程微生物宿主细胞表达α-1,2-岩藻糖基转移酶。所述α-1,2-岩藻糖基转移酶能够将岩藻糖残基从GDP-岩藻糖转移到乳糖(作为受体底物)的半乳糖部分，从而合成2’-FL，作为所需低聚糖。3-FL和2’3-DFL是2’-FL生产中不需要的糖副产物。

通过在能够产生2’-FL的基因工程微生物宿主细胞中表达异源α-1,3-岩藻糖苷酶，可以消除或至少减少副产物3-FL和2’3-DFL的产生，因为这些副产物在基因工程微生物宿主细胞中被异源α-1,3-岩藻糖苷酶水解。得到的降解产物为岩藻糖和乳糖。岩藻糖和乳糖都可以被基因工程微生物宿主生物体利用以产生所需的2’-FL。

在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以表达α-1,3-岩藻糖苷酶。在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以含有包含编码α-1,3-岩藻糖苷酶用于其表达的核苷酸序列的核酸分子。优选地，编码α-1,3-岩藻糖苷酶的核苷酸序列为选自以下的核苷酸序列；

-由SEQ ID NO:3表示的核苷酸序列；

-与在严格的条件下与由SEQ ID NO:3表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列；

-与由SEQ ID NO:3表示的核苷酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性的核苷酸序列；

-编码具有由SEQ ID NO:4表示的氨基酸序列的多肽的核苷酸序列；和

-编码由SEQ ID NO:4表示的多肽序列的功能性变体的核苷酸序列，其中功能性变体的氨基酸序列与由SEQ ID NO:4表示的氨基酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性。

为了表达编码α-1,3-岩藻糖苷酶或其功能性变体的核苷酸序列，所述核苷酸序列可操作地连接到表达控制序列，其介导编码α-1,3-岩藻糖苷酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。

在另一个和/或替代的实施方案中，提供了能够产生LNFP-I的基因工程微生物宿主细胞，其中所述基因工程微生物宿主细胞表达α-1,3-岩藻糖苷酶。为了能够产生LNFP-I，基因工程微生物宿主细胞表达β-1,3-N-乙酰葡糖胺基转移酶、β-1,3-半乳糖基转移酶和α-1,2-岩藻糖基转移酶。所述β-1,3-N-乙酰葡糖胺基转移酶能够将GlcNAc残基从UDP-GlcNAc转移到乳糖的半乳糖部分，从而合成乳-N-三糖-II(LNT-II)。所述β-1,3-半乳糖基转移酶能够将半乳糖残基从UDP-半乳糖转移到LNT-II的GlcNAc部分，从而合成乳-N-四糖(LNT)。所述α-1,2-岩藻糖基转移酶能够将岩藻糖残基从GDP-岩藻糖转移到LNT的末端半乳糖部分，从而合成LNFP-I。3-FL和2’3-DFL将会是LNFP-I生产中不需要的副产物。通过在能够产生LNFP-I的基因工程微生物宿主细胞中表达α-1,3-岩藻糖苷酶，可以消除或至少减少副产物3-FL和2’3-DFL的产生，因为这些副产物在基因工程微生物宿主细胞中被α-1,3-岩藻糖苷酶水解。得到的降解产物为岩藻糖、乳糖和2’-FL。岩藻糖和乳糖可以被基因工程微生物宿主生物体利用以产生所需的LNFP-I。

-SEQ ID NO:3所表示的核苷酸序列；

-与在严格的条件下与SEQ ID NO:3所表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列；

-与SEQ ID NO:3所表示的核苷酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性的核苷酸序列；

-编码具有SEQ ID NO:4所表示的氨基酸序列的多肽的核苷酸序列；和

-编码SEQ ID NO:4所表示的多肽序列的功能性变体的核苷酸序列，其中功能性变体的氨基酸序列与SEQ ID NO:4所表示的氨基酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性。

合适的唾液酸酶为α-2,3-唾液酸酶。α-2,3-唾液酸酶为高度特异性外切糖苷酶，其催化来自低聚糖的线性α-2,3-连接的L-唾液酸残基的水解。优选的α-2,3-唾液酸酶为肺炎链球菌(Streptococcus pneumoniae)的NanB(SEQ ID NO:6)。

在另一个和/或替代的实施方案中，提供了能够产生6’-SL的基因工程微生物宿主细胞，其中所述基因工程微生物宿主细胞表达α-2,3-唾液酸酶。为了能够产生6’-SL，基因工程微生物宿主细胞表达α-2,6-唾液酸转移酶。所述α-2,6-唾液酸转移酶能够将Neu5Ac残基从CMP-Neu5Ac转移到乳糖(作为底物)的半乳糖部分，从而合成6’-SL。3’-SL是6’-SL产生中不需要的副产物。

通过在能够产生6’-SL的基因工程微生物宿主细胞中表达α-2,3-唾液酸酶，可以消除或至少减少副产物3’-SL的产生，因为该副产物在遗传修饰的微生物宿主细胞中被α-2,3-唾液酸酶水解。得到的降解产物为N-乙酰神经氨酸和乳糖。N-乙酰神经氨酸和乳糖都可以被基因工程微生物宿主生物体利用以产生所需的6’-SL。

在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以表达α-2,3-唾液酸酶。在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以含有包含编码α-2,3-唾液酸酶的核苷酸序列的核酸分子，用于其表达。优选地，编码α-2,3-唾液酸酶的核苷酸序列为选自以下的核苷酸序列；

-SEQ ID NO:5所表示的核苷酸序列；

-与在严格的条件下与SEQ ID NO:5所表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列；

-与SEQ ID NO:5所表示的核苷酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性的核苷酸序列；

-编码具有SEQ ID NO:6所表示的氨基酸序列的多肽的核苷酸序列；和

-编码SEQ ID NO:6所表示的多肽序列的功能性变体的核苷酸序列，其中功能性变体的氨基酸序列与SEQ ID NO:6所表示的氨基酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性。

为了表达编码α-2,3-唾液酸酶或其功能性变体的核苷酸序列，所述核苷酸序列可操作地连接到表达控制序列，其介导编码α-2,3-唾液酸酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。

合适的半乳糖苷酶为β-1,3-半乳糖苷酶。β-1,3-半乳糖苷酶为催化低聚糖中β-1,3-连接的半乳糖残基的水解的酶。优选的β-1,3-半乳糖苷酶为长双歧杆菌的Bga42A(SEQID NO:8)。

在另一个和/或替代的实施方案中，提供了能够产生LNnT的基因工程微生物宿主细胞，其中所述基因工程微生物宿主细胞表达β-1,3-半乳糖苷酶。为了能够产生LNnT，基因工程微生物宿主细胞表达β-1,3-N-乙酰葡糖胺基转移酶和β-1,4-半乳糖基转移酶。所述β-1,3-N-乙酰葡糖胺基转移酶能够将GlcNAc残基从UDP-GIcNAc转移到乳糖的半乳糖部分，从而合成LNT-II。所述β-1,4-半乳糖基转移酶能够将半乳糖残基从UDP-半乳糖转移到LNT-II的GlcNAc部分，从而合成LNnT，作为所需低聚糖。

LNT是LNnT生产中不需要的副产物。通过在能够生产LNnT的基因工程微生物宿主细胞中表达β-1,3-半乳糖苷酶，可以消除或至少减少副产物LNT的产生，因为该副产物在基因工程微生物宿主细胞中被异源β-1,3-半乳糖苷酶水解。得到的降解产物为半乳糖和LNT-II。半乳糖和LNT-II都可以被基因工程微生物宿主生物体利用以产生所需的LNnT。

在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以表达β-1,3-半乳糖苷酶。在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以含有包含编码β-1,3-半乳糖苷酶用于其表达的核苷酸序列的核酸分子。

优选地，编码β-1,3-半乳糖苷酶的核苷酸序列为选自以下的核苷酸序列；

-SEQ ID NO:7所表示的核苷酸序列；

-与在严格的条件下与SEQ ID NO:7所表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列；

-与SEQ ID NO:7所表示的核苷酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性的核苷酸序列；

-编码具有SEQ ID NO:8所表示的氨基酸序列的多肽的核苷酸序列；和

-编码SEQ ID NO:8所表示的多肽序列的功能性变体的核苷酸序列，其中功能性变体的氨基酸序列与SEQ ID NO:8所表示的氨基酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性。

为了表达编码β-1,3-半乳糖苷酶或其功能性变体的核苷酸序列，所述核苷酸序列可操作地连接到表达控制序列，其介导编码β-1,3-半乳糖苷酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。

另一种合适的半乳糖苷酶为半乳聚糖β-1,3-半乳糖苷酶。所述半乳聚糖β-1,3-半乳糖苷酶为催化具有低聚糖链的半乳糖中β-1,3-连接的半乳糖残基的水解的酶。优选的半乳聚糖β-1,3-半乳糖苷酶为热纤梭菌(Clostridium thermocellum)的Ct1、3Gal43A(SEQID NO:10)。

在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以表达半乳聚糖β-1,3-半乳糖苷酶。在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以含有包含编码半乳聚糖β-1,3-半乳糖苷酶用于其表达的核苷酸序列的核酸分子。优选地，编码半乳聚糖β-1,3-半乳糖苷酶的核苷酸序列为选自以下的核苷酸序列；

-SEQ ID NO:9所表示的核苷酸序列；

-与在严格的条件下与SEQ ID NO:9所表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列；

-与SEQ ID NO:9所表示的核苷酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性的核苷酸序列；

-编码具有由SEQ ID NO:10所表示的氨基酸序列的多肽的核苷酸序列；和

-编码SEQ ID NO:10所表示的多肽序列的功能性变体的核苷酸序列，其中功能性变体的氨基酸序列与SEQ ID NO:10所表示的氨基酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性。

为了表达编码半乳聚糖β-1,3-半乳糖苷酶或其功能性变体的核苷酸序列，所述核苷酸序列可操作地连接到表达控制序列，其介导编码半乳聚糖β-1,3-葡糖苷酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。

合适的葡糖苷酶为β-1,3-葡糖苷酶。所述β-1,3-葡糖苷酶为高度特异性外切糖苷酶，其催化低聚糖中β-1,3-连接的葡萄糖残基的水解。优选的β-1,3-葡糖苷酶为类芽孢杆菌属(Paenibacillus sp.)的PglA(SEQ ID NO:12)。

在另一个和/或替代的实施方案中，提供了能够产生LNT或LNnT的基因工程微生物宿主细胞，其中所述基因工程微生物宿主细胞表达β-1,3-葡糖苷酶和/或β-1,3-半乳糖苷酶。为了能够产生LNT，基因工程微生物宿主细胞表达β-1,3-N-乙酰葡糖胺基转移酶和β-1,3-半乳糖基转移酶。所述β-1,3-N-乙酰葡糖胺基转移酶能够将GlcNAc残基从UDP-GlcNAc转移到乳糖的半乳糖部分，从而合成乳-N-三糖-II(LNT-II)。所述β-1,3-半乳糖基转移酶能够将半乳糖残基从UDP-半乳糖转移到LNT-II的GlcNAc部分，从而合成乳-N-四糖(LNT)。为了能够产生LNnT，基因工程微生物宿主细胞表达β-1,3-N-乙酰葡糖胺基转移酶和β-1,4-半乳糖基转移酶。所述β-1,3-N-乙酰葡糖胺基转移酶能够合成LNT-II。所述β-1,4-半乳糖基转移酶能够将半乳糖残基从UDP-半乳糖转移到LNT-II的GlcNAc部分，从而合成LNnT，作为所需低聚糖。

技术人员已知，β-1,3-N-乙酰葡糖胺基转移酶(如脑膜炎奈瑟氏菌(Neisseriameningitidis)的LgtA)接受广谱的供体底物。虽然主要将GlcNAc从UDP-GIcNAc转移到适当的受体糖，但LgtA还能够使用UDP-半乳糖或UDP-葡萄糖作为供体底物。使用能够生产所述的LNT或LNnT的基因工程微生物宿主生物体，所述β-1,3-N-乙酰葡糖胺基转移酶还能够将UDP-半乳糖的半乳糖残基以及UDP-葡萄糖的葡萄糖残基转移到乳糖的半乳糖部分，从而分别合成不需要的副产物Gal(β1,3)Gal(β1,4)Glc和Glc(β1,3)Gal(β1,4)Glc。

通过在能够产生LNT或LNnT的基因工程微生物宿主细胞中表达半乳聚糖β-1,3-半乳糖苷酶和/或β-1,3-葡糖苷酶，可以消除或至少减少副产物Gal(β1,3)Gal(β1,4)Glc和Glc(β1,3)Gal(β1,4)Glc的产生，因为这些副产物在基因工程微生物宿主细胞中被半乳聚糖β-1,3-半乳糖苷酶和/或β-1,3-葡糖苷酶水解。得到的降解产物为半乳糖和/或葡萄糖和乳糖。单糖和乳糖都可以被基因工程微生物宿主细胞利用以产生所需的LNT或LNnT。

在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以表达β-1,3-葡糖苷酶。在另一个和/或替代的实施方案中，基因工程微生物宿主细胞已被基因工程改造以含有包含编码β-1,3-葡糖苷酶用于其表达的核苷酸序列的核酸分子。优选地，编码β-1,3-葡糖苷酶的核苷酸序列为选自以下的核苷酸序列；

-SEQ ID NO:11所表示的核苷酸序列；

-与在严格的条件下与SEQ ID NO:11所表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列；

-与SEQ ID NO:11所表示的核苷酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性的核苷酸序列；

-编码具有SEQ ID NO:12所表示的氨基酸序列的多肽的核苷酸序列；和

-编码SEQ ID NO:12所表示的多肽序列的功能性变体的核苷酸序列，其中功能性变体的氨基酸序列与SEQ ID NO:10所表示的氨基酸序列具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性。

为了表达编码β-1,3-葡糖苷酶或其功能性变体的核苷酸序列，所述核苷酸序列可操作地连接到表达控制序列，其介导编码β-1,3-葡糖苷酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。

基因工程微生物宿主细胞能够回收至少一种由基因工程微生物宿主细胞中的异源糖苷酶的酶活性产生的降解产物。因此，基因工程微生物宿主细胞可以使用至少一种由异源糖苷酶的酶活性产生的降解产物来生产所需低聚糖。例如，从不需要的糖副产物中释放出的单糖残基可以被异源糖苷酶再激活，即结合到核苷酸上，由各自的糖基转移酶从产生的核苷酸激活的单糖转移到受体底物上，以获得所需低聚糖或所需低聚糖的前体。

所述方法包括在允许所述基因工程微生物宿主生物体产生所需低聚糖的培养基中，以及在允许所述基因工程微生物宿主生物体产生所需低聚糖的条件下培养基因工程微生物宿主细胞的步骤。

允许基因工程微生物宿主细胞产生所需低聚糖的培养基含有营养物、至少一种能量来源、必需金属和矿物质以及缓冲剂。所述培养基任选地含有所需低聚糖的前体，所述前体可由基因工程微生物宿主细胞内化，并用于产生所需低聚糖，条件是基因工程微生物宿主细胞不能自行合成所述前体。然后，基因工程微生物宿主细胞内化前体，并使前体进行所需低聚糖的生物合成。例如，乳糖可以被认为是2’-岩藻糖基乳糖的前体。

在培养用于产生所需低聚糖的基因工程微生物宿主细胞的过程中，保持允许的条件。如果在这些条件下培养的基因工程微生物宿主细胞保持活力并产生所需低聚糖，则条件是“允许的”。优选地，允许的培养条件使基因工程微生物宿主细胞增殖。需要保持在一定值或一定范围内的条件包括pH、温度、氧和营养物浓度、能量来源以及必需的金属和矿物质。

在另一个和/或替代的实施方案中，所述方法包括回收所需低聚糖的步骤。所需低聚糖可以从发酵液和/或基因工程微生物宿主生物体中回收。

本文前述的方法是有利的，因为在生产所需低聚糖的过程中很少或没有产生不需要的副产物。因此，从发酵液或细胞裂解液中回收和纯化所需低聚糖是不那么麻烦和昂贵的。

此外，更多的底物被专门用于生产所需低聚糖，而不是因为它被并入不需要的副产物中，而这些副产物不能被微生物宿主细胞代谢而变得无法用于生产所需低聚糖。

根据第二方面，提供了用于生产所需低聚糖的基因工程微生物宿主细胞，其中所述微生物宿主细胞能够产生所需低聚糖，并且其中所述微生物宿主细胞已被基因工程改造以表达异源糖苷酶，其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢副产物。

根据第三方面，本文前述的基因工程微生物宿主细胞用于生产所需低聚糖。使用这些基因工程微生物宿主细胞通过发酵生产所需低聚糖是有利的，因为防止甚至消除了不需要的糖副产物的产生。因此，从发酵液中回收所需低聚糖既节省了资源，又不那么麻烦，因为可以避免将所需低聚糖从不需要的低聚糖副产物中分离出来。此外，与未被基因工程改造以表达异源糖苷酶的天然微生物宿主细胞相比，向本发明的基因工程微生物宿主细胞提供的更多的离析物和能量来源被转化为所需的产物。

根据第四方面，通过本文前述的方法和/或基因工程微生物宿主细胞的用途生产的所需低聚糖优选选自HMO。

通过本文所述的方法和/或基因工程微生物宿主细胞的用途生产的所需低聚糖可用于生产营养组合物。

所述营养组合物为药用组合物、膳食组合物、婴儿配方物等。

将参照具体实施方案并参照附图来描述本发明，但本发明不仅限于此，而仅通过权利要求来限定。此外，说明书和权利要求中的术语第一、第二等用于区分相似的要素，而并不必然用于在时间、空间、排序或以任何其他方式描述顺序。应该理解，如此使用的术语在适当的情况下是可互换的，并且本文所述的本发明的实施方案能够以不同于本文所述或所示的其他顺序操作。

应当注意的是，权利要求中使用的术语“包括”不应被解释为限于其后列出的方法；它不排除其他元素或步骤。因此，它被解释为指明所述特征、整数、步骤或成分的存在，但不排除存在或添加一个或多个其他特征、整数、步骤或成分或其群组。因此，表述“包括装置A和B的设备”的范围不应限于仅由组件A和B组成的设备。这意味着，就本发明而言，该装置仅有的相关组件是A和B。

在本说明书中提及“一个实施方案(one embodiment)”或“实施方案(anembodiment)”是指在本发明的至少一个实施方案中包括与实施方案相关描述的特定的特性、结构或特征。因此，短语“在一个实施方案中”或“在实施方案中”在本说明书中各处出现不一定都是指同一实施方案，而是可能。此外，在一个或多个实施方案中，可以以任何适当的方式结合特定的特性、结构或特征，这对于本领域普通技术人员来说，根据本公开将是显而易见的。

类似地，应当理解，在本发明的示例性实施方案的描述中，出于简化公开内容并帮助理解本发明的一个或多个方面的目的，有时将本发明的各种特征组合在单个实施方案、附图或其描述。然而，这种公开方法不应被解释为反映了所要求保护的发明需要比在每个权利要求中明确陈述的更多的特征的意图。相反，正如所附权利要求所反映的，本发明的方面在于小于单个前述公开实施方案的所有特征。因此，在详细说明书之后的权利要求被明确地并入本详细说明书中，每一项权利要求本身作为本发明的单独的实施方案。

此外，虽然本文描述的一些实施方案包括其他实施方案中包括的一些特征但不包括其他特征，但不同实施方案的特征的组合意于在本发明的范围内，并形成不同的实施方案，正如本领域技术人员所理解的那样。例如，在所附权利要求中，任何要求保护的实施方案都可以以任何组合使用。

此外，本文将一些实施方案描述为可以由计算机系统的处理器或通过执行该功能的其他手段来实现的方法或方法的要素的组合。因此，具有执行这种方法或方法的要素的必要指令的处理器构成用于执行方法或方法的要素的手段。此外，本文描述的装置实施方案的元件是为了实施本发明，用于执行由元件行使的功能的装置的实例。

在本文提供的说明书和附图中，列出了许多具体的细节。然而，应当理解，本发明的实施方案可以在没有这些具体细节的情况下实施。在其他情况下，公知的方法、结构和技术还没有被详细地示出，以避免混淆对本说明书的理解。

现在将通过对本发明的几个实施方案的详细描述来描述本发明。显然，在不偏离本发明的真正精神或技术教导的情况下，可以根据本领域技术人员的知识来设置本发明的其他实施方案，本发明仅由所附权利要求的条款来限制。

实施例1：用于生产2’-岩藻糖基乳糖的大肠杆菌(E.coli)BL21(DE3)菌株的代谢改造

将大肠杆菌BL21(DE3)(Novagen)用作亲本菌株，用于构建用于生产2’-FL的宿主菌株。亲本菌株的遗传改造包括基因破坏和缺失事件以及异源基因的整合。

由于2’-岩藻糖基乳糖是由乳糖(其应用于细菌培养)和GDP-L-岩藻糖(其是由活细胞产生)合成的，首先通过使用错配寡核苷酸的诱变，使编码内源性β-半乳糖苷酶的lacZ基因的野生型拷贝失活(Ellis et al.,“High efficiency mutagenesis,repair,andengineering of chromosomal DNA using single-stranded oligonucleotides”,Proc.Natl.Acad.Sci.USA 98:6742-6746(2001))。使用同样的方法，破坏了阿拉伯糖-异构酶araA的基因。

在温度敏感的转录抑制子cl857的控制下，引入了lacZΩ基因片段。在菌株中大肠杆菌BL21(DE3)PgbA启动子的控制下表达了lacZα片段基因，显示为LacZ⁺菌株。

基因组缺失按照Datsenko和Warner的方法通过λRed介导的重组进行(“One-stepinactivation of chromosomal genes in Escherichia coli K-12 using PCRproducts”,Proc.Natl.Acad.Sci.USA 97:6640-6645(2000))。为了防止L-岩藻糖的降解，分别缺失了编码L-岩藻糖异构酶和L-墨角藻糖激酶的基因fucl和fucK。还缺失了基因wzxC-wcaJ。WcaJ可能编码UDP-葡萄糖：

十一碳二烯磷酸葡萄糖-1-磷酸转移酶，其催化荚膜异多糖酸(colanic acid)合成的第一步(Stevenson et al.,“Organization of the Escherichia coli K-12 genecluster responsible for production of the extracellular polysaccharidecolonic acid”,J.Bacteriol.178:4885-4893；(1996))；产生的荚膜异多糖酸将与岩藻糖基转移酶反应竞争GDP-岩藻糖。

通过转座进行异源基因的基因组整合。大的基因簇被整合到由水手(mariner)转座酶Himar1的超活性C9突变体介导的基因组中(Lampe et al.,“Hyperactivetransposase mutants of the Himar1 mariner transposon”,Proc.Natl.Acad.Sci.USA96:11428-11433(1999))，其在P_ara启动子的转录控制下被插入到质粒pEcomar中。为增强GDP-岩藻糖的从头合成，编码来自大肠杆菌K12 DH5α的磷酸甘露糖变位酶(manB)、甘露糖-1-磷酸鸟苷酰转移酶(mannose-1-phosphate guanosyltransferase，manC)、GDP-甘露糖-4,6-脱水酶(gmd)和GDP-L-岩藻糖合酶(wcaG)的基因在大肠杆菌BL21(DE3)菌株中过表达；将操纵子manCB置于组成型启动子P_tet的控制下，操纵子gmd、wcaG从组成型P_T5启动子转录而来。将转座子盒<P_tet-manCB-P_T5-gmd，wcaG-FRT-dhfr-FRT>(SEQ ID NO:13)从pEcomar C9-manCB-gmd、wcaG-dhfr插入到大肠杆菌基因组中，所述转座子盒包含对甲氧苄氨嘧啶抗性的二氢叶酸还原酶的基因，侧翼为被水手状元件Himar1转座酶特异性识别的反向末端重复序列。

对于单个基因的染色体整合，使用EZ-Tn5TM转座酶(Epicentre，USA)。为了产生EZ-Tn5转座体，用引物一起扩增目的基因和侧翼为FRT位点的抗生素抗性盒，所述引物在两个位点上携带EZ-Tn5转座酶的19-bp嵌合端识别位点(5’-CTGTCTCTTATACACATCT，SEQ IDNO:21)。使用EZ-Tn5TM转座酶，将来自大肠杆菌K12 TG1的乳糖内向转运蛋白(importer)LacY的基因(登录号ABN72583)、来自大肠杆菌O126的2-岩藻糖基转移酶基因wbgL(登录号ADN43847)和编码来自Yersinia bercovieri ATCC 43970的主要易化子超家族的糖外排转运蛋白的基因yberc0001_9420(登录号EEQ08298)使用各自的整合盒：<P_tet-lacY-FRT-aadA-FRT>(SEQ ID NO:14)、<P_tet-wbgLco-FRT-neo-FRT>(SEQ ID NO:15)和<P_tet-yberc0001_9420co-FRT-cat-FRT>(SEQ ID NO:16)整合。基因wbgL和yberc0001_9420由GenScript公司(USA)合成，并进行密码子优化(co)。在成功整合lacY基因后，通过在质粒pCP20上编码的FLP重组酶从链霉素抗性克隆中消除抗性基因(Datsenko and Warner,“One-step inactivation of chromosomal genes in Escherichia coli K-12 usingPCR products”,Proc.Natl.Acad.Sci.USA 97:6640-6645(2000))。

由于大肠杆菌BL21(DE3)缺乏功能性gal-操纵子，因此将来自大肠杆菌K的galETKM操纵子的天然调控拷贝用整合盒<P_gal-galE-galT-galK-galM>(SEQ ID NO:17)通过EZ-转座整合到B菌株中。从含有1％半乳糖的MacConkey-agar中选择整合体，为红色菌落。所得菌株能够代谢源自乳糖水解的单糖葡萄糖和半乳糖。

通过缺失编码磷酸果糖激酶A的pfkA基因，实现了关于大肠杆菌菌株合成2’-岩藻糖基乳糖的进一步改善。当在葡萄糖异生作用底物(如甘油)上培养大肠杆菌时，PfkA对果糖-6-磷酸的磷酸化是高度消耗ATP的平板(treadmill)反应，此外，它还与ManA竞争底物。根据Datsenko和Wanner(2000)，使用侧翼为lox71/66位点的庆大霉素抗性盒(aacC1)，通过同源重组缺失pfkA基因(Lambert,JM et al.(2007)Cre-lox-based system for multiplegene deletions and selectable-marker removal in Lactobacillus plantarum.Appl.Environ.Microbiol 73:1126-1135)。成功缺失pfkA基因后，使用在pKD46(Datsenko和Wanner，2000)底盘(chassis)中的P_ara启动子控制下克隆的Cre重组酶(Abremski,K et al.(1983)Studies on the properties of P1 site-specific recombination:evidencefor topologically unlinked products following recombination.Cell 32:1301-1311)从大肠杆菌基因组中去除抗生素抗性基因。

对于不同的岩藻糖基转移酶，除了转移酶活性外，还显示了GDP-L-岩藻糖水解酶活性。此外，对于wbgL，本文用于2’-岩藻糖基乳糖合成的α-1,2-岩藻糖基转移酶显示了这种水解活性(见EP 3 050 973 A1)。为了挽救用于2’-岩藻糖基乳糖生产的游离L-岩藻糖，并消除来自发酵液的污染L-岩藻糖，将编码脆弱拟杆菌(Bacteroides fragilis)的双功能L-岩藻糖激酶/L-岩藻糖1-磷酸鸟苷基转移酶的fkp基因，在P_tet启动子的转录控制下，与侧翼为lox71/66的aacC1基因一起，使用EZ-Tn5^TM转座酶<P_tet-fkp-lox-aacC1-lox>(SEQ IDNO:18)通过转座进行染色体整合。在成功整合后，从上述基因组中去除庆大霉素抗性基因。

为了提高代谢碳源甘油通过从丙糖-磷酸到果糖-6-磷酸的糖异生途径来供给GDP-L-岩藻糖生物合成的通量，将编码来自豌豆(Pisum sativum)的果糖-1,6-二磷酸醛缩酶(fbaB)和异源果糖-1,6-二磷酸磷酸酶(fbpase)的基因过表达。将大肠杆菌BL21(DE3)的fbaB基因与P_tet启动子融合。由于硫氧还蛋白的还原作用，豌豆叶绿体FBPase的活性受到二硫化物-二巯基化物交换的别构调控。半胱氨酸残基153与丝氨酸的交换产生组成型活性酶。购买编码来自豌豆的叶绿体FBPase的基因(登录号AAD10213)，进行密码子优化以在大肠杆菌中表达，N端用六聚组氨酸标记进行标记，并进行修饰以编码来自Genescript的酶的C153S变体。从T7启动子转录fbpase基因。盒<P_tet-fbaB-P_T7-His₆-fbpase-lox-aacC1-lox>(SEQ ID NO:19)用于EZ-Tn5^TM转座酶介导的宿主菌株中的整合。从大肠杆菌基因组中去除庆大霉素抗性基因后，该菌株用于2’-岩藻糖基乳糖生产。随后，该菌株被命名为“菌株A”。

实施例2：改造大肠杆菌BL21(DE3)菌株以生产高纯度的2’-岩藻糖基乳糖

用菌株A进行2’-岩藻糖基乳糖生产的分批补料培养显示，在发酵液中存在副产物(3-岩藻糖基乳糖和2’3-二岩藻糖基乳糖)。为了最大限度地减少这些副产物的产生并提高碳产量，将α-1,3-岩藻糖苷酶亚克隆到组成型启动子后面，并整合到菌株A的基因组中。因此，两岐双歧杆菌的afcB基因(登录号AB474964)与组成型P_and启动子和庆大霉素抗性基因融合。将得到的转座子盒<P_and-afcB-lox-aacC1-lox>(SEQ ID NO:20)——其侧翼为被水手状元件Himar1转座酶特异性识别的反向末端重复序列——从pEcomar afcB-aacC1插入到大肠杆菌基因组中，产生“菌株B”。

实施例3：HPLC分析检测培养上清液中的2’-岩藻糖基乳糖

用与HPLC系统(Shimadzu，Germany)连接的折射率检测器(RID-10A)(Shimadzu，Germany)和Waters XBridge Amide柱3.5μm(250×4.6mm)(Eschborn，Germany)进行HPLC分析。等比例地用30％A：50％(v/v)ACN于ddH₂O中、0.1％(v/v)NH₄OH和70％B：80％(v/v)ACN于ddH₂O中、0.1％(v/v)NH₄OH(v/v)作为洗脱剂，在35℃下，以1.4ml·min^-1的流速进行洗脱。对HPLC样品进行无菌过滤(0.22μm孔径)，并在离子交换基质(Strata ABW，Phenotex)上通过固相萃取清除。将10μl的样品上样于柱上，并根据标准曲线计算2’-岩藻糖基乳糖浓度。其他糖，如L-岩藻糖和/或其他单糖、乳糖和/或其他二糖、3-岩藻糖基乳糖和/或其他三糖、2’3-二岩藻糖基乳糖和/或其他四糖以及甘油，用这些分析条件也是可检测到的。通过比较色谱图中所有峰的AUC(曲线下面积)，可以确定检测到的糖的相对量。将水对照中也存在的峰排除在该计算之外。

实施例4：在发酵过程中产生2’-岩藻糖基乳糖

在33℃下在3L-发酵罐中进行发酵(New Brunswick，Edison，USA)，开始于含有3g/L KH₂PO4、12g/L K₂HPO₄、5g/L(NH₄)₂SO₄、0.3g/L柠檬酸、2g/L MgSO₄×7·H₂O、0.1g/L NaCl和0.015g/L CaCl₂×6·H₂O，补充1g/L微量元素溶液(54.4g·L^-1柠檬酸铁铵、9.8g/L MnCl₂×4·H₂O、1.6g/L CoCl₂×6·H₂O、1g/L CuCl₂×2·H₂O、1.9g/L H₃BO₃、9g/L ZnSO₄×7·H₂O、1.1g/L Na₂MoO₄×2·H₂O、1.5g/L Na₂SeO₃、1.5g/L NiSO₄×6·H₂O)，并含有2％(v/v)甘油作为碳源、60mM乳糖和抗生素卡那霉素(25μg/mL)的1000mL矿物盐培养基。曝气维持在3L/min。通过控制搅拌速度，使溶解氧保持在20-30％的饱和度。通过加入25％氨溶液使pH维持在7.0。用2.5％(v/v)接种物开始培养，该接种物来自在含有相同的甘油但缺乏乳糖的培养基中生长的预培养物。离开分批阶段后，以溶解氧水平上升为指示，进行甘油补料(60％(v/v)，补充有2g/L MgSO₄×7·H₂O、0.015g/L CaCl₂×6·H₂O和1mL/L微量元素溶液)，流速为7.0-8.0mL/h，参照起始体积。在整个培养过程中进行乳糖补料(0.66M)，并直观地进行调整，以实现发酵液中恒定的乳糖供应。在发酵快要结束时停止乳糖补料，并继续培养，直到乳糖完全转化为2’-岩藻糖基乳糖。当使用实施例1中描述的菌株(菌株A)时，在接种发酵罐后约94小时，在细胞培养基中达到约150g/L的2’-岩藻糖基乳糖效价(titer)。将如实施例2中描述的基因修饰的2’-岩藻糖基乳糖生产菌株(菌株B)进行同等地培养，也产生了约150g/L的2’-岩藻糖基乳糖效价。然而，副产物的量明显低于培养菌株A后的量(表2)。尽管菌株A的培养上清液中的糖含量2’-岩藻糖基乳糖仅占94.22％，但在菌株B的培养上清液中增加了5.50％，纯度为99.72％。

表2：培养94小时后，菌株A和菌株B的培养上清液中可检测糖的相对量的定性HPLC分析(n.d.：未检测出的)。

序列表

<110> 詹尼温生物技术有限责任公司

<120> 糖苷酶在低聚糖生产中的用途

<130> CP1200849P

<160> 20

<170> PatentIn version 3.5

<210> 1

<211> 5880

<212> DNA

<213> 两岐双岐杆菌（Bifidobacterium bifidum）

<400> 1

atgaaacata gagcgatgtc atcgcgtctg atgccactgg tggcgtcctg cgcgacggtc 60

ggcatgctgc tggccggact acctgtgtcg gccgtcgcgg tcggcacgac gagagcggca 120

gcgtccgacg cctcgtcctc caccacagca accatcaccc cctccgccga taccacgttg 180

cagacatgga cgagcgagaa gaattcctca atggcgtcca agccgtacat cggcacactg 240

caagggccct cgcaaggcgt gttcggcgag aagttcgagt ccacggatgc cgcggacacc 300

accgatctga agaccggcct gctgacgttc gacctgagcg cctacgacca tgcccccgat 360

tccgcaacgt tcgagatgac gtacctcggc taccgcggca acccgacggc caccgacacc 420

gacaccatca aggtgacccc cgtcgacacc accgtgtgca ccaataacgc cacagactgc 480

ggcgcgaatg tcgcgaccgg cgcgaccaag ccgaagttca gcatcaacga ctcctcattc 540

gtcgccgagt ccaagccgtt cgagtacggt acgacggttt acacgggcga cgccatcacc 600

gtggttcccg ccaataccaa gaaggtcacc gtagatgtga ccgaaatcgt gcgccagcag 660

ttcgccgaag gcaagaaggt catcaccctg gccgtgggcg agaccaagaa gaccgaggtt 720

cgtttcgcca gttccgaagg cacgacgtcc ctgaacggcg cgaccgcaga catggctccg 780

aagctgaccg tttccgtgtc caccaaggac gatctcaagc cctccgccga caccacgttg 840

caggcatggg ccagcgagaa gaacgagaag aagaacactg cggcctatgt cggcgcgctg 900

cagccggaag gcgattacgg cgacttcggt gagaagttca agtccaccga cgtccacgat 960

gtcacagacg ccaagatggg tctgatgacg ttcgacctgt ccgattacac cgcggcgccc 1020

gagcactcca tcctcacctt gacgtatctg ggctacgccg gtgcagacaa gaccgccacg 1080

gccaccgata aggtcaaggt ggtcgctgtt gacacgtcgc ggtgcaccgg caccgctccc 1140

tgcgacacca acaatgccac gtgggcgaac cgcccggact tcgaggtgac cgataccacg 1200

aagaccgcga cgtcccatgc gttcgcttat ggatctaaga agtattccga tggcatgacc 1260

gtcgaatcgg gcaacgccaa gaaggtcctg ctcgacgtgt ccgatgtcat caaggcagag 1320

ttcgccaagt tcagcgccgg cgccaccgag aagaagatca cgctggccct gggcgagctc 1380

aacaagtccg acatgcgttt cggcagcaag gaagtcacct cgctgaccgg cgccaccgaa 1440

gccatgcagc cgaccttgtc cgtcaccaag aagccgaagg catacacgct gagcatcgaa 1500

ggcccgacca aggtcaagta ccagaagggc gaggcgttcg acaaggccgg actcgtggtc 1560

aaggccacca gcacggctga cggcacggtc aagacgctga ccgaaggcaa cggtgaggat 1620

aactacacca tcgacaccag cgctttcgat agtgccagca tcggcgtata ccctgttacc 1680

gtgaagtaca acaaggaccc cgaaatcgcc gcttcgttca acgcctatgt catcgccagt 1740

gtcgaggacg gcggagacgg cgacaccagc aaagacgact ggctgtggta caagcagccc 1800

gcgtcgcaga ccgacgccac cgccaccgcc ggcggcaatt acggcaaccc cgacaacaac 1860

cgttggcagc agaccacctt gccgttcggc aacggcaaga tcggcggcac cgtctggggc 1920

gaggtcagcc gtgaacgcgt caccttcaac gaggagacgc tgtggaccgg cggccccgga 1980

tcctcgacca gctacaacgg cggcaacaac gagaccaagg gtcagaacgg cgccacgctg 2040

cgcgcgctca acaagcagct cgcgaacggc gccgagacgg tcaatcccgg caacctgacc 2100

ggcggcgaga acgcggccga gcagggcaac tacctgaact ggggcgacat ctacctcgac 2160

tacgggttca acgatacgac cgtcaccgaa taccgccgcg acctgaacct gagcaagggc 2220

aaggccgacg tcacgttcaa gcatgacggc gtcacctaca cgcgcgaata cttcgcgtcg 2280

aaccccgaca atgtcatggt cgcccgcctc acggccagca aagccggcaa gctgaacttc 2340

aacgtcagca tgccgaccaa cacgaactac tccaagaccg gcgaaaccac gacggtcaag 2400

ggtgacacgc tcaccgtcaa gggcgctctc ggcaacaacg gcctgctgta caactcgcag 2460

atcaaggtcg tcctcgacaa cggtgagggc acgctctccg aaggctccga cggcgcttcg 2520

ctgaaggtct ccgacgcgaa ggcggtcacg ctgtacatcg ccgccgcgac ggactacaag 2580

cagaagtatc cgtcctaccg caccggcgaa accgccgccg aggtgaacac ccgcgtcgcc 2640

aaggtcgtgc aggacgccgc caacaagggc tacaccgccg tcaagaaagc gcacatcgac 2700

gatcattccg ccatctacga ccgcgtgaag atcgatttgg gccagtccgg ccacagctcc 2760

gacggcgccg tcgccaccga cgcgctgctc aaggcgtacc agagaggctc cgcaaccacc 2820

gcgcagaagc gcgagctgga gacgctggtg tacaagtacg gccgctactt gaccatcggc 2880

tcctcccgtg agaacagcca gctgcccagc aacctgcagg gcatctggtc ggtcaccgcg 2940

ggcgacaacg cccacggcaa cacgccttgg ggctccgact tccacatgaa cgtgaacctc 3000

cagatgaact actggccgac ctattcggcc aacatgggag agctcgccga gccgctcatc 3060

gagtatgtgg agggtctggt caagcccggc cgtgtgaccg ccaaggtcta cgcgggcgcg 3120

gagacgacga accccgagac cacgccgatc ggcgagggcg agggctacat ggcccacacc 3180

gagaacaccg cctacggctg gaccgcaccc ggtcaatcgt tctcgtgggg ttggagcccg 3240

gccgccgtgc cgtggatcct gcagaacgtg tacgaggcgt acgagtactc cggcgaccct 3300

gccctgcttg atcgcgtgta cgcgctgctc aaggaggaat cgcacttcta cgtcaactac 3360

atgctgcaca aggccggctc cagctccggt gaccgcctga ctaccggcgt cgcgtactcg 3420

cccgaacagg gcccgctggg caccgacggc aacacgtacg agagctcgct cgtgtggcag 3480

atgctcaacg acgccatcga ggcggccaag gccaagggag atccggacgg tctggtcggc 3540

aataccaccg actgctcggc cgacaactgg gccaagaatg acagcggcaa cttcaccgat 3600

gcgaacgcca accgttcctg gagctgcgcc aagagcctgc tcaagccgat cgaggtcggc 3660

gactccggcc agatcaagga atggtacttc gaaggtgcgc tcggcaagaa gaaggatgga 3720

tccaccatca gcggctacca ggcggacaac cagcaccgtc acatgtccca cctgctcgga 3780

ctgttccccg gtgatttgat caccatcgac aactccgagt acatggatgc ggccaagacc 3840

tcgctgaggt accgctgctt caagggcaac gtgctgcagt ccaacaccgg ctgggccatt 3900

ggccagcgca tcaattcgtg ggctcgcacc ggcgacggca acaccacgta ccagctggtc 3960

gagctgcagc tcaagaacgc gatgtatgca aacctgttcg attaccatgc gccgttccag 4020

atcgacggca acttcggcaa cacctccggt gtcgacgaaa tgctgctgca gtccaactcc 4080

accttcaccg acaccgccgg caagaagtac gtgaactaca cgaacatcct gcccgccctg 4140

cccgatgcct gggcgggcgg ctcggtgagc ggcctcgtgg cccgcggcaa cttcaccgtc 4200

ggcacgacat ggaagaacgg caaggccacc gaagtcaggc tgacctccaa caagggcaag 4260

caggcggccg tcaagatcac cgccggcggc gcccagaact acgaggtcaa gaacggtgac 4320

accgccgtga acgccaaggt cgtgaccaac gcggacggcg cctcgctgct cgtgttcgat 4380

accaccgcag gcaccacgta cacgatcacg aagaaggcga gcgccaacgt gcccgtcacc 4440

ggcgtgaccg tgaccggcgc caacaccgcc accgcaggcg acaccgtcac tcttacggct 4500

accgtcgccc cggccaatgc gaccgacaag tccgtcacct ggtcgacctc cgacgccgcc 4560

gtagctacgg tcaacgccaa cggcgtggtg accacgaaga aggccggcaa ggtgaccatc 4620

accgccacgt cgaacggcga caagacgaag ttcggttcca tcgagatcac cgtctccgcc 4680

gcgaccgtgc ccgtcaccag cgtcaccgtt gccggcgacg ccgcgatgac cgtcgatgga 4740

gagcagaccc tgacggcgac cgtcgccccg gccactgcga ccgacaagac ggtcacgtgg 4800

aagtcctccg acgccactgt ggcgacggtt gacgccaacg gcaaggtcgt cgcgaagaag 4860

gccggcgaag tgacgatcac cgccacggcc ggtggcgtgt ccggcacgct gaagatcacg 4920

gtgagcgaca aggccccgac cgtcatcccg gtccagtccg tgaccgtgac aggcaagcag 4980

gagctcgtcg aaggcgcctc cacgaccctg acggcgaccg tcgccccggc tgacgcgacc 5040

gacaagacgg ttacgtggaa gtcgagcgac gagtccgtcg ccacggtcga caaggacggc 5100

gtcgtgaccg ccaagaaggc cggcacggtg accatcaccg ccacggccgg tggcgtgtcc 5160

ggcacgctcc acatcaccgt gacggccaag cccgtcgaga ccgtccccgt caccagcgtg 5220

gaggtcaccg tcgaggccgg caccaccgtc tccgtcggca agacactcca ggccaccgcg 5280

accgtcaagc ccggcaacgc caccaacaag aaggtgacgt ggaagtcgag cgacgaatcc 5340

atcgcgacgg tcgacgccaa cggcgtcatc accgcgaaga aggccggcaa ggtcgtcatc 5400

acggccacct cgaccgacgg cacggacaag tccggcagcg tcgagatcac cgtcgtggat 5460

gagaccaagc cgacgcccga ccacaagtcc gtcaaggccg ataccggcga cgtgaccgcc 5520

ggcaagaccg gtacggtcac cgagccgaag gacgtggcgg gctggaagag ccgctccatc 5580

atcaagcaag gcaagctcgg caaggccgaa atcgccgacg gcacgctcgt gtatgcggcc 5640

ggcgacaaga ccggtgacga cagcttcgtc gtgcagtaca cgatggccga cggcacggtc 5700

atcgacgtga cctacagcgt cacggtcaag gccgccgaaa ccggcaagaa cgacggcgac 5760

ggcaagggcg acggtgtcgc gaagaccggc gccgccgtcg gcgcgctcgc cggcctcggc 5820

ttgatgctgc tcgccgtcgg agtgagcgtg gtgatgattc gccgcaagca ctccgcctga 5880

<210> 2

<211> 1959

<212> PRT

<213> 两岐双岐杆菌

<400> 2

Met Lys His Arg Ala Met Ser Ser Arg Leu Met Pro Leu Val Ala Ser

1 5 10 15

Cys Ala Thr Val Gly Met Leu Leu Ala Gly Leu Pro Val Ser Ala Val

20 25 30

Ala Val Gly Thr Thr Arg Ala Ala Ala Ser Asp Ala Ser Ser Ser Thr

35 40 45

Thr Ala Thr Ile Thr Pro Ser Ala Asp Thr Thr Leu Gln Thr Trp Thr

50 55 60

Ser Glu Lys Asn Ser Ser Met Ala Ser Lys Pro Tyr Ile Gly Thr Leu

65 70 75 80

Gln Gly Pro Ser Gln Gly Val Phe Gly Glu Lys Phe Glu Ser Thr Asp

85 90 95

Ala Ala Asp Thr Thr Asp Leu Lys Thr Gly Leu Leu Thr Phe Asp Leu

100 105 110

Ser Ala Tyr Asp His Ala Pro Asp Ser Ala Thr Phe Glu Met Thr Tyr

115 120 125

Leu Gly Tyr Arg Gly Asn Pro Thr Ala Thr Asp Thr Asp Thr Ile Lys

130 135 140

Val Thr Pro Val Asp Thr Thr Val Cys Thr Asn Asn Ala Thr Asp Cys

145 150 155 160

Gly Ala Asn Val Ala Thr Gly Ala Thr Lys Pro Lys Phe Ser Ile Asn

165 170 175

Asp Ser Ser Phe Val Ala Glu Ser Lys Pro Phe Glu Tyr Gly Thr Thr

180 185 190

Val Tyr Thr Gly Asp Ala Ile Thr Val Val Pro Ala Asn Thr Lys Lys

195 200 205

Val Thr Val Asp Val Thr Glu Ile Val Arg Gln Gln Phe Ala Glu Gly

210 215 220

Lys Lys Val Ile Thr Leu Ala Val Gly Glu Thr Lys Lys Thr Glu Val

225 230 235 240

Arg Phe Ala Ser Ser Glu Gly Thr Thr Ser Leu Asn Gly Ala Thr Ala

245 250 255

Asp Met Ala Pro Lys Leu Thr Val Ser Val Ser Thr Lys Asp Asp Leu

260 265 270

Lys Pro Ser Ala Asp Thr Thr Leu Gln Ala Trp Ala Ser Glu Lys Asn

275 280 285

Glu Lys Lys Asn Thr Ala Ala Tyr Val Gly Ala Leu Gln Pro Glu Gly

290 295 300

Asp Tyr Gly Asp Phe Gly Glu Lys Phe Lys Ser Thr Asp Val His Asp

305 310 315 320

Val Thr Asp Ala Lys Met Gly Leu Met Thr Phe Asp Leu Ser Asp Tyr

325 330 335

Thr Ala Ala Pro Glu His Ser Ile Leu Thr Leu Thr Tyr Leu Gly Tyr

340 345 350

Ala Gly Ala Asp Lys Thr Ala Thr Ala Thr Asp Lys Val Lys Val Val

355 360 365

Ala Val Asp Thr Ser Arg Cys Thr Gly Thr Ala Pro Cys Asp Thr Asn

370 375 380

Asn Ala Thr Trp Ala Asn Arg Pro Asp Phe Glu Val Thr Asp Thr Thr

385 390 395 400

Lys Thr Ala Thr Ser His Ala Phe Ala Tyr Gly Ser Lys Lys Tyr Ser

405 410 415

Asp Gly Met Thr Val Glu Ser Gly Asn Ala Lys Lys Val Leu Leu Asp

420 425 430

Val Ser Asp Val Ile Lys Ala Glu Phe Ala Lys Phe Ser Ala Gly Ala

435 440 445

Thr Glu Lys Lys Ile Thr Leu Ala Leu Gly Glu Leu Asn Lys Ser Asp

450 455 460

Met Arg Phe Gly Ser Lys Glu Val Thr Ser Leu Thr Gly Ala Thr Glu

465 470 475 480

Ala Met Gln Pro Thr Leu Ser Val Thr Lys Lys Pro Lys Ala Tyr Thr

485 490 495

Leu Ser Ile Glu Gly Pro Thr Lys Val Lys Tyr Gln Lys Gly Glu Ala

500 505 510

Phe Asp Lys Ala Gly Leu Val Val Lys Ala Thr Ser Thr Ala Asp Gly

515 520 525

Thr Val Lys Thr Leu Thr Glu Gly Asn Gly Glu Asp Asn Tyr Thr Ile

530 535 540

Asp Thr Ser Ala Phe Asp Ser Ala Ser Ile Gly Val Tyr Pro Val Thr

545 550 555 560

Val Lys Tyr Asn Lys Asp Pro Glu Ile Ala Ala Ser Phe Asn Ala Tyr

565 570 575

Val Ile Ala Ser Val Glu Asp Gly Gly Asp Gly Asp Thr Ser Lys Asp

580 585 590

Asp Trp Leu Trp Tyr Lys Gln Pro Ala Ser Gln Thr Asp Ala Thr Ala

595 600 605

Thr Ala Gly Gly Asn Tyr Gly Asn Pro Asp Asn Asn Arg Trp Gln Gln

610 615 620

Thr Thr Leu Pro Phe Gly Asn Gly Lys Ile Gly Gly Thr Val Trp Gly

625 630 635 640

Glu Val Ser Arg Glu Arg Val Thr Phe Asn Glu Glu Thr Leu Trp Thr

645 650 655

Gly Gly Pro Gly Ser Ser Thr Ser Tyr Asn Gly Gly Asn Asn Glu Thr

660 665 670

Lys Gly Gln Asn Gly Ala Thr Leu Arg Ala Leu Asn Lys Gln Leu Ala

675 680 685

Asn Gly Ala Glu Thr Val Asn Pro Gly Asn Leu Thr Gly Gly Glu Asn

690 695 700

Ala Ala Glu Gln Gly Asn Tyr Leu Asn Trp Gly Asp Ile Tyr Leu Asp

705 710 715 720

Tyr Gly Phe Asn Asp Thr Thr Val Thr Glu Tyr Arg Arg Asp Leu Asn

725 730 735

Leu Ser Lys Gly Lys Ala Asp Val Thr Phe Lys His Asp Gly Val Thr

740 745 750

Tyr Thr Arg Glu Tyr Phe Ala Ser Asn Pro Asp Asn Val Met Val Ala

755 760 765

Arg Leu Thr Ala Ser Lys Ala Gly Lys Leu Asn Phe Asn Val Ser Met

770 775 780

Pro Thr Asn Thr Asn Tyr Ser Lys Thr Gly Glu Thr Thr Thr Val Lys

785 790 795 800

Gly Asp Thr Leu Thr Val Lys Gly Ala Leu Gly Asn Asn Gly Leu Leu

805 810 815

Tyr Asn Ser Gln Ile Lys Val Val Leu Asp Asn Gly Glu Gly Thr Leu

820 825 830

Ser Glu Gly Ser Asp Gly Ala Ser Leu Lys Val Ser Asp Ala Lys Ala

835 840 845

Val Thr Leu Tyr Ile Ala Ala Ala Thr Asp Tyr Lys Gln Lys Tyr Pro

850 855 860

Ser Tyr Arg Thr Gly Glu Thr Ala Ala Glu Val Asn Thr Arg Val Ala

865 870 875 880

Lys Val Val Gln Asp Ala Ala Asn Lys Gly Tyr Thr Ala Val Lys Lys

885 890 895

Ala His Ile Asp Asp His Ser Ala Ile Tyr Asp Arg Val Lys Ile Asp

900 905 910

Leu Gly Gln Ser Gly His Ser Ser Asp Gly Ala Val Ala Thr Asp Ala

915 920 925

Leu Leu Lys Ala Tyr Gln Arg Gly Ser Ala Thr Thr Ala Gln Lys Arg

930 935 940

Glu Leu Glu Thr Leu Val Tyr Lys Tyr Gly Arg Tyr Leu Thr Ile Gly

945 950 955 960

Ser Ser Arg Glu Asn Ser Gln Leu Pro Ser Asn Leu Gln Gly Ile Trp

965 970 975

Ser Val Thr Ala Gly Asp Asn Ala His Gly Asn Thr Pro Trp Gly Ser

980 985 990

Asp Phe His Met Asn Val Asn Leu Gln Met Asn Tyr Trp Pro Thr Tyr

995 1000 1005

Ser Ala Asn Met Gly Glu Leu Ala Glu Pro Leu Ile Glu Tyr Val

1010 1015 1020

Glu Gly Leu Val Lys Pro Gly Arg Val Thr Ala Lys Val Tyr Ala

1025 1030 1035

Gly Ala Glu Thr Thr Asn Pro Glu Thr Thr Pro Ile Gly Glu Gly

1040 1045 1050

Glu Gly Tyr Met Ala His Thr Glu Asn Thr Ala Tyr Gly Trp Thr

1055 1060 1065

Ala Pro Gly Gln Ser Phe Ser Trp Gly Trp Ser Pro Ala Ala Val

1070 1075 1080

Pro Trp Ile Leu Gln Asn Val Tyr Glu Ala Tyr Glu Tyr Ser Gly

1085 1090 1095

Asp Pro Ala Leu Leu Asp Arg Val Tyr Ala Leu Leu Lys Glu Glu

1100 1105 1110

Ser His Phe Tyr Val Asn Tyr Met Leu His Lys Ala Gly Ser Ser

1115 1120 1125

Ser Gly Asp Arg Leu Thr Thr Gly Val Ala Tyr Ser Pro Glu Gln

1130 1135 1140

Gly Pro Leu Gly Thr Asp Gly Asn Thr Tyr Glu Ser Ser Leu Val

1145 1150 1155

Trp Gln Met Leu Asn Asp Ala Ile Glu Ala Ala Lys Ala Lys Gly

1160 1165 1170

Asp Pro Asp Gly Leu Val Gly Asn Thr Thr Asp Cys Ser Ala Asp

1175 1180 1185

Asn Trp Ala Lys Asn Asp Ser Gly Asn Phe Thr Asp Ala Asn Ala

1190 1195 1200

Asn Arg Ser Trp Ser Cys Ala Lys Ser Leu Leu Lys Pro Ile Glu

1205 1210 1215

Val Gly Asp Ser Gly Gln Ile Lys Glu Trp Tyr Phe Glu Gly Ala

1220 1225 1230

Leu Gly Lys Lys Lys Asp Gly Ser Thr Ile Ser Gly Tyr Gln Ala

1235 1240 1245

Asp Asn Gln His Arg His Met Ser His Leu Leu Gly Leu Phe Pro

1250 1255 1260

Gly Asp Leu Ile Thr Ile Asp Asn Ser Glu Tyr Met Asp Ala Ala

1265 1270 1275

Lys Thr Ser Leu Arg Tyr Arg Cys Phe Lys Gly Asn Val Leu Gln

1280 1285 1290

Ser Asn Thr Gly Trp Ala Ile Gly Gln Arg Ile Asn Ser Trp Ala

1295 1300 1305

Arg Thr Gly Asp Gly Asn Thr Thr Tyr Gln Leu Val Glu Leu Gln

1310 1315 1320

Leu Lys Asn Ala Met Tyr Ala Asn Leu Phe Asp Tyr His Ala Pro

1325 1330 1335

Phe Gln Ile Asp Gly Asn Phe Gly Asn Thr Ser Gly Val Asp Glu

1340 1345 1350

Met Leu Leu Gln Ser Asn Ser Thr Phe Thr Asp Thr Ala Gly Lys

1355 1360 1365

Lys Tyr Val Asn Tyr Thr Asn Ile Leu Pro Ala Leu Pro Asp Ala

1370 1375 1380

Trp Ala Gly Gly Ser Val Ser Gly Leu Val Ala Arg Gly Asn Phe

1385 1390 1395

Thr Val Gly Thr Thr Trp Lys Asn Gly Lys Ala Thr Glu Val Arg

1400 1405 1410

Leu Thr Ser Asn Lys Gly Lys Gln Ala Ala Val Lys Ile Thr Ala

1415 1420 1425

Gly Gly Ala Gln Asn Tyr Glu Val Lys Asn Gly Asp Thr Ala Val

1430 1435 1440

Asn Ala Lys Val Val Thr Asn Ala Asp Gly Ala Ser Leu Leu Val

1445 1450 1455

Phe Asp Thr Thr Ala Gly Thr Thr Tyr Thr Ile Thr Lys Lys Ala

1460 1465 1470

Ser Ala Asn Val Pro Val Thr Gly Val Thr Val Thr Gly Ala Asn

1475 1480 1485

Thr Ala Thr Ala Gly Asp Thr Val Thr Leu Thr Ala Thr Val Ala

1490 1495 1500

Pro Ala Asn Ala Thr Asp Lys Ser Val Thr Trp Ser Thr Ser Asp

1505 1510 1515

Ala Ala Val Ala Thr Val Asn Ala Asn Gly Val Val Thr Thr Lys

1520 1525 1530

Lys Ala Gly Lys Val Thr Ile Thr Ala Thr Ser Asn Gly Asp Lys

1535 1540 1545

Thr Lys Phe Gly Ser Ile Glu Ile Thr Val Ser Ala Ala Thr Val

1550 1555 1560

Pro Val Thr Ser Val Thr Val Ala Gly Asp Ala Ala Met Thr Val

1565 1570 1575

Asp Gly Glu Gln Thr Leu Thr Ala Thr Val Ala Pro Ala Thr Ala

1580 1585 1590

Thr Asp Lys Thr Val Thr Trp Lys Ser Ser Asp Ala Thr Val Ala

1595 1600 1605

Thr Val Asp Ala Asn Gly Lys Val Val Ala Lys Lys Ala Gly Glu

1610 1615 1620

Val Thr Ile Thr Ala Thr Ala Gly Gly Val Ser Gly Thr Leu Lys

1625 1630 1635

Ile Thr Val Ser Asp Lys Ala Pro Thr Val Ile Pro Val Gln Ser

1640 1645 1650

Val Thr Val Thr Gly Lys Gln Glu Leu Val Glu Gly Ala Ser Thr

1655 1660 1665

Thr Leu Thr Ala Thr Val Ala Pro Ala Asp Ala Thr Asp Lys Thr

1670 1675 1680

Val Thr Trp Lys Ser Ser Asp Glu Ser Val Ala Thr Val Asp Lys

1685 1690 1695

Asp Gly Val Val Thr Ala Lys Lys Ala Gly Thr Val Thr Ile Thr

1700 1705 1710

Ala Thr Ala Gly Gly Val Ser Gly Thr Leu His Ile Thr Val Thr

1715 1720 1725

Ala Lys Pro Val Glu Thr Val Pro Val Thr Ser Val Glu Val Thr

1730 1735 1740

Val Glu Ala Gly Thr Thr Val Ser Val Gly Lys Thr Leu Gln Ala

1745 1750 1755

Thr Ala Thr Val Lys Pro Gly Asn Ala Thr Asn Lys Lys Val Thr

1760 1765 1770

Trp Lys Ser Ser Asp Glu Ser Ile Ala Thr Val Asp Ala Asn Gly

1775 1780 1785

Val Ile Thr Ala Lys Lys Ala Gly Lys Val Val Ile Thr Ala Thr

1790 1795 1800

Ser Thr Asp Gly Thr Asp Lys Ser Gly Ser Val Glu Ile Thr Val

1805 1810 1815

Val Asp Glu Thr Lys Pro Thr Pro Asp His Lys Ser Val Lys Ala

1820 1825 1830

Asp Thr Gly Asp Val Thr Ala Gly Lys Thr Gly Thr Val Thr Glu

1835 1840 1845

Pro Lys Asp Val Ala Gly Trp Lys Ser Arg Ser Ile Ile Lys Gln

1850 1855 1860

Gly Lys Leu Gly Lys Ala Glu Ile Ala Asp Gly Thr Leu Val Tyr

1865 1870 1875

Ala Ala Gly Asp Lys Thr Gly Asp Asp Ser Phe Val Val Gln Tyr

1880 1885 1890

Thr Met Ala Asp Gly Thr Val Ile Asp Val Thr Tyr Ser Val Thr

1895 1900 1905

Val Lys Ala Ala Glu Thr Gly Lys Asn Asp Gly Asp Gly Lys Gly

1910 1915 1920

Asp Gly Val Ala Lys Thr Gly Ala Ala Val Gly Ala Leu Ala Gly

1925 1930 1935

Leu Gly Leu Met Leu Leu Ala Val Gly Val Ser Val Val Met Ile

1940 1945 1950

Arg Arg Lys His Ser Ala

1955

<210> 3

<211> 4482

<212> DNA

<213> 两岐双岐杆菌

<400> 3

atgctacaca cagcatcaag aggatgctcg cgttcgtggc tgcgcagact caccgcattg 60

atagcggtct cggcgctcgc gttcgtggca ttgccgaacg tcgcggtggc ggcggatccg 120

atggaatacc tcgatgtgtc gttcggcggc acgttcgctg cagacaccta caccacaggt 180

ggcgacgagg tggcgaaggg ccccgtgacc aagcacggca gcataccgac caagcttgac 240

ggcggcggca tcaccctcgc tggcggcacc aacggcgtga cattcacctc gaccgcgagc 300

ttcagcgaga gtgggaaggt gaacaaggga ttccgcgccg aaatggagta ccgtacgacg 360

cagacgccca gcaacctcgc cacattgttc tccgccatgg gcaacatctt cgtgcgggcg 420

aacggcagca acctcgaata cggcttctcc acgaaccctt ccggcagtac atggaacgac 480

tacacaaagt ccgtgacgct gccttccaac aatgtgaagc acatcatcca gctgacatat 540

ctgccgggag ccgacggcgc tgcctcgacg ttgcagttgt cggtggatgg cgtggccggc 600

gagaccgcca cctccgcggc cggcgagctc gcggccgtca gcgattccgt cgggaacaag 660

ttcgggatcg gctacgaggt gaaccccgct tccggcgcgg cgagccgcgg tcttgccggt 720

gacgtgttcc gcgcgcgtgt cgccgattcg gacgccccgt gggagattct tgacgcatcc 780

cagctgctgc atgtcaattt caacggcacg ttcagcggca cctcatatac cgcggcgagc 840

ggcgagcaga tgctgggctc gctggtgtcg cgctcggcca atccgtccat ctcgaactcc 900

gccgtcacgc tgggcggcgg cacggccgga ttcgatttca cgcccacgga cttcaccctc 960

ggtgacaacg aggccatcac ccgcccgctg gtcgcggagc tgcgcttcac cccgacgcag 1020

accggcgaca accagaccct gttcggcgcg ggcggcaacc tgttcctgcg ctacgagtcg 1080

aacaagctcg tgttcggcgc ctccaccaag tccggcgata attggaccga ccacaagatc 1140

gagtccgcgg ccgccacggg tgcggagcac gtcgtgtcgg tggcgtacgt gcccaataag 1200

gccggcaccg gcgcgaagct tgtcatgcgc gtggatggcg gcgacgccca gaccaaggac 1260

atcactggtc tggcttacct gaattcgagc atcaagggca aggtcggctt cggcaacgac 1320

gtgcataccg acgcgctcag ccgcggcttc gtcggctcgc tgagcgagat ccgcctggcc 1380

gaaacctccg cgaacttcac caccaacgaa ttcaagctgg tctactctca ggtcagctgc 1440

gacacgtcgg gcatcaagga ggcgaatacc ttcgacgtgg agcccgccga gtgcgaggcc 1500

gcgcttaaga ccaagctgtc caagctgcgt ccgaccgaag ggcaggccga ctacatcgac 1560

tggggtcaga tcggattcct ccattacggc atcaacacgt actacaacca ggagtggggt 1620

cacggtaacg aggatccctc ccgcatcaac ccgaccggcc tcgacaccga ccagtgggcg 1680

aagtccttcg ccgacggtgg cttcaagatg atcatggtga cggtcaagca ccatgacggt 1740

ttcgagctgt acgactcgcg gtacaacacc gagcacgact gggcaaacac cgccgtcgcc 1800

aagcgcacgg gggagaagga cctgttccgc aagattgtcg cctcggcgaa gaaatacggc 1860

ctgaaggtcg gcatctacta ttcgccggcc gattcctaca tggagaggaa gggcgtctgg 1920

ggcaacaact ccgcacgcgt cgagcgcacg atccccacgc tggtggagaa cgacgaccgc 1980

gccggcaagg tggcttccgg caaactgccc acgttcaagt acaaggccac ggattacggc 2040

gcctacatgc tcaaccagct ctatgagctg ctgactgagt acggcgacat ctccgaggtc 2100

tggttcgacg gtgcccaagg caacaccgca ggcactgagc attacgacta tggcgtgttc 2160

tacgagatga tccgccggct tcagccccag gcaattcagg ccaacgccgc atacgatgcc 2220

cgatgggtgg gcaacgagga cggctgggcc cgtcagaccg agtggagccc gcaggcggca 2280

tacaacgacg gcgtggacaa ggtgtcgctc aagcctggcc agatggcccc cgacggtaag 2340

cttggcagca tgtcgagcgt gctgtccgag atccgcagcg gcgccgccaa ccagctgcac 2400

tggtatccgg ccgaagtcga cgccaagaac cggcccggat ggttctaccg tgccagccaa 2460

tcgccggcgt ccgtagccga agtcgtgaag tactacgagc agtccacggg acgcaactcg 2520

cagtatctgc tgaacgtccc accgtccgat accggcaagc tcgccgatgc ggatgccgcg 2580

ggacttaagg ggctgggcga ggagctcgcc cgacgctacg gcaccgatct tgccctgggc 2640

aagagcgcga ccgtcgccgc gtccgcgaac gacactgcgg tagcggcccc gaagctgacc 2700

gacggttcga agctctcctc cgacaaggcc gtgggcaata cgccgacgta caccatcgat 2760

ctgggcagca ctgtcgccgt ggatgcagtg aagatctccg aggacgtgcg caatgccggc 2820

cagcagatcg aaagcgccac tctgcaggga cgagtcaatg gaacatggac gaatctggcg 2880

actatgacga cggtcgggca gcagcgcgac cttcgcttca cgtcccagaa catcgatgcc 2940

atccgtctgg tggtcaactc ctcccgcggt ccggtgcgtc tgagccgtct tgaggtgttc 3000

cacaccgaat ccgagattca gaccggcgcc cgcgcctact acatcgatcc gacggcgcag 3060

accgcgggag atggattcac gaaggacaag cccatgacgt cgatcgagca gctgcacgat 3120

gtgaccgtcg cgccaggctc cgtgatcttc gtcaaggcgg gcaccgagct gaccggggac 3180

ttcgccgtct tcggctacgg caccaaggac gagcccatca ccgtgacgac atacggcgaa 3240

agcgacaaag ccaccaccgc gagcttcgac ggcatgaccg ccgggctgac gctgaagcag 3300

gcgctgaagg cgctcggcaa ggacgacgcc ggctgggtcg tggccgattc cgccactgca 3360

ccggcctccc gcgtgtatgt cccgcaggat gagatcagcg tgcacgccca gtcgtcgcag 3420

aactccggcg cagaggcggc gagggcgctc gacggcgact cgtcgacgag ctggcactcc 3480

cagtacagcc cgaccaccgc gtctgctccg cattgggtga ctctcgatct cggcaaatcg 3540

cgtgagaacg tcgcctactt cgactacctc gcccgtatcg acggcaacaa taacggtgcc 3600

gccaaggatt acgaggtgta tgtctccgac gatcccaacg attttggagc ccctgtggcc 3660

tcgggcacgt tgaagaacgt cgcctacacg cagcgcatca agctgacccc caagaacgga 3720

cggtacgtca agttcgtcat caagaccgat tattccggat cgaacttcgg ctccgcggcg 3780

gaaatgaatg tcgagttgct gcccacggcc gtagaggagg acaaggtcgc caccccgcag 3840

aagccgacag tggacgatga tgccgataca tacaccatcc ccgacatcga gggagtcgtg 3900

tacaaggtcg acggcaaggt gttggccgct ggttccgtag tgaacgtggg cgatgaggac 3960

gtgaccgtca cggtcaccgc cgagcccgcc gacggatacc gcttcccgga tggtgtgacg 4020

tccccagtca cgtatgagct gacgttcacc aagaagggtg gcgagaagcc tccgaccgaa 4080

gtcaacaagg acaagctgca cgccacgatc accaaggctc aggcgatcga ccgttccgcc 4140

tatacggacg agtcgctcaa ggtgcttgat gacaagctcg ccgcagcgct caaggtctat 4200

gacgatgaca aggtgagcca ggatgatgtc gatgccgccg aggcggctct gtctgcggcg 4260

atcgacgcgc tgaagaccaa gccgacgacc cccggcggtg aaggtgagaa gcctggtgaa 4320

ggtgaaaagc ccggtgacgg caacaagccc ggtgacggca agaagcccgg cgacgtgatc 4380

gcaaagaccg gcgcctccac aatgggcgtt gtcttcgctg cactcgcgat ggtagcgggt 4440

gcggtcgtga cgcttgaagc caagcgtaag tccaaccggt aa 4482

<210> 4

<211> 1493

<212> PRT

<213> 两岐双岐杆菌

<400> 4

Met Leu His Thr Ala Ser Arg Gly Cys Ser Arg Ser Trp Leu Arg Arg

1 5 10 15

Leu Thr Ala Leu Ile Ala Val Ser Ala Leu Ala Phe Val Ala Leu Pro

20 25 30

Asn Val Ala Val Ala Ala Asp Pro Met Glu Tyr Leu Asp Val Ser Phe

35 40 45

Gly Gly Thr Phe Ala Ala Asp Thr Tyr Thr Thr Gly Gly Asp Glu Val

50 55 60

Ala Lys Gly Pro Val Thr Lys His Gly Ser Ile Pro Thr Lys Leu Asp

65 70 75 80

Gly Gly Gly Ile Thr Leu Ala Gly Gly Thr Asn Gly Val Thr Phe Thr

85 90 95

Ser Thr Ala Ser Phe Ser Glu Ser Gly Lys Val Asn Lys Gly Phe Arg

100 105 110

Ala Glu Met Glu Tyr Arg Thr Thr Gln Thr Pro Ser Asn Leu Ala Thr

115 120 125

Leu Phe Ser Ala Met Gly Asn Ile Phe Val Arg Ala Asn Gly Ser Asn

130 135 140

Leu Glu Tyr Gly Phe Ser Thr Asn Pro Ser Gly Ser Thr Trp Asn Asp

145 150 155 160

Tyr Thr Lys Ser Val Thr Leu Pro Ser Asn Asn Val Lys His Ile Ile

165 170 175

Gln Leu Thr Tyr Leu Pro Gly Ala Asp Gly Ala Ala Ser Thr Leu Gln

180 185 190

Leu Ser Val Asp Gly Val Ala Gly Glu Thr Ala Thr Ser Ala Ala Gly

195 200 205

Glu Leu Ala Ala Val Ser Asp Ser Val Gly Asn Lys Phe Gly Ile Gly

210 215 220

Tyr Glu Val Asn Pro Ala Ser Gly Ala Ala Ser Arg Gly Leu Ala Gly

225 230 235 240

Asp Val Phe Arg Ala Arg Val Ala Asp Ser Asp Ala Pro Trp Glu Ile

245 250 255

Leu Asp Ala Ser Gln Leu Leu His Val Asn Phe Asn Gly Thr Phe Ser

260 265 270

Gly Thr Ser Tyr Thr Ala Ala Ser Gly Glu Gln Met Leu Gly Ser Leu

275 280 285

Val Ser Arg Ser Ala Asn Pro Ser Ile Ser Asn Ser Ala Val Thr Leu

290 295 300

Gly Gly Gly Thr Ala Gly Phe Asp Phe Thr Pro Thr Asp Phe Thr Leu

305 310 315 320

Gly Asp Asn Glu Ala Ile Thr Arg Pro Leu Val Ala Glu Leu Arg Phe

325 330 335

Thr Pro Thr Gln Thr Gly Asp Asn Gln Thr Leu Phe Gly Ala Gly Gly

340 345 350

Asn Leu Phe Leu Arg Tyr Glu Ser Asn Lys Leu Val Phe Gly Ala Ser

355 360 365

Thr Lys Ser Gly Asp Asn Trp Thr Asp His Lys Ile Glu Ser Ala Ala

370 375 380

Ala Thr Gly Ala Glu His Val Val Ser Val Ala Tyr Val Pro Asn Lys

385 390 395 400

Ala Gly Thr Gly Ala Lys Leu Val Met Arg Val Asp Gly Gly Asp Ala

405 410 415

Gln Thr Lys Asp Ile Thr Gly Leu Ala Tyr Leu Asn Ser Ser Ile Lys

420 425 430

Gly Lys Val Gly Phe Gly Asn Asp Val His Thr Asp Ala Leu Ser Arg

435 440 445

Gly Phe Val Gly Ser Leu Ser Glu Ile Arg Leu Ala Glu Thr Ser Ala

450 455 460

Asn Phe Thr Thr Asn Glu Phe Lys Leu Val Tyr Ser Gln Val Ser Cys

465 470 475 480

Asp Thr Ser Gly Ile Lys Glu Ala Asn Thr Phe Asp Val Glu Pro Ala

485 490 495

Glu Cys Glu Ala Ala Leu Lys Thr Lys Leu Ser Lys Leu Arg Pro Thr

500 505 510

Glu Gly Gln Ala Asp Tyr Ile Asp Trp Gly Gln Ile Gly Phe Leu His

515 520 525

Tyr Gly Ile Asn Thr Tyr Tyr Asn Gln Glu Trp Gly His Gly Asn Glu

530 535 540

Asp Pro Ser Arg Ile Asn Pro Thr Gly Leu Asp Thr Asp Gln Trp Ala

545 550 555 560

Lys Ser Phe Ala Asp Gly Gly Phe Lys Met Ile Met Val Thr Val Lys

565 570 575

His His Asp Gly Phe Glu Leu Tyr Asp Ser Arg Tyr Asn Thr Glu His

580 585 590

Asp Trp Ala Asn Thr Ala Val Ala Lys Arg Thr Gly Glu Lys Asp Leu

595 600 605

Phe Arg Lys Ile Val Ala Ser Ala Lys Lys Tyr Gly Leu Lys Val Gly

610 615 620

Ile Tyr Tyr Ser Pro Ala Asp Ser Tyr Met Glu Arg Lys Gly Val Trp

625 630 635 640

Gly Asn Asn Ser Ala Arg Val Glu Arg Thr Ile Pro Thr Leu Val Glu

645 650 655

Asn Asp Asp Arg Ala Gly Lys Val Ala Ser Gly Lys Leu Pro Thr Phe

660 665 670

Lys Tyr Lys Ala Thr Asp Tyr Gly Ala Tyr Met Leu Asn Gln Leu Tyr

675 680 685

Glu Leu Leu Thr Glu Tyr Gly Asp Ile Ser Glu Val Trp Phe Asp Gly

690 695 700

Ala Gln Gly Asn Thr Ala Gly Thr Glu His Tyr Asp Tyr Gly Val Phe

705 710 715 720

Tyr Glu Met Ile Arg Arg Leu Gln Pro Gln Ala Ile Gln Ala Asn Ala

725 730 735

Ala Tyr Asp Ala Arg Trp Val Gly Asn Glu Asp Gly Trp Ala Arg Gln

740 745 750

Thr Glu Trp Ser Pro Gln Ala Ala Tyr Asn Asp Gly Val Asp Lys Val

755 760 765

Ser Leu Lys Pro Gly Gln Met Ala Pro Asp Gly Lys Leu Gly Ser Met

770 775 780

Ser Ser Val Leu Ser Glu Ile Arg Ser Gly Ala Ala Asn Gln Leu His

785 790 795 800

Trp Tyr Pro Ala Glu Val Asp Ala Lys Asn Arg Pro Gly Trp Phe Tyr

805 810 815

Arg Ala Ser Gln Ser Pro Ala Ser Val Ala Glu Val Val Lys Tyr Tyr

820 825 830

Glu Gln Ser Thr Gly Arg Asn Ser Gln Tyr Leu Leu Asn Val Pro Pro

835 840 845

Ser Asp Thr Gly Lys Leu Ala Asp Ala Asp Ala Ala Gly Leu Lys Gly

850 855 860

Leu Gly Glu Glu Leu Ala Arg Arg Tyr Gly Thr Asp Leu Ala Leu Gly

865 870 875 880

Lys Ser Ala Thr Val Ala Ala Ser Ala Asn Asp Thr Ala Val Ala Ala

885 890 895

Pro Lys Leu Thr Asp Gly Ser Lys Leu Ser Ser Asp Lys Ala Val Gly

900 905 910

Asn Thr Pro Thr Tyr Thr Ile Asp Leu Gly Ser Thr Val Ala Val Asp

915 920 925

Ala Val Lys Ile Ser Glu Asp Val Arg Asn Ala Gly Gln Gln Ile Glu

930 935 940

Ser Ala Thr Leu Gln Gly Arg Val Asn Gly Thr Trp Thr Asn Leu Ala

945 950 955 960

Thr Met Thr Thr Val Gly Gln Gln Arg Asp Leu Arg Phe Thr Ser Gln

965 970 975

Asn Ile Asp Ala Ile Arg Leu Val Val Asn Ser Ser Arg Gly Pro Val

980 985 990

Arg Leu Ser Arg Leu Glu Val Phe His Thr Glu Ser Glu Ile Gln Thr

995 1000 1005

Gly Ala Arg Ala Tyr Tyr Ile Asp Pro Thr Ala Gln Thr Ala Gly

1010 1015 1020

Asp Gly Phe Thr Lys Asp Lys Pro Met Thr Ser Ile Glu Gln Leu

1025 1030 1035

His Asp Val Thr Val Ala Pro Gly Ser Val Ile Phe Val Lys Ala

1040 1045 1050

Gly Thr Glu Leu Thr Gly Asp Phe Ala Val Phe Gly Tyr Gly Thr

1055 1060 1065

Lys Asp Glu Pro Ile Thr Val Thr Thr Tyr Gly Glu Ser Asp Lys

1070 1075 1080

Ala Thr Thr Ala Ser Phe Asp Gly Met Thr Ala Gly Leu Thr Leu

1085 1090 1095

Lys Gln Ala Leu Lys Ala Leu Gly Lys Asp Asp Ala Gly Trp Val

1100 1105 1110

Val Ala Asp Ser Ala Thr Ala Pro Ala Ser Arg Val Tyr Val Pro

1115 1120 1125

Gln Asp Glu Ile Ser Val His Ala Gln Ser Ser Gln Asn Ser Gly

1130 1135 1140

Ala Glu Ala Ala Arg Ala Leu Asp Gly Asp Ser Ser Thr Ser Trp

1145 1150 1155

His Ser Gln Tyr Ser Pro Thr Thr Ala Ser Ala Pro His Trp Val

1160 1165 1170

Thr Leu Asp Leu Gly Lys Ser Arg Glu Asn Val Ala Tyr Phe Asp

1175 1180 1185

Tyr Leu Ala Arg Ile Asp Gly Asn Asn Asn Gly Ala Ala Lys Asp

1190 1195 1200

Tyr Glu Val Tyr Val Ser Asp Asp Pro Asn Asp Phe Gly Ala Pro

1205 1210 1215

Val Ala Ser Gly Thr Leu Lys Asn Val Ala Tyr Thr Gln Arg Ile

1220 1225 1230

Lys Leu Thr Pro Lys Asn Gly Arg Tyr Val Lys Phe Val Ile Lys

1235 1240 1245

Thr Asp Tyr Ser Gly Ser Asn Phe Gly Ser Ala Ala Glu Met Asn

1250 1255 1260

Val Glu Leu Leu Pro Thr Ala Val Glu Glu Asp Lys Val Ala Thr

1265 1270 1275

Pro Gln Lys Pro Thr Val Asp Asp Asp Ala Asp Thr Tyr Thr Ile

1280 1285 1290

Pro Asp Ile Glu Gly Val Val Tyr Lys Val Asp Gly Lys Val Leu

1295 1300 1305

Ala Ala Gly Ser Val Val Asn Val Gly Asp Glu Asp Val Thr Val

1310 1315 1320

Thr Val Thr Ala Glu Pro Ala Asp Gly Tyr Arg Phe Pro Asp Gly

1325 1330 1335

Val Thr Ser Pro Val Thr Tyr Glu Leu Thr Phe Thr Lys Lys Gly

1340 1345 1350

Gly Glu Lys Pro Pro Thr Glu Val Asn Lys Asp Lys Leu His Ala

1355 1360 1365

Thr Ile Thr Lys Ala Gln Ala Ile Asp Arg Ser Ala Tyr Thr Asp

1370 1375 1380

Glu Ser Leu Lys Val Leu Asp Asp Lys Leu Ala Ala Ala Leu Lys

1385 1390 1395

Val Tyr Asp Asp Asp Lys Val Ser Gln Asp Asp Val Asp Ala Ala

1400 1405 1410

Glu Ala Ala Leu Ser Ala Ala Ile Asp Ala Leu Lys Thr Lys Pro

1415 1420 1425

Thr Thr Pro Gly Gly Glu Gly Glu Lys Pro Gly Glu Gly Glu Lys

1430 1435 1440

Pro Gly Asp Gly Asn Lys Pro Gly Asp Gly Lys Lys Pro Gly Asp

1445 1450 1455

Val Ile Ala Lys Thr Gly Ala Ser Thr Met Gly Val Val Phe Ala

1460 1465 1470

Ala Leu Ala Met Val Ala Gly Ala Val Val Thr Leu Glu Ala Lys

1475 1480 1485

Arg Lys Ser Asn Arg

1490

<210> 5

<211> 2094

<212> DNA

<213> 肺炎链球菌（Streptococcus pneumoniae）

<400> 5

atgaataaaa gaggtcttta ttcaaaacta ggaatttctg ttgtaggcat tagtctttta 60

atgggagtcc ccactttgat tcatgcgaat gaattaaact atggtcaact gtccatatct 120

cctatttttc aaggaggttc atatcaactg aacaataaga gtatagatat cagctctttg 180

ttattagata aattgtctgg agagagtcag acagtagtaa tgaaatttaa agcagataaa 240

ccaaactctc ttcaagcttt gtttggccta tctaatagta aagcaggctt taaaaataat 300

tacttttcaa ttttcatgag agattctggt gagataggtg tagaaataag agacgcccaa 360

gagggaataa attatttatt ttctagacca gcttcattat ggggaaagca taaaggacag 420

gcagttgaaa atacactagt atttgtatct gattctaaag ataaaacata cacaatgtat 480

gttaatggaa tagaagtgtt ctctgaaaca gttgatacat ttttgccaat ttcaaatata 540

aatggtatag ataaggcaac actaggagct gttaatcgtg aaggtaagga acattacctc 600

gcaaaaggaa gtattggtga aatcagtcta tttaacaaag caattagtga tcaggaagtt 660

tcaaatattc ccttgtcaaa tccatttcag ttaattttcc aatcaggaga ttctactcaa 720

gctaactatt ttagaatacc gacactatat acattaagta gtggaagagt tctatcaagt 780

attgatgcac gttatggtgg gactcatgat tctaaaagta agattaatat tgccacttct 840

tatagtgatg ataatgggaa aacgtggagt gagccaattt ttgctatgaa gtttaatgac 900

tatgaggagc agttagttta ctggccacga gataataaat taaagaatag tcaaattagt 960

ggaagtgctt cattcataga ttcatccatt gttgaagata aaaaatctgg gaaaacgata 1020

ttactagctg atgttatgcc tgcgggtatt ggaaataata atgcaaataa agccgactca 1080

ggttttaaag aaataaatgg tcattattat ttaaaactaa agaagaatgg agataacgat 1140

ttccgttata cagttagaga aaatggtgtc gtttatgatg aaacaactaa taaacctaca 1200

aattatacta taaatgataa gtatgaagtt ttggagggag gaaagtcttt aacagtcgaa 1260

caatattcgg ttgattttga tagtggctct ttaagagaaa ggcataatgg aaaacaggtt 1320

cctatgaatg ttttctacaa agattcgtta tttaaagtga ctcctactaa ttatatagca 1380

atgacaacta gtcagaatag aggagagagt tgggaacaat ttaagttgtt gcctccgttc 1440

ttaggagaaa aacataatgg aacttacttg tgtcctggac aaggtttagc attaaaatca 1500

agtaacagat tgatttttgc aacatatact agtggagaac taacctatct catttcggat 1560

gatagtggtc aaacatggaa gaaatcctca gcttcaattc cgtttaaaaa tgcaacagca 1620

gaagcacaaa tggttgaact gagagatggt gtgattagaa cattctttag aaccactaca 1680

ggtaagatag cttatatgac tagtagagat tctggagaaa catggtcgaa agtttcgtat 1740

attgatggaa ttcaacaaac ttcatatggc acacaagtat ctgcaattaa atactctcaa 1800

ttaattgatg gaaaagaagc agtcattttg agtacaccaa attctagaag tggccgtaag 1860

ggaggccaat tagttgtcgg tttggtcaat aaagaagatg atagtattga ttggagatac 1920

cactatgata ttgatttgcc ttcgtatggt tatgcctatt ctgcgattac agaattgcca 1980

aatcatcaca taggtgtact gtttgaaaaa tatgattcgt ggtcgagaaa tgaattgcat 2040

ttaagcaatg tagttcagta tatagatttg gaaattaatg atttaacaaa ataa 2094

<210> 6

<211> 697

<212> PRT

<213> 肺炎链球菌

<400> 6

Met Asn Lys Arg Gly Leu Tyr Ser Lys Leu Gly Ile Ser Val Val Gly

1 5 10 15

Ile Ser Leu Leu Met Gly Val Pro Thr Leu Ile His Ala Asn Glu Leu

20 25 30

Asn Tyr Gly Gln Leu Ser Ile Ser Pro Ile Phe Gln Gly Gly Ser Tyr

35 40 45

Gln Leu Asn Asn Lys Ser Ile Asp Ile Ser Ser Leu Leu Leu Asp Lys

50 55 60

Leu Ser Gly Glu Ser Gln Thr Val Val Met Lys Phe Lys Ala Asp Lys

65 70 75 80

Pro Asn Ser Leu Gln Ala Leu Phe Gly Leu Ser Asn Ser Lys Ala Gly

85 90 95

Phe Lys Asn Asn Tyr Phe Ser Ile Phe Met Arg Asp Ser Gly Glu Ile

100 105 110

Gly Val Glu Ile Arg Asp Ala Gln Lys Gly Ile Asn Tyr Leu Phe Ser

115 120 125

Arg Pro Ala Ser Leu Trp Gly Lys His Lys Gly Gln Ala Val Glu Asn

130 135 140

Thr Leu Val Phe Val Ser Asp Ser Lys Asp Lys Thr Tyr Thr Met Tyr

145 150 155 160

Val Asn Gly Ile Glu Val Phe Ser Glu Thr Val Asp Thr Phe Leu Pro

165 170 175

Ile Ser Asn Ile Asn Gly Ile Asp Lys Ala Thr Leu Gly Ala Val Asn

180 185 190

Arg Glu Gly Lys Glu His Tyr Leu Ala Lys Gly Ser Ile Asp Glu Ile

195 200 205

Ser Leu Phe Asn Lys Ala Ile Ser Asp Gln Glu Val Ser Thr Ile Pro

210 215 220

Leu Ser Asn Pro Phe Gln Leu Ile Phe Gln Ser Gly Asp Ser Thr Gln

225 230 235 240

Ala Asn Tyr Phe Arg Ile Pro Thr Leu Tyr Thr Leu Ser Ser Gly Arg

245 250 255

Val Leu Ser Ser Ile Asp Ala Arg Tyr Gly Gly Thr His Asp Ser Lys

260 265 270

Ser Lys Ile Asn Ile Ala Thr Ser Tyr Ser Asp Asp Asn Gly Lys Thr

275 280 285

Trp Ser Glu Pro Ile Phe Ala Met Lys Phe Asn Asp Tyr Glu Glu Gln

290 295 300

Leu Val Tyr Trp Pro Arg Asp Asn Lys Leu Lys Asn Ser Gln Ile Ser

305 310 315 320

Gly Ser Ala Ser Phe Ile Asp Ser Ser Ile Val Glu Asp Lys Lys Ser

325 330 335

Gly Lys Thr Ile Leu Leu Ala Asp Val Met Pro Ala Gly Ile Gly Asn

340 345 350

Asn Asn Ala Asn Lys Ala Asp Ser Gly Phe Lys Glu Ile Asn Gly His

355 360 365

Tyr Tyr Leu Lys Leu Lys Lys Asn Gly Asp Asn Asp Phe Arg Tyr Thr

370 375 380

Val Arg Glu Asn Gly Val Val Tyr Asn Glu Thr Thr Asn Lys Pro Thr

385 390 395 400

Asn Tyr Thr Ile Asn Asp Lys Tyr Glu Val Leu Glu Gly Gly Lys Ser

405 410 415

Leu Thr Val Glu Gln Tyr Ser Val Asp Phe Asp Ser Gly Ser Leu Arg

420 425 430

Glu Arg His Asn Gly Lys Gln Val Pro Met Asn Val Phe Tyr Lys Asp

435 440 445

Ser Leu Phe Lys Val Thr Pro Thr Asn Tyr Ile Ala Met Thr Thr Ser

450 455 460

Gln Asn Arg Gly Glu Ser Trp Glu Gln Phe Lys Leu Leu Pro Pro Phe

465 470 475 480

Leu Gly Glu Lys His Asn Gly Thr Tyr Leu Cys Pro Gly Gln Gly Leu

485 490 495

Ala Leu Lys Ser Ser Asn Arg Leu Ile Phe Ala Thr Tyr Thr Ser Gly

500 505 510

Glu Leu Thr Tyr Leu Ile Ser Asp Asp Ser Gly Gln Thr Trp Lys Lys

515 520 525

Ser Ser Ala Ser Ile Pro Phe Lys Asn Ala Thr Ala Glu Ala Gln Met

530 535 540

Val Glu Leu Arg Asp Gly Val Ile Arg Thr Phe Phe Arg Thr Thr Thr

545 550 555 560

Gly Lys Ile Ala Tyr Met Thr Ser Arg Asp Ser Gly Glu Thr Trp Ser

565 570 575

Lys Val Ser Tyr Ile Asp Gly Ile Gln Gln Thr Ser Tyr Gly Thr Gln

580 585 590

Val Ser Ala Ile Lys Tyr Ser Gln Leu Ile Asp Gly Lys Glu Ala Val

595 600 605

Ile Leu Ser Thr Pro Asn Ser Arg Ser Gly Arg Lys Gly Gly Gln Leu

610 615 620

Val Val Gly Leu Val Asn Lys Glu Asp Asp Ser Ile Asp Trp Lys Tyr

625 630 635 640

His Tyr Asp Ile Asp Leu Pro Ser Tyr Gly Tyr Ala Tyr Ser Ala Ile

645 650 655

Thr Glu Leu Pro Asn His His Ile Gly Val Leu Phe Glu Lys Tyr Asp

660 665 670

Ser Trp Ser Arg Asn Glu Leu His Leu Ser Asn Val Val Gln Tyr Ile

675 680 685

Asp Leu Glu Ile Asn Asp Leu Thr Lys

690 695

<210> 7

<211> 2076

<212> DNA

<213> 长双歧杆菌（Bifidobacterium longum）

<400> 7

atggaacata gagcgttcaa gtggccgcag ccacttgcgg gcaacaagcc ccgcatctgg 60

tacggcggcg attacaaccc cgaccaatgg cctgaggaag tgtgggacga agatgtagcc 120

ctcatgcagc aggccggcgt caacctcgtc tccgtagcca tcttctcctg ggccaagctt 180

gagcccgaag aaggcgtgta cgacttcgat tggctcgacc gcgtcatcga caagctcggc 240

aaggccggca tcgccgtcga tctcgcctcc ggcaccgcat ccccgccgat gtggatgacc 300

caggcccacc cggagatcct ctgggtcgac taccgcggcg acgtctgcca gcccggtgcc 360

cgccagcact ggcgcgccac cagcccggtc ttccttgact acgcgctcaa cctgtgccgc 420

aagatggccg agcactacaa ggacaacccc tatgtggtct cttggcatgt gagcaacgag 480

tacggctgcc acaaccgctt cgactattcc gaagacgccg agcgcgcctt ccagaagtgg 540

tgcgagaaga agtacggcac catcgacgct gtcaacgacg cctggggcac cgccttctgg 600

gcgcagcgca tgaacaattt ctccgagatc atcccgccgc gattcatcgg cgacggcaac 660

ttcatgaacc cgggcaagct gcttgattgg aagcgtttca gctccgacgc gctgctggac 720

ttctacaagg ccgagcgcga cgccctgctc gagatcgccc ccaagccgca gaccaccaac 780

ttcatggtct ccgcgggctg caccgtcctc gactacgaca agtggggtca tgacgtggac 840

ttcgtgtcca acgaccatta cttctcgccc ggcgaggccc acttcgacga gatggcctac 900

gcggcctgcc tcaccgacgg catcgcccgc aagaacccgt ggttcctcat ggaacattcc 960

acgtccgccg tcaactggcg cccgaccaac taccggctcg agcccggcga gctggtgcgc 1020

gactccctgg cccatctggc catgggcgcc gacgccatct gctacttcca gtggcgtcag 1080

tccaaggccg gcgccgagaa gtggcattcc gccatggtgc cccacgcagg ccccgactcc 1140

cagatcttcc gcgatgtgtg cgagctgggt gccgacctca acaagcttgc tgacgagggc 1200

ctgctgagca ccaagctggt caagtccaag gtcgccatcg tcttcgacta cgagtcccag 1260

tgggccaccg agcacaccgc cacccccacg caggaggtgc gccactggac cgagccgctg 1320

gactggttcc gcgcgctggc ggacaatggc ctgaccgccg acgtggtgcc ggtccgcggt 1380

ccttgggatg agtacgaggc cgtcgtgttg ccgagcctgg ccatcctgtc cgagcagacc 1440

acgcgccgcg tgcgcgagta tgtggcgaac ggcggcaagc tgttcgtgac ctactacacc 1500

ggtctggtgg acgacaggga tcacgtctgg ctgggcggct accccggctc cattcgcgac 1560

gtggtgggcg tgcgcgtcga ggaattcgcc ccgatgggca ccgacgcccc cggcaccatg 1620

gaccaccttg acttggacaa cggaaccgtg gcgcacgatt tcgccgacgt gatcacctcc 1680

gtggccgata ccgctcacgt ggtcgcctcc ttcaaggcag ataagtggac cggtttcgac 1740

ggcgctcccg ccatcaccgt caacgacttc ggcgacggca aggccgcata cgtcggtgcc 1800

cgtctcgggc gtgagggctt ggccaagagc ctgcccgcgc tgctggagga actcggcatc 1860

gagacttcgg ctgaggacga tcgtggtgaa gtgctgcgcg tcgagcgtgc ggacgaaact 1920

ggcgagaacc acttcgtgtt cctgttcaac cgcacccacg atgttgcggt cgtggacgtg 1980

gaaggcgaac cgctggtcgc ctcgctggcc caggtcaacg agtccgagca cacggccgcc 2040

atccagccca acggcgtact cgtcgtcaag ctgtaa 2076

<210> 8

<211> 691

<212> PRT

<213> 长双歧杆菌

<400> 8

Met Glu His Arg Ala Phe Lys Trp Pro Gln Pro Leu Ala Gly Asn Lys

1 5 10 15

Pro Arg Ile Trp Tyr Gly Gly Asp Tyr Asn Pro Asp Gln Trp Pro Glu

20 25 30

Glu Val Trp Asp Glu Asp Val Ala Leu Met Gln Gln Ala Gly Val Asn

35 40 45

Leu Val Ser Val Ala Ile Phe Ser Trp Ala Lys Leu Glu Pro Glu Glu

50 55 60

Gly Val Tyr Asp Phe Asp Trp Leu Asp Arg Val Ile Asp Lys Leu Gly

65 70 75 80

Lys Ala Gly Ile Ala Val Asp Leu Ala Ser Gly Thr Ala Ser Pro Pro

85 90 95

Met Trp Met Thr Gln Ala His Pro Glu Ile Leu Trp Val Asp Tyr Arg

100 105 110

Gly Asp Val Cys Gln Pro Gly Ala Arg Gln His Trp Arg Ala Thr Ser

115 120 125

Pro Val Phe Leu Asp Tyr Ala Leu Asn Leu Cys Arg Lys Met Ala Glu

130 135 140

His Tyr Lys Asp Asn Pro Tyr Val Val Ser Trp His Val Ser Asn Glu

145 150 155 160

Tyr Gly Cys His Asn Arg Phe Asp Tyr Ser Glu Asp Ala Glu Arg Ala

165 170 175

Phe Gln Lys Trp Cys Glu Lys Lys Tyr Gly Thr Ile Asp Ala Val Asn

180 185 190

Asp Ala Trp Gly Thr Ala Phe Trp Ala Gln Arg Met Asn Asn Phe Ser

195 200 205

Glu Ile Ile Pro Pro Arg Phe Ile Gly Asp Gly Asn Phe Met Asn Pro

210 215 220

Gly Lys Leu Leu Asp Trp Lys Arg Phe Ser Ser Asp Ala Leu Leu Asp

225 230 235 240

Phe Tyr Lys Ala Glu Arg Asp Ala Leu Leu Glu Ile Ala Pro Lys Pro

245 250 255

Gln Thr Thr Asn Phe Met Val Ser Ala Gly Cys Thr Val Leu Asp Tyr

260 265 270

Asp Lys Trp Gly His Asp Val Asp Phe Val Ser Asn Asp His Tyr Phe

275 280 285

Ser Pro Gly Glu Ala His Phe Asp Glu Met Ala Tyr Ala Ala Cys Leu

290 295 300

Thr Asp Gly Ile Ala Arg Lys Asn Pro Trp Phe Leu Met Glu His Ser

305 310 315 320

Thr Ser Ala Val Asn Trp Arg Pro Thr Asn Tyr Arg Leu Glu Pro Gly

325 330 335

Glu Leu Val Arg Asp Ser Leu Ala His Leu Ala Met Gly Ala Asp Ala

340 345 350

Ile Cys Tyr Phe Gln Trp Arg Gln Ser Lys Ala Gly Ala Glu Lys Trp

355 360 365

His Ser Ala Met Val Pro His Ala Gly Pro Asp Ser Gln Ile Phe Arg

370 375 380

Asp Val Cys Glu Leu Gly Ala Asp Leu Asn Lys Leu Ala Asp Glu Gly

385 390 395 400

Leu Leu Ser Thr Lys Leu Val Lys Ser Lys Val Ala Ile Val Phe Asp

405 410 415

Tyr Glu Ser Gln Trp Ala Thr Glu His Thr Ala Thr Pro Thr Gln Glu

420 425 430

Val Arg His Trp Thr Glu Pro Leu Asp Trp Phe Arg Ala Leu Ala Asp

435 440 445

Asn Gly Leu Thr Ala Asp Val Val Pro Val Arg Gly Pro Trp Asp Glu

450 455 460

Tyr Glu Ala Val Val Leu Pro Ser Leu Ala Ile Leu Ser Glu Gln Thr

465 470 475 480

Thr Arg Arg Val Arg Glu Tyr Val Ala Asn Gly Gly Lys Leu Phe Val

485 490 495

Thr Tyr Tyr Thr Gly Leu Val Asp Asp Arg Asp His Val Trp Leu Gly

500 505 510

Gly Tyr Pro Gly Ser Ile Arg Asp Val Val Gly Val Arg Val Glu Glu

515 520 525

Phe Ala Pro Met Gly Thr Asp Ala Pro Gly Thr Met Asp His Leu Asp

530 535 540

Leu Asp Asn Gly Thr Val Ala His Asp Phe Ala Asp Val Ile Thr Ser

545 550 555 560

Val Ala Asp Thr Ala His Val Val Ala Ser Phe Lys Ala Asp Lys Trp

565 570 575

Thr Gly Phe Asp Gly Ala Pro Ala Ile Thr Val Asn Asp Phe Gly Asp

580 585 590

Gly Lys Ala Ala Tyr Val Gly Ala Arg Leu Gly Arg Glu Gly Leu Ala

595 600 605

Lys Ser Leu Pro Ala Leu Leu Glu Glu Leu Gly Ile Glu Thr Ser Ala

610 615 620

Glu Asp Asp Arg Gly Glu Val Leu Arg Val Glu Arg Ala Asp Glu Thr

625 630 635 640

Gly Glu Asn His Phe Val Phe Leu Phe Asn Arg Thr His Asp Val Ala

645 650 655

Val Val Asp Val Glu Gly Glu Pro Leu Val Ala Ser Leu Ala Gln Val

660 665 670

Asn Glu Ser Glu His Thr Ala Ala Ile Gln Pro Asn Gly Val Leu Val

675 680 685

Val Lys Leu

690

<210> 9

<211> 1626

<212> DNA

<213> 热纤梭菌（Clostridium thermocellum）

<400> 9

atggcagaag gggttatagt caacggaact cagtttaaag acacatcggg aaatgtgata 60

catgcccatg ggggaggcat gttaaagcat ggtgactatt attactggta cggtgaatac 120

cgggacgact ccaacttgtt tttgggtgta agttgctaca ggtcaaaaga tcttgtaaac 180

tgggaataca gaggagaagt gctgagccga aattccgctc ctgaactgaa tcactgcaat 240

attgaaagac cgaaagtcat gtacaacgca tcaaccggtg aatttgtcat gtggatgcac 300

tgggagaacg gcataaacta cggtcaggca agagcagctg ttgcgtattc caaaacgccc 360

gacggcaaat tcacatacat tcgaagcttt cgtcccatgc aggataccgg cgttatggat 420

catggccttc cgggatatat gtcaagggac tgcaatgtat ttgtggacac tgacggcaag 480

ggatatttta tatccgcagc caatgagaac atggacctgc acctttatga gctgacacct 540

gactataaaa atattgcatc ccttaaggca aagctgtttg tcggacagca gagggaagca 600

ccatgcctta taaagagaaa cggctactat taccttatta cttccggttg tacaggttgg 660

aacccgaatc aggctaaata cgcatattcc aaagatttgg ccagtggctg gtcccagctt 720

tacaatcttg gtaattcaac cacctacagg tcacagccga cttttatcat tcccgttcag 780

ggaagctcgg gaaccagtta tctttatatg ggtgaccgtt gggccggtgc ctggggagga 840

aaggttaatg actcccaata tgtatggctt cccttaaact tcatatccga tacaacactt 900

gaactgccct attatgactc tgtaaagatt gatgcttctt caggaataat ttccgagtac 960

ataccggaca ctacacgcta caagctggta aacaaaaaca gcggaaaagt cctggatgtt 1020

cttgacggtt ctgtcgataa tgcagcccag atagtccaat ggaccgataa cgggtctttg 1080

agtcaacagt ggtaccttgt ggacgtgggc ggtggttata aaaagattgt aaatgtaaag 1140

agcggaagag ccttggatgt aaaagacgaa tccaaggaag acggtggagt attaatacaa 1200

tataccagca acggcggata taatcagcac tggaaattca cagacatagg tgacgggtat 1260

tacaagattt ccagccgcca ctgcggaaaa cttatagatg tgcgaaaatg gtcaacggaa 1320

gacggcggaa taattcagca gtggtccgat gccggaggaa caaatcagca ttggaagctg 1380

gtgcttgtat caagtcccga gccttcacca tcaccttctc cccaagtggt taaaggagat 1440

gtaaacggcg acttgaaagt aaattcaacg gatttttcca tgttaagaag atatttactt 1500

aaaaccattg acaattttcc gacagaaaac ggaaaacagg ctgccgattt gaacggagac 1560

ggcagaataa actcttcgga tcttacaatg ctgaaaagat acttgcttat ggaagtggat 1620

ttgtaa 1626

<210> 10

<211> 541

<212> PRT

<213> 热纤梭菌（Clostridium thermocellum）

<400> 10

Met Ala Glu Gly Val Ile Val Asn Gly Thr Gln Phe Lys Asp Thr Ser

1 5 10 15

Gly Asn Val Ile His Ala His Gly Gly Gly Met Leu Lys His Gly Asp

20 25 30

Tyr Tyr Tyr Trp Tyr Gly Glu Tyr Arg Asp Asp Ser Asn Leu Phe Leu

35 40 45

Gly Val Ser Cys Tyr Arg Ser Lys Asp Leu Val Asn Trp Glu Tyr Arg

50 55 60

Gly Glu Val Leu Ser Arg Asn Ser Ala Pro Glu Leu Asn His Cys Asn

65 70 75 80

Ile Glu Arg Pro Lys Val Met Tyr Asn Ala Ser Thr Gly Glu Phe Val

85 90 95

Met Trp Met His Trp Glu Asn Gly Ile Asn Tyr Gly Gln Ala Arg Ala

100 105 110

Ala Val Ala Tyr Ser Lys Thr Pro Asp Gly Lys Phe Thr Tyr Ile Arg

115 120 125

Ser Phe Arg Pro Met Gln Asp Thr Gly Val Met Asp His Gly Leu Pro

130 135 140

Gly Tyr Met Ser Arg Asp Cys Asn Val Phe Val Asp Thr Asp Gly Lys

145 150 155 160

Gly Tyr Phe Ile Ser Ala Ala Asn Glu Asn Met Asp Leu His Leu Tyr

165 170 175

Glu Leu Thr Pro Asp Tyr Lys Asn Ile Ala Ser Leu Lys Ala Lys Leu

180 185 190

Phe Val Gly Gln Gln Arg Glu Ala Pro Cys Leu Ile Lys Arg Asn Gly

195 200 205

Tyr Tyr Tyr Leu Ile Thr Ser Gly Cys Thr Gly Trp Asn Pro Asn Gln

210 215 220

Ala Lys Tyr Ala Tyr Ser Lys Asp Leu Ala Ser Gly Trp Ser Gln Leu

225 230 235 240

Tyr Asn Leu Gly Asn Ser Thr Thr Tyr Arg Ser Gln Pro Thr Phe Ile

245 250 255

Ile Pro Val Gln Gly Ser Ser Gly Thr Ser Tyr Leu Tyr Met Gly Asp

260 265 270

Arg Trp Ala Gly Ala Trp Gly Gly Lys Val Asn Asp Ser Gln Tyr Val

275 280 285

Trp Leu Pro Leu Asn Phe Ile Ser Asp Thr Thr Leu Glu Leu Pro Tyr

290 295 300

Tyr Asp Ser Val Lys Ile Asp Ala Ser Ser Gly Ile Ile Ser Glu Tyr

305 310 315 320

Ile Pro Asp Thr Thr Arg Tyr Lys Leu Val Asn Lys Asn Ser Gly Lys

325 330 335

Val Leu Asp Val Leu Asp Gly Ser Val Asp Asn Ala Ala Gln Ile Val

340 345 350

Gln Trp Thr Asp Asn Gly Ser Leu Ser Gln Gln Trp Tyr Leu Val Asp

355 360 365

Val Gly Gly Gly Tyr Lys Lys Ile Val Asn Val Lys Ser Gly Arg Ala

370 375 380

Leu Asp Val Lys Asp Glu Ser Lys Glu Asp Gly Gly Val Leu Ile Gln

385 390 395 400

Tyr Thr Ser Asn Gly Gly Tyr Asn Gln His Trp Lys Phe Thr Asp Ile

405 410 415

Gly Asp Gly Tyr Tyr Lys Ile Ser Ser Arg His Cys Gly Lys Leu Ile

420 425 430

Asp Val Arg Lys Trp Ser Thr Glu Asp Gly Gly Ile Ile Gln Gln Trp

435 440 445

Ser Asp Ala Gly Gly Thr Asn Gln His Trp Lys Leu Val Leu Val Ser

450 455 460

Ser Pro Glu Pro Ser Pro Ser Pro Ser Pro Gln Val Val Lys Gly Asp

465 470 475 480

Val Asn Gly Asp Leu Lys Val Asn Ser Thr Asp Phe Ser Met Leu Arg

485 490 495

Arg Tyr Leu Leu Lys Thr Ile Asp Asn Phe Pro Thr Glu Asn Gly Lys

500 505 510

Gln Ala Ala Asp Leu Asn Gly Asp Gly Arg Ile Asn Ser Ser Asp Leu

515 520 525

Thr Met Leu Lys Arg Tyr Leu Leu Met Glu Val Asp Leu

530 535 540

<210> 11

<211> 2631

<212> DNA

<213> 类芽孢杆菌属（Paenibacillus sp.）

<400> 11

atgaatcgac acgtcctgct tcatccgtat ctccaccgga aggcgttgcc tctgctcctg 60

gccttgacgc tgctgacggg catcgccctg ttcccggcct ccaccgcgca ggcggcgacg 120

accgtgacgt cgatgacgta cttctctgcc aatgacggtc ccgtcatctc caaatccggc 180

gtcgggcaag ccagctacgg tttcgtcatg ccgatcttca acggaggcgc tgcgacctgg 240

aacgatgtcg ccgatgacgt cggcgttcgc gtcaaggtcg gcggcagctg ggtcgacatt 300

gacagcgttg gcggctatgt gtacaaccag aactggggcc attggaacga cagcggcacc 360

tatggctact ggttcaccct ctccgccacg accgagctgc agctctactc caaggcgaac 420

agcagcgtca cactcaacta cacgctcgtc ttccagaatg tcaatgaaac gaccattacc 480

tcgatgacac cgacccaggg cccgcaattg accgcagggt ataccggcgg cgcaggcttc 540

acctatccgg tcttcaacaa cgatccctcc atcccgtatg cagccgtagc cggcgatctg 600

aaggtgtacg tcaagccagt cgccagcagt acctggatcg atatcgacaa caacgcggcg 660

agcggctgga tctacgacag caacttcggc cagttcaccg aaggcggcgg cggctactgg 720

ttcaccgtca ccgagtcgat caacgtcaag ctcgagtcca ggacgtcctc ggccaacgtc 780

gtctatacga tcaacttccc gcagccgacg cgcagcagct acacactctc cgcctatgac 840

ggcacgacct acagcgccga tgcgagcggc gcgatcggta tcccgctgcc gcggatcgac 900

ggcaccccgg cgatcggcag cgagctcggc aacttcgtct accagatcta ccggaacggc 960

cagtgggtcg agatgagcaa ctcggcgcag agcagcttcg tctactcggc caatggctac 1020

aacaacatgt ccgacgccaa tcaatggggc tactgggccg actacatcta cggcctctgg 1080

ttccggccga tccaggagga tatgcagatc cgcatcggct atccgctgaa tggccagtcc 1140

ggcggcagcg tcggcagcaa cttcgtcacc tatacgctga tcggcaaccc gaacgcgccg 1200

cgacccgatg tgagcgacca gggcgacgtc gagatcggca cgcccaccga tccggccatc 1260

gcaggatgga atctgtattg gcaggatgaa ttcgccggca gcgcgctcga tctgaacaag 1320

tggaactacg agaccggcta ctacatcggc aacgacccca atctgtgggg ctggggcaac 1380

gccgagatgc agcactatac gacgagcacg caaaatgtct tcgtcgctga cggcaaactc 1440

aacatccgag cgctccacga ttaccaatcg ttcccgcagg acccgaaccg ctacgcgacc 1500

tactcctccg gcaagatcaa caccaaggac aacatgtcgc tgcagtacgg ccgcgtcgat 1560

atccgcgcca agctgccgac tggcgatggc gtctggccgg cactgtggat gctgccggag 1620

gactccgtct acggcgcatg ggcggcatca ggagagatcg acatcatgga ggcgaagggc 1680

cgtctgcccg gcacgacgag cggcgcgatc cactacggcg gccaatggcc ggtcaaccgc 1740

tacctcgccg gagaatgcta cctcccgcaa ggtacgacat tcgccgacga ctttaatgtg 1800

tacacgatga tctgggaaga ggacaacatg aagtggtacg ttaacggtga gtttttcttc 1860

aaggtgacgc gcgagcagtg gtactccgtc gccgccccca acaatccgga cgcgccgttc 1920

gaccagccgt tctatctgat catgaacctg gcggtcggcg gccacttcga cggcgggcgt 1980

acgcccgacc cgtccgacat cccggcgacg atgcagatcg actacgtgcg ggtgtacaaa 2040

gagggcgcgg gcggcggtcc gggcaacccg ggcggcaacg tcgcggtgac cggcgttagc 2100

gtgaccccgg caacggcgca ggtgcaggtc ggtcagaccg tctcgctgag cgccaacgtc 2160

gcgccagcca atgcaacgaa caagcaagtg acctggtcag tcgccaatgg cagcatcgcc 2220

tcggtgagcg ccagcggcgt cgtcagtgga ctcgctgctg gcacgacgac cgtaaccgcc 2280

acgaccgcag acggcaaccg caccgcctcg gcgacgatca ccgtcgtgcc gccaccgacg 2340

acgaccgtca tcatcggcga tagcgtgcgc ggcatccgaa agaccggcga caacctgctc 2400

ttctacgtca acggcgcaac ctacgccgac ctgcactaca aggtgaacgg cggcggtcag 2460

cctaatgtcg cgatgacgca cacaggaggc ggcaactaca cctacccggt gcatggcctc 2520

caacaaggcg ataccgtcga atacttcttc acctacaacc ccggcaacgg cgcgctagac 2580

acgccttggc agacttatgt gcatggggta acacaaggtg ttgttgagta a 2631

<210> 12

<211> 876

<212> PRT

<213> 类芽孢杆菌属

<400> 12

Met Asn Arg His Val Leu Leu His Pro Tyr Leu His Arg Lys Ala Leu

1 5 10 15

Pro Leu Leu Leu Ala Leu Thr Leu Leu Thr Gly Ile Ala Leu Phe Pro

20 25 30

Ala Ser Thr Ala Gln Ala Ala Thr Thr Val Thr Ser Met Thr Tyr Phe

35 40 45

Ser Ala Asn Asp Gly Pro Val Ile Ser Lys Ser Gly Val Gly Gln Ala

50 55 60

Ser Tyr Gly Phe Val Met Pro Ile Phe Asn Gly Gly Ala Ala Thr Trp

65 70 75 80

Asn Asp Val Ala Asp Asp Val Gly Val Arg Val Lys Val Gly Gly Ser

85 90 95

Trp Val Asp Ile Asp Ser Val Gly Gly Tyr Val Tyr Asn Gln Asn Trp

100 105 110

Gly His Trp Asn Asp Ser Gly Thr Tyr Gly Tyr Trp Phe Thr Leu Ser

115 120 125

Ala Thr Thr Glu Leu Gln Leu Tyr Ser Lys Ala Asn Ser Ser Val Thr

130 135 140

Leu Asn Tyr Thr Leu Val Phe Gln Asn Val Asn Glu Thr Thr Ile Thr

145 150 155 160

Ser Met Thr Pro Thr Gln Gly Pro Gln Leu Thr Ala Gly Tyr Thr Gly

165 170 175

Gly Ala Gly Phe Thr Tyr Pro Val Phe Asn Asn Asp Pro Ser Ile Pro

180 185 190

Tyr Ala Ala Val Ala Gly Asp Leu Lys Val Tyr Val Lys Pro Val Ala

195 200 205

Ser Ser Thr Trp Ile Asp Ile Asp Asn Asn Ala Ala Ser Gly Trp Ile

210 215 220

Tyr Asp Ser Asn Phe Gly Gln Phe Thr Glu Gly Gly Gly Gly Tyr Trp

225 230 235 240

Phe Thr Val Thr Glu Ser Ile Asn Val Lys Leu Glu Ser Arg Thr Ser

245 250 255

Ser Ala Asn Val Val Tyr Thr Ile Asn Phe Pro Gln Pro Thr Arg Ser

260 265 270

Ser Tyr Thr Leu Ser Ala Tyr Asp Gly Thr Thr Tyr Ser Ala Asp Ala

275 280 285

Ser Gly Ala Ile Gly Ile Pro Leu Pro Arg Ile Asp Gly Thr Pro Ala

290 295 300

Ile Gly Ser Glu Leu Gly Asn Phe Val Tyr Gln Ile Tyr Arg Asn Gly

305 310 315 320

Gln Trp Val Glu Met Ser Asn Ser Ala Gln Ser Ser Phe Val Tyr Ser

325 330 335

Ala Asn Gly Tyr Asn Asn Met Ser Asp Ala Asn Gln Trp Gly Tyr Trp

340 345 350

Ala Asp Tyr Ile Tyr Gly Leu Trp Phe Arg Pro Ile Gln Glu Asp Met

355 360 365

Gln Ile Arg Ile Gly Tyr Pro Leu Asn Gly Gln Ser Gly Gly Ser Val

370 375 380

Gly Ser Asn Phe Val Thr Tyr Thr Leu Ile Gly Asn Pro Asn Ala Pro

385 390 395 400

Arg Pro Asp Val Ser Asp Gln Gly Asp Val Glu Ile Gly Thr Pro Thr

405 410 415

Asp Pro Ala Ile Ala Gly Trp Asn Leu Tyr Trp Gln Asp Glu Phe Ala

420 425 430

Gly Ser Ala Leu Asp Leu Asn Lys Trp Asn Tyr Glu Thr Gly Tyr Tyr

435 440 445

Ile Gly Asn Asp Pro Asn Leu Trp Gly Trp Gly Asn Ala Glu Met Gln

450 455 460

His Tyr Thr Thr Ser Thr Gln Asn Val Phe Val Ala Asp Gly Lys Leu

465 470 475 480

Asn Ile Arg Ala Leu His Asp Tyr Gln Ser Phe Pro Gln Asp Pro Asn

485 490 495

Arg Tyr Ala Thr Tyr Ser Ser Gly Lys Ile Asn Thr Lys Asp Asn Met

500 505 510

Ser Leu Gln Tyr Gly Arg Val Asp Ile Arg Ala Lys Leu Pro Thr Gly

515 520 525

Asp Gly Val Trp Pro Ala Leu Trp Met Leu Pro Glu Asp Ser Val Tyr

530 535 540

Gly Ala Trp Ala Ala Ser Gly Glu Ile Asp Ile Met Glu Ala Lys Gly

545 550 555 560

Arg Leu Pro Gly Thr Thr Ser Gly Ala Ile His Tyr Gly Gly Gln Trp

565 570 575

Pro Val Asn Arg Tyr Leu Ala Gly Glu Cys Tyr Leu Pro Gln Gly Thr

580 585 590

Thr Phe Ala Asp Asp Phe Asn Val Tyr Thr Met Ile Trp Glu Glu Asp

595 600 605

Asn Met Lys Trp Tyr Val Asn Gly Glu Phe Phe Phe Lys Val Thr Arg

610 615 620

Glu Gln Trp Tyr Ser Val Ala Ala Pro Asn Asn Pro Asp Ala Pro Phe

625 630 635 640

Asp Gln Pro Phe Tyr Leu Ile Met Asn Leu Ala Val Gly Gly His Phe

645 650 655

Asp Gly Gly Arg Thr Pro Asp Pro Ser Asp Ile Pro Ala Thr Met Gln

660 665 670

Ile Asp Tyr Val Arg Val Tyr Lys Glu Gly Ala Gly Gly Gly Pro Gly

675 680 685

Asn Pro Gly Gly Asn Val Ala Val Thr Gly Val Ser Val Thr Pro Ala

690 695 700

Thr Ala Gln Val Gln Val Gly Gln Thr Val Ser Leu Ser Ala Asn Val

705 710 715 720

Ala Pro Ala Asn Ala Thr Asn Lys Gln Val Thr Trp Ser Val Ala Asn

725 730 735

Gly Ser Ile Ala Ser Val Ser Ala Ser Gly Val Val Ser Gly Leu Ala

740 745 750

Ala Gly Thr Thr Thr Val Thr Ala Thr Thr Ala Asp Gly Asn Arg Thr

755 760 765

Ala Ser Ala Thr Ile Thr Val Val Pro Pro Pro Thr Thr Thr Val Ile

770 775 780

Ile Gly Asp Ser Val Arg Gly Ile Arg Lys Thr Gly Asp Asn Leu Leu

785 790 795 800

Phe Tyr Val Asn Gly Ala Thr Tyr Ala Asp Leu His Tyr Lys Val Asn

805 810 815

Gly Gly Gly Gln Pro Asn Val Ala Met Thr His Thr Gly Gly Gly Asn

820 825 830

Tyr Thr Tyr Pro Val His Gly Leu Gln Gln Gly Asp Thr Val Glu Tyr

835 840 845

Phe Phe Thr Tyr Asn Pro Gly Asn Gly Ala Leu Asp Thr Pro Trp Gln

850 855 860

Thr Tyr Val His Gly Val Thr Gln Gly Val Val Glu

865 870 875

<210> 13

<211> 6783

<212> DNA

<213> 人工序列

<220>

<223> 转座子盒

<400> 13

gccagatgat taattcctaa tttttgttga cactctatca ttgatagagt tattttacca 60

ctccctatca gtgatagaga aaagtgaaat gaatagttcg acaaaaatct agaaataatt 120

ttgtttaact ttaagaagga gatatacaat ttcgtcgaca cacaggaaac atattaaaaa 180

ttaaaacctg caggagtttg aaggagatag aaccatggcg cagtcgaaac tctatccagt 240

tgtgatggca ggtggctccg gtagccgctt atggccgctt tcccgcgtac tttatcccaa 300

gcagttttta tgcctgaaag gcgatctcac catgctgcaa accaccatct gccgcctgaa 360

cggcgtggag tgcgaaagcc cggtggtgat ttgcaatgag cagcaccgct ttattgtcgc 420

ggaacagctg cgtcaactga acaaacttac cgagaacatt attctcgaac cggcagggcg 480

aaacacggca cctgccattg cgctggcggc gctggcggca aaacgtcata gcccggagag 540

cgacccgtta atgctggtat tggcggcgga tcatgtgatt gccgatgaag acgcgttccg 600

tgccgccgtg cgtaatgcca tgccatatgc cgaagcgggc aagctggtga ccttcggcat 660

tgtgccggat ctaccagaaa ccggttatgg ctatattcgt cgcggtgaag tgtctgcggg 720

tgagcaggat atggtggcct ttgaagtggc gcagtttgtc gaaaaaccga atctggaaac 780

cgctcaggcc tatgtggcaa gcggcgaata ttactggaac agcggtatgt tcctgttccg 840

cgccggacgc tatctcgaag aactgaaaaa atatcgcccg gatatcctcg atgcctgtga 900

aaaagcgatg agcgccgtcg atccggatct caattttatt cgcgtggatg aagaagcgtt 960

tctcgcctgc ccggaagagt cggtggatta cgcggtcatg gaacgtacgg cagatgctgt 1020

tgtggtgccg atggatgcgg gctggagcga tgttggctcc tggtcttcat tatgggagat 1080

cagcgcccac accgccgagg gcaacgtttg ccacggcgat gtgattaatc acaaaactga 1140

aaacagctat gtgtatgctg aatctggcct ggtcaccacc gtcggggtga aagatctggt 1200

agtggtgcag accaaagatg cggtgctgat tgccgaccgt aacgcggtac aggatgtgaa 1260

aaaagtggtc gagcagatca aagccgatgg tcgccatgag catcgggtgc atcgcgaagt 1320

gtatcgtccg tggggcaaat atgactctat cgacgcgggc gaccgctacc aggtgaaacg 1380

catcaccgtg aaaccgggcg agggcttgtc ggtacagatg caccatcacc gcgcggaaca 1440

ctgggtggtt gtcgcgggaa cggcaaaagt caccattgat ggtgatatca aactgcttgg 1500

tgaaaacgag tccatttata ttccgctggg ggcgacgcat tgcctggaaa acccggggaa 1560

aattccgctc gatttaattg aagtgcgctc cggctcttat ctcgaagagg atgatgtggt 1620

gcgtttcgcg gatcgctacg gacgggtgta aacgtcgcat caggcaatga atgcgaaacc 1680

gcggtgtaaa taacgacaaa aataaaattg gccgcttcgg tcagggccaa ctattgcctg 1740

aaaaagggta acgatatgaa aaaattaacc tgctttaaag cctatgatat tcgcgggaaa 1800

ttaggcgaag aactgaatga agatatcgcc tggcgcattg gtcgcgccta tggcgaattt 1860

ctcaaaccga aaaccattgt gttaggcggt gatgtccgcc tcaccagcga aaccttaaaa 1920

ctggcgctgg cgaaaggttt acaggatgcg ggcgttgacg tgctggatat tggtatgtcc 1980

ggcaccgaag agatctattt cgccacgttc catctcggcg tggatggcgg cattgaagtt 2040

accgccagcc ataatccgat ggattataac ggcatgaagc tggttcgcga gggggctcgc 2100

ccgatcagcg gagataccgg actgcgcgac gtccagcgtc tggctgaagc caacgacttt 2160

cctcccgtcg atgaaaccaa acgcggtcgc tatcagcaaa tcaacctgcg tgacgcttac 2220

gttgatcacc tgttcggtta tatcaatgtc aaaaacctca cgccgctcaa gctggtgatc 2280

aactccggga acggcgcagc gggtccggtg gtggacgcca ttgaagcccg ctttaaagcc 2340

ctcggcgcgc ccgtggaatt aatcaaagtg cacaacacgc cggacggcaa tttccccaac 2400

ggtattccta acccactact gccggaatgc cgcgacgaca cccgcaatgc ggtcatcaaa 2460

cacggcgcgg atatgggcat tgcttttgat ggcgattttg accgctgttt cctgtttgac 2520

gaaaaagggc agtttattga gggctactac attgtcggcc tgttggcaga agcattcctc 2580

gaaaaaaatc ccggcgcgaa gatcatccac gatccacgtc tctcctggaa caccgttgat 2640

gtggtgactg ccgcaggtgg cacgccggta atgtcgaaaa ccggacacgc ctttattaaa 2700

gaacgtatgc gcaaggaaga cgccatctat ggtggcgaaa tgagcgccca ccattacttc 2760

cgtgatttcg cttactgcga cagcggcatg atcccgtggc tgctggtcgc cgaactggtg 2820

tgcctgaaag ataaaacgct gggcgaactg gtacgcgacc ggatggcggc gtttccggca 2880

agcggtgaga tcaacagcaa actggcgcaa cccgttgagg cgattaaccg cgtggaacag 2940

cattttagcc gtgaggcgct ggcggtggat cgcaccgatg gcatcagcat gacctttgcc 3000

gactggcgct ttaacctgcg cacctccaat accgaaccgg tggtgcgcct gaatgtggaa 3060

tcgcgcggtg atgtgccgct gatggaagcg cgaacgcgaa ctctgctgac gttgctgaac 3120

gagtaaaaac gcggccgcga tatcgttgta aaacgacggc cagtgcaaga atcataaaaa 3180

atttatttgc tttcaggaaa atttttctgt ataatagatt cataaatttg agagaggagt 3240

ttttgtgagc ggataacaat tccccatctt agtatattag ttaagtataa atacaccgcg 3300

gaggacgaag gagatagaac catgtcaaaa gtcgctctca tcaccggtgt aaccggacaa 3360

gacggttctt acctggcaga gtttctgctg gaaaaaggtt acgaggtgca tggtattaag 3420

cgtcgcgcat cgtcattcaa caccgagcgc gtggatcaca tttatcagga tccgcacacc 3480

tgcaacccga aattccatct gcattatggc gacctgagtg atacctctaa cctgacgcgc 3540

attttgcgtg aagtacagcc ggatgaagtg tacaacctgg gcgcaatgag ccacgttgcg 3600

gtctcttttg agtcaccaga atataccgct gacgtcgacg cgatgggtac gctgcgcctg 3660

ctggaggcga tccgcttcct cggtctggaa aagaaaactc gtttctatca ggcttccacc 3720

tctgaactgt atggtctggt gcaggaaatt ccgcagaaag agaccacgcc gttctacccg 3780

cgatctccgt atgcggtcgc caaactgtac gcctactgga tcaccgttaa ctaccgtgaa 3840

tcctacggca tgtacgcctg taacggaatt ctcttcaacc atgaatcccc gcgccgcggc 3900

gaaaccttcg ttacccgcaa aatcacccgc gcaatcgcca acatcgccca ggggctggag 3960

tcgtgcctgt acctcggcaa tatggattcc ctgcgtgact ggggccacgc caaagactac 4020

gtaaaaatgc agtggatgat gctgcagcag gaacagccgg aagatttcgt tatcgcgacc 4080

ggcgttcagt actccgtgcg tcagttcgtg gaaatggcgg cagcacagct gggcatcaaa 4140

ctgcgctttg aaggcacggg cgttgaagag aagggcattg tggtttccgt caccgggcat 4200

gacgcgccgg gcgttaaacc gggtgatgtg attatcgctg ttgacccgcg ttacttccgt 4260

ccggctgaag ttgaaacgct gctcggcgac ccgaccaaag cgcacgaaaa actgggctgg 4320

aaaccggaaa tcaccctcag agagatggtg tctgaaatgg tggctaatga cctcgaagcg 4380

gcgaaaaaac actctctgct gaaatctcac ggctacgacg tggcgatcgc gctggagtca 4440

taagcatgag taaacaacga gtttttattg ctggtcatcg cgggatggtc ggttccgcca 4500

tcaggcggca gctcgaacag cgcggtgatg tggaactggt attacgcacc cgcgacgagc 4560

tgaacctgct ggacagccgc gccgtgcatg atttctttgc cagcgaacgt attgaccagg 4620

tctatctggc ggcggcgaaa gtgggcggca ttgttgccaa caacacctat ccggcggatt 4680

tcatctacca gaacatgatg attgagagca acatcattca cgccgcgcat cagaacgacg 4740

tgaacaaact gctgtttctc ggatcgtcct gcatctaccc gaaactggca aaacagccga 4800

tggcagaaag cgagttgttg cagggcacgc tggagccgac taacgagcct tatgctattg 4860

ccaaaatcgc cgggatcaaa ctgtgcgaat catacaaccg ccagtacgga cgcgattacc 4920

gctcagtcat gccgaccaac ctgtacgggc cacacgacaa cttccacccg agtaattcgc 4980

atgtgatccc agcattgctg cgtcgcttcc acgaggcgac ggcacagaat gcgccggacg 5040

tggtggtatg gggcagcggt acaccgatgc gcgaatttct gcacgtcgat gatatggcgg 5100

cggcgagcat tcatgtcatg gagctggcgc atgaagtctg gctggagaac acccagccga 5160

tgttgtcgca cattaacgtc ggcacgggcg ttgactgcac tatccgcgag ctggcgcaaa 5220

ccatcgccaa agtggtgggt tacaaaggcc gggtggtttt tgatgccagc aaaccggatg 5280

gcacgccgcg caaactgctg gatgtgacgc gcctgcatca gcttggctgg tatcacgaaa 5340

tctcactgga agcggggctt gccagcactt accagtggtt ccttgagaat caagaccgct 5400

ttcggggggg gagctaacgc gccatttaaa tcaacctcag cggtcatagc tgtttcctgt 5460

gactgagcaa taactagcat aaccccttgg ggcctctaaa cgggtcttga ggggtttttt 5520

gctgaaacca atttgcctgg cggcagtagc gcggtggtcc cacctgaccc catgccgaac 5580

tcagaagtga aacgccgtag cgccgatggt agtgtggggt ctccccatgc gagagtaggg 5640

aactgccagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgggatcc 5700

aggccggcct gttaacgaat taatcttccg cggcggtatc gataagcttg atatcgaatt 5760

ccgaagttcc tattctctag aaagtatagg aacttcaggt ctgaagagga gtttacgtcc 5820

agccaagcta gcttggctgc aggtcgtcga aattctaccg ggtaggggag gcgcttttcc 5880

caaggcagtc tggagcatgc gctttagcag ccccgctggg cacttggcgc tacacaagtg 5940

gcctctggcc tcgcacacat tccacatcca ccggtaggcg ccaaccggct ccgttctttg 6000

gtggcccctt cgcgccacct tctactcctc ccctagtcag gaagttcccc cccgccccgc 6060

agctcgcgtc gtgcaggacg tgacaaatgg aagtagcacg tctcactagt ctcgtgcaga 6120

tggacagcac cgctgagcaa tggaagcggg taggcctttg gggcagcggc caatagcagc 6180

tttgctcctt cgctttctgg gctcagaggc tgggaagggg tgggtccggg ggcgggctca 6240

ggggcgggct caggggcggg gcgggcgccc gaaggtcctc cggaggcccg gcattctgca 6300

cgcttcaaaa gcgcacgtct gccgcgctgt tctcctcttc ctcatctccg ggcctttcga 6360

cctgcagcct gttgacaatt aatcatcggc atagtatatc ggcatagtat aatacgacaa 6420

ggtgaggaac taaaccatgg gtcaaagtag cgatgaagcc aacgctcccg ttgcagggca 6480

gtttgcgctt cccctgagtg ccacctttgg cttaggggat cgcgtacgca agaaatctgg 6540

tgccgcttgg cagggtcaag tcgtcggttg gtattgcaca aaactcactc ctgaaggcta 6600

tgcggtcgag tccgaatccc acccaggctc agtgcaaatt tatcctgtgg ctgcacttga 6660

acgtgtggcc taatgagggg atcaattctc tagagctcgc tgatcagaag ttcctattct 6720

ctagaaagta taggaacttc gatggcgcct catccctgaa gccaataggg ataacagggt 6780

aat 6783

<210> 14

<211> 2851

<212> DNA

<213> 人工序列

<220>

<223> 整合盒

<400> 14

tggccagatg attaattcct aatttttgtt gacactctat cattgataga gttattttac 60

cactccctat cagtgataga gaaaagtgaa atgaatagtt cgacaaaaat ctagaaataa 120

ttttgtttaa ctttaagaag gagatataca aatgtactat ttaaaaaaca caaacttttg 180

gatgttcggt ttattctttt tcttttactt ttttatcatg ggagcctact tcccgttttt 240

cccgatttgg ctacatgaca tcaaccatat cagcaaaagt gatacgggta ttatttttgc 300

cgctatttct ctgttctcgc tattattcca accgctgttt ggtctgcttt ctgacaaact 360

cgggctgcgc aaatacctgc tgtggattat taccggcatg ttagtgatgt ttgcgccgtt 420

ctttattttt atcttcgggc cactgttaca atacaacatt ttagtaggat cgattgttgg 480

tggtatttat ctaggctttt gttttaacgc cggtgcgcca gcagtagagg catttattga 540

gaaagtcagc cgtcgcagta atttcgaatt tggtcgcgcg cggatgtttg gctgtgttgg 600

ctgggcgctg tgtgcctcga ttgtcggcat catgttcacc atcaataatc agtttgtttt 660

ctggctgggc tctggctgtg cactcatcct cgccgtttta ctctttttcg ccaaaacgga 720

tgcgccctct tctgccacgg ttgccaatgc ggtaggtgcc aaccattcgg catttagcct 780

taagctggca ctggaactgt tcagacagcc aaaactgtgg tttttgtcac tgtatgttat 840

tggcgtttcc tgcacctacg atgtttttga ccaacagttt gctaatttct ttacttcgtt 900

ctttgctacc ggtgaacagg gtacgcgggt atttggctac gtaacgacaa tgggcgaatt 960

acttaacgcc tcgattatgt tctttgcgcc actgatcatt aatcgcatcg gtgggaaaaa 1020

cgccctgctg ctggctggca ctattatgtc tgtacgtatt attggctcat cgttcgccac 1080

ctcagcgctg gaagtggtta ttctgaaaac gctgcatatg tttgaagtac cgttcctgct 1140

ggtgggctgc tttaaatata ttaccagcca gtttgaagtg cgtttttcag cgacgattta 1200

tctggtctgt ttctgcttct ttaagcaact ggcgatgatt tttatgtctg tactggcggg 1260

caatatgtat gaaagcatcg gtttccaggg cgcttatctg gtgctgggtc tggtggcgct 1320

gggcttcacc ttaatttccg tgttcacgct tagcggcccc ggcccgcttt ccctgctgcg 1380

tcgtcaggtg aatgaagtcg ctgggagcta agcggccgcg tcgacacgca aaaaggccat 1440

ccgtcaggat ggccttctgc ttaatttgat gcctggcagt ttatggcggg cgtcctgccc 1500

gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga tttgtcctac 1560

tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct ttcgactgag 1620

cctttcgttt tatttgatgc ctggcagttc cctactctcg catggggaga ccccacacta 1680

ccatcatgta tgaatatcct ccttagttcc tattccgaag ttcctattct ctagaaagta 1740

taggaacttc ggcgcgtcct acctgtgaca cgcgtgccgc agtctcacgc ccggagcgta 1800

gcgaccgagt gagctagcta tttgtttatt tttctaaata cattcaaata tgtatccgct 1860

catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgaggga 1920

agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca 1980

tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa 2040

gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg 2100

gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct 2160

ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc 2220

taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga 2280

gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt 2340

tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt 2400

tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga 2460

gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc 2520

gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt 2580

catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg cctcgcgcgc 2640

agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg tagtcggcaa 2700

ataatgtcta acaattcgtt caagccgagg ggccgcaaga tccggccacg atgacccggt 2760

cgtcgggtac cggcagggcg gggcgtaagg cgcgccattt aaatgaagtt cctattccga 2820

agttcctatt ctctagaaag tataggaact t 2851

<210> 15

<211> 2858

<212> DNA

<213> 人工序列

<220>

<223> 整合盒

<400> 15

ggccagatga ttaattccta atttttgttg acactctatc attgatagag ttattttacc 60

actccctatc agtgatagag aaaagtgaaa tgaatagttc gacaaaaatc tagaaataat 120

tttgtttaac tttaagaagg agatatacaa atgggcagca ttattcgtct gcagggtggt 180

ctgggtaatc agctgtttca gtttagcttt ggttatgccc tgagcaaaat taatggtaca 240

ccgctgtatt tcgacattag ccattatgcc gaaaacgatg atcatggtgg ttatcgtctg 300

aataatctgc agattccgga agaatatctg cagtattata ccccgaaaat taataatatt 360

tataaactgc tggtgcgtgg cagccgtctg tatccggata tttttctgtt tctgggcttt 420

tgcaacgaat ttcatgccta tggctacgat tttgaatata ttgcccagaa atggaaaagc 480

aaaaaataca ttggctactg gcagagcgaa cacttttttc ataaacatat tctggacctg 540

aaagaatttt ttattccgaa aaatgtgagc gaacaggcaa atctgctggc agcaaaaatt 600

ctggaaagcc agagcagcct gagcattcat attcgtcgtg gcgattatat taaaaacaaa 660

accgcaaccc tgacacatgg tgtttgtagc ctggaatatt ataaaaaagc cctgaacaaa 720

atccgcgatc tggcaatgat tcgtgatgtg tttatcttta gcgacgatat cttctggtgc 780

aaagaaaata ttgaaaccct gctgagcaaa aaatataata tttattatag cgaagatctg 840

agccaagaag aggatctgtg gctgatgagc ctggcaaatc atcatattat tgccaatagc 900

agctttagtt ggtggggtgc atatctgggt agcagcgcaa gccagattgt tatttatccg 960

accccgtggt atgatattac cccgaaaaac acctatatcc cgattgtgaa ccattggatc 1020

aacgttgata aacatagcag ctgctaagcg gccgcgtcga cacgcaaaaa ggccatccgt 1080

caggatggcc ttctgcttaa tttgatgcct ggcagtttat ggcgggcgtc ctgcccgcca 1140

ccctccgggc cgttgcttcg caacgttcaa atccgctccc ggcggatttg tcctactcag 1200

gagagcgttc accgacaaac aacagataaa acgaaaggcc cagtctttcg actgagcctt 1260

tcgttttatt tgatgcctgg cagttcccta ctctcgcatg gggagacccc acactaccat 1320

catgtatgaa tatcctcctt agttcctatt ccgaagttcc tattctctag aaagtatagg 1380

aacttcggcg cgtcctacct gtgacacgcg tcaagatccc ctcacgctgc cgcaagcact 1440

cagggcgcaa gggctgctaa aggaagcgga acacgtagaa agccagtccg cagaaacggt 1500

gctgaccccg gatgaatgtc agctactggg ctatctggac aagggaaaac gcaagcgcaa 1560

agagaaagca ggtagcttgc agtgggctta catggcgata gctagactgg gcggttttat 1620

ggacagcaag cgaaccggaa ttgccagctg gggcgccctc tggtaaggtt gggaagccct 1680

gcaaagtaaa ctggatggct ttcttgccgc caaggatctg atggcgcagg ggatcaagat 1740

ctgatcaaga gacaggatga ggatcgtttc gcatgattga acaagatgga ttgcacgcag 1800

gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg 1860

gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca 1920

agaccgacct gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc 1980

tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg 2040

actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg 2100

ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta 2160

cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag 2220

ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac 2280

tgttcgccag gctcaaggcg cgcatgcccg acggcgagga tctcgtcgtg acccatggcg 2340

atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg 2400

gccggctggg tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg 2460

aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg 2520

attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctgagcg ggactctggg 2580

gttcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg attccaccgc 2640

cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct ggatgatcct 2700

ccagcgcggg gatctcatgc tggagttctt cgcccacccc agcttcaaaa gcgctctcgg 2760

taccggcagg gcggggcgta aggcgcgcca tttaaatgaa gttcctattc cgaagttcct 2820

attctctaga aagtatagga acttcgaagc agctccag 2858

<210> 16

<211> 2631

<212> DNA

<213> 人工序列

<220>

<223> 整合盒

<400> 16

ggccagatga ttaattccta atttttgttg acactctatc attgatagag ttattttacc 60

actccctatc agtgatagag aaaagtgaaa tgaatagttc gacaaaaatc tagaaataat 120

tttgtttaac tttaagaagg agatatacaa atgaagtcgg cactgacctt ttcccgtcgc 180

atcaatccgg tgtttctggc gttctttgtc gttgcttttc tgagcggtat cgcaggcgca 240

ctgcaggctc cgaccctgag tctgtttctg tccacggaag tgaaagttcg tccgctgtgg 300

gttggtctgt tctataccgt caacgcaatc gctggcatta cggttagctt tatcctggcg 360

aaacgttcag attcgcgcgg tgaccgtcgc aagctgatta tggtgtgcta tctgatggcg 420

gttggcaact gtctgctgtt tgccttcaat cgtgattacc tgaccctgat cacggcaggt 480

gtgctgctgg cgagcgttgc caacaccgca atgccgcaga ttttcgcgct ggcccgtgaa 540

tatgccgaca gctctgcacg cgaagtggtt atgtttagtt ccatcatgcg cgctcaactg 600

agtctggcat gggtgattgg tccgccgctg tcctttatgc tggcgctgaa ttacggtttt 660

accctgatgt tctcaatcgc ggccggcatt ttcgttctgt cggccctggt cgtgtggttt 720

atcctgccga gtgtcccgcg tgcagaaccg gttgtcgatg caccggtggt tgtccagggt 780

tcactgttcg cagacaaaaa cgttctgctg ctgtttatcg cgtcgatgct gatgtggacc 840

tgcaatacga tgtatattat cgatatgccg ctgtacatta ccgcaagcct gggtctgccg 900

gaacgtctgg ctggtctgct gatgggtacc gcagctggcc tggaaattcc gatcatgctg 960

ctggcgggtt attctgtgcg ttactttggc aaacgcaaga ttatgctgtt cgctgttctg 1020

gcgggtgtcc tgttttatac cggcctggtt ctgtttaaat tcaagacggc cctgatgctg 1080

ctgcagatct ttaacgcaat tttcatcggt attgtggctg gcattggtat gctgtacttc 1140

caagatctga tgccgggtcg tgcaggtgca gcaaccacgc tgtttaccaa tagcatctct 1200

acgggtgtca ttctggcagg cgtgctgcaa ggcggtctga ccgaaacgtg gggccatgac 1260

agcgtctatg tgatggcgat ggtcctgtct attctggccc tgattatctg tgcacgtgtg 1320

cgcgaagctt aaatcgatac tagcataacc ccttggggcc tctaaacgcg tcgacacgca 1380

aaaaggccat ccgtcaggat ggccttctgc ttaatttgat gcctggcagt ttatggcggg 1440

cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga 1500

tttgtcctac tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct 1560

ttcgactgag cctttcgttt tatttgatgc ctggcagttc cctactctcg catggggaga 1620

ccccacacta ccatcatgta tgaatatcct ccttagttcc tattccgaag ttcctattct 1680

ctagaaagta taggaacttc ggcgcgtcct acctgtgacg gaagatcact tcgcagaata 1740

aataaatcct ggtgtccctg ttgataccgg gaagccctgg gccaactttt ggcgaaaatg 1800

agacgttgat cggcacgtaa gaggttccaa ctttcaccat aatgaaataa gatcactacc 1860

gggcgtattt tttgagttgt cgagattttc aggagctaag gaagctaaaa tggagaaaaa 1920

aatcactgga tataccaccg ttgatatatc ccaatggcat cgtaaagaac attttgaggc 1980

atttcagtca gttgctcaat gtacctataa ccagaccgtt cagctggata ttacggcctt 2040

tttaaagacc gtaaagaaaa ataagcacaa gttttatccg gcctttattc acattcttgc 2100

ccgcctgatg aatgctcatc cggaattacg tatggcaatg aaagacggtg agctggtgat 2160

atgggatagt gttcaccctt gttacaccgt tttccatgag caaactgaaa cgttttcatc 2220

gctctggagt gaataccacg acgatttccg gcagtttcta cacatatatt cgcaagatgt 2280

ggcgtgttac ggtgaaaacc tggcctattt ccctaaaggg tttattgaga atatgttttt 2340

cgtctcagcc aatccctggg tgagtttcac cagttttgat ttaaacgtgg ccaatatgga 2400

caacttcttc gcccccgttt tcaccatggg caaatattat acgcaaggcg acaaggtgct 2460

gatgccgctg gcgattcagg ttcatcatgc cgtttgtgat ggcttccatg tcggcagatg 2520

cttaatgaat acaacagtac tgcgatgagt ggcagggcgg ggcgtaaggc gcgccattta 2580

aatgaagttc ctattccgaa gttcctattc tctagaaagt ataggaactt c 2631

<210> 17

<211> 4259

<212> DNA

<213> 人工序列

<220>

<223> 整合盒

<400> 17

ttactcagca ataaactgat attccgtcag gctggaatac tcttcgccag gacgcaggaa 60

gcagtccggt tgcggccatt cagggtggtt cgggctgtcc ggtagaaact cgctttccag 120

agccagccct tgccagtcgg cgtaaggttc ggttccccgc gacggtgtgc cgccgaggaa 180

gttgccggag tagaattgca gagccggagc ggtggtgtag accttcagct gcaatttttc 240

atctgctgac cagacatgcg ccgccacttt cttgccatcg cctttggcct gtaacaagaa 300

tgcgtgatcg taacctttca ctttgcgctg atcgtcgtcg gcaagaaact cactggcgat 360

gattttggcg ctgcggaaat caaaagacgt tccggcgaca gatttcaggc cgtcgtgcgg 420

aatgccgcct tcatcaaccg gcagatattc gtccgccaga atctgcaact tgtgattgcg 480

cacgtcagac tgctcgccgt caagattgaa atagacgtga ttagtcatat tcaccgggca 540

aggtttatca actgtggcgc gataagtaat ggagatacgg ttatcgtcgg tcagacgata 600

ttgcaccgtc gcgccgagat tacccgggaa gccctgatca ccatcatctg aactcagggc 660

aaacagcacc tgacgatcgt tctggttcac aatctgccag cgacgtttgt cgaacccttc 720

cggcccgccg tgcagctggt taacgccctg acttggcgaa agcgtcacgg tttcaccgtc 780

aaaggtataa cggctattgg cgatacggtt ggcataacga ccaatagagg cccccagaaa 840

cgcggcctga tcctgatagc attccgggct ggcacagccg agcagcgcct cgcggacgct 900

gccatcggaa agcggaatac gggcggaaag taaagtcgca ccccagtcca tcagcgtgac 960

taccatccct gcgttgttac gcaaagttaa cagtcggtac ggctgaccat cgggtgccag 1020

tgcgggagtt tcgttcagca ctgtcctgct ccttgtgatg gtttacaaac gtaaaaagtc 1080

tctttaatac ctgtttttgc ttcatattgt tcagcgacag cttgctgtac ggcaggcacc 1140

agctcttccg ggatcagcgc gacgatacag ccgccaaatc cgccgccggt catgcgtacg 1200

ccacctttgt cgccaatcac agctttgacg atttctacca gagtgtcaat ttgcggcacg 1260

gtgatttcga aatcatcgcg catagaggca tgagactccg ccatcaactc gcccatacgt 1320

ttcaggtcgc cttgctccag cgcgctggca gcttcaacgg tgcgggcgtt ttcagtcagt 1380

atatgacgca cgcgttttgc cacgatcggg tccagttcat gcgcaacagc gttgaactct 1440

tcaatggtga catcacgcag ggctggctgc tggaagaaac gcgcaccggt ttcgcactgt 1500

tcacgacggg tgttgtattc gctgccaacc agggtacgtt tgaagttact gttgatgatg 1560

acgacagcca cacctttggg catggaaact gctttggtcc ccagtgagcg gcaatcgatc 1620

agcaaggcat gatctttctt gccgagcgcg gaaattagct gatccatgat cccgcagtta 1680

cagcctacaa actggttttc tgcttcctga ccgttaagcg cgatttgtgc gccgtccagc 1740

ggcagatgat aaagctgctg caatacggtt ccgaccgcga cttccagtga agcggaagaa 1800

cttaacccgg caccctgcgg cacattgccg ctgatcacca tgtccacgcc gccgaagctg 1860

ttgttacgca gttgcagatg tttcaccacg ccacgaacgt agttagccca ttgatagttt 1920

tcatgtgcga caatgggcgc atcgagggaa aactcgtcga gctgattttc ataatcggct 1980

gccatcacgc gaactttacg gtcatcgcgt ggtgcacaac tgatcacggt ttgataatca 2040

atcgcgcagg gcagaacgaa accgtcgttg tagtcggtgt gttcaccaat caaattcacg 2100

cggccaggcg cctgaatggt gtgagtggca gggtagccaa atgcgttggc aaacagagat 2160

tgtgtttttt ctttcagact catttcttac actccggatt cgcgaaaatg gatatcgctg 2220

actgcgcgca aacgctctgc tgcctgttct gcggtcaggt ctcgctgggt ctctgccagc 2280

atttcataac caaccataaa tttacgtacg gtggcggagc gcagcagagg cggataaaag 2340

tgcgcgtgca gctgccagtg ttgattctct tcgccattaa atggcgcgcc gtgccagccc 2400

atagagtagg ggaaggagca ctggaagagg ttgtcataac gactggtcag ctttttcaac 2460

gccagcgcca gatcgctgcg ctgggcgtcg gtcaaatcgg tgatccgtaa aacgtgggct 2520

ttgggcagca gtagcgtttc gaacggccag gcagcccagt aaggcacgac ggctaaccag 2580

tgttcggttt cgacaacggt acggctaccg tctgccagct cgcgctgaac ataatccacc 2640

agcattggtg atttctgttc ggcaaaatat tctttttgca ggcggtcttc gcgctcagct 2700

tcgttaggca ggaagctatt tgcccaaatc tgaccgtgcg gatgcgggtt agagcagccc 2760

atcgccgcgc ctttgttttc aaaaacctgc acccatgggt acgttttccc cagttctgcg 2820

gtttgctcct gccaggtttt gacgatttcc gtcaatgctg caacgctgag ctctggcagc 2880

gttttactgt gatccggtga aaagcagatc acccggctgg tgccgcgcgc gctctggcaa 2940

cgcatcagcg gatcgtgact ttctggcgca tctggcgtgt cagacatcaa agccgcaaag 3000

tcattagtga aaacgtaagt cccggtgtaa tcggggtttt tatcgcctgt cacccgcaca 3060

ttacctgcgc agaggaagca atctggatcg tgcgcaggta acacctgttt ggctggcgtt 3120

tcctgcgccc cctgccaggg gcgcttagcg cggtgcggtg aaaccagaat ccattgcccg 3180

gtgagcgggt tgtagcggcg atgtggatga tcaacgggat taaattgcgt catggtcgtt 3240

ccttaatcgg gatatccctg tggatggcgt gactgccagt gccaggtgtc ctgcgccatt 3300

tcatcgagtg tgcgcgttac gcgccagttc agttcacggt cggctttgct ggcgtccgcc 3360

cagtaggccg gaaggtcgcc ctcgcgacgc ggtgcaaaat gataattaac cggtttgccg 3420

caggctttgc tgaaggcatt aaccacgtcc agcacgctgt tgcctacgcc agcgccgagg 3480

ttgtagatgt gtacgcctgg cttgttcgcc agtttttcca tcgccacgac gtgaccgtcc 3540

gccagatcca ttacgtggat gtaatcgcgt acgccagtac catcttcggt cggataatcg 3600

ttaccaaaaa tcgccagcga gtcgcgacgg cctacagcaa cctgggcgat gtatggcatc 3660

aggttattcg gaatgccttg cggatcttcg cccatatcgc ccgacggatg cgcgccaacc 3720

gggttgaagt agcgcagcag ggcaatgctc cagtccggct gggctttttg cagatcggtg 3780

aggatctgtt ccaccatcag cttgcttttg ccgtaagggc tttgcggtgt gccggtcggg 3840

aagctttcaa cgtatggaat tttgggctga tcgccataaa cggtggcgga ggagctaaaa 3900

ataaagtttt tgacgttagc ggcgcgcatg gcgctaatca ggcgcagagt gccgttgaca 3960

ttgttgtcgt aatattccag cggtttttgt accgattcgc ccacggcttt cagcccggcg 4020

aagtggatca cggtgtcgat agcgtgatcg tgcaggatct cggtcatcaa cgcttcgtta 4080

cgaatatcgc cttcaacaaa cgttggatgt ttgccgccta aacgctcgat aacaggcagt 4140

acgctgcgct tactgttaca gaggttatca agaatgatga catcatgacc gttttgcagt 4200

aattgcacac aggtatgact tccaatgtaa ccgctaccac cggtaaccag aactctcat 4259

<210> 18

<211> 4223

<212> DNA

<213> 人工序列

<220>

<223> 整合盒

<400> 18

tggccagatg attaattcct aatttttgtt gacactctat cattgataga gttattttac 60

cactccctat cagtgataga gaaaagtgaa atgaatagtt cgacaaaaat ctagaaataa 120

ttttgtttaa ctttaagaag gagatataca aatgcaaaaa ctactatctt taccgtccaa 180

tctggttcag tcttttcatg aactggagag ggtgaatcgt accgattggt tttgtacttc 240

cgacccggta ggtaagaaac ttggttccgg tggtggaaca tcctggctgc ttgaagaatg 300

ttataatgaa tattcagatg gtgctacttt tggagagtgg cttgaaaaag aaaaaagaat 360

tcttcttcat gcgggtgggc aaagccgtcg tttacccggc tatgcacctt ctggaaagat 420

tctcactccg gttcctgtgt tccggtggga gagagggcaa catctgggac aaaatctgct 480

ttctctgcaa cttcccctat atgaaaaaat catgtctttg gctccggata aactccatac 540

actgattgcg agtggtgatg tctatattcg ttcggagaaa cctttgcaga gtattcccga 600

agcggatgtg gtttgttatg gactgtgggt agatccgtct ctggctaccc atcatggcgt 660

gtttgcttcc gatcgcaaac atcccgaaca actcgacttt atgcttcaga agccttcgtt 720

ggcagaattg gaatctttat cgaagaccca tttgttcctg atggacatcg gtatatggct 780

tttgagtgac cgtgccgtag aaatcttgat gaaacgttct cataaagaaa gctctgaaga 840

actaaagtat tatgatcttt attccgattt tggattagct ttgggaactc atccccgtat 900

tgaagacgaa gaggtcaata cgctatccgt tgctattctg cctttgccgg gaggagagtt 960

ctatcattac gggaccagta aagaactgat ttcttcaact ctttccgtac agaataaggt 1020

ttacgatcag cgtcgtatca tgcaccgtaa agtaaagccc aatccggcta tgtttgtcca 1080

aaatgctgtc gtgcggatac ctctttgtgc cgagaatgct gatttatgga tcgagaacag 1140

tcatatcgga ccaaagtgga agattgcttc acgacatatt attaccgggg ttccggaaaa 1200

tgactggtca ttggctgtgc ctgccggagt gtgtgtagat gtggttccga tgggtgataa 1260

gggctttgtt gcccgtccat acggtctgga cgatgttttc aaaggagatt tgagagattc 1320

caaaacaacc ctgacgggta ttccttttgg tgaatggatg tccaaacgcg gtttgtcata 1380

tacagatttg aaaggacgta cggacgattt acaggcagtt tccgtattcc ctatggttaa 1440

ttctgtagaa gagttgggat tggtgttgag gtggatgttg tccgaacccg aactggagga 1500

aggaaagaat atctggttac gttccgaaca tttttctgcg gacgaaattt cggcaggtgc 1560

caatctgaag cgtttgtatg cacaacgtga agagttcaga aaaggaaact ggaaagcatt 1620

ggccgttaat catgaaaaaa gtgtttttta tcaacttgat ttggccgatg cagctgaaga 1680

ttttgtacgt cttggtttgg atatgcctga attattgcct gaggatgctc tgcagatgtc 1740

acgcatccat aaccggatgt tgcgtgcgcg tattttgaaa ttagacggga aagattatcg 1800

tccggaagaa caggctgctt ttgatttgct tcgtgacggc ttgctggacg ggatcagtaa 1860

tcgtaagagt accccaaaat tggatgtata ttccgatcag attgtttggg gacgtagccc 1920

cgtgcgcatc gatatggcag gtggatggac cgatactcct ccttattcac tttattcggg 1980

aggaaatgtg gtgaatctag ccattgagtt gaacggacaa cctcccttac aggtctatgt 2040

gaagccgtgt aaagacttcc atatcgtcct gcgttctatc gatatgggtg ctatggaaat 2100

agtatctacg tttgatgaat tgcaagatta taagaagatc ggttcacctt tctctattcc 2160

gaaagccgct ctgtcattgg caggctttgc acctgcgttt tctgctgtat cttatgcttc 2220

attagaggaa cagcttaaag atttcggtgc aggtattgaa gtgactttat tggctgctat 2280

tcctgccggt tccggtttgg gcaccagttc cattctggct tctaccgtac ttggtgccat 2340

taacgatttc tgtggtttag cctgggataa aaatgagatt tgtcaacgta ctcttgttct 2400

tgaacaattg ctgactaccg gaggtggatg gcaggatcag tatggaggtg tgttgcaggg 2460

tgtgaagctt cttcagaccg aggccggctt tgctcaaagt ccattggtgc gttggctacc 2520

cgatcattta tttacgcatc ctgaatacaa agactgtcac ttgctttatt ataccggtat 2580

aactcgtacg gcaaaaggga tcttggcaga aatagtcagt tccatgttcc tcaattcatc 2640

gttgcatctc aatttacttt cggaaatgaa ggcgcatgca ttggatatga atgaagctat 2700

acagcgtgga agttttgttg agtttggccg tttggtagga aaaacctggg aacaaaacaa 2760

agcattggat agcggaacaa atcctccggc tgtggaggca attatcgatc tgataaaaga 2820

ttataccttg ggatataaat tgccgggagc cggtggtggc gggtacttat atatggtagc 2880

gaaagatccg caagctgctg ttcgtattcg taagatactg acagaaaacg ctccgaatcc 2940

gcgggcacgt tttgtcgaaa tgacgttatc tgataaggga ttccaagtat cacgatcata 3000

actgaaacca atttgcctgg cggcagtagc gcggtggtcc cacctgaccc catgccgaac 3060

tcagaagtga aacgccgtag cgccgatggt agtgtggggt ctccccatgc gagagtaggg 3120

aactgccagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgggatcc 3180

aggccggcct gttaagacgg ccagtgaatt cgagctcggt acctaccgtt cgtataatgt 3240

atgctatacg aagttatcga gctctagaga atgatcccct cattaggcca cacgttcaag 3300

tgcagcgcac accgtggaaa cggatgaagg cacgaaccca gttgacataa gcctgttcgg 3360

ttcgtaaact gtaatgcaag tagcgtatgc gctcacgcaa ctggtccaga accttgaccg 3420

aacgcagcgg tggtaacggc gcagtggcgg ttttcatggc ttgttatgac tgtttttttg 3480

tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3540

tgttatggag cagcaacgat gttacgcagc agcaacgatg ttacgcagca gggcagtcgc 3600

cctaaaacaa agttaggtgg ctcaagtatg ggcatcattc gcacatgtag gctcggccct 3660

gaccaagtca aatccatgcg ggctgctctt gatcttttcg gtcgtgagtt cggagacgta 3720

gccacctact cccaacatca gccggactcc gattacctcg ggaacttgct ccgtagtaag 3780

acattcatcg cgcttgctgc cttcgaccaa gaagcggttg ttggcgctct cgcggcttac 3840

gttctgccca ggtttgagca gccgcgtagt gagatctata tctatgatct cgcagtctcc 3900

ggcgagcacc ggaggcaggg cattgccacc gcgctcatca atctcctcaa gcatgaggcc 3960

aacgcgcttg gtgcttatgt gatctacgtg caagcagatt acggtgacga tcccgcagtg 4020

gctctctata caaagttggg catacgggaa gaagtgatgc actttgatat cgacccaagt 4080

accgccacct aacaattcgt tcaagccgag atcgtagaat ttcgacgacc tgcagccaag 4140

cataacttcg tataatgtat gctatacgaa cggtaggatc ctctagagtc gacctgcagg 4200

catgagatgt gtataagaga cag 4223

<210> 19

<211> 3792

<212> DNA

<213> 人工序列

<220>

<223> 整合盒

<400> 19

gggaattgat tctggtacca aatgagtcga ccggccagat gattaattcc taatttttgt 60

tgacactcta tcattgatag agttatttta ccactcccta tcagtgatag agaaaagtga 120

aatgaatagt tcgacaaaaa tctagaaata attttgttta actttaagaa ggagatatac 180

aaatgattac ccgcaaaagg cgggccagga caatccatag ccgatatcca atcggaattt 240

acgggagcat agtaatgaca gatattgcac agttgcttgg caaagacgcc gacaaccttt 300

tacagcaccg ttgtatgact attccttctg accagcttta tctccccgga catgactacg 360

tagaccgcgt gatgattgac aataatcgcc cgccagcggt gttacgtaat atgcagacgt 420

tgtacaacac tgggcgtctg gctggcacag gatatctttc tattctgccg gttgaccagg 480

gcgttgagca ctctgccgga gcttcatttg ctgctaaccc gctctacttt gacccgaaaa 540

acattgttga actggcgatc gaagcgggct gtaactgtgt ggcatcaact tacggcgtgt 600

tggcgtcggt atcgcggcgc tatgcgcatc gcattccatt cctcgtcaaa cttaatcaca 660

acgagacgct aagttacccg aacacctacg atcaaacgct gtatgccagc gtggagcagg 720

ccttcaacat gggcgcggtg gcggttggtg cgactatcta ttttggttcg gaagagtcac 780

gtcgccagat tgaagaaatt tctgcggctt ttgaacgtgc gcacgagctg ggcatggtga 840

cagtgctgtg ggcctatttg cgtaactccg cctttaagaa agatggcgtt gattaccatg 900

tttccgccga cctgaccggt caggcaaacc atctggcggc gaccataggt gcagatatcg 960

tcaaacaaaa aatggcggaa aataacggcg gctataaagc aattaattac ggttataccg 1020

acgatcgcgt gtacagcaag ttaaccagcg aaaacccgat tgatctggtg cgttatcagt 1080

tagctaactg ctatatgggc cgggccgggt tgataaactc cggcggtgct gcaggcggtg 1140

aaactgacct cagcgatgca gtgcgtactg cggttatcaa caaacgcgct ggcggaatgg 1200

ggctgattct tggacgtaag gcgttcaaga aatcgatggc tgacggcgtg aaactgatta 1260

acgccgtgca ggatgtttat ctcgatagca aaattactat cgcctaagag gatcgagatc 1320

tcgatcccgc gaaattaata cgactcacta taggggaatt gtgagcggat aacaattccc 1380

ctctagaaat aattttgttt aactttaaga aggagatata ccatgggcca tcatcatcat 1440

catcatcatc atcatcacag cagcggccat atcgaaggtc gtcatatggc ggtgaaagaa 1500

gcgaccagcg agaccaagaa gcgtagcggt tacgagatca ttaccctgac cagctggctg 1560

ctgcaacaag aacagaaggg tatcattgac gcggaactga ccatcgttct gagcagcatt 1620

agcatggcgt gcaaacagat cgcgagcctg gtgcaacgtg cgaacattag caacctgacc 1680

ggtacccaag gcgcggttaa catccagggt gaagaccaaa agaaactgga tgttattagc 1740

aacgaggtgt tcagcaactg cctgcgtagc agcggtcgta ccggcatcat tgcgagcgag 1800

gaagaggacg tggcggttgc ggtggaagag agctacagcg gtaactatat cgtggttttt 1860

gacccgctgg atggcagcag caacctggat gcggctgtga gcaccggtag catcttcggc 1920

atttacagcc cgaacgacga gagcctgccg gattttggtg acgatagcga cgataacacc 1980

ctgggcaccg aagagcaacg ttgcatcgtt aacgtgtgcc aaccgggtag caacctgctg 2040

gcggcgggct actgcatgta tagcagcagc gttgcgttcg tgctgaccat tggcaagggc 2100

gttttcgtgt ttaccctgga cccgctgtac ggtgaattcg tgctgaccca ggagaacctg 2160

caaatcccga agagcggtga aatttacagc tttaacgagg gcaactataa actgtgggat 2220

gaaaacctga agaaatatat cgacgatctg aaggaaccgg gtccgagcgg taaaccgtac 2280

agcgcgcgtt atatcggtag cctggttggc gacttccacc gtaccctgct gtacggtggc 2340

atttacggtt atccgcgtga taagaaaagc aagaacggca aactgcgtct gctgtatgaa 2400

tgcgcgccga tgagctttat tgttgagcag gcgggtggca aaggtagcga cggccaccag 2460

cgtgtgctgg atatccaacc gaccgaaatt caccagcgtg ttccgctgta cattggtagc 2520

accgaagagg ttgaaaaagt tgaaaagtat ctggcgtaat cgagtctggt aaagaaaccg 2580

ctgctgcgaa atttgaacgc cagcacatgg actcgtctac tagcgcagct taattaacct 2640

aggctgctgc caccgctgag caataactag cataacccct tggggcctct aaacgggtct 2700

tgaggggttt tttgctgaaa ggaggaacta tatccggatt ggcgaatggg acgcgccctg 2760

tagcggcgca ttaagcgcgg cgggtggacg gccagtgaat tcgagctcgg tacctaccgt 2820

tcgtataatg tatgctatac gaagttatcg agctctagag aatgatcccc tcattaggcc 2880

acacgttcaa gtgcagcgca caccgtggaa acggatgaag gcacgaaccc agttgacata 2940

agcctgttcg gttcgtaaac tgtaatgcaa gtagcgtatg cgctcacgca actggtccag 3000

aaccttgacc gaacgcagcg gtggtaacgg cgcagtggcg gttttcatgg cttgttatga 3060

ctgttttttt gtacagtcta tgcctcgggc atccaagcag caagcgcgtt acgccgtggg 3120

tcgatgtttg atgttatgga gcagcaacga tgttacgcag cagcaacgat gttacgcagc 3180

agggcagtcg ccctaaaaca aagttaggtg gctcaagtat gggcatcatt cgcacatgta 3240

ggctcggccc tgaccaagtc aaatccatgc gggctgctct tgatcttttc ggtcgtgagt 3300

tcggagacgt agccacctac tcccaacatc agccggactc cgattacctc gggaacttgc 3360

tccgtagtaa gacattcatc gcgcttgctg ccttcgacca agaagcggtt gttggcgctc 3420

tcgcggctta cgttctgccc aggtttgagc agccgcgtag tgagatctat atctatgatc 3480

tcgcagtctc cggcgagcac cggaggcagg gcattgccac cgcgctcatc aatctcctca 3540

agcatgaggc caacgcgctt ggtgcttatg tgatctacgt gcaagcagat tacggtgacg 3600

atcccgcagt ggctctctat acaaagttgg gcatacggga agaagtgatg cactttgata 3660

tcgacccaag taccgccacc taacaattcg ttcaagccga gatcgtagaa tttcgacgac 3720

ctgcagccaa gcataacttc gtataatgta tgctatacga acggtaggat cctctagagt 3780

cgacctgcag gc 3792

<210> 20

<211> 5917

<212> DNA

<213> 人工序列

<220>

<223> 转座子盒

<400> 20

acaggttggc tgataagtcc ccggtctagc ttgcatgcag attgcagcat tacacgtctt 60

gatttgacgg ctagctcagt cctaggtaca gtgctagcac tgctttgtgg aaggagatag 120

acttatggcg gatccgatgg aatacctcga tgtgtcgttc ggcggcacgt tcgctgcaga 180

cacctacacc acaggtggcg acgaggtggc gaagggcccc gtgaccaagc acggcagcat 240

accgaccaag cttgacggcg gcggcatcac cctcgctggc ggcaccaacg gcgtgacatt 300

cacctcgacc gcgagcttca gcgagagtgg gaaggtgaac aagggattcc gcgccgaaat 360

ggagtaccgt acgacgcaga cgcccagcaa cctcgccaca ttgttctccg ccatgggcaa 420

catcttcgtg cgggcgaacg gcagcaacct cgaatacggc ttctccacga acccttccgg 480

cagtacatgg aacgactaca caaagtccgt gacgctgcct tccaacaatg tgaagcacat 540

catccagctg acatatctgc cgggagccga cggcgctgcc tcgacgttgc agttgtcggt 600

ggatggcgtg gccggcgaga ccgccacctc cgcggccggc gagctcgcgg ccgtcagcga 660

ttccgtcggg aacaagttcg ggatcggcta cgaggtgaac cccgcttccg gcgcggcgag 720

ccgcggtctt gccggtgacg tgttccgcgc gcgtgtcgcc gattcggacg ccccgtggga 780

gattcttgac gcatcccagc tgctgcatgt caatttcaac ggcacgttca gcggcacctc 840

atataccgcg gcgagcggcg agcagatgct gggctcgctg gtgtcgcgct cggccaatcc 900

gtccatctcg aactccgccg tcacgctggg cggcggcacg gccggattcg atttcacgcc 960

cacggacttc accctcggtg acaacgaggc catcacccgc ccgctggtcg cggagctgcg 1020

cttcaccccg acgcagaccg gcgacaacca gaccctgttc ggcgcgggcg gcaacctgtt 1080

cctgcgctac gagtcgaaca agctcgtgtt cggcgcctcc accaagtccg gcgataattg 1140

gaccgaccac aagatcgagt ccgcggccgc cacgggtgcg gagcacgtcg tgtcggtggc 1200

gtacgtgccc aataaggccg gcaccggcgc gaagcttgtc atgcgcgtgg atggcggcga 1260

cgcccagacc aaggacatca ctggtctggc ttacctgaat tcgagcatca agggcaaggt 1320

cggcttcggc aacgacgtgc ataccgacgc gctcagccgc ggcttcgtcg gctcgctgag 1380

cgagatccgc ctggccgaaa cctccgcgaa cttcaccacc aacgaattca agctggtcta 1440

ctctcaggtc agctgcgaca cgtcgggcat caaggaggcg aataccttcg acgtggagcc 1500

cgccgagtgc gaggccgcgc ttaagaccaa gctgtccaag ctgcgtccga ccgaagggca 1560

ggccgactac atcgactggg gtcagatcgg attcctccat tacggcatca acacgtacta 1620

caaccaggag tggggtcacg gtaacgagga tccctcccgc atcaacccga ccggcctcga 1680

caccgaccag tgggcgaagt ccttcgccga cggtggcttc aagatgatca tggtgacggt 1740

caagcaccat gacggtttcg agctgtacga ctcgcggtac aacaccgagc acgactgggc 1800

aaacaccgcc gtcgccaagc gcacggggga gaaggacctg ttccgcaaga ttgtcgcctc 1860

ggcgaagaaa tacggcctga aggtcggcat ctactattcg ccggccgatt cctacatgga 1920

gaggaagggc gtctggggca acaactccgc acgcgtcgag cgcacgatcc ccacgctggt 1980

ggagaacgac gaccgcgccg gcaaggtggc ttccggcaaa ctgcccacgt tcaagtacaa 2040

ggccacggat tacggcgcct acatgctcaa ccagctctat gagctgctga ctgagtacgg 2100

cgacatctcc gaggtctggt tcgacggtgc ccaaggcaac accgcaggca ctgagcatta 2160

cgactatggc gtgttctacg agatgatccg ccggcttcag ccccaggcaa ttcaggccaa 2220

cgccgcatac gatgcccgat gggtgggcaa cgaggacggc tgggcccgtc agaccgagtg 2280

gagcccgcag gcggcataca acgacggcgt ggacaaggtg tcgctcaagc ctggccagat 2340

ggcccccgac ggtaagcttg gcagcatgtc gagcgtgctg tccgagatcc gcagcggcgc 2400

cgccaaccag ctgcactggt atccggccga agtcgacgcc aagaaccggc ccggatggtt 2460

ctaccgtgcc agccaatcgc cggcgtccgt agccgaagtc gtgaagtact acgagcagtc 2520

cacgggacgc aactcgcagt atctgctgaa cgtcccaccg tccgataccg gcaagctcgc 2580

cgatgcggat gccgcgggac ttaaggggct gggcgaggag ctcgcccgac gctacggcac 2640

cgatcttgcc ctgggcaaga gcgcgaccgt cgccgcgtcc gcgaacgaca ctgcggtagc 2700

ggccccgaag ctgaccgacg gttcgaagct ctcctccgac aaggccgtgg gcaatacgcc 2760

gacgtacacc atcgatctgg gcagcactgt cgccgtggat gcagtgaaga tctccgagga 2820

cgtgcgcaat gccggccagc agatcgaaag cgccactctg cagggacgag tcaatggaac 2880

atggacgaat ctggcgacta tgacgacggt cgggcagcag cgcgaccttc gcttcacgtc 2940

ccagaacatc gatgccatcc gtctggtggt caactcctcc cgcggtccgg tgcgtctgag 3000

ccgtcttgag gtgttccaca ccgaatccga gattcagacc ggcgcccgcg cctactacat 3060

cgatccgacg gcgcagaccg cgggagatgg attcacgaag gacaagccca tgacgtcgat 3120

cgagcagctg cacgatgtga ccgtcgcgcc aggctccgtg atcttcgtca aggcgggcac 3180

cgagctgacc ggggacttcg ccgtcttcgg ctacggcacc aaggacgagc ccatcaccgt 3240

gacgacatac ggcgaaagcg acaaagccac caccgcgagc ttcgacggca tgaccgccgg 3300

gctgacgctg aagcaggcgc tgaaggcgct cggcaaggac gacgccggct gggtcgtggc 3360

cgattccgcc actgcaccgg cctcccgcgt gtatgtcccg caggatgaga tcagcgtgca 3420

cgcccagtcg tcgcagaact ccggcgcaga ggcggcgagg gcgctcgacg gcgactcgtc 3480

gacgagctgg cactcccagt acagcccgac caccgcgtct gctccgcatt gggtgactct 3540

cgatctcggc aaatcgcgtg agaacgtcgc ctacttcgac tacctcgccc gtatcgacgg 3600

caacaataac ggtgccgcca aggattacga ggtgtatgtc tccgacgatc ccaacgattt 3660

tggagcccct gtggcctcgg gcacgttgaa gaacgtcgcc tacacgcagc gcatcaagct 3720

gacccccaag aacggacggt acgtcaagtt cgtcatcaag accgattatt ccggatcgaa 3780

cttcggctcc gcggcggaaa tgaatgtcga gttgctgccc acggccgtag aggaggacaa 3840

ggtcgccacc ccgcagaagc cgacagtgga cgatgatgcc gatacataca ccatccccga 3900

catcgaggga gtcgtgtaca aggtcgacgg caaggtgttg gccgctggtt ccgtagtgaa 3960

cgtgggcgat gaggacgtga ccgtcacggt caccgccgag cccgccgacg gataccgctt 4020

cccggatggt gtgacgtccc cagtcacgta tgagctgacg ttcaccaaga agggtggcga 4080

gaagcctccg accgaagtca acaaggacaa gctgcacgcc acgatcacca aggctcaggc 4140

gatcgaccgt tccgcctata cggacgagtc gctcaaggtg cttgatgaca agctcgccgc 4200

agcgctcaag gtctatgacg atgacaaggt gagccaggat gatgtcgatg ccgccgaggc 4260

ggctctgtct gcggcgatcg acgcgctgaa gaccaagccg acgacccccg gcggtgaagg 4320

tgagaagcct ggtgaaggtg aaaagcccgg tgacggcaac aagcccggtg acggcaagaa 4380

gcccggcgac gtgatcgcaa agaccggcgc ctccacaatg taactagcat aaccccttgg 4440

ggcctctaaa cgggtcttga ggggtttttt gctgaaacca atttgcctgg cggcagtagc 4500

gcggtggtcc cacctgaccc catgccgaac tcagaagtga aacgccgtag cgccgatggt 4560

agtgtggggt ctccccatgc gagagtaggg aactgccagg catcaaataa aacgaaaggc 4620

tcagtcgaaa gactgggcct ttcgggatcc aggccggcct gttaacgaat taatcttccg 4680

cggcggtatc gataagcttg atatcgaatt ccgaagttcc tattctctag acgccattca 4740

ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg 4800

cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagtcac 4860

gacgttgtaa aacgacggcc agtgaattcg agctcggtac ctaccgttcg tataatgtat 4920

gctatacgaa gttatcgagc tctagagaat gatcccctca ttaggccaca cgttcaagtg 4980

cagcgcacac cgtggaaacg gatgaaggca cgaacccagt tgacataagc ctgttcggtt 5040

cgtaaactgt aatgcaagta gcgtatgcgc tcacgcaact ggtccagaac cttgaccgaa 5100

cgcagcggtg gtaacggcgc agtggcggtt ttcatggctt gttatgactg tttttttgta 5160

cagtctatgc ctcgggcatc caagcagcaa gcgcgttacg ccgtgggtcg atgtttgatg 5220

ttatggagca gcaacgatgt tacgcagcag caacgatgtt acgcagcagg gcagtcgccc 5280

taaaacaaag ttaggtggct caagtatggg catcattcgc acatgtaggc tcggccctga 5340

ccaagtcaaa tccatgcggg ctgctcttga tcttttcggt cgtgagttcg gagacgtagc 5400

cacctactcc caacatcagc cggactccga ttacctcggg aacttgctcc gtagtaagac 5460

attcatcgcg cttgctgcct tcgaccaaga agcggttgtt ggcgctctcg cggcttacgt 5520

tctgcccaga tttgagcagc cgcgtagtga gatctatatc tatgatctcg cagtctccgg 5580

cgagcaccgg aggcagggca ttgccaccgc gctcatcaat ctcctcaagc atgaggccaa 5640

cgcgcttggt gcttatgtga tctacgtgca agcagattac ggtgacgatc ccgcagtggc 5700

tctctataca aagttgggca tacgggaaga agtgatgcac tttgatatcg acccaagtac 5760

cgccacctaa caattcgttc aagccgagat cgtagaattt cgacgacctg cagccaagca 5820

taacttcgta taatgtatgc tatacgaacg gtaggatcct ctagagtcga ccaggtggca 5880

cttttcgggc agaccgggga cttatcagcc aacctgt 5917

Claims

1.一种使用基因工程微生物宿主细胞生产所需低聚糖的方法，所述方法包括以下步骤：

(i)提供能够产生所需低聚糖的基因工程微生物宿主细胞，其中所述微生物宿主细胞已被基因工程改造以表达至少一种异源糖苷酶，其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物，其中所述微生物宿主细胞能够回收由所述糖苷酶的酶活性产生的降解产物，用于产生所需低聚糖；

(ii)在允许产生所需低聚糖的条件下和培养基中培养所述基因工程微生物宿主细胞，从而产生所需低聚糖；和

(iii)任选地，回收所需低聚糖。

2.一种用于生产所需低聚糖的基因工程微生物宿主细胞，其中所述微生物宿主细胞

a)能够产生所需低聚糖；

b)已被基因工程改造以表达至少一种异源糖苷酶，其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物；和

c)能够回收由所述糖苷酶的酶活性产生的降解产物，以产生所需低聚糖。

3.根据权利要求1所述的方法或根据权利要求2所述的基因工程微生物宿主细胞，其中所述异源糖苷酶选自岩藻糖苷酶、唾液酸酶、己糖胺酶、半乳糖苷酶和葡糖苷酶。

4.根据权利要求1至3中任一项所述的方法或基因工程微生物宿主细胞，其中所述异源糖苷酶选自α-1,2-岩藻糖苷酶、α-1,3-岩藻糖苷酶、α-2,3-唾液酸酶、α-2,6-唾液酸酶、α-2,8-唾液酸酶、β-1,3-半乳糖苷酶、β-1,4-半乳糖苷酶、β-1,6-半乳糖苷酶、β-N-乙酰己糖胺酶和β-1,3-葡糖苷酶。

5.根据权利要求1至4中任一项所述的方法或基因工程微生物宿主细胞，其中所述基因工程微生物宿主细胞已被基因工程改造以表达异源糖基转移酶，优选选自岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、N-乙酰葡糖胺基转移酶和葡糖基转移酶的糖基转移酶。

6.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞，其中所述微生物宿主细胞已被基因工程改造以表达异源α-1,3-岩藻糖基转移酶和异源α-1,2-岩藻糖苷酶。

7.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞，其中所述微生物宿主细胞已被基因工程改造以表达异源α-1,2-岩藻糖基转移酶和异源α-1,3-岩藻糖苷酶。

8.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞，其中所述微生物宿主细胞已被基因工程改造以表达异源β-1,3-N-乙酰葡糖胺基转移酶、异源α-1,2-岩藻糖基转移酶、异源β-1,3-半乳糖基转移酶和异源α-1,3-岩藻糖苷酶。

9.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞，其中所述微生物宿主细胞已被基因工程改造以表达异源α-2,6-唾液酸转移酶和异源α-2,3-唾液酸酶。

10.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞，其中所述微生物宿主细胞已被基因工程改造以表达异源β-1,3-N-乙酰葡糖胺基转移酶、异源β-1,4-半乳糖基转移酶和异源β-1,3-半乳糖苷酶和/或β-1,3-葡糖苷酶和/或半乳聚糖-β-1,3-半乳糖苷酶。

11.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞，其中所述微生物宿主细胞已被基因工程改造以表达异源β-1,3-N-乙酰葡糖胺基转移酶、异源β-1,3-半乳糖基转移酶和异源β-1,3-葡糖苷酶和/或半乳聚糖-β-1,3-半乳糖苷酶。

12.根据权利要求1至11中任一项所述的方法或基因工程微生物宿主细胞，其中所述所需低聚糖为人乳低聚糖，优选选自以下的人乳低聚糖：2’-岩藻糖基乳糖(2’-FL)、3-岩藻糖基乳糖(3-FL)、2’,3-二岩藻糖基乳糖、乳-N-三糖II、乳-N-四糖、乳-N-新四糖、乳-N-岩藻戊糖I、乳-N-新岩藻戊糖I、乳-N-岩藻戊糖II、乳-N-岩藻戊糖III、乳-N-岩藻戊糖V、乳-N-新岩藻戊糖V、乳-N-二岩藻己糖I、乳-N-二岩藻糖基己糖II、对-乳-N-岩藻糖基己糖、岩藻糖基-乳-N-唾液酸戊糖b、岩藻糖基-乳-N-唾液酸戊糖c、岩藻糖基-乳-N-唾液酸戊糖c、二唾液酸-乳-N-岩藻戊糖、3-岩藻糖基-3’-唾液酸乳糖、3-岩藻糖基-6’-唾液酸乳糖、乳-N-新二岩藻己糖I、3’-唾液酸乳糖、6’-唾液酸乳糖、唾液酸乳-N-四糖a(LST-a)、唾液酸乳-N-四糖b(LST-b)、唾液酸乳-N-四糖c(LST-c)和二唾液酸乳-N-四糖。

13.根据权利要求2至12中任一项所述的基因工程微生物宿主细胞用于生产所需低聚糖、优选选自HMO的低聚糖的用途。

14.一种低聚糖，优选选自HMO的低聚糖，其通过权利要求1至12中任一项所述的方法或通过使用权利要求1至12中任一项所述的基因工程微生物宿主细胞生产，其用于制备营养组合物。

15.一种营养组合物，其含有通过权利要求1至12中任一项所述的方法或通过使用权利要求1至12中任一项所述的基因工程微生物宿主细胞生产的至少一种低聚糖，其中所述至少一种低聚糖优选为HMO。