CN112119164A - 糖苷酶在低聚糖生产中的用途 - Google Patents

糖苷酶在低聚糖生产中的用途 Download PDF

Info

Publication number
CN112119164A
CN112119164A CN201980032286.2A CN201980032286A CN112119164A CN 112119164 A CN112119164 A CN 112119164A CN 201980032286 A CN201980032286 A CN 201980032286A CN 112119164 A CN112119164 A CN 112119164A
Authority
CN
China
Prior art keywords
ala
gly
thr
val
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980032286.2A
Other languages
English (en)
Inventor
S·詹尼温
D·瓦滕伯格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chr Hansen HMO GmbH
Original Assignee
Jennewein Biotechnologie GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jennewein Biotechnologie GmbH filed Critical Jennewein Biotechnologie GmbH
Publication of CN112119164A publication Critical patent/CN112119164A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES, NOT OTHERWISE PROVIDED FOR; PREPARATION OR TREATMENT THEREOF
    • A23L33/00Modifying nutritive qualities of foods; Dietetic products; Preparation or treatment thereof
    • A23L33/40Complete food formulations for specific consumer groups or specific purposes, e.g. infant formula
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Polymers & Plastics (AREA)
  • Plant Pathology (AREA)
  • Nutrition Science (AREA)
  • Food Science & Technology (AREA)
  • Pediatric Medicine (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)
  • Saccharide Compounds (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

公开了一种使用基因工程微生物宿主细胞生产所需低聚糖的方法,所述基因工程微生物宿主细胞已被基因工程改造以表达异源糖苷酶,其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物。

Description

糖苷酶在低聚糖生产中的用途
本发明涉及通过微生物发酵生产低聚糖。更具体地,本发明涉及糖苷酶通过微生物发酵改善所需低聚糖的生产的用途。
背景技术
人乳含有称为人乳低聚糖(HMO)的不同低聚糖的独特混合物。迄今为止,已在人乳中鉴定出150多种结构不同的低聚糖。除极少数例外以外,HMO的特征在于在其还原端为乳糖部分,许多HMO在其非还原端含有岩藻糖残基和/或N-乙酰神经氨酸残基。通常,HMO的单糖残基来源于D-葡萄糖、D-半乳糖、N-乙酰葡糖胺、L-岩藻糖和N-乙酰神经氨酸。HMO对婴儿营养的重要性与其独特的生物活性直接相关,所述生物活性包括保护新生儿免受病原体的侵害,支持婴儿免疫系统和认知能力的发育。因此,人们对以商业规模制备HMO具有强烈的兴趣。
除了单个HMO的化学合成外,在使用过表达异源糖基转移酶的基因修饰的微生物通过微生物发酵生产HMO的开发中也取得了相当大的进展。在允许微生物表达所述异源糖基转移酶的培养基中和条件下培养此类微生物时,所述微生物可以产生HMO,并从培养基或细胞裂解物中回收。
然而,糖基转移酶通常具有酶的副活性,使得它们产生所需低聚糖的过表达通常会导致不需要的副产物。通常,这些副产物也是低聚糖,但必须从所需低聚糖的制备中去除,以用于产品的商业用途。然而,从所需低聚糖中去除此类副产物是困难和麻烦的。去除此类副产物的一种方法涉及使用糖苷酶,其是外源添加到含有所需和不需要的低聚糖的反应混合物/细胞培养基中,或者是由基因工程微生物在用于生产所需低聚糖的发酵过程结束时经在特定时间点诱导产生的。
国际公布号WO 2015/032412 A1涉及岩藻糖的用途,并公开了一种方法,其中在乳糖存在下培养表达异源岩藻糖基转移酶的基因修饰细胞,以高产率产生和分泌2’-岩藻糖基乳糖(2’-FL)和二岩藻糖基乳糖(DFL)的混合物至培养基的细胞外空间。分离糖,并通过酸或岩藻糖苷酶进行水解以高产率产生岩藻糖。
国际公布号WO 2104/090261 A1公开了一种形成含有2’-FL和3-岩藻糖基乳糖(3-FL)的至少一种的混合物的方法,其中将DFL部分水解,例如酶水解或酸水解。在酶水解中,将DFL暴露于岩藻糖苷酶中,该酶可从DFL中释放一个岩藻糖残基。将DFL(10mM)与来自曼尼霍蒂斯黄单胞菌(Xanthomonas manihotis)的1,2-α-L-岩藻糖苷酶在37℃下在孵育缓冲液中孵育,水解DFL,然后通过HPLC。在18小时后,DFL被部分水解为3-FL和岩藻糖。未检出乳糖。
欧洲专利申请号EP 2 845 905 A1涉及低聚糖的生产,并公开了在生产和/或纯化低聚糖的方法中使用一种或多种糖苷酶。所述方法包括:a)在允许生产所述所需低聚糖的条件下和培养基中培育适合生产所需低聚糖的宿主微生物,从而生产低聚糖,并在适用的情况下生产生物合成糖中间体和/或副产物;b)在培养宿主微生物的培养基中使用糖苷酶,以降解生物合成的糖中间体和/或糖副产物和/或未使用的糖底物;和c)回收所需低聚糖。在实施方案中,所述糖苷酶是在宿主微生物中内源生产的,其中所述糖苷酶是在宿主微生物中非天然存在的糖苷酶,并且其中所述糖苷酶在所述宿主微生物中的表达是可诱导的,使得在宿主微生物的培养过程中已经产生了足够和/或基本上最大量的所需低聚糖后,可以启动该表达。
总之,现有技术公开了糖苷酶在反应混合物/细胞培养基中通过水解不需要的低聚糖从所需和不需要的低聚糖的混合物中去除不需要的低聚糖的用途。然而,这些方法包括通过微生物(包括使用底物和能量)对不需要的低聚糖的生物合成,并且这些方法需要从所需低聚糖中去除不需要的低聚糖的降解产物。
因此,本发明的目的是提供一种生产所需低聚糖的方法,其在含有待发酵的微生物的细胞培养基中通过微生物发酵进行,而不同时产生/积累不需要的糖副产物,即不需要的低聚糖。
所述目的是通过提供能够产生所需低聚糖的基因工程微生物宿主细胞来解决的,其中所述微生物宿主细胞表达异源糖苷酶,其能够降解细胞内生物合成所需低聚糖过程中产生的胞内代谢产物,从而防止在培养基中形成所需和不需要的糖的混合物。然后,所述降解产物可通过微生物宿主细胞的代谢利用,例如用于生物合成所需低聚糖。
表1提供了所需低聚糖和在生产所需低聚糖的过程中添加的可想到的前体和/或产生的不需要的糖副产物的综合概述。
Figure BDA0002776628370000031
Figure BDA0002776628370000041
Figure BDA0002776628370000051
Figure BDA0002776628370000061
Figure BDA0002776628370000071
Figure BDA0002776628370000081
Figure BDA0002776628370000091
表1:所需低聚糖和在生产所需低聚糖的过程中添加的可想到的前体和/或产生的不需要的糖副产物的概述。
发明内容
在第一方面,公开了一种使用能够产生所需低聚糖的基因工程微生物宿主细胞生产所需低聚糖的方法,所述微生物宿主细胞表达异源糖苷酶,其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物。
在第二方面,公开了一种用于生产所需低聚糖的基因工程微生物宿主细胞,其中所述微生物宿主细胞能够产生所需低聚糖,并且其中所述微生物宿主细胞已被基因工程改造以表达异源糖苷酶,其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物。
在第三方面,公开了根据第二方面的基因工程微生物宿主细胞用于生产所需低聚糖的用途。
在第四方面,公开了由根据第一方面的方法和/或使用根据第二方面的基因工程微生物宿主细胞生产的低聚糖,即所需低聚糖。
在第五方面,公开了根据第四方面的所需低聚糖用于生产营养组合物的用途。
在第六方面,公开了包含根据第四方面的所需低聚糖的营养组合物。
附图说明
图1示出了表达异源糖苷酶(如α-1,3-岩藻糖苷酶)的微生物宿主细胞的实施方案的示意图,所述异源糖苷酶能够降解在所需低聚糖(2’-岩藻糖基乳糖)的细胞内生物合成过程中产生的代谢糖副产物(例如3-岩藻糖基乳糖和2’3-二岩藻糖基乳糖),其中微生物宿主细胞能够回收由所述糖苷酶的酶活性产生的降解产物(例如岩藻糖和乳糖),用于产生所需低聚糖。
具体实施方式
根据第一方面,提供了一种使用基因工程微生物宿主细胞生产所需低聚糖的方法,所述方法包括以下步骤:
(i)提供能够产生所需低聚糖的基因工程微生物宿主细胞,其中微生物宿主细胞已被基因工程改造以表达异源糖苷酶,其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物,其中微生物宿主细胞能够回收由所述糖苷酶的酶活性产生的降解产物;
(ii)在允许产生所需低聚糖的条件下和培养基中培养基因工程微生物宿主细胞,从而产生所需低聚糖;和
(iii)任选地,回收所需低聚糖。
本文使用的关于低聚糖的术语“所需”是指旨在由微生物宿主细胞产生的低聚糖。术语“所需”用于区分有意产生的低聚糖和微生物宿主细胞可能产生的其他低聚糖。所述其他低聚糖被认为是“不需要的”,无论这些其他低聚糖是否具有生物功能,是否参与其他细胞化合物(如糖脂、糖蛋白或多糖)的生物合成,或者是否是在所需低聚糖的细胞内生物合成过程中产生的代谢糖产物,这些代谢糖产物要么是由于参与所需低聚糖的生物合成的一种或多种酶的次要(不需要的)酶活性而产生的,要么是由于一种或多种不直接参与所需低聚糖的生物合成,而是使用低聚糖——在产生所需低聚糖的代谢途径中作为中间体而生成的——作为底物的酶的酶活性而产生的。
本文使用的术语“低聚糖”是指由三至二十个单糖残基组成的糖分子,其中每个所述单糖残基通过糖苷键与所述单糖单元中的至少另一个结合。低聚糖可为单糖残基的直链,或单糖残基的支链。
在另一个和/或替代的实施方案中,所需低聚糖为人乳低聚糖(HMO)。
在另一个和/或替代的实施方案中,所需低聚糖为选自以下的HMO:2’-岩藻糖基乳糖(2’-FL)、3-岩藻糖基乳糖(3-FL)、2’3-二岩藻糖基乳糖(DFL)、乳-N-三糖II、乳-N-四糖(LNT)、乳-N-新四糖(LNnT)、乳-N-岩藻戊糖I(LNFP-I)、乳-N-新岩藻戊糖I(LNnFP-I)、乳-N-岩藻戊糖II(LNFP-II)、乳-N-岩藻戊糖III(LNFP-III)、乳-N-岩藻戊糖V(LNFP-V)、乳-N-新岩藻戊糖V(LNnFP-V)、乳-N-二岩藻己糖I、乳-N-二岩藻糖基己糖II、对-乳-N-岩藻糖基己糖、岩藻糖基-乳-N-唾液酸戊糖b、岩藻糖基-乳-N-唾液酸戊糖c、岩藻糖基-乳-N-唾液酸戊糖c、二唾液酸-乳-N-岩藻戊糖、3-岩藻糖基-3’-唾液酸乳糖、3-岩藻糖基-6’-唾液酸乳糖、乳-N-新二岩藻己糖I、3’-唾液酸乳糖(3-SL)、6’-唾液酸乳糖(6-SL)、唾液酸乳-N-四糖a(LST-a)、唾液酸乳-N-四糖b(LST-b)、唾液酸乳-N-四糖c(LST-c)和二唾液酸乳-N-四糖。
所述方法包括提供能够产生所需低聚糖的基因工程微生物宿主细胞。
本文使用的术语“基因工程(genetically-engineered)”是指使用分子生物学方法进行的对细胞遗传组成的修饰。细胞遗传组成的修饰可包括基因在物种界限内和/或跨越物种界限的转移、插入、缺失、替换和/或修饰核苷酸、三联体、基因、开放阅读框、启动子、增强子、终止子和其他介导和/或控制基因表达的核苷酸序列。细胞遗传组成的修饰旨在产生具有特定的、所需特性的基因修饰生物体。基因工程微生物宿主细胞可以含有一个或多个在天然(非基因工程)形式的细胞中不存在的基因。本领域技术人员已知用于将外源核酸分子引入和/或将外源核酸分子(重组、异源)插入到细胞的遗传信息中来插入、缺失或改变细胞遗传信息的核甘酸序列的技术。基因工程细胞可以含有一个或多个存在于天然形式的细胞中的基因,其中所述基因通过人工手段被修饰并重新导入到细胞中。术语“基因工程”还涵盖这样的细胞,其含有对于细胞而言是内源性的核酸分子,并且已经被修饰而未将核酸分子从细胞中移除。此类修饰包括通过基因替换、位点特异性突变和包括通常称为“基因编辑”的相关技术获得的那些修饰。
基因工程微生物宿主细胞可为原核细胞或真核细胞。合适的微生物宿主细胞包括酵母细胞、细菌细胞、古细菌细胞和真菌细胞。
在另一个和/或替代的实施方案中,原核细胞是细菌细胞,优选选自以下细菌属的细菌细胞:芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、微球菌属(Micrococcus)、小单孢菌属(Micromonospora)、假单胞菌属(Pseudomonas)、红球菌属(Rhodococcus)和芽胞乳杆菌属(Sporolactobacillus)。适合的细菌种为枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(B.licheniformis)、凝结芽孢杆菌(B.coagulans)、嗜热芽孢杆菌(B.thermophilus)、侧孢芽孢杆菌(B.laterosporus)、巨大芽孢杆菌(B.megaterium)、蕈状芽孢杆菌(B.mycoides)、短小芽孢杆菌(B.pumilus)、迟缓芽孢杆菌(B.lentus)、蜡样芽孢杆菌(B.cereus)、环状芽孢杆菌(B.circulans)、长双歧杆菌(Bifidobacterium longum)、婴儿双歧杆菌(B.infantis)、两歧双歧杆菌(B.bifidum)、弗氏柠檬酸杆菌(Citrobacterfreundii)、解纤维素梭菌(Clostridium cellulolyticum)、永达尔梭菌(C.ljungdahlii)、自产乙醇梭菌(C.autoethanogenum)、丙酮丁醇梭菌(C.acetobutylicum)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、屎肠球菌(Enterococcus faecium)、嗜热肠球菌(E.thermophiles)、大肠杆菌(Escherichia coli)、草生欧文氏菌(Erwinia herbicola)(成团泛菌(Pantoea agglomerans))、嗜酸乳杆菌(Lactobacillus acidophilus)、唾液乳杆菌(L.salivarius)、胚牙乳杆菌(L.plantarum)、瑞士乳杆菌(L.helveticus)、德氏乳杆菌(L.delbrueckii)、鼠李糖乳杆菌(L.rhamnosus)、保加利亚乳杆菌(L.bulgaricus)、卷曲乳杆菌(L.crispatus)、加氏乳杆菌(L.gasseri)、干酪乳杆菌(L.casei)、罗伊氏乳杆菌(L.reuteri)、詹氏乳杆菌(L.jensenii)、乳酸乳球菌(L.lactis)、柠檬泛菌(Pantoeacitrea)、胡萝卜软腐果胶杆菌(Pectobacterium carotovorum)、费氏丙酸杆菌(Proprionibacterium freudenreichii)、荧光假单胞菌(Pseudomonas fluorescens)、铜绿假单胞菌(P.aeruginosa)、嗜热链球菌(Streptococcus thermophiles)和野油菜黄单胞菌(Xanthomonas campestris)。
在另一个和/或替代的实施方案中,真核细胞是酵母细胞,优选选自以下的酵母细胞:酵母属某些种(Saccharomyces sp.),特别是酿酒酵母(Saccharomyces cerevisiae);复膜孢酵母属某些种(Saccharomycopsis sp.);毕赤酵母属某些种(Pichia sp.),特别是巴斯德毕赤酵母(Pichia pastoris);汉森酵母属某些种(Hansenula sp.)、克鲁维酵母属种(Kluyveromyces sp.);亚罗酵母属某些种(Yarrowia sp.);红酵母属某些种(Rhodotorula sp.)和裂殖酵母属某些种(Schizosaccharomyces sp.)。
基因工程微生物宿主细胞能够产生所需低聚糖。本文使用的术语“能够产生”是指基因工程微生物宿主细胞产生所需低聚糖的能力,条件是微生物宿主细胞是在允许微生物宿主细胞产生所需低聚糖的条件下和培养基中培养的。因此,培养基必须含有在规定范围内的pH值、离子和营养物的组合物以及维持微生物宿主细胞活力和代谢活性所需的化合物。如果对于产生所需低聚糖是必需的,则培养基还必须含有足够量的用于通过微生物宿主细胞生物合成所需低聚糖所需要的任何前体。同样,必须保持用于培养产生所需低聚糖的微生物宿主细胞的条件(例如温度、pH、供氧、搅拌、营养物供应等),使得微生物宿主细胞能够为代谢活性的或保持代谢活性以产生所需低聚糖。
在另一个和/或替代的实施方案中,能够生产所需低聚糖的基因工程微生物宿主细胞为已被基因工程改造以能够产生所需低聚糖的微生物宿主细胞。在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以表达异源糖基转移酶。异源糖苷酶在发酵过程中(即在所需低聚糖的产生或生物合成过程中)在基因工程微生物宿主细胞中表达。在另一个和/或替代的实施方案中,异源糖苷酶的表达在基因工程微生物宿主中为组成型。
本文使用的术语“异源”是指对于细胞或生物体而言是外来的核苷酸序列、核酸分子或多肽,即是指非天然存在于所述细胞或生物体中的核苷酸序列、核酸分子或多肽。本文所用的“异源序列”或“异源核酸”或“异源多肽”是源自特定宿主细胞以外的来源(例如来自不同物种)的序列、核酸分子或多肽,或如果来自同一来源,则从其原始形式被修饰的序列、核酸分子或多肽。因此,可操作地连接到启动子的异源核酸来自不同于该启动子的来源,或者,如果来自同一来源,则从其原始形式被修饰。所述异源序列可以例如通过转染、转化、接合或转导稳定地引入宿主微生物宿主细胞的基因组中,从而代表基因工程宿主细胞。可以应用技术,这些技术将取决于将要引入序列的宿主细胞。各种技术对于本领域的技术人员来说是已知的并且例如公开于Sambrook et al.,Molecular Cloning:A LaboratoryManual,2nd Ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989)。因此,“异源多肽”是一种非天然存在于基因工程细胞所源自的野生型细胞中的多肽,“异源糖基转移酶”是一种非天然存在于基因工程细胞所源自的野生型细胞中的糖基转移酶。
在另一个和/或替代的实施方案中,异源糖基转移酶选自岩藻糖基转移酶(优选α-1,2-岩藻糖基转移酶和α-1,3-岩藻糖基转移酶)、葡糖基转移酶、半乳糖基转移酶(优选β-1,3-半乳糖基转移酶和β-1,4-半乳糖基转移酶)、唾液酸转移酶(优选α-2,3-唾液酸转移酶和α-2,6-唾液酸转移酶)和N-乙酰葡糖胺基转移酶。
岩藻糖基转移酶催化岩藻糖残基从供体鸟苷二磷酸活化的L-岩藻糖(GDP-岩藻糖)转移到几个受体分子。岩藻糖基转移酶在动物、植物、真菌和细菌中表达,并根据受体底物上的岩藻糖键进行分类。因此,α-1,2-岩藻糖基转移酶、α-1,3/4-岩藻糖基转移酶和α-1,6-岩藻糖基转移酶是彼此区别的。例如,在欧洲专利申请号17 180 176中公开了合适的用于在基因工程微生物宿主细胞中异源表达的岩藻糖基转移酶。
唾液酸转移酶催化N-乙酰神经氨酸(Neu5Ac)残基从供体CMP-Neu5Ac转移到受体分子。发现唾液酸转移酶在动物、植物、真菌和细菌中表达。唾液酸转移酶根据Neu5Ac与受体分子之间形成的键进行分类。因此,α-2,3-唾液酸转移酶、α-2,6-唾液酸转移酶和α-2,8-唾液酸转移酶是彼此区别的。例如,在欧洲专利申请号17 183 391中公开了合适的用于在基因工程微生物宿主细胞中异源表达的唾液酸转移酶。
半乳糖基转移酶催化半乳糖残基从供体UDP-半乳糖转移到受体底物。根据半乳糖和受体分子之间形成的键来区分半乳糖基转移酶。因此,β-1,3-半乳糖基转移酶和β-1,4-半乳糖基转移酶是彼此区别的。合适的用于在基因工程微生物宿主细胞中异源表达的β-1,3-半乳糖基转移酶由肠道沙门氏菌(Salmonella enterica)wbdO基因编码。合适的用于在基因工程微生物宿主细胞中异源表达的β-1,4-半乳糖基转移酶由嗜沫聚集杆菌(Aggregatibacter aphrophilus)的lex1基因编码的。
基因工程微生物宿主细胞已被基因工程改造以表达异源糖苷酶,其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物。合适的糖苷酶是相对于被酶活性水解的糖苷键和/或相对于被糖苷酶水解的底物具有特异性的糖苷酶。由于所述特异性,糖苷酶水解不需要的副产物,但不水解要生产的所需低聚糖。在另一个和/或替代的实施方案中,糖苷酶不水解由微生物宿主细胞内化或合成以产生所需低聚糖的一种或多种前体。优选地,所述糖苷酶为外切糖苷酶。
外切糖苷酶为糖苷水解酶,其破坏了低聚糖结构末端残基处的糖苷键。
在另一个和/或替代的实施方案中,异源糖苷酶选自岩藻糖苷酶(包括α-1,2-岩藻糖苷酶和α-1,3-岩藻糖苷酶)、唾液酸酶(如α-2,3-唾液酸酶、α-2,6-唾液酸酶、α-2,8-唾液酸酶)、半乳糖苷酶(如β-1,3-半乳糖苷酶、β-1,4-半乳糖苷酶和β-1,6-半乳糖苷酶)、β-N-乙酰己糖胺酶和葡糖苷酶(如β-1,3-葡糖苷酶)。
合适的岩藻糖苷酶为α-1,2-岩藻糖苷酶。α-1,2-岩藻糖苷酶是高度特异性的外切糖苷酶,其催化低聚糖中线性α-1,2-连接的L-岩藻吡喃糖基残基的水解。优选的α-1,2-岩藻糖苷酶为两岐双岐杆菌的AfcA(SEQ ID NO:2)。
在另一个和/或替代的实施方案中,提供了能够产生3-FL的基因工程微生物宿主细胞,其中所述基因工程微生物宿主细胞表达α-1,2-岩藻糖苷酶。为了能够产生3-FL,基因工程微生物宿主细胞表达α-1,3-岩藻糖基转移酶。所述α-1,3-岩藻糖基转移酶能够将岩藻糖残基从GDP-岩藻糖转移到乳糖(作为受体底物)的葡萄糖部分,从而合成3-FL,作为所需低聚糖。2’-FL和2’3-DFL是3-FL生产中不需要的糖副产物。
通过在能够产生3-FL的基因工程微生物宿主细胞中表达异源α-1,2-岩藻糖苷酶,可以消除或至少减少副产物2’-FL和2’3-DFL的产生,因为这些副产物在基因工程微生物宿主细胞内被异源α-1,2-岩藻糖苷酶水解。得到的降解产物为岩藻糖和乳糖。岩藻糖和乳糖都可以被基因工程微生物宿主细胞利用以产生所需的3-FL。
在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以表达α-1,2-岩藻糖苷酶。在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以含有包含编码α-1,2-岩藻糖苷酶用于其表达的核苷酸序列的核酸分子。优选地,编码α-1,2-岩藻糖苷酶的核苷酸序列为选自以下的核苷酸序列:
-由SEQ ID NO:1表示的核苷酸序列;
-与在严格的条件下与由SEQ ID NO:1表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列;
-与由SEQ ID NO:1表示的核苷酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性的核苷酸序列;
-编码具有由SEQ ID NO:2表示的氨基酸序列的多肽的核苷酸序列;和
-编码由SEQ ID NO:2表示的多肽序列的功能性变体的核苷酸序列,其中功能性变体的氨基酸序列与由SEQ ID NO:2表示的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。
本文使用的术语“杂交(hybridize)”或“杂交(hybridizing)”是指在常规条件下杂交,如Sambrook et al.(1989)"Molecular Cloning,A Laboratory Manual"(ColdSpring Harbor Laboratory Press,New York)中描述的,优选在严格条件下。严格的杂交条件为例如:在65℃下在4x SSC中杂交,随后在65℃下在0.1x SSC中进行多次洗涤,共持续约1小时。较不严格的杂交条件为例如:在37℃下在4x SSC中杂交,随后在室温(约21℃)下在1x SSC中多次洗涤。“严格的杂交条件”还指:在68℃下在0.25M磷酸钠、pH 7.2、7%SDS、1mM EDTA和1%BSA中杂交16小时,随后在68℃下用2x SSC和01%SDS洗涤两次。
为了表达编码α-1,2-岩藻糖苷酶或其功能性变体的核苷酸序列,所述核苷酸序列可操作地连接到表达控制序列,其介导编码α-1,2-岩藻糖苷酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。
“表达控制序列”为不是编码蛋白质的核苷酸序列的一部分,而是介导编码蛋白质的核苷酸序列的表达的调控核苷酸序列。调控元件核苷酸序列包括启动子、顺式调控元件、增强子、内含子和终止子。根据调控元件的类型,它在编码蛋白质的核苷酸序列之前(即3’)或编码蛋白质的核苷酸序列之后(即5’)存在于核酸分子上。调控元件在微生物宿主细胞中是功能性的。
术语“可操作地连接”是指调控元件以这种方式与编码蛋白质的核苷酸序列连接,即相对于编码蛋白质的核苷酸序列以这种方式定位在例如核酸分子上,在调控元件的控制下,编码蛋白质的核苷酸序列的表达可以发生在活细胞中。
为了本发明的目的,“启动子”是调控核苷酸序列的表达基因,其通常位于基因的5’端,并通过与特定的DNA结合蛋白的相互作用介导RNA聚合酶转录启动。
此外,合适的启动子包括合成启动子。这些是通过分子生物学技术创建的的启动子,在自然界中没有发现这种构型的启动子。合成启动子是除了最小启动子之外只包含一个或多个选择的、定义的顺式元件的极简启动子。这些顺式元件是DNA结合蛋白(如转录因子)的结合位点,分离自天然启动子,源自先前分离的顺式元件,或通过随机重组技术技术性产生,并通过适当的方法选择;与天然启动子相比,由于合成启动子的结构不太复杂,其仅由少数外源和内源因子激活,因此受到更具体的调控。
“最小启动子”或“核心”启动子是含有基础转录因子复合物的结合位点,并允许通过RNA聚合酶II准确启动转录的核苷酸序列。最小启动子的特征序列基序为TATA盒、启动子元件(Inr)、“TFBII识别元件”(BRE)和“下游核心启动子元件”(OPE)。在最小启动子中,这些元件可以单独或组合存在。最小启动子或其序列基序是例如可从细菌、真菌或病毒基因中获得的。
“顺式元件”是指与待表达的编码蛋白质的核苷酸序列位于同一核酸分子上的核苷酸序列。顺式元件不必编码RNA或蛋白质,在转录方向上可以位于待表达的编码蛋白质的核苷酸序列之前或之后。在待表达的编码蛋白质的核苷酸序列之前的上游顺式元件通常提供必要的结合基序,特别是对于转录因子而言是必要的,所述转录因子在分子水平上从另一端作为(Lat.trans,'beyond'的)反式作用元件参与该基因的转录调控。此外,如果顺式元件导致转录受到抑制,那么它们称为沉默子。导致转录增强的顺式元件称为增强子。启动子中顺式/反式活性的总和决定了RNA聚合酶进行转录的强度。
此外,启动子可为嵌合启动子和/或已被顺式元件修饰的启动子。启动子的修饰还可指在启动子中额外引入顺式元件,所述启动子例如已经天然具有顺式元件。此外,修饰还包括顺式元件的多聚化,特别是天然存在的顺式元件的多聚化。与天然形式相比,这种修饰的启动子的特性例如关于特异性、表达水平或背景活性方面可能已发生了改变。
终止子为DNA上的核苷酸序列,其通常标记基因末端,导致转录终止。
另一种合适的岩藻糖苷酶为α-1,3-岩藻糖苷酶。α-1,3-岩藻糖苷酶为高度特异性糖苷酶,其催化低聚糖中α-1,3-连接的L-岩藻吡喃糖基残基的水解。优选的α-1,3-岩藻糖苷酶为来自两歧双歧杆菌的AfcB(SEQ ID NO:4)。
在另一个和/或替代的实施方案中,提供了能够产生2’-FL的基因工程微生物宿主细胞,其中所述基因工程微生物宿主生物体表达α-1,3-岩藻糖苷酶。为了能够产生2’-FL,基因工程微生物宿主细胞表达α-1,2-岩藻糖基转移酶。所述α-1,2-岩藻糖基转移酶能够将岩藻糖残基从GDP-岩藻糖转移到乳糖(作为受体底物)的半乳糖部分,从而合成2’-FL,作为所需低聚糖。3-FL和2’3-DFL是2’-FL生产中不需要的糖副产物。
通过在能够产生2’-FL的基因工程微生物宿主细胞中表达异源α-1,3-岩藻糖苷酶,可以消除或至少减少副产物3-FL和2’3-DFL的产生,因为这些副产物在基因工程微生物宿主细胞中被异源α-1,3-岩藻糖苷酶水解。得到的降解产物为岩藻糖和乳糖。岩藻糖和乳糖都可以被基因工程微生物宿主生物体利用以产生所需的2’-FL。
在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以表达α-1,3-岩藻糖苷酶。在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以含有包含编码α-1,3-岩藻糖苷酶用于其表达的核苷酸序列的核酸分子。优选地,编码α-1,3-岩藻糖苷酶的核苷酸序列为选自以下的核苷酸序列;
-由SEQ ID NO:3表示的核苷酸序列;
-与在严格的条件下与由SEQ ID NO:3表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列;
-与由SEQ ID NO:3表示的核苷酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性的核苷酸序列;
-编码具有由SEQ ID NO:4表示的氨基酸序列的多肽的核苷酸序列;和
-编码由SEQ ID NO:4表示的多肽序列的功能性变体的核苷酸序列,其中功能性变体的氨基酸序列与由SEQ ID NO:4表示的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。
为了表达编码α-1,3-岩藻糖苷酶或其功能性变体的核苷酸序列,所述核苷酸序列可操作地连接到表达控制序列,其介导编码α-1,3-岩藻糖苷酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。
在另一个和/或替代的实施方案中,提供了能够产生LNFP-I的基因工程微生物宿主细胞,其中所述基因工程微生物宿主细胞表达α-1,3-岩藻糖苷酶。为了能够产生LNFP-I,基因工程微生物宿主细胞表达β-1,3-N-乙酰葡糖胺基转移酶、β-1,3-半乳糖基转移酶和α-1,2-岩藻糖基转移酶。所述β-1,3-N-乙酰葡糖胺基转移酶能够将GlcNAc残基从UDP-GlcNAc转移到乳糖的半乳糖部分,从而合成乳-N-三糖-II(LNT-II)。所述β-1,3-半乳糖基转移酶能够将半乳糖残基从UDP-半乳糖转移到LNT-II的GlcNAc部分,从而合成乳-N-四糖(LNT)。所述α-1,2-岩藻糖基转移酶能够将岩藻糖残基从GDP-岩藻糖转移到LNT的末端半乳糖部分,从而合成LNFP-I。3-FL和2’3-DFL将会是LNFP-I生产中不需要的副产物。通过在能够产生LNFP-I的基因工程微生物宿主细胞中表达α-1,3-岩藻糖苷酶,可以消除或至少减少副产物3-FL和2’3-DFL的产生,因为这些副产物在基因工程微生物宿主细胞中被α-1,3-岩藻糖苷酶水解。得到的降解产物为岩藻糖、乳糖和2’-FL。岩藻糖和乳糖可以被基因工程微生物宿主生物体利用以产生所需的LNFP-I。
在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以表达α-1,3-岩藻糖苷酶。在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以含有包含编码α-1,3-岩藻糖苷酶用于其表达的核苷酸序列的核酸分子。优选地,编码α-1,3-岩藻糖苷酶的核苷酸序列为选自以下的核苷酸序列;
-SEQ ID NO:3所表示的核苷酸序列;
-与在严格的条件下与SEQ ID NO:3所表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列;
-与SEQ ID NO:3所表示的核苷酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性的核苷酸序列;
-编码具有SEQ ID NO:4所表示的氨基酸序列的多肽的核苷酸序列;和
-编码SEQ ID NO:4所表示的多肽序列的功能性变体的核苷酸序列,其中功能性变体的氨基酸序列与SEQ ID NO:4所表示的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。
为了表达编码α-1,3-岩藻糖苷酶或其功能性变体的核苷酸序列,所述核苷酸序列可操作地连接到表达控制序列,其介导编码α-1,3-岩藻糖苷酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。
合适的唾液酸酶为α-2,3-唾液酸酶。α-2,3-唾液酸酶为高度特异性外切糖苷酶,其催化来自低聚糖的线性α-2,3-连接的L-唾液酸残基的水解。优选的α-2,3-唾液酸酶为肺炎链球菌(Streptococcus pneumoniae)的NanB(SEQ ID NO:6)。
在另一个和/或替代的实施方案中,提供了能够产生6’-SL的基因工程微生物宿主细胞,其中所述基因工程微生物宿主细胞表达α-2,3-唾液酸酶。为了能够产生6’-SL,基因工程微生物宿主细胞表达α-2,6-唾液酸转移酶。所述α-2,6-唾液酸转移酶能够将Neu5Ac残基从CMP-Neu5Ac转移到乳糖(作为底物)的半乳糖部分,从而合成6’-SL。3’-SL是6’-SL产生中不需要的副产物。
通过在能够产生6’-SL的基因工程微生物宿主细胞中表达α-2,3-唾液酸酶,可以消除或至少减少副产物3’-SL的产生,因为该副产物在遗传修饰的微生物宿主细胞中被α-2,3-唾液酸酶水解。得到的降解产物为N-乙酰神经氨酸和乳糖。N-乙酰神经氨酸和乳糖都可以被基因工程微生物宿主生物体利用以产生所需的6’-SL。
在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以表达α-2,3-唾液酸酶。在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以含有包含编码α-2,3-唾液酸酶的核苷酸序列的核酸分子,用于其表达。优选地,编码α-2,3-唾液酸酶的核苷酸序列为选自以下的核苷酸序列;
-SEQ ID NO:5所表示的核苷酸序列;
-与在严格的条件下与SEQ ID NO:5所表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列;
-与SEQ ID NO:5所表示的核苷酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性的核苷酸序列;
-编码具有SEQ ID NO:6所表示的氨基酸序列的多肽的核苷酸序列;和
-编码SEQ ID NO:6所表示的多肽序列的功能性变体的核苷酸序列,其中功能性变体的氨基酸序列与SEQ ID NO:6所表示的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。
为了表达编码α-2,3-唾液酸酶或其功能性变体的核苷酸序列,所述核苷酸序列可操作地连接到表达控制序列,其介导编码α-2,3-唾液酸酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。
合适的半乳糖苷酶为β-1,3-半乳糖苷酶。β-1,3-半乳糖苷酶为催化低聚糖中β-1,3-连接的半乳糖残基的水解的酶。优选的β-1,3-半乳糖苷酶为长双歧杆菌的Bga42A(SEQID NO:8)。
在另一个和/或替代的实施方案中,提供了能够产生LNnT的基因工程微生物宿主细胞,其中所述基因工程微生物宿主细胞表达β-1,3-半乳糖苷酶。为了能够产生LNnT,基因工程微生物宿主细胞表达β-1,3-N-乙酰葡糖胺基转移酶和β-1,4-半乳糖基转移酶。所述β-1,3-N-乙酰葡糖胺基转移酶能够将GlcNAc残基从UDP-GIcNAc转移到乳糖的半乳糖部分,从而合成LNT-II。所述β-1,4-半乳糖基转移酶能够将半乳糖残基从UDP-半乳糖转移到LNT-II的GlcNAc部分,从而合成LNnT,作为所需低聚糖。
LNT是LNnT生产中不需要的副产物。通过在能够生产LNnT的基因工程微生物宿主细胞中表达β-1,3-半乳糖苷酶,可以消除或至少减少副产物LNT的产生,因为该副产物在基因工程微生物宿主细胞中被异源β-1,3-半乳糖苷酶水解。得到的降解产物为半乳糖和LNT-II。半乳糖和LNT-II都可以被基因工程微生物宿主生物体利用以产生所需的LNnT。
在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以表达β-1,3-半乳糖苷酶。在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以含有包含编码β-1,3-半乳糖苷酶用于其表达的核苷酸序列的核酸分子。
在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以表达β-1,3-半乳糖苷酶。在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以含有包含编码β-1,3-半乳糖苷酶用于其表达的核苷酸序列的核酸分子。
优选地,编码β-1,3-半乳糖苷酶的核苷酸序列为选自以下的核苷酸序列;
-SEQ ID NO:7所表示的核苷酸序列;
-与在严格的条件下与SEQ ID NO:7所表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列;
-与SEQ ID NO:7所表示的核苷酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性的核苷酸序列;
-编码具有SEQ ID NO:8所表示的氨基酸序列的多肽的核苷酸序列;和
-编码SEQ ID NO:8所表示的多肽序列的功能性变体的核苷酸序列,其中功能性变体的氨基酸序列与SEQ ID NO:8所表示的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。
为了表达编码β-1,3-半乳糖苷酶或其功能性变体的核苷酸序列,所述核苷酸序列可操作地连接到表达控制序列,其介导编码β-1,3-半乳糖苷酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。
另一种合适的半乳糖苷酶为半乳聚糖β-1,3-半乳糖苷酶。所述半乳聚糖β-1,3-半乳糖苷酶为催化具有低聚糖链的半乳糖中β-1,3-连接的半乳糖残基的水解的酶。优选的半乳聚糖β-1,3-半乳糖苷酶为热纤梭菌(Clostridium thermocellum)的Ct1、3Gal43A(SEQID NO:10)。
在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以表达半乳聚糖β-1,3-半乳糖苷酶。在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以含有包含编码半乳聚糖β-1,3-半乳糖苷酶用于其表达的核苷酸序列的核酸分子。优选地,编码半乳聚糖β-1,3-半乳糖苷酶的核苷酸序列为选自以下的核苷酸序列;
-SEQ ID NO:9所表示的核苷酸序列;
-与在严格的条件下与SEQ ID NO:9所表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列;
-与SEQ ID NO:9所表示的核苷酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性的核苷酸序列;
-编码具有由SEQ ID NO:10所表示的氨基酸序列的多肽的核苷酸序列;和
-编码SEQ ID NO:10所表示的多肽序列的功能性变体的核苷酸序列,其中功能性变体的氨基酸序列与SEQ ID NO:10所表示的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。
为了表达编码半乳聚糖β-1,3-半乳糖苷酶或其功能性变体的核苷酸序列,所述核苷酸序列可操作地连接到表达控制序列,其介导编码半乳聚糖β-1,3-葡糖苷酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。
合适的葡糖苷酶为β-1,3-葡糖苷酶。所述β-1,3-葡糖苷酶为高度特异性外切糖苷酶,其催化低聚糖中β-1,3-连接的葡萄糖残基的水解。优选的β-1,3-葡糖苷酶为类芽孢杆菌属(Paenibacillus sp.)的PglA(SEQ ID NO:12)。
在另一个和/或替代的实施方案中,提供了能够产生LNT或LNnT的基因工程微生物宿主细胞,其中所述基因工程微生物宿主细胞表达β-1,3-葡糖苷酶和/或β-1,3-半乳糖苷酶。为了能够产生LNT,基因工程微生物宿主细胞表达β-1,3-N-乙酰葡糖胺基转移酶和β-1,3-半乳糖基转移酶。所述β-1,3-N-乙酰葡糖胺基转移酶能够将GlcNAc残基从UDP-GlcNAc转移到乳糖的半乳糖部分,从而合成乳-N-三糖-II(LNT-II)。所述β-1,3-半乳糖基转移酶能够将半乳糖残基从UDP-半乳糖转移到LNT-II的GlcNAc部分,从而合成乳-N-四糖(LNT)。为了能够产生LNnT,基因工程微生物宿主细胞表达β-1,3-N-乙酰葡糖胺基转移酶和β-1,4-半乳糖基转移酶。所述β-1,3-N-乙酰葡糖胺基转移酶能够合成LNT-II。所述β-1,4-半乳糖基转移酶能够将半乳糖残基从UDP-半乳糖转移到LNT-II的GlcNAc部分,从而合成LNnT,作为所需低聚糖。
技术人员已知,β-1,3-N-乙酰葡糖胺基转移酶(如脑膜炎奈瑟氏菌(Neisseriameningitidis)的LgtA)接受广谱的供体底物。虽然主要将GlcNAc从UDP-GIcNAc转移到适当的受体糖,但LgtA还能够使用UDP-半乳糖或UDP-葡萄糖作为供体底物。使用能够生产所述的LNT或LNnT的基因工程微生物宿主生物体,所述β-1,3-N-乙酰葡糖胺基转移酶还能够将UDP-半乳糖的半乳糖残基以及UDP-葡萄糖的葡萄糖残基转移到乳糖的半乳糖部分,从而分别合成不需要的副产物Gal(β1,3)Gal(β1,4)Glc和Glc(β1,3)Gal(β1,4)Glc。
通过在能够产生LNT或LNnT的基因工程微生物宿主细胞中表达半乳聚糖β-1,3-半乳糖苷酶和/或β-1,3-葡糖苷酶,可以消除或至少减少副产物Gal(β1,3)Gal(β1,4)Glc和Glc(β1,3)Gal(β1,4)Glc的产生,因为这些副产物在基因工程微生物宿主细胞中被半乳聚糖β-1,3-半乳糖苷酶和/或β-1,3-葡糖苷酶水解。得到的降解产物为半乳糖和/或葡萄糖和乳糖。单糖和乳糖都可以被基因工程微生物宿主细胞利用以产生所需的LNT或LNnT。
在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以表达β-1,3-葡糖苷酶。在另一个和/或替代的实施方案中,基因工程微生物宿主细胞已被基因工程改造以含有包含编码β-1,3-葡糖苷酶用于其表达的核苷酸序列的核酸分子。优选地,编码β-1,3-葡糖苷酶的核苷酸序列为选自以下的核苷酸序列;
-SEQ ID NO:11所表示的核苷酸序列;
-与在严格的条件下与SEQ ID NO:11所表示的核苷酸序列杂交的核苷酸序列互补的核苷酸序列;
-与SEQ ID NO:11所表示的核苷酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性的核苷酸序列;
-编码具有SEQ ID NO:12所表示的氨基酸序列的多肽的核苷酸序列;和
-编码SEQ ID NO:12所表示的多肽序列的功能性变体的核苷酸序列,其中功能性变体的氨基酸序列与SEQ ID NO:10所表示的氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。
为了表达编码β-1,3-葡糖苷酶或其功能性变体的核苷酸序列,所述核苷酸序列可操作地连接到表达控制序列,其介导编码β-1,3-葡糖苷酶或其功能性变体的核苷酸序列在基因工程微生物宿主细胞中的表达。
基因工程微生物宿主细胞能够回收至少一种由基因工程微生物宿主细胞中的异源糖苷酶的酶活性产生的降解产物。因此,基因工程微生物宿主细胞可以使用至少一种由异源糖苷酶的酶活性产生的降解产物来生产所需低聚糖。例如,从不需要的糖副产物中释放出的单糖残基可以被异源糖苷酶再激活,即结合到核苷酸上,由各自的糖基转移酶从产生的核苷酸激活的单糖转移到受体底物上,以获得所需低聚糖或所需低聚糖的前体。
所述方法包括在允许所述基因工程微生物宿主生物体产生所需低聚糖的培养基中,以及在允许所述基因工程微生物宿主生物体产生所需低聚糖的条件下培养基因工程微生物宿主细胞的步骤。
允许基因工程微生物宿主细胞产生所需低聚糖的培养基含有营养物、至少一种能量来源、必需金属和矿物质以及缓冲剂。所述培养基任选地含有所需低聚糖的前体,所述前体可由基因工程微生物宿主细胞内化,并用于产生所需低聚糖,条件是基因工程微生物宿主细胞不能自行合成所述前体。然后,基因工程微生物宿主细胞内化前体,并使前体进行所需低聚糖的生物合成。例如,乳糖可以被认为是2’-岩藻糖基乳糖的前体。
在培养用于产生所需低聚糖的基因工程微生物宿主细胞的过程中,保持允许的条件。如果在这些条件下培养的基因工程微生物宿主细胞保持活力并产生所需低聚糖,则条件是“允许的”。优选地,允许的培养条件使基因工程微生物宿主细胞增殖。需要保持在一定值或一定范围内的条件包括pH、温度、氧和营养物浓度、能量来源以及必需的金属和矿物质。
在另一个和/或替代的实施方案中,所述方法包括回收所需低聚糖的步骤。所需低聚糖可以从发酵液和/或基因工程微生物宿主生物体中回收。
本文前述的方法是有利的,因为在生产所需低聚糖的过程中很少或没有产生不需要的副产物。因此,从发酵液或细胞裂解液中回收和纯化所需低聚糖是不那么麻烦和昂贵的。
此外,更多的底物被专门用于生产所需低聚糖,而不是因为它被并入不需要的副产物中,而这些副产物不能被微生物宿主细胞代谢而变得无法用于生产所需低聚糖。
根据第二方面,提供了用于生产所需低聚糖的基因工程微生物宿主细胞,其中所述微生物宿主细胞能够产生所需低聚糖,并且其中所述微生物宿主细胞已被基因工程改造以表达异源糖苷酶,其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢副产物。
根据第三方面,本文前述的基因工程微生物宿主细胞用于生产所需低聚糖。使用这些基因工程微生物宿主细胞通过发酵生产所需低聚糖是有利的,因为防止甚至消除了不需要的糖副产物的产生。因此,从发酵液中回收所需低聚糖既节省了资源,又不那么麻烦,因为可以避免将所需低聚糖从不需要的低聚糖副产物中分离出来。此外,与未被基因工程改造以表达异源糖苷酶的天然微生物宿主细胞相比,向本发明的基因工程微生物宿主细胞提供的更多的离析物和能量来源被转化为所需的产物。
根据第四方面,通过本文前述的方法和/或基因工程微生物宿主细胞的用途生产的所需低聚糖优选选自HMO。
通过本文所述的方法和/或基因工程微生物宿主细胞的用途生产的所需低聚糖可用于生产营养组合物。
所述营养组合物为药用组合物、膳食组合物、婴儿配方物等。
将参照具体实施方案并参照附图来描述本发明,但本发明不仅限于此,而仅通过权利要求来限定。此外,说明书和权利要求中的术语第一、第二等用于区分相似的要素,而并不必然用于在时间、空间、排序或以任何其他方式描述顺序。应该理解,如此使用的术语在适当的情况下是可互换的,并且本文所述的本发明的实施方案能够以不同于本文所述或所示的其他顺序操作。
应当注意的是,权利要求中使用的术语“包括”不应被解释为限于其后列出的方法;它不排除其他元素或步骤。因此,它被解释为指明所述特征、整数、步骤或成分的存在,但不排除存在或添加一个或多个其他特征、整数、步骤或成分或其群组。因此,表述“包括装置A和B的设备”的范围不应限于仅由组件A和B组成的设备。这意味着,就本发明而言,该装置仅有的相关组件是A和B。
在本说明书中提及“一个实施方案(one embodiment)”或“实施方案(anembodiment)”是指在本发明的至少一个实施方案中包括与实施方案相关描述的特定的特性、结构或特征。因此,短语“在一个实施方案中”或“在实施方案中”在本说明书中各处出现不一定都是指同一实施方案,而是可能。此外,在一个或多个实施方案中,可以以任何适当的方式结合特定的特性、结构或特征,这对于本领域普通技术人员来说,根据本公开将是显而易见的。
类似地,应当理解,在本发明的示例性实施方案的描述中,出于简化公开内容并帮助理解本发明的一个或多个方面的目的,有时将本发明的各种特征组合在单个实施方案、附图或其描述。然而,这种公开方法不应被解释为反映了所要求保护的发明需要比在每个权利要求中明确陈述的更多的特征的意图。相反,正如所附权利要求所反映的,本发明的方面在于小于单个前述公开实施方案的所有特征。因此,在详细说明书之后的权利要求被明确地并入本详细说明书中,每一项权利要求本身作为本发明的单独的实施方案。
此外,虽然本文描述的一些实施方案包括其他实施方案中包括的一些特征但不包括其他特征,但不同实施方案的特征的组合意于在本发明的范围内,并形成不同的实施方案,正如本领域技术人员所理解的那样。例如,在所附权利要求中,任何要求保护的实施方案都可以以任何组合使用。
此外,本文将一些实施方案描述为可以由计算机系统的处理器或通过执行该功能的其他手段来实现的方法或方法的要素的组合。因此,具有执行这种方法或方法的要素的必要指令的处理器构成用于执行方法或方法的要素的手段。此外,本文描述的装置实施方案的元件是为了实施本发明,用于执行由元件行使的功能的装置的实例。
在本文提供的说明书和附图中,列出了许多具体的细节。然而,应当理解,本发明的实施方案可以在没有这些具体细节的情况下实施。在其他情况下,公知的方法、结构和技术还没有被详细地示出,以避免混淆对本说明书的理解。
现在将通过对本发明的几个实施方案的详细描述来描述本发明。显然,在不偏离本发明的真正精神或技术教导的情况下,可以根据本领域技术人员的知识来设置本发明的其他实施方案,本发明仅由所附权利要求的条款来限制。
实施例1:用于生产2’-岩藻糖基乳糖的大肠杆菌(E.coli)BL21(DE3)菌株的代谢改造
将大肠杆菌BL21(DE3)(Novagen)用作亲本菌株,用于构建用于生产2’-FL的宿主菌株。亲本菌株的遗传改造包括基因破坏和缺失事件以及异源基因的整合。
由于2’-岩藻糖基乳糖是由乳糖(其应用于细菌培养)和GDP-L-岩藻糖(其是由活细胞产生)合成的,首先通过使用错配寡核苷酸的诱变,使编码内源性β-半乳糖苷酶的lacZ基因的野生型拷贝失活(Ellis et al.,“High efficiency mutagenesis,repair,andengineering of chromosomal DNA using single-stranded oligonucleotides”,Proc.Natl.Acad.Sci.USA 98:6742-6746(2001))。使用同样的方法,破坏了阿拉伯糖-异构酶araA的基因。
在温度敏感的转录抑制子cl857的控制下,引入了lacZΩ基因片段。在菌株中大肠杆菌BL21(DE3)PgbA启动子的控制下表达了lacZα片段基因,显示为LacZ+菌株。
基因组缺失按照Datsenko和Warner的方法通过λRed介导的重组进行(“One-stepinactivation of chromosomal genes in Escherichia coli K-12 using PCRproducts”,Proc.Natl.Acad.Sci.USA 97:6640-6645(2000))。为了防止L-岩藻糖的降解,分别缺失了编码L-岩藻糖异构酶和L-墨角藻糖激酶的基因fucl和fucK。还缺失了基因wzxC-wcaJ。WcaJ可能编码UDP-葡萄糖:
十一碳二烯磷酸葡萄糖-1-磷酸转移酶,其催化荚膜异多糖酸(colanic acid)合成的第一步(Stevenson et al.,“Organization of the Escherichia coli K-12 genecluster responsible for production of the extracellular polysaccharidecolonic acid”,J.Bacteriol.178:4885-4893;(1996));产生的荚膜异多糖酸将与岩藻糖基转移酶反应竞争GDP-岩藻糖。
通过转座进行异源基因的基因组整合。大的基因簇被整合到由水手(mariner)转座酶Himar1的超活性C9突变体介导的基因组中(Lampe et al.,“Hyperactivetransposase mutants of the Himar1 mariner transposon”,Proc.Natl.Acad.Sci.USA96:11428-11433(1999)),其在Para启动子的转录控制下被插入到质粒pEcomar中。为增强GDP-岩藻糖的从头合成,编码来自大肠杆菌K12 DH5α的磷酸甘露糖变位酶(manB)、甘露糖-1-磷酸鸟苷酰转移酶(mannose-1-phosphate guanosyltransferase,manC)、GDP-甘露糖-4,6-脱水酶(gmd)和GDP-L-岩藻糖合酶(wcaG)的基因在大肠杆菌BL21(DE3)菌株中过表达;将操纵子manCB置于组成型启动子Ptet的控制下,操纵子gmd、wcaG从组成型PT5启动子转录而来。将转座子盒<Ptet-manCB-PT5-gmd,wcaG-FRT-dhfr-FRT>(SEQ ID NO:13)从pEcomar C9-manCB-gmd、wcaG-dhfr插入到大肠杆菌基因组中,所述转座子盒包含对甲氧苄氨嘧啶抗性的二氢叶酸还原酶的基因,侧翼为被水手状元件Himar1转座酶特异性识别的反向末端重复序列。
对于单个基因的染色体整合,使用EZ-Tn5TM转座酶(Epicentre,USA)。为了产生EZ-Tn5转座体,用引物一起扩增目的基因和侧翼为FRT位点的抗生素抗性盒,所述引物在两个位点上携带EZ-Tn5转座酶的19-bp嵌合端识别位点(5’-CTGTCTCTTATACACATCT,SEQ IDNO:21)。使用EZ-Tn5TM转座酶,将来自大肠杆菌K12 TG1的乳糖内向转运蛋白(importer)LacY的基因(登录号ABN72583)、来自大肠杆菌O126的2-岩藻糖基转移酶基因wbgL(登录号ADN43847)和编码来自Yersinia bercovieri ATCC 43970的主要易化子超家族的糖外排转运蛋白的基因yberc0001_9420(登录号EEQ08298)使用各自的整合盒:<Ptet-lacY-FRT-aadA-FRT>(SEQ ID NO:14)、<Ptet-wbgLco-FRT-neo-FRT>(SEQ ID NO:15)和<Ptet-yberc0001_9420co-FRT-cat-FRT>(SEQ ID NO:16)整合。基因wbgL和yberc0001_9420由GenScript公司(USA)合成,并进行密码子优化(co)。在成功整合lacY基因后,通过在质粒pCP20上编码的FLP重组酶从链霉素抗性克隆中消除抗性基因(Datsenko and Warner,“One-step inactivation of chromosomal genes in Escherichia coli K-12 usingPCR products”,Proc.Natl.Acad.Sci.USA 97:6640-6645(2000))。
由于大肠杆菌BL21(DE3)缺乏功能性gal-操纵子,因此将来自大肠杆菌K的galETKM操纵子的天然调控拷贝用整合盒<Pgal-galE-galT-galK-galM>(SEQ ID NO:17)通过EZ-转座整合到B菌株中。从含有1%半乳糖的MacConkey-agar中选择整合体,为红色菌落。所得菌株能够代谢源自乳糖水解的单糖葡萄糖和半乳糖。
通过缺失编码磷酸果糖激酶A的pfkA基因,实现了关于大肠杆菌菌株合成2’-岩藻糖基乳糖的进一步改善。当在葡萄糖异生作用底物(如甘油)上培养大肠杆菌时,PfkA对果糖-6-磷酸的磷酸化是高度消耗ATP的平板(treadmill)反应,此外,它还与ManA竞争底物。根据Datsenko和Wanner(2000),使用侧翼为lox71/66位点的庆大霉素抗性盒(aacC1),通过同源重组缺失pfkA基因(Lambert,JM et al.(2007)Cre-lox-based system for multiplegene deletions and selectable-marker removal in Lactobacillus plantarum.Appl.Environ.Microbiol 73:1126-1135)。成功缺失pfkA基因后,使用在pKD46(Datsenko和Wanner,2000)底盘(chassis)中的Para启动子控制下克隆的Cre重组酶(Abremski,K et al.(1983)Studies on the properties of P1 site-specific recombination:evidencefor topologically unlinked products following recombination.Cell 32:1301-1311)从大肠杆菌基因组中去除抗生素抗性基因。
对于不同的岩藻糖基转移酶,除了转移酶活性外,还显示了GDP-L-岩藻糖水解酶活性。此外,对于wbgL,本文用于2’-岩藻糖基乳糖合成的α-1,2-岩藻糖基转移酶显示了这种水解活性(见EP 3 050 973 A1)。为了挽救用于2’-岩藻糖基乳糖生产的游离L-岩藻糖,并消除来自发酵液的污染L-岩藻糖,将编码脆弱拟杆菌(Bacteroides fragilis)的双功能L-岩藻糖激酶/L-岩藻糖1-磷酸鸟苷基转移酶的fkp基因,在Ptet启动子的转录控制下,与侧翼为lox71/66的aacC1基因一起,使用EZ-Tn5TM转座酶<Ptet-fkp-lox-aacC1-lox>(SEQ IDNO:18)通过转座进行染色体整合。在成功整合后,从上述基因组中去除庆大霉素抗性基因。
为了提高代谢碳源甘油通过从丙糖-磷酸到果糖-6-磷酸的糖异生途径来供给GDP-L-岩藻糖生物合成的通量,将编码来自豌豆(Pisum sativum)的果糖-1,6-二磷酸醛缩酶(fbaB)和异源果糖-1,6-二磷酸磷酸酶(fbpase)的基因过表达。将大肠杆菌BL21(DE3)的fbaB基因与Ptet启动子融合。由于硫氧还蛋白的还原作用,豌豆叶绿体FBPase的活性受到二硫化物-二巯基化物交换的别构调控。半胱氨酸残基153与丝氨酸的交换产生组成型活性酶。购买编码来自豌豆的叶绿体FBPase的基因(登录号AAD10213),进行密码子优化以在大肠杆菌中表达,N端用六聚组氨酸标记进行标记,并进行修饰以编码来自Genescript的酶的C153S变体。从T7启动子转录fbpase基因。盒<Ptet-fbaB-PT7-His6-fbpase-lox-aacC1-lox>(SEQ ID NO:19)用于EZ-Tn5TM转座酶介导的宿主菌株中的整合。从大肠杆菌基因组中去除庆大霉素抗性基因后,该菌株用于2’-岩藻糖基乳糖生产。随后,该菌株被命名为“菌株A”。
实施例2:改造大肠杆菌BL21(DE3)菌株以生产高纯度的2’-岩藻糖基乳糖
用菌株A进行2’-岩藻糖基乳糖生产的分批补料培养显示,在发酵液中存在副产物(3-岩藻糖基乳糖和2’3-二岩藻糖基乳糖)。为了最大限度地减少这些副产物的产生并提高碳产量,将α-1,3-岩藻糖苷酶亚克隆到组成型启动子后面,并整合到菌株A的基因组中。因此,两岐双歧杆菌的afcB基因(登录号AB474964)与组成型Pand启动子和庆大霉素抗性基因融合。将得到的转座子盒<Pand-afcB-lox-aacC1-lox>(SEQ ID NO:20)——其侧翼为被水手状元件Himar1转座酶特异性识别的反向末端重复序列——从pEcomar afcB-aacC1插入到大肠杆菌基因组中,产生“菌株B”。
实施例3:HPLC分析检测培养上清液中的2’-岩藻糖基乳糖
用与HPLC系统(Shimadzu,Germany)连接的折射率检测器(RID-10A)(Shimadzu,Germany)和Waters XBridge Amide柱3.5μm(250×4.6mm)(Eschborn,Germany)进行HPLC分析。等比例地用30%A:50%(v/v)ACN于ddH2O中、0.1%(v/v)NH4OH和70%B:80%(v/v)ACN于ddH2O中、0.1%(v/v)NH4OH(v/v)作为洗脱剂,在35℃下,以1.4ml·min-1的流速进行洗脱。对HPLC样品进行无菌过滤(0.22μm孔径),并在离子交换基质(Strata ABW,Phenotex)上通过固相萃取清除。将10μl的样品上样于柱上,并根据标准曲线计算2’-岩藻糖基乳糖浓度。其他糖,如L-岩藻糖和/或其他单糖、乳糖和/或其他二糖、3-岩藻糖基乳糖和/或其他三糖、2’3-二岩藻糖基乳糖和/或其他四糖以及甘油,用这些分析条件也是可检测到的。通过比较色谱图中所有峰的AUC(曲线下面积),可以确定检测到的糖的相对量。将水对照中也存在的峰排除在该计算之外。
实施例4:在发酵过程中产生2’-岩藻糖基乳糖
在33℃下在3L-发酵罐中进行发酵(New Brunswick,Edison,USA),开始于含有3g/L KH2PO4、12g/L K2HPO4、5g/L(NH4)2SO4、0.3g/L柠檬酸、2g/L MgSO4×7·H2O、0.1g/L NaCl和0.015g/L CaCl2×6·H2O,补充1g/L微量元素溶液(54.4g·L-1柠檬酸铁铵、9.8g/L MnCl2×4·H2O、1.6g/L CoCl2×6·H2O、1g/L CuCl2×2·H2O、1.9g/L H3BO3、9g/L ZnSO4×7·H2O、1.1g/L Na2MoO4×2·H2O、1.5g/L Na2SeO3、1.5g/L NiSO4×6·H2O),并含有2%(v/v)甘油作为碳源、60mM乳糖和抗生素卡那霉素(25μg/mL)的1000mL矿物盐培养基。曝气维持在3L/min。通过控制搅拌速度,使溶解氧保持在20-30%的饱和度。通过加入25%氨溶液使pH维持在7.0。用2.5%(v/v)接种物开始培养,该接种物来自在含有相同的甘油但缺乏乳糖的培养基中生长的预培养物。离开分批阶段后,以溶解氧水平上升为指示,进行甘油补料(60%(v/v),补充有2g/L MgSO4×7·H2O、0.015g/L CaCl2×6·H2O和1mL/L微量元素溶液),流速为7.0-8.0mL/h,参照起始体积。在整个培养过程中进行乳糖补料(0.66M),并直观地进行调整,以实现发酵液中恒定的乳糖供应。在发酵快要结束时停止乳糖补料,并继续培养,直到乳糖完全转化为2’-岩藻糖基乳糖。当使用实施例1中描述的菌株(菌株A)时,在接种发酵罐后约94小时,在细胞培养基中达到约150g/L的2’-岩藻糖基乳糖效价(titer)。将如实施例2中描述的基因修饰的2’-岩藻糖基乳糖生产菌株(菌株B)进行同等地培养,也产生了约150g/L的2’-岩藻糖基乳糖效价。然而,副产物的量明显低于培养菌株A后的量(表2)。尽管菌株A的培养上清液中的糖含量2’-岩藻糖基乳糖仅占94.22%,但在菌株B的培养上清液中增加了5.50%,纯度为99.72%。
Figure BDA0002776628370000341
表2:培养94小时后,菌株A和菌株B的培养上清液中可检测糖的相对量的定性HPLC分析(n.d.:未检测出的)。
序列表
<110> 詹尼温生物技术有限责任公司
<120> 糖苷酶在低聚糖生产中的用途
<130> CP1200849P
<160> 20
<170> PatentIn version 3.5
<210> 1
<211> 5880
<212> DNA
<213> 两岐双岐杆菌(Bifidobacterium bifidum)
<400> 1
atgaaacata gagcgatgtc atcgcgtctg atgccactgg tggcgtcctg cgcgacggtc 60
ggcatgctgc tggccggact acctgtgtcg gccgtcgcgg tcggcacgac gagagcggca 120
gcgtccgacg cctcgtcctc caccacagca accatcaccc cctccgccga taccacgttg 180
cagacatgga cgagcgagaa gaattcctca atggcgtcca agccgtacat cggcacactg 240
caagggccct cgcaaggcgt gttcggcgag aagttcgagt ccacggatgc cgcggacacc 300
accgatctga agaccggcct gctgacgttc gacctgagcg cctacgacca tgcccccgat 360
tccgcaacgt tcgagatgac gtacctcggc taccgcggca acccgacggc caccgacacc 420
gacaccatca aggtgacccc cgtcgacacc accgtgtgca ccaataacgc cacagactgc 480
ggcgcgaatg tcgcgaccgg cgcgaccaag ccgaagttca gcatcaacga ctcctcattc 540
gtcgccgagt ccaagccgtt cgagtacggt acgacggttt acacgggcga cgccatcacc 600
gtggttcccg ccaataccaa gaaggtcacc gtagatgtga ccgaaatcgt gcgccagcag 660
ttcgccgaag gcaagaaggt catcaccctg gccgtgggcg agaccaagaa gaccgaggtt 720
cgtttcgcca gttccgaagg cacgacgtcc ctgaacggcg cgaccgcaga catggctccg 780
aagctgaccg tttccgtgtc caccaaggac gatctcaagc cctccgccga caccacgttg 840
caggcatggg ccagcgagaa gaacgagaag aagaacactg cggcctatgt cggcgcgctg 900
cagccggaag gcgattacgg cgacttcggt gagaagttca agtccaccga cgtccacgat 960
gtcacagacg ccaagatggg tctgatgacg ttcgacctgt ccgattacac cgcggcgccc 1020
gagcactcca tcctcacctt gacgtatctg ggctacgccg gtgcagacaa gaccgccacg 1080
gccaccgata aggtcaaggt ggtcgctgtt gacacgtcgc ggtgcaccgg caccgctccc 1140
tgcgacacca acaatgccac gtgggcgaac cgcccggact tcgaggtgac cgataccacg 1200
aagaccgcga cgtcccatgc gttcgcttat ggatctaaga agtattccga tggcatgacc 1260
gtcgaatcgg gcaacgccaa gaaggtcctg ctcgacgtgt ccgatgtcat caaggcagag 1320
ttcgccaagt tcagcgccgg cgccaccgag aagaagatca cgctggccct gggcgagctc 1380
aacaagtccg acatgcgttt cggcagcaag gaagtcacct cgctgaccgg cgccaccgaa 1440
gccatgcagc cgaccttgtc cgtcaccaag aagccgaagg catacacgct gagcatcgaa 1500
ggcccgacca aggtcaagta ccagaagggc gaggcgttcg acaaggccgg actcgtggtc 1560
aaggccacca gcacggctga cggcacggtc aagacgctga ccgaaggcaa cggtgaggat 1620
aactacacca tcgacaccag cgctttcgat agtgccagca tcggcgtata ccctgttacc 1680
gtgaagtaca acaaggaccc cgaaatcgcc gcttcgttca acgcctatgt catcgccagt 1740
gtcgaggacg gcggagacgg cgacaccagc aaagacgact ggctgtggta caagcagccc 1800
gcgtcgcaga ccgacgccac cgccaccgcc ggcggcaatt acggcaaccc cgacaacaac 1860
cgttggcagc agaccacctt gccgttcggc aacggcaaga tcggcggcac cgtctggggc 1920
gaggtcagcc gtgaacgcgt caccttcaac gaggagacgc tgtggaccgg cggccccgga 1980
tcctcgacca gctacaacgg cggcaacaac gagaccaagg gtcagaacgg cgccacgctg 2040
cgcgcgctca acaagcagct cgcgaacggc gccgagacgg tcaatcccgg caacctgacc 2100
ggcggcgaga acgcggccga gcagggcaac tacctgaact ggggcgacat ctacctcgac 2160
tacgggttca acgatacgac cgtcaccgaa taccgccgcg acctgaacct gagcaagggc 2220
aaggccgacg tcacgttcaa gcatgacggc gtcacctaca cgcgcgaata cttcgcgtcg 2280
aaccccgaca atgtcatggt cgcccgcctc acggccagca aagccggcaa gctgaacttc 2340
aacgtcagca tgccgaccaa cacgaactac tccaagaccg gcgaaaccac gacggtcaag 2400
ggtgacacgc tcaccgtcaa gggcgctctc ggcaacaacg gcctgctgta caactcgcag 2460
atcaaggtcg tcctcgacaa cggtgagggc acgctctccg aaggctccga cggcgcttcg 2520
ctgaaggtct ccgacgcgaa ggcggtcacg ctgtacatcg ccgccgcgac ggactacaag 2580
cagaagtatc cgtcctaccg caccggcgaa accgccgccg aggtgaacac ccgcgtcgcc 2640
aaggtcgtgc aggacgccgc caacaagggc tacaccgccg tcaagaaagc gcacatcgac 2700
gatcattccg ccatctacga ccgcgtgaag atcgatttgg gccagtccgg ccacagctcc 2760
gacggcgccg tcgccaccga cgcgctgctc aaggcgtacc agagaggctc cgcaaccacc 2820
gcgcagaagc gcgagctgga gacgctggtg tacaagtacg gccgctactt gaccatcggc 2880
tcctcccgtg agaacagcca gctgcccagc aacctgcagg gcatctggtc ggtcaccgcg 2940
ggcgacaacg cccacggcaa cacgccttgg ggctccgact tccacatgaa cgtgaacctc 3000
cagatgaact actggccgac ctattcggcc aacatgggag agctcgccga gccgctcatc 3060
gagtatgtgg agggtctggt caagcccggc cgtgtgaccg ccaaggtcta cgcgggcgcg 3120
gagacgacga accccgagac cacgccgatc ggcgagggcg agggctacat ggcccacacc 3180
gagaacaccg cctacggctg gaccgcaccc ggtcaatcgt tctcgtgggg ttggagcccg 3240
gccgccgtgc cgtggatcct gcagaacgtg tacgaggcgt acgagtactc cggcgaccct 3300
gccctgcttg atcgcgtgta cgcgctgctc aaggaggaat cgcacttcta cgtcaactac 3360
atgctgcaca aggccggctc cagctccggt gaccgcctga ctaccggcgt cgcgtactcg 3420
cccgaacagg gcccgctggg caccgacggc aacacgtacg agagctcgct cgtgtggcag 3480
atgctcaacg acgccatcga ggcggccaag gccaagggag atccggacgg tctggtcggc 3540
aataccaccg actgctcggc cgacaactgg gccaagaatg acagcggcaa cttcaccgat 3600
gcgaacgcca accgttcctg gagctgcgcc aagagcctgc tcaagccgat cgaggtcggc 3660
gactccggcc agatcaagga atggtacttc gaaggtgcgc tcggcaagaa gaaggatgga 3720
tccaccatca gcggctacca ggcggacaac cagcaccgtc acatgtccca cctgctcgga 3780
ctgttccccg gtgatttgat caccatcgac aactccgagt acatggatgc ggccaagacc 3840
tcgctgaggt accgctgctt caagggcaac gtgctgcagt ccaacaccgg ctgggccatt 3900
ggccagcgca tcaattcgtg ggctcgcacc ggcgacggca acaccacgta ccagctggtc 3960
gagctgcagc tcaagaacgc gatgtatgca aacctgttcg attaccatgc gccgttccag 4020
atcgacggca acttcggcaa cacctccggt gtcgacgaaa tgctgctgca gtccaactcc 4080
accttcaccg acaccgccgg caagaagtac gtgaactaca cgaacatcct gcccgccctg 4140
cccgatgcct gggcgggcgg ctcggtgagc ggcctcgtgg cccgcggcaa cttcaccgtc 4200
ggcacgacat ggaagaacgg caaggccacc gaagtcaggc tgacctccaa caagggcaag 4260
caggcggccg tcaagatcac cgccggcggc gcccagaact acgaggtcaa gaacggtgac 4320
accgccgtga acgccaaggt cgtgaccaac gcggacggcg cctcgctgct cgtgttcgat 4380
accaccgcag gcaccacgta cacgatcacg aagaaggcga gcgccaacgt gcccgtcacc 4440
ggcgtgaccg tgaccggcgc caacaccgcc accgcaggcg acaccgtcac tcttacggct 4500
accgtcgccc cggccaatgc gaccgacaag tccgtcacct ggtcgacctc cgacgccgcc 4560
gtagctacgg tcaacgccaa cggcgtggtg accacgaaga aggccggcaa ggtgaccatc 4620
accgccacgt cgaacggcga caagacgaag ttcggttcca tcgagatcac cgtctccgcc 4680
gcgaccgtgc ccgtcaccag cgtcaccgtt gccggcgacg ccgcgatgac cgtcgatgga 4740
gagcagaccc tgacggcgac cgtcgccccg gccactgcga ccgacaagac ggtcacgtgg 4800
aagtcctccg acgccactgt ggcgacggtt gacgccaacg gcaaggtcgt cgcgaagaag 4860
gccggcgaag tgacgatcac cgccacggcc ggtggcgtgt ccggcacgct gaagatcacg 4920
gtgagcgaca aggccccgac cgtcatcccg gtccagtccg tgaccgtgac aggcaagcag 4980
gagctcgtcg aaggcgcctc cacgaccctg acggcgaccg tcgccccggc tgacgcgacc 5040
gacaagacgg ttacgtggaa gtcgagcgac gagtccgtcg ccacggtcga caaggacggc 5100
gtcgtgaccg ccaagaaggc cggcacggtg accatcaccg ccacggccgg tggcgtgtcc 5160
ggcacgctcc acatcaccgt gacggccaag cccgtcgaga ccgtccccgt caccagcgtg 5220
gaggtcaccg tcgaggccgg caccaccgtc tccgtcggca agacactcca ggccaccgcg 5280
accgtcaagc ccggcaacgc caccaacaag aaggtgacgt ggaagtcgag cgacgaatcc 5340
atcgcgacgg tcgacgccaa cggcgtcatc accgcgaaga aggccggcaa ggtcgtcatc 5400
acggccacct cgaccgacgg cacggacaag tccggcagcg tcgagatcac cgtcgtggat 5460
gagaccaagc cgacgcccga ccacaagtcc gtcaaggccg ataccggcga cgtgaccgcc 5520
ggcaagaccg gtacggtcac cgagccgaag gacgtggcgg gctggaagag ccgctccatc 5580
atcaagcaag gcaagctcgg caaggccgaa atcgccgacg gcacgctcgt gtatgcggcc 5640
ggcgacaaga ccggtgacga cagcttcgtc gtgcagtaca cgatggccga cggcacggtc 5700
atcgacgtga cctacagcgt cacggtcaag gccgccgaaa ccggcaagaa cgacggcgac 5760
ggcaagggcg acggtgtcgc gaagaccggc gccgccgtcg gcgcgctcgc cggcctcggc 5820
ttgatgctgc tcgccgtcgg agtgagcgtg gtgatgattc gccgcaagca ctccgcctga 5880
<210> 2
<211> 1959
<212> PRT
<213> 两岐双岐杆菌
<400> 2
Met Lys His Arg Ala Met Ser Ser Arg Leu Met Pro Leu Val Ala Ser
1 5 10 15
Cys Ala Thr Val Gly Met Leu Leu Ala Gly Leu Pro Val Ser Ala Val
20 25 30
Ala Val Gly Thr Thr Arg Ala Ala Ala Ser Asp Ala Ser Ser Ser Thr
35 40 45
Thr Ala Thr Ile Thr Pro Ser Ala Asp Thr Thr Leu Gln Thr Trp Thr
50 55 60
Ser Glu Lys Asn Ser Ser Met Ala Ser Lys Pro Tyr Ile Gly Thr Leu
65 70 75 80
Gln Gly Pro Ser Gln Gly Val Phe Gly Glu Lys Phe Glu Ser Thr Asp
85 90 95
Ala Ala Asp Thr Thr Asp Leu Lys Thr Gly Leu Leu Thr Phe Asp Leu
100 105 110
Ser Ala Tyr Asp His Ala Pro Asp Ser Ala Thr Phe Glu Met Thr Tyr
115 120 125
Leu Gly Tyr Arg Gly Asn Pro Thr Ala Thr Asp Thr Asp Thr Ile Lys
130 135 140
Val Thr Pro Val Asp Thr Thr Val Cys Thr Asn Asn Ala Thr Asp Cys
145 150 155 160
Gly Ala Asn Val Ala Thr Gly Ala Thr Lys Pro Lys Phe Ser Ile Asn
165 170 175
Asp Ser Ser Phe Val Ala Glu Ser Lys Pro Phe Glu Tyr Gly Thr Thr
180 185 190
Val Tyr Thr Gly Asp Ala Ile Thr Val Val Pro Ala Asn Thr Lys Lys
195 200 205
Val Thr Val Asp Val Thr Glu Ile Val Arg Gln Gln Phe Ala Glu Gly
210 215 220
Lys Lys Val Ile Thr Leu Ala Val Gly Glu Thr Lys Lys Thr Glu Val
225 230 235 240
Arg Phe Ala Ser Ser Glu Gly Thr Thr Ser Leu Asn Gly Ala Thr Ala
245 250 255
Asp Met Ala Pro Lys Leu Thr Val Ser Val Ser Thr Lys Asp Asp Leu
260 265 270
Lys Pro Ser Ala Asp Thr Thr Leu Gln Ala Trp Ala Ser Glu Lys Asn
275 280 285
Glu Lys Lys Asn Thr Ala Ala Tyr Val Gly Ala Leu Gln Pro Glu Gly
290 295 300
Asp Tyr Gly Asp Phe Gly Glu Lys Phe Lys Ser Thr Asp Val His Asp
305 310 315 320
Val Thr Asp Ala Lys Met Gly Leu Met Thr Phe Asp Leu Ser Asp Tyr
325 330 335
Thr Ala Ala Pro Glu His Ser Ile Leu Thr Leu Thr Tyr Leu Gly Tyr
340 345 350
Ala Gly Ala Asp Lys Thr Ala Thr Ala Thr Asp Lys Val Lys Val Val
355 360 365
Ala Val Asp Thr Ser Arg Cys Thr Gly Thr Ala Pro Cys Asp Thr Asn
370 375 380
Asn Ala Thr Trp Ala Asn Arg Pro Asp Phe Glu Val Thr Asp Thr Thr
385 390 395 400
Lys Thr Ala Thr Ser His Ala Phe Ala Tyr Gly Ser Lys Lys Tyr Ser
405 410 415
Asp Gly Met Thr Val Glu Ser Gly Asn Ala Lys Lys Val Leu Leu Asp
420 425 430
Val Ser Asp Val Ile Lys Ala Glu Phe Ala Lys Phe Ser Ala Gly Ala
435 440 445
Thr Glu Lys Lys Ile Thr Leu Ala Leu Gly Glu Leu Asn Lys Ser Asp
450 455 460
Met Arg Phe Gly Ser Lys Glu Val Thr Ser Leu Thr Gly Ala Thr Glu
465 470 475 480
Ala Met Gln Pro Thr Leu Ser Val Thr Lys Lys Pro Lys Ala Tyr Thr
485 490 495
Leu Ser Ile Glu Gly Pro Thr Lys Val Lys Tyr Gln Lys Gly Glu Ala
500 505 510
Phe Asp Lys Ala Gly Leu Val Val Lys Ala Thr Ser Thr Ala Asp Gly
515 520 525
Thr Val Lys Thr Leu Thr Glu Gly Asn Gly Glu Asp Asn Tyr Thr Ile
530 535 540
Asp Thr Ser Ala Phe Asp Ser Ala Ser Ile Gly Val Tyr Pro Val Thr
545 550 555 560
Val Lys Tyr Asn Lys Asp Pro Glu Ile Ala Ala Ser Phe Asn Ala Tyr
565 570 575
Val Ile Ala Ser Val Glu Asp Gly Gly Asp Gly Asp Thr Ser Lys Asp
580 585 590
Asp Trp Leu Trp Tyr Lys Gln Pro Ala Ser Gln Thr Asp Ala Thr Ala
595 600 605
Thr Ala Gly Gly Asn Tyr Gly Asn Pro Asp Asn Asn Arg Trp Gln Gln
610 615 620
Thr Thr Leu Pro Phe Gly Asn Gly Lys Ile Gly Gly Thr Val Trp Gly
625 630 635 640
Glu Val Ser Arg Glu Arg Val Thr Phe Asn Glu Glu Thr Leu Trp Thr
645 650 655
Gly Gly Pro Gly Ser Ser Thr Ser Tyr Asn Gly Gly Asn Asn Glu Thr
660 665 670
Lys Gly Gln Asn Gly Ala Thr Leu Arg Ala Leu Asn Lys Gln Leu Ala
675 680 685
Asn Gly Ala Glu Thr Val Asn Pro Gly Asn Leu Thr Gly Gly Glu Asn
690 695 700
Ala Ala Glu Gln Gly Asn Tyr Leu Asn Trp Gly Asp Ile Tyr Leu Asp
705 710 715 720
Tyr Gly Phe Asn Asp Thr Thr Val Thr Glu Tyr Arg Arg Asp Leu Asn
725 730 735
Leu Ser Lys Gly Lys Ala Asp Val Thr Phe Lys His Asp Gly Val Thr
740 745 750
Tyr Thr Arg Glu Tyr Phe Ala Ser Asn Pro Asp Asn Val Met Val Ala
755 760 765
Arg Leu Thr Ala Ser Lys Ala Gly Lys Leu Asn Phe Asn Val Ser Met
770 775 780
Pro Thr Asn Thr Asn Tyr Ser Lys Thr Gly Glu Thr Thr Thr Val Lys
785 790 795 800
Gly Asp Thr Leu Thr Val Lys Gly Ala Leu Gly Asn Asn Gly Leu Leu
805 810 815
Tyr Asn Ser Gln Ile Lys Val Val Leu Asp Asn Gly Glu Gly Thr Leu
820 825 830
Ser Glu Gly Ser Asp Gly Ala Ser Leu Lys Val Ser Asp Ala Lys Ala
835 840 845
Val Thr Leu Tyr Ile Ala Ala Ala Thr Asp Tyr Lys Gln Lys Tyr Pro
850 855 860
Ser Tyr Arg Thr Gly Glu Thr Ala Ala Glu Val Asn Thr Arg Val Ala
865 870 875 880
Lys Val Val Gln Asp Ala Ala Asn Lys Gly Tyr Thr Ala Val Lys Lys
885 890 895
Ala His Ile Asp Asp His Ser Ala Ile Tyr Asp Arg Val Lys Ile Asp
900 905 910
Leu Gly Gln Ser Gly His Ser Ser Asp Gly Ala Val Ala Thr Asp Ala
915 920 925
Leu Leu Lys Ala Tyr Gln Arg Gly Ser Ala Thr Thr Ala Gln Lys Arg
930 935 940
Glu Leu Glu Thr Leu Val Tyr Lys Tyr Gly Arg Tyr Leu Thr Ile Gly
945 950 955 960
Ser Ser Arg Glu Asn Ser Gln Leu Pro Ser Asn Leu Gln Gly Ile Trp
965 970 975
Ser Val Thr Ala Gly Asp Asn Ala His Gly Asn Thr Pro Trp Gly Ser
980 985 990
Asp Phe His Met Asn Val Asn Leu Gln Met Asn Tyr Trp Pro Thr Tyr
995 1000 1005
Ser Ala Asn Met Gly Glu Leu Ala Glu Pro Leu Ile Glu Tyr Val
1010 1015 1020
Glu Gly Leu Val Lys Pro Gly Arg Val Thr Ala Lys Val Tyr Ala
1025 1030 1035
Gly Ala Glu Thr Thr Asn Pro Glu Thr Thr Pro Ile Gly Glu Gly
1040 1045 1050
Glu Gly Tyr Met Ala His Thr Glu Asn Thr Ala Tyr Gly Trp Thr
1055 1060 1065
Ala Pro Gly Gln Ser Phe Ser Trp Gly Trp Ser Pro Ala Ala Val
1070 1075 1080
Pro Trp Ile Leu Gln Asn Val Tyr Glu Ala Tyr Glu Tyr Ser Gly
1085 1090 1095
Asp Pro Ala Leu Leu Asp Arg Val Tyr Ala Leu Leu Lys Glu Glu
1100 1105 1110
Ser His Phe Tyr Val Asn Tyr Met Leu His Lys Ala Gly Ser Ser
1115 1120 1125
Ser Gly Asp Arg Leu Thr Thr Gly Val Ala Tyr Ser Pro Glu Gln
1130 1135 1140
Gly Pro Leu Gly Thr Asp Gly Asn Thr Tyr Glu Ser Ser Leu Val
1145 1150 1155
Trp Gln Met Leu Asn Asp Ala Ile Glu Ala Ala Lys Ala Lys Gly
1160 1165 1170
Asp Pro Asp Gly Leu Val Gly Asn Thr Thr Asp Cys Ser Ala Asp
1175 1180 1185
Asn Trp Ala Lys Asn Asp Ser Gly Asn Phe Thr Asp Ala Asn Ala
1190 1195 1200
Asn Arg Ser Trp Ser Cys Ala Lys Ser Leu Leu Lys Pro Ile Glu
1205 1210 1215
Val Gly Asp Ser Gly Gln Ile Lys Glu Trp Tyr Phe Glu Gly Ala
1220 1225 1230
Leu Gly Lys Lys Lys Asp Gly Ser Thr Ile Ser Gly Tyr Gln Ala
1235 1240 1245
Asp Asn Gln His Arg His Met Ser His Leu Leu Gly Leu Phe Pro
1250 1255 1260
Gly Asp Leu Ile Thr Ile Asp Asn Ser Glu Tyr Met Asp Ala Ala
1265 1270 1275
Lys Thr Ser Leu Arg Tyr Arg Cys Phe Lys Gly Asn Val Leu Gln
1280 1285 1290
Ser Asn Thr Gly Trp Ala Ile Gly Gln Arg Ile Asn Ser Trp Ala
1295 1300 1305
Arg Thr Gly Asp Gly Asn Thr Thr Tyr Gln Leu Val Glu Leu Gln
1310 1315 1320
Leu Lys Asn Ala Met Tyr Ala Asn Leu Phe Asp Tyr His Ala Pro
1325 1330 1335
Phe Gln Ile Asp Gly Asn Phe Gly Asn Thr Ser Gly Val Asp Glu
1340 1345 1350
Met Leu Leu Gln Ser Asn Ser Thr Phe Thr Asp Thr Ala Gly Lys
1355 1360 1365
Lys Tyr Val Asn Tyr Thr Asn Ile Leu Pro Ala Leu Pro Asp Ala
1370 1375 1380
Trp Ala Gly Gly Ser Val Ser Gly Leu Val Ala Arg Gly Asn Phe
1385 1390 1395
Thr Val Gly Thr Thr Trp Lys Asn Gly Lys Ala Thr Glu Val Arg
1400 1405 1410
Leu Thr Ser Asn Lys Gly Lys Gln Ala Ala Val Lys Ile Thr Ala
1415 1420 1425
Gly Gly Ala Gln Asn Tyr Glu Val Lys Asn Gly Asp Thr Ala Val
1430 1435 1440
Asn Ala Lys Val Val Thr Asn Ala Asp Gly Ala Ser Leu Leu Val
1445 1450 1455
Phe Asp Thr Thr Ala Gly Thr Thr Tyr Thr Ile Thr Lys Lys Ala
1460 1465 1470
Ser Ala Asn Val Pro Val Thr Gly Val Thr Val Thr Gly Ala Asn
1475 1480 1485
Thr Ala Thr Ala Gly Asp Thr Val Thr Leu Thr Ala Thr Val Ala
1490 1495 1500
Pro Ala Asn Ala Thr Asp Lys Ser Val Thr Trp Ser Thr Ser Asp
1505 1510 1515
Ala Ala Val Ala Thr Val Asn Ala Asn Gly Val Val Thr Thr Lys
1520 1525 1530
Lys Ala Gly Lys Val Thr Ile Thr Ala Thr Ser Asn Gly Asp Lys
1535 1540 1545
Thr Lys Phe Gly Ser Ile Glu Ile Thr Val Ser Ala Ala Thr Val
1550 1555 1560
Pro Val Thr Ser Val Thr Val Ala Gly Asp Ala Ala Met Thr Val
1565 1570 1575
Asp Gly Glu Gln Thr Leu Thr Ala Thr Val Ala Pro Ala Thr Ala
1580 1585 1590
Thr Asp Lys Thr Val Thr Trp Lys Ser Ser Asp Ala Thr Val Ala
1595 1600 1605
Thr Val Asp Ala Asn Gly Lys Val Val Ala Lys Lys Ala Gly Glu
1610 1615 1620
Val Thr Ile Thr Ala Thr Ala Gly Gly Val Ser Gly Thr Leu Lys
1625 1630 1635
Ile Thr Val Ser Asp Lys Ala Pro Thr Val Ile Pro Val Gln Ser
1640 1645 1650
Val Thr Val Thr Gly Lys Gln Glu Leu Val Glu Gly Ala Ser Thr
1655 1660 1665
Thr Leu Thr Ala Thr Val Ala Pro Ala Asp Ala Thr Asp Lys Thr
1670 1675 1680
Val Thr Trp Lys Ser Ser Asp Glu Ser Val Ala Thr Val Asp Lys
1685 1690 1695
Asp Gly Val Val Thr Ala Lys Lys Ala Gly Thr Val Thr Ile Thr
1700 1705 1710
Ala Thr Ala Gly Gly Val Ser Gly Thr Leu His Ile Thr Val Thr
1715 1720 1725
Ala Lys Pro Val Glu Thr Val Pro Val Thr Ser Val Glu Val Thr
1730 1735 1740
Val Glu Ala Gly Thr Thr Val Ser Val Gly Lys Thr Leu Gln Ala
1745 1750 1755
Thr Ala Thr Val Lys Pro Gly Asn Ala Thr Asn Lys Lys Val Thr
1760 1765 1770
Trp Lys Ser Ser Asp Glu Ser Ile Ala Thr Val Asp Ala Asn Gly
1775 1780 1785
Val Ile Thr Ala Lys Lys Ala Gly Lys Val Val Ile Thr Ala Thr
1790 1795 1800
Ser Thr Asp Gly Thr Asp Lys Ser Gly Ser Val Glu Ile Thr Val
1805 1810 1815
Val Asp Glu Thr Lys Pro Thr Pro Asp His Lys Ser Val Lys Ala
1820 1825 1830
Asp Thr Gly Asp Val Thr Ala Gly Lys Thr Gly Thr Val Thr Glu
1835 1840 1845
Pro Lys Asp Val Ala Gly Trp Lys Ser Arg Ser Ile Ile Lys Gln
1850 1855 1860
Gly Lys Leu Gly Lys Ala Glu Ile Ala Asp Gly Thr Leu Val Tyr
1865 1870 1875
Ala Ala Gly Asp Lys Thr Gly Asp Asp Ser Phe Val Val Gln Tyr
1880 1885 1890
Thr Met Ala Asp Gly Thr Val Ile Asp Val Thr Tyr Ser Val Thr
1895 1900 1905
Val Lys Ala Ala Glu Thr Gly Lys Asn Asp Gly Asp Gly Lys Gly
1910 1915 1920
Asp Gly Val Ala Lys Thr Gly Ala Ala Val Gly Ala Leu Ala Gly
1925 1930 1935
Leu Gly Leu Met Leu Leu Ala Val Gly Val Ser Val Val Met Ile
1940 1945 1950
Arg Arg Lys His Ser Ala
1955
<210> 3
<211> 4482
<212> DNA
<213> 两岐双岐杆菌
<400> 3
atgctacaca cagcatcaag aggatgctcg cgttcgtggc tgcgcagact caccgcattg 60
atagcggtct cggcgctcgc gttcgtggca ttgccgaacg tcgcggtggc ggcggatccg 120
atggaatacc tcgatgtgtc gttcggcggc acgttcgctg cagacaccta caccacaggt 180
ggcgacgagg tggcgaaggg ccccgtgacc aagcacggca gcataccgac caagcttgac 240
ggcggcggca tcaccctcgc tggcggcacc aacggcgtga cattcacctc gaccgcgagc 300
ttcagcgaga gtgggaaggt gaacaaggga ttccgcgccg aaatggagta ccgtacgacg 360
cagacgccca gcaacctcgc cacattgttc tccgccatgg gcaacatctt cgtgcgggcg 420
aacggcagca acctcgaata cggcttctcc acgaaccctt ccggcagtac atggaacgac 480
tacacaaagt ccgtgacgct gccttccaac aatgtgaagc acatcatcca gctgacatat 540
ctgccgggag ccgacggcgc tgcctcgacg ttgcagttgt cggtggatgg cgtggccggc 600
gagaccgcca cctccgcggc cggcgagctc gcggccgtca gcgattccgt cgggaacaag 660
ttcgggatcg gctacgaggt gaaccccgct tccggcgcgg cgagccgcgg tcttgccggt 720
gacgtgttcc gcgcgcgtgt cgccgattcg gacgccccgt gggagattct tgacgcatcc 780
cagctgctgc atgtcaattt caacggcacg ttcagcggca cctcatatac cgcggcgagc 840
ggcgagcaga tgctgggctc gctggtgtcg cgctcggcca atccgtccat ctcgaactcc 900
gccgtcacgc tgggcggcgg cacggccgga ttcgatttca cgcccacgga cttcaccctc 960
ggtgacaacg aggccatcac ccgcccgctg gtcgcggagc tgcgcttcac cccgacgcag 1020
accggcgaca accagaccct gttcggcgcg ggcggcaacc tgttcctgcg ctacgagtcg 1080
aacaagctcg tgttcggcgc ctccaccaag tccggcgata attggaccga ccacaagatc 1140
gagtccgcgg ccgccacggg tgcggagcac gtcgtgtcgg tggcgtacgt gcccaataag 1200
gccggcaccg gcgcgaagct tgtcatgcgc gtggatggcg gcgacgccca gaccaaggac 1260
atcactggtc tggcttacct gaattcgagc atcaagggca aggtcggctt cggcaacgac 1320
gtgcataccg acgcgctcag ccgcggcttc gtcggctcgc tgagcgagat ccgcctggcc 1380
gaaacctccg cgaacttcac caccaacgaa ttcaagctgg tctactctca ggtcagctgc 1440
gacacgtcgg gcatcaagga ggcgaatacc ttcgacgtgg agcccgccga gtgcgaggcc 1500
gcgcttaaga ccaagctgtc caagctgcgt ccgaccgaag ggcaggccga ctacatcgac 1560
tggggtcaga tcggattcct ccattacggc atcaacacgt actacaacca ggagtggggt 1620
cacggtaacg aggatccctc ccgcatcaac ccgaccggcc tcgacaccga ccagtgggcg 1680
aagtccttcg ccgacggtgg cttcaagatg atcatggtga cggtcaagca ccatgacggt 1740
ttcgagctgt acgactcgcg gtacaacacc gagcacgact gggcaaacac cgccgtcgcc 1800
aagcgcacgg gggagaagga cctgttccgc aagattgtcg cctcggcgaa gaaatacggc 1860
ctgaaggtcg gcatctacta ttcgccggcc gattcctaca tggagaggaa gggcgtctgg 1920
ggcaacaact ccgcacgcgt cgagcgcacg atccccacgc tggtggagaa cgacgaccgc 1980
gccggcaagg tggcttccgg caaactgccc acgttcaagt acaaggccac ggattacggc 2040
gcctacatgc tcaaccagct ctatgagctg ctgactgagt acggcgacat ctccgaggtc 2100
tggttcgacg gtgcccaagg caacaccgca ggcactgagc attacgacta tggcgtgttc 2160
tacgagatga tccgccggct tcagccccag gcaattcagg ccaacgccgc atacgatgcc 2220
cgatgggtgg gcaacgagga cggctgggcc cgtcagaccg agtggagccc gcaggcggca 2280
tacaacgacg gcgtggacaa ggtgtcgctc aagcctggcc agatggcccc cgacggtaag 2340
cttggcagca tgtcgagcgt gctgtccgag atccgcagcg gcgccgccaa ccagctgcac 2400
tggtatccgg ccgaagtcga cgccaagaac cggcccggat ggttctaccg tgccagccaa 2460
tcgccggcgt ccgtagccga agtcgtgaag tactacgagc agtccacggg acgcaactcg 2520
cagtatctgc tgaacgtccc accgtccgat accggcaagc tcgccgatgc ggatgccgcg 2580
ggacttaagg ggctgggcga ggagctcgcc cgacgctacg gcaccgatct tgccctgggc 2640
aagagcgcga ccgtcgccgc gtccgcgaac gacactgcgg tagcggcccc gaagctgacc 2700
gacggttcga agctctcctc cgacaaggcc gtgggcaata cgccgacgta caccatcgat 2760
ctgggcagca ctgtcgccgt ggatgcagtg aagatctccg aggacgtgcg caatgccggc 2820
cagcagatcg aaagcgccac tctgcaggga cgagtcaatg gaacatggac gaatctggcg 2880
actatgacga cggtcgggca gcagcgcgac cttcgcttca cgtcccagaa catcgatgcc 2940
atccgtctgg tggtcaactc ctcccgcggt ccggtgcgtc tgagccgtct tgaggtgttc 3000
cacaccgaat ccgagattca gaccggcgcc cgcgcctact acatcgatcc gacggcgcag 3060
accgcgggag atggattcac gaaggacaag cccatgacgt cgatcgagca gctgcacgat 3120
gtgaccgtcg cgccaggctc cgtgatcttc gtcaaggcgg gcaccgagct gaccggggac 3180
ttcgccgtct tcggctacgg caccaaggac gagcccatca ccgtgacgac atacggcgaa 3240
agcgacaaag ccaccaccgc gagcttcgac ggcatgaccg ccgggctgac gctgaagcag 3300
gcgctgaagg cgctcggcaa ggacgacgcc ggctgggtcg tggccgattc cgccactgca 3360
ccggcctccc gcgtgtatgt cccgcaggat gagatcagcg tgcacgccca gtcgtcgcag 3420
aactccggcg cagaggcggc gagggcgctc gacggcgact cgtcgacgag ctggcactcc 3480
cagtacagcc cgaccaccgc gtctgctccg cattgggtga ctctcgatct cggcaaatcg 3540
cgtgagaacg tcgcctactt cgactacctc gcccgtatcg acggcaacaa taacggtgcc 3600
gccaaggatt acgaggtgta tgtctccgac gatcccaacg attttggagc ccctgtggcc 3660
tcgggcacgt tgaagaacgt cgcctacacg cagcgcatca agctgacccc caagaacgga 3720
cggtacgtca agttcgtcat caagaccgat tattccggat cgaacttcgg ctccgcggcg 3780
gaaatgaatg tcgagttgct gcccacggcc gtagaggagg acaaggtcgc caccccgcag 3840
aagccgacag tggacgatga tgccgataca tacaccatcc ccgacatcga gggagtcgtg 3900
tacaaggtcg acggcaaggt gttggccgct ggttccgtag tgaacgtggg cgatgaggac 3960
gtgaccgtca cggtcaccgc cgagcccgcc gacggatacc gcttcccgga tggtgtgacg 4020
tccccagtca cgtatgagct gacgttcacc aagaagggtg gcgagaagcc tccgaccgaa 4080
gtcaacaagg acaagctgca cgccacgatc accaaggctc aggcgatcga ccgttccgcc 4140
tatacggacg agtcgctcaa ggtgcttgat gacaagctcg ccgcagcgct caaggtctat 4200
gacgatgaca aggtgagcca ggatgatgtc gatgccgccg aggcggctct gtctgcggcg 4260
atcgacgcgc tgaagaccaa gccgacgacc cccggcggtg aaggtgagaa gcctggtgaa 4320
ggtgaaaagc ccggtgacgg caacaagccc ggtgacggca agaagcccgg cgacgtgatc 4380
gcaaagaccg gcgcctccac aatgggcgtt gtcttcgctg cactcgcgat ggtagcgggt 4440
gcggtcgtga cgcttgaagc caagcgtaag tccaaccggt aa 4482
<210> 4
<211> 1493
<212> PRT
<213> 两岐双岐杆菌
<400> 4
Met Leu His Thr Ala Ser Arg Gly Cys Ser Arg Ser Trp Leu Arg Arg
1 5 10 15
Leu Thr Ala Leu Ile Ala Val Ser Ala Leu Ala Phe Val Ala Leu Pro
20 25 30
Asn Val Ala Val Ala Ala Asp Pro Met Glu Tyr Leu Asp Val Ser Phe
35 40 45
Gly Gly Thr Phe Ala Ala Asp Thr Tyr Thr Thr Gly Gly Asp Glu Val
50 55 60
Ala Lys Gly Pro Val Thr Lys His Gly Ser Ile Pro Thr Lys Leu Asp
65 70 75 80
Gly Gly Gly Ile Thr Leu Ala Gly Gly Thr Asn Gly Val Thr Phe Thr
85 90 95
Ser Thr Ala Ser Phe Ser Glu Ser Gly Lys Val Asn Lys Gly Phe Arg
100 105 110
Ala Glu Met Glu Tyr Arg Thr Thr Gln Thr Pro Ser Asn Leu Ala Thr
115 120 125
Leu Phe Ser Ala Met Gly Asn Ile Phe Val Arg Ala Asn Gly Ser Asn
130 135 140
Leu Glu Tyr Gly Phe Ser Thr Asn Pro Ser Gly Ser Thr Trp Asn Asp
145 150 155 160
Tyr Thr Lys Ser Val Thr Leu Pro Ser Asn Asn Val Lys His Ile Ile
165 170 175
Gln Leu Thr Tyr Leu Pro Gly Ala Asp Gly Ala Ala Ser Thr Leu Gln
180 185 190
Leu Ser Val Asp Gly Val Ala Gly Glu Thr Ala Thr Ser Ala Ala Gly
195 200 205
Glu Leu Ala Ala Val Ser Asp Ser Val Gly Asn Lys Phe Gly Ile Gly
210 215 220
Tyr Glu Val Asn Pro Ala Ser Gly Ala Ala Ser Arg Gly Leu Ala Gly
225 230 235 240
Asp Val Phe Arg Ala Arg Val Ala Asp Ser Asp Ala Pro Trp Glu Ile
245 250 255
Leu Asp Ala Ser Gln Leu Leu His Val Asn Phe Asn Gly Thr Phe Ser
260 265 270
Gly Thr Ser Tyr Thr Ala Ala Ser Gly Glu Gln Met Leu Gly Ser Leu
275 280 285
Val Ser Arg Ser Ala Asn Pro Ser Ile Ser Asn Ser Ala Val Thr Leu
290 295 300
Gly Gly Gly Thr Ala Gly Phe Asp Phe Thr Pro Thr Asp Phe Thr Leu
305 310 315 320
Gly Asp Asn Glu Ala Ile Thr Arg Pro Leu Val Ala Glu Leu Arg Phe
325 330 335
Thr Pro Thr Gln Thr Gly Asp Asn Gln Thr Leu Phe Gly Ala Gly Gly
340 345 350
Asn Leu Phe Leu Arg Tyr Glu Ser Asn Lys Leu Val Phe Gly Ala Ser
355 360 365
Thr Lys Ser Gly Asp Asn Trp Thr Asp His Lys Ile Glu Ser Ala Ala
370 375 380
Ala Thr Gly Ala Glu His Val Val Ser Val Ala Tyr Val Pro Asn Lys
385 390 395 400
Ala Gly Thr Gly Ala Lys Leu Val Met Arg Val Asp Gly Gly Asp Ala
405 410 415
Gln Thr Lys Asp Ile Thr Gly Leu Ala Tyr Leu Asn Ser Ser Ile Lys
420 425 430
Gly Lys Val Gly Phe Gly Asn Asp Val His Thr Asp Ala Leu Ser Arg
435 440 445
Gly Phe Val Gly Ser Leu Ser Glu Ile Arg Leu Ala Glu Thr Ser Ala
450 455 460
Asn Phe Thr Thr Asn Glu Phe Lys Leu Val Tyr Ser Gln Val Ser Cys
465 470 475 480
Asp Thr Ser Gly Ile Lys Glu Ala Asn Thr Phe Asp Val Glu Pro Ala
485 490 495
Glu Cys Glu Ala Ala Leu Lys Thr Lys Leu Ser Lys Leu Arg Pro Thr
500 505 510
Glu Gly Gln Ala Asp Tyr Ile Asp Trp Gly Gln Ile Gly Phe Leu His
515 520 525
Tyr Gly Ile Asn Thr Tyr Tyr Asn Gln Glu Trp Gly His Gly Asn Glu
530 535 540
Asp Pro Ser Arg Ile Asn Pro Thr Gly Leu Asp Thr Asp Gln Trp Ala
545 550 555 560
Lys Ser Phe Ala Asp Gly Gly Phe Lys Met Ile Met Val Thr Val Lys
565 570 575
His His Asp Gly Phe Glu Leu Tyr Asp Ser Arg Tyr Asn Thr Glu His
580 585 590
Asp Trp Ala Asn Thr Ala Val Ala Lys Arg Thr Gly Glu Lys Asp Leu
595 600 605
Phe Arg Lys Ile Val Ala Ser Ala Lys Lys Tyr Gly Leu Lys Val Gly
610 615 620
Ile Tyr Tyr Ser Pro Ala Asp Ser Tyr Met Glu Arg Lys Gly Val Trp
625 630 635 640
Gly Asn Asn Ser Ala Arg Val Glu Arg Thr Ile Pro Thr Leu Val Glu
645 650 655
Asn Asp Asp Arg Ala Gly Lys Val Ala Ser Gly Lys Leu Pro Thr Phe
660 665 670
Lys Tyr Lys Ala Thr Asp Tyr Gly Ala Tyr Met Leu Asn Gln Leu Tyr
675 680 685
Glu Leu Leu Thr Glu Tyr Gly Asp Ile Ser Glu Val Trp Phe Asp Gly
690 695 700
Ala Gln Gly Asn Thr Ala Gly Thr Glu His Tyr Asp Tyr Gly Val Phe
705 710 715 720
Tyr Glu Met Ile Arg Arg Leu Gln Pro Gln Ala Ile Gln Ala Asn Ala
725 730 735
Ala Tyr Asp Ala Arg Trp Val Gly Asn Glu Asp Gly Trp Ala Arg Gln
740 745 750
Thr Glu Trp Ser Pro Gln Ala Ala Tyr Asn Asp Gly Val Asp Lys Val
755 760 765
Ser Leu Lys Pro Gly Gln Met Ala Pro Asp Gly Lys Leu Gly Ser Met
770 775 780
Ser Ser Val Leu Ser Glu Ile Arg Ser Gly Ala Ala Asn Gln Leu His
785 790 795 800
Trp Tyr Pro Ala Glu Val Asp Ala Lys Asn Arg Pro Gly Trp Phe Tyr
805 810 815
Arg Ala Ser Gln Ser Pro Ala Ser Val Ala Glu Val Val Lys Tyr Tyr
820 825 830
Glu Gln Ser Thr Gly Arg Asn Ser Gln Tyr Leu Leu Asn Val Pro Pro
835 840 845
Ser Asp Thr Gly Lys Leu Ala Asp Ala Asp Ala Ala Gly Leu Lys Gly
850 855 860
Leu Gly Glu Glu Leu Ala Arg Arg Tyr Gly Thr Asp Leu Ala Leu Gly
865 870 875 880
Lys Ser Ala Thr Val Ala Ala Ser Ala Asn Asp Thr Ala Val Ala Ala
885 890 895
Pro Lys Leu Thr Asp Gly Ser Lys Leu Ser Ser Asp Lys Ala Val Gly
900 905 910
Asn Thr Pro Thr Tyr Thr Ile Asp Leu Gly Ser Thr Val Ala Val Asp
915 920 925
Ala Val Lys Ile Ser Glu Asp Val Arg Asn Ala Gly Gln Gln Ile Glu
930 935 940
Ser Ala Thr Leu Gln Gly Arg Val Asn Gly Thr Trp Thr Asn Leu Ala
945 950 955 960
Thr Met Thr Thr Val Gly Gln Gln Arg Asp Leu Arg Phe Thr Ser Gln
965 970 975
Asn Ile Asp Ala Ile Arg Leu Val Val Asn Ser Ser Arg Gly Pro Val
980 985 990
Arg Leu Ser Arg Leu Glu Val Phe His Thr Glu Ser Glu Ile Gln Thr
995 1000 1005
Gly Ala Arg Ala Tyr Tyr Ile Asp Pro Thr Ala Gln Thr Ala Gly
1010 1015 1020
Asp Gly Phe Thr Lys Asp Lys Pro Met Thr Ser Ile Glu Gln Leu
1025 1030 1035
His Asp Val Thr Val Ala Pro Gly Ser Val Ile Phe Val Lys Ala
1040 1045 1050
Gly Thr Glu Leu Thr Gly Asp Phe Ala Val Phe Gly Tyr Gly Thr
1055 1060 1065
Lys Asp Glu Pro Ile Thr Val Thr Thr Tyr Gly Glu Ser Asp Lys
1070 1075 1080
Ala Thr Thr Ala Ser Phe Asp Gly Met Thr Ala Gly Leu Thr Leu
1085 1090 1095
Lys Gln Ala Leu Lys Ala Leu Gly Lys Asp Asp Ala Gly Trp Val
1100 1105 1110
Val Ala Asp Ser Ala Thr Ala Pro Ala Ser Arg Val Tyr Val Pro
1115 1120 1125
Gln Asp Glu Ile Ser Val His Ala Gln Ser Ser Gln Asn Ser Gly
1130 1135 1140
Ala Glu Ala Ala Arg Ala Leu Asp Gly Asp Ser Ser Thr Ser Trp
1145 1150 1155
His Ser Gln Tyr Ser Pro Thr Thr Ala Ser Ala Pro His Trp Val
1160 1165 1170
Thr Leu Asp Leu Gly Lys Ser Arg Glu Asn Val Ala Tyr Phe Asp
1175 1180 1185
Tyr Leu Ala Arg Ile Asp Gly Asn Asn Asn Gly Ala Ala Lys Asp
1190 1195 1200
Tyr Glu Val Tyr Val Ser Asp Asp Pro Asn Asp Phe Gly Ala Pro
1205 1210 1215
Val Ala Ser Gly Thr Leu Lys Asn Val Ala Tyr Thr Gln Arg Ile
1220 1225 1230
Lys Leu Thr Pro Lys Asn Gly Arg Tyr Val Lys Phe Val Ile Lys
1235 1240 1245
Thr Asp Tyr Ser Gly Ser Asn Phe Gly Ser Ala Ala Glu Met Asn
1250 1255 1260
Val Glu Leu Leu Pro Thr Ala Val Glu Glu Asp Lys Val Ala Thr
1265 1270 1275
Pro Gln Lys Pro Thr Val Asp Asp Asp Ala Asp Thr Tyr Thr Ile
1280 1285 1290
Pro Asp Ile Glu Gly Val Val Tyr Lys Val Asp Gly Lys Val Leu
1295 1300 1305
Ala Ala Gly Ser Val Val Asn Val Gly Asp Glu Asp Val Thr Val
1310 1315 1320
Thr Val Thr Ala Glu Pro Ala Asp Gly Tyr Arg Phe Pro Asp Gly
1325 1330 1335
Val Thr Ser Pro Val Thr Tyr Glu Leu Thr Phe Thr Lys Lys Gly
1340 1345 1350
Gly Glu Lys Pro Pro Thr Glu Val Asn Lys Asp Lys Leu His Ala
1355 1360 1365
Thr Ile Thr Lys Ala Gln Ala Ile Asp Arg Ser Ala Tyr Thr Asp
1370 1375 1380
Glu Ser Leu Lys Val Leu Asp Asp Lys Leu Ala Ala Ala Leu Lys
1385 1390 1395
Val Tyr Asp Asp Asp Lys Val Ser Gln Asp Asp Val Asp Ala Ala
1400 1405 1410
Glu Ala Ala Leu Ser Ala Ala Ile Asp Ala Leu Lys Thr Lys Pro
1415 1420 1425
Thr Thr Pro Gly Gly Glu Gly Glu Lys Pro Gly Glu Gly Glu Lys
1430 1435 1440
Pro Gly Asp Gly Asn Lys Pro Gly Asp Gly Lys Lys Pro Gly Asp
1445 1450 1455
Val Ile Ala Lys Thr Gly Ala Ser Thr Met Gly Val Val Phe Ala
1460 1465 1470
Ala Leu Ala Met Val Ala Gly Ala Val Val Thr Leu Glu Ala Lys
1475 1480 1485
Arg Lys Ser Asn Arg
1490
<210> 5
<211> 2094
<212> DNA
<213> 肺炎链球菌(Streptococcus pneumoniae)
<400> 5
atgaataaaa gaggtcttta ttcaaaacta ggaatttctg ttgtaggcat tagtctttta 60
atgggagtcc ccactttgat tcatgcgaat gaattaaact atggtcaact gtccatatct 120
cctatttttc aaggaggttc atatcaactg aacaataaga gtatagatat cagctctttg 180
ttattagata aattgtctgg agagagtcag acagtagtaa tgaaatttaa agcagataaa 240
ccaaactctc ttcaagcttt gtttggccta tctaatagta aagcaggctt taaaaataat 300
tacttttcaa ttttcatgag agattctggt gagataggtg tagaaataag agacgcccaa 360
gagggaataa attatttatt ttctagacca gcttcattat ggggaaagca taaaggacag 420
gcagttgaaa atacactagt atttgtatct gattctaaag ataaaacata cacaatgtat 480
gttaatggaa tagaagtgtt ctctgaaaca gttgatacat ttttgccaat ttcaaatata 540
aatggtatag ataaggcaac actaggagct gttaatcgtg aaggtaagga acattacctc 600
gcaaaaggaa gtattggtga aatcagtcta tttaacaaag caattagtga tcaggaagtt 660
tcaaatattc ccttgtcaaa tccatttcag ttaattttcc aatcaggaga ttctactcaa 720
gctaactatt ttagaatacc gacactatat acattaagta gtggaagagt tctatcaagt 780
attgatgcac gttatggtgg gactcatgat tctaaaagta agattaatat tgccacttct 840
tatagtgatg ataatgggaa aacgtggagt gagccaattt ttgctatgaa gtttaatgac 900
tatgaggagc agttagttta ctggccacga gataataaat taaagaatag tcaaattagt 960
ggaagtgctt cattcataga ttcatccatt gttgaagata aaaaatctgg gaaaacgata 1020
ttactagctg atgttatgcc tgcgggtatt ggaaataata atgcaaataa agccgactca 1080
ggttttaaag aaataaatgg tcattattat ttaaaactaa agaagaatgg agataacgat 1140
ttccgttata cagttagaga aaatggtgtc gtttatgatg aaacaactaa taaacctaca 1200
aattatacta taaatgataa gtatgaagtt ttggagggag gaaagtcttt aacagtcgaa 1260
caatattcgg ttgattttga tagtggctct ttaagagaaa ggcataatgg aaaacaggtt 1320
cctatgaatg ttttctacaa agattcgtta tttaaagtga ctcctactaa ttatatagca 1380
atgacaacta gtcagaatag aggagagagt tgggaacaat ttaagttgtt gcctccgttc 1440
ttaggagaaa aacataatgg aacttacttg tgtcctggac aaggtttagc attaaaatca 1500
agtaacagat tgatttttgc aacatatact agtggagaac taacctatct catttcggat 1560
gatagtggtc aaacatggaa gaaatcctca gcttcaattc cgtttaaaaa tgcaacagca 1620
gaagcacaaa tggttgaact gagagatggt gtgattagaa cattctttag aaccactaca 1680
ggtaagatag cttatatgac tagtagagat tctggagaaa catggtcgaa agtttcgtat 1740
attgatggaa ttcaacaaac ttcatatggc acacaagtat ctgcaattaa atactctcaa 1800
ttaattgatg gaaaagaagc agtcattttg agtacaccaa attctagaag tggccgtaag 1860
ggaggccaat tagttgtcgg tttggtcaat aaagaagatg atagtattga ttggagatac 1920
cactatgata ttgatttgcc ttcgtatggt tatgcctatt ctgcgattac agaattgcca 1980
aatcatcaca taggtgtact gtttgaaaaa tatgattcgt ggtcgagaaa tgaattgcat 2040
ttaagcaatg tagttcagta tatagatttg gaaattaatg atttaacaaa ataa 2094
<210> 6
<211> 697
<212> PRT
<213> 肺炎链球菌
<400> 6
Met Asn Lys Arg Gly Leu Tyr Ser Lys Leu Gly Ile Ser Val Val Gly
1 5 10 15
Ile Ser Leu Leu Met Gly Val Pro Thr Leu Ile His Ala Asn Glu Leu
20 25 30
Asn Tyr Gly Gln Leu Ser Ile Ser Pro Ile Phe Gln Gly Gly Ser Tyr
35 40 45
Gln Leu Asn Asn Lys Ser Ile Asp Ile Ser Ser Leu Leu Leu Asp Lys
50 55 60
Leu Ser Gly Glu Ser Gln Thr Val Val Met Lys Phe Lys Ala Asp Lys
65 70 75 80
Pro Asn Ser Leu Gln Ala Leu Phe Gly Leu Ser Asn Ser Lys Ala Gly
85 90 95
Phe Lys Asn Asn Tyr Phe Ser Ile Phe Met Arg Asp Ser Gly Glu Ile
100 105 110
Gly Val Glu Ile Arg Asp Ala Gln Lys Gly Ile Asn Tyr Leu Phe Ser
115 120 125
Arg Pro Ala Ser Leu Trp Gly Lys His Lys Gly Gln Ala Val Glu Asn
130 135 140
Thr Leu Val Phe Val Ser Asp Ser Lys Asp Lys Thr Tyr Thr Met Tyr
145 150 155 160
Val Asn Gly Ile Glu Val Phe Ser Glu Thr Val Asp Thr Phe Leu Pro
165 170 175
Ile Ser Asn Ile Asn Gly Ile Asp Lys Ala Thr Leu Gly Ala Val Asn
180 185 190
Arg Glu Gly Lys Glu His Tyr Leu Ala Lys Gly Ser Ile Asp Glu Ile
195 200 205
Ser Leu Phe Asn Lys Ala Ile Ser Asp Gln Glu Val Ser Thr Ile Pro
210 215 220
Leu Ser Asn Pro Phe Gln Leu Ile Phe Gln Ser Gly Asp Ser Thr Gln
225 230 235 240
Ala Asn Tyr Phe Arg Ile Pro Thr Leu Tyr Thr Leu Ser Ser Gly Arg
245 250 255
Val Leu Ser Ser Ile Asp Ala Arg Tyr Gly Gly Thr His Asp Ser Lys
260 265 270
Ser Lys Ile Asn Ile Ala Thr Ser Tyr Ser Asp Asp Asn Gly Lys Thr
275 280 285
Trp Ser Glu Pro Ile Phe Ala Met Lys Phe Asn Asp Tyr Glu Glu Gln
290 295 300
Leu Val Tyr Trp Pro Arg Asp Asn Lys Leu Lys Asn Ser Gln Ile Ser
305 310 315 320
Gly Ser Ala Ser Phe Ile Asp Ser Ser Ile Val Glu Asp Lys Lys Ser
325 330 335
Gly Lys Thr Ile Leu Leu Ala Asp Val Met Pro Ala Gly Ile Gly Asn
340 345 350
Asn Asn Ala Asn Lys Ala Asp Ser Gly Phe Lys Glu Ile Asn Gly His
355 360 365
Tyr Tyr Leu Lys Leu Lys Lys Asn Gly Asp Asn Asp Phe Arg Tyr Thr
370 375 380
Val Arg Glu Asn Gly Val Val Tyr Asn Glu Thr Thr Asn Lys Pro Thr
385 390 395 400
Asn Tyr Thr Ile Asn Asp Lys Tyr Glu Val Leu Glu Gly Gly Lys Ser
405 410 415
Leu Thr Val Glu Gln Tyr Ser Val Asp Phe Asp Ser Gly Ser Leu Arg
420 425 430
Glu Arg His Asn Gly Lys Gln Val Pro Met Asn Val Phe Tyr Lys Asp
435 440 445
Ser Leu Phe Lys Val Thr Pro Thr Asn Tyr Ile Ala Met Thr Thr Ser
450 455 460
Gln Asn Arg Gly Glu Ser Trp Glu Gln Phe Lys Leu Leu Pro Pro Phe
465 470 475 480
Leu Gly Glu Lys His Asn Gly Thr Tyr Leu Cys Pro Gly Gln Gly Leu
485 490 495
Ala Leu Lys Ser Ser Asn Arg Leu Ile Phe Ala Thr Tyr Thr Ser Gly
500 505 510
Glu Leu Thr Tyr Leu Ile Ser Asp Asp Ser Gly Gln Thr Trp Lys Lys
515 520 525
Ser Ser Ala Ser Ile Pro Phe Lys Asn Ala Thr Ala Glu Ala Gln Met
530 535 540
Val Glu Leu Arg Asp Gly Val Ile Arg Thr Phe Phe Arg Thr Thr Thr
545 550 555 560
Gly Lys Ile Ala Tyr Met Thr Ser Arg Asp Ser Gly Glu Thr Trp Ser
565 570 575
Lys Val Ser Tyr Ile Asp Gly Ile Gln Gln Thr Ser Tyr Gly Thr Gln
580 585 590
Val Ser Ala Ile Lys Tyr Ser Gln Leu Ile Asp Gly Lys Glu Ala Val
595 600 605
Ile Leu Ser Thr Pro Asn Ser Arg Ser Gly Arg Lys Gly Gly Gln Leu
610 615 620
Val Val Gly Leu Val Asn Lys Glu Asp Asp Ser Ile Asp Trp Lys Tyr
625 630 635 640
His Tyr Asp Ile Asp Leu Pro Ser Tyr Gly Tyr Ala Tyr Ser Ala Ile
645 650 655
Thr Glu Leu Pro Asn His His Ile Gly Val Leu Phe Glu Lys Tyr Asp
660 665 670
Ser Trp Ser Arg Asn Glu Leu His Leu Ser Asn Val Val Gln Tyr Ile
675 680 685
Asp Leu Glu Ile Asn Asp Leu Thr Lys
690 695
<210> 7
<211> 2076
<212> DNA
<213> 长双歧杆菌(Bifidobacterium longum)
<400> 7
atggaacata gagcgttcaa gtggccgcag ccacttgcgg gcaacaagcc ccgcatctgg 60
tacggcggcg attacaaccc cgaccaatgg cctgaggaag tgtgggacga agatgtagcc 120
ctcatgcagc aggccggcgt caacctcgtc tccgtagcca tcttctcctg ggccaagctt 180
gagcccgaag aaggcgtgta cgacttcgat tggctcgacc gcgtcatcga caagctcggc 240
aaggccggca tcgccgtcga tctcgcctcc ggcaccgcat ccccgccgat gtggatgacc 300
caggcccacc cggagatcct ctgggtcgac taccgcggcg acgtctgcca gcccggtgcc 360
cgccagcact ggcgcgccac cagcccggtc ttccttgact acgcgctcaa cctgtgccgc 420
aagatggccg agcactacaa ggacaacccc tatgtggtct cttggcatgt gagcaacgag 480
tacggctgcc acaaccgctt cgactattcc gaagacgccg agcgcgcctt ccagaagtgg 540
tgcgagaaga agtacggcac catcgacgct gtcaacgacg cctggggcac cgccttctgg 600
gcgcagcgca tgaacaattt ctccgagatc atcccgccgc gattcatcgg cgacggcaac 660
ttcatgaacc cgggcaagct gcttgattgg aagcgtttca gctccgacgc gctgctggac 720
ttctacaagg ccgagcgcga cgccctgctc gagatcgccc ccaagccgca gaccaccaac 780
ttcatggtct ccgcgggctg caccgtcctc gactacgaca agtggggtca tgacgtggac 840
ttcgtgtcca acgaccatta cttctcgccc ggcgaggccc acttcgacga gatggcctac 900
gcggcctgcc tcaccgacgg catcgcccgc aagaacccgt ggttcctcat ggaacattcc 960
acgtccgccg tcaactggcg cccgaccaac taccggctcg agcccggcga gctggtgcgc 1020
gactccctgg cccatctggc catgggcgcc gacgccatct gctacttcca gtggcgtcag 1080
tccaaggccg gcgccgagaa gtggcattcc gccatggtgc cccacgcagg ccccgactcc 1140
cagatcttcc gcgatgtgtg cgagctgggt gccgacctca acaagcttgc tgacgagggc 1200
ctgctgagca ccaagctggt caagtccaag gtcgccatcg tcttcgacta cgagtcccag 1260
tgggccaccg agcacaccgc cacccccacg caggaggtgc gccactggac cgagccgctg 1320
gactggttcc gcgcgctggc ggacaatggc ctgaccgccg acgtggtgcc ggtccgcggt 1380
ccttgggatg agtacgaggc cgtcgtgttg ccgagcctgg ccatcctgtc cgagcagacc 1440
acgcgccgcg tgcgcgagta tgtggcgaac ggcggcaagc tgttcgtgac ctactacacc 1500
ggtctggtgg acgacaggga tcacgtctgg ctgggcggct accccggctc cattcgcgac 1560
gtggtgggcg tgcgcgtcga ggaattcgcc ccgatgggca ccgacgcccc cggcaccatg 1620
gaccaccttg acttggacaa cggaaccgtg gcgcacgatt tcgccgacgt gatcacctcc 1680
gtggccgata ccgctcacgt ggtcgcctcc ttcaaggcag ataagtggac cggtttcgac 1740
ggcgctcccg ccatcaccgt caacgacttc ggcgacggca aggccgcata cgtcggtgcc 1800
cgtctcgggc gtgagggctt ggccaagagc ctgcccgcgc tgctggagga actcggcatc 1860
gagacttcgg ctgaggacga tcgtggtgaa gtgctgcgcg tcgagcgtgc ggacgaaact 1920
ggcgagaacc acttcgtgtt cctgttcaac cgcacccacg atgttgcggt cgtggacgtg 1980
gaaggcgaac cgctggtcgc ctcgctggcc caggtcaacg agtccgagca cacggccgcc 2040
atccagccca acggcgtact cgtcgtcaag ctgtaa 2076
<210> 8
<211> 691
<212> PRT
<213> 长双歧杆菌
<400> 8
Met Glu His Arg Ala Phe Lys Trp Pro Gln Pro Leu Ala Gly Asn Lys
1 5 10 15
Pro Arg Ile Trp Tyr Gly Gly Asp Tyr Asn Pro Asp Gln Trp Pro Glu
20 25 30
Glu Val Trp Asp Glu Asp Val Ala Leu Met Gln Gln Ala Gly Val Asn
35 40 45
Leu Val Ser Val Ala Ile Phe Ser Trp Ala Lys Leu Glu Pro Glu Glu
50 55 60
Gly Val Tyr Asp Phe Asp Trp Leu Asp Arg Val Ile Asp Lys Leu Gly
65 70 75 80
Lys Ala Gly Ile Ala Val Asp Leu Ala Ser Gly Thr Ala Ser Pro Pro
85 90 95
Met Trp Met Thr Gln Ala His Pro Glu Ile Leu Trp Val Asp Tyr Arg
100 105 110
Gly Asp Val Cys Gln Pro Gly Ala Arg Gln His Trp Arg Ala Thr Ser
115 120 125
Pro Val Phe Leu Asp Tyr Ala Leu Asn Leu Cys Arg Lys Met Ala Glu
130 135 140
His Tyr Lys Asp Asn Pro Tyr Val Val Ser Trp His Val Ser Asn Glu
145 150 155 160
Tyr Gly Cys His Asn Arg Phe Asp Tyr Ser Glu Asp Ala Glu Arg Ala
165 170 175
Phe Gln Lys Trp Cys Glu Lys Lys Tyr Gly Thr Ile Asp Ala Val Asn
180 185 190
Asp Ala Trp Gly Thr Ala Phe Trp Ala Gln Arg Met Asn Asn Phe Ser
195 200 205
Glu Ile Ile Pro Pro Arg Phe Ile Gly Asp Gly Asn Phe Met Asn Pro
210 215 220
Gly Lys Leu Leu Asp Trp Lys Arg Phe Ser Ser Asp Ala Leu Leu Asp
225 230 235 240
Phe Tyr Lys Ala Glu Arg Asp Ala Leu Leu Glu Ile Ala Pro Lys Pro
245 250 255
Gln Thr Thr Asn Phe Met Val Ser Ala Gly Cys Thr Val Leu Asp Tyr
260 265 270
Asp Lys Trp Gly His Asp Val Asp Phe Val Ser Asn Asp His Tyr Phe
275 280 285
Ser Pro Gly Glu Ala His Phe Asp Glu Met Ala Tyr Ala Ala Cys Leu
290 295 300
Thr Asp Gly Ile Ala Arg Lys Asn Pro Trp Phe Leu Met Glu His Ser
305 310 315 320
Thr Ser Ala Val Asn Trp Arg Pro Thr Asn Tyr Arg Leu Glu Pro Gly
325 330 335
Glu Leu Val Arg Asp Ser Leu Ala His Leu Ala Met Gly Ala Asp Ala
340 345 350
Ile Cys Tyr Phe Gln Trp Arg Gln Ser Lys Ala Gly Ala Glu Lys Trp
355 360 365
His Ser Ala Met Val Pro His Ala Gly Pro Asp Ser Gln Ile Phe Arg
370 375 380
Asp Val Cys Glu Leu Gly Ala Asp Leu Asn Lys Leu Ala Asp Glu Gly
385 390 395 400
Leu Leu Ser Thr Lys Leu Val Lys Ser Lys Val Ala Ile Val Phe Asp
405 410 415
Tyr Glu Ser Gln Trp Ala Thr Glu His Thr Ala Thr Pro Thr Gln Glu
420 425 430
Val Arg His Trp Thr Glu Pro Leu Asp Trp Phe Arg Ala Leu Ala Asp
435 440 445
Asn Gly Leu Thr Ala Asp Val Val Pro Val Arg Gly Pro Trp Asp Glu
450 455 460
Tyr Glu Ala Val Val Leu Pro Ser Leu Ala Ile Leu Ser Glu Gln Thr
465 470 475 480
Thr Arg Arg Val Arg Glu Tyr Val Ala Asn Gly Gly Lys Leu Phe Val
485 490 495
Thr Tyr Tyr Thr Gly Leu Val Asp Asp Arg Asp His Val Trp Leu Gly
500 505 510
Gly Tyr Pro Gly Ser Ile Arg Asp Val Val Gly Val Arg Val Glu Glu
515 520 525
Phe Ala Pro Met Gly Thr Asp Ala Pro Gly Thr Met Asp His Leu Asp
530 535 540
Leu Asp Asn Gly Thr Val Ala His Asp Phe Ala Asp Val Ile Thr Ser
545 550 555 560
Val Ala Asp Thr Ala His Val Val Ala Ser Phe Lys Ala Asp Lys Trp
565 570 575
Thr Gly Phe Asp Gly Ala Pro Ala Ile Thr Val Asn Asp Phe Gly Asp
580 585 590
Gly Lys Ala Ala Tyr Val Gly Ala Arg Leu Gly Arg Glu Gly Leu Ala
595 600 605
Lys Ser Leu Pro Ala Leu Leu Glu Glu Leu Gly Ile Glu Thr Ser Ala
610 615 620
Glu Asp Asp Arg Gly Glu Val Leu Arg Val Glu Arg Ala Asp Glu Thr
625 630 635 640
Gly Glu Asn His Phe Val Phe Leu Phe Asn Arg Thr His Asp Val Ala
645 650 655
Val Val Asp Val Glu Gly Glu Pro Leu Val Ala Ser Leu Ala Gln Val
660 665 670
Asn Glu Ser Glu His Thr Ala Ala Ile Gln Pro Asn Gly Val Leu Val
675 680 685
Val Lys Leu
690
<210> 9
<211> 1626
<212> DNA
<213> 热纤梭菌(Clostridium thermocellum)
<400> 9
atggcagaag gggttatagt caacggaact cagtttaaag acacatcggg aaatgtgata 60
catgcccatg ggggaggcat gttaaagcat ggtgactatt attactggta cggtgaatac 120
cgggacgact ccaacttgtt tttgggtgta agttgctaca ggtcaaaaga tcttgtaaac 180
tgggaataca gaggagaagt gctgagccga aattccgctc ctgaactgaa tcactgcaat 240
attgaaagac cgaaagtcat gtacaacgca tcaaccggtg aatttgtcat gtggatgcac 300
tgggagaacg gcataaacta cggtcaggca agagcagctg ttgcgtattc caaaacgccc 360
gacggcaaat tcacatacat tcgaagcttt cgtcccatgc aggataccgg cgttatggat 420
catggccttc cgggatatat gtcaagggac tgcaatgtat ttgtggacac tgacggcaag 480
ggatatttta tatccgcagc caatgagaac atggacctgc acctttatga gctgacacct 540
gactataaaa atattgcatc ccttaaggca aagctgtttg tcggacagca gagggaagca 600
ccatgcctta taaagagaaa cggctactat taccttatta cttccggttg tacaggttgg 660
aacccgaatc aggctaaata cgcatattcc aaagatttgg ccagtggctg gtcccagctt 720
tacaatcttg gtaattcaac cacctacagg tcacagccga cttttatcat tcccgttcag 780
ggaagctcgg gaaccagtta tctttatatg ggtgaccgtt gggccggtgc ctggggagga 840
aaggttaatg actcccaata tgtatggctt cccttaaact tcatatccga tacaacactt 900
gaactgccct attatgactc tgtaaagatt gatgcttctt caggaataat ttccgagtac 960
ataccggaca ctacacgcta caagctggta aacaaaaaca gcggaaaagt cctggatgtt 1020
cttgacggtt ctgtcgataa tgcagcccag atagtccaat ggaccgataa cgggtctttg 1080
agtcaacagt ggtaccttgt ggacgtgggc ggtggttata aaaagattgt aaatgtaaag 1140
agcggaagag ccttggatgt aaaagacgaa tccaaggaag acggtggagt attaatacaa 1200
tataccagca acggcggata taatcagcac tggaaattca cagacatagg tgacgggtat 1260
tacaagattt ccagccgcca ctgcggaaaa cttatagatg tgcgaaaatg gtcaacggaa 1320
gacggcggaa taattcagca gtggtccgat gccggaggaa caaatcagca ttggaagctg 1380
gtgcttgtat caagtcccga gccttcacca tcaccttctc cccaagtggt taaaggagat 1440
gtaaacggcg acttgaaagt aaattcaacg gatttttcca tgttaagaag atatttactt 1500
aaaaccattg acaattttcc gacagaaaac ggaaaacagg ctgccgattt gaacggagac 1560
ggcagaataa actcttcgga tcttacaatg ctgaaaagat acttgcttat ggaagtggat 1620
ttgtaa 1626
<210> 10
<211> 541
<212> PRT
<213> 热纤梭菌(Clostridium thermocellum)
<400> 10
Met Ala Glu Gly Val Ile Val Asn Gly Thr Gln Phe Lys Asp Thr Ser
1 5 10 15
Gly Asn Val Ile His Ala His Gly Gly Gly Met Leu Lys His Gly Asp
20 25 30
Tyr Tyr Tyr Trp Tyr Gly Glu Tyr Arg Asp Asp Ser Asn Leu Phe Leu
35 40 45
Gly Val Ser Cys Tyr Arg Ser Lys Asp Leu Val Asn Trp Glu Tyr Arg
50 55 60
Gly Glu Val Leu Ser Arg Asn Ser Ala Pro Glu Leu Asn His Cys Asn
65 70 75 80
Ile Glu Arg Pro Lys Val Met Tyr Asn Ala Ser Thr Gly Glu Phe Val
85 90 95
Met Trp Met His Trp Glu Asn Gly Ile Asn Tyr Gly Gln Ala Arg Ala
100 105 110
Ala Val Ala Tyr Ser Lys Thr Pro Asp Gly Lys Phe Thr Tyr Ile Arg
115 120 125
Ser Phe Arg Pro Met Gln Asp Thr Gly Val Met Asp His Gly Leu Pro
130 135 140
Gly Tyr Met Ser Arg Asp Cys Asn Val Phe Val Asp Thr Asp Gly Lys
145 150 155 160
Gly Tyr Phe Ile Ser Ala Ala Asn Glu Asn Met Asp Leu His Leu Tyr
165 170 175
Glu Leu Thr Pro Asp Tyr Lys Asn Ile Ala Ser Leu Lys Ala Lys Leu
180 185 190
Phe Val Gly Gln Gln Arg Glu Ala Pro Cys Leu Ile Lys Arg Asn Gly
195 200 205
Tyr Tyr Tyr Leu Ile Thr Ser Gly Cys Thr Gly Trp Asn Pro Asn Gln
210 215 220
Ala Lys Tyr Ala Tyr Ser Lys Asp Leu Ala Ser Gly Trp Ser Gln Leu
225 230 235 240
Tyr Asn Leu Gly Asn Ser Thr Thr Tyr Arg Ser Gln Pro Thr Phe Ile
245 250 255
Ile Pro Val Gln Gly Ser Ser Gly Thr Ser Tyr Leu Tyr Met Gly Asp
260 265 270
Arg Trp Ala Gly Ala Trp Gly Gly Lys Val Asn Asp Ser Gln Tyr Val
275 280 285
Trp Leu Pro Leu Asn Phe Ile Ser Asp Thr Thr Leu Glu Leu Pro Tyr
290 295 300
Tyr Asp Ser Val Lys Ile Asp Ala Ser Ser Gly Ile Ile Ser Glu Tyr
305 310 315 320
Ile Pro Asp Thr Thr Arg Tyr Lys Leu Val Asn Lys Asn Ser Gly Lys
325 330 335
Val Leu Asp Val Leu Asp Gly Ser Val Asp Asn Ala Ala Gln Ile Val
340 345 350
Gln Trp Thr Asp Asn Gly Ser Leu Ser Gln Gln Trp Tyr Leu Val Asp
355 360 365
Val Gly Gly Gly Tyr Lys Lys Ile Val Asn Val Lys Ser Gly Arg Ala
370 375 380
Leu Asp Val Lys Asp Glu Ser Lys Glu Asp Gly Gly Val Leu Ile Gln
385 390 395 400
Tyr Thr Ser Asn Gly Gly Tyr Asn Gln His Trp Lys Phe Thr Asp Ile
405 410 415
Gly Asp Gly Tyr Tyr Lys Ile Ser Ser Arg His Cys Gly Lys Leu Ile
420 425 430
Asp Val Arg Lys Trp Ser Thr Glu Asp Gly Gly Ile Ile Gln Gln Trp
435 440 445
Ser Asp Ala Gly Gly Thr Asn Gln His Trp Lys Leu Val Leu Val Ser
450 455 460
Ser Pro Glu Pro Ser Pro Ser Pro Ser Pro Gln Val Val Lys Gly Asp
465 470 475 480
Val Asn Gly Asp Leu Lys Val Asn Ser Thr Asp Phe Ser Met Leu Arg
485 490 495
Arg Tyr Leu Leu Lys Thr Ile Asp Asn Phe Pro Thr Glu Asn Gly Lys
500 505 510
Gln Ala Ala Asp Leu Asn Gly Asp Gly Arg Ile Asn Ser Ser Asp Leu
515 520 525
Thr Met Leu Lys Arg Tyr Leu Leu Met Glu Val Asp Leu
530 535 540
<210> 11
<211> 2631
<212> DNA
<213> 类芽孢杆菌属(Paenibacillus sp.)
<400> 11
atgaatcgac acgtcctgct tcatccgtat ctccaccgga aggcgttgcc tctgctcctg 60
gccttgacgc tgctgacggg catcgccctg ttcccggcct ccaccgcgca ggcggcgacg 120
accgtgacgt cgatgacgta cttctctgcc aatgacggtc ccgtcatctc caaatccggc 180
gtcgggcaag ccagctacgg tttcgtcatg ccgatcttca acggaggcgc tgcgacctgg 240
aacgatgtcg ccgatgacgt cggcgttcgc gtcaaggtcg gcggcagctg ggtcgacatt 300
gacagcgttg gcggctatgt gtacaaccag aactggggcc attggaacga cagcggcacc 360
tatggctact ggttcaccct ctccgccacg accgagctgc agctctactc caaggcgaac 420
agcagcgtca cactcaacta cacgctcgtc ttccagaatg tcaatgaaac gaccattacc 480
tcgatgacac cgacccaggg cccgcaattg accgcagggt ataccggcgg cgcaggcttc 540
acctatccgg tcttcaacaa cgatccctcc atcccgtatg cagccgtagc cggcgatctg 600
aaggtgtacg tcaagccagt cgccagcagt acctggatcg atatcgacaa caacgcggcg 660
agcggctgga tctacgacag caacttcggc cagttcaccg aaggcggcgg cggctactgg 720
ttcaccgtca ccgagtcgat caacgtcaag ctcgagtcca ggacgtcctc ggccaacgtc 780
gtctatacga tcaacttccc gcagccgacg cgcagcagct acacactctc cgcctatgac 840
ggcacgacct acagcgccga tgcgagcggc gcgatcggta tcccgctgcc gcggatcgac 900
ggcaccccgg cgatcggcag cgagctcggc aacttcgtct accagatcta ccggaacggc 960
cagtgggtcg agatgagcaa ctcggcgcag agcagcttcg tctactcggc caatggctac 1020
aacaacatgt ccgacgccaa tcaatggggc tactgggccg actacatcta cggcctctgg 1080
ttccggccga tccaggagga tatgcagatc cgcatcggct atccgctgaa tggccagtcc 1140
ggcggcagcg tcggcagcaa cttcgtcacc tatacgctga tcggcaaccc gaacgcgccg 1200
cgacccgatg tgagcgacca gggcgacgtc gagatcggca cgcccaccga tccggccatc 1260
gcaggatgga atctgtattg gcaggatgaa ttcgccggca gcgcgctcga tctgaacaag 1320
tggaactacg agaccggcta ctacatcggc aacgacccca atctgtgggg ctggggcaac 1380
gccgagatgc agcactatac gacgagcacg caaaatgtct tcgtcgctga cggcaaactc 1440
aacatccgag cgctccacga ttaccaatcg ttcccgcagg acccgaaccg ctacgcgacc 1500
tactcctccg gcaagatcaa caccaaggac aacatgtcgc tgcagtacgg ccgcgtcgat 1560
atccgcgcca agctgccgac tggcgatggc gtctggccgg cactgtggat gctgccggag 1620
gactccgtct acggcgcatg ggcggcatca ggagagatcg acatcatgga ggcgaagggc 1680
cgtctgcccg gcacgacgag cggcgcgatc cactacggcg gccaatggcc ggtcaaccgc 1740
tacctcgccg gagaatgcta cctcccgcaa ggtacgacat tcgccgacga ctttaatgtg 1800
tacacgatga tctgggaaga ggacaacatg aagtggtacg ttaacggtga gtttttcttc 1860
aaggtgacgc gcgagcagtg gtactccgtc gccgccccca acaatccgga cgcgccgttc 1920
gaccagccgt tctatctgat catgaacctg gcggtcggcg gccacttcga cggcgggcgt 1980
acgcccgacc cgtccgacat cccggcgacg atgcagatcg actacgtgcg ggtgtacaaa 2040
gagggcgcgg gcggcggtcc gggcaacccg ggcggcaacg tcgcggtgac cggcgttagc 2100
gtgaccccgg caacggcgca ggtgcaggtc ggtcagaccg tctcgctgag cgccaacgtc 2160
gcgccagcca atgcaacgaa caagcaagtg acctggtcag tcgccaatgg cagcatcgcc 2220
tcggtgagcg ccagcggcgt cgtcagtgga ctcgctgctg gcacgacgac cgtaaccgcc 2280
acgaccgcag acggcaaccg caccgcctcg gcgacgatca ccgtcgtgcc gccaccgacg 2340
acgaccgtca tcatcggcga tagcgtgcgc ggcatccgaa agaccggcga caacctgctc 2400
ttctacgtca acggcgcaac ctacgccgac ctgcactaca aggtgaacgg cggcggtcag 2460
cctaatgtcg cgatgacgca cacaggaggc ggcaactaca cctacccggt gcatggcctc 2520
caacaaggcg ataccgtcga atacttcttc acctacaacc ccggcaacgg cgcgctagac 2580
acgccttggc agacttatgt gcatggggta acacaaggtg ttgttgagta a 2631
<210> 12
<211> 876
<212> PRT
<213> 类芽孢杆菌属
<400> 12
Met Asn Arg His Val Leu Leu His Pro Tyr Leu His Arg Lys Ala Leu
1 5 10 15
Pro Leu Leu Leu Ala Leu Thr Leu Leu Thr Gly Ile Ala Leu Phe Pro
20 25 30
Ala Ser Thr Ala Gln Ala Ala Thr Thr Val Thr Ser Met Thr Tyr Phe
35 40 45
Ser Ala Asn Asp Gly Pro Val Ile Ser Lys Ser Gly Val Gly Gln Ala
50 55 60
Ser Tyr Gly Phe Val Met Pro Ile Phe Asn Gly Gly Ala Ala Thr Trp
65 70 75 80
Asn Asp Val Ala Asp Asp Val Gly Val Arg Val Lys Val Gly Gly Ser
85 90 95
Trp Val Asp Ile Asp Ser Val Gly Gly Tyr Val Tyr Asn Gln Asn Trp
100 105 110
Gly His Trp Asn Asp Ser Gly Thr Tyr Gly Tyr Trp Phe Thr Leu Ser
115 120 125
Ala Thr Thr Glu Leu Gln Leu Tyr Ser Lys Ala Asn Ser Ser Val Thr
130 135 140
Leu Asn Tyr Thr Leu Val Phe Gln Asn Val Asn Glu Thr Thr Ile Thr
145 150 155 160
Ser Met Thr Pro Thr Gln Gly Pro Gln Leu Thr Ala Gly Tyr Thr Gly
165 170 175
Gly Ala Gly Phe Thr Tyr Pro Val Phe Asn Asn Asp Pro Ser Ile Pro
180 185 190
Tyr Ala Ala Val Ala Gly Asp Leu Lys Val Tyr Val Lys Pro Val Ala
195 200 205
Ser Ser Thr Trp Ile Asp Ile Asp Asn Asn Ala Ala Ser Gly Trp Ile
210 215 220
Tyr Asp Ser Asn Phe Gly Gln Phe Thr Glu Gly Gly Gly Gly Tyr Trp
225 230 235 240
Phe Thr Val Thr Glu Ser Ile Asn Val Lys Leu Glu Ser Arg Thr Ser
245 250 255
Ser Ala Asn Val Val Tyr Thr Ile Asn Phe Pro Gln Pro Thr Arg Ser
260 265 270
Ser Tyr Thr Leu Ser Ala Tyr Asp Gly Thr Thr Tyr Ser Ala Asp Ala
275 280 285
Ser Gly Ala Ile Gly Ile Pro Leu Pro Arg Ile Asp Gly Thr Pro Ala
290 295 300
Ile Gly Ser Glu Leu Gly Asn Phe Val Tyr Gln Ile Tyr Arg Asn Gly
305 310 315 320
Gln Trp Val Glu Met Ser Asn Ser Ala Gln Ser Ser Phe Val Tyr Ser
325 330 335
Ala Asn Gly Tyr Asn Asn Met Ser Asp Ala Asn Gln Trp Gly Tyr Trp
340 345 350
Ala Asp Tyr Ile Tyr Gly Leu Trp Phe Arg Pro Ile Gln Glu Asp Met
355 360 365
Gln Ile Arg Ile Gly Tyr Pro Leu Asn Gly Gln Ser Gly Gly Ser Val
370 375 380
Gly Ser Asn Phe Val Thr Tyr Thr Leu Ile Gly Asn Pro Asn Ala Pro
385 390 395 400
Arg Pro Asp Val Ser Asp Gln Gly Asp Val Glu Ile Gly Thr Pro Thr
405 410 415
Asp Pro Ala Ile Ala Gly Trp Asn Leu Tyr Trp Gln Asp Glu Phe Ala
420 425 430
Gly Ser Ala Leu Asp Leu Asn Lys Trp Asn Tyr Glu Thr Gly Tyr Tyr
435 440 445
Ile Gly Asn Asp Pro Asn Leu Trp Gly Trp Gly Asn Ala Glu Met Gln
450 455 460
His Tyr Thr Thr Ser Thr Gln Asn Val Phe Val Ala Asp Gly Lys Leu
465 470 475 480
Asn Ile Arg Ala Leu His Asp Tyr Gln Ser Phe Pro Gln Asp Pro Asn
485 490 495
Arg Tyr Ala Thr Tyr Ser Ser Gly Lys Ile Asn Thr Lys Asp Asn Met
500 505 510
Ser Leu Gln Tyr Gly Arg Val Asp Ile Arg Ala Lys Leu Pro Thr Gly
515 520 525
Asp Gly Val Trp Pro Ala Leu Trp Met Leu Pro Glu Asp Ser Val Tyr
530 535 540
Gly Ala Trp Ala Ala Ser Gly Glu Ile Asp Ile Met Glu Ala Lys Gly
545 550 555 560
Arg Leu Pro Gly Thr Thr Ser Gly Ala Ile His Tyr Gly Gly Gln Trp
565 570 575
Pro Val Asn Arg Tyr Leu Ala Gly Glu Cys Tyr Leu Pro Gln Gly Thr
580 585 590
Thr Phe Ala Asp Asp Phe Asn Val Tyr Thr Met Ile Trp Glu Glu Asp
595 600 605
Asn Met Lys Trp Tyr Val Asn Gly Glu Phe Phe Phe Lys Val Thr Arg
610 615 620
Glu Gln Trp Tyr Ser Val Ala Ala Pro Asn Asn Pro Asp Ala Pro Phe
625 630 635 640
Asp Gln Pro Phe Tyr Leu Ile Met Asn Leu Ala Val Gly Gly His Phe
645 650 655
Asp Gly Gly Arg Thr Pro Asp Pro Ser Asp Ile Pro Ala Thr Met Gln
660 665 670
Ile Asp Tyr Val Arg Val Tyr Lys Glu Gly Ala Gly Gly Gly Pro Gly
675 680 685
Asn Pro Gly Gly Asn Val Ala Val Thr Gly Val Ser Val Thr Pro Ala
690 695 700
Thr Ala Gln Val Gln Val Gly Gln Thr Val Ser Leu Ser Ala Asn Val
705 710 715 720
Ala Pro Ala Asn Ala Thr Asn Lys Gln Val Thr Trp Ser Val Ala Asn
725 730 735
Gly Ser Ile Ala Ser Val Ser Ala Ser Gly Val Val Ser Gly Leu Ala
740 745 750
Ala Gly Thr Thr Thr Val Thr Ala Thr Thr Ala Asp Gly Asn Arg Thr
755 760 765
Ala Ser Ala Thr Ile Thr Val Val Pro Pro Pro Thr Thr Thr Val Ile
770 775 780
Ile Gly Asp Ser Val Arg Gly Ile Arg Lys Thr Gly Asp Asn Leu Leu
785 790 795 800
Phe Tyr Val Asn Gly Ala Thr Tyr Ala Asp Leu His Tyr Lys Val Asn
805 810 815
Gly Gly Gly Gln Pro Asn Val Ala Met Thr His Thr Gly Gly Gly Asn
820 825 830
Tyr Thr Tyr Pro Val His Gly Leu Gln Gln Gly Asp Thr Val Glu Tyr
835 840 845
Phe Phe Thr Tyr Asn Pro Gly Asn Gly Ala Leu Asp Thr Pro Trp Gln
850 855 860
Thr Tyr Val His Gly Val Thr Gln Gly Val Val Glu
865 870 875
<210> 13
<211> 6783
<212> DNA
<213> 人工序列
<220>
<223> 转座子盒
<400> 13
gccagatgat taattcctaa tttttgttga cactctatca ttgatagagt tattttacca 60
ctccctatca gtgatagaga aaagtgaaat gaatagttcg acaaaaatct agaaataatt 120
ttgtttaact ttaagaagga gatatacaat ttcgtcgaca cacaggaaac atattaaaaa 180
ttaaaacctg caggagtttg aaggagatag aaccatggcg cagtcgaaac tctatccagt 240
tgtgatggca ggtggctccg gtagccgctt atggccgctt tcccgcgtac tttatcccaa 300
gcagttttta tgcctgaaag gcgatctcac catgctgcaa accaccatct gccgcctgaa 360
cggcgtggag tgcgaaagcc cggtggtgat ttgcaatgag cagcaccgct ttattgtcgc 420
ggaacagctg cgtcaactga acaaacttac cgagaacatt attctcgaac cggcagggcg 480
aaacacggca cctgccattg cgctggcggc gctggcggca aaacgtcata gcccggagag 540
cgacccgtta atgctggtat tggcggcgga tcatgtgatt gccgatgaag acgcgttccg 600
tgccgccgtg cgtaatgcca tgccatatgc cgaagcgggc aagctggtga ccttcggcat 660
tgtgccggat ctaccagaaa ccggttatgg ctatattcgt cgcggtgaag tgtctgcggg 720
tgagcaggat atggtggcct ttgaagtggc gcagtttgtc gaaaaaccga atctggaaac 780
cgctcaggcc tatgtggcaa gcggcgaata ttactggaac agcggtatgt tcctgttccg 840
cgccggacgc tatctcgaag aactgaaaaa atatcgcccg gatatcctcg atgcctgtga 900
aaaagcgatg agcgccgtcg atccggatct caattttatt cgcgtggatg aagaagcgtt 960
tctcgcctgc ccggaagagt cggtggatta cgcggtcatg gaacgtacgg cagatgctgt 1020
tgtggtgccg atggatgcgg gctggagcga tgttggctcc tggtcttcat tatgggagat 1080
cagcgcccac accgccgagg gcaacgtttg ccacggcgat gtgattaatc acaaaactga 1140
aaacagctat gtgtatgctg aatctggcct ggtcaccacc gtcggggtga aagatctggt 1200
agtggtgcag accaaagatg cggtgctgat tgccgaccgt aacgcggtac aggatgtgaa 1260
aaaagtggtc gagcagatca aagccgatgg tcgccatgag catcgggtgc atcgcgaagt 1320
gtatcgtccg tggggcaaat atgactctat cgacgcgggc gaccgctacc aggtgaaacg 1380
catcaccgtg aaaccgggcg agggcttgtc ggtacagatg caccatcacc gcgcggaaca 1440
ctgggtggtt gtcgcgggaa cggcaaaagt caccattgat ggtgatatca aactgcttgg 1500
tgaaaacgag tccatttata ttccgctggg ggcgacgcat tgcctggaaa acccggggaa 1560
aattccgctc gatttaattg aagtgcgctc cggctcttat ctcgaagagg atgatgtggt 1620
gcgtttcgcg gatcgctacg gacgggtgta aacgtcgcat caggcaatga atgcgaaacc 1680
gcggtgtaaa taacgacaaa aataaaattg gccgcttcgg tcagggccaa ctattgcctg 1740
aaaaagggta acgatatgaa aaaattaacc tgctttaaag cctatgatat tcgcgggaaa 1800
ttaggcgaag aactgaatga agatatcgcc tggcgcattg gtcgcgccta tggcgaattt 1860
ctcaaaccga aaaccattgt gttaggcggt gatgtccgcc tcaccagcga aaccttaaaa 1920
ctggcgctgg cgaaaggttt acaggatgcg ggcgttgacg tgctggatat tggtatgtcc 1980
ggcaccgaag agatctattt cgccacgttc catctcggcg tggatggcgg cattgaagtt 2040
accgccagcc ataatccgat ggattataac ggcatgaagc tggttcgcga gggggctcgc 2100
ccgatcagcg gagataccgg actgcgcgac gtccagcgtc tggctgaagc caacgacttt 2160
cctcccgtcg atgaaaccaa acgcggtcgc tatcagcaaa tcaacctgcg tgacgcttac 2220
gttgatcacc tgttcggtta tatcaatgtc aaaaacctca cgccgctcaa gctggtgatc 2280
aactccggga acggcgcagc gggtccggtg gtggacgcca ttgaagcccg ctttaaagcc 2340
ctcggcgcgc ccgtggaatt aatcaaagtg cacaacacgc cggacggcaa tttccccaac 2400
ggtattccta acccactact gccggaatgc cgcgacgaca cccgcaatgc ggtcatcaaa 2460
cacggcgcgg atatgggcat tgcttttgat ggcgattttg accgctgttt cctgtttgac 2520
gaaaaagggc agtttattga gggctactac attgtcggcc tgttggcaga agcattcctc 2580
gaaaaaaatc ccggcgcgaa gatcatccac gatccacgtc tctcctggaa caccgttgat 2640
gtggtgactg ccgcaggtgg cacgccggta atgtcgaaaa ccggacacgc ctttattaaa 2700
gaacgtatgc gcaaggaaga cgccatctat ggtggcgaaa tgagcgccca ccattacttc 2760
cgtgatttcg cttactgcga cagcggcatg atcccgtggc tgctggtcgc cgaactggtg 2820
tgcctgaaag ataaaacgct gggcgaactg gtacgcgacc ggatggcggc gtttccggca 2880
agcggtgaga tcaacagcaa actggcgcaa cccgttgagg cgattaaccg cgtggaacag 2940
cattttagcc gtgaggcgct ggcggtggat cgcaccgatg gcatcagcat gacctttgcc 3000
gactggcgct ttaacctgcg cacctccaat accgaaccgg tggtgcgcct gaatgtggaa 3060
tcgcgcggtg atgtgccgct gatggaagcg cgaacgcgaa ctctgctgac gttgctgaac 3120
gagtaaaaac gcggccgcga tatcgttgta aaacgacggc cagtgcaaga atcataaaaa 3180
atttatttgc tttcaggaaa atttttctgt ataatagatt cataaatttg agagaggagt 3240
ttttgtgagc ggataacaat tccccatctt agtatattag ttaagtataa atacaccgcg 3300
gaggacgaag gagatagaac catgtcaaaa gtcgctctca tcaccggtgt aaccggacaa 3360
gacggttctt acctggcaga gtttctgctg gaaaaaggtt acgaggtgca tggtattaag 3420
cgtcgcgcat cgtcattcaa caccgagcgc gtggatcaca tttatcagga tccgcacacc 3480
tgcaacccga aattccatct gcattatggc gacctgagtg atacctctaa cctgacgcgc 3540
attttgcgtg aagtacagcc ggatgaagtg tacaacctgg gcgcaatgag ccacgttgcg 3600
gtctcttttg agtcaccaga atataccgct gacgtcgacg cgatgggtac gctgcgcctg 3660
ctggaggcga tccgcttcct cggtctggaa aagaaaactc gtttctatca ggcttccacc 3720
tctgaactgt atggtctggt gcaggaaatt ccgcagaaag agaccacgcc gttctacccg 3780
cgatctccgt atgcggtcgc caaactgtac gcctactgga tcaccgttaa ctaccgtgaa 3840
tcctacggca tgtacgcctg taacggaatt ctcttcaacc atgaatcccc gcgccgcggc 3900
gaaaccttcg ttacccgcaa aatcacccgc gcaatcgcca acatcgccca ggggctggag 3960
tcgtgcctgt acctcggcaa tatggattcc ctgcgtgact ggggccacgc caaagactac 4020
gtaaaaatgc agtggatgat gctgcagcag gaacagccgg aagatttcgt tatcgcgacc 4080
ggcgttcagt actccgtgcg tcagttcgtg gaaatggcgg cagcacagct gggcatcaaa 4140
ctgcgctttg aaggcacggg cgttgaagag aagggcattg tggtttccgt caccgggcat 4200
gacgcgccgg gcgttaaacc gggtgatgtg attatcgctg ttgacccgcg ttacttccgt 4260
ccggctgaag ttgaaacgct gctcggcgac ccgaccaaag cgcacgaaaa actgggctgg 4320
aaaccggaaa tcaccctcag agagatggtg tctgaaatgg tggctaatga cctcgaagcg 4380
gcgaaaaaac actctctgct gaaatctcac ggctacgacg tggcgatcgc gctggagtca 4440
taagcatgag taaacaacga gtttttattg ctggtcatcg cgggatggtc ggttccgcca 4500
tcaggcggca gctcgaacag cgcggtgatg tggaactggt attacgcacc cgcgacgagc 4560
tgaacctgct ggacagccgc gccgtgcatg atttctttgc cagcgaacgt attgaccagg 4620
tctatctggc ggcggcgaaa gtgggcggca ttgttgccaa caacacctat ccggcggatt 4680
tcatctacca gaacatgatg attgagagca acatcattca cgccgcgcat cagaacgacg 4740
tgaacaaact gctgtttctc ggatcgtcct gcatctaccc gaaactggca aaacagccga 4800
tggcagaaag cgagttgttg cagggcacgc tggagccgac taacgagcct tatgctattg 4860
ccaaaatcgc cgggatcaaa ctgtgcgaat catacaaccg ccagtacgga cgcgattacc 4920
gctcagtcat gccgaccaac ctgtacgggc cacacgacaa cttccacccg agtaattcgc 4980
atgtgatccc agcattgctg cgtcgcttcc acgaggcgac ggcacagaat gcgccggacg 5040
tggtggtatg gggcagcggt acaccgatgc gcgaatttct gcacgtcgat gatatggcgg 5100
cggcgagcat tcatgtcatg gagctggcgc atgaagtctg gctggagaac acccagccga 5160
tgttgtcgca cattaacgtc ggcacgggcg ttgactgcac tatccgcgag ctggcgcaaa 5220
ccatcgccaa agtggtgggt tacaaaggcc gggtggtttt tgatgccagc aaaccggatg 5280
gcacgccgcg caaactgctg gatgtgacgc gcctgcatca gcttggctgg tatcacgaaa 5340
tctcactgga agcggggctt gccagcactt accagtggtt ccttgagaat caagaccgct 5400
ttcggggggg gagctaacgc gccatttaaa tcaacctcag cggtcatagc tgtttcctgt 5460
gactgagcaa taactagcat aaccccttgg ggcctctaaa cgggtcttga ggggtttttt 5520
gctgaaacca atttgcctgg cggcagtagc gcggtggtcc cacctgaccc catgccgaac 5580
tcagaagtga aacgccgtag cgccgatggt agtgtggggt ctccccatgc gagagtaggg 5640
aactgccagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgggatcc 5700
aggccggcct gttaacgaat taatcttccg cggcggtatc gataagcttg atatcgaatt 5760
ccgaagttcc tattctctag aaagtatagg aacttcaggt ctgaagagga gtttacgtcc 5820
agccaagcta gcttggctgc aggtcgtcga aattctaccg ggtaggggag gcgcttttcc 5880
caaggcagtc tggagcatgc gctttagcag ccccgctggg cacttggcgc tacacaagtg 5940
gcctctggcc tcgcacacat tccacatcca ccggtaggcg ccaaccggct ccgttctttg 6000
gtggcccctt cgcgccacct tctactcctc ccctagtcag gaagttcccc cccgccccgc 6060
agctcgcgtc gtgcaggacg tgacaaatgg aagtagcacg tctcactagt ctcgtgcaga 6120
tggacagcac cgctgagcaa tggaagcggg taggcctttg gggcagcggc caatagcagc 6180
tttgctcctt cgctttctgg gctcagaggc tgggaagggg tgggtccggg ggcgggctca 6240
ggggcgggct caggggcggg gcgggcgccc gaaggtcctc cggaggcccg gcattctgca 6300
cgcttcaaaa gcgcacgtct gccgcgctgt tctcctcttc ctcatctccg ggcctttcga 6360
cctgcagcct gttgacaatt aatcatcggc atagtatatc ggcatagtat aatacgacaa 6420
ggtgaggaac taaaccatgg gtcaaagtag cgatgaagcc aacgctcccg ttgcagggca 6480
gtttgcgctt cccctgagtg ccacctttgg cttaggggat cgcgtacgca agaaatctgg 6540
tgccgcttgg cagggtcaag tcgtcggttg gtattgcaca aaactcactc ctgaaggcta 6600
tgcggtcgag tccgaatccc acccaggctc agtgcaaatt tatcctgtgg ctgcacttga 6660
acgtgtggcc taatgagggg atcaattctc tagagctcgc tgatcagaag ttcctattct 6720
ctagaaagta taggaacttc gatggcgcct catccctgaa gccaataggg ataacagggt 6780
aat 6783
<210> 14
<211> 2851
<212> DNA
<213> 人工序列
<220>
<223> 整合盒
<400> 14
tggccagatg attaattcct aatttttgtt gacactctat cattgataga gttattttac 60
cactccctat cagtgataga gaaaagtgaa atgaatagtt cgacaaaaat ctagaaataa 120
ttttgtttaa ctttaagaag gagatataca aatgtactat ttaaaaaaca caaacttttg 180
gatgttcggt ttattctttt tcttttactt ttttatcatg ggagcctact tcccgttttt 240
cccgatttgg ctacatgaca tcaaccatat cagcaaaagt gatacgggta ttatttttgc 300
cgctatttct ctgttctcgc tattattcca accgctgttt ggtctgcttt ctgacaaact 360
cgggctgcgc aaatacctgc tgtggattat taccggcatg ttagtgatgt ttgcgccgtt 420
ctttattttt atcttcgggc cactgttaca atacaacatt ttagtaggat cgattgttgg 480
tggtatttat ctaggctttt gttttaacgc cggtgcgcca gcagtagagg catttattga 540
gaaagtcagc cgtcgcagta atttcgaatt tggtcgcgcg cggatgtttg gctgtgttgg 600
ctgggcgctg tgtgcctcga ttgtcggcat catgttcacc atcaataatc agtttgtttt 660
ctggctgggc tctggctgtg cactcatcct cgccgtttta ctctttttcg ccaaaacgga 720
tgcgccctct tctgccacgg ttgccaatgc ggtaggtgcc aaccattcgg catttagcct 780
taagctggca ctggaactgt tcagacagcc aaaactgtgg tttttgtcac tgtatgttat 840
tggcgtttcc tgcacctacg atgtttttga ccaacagttt gctaatttct ttacttcgtt 900
ctttgctacc ggtgaacagg gtacgcgggt atttggctac gtaacgacaa tgggcgaatt 960
acttaacgcc tcgattatgt tctttgcgcc actgatcatt aatcgcatcg gtgggaaaaa 1020
cgccctgctg ctggctggca ctattatgtc tgtacgtatt attggctcat cgttcgccac 1080
ctcagcgctg gaagtggtta ttctgaaaac gctgcatatg tttgaagtac cgttcctgct 1140
ggtgggctgc tttaaatata ttaccagcca gtttgaagtg cgtttttcag cgacgattta 1200
tctggtctgt ttctgcttct ttaagcaact ggcgatgatt tttatgtctg tactggcggg 1260
caatatgtat gaaagcatcg gtttccaggg cgcttatctg gtgctgggtc tggtggcgct 1320
gggcttcacc ttaatttccg tgttcacgct tagcggcccc ggcccgcttt ccctgctgcg 1380
tcgtcaggtg aatgaagtcg ctgggagcta agcggccgcg tcgacacgca aaaaggccat 1440
ccgtcaggat ggccttctgc ttaatttgat gcctggcagt ttatggcggg cgtcctgccc 1500
gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga tttgtcctac 1560
tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct ttcgactgag 1620
cctttcgttt tatttgatgc ctggcagttc cctactctcg catggggaga ccccacacta 1680
ccatcatgta tgaatatcct ccttagttcc tattccgaag ttcctattct ctagaaagta 1740
taggaacttc ggcgcgtcct acctgtgaca cgcgtgccgc agtctcacgc ccggagcgta 1800
gcgaccgagt gagctagcta tttgtttatt tttctaaata cattcaaata tgtatccgct 1860
catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga gtatgaggga 1920
agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca 1980
tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa 2040
gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg 2100
gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct 2160
ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc 2220
taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga 2280
gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt 2340
tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt 2400
tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga 2460
gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc 2520
gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt 2580
catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg cctcgcgcgc 2640
agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg tagtcggcaa 2700
ataatgtcta acaattcgtt caagccgagg ggccgcaaga tccggccacg atgacccggt 2760
cgtcgggtac cggcagggcg gggcgtaagg cgcgccattt aaatgaagtt cctattccga 2820
agttcctatt ctctagaaag tataggaact t 2851
<210> 15
<211> 2858
<212> DNA
<213> 人工序列
<220>
<223> 整合盒
<400> 15
ggccagatga ttaattccta atttttgttg acactctatc attgatagag ttattttacc 60
actccctatc agtgatagag aaaagtgaaa tgaatagttc gacaaaaatc tagaaataat 120
tttgtttaac tttaagaagg agatatacaa atgggcagca ttattcgtct gcagggtggt 180
ctgggtaatc agctgtttca gtttagcttt ggttatgccc tgagcaaaat taatggtaca 240
ccgctgtatt tcgacattag ccattatgcc gaaaacgatg atcatggtgg ttatcgtctg 300
aataatctgc agattccgga agaatatctg cagtattata ccccgaaaat taataatatt 360
tataaactgc tggtgcgtgg cagccgtctg tatccggata tttttctgtt tctgggcttt 420
tgcaacgaat ttcatgccta tggctacgat tttgaatata ttgcccagaa atggaaaagc 480
aaaaaataca ttggctactg gcagagcgaa cacttttttc ataaacatat tctggacctg 540
aaagaatttt ttattccgaa aaatgtgagc gaacaggcaa atctgctggc agcaaaaatt 600
ctggaaagcc agagcagcct gagcattcat attcgtcgtg gcgattatat taaaaacaaa 660
accgcaaccc tgacacatgg tgtttgtagc ctggaatatt ataaaaaagc cctgaacaaa 720
atccgcgatc tggcaatgat tcgtgatgtg tttatcttta gcgacgatat cttctggtgc 780
aaagaaaata ttgaaaccct gctgagcaaa aaatataata tttattatag cgaagatctg 840
agccaagaag aggatctgtg gctgatgagc ctggcaaatc atcatattat tgccaatagc 900
agctttagtt ggtggggtgc atatctgggt agcagcgcaa gccagattgt tatttatccg 960
accccgtggt atgatattac cccgaaaaac acctatatcc cgattgtgaa ccattggatc 1020
aacgttgata aacatagcag ctgctaagcg gccgcgtcga cacgcaaaaa ggccatccgt 1080
caggatggcc ttctgcttaa tttgatgcct ggcagtttat ggcgggcgtc ctgcccgcca 1140
ccctccgggc cgttgcttcg caacgttcaa atccgctccc ggcggatttg tcctactcag 1200
gagagcgttc accgacaaac aacagataaa acgaaaggcc cagtctttcg actgagcctt 1260
tcgttttatt tgatgcctgg cagttcccta ctctcgcatg gggagacccc acactaccat 1320
catgtatgaa tatcctcctt agttcctatt ccgaagttcc tattctctag aaagtatagg 1380
aacttcggcg cgtcctacct gtgacacgcg tcaagatccc ctcacgctgc cgcaagcact 1440
cagggcgcaa gggctgctaa aggaagcgga acacgtagaa agccagtccg cagaaacggt 1500
gctgaccccg gatgaatgtc agctactggg ctatctggac aagggaaaac gcaagcgcaa 1560
agagaaagca ggtagcttgc agtgggctta catggcgata gctagactgg gcggttttat 1620
ggacagcaag cgaaccggaa ttgccagctg gggcgccctc tggtaaggtt gggaagccct 1680
gcaaagtaaa ctggatggct ttcttgccgc caaggatctg atggcgcagg ggatcaagat 1740
ctgatcaaga gacaggatga ggatcgtttc gcatgattga acaagatgga ttgcacgcag 1800
gttctccggc cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg 1860
gctgctctga tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca 1920
agaccgacct gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc 1980
tggccacgac gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg 2040
actggctgct attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg 2100
ccgagaaagt atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta 2160
cctgcccatt cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag 2220
ccggtcttgt cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac 2280
tgttcgccag gctcaaggcg cgcatgcccg acggcgagga tctcgtcgtg acccatggcg 2340
atgcctgctt gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg 2400
gccggctggg tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg 2460
aagagcttgg cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg 2520
attcgcagcg catcgccttc tatcgccttc ttgacgagtt cttctgagcg ggactctggg 2580
gttcgaaatg accgaccaag cgacgcccaa cctgccatca cgagatttcg attccaccgc 2640
cgccttctat gaaaggttgg gcttcggaat cgttttccgg gacgccggct ggatgatcct 2700
ccagcgcggg gatctcatgc tggagttctt cgcccacccc agcttcaaaa gcgctctcgg 2760
taccggcagg gcggggcgta aggcgcgcca tttaaatgaa gttcctattc cgaagttcct 2820
attctctaga aagtatagga acttcgaagc agctccag 2858
<210> 16
<211> 2631
<212> DNA
<213> 人工序列
<220>
<223> 整合盒
<400> 16
ggccagatga ttaattccta atttttgttg acactctatc attgatagag ttattttacc 60
actccctatc agtgatagag aaaagtgaaa tgaatagttc gacaaaaatc tagaaataat 120
tttgtttaac tttaagaagg agatatacaa atgaagtcgg cactgacctt ttcccgtcgc 180
atcaatccgg tgtttctggc gttctttgtc gttgcttttc tgagcggtat cgcaggcgca 240
ctgcaggctc cgaccctgag tctgtttctg tccacggaag tgaaagttcg tccgctgtgg 300
gttggtctgt tctataccgt caacgcaatc gctggcatta cggttagctt tatcctggcg 360
aaacgttcag attcgcgcgg tgaccgtcgc aagctgatta tggtgtgcta tctgatggcg 420
gttggcaact gtctgctgtt tgccttcaat cgtgattacc tgaccctgat cacggcaggt 480
gtgctgctgg cgagcgttgc caacaccgca atgccgcaga ttttcgcgct ggcccgtgaa 540
tatgccgaca gctctgcacg cgaagtggtt atgtttagtt ccatcatgcg cgctcaactg 600
agtctggcat gggtgattgg tccgccgctg tcctttatgc tggcgctgaa ttacggtttt 660
accctgatgt tctcaatcgc ggccggcatt ttcgttctgt cggccctggt cgtgtggttt 720
atcctgccga gtgtcccgcg tgcagaaccg gttgtcgatg caccggtggt tgtccagggt 780
tcactgttcg cagacaaaaa cgttctgctg ctgtttatcg cgtcgatgct gatgtggacc 840
tgcaatacga tgtatattat cgatatgccg ctgtacatta ccgcaagcct gggtctgccg 900
gaacgtctgg ctggtctgct gatgggtacc gcagctggcc tggaaattcc gatcatgctg 960
ctggcgggtt attctgtgcg ttactttggc aaacgcaaga ttatgctgtt cgctgttctg 1020
gcgggtgtcc tgttttatac cggcctggtt ctgtttaaat tcaagacggc cctgatgctg 1080
ctgcagatct ttaacgcaat tttcatcggt attgtggctg gcattggtat gctgtacttc 1140
caagatctga tgccgggtcg tgcaggtgca gcaaccacgc tgtttaccaa tagcatctct 1200
acgggtgtca ttctggcagg cgtgctgcaa ggcggtctga ccgaaacgtg gggccatgac 1260
agcgtctatg tgatggcgat ggtcctgtct attctggccc tgattatctg tgcacgtgtg 1320
cgcgaagctt aaatcgatac tagcataacc ccttggggcc tctaaacgcg tcgacacgca 1380
aaaaggccat ccgtcaggat ggccttctgc ttaatttgat gcctggcagt ttatggcggg 1440
cgtcctgccc gccaccctcc gggccgttgc ttcgcaacgt tcaaatccgc tcccggcgga 1500
tttgtcctac tcaggagagc gttcaccgac aaacaacaga taaaacgaaa ggcccagtct 1560
ttcgactgag cctttcgttt tatttgatgc ctggcagttc cctactctcg catggggaga 1620
ccccacacta ccatcatgta tgaatatcct ccttagttcc tattccgaag ttcctattct 1680
ctagaaagta taggaacttc ggcgcgtcct acctgtgacg gaagatcact tcgcagaata 1740
aataaatcct ggtgtccctg ttgataccgg gaagccctgg gccaactttt ggcgaaaatg 1800
agacgttgat cggcacgtaa gaggttccaa ctttcaccat aatgaaataa gatcactacc 1860
gggcgtattt tttgagttgt cgagattttc aggagctaag gaagctaaaa tggagaaaaa 1920
aatcactgga tataccaccg ttgatatatc ccaatggcat cgtaaagaac attttgaggc 1980
atttcagtca gttgctcaat gtacctataa ccagaccgtt cagctggata ttacggcctt 2040
tttaaagacc gtaaagaaaa ataagcacaa gttttatccg gcctttattc acattcttgc 2100
ccgcctgatg aatgctcatc cggaattacg tatggcaatg aaagacggtg agctggtgat 2160
atgggatagt gttcaccctt gttacaccgt tttccatgag caaactgaaa cgttttcatc 2220
gctctggagt gaataccacg acgatttccg gcagtttcta cacatatatt cgcaagatgt 2280
ggcgtgttac ggtgaaaacc tggcctattt ccctaaaggg tttattgaga atatgttttt 2340
cgtctcagcc aatccctggg tgagtttcac cagttttgat ttaaacgtgg ccaatatgga 2400
caacttcttc gcccccgttt tcaccatggg caaatattat acgcaaggcg acaaggtgct 2460
gatgccgctg gcgattcagg ttcatcatgc cgtttgtgat ggcttccatg tcggcagatg 2520
cttaatgaat acaacagtac tgcgatgagt ggcagggcgg ggcgtaaggc gcgccattta 2580
aatgaagttc ctattccgaa gttcctattc tctagaaagt ataggaactt c 2631
<210> 17
<211> 4259
<212> DNA
<213> 人工序列
<220>
<223> 整合盒
<400> 17
ttactcagca ataaactgat attccgtcag gctggaatac tcttcgccag gacgcaggaa 60
gcagtccggt tgcggccatt cagggtggtt cgggctgtcc ggtagaaact cgctttccag 120
agccagccct tgccagtcgg cgtaaggttc ggttccccgc gacggtgtgc cgccgaggaa 180
gttgccggag tagaattgca gagccggagc ggtggtgtag accttcagct gcaatttttc 240
atctgctgac cagacatgcg ccgccacttt cttgccatcg cctttggcct gtaacaagaa 300
tgcgtgatcg taacctttca ctttgcgctg atcgtcgtcg gcaagaaact cactggcgat 360
gattttggcg ctgcggaaat caaaagacgt tccggcgaca gatttcaggc cgtcgtgcgg 420
aatgccgcct tcatcaaccg gcagatattc gtccgccaga atctgcaact tgtgattgcg 480
cacgtcagac tgctcgccgt caagattgaa atagacgtga ttagtcatat tcaccgggca 540
aggtttatca actgtggcgc gataagtaat ggagatacgg ttatcgtcgg tcagacgata 600
ttgcaccgtc gcgccgagat tacccgggaa gccctgatca ccatcatctg aactcagggc 660
aaacagcacc tgacgatcgt tctggttcac aatctgccag cgacgtttgt cgaacccttc 720
cggcccgccg tgcagctggt taacgccctg acttggcgaa agcgtcacgg tttcaccgtc 780
aaaggtataa cggctattgg cgatacggtt ggcataacga ccaatagagg cccccagaaa 840
cgcggcctga tcctgatagc attccgggct ggcacagccg agcagcgcct cgcggacgct 900
gccatcggaa agcggaatac gggcggaaag taaagtcgca ccccagtcca tcagcgtgac 960
taccatccct gcgttgttac gcaaagttaa cagtcggtac ggctgaccat cgggtgccag 1020
tgcgggagtt tcgttcagca ctgtcctgct ccttgtgatg gtttacaaac gtaaaaagtc 1080
tctttaatac ctgtttttgc ttcatattgt tcagcgacag cttgctgtac ggcaggcacc 1140
agctcttccg ggatcagcgc gacgatacag ccgccaaatc cgccgccggt catgcgtacg 1200
ccacctttgt cgccaatcac agctttgacg atttctacca gagtgtcaat ttgcggcacg 1260
gtgatttcga aatcatcgcg catagaggca tgagactccg ccatcaactc gcccatacgt 1320
ttcaggtcgc cttgctccag cgcgctggca gcttcaacgg tgcgggcgtt ttcagtcagt 1380
atatgacgca cgcgttttgc cacgatcggg tccagttcat gcgcaacagc gttgaactct 1440
tcaatggtga catcacgcag ggctggctgc tggaagaaac gcgcaccggt ttcgcactgt 1500
tcacgacggg tgttgtattc gctgccaacc agggtacgtt tgaagttact gttgatgatg 1560
acgacagcca cacctttggg catggaaact gctttggtcc ccagtgagcg gcaatcgatc 1620
agcaaggcat gatctttctt gccgagcgcg gaaattagct gatccatgat cccgcagtta 1680
cagcctacaa actggttttc tgcttcctga ccgttaagcg cgatttgtgc gccgtccagc 1740
ggcagatgat aaagctgctg caatacggtt ccgaccgcga cttccagtga agcggaagaa 1800
cttaacccgg caccctgcgg cacattgccg ctgatcacca tgtccacgcc gccgaagctg 1860
ttgttacgca gttgcagatg tttcaccacg ccacgaacgt agttagccca ttgatagttt 1920
tcatgtgcga caatgggcgc atcgagggaa aactcgtcga gctgattttc ataatcggct 1980
gccatcacgc gaactttacg gtcatcgcgt ggtgcacaac tgatcacggt ttgataatca 2040
atcgcgcagg gcagaacgaa accgtcgttg tagtcggtgt gttcaccaat caaattcacg 2100
cggccaggcg cctgaatggt gtgagtggca gggtagccaa atgcgttggc aaacagagat 2160
tgtgtttttt ctttcagact catttcttac actccggatt cgcgaaaatg gatatcgctg 2220
actgcgcgca aacgctctgc tgcctgttct gcggtcaggt ctcgctgggt ctctgccagc 2280
atttcataac caaccataaa tttacgtacg gtggcggagc gcagcagagg cggataaaag 2340
tgcgcgtgca gctgccagtg ttgattctct tcgccattaa atggcgcgcc gtgccagccc 2400
atagagtagg ggaaggagca ctggaagagg ttgtcataac gactggtcag ctttttcaac 2460
gccagcgcca gatcgctgcg ctgggcgtcg gtcaaatcgg tgatccgtaa aacgtgggct 2520
ttgggcagca gtagcgtttc gaacggccag gcagcccagt aaggcacgac ggctaaccag 2580
tgttcggttt cgacaacggt acggctaccg tctgccagct cgcgctgaac ataatccacc 2640
agcattggtg atttctgttc ggcaaaatat tctttttgca ggcggtcttc gcgctcagct 2700
tcgttaggca ggaagctatt tgcccaaatc tgaccgtgcg gatgcgggtt agagcagccc 2760
atcgccgcgc ctttgttttc aaaaacctgc acccatgggt acgttttccc cagttctgcg 2820
gtttgctcct gccaggtttt gacgatttcc gtcaatgctg caacgctgag ctctggcagc 2880
gttttactgt gatccggtga aaagcagatc acccggctgg tgccgcgcgc gctctggcaa 2940
cgcatcagcg gatcgtgact ttctggcgca tctggcgtgt cagacatcaa agccgcaaag 3000
tcattagtga aaacgtaagt cccggtgtaa tcggggtttt tatcgcctgt cacccgcaca 3060
ttacctgcgc agaggaagca atctggatcg tgcgcaggta acacctgttt ggctggcgtt 3120
tcctgcgccc cctgccaggg gcgcttagcg cggtgcggtg aaaccagaat ccattgcccg 3180
gtgagcgggt tgtagcggcg atgtggatga tcaacgggat taaattgcgt catggtcgtt 3240
ccttaatcgg gatatccctg tggatggcgt gactgccagt gccaggtgtc ctgcgccatt 3300
tcatcgagtg tgcgcgttac gcgccagttc agttcacggt cggctttgct ggcgtccgcc 3360
cagtaggccg gaaggtcgcc ctcgcgacgc ggtgcaaaat gataattaac cggtttgccg 3420
caggctttgc tgaaggcatt aaccacgtcc agcacgctgt tgcctacgcc agcgccgagg 3480
ttgtagatgt gtacgcctgg cttgttcgcc agtttttcca tcgccacgac gtgaccgtcc 3540
gccagatcca ttacgtggat gtaatcgcgt acgccagtac catcttcggt cggataatcg 3600
ttaccaaaaa tcgccagcga gtcgcgacgg cctacagcaa cctgggcgat gtatggcatc 3660
aggttattcg gaatgccttg cggatcttcg cccatatcgc ccgacggatg cgcgccaacc 3720
gggttgaagt agcgcagcag ggcaatgctc cagtccggct gggctttttg cagatcggtg 3780
aggatctgtt ccaccatcag cttgcttttg ccgtaagggc tttgcggtgt gccggtcggg 3840
aagctttcaa cgtatggaat tttgggctga tcgccataaa cggtggcgga ggagctaaaa 3900
ataaagtttt tgacgttagc ggcgcgcatg gcgctaatca ggcgcagagt gccgttgaca 3960
ttgttgtcgt aatattccag cggtttttgt accgattcgc ccacggcttt cagcccggcg 4020
aagtggatca cggtgtcgat agcgtgatcg tgcaggatct cggtcatcaa cgcttcgtta 4080
cgaatatcgc cttcaacaaa cgttggatgt ttgccgccta aacgctcgat aacaggcagt 4140
acgctgcgct tactgttaca gaggttatca agaatgatga catcatgacc gttttgcagt 4200
aattgcacac aggtatgact tccaatgtaa ccgctaccac cggtaaccag aactctcat 4259
<210> 18
<211> 4223
<212> DNA
<213> 人工序列
<220>
<223> 整合盒
<400> 18
tggccagatg attaattcct aatttttgtt gacactctat cattgataga gttattttac 60
cactccctat cagtgataga gaaaagtgaa atgaatagtt cgacaaaaat ctagaaataa 120
ttttgtttaa ctttaagaag gagatataca aatgcaaaaa ctactatctt taccgtccaa 180
tctggttcag tcttttcatg aactggagag ggtgaatcgt accgattggt tttgtacttc 240
cgacccggta ggtaagaaac ttggttccgg tggtggaaca tcctggctgc ttgaagaatg 300
ttataatgaa tattcagatg gtgctacttt tggagagtgg cttgaaaaag aaaaaagaat 360
tcttcttcat gcgggtgggc aaagccgtcg tttacccggc tatgcacctt ctggaaagat 420
tctcactccg gttcctgtgt tccggtggga gagagggcaa catctgggac aaaatctgct 480
ttctctgcaa cttcccctat atgaaaaaat catgtctttg gctccggata aactccatac 540
actgattgcg agtggtgatg tctatattcg ttcggagaaa cctttgcaga gtattcccga 600
agcggatgtg gtttgttatg gactgtgggt agatccgtct ctggctaccc atcatggcgt 660
gtttgcttcc gatcgcaaac atcccgaaca actcgacttt atgcttcaga agccttcgtt 720
ggcagaattg gaatctttat cgaagaccca tttgttcctg atggacatcg gtatatggct 780
tttgagtgac cgtgccgtag aaatcttgat gaaacgttct cataaagaaa gctctgaaga 840
actaaagtat tatgatcttt attccgattt tggattagct ttgggaactc atccccgtat 900
tgaagacgaa gaggtcaata cgctatccgt tgctattctg cctttgccgg gaggagagtt 960
ctatcattac gggaccagta aagaactgat ttcttcaact ctttccgtac agaataaggt 1020
ttacgatcag cgtcgtatca tgcaccgtaa agtaaagccc aatccggcta tgtttgtcca 1080
aaatgctgtc gtgcggatac ctctttgtgc cgagaatgct gatttatgga tcgagaacag 1140
tcatatcgga ccaaagtgga agattgcttc acgacatatt attaccgggg ttccggaaaa 1200
tgactggtca ttggctgtgc ctgccggagt gtgtgtagat gtggttccga tgggtgataa 1260
gggctttgtt gcccgtccat acggtctgga cgatgttttc aaaggagatt tgagagattc 1320
caaaacaacc ctgacgggta ttccttttgg tgaatggatg tccaaacgcg gtttgtcata 1380
tacagatttg aaaggacgta cggacgattt acaggcagtt tccgtattcc ctatggttaa 1440
ttctgtagaa gagttgggat tggtgttgag gtggatgttg tccgaacccg aactggagga 1500
aggaaagaat atctggttac gttccgaaca tttttctgcg gacgaaattt cggcaggtgc 1560
caatctgaag cgtttgtatg cacaacgtga agagttcaga aaaggaaact ggaaagcatt 1620
ggccgttaat catgaaaaaa gtgtttttta tcaacttgat ttggccgatg cagctgaaga 1680
ttttgtacgt cttggtttgg atatgcctga attattgcct gaggatgctc tgcagatgtc 1740
acgcatccat aaccggatgt tgcgtgcgcg tattttgaaa ttagacggga aagattatcg 1800
tccggaagaa caggctgctt ttgatttgct tcgtgacggc ttgctggacg ggatcagtaa 1860
tcgtaagagt accccaaaat tggatgtata ttccgatcag attgtttggg gacgtagccc 1920
cgtgcgcatc gatatggcag gtggatggac cgatactcct ccttattcac tttattcggg 1980
aggaaatgtg gtgaatctag ccattgagtt gaacggacaa cctcccttac aggtctatgt 2040
gaagccgtgt aaagacttcc atatcgtcct gcgttctatc gatatgggtg ctatggaaat 2100
agtatctacg tttgatgaat tgcaagatta taagaagatc ggttcacctt tctctattcc 2160
gaaagccgct ctgtcattgg caggctttgc acctgcgttt tctgctgtat cttatgcttc 2220
attagaggaa cagcttaaag atttcggtgc aggtattgaa gtgactttat tggctgctat 2280
tcctgccggt tccggtttgg gcaccagttc cattctggct tctaccgtac ttggtgccat 2340
taacgatttc tgtggtttag cctgggataa aaatgagatt tgtcaacgta ctcttgttct 2400
tgaacaattg ctgactaccg gaggtggatg gcaggatcag tatggaggtg tgttgcaggg 2460
tgtgaagctt cttcagaccg aggccggctt tgctcaaagt ccattggtgc gttggctacc 2520
cgatcattta tttacgcatc ctgaatacaa agactgtcac ttgctttatt ataccggtat 2580
aactcgtacg gcaaaaggga tcttggcaga aatagtcagt tccatgttcc tcaattcatc 2640
gttgcatctc aatttacttt cggaaatgaa ggcgcatgca ttggatatga atgaagctat 2700
acagcgtgga agttttgttg agtttggccg tttggtagga aaaacctggg aacaaaacaa 2760
agcattggat agcggaacaa atcctccggc tgtggaggca attatcgatc tgataaaaga 2820
ttataccttg ggatataaat tgccgggagc cggtggtggc gggtacttat atatggtagc 2880
gaaagatccg caagctgctg ttcgtattcg taagatactg acagaaaacg ctccgaatcc 2940
gcgggcacgt tttgtcgaaa tgacgttatc tgataaggga ttccaagtat cacgatcata 3000
actgaaacca atttgcctgg cggcagtagc gcggtggtcc cacctgaccc catgccgaac 3060
tcagaagtga aacgccgtag cgccgatggt agtgtggggt ctccccatgc gagagtaggg 3120
aactgccagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgggatcc 3180
aggccggcct gttaagacgg ccagtgaatt cgagctcggt acctaccgtt cgtataatgt 3240
atgctatacg aagttatcga gctctagaga atgatcccct cattaggcca cacgttcaag 3300
tgcagcgcac accgtggaaa cggatgaagg cacgaaccca gttgacataa gcctgttcgg 3360
ttcgtaaact gtaatgcaag tagcgtatgc gctcacgcaa ctggtccaga accttgaccg 3420
aacgcagcgg tggtaacggc gcagtggcgg ttttcatggc ttgttatgac tgtttttttg 3480
tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3540
tgttatggag cagcaacgat gttacgcagc agcaacgatg ttacgcagca gggcagtcgc 3600
cctaaaacaa agttaggtgg ctcaagtatg ggcatcattc gcacatgtag gctcggccct 3660
gaccaagtca aatccatgcg ggctgctctt gatcttttcg gtcgtgagtt cggagacgta 3720
gccacctact cccaacatca gccggactcc gattacctcg ggaacttgct ccgtagtaag 3780
acattcatcg cgcttgctgc cttcgaccaa gaagcggttg ttggcgctct cgcggcttac 3840
gttctgccca ggtttgagca gccgcgtagt gagatctata tctatgatct cgcagtctcc 3900
ggcgagcacc ggaggcaggg cattgccacc gcgctcatca atctcctcaa gcatgaggcc 3960
aacgcgcttg gtgcttatgt gatctacgtg caagcagatt acggtgacga tcccgcagtg 4020
gctctctata caaagttggg catacgggaa gaagtgatgc actttgatat cgacccaagt 4080
accgccacct aacaattcgt tcaagccgag atcgtagaat ttcgacgacc tgcagccaag 4140
cataacttcg tataatgtat gctatacgaa cggtaggatc ctctagagtc gacctgcagg 4200
catgagatgt gtataagaga cag 4223
<210> 19
<211> 3792
<212> DNA
<213> 人工序列
<220>
<223> 整合盒
<400> 19
gggaattgat tctggtacca aatgagtcga ccggccagat gattaattcc taatttttgt 60
tgacactcta tcattgatag agttatttta ccactcccta tcagtgatag agaaaagtga 120
aatgaatagt tcgacaaaaa tctagaaata attttgttta actttaagaa ggagatatac 180
aaatgattac ccgcaaaagg cgggccagga caatccatag ccgatatcca atcggaattt 240
acgggagcat agtaatgaca gatattgcac agttgcttgg caaagacgcc gacaaccttt 300
tacagcaccg ttgtatgact attccttctg accagcttta tctccccgga catgactacg 360
tagaccgcgt gatgattgac aataatcgcc cgccagcggt gttacgtaat atgcagacgt 420
tgtacaacac tgggcgtctg gctggcacag gatatctttc tattctgccg gttgaccagg 480
gcgttgagca ctctgccgga gcttcatttg ctgctaaccc gctctacttt gacccgaaaa 540
acattgttga actggcgatc gaagcgggct gtaactgtgt ggcatcaact tacggcgtgt 600
tggcgtcggt atcgcggcgc tatgcgcatc gcattccatt cctcgtcaaa cttaatcaca 660
acgagacgct aagttacccg aacacctacg atcaaacgct gtatgccagc gtggagcagg 720
ccttcaacat gggcgcggtg gcggttggtg cgactatcta ttttggttcg gaagagtcac 780
gtcgccagat tgaagaaatt tctgcggctt ttgaacgtgc gcacgagctg ggcatggtga 840
cagtgctgtg ggcctatttg cgtaactccg cctttaagaa agatggcgtt gattaccatg 900
tttccgccga cctgaccggt caggcaaacc atctggcggc gaccataggt gcagatatcg 960
tcaaacaaaa aatggcggaa aataacggcg gctataaagc aattaattac ggttataccg 1020
acgatcgcgt gtacagcaag ttaaccagcg aaaacccgat tgatctggtg cgttatcagt 1080
tagctaactg ctatatgggc cgggccgggt tgataaactc cggcggtgct gcaggcggtg 1140
aaactgacct cagcgatgca gtgcgtactg cggttatcaa caaacgcgct ggcggaatgg 1200
ggctgattct tggacgtaag gcgttcaaga aatcgatggc tgacggcgtg aaactgatta 1260
acgccgtgca ggatgtttat ctcgatagca aaattactat cgcctaagag gatcgagatc 1320
tcgatcccgc gaaattaata cgactcacta taggggaatt gtgagcggat aacaattccc 1380
ctctagaaat aattttgttt aactttaaga aggagatata ccatgggcca tcatcatcat 1440
catcatcatc atcatcacag cagcggccat atcgaaggtc gtcatatggc ggtgaaagaa 1500
gcgaccagcg agaccaagaa gcgtagcggt tacgagatca ttaccctgac cagctggctg 1560
ctgcaacaag aacagaaggg tatcattgac gcggaactga ccatcgttct gagcagcatt 1620
agcatggcgt gcaaacagat cgcgagcctg gtgcaacgtg cgaacattag caacctgacc 1680
ggtacccaag gcgcggttaa catccagggt gaagaccaaa agaaactgga tgttattagc 1740
aacgaggtgt tcagcaactg cctgcgtagc agcggtcgta ccggcatcat tgcgagcgag 1800
gaagaggacg tggcggttgc ggtggaagag agctacagcg gtaactatat cgtggttttt 1860
gacccgctgg atggcagcag caacctggat gcggctgtga gcaccggtag catcttcggc 1920
atttacagcc cgaacgacga gagcctgccg gattttggtg acgatagcga cgataacacc 1980
ctgggcaccg aagagcaacg ttgcatcgtt aacgtgtgcc aaccgggtag caacctgctg 2040
gcggcgggct actgcatgta tagcagcagc gttgcgttcg tgctgaccat tggcaagggc 2100
gttttcgtgt ttaccctgga cccgctgtac ggtgaattcg tgctgaccca ggagaacctg 2160
caaatcccga agagcggtga aatttacagc tttaacgagg gcaactataa actgtgggat 2220
gaaaacctga agaaatatat cgacgatctg aaggaaccgg gtccgagcgg taaaccgtac 2280
agcgcgcgtt atatcggtag cctggttggc gacttccacc gtaccctgct gtacggtggc 2340
atttacggtt atccgcgtga taagaaaagc aagaacggca aactgcgtct gctgtatgaa 2400
tgcgcgccga tgagctttat tgttgagcag gcgggtggca aaggtagcga cggccaccag 2460
cgtgtgctgg atatccaacc gaccgaaatt caccagcgtg ttccgctgta cattggtagc 2520
accgaagagg ttgaaaaagt tgaaaagtat ctggcgtaat cgagtctggt aaagaaaccg 2580
ctgctgcgaa atttgaacgc cagcacatgg actcgtctac tagcgcagct taattaacct 2640
aggctgctgc caccgctgag caataactag cataacccct tggggcctct aaacgggtct 2700
tgaggggttt tttgctgaaa ggaggaacta tatccggatt ggcgaatggg acgcgccctg 2760
tagcggcgca ttaagcgcgg cgggtggacg gccagtgaat tcgagctcgg tacctaccgt 2820
tcgtataatg tatgctatac gaagttatcg agctctagag aatgatcccc tcattaggcc 2880
acacgttcaa gtgcagcgca caccgtggaa acggatgaag gcacgaaccc agttgacata 2940
agcctgttcg gttcgtaaac tgtaatgcaa gtagcgtatg cgctcacgca actggtccag 3000
aaccttgacc gaacgcagcg gtggtaacgg cgcagtggcg gttttcatgg cttgttatga 3060
ctgttttttt gtacagtcta tgcctcgggc atccaagcag caagcgcgtt acgccgtggg 3120
tcgatgtttg atgttatgga gcagcaacga tgttacgcag cagcaacgat gttacgcagc 3180
agggcagtcg ccctaaaaca aagttaggtg gctcaagtat gggcatcatt cgcacatgta 3240
ggctcggccc tgaccaagtc aaatccatgc gggctgctct tgatcttttc ggtcgtgagt 3300
tcggagacgt agccacctac tcccaacatc agccggactc cgattacctc gggaacttgc 3360
tccgtagtaa gacattcatc gcgcttgctg ccttcgacca agaagcggtt gttggcgctc 3420
tcgcggctta cgttctgccc aggtttgagc agccgcgtag tgagatctat atctatgatc 3480
tcgcagtctc cggcgagcac cggaggcagg gcattgccac cgcgctcatc aatctcctca 3540
agcatgaggc caacgcgctt ggtgcttatg tgatctacgt gcaagcagat tacggtgacg 3600
atcccgcagt ggctctctat acaaagttgg gcatacggga agaagtgatg cactttgata 3660
tcgacccaag taccgccacc taacaattcg ttcaagccga gatcgtagaa tttcgacgac 3720
ctgcagccaa gcataacttc gtataatgta tgctatacga acggtaggat cctctagagt 3780
cgacctgcag gc 3792
<210> 20
<211> 5917
<212> DNA
<213> 人工序列
<220>
<223> 转座子盒
<400> 20
acaggttggc tgataagtcc ccggtctagc ttgcatgcag attgcagcat tacacgtctt 60
gatttgacgg ctagctcagt cctaggtaca gtgctagcac tgctttgtgg aaggagatag 120
acttatggcg gatccgatgg aatacctcga tgtgtcgttc ggcggcacgt tcgctgcaga 180
cacctacacc acaggtggcg acgaggtggc gaagggcccc gtgaccaagc acggcagcat 240
accgaccaag cttgacggcg gcggcatcac cctcgctggc ggcaccaacg gcgtgacatt 300
cacctcgacc gcgagcttca gcgagagtgg gaaggtgaac aagggattcc gcgccgaaat 360
ggagtaccgt acgacgcaga cgcccagcaa cctcgccaca ttgttctccg ccatgggcaa 420
catcttcgtg cgggcgaacg gcagcaacct cgaatacggc ttctccacga acccttccgg 480
cagtacatgg aacgactaca caaagtccgt gacgctgcct tccaacaatg tgaagcacat 540
catccagctg acatatctgc cgggagccga cggcgctgcc tcgacgttgc agttgtcggt 600
ggatggcgtg gccggcgaga ccgccacctc cgcggccggc gagctcgcgg ccgtcagcga 660
ttccgtcggg aacaagttcg ggatcggcta cgaggtgaac cccgcttccg gcgcggcgag 720
ccgcggtctt gccggtgacg tgttccgcgc gcgtgtcgcc gattcggacg ccccgtggga 780
gattcttgac gcatcccagc tgctgcatgt caatttcaac ggcacgttca gcggcacctc 840
atataccgcg gcgagcggcg agcagatgct gggctcgctg gtgtcgcgct cggccaatcc 900
gtccatctcg aactccgccg tcacgctggg cggcggcacg gccggattcg atttcacgcc 960
cacggacttc accctcggtg acaacgaggc catcacccgc ccgctggtcg cggagctgcg 1020
cttcaccccg acgcagaccg gcgacaacca gaccctgttc ggcgcgggcg gcaacctgtt 1080
cctgcgctac gagtcgaaca agctcgtgtt cggcgcctcc accaagtccg gcgataattg 1140
gaccgaccac aagatcgagt ccgcggccgc cacgggtgcg gagcacgtcg tgtcggtggc 1200
gtacgtgccc aataaggccg gcaccggcgc gaagcttgtc atgcgcgtgg atggcggcga 1260
cgcccagacc aaggacatca ctggtctggc ttacctgaat tcgagcatca agggcaaggt 1320
cggcttcggc aacgacgtgc ataccgacgc gctcagccgc ggcttcgtcg gctcgctgag 1380
cgagatccgc ctggccgaaa cctccgcgaa cttcaccacc aacgaattca agctggtcta 1440
ctctcaggtc agctgcgaca cgtcgggcat caaggaggcg aataccttcg acgtggagcc 1500
cgccgagtgc gaggccgcgc ttaagaccaa gctgtccaag ctgcgtccga ccgaagggca 1560
ggccgactac atcgactggg gtcagatcgg attcctccat tacggcatca acacgtacta 1620
caaccaggag tggggtcacg gtaacgagga tccctcccgc atcaacccga ccggcctcga 1680
caccgaccag tgggcgaagt ccttcgccga cggtggcttc aagatgatca tggtgacggt 1740
caagcaccat gacggtttcg agctgtacga ctcgcggtac aacaccgagc acgactgggc 1800
aaacaccgcc gtcgccaagc gcacggggga gaaggacctg ttccgcaaga ttgtcgcctc 1860
ggcgaagaaa tacggcctga aggtcggcat ctactattcg ccggccgatt cctacatgga 1920
gaggaagggc gtctggggca acaactccgc acgcgtcgag cgcacgatcc ccacgctggt 1980
ggagaacgac gaccgcgccg gcaaggtggc ttccggcaaa ctgcccacgt tcaagtacaa 2040
ggccacggat tacggcgcct acatgctcaa ccagctctat gagctgctga ctgagtacgg 2100
cgacatctcc gaggtctggt tcgacggtgc ccaaggcaac accgcaggca ctgagcatta 2160
cgactatggc gtgttctacg agatgatccg ccggcttcag ccccaggcaa ttcaggccaa 2220
cgccgcatac gatgcccgat gggtgggcaa cgaggacggc tgggcccgtc agaccgagtg 2280
gagcccgcag gcggcataca acgacggcgt ggacaaggtg tcgctcaagc ctggccagat 2340
ggcccccgac ggtaagcttg gcagcatgtc gagcgtgctg tccgagatcc gcagcggcgc 2400
cgccaaccag ctgcactggt atccggccga agtcgacgcc aagaaccggc ccggatggtt 2460
ctaccgtgcc agccaatcgc cggcgtccgt agccgaagtc gtgaagtact acgagcagtc 2520
cacgggacgc aactcgcagt atctgctgaa cgtcccaccg tccgataccg gcaagctcgc 2580
cgatgcggat gccgcgggac ttaaggggct gggcgaggag ctcgcccgac gctacggcac 2640
cgatcttgcc ctgggcaaga gcgcgaccgt cgccgcgtcc gcgaacgaca ctgcggtagc 2700
ggccccgaag ctgaccgacg gttcgaagct ctcctccgac aaggccgtgg gcaatacgcc 2760
gacgtacacc atcgatctgg gcagcactgt cgccgtggat gcagtgaaga tctccgagga 2820
cgtgcgcaat gccggccagc agatcgaaag cgccactctg cagggacgag tcaatggaac 2880
atggacgaat ctggcgacta tgacgacggt cgggcagcag cgcgaccttc gcttcacgtc 2940
ccagaacatc gatgccatcc gtctggtggt caactcctcc cgcggtccgg tgcgtctgag 3000
ccgtcttgag gtgttccaca ccgaatccga gattcagacc ggcgcccgcg cctactacat 3060
cgatccgacg gcgcagaccg cgggagatgg attcacgaag gacaagccca tgacgtcgat 3120
cgagcagctg cacgatgtga ccgtcgcgcc aggctccgtg atcttcgtca aggcgggcac 3180
cgagctgacc ggggacttcg ccgtcttcgg ctacggcacc aaggacgagc ccatcaccgt 3240
gacgacatac ggcgaaagcg acaaagccac caccgcgagc ttcgacggca tgaccgccgg 3300
gctgacgctg aagcaggcgc tgaaggcgct cggcaaggac gacgccggct gggtcgtggc 3360
cgattccgcc actgcaccgg cctcccgcgt gtatgtcccg caggatgaga tcagcgtgca 3420
cgcccagtcg tcgcagaact ccggcgcaga ggcggcgagg gcgctcgacg gcgactcgtc 3480
gacgagctgg cactcccagt acagcccgac caccgcgtct gctccgcatt gggtgactct 3540
cgatctcggc aaatcgcgtg agaacgtcgc ctacttcgac tacctcgccc gtatcgacgg 3600
caacaataac ggtgccgcca aggattacga ggtgtatgtc tccgacgatc ccaacgattt 3660
tggagcccct gtggcctcgg gcacgttgaa gaacgtcgcc tacacgcagc gcatcaagct 3720
gacccccaag aacggacggt acgtcaagtt cgtcatcaag accgattatt ccggatcgaa 3780
cttcggctcc gcggcggaaa tgaatgtcga gttgctgccc acggccgtag aggaggacaa 3840
ggtcgccacc ccgcagaagc cgacagtgga cgatgatgcc gatacataca ccatccccga 3900
catcgaggga gtcgtgtaca aggtcgacgg caaggtgttg gccgctggtt ccgtagtgaa 3960
cgtgggcgat gaggacgtga ccgtcacggt caccgccgag cccgccgacg gataccgctt 4020
cccggatggt gtgacgtccc cagtcacgta tgagctgacg ttcaccaaga agggtggcga 4080
gaagcctccg accgaagtca acaaggacaa gctgcacgcc acgatcacca aggctcaggc 4140
gatcgaccgt tccgcctata cggacgagtc gctcaaggtg cttgatgaca agctcgccgc 4200
agcgctcaag gtctatgacg atgacaaggt gagccaggat gatgtcgatg ccgccgaggc 4260
ggctctgtct gcggcgatcg acgcgctgaa gaccaagccg acgacccccg gcggtgaagg 4320
tgagaagcct ggtgaaggtg aaaagcccgg tgacggcaac aagcccggtg acggcaagaa 4380
gcccggcgac gtgatcgcaa agaccggcgc ctccacaatg taactagcat aaccccttgg 4440
ggcctctaaa cgggtcttga ggggtttttt gctgaaacca atttgcctgg cggcagtagc 4500
gcggtggtcc cacctgaccc catgccgaac tcagaagtga aacgccgtag cgccgatggt 4560
agtgtggggt ctccccatgc gagagtaggg aactgccagg catcaaataa aacgaaaggc 4620
tcagtcgaaa gactgggcct ttcgggatcc aggccggcct gttaacgaat taatcttccg 4680
cggcggtatc gataagcttg atatcgaatt ccgaagttcc tattctctag acgccattca 4740
ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg 4800
cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagtcac 4860
gacgttgtaa aacgacggcc agtgaattcg agctcggtac ctaccgttcg tataatgtat 4920
gctatacgaa gttatcgagc tctagagaat gatcccctca ttaggccaca cgttcaagtg 4980
cagcgcacac cgtggaaacg gatgaaggca cgaacccagt tgacataagc ctgttcggtt 5040
cgtaaactgt aatgcaagta gcgtatgcgc tcacgcaact ggtccagaac cttgaccgaa 5100
cgcagcggtg gtaacggcgc agtggcggtt ttcatggctt gttatgactg tttttttgta 5160
cagtctatgc ctcgggcatc caagcagcaa gcgcgttacg ccgtgggtcg atgtttgatg 5220
ttatggagca gcaacgatgt tacgcagcag caacgatgtt acgcagcagg gcagtcgccc 5280
taaaacaaag ttaggtggct caagtatggg catcattcgc acatgtaggc tcggccctga 5340
ccaagtcaaa tccatgcggg ctgctcttga tcttttcggt cgtgagttcg gagacgtagc 5400
cacctactcc caacatcagc cggactccga ttacctcggg aacttgctcc gtagtaagac 5460
attcatcgcg cttgctgcct tcgaccaaga agcggttgtt ggcgctctcg cggcttacgt 5520
tctgcccaga tttgagcagc cgcgtagtga gatctatatc tatgatctcg cagtctccgg 5580
cgagcaccgg aggcagggca ttgccaccgc gctcatcaat ctcctcaagc atgaggccaa 5640
cgcgcttggt gcttatgtga tctacgtgca agcagattac ggtgacgatc ccgcagtggc 5700
tctctataca aagttgggca tacgggaaga agtgatgcac tttgatatcg acccaagtac 5760
cgccacctaa caattcgttc aagccgagat cgtagaattt cgacgacctg cagccaagca 5820
taacttcgta taatgtatgc tatacgaacg gtaggatcct ctagagtcga ccaggtggca 5880
cttttcgggc agaccgggga cttatcagcc aacctgt 5917

Claims (15)

1.一种使用基因工程微生物宿主细胞生产所需低聚糖的方法,所述方法包括以下步骤:
(i)提供能够产生所需低聚糖的基因工程微生物宿主细胞,其中所述微生物宿主细胞已被基因工程改造以表达至少一种异源糖苷酶,其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物,其中所述微生物宿主细胞能够回收由所述糖苷酶的酶活性产生的降解产物,用于产生所需低聚糖;
(ii)在允许产生所需低聚糖的条件下和培养基中培养所述基因工程微生物宿主细胞,从而产生所需低聚糖;和
(iii)任选地,回收所需低聚糖。
2.一种用于生产所需低聚糖的基因工程微生物宿主细胞,其中所述微生物宿主细胞
a)能够产生所需低聚糖;
b)已被基因工程改造以表达至少一种异源糖苷酶,其能够在细胞内降解在所需低聚糖的细胞内生物合成过程中产生的代谢糖副产物;和
c)能够回收由所述糖苷酶的酶活性产生的降解产物,以产生所需低聚糖。
3.根据权利要求1所述的方法或根据权利要求2所述的基因工程微生物宿主细胞,其中所述异源糖苷酶选自岩藻糖苷酶、唾液酸酶、己糖胺酶、半乳糖苷酶和葡糖苷酶。
4.根据权利要求1至3中任一项所述的方法或基因工程微生物宿主细胞,其中所述异源糖苷酶选自α-1,2-岩藻糖苷酶、α-1,3-岩藻糖苷酶、α-2,3-唾液酸酶、α-2,6-唾液酸酶、α-2,8-唾液酸酶、β-1,3-半乳糖苷酶、β-1,4-半乳糖苷酶、β-1,6-半乳糖苷酶、β-N-乙酰己糖胺酶和β-1,3-葡糖苷酶。
5.根据权利要求1至4中任一项所述的方法或基因工程微生物宿主细胞,其中所述基因工程微生物宿主细胞已被基因工程改造以表达异源糖基转移酶,优选选自岩藻糖基转移酶、唾液酸转移酶、半乳糖基转移酶、N-乙酰葡糖胺基转移酶和葡糖基转移酶的糖基转移酶。
6.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞,其中所述微生物宿主细胞已被基因工程改造以表达异源α-1,3-岩藻糖基转移酶和异源α-1,2-岩藻糖苷酶。
7.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞,其中所述微生物宿主细胞已被基因工程改造以表达异源α-1,2-岩藻糖基转移酶和异源α-1,3-岩藻糖苷酶。
8.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞,其中所述微生物宿主细胞已被基因工程改造以表达异源β-1,3-N-乙酰葡糖胺基转移酶、异源α-1,2-岩藻糖基转移酶、异源β-1,3-半乳糖基转移酶和异源α-1,3-岩藻糖苷酶。
9.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞,其中所述微生物宿主细胞已被基因工程改造以表达异源α-2,6-唾液酸转移酶和异源α-2,3-唾液酸酶。
10.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞,其中所述微生物宿主细胞已被基因工程改造以表达异源β-1,3-N-乙酰葡糖胺基转移酶、异源β-1,4-半乳糖基转移酶和异源β-1,3-半乳糖苷酶和/或β-1,3-葡糖苷酶和/或半乳聚糖-β-1,3-半乳糖苷酶。
11.根据权利要求1至5中任一项所述的方法或基因工程微生物宿主细胞,其中所述微生物宿主细胞已被基因工程改造以表达异源β-1,3-N-乙酰葡糖胺基转移酶、异源β-1,3-半乳糖基转移酶和异源β-1,3-葡糖苷酶和/或半乳聚糖-β-1,3-半乳糖苷酶。
12.根据权利要求1至11中任一项所述的方法或基因工程微生物宿主细胞,其中所述所需低聚糖为人乳低聚糖,优选选自以下的人乳低聚糖:2’-岩藻糖基乳糖(2’-FL)、3-岩藻糖基乳糖(3-FL)、2’,3-二岩藻糖基乳糖、乳-N-三糖II、乳-N-四糖、乳-N-新四糖、乳-N-岩藻戊糖I、乳-N-新岩藻戊糖I、乳-N-岩藻戊糖II、乳-N-岩藻戊糖III、乳-N-岩藻戊糖V、乳-N-新岩藻戊糖V、乳-N-二岩藻己糖I、乳-N-二岩藻糖基己糖II、对-乳-N-岩藻糖基己糖、岩藻糖基-乳-N-唾液酸戊糖b、岩藻糖基-乳-N-唾液酸戊糖c、岩藻糖基-乳-N-唾液酸戊糖c、二唾液酸-乳-N-岩藻戊糖、3-岩藻糖基-3’-唾液酸乳糖、3-岩藻糖基-6’-唾液酸乳糖、乳-N-新二岩藻己糖I、3’-唾液酸乳糖、6’-唾液酸乳糖、唾液酸乳-N-四糖a(LST-a)、唾液酸乳-N-四糖b(LST-b)、唾液酸乳-N-四糖c(LST-c)和二唾液酸乳-N-四糖。
13.根据权利要求2至12中任一项所述的基因工程微生物宿主细胞用于生产所需低聚糖、优选选自HMO的低聚糖的用途。
14.一种低聚糖,优选选自HMO的低聚糖,其通过权利要求1至12中任一项所述的方法或通过使用权利要求1至12中任一项所述的基因工程微生物宿主细胞生产,其用于制备营养组合物。
15.一种营养组合物,其含有通过权利要求1至12中任一项所述的方法或通过使用权利要求1至12中任一项所述的基因工程微生物宿主细胞生产的至少一种低聚糖,其中所述至少一种低聚糖优选为HMO。
CN201980032286.2A 2018-05-16 2019-05-13 糖苷酶在低聚糖生产中的用途 Pending CN112119164A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18172658.9A EP3569713A1 (en) 2018-05-16 2018-05-16 Use of glycosidases in the production of oligosaccharides
EP18172658.9 2018-05-16
PCT/EP2019/062160 WO2019219578A1 (en) 2018-05-16 2019-05-13 Use of glycosidases in the production of oligosaccharides

Publications (1)

Publication Number Publication Date
CN112119164A true CN112119164A (zh) 2020-12-22

Family

ID=62186367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980032286.2A Pending CN112119164A (zh) 2018-05-16 2019-05-13 糖苷酶在低聚糖生产中的用途

Country Status (11)

Country Link
US (1) US20210363557A1 (zh)
EP (2) EP3569713A1 (zh)
JP (4) JP2021524232A (zh)
KR (1) KR20210010472A (zh)
CN (1) CN112119164A (zh)
AU (2) AU2019270211B2 (zh)
BR (1) BR112020023228A2 (zh)
MX (1) MX2020012152A (zh)
PH (1) PH12020551940A1 (zh)
SG (1) SG11202010730SA (zh)
WO (1) WO2019219578A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115003687A (zh) * 2020-01-23 2022-09-02 格礼卡姆股份公司 Hmo生产
CN117321217A (zh) * 2021-05-17 2023-12-29 帝斯曼知识产权资产管理有限公司 用于体内生产纯LNFP-I的α-1,2-岩藻糖基转移酶的识别
CN117597451A (zh) * 2021-05-17 2024-02-23 帝斯曼知识产权资产管理有限公司 通过修饰细胞内乳糖的输入来增强hmo的形成
CN118834856A (zh) * 2024-07-25 2024-10-25 合肥中科健康生物产业技术研究院有限公司 一种α-L-岩藻糖苷酶突变体及其应用

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2020000969A (es) * 2017-07-26 2020-09-28 Jennewein Biotechnologie Gmbh Sialil-transferasas y su uso en la produccion de oligosacaridos sialilados.
WO2019222391A1 (en) * 2018-05-15 2019-11-21 The Board Of Trustees Of The University Of Illinois Engineered microorganisms for production of 2' fucosyllactose and l-fucose
US11162102B2 (en) 2019-05-13 2021-11-02 Dna Twopointo Inc. Modifications of mammalian cells using artificial micro-RNA to alter their properties and the compositions of their products
CN110804577B (zh) * 2019-11-28 2021-05-28 江南大学 一种高效生产2’-岩藻糖基乳糖的重组菌的构建方法及其应用
JP2023511523A (ja) * 2020-01-23 2023-03-20 グリコム・アクティーゼルスカブ Hmoの産生
US20230109661A1 (en) * 2020-01-23 2023-04-06 Glycom A/S Hmo production
KR20230048380A (ko) * 2020-08-10 2023-04-11 인바이오스 엔.브이. 세포에 의한 올리고당 혼합물의 제조
US20230313187A1 (en) * 2020-09-04 2023-10-05 Dna Twopointo Inc. Modifications of mammalian cells using artificial micro-rna to alter their properties and the compositions of their products
EP4281577A1 (en) * 2021-01-20 2023-11-29 Inbiose N.V. Production of oligosaccharides comprising ln3 as core structure in host cells
WO2024042235A1 (en) * 2022-08-25 2024-02-29 Dsm Ip Assets B.V. Hybrid method for producing complex hmos

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015150328A1 (en) * 2014-03-31 2015-10-08 Jennewein Biotechnologie Gmbh Total fermentation of oligosaccharides
CN105722991A (zh) * 2013-09-10 2016-06-29 詹尼温生物技术有限责任公司 寡糖的生产

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102459605A (zh) * 2009-06-08 2012-05-16 詹尼温生物技术有限责任公司 Hmo合成
ES2439507T3 (es) * 2011-01-20 2014-01-23 Jennewein Biotechnologie Gmbh Fucosiltransferasas novedosas y sus aplicaciones
DK2728009T3 (da) * 2012-10-31 2017-11-06 Jennewein Biotechnologie Gmbh Fremgangsmåde til fremstilling af monosaccharider
EP2931737A4 (en) 2012-12-14 2016-11-16 Glycom As MIXTURE FROM FUCOSYLATE LACTOSES
CN111172220B (zh) 2013-09-06 2023-08-04 格礼卡姆股份公司 寡糖的发酵生产
CN106715076B (zh) 2014-08-11 2020-03-13 圣万提注塑工业(苏州)有限公司 能够实现多个活塞速度的致动装置和方法
CA2958294C (en) 2014-08-19 2019-02-19 Atlas James RUSSELL System, method and apparatus for recycling asphalt shingles and producing asphalt mix
EP3050973A1 (en) 2015-01-30 2016-08-03 Jennewein Biotechnologie GmbH Fermentation process for producing monosaccharides in free form from nucleotide-activated sugars

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105722991A (zh) * 2013-09-10 2016-06-29 詹尼温生物技术有限责任公司 寡糖的生产
WO2015150328A1 (en) * 2014-03-31 2015-10-08 Jennewein Biotechnologie Gmbh Total fermentation of oligosaccharides

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HISASHI ASHIDA等: "Two distinct α-L-fucosidases from Bifidobacterium bifidum are essential for the utilization of fucosylated milk oligosaccharides and glycoconjugates", 《GLYCOBIOLOGY》, vol. 9, no. 9, 11 June 2009 (2009-06-11) *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115003687A (zh) * 2020-01-23 2022-09-02 格礼卡姆股份公司 Hmo生产
CN115003687B (zh) * 2020-01-23 2024-12-06 格礼卡姆股份公司 Hmo生产
CN117321217A (zh) * 2021-05-17 2023-12-29 帝斯曼知识产权资产管理有限公司 用于体内生产纯LNFP-I的α-1,2-岩藻糖基转移酶的识别
CN117597451A (zh) * 2021-05-17 2024-02-23 帝斯曼知识产权资产管理有限公司 通过修饰细胞内乳糖的输入来增强hmo的形成
CN118834856A (zh) * 2024-07-25 2024-10-25 合肥中科健康生物产业技术研究院有限公司 一种α-L-岩藻糖苷酶突变体及其应用

Also Published As

Publication number Publication date
JP2021524232A (ja) 2021-09-13
WO2019219578A1 (en) 2019-11-21
JP2024081772A (ja) 2024-06-18
SG11202010730SA (en) 2020-11-27
PH12020551940A1 (en) 2021-06-21
BR112020023228A2 (pt) 2021-02-23
EP3569713A1 (en) 2019-11-20
AU2019270211B2 (en) 2024-10-10
EP3794134A1 (en) 2021-03-24
AU2025200092A1 (en) 2025-01-30
JP2024081773A (ja) 2024-06-18
AU2019270211A1 (en) 2020-11-26
KR20210010472A (ko) 2021-01-27
MX2020012152A (es) 2021-01-29
US20210363557A1 (en) 2021-11-25
JP2024081771A (ja) 2024-06-18

Similar Documents

Publication Publication Date Title
CN112119164A (zh) 糖苷酶在低聚糖生产中的用途
KR102554781B1 (ko) 푸코실화 올리고당(fucosylated oligosaccharide)의 생산을 위한 향상된 공정
JP2024028710A (ja) フコシル基転移酵素及びフコシル化オリゴ糖の生産におけるその使用
CN113166789A (zh) 岩藻糖基化寡糖lnfp-v的合成
WO2021148618A9 (en) New major facilitator superfamily (mfs) protein (bad) in hmo production
TW201839139A (zh) 用於生產塔格糖的組成物與利用其生產塔格糖的方法
US10519475B1 (en) Biosynthesis of compounds in yeast
JP2024516207A (ja) インベルターゼ/スクロースヒドロラーゼを発現する微生物株
WO2022243312A1 (en) IDENTIFICATION OF AN α-1,2-FUCOSYLTRANSFERASE FOR THE IN VIVO PRODUCTION OF PURE LNFP-I
WO2023099680A1 (en) Cells with tri-, tetra- or pentasaccharide importers useful in oligosaccharide production
WO2004081216A1 (ja) 酢酸菌のアルコール脱水素酵素遺伝子
CN117321210A (zh) 产生以lnfp-i和lnt作为主要化合物的hmo共混物的方法
RU2810730C2 (ru) Применение гликозидаз в получении олигосахаридов
CN116802286A (zh) 一种产生dfl的菌株
RU2790445C2 (ru) Улучшенный способ получения фукозилированных олигосахаридов
JP7331278B1 (ja) 3’slのインビボ合成のための新規なシアリルトランスフェラーゼ
RU2818835C2 (ru) Фукозилтрансферазы и их применение для получения фукозилированных олигосахаридов
WO2024046994A1 (en) Fermentative production of oligosaccharides by microbial cells utilizing glycerol
CN118804979A (zh) 用于体内合成lst-a的新型唾液酸转移酶
CN118786221A (zh) 用于体内合成3&#39;sl和6&#39;sl的新型唾液酸转移酶
WO2024133702A2 (en) New fucosyltransferases for production of 3fl
DK202200591A1 (en) New sialyltransferases for in vivo synthesis of lst-c
CN117321071A (zh) 表达转化酶/蔗糖水解酶的微生物菌株
CN118440916A (zh) 载体、转化子、唾液酸转移酶突变体及其应用
CN117355613A (zh) 产生以lnfp-i和2’-fl作为主要化合物的hmo共混物分布的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40038438

Country of ref document: HK

CB02 Change of applicant information

Address after: Bright Bach, Rhine, Germany

Applicant after: Kohansen breast milk oligosaccharides Co.,Ltd.

Address before: Bright Bach, Rhine, Germany

Applicant before: JENNEWEIN BIOTECHNOLOGIE GmbH

CB02 Change of applicant information