CN1262666C - 用人工转座子扩增基因的方法 - Google Patents

用人工转座子扩增基因的方法 Download PDF

Info

Publication number
CN1262666C
CN1262666C CNB961117095A CN96111709A CN1262666C CN 1262666 C CN1262666 C CN 1262666C CN B961117095 A CNB961117095 A CN B961117095A CN 96111709 A CN96111709 A CN 96111709A CN 1262666 C CN1262666 C CN 1262666C
Authority
CN
China
Prior art keywords
gene
leu
ala
plasmid
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB961117095A
Other languages
English (en)
Other versions
CN1163937A (zh
Inventor
守屋美加
松井裕
横关健三
平野圣子
早川敦
泉井正子
杉本雅一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ajinomoto Co Inc
Original Assignee
Ajinomoto Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ajinomoto Co Inc filed Critical Ajinomoto Co Inc
Publication of CN1163937A publication Critical patent/CN1163937A/zh
Application granted granted Critical
Publication of CN1262666C publication Critical patent/CN1262666C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/77Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1217Phosphotransferases with a carboxyl group as acceptor (2.7.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/08Lysine; Diaminopimelic acid; Threonine; Valine

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

构建:扩增在棒状细菌染色体中的所需基因的方法,包括,形成药物抗性基因和所需基因插入棒状细菌的插入序列中的人工转座子,将所说的人工转座子导入棒状细菌中。效果根据本发明的方法,可以在工业化生产氨基酸或核酸的棒状细菌的染色体中扩增所需的基因,可以改善所说的棒状细菌的育种。

Description

用人工转座子扩增基因的方法
本发明涉及用人工转座子扩增棒状杆菌染色体中的所需基因的方法,所述人工转座子在所述的棒状杆菌中是可转座的,本发明还涉及用本方法得到的棒状杆菌。若所需的基因是参于氨基酸或核酸的生物合成的基因,则用由此得到的棒状杆菌可以生产氨基酸或核酸。扩增染色体中的所需基因的方法,对于改进棒状杆菌的育种是很重要的,因为在氨基酸或核酸的工业化生产中要使用所述的棒状杆菌。
到目前为止,经过艰苦的努力,已经完成了改进棒状杆菌的育种和有效生产氨基酸或核酸的研究。已经报告了使用基因工程的许多育种方法。用质粒或噬菌体已经系统地开发了用于棒状杆菌育种的基因操作方法。例如使用原生质体转化之方法的建立(J.Bacteriol.,by Katsumata R.,Ozaki A.,Oka T.andFuruya A.,159,306-311,(1984);and J.Bacteriol,bySantamaria R.I.,Gil J.A.and Martin J.F.,161,463-467(1985)),各种载体的研制(Agric.Biol.Chem.,by MiwaK.,Matsui H.,Terabe M.,Nakamori S.,Sano K.andMomose h,48,2901-2903(1984);J.,Bacteriol.,byKatsumata R.,Ozaki A.,Oka T.and Furuya A.,159,306-311(1984);J.Gen.Microbiol.,by Santamaria R.I.,GilJ.A.,Mesas J.M.and Martin J.F.,130,2237-2246(1984);Gene,by Yeh P.,Oreglia J.,Prevotos F.and Scicard A.M.,47,301-306(1986);and Appl.Microbiol.Biotechbol.,by patek M.,Nesvera J.and Hochmannova J.,31,65-69(1989)),控制基因表达方法的研究(Bio/Technology,bytsuchiya M.and Morinaga Y.,6,428-430(1988),粘粒的研究[Gene,by Nakamori S.and Sano K.,39,281-286(1985)].在Nucleic Acids Res.,(Matsue K.,Sano K.and Ohtsubo E.,14,10113-10114(1986));J.Bacteriol(follettie M.T.and Shinskey A.H.,167,695-702(1986)),Nuclerc Acids Res.,(Mateos L.M.,Del R.G.,Aguelar A.and Martin H.F.,15,10598(1987));Nuclerc Acids Res.,(Mateos L.M.,Del R.G.,Auilar A.and martin J.F.,15,3922(1987));NuclercAcids Res.,(Melumbres M.,Mateos L.M.,Guerrero C.andMartin J.F.,16,9859(1988));Agric.Biol.Chem.,(MatsuiK.,Miwa K.and Sano K.,52,525-531(1988));Mol.Microbiol(by Peoples O.P.,Liebl W.,bodis M.,Maeng P.J.,Follettie M.T.,Archer J.A.and Sinskey A.J.,2,63-72(1988));Mol.Gen.Genet.,(by Eikamanns B.J.,FollettieM.T.,Griot M.U.,Martin u.and Shinskey A.J.,218,330-339(1989);和Gene(by O′Regan M.,Thierbach G.,BachmannB.,Vgilleval D.,LepageP.,Viret J.F.and Lemoine Y.,77,237-251(1989))中报告了得自棒状杆菌的基因的克隆。在Agric.Biol.Chem.,(by/sano K.,Miwa K.and Nakamori S.,51,597-599(1987))中报告了各种氨基酸产率的增加。
最近,报告了棒状杆菌的转座因子[WO 92/02627;WO93/18151;EP 0445385;日本特许公开专利申请(下文称为″日本Kokai″)No.46,867/1994;Mol.Microbiol.by Vertes A.A.,Inui M.,Kobayashi M.,Kurusr Y.and Yukawa H.,11,739-746(1994);Mol.Microbiol.,by Bonamy C.,Labarre J.,reyer O.and LeblonG.,14,571-581(1994);Mol.gen.Genet.,by Vertes A.a.,Asai Y.,Inui M.,Kobayashi M.,Kurusr Y.and Yukawa H.,245,397-405(1994);FRMSMicrobiology Letters,by Jagar W.,Schafer A.,Kalinowki J.and Puehler A.,126,1-6;(1995);和日本KokaiNo.107,976/1995]。
转座因子是可在染色体中转座的DNA片段,而且已知这种转座因子广泛地存在于包括原核生物和真核生物的各种生物中。已经得到了有关真核生物,例如玉米,果蝇,酵母等,以及原核生物,例如大肠杆菌等的详细知识[Mobile DNA,AmericanSociety for Microbiology,Washington D.C(1989)]。细菌的转座因子被分成两类,即插入序列和转座子。插入序列是大小约为760-2000bp的DNA片段,在其两个末端均有约8-20bp的反向重复序列,而且编码转座酶,即在其中转座所必需的酶。而转座子是含有反向重复序列和转座酶以及不直接参与转座过程的基因,例如药物抗性基因的转座因子。转座子通常包括一个位于两个插入序列之间的药物抗性基因,和一个插入在插入序列中的药物抗性基因。插入序列和转座子的特征均在于在导入于插入序列或转座子的靶基因位点中观察到约10bp核苷酸序列的复制[MobileGenetic Elements,Academic Press,New York,pp.159-221(1983)]。
目前已知的转座因子包括大肠杆菌和Mu噬菌体转座子Tn10和Tn5,它们在染色体基因工程中是非常有用的。例如,认为(1)将转座子转座到染色体基因中,从而破坏了所述的基因,抑制了该染色体基因的表达,(2)将启动子序列插入到转座子中以表达在插入位点存在的染色体基因,和(3)将异源所需基因或同源所需基因包含在用于转座的转座子中以便将新基因导入到染色体中[Mobile DNA,American Society for Microbiolgy,Washington S.C.pp.879-925(1989)]。
最近已在棒状杆菌中发现了作为插入序列的转座因子,但尚未发现作为含有药物抗性基因等转座子的转座因子。已经可能生产其中人工插入有卡那霉素抗性基因的转座子[WO93/18151;Japanese Kokai No.107,976/1995;and Mol.Gen.Genet.,by Vertes A.A.,Asai Y.,Inui M.,Kobayashi M.,KurusuY.and Yukawa H,245,397-405(1994)],并且将所述的转座子转座到染色体中。其中生产的人工转座子包括一个插入在两个插入序列之间的药物抗性基因(WO93/18151)和一个插入在插入序列中的药物抗性基因[Japanese Kokai No.107,976/1995;and Mol.Gen.Genet.,by Vertes A.A.,asai Y.,Inui M.,KobayashiM.,Kurusu Y.and Yukawa H.,245,397-405(1994)]。通过多拷贝所述的人工转座子而进行的转座并未观察到,或者说拷贝数的增加不能令人满意。因此,目前尚未确立用在氨基酸或核酸工业化生产中有用的这种转座子来扩增基因的技术。
本发明的一个目的是提供一种方法,包括在棒状杆菌插入序列的基础上形成含有药物抗性基因和所需有用基因的人工转座子,用上述的人工转座子在工业化生产氨基酸或核酸所用的棒状杆菌的染色体中扩增所需的基因。
本发明的另一目的是提供所需的有用基因在染色体中扩增的棒状杆菌。
本发明的另一目的是提供利用棒状杆菌生产物质的方法,在所述的棒状杆菌中所需的有用基因在染色体中扩增。
为了解决上述问题,本发明申请人注意到可以转座大肠杆菌等的已知转座子,具有不参与转座过程的药物抗性基因的结构被插入到在其两个末端均有插入序列的反向重复序列之间。本发明人人工构建了各种不同的转座子样序列,所述序列有这样一种结构,即不参与转座过程的药物抗性基因和所需基因被插入到插入序列两端的反向重复序列之间,所述的插入序列来自棒状杆菌的染色体DNA,而且已努力完成这些研究。结果,转座子样序列(人工转座子)以良好的效率被转座,而且适当选择药物抗性基因并确定药物浓度,可以以良好的效率形成扩增基因的微生物,在所述的微生物中,多拷贝的人工转座子被转座到其染色体中。这些发现导致了本发明的完成。
即本发明如下:
1导入并在染色体上扩增所需基因的方法,包括形成人工转座,所述人工转座含有在反向重复系列之间插入了药物抗性基因和所需的基因的结构并且在棒状杆菌细胞内是可转座的,将所述的人工转座子转入棒状杆菌细胞,将所述转座子转座到所述棒状杆菌的染色体中。
2发明1的方法,其中,所述人工转座子还有一个转座酶位于反向重复序列之间的结构。
3发明1或2的方法,其中所述反向重复序列和转座酶基因来自棒状杆菌的插入序列。
4发明3的方法,其中所述插入序列含有序列表中SequcenceNos.1、5或9的任一个所代表的碱基序列。
5发明1-4的任一方法,其中药物抗性基因是氯霉素抗性基因或四环素抗性基因。
6发明1-5的任一方法,其中所需的基因是参与氨基酸生物合成的基因。
7发明6的方法,其中所需的基因是天冬氨酸激酶基因和/或二氢吡啶羧酸合成酶基因。
8棒状杆菌,是通过将所需基因用发明1-7中的任一方法转座到染色体中而形成的。
9生产氨基酸的方法,包括培养用发明6的方法将参与氨基酸生物合成的基因转座到染色体中而形成的棒状杆菌,以便在培养基中形成并积累氨基酸,然后回收所述的氨基酸。
10发明9的方法,其中参与氨基酸生物合成的基因是天冬氨酸激酶基因和/或二氢吡啶羧酸合成酶基因,所述氨基酸是赖氨酸。
本发明中所述的反向重复序列可能是存在于从棒状杆菌分离的转座因子的两个末端的反向重复序列。作为得自棒状杆菌的转座因子的实例,在序列表中1,5和9所列的插入序列是已知的(WO93/18151)。在序列1中的插入序列IS714在5′端含有序列3的序列,在反向链的5′端含有序列4的序列,从而形成了反向重复序列。在序列5中的插入序列IS719在5′端含有序列7的序列,在反向链的5′端含有序列8的序列,从而形成了反向重复序列。通过在5′端和反向链的5′端均加入选自序列3,4,7和8的一种序列,可以形成反向重复序列。通过在5′端和反向链的5′端均加入选自序列3,4,7和8的两种序列,可以形成反向重复序列。
在序列9中的插入序列IS903在5′端含有序列10的序列,在反向链的5′端含有序列11的序列,从而形成了反向重复序列。通过在5′端和反向链的5′端均加入选自序列10和11的一种序列,可以形成反向重复序列。通过在5′端和反向链的5′端均加入选自序列10和11的两种序列,可以形成反向重复序列。
用除序列3,4,7,8,10和11所列序列外,可以在转座因子中起作用的任何其它序列,也可以形成本发明的反向重复序列。
被插入插入序列中的药物抗性基因包括卡那霉素抗性基因,氯霉素抗性基因和四环素抗性基因以及对各种药物有抗性的基因,例如氨苄青霉素抗性基因,氨甲蝶呤抗性基因等。药物抗性程度和药物抗性基因的拷贝数之间有关系的药物抗性基因是优选的。
由于要扩增所需的基因,因此,可以使用参与各种氨基酸和核酸生物合成的基因。其实例包括用于谷氨酸生物合成的谷氨酸脱氢酶基因,用于谷氨酰胺生物合成的谷氨酰胺合成酶基因,用于赖氨酸生物合成的天冬氨酸激酶基因(下文称天冬氨酸激酶为″AK″,如果需要,编码AK蛋白质的基因在下文中被称为″lysC″),二氢二吡啶羧酸盐合成酶基因(下文将二氢二吡啶羧酸盐合成酶称为″DDPS″,如果需要,编码DDPS蛋白质的基因在下文中被称为″dapA″),二氢二吡啶羧酸盐还原酶基因(下文将二氢二吡啶羧酸盐还原酶称为″DDPR″,如果需要,编码DDPR蛋白质的基因在下文中被称为″dapB″),二氨基庚二酸脱羧酶基因(下文将二氨基庚二酸脱羧酶称为″DDC″,如果需要,编码DDC蛋白质的基因在下文中被称为″lysA″),和二氨基庚二酸脱氢酶基因(下文将二氨基庚二酸脱氢酶称为″DDH″,如果需要,编码DDH蛋白质的基因在下文中被称为″ddh″),用于苏氨酸生物合成的同丝氨酸脱氢酶基因,用于异亮氨酸或缬氨酸生物合成的acetohydroxy acid合成酶基因,用于亮氨酸生物合成的2-异丙基苹果酸合成酶基因,用于脯氨酸或精氨酸生物合成的谷氨酸激酶基因,用于组氨酸生物合成的磷酸核糖-ATP焦磷酸化酶基因,用于芳香族氨基酸,例如色氨酸酪氨酸和苯丙氨酸生物合成的脱氧阿拉伯庚糖醛酸磷酸(DAHP)合成酶基因,用于核酸,例如肌苷酸和鸟苷酸生物合成磷酸核糖焦磷酸(PRPP)酰氨基转移酶基因,肌苷鸟苷激酶基因,肌苷酸(IMP)脱氢酶基因和鸟苷酸(GMP)合成酶基因。此外,也可以使用编码生理学活性蛋白质例如白介素2,白介素6等的基因。
按Bergey′s Manual of Determinative Bacteriology,8thed.,p.599(1974)中的描述,本发明中涉及的棒状杆菌包括需氧革兰氏阳性杆菌,分为棒状杆菌属的细菌,曾经分到短杆菌属中,但现在分到棒状杆菌属中的细菌[Int.j.Syst.Bacteriol.,41,255(1981)],很接近棒状杆菌属的短杆菌属的细菌,和微杆菌属的细菌。总的来讲,在棒状细菌中包括下列已知作为L-谷氨酸-生产菌的微生物。
嗜乙酰乙酸棒状杆菌
醋各棒状杆菌
颈棒状杆菌
谷氨酸棒状杆菌
百合棒状杆菌(谷氨酸棒状杆菌)
栖糖蜜棒状杆菌
扩展短杆菌(谷氨酸棒状杆菌)
黄色短杆菌(谷氨酸棒状杆菌)
不嗜海水短杆菌
乳酸发酵短杆菌(谷氨酸棒状杆菌)
玫瑰色短杆菌
解糖短杆菌
生硫短杆菌
产氨短杆菌(产氨棒状杆菌)
Microbacterium ammoniaphilum
Corynebacterium thermoaninogenes
具体地,提到下列野生型和从其得到的突变菌株。
嗜乙酰乙酸棒杆菌ATCC 13870
醋谷棒状杆菌ATCC 15806
颈棒状杆菌ATCC 15991
谷氨酸棒状杆菌ATCC 13020
百合棒状杆菌(谷氨酸棒状杆菌)ATCC 15990
栖糖蜜棒状杆菌ATCC 17965
扩展短杆菌(谷氨酸棒状杆菌)ATCC 14020
黄色短杆菌(谷氨酸棒状杆菌)ATCC 14067
不嗜海水短杆菌ATCC 14068
乳酸发酵短杆菌(谷氨酸棒状杆菌)ATCC 13869
玫瑰色短杆菌ATCC 13825
解糖短杆菌ATCC 14066
生硫短杆菌ATCC 19240
产氨短杆菌(产氨棒状杆菌)ATCC 6871
Microbacterium ammoniaphilum ATCC 15354
Corynebacterium thermoaninogenes AJ12340(FERMBP-1539)
本发明的人工转座子含有在反向重复序列之间插入了药物抗性基因和所需基因的结构,而且具有在棒状细菌中转座的能力。
本发明的转座酶是例如具有序列表中序列2或6所列的核苷酸序列的转座酶。然而本发明的转座酶还包括在上述序列中有一个或两个以上氨基酸残基缺失,插入,增加,取代或倒位,但只要还具有转座酶活性的转座酶。本发明的转座酶基因具有例如含有序列1核苷酸序列中第130-1437的序列,或含有序列5核苷酸序列中第130-1437的序列。但是本发明的转座酶基因还包括在上述序列中有一个或两个以上氨基酸残基缺失,插入,增加,取代或倒位,但只要所述基因产物具有转座酶活性的转座酶。
可以将转座酶基因放在人工转座子内。即,将转座子基因放在反向重复序列之间,而且放在不会影响药物抗性基因和所需基因的功能的位置。可以将转座酶基因放在人工转座子外。可以在一个质粒上用含有人工转座子的质粒携带转座酶基因。也可以用两个质粒,一个含有人工转座子,另一个质粒携带转座子基因。转座子基因可以在染色体上存在。
以转座因子为起始材料,可以很容易地构建本发明的人工转座子。
在本发明中,可以使用任何插入序列,只要它存在于上述棒状杆菌的染色体中,大小为约760-2000bp,有约8-20bp的反向重复序列,并且其中编码转座所需的转座酶。按照WO93/18151中公开的方法,可以得到所述的插入序列。即,可以经下列方法得到含有插入序列的DNA片段(1)将质粒pEC701导入棒状细菌进行转化,(2)用卡那霉素抗性为标记筛选用pEC701转化的菌株,(3)在含有异丙基-β-硫代半乳糖苷(IPTG)的琼脂平板上涂布含有质粒pEC701的棒状细菌,然后筛选由此生长的菌株,(4)分析所筛选的菌株所含的质粒中氯霉素乙酰基转移酶基因的调节基因区或结构基因区,和(5)找到在该基因中的插入的序列。另外,可以经下列方法得到上述的DNA片段(1)将质粒pEC901导入棒状细菌进行转化,(2)用卡那霉素抗性作为标记筛选用pEC901转化的菌株,(3)在30℃培养含有pEC901的棒状细菌,甚至在30℃筛选表达氯霉素抗性的菌株,(4)分析所选菌株所含的质粒中的cI阻遏基因,和(5)找到在该基因中的插入序列。
棒状细菌插入序列的实例包括由序列表中的Sequence Nos.1,5和9,即IS714,IS719和IS903所代表的三种插入序列。这些核苷酸序列不必是严格的,在构建人工转座子时,可以使用包括反向重复序列的插入序列,只要它可以作为插入序列,在所述的反向重复系列中,部分碱基被其他碱基取代或缺失,或者新的系列被插入或加入。
在这些插入序列的基础上可以构建各种人工转座子。这些人工转座子的结构示于图1。其中本发明所用的人工转座子含有所扩增的药物抗性基因和所需基因被插入到插入序列中的结构。
在示于序列1的IS714中,限制性酶NheI位点位于37-42。由于在该位置的插入并不会影响反向重复系列和转座酶的功能,因此该位置适于插入待扩增的药物抗性基因和所需的基因。
在示于序列5的IS719中,限制性酶NheI位点位于37-42。由于在该位置的插入并不会影响反向重复系列和转座酶的功能,因此该位置适于插入待扩增的药物抗性基因和所需的基因。
在示于序列9的IS903中,限制性酶XcmI位点位于34-48。由于在该位置的插入并不会影响反向重复系列和转座酶的功能,因此该位置适于插入待扩增的药物抗性基因和所需的基因。
下文将以IS714为例,描述构建其中插入有药物,例如卡那霉素(新霉素),氯霉素或四环素抗性基因的人工转座子的方法,以及构建其中插入了药物抗性基因和用于生产氨基酸或核酸(如天冬氨酸激酶)的所需基因的人工转座子的方法。IS714的核苷酸序列示于序列表中的Seqence No.1。
(1)构建含有卡那霉素抗性基因的人工转座子
用限制性内切核酸酶PvuII和EcoRI裂解含有IS714序列的质粒pEC701-IS14,IS714是乳酸发酵短杆菌AJ12036(FERM BP-734)的插入序列,所述乳酸发酵短杆菌AJ12036(FERM BP-734)是棒状细菌的野生型菌株(见WO93/18151)。同时,将含有IS714的片段插入到质粒pHSC4的限制性内切核酸酶Sa1I位点以构建质粒pHIS714,所述的质粒pHSC4含有得自棒状细菌(日本Kokai No.7,491/1993)的温度敏感型复制起点。将上述所得的含IS714的1.6kb片段插入到pHIS714的SmaI位点。因此,按图2构建了含有相反方向的IS714的质粒pHTN7141和pHTN7142。
然后用限制性内切核酸酶PvuII型解pHTN7141和pHTN7142,以便切出含有IS714和pHSC4温度敏感型复制起点序列的这两个序列的片段。同时,质粒载体pHSG298(由Takara Shuzo制造)还含有两个限制性内切核酸酶PvuII位点。通过用限制性内切核酸酶PvuII裂解该质粒载体可以得到含有新霉素磷酸转移酶基因(卡那霉素抗性基因)的2.3kb片段。用限制性内切核酸酶PvuII裂解pHTN7141和pHSG298,然后连接所得的片段以转化乳酸发酵短杆菌AJ12036。如图3所示,从具有卡那霉素抗性的菌株得到质粒pHTN7143。
如图4所示,用上述方法,从质粒pHTN7142和pHSG298得到质粒pHTN7144。pHTN7143和pHTN7144含有新霉素磷酸转移酶基因位于两个IS714系列之间的结构。如图5所示,用上述方法从质粒pHIS714构建质粒pHIS714K1和pHIS714K2,pHSG298作为对照质粒。在pHIS714K1和pHIS714K2中,含有新霉素磷酸转移酶基因的插入片段的方向彼此相反。
为了使人工转座子最小化,构建了其中将新霉素磷酸转移酶基因插入到一个IS714中的人工转座子。在IS714中,限制性内切核酸酶NheI位点位于转座子功能不受干扰的位置。用限制性内切核酸酶NheI裂解质粒pHIS714,然后平截其末端。另一方面,用限制性内切核酸酶PstI从质粒pUC4K(由Pharmacia Biotech制造)切出新霉素磷酸转移酶基因区。按图6所示,连接两个片段以得到所需的质粒pHTN7145。
(2)构建含有氯霉素抗性基因的人工转座子
用限制性内切核酸酶AccII裂解质粒载体pHSG398(由TakaraShuzo制造)得到含有氯霉素酰基转移酶基因的约1.1kb的片段。然后将所述的AccII片段插入到pUC18(由Takara Shuzo制造)的SmaI位点,克隆由此所得的质粒。筛选所得的克隆以得到质粒pUC18-CM。
此外,在上述构建的pHIS714K2中,平截位于不影响转座酶功能的位置的IS714的限制性内切核酸酶NheI的位点。将用EcoRI和HindIII从pUC18-CM切出的含氯霉素乙酰基转移酶基因的约1.1kb片段与pHIS714K2的限制性内切核酸酶NheI平端位点相连,以转化大肠杆菌,然后筛选其中插入了氯霉素乙酰基转移酶基因片段的克隆。按图7所示,从所得的克隆可以得到所需的质粒pHTN7151。
(3)构建含四环素抗性基因的人工转座子
用限制性内切核酸酶EcoRI和AvaI裂解质粒载体pBR322(由Takara Shuzo制造)可以得到含有四环素抗性基因的约1.4kb片段。在上述构建的pHIS714K2中,平截位于不影响转座酶功能的位置的IS714的限制性内切核酸酶NheI位点。将上述形成的DNA片段与该限制性内切核酸酶NheI平端位点相连,以转化大肠杆菌,然后筛选其中插入了四环素抗性基因片段的克隆。按图8所示从所得的克隆可以得到所需的质粒pHTN7152。
(4)将赖氨酸生物合成基因之一的天冬氨酸激酶基因插入到含有四环素抗性基因的人工转座子中
由于图8中构建的pHTN7152没有适于天冬氨酸激酶基因插入的适宜的限制性内切核酸酶位点,按如下构建新导入一个插入位点的pHTN7156。
用限制性内切核酸酶EcoRI和AvaI裂解质粒载体pBR322(由Takara Shuzo制造)可以得到含有四环素抗性基因的约1.4kb片段。将该片段与经用限制性内切核酸酶SmaI裂解质粒载体pHY300PLK(由Takara Shuzo制造)而得到的片段相连以转化大肠杆菌,然后筛选其中插入了四环素抗性基因片段的克隆。从所得的克隆得到质粒pHY300-TC。
此外,在上述构建的pHIS714K2中,平截位于不影响转座酶功能之位置的IS714的限制性内切核酸酶NheI位点。将经用限制性内切核酸酶EcoRI和XbaI裂解pHY300-TC而得到的含有四环素抗性基因的片段与该限制性内切核酸酶NheI平端位点相连以转化大肠杆菌,筛选其中插入了四环素抗性基因的克隆。按图9所示从所得的克隆得到所需的质粒pHTN7156。
随后,将赖氨酸生物合成基因之一的天冬氨酸激酶基因按如下所述插入到质粒pHTN7156中。
用限制性内切核酸酶BamHI裂解质粒p399AK9B,该质粒含有天冬氨酸激酶基因,所述基因得自棒状细菌乳酸发酵短杆菌的赖氨酸-生产突变体,并经过了脱敏,从而同时抑制赖氨酸和苏氨酸(参见WO94/25605),然后自身连接以构建pHSG399AK,但从中除去了在棒状细菌中起作用的复制起点。用限制性内切核酸酶EcoRI和SphI裂解pHSG399AK以得到约1.7kb的天冬氨酸激酶基因片段。将该片段插入到质粒pHTN7156的限制性内切核酸酶BglII平端位点以便按图9所示构建质粒pHTN7156-C,质粒pHTN7156含有携带四环素抗性基因的人工转座子。
(5)构建含有四环素抗性基因,但在转座子单元中没有转座酶的人工转座子
用限制性内切核酸酶NheI和XbaI裂解质粒pHIS714以得到含有编码转座酶基因的片段。将所述的DNA片段导入质粒载体pUC19的XbaI位点以构建质粒TnpL/pUC19。
然后,用限制性内切核酸酶MroI和XbaI裂解TnpL/pUC19以缺失含有IS714终止密码子和3′反向重复(IR)的序列。将被设计用来再导入终止密码子的合成的双链DNA经连接插入到上述的裂解部分。用所述的方法,得到未插入反向重复序列之间的转座酶基因。
随后,用限制性内切核酸酶SmaI和XbaI裂解所述的ORFL/pUC19以得到含有转座酶的约1.5kb的基因片段。将该转座酶基因片段插入到通过除去其SmaI和XbaI位点之间的序列而得到的质粒载体pHY300PLK部分,然后用限制性内切核酸酶EcoRI和KpnI切割。EcoRI和KpnI片段是平整末端。同时,用限制性内切核酸酶PvuII部分消化质粒载体pHSG398以缺失含有多克隆位点的片段,然后与上述得到的转座酶基因片段相连。由此构建质粒pORF1(图10)。
另一方面,得到含有转座酶基因的质粒pHIS714的NheI-XbaI裂解片段,使其末端平整,然后转入质粒载体pUC19的末端钝化的PstI位点以构建质粒Tnp(Pst)/puc19。
用U.S.E.Mutagensis试剂盒(Pharmacia Biotech)使所述Tnp(Pst)/pUC19的转座酶基因经部分碱基取代。被取代的碱基是IS714序列中第288位上的G。用C取代所述的碱基G。经碱基取代的质粒称为Tnp(Pst)M/pUC19。Tnp(Pst)M/pUC19的结构示于图11中。*表示导入的突变。
用各种系统控制转座因子的转座。所述控制的实例包括下列系统(Mobile DNA,American Society for Microbiology,Washingtoln D.C.(1989))。
(1)在转座因子内与转座酶基因邻接的转座酶抑制基因或阻遏基因(例如Tn3)。
(2)在一个框架内存在两个ORF。一个靠近3′末端编码区。在两个ORF之间的转译移框的发生频率很低,从而使得表达转座酶的两个ORF被完全转译,(例如IS1)。
(3)在编码转座酶的ORF中存在另一个转译起始密码子(ATG,GTG),而且转译从所述的密码子开始以表达抑制剂(例如Tn5(IS50))。
同时,在IS714中存在一个几乎相当于全长IS714的ORF,但未发现另一个ORF。这表明可能是IS714含有编码转座酶样Tn5的ORF,而抑制剂是从所述ORF中的另一个起始密码子开始转译的。寻查启动子样序列的结果表明从286-288的序列GTG可能是抑制剂的起始密码子。设计在质粒Tnp(Pst)M/pUC19上导入的突变,使其不会引发抑制剂的转译。
从pORF1中缺失在转座酶前一半基因中限制性内切核酸酶SmaI和NaeI位点之间的序列。将用限制性内切核酸酶SmaI和NaeI裂解Tnp(Pst)M/pUC19而得到的转座酶前一半基因片段插入到上述缺失的部分,通过连接构建poRF2。
从pORF2缺失SmaI和XbaI位点之间的序列,使所得的片段末端钝化。用限制性内切核酸酶NaeI和HindIII裂解pBSF2-SD7得到含有色氨酸操纵子弱化子的DNA片段,然后使之成为平端,将前一个片段与后一个片段相连。由此构建的质粒称为pORF3。
用限制性内切核酸酶SalI和Bpu 1102I裂解pORF3以缺失转座酶的前半段基因片段。将用限制性内切核酸酶SalI和Bpu1102I裂解Tnp(Pst)/pUC19而得到的转座酶前半段基因片段插入到上述缺失的部分,连接后构建图11所示的pORF4。
用SacI裂解TnpL/pUC19,然后用BAL 31核酸酶于30℃消化20分钟以便从上游侧缺失靠近转座酶基因起始密码子的序列。此后,用SphI位点切出转座酶基因片段,然后与用SmaI和SphI裂解的pHSG398相连。由此构建的质粒称为delTnp5/398。
用限制性内切核酸酶KnpI和HindIII裂解delTnp5/398,然后使转座酶前半段基因片段成为平端。然后,用NcoI和HindIII裂解质粒载体pKK233-2(由Pharmacia Biotech制备),使之成为平端。将前一个片段与后一个片段相连以构建pTrc-ORF。
用SspI和Bpu 1102I裂解pTrc-ORF以形成含有Trc启动子和转座酶前半段基因的片段。用XbaI裂解pORF3,使之成为平端,然后再用Bpu 1102I裂解以缺失转座酶前半段基因片段。将上述形成的片段与所缺失的pORF3相连以便如图12所示构建pORF7。
将用限制性内切核酸酶KpnI和HindIII裂解delTnp5/39而得到的转座酶前半段基因片段克隆到质粒载体pUC18的KpnI和HindIII之间。缺失所述质粒delTnp5/18的BsmI和NaeI位点之间部分,将该片段与通过用限制性内切核酸酶BsmI和NaeI裂解Tnp(Pst)M/pUC19而得到的转座酶前半段基因片段相连以构建delTnp5M/18。
用KpnI和HindIII裂解delTnp5M/18,使所得的转座酶前半段基因片段成为平端。用NcoI和HindIII裂解pKK233-2,使所得的片段成为平端。将这些片段彼此相连以构建pTrc-TnpM。
通过用从pTrc-Tnp构建pORF7相同的方法,从pTrc-TnpM和ORF3构建pORF8(图13)。
用上述质粒pORF3,pORF4,pORF7和pORF8构建导入到棒状细菌中的质粒。下面描述从pORF3构建pORF41。
首先,用NheI和SacII裂解pHIS714以缺失转座酶基因的主要部分。将被设计的以导入克隆位点的双链合成DNA插入到上述缺失的部分以构建pHTN7160。
用限制性内切核酸酶KpnI裂解pHTN7160,使之成为平端,然后再用BglI裂解以得到含有IS714两端的反向重复(IR)序列和在棒状细菌中起作用的温度敏感型复制起点的片段。
用限制性内切核酸酶EarI裂解pORF3,使之成为平端,然后再用BglI裂解。将pHTN7160的上述片段插入其中,以构建pORF41-pre。
用EcoRV裂解位于IS714两个末端IR之间的pORF41-pre。使含有pBR322的Tc抗性基因的EcoRI-AvaI片段成为平端,与EcoRV-裂解的片段连接以便按图14所示构建pORF41。
重复上述方法,以便从pORF4经pORF31-pre,从pORF7经pORF71-pre,从pORF8经pORF81-pre分别构建pORF31,pORF71,pORF81。
用XbaI和EarI裂解pORF3,使之成为平端,然后自身连接以构建不含转座酶基因的pORFCO(图15)。
用相同于从pORF3构建pORF41的方法,从pORFCO经pORFC2-pre构建pORFC2。
这些最终构建的质粒含有转座酶的结构基因,Cm抗性基因,在大肠杆菌中起作用的复制起点,在棒状细菌中起作用的温度敏感型复制起点,位于IS714的IR之间的Tc抗性基因,使得pORFC2不含有转座酶的结构基因。
含有IS714两个末端上的IR和Tc抗性基因的单元被称为转座子单元Tn7162。IS714本身或上述Tn7152等具有在一个可转座的区域内转座酶结构基因,而Tn7162的特征在于在可转座的区域内没有转座酶的结构基因。认为Tn7162是通过由位于该单元外并在携带Tn7162的载体上的转座子基因表达的转座子而转座的(图16)。或者认为,由染色体上的转座酶基因表达的转座酶来转座Tn7162。
其次,说明如何构建用于棒状细菌,含有转座酶基因,但没有转座子单元的质粒。
用EcoO 109I和MroI裂解质粒pHIS714K1以缺失IS714,然后将其自身连接以构建pHIS714Kdel。
同时,用限制性内切核酸酶EarI裂解pORF3,使之成为平端,然后,再用BglI裂解。用限制性内切核酸酶KpnI裂解pHIS714Kdel,使之成为平端,然后再用BglI裂解以形成含有在棒状细菌中起作用的温度敏感型复制起点的片段。将由此形成的片段彼此连接,以便按图17所示构建pORF40。
重量所述的方法,以便从pORF4,pORF7,pORF8和pORFCO分别构建pORF30,pORF70,pORF80,pORFC1。
就棒状细菌的插入序列,例如IS719和IS903而言,它们含有由序列表中序列5和9所代表的序列,而且不同于上述的IS714,通过将药物抗性基因。例如氯霉素抗性基因和四环素抗性基因以及所需的基因,例如天冬氨酸激酶基因插入到插入序列中转座酶基因的调节基因区和结构基因区外的适宜限制性内切核酸酶位点,可以构建人工转座子。若在转座酶基因的调节基因区和结构基因区外,没有适宜的限制性内切核酸酶位点,则在不抑制转座酶功能的区域,通过利用聚合酶链反应(PCR)的部分特异性碱基突变,经修饰插入序列,或者用合成DNA寡核苷酸(衔接子)进行基因插入,可以首先制备适宜的限制性内切核酸酶位点。
将由此构建的人工座子通过适当的载体,例如质粒导入宿主棒状细菌中。对含有人工转座子的质粒没有特别限定。通常使用来自棒状细菌的质粒。质粒的实例包括pHM1519[Agric.Biol.chem.,48,2901-2903(1984)],AM330[Agric.Biol.Chem.,48,2901-2903(1984)],和通过改进上述质粒而得到的含有药物抗性基因的质粒。为了以良好的效率扩增导入到染色体中的人工转座子,推荐使用在(1)中提到的含有温度敏感型复制起点的质粒(参见日本Kokai No.7,491/1993)。
用原生质体方法[Gene,39,281-286(1985)]或电穿孔方法[Bio/Technology,7,1067-1070(1989)]可以将含有人工转座子的质粒导入到棒状细菌中。
用构建的质粒,通过转化棒状细菌,在25℃温育转化体,在所述的温度,可以复制质粒以扩增含人工转座子的质粒达到每细胞数百拷贝,并导入到染色体中,再在34℃下保温以除去额外的质粒,这样通过温度敏感型质粒即可将人工转座子导入到棒状细菌的染色体中。用所述的方法,可以以良好的效率完成基因在染色体中的扩增。可以用正常质粒代替温度敏感型质粒。但是,在许多情况下,在将人工转座子导入到染色体中后,很难除去额外的质粒。此外,还有一种方法,只用人工转座子的DNA片段或不能在棒状细菌中复制的质粒载体(例如,在大肠杆菌中复制的质粒载体),而将人工转座子导入到棒状细菌中[Japanese Kokai No.107,976/1955;and Mol.Gen.Genet.,by Wertes A.A.,Asai Y.,Inui M.,Kobausshi M.,Kurusu Y.and Yukawa H.,245,397-405(1994)]。然而,用该方法不能在转化后的宿主菌株中扩增DNA片段,而且转座到宿主染色体中的效率很差。
用与所需基因一起导入的药物抗性基因的药物抗性程度,来筛选所需基因被导入染色体中的菌株或在染色体中扩增的所需基因的菌株。所用的药物抗性基因包括卡那霉素抗性基因,氯霉素抗性基因,四环素抗性基因,氨苄青霉素抗性基因,氨甲蝶呤抗性基因等。抗性程度与药物抗性基因的拷贝数相关的药物抗性基因是最优选的。即,从存在高浓度药物的情况下可以生长的克隆可以达到所需基因在染色体中扩增的菌株。
用含有药物抗性基因。例如四环素抗性基因等和所需基因,例如脱敏的天冬氨酸激酶基因等的质粒(例如pHTN7156-C)转化棒状细菌,并且人工转座子被转座到宿主染色体中后,可以用下列方法评估转座后在染色体中形成的转座拷贝数。
在25℃,于含适当浓度(用Tc时,从1-20μg/ml)药物,例如四环素(Tc)等,10g/L酵母提取物,10g/L胰胨,5g/L葡萄糖和5g/LNaCl的CM2G液体培养基中,将转化子温育过夜。用0.9%NaCl溶液适当稀释培养液,然后以100μl的量涂布在含适当浓度药物的CM2G琼脂培养基上。将所得的培养物在34℃温育。从形成的许多克隆中随机筛选数个克隆。制备染色体DNA,用包括PvuII的不同限制性内切核酸酶完全消化,然后经琼脂糖凝胶电泳。在硝酸纤维素,尼龙或聚偏氟乙烯(PVDF)滤纸上印迹片段。用32P-标记的四环素抗性基因片段作为探针,使所述滤纸经Southern杂交,以检测与该探针杂交的带的数目。
用常规使用的方法和条件可以温育所需基因在由此得到的染色体中扩增的转化子。温育所用的培养基是含有碳源,氮源,无机离子等的常规培养基。可以按需要加入有机微量营养物质,例如维生素,氨基酸等。碳源的实例包括碳水化合物,例如葡萄糖和蔗糖,有机酸,例如乙酸,和醇例如乙醇。氮源的实例包括氨气,液氨,胺盐。无机离子的实例包括镁离子,磷酸离子,钾离子和铁离子。根据需要使用这些物质。
需氧培养1-7天,同时将pH的范围控制在5.0-8.5,温度控制在15℃-37℃。用人工转座子扩增基因,其结果是生产有用物质的效率得到提高,并且在培养菌株内或外生产并积累所需的物质。用已知方法,可以从培养液中收集所需的物质。
实施例
参考下列实施例将更详细地说明本发明。
实施例1
用IS714构建含有卡那霉素抗性基因的人工转座子
用限制性内切核酸酶PvuII和EcoRI裂解含有IS714的序列的质粒pEC701-IS14以得到含IS714的1.6kb片段,所述的IS714的序列是棒状细菌的插入序列。含质粒pEC701-IS14的乳酸发酵短杆菌于1992年3月10日保藏在通商产业省工业技术院生命工学工业技术研究所(1-3,Higashil Chome Tsukuba-shi Ibaraki-Ken 305,Japan),保藏号为No.FERM P-12863,然后于1993年3月9日转变为根据布达佩斯条约的保藏证书。保藏号为BP-4232。
同时,用限制性内切核酸酶SalI消化温度敏感型质粒pHSC4,用Klenow片段处理成平端。温度敏感型质粒pHSC4的限制性内切核酸酶SalI位点位于不参与复制的区域。用Klenow片段处理成平端。然后通过连接将所得的片段插入到限制性内切核酸酶SalI位点,得到如图2所示的质粒pHIS714。含质粒pHSC4的大肠杆菌AJ12571于1990年10月11日保藏在通商产业省工业技术院生命工学工业技术研究所(1-3,Higashi 1 ChomeTsukuba-shiIbaraki-Ken 305,Japan),保藏号为FERM P-11763,然后于1991年8月26日转变为根据布达佩斯条约的保藏证书。保藏号为BP-3524。
通过Klenow片段处理将上述含IS714的1.6kb片段制成平端,然后插入到所述pHIS714的SmaI位点,通过连接构建如图2所示的质粒pHTN7141和pHTN7142。限制性内切核酸酶裂解分析表明,将两个IS714片段以相同的方向插入到质粒pHTN7141中,以相反的方向插入到质粒pHTN7142中。
用限制性内切核酸酶PvuII裂解pHTN7141和pHTN7142,可以切出在棒状细菌pHSC4中的含两个IS714序列的片段和温度敏感型复制起点的序列。另一方面,质粒载体pHSG298(由Takara shuzo制备)还含有两个限制性内切核酸酶PvuII位点。因此,用限制性内切核酸酶PvuII裂解pHSG298可以得到含新霉素磷酸转移酶基因(卡那霉素抗性基因)的2.3kb片段。
用限制性内切核酸酶PvuII裂解pHTN7141和pHSG298,然后将其彼此相连以转化乳酸发酵短杆菌AJ12036。如图3所示,从对25μg/ml卡那霉素(km)有抗性的转化子菌株得到质粒pHTN7143。根据布达佩斯条约,含质粒pHTN7143的乳酸发酵短杆菌于1993年3月9日保藏在通商产业省工业技术院生命工学工业技术研究所(1-3,Higashi 1Chome Tsukuba-shi Ibaraki-ken 305,Japan)。保藏号为BP-4231。
按图4所述,用上述方法,从pHTN7142和pHSG298得到质粒pHTN7144。pHTN7143和pHTN7144具有新霉素磷酸转移酶位于两个IS714序列之间的结构。此外,按图5所示,用pHSG298为对照,从质粒pHIS714制备质粒pHIS714K1和pHISK2。在pHIS714K1和pHISK2中,含新霉素磷酸转移酶基因的插入片段位于相反的位点。
为了使人工转座子最小化,构建新霉素磷酸转移酶基因插入到一个IS714序列中的人工转座子。限制性内切核酸酶NheI位于IS714中不影响转座酶功能的位置。因此,用限制性内切核酸酶NheI裂解质粒pHIS714,使其末端平整。同时,用限制性内切核酸酶PstI从质粒pUC4K(由Pharmacia Biotech制备)中切出新霉素磷酸转移酶基因区,然后使其末端平整。将这些片段彼此相连,如图6所示,所得质粒称为pHTN7145。
含质粒pHTN7145的大肠杆菌AJ12036于1995年6月29日保藏在通商产业省工业技术院生命工学工业技术研究所(1-3,Higashil Chome Tsukuba-shi Ibauaki-ken 305,Japan),并于1996年5月16日转变为根据布达佩斯条约的保藏证书,保藏号为BP-5537。
评估人工转座子的转座性能
按如下评估由此得到的人工转座子的转座性能。
用含有氯霉素乙酰基转移酶基因的质粒pAJ43转化乳酸发酵短杆菌以产生乳酸发酵短杆菌AJ11882。用含有人工转座子的质粒pHTN7145转化乳酸发酵短杆菌AJ11882,以便质粒pAJ43和质粒pHTN7145共存于所述的乳酸发酵短杆菌中。含质粒pAJ43的大肠杆菌AJ11882于1982年4月28日保藏在通商产业省工业技术院生命工学工业技术研究所(1-3,Higashi 1 ChomeTsukuba-shiIbauaki-ken 305,Japan),并于1982年5月22日转变为根据布达佩斯条约的保藏证书,保藏号为BP-136。
在含有25μg/ml卡那霉素(Km),5μg/ml的氯霉素(Cm),10g/L酵母提取物,10g/L胰胨,5g/L葡萄糖和5g/LNaCl的CM2G培养基中,于25℃培养上述得到的含pHTN7145和pAJ43的乳酸发酵短杆菌过夜,同时搅拌。然后将培养液适当稀释,涂布在含25μg/ml卡那霉素(Km)和5μg/ml氯霉素(Cm)的CG2M琼脂培养基中,于34℃培养。在形成的菌落中从100个菌株提取质粒,然后通过电泳检测其大小。其中,质粒pHTN7145和pAJ43的分子量不同。它们是其分子量为pAJ43和人工转座子的总分子量的质粒。
通过限制内切酶裂解分析这些质粒时,发现pHTN7145中的序列被插入到pAJ43中。就这些质粒中的一个来看,用双脱氧法确定插入在pAJ43部分附近和插入片段核苷酸序列。结果,鉴定出人工转座子两个末端的序列,经过插入的pAJ43上的靶序列GGTITATT(Sequence No.12)是双份的。
从这些结果发现若采用一种转座子结果,其中在一个IS714序列中插入不参与转座性能的基因(新霉素磷酸转移酶基因),则它可以象有所述结构的转座子一样转座。
评价人工转座子的转座频率
用pHTN714K1、对照质粒、pHTN7143、pHTN7144和pHTN7145转化乳酸发酵短杆菌AJ12036,评价人工转座子转座到宿主染色体内的频率。pHTN7143、pHTN7144和pHTN7145都含有人工转座子。
于25℃,在含有25μg/ml Km的上述CM2G液体培养基中将每个转化子温育过夜,然后用0.9%NaCl溶液大致稀释培养物,以100μl的量将之涂布于含25μg/ml Km的CM2G琼脂培养基上。在34℃和25℃保温所得物质,由菌落数目测量每个温度Km抗性菌株出现的频率,用34℃时的菌落数除以25℃时的菌落数,将所得数值定义为转座频率。
结果示于表1。
                                          表1
  转座因子或人工转座子   转座频率   比率
  IS714Tn7143Tn7144Tn7145   1.85×10-33.52×10-32.38×10-32.08×10-2   11.91.311.2
从上述结果中发现人工转座子Tn7143(包含于pHTN7143中)和Tn7144(包含于pHTN7144中)转座到宿主染色体内的频率仅为作为对照质粒的IS714(包含于pHIS 714K1中)的1或2倍,但是人工转座子Tn7145(包含于pHTN7145中)的转座频率大约为对照的11倍,因此它是一个十分有效的人工转座子。
实施例2
使用IS714构建含有氯霉素抗性基因的人工转座子
用限制性内切核酸酶ACCII切割质粒载体pHSG398(由TakaraShuzo制备),得到含有氯霉素乙酰转移酶基因的约为1.1kb的片段,用T4DNA聚合酶处理以使此ACCII片段的末端钝化,将之插入pUC18(由Takara Shuzo制备)的SmaI位点并克隆之,即从已在含有25μg/ml Cm、100μg/ml氨苄西林(Ap)、10g/l胰胨、5g/l酵母提取物和5g/l Nall的L-培养基中生长的E.coli转化子中选择所需的克隆。将此质粒称为pUC18-CM。
另外,用EcoRI和HindIII从pUC18-CM上切下含有氯霉素乙酰转移酶基因的大约为1.1kb的片段,并使其末端钝化。在实施例1所构建的pHIS714K2中,通过用Klenow片段处理,可使位于不会损害转座酶功能之位置处的IS714的限制性内切核酸酶NheI位点的末端钝化。将上述片段与此限制性内切核酸酶NheI位点连接以转化E.coli,挑选在含有25μg/ml Cm和50μg/ml Km的L-琼脂-培养基上生长的菌落,选择其中已插入了氯霉素乙酰转移酶基因片段的克隆,如图7所示,将此克隆中所含的质粒称为pHTN7151。
用质粒pHTN7151转化E.coli HB101可得到E.coli AJ13129,1995年6月29日将之保藏于通商产业省工业技术院生命工学工业技术研究所(1-3、Higashi 1chome Tsukuba-shi Ibaraki-ken305,Japan),保藏目录号为FERM P-15012,1996年5月16日变成根据布达佩斯条约的保藏证书,指定保藏号为No.BP-5538。
评价染色体中经人工转座子转座而形成的拷贝数
用pHTN 7151转化乳酸发酵短杆菌AJ12036,用下述方法评价经人工转座子转座到宿主染色体内形成的染色体中人工转座子的拷贝数。
于25℃,在上述含有3μg/ml Cm的CM2G液体培养基中将所得转化子温育过夜,用0.9%NaCl溶液大致稀释,以100μl的量涂布于含有3μg/ml Cm的CM2G琼脂培养基中,将所得物质在34℃中保温。从长出的菌落中选择卡那霉素敏感克隆,于30℃,在上述含有3μg/ml Cm的CM2G液体培养基中将此克隆温肓过夜,用0.9%NaCl溶液大致稀释,以100μl的量涂布于含有6μg/ml Cm的上述CM2G琼脂培养基中,将所得物质在30℃中保温,从形成的菌落中随机选择一些克隆,制备每个克隆的染色体DNA,用限制性内切核酸酶PvuII完全消化,经琼脂糖凝胶电泳,在聚偏氟乙烯(PVDF)滤膜上印迹,使用经32P-标记的氯霉素乙酰转移酶基因片段作为探针,使滤膜经受Southern杂交,测量与探针杂交的带的数目。
结果,鉴定出随机选择的四个克隆中有三个,其两拷贝具有氯霉素抗性基因的人工转座子被转座到宿主染色体内。
实施例3
使用IS714构建含有四环素抗性基因的人工转座子
用限制性内切核酸酶EcoRI和AvaI裂解质粒载体pBR322(由Takara Shnzo制备)以得到含有四环素抗性基因的大约为1.4kb的片段。再用T4DNA聚合酶处理使此EcoRI-AvaI-裂解片段的末端钝化。在实施例1所构建的pHIS714K2中,通过用Klenow片段处理,可使位于不会损害转座酶功能之位置处的IS714的限制性内切核酸酶NheI位点的末端钝化,将上述片段与此限制性内切核酸酶NheI位点连接以转化E.coli。得到在含有25μg/ml Tc的L-琼脂-培养基上生长的菌落,选择其中已插入了四环素抗性基因的克隆,如图8所示,将此克隆中所含的质粒称为pHTN7152。
用质粒pHTN7152转化E.coli可得到E.coli AJ13130,1995年6月29日将之保藏于工业贸易和工业部、工业科学和技术机构的国家生物科学和人类技术研究所(1-3、Higazhi 1 ChomeTsukuba-shi Ibaraki-Ken 305、Japan),保藏目录号为FERM P-15013,1996年5月16日变成根据布达佩斯条约的保藏证书,其指定保藏号为BP-5539。
评价染色体中经人工转座子转座而形成的拷贝数
用pHTN7152转化乳酵发酵短杆菌AJ12036,按下述方法评价经人工转座子转座而形成的染色体中的拷贝数。
于25℃,在含有1.5μg/ml Tc的上述CM2G液体培养基中将转化子温育过夜,再用0.9%NaCl溶液大致稀释,涂布于含有1.5μg/ml至5μg/ml T的上述CM2G琼脂培养基中。将所得物质在34℃中保温,从形成的菌落中随机选择一些克隆,制备每个菌落的染色体DNA,用限制性内切核酸酶PvuII完全消化,经琼脂糖凝胶电泳,在聚偏氟乙烯(PVDF)滤膜上印迹,使用经32P-标记的四环素抗性基因片段作为探针,使滤膜经受Southern杂交,测量与探针杂交的带的数目。
结果,如表2所示,以高频率检测到具有四环素抗性基因的两或三拷贝人工转座子。因此;鉴定出使用四环素抗性基因作为选择性药物抗性基因可以高频率得到所需的多拷贝型转化子。
                                           表2
  Tc浓度(μg/ml)   检测的克隆数        检测的克隆数
  1拷贝  2拷贝   3拷贝
  1.52.03.04.04.0   64466   44325   20131   00010
根据布达佩斯条约,于1996年5月14日将抗4μg/ml Tc且染色体上具有了拷贝人工转座子的乳酸发酵短杆菌AJ13188保藏于通商产业省工业技术院生命工学工业技术研究所(1-3,Higazhi1 Chome Tsukuba-Shi Ibaraki-Ken 305,Japan),指定保藏号为No.BP-5536。
实施例4
使用IS714构建含有四环素抗性基因和天冬氨酸激酶基因的
人工转座子
按下述方法将天冬氨酸激酶基因(赖氨酸生物合成基因之一)插入含有四环素抗性基因的人工转座子中。
用限制性内切核酸酶EcoRI和AvaI裂解质粒载体pBR322(内Takara Shuzo制备)以得到含有四环素抗性基因的约为1.4kb的DNA片段,用T4DNA聚合酶处理使此经过EcoRI-AuvI裂解的片段末端钝化,将所得DNA片段与用限制性内切核酸酶SmaI切割质粒载体pHY300PLK(由Takara Shuzo制备)所得的片段连接,并转化E.coli,得到在含有25μg/ml Tc的L-琼脂培养基上生长的菌落,选择其中已插入四环来抗性基因片段的克隆,将此克隆的质粒称为pHY300-Tc。
另外,可通过用Klenow片段处理,使得通过用限制性内切核酸酶EcoRI和XbaI裂解pHY300-Tc得到的、并含有pBR322的四环素抗性基因的片段的末端钝化。在以上构建的pHIS714K2中,通过用Klenow片段处理,可使位于不会损害转座酶功能之位置处的IS714的限制性内切核酸酶NheI位点的末端钝化。将上述片段与此限制性内切核酸酶NheI位点连接以转化E.coli,得到在含有25μg/ml Tc的L-琼脂培养基上生长的菌落,选择其中已插入四环来抗性基因片段的克隆,如图9所示,将此克隆中所含有质粒称作pHTN7156。
在另一方面,于1992年4月10日将E.coli AJ12691(WO94/25605)保藏于通商产业省工业技术院生命工学工业技术研究所(1-3、Higachi 1 ChomeTsukuba-shi Ibaraki-Ken 305、Japan),保藏号为FERM P-12198,1995年2月10日将之变为根据布达佩斯条约的保藏证书,其指定保藏号为NO.FERM BP-4999。E.coli AJ12691中具有质粒p399AK9B,此质粒含有来自乳酸发酵短杆菌产赖氨酸突变体的天冬氨酸激酶基因,此基因对赖氨酸和苏氨酸的协同抑制作用脱敏感。
用限制性内切核酸酶BamHI裂解此p399AK9B,并自身连接到已从中去除了在棒状杆菌中起作用的复制起点的构建体PHSG399AK中。用EcoRI和SphI裂解PHSG399AK以得到约为1.7kb的天冬氨酸激酶基因片段。用T4DNA聚合酶处理使此片段的末端钝化,用Klenow片段片理使质粒pHTN7156的限制性内切核酸酶BglII位点的末端钝化,所述质粒具有含四环素抗性基因的人工转座子。然后将以上形成的片段插入此限制性内切核酸酶BglII位点,以此方式构建了如图9所示的质粒pHTN7156-C。
用质粒pHTN 7156-C转化E.coli可得到E.coli AJ13131,1995年6月29日将之保藏于通商产业省工业技术院生命工学工业技术研究所(1-3、Higashi 1 ChomeTsukuba-shi Ibaraki-ken 305、Japan),指定保藏号为No.FERM P-15014,1996年5月16日将E.coli AJ13131变成根据布达佩斯条约的保藏,其指定保藏号为No.BP-5540。
评价染色体中经人工转座子转座而形成的拷贝数
用pHTN 7156-C转化乳酸发酵短杆菌AJ12036或乳酸发酵短杆菌AJ3445。评价经人工转座子转座到宿主染色体中而形成的染色体中转座子的拷贝数。AJ12036菌株的染色体上具有野生型天冬氨酸激酶基因,而AJ3445菌株表现出S-2-戊基乙基-L-半胱氨酸抗性,并且具有对赖氨酸和苏氨酸的协同抑制作用脱敏的天冬氨酸激酶基因。
1984年3月26日将乳酸发酵短杆菌AJ 12036保藏于通商产业省工业技术院生命工学工业技术研究所(1-3,Higashi 1 ChomeTsukuba-Shi Ibaraki-ken 305.Japan),指定保藏号为No.FERM P-7559,1985年3月13日将乳酸发酵短杆菌AJ12036变成根据布达佩斯条约的保藏证书,其指定保藏号为No.BP-734。
1973年3月2日将乳酸发酵短杆菌AJ3445保藏于通商产业省工业技术院生命工学工业技术研究所(1-3,Higashi 1 ChomeTsukuba-shi Ibaraki-Ken 305,Japan),指定保藏号为No.FERM P-1944,1996年5月17日将乳酶发酵短杆菌AJ 3445变成根据布达佩斯条约的保藏证书,其指定保藏号为No,BP-5541。
首先,于25℃,在CM2G培养基中将转化子温育过夜,所述培养基含有0.7μg/ml Tc 10g/l酵母提取物,10g/l胰化蛋白胨,5g/l葡萄糖和15g/l NaCl。用0.9%NaCl溶液大致稀释培养物,以100μl的量涂布于含1.5μg/ml至5μg/ml Tc的上述CM2G琼脂培养基中,将所得培养物保温于34℃,从形成的菌落中随机选择一些克隆,并在含有25μg/ml Km的CM2G琼脂培养基中复制,然后选择Km-敏感菌株,制备选定的Km-敏感菌株的染色体DNA,用限制性内切核酸酶GblII完全消化,进行琼脂糖凝胶电泳,在聚偏氟乙烯(PVDF)滤膜上印迹,使用经32P标记的天冬氨酸激酶基因片段(从基因后一半的HindIII位点至EcoRI位点,为440bp)作为探针,对此滤膜进行Southern杂交,检测与探针杂交的带的数目,结果发现当AJ12036用作宿主时,10个分析菌株中的4个有两拷贝的转座子Tn7156-C被转座,当AJ3445用作宿主时,22个分析菌株中的8个有两拷贝的转座子Tn7156-C被转座。这证明通过使用四环素抗性基因作为选择性药物抗性基因,可以高频率将多拷贝有用基因引入染色体。
评价使用人工转座子转座天冬氨酸激酶基因的菌株中所产生 的赖氨酸的量
评价其中转座子转座子的上述菌株中产生的赖氨酸的量。
将含有转座子的菌株涂布于含有0.7μg/ml Tc的CM2G琼脂培养基的整个表面,于34℃温育过液,将其量为原始量1/6的细胞接种于20ml赖氨酸生产培养基中,所述培养基含有100g/l葡萄糖,55g/l硫酸铵,50ml/l Mamenon(Ajinomoto CO.,Inc.),1/gl磷酸二氢钾、1g/l硫酸镁、2mg/l维生素B1、0.5mg/l生物素、5ml/l烟酸酰胺、2mg/l硫酸铁和2mg/l硫酸锰(将此培养基的pH调节至7.5,然后以115℃高压灭菌15分钟,然后向其中加入50g/l的碳酸钙)。于30℃将培养物溶液在Sakaguchi三角锥瓶中温育72小时,分析培养物溶液中所形成的赖氨酸含量,评价含有人工转座子的菌株中所产生的赖氨酸的量,结果,如表3和表4所示,当AJ 12036和AJ3445用作亲本菌株时,与无转座子的菌株相比,在Tn7156-C的转座中观察到所产生赖氨酸的量有所增加,另外,转座子的转座拷贝数越大(1拷贝和2拷贝),所产生赖氨酸的量越多。
这证明通过使用四环素抗性基因作为选择性药物抗性基因来引入有用基因的拷贝,可增加此菌株中产生的氨基酸的量。
                                        表3
                      使用AJ12036作为亲本菌株,其中转座了转座因子的
                       菌株中所产生的赖氨酸的量
  菌株   Tn7156-C的转座拷贝数   所产生赖氨酸的量(g/l)
  AJ12306Tn7156-Cint-Y1Tn7156-Cint-Y2   012   0.012.818.8
                                            表4
                       使用AJ13445作为亲本菌株,其中转座了转座因子的
                          菌株中所产生的赖氨酸的量
  菌株   Tn7156-C的转座拷贝数   所产生赖氨酸的量(g/l)
  AJ13445Tn7156-Cint-06Tn7156-Cint-019   012   18.721.325.2
实施例5
穿梭载体pvK7的构建
如日本专利公开No.11,280/1989和USP 4,788,762中所述,乳酸发酵短杆菌中存在隐蔽性质粒pAM330。此pAM330产生于乳酸发酵短杆菌ATCC13869,它可用作能在短杆菌原中扩增的穿梭载体复制起点。
通过将pHSG299(由Takara Shnzo制备)与pAM330结合可构建一个新的穿梭载体,所述pHXG299是E、coli的多功能载体。
用限制性内切核酸酶HindIII在一个位点处切割pAM330,用T4DNA聚合酶使裂解的表面末端钝化。另外,用限制性内切核酸酶AvaII在一个位点处切割pHSG299,用T4DNA聚合酶使裂解的表面末端钝化。将所得片段相互连接可得到pAM330与pHSG299相结合的值粒,pVK7的构建图示于图18中,pVK7可在大肠杆菌和短杆菌中复制,并可将卡那霉素抗性传递给宿主。此载体具有PstI、SalI、BamHI、KpnI、SalI和EcoRI克隆位点,每个位点都允许在一个位点处裂解,它们都来自pHSG299的多克隆位点。
穿梭载体pVC7的构建
与pVK7类似,将pHSG399(由Takara Shnzo制备)与pAM330联合可构建一种新的穿梭载体pVC7,所述pHSG399是E.Coli的多功能载体。
用限制性内切核酸酶HindIII在一个位点处切割pAM330,用T4DNA聚合酶使裂解的表面末端钝化,另外用限制性内切核酸酶BsaI在一个位点处切割pHSG399,并用T4DNA聚合酶使之未端钝化将所得片段互相连接可得到pAM330和pHSG399相联合的质粒。pVC7的构建图示于图19中。pVC7在大肠杆菌和短杆菌中都可复制,并可将卡那霉素抗性传递给宿主,此载体具有PstI.SalI.BamHI、KpnI、SacI、EcoRI、SmaI和HindIII克隆位点,每个位点都允许在一个位点处裂解,它们都来自pHSG399的多克隆位点。
含有dapA、dapB和lysA的质粒的产生
(1)lysA的制备及含有lysA质粒的构建
使用乳酸发酵短杆菌ATCC 13869的野生型菌株作为染色体DNA的供体,根据一般方法从ATCC 13869菌株中制备染色体DNA,根据PCR从染色体DNA中扩增含有 argS、 lysA的DNA片段以及含有它们的操纵子的启动子DNA片段。分别使用具序列表中SEQ IDNOs:13和14所示核苷酸序列的23-聚体合成DNA作为扩增所用的DNA引物,以根据谷氨酸棒状杆菌(Corynebalterinm glutamicum)的已知序列(见Molecular Microbiology,4(11),1819-1830(1990);Molecular and General Genetics,212,112-119(1988))扩增编码精氨酰-tRNA合酶和DDC的约为3.6kb的区域。用常规方法进行DNA的合成和PCR,即根据一般方法,通过使用AppliedBiosystems生产的380B型DNA合成仪并使用亚磷酰胺法(见Tetrahedron letters(1981), 22,1859)以合成DNA。根据供应商指定的方法,使用PJ2000型DNA热循环仪(由Takara Shuzo生产)以及Taq DNA聚合酶,经PCR扩增基因。经扩增的DNA片段的序列示于第15号序列中。
使用pHSG399作为克隆载体以扩增3,579bp的基因片段,用限制件酶SmaI消化pHSG399,此载体上连接有含经扩增的 lysA的DNA片段。按上述方法得到的质粒被称为p399LYSA,它具有来源于ATCC13869的 lysA
用KpnI和BamHI消化p339LYSA可提取到含有 lysA的DNA片段,将此DNA片段连接到已被KpnI和BamHI消化的pHSG299上,所得质粒被称作p299LYSA。p299LYSA的构建过程示于图20中。
用限制性内切核酸酶KpnI和BamHI裂解p399LYSA以提取 lysA片段,将此片段连接到已被KpnI和BamHI裂解的pVK7中,由此产生的质粒被称作pLYSAm(图21)。
(2)dapA的制备以及含有dapA的质粒的构建
使用乳酸发酵短杆菌ATCC13869的野生型菌株作为染色体DNA供体,根据一般方法从ATCC13869菌株中制备染色体DNA,根据PCR从染色体DNA中扩增含有 dapA的DNA片段。分别合成具有序列表中SEQ ID NOs:16和17所示核苷酸序列的20-聚体DNA以作为扩增所用的DNA引物,从而根据各氨酸棒状杆菌的已知序列(见Nueleic Acids Research,18(21),6421(1990);EMBL登记号为No、X53993)扩增编码DDPS的约为1.5kb的区域。用常规方法进行DNA合成和PCR,经扩增的DNA片段的序列示于第18号序列中。将pCR1000(由Invitrogen生产,见Bio/Technology,9,657-663(1991))用作1.411bp的扩增基因片段的克隆载体,所述基因上连接有经扩增的 dapA片段,根据指定的方法使用DNA连接试剂盒(由Takara Shuzo生产)以进行DNA的连接,从而构建出一质粒,其中扩增自乳发酵短杆菌染色体的1,411bp的 dapA片段插入到pCR1000上。将接上述方法制得的质粒称为pCRDAPA(图22),它具有来源于ATCC13869的 dapA
将pCRDAPA导入E.coli菌株中可得到转化子菌株AJ13106,根据布达佩斯条约,于1995年5月26日将此菌株国际保藏于通商产业省工业技术院生命工学工业技术研究所(邮编:305.1-3,Higazhi 1-Chome,Tsukuba-Shi,Ibaraki-Ken,Japan),保藏号为FERM BP-5113。
用KpnI和EcoRI消化含有 dapA的质粒pCRDAPA,并分离含有dapA的DNA片段,将此片段与已被KpnI和EcoRI消化的pHSG399连接可得到p399DPS(图23)。
(3)野生型和突变体1ysC的制备以及含有它们的质粒的制备
将乳酸发酵短杆菌ATCC13869的菌株,得自ATCC13869菌株并经突变处理的可生产L-赖氨酸的突变体菌株AJ3445用作染色体DNA供体,AJ3445菌株已经过突变以使 lysC变成对赖氨酸和苏氨酸的协同抑制作用基本上脱敏(Journal of Biochemistry、68,701-710(1970))。
根据PCR法(聚合酶链反应;见White T.J.et al.TrendsGenet.,5.185(1989)),从染色体DNA中扩增含有 lysC的DNA片段,合成具有SEQ ID NOs:19和20所示核苷酸序列的23-聚体和21-聚体单链DNA以作为扩增所用的DNA引物,从而可根据各氨酸棒状杆菌的已知序列(见Moleadar Microbiology(1991),5(5),1197-1204;和Mol Gen.Genet.(1990)224 317-324)扩增编码 lysC的约为1,643bp的区域。使用常规方法进行DNA合成和DNA扩增,扩增DNA的序列示于序列21号,经琼脂糖凝胶电泳证实1,643bp的扩增基因片段,然后根据一般方法从凝胶中纯化切下的片段,用限制性酶NruI和EcoRI消化此片段。
将pHSG399用作基因片段的克隆载体,用限制性酶SmaI和EcoRI消化pHSG399,并将之与扩增的 lysC片段相连接,根据指定方法使用DNA连接试剂盒以连接DNA,因而制备了一种质粒,其中扩增自乳酸发酵短杆菌的染色体的 lysC片段分别与pHSG399连接,将含有ATCC13869(野生型菌株)之 lysC的质粒称为p399AKY,含有AJ3445(可生产L-赖氨酸的细菌)之 lysC的质粒称为p399AK9(图24)。
(4)dapB的制备以及含有dapB的质粒的构建
将乳酸发酵短杆菌ATCC13869的野生型菌株用作染色体DNA供体,根据一般方法从ATCC13869菌株中制备染色体DNA,根据PCR从染色体DNA中扩增含有 dapB的DNA片段。合成分别具有序列表中SEQ ID NOs:22和23所示核苷酸序列的23-聚体DNA以作为扩增所用的DNA引物,从而根据乳酸发酵短杆菌的已知序列(见Journal of Bacteriology,157(9),2743-2749(1993))扩增编码DDPR的约为2.0kb的区域。用常规方法进行DNA合成和PCR,经扩增的DNA序列示于序列24号中。将pCR-Script(由Invitrogen制备)用作2,001bp扩增基因片段的克隆载体,所述基因片段上连接有扩增的 dapB片段,由此构建了一个质粒,其中扩增自乳酸发酵短杆菌染色体的2,001bp的 dapB片段插入到pCR-Script上,将按上述方法得到的质粒称作pCRDAPB(图25),它具有来源于ATCC13869的 dapB。将pCRDAPB导入E.coli菌株可得到转化子菌株AJ13107,根据布达佩斯条约,于1995年5月26日将此菌株国际保藏于通商产业省工业技术院生命工学工业技术研究所(邮编:305,103,Higashi 1-Chme,Tsukuba-ShiIbaraki-Ken Japan),保藏号为FERM BP-5114。
(5)含有突变体lysC、dapA和dapB联合的质粒的构建
用EcoRI和SphI裂解p399DPS以形成钝端,然后提取 dapA基因片段,将此片段与已被SalI消化并钝端化的p399AK9连接以构建其中同时存在突变体 lysCdapA的质粒p399CA。
用EcoRI消化含有 dapB的质粒pCRDAPB并使之钝端化,然后用SacI消化以提取含有 dapB的2.0kb DNA片段。用SpeI消化含有dapA和突变体 lysC的质粒p399CA并使之钝端化,然后用SacI消化之并与以上提取出的2.0kb的 dapB片段连接以得到含有突变体 lysCdapAdapB的质粒,此质粒被称作p399CAB(图26)。
随后,用SacII裂解p399CAB,使裂解片段的末端钝化,再从中提取含有dapA和dapB片段,同时用BamHI裂解pLYSAm,使裂解片段的末端钝化,将这些片段相互连接以产生含有dapA、dapB和lysA的质粒,此质粒在棒状细菌中可自我增殖,将此质粒称作pABLm,pABLm的构建示于图21中。
将含有dapA、dapB和lysA的质粒导入乳酸发酵短杆菌Tn7156 -Cint-Y2中
使用电脉冲洗[日本特许公开专利申请(Kokai)no、207,791/1990,Sugimoto等人]将含有dapA、dapB和lysA的以上产生的质粒pABLm导入乳发酵短杆菌Tn7156-Cint-Y2中。通过药物抗性标记,即质粒的卡那霉素抗性基因以及染色体中扩增的四环素抗性基因来选择转化子,因此,转化子的选择在含有25μg/ml卡那霉素和1.5-μg/ml四环素的完全培养基中进行,将此转化子称为Tn7156-Cint-Y2/PABLm。
将含有lysC、dapA、dapB和lysA的质粒导入乳酸发酵短杆菌野生 型菌株中
将具有可使质粒在棒状杆菌属所属细菌中自主复制之能力的DNA片段(下文称为″Brevi.-ori″)导入p399CAB中。
从含有Brevi.-Ori的质粒载体pHK4中制备Brevi-Ori,所述质粒在大肠杆菌细胞和棒状杆菌属所属细菌细胞中都可以自主复制。用限制性酶BamHI消化pHK4,使裂解片段的末端钝化,根据指定的方法使用DNA钝端化试剂盒以进行钝端的形成。钝端形成之后,在其上连接一个磷酸化的KpnI接头(由Takara Shnzo生产)以引进修饰,以使仅用KpnI消化即可从pHK4中切割下相应于Brevi、-Ori部分的DNA片段。用KpnI消化此质粒,将产生的Brevi、-Ori DNA片段与已被KpnI消化的p399CAB连接以制备含有lysCdapAdapB基因并可在棒状杆菌属所属细菌中自主复制的质粒。此质粒被称作pCAB,构建pCAB的流程示于图26中。
用KpnI和BamHI消化pHC4、提取Brevi.-Ori片段,将之与已被KpnI和BamHI消化的pHSG298相连接,即可构建出pHK4(见日本专利特许公开No.5-7491)。pHK4可将卡那霉素抗性赋予宿主,将含有pHK4的E.coli称作E.coli AJ13136,1995年8月1日将之通商产业省工业技术院生命工学工业技术研究所(邮编:305,1-3,Higashi 1-Chome,Tsukuba-ShiIbaraki-Ken Japan),保藏号为FERM BP-5186。
(2)用Kpni和BamHI消化含有 lysA的质粒p299LYSA并使其末端钝化,再提取 lysA基因片段,将此片段与已被HpaI消化的PCAB连接以构建含有突变体 lysCdapAdapBlysA的联合并可在棒状细菌中自主复制的质粒。将构建出的质粒称作pCABL,pCABL的构建过程示于图27中。已注意到pCABL中含有 dapB基因的DNA片段的HpaI位点插入了 lysA基因片段,然而,HpaI位点位于 dapB基因启动子的上游(SEQ ID NO:24中的核苷酸数611至616处), dapB基因不能脱偶联。
将以上产生的含有lysC、dapA、dapB和lysA的质粒pCABL导入乳发酵短杆菌野生型菌株AJ12036中,在含有5μg/ml氯霉素的完全培养基中进行转化子的选择,将此转化子称为AJ12036/PCABL。
对以上构建的菌株培养作评价
在L-赖氨酸生产培养基中培养乳发酵短杆菌野生型菌株AJ12036的转化子AJ12036/pCABL和Tn7156-Cint-Y2/pABLm,评价其中产生的L-赖氨酸的量。L-赖氨酸生产培养基组成如下所示。
L-赖氨酸生产培养基:
溶解除碳酸钙以外的下列成分(每升中的量),用KOH将溶液的ph调至8.0,将所得溶液在115℃灭菌15分钟,加入50g已单独干热灭菌过的碳酸钙。
葡萄糖                   100g
(NH4)2SO4            55g
KH2PO4                1g
MgSO4·7H2O           1g
生物素                   500μg
维生素B1                 2000μg
FeSO4·7H2O           0.01g
MnSO4·7H2O           0.01g
烟酰胺                   5mg
蛋白水解物(Mamenon)      30ml
碳酸钙                   50g
将亲本菌株和转化子接种于具有上述组成的培养基中,在31.5℃往复振荡培养。表5中显示了培养72小时后产生的L-赖氨酸的量,培养完成时的生长量(OD562)和稳定性。通过将溶液稀释101倍并测量OD562即可评价生长量,另外,对稳定性而言,稀释后在完全培养基中培养上述培养完成时的培养物溶液,将形成的菌落涂布于含有药物的平板中,稳定性表现为在药物平板上形成之菌落的生长率
                                                表5
  菌株/质粒   生长量   产生的L-赖氨酸的量(g/l)   稳定性(%)
  AT12036AJ12036/PCABLTn7156-Cint-Y2/PABLm   0.7000.5900.608   0.028.128.5   -90100
如表5所示,当使用其中质粒上增加了lysC的菌株时以及当使用其中染色体上增加了lysC的菌株时,所产生的赖氨酸的量有所增加。另外,AJ12036/PCABL的稳定性为90%,而Tn7156-Cint-Y2/pABLm的稳定性为100%。
实施例6
构建质粒pHTN7150
由于以上构建出的携有卡那霉素抗性基因的人工转座子Tn7145上不具有适于二氢2,6-吡啶二羧酸合酶基因插入的位点,故可按下述方法构建其中引入了新的插入位点的新质粒pHTN7150。
用限制性酶PstI从质粒载体Puc4K(由Pharmacia Biotech制备)上切下卡那霉素抗性基因并使之末端钝化。将含有卡那霉素抗性基因的片段插入pHY300PLK(由Takara Shuzo制备)的SmaI位点以构建pHY300-KM,再用限制性酶EcoRI和XbaI消化pHY300-KM以切下含有卡那霉素抗性基因的片段,使此片段的末端钝化并插入位于质粒pHIS714上的IS714的钝端化NheI位点以构建质粒pHTN7150。pHTN7150上的人工转座子Tn7150具有卡那霉素抗性基因作为标记基因,基BglII位点可用作基因克隆位点。
联合pHTN7150和乳酸发酵短杆菌的dapA基因
按下述方法将编码二氢2,6-吡啶二羧酸合酶的基因(赖氨酸生物合成酶基因)插入含有卡那霉素抗性基因的人工转座子pHTN7150中。
用EcoRI裂解含有dapA的质粒p399DPS后,通过用T4DNA聚合酶处理使所得片段的末端钝化,将磷酸化的BamHI接头(由Takara Shnzo制备)与之结合以修饰片段,致使仅用BamHI即可切下dapA基因。此质粒被称作p399DPSZ,将经用BamHI裂解此质粒形成的1.4kb的dapA片段与用BglII裂解的pHTN7150联合,BglII可给出与BamHI相同的粘性末端。由此构建的质粒被称为pHTN7150A,pHTN7150A的构建示于图28中。
人工转座子TN7150A转座到乳酸发酵短杆菌的染色体中
按下述方法,使用pHTN7150A可得到经过将含有dapA的人工转座子Tn7150A转座到乳酸发酵短杆菌AJ12036菌株中所形成的菌株。
用pHTN7150A转化AJ12036菌株,于25C,在含有25μg/ml卡那霉素、10g/l酵母提取物、10g/l胰胨、5g/l蔗糖和15g/l Nall的CM2S液体培养基中将所得转化子培养过夜,用0.9%NaCl溶液大致稀释培养物,将稀释物涂布于含有25μg/mlCm的上述CM2S琼脂培养基上,于34℃下培养。从形成的菌落中选择氯霉素敏感菌株,随机选择这些菌株中的一些。从中制备染色体DNA,使用dapA片段作为探针进行Southern杂交以鉴定人工转座子的转座,将以上得到的其中转座了人工转座子的菌株称为AJ2036::A。
PCBLmc的构建以及菌株的产生
按下述方法,使用pAM330和pHSG399的穿梭载体pVC7构建含有变体lysC、capB和lysA的质粒。
用SacI处理含有dapB的pCRDAPB之后,通过用T4DNA聚合酶处理使所得片段的末端钝化,从而构建了与磷酸化的PstI接头(由Takara Shnzo制备)联合的质粒,由此得到的质粒被称作PCRDAPB2。用BamHI和PstI裂解该质粒,将所得dapB片段(2.0Kb)插入已被BamHI和PstI裂解的PVC7中,此质粒被称为PBmc。
用BamHI和EcoRI裂解含有lysC的PAK9,将所得1.6kb的lysC片段与也经BamHI和EcoRI裂解的pBmc连接以构建含有dapB和lysC的质粒,此质粒被称为pBCmc。
用EcoRI裂解含有lysA的p399LYSA之后,通过用T4DNA聚合酶处理使所得片段的末端钝化,将之与磷酸化的KpnI接头结合以修饰之,从而可用KpnI裂解lysA。此质粒被称为p399LYSAZ,用KpnI裂解p399LYSA2,将所得的3.6kb lysA片段与已被EcoRI消化的pBCmc连接,通过用T4DNA聚合酶处理使其末端钝化,并与磷酸化的KpnI接头结合。由此得到的质粒被称作pCBLmc。此质粒在大肠杆菌和棒状细菌中可自我复制,并可将氯霉素抗性传递给宿主,它含有突变体lysC、dapB和lysA。PCBLmc的构建示于图29中。
使用电脉冲法[Sugimoto等人的日本特许公开专利申请(Kokai)No,207,791/1990]将上文构建的pCBLm导入AJ12036::A菌株,此菌株中的染色体上已转座了人工转座子Tn7150A。在含有5μg/ml氯霉素和25μg/ml卡那霉素的上述CM2S培养基中进行转化子的选择。将如此构建的菌株称为AJ12036::A/pCBLmc。
评价构建菌株的培养
在L-赖氨酸生产培养基中培养亲本菌株和转化子AJ12036/pCABL和AJ12036::A/pCBLmc,评价所产生的赖氨酸的量,结果示于表6中。
                                                  表6
  菌株/质粒   生长量   产生的赖氨酸的量(g/l)   稳定性(%)
  AT12036AJ12036/PCABLAJ12036::A/pCBLmc   0.7000.5900.595   0.028.128.7   -90100
如表6中可明显看出,在其染色体上增加了dapA的菌株中以及其质粒上增加了lysC的菌株中,所产生的赖氨酸量有所增加。另外,AJ12036/PCABL的稳定性为90%,而AJ12036::A/pCBLm的稳定性为100%。
实施例7
转座子单元中不含转座酶的人工转座子的构建使用E.coli Trc 启动子或类似物构建转座酶表达质粒
用限制性内切核酸酶NheI和XbaI裂解质粒pHIS714,得到含有编码转座酶之基因的片段,其中缺失了IS714的5′端反向重复(IR)序列。将此DNA片段导入质粒载体PNC19的XbaI位点以构建质粒TnPL/pUC19。
另外,用限制性内切核酸酶MroI和XbaI裂解TnpL/pUC19以缺失包括IS714终止密码子和3′端反向重复(IR)的序列,通过连接将具有下列序列的合成双链DNA插入以上裂解的部分。
5′-CCGGACAGCTCACCCACAAAATCAATGCACTCTAAAAAGGTACCT-3′
3′-TGTCGAGTGGGTGTTTTAGTTACGTGAGATTTTCCATGGAGATC-5′
(序列25和26)
用此方法构建了质粒ORFL/pUC19,其中TnPL/pUC19转座酶3′端存在的IR已经缺失。
随后,用限制性内切核酸酶SmaI和XbaI裂解此ORFL/pUC19以得到含有转座酶的约为1.5kb的基因片段,将此转座酶基因片段插入质粒载体pHY300PLK(由Takara Shnzo制备)的部分中,该部分是通过除去质粒中SmaI和XbaI位点之间的序列,再用限制性内切核酸酶EcoRI和KpnI切割而得到的。用T4DNA聚合酶使此EcoRI-KpnI转座酶基因片段的末端印化,同时,用限制性内切核酸酶PvuII部分消化质粒载体pHSG398(由Takara Shuzo制备)以缺失含有多克隆位点的约为0.3kb的片段。将以上得到的转座酶基因片段插入质粒载体pHSG398的已消化部分以构建图10所示的质粒pORF1。
另一方面,使较容易得到的、质粒pHIS714的NheI-XbaI裂解片段的末端钝化,并导入质粒载体pUC19的末端钝化的PstI位点以构建质粒Tnp(Pst)/pUC19。
使用U.S.E.诱变试剂盒(内Pharmacia Biotech制备)对此Tnp(Pst)/Puc19的转座酶基因进行部分碱基取代。被取代的碱基是LS714序列中第288位碱基G,用C取代此碱基G,这是由GTG变为GTC的变化,而不是氨基酸水平上的变化,将此碱基被取代的质粒称为Tnp(Pst)M/puc19。
从pORF1中缺失转座酶前一半基因中存在的限制性内切核酸酶SmaI和NaeI位点之间的序列,通过连接将经用限制性由切核酸酶SmaI和NaeI裂解Tnp(Pst)M/puc19所得的转座酶前一半基因片段(包括GTG→GTC的变化)插入以上经缺失的部分以构建PORF2。
从pORF2中缺失SmaI和XbaI位点之间的序列,使所得片段的末端钝化,通过用限制性内切核酸酶NaeI和HindIII裂解pBSF2-SD7,再使其末端钝化可得到含有色氨酸操纵子衰减子的DNA片段。将前一片段与后一片段相连接,由此构建的质粒被称为pORF3。
1989年6月1日将用质粒pBSF2-SD7转化的E.coli HB101(AJ12448)通商产业省工业技术院生命工学工业技术研究所(1-3、Higashi 1 Chome Tsukuba-Shi Ibaraki-Ken 305、Japan),保藏号为No.FERM P-10758,1992年2月19日将此菌株变成根据布达佩斯条约的保藏证书,指定保藏号为No,BP-3753。
用限制性由切核酸酶SalI和Bpu 1102I裂解pORF3以缺失转座酶前半个基因片段。通过连接将经用限制性内切核酸酶SalI和Blu 1102I裂解Tnp(Pst)/pUC19所得的转座酶前半个基因片段插入以上已缺失的部分以构建如图11所示的pOFR4。
用SacI裂解TnPL/pUC19,再于30℃中,用BAL31核酸酶消化20分钟以从转座酶基因起始密码子上游附近缺失序列,当经过缺失的末端钝化之后,使用SphI位点切下转座酶基因片段,并插入已被SmaI和SphI裂解的pHSG398位点,将由此构建的质粒称为delTnp5/398。
用限制性由切核酸酶KnpI和HindIII裂解此delTnp5/398,使所得的转座酶前半个基因片段的末端钝化,然后用NcoI和HindIII裂解质粒载体PKK233-2(由Pharmacia Biotech制备),并使其末端钝化,通过连接反应将前一片段与后一片段相连接以构建pTrc-ORF。
用SspI和Bpu1102I裂解PTrc-ORF以形成含有Trc启动子和转座酶前一半基因的片段,用XbaI裂解pORF3,末端钝化,再用Bpu1102I进一步裂解以缺失转座酶的前一半基因片段,将以上形成的片段插入此pORF3的已缺失部分以构建如图12所示的pORF7。
将经用限制性由切核酸酶KpnI和HindIII裂解del Tnp5/398所得的转座酶的前一半基因片段克隆到质粒载体pUC18的KpnI和HindIII位点之间,此质粒的BsmI和NaeI位点之间的部分已缺失,将此片段与经用限制性内切核酸酶BsmI和NacI裂解Tnp(Pst)M/pUC19所得的转座酶前半个基因片段(G→C取代型)相连接以构建delTnp5M/18。
用KpnI和HindIII裂解此delTnp5M/18,使所得的转座酶前一半基因片段的末端钝化。用NooI和HindIII裂解pKK233-2,使所得片段的末端钝化。将这些片段相互连接以构建pTrc-TnpM。
使用由pTrc-Tnp构建pORF7的方法(图13)由pTrc-TnPM构建pORF8。
构建质粒以导入含有人工转座子单元以及此单元外部的转座 酶表达系统的棒状细菌中
使用上述质粒pORF3、pORF4、pORF7和pORF8构建质粒,以下描述的是由pORF3构建pORF41。
首先用NheI和SacII裂解pHIS714以缺失转座酶基因的主要部分,将具有下列序列的双链合成DNA插入以上已缺失的部分以构建pHTN7160。
5′-CTAGCTCGAGATATCAGATCTACTAGTCGACCGC-3′(序列27)
3′-GAGCTCTATAGTCTAGATGATCAGCTGG-5′(序列28)
用限制性内切核酸酶KpnI裂解pHTN7160,使之末端钝化,再用BglI裂解以得到含有IS714两条侧链上的反向重复(IR)序列以及在棒状细菌中起作用的温度敏感型复制起点的片段。
用限制性内切核酸酶EarI裂解pORF3,使之末端钝化,再用BglI裂解,将上述pHTN7160的片段插入其中以构建pURF41-Pre。
然后,用EcoRV裂解pORF41-pre,将含有pBR322的Tc抗性基因并且已末端钝化的EcoRI-AvaI片段插入经EcoRV裂解的片段以构建图14所示的pORF41。
重复上述方法以分别通过pORF31-Pre由pORF4构建pORF31,通过pORF71-Pre由pORF7构建pORF71,通过pORF81-Pre由pORF8构建pORF81。
根据布达佩斯条约,于1996年6月3日将含有质粒pORF81的E.coli AJ13208保藏于通商产业省工业技术院生命工学工业技术研究所(1-3,Higashi 1 ChomeTsukuba-Shi Ibaraki-Ken 305,Japan),其指定保藏号为No.BP-5557。
用XbaI和EarI裂解pORF3,使之末端钝化,并自身连接以构建不含转座酶基因的pORFCO(图15)。
使用与由pORF3构建pURF41相同的方法通过poRFC2-Pre由pORFCO构建仅含有一个转座子单元(不含转座酶基因)的pORFC2。
假如pURFC2不具有转座酶的结构基因,则这些最终构建出的质粒具有转座酶的结构基因、Cm抗性基因,在E.coli中起作用的复制起点,在棒状细菌中起作用的温度敏感型复制起点,以及IS714的IR之间所包含的Tc抗性基因。
将含有IS714两个末端上的IR并含有Tc抗性基因的单元称为转座子单元Tn7162。
评价染色体上内转座子单元转座而形成的具有Tc抗性基因 的转座子单元的拷贝数
使用以上构建的质粒pORF31、pORF41、pORF81和pORFC2进行转座试验,认为可被转座的单元是转座单元Tn7162。
用上述每个质粒转化乳发酵短杆菌AJ12036,评价内转座子单元Tn7162转座到宿主染色体中而形成的宿主染色体中的转座子单元Tn7162的拷贝数。即于25℃,在含有5μg/ml Cm的上述CM2G液体培养基中将转化子培养过夜,用0.9%NaCl溶液大致稀释,将稀释物以100μl的量涂布于含有1.5μg/ml至4μg/ml Tc的上述CM2G琼脂培养基中,于34℃培养,从形成的菌落中挑选Cm敏感克隆,于34℃培养,从形成的菌落中随机选择一些克隆,从中制备染色体DNA,用限制性内切核酸酶PvuII完全消化,进行琼脂糖凝胶电际,印迹于硝酸纤维素(或尼龙或PVDF)滤膜上,使用经32-P或ECL直接标记系统(由Amersham制备)标记的Tc抗性基因片段作为探针,对此滤膜进行Southern杂交,检测与此探针杂交的带的数目。
结果发现,如表7所示,具有Tc抗性标记基因的多拷贝数的转座子单元Tn7162以某些频率被转座。
这表明表达型的转座酶基因可以在质粒转座子单元之外起作用(pORF31、41和81),也可以在染色体本身存在的转座酶内起作用(pORFC2)。
                                         表7
  质粒   选择性的Tc浓度(μg/ml)   Tc抗性基因的拷贝数
  pORFC2   1.52.0   >8>12
  pORF31   1.5   >7
  pORF41   1.5   >11
  pORF81   1.5   341011
  2.0   344
  4.0   5
实施例8
构建仅含有转座酶表达系统的棒状细菌的质粒以及将转座子 单元转座到染色体上
构建仅含有转座酶表达系统的棒状细菌的质粒
用EcoO 109I和MroI裂解质粒pHIS7 14K1以缺失IS714,然后使之自身连接以构建pHIS714Kdel。
同时,用限制性由切核酸酶EarI裂解pORF3,使之末端钝化,再用BglI裂解,用限制性由切核酸酶KpnI裂解pHIS714Kdel,使之末端钝化,再用BglI裂解以形成含有温度敏感型复制起点并在棒状细菌中起作用的片段。将如此形成的片段互相连接以构建如图17所示的pORF40。
重复此方法以分别由pORF4构建pORF30、由pORF7构建pORF70、由pORF8构建pORF80以及由pORFCO构建pORFC1。
评价染色体中内转座子单元转座而形成的具有
Tc抗性基因的转座子单元的拷贝数
使用以上构建的质粒pORF80和pORFC1进行转座试验,认为可被转座的单元是转座子单元Tn7162。
在实施例7中阐明:用含有转座子单元Tn7162的质粒转化乳酸发酵短杆菌AJ12036,多拷贝数的Tn7162被转座到宿主染色体中。通过对染色体DNA进行Southern杂交分析来检测当以上构建的质粒pORF80和pORFC1被进一步导入作为宿主的有一拷贝染色体转座的菌株以增加转座酶活性时,染色体中的Tn7162是否会进一步转座或复制,然后评价拷贝数。
即在25℃下,于含有5μg/ml Cm的上述CM2G液体培养基中将转化子培养过夜,用0.9%Nacl溶液大致稀释,以100μl的量将稀释物涂布于含有6μg/ml至20μg/ml T的上述DM2G琼脂培养基上,于34℃培养,从所形成的菌落中挑选Cm-敏感克隆。
从这些Cm-敏感克隆中随机选择一些克隆,从中制备染色体DNA,用限制性内切核酸酶PvuII完全消化,进行琼脂糖凝胶电泳,印迹于硝酸纤维素(或尼龙或PVDF)滤膜上,使用经32-P或ECL直接标记系统(由Amersham制备)标记的Tc抗性基因片段作为探针,对滤膜进行Southern杂交,检测与此探针杂交的带的数目。
结果、多拷贝数的具有Tc抗性标记基因的转座子单元Tn7162以某些频率被转座和复制。
                    序列表
(1)SEQ ID NO:1:的资料:
1(i)序列特征:
    (A)长度:1453个碱基对
    (B)类型:核酸
    (C)链数:双链
    (D)拓扑结构:线形
(ii)分子类型:DNA(基因组的)
(iii)假设:否
(iV)反义:否
(vi)来源
    (A)生物:乳酸发酵短杆菌
    (B)菌株:AJl2036
(ix)特征描述:
    (A)名称/关键词:
    (B)定位:130..1440
(ix)特征描述:
    (A)名称/关键词.重复区域
    (B)定位:1..15
(ix)特征描述:
    (A)名称/关键词.重复区域
    (B)定位:1439..1453
(ix)特征描述:
    (A)名称/关键词:-35信号
    (B)定位:71..76
(ix)特征描述:
    (A)名称/关键词:-10信号
    (B)定位:92..97
(xi)序列描述:SEQ ID NO:1:
GGCCCTTCCG GTTTTGGGGT ACATCACAGA ACCTGGGCTA GCGGTGTAGA CCCGAAAATA    60
AACGAGCCTT TTGTCAGGGT TAAGGTTTAG GTATCTAAGC TAACCAAACA CCAACAAAAG  120
GCTCTACCC ATG AAG TCT ACC GGC AAC ATC ATC GCT GAC ACC ATC TGC      168
          Met Lys Ser Thr Gly Asn Ile Ile Ala Asp Thr Ile Cys
           1               5                   10
CGC ACT GCG GAA CTA GGA CTC ACC ATC ACC GGC GCT TCC GAT GCA GGT    216
Arg Thr Ala Glu Leu Gly Leu Thr Ile Thr Gly Ala Ser Asp Ala Gly
     15                  20                  25
GAT TAC ACC CTG ATC GAA GCA GAC GCA CTC GAC TAT ACC TCC ACC TGC    264
Asp Tyr Thr Leu Ile Glu Ala Asp Ala Leu Asp Tyr Thr Ser Thr Cys
 30                  35                  40                  45
CCA GAA TGC TTC CAA CCT GGG GTG TTT CGT CAT CAC ACC CAC CGG ATG    312
Pro Glu Cys Phe Gln Pro Gly Val Phe Arg His His Thr His Arg Met
                 50                  55                  60
CTC ATT GAT TTA CCC ATC GTC GGG TTT CCC ACC AAA CTG TTT ATC CGT    360
Leu Ile Asp Leu Pro Ile Val Gly Phe Pro Thr Lys Leu Phe Ile Arg
             65                  70                      75
CTA CCT CGC TAC CGC TGC ACC AAC CCG ACA TGT AAG CAA AAG TAT TTC    408
Leu Pro Arg Tyr Arg Cys Thr Asn Pro Thr Cys Lys Gln Lys Tyr Phe
         80                  85                  90
CAA GCA GAA CTA AGC TGC GCT GAC CAC GGT AAA AAG GTC ACC CAC CGG    456
Gln Ala Glu Leu Ser Cys Ala Asp His Gly Lys Lys Val Thr His Arg
     95                 100                 105
GTC ACC CGC TGG ATT TTG CAA CGC CTT GCT ATT GAC CGG ATG AGT GTT    504
Val Thr Arg Trp Ile Leu Gln Arg Leu Ala Ile Asp Arg Met Ser Val
110                 115                 120                 125
CAC GCA ACT GCG AAA GCA CTT GGG CTA GGG TGG GAT TTA ACC TGC CAA    552
His Ala Thr Ala Lys Ala Leu Gly Leu Gly Trp Asp Leu Thr Cys Gln
                130                 135                 140
CTA GCC CTC GAT ATG TGC CGT GAG CTG GTC TAT AAC GAT CCT CAC CAT    600
Leu Ala Leu Asp Met Cys Arg Glu Leu Val Tyr Asn Asp Pro His His
            145                 150                 155
CTT GAT GGA GTG TAT GTC ATT GGG GTG GAT GAG CAT AAG TGG TCA CAT    648
Leu Asp Gly Val Tyr Val Ile Gly Val Asp Glu His Lys Trp Ser His
        160                 165                 170
AAT AGG GCT AAG CAT GGT GAT GGG TTT GTC ACC GTG ATT GTC GAT ATG    696
Asn Arg Ala Lys His Gly Asp Gly Phe Val Thr Val Ile Val Asp Met
    175                 180                 185
ACC GGG CAT CGG TAT GAC TCA CGG TGT CCT GCC CGG TTA TTA GAT GTC    744
Thr Gly His Arg Tyr Asp Ser Arg Cys Pro Ala Arg Leu Leu Asp Val
190                 195                 200                 205
GTC CCA GGT CGT AGT GCT GAT GCT TTA CGG TCC TGG CTT GGC TCC CGC    792
Val Pro Gly Arg Ser Ala Asp Ala Leu Arg Ser Trp Leu Gly Ser Arg
                210                 215                 220
GGT GAA CAG TTC CGC AAT CAG ATA CGG ATC GTG TCC ATG GAT GGA TTC    840
Gly Glu Gln Phe Arg Asn Gln Ile Arg Ile Val Ser Met Asp Gly Phe
            225                  230                 235
CAA GGC TAC GCC ACA GCA AGT AAA GAA CTC ATT CCT TCT GCT CGT CGC     888
Gln Gly Tyr Ala Thr Ala Ser Lys Glu Leu Ile Pro Ser Ala Arg Arg
        240                 245                 250
GTG ATG GAT CCA TTC CAT GTT GTG CGG CTT GCT GGT GAC AAG CTC ACC     936
Val Met Asp Pro Phe His Val Val Arg Leu Ala Gly Asp Lys Leu Thr
    255                 260                 265
GCC TGC CGG CAA CGC CTC CAG CGG GAG AAA TAC CAG CGT CGT GGT TTA     984
Ala Cys Arg Gln Arg Leu Gln Arg Glu Lys Tyr Gln Arg Arg Gly Leu
270                 275                 280                 285
AGC CAG GAT CCG TTG TAT AAA AAC CGG AAG ACC TTG TTG ACC ACG CAC    1032
Ser Gln Asp Pro Leu Tyr Lys Asn Arg Lys Thr Leu Leu Thr Thr His
                290                 295                 300
AAG TGG TTG AGT CCT CGT CAG CAA GAA AGC TTG GAG CAG TTG TGG GCG    1080
Lys Trp Leu Ser Pro Arg Gln Gln Glu Ser Leu Glu Gln Leu Trp Ala
             305                 310                  315
TAT GAC AAA GAC TAC GGG GTG TTA AAG CTT GCG TGG CTT GCG TAT CAG    1128
Tyr Asp Lys Asp Tyr Gly Val Leu Lys Leu Ala Trp Leu Ala Tyr Gln
        320                 325                 330
GCG ATT ATT GAT TGT TAT CAG ATG GGT AAT AAG CGT GAA GCG AAG AAG    1176
Ala Ile Ile Asp Cys Tyr Gln Met Gly Asn Lys Arg Glu Ala Lys Lys
    335                 340                 345
AAA ATG CGG ACC ATT ATT GAT CAG CTT CGG GTG TTG AAG GGG CCG AAT    1224
Lys Met Arg Thr Ile Ile Asp Gln Leu Arg Val Leu Lys Gly Pro Asn
350                 355                 360                 365
AAG GAA CTC GCG CAG TTG GGT CGT AGT TTG TTT AAA CGA CTT GGT GAT    1272
Lys Glu Leu Ala Gln Leu Gly Arg Ser Leu Phe Lys Arg Leu Gly Asp
                370                 375                 380
GTG TTG GCG TAT TTC GAC GTA GGA GTC TCC AAC GGA CCA GTC GAA GCC    1320
Val Leu Ala Tyr Phe Asp Val Gly Val Ser Asr Gly Pro Val Glu Ala
             385                 390                 395
ATc AAT GGA CGC CTA GAA CAC CTC CGC GGA ATC GCG CTT GGA TTC CGC    1368
Ile Asn Gly Arg Leu Glu His Leu Arg Gly Ile Ala Leu Gly Phe Arg
        400                 405                 410
AAC CTC ACC CAC TAC ATC CTT CGA TGC CTC ATC CAC TCC GGA CAG CTC    1416
Asn Leu Thr His Tyr Ile Leu Arg Cys Leu Ile His Ser Gly Gln Leu
    415                 420                 425
ACC CAC AAA ATC AAT GCA CTC TAA AAACGGAAGA GCC                     1453
Thr His Lys Ile Asn Ala Leu   *
430                 435
(2)INFORMATION FOR SEQ ID NO:2:
    (i)SEQUENCE CHARACTERISTICS:
        (A)LENGTH:437 amino acids
        (B)TYPE:amino acid
        (D)TOPOLOGY:linear
(2)SEQ ID NO:2:的资料:
    (i)序列特征:
        (A)长度:437个氨基酸
        (B)类型:氨基酸
        (D)拓扑结构:线形
    (ii)分子类型:蛋白质
    (xi)序列描述:SEQ ID NO:2:
Vet Lys Ser Thr Gly Asn Ile Ile Ala Asp Thr Ile Cys Arg Thr Ala
  1               5                  10                  15
Glu Leu Gly Leu Thr Ile Thr Gly Ala Ser Asp Ala Gly Asp Tyr Thr
             20                  25                  30
Leu Ile Glu Ala Asp Ala Leu Asp Tyr Thr Ser Thr Cys Pro Glu Cys
         35                  40                  45
Phe Gln Pro Gly Val Phe Arg His His Thr His Arg Met Leu Ile Asp
     50                  55                  60
Leu Pro Ile Val Gly Phe Pro Thr Lys Leu Phe Ile Arg Leu Pro Arg
 65                  70                  75                  80
Tyr Arg Cys Thr Asn Pro Thr Cys Lys Gln Lys Tyr Phe Gln Ala Glu
                 85                  90                  95
Leu Ser Cys Ala Asp His Gly Lys Lys Val Thr His Arg Val Thr Arg
            100                 105                 110
Trp Ile Leu Gln Arg Leu Ala Ile Asp Arg Met Ser Val His Ala Thr
        115                 120                 125
Ala Lys Ala Leu Gly Leu Gly Trp Asp Leu Thr Cys Gln Leu Ala Leu
    130                 135                 140
Asp Met Cys Arg Glu Leu Val Tyr Asn Asp Pro His His Leu Asp Gly
145                 150                 155                 160
Val Tyr Val Ile Gly Val Asp Glu His Lys Trp Ser His Asn Arg Ala
                165                 170                 175
Lys His Gly Asp Gly Phe Val Thr Val Ile Val Asp Met Thr Gly His
            180                 185                 190
Arg Tyr Asp Ser Arg Cys Pro Ala Arg Leu Leu Asp Val Val Pro Gly
        195                 200                 205
Arg Ser Ala Asp Ala Leu Arg Ser Trp Leu Gly Ser Arg Gly Glu Gln
    210                 215                 220
Phe Arg Asn Gln Ile Arg Ile Val Ser Met Asp Gly Phe Gln Gly Tyr
225                 230                 235                 240
Ala Thr Ala Ser Lys Glu Leu Ile Pro Ser Ala Arg Arg Val Met Asp
                245                 250                 255
Pro Phe His Val Val Arg Leu Ala Gly Asp Lys Leu Thr Ala Cys Arg
            260                 265                 270
Gln Arg Leu Gln Arg Glu Lys Tyr Gln Arg Arg Gly Leu Ser Gln Asp
        275                 280                 285
Pro Leu Tyr Lys Ash Arg Lys Thr Leu Leu Thr Thr His Lys Trp Leu
    290                 295                 300
Ser Pro Arg Gln Gln Glu Ser Leu Glu Gln Leu Trp Ala Tyr Asp Lys
305                 310                 315                 320
Asp Tyr Gly Val Leu Lys Leu Ala Trp Leu Ala Tyr Gln Ala Ile Ile
                325                 330                 335
Asp Cys Tyr Gln Met Gly Asn Lys Arg Glu Ala Lys Lys Lys Met Arg
            340                 345                 350
Thr Ile Ile Asp Gln Leu Arg Val Leu Lys Gly Pro Asn Lys Glu Leu
        355                 360                 365
Ala Gln Leu Gly Arg Ser Leu Phe Lys Arg Leu Gly Asp Val Leu Ala
    370                 375                 380
Tyr Phe Asp Val Gly Val Ser Asn Gly Pro Val Glu Ala Ile Asn Gly
385                 390                 395                 400
Arg Leu Glu His Leu Arg Gly Ile Ala Leu Gly Phe Arg Asn Leu Thr
                405                 410                 415
His Tyr Ile Leu Arg Cys Leu Ile His Ser Gly Gln Leu Thr His Lys
            420                 425                 430
(3)SEQ ID NO:3:的资料:
    (i)序列特征:
        (A)长度:15个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线形
    (ii)分子类型:DNA(基因组的)
    (iii)假设:否
    (iv)反义:否
    (vi)来源:
        (A)生物:乳酸发酵短杆菌
        (B)菌株:
    (xi)序列描述:SEQ ID NO:3:
(4)SEQ ID NO:4:的资料:
    (i)序列特征:
        (A)长度:15个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线形
    (ii)分子类型:DNA(基因组的)
    (iii)假设:否
    (iv)反义:否
    (vi)来源:
        (A)生物:乳酸发酵短杆菌
        (B)菌株:AJ12036
    (xi)序列描述:
GGCTCTTCCG TTTTT                         15
(5)SEQ ID NO:5:的资料:
    (i)序列特征:
        (A)长度:1453个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线形
(ii)分子类型:DNA(基因组的)
(iii)假设:否
(iv)反义:否
(vi)来源:
    (A)生物:乳酸发酵短杆菌
    (B)菌株:AJ12036
(ix)特征描述:
    (A)名称/关键词:CDS
    (B)定位:130..1440
(ix)特征描述:
    (A)名称/关键词.重复区域
    (B)定位:1..15
(ix)特征描述:
    (A)名称/关键词.重复区域
    (B)定位:1439..1453
(ix)特征描述:
    (A)名称/关键词:-35信号
    (B)定位:71..76
(ix)特征描述:
    (A)名称/关键词:-10信号
    (B)定位:92..97
(xi)序列描述:SEQ ID NO:5:
GGCCCTTCCG GTTTTGGGGT ACATCACAGA ACCTGGGCTA GCGGTGTAGA CCCGAAAATA     60
AACGAGCCTT TTGTCAGGGT TAAGGTTTAG GTATCTAAGC TAACCAAACA CCAACAAAAG    120
GCTCTACCC ATG AAG TCT ACC GGC AAC ATC ATC GCT GAC ACC ATC TGC        168
          Met Lys Ser Thr Gly Asn Ile Ile Ala Asp Thr Ile Cys
            1               5                  10
CGC ACT GCG GAA CTA GGA CTC ACC ATC ACC GGC GCT TCC GAT GCA GGT      216
Arg Thr Ala Glu Leu Gly Leu Thr Ile Thr Gly Ala Ser Asp Ala Gly
     15                  20                  25
GAT TAC ACC CTG ATC GAA GCA GAC GCA CTC GAC TAT ACC TCC ACC TGC      264
Asp Tyr Thr Leu Ile Glu Ala Asp Ala Leu Asp Tyr Thr Ser Thr Cys
  30                 35                  40                  45
CCA GAA TGC TTC CAA CCT GGG GTG TTT CGT CAT CAC ACC CAC CGG ATG      312
Pro Glu Cys Phe Gln Pro Gly Val Phe Arg His His Thr His Arg Met
                 50                  55                  60
CTC ATT GAT TTA CCC ATC GTC GGG TTT CCC ACC AAA CTG TTT ATC CGT    360
Leu Ile Asp Leu Pro Ile Val Gly Phe Pro Thr Lys Leu Phe Ile Arg
             65                  70                  75
CTA CCT CGC TAC CGC TGC ACC AAC CCG ACA TGT AAG CAA AAG TAT TTC    408
Leu Pro Arg Tyr Arg Cys Thr Asn Pro Thr Cys Lys Gln Lys Tyr Phe
         80                  85                  90
CAA GCA GAA CTA AGC TGC GCT GAC CAC GGT AAA AAG GTC ACC CAC CGG    456
Gln Ala Glu Leu Ser Cys Ala Asp His Gly Lys Lys Val Thr His Arg
     95                 100                 105
GTC ACC CGC TGG ATT TTG CAA CGC CTT GCT ATT GAC CGG ATG AGT GTT    504
Val Thr Arg Trp Ile Leu Gln Arg Leu Ala Ile Asp Arg Met Ser Val
110                 115                 120                 125
CAC GCA ACT GCG AAA GCA CTT GGG CTA GGG TGG GAT TTA ACC TGC CAA    552
His Ala Thr Ala Lys Ala Leu Gly Leu Gly Trp Asp Leu Thr Cys Gln
                130                 135                 140
CTA GCC CTC GAT ATG TGC CGT GAG CTG GTC TAT AAC GAT CCT CAC CAT    600
Leu Ala Leu Asp Met Cys Arg Glu Leu Val Tyr Asn Asp Pro His His
            145                 150                 155
CTT GAT GGA GTG TAT GTC ATT GGG GTG GAT GAG CAT AAG TGG TCA CAT    648
Leu Asp Gly Val Tyr Val Ile Gly Val Asp Glu His Lys Trp Ser His
        160                 165                 170
AAT AGG GCT AAG CAT GGT GAT GGG TTT GTC ACC GTG ATT GTC GAT ATG    696
Asn Arg Ala Lys His Gly Asp Gly Phe Val Thr Val Ile Val Asp Met
    175                 180                 185
ACC GGG CAT CGG TAT GAC TCA CGG TGT CCT GCC CGG TTA TTA GAT GTC    744
Thr Gly His Arg Tyr Asp Ser Arg Cys Pro Ala Arg Leu Leu Asp Val
190                 195                 200                 205
GTC CCA GGT CGT AGT GCT GAT GCT TTA CGG TCC TGG CTT GGC TCC CGC    792
Val Pro Gly Arg Ser Ala Asp Ala Leu Arg Ser Trp Leu Gly Ser Arg
                210                 215                 220
GGT GAA CAG TTC CGC AAT CAG ATA CGG ATC GTG TCC ATG GAT GGA TTC    840
Gly Glu Gln Phe Arg Asn Gln Ile Arg Ile Val Ser Met Asp Gly Phe
            225                 230                 235
CAA GGC TAC GCC ACA GCA AGT AAA GAA CTC ATT CCT TCT GCT CGT CGC    888
Gln Gly Tyr Ala Thr Ala Ser Lys Glu Leu Ile Pro Ser Ala Arg Arg
        240                 245                 250
GTG ATG GAT CCA TTC CAT GTT GTG CGG CTT GCT GGT GAC AAG CTC ACC    936
Val Met Asp Pro Phe His Val Val Arg Leu Ala Gly Asp Lys Leu Thr
    255                 260                 265
GCC TGC CGG CAA CGC CTC CAG CGG GAG AAA TAC CAG CGT CGT GGT TTA    984
Ala Cys Arg Gln Arg Leu Gln Arg Glu Lys Tyr Gln Arg Arg Gly Leu
270                 275                 280                 285
AGC CAG GAT CCG TTG TAT AAA AAC CGG AAG ACC TTG TTG ACC ACG CAC   1032
Ser Gln Asp Pro Leu Tyr Lys Asn Arg Lys Thr Leu Leu Thr Thr His
                290                 295             300
AAG TGG TTG AGT CCT CGT CAG CAA GAA AGC TTG GAG CAG TTG TGG GCG    1080
Lys Trp Leu Ser Pro Arg Gln Gln Glu Ser Leu Glu Gln Leu Trp Ala
            305                 310                 315
TAT GAC AAA GAC TAC GGG GTG TTA AAG CTT GCG TGG CTT GCG TAT CAG    1128
Tyr Asp Lys Asp Tyr Gly Val Leu Lys Leu Ala Trp Leu Ala Tyr Gln
        320                 325                 330
GCG ATT ATT GAT TGT TAT CAG ATG GGT AAT AAG CGT GAA GCG AAG AAG    1176
Ala Ile Ile Asp Cys Tyr Gln Met Gly Asn Lys Arg Glu Ala Lys Lys
    335                 340                 345
AAA ATG CGG ACC ATT ATT GAT CAG CTT CGG GTG TTG AAG GGG CCG AAT    1224
Lys Met Arg Thr Ile Ile Asp Gln Leu Arg Val Leu Lys Gly Pro Asn
350                 355                 360                 365
AAG GAA CTC GCG CAG TTG GGT CGT AGT TTG TTT AAA CGA CTT GGT GAT    1272
Lys Glu Leu Ala Gln Leu Gly Arg Ser Leu Phe Lys Arg Leu Gly Asp
                370                 375                 380
GTG TTG GCG TAT TTC GAT GTT GGT GTC TCC AAC GGT CCG GTC GAA GCG    1320
Val Leu Ala Tyr Phe Asp Val Gly Val Ser Asn Gly Pro Val Glu Ala
            385                 390                 395
ATC AAC GGA CGG TTG GAG CAT TTG CGT GGG ATT GCT CTA GGT TTC CGT    1368
Ile Asn Gly Arg Leu Glu His Leu Arg Gly Ile Ala Leu Gly Phe Arg
        400                 405                 410
AAT TTG AAC CAC TAC ATT CTG CGG TGC CTT ATC CAT TCA GGG CAG TTG    1416
Asn Leu Asn His Tyr Ile Leu Arg Cys Leu Ile His Ser Gly Gln Leu
    415                 420                 425
GTC CAT AAG ATC AAT GCA CTC TAA AACAGGAAGA GCC                     1453
Val His Lys Ile Asn Ala Leu
430                 435
(6)SEQ ID NO:6:的资料:
    (i)序列特征:
        (A)长度:437个氨基酸
        (B)类型:氨基酸
        (D)拓扑结构:线形
    (ii)分子类型:蛋白质
    (xi)序列描述SEQ ID NO:6:
Met Lys Ser Thr Gly Asn Ile Ile Ala Asp Thr Ile Cys Arg Thr Ala
  1               5                  10                  15
Glu Leu Gly Leu Thr Ile Thr Gly Ala Ser Asp Ala Gly Asp Tyr Thr
             20                  25                  30
Leu Ile Glu Ala Asp Ala Leu Asp Tyr Thr Ser Thr Cys Prc Glu Cys
         35                  40                  45
Phe Gln Pro Gly Val Phe Arg His His Thr His Arg Met Leu Ile Asp
     50                  55                  60
Leu Pro Ile Val Gly Phe Pro Thr Lys Leu Phe Ile Arg Leu Pro Arg
 65                  70                  75                  80
Tyr Arg Cys Thr Asn Pro Thr Cys Lys Gln Lys Tyr Phe Gln Ala Glu
                 85                  90                  95
Leu Ser Cys Ala Asp His Gly Lys Lys Val Thr His Arg Val Thr Arg
            100                 105                 110
Trp Ile Leu Gln Arg Leu Ala Ile Asp Arg Met Ser Val His Ala Thr
        115                 120                 125
Ala Lys Ala Leu Gly Leu Gly Trp Asp Leu Thr Cys Gln Leu Ala Leu
    130                 135                 140
Asp Met Cys Arg Glu Leu Val Tyr Asn Asp Pro His His Leu Asp Gly
145                 150                 155                 160
Val Tyr Val Ile Gly Val Asp Glu His Lys Trp Ser His Asn Arg Aia
                165                 170                 175
Lys His Gly Asp Gly Phe Val Thr Val Ile Val Asp Met Thr Gly His
            180                 185                 190
Arg Tyr Asp Ser Arg Cys Pro Ala Arg Leu Leu Asp Val Val Pro Gly
        195                 200                 205
Arg Ser Ala Asp Ala Leu Arg Ser Trp Leu Gly Ser Arg Gly Glu Gln
    210                 215                 220
Phe Arg Asn Gln Ile Arg Ile Val Ser Met Asp Gly Phe Gln Gly Tyr
225                 230                 235                 240
Ala Thr Ala Ser Lys Glu Leu Ile Pro Ser Ala Arg Arg Val Met Asp
                245                 250                 255
Pro Phe His Val Val Arg Leu Ala Gly Asp Lys Leu Thr Ala Cys Arg
            260                 265                 270
Gln Arg Leu Gln Arg Glu Lys Tyr Gln Arg Arg Gly Leu Ser Gln Asp
        275                 280                 285
Pro Leu Tyr Lys Asn Arg Lys Thr Leu Leu Thr Thr His Lys Trp Leu
    290                 295                 300
Ser Pro Arg Gln Gln Glu Ser Leu Glu Gln Leu Trp Ala Tyr Asp Lys
305                 310                 315                 320
Asp Tyr Gly Val Leu Lys Leu Ala Trp Leu Ala Tyr Gln Ala Ile Ile
                325                 330                 335
Asp Cys Tyr Gln Met Gly Asn Lys Arg Glu Ala Lys Lys Lys Met Arg
            340                 345                 350
Thr Ile Ile Asp Gln Leu Arg Val Leu Lys Gly Pro Asn Lys Glu Leu
        355                 360                 365
Ala Gln Leu Gly Arg Ser Leu Phe Lys Arg Leu Gly Asp Val Leu Ala
    370                 375                 380
Tyr Phe Asp Val Gly Val Ser Asn Gly Pro Val Glu Ala Ile Asn Gly
385                 390                 395                 400
Arg Leu Glu His Leu Arg Gly Ile Ala Leu Gly Phe Arg Asn Leu Asn
                405                 410                 415
His Tyr Ile Leu Arg Cys Leu Ile His Ser Gly Gln Leu Val His Lys
            420                 425                 430
Ile Asn Ala Leu  *
        435
(7)SEQ ID NO:7:的资料
    (i)序列特征:
        (A)长度:15个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线形
    (ii)分子类型:DNA(基因组的)
    (iii)假设:否
    (iv)反义:否
    (vi)来源:
        (A)生物:乳酸发酵短杆菌
        (B)菌株:AJ12036
    (xi)序列描述:SEQ ID NO:7:
GGCCCTICCG GTTIT                            15
(8)SEQ ID NO:8:的资料
    (i)序列特征:
        (A)长度:15个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线形
    (ii)分子类型:DNA(基因组的)
    (iii)假设:否
    (iv)反义:是
    (vi)来源:
        (A)生物:乳酸发酵短杆菌
        (B)菌株:
    (xi)序列描述:
GGCTCTTCCG GTTTT                            15
(9)SEQ ID NO:9:的资料
(i)序列特征:
    (A)长度:1279个碱基对
    (B)类型:核酸
    (C)链型:双链
    (D)拓扑结构:线形
(ii)分子类型:DNA(基因组的)
(iii)假设:否
(iv)反义:否
(vi)来源:
    (A)生物体:乳酸发酵短杆菌
    (B)菌株:AJ12036
(ix)特征描述:
    (A)名称/关键词:重复区域
    (B)定位:1..14
(ix)特征描述:
    (A)名称/关键词:重复区域
    (B)定位:12b6..1279
(xi)序列描述:SEQ ID NO:9:
GGGACTGACC CCTGTTTGGT GGACACCTTG AAACCAGCAT GATGCTGGAA AGGTAATCTG     60
CCACCATGCC ACGCAAGACC TATACAGAGG AGTTCAAGCG CGATGCCGTC GCCTTGTACG    120
AGAACTCCCC AGAGGCTTCG ATCCAGACCA TCGCCACCGA TCTCGGGGTC AACCGCGCCA    180
CGTTGGCGAA CTGGGTGAAA AAATACGGCA CCGCAGGCTC CCAACGAAAC ACCCTCGCCA    240
GCCTCTGTGA ACGAGGCTGA GCAGATCCGG AAACTGGAAC GGGAAAACGC TCGCTTGAGA    300
GAAGAGCGCG ATATCCTGCG GAAAGCTGCA AAATATTTCG CGGAAGAGAC GAATTGGTGA    360
TCCGCTTCCG GTTCGTTGAT GACGCCTCCA AGACCTACTC GGTCAAGCGG ATATGTGACG    420
TCCTCAAACT CAACAGGTCT TCCTACTATA AATGGAAAAG TACCTGCTCA GCACGCAGGA    480
AACGCCTCAT GTCGACGCGA TCCTCGGGGC TCGAGTCAAG GCTGTCTTCA CCACCGAAAA    540
TGGTTGTTAT GGGGCCAAGC GGATCACCGC TGAACTCAAA GACCAGGTGG ATCATGACCC     600
CGTAAATCAC AAGCGGGTCG CTCGGGTGAT GCGCTCGTTG AAGCTGTTTG GCTACACAAA     660
TAAACGCAAG GTCACCACCA CTGTGTCGGA TAAAACCAAG ACAGTGTTTC CTGACCTTGT     720
CGGCCGGAAG TTCACCGCTA ATAAGCCAAA TCAGGTGTAC GTCGGGACAT CACGTACCTG     780
CCGATTGCTG ATGGGTCGAA TATGTACCTG GCTACGGTCA TTGACTGCTA TTCCCGCAGG     840
TTGGTGGGCT TTTCTATCGC ACATCACATG CGTACCTCCC TGGTGCAGAC GCGCTGCTGA     900
TGGCTAAGGG CCAGCGCGAA GCTGACGGGG GCGATCTTTC ACTCGGATCA CGGAAGTGTT     960
TACACTTCTC ACGCATTCCA GACACCTGTA AAGACCTGGG ATAAGGCAGT CGATGGGATC    1020
AATCGGCACC AGTGCGACAA TGCCTCGCGG AGTCCTTCAA CGCAGCACTG AAGCGGAAGT    1080
CCTCCAGGAT TCCAAGACAT TCATGAACCA GTTGCGCTGT CGCCGGGACG TCTTCCGCTG    1140
GTGTACCCGC TACAACATGG TGCGCCGGCA TTCCTGGTGT AAATATCTCG CCCTGCGGTG    1200
TTTGAGAAGC GCTGTCCTGC TATCCTGAAA TCTGCTTCCT GATCAAATCC TCCGTGTCTA    1260
CTATCCGGGG GTCGGGCCC                                                 1279
(10)SEQ ID NO:10:的资料:
    (i)序列特征:
        (A)长度:14个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线形
    (ii)分子类型:DNA(基因组的)
    (iii)假设:否
    (iv)反义:否
    (vi)来源:
        (A)生物:乳酸发酵短杆菌
        (B)菌株:AJ12036
    (xi)序列描述:SEQ ID NO:10:
GGGACTGACC CCTG
(11)SEQ ID NO:11:的资料
    (i)序列特征:
        (A)长度:14个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线形
    (ii)分子类型:DNA(基因组的)
    (iii)假设:否
    (iv)反义:是
    (vi)来源:
        (A)生物:乳酸发酵短杆菌
        (B)菌株:AJ12036
    (xi)序列描述:SEQ ID NO:11:
GGGCCCGACC CCCG                                    14
(12)SEQ ID NO:12:的资料
    (i)序列特征:
        (A)长度:8个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线形
    (ii)分子类型:DNA(基因组的)
    (iii)假设:否
    (iv)反义:否
    (xi)序列描述:SEQ ID NO:12:
GGTTTATT                                         8
(13)SEQ ID NO:13:的资料
    (i)序列特征:
        (A)长度:23个碱基对
        (B)类型:核酸
        (C)链型:单链
        (D)拓扑结构:线形
    (ii)分子类型:其他..合成DNA
    (iv)反义:否
    (xi)序列描述:SEQ ID NO:13:
GTGGAGCCGA CCATTCCGCG AGG                   23
(14)SEQ ID NO:14:的资料
    (i)序列特征:
        (A)长度:23个碱基
        (B)类型:核酸
        (C)链型:单链
        (D)拓扑结构:线形
    (ii)分子类型:其他..合成的DNA
    (iv)反义:是
    (xi)序列描述:SEQ ID NO:14:
CCAAAACCGC CCTCCACGGC GAA                       23
(15)SEQ ID NO:15:的资料
    (i)序列特征:
        (A)长度:3579个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线形
    (ii)分子类型:基因组DNA
    (iv)反义:无
    (vi)来源:
        (A)生物:乳酸发酵短杆菌
        (B)菌株:ATcc 13869
    (ix)特征:
        (A)名称/关键词:CDS
        (B)位置:533..2182
    (ix)特征:
        (A)名称/关键词:CDS
        (B)位置:2188..3522
(xi)序列描述:SEQ ID NO:15:
GTGGAGCCGA CCATTCCGCG AGGCTGCACT GCAACGAGGT CGTAGTTTTG GTACATGGCT   60
TCTGGCCAGT TCATGGATTG GCTGCCGAAG AAGCTATAGG CATCGCACCA GGGCCACCGA  120
GTTACCGAAG ATGGTGCCGT GCTTTTCGCC TTGGGCAGGG ACCTTGACAA AGCCCACGCT  180
GATATCGCCA AGTGAGGGAT CAGAATAGTG CATGGGCACG TCGATGCTGC CACATTGAGC  240
GGAGGCAATA TCTACCTGAG GTGGGCATTC TTCCCAGCGG ATGTTTTCTT GCGCTGCTGC  300
AGTGGGCATT GATACCAAAA AGGGGCTAAG CGCAGTCGAG GCGGCAAGAA CTGCTACTAC  360
CCTTTTTATT GTCGAACGGG GCATTACGGC TCCAAGGACG TTTGTTTTCT GGGTCAGTTA  420
CCCCAAAAAG CATATACAGA GACCAATGAT TTTTCATTAA AAAGGCAGGG ATTTGTTATA  480
AGTATGGGTC GTATTCTGTG CGACGGGTGT ACCTCGGCTA GAATTTCTCC CC ATG      535
                                                          Met
                                                            1
ACA CCA GCT GAT CTC GCA ACA TTG ATT AAA GAG ACC GCG GTA GAG GTT    583
Thr Pro Ala Asp Leu Ala Thr Leu Ile Lys Glu Thr Ala Val Glu Val
             5                   10                  15
ITG ACC TCC CGC GAG CTC GAT ACT TCT GTT CTT CCG GAG CAG GTA GTT    631
Leu Thr Ser Arg Glu Leu Asp Thr Ser Val Leu Pro Glu Gln Val Val
         20                  25                  30
GTG GAG CGT CCG CGT AAC CCA GAG CAC GGC GAT TAC GCC ACC AAC ATT    679
Val Glu Arg Pro Arg Asn Pro Glu His Gly Asp Tyr Ala Thr Asn Ile
     35                  40                  45
GCA TTG CAG GTG GCT AAA AAG GTC GGT CAG AAC CCT CGG GAT TTG GCT    727
Ala Leu Gln Val Ala Lys Lys Val Gly Gln Asn Pro Arg Asp Leu Ala
 50                  55                  60                  65
ACC TGG CTG GCA GAG GCA TTG GCT GCA GAT GAC GCC ATT GAT TCT GCT    775
Thr Trp Leu Ala Glu Ala Leu Ala Ala Asp Asp Ala Ile Asp Ser Ala
                 70                  75                  80
GAA ATT GCT GGC CCA GGC TTT TTG AAC ATT CGC CTT GCT GCA GCA GCA    823
Glu Ile Ala Gly Pro Gly Phe Leu Asn Ile Arg Leu Ala Ala Ala Ala
             85                  90                  95
CAG GGT GAA ATT GTG GCC AAG ATT CTG GCA CAG GGC GAG ACT TTC GGA    871
Gln Gly Glu Ile Val Ala Lys Ile Leu Ala Gln Gly Glu Thr Phe Gly
        100                 105                 110
AAC TCC GAT CAC CTT TCC CAC TTG GAC GTG AAC CTC GAG TTC GTT TCT    919
Asn Ser Asp His Leu Ser His Leu Asp Val Asn Leu Glu Phe Val Ser
    115                 120                 125
GCA AAC CCA ACC GGA CCT ATT CAC CTT GGC GGA ACC CGC TGG GCT GCC    967
Ala Asn Pro Thr Gly Pro Ile His Leu Gly Gly Thr Arg Trp Ala Ala
130                 135                 140                 145
GTG GGT GAC TCT TTG GGT CGT GTG CTG GAG GCT TCC GGC GCG AAA GTG   1015
Val Gly Asp Ser Leu Gly Arg Val Leu Glu Ala Ser Gly Ala Lys Val
                150                 155                 160
ACC CGC GAA TAC TAC TTC AAC GAT CAC GGT CGC CAG ATC GAT CGT TTC   1063
Thr Arg Glu Tyr Tyr Phe Asn Asp His Gly Arg Gln Ile Asp Arg Phe
            165                 170                 175
GCT TTG TCC CTT CTT GCA GCG GCG AAG GGC GAG CCA ACG CCA GAA GAC   1111
Ala Leu Ser Leu Leu Ala Ala Ala Lys Gly Glu Pro Thr Pro Glu Asp
        180                 185                 190
GGT TAT GGC GGC GAA TAC ATT AAG GAA ATT GCG GAG GCA ATC GTC GAA 1159
Gly Tyr Gly Gly Glu Tyr Ile Lys Glu Ile Ala Glu Ala Ile Val Glu
    195                 200                 205
AAG CAT CCT GAA GCG TTG GCT TTG GAG CCT GCC GCA ACC CAG GAG CTT    1207
Lys His Pro Glu Ala Leu Ala Leu Glu Pro Ala Ala Thr Gln Glu Leu
210                 215                 220                 225
TTC CGC GCT GAA GGC GTG GAG ATG ATG TTC GAG CAC ATC AAA TCT TCC    1255
Phe Arg Ala Glu Gly Val Glu Met Met Phe Glu His Ile Lys Ser Ser
                230                 235                 240
CTG CAT GAG TTC GGC ACC GAT TTC GAT GTC TAC TAC CAC GAG AAC TCC    1303
Leu His Glu Phe Gly Thr Asp Phe Asp Val Tyr Tyr His Glu Asn Ser
            245                 250                 255
CTG TTC GAG TCC GGT GCG GTG GAC AAG GCC GTG CAG GTG CTG AAG GAC    1351
Leu Phe Glu Ser Gly Ala Val Asp Lys Ala Val Gln Val Leu Lys Asp
        260                 265                 270
AAC GGC AAC CTG TAC GAA AAC GAG GGC GCT TGG TGG CTG CGT TCC ACC    1399
Asn Gly Asn Leu Tyr Glu Asn Glu Gly Ala Trp Trp Leu Arg Ser Thr
    275                 280                 285
GAA TTC GGC GAT GAC AAA GAC CGC GTG GTG ATC AAG TCT GAC GGC GAC    1447
Glu Phe Gly Asp Asp Lys Asp Arg Val Val Ile Lys Ser Asp Gly Asp
290                 295                 300                 305
GCA GCC TAC ATC GCT GGC GAT ATC GCG TAC GTG GCT GAT AAG TTC TCC    1495
Ala Ala Tyr Ile Ala Gly Asp Ile Ala Tyr Val Ala Asp Lys Phe Ser
                310                 315                 320
CGC GGA CAC AAC CTA AAC ATC TAC ATG TTG GGT GCT GAC CAC CAT GGT    1543
Arg Gly His Asn Leu Asn Ile Tyr Met Leu Gly Ala Asp His His Gly
            325                 330                 335
TAC ATC GCG CGC CTG AAG GCA GCG GCG GCG GCA CTT GGC TAC AAG CCA    1591
Tyr Ile Ala Arg Leu Lys Ala Ala Ala Ala Ala Leu Gly Tyr Lys Pro
        340                 345                 350
GAA GGC GTT GAA GTC CTG ATT GGC CAG ATG GTG AAC CTG CTT CGC GAC    1639
Glu Gly Val Glu Val Leu Ile Gly Gln Met Val Asn Leu Leu Arg Asp
    355                 360                 365
GGC AAG GCA GTG CGT ATG TCC AAG CGT GCA GGC ACC GTG GTC ACC CTA    1687
Gly Lys Ala Val Arg Met Ser Lys Arg Ala Gly Thr Val Val Thr Leu
370                 375                 380                 385
GAT GAC CTC GTT GAA GCA ATC GGC ATC GAT GCG GCG CGT TAC TCC CTG    1735
Asp Asp Leu Val Glu Ala Ile Gly Ile Asp Ala Ala Arg Tyr Ser Leu
                390                 395                 400
ATC CGT TCC TCC GTG GAT TCT TCC CTG GAT ATC GAT CTC GGC CTG TGG    1783
Ile Arg Ser Ser Val Asp Ser Ser Leu Asp Ile Asp Leu Gly Leu Trp
            405                 410                 415
GAA TCC CAG TCC TCC GAC AAC CCT GTG TAC TAC GTG CAG TAC GGA CAC    1831
Glu Ser Gln Ser Ser Asp Asn Pro Val Tyr Tyr Val Gln Tyr Gly His
        420                 425                 430
GCT CGT CTG TGC TCC ATC GCG CGC AAG GCA GAG ACC TTG GGT GTC ACC    1879
Ala Arg Leu Cys Ser Ile Ala Arg Lys Ala Glu Thr Leu Gly Val Thr
    435                 440                 445
GAG GAA GGC GCA GAC CTA TCT CTA CTG ACC CAC GAC CGC GAA GGC GAT    1927
Glu Glu Gly Ala Asp Leu Ser Leu Leu Thr His Asp Arg Glu Gly Asp
450                 455                 460                 465
CTC ATC CGC ACA CTC GGA GAG TTC CCA GCA GTG GTG AAG GCT GCC GCT    1975
Leu Ile Arg Thr Leu Gly Glu Phe Pro Ala Val Val Lys Ala Ala Ala
                470                 475                 480
GAC CTA CGT GAA CCA CAC CGC ATT GCC CGC TAT GCT GAG GAA TTA GCT    2023
Asp Leu Arg Glu Pro His Arg Ile Ala Arg Tyr Ala Glu Glu Leu Ala
            485                 490                 495
GGA ACT TTC CAC CGC TTC TAC GAT TCC TGC CAC ATC CTT CCA AAG GTT    2071
Gly Thr Phe His Arg Phe Tyr Asp Ser Cys His Ile Leu Pro Lys Val
        500                 505                 510
GAT GAG GAT ACG GCA CCA ATC CAC ACA GCA CGT CTG GCA CTT GCA GCA    2119
Asp Glu Asp Thr Ala Pro Ile His Thr Ala Arg Leu Ala Leu Ala Ala
    515                 520                 525
GCA ACC CGC CAG ACC CTC GCT AAC GCC CTG CAC CTG GTT GGC GTT TCC    2167
Ala Thr Arg Gln Thr Leu Ala Asn Ala Leu His Leu Val Gly Val Ser
630                 535                 540                 545
GCA CCG GAG AAG ATG TAACA ATG GCT ACA GTT GAA AAT TTC AAT GAA      2214
Ala Pro Glu Lys Met       Met Ala Thr Val Glu Asn Phe Asn Glu
                550         1               5
CTT CCC GCA CAC GTA TGG CCA CGC AAT GCC GTG CGC CAA GAA GAC GGC    2262
Leu Pro Ala His Val Trp Pro Arg Asn Ala Val Arg Gln Glu Asp Gly
 10                  15                  20                  25
GTT GTC ACC GTC GCT GGT GTG CCT CTG CCT GAC CTC GCT GAA GAA TAC    2310
Val Val Thr Val Ala Gly Val Pro Leu Pro Asp Leu Ala Glu Glu Tyr
                 30                  35                  40
GGA ACC CCA CTG TTC GTA GTC GAC GAG GAC GAT TTC CGT TCC CGC TGT    2358
Gly Thr Pro Leu Phe Val Val Asp Glu Asp Asp Phe Arg Ser Arg Cys
             45                   50                  55
CGC GAC ATG GCT ACC GCA TTC GGT GGA CCA GGC AAT GTG CAC TAC GCA    2406
Arg Asp Met Ala Thr Ala Phe Gly Gly Pro Gly Asn Val His Tyr Ala
         60                   65                  70
TCT AAA GCG TTC CTG ACC AAG ACC ATT GCA CGT TGG GTT GAT GAA GAG    2454
Ser Lys Ala Phe Leu Thr Lys Thr Ile Ala Arg Trp Val Asp Glu Glu
     75                  80                  85
GGG CTG GCA CTG GAC ATT GCA TCC ATC AAC GAA CTG GGC ATT GCC CTG    2502
Gly Leu Ala Leu Asp Ile Ala Ser Ile Asn Glu Leu Gly Ile Ala Leu
 90                  95                 100                 105
GCC GCT GGT TTC CCC GCC AGC CGT ATC ACC GCG CAC GGC AAC AAC AAA    2550
Ala Ala Gly Phe Pro Ala Ser Arg Ile Thr Ala His Gly Asn Asn Lys
                110                 115                 120
GGC GTA GAG TTC CTG CGC GCG TTG GTT CAA AAC GGT GTG GGA CAC GTG    2598
Gly Val Glu Phe Leu Arg Ala Leu Val Gln Asn Gly Val Gly His Val
            125                 130                 135
GTG CTG GAC TCC GCA CAG GAA CTA GAA CTG TTG GAT TAC GTT GCC GCT    2646
Val Leu Asp Ser Ala Gln Glu Leu Glu Leu Leu Asp Tyr Val Ala Ala
        140                 145                 150
GGT GAA GGC AAG ATT CAG GAC GTG TTG ATC CGC GTA AAG CCA GGC ATC    2694
Gly Glu Gly Lys Ile Gln Asp Val Leu Ile Arg Val Lys Pro Gly Ile
    155                 160                 165
GAA GCA CAC ACC CAC GAG TTC ATC GCC ACT AGC CAC GAA GAC CAG AAG    2742
Glu Ala His Thr His Glu Phe Ile Ala Thr Ser His Glu Asp Gln Lys
170                 175                 180                 185
TTC GGA TTC TCC CTG GCA TCC GGT TCC GCA TTC GAA GCA GCA AAA GCC    2790
Phe Gly Phe Ser Leu Ala Ser Gly Ser Ala Phe Glu Ala Ala Lys Ala
                190                 195                 200
GCC AAC AAC GCA GAA AAC CTG AAC CTG GTT GGC CTG CAC TGC CAC GTT    2838
Ala Asn Asn Ala Glu Asn Leu Asn Leu Val Gly Leu His Cys His Val
            205                 210                 215
GGT TCC CAG GTG TTC GAC GCC GAA GGC TTC AAG CTG GCA GCA GAA CGC    2886
Gly Ser Gln Val Phe Asp Ala Glu Gly Phe Lys Leu Ala Ala Glu Arg
        220                 225                 230
GTG TTG GGC CTG TAC TCA CAG ATC CAC AGC GAA CTG GGC GTT GCC CTT    2934
Val Leu Gly Leu Tyr Ser Gln Ile His Ser Glu Leu Gly Val Ala Leu
    235                 240                 245
CCT GAA CTG GAT CTC GGT GGC GGA TAC GGC ATT GCC TAT ACC GCA GCT    2982
Pro Glu Leu Asp Leu Gly Gly Gly Tyr Gly Ile Ala Tyr Thr Ala Ala
250                 255                 260                 265
GAA GAA CCA CTC AAC GTC GCA GAA GTT GCC TCC GAC CTG CTC ACC GCA    3030
Glu Glu Pro Leu Asn Val Ala Glu Val Ala Ser Asp Leu Leu Thr Ala
                270                 275                 280
GTC GGA AAA ATG GCA GCG GAA CTA GGC ATC GAC GCA CCA ACC GTG CTT    3078
Val Gly Lys Met Ala Ala Glu Leu Gly Ile Asp Ala Pro Thr Val Leu
            285                 290                 295
GTT GAG CCC GGC CGC GCT ATC GCA GGC CCC TCC ACC GTG ACC ATC TAC    3126
Val Glu Pro Gly Arg Ala Ile Ala Gly Pro Ser Thr Val Thr Ile Tyr
        300                 305                 310
GAA GTC GGC ACC ACC AAA GAC GTC CAC GTA GAC GAC GAC AAA ACC CGC    3174
Glu Val Gly Thr Thr Lys Asp Val His Val Asp Asp Asp Lys Thr Arg
    315                 320                 325
CGT TAC ATC GCC GTG GAC GGA GGC ATG TCC GAC AAC ATC CGC CCA GCA    3222
Arg Tyr Ile Ala Val Asp Gly Gly Met Ser Asp Asn Ile Arg Pro Ala
330                 335                 340                 345
CTC TAC GGC TCC GAA TAC GAC GCC CGC GTA GTA TCC CGC TTC GCC GAA    3270
Leu Tyr Gly Ser Glu Tyr Asp Ala Arg Val Val Ser Arg Phe Ala Glu
                 350                 355                 360
GGA GAC CCA GTA AGC ACC CGC ATC GTG GGC TCC CAC TGC GAA TCC GGC    3318
Gly Asp Pro Val Ser Thr Arg Ile Val Gly Ser His Cys Glu Ser Gly
            365                 370                 375
GAT ATC CTG ATC AAC GAT GAA ATC TAC CCA TCT GAC ATC ACC AGC GGC    3366
Asp Ile Leu Ile Asn Asp Glu Ile Tyr Pro Ser Asp Ile Thr Ser Gly
        380                 385                 390
GAC TTC CTT GCA CTC GCA GCC ACC GGC GCA TAC TGC TAC GCC ATG AGC    3414
Asp Phe Leu Ala Leu Ala Ala Thr Gly Ala Tyr Cys Tyr Ala Met Ser
    395                 400                 405
TCC CGC TAC AAC GCC TTC ACA CGG CCC GCC GTC GTG TCC GTC CGC GCT    3462
Ser Arg Tyr Asn Ala Phe Thr Arg Pro Ala Val Val Ser Val Arg Ala
410                 415                 420                 425
GGC AGC TCC CGC CTC ATG CTG CGC CGC GAA ACG CTC GAC GAC ATC CTC    3510
Gly Ser Ser Arg Leu Met Leu Arg Arg Glu Thr Leu Asp Asp Ile Leu
                430                 435                 440
TCA CTA GAG GCA TAACGCTTTT CGACGCCTGA CCCCGCCCTT CACCTTCGCC        3562
Ser Leu Glu Ala
            445
GTGGAGGGGCG GTTTTGG                               3579
(16)SEQ ID NO:16:的资料
    (i)序列特征:
        (A)长度:23个碱基对
        (B)类型:核酸
        (C)链型:单链
        (D)拓扑结构:线性
    (ii)分子类型:其他..合成的DNA
    (iv)反义:无
    (xi)序列描述:SEQ ID NO:16:
GTCGACGGAT CGCAAATGGC AAC                         23
(17)SEQ ID NO:17:的资料
    (i)序列特征:
        (A)长度:23个碱基
        (B)类型:核酸
        (C)链型:单链
        (D)拓扑结构:线性
    (ii)分子类型:其他..合成DNA
    (iv)反义:有
    (xi)序列描述:SEQ ID NO:17:
GGATCCTTGA GCAUTTGCG CAG
(18)SEQ ID NO:18:的资料
    (i)序列特征:
        (A)长度:1411个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线性
    (ii)分子类型:基因组DNA
    (iv)反义:无
(vi)来源:
    (A)生物:乳酸发酵短杆菌
    (B)菌株:ATCC 13869
(ix)特征:
    (A)名称/关键词:CDS
    (B)位置:311..1213
(xi)序列描述:SEQ ID NO:18:
CTCTCGATAT CGAGAGAGAA GCAGCGCCAC GGTTTTTCGG TGATTTTGAG ATTGAAACTT     60
TGGCAGACGG ATCGCAAATG GCAACAAGCC CGTATGTCAT GGACTTTTAA CGCAAAGCTC    120
ACACCCACGA GCTAAAAATT CATATAGTTA AGACAACATT TTTGGCTGTA AAAGACAGCC    180
GTAAAAACCT CTTGCTCATG TCAATTGTTC TTATCGGAAT GTGGCTTGGG CGATTGTTAT    240
GCAAAAGTTG TTAGGTTTTT TGCGGGGTTG TTTAACCCCC AAATGAGGGA AGAAGGTAAC    300
CTTGAACTCT ATG AGC ACA GGT TTA ACA GCT AAG ACC GGA GTA GAG CAC       349
           Met Ser Thr Gly Leu Thr Ala Lys Thr Gly Val Glu His
             1               5                  10
TTC GGC ACC GTT GGA GTA GCA ATG GTT ACT CCA TTC ACG GAA TCC GGA      397
Phe Gly Thr Val Gly Val Ala Met Val Thr Pro Phe Thr Glu Ser Gly
     15                   20                 25
GAC ATC GAT ATC GCT GCT GGC CGC GAA GTC GCG GCT TAT TTG GTT GAT      445
Asp Ile Asp Ile Ala Ala Gly Arg Glu Val Ala Ala Tyr Leu Val Asp
 30                  35                  40                  45
AAG GGC TTG GAT TCT TTG GTT CTC GCG GGC ACC ACT GGT GAA TCC CCA      493
Lys Gly Leu Asp Ser Leu Val Leu Ala Gly Thr Thr Gly Glu Ser Pro
                 50                  55                  60
ACG ACA ACC GCC GCT GAA AAA CTA GAA CTG CTC AAG GCC GTT CGT GAG    541
Thr Thr Thr Ala Ala Glu Lys Leu Glu Leu Leu Lys Ala Val Arg Glu
             65                  70                  75
GAA GTT GGG GAT CGG GCG AAC GTC ATC GCC GGT GTC GGA ACC AAC AAC    589
Glu Val Gly Asp Arg Ala Asn Val Ile Ala Gly Val Gly Thr Asn Asn
         80                  85                  90
ACG CGG ACA TCT GTG GAA CTT GCG GAA GCT GCT GCT TCT GCT GGC GCA    637
Thr Arg Thr Ser Val Glu Leu Ala Glu Ala Ala Ala Ser Ala Gly Ala
     95                 100                 105
GAC GGC CTT TTA GTT GTA ACT CCT TAT TAC TCC AAG CCG AGC CAA GAG    685
Asp Gly Leu Leu Val Val Thr Pro Tyr Tyr Ser Lys Pro Ser Gln Glu
110                  115                  120                 125
GGA TTG CTG GCG CAC TTC GGT GCA ATT GCT GCA GCA ACA GAG GTT CCA    733
Gly Leu Leu Ala His Phe Gly Ala Ile Ala Ala Ala Thr Glu Val Pro
                130                 135                 140
ATT TGT CTC TAT GAC ATT CCT GGT CGG TCA GGT ATT CCA ATT GAG TCT    781
Ile Cys Leu Tyr Asp Ile Pro Gly Arg Ser Gly Ile Pro Ile Glu Ser
            145                 150                 155
GAT ACC ATG AGA CGC CTG AGT GAA TTA CCT ACG ATT TTG GCG GTC AAG    829
Asp Thr Met Arg Arg Leu Ser Glu Leu Pro Thr Ile Leu Ala Val Lys
        160                 165                 170
GAC GCC AAG GGT GAC CTC GTT GCA GCC ACG TCA TTG ATC AAA GAA ACG    877
Asp Ala Lys Gly Asp Leu Val Ala Ala Thr Ser Leu Ile Lys Glu Thr
    175                  180                  185
GGA CTT GCC TGG TAT TCA GGC GAT GAC CCA CTA AAC CTT GTT TGG CTT     925
Gly Leu Ala Trp Tyr Ser Gly Asp Asp Pro Leu Asn Leu Val Trp Leu
190                 195                 200                 205
GCT TTG GGC GGA TCA GGT TTC ATT TCC GTA ATT GGA CAT GCA GCC CCC     973
Ala Leu Gly Gly Ser Gly Phe Ile Ser Val Ile Gly His Ala Ala Pro
                210                 215                 220
ACA GCA TTA CGT GAG TTG TAC ACA AGC TTC GAG GAA GGC GAC CTC GTC    1021
Thr Ala Leu Arg Glu Leu Tyr Thr Ser Phe Glu Glu Gly Asp Leu Val
            225                 230                 235
CGT GCG CGG GAA ATC AAC GCC AAA CTA TCA CCG CTG GTA GCT GCC CAA    1069
Arg Ala Arg Glu Ile Asn Ala Lys Leu Ser Pro Leu Val Ala Ala Gln
        240                  245                 250
GGT CGC TTG GGT GGA GTC AGC TTG GCA AAA GCT GCT CTG CGT CTG CAG    1117
Gly Arg Leu Gly Gly Val Ser Leu Ala Lys Ala Ala Leu Arg Leu Gln
    255                 260                 265
GGC ATC AAC GTA GGA GAT CCT CGA CTT CCA ATT ATG GCT CCA AAT GAG    1165
Gly Ile Asn Val Gly Asp Pro Arg Leu Pro Ile Met Ala Pro Asn Glu
270                 275                 280                 285
CAG GAA CTT GAG GCT CTC CGA GAA GAC ATG AAA AAA GCT GGA GTT CTA    1213
Gln Glu Leu Glu Ala Leu Arg Glu Asp Met Lys Lys Ala Gly Val Leu
                290                 295                 300
TAAATATGAA TGATTCCCGA AATCGCGGCC GGAAGGTTAC CCGCAAGGCG GCCCACCAGA  1273
AGCTGGTCAG GAAAACCATC TGGATACCCC TGTCTTTCAG GCACCAGATG CTTCCTCTAA  1333
CCAGAGCGCT GTAAAAGCTG AGACCGCCGG AAACGACAAT CGGGATGCTG CGCAAGGTGC  1393
TCAAGGATCC CAACATTC                                                1411
(19)SEQ ID NO:19的资料:
    (i)序列特征:
        (A)长度:23个碱基
        (B)类型:核酸
        (C)链型:单链
        (D)拓扑结构:线性
    (ii)分子类型:其他..合成DNA
    (iv)反义:无
    (xi)序列描述:SEQ ID NO:19:
TCGCGAAGTA GCACCTGTCA CTT                     23
(20)SEQ ID NO:20的资料:
    (i)序列特征:
        (A)长度:21个碱基
        (B)类型:核酸
        (C)链型:单链
        (D)拓扑结构:线性
    (ii)分子类型:其他..合成DNA
    (iv)反义:有
    (xi)序列描述:SEQ ID NO:20:
ACGGAATTCA ATCTTACGGC C                     21
(21)SEQ ID NO:21的资料:
    (i)序列特征:
        (A)长度:1643个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线性
    (ii)分子类型:基因组DNA
    (iv)反义:无
    (vi)来源:
        (A)生物:乳酸发酵短杆菌
        (B)菌株:ATCC 13869
    (xi)序列描述:SEQ ID NO:21:
TCGCGAAGTA GCACCTGTCA CTTTTGTCTC AAATATTAAA TCGAATATCA ATATACGGTC     60
TGTTTATTGG AACGCATCCC AGTGGCTGAG ACGCATCCGC TAAAGCCCCA GGAACCCTGT    120
GCAGAAAGAA AACACTCCTC TGGCTAGGTA GACACAGTTT ATAAAGGTAG AGTTGAGCGG    180
GTAACTGTCA GCACGTAGAT CGAAAGGTGC ACAAAGGTGG CCCTGGTCGT ACAGAAATAT    240
GGCGGTTCCT CGCTTGAGAG TGCGGAACGC ATTAGAAACG TCGCTGAACG GATCGTTGCC    300
ACCAAGAAGG CTGGAAATGA TGTCGTGGTT GTCTGCTCCG CAATGGGAGA CACCACGGAT    360
GAACTTCTAG AACTTGCAGC GGCAGTGAAT CCCGTTCCGC CAGCTCGTGA AATGGATATG    420
CTCCTGACTG CTGGTGAGCG TATTTCTAAC GCTCTCGTCG CCATGGCTAT TGAGTCCCTT    480
GGCGCAGAAG CTCAATCTTT CACTGGCTCT CAGGCTGGTG TGCTCACCAC CGAGCGCCAC    540
GGAAACGCAC GCATTGTTGA CGTCACACCG GGTCGTGTGC GTGAAGCACT CGATGAGGGC    600
AAGATCTGCA TTGTTGCTGG TTTTCAGGGT GTTAATAAAG AAACCCGCGA TGTCACCACG    660
TTGGGTCGTG GTGGTTCTGA CACCACTGCA GTTGCGTTGG CAGCTGCTTT GAACGCTGAT    720
GTGTGTGAGA TTTACTCGGA CGTTGACGGT GTGTATACCG CTGACCCGCG CATCGTTCCT    780
AATGCACAGA AGCTGGAAAA GCTCAGCTTC GAAGAAATGC TGGAACTTGC TGCTGTTGGC    840
TCCAAGATTT TGGTGCTGCG CAGTGTTGAA TACGCTCGTG CATTCAATGT GCCACTTCGC    900
GTACGCTCGT CTTATAGTAA TGATCCCGGC ACTTTGATTG CCGGCTCTAT GGAGGATATT    960
CCTGTGGAAG AAGCAGTCCT TACCGGTGTC GCAACCGACA AGTCCGAAGC CAAAGTAACC   1020
GTTCTGGGTA TTTCCGATAA GCCAGGCGAG GCTGCCAAGG TTTTCCGTGC GTTGGCTGAT    1080
GCAGAAATCA ACATTGACAT GGTTCTGCAG AACGTCTCCT CTGTGGAAGA CGGCACCACC    1140
GACATCACGT TCACCTGCCC TCGCGCTGAC GGACGCCGTG CGATGGAGAT CTTGAAGAAG    1200
CTTCAGGTTC AGGGCAACTG GACCAATGTG CTTTACGACG ACCAGGTCGG CAAAGTCTCC    1260
CTCGTGGGTG CTGGCATGAA GTCTCACCCA GGTGTTACCG CAGAGTTCAT GGAAGCTCTG    1320
CGCGATGTCA ACGTGAACAT CGAATTGATT TCCACCTCTG AGATCCGCAT TTCCGTGCTG    1380
ATCCGTGAAG ATGATCTGGA TGCTGCTGCA CGTGCATTGC ATGAGCAGTT CCAGCTGGGC    1440
GGCGAAGACG AAGCCGTCGT TTATGCAGGC ACCGGACGCT AAAGTTTTAA AGGAGTAGTT    1500
TTACAATGAC CACCATCGCA GTTGTTGGTG CAACCGGCCA GGTCGGCCAG GTTATGCGCA    1560
CCCTTTTGGA AGAGCGCAAT TTCCCAGCTG ACACTGTTCG TTTCTTTGCT TCCCCGCGTT    1620
CCGCAGGCCG TAAGATTGAA TTC                                            1643
(22)SEQ ID NO:22的资料:
    (i)序列特征:
        (A)长度:23个碱基
        (B)类型:核酸
        (C)链型:单链
        (D)拓扑结构:线性
    (ii)分子类型:其他..合成DNA
    (iv)反义:无
    (xi)序列描述:SEQ ID NO:22:
GGATCCCCAA TCGATACCTG GAA                    23
(23)SEQ ID NO:23的资料:
    (i)序列特征:
        (A)长度:23个碱基
        (B)类型:核酸
        (C)链型:单链
        (D)拓扑结构:线性
    (ii)分子类型:其他..合成DNA
    (iv)反义:有
    (xi)序列描述:SEQ ID NO:23:
CGGTTCATCG CCAAGTTTTT CTT                   23
(24)SEQ ID NO:24的资料:
    (i)序列特征:
        (A)长度:2001个碱基对
        (B)类型:核酸
        (C)链型:双链
        (D)拓扑结构:线性
    (ii)分子类型:基因组DNA
    (iv)反义:无
    (vi)来源:
        (A)生物:乳酸发酵短杆菌
        (B)菌株:ATCC 13869
    (ix)特征:
        (A)名称/关键词:CDS
    (B)位置:730..1473
(xi)序列描述:SEQ ID NO:24:
GGATCCCCAA TCGATACCTG GAACGACAAC CTGATCAGGA TATCCAATGC CTTGAATATT     60
GACGTTGAGG AAGGAATCAC CAGCCATCTC AACTGGAAGA CCTGACGCCT GCTGAATTGG    120
ATCAGTGGCC CAATCGACCC ACCAACCAGG TTGGCTATTA CCGGCGATAT CAAAAACAAC    180
TCGCGTGAAC GTTTCGTGCT CGGCAACGCG GATGCCAGCG ATCGACATAT CGGAGTCACC    240
AACTTGAGCC TGCTGCTTCT GATCCATCGA CGGGGAACCC AACGGCGGCA AAGCAGTGGG    300
GGAAGGGGAG TTGGTGGACT CTGAATCAGT GGGCTCTGAA GTGGTAGGCG ACGGGGCAGC    360
ATCTGAAGGC GTGCGAGTTG TGGTGACCGG GTTAGCGGTT TCAGTTTCTG TCACAACTGG    420
AGCAGGACTA GCAGAGGTTG TAGGCGTTGA GCCGCTTCCA TCACAAGCAC TTAAAAGTAA    480
AGAGGCGGAA ACCACAAGCG CCAAGGAACT ACCTGCGGAA CGGGCGGTGA AGGGCAACTT    540
AAGTCTCATA TTTCAAACAT AGTTCCACCT GTGTGATTAA TCTCCAGAAC GGAACAAACT    600
GATGAACAAT CGTTAACAAC ACAGACCAAA ACGGTCAGTT AGGTATGGAT ATCAGCACCT    660
TCTGAATGGG TACGTCTAGA CTGGTGGGCG TTTGAAAAAC TCTTCGCCCC ACGAAAATGA    720
AGGAGCATA ATG GGA ATC AAG GTT GGC GTT CTC GGA GCC AAA GGC CGT        768
          Met Gly Ile Lys Val Gly Val Leu Gly Ala Lys Gly Arg
            1                 5                10
GTT GGT CAA ACT ATT GTG GCA GCA GTC AAT GAG TCC GAC GAT CTG GAG    816
Val Gly Gln Thr Ile Val Ala Ala Val Asn Glu Ser Asp Asp Leu Glu
     15                  20                  25
CTT GTT GCA GAG ATC GGC GTC GAC GAT GAT TTG AGC CTT CTG GTA GAC    864
Leu Val Ala Glu Ile Gly Val Asp Asp Asp Leu Ser Leu Leu Val Asp
 30                  35                   40                 45
AAC GGC GCT GAA GTT GTC GTT GAC TTC ACC ACT CCT AAC GCT GTG ATG    912
Asn Gly Ala Glu Val Val Val Asp Phe Thr Thr Pro Asn Ala Val Met
                 50                  55                  60
GGC AAC CTG GAG TTC TGC ATC AAC AAC GGC ATT TCT GCG GTT GTT GGA    960
Gly Asn Leu Glu Phe Cys Ile Asn Asn Gly Ile Ser Ala Val Val Gly
             65                  70                  75
ACC ACG GGC TTC GAT GAT GCT CGT TTG GAG CAG GTT CGC GCC TGG CTT    1008
Thr Thr Gly Phe Asp Asp Ala Arg Leu Glu Gln Val Arg Ala Trp Leu
         80                  85                  90
GAA GGA AAA GAC AAT GTC GGT GTT CTG ATC GCA CCT AAC TTT GCT ATC    1056
Glu Gly Lys Asp Asn Val Gly Val Leu Ile Ala Pro Asn Phe Ala Ile
     95                 100                 105
TCT GCG GTG TTG ACC ATG GTC TTT TCC AAG CAG GCT GCC CGC TTC TTC    1104
Ser A1a Val Leu Thr Met Val Phe Ser Lys Gln Ala Ala Arg Phe Phe
110                 115                 120                 125
GAA TCA GCT GAA GTT ATT GAG CTG CAC CAC CCC AAC AAG CTG GAT GCA    1152
Glu Ser Ala Glu Val Ile Glu Leu His His Pro Asn Lys Leu Asp Ala
                130                 135                 140
CCT TCA GGC ACC GCG ATC CAC ACT GCT CAG GGC ATT GCT GCG GCA CGC    1200
Pro Ser Gly Thr Ala Ile His Thr Ala Gln Gly Ile Ala Ala Ala Arg
            145                 150                 155
AAA GAA GCA GGC ATG GAC GCA CAG CCA GAT GCG ACC GAG CAG GCA CTT    1248
Lys Glu Ala Gly Met Asp Ala Gln Pro Asp Ala Thr Glu Gln Ala Leu
        160                 165                 170
GAG GGT TCC CGT GGC GCA AGC GTA GAT GGA ATC CCA GTT CAC GCA GTC    1296
Glu Gly Ser Arg Gly Ala Ser Val Asp Gly Ile Pro Val His Ala Val
    175                 180                 185
CGC ATG TCC GGC ATG GTT GCT CAC GAG CAA GTT ATC TTT GGC ACC CAG    1344
Arg Met Ser Gly Met Val Ala His Glu Gln Val Ile Phe Gly Thr Gln
190                 195                 200                 205
GGT CAG ACC TTG ACC ATC AAG CAG GAC TCC TAT GAT CGC AAC TCA TTT    1392
Gly Gln Thr Leu Thr Ile Lys Gln Asp Ser Tyr Asp Arg Asn Ser Phe
                 210                    215              220
GCA CCA GGT GTC TTG GTG GGT GTG CGC AAC ATT GCA CAG CAC CCA GGC      1440
Ala Pro Gly Val Leu Val Gly Val Arg Asn Ile Ala Gln His Pro Gly
            225                 230                 235
 TA GTC GTA GGA CTT GAG CAT TAC CTA GGC CTG TAAAGGCTCA TTTCAGCAGC    1493
Leu Val Val Gly Leu Glu His Tyr Leu Gly Leu
        240                 245
GGGTGGAATT TTTTAAAAGG AGCGTTTAAA GGCTGTGGCC GAACAAGTTA AATTGAGCGT    1553
GGAGTTGATA GCGTGCAGTT CTTTTACTCC ACCCGCTGAT GTTGAGTGGT CAACTGATGT    1613
TGAGGGCGCG GAAGCACTCG TCGAGTTTGC GGGTCGTGCC TGCTACGAAA CTTTTGATAA    1673
GCCGAACCCT CGAACTGCTT CCAATGCTGC GTATCTGCGC CACATCATGG AAGTGGGGCA    1733
GACTGCTTTG CTTGAGCATG CCAATGCCAC GATGTATATC CGAGGCATTT CTCGGTCCGC    1793
GACCCATGAA TTGGTCCGAC ACCGCCATTT TTCCTTCTCT CAACTGTCTC AGCGTTTCGT    1853
GCACAGCGGA GAATCGGAAG TAGTGGTGCC CACTCTCATC GATGAAGATC CGCAGTTGCG    1913
TGAACTTTTC ATGCACGCCA TGGATGAGTC TCGGTTCGCT TTCAATGAGC TGCTTAATGC    1973
(25)SEQ ID NO:25的资料:
    (i)序列特征:
        (A)长度:45个碱基
        (B)类型:核酸
        (C)链型:单链
        (D)拓扑结构:线性
    (ii)分子类型:其他..合成DNA
    (iv)反义:无
    (xi)序列描述:SEQ ID NO:25:
CCGGACAGCT CACCCACAAA ATCAATGCAC TCTAAAAAGG TACCT           45
(26)SEQ ID NO:26的资料:
    (i)序列特征:
        (A)长度:45个碱基
        (B)类型:核酸
        (C)链型:单链
        (D)拓扑结构:线性
    (ii)分子类型:其他..合成DNA
    (iv)反义:有
    (xi)序列描述:SEQ ID NO:26:
CTAGAGGTAC CTTTTTAGAG TGCATTGATT TTGTGGGTGA GCTGT     45
(27)SEQ ID NO:27的资料:
    (i)序列特征:
        (A)长度:34个碱基
        (B)类型:核酸
        (C)链型:单链
        (D)拓扑结构:线性
    (ii)分子类型:其他..合成DNA
    (iv)反义:无
    (xi)序列描述:SEQ ID NO:27:
CTAGCTCGAG ATATCAGATC TACTAGTCGA CCGC                    34
(28)SEQ ID NO:28的资料:
    (i)序列特征:
        (A)长度:28个碱基
    (B)类型:核酸
    (C)链型:单链
    (D)拓扑结构:线性
(ii)分子类型:其他..合成DNA
(iv)反义:有
(xi)序列描述:SEQ ID NO:28:
GGTCGACTAG TAGATCTGAT ATCTCGAG                 28
附图说明:
图1表示各种人工转座子的结构。Kmr表示新霉素磷酸转移酶基因(卡那霉素抗性基因),Tnp表示转座酶基因。黑色部分表示反向重复序列。
图2说明分别含有人工转座子的质粒pHTN7141和pHTN7142的构建。
图3说明含人工转座子的质粒pHTN7143的构建。
图4说明含人工转座子的质粒pHTN7144构建。
图5说明质粒pHTN714K1和pHTN714K2构建。
图6说明含人工转座子的质粒pHTN7145构建。
图7说明含人工转座子的质粒pHTN7151构建。
图8说明含人工转座子的质粒pHTN7152构建。
图9说明含人工转座子的质粒pHTN7156-C构建。
图10说明质粒pORF1的构建。
图11说明质粒pORF3和pORF4的构建。
图12说明质粒pORF7的构建。
图13说明质粒pORF8的构建。
图14说明含转座子单元的质粒pORF41的构建。
图15说明质粒pORFCO的构建。
图16说明插入序列,人工转座子和转座子单元之间的差异。TCr指四环素抗性基因,Tnp指转座酶基因,黑框指反向重复序列(IR)。在结构图下划线的点部分表示被转座的部分。
图17说明质粒pORF40的构建。
图18说明质粒pVK7的构建。
图19说明质粒pVC7的构建。
图20说明质粒p399LYSA和质粒p299LYSA的构建。
图21说明质粒pABLm的构建。
图22说明质粒pCRDAPA的构建。
图23说明质粒p399DPS的构建。
图24说明质粒p399AK9的构建。
图25说明质粒pCRDAPB的构建。
图26说明质粒p399CAB和pCAB的构建。
图27说明质粒pCABL的构建。
图28说明质粒pHTN7150A的构建。
图29说明质粒pCBLmc的构建。
图30说明质粒pHTN7150的构建。

Claims (10)

1.扩增所需基因的方法,其包括形成人工转座子,所述人工转座子含有在反向重复序列之间插入了药物抗性基因和所需的基因的结构并且在棒状杆菌细胞内是可转座的,将所述的人工转座子导入棒状杆菌细胞,将所述转座子转座到所述棒状杆菌的染色体中,并且扩增在所述染色体中的所述基因。
2.权利要求1的方法,其中所述人工转座子含有在反向重复序列之间还插入了转座酶基因的结构。
3.权利要求1或2的方法,其中所述反向重复序列和转座酶基因来自棒状杆菌的插入序列。
4.权利要求3的方法,其中所述插入序列为序列表中Sequence No.1、5或9中任一个所代表的核苷酸序列。
5.权利要求1至4中任一项的方法,其中所述药物抗性基因是氯霉素抗性基因或四环素抗性基因。
6.权利要求1至5中任一项的方法,其中所需基因是参与氨基酸生物合成的基因。
7.权利要求6的方法,其中所需基因是天冬氨酸激酶基因和/或二氢吡啶羧酸合成酶基因。
8.用权利要求1至7中的任一方法,将所需基因导入染色体而形成的棒状杆菌。
9.生产氨基酸的方法,包括在培养基中培养用权利要求6的方法,将参与氨基酸生物合成的基因导入染色体而形成的棒状杆菌,以便在培养基中形成并积累氨基酸,然后回收所述氨基酸。
10.权利要求9的方法,其中参与氨基酸生物合成的基因是天冬氨酸激酶基因和/或二氢吡啶羧酸合成酶基因,而且所述氨基酸是赖氨酸。
CNB961117095A 1995-06-30 1996-06-29 用人工转座子扩增基因的方法 Expired - Fee Related CN1262666C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP16654195 1995-06-30
JP166541/95 1995-06-30

Publications (2)

Publication Number Publication Date
CN1163937A CN1163937A (zh) 1997-11-05
CN1262666C true CN1262666C (zh) 2006-07-05

Family

ID=15833197

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB961117095A Expired - Fee Related CN1262666C (zh) 1995-06-30 1996-06-29 用人工转座子扩增基因的方法

Country Status (6)

Country Link
US (1) US5804414A (zh)
EP (1) EP0756007A3 (zh)
CN (1) CN1262666C (zh)
BR (1) BR9602946A (zh)
CA (1) CA2180202A1 (zh)
FR (1) FR2736066B1 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ZA964665B (en) * 1995-06-07 1997-01-07 Ajinomoto Kk Method of producing l-lysine
JP4075087B2 (ja) * 1996-12-05 2008-04-16 味の素株式会社 L−リジンの製造法
SK285201B6 (sk) * 1996-12-05 2006-08-03 Ajinomoto Co., Inc. Rekombinantná DNA, autonómne reprodukovaná v bunkách koryneformnej baktérie, koryneformná baktéria a spôsob výroby L-lyzínu, vektor pVK7
US6489458B2 (en) 1997-03-11 2002-12-03 Regents Of The University Of Minnesota DNA-based transposon system for the introduction of nucleic acid into DNA of a cell
CA2221819A1 (en) 1997-03-27 1998-09-27 Thomas A. Gigliatti Insect expression vectors
DE69837041T2 (de) * 1997-07-18 2007-11-08 Ajinomoto Co., Inc. Verfahren und Mikroorganismus zur Herstellung von Purin-Nukleosiden durch Fermentation
US7160682B2 (en) 1998-11-13 2007-01-09 Regents Of The University Of Minnesota Nucleic acid transfer vector for the introduction of nucleic acid into the DNA of a cell
JP3965821B2 (ja) * 1999-03-09 2007-08-29 味の素株式会社 L−リジンの製造法
AU4711000A (en) * 1999-05-11 2000-11-21 Estuardo Aguilar-Cordova Vector-mediated delivery of integrating transposon sequences
US6599732B1 (en) 1999-06-29 2003-07-29 Archer-Daniels-Midland Company Regulation of carbon assimilation
AU4720999A (en) * 1999-06-29 2001-01-31 Archer-Daniels-Midland Company Regulation of carbon assimilation
AU781091B2 (en) 1999-07-02 2005-05-05 Ajinomoto Co., Inc. DNA encoding sucrose PTS enzyme II
WO2001048146A1 (fr) * 1999-12-24 2001-07-05 Ajinomoto Co., Inc. Procede de production d'acide l-amine et nouveau gene
US6927046B1 (en) 1999-12-30 2005-08-09 Archer-Daniels-Midland Company Increased lysine production by gene amplification using coryneform bacteria
JP4560998B2 (ja) * 2001-02-05 2010-10-13 味の素株式会社 発酵法によるl−グルタミンの製造法及びl−グルタミン生産菌
WO2003089618A2 (en) 2002-04-22 2003-10-30 Regents Of The University Of Minnesota Transposon system and methods of use
US8071310B2 (en) * 2005-11-14 2011-12-06 Keygene Nv Method for the high throughput screening of transposon tagging populations and massive parallel sequence identification of insertion sites
EP1881076A1 (en) * 2006-07-17 2008-01-23 Evonik Degussa GmbH Method for producing L-amino acids
KR100830826B1 (ko) * 2007-01-24 2008-05-19 씨제이제일제당 (주) 코리네박테리아를 이용하여 글리세롤을 포함한탄소원으로부터 발효산물을 생산하는 방법
KR101126041B1 (ko) * 2008-04-10 2012-03-19 씨제이제일제당 (주) 트랜스포존을 이용한 형질전환용 벡터, 상기 벡터로형질전환된 미생물 및 이를 이용한 l-라이신 생산방법
US8932861B2 (en) 2008-04-10 2015-01-13 Cj Cheiljedang Corporation Transformation vector comprising transposon, microorganisms transformed with the vector, and method for producing L-lysine using the microorganism
EP2479279A1 (de) 2011-01-20 2012-07-25 Evonik Degussa GmbH Verfahren zur fermentativen Herstellung schwefelhaltiger Aminosäuren
EP2628792A1 (de) 2012-02-17 2013-08-21 Evonik Industries AG Zelle mit verringerter ppGppase-Aktivität
PL2700715T3 (pl) 2012-08-20 2019-03-29 Evonik Degussa Gmbh Sposób fermentacyjnego wytwarzania L-aminokwasów z zastosowaniem ulepszonych szczepów z rodziny Enterobacteriaceae
DE102012016716A1 (de) 2012-08-22 2014-02-27 Forschungszentrum Jülich GmbH Verfahren zur Herstellung von Vektoren enthaltend ein für in seiner feedback-Inhibierung gemindertes oder ausgeschaltetes Enzym kodierendes Gen und deren Verwendung für die Herstellung von Aminosäuren und Nukleotiden
CN110494567A (zh) 2017-03-28 2019-11-22 味之素株式会社 生产rna的方法
DE102017004566A1 (de) 2017-05-11 2018-11-15 Forschungszentrum Jülich GmbH Pyruvatcarboxylase und für die Pyruvatcarboxylase kodierende DNA, Plasmid enthaltend die DNA, sowie Mikroorganismus zur Produktion und Verfahren zur Herstellung von Produkten, deren Biosynthese Oxalacetat als Vorstufe beinhaltet, Chromosom und Screeningverfahren

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2627508B1 (fr) * 1988-02-22 1990-10-05 Eurolysine Procede pour l'integration d'un gene choisi sur le chromosome d'une bacterie et bacterie obtenue par ledit procede
DK639689D0 (da) * 1989-12-18 1989-12-18 Novo Nordisk As Indfoering af dna i celler
DE3943117A1 (de) * 1989-12-27 1991-07-04 Forschungszentrum Juelich Gmbh Verfahren zur fermentativen herstellung von aminosaeure, insbesondere l-lysin, dafuer geeignete mikroorganismen und rekombinante dna
DE4006637A1 (de) * 1990-03-03 1991-09-05 Degussa Transposon, dieses transposon enthaltende testvektoren und verfahren zur mutagenese
FR2665711B1 (fr) * 1990-08-08 1993-08-13 Centre Nat Rech Scient Integron de corynebacterie, procede de transformation d'une corynebacterie par ledit integron et corynebacterie obtenue.
EP0485701A1 (en) * 1990-09-28 1992-05-20 American Cyanamid Company Insertion of DNA by modified transposons
WO1993018151A1 (fr) * 1992-03-11 1993-09-16 Ajinomoto Co., Inc. Element transposable originaire d'une bacterie du genre brevibacterium
DE4208785A1 (de) * 1992-03-19 1993-09-23 Degussa Verfahren zum auffinden von insertionselementen (is-elemente) oder transposonen
JP3449758B2 (ja) * 1993-10-15 2003-09-22 三菱化学株式会社 挿入配列
JPH07327680A (ja) * 1994-06-07 1995-12-19 Mitsubishi Chem Corp 新規プラスミド及びそれを用いる変異株の取得方法

Also Published As

Publication number Publication date
FR2736066A1 (fr) 1997-01-03
CN1163937A (zh) 1997-11-05
FR2736066B1 (fr) 1998-11-20
EP0756007A2 (en) 1997-01-29
US5804414A (en) 1998-09-08
EP0756007A3 (en) 1997-10-29
BR9602946A (pt) 1998-04-22
CA2180202A1 (en) 1996-12-31

Similar Documents

Publication Publication Date Title
CN1262666C (zh) 用人工转座子扩增基因的方法
CN1161470C (zh) 用于产生l-赖氨酸的方法
CN1273592C (zh) 用于产生l-赖氨酸的方法
CN1165619C (zh) 制备l-赖氨酸的方法
CN1154716C (zh) 发酵法制造l-异亮氨酸的方法
CN1211399C (zh) L-亮氨酸的生产方法及有关dna和微生物
CN100336901C (zh) 生产化合物ⅱ的棒状细菌
CN1170938C (zh) 构建产生氨基酸的细菌的方法及通过发酵该经构建的产生氨基酸的细菌以制备氨基酸的方法
CN1247783C (zh) 发酵生产l-氨基酸的方法
CN1117152C (zh) 生产l-赖氨酸的方法
CN1210396C (zh) L-氨基酸生产菌以及用于生产l-氨基酸的方法
CN1908174A (zh) 生产l-赖氨酸的方法
CN1077139C (zh) L-氨基酸的制备方法
CN1539015A (zh) 用遗传修饰的谷氨酸棒杆菌生产l-赖氨酸
CN1618970A (zh) 用甲基营养菌生产l-氨基酸的方法
CN1829792A (zh) 用苹果酸酶活性减弱的埃希氏菌生产l-赖氨酸或l-苏氨酸的方法
CN1748031A (zh) 细菌和用所述细菌生产化合物的方法
CN1117861C (zh) 来自棒状杆菌属细菌的新基因及其用途
CN1530438A (zh) 使用利用甲醇的细菌生产l-赖氨酸的方法
CN1572868A (zh) 生产靶物质的方法
CN1706935A (zh) 生产l-赖氨酸的棒状菌和制备l-赖氨酸的方法
CN1231574C (zh) 生产l-赖氨酸的棒状菌和制备赖氨酸的方法
CN1550546A (zh) 通过发酵生产l—精氨酸或l—赖氨酸的方法
CN1161059A (zh) 通过发酵生产l-赖氨酸及l-谷氨酸的方法
CN1117860C (zh) 发酵生产l-赖氨酸的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060705

Termination date: 20150629

EXPY Termination of patent right or utility model