KR20140131939A - 유전자 조작된 미생물로부터 뮤콘산의 생산 - Google Patents

유전자 조작된 미생물로부터 뮤콘산의 생산 Download PDF

Info

Publication number
KR20140131939A
KR20140131939A KR1020147024229A KR20147024229A KR20140131939A KR 20140131939 A KR20140131939 A KR 20140131939A KR 1020147024229 A KR1020147024229 A KR 1020147024229A KR 20147024229 A KR20147024229 A KR 20147024229A KR 20140131939 A KR20140131939 A KR 20140131939A
Authority
KR
South Korea
Prior art keywords
gene
cis
arog
protein
pathway
Prior art date
Application number
KR1020147024229A
Other languages
English (en)
Other versions
KR102092422B1 (ko
Inventor
알. 로져스 요쿰
웨이 공
수드한슈 돌
라이언 실러스
메갈 간디
재니스 지. 페로
Original Assignee
미리안트 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 미리안트 코포레이션 filed Critical 미리안트 코포레이션
Publication of KR20140131939A publication Critical patent/KR20140131939A/ko
Application granted granted Critical
Publication of KR102092422B1 publication Critical patent/KR102092422B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0014Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4)
    • C12N9/0016Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4) with NAD or NADP as acceptor (1.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0069Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1022Transferases (2.) transferring aldehyde or ketonic groups (2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/44Polycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01025Shikimate dehydrogenase (1.1.1.25)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/010543-Deoxy-7-phosphoheptulonate synthase (2.5.1.54)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • C12Y402/011183-Dehydroshikimate dehydratase (4.2.1.118)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

본 발명은, 재생가능한 탄소원을 유용한 화합물로 전환하는 능력을 증대시키기 위해 유전적으로 조작되는 생촉매를 이용하여 재생가능한 화학적 공급 원료를 생산하는 분야에 관한 것이다. 더 구체적으로, 본 발명은 유전적으로 개질된 유기체를 사용하여 재생가능한 탄소원으로부터 뮤콘산을 생산하기 위한 공정을 제공한다.

Description

유전자 조작된 미생물로부터 뮤콘산의 생산{PRODUCTION OF MUCONIC ACID FROM GENETICALLY ENGINEERED MICROORGANISMS}
본원은 2012년 1월 30일에 출원된 미국가출원번호 제61/632,777호에 대한 우선권을 주장한다.
본원은 재생 가능한 탄소원을 유용한 화합물로 전환하는 능력을 향상시키도록 유전자 조작된 생촉매를 사용하여 재생 가능한 화학물질 공급 원료을 생산하는 분야에 속한다. 더 구체적으로, 본 발명은 유전자 조작된 생촉매를 사용하여 재생 가능한 탄소원으로부터 뮤콘산 이성질체를 생산하는 공정을 제공한다.
아디프산은 나일론 66(Nylon 66)의 제조에서 사용된 대용량의 화학물질이다. 아디프산은 석유화학물질로부터 현재 만들어지지만, 합성은 환경친화적이지 못하다(Niu 등, 2002). 대안으로, 아디프산은 화학적 수소화에 의해 뮤콘산의 세 개의 이성질체(시스, 시스; 시트, 트랜스; 트랜스, 트랜스)들 중 어느 것으로부터 만들어질 수 있다. 재생 가능한 공급원을 미생물과 함께 발효하여 뮤콘산을 생산하고, 이어서 수소화하여 아디프산을 생산하는 것이 바람직한데, 그 이유는 이러한 아디프산을 제조하는 경로는 종래의 석유화학적 경로에 비해 더 환경 친화적이기 때문이다.
뮤콘산의 미생물학적 생산(microbial productiopn)에 대한 현재 노력은 세 개의 카테고리로 그룹화할 수 있다: (1) 다양한 방향족 화합물이 공급되고, 방향족의 벤젠 고리 부분이 산화되어 고리가 열리는, 뮤콘산 생산을 위한 대한 방향족 분해 경로; (2) 뮤콘산 백본(backbone)이 다양한 C2, C3, C4, 화합물 또는 리신으로 축적되는, 뮤콘산염 축적 경로; 및 (3) 뮤콘산이 많은 유기체에서 방향족 아미노산 생합성 경로의 중간체인 3-디히드로쉬키메이트(3-dehydroshikimate)로 만들어지는, 방향족 아미노산 생합성 뮤콘산 경로.
많은 미생물들은 방향족 고리를 분해하는 경로를 사용하여 페놀, 카테콜, 및 벤조산과 같은 벤젠고리를 함유하는 방향족 화합물을 분해하여, 시스, 시스-뮤콘산, 또는 3-카복시-시스, 시스-뮤콘산과 같은 비-방향족 화합물인 최종 또는 중간체 화합물을 만들었다(Niu 등, 2002; Perez-Pantoja 등, 2008). 과거에는, 많은 그룹들이 공업적 수준의 시스, 시스-뮤콘산의 생산에서 미생물의 이런 능력을 개발하려고 시도되어왔다(Mizuno 등, 1988; Yoshikawa 등, 1990; Choi 등, 1997). 1980년대 후반에는, 미국의 Celgene Corporation 및 일본의 Mitsubishi Chemical Industries는 톨루엔 및 벤조산 각각으로부터 뮤콘산을 제조하기 위한 공정을 개발하는데에 적극적이었으며, 이는 이 분야에서 많은 등록된 미국 및 일본 특허가 증명한다.
많은 미생물들은 톨루엔, 벤조산, 벤젠 또는 카테콜을 사용하여 시스, 시스-뮤콘산을 제조하는 것으로 보고되어 왔다. 예를 들어, 탄소원으로서 카테콜과 함께, 시스, 시스-뮤콘산 생산은 catA 유전자를 발현하는 재조합 대장균 세포를 사용하여 거의 100% 몰 전환 수율이 달성될 수 있으며, 상기 catA 유전자는 생촉매로서 카테콜의 오쏘-절단을 촉매하는 슈도모나스 푸티다(Pseudomonas putida) mt-2 카테콜 1,2-디옥시게나아제(Pseutomonas putida mt-2 catechol 1,2-dioxygenase)를 인코딩한다(Kaneko 등, 2011). 이런 시스템을 사용하는 뮤콘산의 연속적 생산을 위한 생물 반응 장치가 설명됐다.
고리형 C6 탄소 화학반응을 사용하는 시스, 시스-뮤콘산의 미생물학적 생산의 접근법은 전혀 상업적 현실화를 이루지 못했지만; 미생물에서 뮤콘산 생산을 위한 분해 경로에 있어서 효소의 기능을 이해하는데에 지속적인 학구적 관심이 있어왔다.
최근에, 공개된 국제출원공개 WO2011/017560은 뮤코네이트 경로를 갖는 생촉매 및 이러한 생촉매를 사용하는 뮤콘산 생산 방법을 청구한다. 간략하게는, 이런 공개된 특허출원은 뮤콘산을 생산하기 위한 4가지 다른 경로를 개시한다. 뮤콘산 생산을 위한 제1 경로는 숙시닐-Coa 및 아세틸-Coa와 함께 시작된다. 뮤콘산 생산을 위한 제2 경로는 피루베이트 및 말로네이트 세미알데히드와 함께 개시된다. 뮤콘산 생산을 위한 제3 경로는 피루베이트 및 숙신산 세미알데히드와 함께 시작한다. 뮤콘산 생산을 위한 제4 경로는 리신과 함께 시작한다. 본원에서 제안된 뮤콘산 생산을 위한 모든 이러한 경로는 컴퓨터 모델링에 기초하고, 이러한 생촉매들이 뮤콘산에 대해 상업적으로 용인되는 생산성 및 수율을 만들어 낼 수 있는지에 대해 아직 밝혀지지 않았다.
유전자 조작된 대장균 시스템을 사용하는 시스, 시스-뮤콘산으로의 발효 경로는 과학 논문(Niu 등, 2002) 및 특허문헌(US 5,616,496; US5,487,987; WO2011/085311 A1)에서 설명되지만, 선행기술의 공정들은 상업적으로 매력적이기 위하여 역가, 수율, 및 대규모의 상업적 생산에 대한 적합성에 관하여 실질적으로 개선될 필요성이 있다. 글루코오스로부터 시스, 시스-뮤콘산을 생산하기 위해 유전자 조작되된 사카로미세스 세레비시아(Saccharomyces cerevisiae) 효모에 대한 2개의 보고서가 있지만, 공개된 역가는 단지 1.5 mg/l 및 140 mg/l였다(Weber 등, 2012; Curran 등, 2012). 이러한 역가에서, 이러한 효모 공정들 중 어느 것도 상업적 생산에 매력적이지 않다. 본 발명은 당해 분야에 잘 알려진 공개된 공정과 비교할 때 대규모의 상업적 생산성에 대한 적합성 측면에서 실질적으로 개선된 발효에 의해 시스, 시스-뮤콘산 또는 시스, 트랜스-뮤콘산을 생산하는 공정을 설명한다.
본원에 개시된 발명의 목적들 중 하나는, 광합성 식물로부터 유래될 수 있는 당 또는 다른 간단한 탄소 화합물과 같은 재생 가능한 비-방향족 탄소원으로부터 대규모의 상업적 생산에 적합한 유전자 조작된 유기체를 사용하는 미생물의 발효에 의해 시스, 시스-뮤콘산을 생산하는 것이다.
2002년에, Nie 등은 아디프산을 생산하기 위한 "벤젠 없는" 경로를 개시하는데, 상기 경로는 시스, 시스-뮤콘산을 생산하기 위한 발효 공정을 사용한 후, 시스-시스-뮤콘산을 아디프산으로 전화하기 위한 촉재적 화학 공정을 사용했다. 이 공정은 특허받았지만, 본 발명자들도 아는 바와 같이, 이 공정은 상업화되지 않았다(US 5, 487,987; US 5,616,496). 이런 공개된 공정의 발효 부분은 유전자 조작된 대장균 균주를 사용했으며, 가장 좋은 것은 WN1/pWN2.248로 이름지어졌다. 경로는 자생 방향족 아미노산 생합성 경로("쉬킴산 경로(shikimic acid pathway)", "쉬키메이트 경로(shikimate pathway)", "코리스메이트 경로(chorismate pathway)", 또는 간단히 "방향족 경로"로도 알려져 있음)의 일부를 사용하며, 그 일부는 도 1에 도시된다. 본원에서, 유기체에 공급된 탄소원, 예를 들어 글루코오스로부터 하류에 있고 코리스메이트로 직접 또는 간접적으로 안내하는 임의의 생화학적 단계는, 쉬킴산 경로의 일부, 예를 들어 Glf, Glk, Zwf, TktA, TalB 및 Pps에 의해 촉매되는 단계를 포함하는 경로로서 여겨진다. 또한, 공개된 공정은 3-디히드로쉬키메이트(방향족 경로에서의 중간체)를 중간체 프로토카테추에이트(protocatechuate) 및 카테콜을 통해 시스, 시스-뮤콘산으로 전환하는 세개의 이종 효소를 사용한다. 유전자 조작된 숙주 균주는 aroE353, serA::(aroB, aroZ), lacZ::(tktA, aroZ)의 유전형을 갖는 대장균 K-12의 유도체이며, aroB는 3-디히드로퀴네이트 합성효소(이하, AroB로 칭함)를 인코딩하고, tktA는 트랜스케토라아제(transketolase)를 인코딩하고, 및 aroZ는 3-디히드로쉬키메이트 탈수효소를 인코딩하는 폐렴간균(Klebsiella pneumoniae)으로부터의 이종 유전자이다(이하, "AroZ"로 칭함). 유전자 조작된 균주는 pBR322로부터 유도된 다중복제 플라스미드, pWN2.248을 함유하고, catA, catX, aroY, aroF (피드백 내성), serA, lacI q , 및 암피실린 내성을 발현하는 유전자 카셋(cassettes)을 함유한다. 이종 유전자 catAcatX아시네토박터 칼코아세티쿠스(Acinetobacter calcoaceticus)로부터 유래되고, 카테콜 1,2-디옥시게나아제(이하, "CatA"로 칭함)를 인코딩하고, CatA 활성을 향상시킬 수 있는 알려지지 않은 기능의 단백질("CatX")을 인코딩한다. 문헌에서, catX 유전자는 "orfl"(Neidle and Ornston, 1986)로도 불린다. 이 특허 명세서에서, 우리는 아시네토박터(Acinetobacter)로부터의 catAcatX 유전자 쌍을 "catAX"로 부를 것이다. 이종 유전자 aroY폐렴간균으로부터 유래되고, 프로토카테츄에이트 디카복실라아제(이하, "AroY"로 칭함)를 인코딩한다.
전술한 등록 특허와 관련된 더 최근의 특허 출원서가 공개되었다(WO/2011/085311 A1). 이런 출원에서, 전술한 것과 동일한 균주 WN1/pWN2.248가 시스, 시스-뮤콘산을 생산하기 위해 사용되었으며, 이는 이후에 시스, 트랜스-뮤콘산으로 이성질화된다.
그러나, 균주 WN1/pWN2.248는 대규모 상업적 생산에 적합하지 않기 때문에, 더 개선된 공정이 필요된다. 본 발명은 시스, 시스-뮤콘산의 발효적 생산을 위한 개선된 생촉매를 제공한다.
WO2011/085311 A1에서 설명된 공정은 대규에서 실시하기에 비현실적으로 만드는 몇몇 다른 특징들을 가진다. 시스, 시스-뮤콘산 의 발효적 생산에 사용된 생촉매 WN1/pWN2.248에 포함되는 aroE353 돌연변이는, 시스, 시스-뮤콘산으로의 소정의 경로 안으로 탄소의 흐름을 최대화하기 위하여 쉬키메이트 경로의 하부로의 탄소의 흐름을 차단하는 기능을 한다. 그러나, aroE 돌연변이는 "삭제(null)" 돌연변이(모든 실험 목적을 위하여 유전자를 비활성화시키는 돌연변이)이며, 이는 균주가 방향족 아미노산(페닐알라닌, 티로신, 및 트립토판) 및 쉬키메이트 경로에서 만들어지는 방향족 비타민 또는 비타민-유사 중간체들(p-히드록시 벤조산, p-아미노 벤조산, 및 2,3-디히드록시 벤조산)에 대한 영양 요구체(auxotroph)가 되도록하는 결과를 가져왔다. 방향족 아미노산은 상대적으로 바씨고, 그의 필요성은 시스, 시스-뮤콘산의 생산 비용에 큰 부담을 부가할 것이다. 따라서, 성장 배지에 첨가될 이러한 비싼 영양성분을 필요로 하지 않는 공정에 대한 필요성도 존재한다.
또한, 시스, 시스-뮤콘산의 생산을 위한 현재 사용가능한 생촉매와 연관된 다른 문제점은 필수 유전자의 일부를 발현하기 위하여 다중복제 플라스미드를 유지할 필요성과 관련된다(Niu 등, 2002). 다중복제 플라스미드는 종종 대규모의 공업적 공정에서 사용하기에 너무 불안정하다. 또한, 플라스미드 상의 유전자들 중 적어도 하나는, 유도를 위해 이소프로필티오갈락토시드(IPTG) 또는 락토오스 중 어느 하나를 필요로 하는 프로모터, Ptac로부터 발현되고, 이러한 두 개의 화학물질은 상업적으로 매력적인 공정을 가능하게 하기에는 너무 비싸다. 따라서, 생산 균주의 염색체 안으로 안정하게 통합된 발현 카셋을 갖는 더 안정한 균주에 대한 필요성이 존재하고, 프로모터에 대한 화학적 유도제에 대한 필요성을 경감시키기 위해 구성 프로모터(constitutive promoters)로부터 높은 수준의 발현을 필요로 한다.
미국특허번호 4,480,034 미국특허번호 4,535,059 미국특허번호 4,588,688 미국특허번호 4,608,338 미국특허번호 4,681,852 미국특허번호 4,753,883 미국특허번호 4,833,078 미국특허번호 4,968,612 미국특허번호 5,168,056 미국특허번호 5,272,073 미국특허번호 5,487,987 미국특허번호 5,616,496 미국특허번호 6,600,077 미국특허번호 6,180,373 미국특허번호 6,210,937 미국특허번호 6,472,169 미국특허번호 6,613,552 미국특허번호 6,962,794 미국특허번호 7,244,593 미국특허번호 7,638,312 미국특허번호 7,790,431 미국특허출원공개번호 US 2009/0191610 미국특허출원공개번호 US 2010/0314243 A1 유럽특허출원번호 86300748.0 국제출원공개번호 WO 2011/017560 국제출원공개번호 WO 2011/085311 국제출원공개번호 WO 2011/123154
Altschul, S. F., Gish, W., Miller, W., Myers, E. W., and Lipman, D. J. (1990) Basic local alignment search tool, J Mol Biol 215, 403-410. Altschul, S. F., Madden, T. L., Schaffer, A. A., Zhang, J., Zhang, Z., Miller, W., and Lipman, D. J. (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs, Nucleic Acids Res 25, 3389-3402. Barbe, V., Vallenet, D., Fonknechten, N., Kreimeyer, A., Oztas, S., Labarre, L., Cruveiller, S., Robert, C., Duprat, S., Wincker, P., Ornston, L. N., Weissenbach, J., Marliere, P., Cohen, G. N., and Medigue, C. (2004) Unique features revealed by the genome sequence of Acinetobacter sp. ADP1, a versatile and naturally transformation competent bacterium, Nucleic Acids Res 32, 5766-5779. Bird, J. A. and Cain, R. B. (1968) cis-cis-muconate, the product inducer of catechol 1,2-oxygenase in Pseudomonas aeruginosa. Biochem. J. 109, 479-481. Bongaerts, J., Kramer, M., Muller, U., Raven, L. and Wubbolts, M. (2001) Metabollic engineering for microbial producitnof aromatic acids and derived compunds. Met. Eng. 3, 289-300. Chandran, S. S., Yi, J., Draths, K. M., von Daeniken, R., Weber, W. and Frost, J. W. (2003) Phosphoenolpyruvate availability and the biosynthesis of shikimic acid. Biotechnol. Prog. 19, 808-814. Chen, R., Hatzimanikatis, V., Yap, W. M. G. J., Potma, P. W. and Bailey, J. E. (1997) Metabolic consequences of phosphotransferase (PTS) mutation in a phenylalanie-producing recombinant Escherichia coli. Biotechnol. Prog. 13, 768-775. Chen, K., Dou, J., Tang, S., Yang, Y., Wang, H., Fang, H. and Zhou, C. (2012) Deletion of the aroK gene is essential for high shikimic acid accumulation through the shikimate in E. coli. Bioresource Technol, 119, 141-147. Choi, W. J., Lee, E. Y., Cho, M. H., and Choi, C. Y. (1997) Enhanced production of cis, cis-muconate in a cell-recycle bioreactor. J. Fermentation and Bioengineering. 84, 70-76. Curran, K. A., Leavitt, J. M., Karim, A. S. and Alper, H. S. (2012) Metabolic engineering of muconic acid production in Saccharomyces cerevisiae. Metabol. Engineer. 15, 55-66. de Berardinis, V., Vallenet, D., Castelli, V., Besnard, M., Pinet, A., Cruaud, C., Samair, S., Lechaplais, C., Gyapay, G., Richez, C., Durot, M., Kreimeyer, A., Le Fevre, F., Schachter, V., Pezo, V., Doring, V., Scarpelli, C., Medigue, C., Cohen, G. N., Marliere, P., Salanoubat, M., and Weissenbach, J. (2008) A complete collection of single-gene deletion mutants of Acinetobacter baylyi ADP1, Mol Syst Biol 4, 174. Draths, K. M., Pompliano, D. L., Conley, D. L., Frost, J. W., Berry, A., Disbrow, G. L., Staversky, R. J., and Lievense, J. C. (1992) Biocatalytic Synthesis of Aromatics from D-Glucose - the Role of Transketolase, Journal of the American Chemical Society 114, 3956-3962. Draths, K. M., and Frost, J. W. (1995) Environmentally Compatible Synthesis of Catechol from D-Glucose, Journal of the American Chemical Society 117, 2395-2400. Elsemore, D. A., and Ornston, L. N. (1995) Unusual ancestry of dehydratases associated with quinate catabolism in Acinetobacter calcoaceticus, J Bacteriol 177, 5971-5978. Escalante, A., Calderon, R., Valdiva, A., de Anda, R., Hernandez, G., Ramirez, O. T., Gosset, G. and Boliver, F. (2010) Metabolic engineering for the production of shikimic acid in an evolved Escherichia coli strain lacking the phosphoenolpyrvate: carbohydrate phosphotransferase system. Microbial Cell Factories 9, 21-33. Flores, N., Xiao, J., Berry, A., Bolivar, F. and Valle, F. (1996) Pathway engineering for the production of aromatic compounds in Escherichia coli. Nature Biotechn. 14, 620-623. Fox, D. T., Hotta, K., Kim, C. Y., and Koppisch, A. T. (2008) The missing link in petrobactin biosynthesis: asbF encodes a (-)-3-dehydroshikimate dehydratase, Biochemistry 47, 12251-12253. Ger, Y., Chen, S., Chiang, H., and Shiuan, D. (1994) A Single Ser-180 Mutation Desensitizes Feedback Inhibition of the Phyenylalanine-Sensitive 3-Deoxy-D-Arabino-Hepulosonate 7-Phosphate (DAHP) Synthetase in Eschericia coli, J Biochem 116, 986-990. Grant, D. J., and Patel, J. C. (1969) The non-oxidative decarboxylation of p-hydroxybenzoic acid, gentisic acid, protocatechuic acid and gallic acid by Klebsiella aerogenes (Aerobacter aerogenes), Antonie Van Leeuwenhoek 35, 325-343. Hansen, E. H., Moller, B. L., Kock, G. R., Bunner, C. M., Kristensen, C., Jensen, O. R., Okkels, F. T., Olsen, C. E., Motawia, M. S., and Hansen, J. (2009) De novo biosynthesis of vanillin in fission yeast (Schizosaccharomyces pombe) and baker's yeast (Saccharomyces cerevisiae), Appl Environ Microbiol 75, 2765-2774. Hu, C., Jiang, P., Xu, J., Wu, Y., and Huang, W. (2003) Mutation analysis of the feedback inhibition site of phenylalanine-sensitive 3-deoxy-D-arabino-heptulosonate 7-phosphate synthase of Escherichia coli, J Basic Microbiol 43, 399-406. Iwagami, S. G., Yang, K., and Davies, J. (2000) Characterization of the protocatechuic acid catabolic gene cluster from Streptomyces sp. strain 2065, Appl Environ Microbiol 66, 1499-1508. Jantama, K., Haupt, M. J., Svoronos, S. A., Zhang, X., Moore, J. C., Shanmugam, K. T., and Ingram, L. O. (2008a) Combining metabolic engineering and metabolic evolution to develop nonrecombinant strains of Escherichia coli C that produce succinate and malate, Biotechnol Bioeng 99, 1140-1153. Jantama, K., Zhang, X., Moore, J. C., Shanmugam, K. T., Svoronos, S. A., and Ingram, L. O. (2008b) Eliminating side products and increasing succinate yields in engineered strains of Escherichia coli C, Biotechnol Bioeng 101, 881-893. Kaneko, A., Ishii, Y., and Kirimura, K. (2011) High-yield production of cis, cis-muconic acid from catechol in aqueous solution by biocatalyst. Chem. Lett. 40, 381-383. Kikuchi, Y., Tsujimoto, K., and Kurahashi, O. (1997) Mutational analysis of the feedback sites of phenylalanine-sensitive 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase of Escherichia coli, Appl Environ Microbiol 63, 761-762. Kojima, Y., Fujisawa, H., Nakazawa, A., Nakazawa, T., Kanetsuna, F., Taniuchi, H., Nozaki, M., and Hayaishi, O. (1967) Studies on pyrocatechase. I. Purification and spectral properties, J Biol Chem 242, 3270-3278. Kramer, M., Bongaerts, J., Bovenberg, R., Kremer, S., Muller, U., Orf, S., Wubbolts, M. and Raeven, L. (2003) Metabolic engineering for microbial production of shikimic acid. Metabol. Eng. 5, 277-283. Lerner, C. G., and Inouye, M. (1990) Low copy number plasmids for regulated low-level expression of cloned genes in Escherichia coli with blue/white insert screening capability, Nucleic Acids Res 18, 4631. Li, K. and Frost, J.W. (1999) Microbial synthesis of 3-dehydroshikimic acid: A comparative analysis of D-xylose, L-arabinose, and D-glucose carbon sources. Biotechnol. Prog. 15, 876-883. Lu, J. L., and Liao, J. C. (1997) Metabolic engineering and control analysis for production of aromatics: Role of transaldolase, Biotechnol Bioeng 53, 132-138. Lu, J., Tang, J., Liu, Y., Zhu, X. (2012) Combinatorial modulation of galP and glk gene expression for improves alternative glucose utilization. Appl. Microbiol. Biotechnol. 93, 2455-2462 Lutke-Eversloh, T., and Stephanopoulos, G. (2007) L-tyrosine production by deregulated strains of Escherichia coli, Appl Microbiol Biotechnol 75, 103-110. Mizuno, S., Yoshikawa, N., Seki, M., Mikawa, T., and Imada, Y. (1988) Microbial production of cis, cis- muconic acid from benzoic acid. Appl Microbiol Biotechnol. 28, 20-25. Nakazawa, A., Kojima, Y., and Taniuchi, H. (1967) Purification and properties of pyrocatechase from Pseudomonas fluorescens, Biochim Biophys Acta 147, 189-199. Neidhardt, F. C., and Curtiss, R. (1996) Escherichia coli and Salmonella : cellular and molecular biology, 2nd ed., ASM Press, Washington, D.C. Neidle, E. L., and Ornston, L. N. (1986) Cloning and expression of Acinetobacter calcoaceticus catechol 1,2-dioxygenase structural gene catA in Escherichia coli, J Bacteriol 168, 815-820. Niu, W., Draths, K. M., and Frost, J. W. (2002) Benzene-free synthesis of adipic acid, Biotechnol Prog 18, 201-211. Parker, C., Barnell, W. O., Snoep, J. L., Ingram, L. O., and Conway, T. (1995) Characterization of the Zymomonas mobilis glucose facilitator gene product (glf) in recombinant Escherichia coli: examination of transport mechanism, kinetics and the role of glucokinase in glucose transport, Mol Microbiol 15, 795-802. Parsek, M. R., Shinabarger, D. .L., Rithmel, R. K. and Chakrabarty, A. M. (1992) Roles of CatR and cis, cis-Muconate in activation of the catBC operson, which is involved in benzoate degradationin Pseudomonas putida. J. Bacteriol. 174, 7798-7806. Patnaik, R. and Liao, J. C. (1994) Engineering of Escherichia coli central metabolism for aromatic metabolite with near theoretical yiled. App. Env. Microbiol. 60, 3903-3908. Pfleger, B. F., Kim, Y., Nusca, T. D., Maltseva, N., Lee, J. Y., Rath, C. M., Scaglione, J. B., Janes, B. K., Anderson, E. C., Bergman, N. H., Hanna, P. C., Joachimiak, A., and Sherman, D. H. (2008) Structural and functional analysis of AsbF: origin of the stealth 3,4-dihydroxybenzoic acid subunit for petrobactin biosynthesis, Proc Natl Acad Sci U S A 105, 17133-17138. Perez-Pantoja, D., De la Iglesia, R., Pieper, D. H., and Gonzalez, B. (2008) Metabolic reconstruction of aromatic compounds degradation from the genome of the amazing pollutant-degrading bacterium Cupriavidus necator JMP134, FEMS Microbiol Rev 32, 736-794. Perez-Pantoja, D., Donoso, R., Agullo, L., Cordova, M., Seeger, M., Pieper, D. H., and Gonzalez, B. (2011) Genomic analysis of the potential for aromatic compounds biodegradation in Burkholderiales, Environ Microbiol. Pittard, J. and Wallace, B. J. (1966) Distribution and function of genes concerned with aromatic biosynthesis in Escherichia coli. J. Bacteriol. 91, 1494-1508. Polen, T., Spelberg, M. and Bott, M. (2012) toward bitechnological produciton of adipic acid and precursors from biorenewables, J. Biotechnol, http://dx.doi.org/10.1016/j.biotec.2012-07.008. Rutledge, B. J. (1984) Molecular characterization of the qa-4 gene of Neurospora crassa, Gene 32, 275-287. Schirmer, F., and Hillen, W. (1998) The Acinetobacter calcoaceticus NCIB8250 mop operon mRNA is differentially degraded, resulting in a higher level of the 3' CatA-encoding segment than of the 5' phenolhydroxylase-encoding portion, Mol Gen Genet 257, 330-337. Shumilin, I. A., Kretsinger, R. H., and Bauerle, R. H. (1999) Crystal structure of phenylalanine-regulated 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase from Escherichia coli, Structure 7, 865-875. Shumilin, I. A., Zhao, C., Bauerle, R., and Kretsinger, R. H. (2002) Allosteric inhibition of 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase alters the coordination of both substrates, J Mol Biol 320, 1147-1156. Shumilin, I. A., Bauerle, R., Wu, J., Woodard, R. W., and Kretsinger, R. H. (2004) Crystal structure of the reaction complex of 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase from Thermotoga maritima refines the catalytic mechanism and indicates a new mechanism of allosteric regulation, J Mol Biol 341, 455-466. Shumkova, E. S., Solyanikova, I. P., Plotnikova, E. G. and Golovleva, L. A. (2009) Phenol degrdation by Rhodococcus opacus Strain 1G. App. Biocehm. Microbiol. 45, 43-49. Sietmann, R., Uebe, R., Boer, E., Bode, R., Kunze, G., and Schauer, F. (2010) Novel metabolic routes during the oxidation of hydroxylated aromatic acids by the yeast Arxula adeninivorans, J Appl Microbiol 108, 789-799. Smith, M. R. and Ratledge, C. (1989) Quantitative biotransformation of catechol to cis, cis muconate. Biotech. Lett. 11, 105-110. Snoep, J. L., Arfman, N., Yomano, L. P., Fliege, R. K., Conway, T., and Ingram, L. O. (1994) Reconstruction of glucose uptake and phosphorylation in a glucose-negative mutant of Escherichia coli by using Zymomonas mobilis genes encoding the glucose facilitator protein and glucokinase, J Bacteriol 176, 2133-2135. Sprenger, G. A. (1995) Genetics of pentose-phosphate pathway enzymes of Escherichia coli K-12, Arch Microbiol 164, 324-330. Sprenger, G. A., Schorken, U., Sprenger, G., and Sahm, H. (1995a) Transketolase A of Escherichia coli K12. Purification and properties of the enzyme from recombinant strains, Eur J Biochem 230, 525-532. Sprenger, G. A., Schorken, U., Sprenger, G., and Sahm, H. (1995b) Transaldolase B of Escherichia coli K-12: cloning of its gene, talB, and characterization of the enzyme from recombinant strains, J Bacteriol 177, 5930-5936. Stroman, P., Reinert, W. R., and Giles, N. H. (1978) Purification and characterization of 3-dehydroshikimate dehydratase, an enzyme in the inducible quinic acid catabolic pathway of Neurospora crassa, J Biol Chem 253, 4593-4598. Tang, J., Zhu, X., Lu, J. and Liu, P. (2012) Recruiting alternative glucose utilization pathways for improving succinate production. App Microbiol Biotechnol DOI 10, 1007/s00253-012-434.1 Tateoka, T., and Yasuda, I. (1995) 3-Dehydroshikimate dehydratase in mung hean cultured cells, Plant Cell Reports 15, 212-217. Weaver, L. M., and Herrmann, K. M. (1990) Cloning of an aroF allele encoding a tyrosine-insensitive 3-deoxy-D-arabino-heptulosonate 7-phosphate synthase, J Bacteriol 172, 6581-6584. Weber, C., Bruckner, C., Weinreb, S., Lehr, C., Essl, C. and Bole, E. (2012) Biosynthesis of cis, cis-muconic acid and its aromatic precursors catechol and proteocatechuic acid, from renewable feedstocks by Saccharomyces cerevisiae, App Environ Microbiol. 78, 8421-8430. Wheeler, K. A., Lamb, H. K., and Hawkins, A. R. (1996) Control of metabolic flux through the quinate pathway in Aspergillus nidulans, Biochem J 315 ( Pt 1), 195-205. Wu, C-M., Wu, C-C., Su, C-C., Lee, S-N., Lee, Y-A. and Wu, J-Y. (2006) Microbial synthesis of cis,cis-muconic acid form benzoate by Sphingobacterium sp. Mutants. Biochem. Eng. J. 29, 35-40. Xie, N., Tang, H., Feng, J., Tao, F., Ma, C. and Xu, P. (2009) Characterization of benzoate degradationby newly isolated bacterium Pseudomonas sp. XP-M2. Biochem. Eng. J. 46, 79-82. Yi, J., Draths, K. M., Li, K. and Frost, J. W. (2003)Altered Glucose Transport and Shikimate Pathway Product Yields in E. coli. Biotechnol. Prog. 2003, 19, 1450-1459 Yoshikawa, N., Mizuno, S., Ohta, K., and Suzuki, M. (1990) Microbial production of cis, cis-muconic acid. J. Biotechnol. 14, 203-210
본 발명은 비-방향족 탄소원으로부터 시작하여 시스, 시스-뮤콘산을 생산하는 유전자 조작된 미생물을 제공한다. 유전자 조작된 미생물들은 소정의 표현형을 달성하기 위해서 필요한 특정 외인성 또는 이종 유전자를 가짐에도 불구하고, 유전자 조작된 미생물은 뮤콘산을 생산하기 위하여 어떤 외인성 플라스미드를 함유할 필요가 없다. 미생물 안으로 도입된 외인성 유전자는 염색체 DNA 안으로 안정하게 통합된다. 외인성 유전자와 이런 염색체 DNA의 통합의 결과로서, 플라스미드 운반 외인성 DNA를 유지하기 위한 항생제 또는 다른 선택적 방법의 사용에 대한 필요성은 완전히 없어졌다. 또한, 화학적 유도제를 필요로 하지 않는 강력한 프로모터는 글루코오스와 같은 탄소원으로부터 시스, 시스-뮤콘산으로의 경로를 위해 필요한 유전자를 발현시키기 위해 사용된다.
본 발명의 일 실시예에서, 방향족 아미노산 생합성의 음성 조절자의 활성은 유전적으로 조작된다. 본 발명의 일 양태에서, 음성 조절자 TyrR의 활성은 TyrR 단백질을 코딩하는 tyrR 유전자의 발현을 조절하는 것에 의해 실질적으로 감소된다. 본 발명의 또 다른 양태에서, 음성 조절자 TyrR의 활성은 미생물의 염색체 DNA로부터 tyrR 유전자를 제거하거나 비활성화하는 것에 의해 완전히 제거될 수 있다.
본 발명의 또 다른 실시예에서, 방향족 아미노산 경로에서 특정 대사산물에 의한 특정 효소의 피드백 억제는 유전자 조작을 통해 극복된다. 대부분의 야생형 대장균 균주에서, 디옥시아라비노-헵툴로소네이트 7-포스페이트(deoxyarabino-heptulosonate 7-phosphate)(DAHP) 합성효소는 aroG, aroFaroH로 명명된 세 개의 유전자들에 의해 인코딩되는 것으로 알려진 세 개의 다른 동종효소로서 존재한다. 이러한 세 개의 유전자 각각에 의해 인코딩된 단백질은 방향족 아미노산 생합성의 원인이 되는 쉬킴산 경로의 하나 이상의 대사 산물에 의해 피드백 억제된다. 본 발명의 일 양태에서, 야생형 aroG 유전자는, 미생물 세포 내에서, 방향족 아미노산 경로에서 하나 이상의 대사 산물에 의한 피드백 억제에 대해 내성을 갖는 AroG 단백질을 코딩하는 개질된 aroG 유전자에 의해 치환된다. 본 발명의 또 다른 양태에서, 야생형 aroF 유전자는, 미생물 세포 내에서, 방향족 아미노산 경로에서 하나 이상의 대사 산물에 의한 피드백 억제에 대해 내성을 갖는 AroF 단백질을 코딩하는 개질된 aroF 유전자에 의해 치환된다. 본 발명의 또 다른 양태에서, 야생형 aroH 유전자는, 미생물 세포 내에서, 방향족 아미노산 경로에서 하나 이상의 대사 산물에 의한 피드백 억제에 대해 내성을 갖는 AroH 단백질을 코딩하는 개질된 aroH 유전자에 의해 치환된다. 본 발명의 또 다른 실시예에서, 시스, 시스-뮤콘산의 상업적 생산을 위해 선택된 생촉매는 디옥시아라비노-헵툴로소네이트 7-포스페이트(DAHP) 합성효소에 대한 하나 이상의 피드백 내성 동종효소를 가질 수 있다.
본 발명의 또 다른 실시예에서, 미생물 세포 내에서 방향족 아미노산 경로를 통한 탄소의 흐름에 수반된 하나 이상의 효소의 활성은 강화된다. 본 발명의 일 양태에서, 방향족 아미노산 경로 및/또는 뮤콘산 경로의 작동에 수반된 하나 이상의 효소의 활성 강화는 유전자 조작을 통해 달성된다. 본 발명의 바람직한 실시예에서, 효소 또는 단백질 AroF, AroG, AroH, AroB, TktA, TalB, AroZ, QutC, qa-4, asbF, QuiC, AroY, Rpe, Rpi, Pps, CatA 및 CatX 또는 그의 동종체 또는 유사체를 코딩하는 하나 이상의 유전자의 발현은 강화되어, 상기 효소들의 증가된 활성을 가져온다. Rpe는 리불로오스-5-포스페이트 에피머라아제(ribulose-5-phosphate epimerase)이고, Rpi는 리불로오스-5-포스페이트 이소머라아제(ribulose-5 -phosphate isomerase)이고, Pps는 포스포에놀 피루베이트 합성효소(phosphoenol pyruvate synthetase)이다(Neidhardt 및 Curtiss, 1996). 만일 숙주 균주가 효모 예를 들어, 사카로미세스 세레비지애(Saccharomyces cerevisiae) 또는 뉴로스포라 크라싸(Neurospora crassa)와 같은 사상균류(filamentous fungus)이면, 쉬키메이트 경로에서 반응을 촉매하는 몇몇 효소들은 사카로미세스 세리비시아(S. cerevisiae)의 경우에서 ARO1 유전자에 의해 인코딩된 Aro1p로 불리는 하나의 거대 단백질 또는 폴리펩티드 안으로 혼합될 수 있다. Aro1p는 AroB, AroD, AroE, AroK (또는 AroL), 및 AroA의 기능을 겸비한다. 이리하여, 본 발명의 목적에 있어서, Aro1p 및 ARO1, 또는 그의 일부는 치환체로서 사용될 수 있거나, AroB, AroD, AroE, AroK, 및/또는 AroA에 더하여 사용될 수 있다.
본 발명의 또 다른 실시예에서, 박테리아 세포 내에서 에리트로오스-4-포스페이트를 거친 플럭스는 펜토오스 포스페이트 경로의 작동에서 효소를 과다발현하는 것에 의해 강화된다. 본 발명의 일 양태에서, talB 또는 talA 유전자에 의해 코딩된 트랜스알돌라아제 효소의 과다 생성은 조작된다. 본 발명의 또 다른 양태에서, 트랜스알돌라아제 및 트랜스케토라아제 효소 모두를 인코딩하는 유전자의 발현은 유전자 조작에 의해 강화된다. 본 발명의 또 다른 양태에서, 리불로오스-5-포스페이트 에피머라아제 및 리불로오스-5-포스페이트 이소머라아제 모두 또는 그들 중 하나를 인코딩하는 유전자의 발현은 유전자 조작에 의해 강화된다.
본 발명의 또 다른 실시예에서, 방향족 아미노산 경로의 기능화를 위해 사용될 수 있는 PEP(포스포에놀 피루베이트)는 유전자 조작을 통해 증가된다. 본 발명의 일 양태에서, PEP 풀(pool)에 대한 경쟁은 글루코오스 활용을 위한 PEP 독립 시스템과 글루코오스의 활용을 위한 PEP-의존성 포스포트랜스퍼라아제 시스템(PTS)의 제거 및/또는 보완을 통해 감소된다. 본 발명의 또 다른 실시예에서, PEP의 이용율은 pps와 같은 PEP 합성효소를 인코딩하는 유전자의 발현을 증가시키는 것에 의해 증가된다.
도 1. 대장균에서 방향족 아미노산 생합성에 대한 경로.
도 2. 대장균에서 뮤콘산의 생산에 대한 경로.
도 3. 총 뮤콘산 및 생화학적 중간체의 HPLC 분석에 사용된 기준을 보여주는 크로마토그래프.
도 4. 뮤콘산 이성질체의 HPLC 분석에 사용된 기준을 보여주는 크로마토그래프.
도 5. 플라스미드 pCP32AMP, pCP14 및 pCP54로 형질전환된 대장균 균주 MYR34에서 DHS의 생산에 대한 역가. 대장균의 MYR34 균주는 aroE 유전자가 결실되었다. 플라스미드 pCP32AMP는 DAHP 합성 효소를 코딩하는 aroG를 발현한다. 플라스미드 pCP14는 DHQ 합성 효소를 코딩하는 aroB 유전자를 발현한다. 플라스미드 pCP54는 aroBaroG 유전자 모두를 발현한다.
도 6. 플라스미드 pCP32AMP 및 pCP54로 형질전환된 대장균 균주 MYR34 및 MYR170에서 DHS의 생산에 대한 역가. 대장균의 MYR34 균주는 aroE 유전자가 결실되었다. MYR170 균주는 숙주 염색체 DNA의 ack 자리(ack locus)에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다. 플라스미드 pCP32AMP는 DAHP 합성 효소를 코딩하는 aroG 유전자를 발현한다. 플라스미드 pCP54는 aroBaroG 유전자를 모두 발현한다.
도 7. 플라스미드 pMG37로만 형질전환되거나 pMG37 및 pCP32AMP 플라스미드와 함께 형질전환된 대장균 균주 MYR34 및 MYR170에서 시스, 시스-뮤콘산의 생산에 대한 역가. 대장균의 MYR34 균주는 aroE 유전자가 결실된다. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다. 플라스미드 pCP32AMP는 DAHP 합성 효소를 코딩하는 aroG 유전자를 발현한다. 플라스미드 pMG37는 뮤콘산 경로에서 기능하는 단백질을 코딩하는 aroZ, aroY,catAX 유전자들을 발현한다.
도 8. aroG 유전자만을 발현하는 플라스미드(pCP32AMP) 또는 aroGtktA 유전자를 동시에 발현하는 플라스미드(pCP50)로 형질전환된 대장균의 MYR170 균주에서 DHS의 생산에 대한 역가. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다.
도 9. 플라스미드 pCP32AMP 및 pCP50으로 형질전환된 대장균 MYR34 및 MYR170 균주로부터 DHS 수율. DHS 수율은 소모된 글루코오스의 그램 당 생산된 DHS의 그램으로서 계산된다. 플라스미드 pCP32AMP는 pCP50이 aroGtktA를 발현하는 동안 aroG 유전자를 발현한다. 박테리아 균주 MYR34는 aroE 유전자의 결실을 가진다. 대장균의 MYR170 균주는 MYR34로부터 유래되고, 염색체 DNA 상의 ack 자리에서 통합된 추가적인 aroB 유전자를 가진다.
도 10. 플라스미드 pCP32AMP 및 pCP50으로 형질전환된 대장균 MYR170 및 MYR261 균주로부터 DHS 역가. 플라스미드 pCP32AMP는 aroG 유전자를 발현하지만, pCP50는 aroBtktA 유전자를 발현한다. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 통합된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 제2 복제의 결실을 갖는다. 대장균의 MYR261 균주는 대장균의 MYR170 균주로부터 유래된다. 대장균의 MYR261 균주는 염색체 DNA의 poxB 자리에서 통합된 그것의 네이티브 프로모터를 갖는 tktA 유전자의 제2 복제를 가진다.
도 11. 쉬킴산 생합성 경로에서 DAHP 합성효소를 코딩하는 aroG를 발현하는 플라스미드 pCP32AMP 및 뮤콘산 경로에서 작용하는 단백질을 코딩하는 aroZ, aroYcatAX 유전자를 발현하는 플라스미드 pMG37로 형질전환된 대장균 균주 MYR170, MYR261 및 MYR305에서 뮤콘산 및 아세트산 생산. MYR170 균주는 숙주 염색체 DNA의 ack 자리에서 삽입된 P15 프로모터의 제어하에서 aroE 유전자 및 aroB 유전자의 추가 복제의 결실을 갖는다. MYR261 및 MYR305는 MYR170 균주의 유도체이다. MYR261은 숙주 염색체 DNA 상의 poxB 자리에서 통합된 tktA 유전자의 추가적인 복제를 갖는 반면, MYR305는 숙주 염색체 DNA 상의 poxB 자리에서 결실을 가진다.
도 12. 대장균 MYR34에 의해 생산된 내생성 DHS의 뮤콘산으로의 전환. 대장균의 MYR34 균주는 쉬키메이트 디히드로게나아제(shikimate dehydrogenase)를 코딩하는 aroE 유전자의 결실을 가진다. 그 결과, DHS의 축적이 발생한다. MYR34 균주가 뮤콘산 경로에서 작용하는 단백질을 코딩하는 aroZ, aroYcatAX 유전자를 발현하는 플라스미드로 형질전환되는 경우에, DHS의 뮤콘산으로의 전환이 발생한다. 그러나, MYR34 균주가 임의의 외부 유전자를 갖지 않는 비어있는 플라스미드 벡터(pCL1921)로 형질전환된 경우에, DHS의 뮤콘산으로의 전환은 발생하지 않는다.
도 13. DHS를 뮤콘산 경로로 전환하는 능력에 대한 aroZ 동족체의 비교. 세개의 다른 aroZ 동족체, 이름하여, 아시네토박터 sp.(Acinetobacter sp.) ADP1으로부터의 quiC, 바실러스 튜링겐시스(Bacillus thuringiensis)로부터의 asbF, 및 뉴로스포라 그라싸(Neurospora crassa)로부터의 qa-4는 P15 및 람다 PR 프로모터로부터 각각 catAXaroY 유전자를 발현하는 저-모사 플라스미드(low-copy plasmid)에서 P26 프로모터 하에서 클로닝되었다. 이러한 세개의 다른 플라스미드 구조체는 형질전환을 통해 MYR34에서 발현되었고, 생산된 뮤콘산의 양은 측정되었다.
도 14. catAX, aroYquiC의 단일 복제는 대장균의 MYR170 균주안으로 염색체로 통합되어(△aroE, △ack::P 15 -aroB), MYR352를 가져왔다(서열번호: 41). 또한, MYR170은, MYR219 균주로 이어지는 뮤콘산 경로의 작동에 필요한 모든 유전자를 가진 저-모사 플라스미드 pMG37로 형질전환되었다. MYR352 및 MYR219 모두는 YEp24(중-모사 비어있는 벡터(medium-copy empty vector)) 또는 pCP32AMP(중-모사 aroG 발현 플라스미드) 또는 pCP50(중-모사 aroGtktA 발현 플라스미드)로 형질전환되었고, 생산된 PCA, 카테콜 및 뮤콘산의 양은 HPLC 방법을 사용하여 정량되었다.
도 15. catAX의 발현을 증가시키는 방법에 의한 MYR352에서 카테콜 축적의 제거. MYR352는 aroY만을 발현하는 플라스미드(pMG27) 또는 quiC만을 발현하는 플라스미드(pMG39) 또는 catAX, aroYquiC의 세 개의 뮤콘산 경로 유전자를 발현하는 플라스미드(pMG37) 또는 catAXaroY의 두 개의 뮤콘산 경로 유전자를 발현하는 플라스미드(pMG33)로 형질전환되었다. catAX만의 과다발현은 카테콜의 축적을 방지하기에 충분했다.
도 16. 글루코오스를 이입하기(importing) 위한 다른 시스템들을 사용하는 균주의 성장. ptsHIgalP(MYR31)의 결실은 최소 글루코오스 배지에서 성장의 결핍을 가져오지만, glfglk 유전자(MYR217)의 도입은 다시 성장을 가져온다. 대조 균주 MYR34는 △aroE일 뿐, 야생형이었다. 세 개의 방향족 아미노산 및 세 개의 방향족 비타민은 영양요구성 균주의 성장을 허용하기 위해 배지에 첨가되었다.
도 17. 대장균의 MYR34 및 MYR217 균주에서 DHS 생산. DHS의 생산을 가져오는 플라스미드로 형질전환된 경우에, 글루코오스 이입을 위해 glf-glk를 활용하는 MYR217은, 포스포트랜스퍼라아제 시스템(phosphotransferase system (PTS))을 활용하는 MYR34의 형질전환체보다 더 높은 DHS 역가를 생산했다.
도 18. 7 리터 발효기에서 대장균의 MYR428 균주에 의해 뮤콘산의 생산. △aroE △ackA::P 15 -aroB △poxB::tktA의 유전자형을 갖는 대장균의 MYR261는 플라스미드 pCP32AMP 및 pMG37로 형질전환되어 대장균의 MYR428 균주를 생성했다.
본원에서 사용된 바와 같이, 문구 "예를 들어" 또는 "~와 같은"은 하나 이상의 방법, 접근법, 해결책, 또는 대상과 근접한 것의 조성물, 및 주어진 예들이 그 예시들로 제한되지 않는다는 것을 지시하는 것이다.
용어 "이종"은 유기체에서 천연 또는 자연적으로 발견되지 않지만 유전자 조작 기술, 예를 들어 형질전환, 교미, 또는 형질도입에 의해 유기체에 도입할 수 있는 유전자 또는 단백질을 지칭한다. 이종 유전자는 염색체 안으로 통합(삽입)되거나 플라스미드 상에 함유될 수 있다. 용어 " 외인성"은 유전자 조작 기술, 예를 들어 형질전환, 교미, 형질도입, 또는 돌연변이에 의해 활성을 증가, 감소 또는 제거하기 위한 목적으로 유기체 안으로 도입하거나 유기체에서 변형되는 유전자 또는 단백질을 지칭한다. 외인성 유전자 또는 단백질은 이종일 수 있거나, 이것은 숙주 유기체의 고유한 유전자 또는 단백질일 수 있지만, 하나 이상의 방법, 예를 들어 돌연변이, 결실, 프로모터의 변화, 종결자의 변화, 중복, 또는 염색체 또는 플라스미드에서 하나 이상의 추가적인 복제의 삽입에 의해 변형될 수 있다. 따라서, 예를 들어, 만일 aroB 유전자의 제2 복제가 네이티브 부위로부터 구별되는 염색체의 부위에서 삽입되면, 제2 복제는 외인성일 것이다.
본원에서 사용된 바와 같은 용어 "미생물"은 발효 공정을 통해 시스, 시스-뮤콘산의 상업적 생산을 위해 사용될 수 있는 박테리아, 고세균(archaea), 효모, 조류(algae) 및 사상균(filamentous fungi)을 포함한다.
명명을 위해서, 유전자 또는 코딩 영역은 이태릭체의 소문자로 보통 명명했으며, 예를 들어 aroZ는 효소 또는 단백질이 유전자에 의해 인코딩되는 한 동일한 문자로 명명될 수 있지만, 첫번째 문자는 대문자이고 이태릭체로, 예를 들어 "AroZ" 또는 "Aro1p"로 명명했으며, 이는 효모에서 효소 또는 단백질을 지정하기 위해 사용된 관습의 예이다. "p"는 지정된 유전자에 의해 인코딩된 단백질에 대한 약어이다. 효소 또는 단백질은 더 구체적인 이름에 의해 지칭될 수도 있는데, 예를 들어 AroZ는 3-디히드로쉬키메이트 탈수효소로 지칭될 수도 있다. 특정 촉매적 활성을 갖는 효소의 일 예를 인코딩하는 유전자 또는 코딩 영역은 다양한 이름을 가질 수 있는데, 그 이유는 이들이 역사적으로 다른 기원을 갖거나, 유전자가 다른 종들로부터 유래되기 때문이다. 예를 들어, 바실러스 튜링겐시스(Bacillus thuringiensis) 또는 바실러스 안트라시스(Bacillus anthracis)로부터 유래된 3-디히드로쉬키메이트 탈수효소를 인코딩하는 유전자는 aroZ 대신에 asbF로 명명될 수 있으며, 아스페르질루스 니둘란스(Aspergillus nidulans)로부터 유래된 관련 유전자는 qutC로 명명될 수 있으며, 뉴로스포라 크라싸(Neurospora crassa)로부터 유래된 관련 유전자는 qa-4로 명명될 수 있으며, 그리고 아시네토박터 바일이(Acinetobacter baylyi)(아시네토박터 칼코아세티쿠스(Acinetobacter calcoaceticus)아시네토박터 sp. ADP1 (Acinetobacter Sp. ADP1)로도 알려짐)로부터 유래된 관련 유전자는 quiC로 명명될 수 있다.
"플라스미드"는 염색체보다 실질적으로 작고, 염색체 또는 미생물의 염색체로부터 분리되고, 염색체 또는 염책체들로부터 별도로 복제하는 원형 또는 선형 DNA 분자를 의미한다. "플라스미드"는 세포 당 약 1회의 복제 또는 세포 당 1회 이상의 복제가 이루어질 수 있다. 미생물 세포 내에서 플라스미드의 일반적인 보존은 항생제 선택을 요구하지만, 영양요구의 상보성도 이용될 수도 있다.
박테리아 세포의 맥락에서 본 발명에서 사용된 바와 같은, 용어 "염색체" 또는 "염색체 DNA"는 플라스미드에 비해 실질적으로 큰 원형 DNA 분자이고, 어떤 항생제 선택도 필요로하지 않는다.
"발현 카셋(expression cassette)"은 적어도 프로모터, 및 효소 또는 다른 단백질을 코딩하는 유전자 또는 영역을 함유하는 염색체 또는 플라스미드의 일부일 수 있는 DNA 서열을 의미하는 것으로, 그 결과 코딩 영역은 프로모터에 의해 발현되고, 효소 또는 단백질은 DNA 서열을 함유하는 숙주 세포에 의해 생산된다. "발현 카셋"은 유전자 조작 방법에 의해 제작되거나 적어도 부분적으로 합성될 수 있어서, 코딩 영역은 코딩 영역과 자연발생적으로 연관되지 않은 프로모터로부터 발현된다. 임의적으로, "발현 카셋"은 코딩 영역과 자연발생적으로 연관되지 않은 종결자이거나 종결자가 아닐 수 있는 전사 종결자를 함유할 수 있다. "발현 카셋"은 하나 이상의 단백질에 대한 코딩 영역을 가질 수 있으며, 이 경우에서, 이것은 오페론(operon), 또는 합성 오페론이라고 불릴 수 있다.
유전자 또는 코딩 영역의 "과다발현"은 유전자 또는 코딩 영역에 의해 인코딩된 효소 또는 단백질이 동일하거나 유사한 성장 조건 하에서 숙주 미생물의 야생형에서 발견된 수준보다 높은 수준으로 숙주 미생물에서 생성되도록 유발하는 것을 의미한다. 이는 예를 들어, 하기 방법들 중 하나 이상에 의해 달성될 수 있다: 1) 더 강력한 프로모터의 도입, 2) 번역 시작 코돈의 약 4~10 염기 상류에 위치된 DNA 서열 5'-AGGAGG와 같은 더 강력한 리보솜 결합 부위의 도입, 3) 종결자 또는 더 강력한 종결자의 도입, 4) 코딩 영역들 중 하나 이상의 부위에서 코돈들의 선택을 개선, 5) mRNA 안정성을 개선, 및 6) 염색체에 다수의 복제를 도입하거나 다중복제(multicopy) 플라스미드 상에 카셋을 위치시키는 것에 의해 유전자의 복제 횟수를 증가시키는 것. 과다발현되는 유전자로부터 생산된 효소 또는 단백질은 "과다생산"이라 부른다. "과다발현"되는 유전자 또는 "과다생산"되는 단백질은 숙주 미생물에 대해 고유한 것일 수 있거나, 이것은 다른 유기체로부터 유전자 조작 방법에 의해 숙주 미생물 안으로 이식되는 것일 수 있으며, 이 경우에, 효소 또는 단백질 및 그 효소 또는 단백질을 인코딩하는 유전자 또는 코딩 영역은 "외래(foreign)" 또는 "이종"으로 불린다. 외래 또는 이종 유전자 및 단백질은 유전자 조작되지 않은 숙주 유기체에 존재하지 않기 때문에, 과다발현 및 과다생산을 정의한다.
제1 유전자, DNA 서열 또는 단백질의 "동족체"는 상기 제1 유전자, DNA 서열 또는 단백질과 유사한 생물학적 기능을 수행하는 제2 유전자, DNA 서열 또는 단백질이고, 서열 비교를 위한 BLAST 컴퓨터 프로그램(Altschul et al, 1990; Altschul et al, 1997)에 의해 결정된 바와 같이 상기 제1 유전자 또는 단백질과 25% 이상의 서열 상동성(단백질 서열을 비교하거나 유전자 서열로부터 유래된 단백질 서열을 비교하는 경우에)을 가지고, 결실과 삽입을 가능하게 한다. 대장균 aroG 유전자의 동족체의 예는 살모넬라 타이피뮤리움(Salmonella typhimurium)로부터 유래된 aroG일 것이다.
제1 유전자, DNA 서열 또는 단백질의 "유사체"는 상기 제1 유전자, DNA 서열 또는 단백질과 유사한 생물학적 기능을 수행하는 제2 유전자, DNA 서열 또는 단백질이고, 서열 비교를 위한 BLAST 컴퓨터 프로그램(Altschul et al, 1990; Altschul et al, 1997)에 의해 결정된 바와 같이 상기 제1 유전자 또는 단백질과 25% 미만의 서열 상동성(단백질 서열을 비교하거나 유전자 서열로부터 유래된 단백질 서열을 비교하는 경우에)을 가지고, 결실과 삽입을 가능하게 한다. 폐렴간균 AroZ 단백질의 유사체의 예는 아스페르질루스 니둘란스(Aspergillus nidulans)로부터 유래된 QutC 단백질일 것이며, 그 이유는 두 개의 단백질 모두 3-디히드로쉬키메이트 탈수 반응을 촉매하는 효소이지만, 두 개의 효소 또는 그들의 개별적인 유전자들 간에 유의한 서열 상동성이 없기 때문이다. 당해 분야의 통상의 기술자는 특정 생물학적 기능을 갖는 많은 효소 및 단백질, 예를 들어 DAHP 합성 효소 또는 3-디히드로쉬키메이트 탈수효소가 많은 다른 유기체들에서 동족체 또는 유사체로서 발견될 수 있다는 것을 알 것이고, 이러한 효소 또는 단백질 군들의 멤버들은 동일한 기능을 공유할 수 있기 때문에, 그들이 구조적으로 약간 또는 실질적으로 상이할 수 있다 하더라도, 동일한 군의 다른 멤버들은 많은 경우에서 현재 유전자 조작 방법을 사용하여 동일한 생물학적 기능을 수행하도록 사용될 수 있다. 따라서, 예를 들어, AorZ 효소 및 QutC 효소는 동일한 반응, DHS 탈수 효소를 촉진하고, 이들 중 어느 것이나 적당한 전후 사정에서 시스, 시스-뮤콘산의 생산을 가져올 것이고, 어느것을 사용할지에 대한 선택은 궁극적으로 유사한 발효 조건 하에서 시스, 시스-뮤콘산의 더 높은 역가를 가져오는 것을 선택함으로써 이루어질 수 있다.
"비-방향족 탄소원" 또는 "비-방향족 화합물"은 탄소 및/또는 에너지의 공급원으로서 발명의 미생물을 먹이기 위해 사용될 수 있는 탄소-함유 화합물이며, 여기서 상기 화합물은 벤젠과 관련된 6각형 고리를 함유하지 않는다. 비-방향족 탄소원의 예는 글루코오스, 자일로오스, 락토오스, 글리세롤, 아세테이트, 아라비노오스, 갈락토오스, 만노오스, 말토오스, 또는 수크로오스를 포함한다. "방향족 화합물"은 벤젠과 관련된 6각형 고리를 하나 이상 함유하는 화합물이다. 방향족 화합물의 예는 카테콜, 또는 1,2-디히드록시 벤젠이다.
"강력한 구성 프로모터(strong constitutive promoter)"는 RNA 중합효소에 의해 전사되는 DNA 서열 또는 유전자의 (관습적으로 5'에서 3'방향으로 제시되는 경우에 유전자의 5'측으로부터) 상류에 일반적으로 놓여있고, 상기 DNA 서열 또는 유전자가 RNA 중합효소에 의한 전사에 의해 발현되도록 하되, 임의의 적절한 검정 과정에 의해 직접 또는 간접적으로 손쉽게 검출되는 수준으로 발현되도록 유발하는 DNA 서열이다. 적절한 검정 과정의 예는 1) 정량적 역 전사효소 + PCR, 2) 인코딩된 효소의 효소 검정, 3) 쿠마시 블루-염색된(Coomassie Blue-stained) 단백질 겔, 또는 4) 상기 전사의 결과로서 간접적으로 생산되는 대사물의 주목할만한 생산, 그리고 이러한 주목할만한 전사는 전사, 대사, 또는 유도 화학물질의 수준을 특이적으로 조절하는 단백질의 존재 또는 부재에 상관없이 발생하는 것을 포함한다. "강력한 구성 프로모터"가 아닌 프로모터의 예는 대장균의 P1ac 프로모터인데, 그 이유는 락토오스 또는 유도자 IPTG의 부재하에서 억제물질에 의해 억제되기 때문이다. 당해 분야에 잘 알려진 방법을 사용함으로써, "강력한 구성 프로모터"는 네이티브 프로모터(DNA 서열 또는 유전자로부터 상류에 자연발생적으로 존재하는 프로모터)를 교체할 수 있으며, 그에 의하여 플라스미드 또는 염색체 중 어느 하나에 위치될 수 있고 소정의 DNA 서열 또는 유전자의 발현 수준을 네이티브 프로모터로부터의 수준에 비해 더 높은 수준으로 제공하는 발현 카셋을 얻었다. 강력한 구성 프로모터는 종 또는 속에 대해 특이적일 수 있지만, 박테리아로부터 유래된 강력한 구성 프로모터는 종종 먼 친척의 박테리아에서 잘 기능할 수 있다. 예를 들어, 고초균(Bacillus subtilis) 또는 고초균 상에서 정상적으로 성장하는 파지으로부터의 프로모터는 대장균에서 잘 기능할 수 있다. "강력한 구성 프로모터"는 Ptac와 같은 유도성 프로모터와 실질적으로 상이하며, 이때 상기 Ptac는 시스, 시스-뮤콘산의 선행 기술 생산에서 사용되어 왔고, 기능의 소정 수준을 위해 비싼 화학물질 또는 다른 환경적 변화를 필요로한다(Niu 등, 2002). 강력한 구성 프로모터의 예는 고초균 파지 SP01 및 대장균 분해 바이러스 람다 PR (서열번호: 1, 2 및 3)로부터의 P15, P26이다.
"뮤코닉 경로" 또는 "뮤콘산 경로"는 DHS로부터 PCA로, PCA로부터 카테콜로, 카테콜로부터 시스, 시스-뮤콘산으로의 생화학적 경로를 지칭하고, "뮤코닉 경로 유전자" 또는 "뮤콘산 경로 유전자"는 뮤코닉 경로의 단계를 촉진하는 효소를 인코딩하는 유전자이거나, 상기 효소들 중 하나의 활성을 향상시키는 역할을 하는 보조 기능을 인코딩하는 유전자, 예를 들어 aroZ, aroY, catA, catX,qutC일 수 있다. DHS는 3-디히드로쉬키메이트에 대한 약어이고, PCA는 프로토카테큐산에 대한 약어이다. "뮤코닉 플라스미드"는 하나 이상의 뮤코닉 경로 유전자를 함유하는 플라스미드이다.
본 발명에서 사용된 유전자 조작기술 중 일부는 도 1에 도시된 박테리아 세포에서 존재하는 방향족 아미노산 생합성에 대한 공통 경로에 집중된다. 또한, 도 1에 도시된 바와 같은, DAHP 합성효소로부터 코리스메이트 합성효소로 방향족 아미노산 생합성을 위한 공통 경로는 "쉬킴산 경로"로 지칭된다.
방향족 아미노산, 페닐알라닌, 티로신 및 트립토판의 생산을 위한 미생물의 유전자 조작에 대해 연구한 방대한 양의 발행된 작업물들이 존재한다(US 4,681,852, US 4,753,883, US 6,180,373, 유럽특허출원 86300748.0). 접근법들은 피드백 내성 효소(AroF, AroG, PheA, TyrA), 전사의 억제의 탈조절(tyrR), 프로모터 강도를 증가시키는 것(Ptac, P1ac) 및 하나 이상의 유전자의 복제수를 증가시키는 것(tktA)의 다양한 조함들을 사용하는 것을 포함한다. 그러나, 상기 접근법들의 많은 특정 조합들은 시도되지 않았는데, 그 이유는 지나친 실험 없이는 너무 많은 조합들이 시도되어야 하기 때문이거나, 어떤 조합이 최고일지에 대한 통찰력의 결여 때문이다. 더 중요하게는, 재생가능한, 비-방향족 탄소원을 사용하는 뮤콘산의 상업적 생산을 위한 생촉매의 개발에서 유전자 조작의 임의의 이러한 조합들의 적합성은 아직 알려져 있지 않다.
방향족 아미노산 생합성 경로는 많은 미생물, 특히 대장균에 대해 잘 알려져 있다(Neidhardt 및 Curtiss, 1996). 야생형 세포에서, 경로는 피드백 억제 및 전사의 억제 모두에 의해 밀접하게 조절된다. 제1 개입단계는 디옥시-아라비노-헵툴로소네이트 7-포스페이트(DAHP) 합성효소(deoxy-arabino-heptulosonate 7-phosphate (DAHP) synthase)에 의해 촉매되며, 거기에는 aroF, aroGaroH에 의해 인코딩되는 세 개의 동종효소가 존재한다. 세 개의 동종효소인 AroF, AroG 및 AroH는 티로신, 페닐알라닌 및 트립토판에 의해 각각 방향족 아미노 생합성 경로의 생성물들을 억제하는 피드백이다. 세 개 모두의 피드백 내성 돌연변이는 잘 알려져 있다(Draths 등, 1992; Lutke-Eversloh and Stephanopoulos, 2007; Hu 등, 2003; Shumilin 등, 1999). 본 발명의 일 양태는 AroF, AroG 및 AroH 효소 단백질을 발현하기 위하여 aroF, aroGaroH 유전자의 피드백 내성 대립 유전자의 사용을 수반하는데, 상기 효소 단백질들은 방향족 아미노산 생합성 경로의 생성물들에 의한 피드백 억제에 대해 내성을 가진다. 방향족 경로에 수반된 몇몇 오페론의 전사는 tyrR 유전자에 의해 인코딩된 억제자 또는 trpR 유전자에 의해 인코딩된 억제자 중 어느 하나에 의해 조절되거나, 아니면 둘 모두에 의해 조절된다(Neidhardt 등, 1996). 특히 중요한 것은, TyrR 단백질이 하나 이상의 방향족 아미노산과 결합되는 경우에, TyrR 단백질에 의한 aroGaroF의 전사의 음성 조절이다. 본 발명의 일 양태는 숙주 박테리아 균주의 염색체로부터 이러한 유전자를 없애는 방식으로 tyrR 또는 trpR 유전자에 의한 음성 조절의 제거를 수반한다.
본 발명의 대상은, 시스, 시스-뮤콘산 생산 균주의 대량 상업적 생산을 위한 발효 파라미터 및 적합성을 증가시키기 위한, 신규한 유전적으로 조작된 요소와 유전적으로 조작된 카셋의 신규한 조합의 창작물이다. 구체적으로, 시스, 시스-뮤콘산의 생산을 위한 선행기술은 유전적 요소의 특정 조합, 예를 들어 이에 제한되지않지만, 과다생산된 피드백 내성 AroG, 과다생산된 피드백 내성 AroF, 과다발현된 tktA, 과다발현된 talA, 강력한 구성 프로모터로부터 aroZ, aroYcatAX(또는 그의 유사체 또는 동족체)를 발현하기 위한 염색체로 통합된 카셋, 및 방향족 아미노산 및 비타민에 대해 프로토트로피(prototrophy)를 부여하지만 방향족 화합물의 현저한 분비를 가져오지 않는 AroE 효소를 인코딩하는 유전자로서 정의한 누출성 aroE 대립유전자의 다양한 조합을 교시하지 않았다.
본원에 개시된 균주 구조체의 모든 특정 예들은 야생형 대장균 C 균주(ATCC 8739), 또는 대장균 K-12 균주(YMC9 또는 MM294)로부터 유래되지만, 본원에 개시된 유전적 요소는 임의의 다른 적절한 대장균 균주에 결합될 수 있고, 본원에 개시된 유전적 요소의 발현 카셋 또는 적절한 유사체 및 동족체는, 발효 공정을 통한 시스, 시스-뮤콘산의 상업적 생산에 사용될 수 있는 박테리아, 고세균, 효모, 조류 및 사상균의 다른 종들과 같은 임의의 다른 적절한 미생물에 결합될 수 있다.
대장균에서, 글루코오스로부터 방향족 아미노산 생합성 경로는 펜토오스 포스페이트 경로(PPP)의 비-산화 분지(branch)로 시작한다. 비-산화 펜토오스 포스페이트 경로에서 4개의 주요 효소는 트랜스케토라아제(transketolase), 트랜스알돌라아제(transaldolase), 리불로오스-5-포스페이트 에피머라아제(ribulose-5-phosphate epimerase) 및 리불로오스-5-포스페이트 이소머라아제(ribulose-5-phosphate isomerase)이다. 이러한 효소는 헥소오스 또는 펜토오스 당으로부터 에리트로오스 4-포스페이트(E4P)의 형성을 가져오는 반응을 촉진한다. 대장균에서 E4P의 이용율을 증가시키기 위하여, 트랜스케토라아제를 인코딩하는 tktA 유전자는 과다발현될 수 있다(Niu 등, 2002). 유사하게, 트랜스알돌라아제 유전자의 과다발현도 일부 상황에서 E4P의 이용율을 증가시키는 것으로 예상된다(Bongaerts 등, 2001). 본 발명의 또 다른 양태에서, 트랜스케토라아제 및 트랜스알돌라아제 유전자 모두의 발현은 유전자 조작을 통해 향상되어, 트랜스케토라아제 및 트랜스알돌라아제 효소의 활성에 증가를 가져온다. 본 발명의 또 다른 양태에서, PPP의 비-산화 분지를 통한 플럭스는 리불로오스-5-포스페이트 에피머라아제 및 리불로오스-5-포스페이트 이소머라아제를 과다생산하는 것에 의해 증가된다.
공통 방향족 아미노산 경로에서 제1 개입단계 및 가장 긴밀히 조절된 반응은 DAHP 합성효소(aroG, aroF,aroH에 의해 인코딩됨)에 의해 포스포에놀피루베이트(PEP) 및 E4P를 축합하여, 디옥시아라비노-헵툴로소네이트 7-포스페이트(DAHP)(deoxyarabino-heptulosonate 7-phosphate (DAHP))를 생산하는 것이다. 대장균에 의해 소비된 D-글루코오스는 일부 PPP를 통해 그리고 일부 해당 작용을 통해 방향족 생합성 안으로 이동된다. 트랜스케타로오스(tktA) 및 DAHP 합성 효소(aroG)의 동종효소가 그들의 복제수를 증가시키는 것에 의해 그들의 발현을 증가시키는 플라스미드로 형질전환하는 것을 통해 증폭되는 경우에, 방향족 경로 안으로 글루코오스의 흐름은 상당히 증가된다(Niu 등, 2002). 본 발명의 바람직한 양태에서, 외인성 aroG 및 tktA 유전자는 트랜스케토라아제 및 DAHP 합성효소 효소들의 활성을 증폭시키기 위한 목적으로 염색체 DNA 안으로 통합된다.
본 발명의 또 다른 실시예에서, 미생물 세포 내에서 PEP를 통한 플럭스는 DAHP의 합성에 대한 PEP 이용성을 증가시키는 것에 의해 개선된다. 많은 박테리아 세포 속(genera)은 포스포트랜스퍼라아제 시스템(PTS)을 사용하여 글루코오스를 세포막을 통과하여 운반하는데에 PEP를 소비하는데, 여기서 하나의 PEP 분자는 박테리아 외부막을 통과하여 운반된 글루코오스 각각의 분자에 대해 소비된다. PEP-의존성 PTS를 비-PEP 의존성(PEP 비의존성) 글루코오스 활용 기작으로 교체하거나 보완함으로써, 미생물 세포 내에서 방향족 아미노산 생합성 경로에 대해 이용가능한 PEP의 풀 크기를 증가시키는 것이 가능하다. 예를 들어, 당 활용을 위한 PTS 시스템은 GalP-기반의 당 활용 시스템 또는 Glf/Glk 단백질에 기초한 당 운반 시스템에 의해 교체되거나 보완될 수 있다(Chandran 등, 2003; Yi 등, 2003). 미생물 세포 내에서 PEP 풀을 보전하기 위하여 당 활용을 위한 PTS 시스템을 삭제하는 것 외에 본 발명의 바람직한 양태에서, GalP 기반 당 활용 시스템도 미생물 세포 내에서 ATP를 보전하기 위한 목적으로 비활성화된다. PTS 시스템 및 Gal-P 기반 당 활용 시스템(△PTS/△galP) 모두의 기능에 결함이 있는 미생물 세포에서, 당 활용은 Glf를 코딩하는 외인성 유전 또는 Glf(글루코오스 촉진 확산 단백질) 및 Glk(글루코키나아제) 단백질 모두를 인코딩하는 외인성 유전자를 도입하는 방식으로 달성될 수 있다. 본 발명에서 사용된 바와 같이, 용어 기능성 글루코오스-촉진 확산 단백질은 임의의 Glf 단백질을 말하는 것 뿐만 아니라, Glf에 대한 기능적 등가물이고 촉진 확산에 의해 당을 미생물 세포 안으로 운반하는 기능을 갖는 임의의 다른 단백질을 말한다. 본 발명의 일 양태에서, 글루코오스 촉진자 단백질 Glf를 코딩하는 유전자는 △PTS/△galP인 미생물 세포 안으로 도입되고, 미생물 세포 안으로 운반된 글루코오스는 내인성 글루코오스 키나아제에 의해 인산화된다. 본 발명의 또 다른 양태에서, Glf 및 Glk 단백질을 코딩하는 유전자는 △PTS/△galP인 미생물 세포 안으로 도임된다. 본 발명의 바람직한 양태에서, 미생물 세포 안으로 도입된 외인성 glfglk 유전자는 숙주 염색체 DNA 안으로 통합된다.
본 발명의 또 다른 실시예에서, 성장 및 에너지를 위한 탄소원이 글루코오스신생합성을 위해 필요한 경우에(예를 들어, 만일 탄소원이 아세테이트 또는 숙시네이트이면), PEP 풀은 세포 내에 이미 존재하는 카복실화 효소, 예를 들어 PEP 카복시키나아제의 활성을 증가시키는 것에 의해 증가될 수 있으며, 상기 카복실화 효소는 외인성 카복실화 효소를 도입하거나 대장균에서 pck에 의해 인코딩된다. 바람직한 실시예에서, 카복실화 효소를 코딩하는 도입된 외인성 유전자는 숙주 염색체 안으로 안정하게 통합된다. 카복실화 효소를 코딩하는 유전자는 다양한 미생물 종으로부터 유래될 수 있다. 카복실화 효소를 코딩하는 유전자는 유전자 조작을 더 거칠 수 있어서, 시스, 시스-뮤콘산 생산용 생촉매 내에서 카복실화 효소의 발현이 현저히 향상된다.
본 발명의 또 다른 실시예에서, 미생물 세포 안의 PEP 풀은, PEP를 기질로서 사용하는 PykA 및 PykF와 같은 피루베이트 키나아제 효소의 활성을 감소시키거나 없애는 것에 의해 증가된다.
DAHP로부터, 방향족 아미노산 경로는 많은 중간체를 거쳐서 코리스메이트(CHA), 세 개의 방향족 아미노산, 즉, L-티로신(L-Tyr), L-페닐알라닌(L-Phe), 및 L-트립토판(L-Trp)의 생합성을 위한 분지점으로 진행한다.
공통 방향족 아미노산 경로의 초기 단계에서, 3-디히드로퀴네이트(DHQ) 합성효소(AroB)는 DAHP로부터 인산기를 제거하여, DHQ의 형성을 가져온다. 효소 DHQ 탈수효소(AroD)는 DHQ로부터 물 분자를 제거하여, 3-디히드로쉬키메이트(DHS)의 형성을 가져오며, 이는 이후에 쉬키메이트 디히드로게나아제(AroE)에 의해 쉬키메이트(SHK)로 환원된다. 쉬키메이트 키나아제 I/II(AroK, AroL)은 쉬키메이트를 쉬키메이트 3-포스페이트(S3P)로 인산화한다. S3P을 PEP와 축합하여, 5-에놀피루보일쉬키메이트 3-포스페이트(EPSP)(5 enolpyruvoylshikimate 3-phosphate (EPSP))의 형성을 가져온다. EPSP의 형성은 EPSP 합성효소(AroA)에 의해 매개된다. EPSP로부터의 인산기는 코리스메이트 합성효소(AroC)에 의해 제거되어, 코리스메이트(CHA)의 형성을 가져온다.
도 2에서 보는 바와 같이, 방향족 아미노산 경로는 aroE 유전자의 돌연변이에 의해 3-디히드로쉬키메이트(DHS)에서 쉬키메이트(SHK)로의 전환 수준에서 차단될 수 있어서, DHS의 축적이 유발된다(Niu 등, 2002). 외인성 aroZ 유전자의 도입은 DHS를 프로토카테츄에이트(protocatechuate)(PCA)로 전환하기 위해 기능한다. PCA는 이후에 AroY 효소에 의해 매개된 탈카복실화 반응을 통해 카테콜로 전환된다. 카테콜은 catA 유전자 산물의 작용을 통해 시스-시스 뮤콘산(ccMuA)으로 궁극적으로 전환된다. ccMuA는 말레일 아세토아세테이트 이소머라아제(maleyl acetoacetate isomerase)에 의한 작용에 따라 트랜스-트랜스 뮤콘산(ttMuA)을 수득할 수 있다. DHS로부터 ccMuA 및 ttMuA로의 생합성 경로는 뮤콘산 경로로 지칭된다. DHS에서 ccMuA로의 전환을 책임지는 세 개의 다른 유전자는 다양한 미생물 종들로부터 얻어질 수 있고, 대장균과 같은 뮤콘산 생산을 위해 선택된 미생물 안으로 도입될 수 있다. 본 발명의 바람직한 실시예에서, 뮤콘산 경로에 수반된 단백질을 코딩하는 외인성 유전자는 숙주 염색체 DNA 안으로 통합된다.
방향족 아미노산 경로를 aroE 유전자의 시스,시스-뮤콘산 돌연변이의 생산으로 전용하는 것은 중요한 것이다. aroE 유전자는 완전히 비활성화되어 방향족 아미노산의 생합성에 완전한 차단을 가져오며, 이는 뮤콘산 생산에 대해 설명된 대장균의 WN1/pWN2.248 균주에서 이루어진 것과 같다(Niu 등, 2002). WN1/pWN2.248 대장균 균주 및 관련 균주의 중요한 단점은 aroE 유전자의 완전한 비활성화 때문에 이러한 균주가 전술한 페닐알라닌, 티로신 및 트립토판과 같은 방향족 아미노산, 및 방향족 비타민 또는 비타민 유사 화합물에 대해 영양 요구성이 된다는 것이다. 그 결과, 시스, 시스-뮤콘산의 생산을 위한 이런 균주의 성장 중에는 이러한 6개의 화합물(또는 쉬키메이트와 같은 공통 중간체)의 외인성 첨가를 필요로하며, 이에 의하여 이러한 균주를 사용하는 시스, 시스-뮤콘산의 상업적 생산 비용이 실질적으로 부가된다. 방향족 아미노산의 외인성 공급원에 대한 이런 의존성을 극복하기 위한 신규한 접근법은, aroE에서 누출 돌연변이를 갖는 균주를 사용하는 것이다. 누출 aroE 돌연변이는 탄소의 제한된 흐름을 쉬킴산에 제공하면서 DHS의 상당량을 축적하도록하여, 이후에 AroZ 효소의 작용에 의해 PCA로 전환을 용이하도록 한다. 따라서, aroE의 누출 돌연변이 형태의 사용은 외인성 방향족 아미노산에 대한 의존성을 없앨 것이며, 이와 동시에 탄소의 흐름을 여전히 시스, 시스-뮤콘산으로 돌린다.
DHS를 시스, 시스-뮤콘산으로 전환하기위해 필수적인 AroZ, AroY 및 CatA 단백질의 합성을 코딩하는 유전자는 많은 미생물 종으로부터 유래될 수 있다. 일 실시예에서, 이러한 외인성 유전자는 개발된 생촉매의 숙주 염색체 안으로 통합된다. 다른 실시예에서, 생촉매 내에서 이러한 외인성 유전자의 발현은 어떠한 유도물질의 필요 없이 구성 프로모터에 의해 유발된다.
효소 3-디히드로쉬키메이트 탈수효소(AroZ; EC 4.2.1.118)는 중간체 프로토카테츄에이트의 생합성을 위해 필요하다. 본원에서, "AroZ"는 3-디히드로쉬키메이트 탈수효소 반응을 촉진하는 임의의 효소를 지칭할 것이다. 선행기술에서, 이런 효소는 폐렴간균 균주 A170-40(ATCC25597)(Niu 등, 2002; Draths and Frost, 1995)의 aroZ 유전자로부터 발현된다. 그러나, AroZ의 특이적 활성은 0.1 내지 261 마이크로몰/분/mg으로 유기체들 간에 광범위하게 다르고(Wheeler 등, 1996; Fox 등, 2008; Pfleger 등, 2008), 그래서 현저한 개선은 폐렴간균, 예를 들어 아신테오박터 바일이(Acinteobacter baylyi), 에머리셀라 니둘란스(Emericella nidulans)로도 현재 알려져 있는 아스페르길루스 니둘란스(Aspergillus nidulans)(Wheeler 등, 1996) 또는 뉴로스포라 크라싸(Neurospora crassa)(Rutledge, 1984; Stroman 등, 1978), 또는 포도스포라 파우시세타(Podospora pauciseta)로도 알려져있는 포도스포라 안세리나(Podospora anserina)(Hansen 등, 2009)보다 특이적 활성이 더 높은 유기체로부터, asbF(Fox 등, 2008; Pfleger 등, 2008), qutC(Wheeler 등, 1996), qa-4(Rutledge, 1984), 및 quiC로도 알려진 aroZ 유전자를 발현시키는 것에 의해 이루어질 수 있다.
일 특정 예로서, 3-디히드로쉬키메이트 탈수효소를 인코딩하는 뉴로스포라 크라싸에서 qa-4 유전자에 대한 코딩 서열은 임의의 몇몇 잘 알려진 방법, 예를 들어 전 유전자 DNA 합성, cDNA 클로닝에 의해 얻어지거나, 게놈 DNA 클로닝 및 PCR 또는 합성 DNA 링커 합성의 조합에 의해 얻어질 수 있다. qa-4 유전자에 인트론이 존재하지 않기 때문에, 코딩 영역은 게놈 DNA로부터 PCR에 의해 얻어질 수 있다(Rutledge, 1984). qa-4 효소의 단백질 서열(서열번호: 4) 및 네이티브 유전자의 DNA 서열(서열번호: 5)는 알려져 있다.
대안으로, 발현 카셋은 아스페르길루스 니둘란스로부터 3-디히드로쉬키메이트 탈수효소에 대해 제작될 수 있다. 아스페르길루스 니둘라스에서 QitC 효소에 대한 코딩 서열은 임의의 몇몇 잘 알려진 방법, 예를 들어 전 유전자 DNA 합성, cDNA 클로닝에 의해 얻어지거나, 게놈 DNA 클로닝 및 PCR 또는 합성 DNA 링커 합성의 조합에 의해 얻어질 수 있다. QutC의 단백질 서열(서열번호: 6) 및 인트론을 함유하지 않은 네이티브 유전자의 DNA 서열은 알려져 있다(서열번호: 7; GenBank accession number M77665.1). 발현 카셋은 DNA 합성에 의해 얻어지거나, 게놈 클로닝 및 PCR의 조합에 의해 얻어질 수 있어서, QutC 효소는 대장균에서 정밀하게 생산될 수 있다. 대장균에서 강력한 구성 프로모터로부터 QutC에 대한 코딩 서열을 발현함으로써, 충분한 발현은 염색체에 통합된 유전자의 1회 또는 2회 복제로부터 얻어질 수 있으며, 선행기술(Niu 등, 2002)에서 개시되는 바와 같은 불안정성을 초래할 수 있는 다중복제 플라스미드 상에서 발현 카셋의 2회 초과의 복제를 유지할 필요성을 제거하였다. 전술한 방법은 희망하는 효소를 코딩하는 DNA 서열을 얻기 위해 일반적으로 사용될 수 있고, 이러한 코딩 서열은 이후에 대장균 또는 다른 적절한 미생물 숙주 유기체에서 기능하도록 설계된 발현 카셋을 제작하기 위해 사용될 수 있다.
AroZ의 특이적 활성은 또한 선행기술(Niu 등, 2002)로부터의 단백질 서열을 사용하는 것에 의해 개선될 수 있지만, 실시예 4에서 설명하는 바와 같은 강력한 프로모터 및/또는 리보솜 결합 부위(RBS)가 코딩 영역 앞에 장착된, 개선된 발현 카셋을 제작하는 것에 의해서도 개선될 수 있다.
폐렴간균 균주 A170-40에서 aroZ 유전자(3-디히드로쉬키메이트 탈수효소)를 인코딩하는 aroZ 유전자는 선행기술에서 설명한 바와 같이 얻어질 수 있다. 유전자의 DNA 서열 및 주변 DNA(surrounding DNA)는 당해 분야에 잘 알려진 방법에 의해 확인될 수 있다. aroZ와 같은 본 발명의 이종 유전자는 네이티브 DNA 서열을 사용하여 발현 카셋 안에 포함되거나, 의도된 숙주 유기체에 대한 코돈 최적화 서열로 합성될 수 있다. aroZ 유전자는 활성 aroZ 유전자, 예를 들어, 폐렴간균 균주 342, 아시네토박터 sp. ADP1(Acinetobacer Sp. ADP1)(아시네토박터 바일이 ADP1(Acinetobacter baylyi ADP1)), 바실러스 튜링겐시스(Bacillus thuringiensis), 에머리셀라 니둘란스(Emericella nidulans), 어위니아 아밀로보라(Erwinia amylovora), 슈도모나스 푸티다 W619(Pseudomonas putida W619), 등을 함유하는 임의의 다른 미생물로부터 설명된 바와 같이(Draths and Frost, 1995) 클로닝될 수 있다.
효소 프로토카테츄에이트 디카복실라아제(AroY; EC 4.1.1.63)는 중간체 카테콜의 생합성을 위해 필요하다. 본원에서, "AroY"는 프로토카테츄에이트 디카복실라아제 반응을 촉진하는 임의의 효소를 지칭할 것이다. 선행기술에서, 이런 효소는 다중복제 플라스미드 상에서 폐렴간균 균주 A170-40(ATCC25597)의 aroY 유전자로부터 발현된다(Niu 등, 2002). 그러나, 공정에서의 개선은 숙주 유기체의 염색체 내에 통합된 발현 카셋의 1회 또는 2회의 복제로부터 충분한 효소를 생산하는 것에 의해 얻을 수 있다. 이는 선행 기술의 폐렴간균 AroY 효소의 특이적 활성에 비해 더 높은 특이적 활성을 갖는 AroY 효소를 자연적으로 생산하는 유기체로부터 aroY 유전자를 얻는 것에 의해 달성될 수 있거나, 강력한 구성 프로모터 및/또는 실시예 4 하에서 설명되는 강력한 RBS를 사용하는 것과 같은 발현 카셋을 제작하여 폐렴간균 AroY의 발현 수준을 증가시키는 것에 의해 달성될 수 있다. 폐렴간균 균주 A170-40에서 AroY에 대한 단백질 서열은 서열번호: 8로 주어진다. 해당 유전자, aroY는 전술한 바와 같이 클로닝되거나(Draths and Frost, 1995), 단백질 서열에 기초하여, 의도된 숙주 유기체에 대한 최적화 코돈을 갖도록 합성될 수 있다.
aroY 유전자는, 예를 들어, 폐렴간균 NCTC418(ATCC15380), 폐렴간균 342, 및 아륵술라 아데니니보란스(Arxula adeninivorans)(Sietmann 등, 2010)와 같은 동족체 또는 유사체를 함유하는 임의의 다른 미생물로부터 얻어질 수 있다. 폐렴간균 342에서 aroY 유전자의 DNA 서열 및 주변 DNA는 서열번호: 9로 주어진다.
효수 카테콜 1,2-디옥시게나아제(CatA; EC 1.13.11.1)는 시스, 시스-뮤콘산 생합성의 마지막 단계에서 필요하다. 본원에서, "CatA"는 카테콜 1,2-디옥시게나아제 반응을 촉진하는 임의의 효소를 지칭할 것이다. 선행기술에서, 이런 효소는 다중복제 플라스미드 상에서 아시네토박터 칼코아세티쿠스 균주 ADP1(Acinetobacter calcoaceticus strain ADP1)의 catA 유전자로부터 발현된다(Niu 등, 2002). 공급원 균주인 아시네토박터 칼코아세티쿠스 균주 ADP1은 분명히 아시네토박터 sp. ADP1 및 아시네토박터 바일이 ADP1으로 재명명되었다(Neidle 및 Ornston, 1986; Barbe 등, 2004; de Berardinis 등, 2008). 이런 선행기술의 예에서, catA 유전자는 유도물질로서 락토오스 또는 IPTG(이소프로필티오갈락토시드) 중 어느 하나가 필요한 Ptac 프로모터로부터 발현되었다. 이러한 화합물은 상업적 발효에서 사용하기에 너무 비싸기 때문에, 값비싼 유도물질에 대한 필요를 없애고 염색체에 발현 카셋을 통합하는 것에 의해 더 안정한 균주를 제작하기 위하여 역시나 공정의 상당한 개선이 필요하다. 이는 다른 예들에서 전술한 바와 같은 강력한 구성 프로모터, 강력한 RBS, 및/또는 더 안정한 mRNA를 사용하는 catA 유전자에 대한 발현 카셋을 제작하는 것에 의해 달성될 수 있다.
아시네토박터 바일이 ADP1에서 catA 유전자의 DNA 서열 및 주변 서열은 서열번호: 10으로 주어진다. 동일한 균주에서 CatA에 대한 단백질 서열은 서열번호: 11로 주어진다. 바람직한 실시예에서, catA에 대한 발현 카셋은, catA 유전자의 발현 수준을 증가시키기 위하여 catA로부터 하류에 자연적으로 존재하는 하나 또는 두 개의 추가적인 오픈리딩프레임을 함유한다(Schirmer 및 Hillen, 1998). 많은 다른 유기체들, 예를 들어 슈도모나스 아빌라(Pseudomonas arvilla), 슈도모나스 플루오레센스(Pseudomonas fluorescens)(Nakazawa 등, 1967; Kojima 등, 1967), 스트렙토미세스 Sp. 균주 2065(Streptomyces Sp. Strain 2065)(Iwagami 등, 2000), 큐프리아비두스 네카터 335T(Cupriavidus necator 335T) 및 많은 다른 것들(Perez-Pantoja 등, 2008)은 catA 유전자에 대한 공급원일 수 있다.
시스, 시스-뮤콘산으로의 탄소의 흐름을 개선하기 위하여, 누출 aroE 돌연변이를 사용하는 것에 의해 DHS로부터 쉬키메이트(SHK)로의 탄소 흐름을 감소시키는 것 외에, 방향족 아미노산 경로로부터 분지되어 나가는 특정 다른 경로들을 차단할 필요가 있다. 일부 박테리아, 예를 들어 아시네토박터슈도모나스 속에 있는 일부 박테리아는 DHS를 갈산으로 전환하는 효소, p-히드록시벤조에이트 히드록실라아제를 인코딩하는 pobA 유전자를 함유한다. PobA 동족체 또는 유사체가 대장균에서 발견되지 않음에도 불구하고, DHS를 생산하도록 유전자 조작된 대장균의 균주는 상당량의 갈산을 분비하여서(Li 및 Frost, 1999), 이러한 효소는 대장균에 존재할 것 같다. 그 밖에도, DHS로부터 유래된 PCA는 pobA 유전자에 의해 코딩된 p-히드록시벤조에이트 히드록살라아제(PobA) 효소의 작용에 의해 갈산으로 전환될 수 있다. 따라서, 생산된 갈산은 이후에 피로갈롤(pyrogallol)로 전환될 수 있다. 개선된 시스, 시스-뮤콘산을 위해 선택된 생촉매에서 갈산 및 피로갈롤로의 탄소 흐름을 차단하기 위한 한 방법은 유전자 조작을 통해 p-히드로벤조에이트 히드록살라아지(PobA) 단백질의 활성을 차단하거나 약화시키는 것이다. 유사하게, DHS에 대한 전구체인 DHQ는 aroE에 의해 코딩된 쉬키메이트 디히드로게나아제에 의해 작동되어서, 퀸산이 생산될 수 있다. 본 발명의 실시예에서, 누출 aroE 돌연변이 효소는 추가적으로 선택되거나 DHQ를 퀸산으로 전환하는 것에 대한 무능력 또는 감소된 능력에 대해 검사된다.
시스, 시스-뮤콘산 대신에 트랜스, 트랜스-뮤콘산을 생산하는데에 몇몇 장점이 있다. 트랜스, 트랜스-뮤콘산은 테레프탈산의 생산을 위해 에틸렌과 시스, 시스 뮤콘산을 디일스-알더 반응 시키는 것이 바람직하다. 유전적으로 조작된 방향족 경로와 함께 생촉매는 시스, 시스-뮤콘산을 생산하고, 이러한 시스, 시스-뮤콘산은 화학적 전환 공정을 사용하여 세포 외부에서 트랜스, 트랜스-뮤콘산으로 전환될 수 있다. 다른 한편으로는, 생촉매 안으로 말레일아세토아세테이트 이소머라아제(maleylacetoacetate isomerase) 또는 유사한 이소머라아제 효소를 도입함으로써, 박테리아 생촉매 내에서 시스, 시스-뮤콘산을 트랜스, 트랜스-뮤콘산으로 전환하는 것도 가능하다.
본 출원의 명세서는 뮤콘산의 효율적 생산을 위한 미생물 균주의 제작에 관하여 본 발명의 다양한 양태를 제공한다. 통상의 기술자는 본 발명의 다양한 양태를 편집하여 뮤콘산의 생산 효율이 매우 높은 생촉매를 제작할 수 있을 것이다.
실험 부분
총설
균주 및 접종물 제조: 본 발명에서 사용된 박테리아 균주 및 플라스미드의 리스트는 표 1에 제공된다. 본원에 개시된 균주 구조체체의 모든 특정 예들은 야생형 대장균 C 균주(ATCC8739), 또는 대장균 K-12 균주(YMC9 또는 MM294)로부터 유래되지만, 본원에 개시된 유전적 요소는 임의의 다른 적절한 대장균 균주에 결합될 수 있고, 본원에 개시된 유전적 요소의 발현 카셋 또는 적절한 유사체 및 동족체는 임의의 다른 적합한 미생물, 예를 들어 박테리아, 고세균, 효모, 조류 및 사상균의 다른 종들에 결합될 수 있고, 상기 미생물들은 발효 공정을 통해 시스, 시스-뮤콘산의 상업적 생산에 사용될 수 있다.
대장균 C는 AM1 미네랄 배지 중에 10% 글루코오스를 발효할 수 있다. AM1 배지는 2.63 g/L (NH4)2HP04, 0.87 g/L NH4H2P04, 1.5 mM MgS04, 1.0 mM 베타인, 및 1.5 ml/L 미량원소를 함유한다. 미량원소는 1000X 스톡(stock)으로서 제조되고 하기 성분들을 함유한다: 1.6 g/L FeCl3, 0.2 g/L CoCl2·6H20, 0.1 g/L CuCl2, 0.2 g/L ZnCl2·4H20, 0.2 g/L NaMo04, 0.05 g/L H3B03, 및 0.33 g/L MnCl2·4H20. 발효 브로스(broth)의 pH는 1.0 - 10.0 M KOH 또는 1.0 - 9.0 M 수산화암모늄을 사용하여 7.0으로 유지된다.
발효: 유전적으로 조작되고 -80℃ 냉동고에 저장된 대장균 균주의 40% 글리세롤 스톡으로부터 신선한 NBS-2% 글루코오스(Jantama 등, 2008a) 플레이트 상에 선조접종하여 발효를 시작했다. 플라스미드가 존재한다면, 한천 평판 및 액체 배지에 적절한 항생제(들)를 포함시키는 것에 의해 플라스미드를 유지시켰다. 암피실린(나트륨 염)를 150 mg/L로, 스펙티노마이신 HCL(spectinomycin HCL)을 100 mg/L로, 테트라시클린 HCl(tetracycline HCl) 15 mg/l로, 및 카나마이신 술페이트(kanamycin sulfate)를 50 mg/l로 사용했다. 24 내지 48시간 후에(37℃), 단일 콜로니(colony)를 셰이크 플라스크(shake flask) 내의 25 ml 동일 배지 안으로 선택해서 옮겼다. 세포들이 약 0.1의 OD600 값을 갖도록 성장할 때까지 37℃ 200 rpm에서 교반한 후, 배양균을 얼음으로 냉각하고 동일 부피의 멸균 80% 글리세롤을 첨가했다. 발효를 위한 접종물로서 사용하기 위하여, 2 ml 앨리쿼트(aliquots)를 -80℃에서 동결하였다.
세포 성장: 열전자 스펙트로닉 20 분광 광도계를 사용하여 550 nm(OD550) 또는 600 nm(OD600)에서의 광학적 밀도를 측정하여 세포량을 추산했다.
쉬킴산 경로 및 뮤콘산 경로에서의 중간체들의 분석: 시스, 시스-뮤콘산 및 시스, 트랜스-뮤콘산, 및 다른 생화학적 중간체들을 포함하는 발효 브로스에서 생산된 총 뮤콘산을, 시그마-알드리치로부터 구매한 210 nm의 모니터링 흡광도 또는 45°의 굴절률 표준규격을 사용하는 Waters Alliance 계측기를 구비하는 HPLC를 사용하여 분석했다. 컬럼은 BioRad Aminex HPX-87H이며, 이는 40분 동안 0.6 ml/분의 유속으로 이동상으로서 8 mM 황산을 사용하여 50 ℃에서 수행된다. 구입한 표준(시그마-알드리치)의 크로마토그래프는 도 3에 보여진다. HPLC를 위한 준비를 위해, 발효 샘플을 0.05 M 인산칼륨 완충액으로 pH 7.0에서 10 또는 100배 희석하였으며, 이는 시스, 시스-형태의 뮤콘산이 시스, 트랜스-형태로 이성질화되는 것을 방지하기 위함이다.
뮤콘산의 이성질체를 분리하기 위하여, 전술한 바와 같이 제조된 샘플들을 제2 HPLC 시스템에서 진행시켰다. 기구는 Agilent 1200 HPLC이었고, 컬럼은 인산을 사용하여 pH 3.0으로 조정된 30% 메탄올 중에 50 mM KH2P04을 이동상으로 30℃에서 진행하는 4.6 x 150 mm의 Agilent Eclipse XDB-C18이다. 유속은 278 nm의 흡광도를 측정하면서 4분 동안 1 ml/분이었다. 물 중에 시스, 시스-뮤콘산을 용해시킨 뒤, HPLC 피크가 완전히 새로운 위치로 이동될 때까지 실온에서 약 2시간 동안 자발적 산 촉매 이성질화를 겪도록 하는 것에 의해 시스, 트랜스-뮤콘산 표준을 만들었다. 다른 표준들은 시그마-알드리치로부터 구입했다. 표준들이 보여주는 크로마토그래프는 도 4에 보여진다.
발효 공정에 대한 뮤콘산 생산 배지의 조성물: 발효 배지 각각의 리터는 50 ml/L의 1M KH2PO4, 10 ml의 200g/L 시트르산 + 25 g/L 구연산철, 1.2 ml의 98% 황산, 및 소포제 204(Antifoam 204) 한 방울을 함유한다. 추가적인 하기 다른 성분들의 첨가를 위한 공간을 허용하기에 충분한 물과 상기 성분들을 혼합했다. 오토클레이브 후에, 하기 성분들을 첨가했다: 10, 20, 30 또는 40 ml의 50% 글로코오스(최종 농도: 5, 10, 15, 또는 20 g/l), 2 ml의 1M MgS04, 1 ml의 0.1M CaC12, 10 ml의 1000X 미량원소(Jantama 등, 2008a), 1, 2, 4, 또는 8 ml의 50 g/L 페닐알라닌 + 50 g/L 티로신 + 50 g/L 트립토판 (최종 농도: 0.5, 0.1, 0.2, 또는 0.4 g/l), 10 ml의 1 g/L p-히드록시벤조산 + 1 g/l p-아미노벤조산 + 1 g/L 2,3-디히드록시벤조산, 및, 필요에 따라, 1 ml의 150 mg/ml 암피실린(나트륨 염) 및/또는 1 ml의 100 mg/ml 스펙티노마이신 HCl.
페드배치 발효를 위하여, 공급병은 600 g/L of 무수 글루코오스 및 32 ml/L의 50 g/L 페닐알라닌 + 50 g/L 티로신 + 50 g/L 트립토판을 함유했다. 9M NH4OH를 염기로 사용하여 발효 배지의 pH를 유지했다.
셰이크 플라스크에 대하여, NBS 염(Jantama 등, 2008a) + 0.2 M MOPS 완충액, pH 7.4은 전술한 사전-오토클레이브 혼합을 대신하였지만, 글루코오스 및 다른 첨가물은 동일했다.
DCU 제어장치 또는 Biocommand Software에 의해 제어된 pH, DO, 온도, 글루코오스 및 공급율을 이용한 7L New Brunswick 과학적 발효기에서 페드-배치 발효를 수행했다. 온도를 37℃로 유지했고, 9N 암모늄수를 이용하여 pH를 7.0으로 유지했고, 임펠러 속도를 750 rpm으로부터 1200 rpm으로 증가시키면서 용존 산소(DO)를 30% 공기 포화로 유지했다. 소정의 배지에서 초기 글루코오스 농도는 약 5 내지 25 g/L였다. 글루코오스 농도가 5 g/L 미만으로 떨어지는 경우에 글루코오스 용액을 발효기에 첨가했고, 용존산소량에 의해 글루코오스의 공급율을 조절했다. 총 발효시간은 48시간이었고, 최종 역가는 16 g/L의 뮤콘산이었다.
뮤콘산 경로 유전자를 발현하는 플라스미드의 제작: DHS를 뮤콘산으로 전환하기위해 필요한 세 개의 이종 유전자들을 개별적으로 클로닝하거나 저-모사 플라스미드, pCL1921와 함께 클로닝하였다(Lerner 및 Inouye, 1990). pCL1921의 DNA 서열은 표 3에서 서열번호: 20으로 주어진다. 간략하게, catAX, aroYaroZ 유사체 또는 동족체의 코딩서열을 대장균에서의 발현을 위해 코돈-최적화하였고 상업적으로 합성하였다(Gene Art, Invitrogen). 이후, 각각의 유전자에 대한 독특한 리보솜-결합 부위를 보유하는 정방향 프라이머 및 독특한 종결자 서열을 보유하는 역방향 프라이머를 사용하여, 이러한 서열들을 PCR 증폭했다. 결과로 얻은 PCR 단편을 제한 효소로 절단시켰고, 표준 분자 클로닝 과정에 의해 독특한 구성 프로모터 서열의 하류를 클로닝했다. 전술한 공급원 DNA(source DNA)로부터 프로모터 서열을 PCR 증폭하여 클로닝한 후(미국특허출원 20090191610; 미국특허 7244593), 제한효소 절단 및 표준 분자 클로닝을 이어갔다. 프로모터-RBS-코딩서열-종결자서열 모두는 발현 카셋을 구성했다. 다음으로, 개별적인 발현 카셋을 혼합하여 하나, 둘 또는 모든 세개의 뮤콘산 경로 유전자를 발현하는 플라스미드를 생성했다.
실시예 1
aroGaroF의 발현의 증가
대장균의 tyrR 유전자는 많은 잘 알려진 방법들, 예를 들어 화학적 또는 방사선 돌연변이유발(예를 들어 PCR 및 DNA 서열화에 의함) 또는 유사 내성(analog resistance)에 대한 선택(예를 들어, 4-플루오로티로신에 대한 내성), 트랜스포슨 돌연변이유발(transposon mutagenesis), 박테리아파지 Mu 돌연변이유발(bacteriophage Mu mutagenesis), 또는 형질전환 중 어느 하나에 의해 돌연변이될 수 있다. 바람직한 실시예에서, tyrR 유전자의 돌연변이는 삭제 돌연변이(검출가능한 활성을 남기지 않은 돌연변이)이고, 더 바람직한 실시예에서는, tyrR 유전자의 적어도 일부는 결실된다. 이는, 예를 들어 선형 DNA 분자를 사용하는 2단계의 형질전환 방법을 사용하여 달성될 수 있다(Jantama 등, 2008a; Jantama 등, 2008b). 제1 단계에서, cam R , sacB 카셋은, 이중 재조합 및 클로람페니콜 내성에 대하여 선택하여 tyrR 자리에 통합되어 tyrR 오픈리딩프레임의 대부분 또는 전부를 교체한다. 제2 단계에서, tyrR 유전자가 결실된 유형을 포함하는 선형 DNA는 이중 재조합 및 LB와 같은 풍부한 배지에서 5% 수크로오스에 대한 내성에 대해 선택하는 것에 의해 통합된다. 정확한 결실은 식별되고 진단 중합효소연쇄반응(PCR)에 의해 확인된다. tyrR 결실의 목적은 aroGaroF의 발현을 증가시키기 위함이다. 유사한 결과를 달성하는 다른 접근법은 aroG 및/또는 aroF 앞의 네이티브 프로모터를 강력한 구성 프로모터로 치환하고, 필요하다면, 전사 종결자를 첨가하는 것이다. 이것이 일반적으로 어떻게 달성되는지에 대한 구체적인 내용은 하기 실시예 4에서 주어진다.
TyrR 단백질에 의해 AroG 및 AroF 활성의 억제를 극복하기 위한 전술한 두 개의 접근법 중 후자가 바람직한데, 그 이유는 tyrR 결실이 aroLM과 같은 유전자의 원치않는 과다발현을 유발할 수 있기 때문이다(Neidhardt 및 Curtiss, 1996). 이것이 일반적으로 어떻게 달성되는지에 대한 구체적인 내용은 하기 실시예 4에서 주어진다.
실시예 2
피드백 내성 AroG 및 AroF
피드백 내성 AroG 효소(3-디옥시-D-아라비노헵툴로소네이트-7포스페이트 합성효소 또는 DAHPS)를 초래하는 aroG 유전자에서의 돌연변이는 당해 분야에 잘 알려져 있다(Shumilin 등, 1999; Kikuchi 등, 1997; Shumilin 등, 2002). 또한, 잘 알려진 것은 이러한 돌연변이를 만들고, 식별하고 특징화하는 방법이다(Ger 등, 1994, Hu 등, 2003). 바람직한 돌연변이는 페닐알라닌에 의한 억제에 대한 완전한 내성을 초래하는 것이다. 임의의 알려진 피드백 내성 돌연변이들은 수 많은 잘 알려진 방법에 의해 염색체에 함유된 aroG 유전자 안으로 도입되거나 플라스미드 상에 도입될 수 있으며, 이러한 방법들 중 하나는 원하는 돌연변이가 PCR 프라이밍 올리고뉴클레오티드(priming oligonucleotide)의 일부로서 합성되는 돌연변이유발 PCR(mutagenic PCR)이다(Hu 등, 2003). 돌연변이의 올바른 도입은 DNA 서열화에 의해 확인된다. 대장균 C에서 야생형 aroG 유전자의 서열은 서열번호: 18로 주어진다. 바람직한 돌연변이는 AroG의 150번째 아미노산을 프롤린으로부터 류신으로, 예를 들어 150번 코돈을 CCA에서 CTA로 변화시키는 점 돌연변이이다(Hu 등, 2003). 더 바람직한 실시예에서, 150번 코돈은, CCA에서 대장균에서 바람직한 코돈인 CTG로 변화된다. aroG의 이런 특정 대립유전자가 바람직한데, 그 이유는 인코딩된 DAHP 합성효소가 페닐알라닌에 의한 억제에 대해 최대 3 mM 까지 완전히 내성을 갖기 때문이고, 이것은 야생형 효소와 유사한 특이적 활성을 가진다(Hu 등, 2003).
추가적인 피드백 내성 aroG 대립유전자는 돌연변이유발 및 하나 이상의 페닐알라닌 유사체, 예를 들어 베타-2-티에닐알라닌, p-플루오로페닐알라닌, p-클로로페닐알라닌, o-플루오로페닐알라닌, 및 o-클로로페닐알라닌에 대한 내성에 대해 선택한 후, 내성을 유발하는 돌연변이가 aroG 유전자에 연결되는 것을 확인하는 것에 의해 얻어질 수 있다(Ger 등, 1994; 미국특허 4,681,852). aroG에 대한 연결은 DNA 서열화 또는 페닐알라닌의 존재/부재 하에서 효소 검정에 의해 직접적으로 확인되거나(Ger 등, 1994), 파지 매개 형질 도입 및 aroG 자리에서 또는 근방에서 선택되거나 반대하여 선택될 수 있는 유전자 표지에 대한 선택에 의해 간접적으로 확인될 수 있다(미국특허 4,681,852). 이러한 유전자 표지는 aroG 유전자 그 자체의 결실 또는 점 돌연변이일 수 있거나, 대장균의 경우에서는 nadA와 같은 임의의 적당하게 근접하게 연결된 유전자에서의 돌연변이일 수 있다. 대장균에서의 예로서, 돌연변이유발 및 페닐알라닌 유사체 내성에 대해 선택한 후에, 개별적인 돌연변이들 또는 돌연변이들의 풀은 나이브(naive) 수용주 안으로의 P1 매개 형질도입을 위한 도너(donors)로서 사용될 수 있으며, 상기 수용주는 모든 세개의 DAHP 합성효소 유전자, aroG, aroF, 및 aroH가 결실되고, 적절한 최소 배지 상에서 성장을 위해 선택된다. 형질 도입주는 소정의 유전자(들)의 돌연변이로서 가득찰 것이다. 대안으로, 돌연변이유발 및 유사 내성에 대해 선택한 후에, 개별적인 돌연변이들 또는 돌연변이들의 풀은 나이브 수용주 균주 안으로의 P1 매개 형질도입을 위한 도너로서 사용될 수 있으며, 상기 균주는 nadA 유전자에서 삭제 돌연변이를 함유하고, 다시 니코틴아미드가 결여된 적절한 최소 배지 상에서의 성장을 위해 선택된다. 또 다른 접근법은 nadA 유전자에서와 같은 aroG 유전자 근처에서 Tn10과 같은 트랜스포손 삽입을 함유하는 배경 균주에서 내성 돌연변이를 선택하는 것이다. 유사 내성 돌연변이로부터 상기 트랜스포손을 함유하지 않는 배경 균주 안으로 P1 형질도입하고, 테트라시클린 또는 다른 적절한 항생제 내성에 대하여 선택하는 것은 소정의 aroG 돌연변이에 대하여 풍부해질 것이다. 모든 이런 접근법에서, 피드백 내성은 유전자의 효소 검정 및 DNA 서열화에 의해 궁극적으로 확인된다. 우리는 피드백 억제에 대한 내성을 갖는 aroG의 대립유전자를 aroG*로 지칭할 것이다.
균주 WM191(△tyrR, △aroF)는 YMC9(ATCC 33927)로부터 유래되었다. 2단계의 유전자 치환 방법(Jantama 등, 2008a)이 tyrRaroF 모두의 완벽한 결실을 위해 사용되었으며, 이를 통해 균주 WM191을 얻었다. 다음으로, nadA::Tn10 대립유전자는 CAG12147(CGSC 7351, Coli Genetic Stock Center, Yale University)로부터의 균주 WM189(△tyrR, △aroF, nadAr::TnlO)로 형질 도입되었다. 선택은 LB + 테트라시클린 HCl(15 mg/l) 상에서 이루어졌다. 균주 RY890(△tyrR::kan, aroF363)은 MM294(ATCC 33625)로부터 P1 형질도입에 의해 3단계로서 유래되었다. 도너 균주는 순서대로 JW1316-1 (CGSC 9179, Coli Genetic Stock Center, Yale University), NK6024 (CGSC 6178, Coli Genetic Stock Center, Yale University), 및 AB3257 (CGSC 3257, Coli Genetic Stock Center, Yale University)이고, 세 개의 선택은 순서대로 LB + 카나마이신 술페이트(50 mg/l), LB + 테트라시클린 히드로클로라이드(15 mg/l), 및 티아민 HCl(5 mg/l)와 함께 NBS 최소 글루코오스(Jantama 등, 2008a)였다.
약 20%의 생존률로 UV 광을 이용하여 WM189를 돌연변이화시켰고, o-플루오로페닐알라닌(1 mM), 티아민(5 mg/l) 및 니코티아미드(1 mM)를 함유하는 NBS 최소 글루코오스 배지(Jantama 등, 2008a) 상에 플레이팅했다. 플레이트들 각각으로부터의 콜로니들을 개별적인 풀들로 수집하였고, P1vir 용균을 각각의 풀 상에서 만들었다. LB 배지 상에서 테트라시클린 내성(15 mg/l)에 WM191 형질도입하는데에 이러한 용균들을 사용했고, o-플루오로페닐알라닌(1 mM), 티아민(5 mg/l) 및 니코티아미드(1 mM)를 함유하는 NBS 최소 글루코오스 배지에서 수득한 콜로니들을 복제 플레이팅했다(replica plated). 테트라시클린 및 유사체 모두에 대해 생존한 콜로니 복제를 aroG 내에 피드백 내성 돌연변이를 함유하는 것으로 추정했다. DNA 서열화를 위하여, 5개의 독립 풀들로부터 8개의 개별적인 콜로니들을 선택했다. 중합효소연쇄반응 및 서열화에 의해 aroG 코딩 영역을 증폭했다. 결과는 표 4에 보여지며, 이러한 결과는 8개의 균주 각각이 그들의 aroG 유전자에 점 돌연변이를 함유하고 있다는 것을 보여준다. 대립유전자들 중 일부는 공개된 대립유전자들과 동일하지만, 일부는 신규하다.
전술한 복제 플레이팅에 의해 RY890(aroG 야생형 대립유전자를 가짐)을 테트라시클린 내성 및 o-플루오로페닐알라닌(0.3 mM)에 대한 내성으로 형질도입하기 위해, 전술한 풀들 중 하나로부터의 P1vir 용균을 사용했다. 4개의 콜로니들, 즉 RY893, RY897, RY899, 및 RY901을 DNA 서열화를 위해 선택했고(표 4), 다시, 대립유전자들 중 두개는 공개된 대립유전자와 동일했지만, 두 개는 신규했다. 균주 RY902는 후자 4개의 균주에 대해 동질 유전자형이지만, 야생형 aroG 유전자를 함유하고, CAG12147로부터 형질도입되어 대조군으로서 제작되었다. 이러한 5개의 균주를 셰이크 플라스크 내의 25 ml NBS 최소 글루코오스(15 g/l) + 티아민 HCl(5 mg/l) 및 니코티아미드(1 mM)에서 밤새도록 성장시켰다. 이를 원심분리하고, 10 ml 물로 씻어내기 위해 재현탁시키고, 재-원심분리하고, 0.5 ml의 50 mM 인산칼륨, pH 7.0에서 재현탁시켜서 결과 세포들을 수확했다. 세 방울의 클로로포름과 함께 와류교반하여 현탁된 세포들을 용해하였고, 이어지는 변형과 함께 문헌(Hu 등, 2003)에서 설명된 방법과 유사한 방법을 사용하여 DAHP 합성 효소 활성에 대하여 조질 용균을 분석했다. 인산 완충액은 50 mM(최종 농도), pH 7.0이고, 최종 에리트로오스-4-포스페이트 농도는 2 mM이고, 최종 포스포에놀 피루베이트 농도는 5 mM이고, 배양 온도는 30℃이고, 반응은 10분에서 멈췄다. 우리는 1 밀리그램 단백질 당 1 분 당 1 nMole의 DAHP을 생산하는 활성을 1 mU로 정의한다. 피드백 내성에 대해 시험하기 위하여, 각각의 조질 용균은 최종 농도 18 mM에서 페닐알라닌과 함께 또는 페닐알라닌 없이 분석했다. 분석 결과는 표 5에 제시된다. 효소는 페닐알라닌에 대한 특이적 활성 및 내성이 변화하는 것을 보여줬지만, 시험된 모든 선택된 돌연변이 형태는 야생형 대조군에 비해 현저히 더 내성을 가졌다.
전술한 RY893, RY899, RY901, 및 RY902로부터의 aroG 대립유전자는 하기와 같이 배경 균주를 생산하는 뮤콘산 안으로 도입되었다. aroG*aroGwt 도너 균주로부터의 P1vir 용균은 MYR219(대장균 C, △aroE, △ack::P 15 -aroB, pMG37)를 테트라시클린 HCl 내성(15 mg/l)에 형질도입하여 각각 새로운 균주 RY903, RY909, RY911, 및 RY912를 얻기 위해 사용되었다. 다음으로, 이러한 균주들 각각은 JW1316-1의 P1vir 용균을 사용하여 카나마이신 술페이트 내성(50 mg/l)에 형질도하여, △tyR::kan 대립 유전자를 도입하고, 이에 의해 각각 균주 RY913, RY919, RY921, 및 RY922를 얻는다. 스펙티노마이신 선택은 뮤코닉 플라스미드를 유지하기 위하여 계속하여 유지되었다. 결과로 얻은 4개의 균주는 셰이크 플라스크 내에서 20 g/l 글루코오스의 보충물, 0.2 M MOPS 완충액, pH 7.4, 니코티아미드 (1 mM), 페닐알라닌 (100 mg/l), 티로신 (100 mg/l), 트립토판 (100 mg/l), p-히드록시벤조산 (1 mg/l), p-아미노벤조산 (1 mg/l), 2,3-디히드록시벤조산 (1 mg/l), 페놀레드 (10 mg/l), 및 황산암모늄 (1 g/l)를 함유하는 25 ml NBS 최소 배지(Jantama 등, 2008a)에서 37℃ 48시간 동안 성장시켰다. pH는 7에 근접하게 유지시켰고, 이는 pH 7.0 기준에 대항하는 페놀레드의 색을 눈으로 관찰하여 측정했으며, pH는 셰이크 플라스크에 1 ml 앨리쿼트의 1.0 M KOH의 수동적 첨가에 의해 유지되었다. 생산된 뮤콘산은 전술한 HPLC에 의해 분석되었고, 그 결과는 표 6에 제시된다. 피드백 내성 aroG* 대립유전자를 함유하는 모든 세 개의 균주들은 야생형 aroG 대립유전자를 함유하는 동질유전자의 균주에 비해 더 많은 뮤콘산을 생산했다. 본원에 개시된 별도의 실험에서, 다중복제 플라스미드 pCP32AMP 상에 aroG를 함유하는 균주 MYR205는 셰이크 플라스크에서 1.5 g/l 뮤콘산을 생산했다. 따라서, 발명자는, 셰이크 플라스크에서 뮤콘산을 생산함에 있어서 △tyrR 및 단일 복제 염색체의 aroG*의 조합이 동질유전자의 aroG 플라스미드 함유 균주에 비해 더 잘 수행할 수 있다는 것을 보여줬다. 플라스미드 대립유전자에 비해 염색체 대립유전자의 내재하는 우수한 유전적 안정성에 더하여, 플라스미드 내에 보유하기 위한 선택적 배지에 대한 필요성의 경감은, 본원에 설명된 신규한 균주가 대규모의 상업적 발효에 더 적합하도록 만든다. 게다가, 화학적 유도물질이 뮤콘산 경로 유전자의 발현을 위해 필요하지 않다. 따라서, 본원에 설명된 본 발명의 균주는 선행 기술(Niu 등, 2002)에 비해 개선된 것이며, 선행기술의 균주 모두는 원치않는 다중복제 플라스미드 상에서 DAHP 합성효소의 과다발현을 위한 유전자를 함유한다.
AroG에 대하여 전술한 바와 유사한 방식으로, 티로신에 의한 피드백 억제에 대해 내성을 갖는 AroF 또는 AroH 동종효소를 초래하는 돌연변이는 플라스미드 상에 또는 염색체 안에 도입될 수 있다. 바람직한 돌연변이는 AroF의 148번 아미노산을 프롤린으로부터 류신으로, 예를 들어 148번 코돈을 CCG로부터 CTG로 변화시켜서(Weaver 등, 1990) aroF* 유전자를 만드는 점 돌연변이이다. aroF*의 다른 대립유전자는 aroG* 대립유전자에 대해 전술한 바와 유사한 방식으로 티로신 유사체(예를들어, o-플루오로티로신, m-플루오로티로신, p-플루오로페닐알라닌 등)에 대한 내성에 의해 단리될 수 있다. aroF* 대립유전자는, 예를 들어, JW2584(CGSC 10051, Coli Genetic Stock Center, Yale University)와 같은 균주에서와 같이 근접하게 연결된 △yfiR::kan에서 트랜스포손에 대한 연결 또는 카나마이신 내성 삽입에 의해 선택되고, 풍부해지고, 형질도입될 수 있다.
실시예 3
염색체 DNA로부터 aroE의 결실 및 뮤콘산 생산
이 실시예에서, 다중복제 플라스미드 상에서 aroBaroG의 과다발현 뿐만 아니라 뮤콘산 경로에서 기능하는 단백질을 코딩하는 유전자의 발현의 효과가 조사되었다. 쉬키메이트 디히드로게나아제를 코딩하는 aroE 유전자에서의 결실을 함유하는 균주 MYR34는 이 연구에서 부모 균주로서 사용되었다. aroE의 염색체 복제의 결실은 실시예 1에서 설명한 바와 유사한 방식으로 달성되었다. MYR34가 쉬킴산 경로에서 기능하는 DAHP 합성효소 단백질을 코딩하는 aroG 유전자를 과다발현하는 플라스미드 pCP32AMP로 형질전환되는 경우에, DHS의 축적에 있어서 상당한 증가가 있다. MYR34가 구성 프로모터로부터 aroB를 발현하는 플라스미드로 형질전환되는 경우에, DHS의 축적에 현저한 증가가 관찰되지 않았다. 그러나, 대장균 균주 MYR34가 aroBaroG 유전자 모두를 발현하는 플라스미드로 형질전환되는 경우에, aroG만으로도 형질전환된 MYR34에서 보다 DHS의 축적이 더 증가하여서, DHS 생산에서 aroB를 2차 병목(bottleneck)으로서 시사한다(도 5).
도 6에서 제시된 실험에서, 숙주 염색체 DNA 안으로 통합된 aroB 유전자의 추가적인 복제의 효과는 시험되었다. MYR34로부터 유래된 대장균 균주 MYR170에서, P15 프로모터의 제어하에서 aroB 유전자의 추가적인 복제는 ack 자리에서 숙주 염색체 안으로 통합되었다. MYR170 균주가 pCP32AMP 플라스미드로 형질전환되는 경우에, 동일한 플라스미드로 형질전환된 MYR34 균주에서 검출된 DHS 축적에 대해 비교하는 경우 DHS 축적에 약간의 증가가 있었다. MYR170에서 DHS의 축적에 약간의 증가는 숙주 염색체 DNA 안으로 통합된 aroB 유전자의 추가적인 복제 때문일 수도 있다. MYR170이 aroBaroG를 모두 발현하는 pCP54로 형질전환되는 경우에, DHS 축적에서 더 많은 증가가 있었고, 이는 DHS 생산에서 aroB가 2차 병목이라는 것을 시사한다.
도 7은 대장균 균주 MYR34 및 MYR170을 이용한 뮤콘산 생산의 결과를 제공한다. aroE 결실 균주 MYR34 및 MYR170에서 aroBaroG 유전자의 과다발현이 DHS의 축적을 가져온다는 것을 확실히 하기 위하여, 뮤콘산 생산 경로에서 기능하는 단백질을 코딩하는 "뮤코닉 경로" 유전자의 발현이 DHS를 시스, 시스-뮤콘산으로 전환하는지를 보이기 위한 노력이 이루어졌다. 이러한 실험에서, 대장균 균주 MYR34 및 MYR170은 플라스미드 pM37만으로 형질전환되거나, 또는 플라스미드 pMG37 및 pCP32AMP 모두로 형질전환되었다. 플라스미드 pMG37은 뮤콘산 경로에서 기능하는 단백질을 코딩하는 aroZ, aroYcatAX 유전자를 발현한다. 이러한 박테리아 균주들 MYR34 및 MYR170이 플라스미드 pCP32AMP 및 pMG37 모두로 형질전환되는 경우에, MYR34 및 MYR170 모두에서 뮤콘산 생산은 두 개의 균주들이 pMG37 플라스미드로만 형질전환되는 경우에서의 뮤콘산 생산과 비교할 때 증가했으며, 이는 이러한 균주에서 aroB 발현이 시스, 시스-뮤콘산 생산에 대해 병목이라는 것을 시사한다.
실시예 4
tktA의 과다발현
tktA에 의해 인코딩된 트랜스케토라아제는 펜토오스 포스페이트 경로에서 중요 효소이고, 에리트로오스-4-포스페이트의 생산을 위해 제한되는 것으로 생각되며, 뮤콘산의 생산에서 중요한 중간체 중 하나 이다. 다중복제 플라스미드 상에 네이티브 프로모터와 함께 유전자를 도입하는 것에 의해(Sprenger 등, 1995, 1995a), 트랜스케토라아제를 인코딩하는 tktA의 과다발현은 방향족 경로 안으로의 플럭스를 향상시키는 것으로 알려져 있다(Draths 등, 1992). 그러나, 이러한 플라스미드는 불안정하고, 종종 유지(maintenance)를 위해 항생제 선택을 필요로 한다. 선행기술에서 또 다른 접근법은 tktA 유전자의 하나의 추가 복제를 숙주 균주의 염색체에 첨가하는 것이다(Niu 등, 2002). 그러나, tktA와 그의 네이티브 프로모터의 하나의 추가 복제는 에리트로오스-4-포스페이트로 방향족 경로를 포화시키기에 충분하지 않은데, 그 이유는 그것의 네이티브 프로모터가 이상과 매우 근접하지 않기 때문이다. 따라서, 공정은 실질적인 개선이 필요하다.
tktA의 개선된 과다발현은, 예를 들어 염색체에서 네이티브 tktA 프로모터를 강력한 구성 프로모터인 예를 들어 고초균 파지 SPO1로부터의 P15 또는 P26 프로모터(각각, 서열번호: 1 및 서열번호: 2), 또는 박테리아파지 람다로부터의 PR 프로모터(서열번호: 3)로 교체하는 것에 의해 얻어질 수 있다. 이는, 제1 단계에서 네이티브 염색체의 tktA 프로모터를 교체하기 위하여 cam R , sacB 카셋이 사용되는 것을 제외하고는 실시예 1에서 설명된 2단계에 의해 달성된다. 제2 단계에서, 강력한 구성 프로모터는 상기 강력한 구성 프로모터 옆으로 하류측에서 tktA 코딩 영역의 5' 단부의 50 염기 이상 및 상류측에서 네이티브 tktA 프로모터의 바로 상류에 50 염기쌍 이상의 상동체가 늘어서있는 강력한 구성 프로모터를 포함하는 선형 DNA로 형질전환하고, 수크로오스 내성에 대해 선택하는 것에 의해 도입된다. 이러한 발현 카셋으로부터 개선된 발현은 발현 카셋으로부터 전사되는 mRNA의 안정성을 증가시키는 것에 의해 달성될 수도 있다. mRNA 안정성의 개선은 mRNA의 5' 말단 또는 mRNA의 3' 말단, 또는 둘 모두에 스템-루프 구조를 추가하는 것에 의해 달성된다. 스템-루프 구조는 로-독립 전사 종결자에 의해 자연적으로 종결되는 mRNA의 말단에서 종종 존재하지만, 만일 존재하지 않는다면, 로-독립 전사 종결자는 잘 알려진 유전자 조작 방법에 의해 DNA 서열에 추가될 수 있다(결찰, PCR 등). 이러한 종결자는 각각의 반복에서 4 내지 20개의 염기의 역위 반복으로 구성될 수 있는데, 이때 상기 염기들은 3개 이상의 염기의 "루프"에 의해 분리되고, 이후에 T들이 풍부한 하나 이상의 염기의 영역(디옥시티미딘)이 이어진다. 역위 반복은 G 및 C로 풍부하다(디옥시구아닌 및 디옥시시티딘). 유사하게, 스템-루프는 전사의 시작점 바로 하류이지만 리보솜 결합 부위 이전에서 전술한 스템-루프를 함유하지만 T-풍부 영역은 포함하지 않는 DNA 서열을 삽입하는 것에 의해 mRNA의 5' 말단 안으로 제작된다. 이러한 예는 P15 프로모터와 결합하여 주어진다(서열번호: 1).
쉬킴산 경로를 통한 탄소의 흐름 상에 tktA 유전자의 과다발현이 미치는 효과의 분석에 있어서, 대장균 균주 MYR170은 부모 균주로서 사용되었다. MYR170은 쉬키메이트 디히드로게나아제 효소를 코딩하는 aroE 유전자에 대한 결실, 및 ack 자리에서 aroB 유전자의 추가 복제를 가진다.
도 8, 9 및 10에서 설명된 실험에서, 두 개의 다른 플라스미드 pCP32AMP 및 pCP50이 사용되었다. 플라스미드 pCP32AMP는 그의 네이티브 프로모터로부터 DAHP 합성 효소 aroG 유전자만을 발현하고, 플라스미드 pCP50은 aroG 유전자와 함께 네이티브 프로모터로부터 트랜스케톨라아제 유전자 tktA를 발현한다. aroE 결실 및 염색체 DNA의 ack 자리에서 통합된 P15 프로모터의 제어 하에서 aroB 유전자의 추가 복제를 갖는, MYR170은 pCP32AMP 및 pCP50 플라스미드로 개별적으로 형질전환되었다. 도 8에서 보는 바와 같이, DHS 축적은, aroG 유전자 만을 발현하는 대장균 세포와 비교할 때, tktA 유전자와 함께 aroG 유전자의 발현을 통해 더 증가되었다.
도 9는 플라스미드 pCP32AMP 또는 pCP50으로 형질전환된 두 개의 다른 균주 MYR34, MYR170에서 DHS 수율에 대한 데이터를 제공한다. aroE 유전자 결실을 갖는 MYR34 균주는 소비된 글루코오스의 1 그램 당 DHS의 0.1g이 수득되었다. MYR34에서 DHS 수율은, 이 균주가 aroG 유전자 과다발현을 갖는 pCP32AMP 플라스미드로 형질전환되는 경우에, 소비된 글루코오스의 1 그램 당 DHS 0.15 g으로 증가했다. MYR170은 ack 자리에서 삽입된 aroB 유전자의 추가 복제를 가진다. aroB 유전자의 추가 복제의 존재의 결과로서, pCP32AMP로 형질전환된 MYR34 균주에서 DHS 생산에 대한 수율은 pCP32AMP로 형질전환된 MYR34 균주에서의 DHS 수율에 비해 약간 더 높았다. 따라서, MYR170에서 aroB의 추가 복제의 존재는 쉬킴산 경로를 통한 탄소 흐름의 증가를 유발했다. 나아가, DHS 수율의 증가는, MYR170 균주가 aroGtktA 유전자 모두를 발현하는 플라스미드 pCP50으로 형질전환되는 경우에 관찰되었다. 따라서, tktA의 추가 복제의 존재는 쉬킴산 경로를 통한 탄소 흐름의 증가를 설명했다. 더 구체적으로, 추가적인 aroBtktA 유전자의 존재의 결과는 DHS 수율에 부가적 효과를 유발했다.
도 10에서 설명된 실험에서 사용된 MYR261은 poxB 자리에서 MYR170의 염색체 DNA 안으로 tktA 유전자의 추가 복제를 통합하도록 유전자 조작되었다. MYR261 균주에서 소정의 유전자 교체(poxB::tktA)는 PCR을 통해 확인되었다. MYR261은 pCP32AMP(aroG 과다발현) 플라스미드 또는 pCP50(aroGtktA 과다발현) 플라스미드 중 어느 하나로 형질전환되었다. 대조군으로서, MYR170은 pCP32AMP 플라스미드로 형질전화되었다. 도 10에 제시된 결과에서 지시하는 바와 같이, MYR261의 염색체 DNA에서 tktA 유전자의 추가 복제의 존재는, pCP32AMP 플라스미드로 형질전환된 MYR170 균주에서 관찰된 DHS 생산에 대한 역가와 비교할 때, pCP32AMP 플라스미드를 이용하는 DHS 생산에 대한 역가를 증가시켰다. 트랜스케토라아제를 과다발현하는 플라스미드 pCP50으로 형질전환되는 경우에 MYR261 균주에서 트랜스케토라아제 수준의 추가적인 증가는 DHS 생산에 대한 역가에 추가적인 증가를 가져왔다. poxB에 의해 인코딩된 효소, PoxB, 또는 피루베이트 옥시다아제는 반응 생성물로서 아세테이트를 생산한다. 따라서, 본원에서 설명된 바와 같이 tktA의 삽입으로부터 기인하는 poxB의 결실은 아세테이트 생산에 대한 잠재적인 활성 경로를 제거한다. 유사하게, 동시적인 P 15 aroB의 삽입 및 AckA를 인코딩하는 ackA의 결실, 또는 하기 실시예 12에서 설명되는 바와 같은 아세테이트 키나아제는 아세테이트로의 또 다른 잠재적인 활성 경로를 제거한다. 아세테이트의 생산은 발효에서 일반적으로 바람직하지 않다(Jantama 등, 2008b). 따라서, 이러한 결실은 아세테이트 생산을 감소시키는데에 유용할 수 있다.
도 11은 플라스미드 pCP32AMP 및 pMG37로 형질전환한 후에 대장균의 MYR170, MYR261, 및 MYR305 균주에서 뮤콘산 및 아세트산 생산에 대한 역가를 제공한다. MYR305는 염색체 DNA로부터 poxB 유전자를 결실하는 것에 의해 MYR170으로부터 유래되는 반면, MYR261은 poxB 유전자가 tktA 유전자의 추가 복제를 삽입하는 것에 의해 비활성화된 MYR170 유도체이다. 전술한 바와 같이, 플라스미드 pCP32AMP는, DHS의 축적으로 이어지는 쉬킴산 생합성 경로에서 기능하는 DAHP 합성효소 단백질을 코딩하는 aroG 유전자를 발현하며, DHS의 축적은 대장균 균주 MYR170, MYR261 및 MYR305에서 aroE 유전자의 결실 때문이다. 뮤코닉 경로 유전자인 플라스미드 pMG37 상에서 aroZ, aroYcatAX의 발현에 의해, DHS는 도 2에서 예시되는 바와 같이, 시스, 시스-뮤콘산으로 전환된다. MYR261 균주에 aroB 유전자 및 tktA 유전자의 추가 복제의 존재에 의해, 아세트산의 축적의 감소에 따라서 뮤코산의 생산이 약간 증가되었다.
실시예 5
talA 또는 talB의 과다발현
talB 유전자는 대장균에서 두드러진 트랜스알돌라아제를 인코딩하지만, talA 유전자는 소수의 트랜스알돌라아제도 인코딩한다. 트랜스알돌라아제의 과다생산은 방향족 경로 안으로의 플럭스를 개선하는 것으로 알려져있다(Lu 및 Liao, 1997; Sprenger, 1995; Sprenger 등, 1995b). 선행기술에서, 이는 다중복제 플라스미드 상에서 그의 네이티브 프로모터로부터 tal 유전자(현재 talB 유전자로 알려짐)의 과다발현에 의해 달성되었다(Lu 등, 1997, Sprenger 등, 1995b). 그러나, 이러한 플라스미드는 불안정하고, 유지를 위해 항생제 선택을 필요로한다. 따라서, 개선된 공정에 대한 필요가 존재한다. talB의 개선된 발현은, 예를 들어 염색체에서 네이티브 tktB 프로모터를 강력한 구성 프로모터인 예를 들어 고초균 파지 SPO1로부터의 P15 또는 P26 프로모터(각각, 서열번호: 1 및 서열번호: 2), 또는 박테리아파지 람다로부터의 PR 프로모터(서열번호: 3)로 교체하는 것에 의해 얻어질 수 있다. 이는, 제1 단계에서 네이티브 염색체의 tktB 프로모터를 교체하기 위하여 cam R , sacB 카셋이 사용되는 것을 제외하고는 실시예 1에서 설명된 2단계에 의해 달성된다. 제2 단계에서, 강력한 구성 프로모터는 상기 강력한 구성 프로모터 옆으로 하류측으로 tktB 코딩 영역의 5' 단부의 50 염기 이상 및 상류측으로 네이티브 tktB 프로모터의 바로 상류에 50 염기쌍 이상의 상동체가 늘어서있는 강력한 구성 프로모터를 포함하는 선형 DNA로 형질전환하고, 수크로오스 내성에 대해 선택하는 것에 의해 도입된다. talA 유전자도 유사한 방법에 의해 과다발현될 수 있지만, talB 유전자가 지배적인 활성을 인코딩하고 있기 때문에, talB 유전자를 과다발현하는 것이 바람직하다(Sprenger, 1995; Sprenger 등, 1995b). 과다발현용으로 설계된 발현 카셋의 구조체에 대한 더 구체적인 내용은 실시예 4를 참조하라.
실시예 6
aroZ, aroYcatAX 유전자의 발현
대장균에 의해 생산된 내인성 DHS의 뮤콘산으로의 전환을 확인하기 위하여, 아시네토박터 sp. ADP1으로부터의 이종 유전자 catAX, 폐렴간균으로부터의 aroY, 및 아시네토박터 sp. ADP1으로부터의 quiC는 저-모사 플라스미드, pCL1921(Lerner 및 Inouye, 1990) 내의 강력한 구성 프로모터(각각, P15, PR 및 P26) 하에서 클로닝되어, '뮤코닉 플라스미드' pMG37을 생성했다. 비어있는 벡터(pCL1921) 또는 pMG37을 함유하는 MYR34 균주 유도체는 2% 글루코오스를 함유하는 셰이크 플라스크 배지(방향족 아미노산 및 비타민이 보충된 NBS 최소 배지)에서 17시간 동안 37℃에서 성장되었다. 상청액을 수집하고 HPLC에 의해 분석했다. DHS의 축적을 보여주는 MYR34/pCL1921과 대비하여, MYR34/pMG37은 뮤콘산의 생산을 보여준다(도 12). DHS, 또는 PCA 및 카테콜과 같은 중간체 산물의 상당량은 후자 균주로부터 검출되지 않았으며, 이는 pMG37로부터 발현된 이종 유전자가 기능적이고 충분하다는 것을 시사한다.
실시예 7
aroZ 동족체의 비교
세 개의 상이한 aroZ 동족체들 및 유사체들은 DHS를 뮤콘산 생산 경로 안으로 흐름을 바꾸는 능력이 비교되었다(도 13). 아시네토박터 sp. ADP1으로부터의 quiC, 바실러스 튜링겐시스로부터의 asbF, 및 뉴로스포라 크라싸로부터의 qa-4는 AroZ-유사 활성을 갖는 단백질을 인코딩하는 것으로 보고된다(Elsemore and Ornston, 1995; Fox et al, 1995; Rutledge, 1984). 이러한 유전자들 각각은 대장균에서의 발현에 대해 코돈-최적화되었고, GeneArt(Invitrogen)에 의해 합성되었고, P15 및 PR 프로모터 각각으로부터 catAXaroY 유전자를 발현하는 저-모사 '뮤코닉 플라스미드' 내의 강력한 구성 P26 프로모터 하에서 클로닝되었다. MYR34/pCL1921, MYR34/pMG37(aroZ로서 quiC를 갖는 뮤코닉 플라스미드), MYR34/pMG47(aroZ로서 asbF를 갖는 뮤코닉 플라스미드), 및 MYR34/pMG70(aroZ로서 asbF를 갖는 뮤코닉 플라스미드)은 2% 글루코오스, 방향족 아미노산 및 방향족 비타민을 함유하는 최소 배지를 포함하는 셰이크 플라스크에서 48시간 동안 37℃에서 성장되었다. 상청액은 수집되고 HPLC로 분석되었다. 예상한 바와 같이, 비어있는 벡터로 형질전환된 MYR34는 DHS를 축적했고 뮤콘산을 생산하지 않았다. 시험된 두 개의 aroZ 동족체 및 하나의 유사체는 DHS를 뮤콘산 생산의 흐름으로의 전환에 기능적이고, 그 정도를 변화시키는데에 기능적이다. quiC 유전자를 발현하는 MYR34 유도체는 매우 강력하고, 미미한 양의 DHS 잔류물을 갖도록 뮤콘산으로 DHS의 거의 100% 전환율을 보였다. 균류 aroZ 동족체, qa-4를 발현하는 MYR34 유도체는 DHS의 뮤콘산으로의 약 80%에 육박하는 전환율 및 20% DHS 잔류물을 보였다. 마직막으로, asbF 유전자를 발현하는 MYR34 유도체는 DHS의 뮤콘산으로의 50% 전환율과 50% DHS 잔류물을 보였다. 종합하면, 우리의 셰이크 플라스크 분석 조건 하에서, quiC 유전자의 발현 및/또는 활성은 다른 aroZ 동족체의 경우에 비해 가장 높은 것으로 보여졌다.
실시예 8
catAX, aroYquiC의 염색체의 통합
뮤콘산은 adhE 자리에서 구성 포르모터로부터 발현된 catA-X, aroYquiC의 염색체가 통합된 단일 복제만을 함유하는 균주에 의해 생산될 수 있다.
MYR170(△aroE, △ack::P 15 -aroB), 고 DHS 생산자는 염색체에서 adhE 자리에서 뮤콘산 경로 유전자들을 통합하기 위해 사용된 숙주 균주였다(서열번호: 41). 결과의 균주 MYR352는 플라스미드 YEp24(중-복제, 비어있는 벡터), pCP32AMP(중-복제, 네이티브 프로모터로부터 발현된 aroG), 또는 pCP50 (중-복제, 그들의 개별적인 네이티브 프로모터로부터 발현된 aroGtktA)로 형질전환되어, 유도체 균주를 형성했다. 후자 두 개의 플라스미드는 DHS 생산을 증가시키기 위해 사용되었다. 균주들은 전술한 바와 같이 2% 글루코오스를 함유하는 셰이크 플라스크 배지에서 72시간 동안 37℃에서 성장시켰다. 상청액은 72시간에 수집되었고, HPLC에 의해 분석되었다. 예상한 바와 같이, aroGaroG/tktA로 형질전환된 MYR352 유도체들은 비어있는 벡터 대조군과 비교할 때 총 생성물 형성에서 전반적인 증가를 보였다(도 14). 모든 MYR352 형질전환체들은 주목할 만한 역가의 뮤콘산을 생산했으며, 이는 뮤콘산이 통합된 "뮤코닉 경로" 유전자만을 함유하고 유전자 발현의 화학적 유도물질을 공급함 없이 균주에 의해 생산될 수 있다는 것을 최초로 증명한 것이다.
이러한 임의의 MYR352 유도체 균주들에서 생성된 DHS 모두가 최종 산물인 뮤콘산으로 전환된 것은 아니다. 대신에, 상당량의 카테콜 축적이 존재했으며(도 14), 이는 catAX의 발현 또는 활성이 염색체 상의 단일 복제로부터 발현되는 경우에 제한된다는 것을 시사한다. 주요 축적 중간체가 카테콜이기 때문에, 뮤콘산 합성에 있어서 quiCaroY 유전자 발현 및/또는 활성은 MYR352 배경 균주에서 충분할 것으로 보인다.
MYR352 균주 유도체는 유사체 MYR219 균주 유도체와 나란히 비교되었다. MYR219 균주는 MYR170 균주와 동일하지만, 뮤콘산 경로 유전자를 발현하는 저-모사 플라스미드 pMG37을 함유한다. 따라서, MYR352 및 MYR219 균주간의 주된 차이점은 뮤콘산 경로 유전자의 용량에 관한 것이다(각각, 1 복제 vs 약 5 복제). MYR352 유도체 균주에 비하여, MYR219 유도체 균주는 카테콜 또는 다른 중간체들의 매우 적은 축적을 보였고, 최종 산물인 뮤콘산을 성공적으로 생산했다. 종합해보면, 이러한 결과들은 MYR352와 같은 균주에서 catAX 활성을 증가시키기 위한 필요성을 보여준다.
실시예 9
catAX의 발현
MYR352 균주에서 카테콜의 축적 및 뮤콘산의 비효율적인 생산은 catAX 유전자 산물(들)의 용량 및/또는 활성을 제한하는 것 때문이다. 전술한 바와 같이, MYR352는 강력한 구성 프로모터 하에서 △aroE, △ack::P 15 -aroB,catAX, aroYquiC의 염색체 통합된 단일 복제를 함유한다. 이 균주는 중-복제 비어있는 벡터 대조군(YEp24) 또는 aroG/tktA 발현 플라스미드(pCP50)으로 형질전환되어, 방향족 아미노산 합성 경로 안으로의 탄소 흐름을 증가시키고 많은 양의 DHS를 생산한다. 전술한 바와 같은 2% 글루코오스가 보충된 셰이크 플라스크 배지에서 72시간 동안 37℃에서 형질전환된 균주를 성장시키는 것은 카테콜 중간체의 축적을 가져왔다. 이런 결과는 catAX 활성이 MYR352에 불충분할 수 있다는 것을 시사했다. 이런 가설을 확인하기 위하여, MYR352/pCP50에서 카테콜 축적을 경감시키기 위한 저-모사 플라스미드로부터 발현된 하나 이상의 뮤콘산 경로 유전자의 능력이 시험되었다(도 15). 구체적으로, MYR352/pCP50은 저-모사 비어있는 벡터 대조군(pCL1921) 또는 뮤콘산 생산 경로의 모든 세 개의 유전자, 두 개의 유전자, 또는 하나 의 유전자를 발현하는 플라스미드로 더 형질전환되었다. 유도체 균주는 전술한 바와 같은 셰이크 플라스크 실험에서 분석되었다. (pMG27로부터의) aroY의 용량만을 증가시키거나 (pMG39로부터의) quiC의 용량만을 증가시키는 것은 카테콜 축적을 경감시키지 못했지만, (pMG37로부터의) 모든 뮤콘산 경로 유전자 또는 (pMG33으로부터의) catAXaroY 모두의 발현은 카테콜의 뮤콘산으로의 성공적인 전환을 가져왔다. 나아가, (pMG31로부터의) catAX만의 발현은 뮤콘산의 생산 및 카테콜의 축적을 방지하기에 충분했다.
실시예 10
누출 aroE 돌연변이의 제작
시스, 시스-뮤콘산을 생산하기 위한 선행기술 공정에서, 숙주 균주는 삭제 돌연변이인 aroE353, 즉 aroE 유전자에서 돌연변이를 함유한다. 그 결과, 균주는 쉬키메이트 경로로부터 만들어진 방향족 아미노산(페닐알라닌, 티로신, 및 트립토판) 및 방향족 비타민(p-히드록시벤조산, p-아미노벤조산, 및 2,3-디히드록시벤조산)의 공급을 필요로한다. 방향족 아미노산은 상업적으로 매력적인 공정에서 공급되기에 너무 비싸다. 따라서, 선행기술 공정은 실질적인 개선이 필요하다. 이는은 aroE 유전자의 누출 유형인 aroE*를 도입하는 것에 의해 달성될 수 있다. 누출 돌연변이는 삭제 표현형(null phenotype)을 초래하는 aroE 코딩 서열에서 하나의 아미노산을 바꾸는 미스센스 돌연변이를 최초 생성하는 것에 의해 얻어진다. 이는 상기 나열된 여섯개의 방향족 화합물에 대한 임의의 형태의 돌연변이유발 및 동시의 영양요구성에 대해 선별함으로써 달성될 수 있다. 바람직한 방법은, Taq DNA 중합효소를 사용하고, 템플레이트로서 야생형 대장균 게놈 DNA를 사용하고, aroE 코딩 영역의 상류에서 약 1000개의 염기쌍 및 하류에서 1000개의 염기쌍을 혼성화하는 PCR 올리고뉴클레오티드 프라이머를 사용하는 오류-유발 PCR 돌연변이유발(error-prone PCR mutagenesis)에 의해 돌연변이 aroE 유전자의 풀을 만드는 것이다. 결과로 얻은 선형 DNA 분자의 풀은 시스, 시스-뮤콘산을 생산하고 aorE 코딩 영역을 대체하는 통합된 cam R , sacB 카셋을 함유하는 대장균 C 유도체를 형질전환하기 위해 사용되고, 수크로오스 저항에 대해 선택된다. 이후에, 형질전환체는 클로르암페니콜 내성을 잃고 상기 나열된 여섯개의 방향족 화합물을 요구하는 영양 요구체들에 대하여 선택된다. 몇몇 독립적인 영양요구체들은 선택되고, 여섯개의 방향족 화합물이 없는 최소 글루코오스 플레이트 상에 (최소 글루코오스 배지에서 세척된) 약 107, 108, 또는 109 세포를 플레이팅하는 것에 의해 복귀능력(revertability)에 대해 시험된다. 플레이트 상에서 콜로니가 생기게 하는 복귀돌연변이체는 선택되고, 방향족 아미노산의 실질적 수준의 생산 없이 시스, 시스-뮤콘산의 생산에 대하여 시험된다. 이러한 복귀돌연변이체들 중에는 aroE 유전자에 하나 이상의 돌연변이를 가지고 있어서 AroE 효소가 성장에 충분한 방향족 아미노산 및 비타민을 제공하지만 이러한 방향족 아미노산의 잉여물은 제공하지 않는 균주가 있을 것이다. 누출 aroE 돌연변이체를 얻는 또 다른 방법은 aroE353 및 aroE24(둘 모두 the Coli Genetic Stock Center at Yale University, New Haven, CT, USA로부터 얻을 수 있음)와 같은 종래의 복귀성 aroE 돌연변이들 중 하나를 시스, 시스-뮤콘산 생산 균주에 도입하고, 전술한 바와 같은 복귀돌연변이체에 대해 선택하는 것이다.
실시예 11
촉진 확산에 의한 글루코오스의 이입
방향족 경로의 제1 개입단계에서 기질들 중 하나는 포스포에놀피루베이트(PEP)이다. PEP는 또한 포스페이트의 공급원이고, 글루코오스 및 일부 다른 당들을 박테리아 포스포트랜스퍼라아제 시스템(PTS)에 의해 이입하기 위한 에너지이다. 따라서, 박테리아가 PTS-의존성 당 상에서 성장하는 경우에, PTS 및 PEP에 대한 방향족 경로 사이의 경쟁이 존재한다. 따라서, 방향족 경로에 대한 플럭스를 증가하도록 현저히 개선하는 것은 PTS를 제거하고 당 활용에 대한 다른 경로를 제공하는 것에 의해 달성될 수 있다. 이런 문제점에 대한 하나의 해결책은 PTS를 대장균 GalP 투과효소인 글루코오스 활용에 대해 상당히 잘 일하는 양성자 공수송체(proton symporter)로 교체하는 것이다(미국특허 6,692,794). 그러나, 양성자 공수송체는 투과효소를 작동시키기 위해 필요한 양성자 구배를 유지하기 위하여 여전히 에너지를 사용한다. 따라서, 공정에 대한 추가적인 개선이 여전히 필요하다.
자일로오스와 같은 일부 당들은 에너지를 ATP(아데노신 트리포스페이트)의 가수분해로부터 유도하는 수송 단백질에 의해 이입될 수 있다. 다시, 만일 에너지-의존성 수송체가 적은 에너지를 필요로 하는 수송체에 의해 교체될 수 있다면, ATP에 내재하는 에너지가 다른 유익한 사용을 위해 보존될 수 있기 때문에 개선이 이루어질 수 있다.
현저한 개선은 촉진 확산 수송체를 사용하는 것에 의해 얻어질 수 있는데, 이러한 촉진 확산 수송체는 당의 이입을 위해 에너지를 소모하지 않는다(Parter 등, 1995; Snoep 등, 1994). 예를 들어, glf 유전자에 의해 인코딩된 자이모모나스 모빌리스(Zymomonas mobilis)로부터의 글루코오스 촉진자는 3-디히드로쉬키메이트(DHS) 생산 균주 대신에 또는 그에 더하여 사용될 수 있다(Yi 등, 2003). 그러나, 이러한 균주는 글루코오스 이입을 위해 GalP에 여전히 적어도 일부 의존한다. GalP는 글루코오스의 이입을 위한 양성자 구배의 형태에서 에너지를 필요로 하기 때문에, 뮤코닉 생산 균주에 대한 글루코오스 이입의 효율에 개선이 필요하다.
glf 플러스 글루코키나아제 유전자, glk, 또한 자이모모나스 모빌리스로부터의 유전자의 발현을 위한 카셋은 P26과 같은 강력한 구성 프로모터와 함께 결합될 수 있다. 이런 카셋은 소정의 화합물의 생산을 방해하지 않을 위치에서 숙주 균주의 게놈 안으로 통합될 수 있으며, 여기서 소정의 화합물은 시스, 시스-뮤콘산이다. 대장균 염색체에서 이러한 위치의 예는 트레오닌 퇴행성 오페론인 tdcABCDEFG이다. 만일, 성장 배지가 트레오닌을 함유하고 있지 않으면, 이런 오페론은 필요하거나 발현되지 않고, 따라서, 이런 오페론에서 발현 카셋의 삽입은 대사를 방해하지 않는다.
전술한 개선을 달성하기 위하여, PTS 기능을 인코딩하는 하나 이상의 유전자들은 실시예 1에 개시된 방법과 유사한 방법을 이용하여 결실된다. 예를 들어, 하나 이상의 ptsH, ptsI, crr, 또는 ptsG는 결실될 수 있다. 다음으로 galP가 결실된다. 이후에, P 26 -glf, glk 카셋은 실시예 1에서 설명된 바와 유사하게 2단계에 걸쳐서 도입될 수 있다. 제1 단계에서, cam R , sacB 카셋은 pAC21로부터 유래된 선형 DNA(서열번호: 15)를 사용하는 tdc 오페론에서 통합되고, 클로르알페니콜(30 mg/l) 내성에 대하여 선택된다. 제2 단계에서, P 26 -glf, glk 카셋은 pAC19로부터 유래된 선형 DNA(서열번호: 15)를 사용하는 tdc 오페론에서 통합되고, 수크로오스 내성에 대해 선택되고, 클로르암페니콜 민감성에 대해 선별되고, 이 경우에 최소 글루코오스 배지 상에서 성장이 개선된다.
글루코오스의 촉진 확산이 대장균에서 종래의 글루코오스 이입 시스템을 대체할 수 있는지를 시험하기 위하여, ptsHI 유전자 및 galP 유전자는 MYR34(△aroE)로부터 결실되었고, 이후에 P 26 -glf, glk 카셋은 pAC19로부터 유래된 선형 DNA(서열번호: 14)를 사용하는 tdc 오페론에서 통합되어서, 균주 MYR217을 얻었다. MYR217은 소정의 세 개의 방향족 아미노산 및 세 개의 방향족 비타민-유사 화합물로 보충된 최소 글루코오스 배지에서 상당히 잘 성장한다(도 16). 그러나, ptsHIgalP의 결실을 함유하지만 glf, glk 카셋을 함유하지 않는 균주 MYR31는 어떤 상당한 성장도 보이지 않았다(도 16). 따라서, 촉진 확산은 우리의 배경 균주에서 두 개의 종래의 글루코오스 이입 시스템을 대체하기에 충분하다.
촉진 확산이 방향족 경로로부터 유래된 화합물들의 생산에 유용한지를 시험하기 위하여, MYR34 및 MYR217이 pCP54(aroG, aroB) 및 pCP55(aroG, aroB, tktA)로 형질전환되었다. 셰이크 플라스크에서 방향족 중간체 3-디히드로쉬키메이트(DHS)의 생산은 이런 두 개의 균주에 대하여 비교되었다(도 17). pCP54 또는 pCP55 중 어느 하나에서, 촉진 확산을 사용하는 균주는 종래의 글루코오스 이입 시스템을 사용하는 균주만큼 또는 그 이상의 DHS를 생산했다. DHS의 생산은 유전자 조작된 대장균 균주에서 뮤콘산 생산에 대한 좋은 대용물이며, 따라서, 우리는 글루코오스의 촉진 확산이 뮤콘산 생성물에 대한 유용한 개선이라는 것이라고 결론내릴 수 있었다.
실시예 12
aroB 유전자의 과다발현
aroB 유전자의 발현은 시스, 시스-뮤콘산 생산에 대한 율속(rate limiting)으로 보고된다(Niu 등, 2002). 선행기술에서, 이는 aroB 유전자의 제2 복제와 그의 네이티브 프로모터를 통합하는 것에 의해 이른바 해결되었다. 그러나, 이는 aroB 제한을 경감하기에 충분하지 못한데, 이는 aroB 유전자의 네이티브 프로모터 및 리보솜 결합 부위가 전혀 이상적이지 않기 때문이다. 따라서, 공정은 실질적으로 개선이 필요하다.
aroB의 개선된 과다발현은, 예를 들어 염색체에서 네이티브 aroB 프로모터를 강력한 구성 프로모터, 예를 들어 고초균 파지 SPO1로부터의 P15 또는 P26 프로모터(각각, 서열번호: 1 및 서열번호: 2) 또는 박테리아파지 람다로부터의 PR 프로모터로 교체하는 것에 의해 얻어질 수 있다. 이는, cam R , sacB 카셋이 네이티브 염색체 aroB 프로모터 및/또는 제1 단계에서 리보솜 결합 부위를 대체하기 위해 사용되는 것을 제외하고는 실시예 4에서 설명된 2단계를 통해 달성된다. 제2 단계에서, 강력한 구성 프로모터는 선형 DNA로 형질전환하고 수크로오스 내성에 대해 선택하는 것에 의해 도입되는데, 여기서 선형 DNA는 강력한 구성 프로모터를 포함하고, 이어서 리보솜 결합 부위 및 하류측에 ATG 시작 코돈을 포함하는 aroB 코딩 서열의 5' 말단으로부터 적어도 50개의 염기들 및 강력한 구성 프로모터의 상류측에 네이티브 aroB 프로모터의 바로 상류에 동족체의 적어도 50개의 염기쌍들을 포함한다. 유사한 방법을 사용하여 강력한 프로모터를 도입하는 것외에 또는 그 대신에, 강력한 리보솜 결합 부위, 예를 들어 AGGAGG는 aroB의 ATG 번역 시작 코돈으로부터 약 4 내지 10 염기쌍 상류에 도입될 수 있다. 이러한 합성 카셋, 예를 들어 P 15 -aroB 카셋의 복제는 네이티브 aroB 자리로부터 구별되는 자리, 예를 들어 ack 자리에서 염색체에 통합될 수 있다. ack 유전자의 동시적 결실 뿐만 아니라, 실시예 4에서와 같은 poxB 유전자의 결실은, 발효과정에서 원치 않은 아세테이트의 형성을 감소시키는 것을 도와줄 수 있다.
실시예 13
펜토오스 포스페이트 경로의 산화적 분지(oxidative branch)를 통한 플럭스의 감소
방향족 경로에서 제1 개입단계를 위해 필요되는 에리트로오스-4-포스페이트는 펜토오스 포스페이트 경로(PPP)의 비-산화적 부분으로부터 유래된다. 탄소가 PPP 안으로 도입되는 두 가지 다른 경로들이 존재한다. 제1 경로는, 효소 글루코오스-6-포스페이트 탈수효소(zwf 유전자에 의해 인코딩됨), 6-포스포글루코노락토나아제(6-phosphogluconolactonase)(pgl 유전자로부터 인코딩됨) 및 6-포스포글루코네이트 탈수효소(gnd 유전자에 의해 인코딩됨)에 의해 글루코오스-6-포스페이트로부터 리불로오스-5-포스페이트를 얻는 것이다. 이러한 세 단계 중 마지막에서,하나의 탄소는 CO2로서 소실된다. PPP로의 이러한 경로는 PPP의 산화적 분지로 불린다. 이후에, 리불로오스-5-포스페이트는 이소머라아제, 에피머라아제, 트랜스케토라아제 및 트랜스알돌라아제의 작용에 의해 다양한 다른 당 포스페이트로 전환된다. 리불로오스-5-포스페이트로 시작되는 이러한 가역반응의 그룹은 PPP의 비-산화적 분지로 불린다. 탄소가 PPP로 진입하는 제2 경로는 프룩토오스-6-포스페이트 및 글리세르알데히드-3-포스페이트(해당작용으로도 알려져 있는 엠덴-마이어호프 경로(Embden-Meyerhof pathway)로부터 둘 다 유래됨)를 통해 이루어지며, 이들은 트랜스알돌라아제 및 트랜스케토라아제에 의해 혼합되고 재배열되어서 다양한 다른 당 포스페이트를 형성하고, 이러한 당 포스페이트 중 하나는 에리트로오스-4-포스페이트이다. 만일 탄소가 제2 경로를 통해 PPP 안으로 진입하면, CO2는 소실되지 않는다. 글루코오스로부터 시스, 시스-뮤콘산의 수율을 개선하기 위하여, CO2의 소실은 PPP의 산화적 분지를 차단하는 것에 의해 방지될 수 있어서, PPP에 진입하는 모든 탄소는 프룩토오스-6-포스페이트 및 글리세르알데히드-3-포스페이트로부터 비-산화적 경로를 통과하게 된다. PPP의 산화적 분지의 차단은, tyrR 유전자를 결실시키기 위하여 실시예 1에서 개시된 것과 유사한 2단계의 방법을 사용하여 zwf 유전자를 결실시키는 것에 의해 달성된다.
실시예 14
방향족 경로로의 플럭스 및 PEP를 통한 플럭스의 증가
PEP가 시스, 시스-뮤콘산으로의 경로에 대한 율속 중간체가 아니게 하는 것이 바람직하다. 이는, 예를 들어 효소 PEP 합성효소에 의한 PEP로 피루베이트의 재생을 증가시키는 것에 의해 달성되며, 이는 다른 실시예들에서 설명한 바와 같이 pps 유전자의 과다발현 카셋을 통합하는 것에 의해 달성된다. 다른 접근법은 대장균에서 pykApykF 유전자에 의해 인코딩되는 피루베이트 키나아제에 의해 PEP의 소비를 제한하는 것이다. 이 경우에, 상기 접근법은 효소(들)의 활성을 감소시키기 위함이다. 이는 피루베이트 키나아제를 인코딩하는 하나 이상의 유전자들을 결실시키거나(실시예 1에서 tyrR로 설명됨), 또는 프로모터, 리보솜 결합 부위 또는 코딩 서열을 돌연변이화하는 것에 의해 이러한 하나 이상의 유전자들의 발현 강도를 감소시키는 것에 의해 달성되어서, 피루베이트 키나아제 활성의 수준은 감소된다. 예를 들어, 대장균 pykA 유전자의 앞에 위치한 RBS는 5'CGGAGYAYYACATG이다. ATG 번역 시작 코돈은 밑줄그었다. 이 서열은 CaGAGTATTACATG, CaaAGTATTACATG, CaatGTATTACATG, CaataTATTACATG 등으로 돌연변이될 수 있어서, RBS 서열은 한번에 하나의 염기를 변화시키는 것에 의해 AGGAGG의 덜 유사한 공통 RBS(consensus RBS)를 만든다. 각각의 돌연변이 유형은 pykA 자리에서 염색체 안으로 통합되어, 야생형을 대체하고, 시스, 시스-뮤콘산 생산 수준은 개선 여부에 대해 측정된다.
실시예 15
수크로오스 상에서 성장을 부여
대장균 C로부터 유래된 균주들은 유일한 탄소원으로서 수크로오스 상에서 성장하지 않는다. 그러나, 그들은 본원에 전체가 참조로서 포함되는 PCT 특허출원서 PCT/US11/064598에서 개시된 바와 같이 유전적으로 조작될 수 있다. 따라서, 시스, 시스-뮤콘산 생산 균주는 전술한 명세서에서 개시한 바와 같이 수크로오스 상에서 성장하도록 유전자 조작될 수 있다.
실시예 16
시스, 시스-뮤콘산의 개선된 생산자
실시예 1 내지 15에서 설명된 모든 특징들은 차례로 특징들을 도입하는 것에 의해 대장균의 한 균주에 결합될 수 있다. 결과로 얻은 균주는 개선된 시스, 시스-뮤콘산 생산자를 포함한다. 이후에, 결과로 얻은 균주는 제1 복제의 위치로부터 분리된 위치에서 차례로 전술한 과다발현 카셋 각각의 제2 복제를 통합하는 것에 의해 더 개선될 수도 있다. 편리하고 안전한 위치의 예는 리보솜 RNA를 인코딩하는 rrfF의 종결자로부터 바로 하류에 있는 BsrB1 제한부위이다. 소정의 카셋은 블런트 선형 DNA로서 플라스미드 pMH17F(서열번호: 17)의 특유의 BsrB1 부위 안으로 결찰된다. 한 예는 catAX 발현 카셋의 결찰에 의해 pcatAX 플라스미드를 얻는 것이다. 이와 동시에, cam R , sacB 카셋은 블런트 단편으로서 pMH17F 안으로 결찰되어 pMH28F(서열번호: 19)를 얻는다. PCR에 의해 또는 제한 효소 절단에 의해 pMH28로부터 유래된 선형 DNA는 rrfF 부위에서 cam R , sacB 카셋을 두기 위하여 사용된다. 다음으로, PCR에 의해 또는 제한효소 절단에 의해 pcatAX로부터 선형 DNA 유래된 선형 DNA는 수크로오스 상에서의 선택을 사용하는 rrfF 자리에서 catAX 카셋의 제2 복제를 도입하는데에 사용된다. 이후에, 결과로 얻은 균주는 시스, 시스-뮤콘산 생산에 대해 그의 조부모 균주와 비교하여, catAX가 제한 단계인 것을 확인했다. 유사한 방법에 의해, 실시예 2 내지 15로 부터의 카셋 각각은 율속 단계에 대해 시험된다. 만일 단계가 율속이라고 판명되면, 관련 카셋의 하나 이상의 추가 복제는 염색체에서 또 다른 적절한 위치에서 통합되어, 플라스미드 또는 유도 프로모터의 필요 없이 시스, 시스-뮤콘산 생산에 추가적인 개선을 가져왔다.
실시예 17
발효에 의한 시스, 시스-뮤콘산의 생산
시스, 시스-뮤콘산은 상기 실시예 1 내지 15에서 개시된 유전적으로 조작된 미생물에 의해 생산될 수 있다. 성장 배지는 광범위하게 변화될 수 있고, 미생물의 충분한 성장을 지원하는 임의의 배지일 수 있다. 바람직한 배지는 미네랄 염 및 글루코오스, 자일로오스, 락토오스, 글리세롤, 아세테이트, 아라비노오스, 갈락토오스, 만노오스, 또는 수크로오스와 같은 비-방향족 탄소원을 함유하는 최소 배지이다(바람직한 최소 성장 배지의 예에 대해 전술한 내용을 참조). 유전자 조작된 미생물 및 성장 배지의 각각의 조합에 대하여, 시스, 시스-뮤콘산을 생산하기 위한 적절한 조건은, 온도, pH, 용존 산소량, 및 화합물 또는 pH를 유지하기 위한 화합물과 같은 발효 파라미터들이 조직적으로 변화되는 정례적인 실험에 의해 결정된다. 시스, 시스-뮤콘산이 생산됨에 따라, 하나 이상의 화합물들은 pH가 낮아지는 것을 방지하기 위하여 발효기 안으로 공급되어야만 한다. 산을 중화하기에 적합한 화합물은 산화물, 수산화물, 카보네이트, 및 암모늄, 소듐, 포타슘, 칼슘, 마그네슘의 바이카보네이트와 같은 알칼리성 염, 또는 이러한 알칼리성 염의 두개 이상의 조합을 포함한다.
7 리터 발효기에서 대장균의 MYR428 균주에 의한 뮤콘산 생산은 도 18에 보여진다. △aroE △ackA::P 15 -aroB △poxB::tktA의 유전자형을 갖는 대장균의 MYR261 균주는 플라스미드 pCP32AMP 및 pMG37로 형질전환되어, MYR428을 생성한다. MYR428은 글루코오스 공급과 함께 48시간 동안 전술한 7리터 발효기에서 성장되었다. 최종 뮤콘산 역가는 16 g/l였다(도 18 참조).
발효가 종료된 후에, 세포들은 응집, 원심분리, 및/또는 여과에 의해 제거되고, 시스, 시스-뮤콘산은 이후에 하기 하나 이상의 단계들의 조합에 의해 정화된 브로스로부터 정제된다. 예를 들어, 침전법, 재결정법, 전기투석법, 크로마토그래피법(이온 교환, 소수성 친화, 및/또는 크기 기초), 미세여과법, 나노여과법, 역삼투법, 및 증발법.
Figure pct00001
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
SEQUENCE LISTING <110> MYRIANT CORPORATION Yocum, R. Rogers Gong, Wei Dole, Sudhanshu Sillers, Ryan Gandhi, Meghal Pero, Janice G. <120> PRODUCTION OF MUCONIC ACID FROM GENETICALLY ENGINEERED MICROORGANISMS <130> MC2013-01PCT <150> US 61/632,777 <151> 2012-01-30 <160> 41 <170> PatentIn version 3.5 <210> 1 <211> 195 <212> DNA <213> P15 promoter; <400> 1 gctattgacg acagctatgg ttcactgtcc accaaccaaa actgtgctca gtaccgccaa 60 tatttctccc ttgaggggta caaagaggtg tccctagaag agatccacgc tgtgtaaaaa 120 ttttacaaaa aggtattgac tttccctaca gggtgtgtaa taatttaatt acaggcgggg 180 gcaaccccgc ctgtt 195 <210> 2 <211> 164 <212> DNA <213> P26 promoter; <400> 2 gcctacctag cttccaagaa agatatccta acagcacaag agcggaaaga tgttttgttc 60 tacatccaga acaacctctg ctaaaattcc tgaaaaattt tgcaaaaagt tgttgacttt 120 atctacaagg tgtggtataa taatcttaac aacagcagga cgct 164 <210> 3 <211> 91 <212> DNA <213> PR promoter; <400> 3 acgttaaatc tatcaccgca agggataaat atctaacacc gtgcgtgttg actattttac 60 ctctggcggt gataatggtt gcatgtacaa g 91 <210> 4 <211> 359 <212> PRT <213> 3-dehydroshikimate dehydratase encoded by the qa-4 gene; <400> 4 Met Pro Ser Lys Leu Ala Ile Ser Ser Met Ser Leu Gly Arg Cys Phe 1 5 10 15 Ala Gly His Ser Leu Asp Ser Lys Leu Asp Ala Ala Gln Arg Tyr Gly 20 25 30 Tyr Leu Gly Ile Glu Leu Phe Tyr Glu Asp Leu Val Asp Val Ala Glu 35 40 45 His Leu Ser Asn Glu Arg Pro Ser Pro Glu Gly Pro Phe Val Glu Ala 50 55 60 Gln Ile Ala Ala Ala Arg His Ile Leu Gln Met Cys Gln Ala Arg Gly 65 70 75 80 Leu Glu Val Val Cys Leu Gln Pro Phe Met His Tyr Asp Gly Leu Asn 85 90 95 Asp Arg Ala Glu His Glu Arg Arg Leu Glu Lys Leu Ala Leu Trp Ile 100 105 110 Glu Leu Ala His Glu Leu His Thr Asp Ile Ile Gln Ile Pro Ala Asn 115 120 125 Phe Leu Pro Ala Asn Gln Val Ser Asp Asn Leu Asp Leu Ile Val Ser 130 135 140 Asp Leu Cys Lys Val Ala Asp Ile Gly Ala Gln Ala Leu Pro Pro Ile 145 150 155 160 Arg Phe Ala Tyr Glu Ser Leu Cys Trp Ser Thr Arg Val Asp Leu Trp 165 170 175 Glu Arg Cys Trp Asp Ile Val Gln Arg Val Asp Arg Pro Asn Phe Gly 180 185 190 Ile Cys Leu Asp Thr Phe Asn Ile Leu Gly Arg Ile Tyr Ala Asp Pro 195 200 205 Thr Ser Pro Ser Gly Arg Thr Pro Asn Ala Lys Glu Ala Val Arg Lys 210 215 220 Ser Ile Ala Asn Leu Val Ser Arg Val Asp Val Ser Lys Val Phe Tyr 225 230 235 240 Val Gln Val Val Asp Ala Glu Arg Leu Ser Lys Pro Leu Leu Pro Gly 245 250 255 His Pro Tyr Tyr Asn Pro Glu Gln Pro Ala Arg Met Ser Trp Ser Arg 260 265 270 Asn Cys Arg Leu Phe Tyr Gly Glu Thr Glu Tyr Gly Ala Tyr Leu Pro 275 280 285 Val Lys Glu Val Ala Arg Ala Leu Phe His Gly Ile Gly Phe Glu Gly 290 295 300 Trp Val Ser Leu Glu Leu Phe Asn Arg Arg Met Ser Glu Glu Gly Pro 305 310 315 320 Glu Val Pro Glu Glu Leu Ala Met Arg Gly Ala Ile Ser Trp Ala Lys 325 330 335 Leu Val Gln Asp Leu Arg Ile Pro Val Glu Gly Pro Leu Val Thr Met 340 345 350 Pro Arg Val Ser Ala Ser Leu 355 <210> 5 <211> 2160 <212> DNA <213> qa-4 gene from Neurospora crassa plus surrounding sequences; <400> 5 gaattcggga aatggaatct tacctgggaa ccgaaatcac agtccgggta ggttatagag 60 catatagtga actgtcaaag ttctagacct ggaccagcca cttggagtcg ttgttttagt 120 tatacctaca ttcactcact gttgactttc aatcatactt acttagacgg agcaacgcgc 180 cagaatccaa attgttgcat agttgcggta tcaccaagtg gcttcccata atagtttgcc 240 attcgatgag acagctaact ggaagaccgg tactcgcagg ttgcacgatt acacggaagg 300 attcggtatt ccgtgtttca tctgtcaaag tccctttcca tatgaatccg aggtactatg 360 actggatctc gatacaagct ggccagcgag gtgcctgcct tgacaggctg tcaactgcgg 420 gacggccggc taagtgttta acacgcaagg gtggaagatg tctcgtcccg tcatccaaga 480 ccgtcaacat tcgaggccat ctgatcgttg aagagatgct aaatcttgtg aaacgctcat 540 aggtcgctta ccttcggccc acccgttaat gctttattcc gctgagcaaa cttcggcttc 600 catcccgcgg ttcaccgttt acatcactta tcgttgcggt tattggccga ttcttcgcaa 660 accgaaacga tgacatcccg aatatctgca atacaccgcc acggccggcg tctttatcac 720 acctcctatg ggagacgaaa gtgccttgat acccctagtc atttgaagat tcaggatggg 780 agacggctgg ccgcttgcgg agttacgttc gagtcttggt cgcaggaacg cttgccgtat 840 tgaatgagac cccgagaagg tcaaatcaaa tcttggaaga ccccaactgc ttcctcattg 900 ccttcactcc ccatatcaat ggggcacatc ctgtgactac cttggtgctt tatttcctca 960 ccatttggcg atacaagctc aaggacaccg aggtgatata cagttcttca aggacactat 1020 ctcacctcaa tatcaagaac cagtctcatc atctcttatt tctccaggat ccccccacca 1080 acaacatcgg cttttttttt tcccctattc tcaagaccca tcaagacgct cacttcgctg 1140 agcctttcgc catgccgtca aagctagcca ttagttccat gtccctaggg cgctgctttg 1200 ccggccactc tctggacagc aagcttgatg ccgctcaacg atacggctat cttggtatcg 1260 agctttttta tgaggatctg gtcgacgttg cagagcattt gtcgaacgag cgtccctctc 1320 ccgaaggccc ttttgtcgaa gctcagatag ccgccgctcg tcatattctc cagatgtgtc 1380 aagccagggg gcttgaggtc gtctgcctcc agcctttcat gcactacgac ggccttaacg 1440 acagggcaga acatgagcgt cgtctggaga agctagcact atggattgag ctcgctcatg 1500 agcttcacac cgacatcatt cagatcccag ccaacttcct ccctgccaac caagtcagtg 1560 acaacctcga cctgattgtc tcagatcttt gcaaggtggc cgatattgga gctcaagctt 1620 tgccccctat ccgctttgcc tacgagagtc tttgctggag cacccgtgtc gacctctggg 1680 agcgctgctg ggacatcgta caacgcgttg accgccccaa ctttggcatt tgccttgaca 1740 ccttcaacat cctcggccgc atctatgccg accctacatc tcctagcggt aggacaccca 1800 acgcaaaaga ggcagtcagg aagtccatcg ccaacttggt ctcgcgcgtg gatgtctcca 1860 aagtcttcta cgtccaggtg gttgacgccg agaggctgag caagccacta ctgcccggtc 1920 acccgtatta caatccagag cagccggcga ggatgagctg gtcgcgcaat tgtagactgt 1980 tctacggcga aacagaatat ggtgcgtatc ttcccgtgaa ggaggttgct cgagcccttt 2040 tccacggcat tggtttcgag ggctgggtca gtttggagct tttcaaccgc agaatgtctg 2100 aggagggacc tgaagtgccg gaggaacttg ccatgagagg cgctatctcg tgggccaagt 2160 <210> 6 <211> 348 <212> PRT <213> QutC from Aspergillus nidulans encoded by the qutC gene; <400> 6 Met Pro Ala Asn Leu Lys Ile Gly Ile Pro Thr Val Ser Leu Ser Lys 1 5 10 15 Pro Gly Leu His Ser Leu Asp His Lys Leu Arg Ser Ala Ala His Gly 20 25 30 Phe Ala Gly Ile Glu Leu Phe Ile Asp Asp Leu Ser His Phe Ala Ser 35 40 45 Ser Ser Phe Asn Gly Ser Leu Thr Gln Ala Ala Lys Tyr Ile Ser Ser 50 55 60 Leu Ala Lys Gln Leu Asn Leu Thr Phe Ile Cys Leu Gln Pro Phe Gly 65 70 75 80 Phe Tyr Glu Gly Leu Val Asp Thr Asn Gln Ser Thr Tyr Leu Leu Thr 85 90 95 Glu Lys Leu Pro Leu Trp Phe Ala Ile Ala Arg Ile Ile Gly Thr Asp 100 105 110 Leu Ile Gln Ile Pro Ala Asn Phe Leu Gln Asn Asp Pro Val Thr Gly 115 120 125 Ala Ala Arg Thr Ser Gly Asp Ile Arg Leu Ile Val Ser Asp Leu Gln 130 135 140 Thr Ile Ala Asp Ile Gly Val Lys Gln Gly Phe Arg Phe Val Tyr Glu 145 150 155 160 Ala Leu Cys Trp Ser Thr His Val Asp Thr Trp Glu Ala Ala Trp Asn 165 170 175 Val Val Lys Leu Val Asp Arg Glu Asn Phe Gly Ile Cys Leu Asp Ser 180 185 190 Phe Asn Thr Arg Thr Pro Leu Pro Ser Leu Gly Arg Arg Arg Met Leu 195 200 205 Ser Lys Pro Trp Pro Ser Pro Trp Arg Arg Ser Val Leu Ser Ser Pro 210 215 220 Val Glu Asn Trp Thr Ser Gly Lys Ser Ser Thr Ser Ser Leu Ser Met 225 230 235 240 Ala Ser Gly Cys Arg Arg Arg Trp Thr Arg Ser Thr Pro Phe Met Trp 245 250 255 Arg Ala Asn Pro Arg Arg Met Ser Trp Ser Arg Asn Ala Arg Leu Phe 260 265 270 Pro Cys Glu Glu Glu Arg Gly Gly Tyr Leu Pro Val Leu Glu Ile Ala 275 280 285 Arg Ala Phe Phe Glu Ile Gly Phe Glu Gly Trp Val Ser Leu Glu Leu 290 295 300 Phe Ser Arg Thr Cys Asn Asp Pro Asp Val Asn Thr Val Gly Glu His 305 310 315 320 Ala Arg Arg Gly Met Asp Arg Arg Arg Arg Val Val Ala Ala Leu Gly 325 330 335 Leu Asp Val Glu Val Pro Ala Arg Asn Cys Glu Cys 340 345 <210> 7 <211> 3298 <212> DNA <213> qutC gene from Aspergillus nidulans plus surrounding sequences; <400> 7 aagcttggtt tcaagtgatg atatatagtt atgaggatat aatatgaacc gaaagacgat 60 gtttcttgtg aatatttacg tgatagttgt ctgtctaata tggtacagca gtagaacaac 120 tacatacggt cactacttac agccctagtc attccctccc tcgattgcct accatttata 180 cactttgaac atccacaggc ttgcctccct ccatactctc cctaacagct tgaacaactc 240 tgagcgccct caccccatct tcaacgccac agccaactcc tcgctcgcca tcctcaccct 300 ttccactaac aacatcaaca aaatatcccc actgcgcatc aaacggcctc acatcagcat 360 ccttcactga aatctgctgc atcgccaact ccgtattcca gcctttctct ttcccctgtc 420 cacaagaaac atggtcatag ctccagcgcg tcatatcagg cacactgaga ctcgctctgg 480 ttccaagaat tcgataacag tcgcttgcac tcttggaagg agcgggcgga atcgtaggat 540 tctcgcccgt tcctgtttca aagttcaacg gcgaaggcgt cgcgtcgcag atgagaaatg 600 tgcctactat cccagacgca aagcgcagcg tcacagcaca gccttcctcg gcggtatgtt 660 ccgggttctg gcgcatgcgc tgcaggagtg taccctccgc gtagacccta ctgacgggcc 720 caaacagaaa ctgcagcacg tcgatatcgt ggataagatt aatccccagc acgccgccct 780 tcttcttatc tgcgcgccaa gaaccgagcg gcggcgcgaa gtaagaggcc ggcttcagaa 840 gtgtccagag gccgttcact gcaacgacgg tgccgagtga gtctgtctct aacaaagact 900 ttgtggtttg gatgtacgga ttgaagcggc ggtggtggcc gatctggatg ttgatcttcg 960 catccttgcc tctcttctca tctttacatt tctgttcctt gacggtagcg aggaggtgct 1020 cggccgactc cagatcgtca ctgatcggtt tctcaaggag gatattgcgg attccgttct 1080 ccagcagctg gagcgtgacg tccacgtgcg tgtgattggg cgtgctcacg atcgccgcgt 1140 ctggtttccc ggttgtctta ccgacaacgt ctaacataga cgtaatagaa tcatagcaag 1200 gaacgccaaa tgattctgcg accgggattg cagagggtga agggtcaaca aaagcgatca 1260 gctgggttcg tgggtgtcgt tgcacggatt gtgcgtgacg gggcccaata agtccggcac 1320 cgacgatgac aatgaggata ttcttgtcct tttccttgct gcagggcacc attgtgcatg 1380 tcggtggctg gaaataaaca gaacagggat atggtcaagt cggagaatcg gtgcaggata 1440 gaccggctac ttgatgtagg acgacagtcg cgatctaccg agagcgtgag attcactgtg 1500 ggactgattt atgtaatttg aggcgcagca gacttaggga cttgaaatgt ggctgtctgt 1560 ggatgcattt gcggggtatg gagtacagag tgcatacagc tgtgtatatg gagttcctta 1620 cggagagggt gacctggtat ggggagaacg ggcaaaatgc tcacccggca acctctcaaa 1680 gcgtttaccc ggtatactcc tctgatatca atatttccaa tcagcaccta tatcatcacg 1740 acgctctcct gaggattccg tagctaaccg ccctggatcc tacattaata aataagccat 1800 ttgctttttc tgctgcgagt gtgattctca atacgattac gtatcacatg cagattgcct 1860 ttacttcagc tgcatttgat cagccacagc tctaagagca aacataccct acctacctac 1920 ctacttcgcc tagggtacat aatcaccgcc atctcctcct cgatcagtct tcaactcaat 1980 cagctcattc attctattct taatataata tataccttta gatctccagc agagacccga 2040 agagtcggca attcaaaatg cccgcaaacc tcaaaatcgg tatcccaacc gtgtccctgt 2100 caaaaccggg cctgcactct cttgaccata agctccgctc ggccgctcat ggcttcgcgg 2160 ggatcgagct gtttattgat gacctctccc atttcgcctc atcgtcattc aatggctccc 2220 tcactcaagc ggcaaagtat atctcctcgc tcgccaagca acttaacctc acatttatct 2280 gcctgcaacc attcggtttc tacgagggtc tggtggacac aaatcagtcg acgtacctgc 2340 tcactgagaa actcccgctc tggtttgcga tcgcccgcat tataggcaca gatctcatcc 2400 aaatccccgc aaatttcctc cagaatgacc ctgtcaccgg ggctgcacga acaagcggcg 2460 acataaggct tatcgtctca gatctgcaga cgatcgcaga tatcggtgta aagcagggct 2520 tccgctttgt gtacgaggcg ctctgctggt cgacgcatgt cgatacatgg gaagcagcgt 2580 ggaatgtcgt caagctggtt gatagagaga atttcgggat ctgcctggat agcttcaaca 2640 cgcggacccc gcttccgtca ctgggaagac gccggatgct gagcaagccg tggccaagtc 2700 catggagacg ctccgttctc tcgtctccag tggagaactg gacatcagga aaatcttcta 2760 catccagctt gtcgatggcg agcggttgtc ggcgccgctg gacgagaagc acccctttca 2820 tgtggagggc caacccccga agaatgagct ggagtcgcaa tgcgcggtta ttcccctgtg 2880 aagaggagag gggtgggtat cttcctgtgt tggagatcgc gagggcgttc tttgaaatcg 2940 ggttcgaggg gtgggtgagt ctagagctgt tttcaaggac gtgtaatgat cccgatgtga 3000 acacggtggg ggagcatgcg agacgtggga tggatagaag gaggagggtt gttgcggcgc 3060 taggactcga tgttgaggtg ccagcacgta actgtgaatg ttagcatgaa cggcaaggag 3120 agggtggagg tgcaggtgca ggaggagctg gctgttcagc atcggctgta ggtagtggta 3180 tcttgaaagg acgatagggt ttgatctaga gatttttatt ttgtctaatt actggtaatg 3240 atggcctcat gcacgctgtt gaacacgctg tacaacatca ctgttgaaga tgatacct 3298 <210> 8 <211> 502 <212> PRT <213> AroY from Klebsiella pnemoniae ATCC25597; <400> 8 Met Thr Ala Pro Ile Gln Asp Leu Arg Asp Ala Ile Ala Leu Leu Gln 1 5 10 15 Gln His Asp Asn Gln Tyr Leu Glu Thr Asp His Pro Val Asp Pro Asn 20 25 30 Ala Glu Leu Ala Gly Val Tyr Arg His Ile Gly Ala Gly Gly Thr Val 35 40 45 Lys Arg Pro Thr Arg Ile Gly Pro Ala Met Met Phe Asn Asn Ile Lys 50 55 60 Gly Tyr Pro His Ser Arg Ile Leu Val Gly Met His Ala Ser Arg Gln 65 70 75 80 Arg Ala Ala Leu Leu Leu Gly Cys Glu Ala Ser Gln Leu Ala Leu Glu 85 90 95 Val Gly Lys Ala Val Lys Lys Pro Val Ala Pro Val Val Val Pro Ala 100 105 110 Ser Ser Ala Pro Cys Gln Glu Gln Ile Phe Leu Ala Asp Asp Pro Asp 115 120 125 Phe Asp Leu Arg Thr Leu Leu Pro Ala His Thr Asn Thr Pro Ile Asp 130 135 140 Ala Gly Pro Phe Phe Cys Leu Gly Leu Ala Leu Ala Ser Asp Pro Val 145 150 155 160 Asp Ala Ser Leu Thr Asp Val Thr Ile His Arg Leu Cys Val Gln Gly 165 170 175 Arg Asp Glu Leu Ser Met Phe Leu Ala Ala Gly Arg His Ile Glu Val 180 185 190 Phe Arg Gln Lys Ala Glu Ala Ala Gly Lys Pro Leu Pro Ile Thr Ile 195 200 205 Asn Met Gly Leu Asp Pro Ala Ile Tyr Ile Gly Ala Cys Phe Glu Ala 210 215 220 Pro Thr Thr Pro Phe Gly Tyr Asn Glu Leu Gly Val Ala Gly Ala Leu 225 230 235 240 Arg Gln Arg Pro Val Glu Leu Val Gln Gly Val Ser Val Pro Glu Lys 245 250 255 Ala Ile Ala Arg Ala Glu Ile Val Ile Glu Gly Glu Leu Leu Pro Gly 260 265 270 Val Arg Val Arg Glu Asp Gln His Thr Asn Ser Gly His Ala Met Pro 275 280 285 Glu Phe Pro Gly Tyr Cys Gly Gly Ala Asn Pro Ser Leu Pro Val Ile 290 295 300 Lys Val Lys Ala Val Thr Met Arg Asn Asn Ala Ile Leu Gln Thr Leu 305 310 315 320 Val Gly Pro Gly Glu Glu His Thr Thr Leu Ala Gly Leu Pro Thr Glu 325 330 335 Ala Ser Ile Trp Asn Ala Val Glu Ala Ala Ile Pro Gly Phe Leu Gln 340 345 350 Asn Val Tyr Ala His Thr Ala Gly Gly Gly Lys Phe Leu Gly Ile Leu 355 360 365 Gln Val Lys Lys Arg Gln Pro Ala Asp Glu Gly Arg Gln Gly Gln Ala 370 375 380 Ala Leu Leu Ala Leu Ala Thr Tyr Ser Glu Leu Lys Asn Ile Ile Leu 385 390 395 400 Val Asp Glu Asp Val Asp Ile Phe Asp Ser Asp Asp Ile Leu Trp Ala 405 410 415 Met Thr Thr Arg Met Gln Gly Asp Val Ser Ile Thr Thr Ile Pro Gly 420 425 430 Ile Arg Gly His Gln Leu Asp Pro Ser Gln Thr Pro Glu Tyr Ser Pro 435 440 445 Ser Ile Arg Gly Asn Gly Ile Ser Cys Lys Thr Ile Phe Asp Cys Thr 450 455 460 Val Pro Trp Ala Leu Lys Ser His Phe Glu Arg Ala Pro Phe Ala Asp 465 470 475 480 Val Asp Pro Arg Pro Phe Ala Pro Glu Tyr Phe Ala Arg Leu Glu Lys 485 490 495 Asn Gln Gly Ser Ala Lys 500 <210> 9 <211> 5502 <212> DNA <213> aroY gene of Klebsiella pneumoniae 342 plus 2 kilobases of surrounding DNA sequences; <400> 9 gcgacgccga ctgggcgatc cgtgaactgc tggcgcgtat gacccagcgt ctgcagggct 60 gtgaaaccat agaggatgtg attaaggtgg cggagctgtt cgcgccgaac atcgccccga 120 cgatccccgg taaactgtat attctggata ccgatccatg gcagatgcgc tgcgtggcgc 180 agtggctgtc gcccgccggg gagacgacgt cctttgctcc cgacgactgc tgggcgatac 240 ggcggggact cagccatccg ccggtgcagg gtgagcccga tatcacctgc tatcatctgc 300 cggaggcgca cgccggccag tcgctctgcg taccgctcat cgcccagggc gaagcgatcg 360 gtctgctgag ctttcagaac gtcaccgcca gtgacgcccc ttcccgggct tacctggagc 420 tgatggccga agcgctgggg ctggcgctcg ccaatcagcg tttacgcagc gccctgctgg 480 aaaaagcgtt gttcgattcg ctgaccggcc tgcgtaaccg ccatcatctt gatgaagcgc 540 tgcactcgca gatggcgctg gcggtccata cccacacccc gctgagctgc ctgatgatcg 600 acatcgatca cttcaaagcc atcaatgacc gctacggcca tgaagccggg gatctggtga 660 ttaagagcgt cgcgaccatt gtgcagcgcg cggtgcgcga tatcggcatg gctttccgct 720 acggcggcga ggagttttta gtgctgctcc ccgggattga cgaagccggg gcgcaccagt 780 gcgccagcga gatctacacc caggtgcaca atatgacgct gcgcgatggc ctgacggaga 840 taggccaggt ggatgtgtcg attggcatcg ccagctaccc gcagcacacc caaagcgaca 900 gcctgctgcg cgcagcggac gccgcgctgt accgggcgaa agagctgggc cgttcaagga 960 ttgtcagctt tggccgcctg aagacccgct aagcgggatt attgctcagc ggcattaagc 1020 agcgagataa ctttccgcac caccgccgaa cggaaatggc ggtggtaaac catgctcagc 1080 tcactctccg ccagccgatc ctgaagatcg atatacacca cgttatcaag gcgtaaggcc 1140 ctcgccgaga ccggcaccag cgccaccccc accccggcgg agaccaggct aatcatcgag 1200 gtgacatcgt taattcgctg caccacctgc ggcgtaaaac ccgcgacgcg acaggcgtca 1260 ataaatacct gctccagtcc ggtgccctgc ggatcgtcaa gcgagatcca gttgtcagtg 1320 cgcaacgagg ccagattgag cgcccccacg cctgccagcg gatgctgttg ataaagcgcc 1380 aggcaaagtt tttcccgcac aaatggcctg accaccagcg cgtccggcgg tgacgccagc 1440 ggcgcgcgga tgatggcgat atccagacgc agatccagca gcgcttcgta gagcatttgc 1500 acatccccct gcaccagcga cagctcaatc cccggccagt cagcgcgcag ctcgcgcagg 1560 agccccggca gtttgctgtc atacatcgca ctggagacat agcccagatg caatcgcccc 1620 tgctcgcctc gtgcggtgcg ctgggcgtcc aggaccgcct gatcggccat ctccagcgcc 1680 agccgcgtct tctgcaagaa ggcctcgccc gcggcggtga gggtcaggcg ccggttagcg 1740 cgggagaaga gcaccacgcc caggcgctgc tcgagttgtt taatctgctg gctgagggcg 1800 ggctgggcga tatgtaaccg ctctgccgcc cgatgcatat gtagttcttc agcaacgacc 1860 acaaaatggc gtaacgctcg caaggacatg gccggactcc gcggagtaaa ttgataataa 1920 aaatgttatc aataaagcat gaatgatgca attgataacc attagcctgc gagcatactg 1980 tgcgcatcga cacgctaagg agaacatcat gaccgcaccg attcaggatc tgcgcgacgc 2040 tatcgcgctg ctgcaacagc atgacaatca gtacctcgaa accgatcatc cggttgaccc 2100 taacgctgag ctggccggcg tctatcgcca catcggcgcg ggcggcaccg tgaagcgccc 2160 cacgcgcatc ggcccggcga tgatgtttaa caatattaag ggctatccgc actcgcgcat 2220 tctggtgggc atgcacgcca gccgccagcg ggccgcgctg ctgctgggct gcgaagcctc 2280 acagctggcg ctggaggtag gcaaagcggt gaaaaaaccg gtcgcgccgg tggtcgttcc 2340 ggccagcagc gccccctgtc aggaacaggt ctttctggcc gacgatccgg attttgattt 2400 gcgcaccctg ctcccggcgc ccaccaacac cccgatcgac gccggtccct tcttctgcct 2460 gggcctggcg ctggccagcg atcccgacga cgcctcgctc accgacgtca ccatccaccg 2520 cttgtgcgtc cagggccggg atgagctgtc gatgtttctc gccgctggcc gccatatcga 2580 agtgtttcgt cagaaagccg aggccgctgg caaaccgctg ccgataacca tcaatatggg 2640 actcgatccg gctatctata tcggcgcctg ctttgaagcg ccgaccacac gtttggctat 2700 aacgaactgg gcgtcgccgg tgcgctgcgt cagcgtccgg tagagctggt acagggcgtc 2760 agcgtcccgg agaaagccat cgctcgcgcc gagatcgtta tcgaagggga actgctgccg 2820 ggggtacgcg tcagagaaga tcagcacaca acagcggcca tgcgatgccg gaatttcctg 2880 gttactgcgg cggcgccaat ccgtcgctgc cggtcattaa agtcaaagcg gtgaccatgc 2940 gaaacaatgc gattctgcag acgctggtag ggccgggcga agagcatacc accctcgccg 3000 gattgccaac ggaagccagt atctggaatg ctgtcgaggc tgctatcccg ggctttttac 3060 aaaatgtcta cgcccacacc gcgggcggcg gtaaattcct cgggatcctg caggtgaaaa 3120 aacgccagcc cgccgacgaa gggcgtcagg ggcaggccgc gttgctggcg ctggcgacct 3180 attccgagct gaaaaatatc attctggtcg atgaagatgt cgatatcttt gacagcgacg 3240 atatcctgtg ggccatgacc acccgcatgc agggggatgt cagcatcacg acgatcccag 3300 gcattcgtgg tcaccagctg gatccttccc agaccccggc ctacagcccg tcgatccgcg 3360 gagagggtat cagttgcaag acgattttcg attgcacggt gccgtgggcg ctaaaatcac 3420 acttcgagcg cgcaccgttt gccgatgtcg atccgcgtcc gtttgcgccg gagtattttg 3480 cccggctgga aaaaaaccac ggtcagtaaa atcaggtgat agccgccgga gcacggcggc 3540 atcttccggg ccagcatcac ctgcagcggg tggctgacgc agggttagtt gatcgcggcg 3600 gagaggtctt ttttcacctg ctcacgctgc tcgggggtca acacctggct cacgtcgaag 3660 tagtatttca cacgataata ccgcacctgc tggtccagct ggccaaaggc ggccagctgc 3720 tgtttgacct tagcgtcatc ccatttcccg gagtgaataa cgtctgccag ggcaccatcc 3780 tgatagccgc tgatttaatc tggcttacat tgttttcgaa tccctgacgc agcgcctgga 3840 ttttggcgac ctgctcttca ctcagcttca ggtgctggac gaccggatcc tgcgagacag 3900 acggtatatc ggcggaggtc gacgcctggc tggctgccgt aaagcaggtg gtcagcgcaa 3960 tggcgagcag ggtgttacgc aagcgagtat tcacagtgaa tgatccttca aaaaagaaaa 4020 tgagaggcga ttatcactgc gctaataaag actatctgta acaaagggtt aatttaaaac 4080 tggataaaaa aaggatggta agaaacagaa atcagatccc gggtcagcag cacagaaaga 4140 tatattcatc cttccagtaa cggccctgtc caatgatatc cccggcggcg ctgattaact 4200 gtttttgctt ttggtttcaa tcccctcaac gatcacatgg ctggtcaggg tatgaataga 4260 ttgcaacagc ccgggaaaag cggggtcgtt ttctttatcc cagaagtaat ctttatccac 4320 tttgacgcaa tcgaagcgga agcgctccag cagcgggaag gacgtcgtcc gcggccaaaa 4380 tcatccagcc agaccgggca aagcgccgcc agcgtgctca gcgccgtcag ctcacgtccg 4440 gcgataaact cgtgaaagtt ctcatttatt tccagagcaa tgtgtttaca ggagcgcagg 4500 aaatcacaga gatagcgatc cgtcagaata aagtggctta ataaatcatc aatattcagc 4560 gatatcggtt tattatcgac ccgggcgaaa tcaaatacag aaagtaactc gatttgccga 4620 ataaatagag caagcttatc gcgttcggta agcgtggaga aagaaaacgt cgacgcagag 4680 gtggtatttt gtgcgggtgc tataatatct ttagtaagca actcccacga gtggtagctg 4740 ccgtcatcgc taatagcggg ctccagaacg aagcgataag aggtattttt cacgttttct 4800 tcaaccattt aaaaaatacc aaaaataaga aagggttaag catgtcatat attttccgcc 4860 aacaaaaata gtttaaagtg atcgataata atcattcgat agttaaaaac tatcaagata 4920 taatttattg atcggtaaat tgaattaata taaattagcc actgccgtaa ctccctctga 4980 aaagtcaatt aaaatattgt ttcaaaccag ccagttacca gagtattctg cgtaaagcct 5040 ggtcgtctca cgctttgtgc tgccaggtaa aaaaagagag gggtaataaa aatgaaaaat 5100 acaagccgcc agttttagtc atatcattat gccgaatatg aataacgctg cgctgaggcg 5160 ccgcttcgcc tggcatgcca tgagtcctca acaaaaaagt gtgactcagt cgacaaaacg 5220 tcatattttc ccgctatcct gcagcgaaga agagtgaagt ggatgacagg cagtgaaaaa 5280 aataaacgtg attccgctgg ggctgatgct attcatgctc atcgccagcg catggctggg 5340 ccctgcgccg cggcacaccg gcagcatgca gtgcgtttgg tttgacgggg caatggtgag 5400 ctgcctgccg aagcaacgac tgggcgaagg ctcgccgcat catttactgg tcagacgata 5460 aaccggtact cgccgggtgg tgttgaacag attatcgctg gc 5502 <210> 10 <211> 4629 <212> DNA <213> catA gene from Acinetobacter baylyi ADP1, including 410 bases of upstream sequence and two open reading frames downstream; <400> 10 atctgctcga ccatagtaat gatcacatta tgagctaaat ttacttttta aaatttaaat 60 atattatata tatttgaatt ttattgtttt attttaattt ttagcttaga agtttttatt 120 aagatttatt tttaaattag atgtcgaaaa aattagtata ccaaaaaagc atgaaaacat 180 actctcttag gaattggagt cgccatgagt ttcagataca gttgatcagt atggaaggta 240 tagaaacgac tatcgaaata aataagtttg tggtgtgtga agcaaggtaa agctcaaggc 300 tgaggcaaac caagcaaagg ttaattgaac cgatatgcac aacacattca acgatagcgt 360 cgacagataa gtttatcaaa tgatgttttg gcgatttcaa ggagaaagcc atggaagtta 420 aaatattcaa tactcaggat gtgcaagatt ttttacgtgt tgcaagcgga cttgagcaag 480 aaggtggcaa tccgcgtgta aagcagatca tccatcgtgt gctttcagat ttatataaag 540 ccattgaaga tttgaatatc acttcagatg aatactgggc aggtgtggca tatttaaatc 600 agctaggtgc caatcaagaa gctggtttac tctcgccagg cttgggtttt gaccattacc 660 tcgatatgcg tatggatgcc gaagatgccg cactaggtat tgaaaatgcg acaccacgta 720 ccattgaagg cccgctatac gtggcaggtg cgcctgaatc ggtaggttat gcgcgcatgg 780 atgacggaag tgatccaaat ggtcataccc tgattctaca tggcacgatc tttgatgcag 840 atggaaaacc tttacccaat gccaaagttg aaatctggca tgccaatacc aaaggctttt 900 attcacactt cgacccaaca ggcgagcagc aggcgttcaa tatgcgccgt agtattatta 960 ccgatgaaaa cggtcagtat cgcgttcgta ccattttgcc tgcgggttat ggttgcccac 1020 cagaaggtcc aacgcaacag ttgctgaatc agttgggccg tcatggtaac cgccctgcgc 1080 acattcacta ttttgtttct gccgatggac accgcaaact aactacgcaa attaatgtgg 1140 ctggcgatcc gtacacctat gacgactttg cttatgcaac ccgtgaaggc ttggtggttg 1200 atgcagtgga acacaccgat cctgaagcca ttaaggccaa tgatgttgaa ggcccattcg 1260 ctgaaatggt tttcgatcta aaattgacgc gtttggttga tggtgtagat aaccaagttg 1320 ttgatcgtcc acgtctagcg gtgtaataca ccaaaatggt tcaaaattat caggcgagtg 1380 atcatgatca ctggcctgtt tttatttcag ggaagggtgg agacaattac gtggacaatc 1440 aaatcattca ggaaaccgta gataaaattt taagcgtatt gccgaatcag gctgggcaat 1500 tggcacgctt ggttcgtctg atgcagtttg cttgtgaccc caccattacc gtcattggta 1560 aatataatca tggtaaaagc cgactactca atgagctgat cgggacagat attttttctg 1620 ttgccgataa acgagagacg attcaactgg ccgaacataa acaagatcag gtgcgttggt 1680 tggatgcacc cggactcgat gcagatgttg cggcagtgga tgatcgtcat gcttttgaag 1740 cagtctggac acaggcagat attcgccttt ttgtgcattc agtccgagaa ggcgaactcg 1800 atgcaactga gcatcatctt ttacaacaac ttattgaaga tgcagaccat agccggcgcc 1860 aaaccatact ggtcttgacc cagatagatc agataccgga tcagacaatt ttaacccaga 1920 ttaaaacctc aattgcacag caggtaccca aactcgatat ttgggctgtt tcggccactc 1980 gccaccgtca gggtattgaa aatggaaaaa ccttgctgat cgaaaaaagt ggaatcggcg 2040 cgttacgaca tacacttgag caggcacttg ctcaggttcc atctgcacga acgtatgaaa 2100 agaatagatt gctgtctgac ttgcatcatc aacttaagca gttattactc gatcaaaaac 2160 atgtacttca gcaactacaa cagacacagc agcagcaatt gcatgacttt gatacaggac 2220 tcatcaacat actcgataag attcgagtag atcttgagcc cattgtaaat atagatggtc 2280 aagaccaagc actcaatcca gattcatttg ccacgatgtt taaaaataca gcagccaagc 2340 agcaacgtgc caaagtgcag attgcttact cacgtgcctg tatcgagatc aatagccatc 2400 tcatacgtca cggtgtggtg ggtttacccg cagagcaaca aaccacgata aaaagtattg 2460 atacggtcat tgttgcggtt tttggaattt cagtgaaatt tcgcgatcag ctacgtgcat 2520 tgttttatac cgataccgaa cgacaacgct tgcaaagaga gtttcgattt tattttgaaa 2580 agtcagcagg ccgaatgatt ttagctgcca agattgagca gacaatgcgg cagcaagggt 2640 gtattcaaaa tgcaatgatg gcgttgcaac agatggagag tgcagcatga ccagcggcgg 2700 acacattcaa ttgtttatcg aacacacccg gcagattgcg actgcccaag gggatataca 2760 gttggcattg caatcgatgc agcaatggcg cgaagcattt gctacagcat taaaacaaaa 2820 tacctttgat ttaacgggct ggtcaccgca gacaaagatc gccaatcaac tcaagcaatt 2880 taaccataag cttacaacgc atgtatcgaa ttgggatacc gaatggcata cttttagtgc 2940 tgctcaatcg gttgcagaag tatttcatga tcgggtgatg ttgcttgtat tcggtaagtt 3000 taatgccgga aagagttcat tgtgtaactt actggccgaa tgctttcgtt ctcacgaaca 3060 aaccgtgcaa tattttcatg ttcaaaatga acagatattt tataccgaat ctcacttacg 3120 cgaaggtgca accgagacga cagcgcaact acagggcgta tgtctgggtg aaaaacttat 3180 tttgctagat acaccaggtt tgcattctgg tactcagaaa aatgcagcgc tcacacaaaa 3240 atttatcgac agtgcagatg gtgtgctgtg gctcagtagc gcaacttcac cgggtcaggt 3300 gcaagagcta gatgcactgg ggcgcgagtt aaagcgtcat aaacctttat ttcctgttat 3360 tacccgaagc gattttgtcg aagaagatga aattgatggt gagctatgta cagtgctttg 3420 caataaaaat tcagaacaac gtgcgttgca agagtctgat gtattgatgc gtgcgaaaga 3480 aaaactgcac atatgcaagt ggatgtgagt ttattaaagc cgcccgtgtc cgtttcaact 3540 caaatggcgc gtgaagcaga tatgaaccca caagccatga acgaggctgg ttttgagcga 3600 ttatttgcag cacttttggc tcttattgag cctgctttgc gctataagca gcgtaaacct 3660 gccgaagtat tgttgcattt tttgcaagaa catatcattg aaggtttaag gttttacctg 3720 caacccgatc tagagcaaat acaacaggac ctcaaacagg ctcaagatga tttacgacag 3780 ctacacaccg atttagccga ggcagtctgg cgtagcgtat tgcctgagct accacaactt 3840 cttgagcaac atgcaagtac acaaaatatt gatgccgtag tgaacagttt gaacgagtgg 3900 ataaacgtcg cattcgaaca acagcttgca attcagcttg atgcttatgg tttaaatttg 3960 gattcgctta gcaagatcga aaaaaccgaa aaaatgcagt atgaacgcat tgcgggaatg 4020 gtggtgcatg atggcttgta cacgactctc acgcagcaga ttcaacaagc tgtcaaagct 4080 tctacgagtg aattgattga tcagtgtcag gctcaacttg agcagtcaat caaacatgtt 4140 caaacactcg atgaaacctt catcgattac agcgcagcac tcgatcaact cagccaagcg 4200 ctacgcattg aataaagagc agtaaatttt tcagacatat tttattcgat gagtggcctg 4260 atatggtgcg ttgcaaacac ctcctgtaca caggcgagaa ttttaggaat gtaattactg 4320 tggtccatat ttcgcaccgc gagtgaaatt gggctatagg catcatcatc taaaattgga 4380 atataaagta gattcttcac cccaatatcc atggcagacg ccggtacgat gcagacgcct 4440 tcacctgctg ccaccaagcc gagtgccagt tgaatttctc gaatttcggt gagtttggat 4500 ggtactaggc ctagttcggt aaagagtgac tgaataaagg tcgcaaaatt gggcttttga 4560 gagactgggt acagcagcat cggttcatca ataatttgag agagatgaac ccctgttgct 4620 gcaaactga 4629 <210> 11 <211> 311 <212> PRT <213> CatA from Acinetobacter baylyi ADP1; <400> 11 Met Glu Val Lys Ile Phe Asn Thr Gln Asp Val Gln Asp Phe Leu Arg 1 5 10 15 Val Ala Ser Gly Leu Glu Gln Glu Gly Gly Asn Pro Arg Val Lys Gln 20 25 30 Ile Ile His Arg Val Leu Ser Asp Leu Tyr Lys Ala Ile Glu Asp Leu 35 40 45 Asn Ile Thr Ser Asp Glu Tyr Trp Ala Gly Val Ala Tyr Leu Asn Gln 50 55 60 Leu Gly Ala Asn Gln Glu Ala Gly Leu Leu Ser Pro Gly Leu Gly Phe 65 70 75 80 Asp His Tyr Leu Asp Met Arg Met Asp Ala Glu Asp Ala Ala Leu Gly 85 90 95 Ile Glu Asn Ala Thr Pro Arg Thr Ile Glu Gly Pro Leu Tyr Val Ala 100 105 110 Gly Ala Pro Glu Ser Val Gly Tyr Ala Arg Met Asp Asp Gly Ser Asp 115 120 125 Pro Asn Gly His Thr Leu Ile Leu His Gly Thr Ile Phe Asp Ala Asp 130 135 140 Gly Lys Pro Leu Pro Asn Ala Lys Val Glu Ile Trp His Ala Asn Thr 145 150 155 160 Lys Gly Phe Tyr Ser His Phe Asp Pro Thr Gly Glu Gln Gln Ala Phe 165 170 175 Asn Met Arg Arg Ser Ile Ile Thr Asp Glu Asn Gly Gln Tyr Arg Val 180 185 190 Arg Thr Ile Leu Pro Ala Gly Tyr Gly Cys Pro Pro Glu Gly Pro Thr 195 200 205 Gln Gln Leu Leu Asn Gln Leu Gly Arg His Gly Asn Arg Pro Ala His 210 215 220 Ile His Tyr Phe Val Ser Ala Asp Gly His Arg Lys Leu Thr Thr Gln 225 230 235 240 Ile Asn Val Ala Gly Asp Pro Tyr Thr Tyr Asp Asp Phe Ala Tyr Ala 245 250 255 Thr Arg Glu Gly Leu Val Val Asp Ala Val Glu His Thr Asp Pro Glu 260 265 270 Ala Ile Lys Ala Asn Asp Val Glu Gly Pro Phe Ala Glu Met Val Phe 275 280 285 Asp Leu Lys Leu Thr Arg Leu Val Asp Gly Val Asp Asn Gln Val Val 290 295 300 Asp Arg Pro Arg Leu Ala Val 305 310 <210> 12 <211> 1461 <212> DNA <213> quiC from Acinetobacter sp. ADP1; <400> 12 atgaaattaa cttctttacg cgtatcttta ttggcgctgg gcttggtaac atcaggtttt 60 gctgcggcag aaacttatac tgtagatcgt tatcaggatg atagtgaaaa aggctctttg 120 cgttgggcaa ttgaacaatc taatgcaaat agcgcacaag agaatcagat tctgattcag 180 gctgttggta aggcacctta tgtgatcaag gtggataaac cgttaccacc gattaaatca 240 tctgtaaaaa ttattggtac agaatgggat aaaacgggcg aatttattgc gattgatggt 300 tcaaactata tcaagggcga aggcgaaaaa gcatgtccag gtgcaaatcc aggacaatat 360 ggtaccaatg ttcgtaccat gactttacca ggtttggttc tacaagatgt caatggtgtg 420 accctgaaag gtcttgatgt tcatcgcttc tgtattggtg tactggtaaa tcgttcaagc 480 aataatttga ttcagcataa ccgtatttca aataattacg gtggcgctgg tgtcatgatc 540 acgggtgatg atggtaaagg taacccaacg tctaccacca ccaataacaa caaagtattg 600 gataatgtgt ttattgacaa tggcgatggt cttgaactga cgcgtggagc agcattcaac 660 ctgattgcta acaatctgtt tacatcgacc aaagccaatc cagagccgtc tcaaggcatt 720 gaaattcttt gggggaatga caatgcagtg gtgggtaaca aatttgaaaa ctattcagat 780 ggtctacaaa tcaactgggg taaacgtaat tacatcgctt ataacgaatt gaccaataac 840 tctttgggtt tcaatcttac aggtgatgga aacatcttcg atagtaacaa agtgcatggc 900 aatcgtattg gtatcgcaat tcgttctgaa aaagatgcaa atgcacgtat cacacttacc 960 aaaaatcaga tttgggataa tggtaaagat atcaaacgct gtgaggctgg tggttcatgt 1020 gttccaaacc aacgtttagg tgcaattgta tttggtgttc ctgcgcttga gcatgaaggt 1080 tttgtaggct ctcgtggtgg cggtgtagtc attgaacctg caaaattaca aaaaacatgt 1140 acacagccaa atcaacaaaa ctgtaatgcc attccgaacc aaggtattca ggcacctaaa 1200 ctgactgtca gtaaaaaaca acttacagtt gaagttaaag gaacaccaaa ccagcgttac 1260 aacgtagaat tttttggaaa tcgtaatgca tcttcttccg aagctgagca atatttaggt 1320 tcaattgttg tagtgacaga tcatcaaggt cttgcaaaag caaactgggc accaaaagtc 1380 agcatgccat ctgttactgc gaatgtaact gatcacttgg gcgccacttc agagttaagt 1440 tctgcagtga aaatgagata a 1461 <210> 13 <211> 1461 <212> DNA <213> Codon-optimized quiC gene from Acinetobacter sp. ADP1; <400> 13 atgaaactga ccagcctgcg tgttagcctg ctggcactgg gtctggttac cagcggtttt 60 gcagcagcag aaacctatac cgttgatcgt tatcaggatg atagcgaaaa aggtagcctg 120 cgttgggcaa ttgaacagag caatgcaaat agcgcacaag aaaaccagat tctgattcag 180 gcagttggta aagcaccgta tgttatcaaa gttgataaac cgctgcctcc gattaaaagc 240 agcgttaaaa tcattggcac cgagtgggat aaaaccggtg aatttattgc aattgatggc 300 agcaactata tcaaaggcga aggtgaaaaa gcatgtccgg gtgcaaatcc gggtcagtat 360 ggcaccaatg ttcgtaccat gaccctgcct ggtctggttc tgcaagatgt taatggtgtt 420 accctgaaag gtctggatgt tcatcgtttt tgtattggtg ttctggttaa tcgcagcagc 480 aataacctga ttcagcataa tcgtatcagc aacaattatg gtggtgccgg tgttatgatt 540 accggtgatg atggtaaagg taatccgacc agcaccacca ccaataataa caaagttctg 600 gataacgtgt tcatcgataa tggtgatggt ctggaactga cccgtggtgc agcatttaat 660 ctgattgcaa ataacctgtt taccagcaca aaagccaatc cggaaccgag ccagggtatt 720 gaaattctgt ggggtaatga taatgccgtg gtgggtaaca aattcgaaaa ctattcagat 780 ggcctgcaaa tcaattgggg taaacgtaac tatatcgcct ataacgaact gaccaataac 840 agcctgggtt tcaatctgac aggtgatggt aacattttcg acagcaataa agtgcatggt 900 aaccgtattg gtattgccat tcgtagtgaa aaagatgcca atgcacgtat taccctgacc 960 aaaaatcaga tttgggataa cggcaaagat atcaaacgtt gtgaagccgg tggtagctgt 1020 gttccgaatc agcgtctggg tgcaattgtt tttggtgttc cggcactgga acatgaaggt 1080 tttgttggta gccgtggcgg tggtgttgtt attgaaccgg caaaactgca aaaaacctgc 1140 acccagccga accagcagaa ttgtaatgca attcctaatc agggtattca ggcaccgaaa 1200 ctgacagtta gcaaaaaaca gctgaccgtt gaagttaaag gcacccctaa tcagcgttat 1260 aatgtggaat tttttggcaa tcgtaatgcc agcagcagcg aagcagaaca gtatctgggt 1320 agcattgttg ttgttaccga tcatcagggt ctggcaaaag caaattgggc tccgaaagtt 1380 agcatgccga gcgttaccgc aaatgtgaca gatcatctgg gtgcgaccag cgaactgagc 1440 agcgcagtta aaatgcgtta a 1461 <210> 14 <211> 486 <212> PRT <213> QuiC from Acinetobacter sp. ADP1; <400> 14 Met Lys Leu Thr Ser Leu Arg Val Ser Leu Leu Ala Leu Gly Leu Val 1 5 10 15 Thr Ser Gly Phe Ala Ala Ala Glu Thr Tyr Thr Val Asp Arg Tyr Gln 20 25 30 Asp Asp Ser Glu Lys Gly Ser Leu Arg Trp Ala Ile Glu Gln Ser Asn 35 40 45 Ala Asn Ser Ala Gln Glu Asn Gln Ile Leu Ile Gln Ala Val Gly Lys 50 55 60 Ala Pro Tyr Val Ile Lys Val Asp Lys Pro Leu Pro Pro Ile Lys Ser 65 70 75 80 Ser Val Lys Ile Ile Gly Thr Glu Trp Asp Lys Thr Gly Glu Phe Ile 85 90 95 Ala Ile Asp Gly Ser Asn Tyr Ile Lys Gly Glu Gly Glu Lys Ala Cys 100 105 110 Pro Gly Ala Asn Pro Gly Gln Tyr Gly Thr Asn Val Arg Thr Met Thr 115 120 125 Leu Pro Gly Leu Val Leu Gln Asp Val Asn Gly Val Thr Leu Lys Gly 130 135 140 Leu Asp Val His Arg Phe Cys Ile Gly Val Leu Val Asn Arg Ser Ser 145 150 155 160 Asn Asn Leu Ile Gln His Asn Arg Ile Ser Asn Asn Tyr Gly Gly Ala 165 170 175 Gly Val Met Ile Thr Gly Asp Asp Gly Lys Gly Asn Pro Thr Ser Thr 180 185 190 Thr Thr Asn Asn Asn Lys Val Leu Asp Asn Val Phe Ile Asp Asn Gly 195 200 205 Asp Gly Leu Glu Leu Thr Arg Gly Ala Ala Phe Asn Leu Ile Ala Asn 210 215 220 Asn Leu Phe Thr Ser Thr Lys Ala Asn Pro Glu Pro Ser Gln Gly Ile 225 230 235 240 Glu Ile Leu Trp Gly Asn Asp Asn Ala Val Val Gly Asn Lys Phe Glu 245 250 255 Asn Tyr Ser Asp Gly Leu Gln Ile Asn Trp Gly Lys Arg Asn Tyr Ile 260 265 270 Ala Tyr Asn Glu Leu Thr Asn Asn Ser Leu Gly Phe Asn Leu Thr Gly 275 280 285 Asp Gly Asn Ile Phe Asp Ser Asn Lys Val His Gly Asn Arg Ile Gly 290 295 300 Ile Ala Ile Arg Ser Glu Lys Asp Ala Asn Ala Arg Ile Thr Leu Thr 305 310 315 320 Lys Asn Gln Ile Trp Asp Asn Gly Lys Asp Ile Lys Arg Cys Glu Ala 325 330 335 Gly Gly Ser Cys Val Pro Asn Gln Arg Leu Gly Ala Ile Val Phe Gly 340 345 350 Val Pro Ala Leu Glu His Glu Gly Phe Val Gly Ser Arg Gly Gly Gly 355 360 365 Val Val Ile Glu Pro Ala Lys Leu Gln Lys Thr Cys Thr Gln Pro Asn 370 375 380 Gln Gln Asn Cys Asn Ala Ile Pro Asn Gln Gly Ile Gln Ala Pro Lys 385 390 395 400 Leu Thr Val Ser Lys Lys Gln Leu Thr Val Glu Val Lys Gly Thr Pro 405 410 415 Asn Gln Arg Tyr Asn Val Glu Phe Phe Gly Asn Arg Asn Ala Ser Ser 420 425 430 Ser Glu Ala Glu Gln Tyr Leu Gly Ser Ile Val Val Val Thr Asp His 435 440 445 Gln Gly Leu Ala Lys Ala Asn Trp Ala Pro Lys Val Ser Met Pro Ser 450 455 460 Val Thr Ala Asn Val Thr Asp His Leu Gly Ala Thr Ser Glu Leu Ser 465 470 475 480 Ser Ala Val Lys Met Arg 485 <210> 15 <211> 9462 <212> DNA <213> Plasmid pAC21; <220> <221> misc_feature <222> (5924)..(5924) <223> n is a, c, g, or t <400> 15 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380 ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgcatgcctg 4440 caggtcgact ctagaggatc ccccccgccg ccgacagagt aataggtttt acttaatagc 4500 tcttcctgtc ccttccaggc agtgatccgc attccgttct catggcgagg caacatttcg 4560 ggatggaaga taatgttctt tgctacagga aaatcaacaa tatgcgcacc agatgccact 4620 ggcagccgcc cgctgcgcgt tactaactct ataaatgcag ggatctcatc aatgacaaca 4680 tcctgcggac tgtttcctgc cagtcccatg atgatggcga catccgtggc atggcctttg 4740 cccgtcagtg acaacgaccc gtacagatcg accacaatat ggctcgtcgc ggttaataag 4800 ccgctacttt ccagccgatc aataaaactt tttccggcat tcattggccc cacggtatgc 4860 gaactggagg gaccaatccc aattttgaaa atatcgaatg cactaatcat gtgacggaag 4920 atcacttcgc agaataaata aatcctggtg tccctgttga taccgggaag ccctgggcca 4980 acttttggcg aaaatgagac gttgatcggc acgtaagagg ttccaacttt caccataatg 5040 aaataagatc actaccgggc gtattttttg agttatcgag attttcagga gctaaggaag 5100 ctaaaatgga gaaaaaaatc actggatata ccaccgttga tatatcccaa tggcatcgta 5160 aagaacattt tgaggcattt cagtcagttg ctcaatgtac ctataaccag accgttcagc 5220 tggatattac ggccttttta aagaccgtaa agaaaaataa gcacaagttt tatccggcct 5280 ttattcacat tcttgcccgc ctgatgaatg ctcatccgga attccgtatg gcaatgaaag 5340 acggtgagct ggtgatatgg gatagtgttc acccttgtta caccgttttc catgagcaaa 5400 ctgaaacgtt ttcatcgctc tggagtgaat accacgacga tttccggcag tttctacaca 5460 tatattcgca agatgtggcg tgttacggtg aaaacctggc ctatttccct aaagggttta 5520 ttgagaatat gtttttcgtc tcagccaatc cctgggtgag tttcaccagt tttgatttaa 5580 acgtggccaa tatggacaac ttcttcgccc ccgttttcac catgggcaaa tattatacgc 5640 aaggcgacaa ggtgctgatg ccgctggcga ttcaggttca tcatgccgtt tgtgatggct 5700 tccatgtcgg cagaatgctt aatgaattac aacagtactg cgatgagtgg cagggcgggg 5760 cgtaattttt ttaaggcagt tattggtgcc cttaaacgcc tggtgctacg cctgaataag 5820 tgataataag cggatgaatg gcagaaattc gaaagcaaat tcgacccggt cgtcggttca 5880 gggcagggtc gttaaatagc cgcttatgtc tattgctggt ttantcggta cccggggatc 5940 gcggccgcgg accggatccc atcacatata cctgccgttc actattattt agtgaaatga 6000 gatattatga tattttctga attgtgatta aaaaggcaac tttatgccca tgcaacagaa 6060 actataaaaa atacagagaa tgaaaagaaa cagatagatt ttttagttct ttaggcccgt 6120 agtctgcaaa tccttttatg attttctatc aaacaaaaga ggaaaataga ccagttgcaa 6180 tccaaacgag agtctaatag aatgaggtcg aaaagtaaat cgcgcgggtt tgttactgat 6240 aaagcaggca agacctaaaa tgtgtaaagg gcaaagtgta tactttggcg tcacccctta 6300 catattttag gtcttttttt attgtgcgta actaacttgc catcttcaaa caggagggct 6360 ggaagaagca gaccgctaac acagtacata aaaaaggaga catgaacgat gaacatcaaa 6420 aagtttgcaa aacaagcaac agtattaacc tttactaccg cactgctggc aggaggcgca 6480 actcaagcgt ttgcgaaaga aacgaaccaa aagccatata aggaaacata cggcatttcc 6540 catattacac gccatgatat gctgcaaatc cctgaacagc aaaaaaatga aaaatatcaa 6600 gttcctgaat tcgattcgtc cacaattaaa aatatctctt ctgcaaaagg cctggacgtt 6660 tgggacagct ggccattaca aaacgctgac ggcactgtcg caaactatca cggctaccac 6720 atcgtctttg cattagccgg agatcctaaa aatgcggatg acacatcgat ttacatgttc 6780 tatcaaaaag tcggcgaaac ttctattgac agctggaaaa acgctggccg cgtctttaaa 6840 gacagcgaca aattcgatgc aaatgattct atcctaaaag accaaacaca agaatggtca 6900 ggttcagcca catttacatc tgacggaaaa atccgtttat tctacactga tttctccggt 6960 aaacattacg gcaaacaaac actgacaact gcacaagtta acgtatcagc atcagacagc 7020 tctttgaaca tcaacggtgt agaggattat aaatcaatct ttgacggtga cggaaaaacg 7080 tatcaaaatg tacagcagtt catcgatgaa ggcaactaca gctcaggcga caaccatacg 7140 ctgagagatc ctcactacgt agaagataaa ggccacaaat acttagtatt tgaagcaaac 7200 actggaactg aagatggcta ccaaggcgaa gaatctttat ttaacaaagc atactatggc 7260 aaaagcacat cattcttccg tcaagaaagt caaaaacttc tgcaaagcga taaaaaacgc 7320 acggctgagt tagcaaacgg cgctctcggt atgattgagc taaacgatga ttacacactg 7380 aaaaaagtga tgaaaccgct gattgcatct aacacagtaa cagatgaaat tgaacgcgcg 7440 aacgtcttta aaatgaacgg caaatggtac ctgttcactg actcccgcgg atcaaaaatg 7500 acgattgacg gcattacgtc taacgatatt tacatgcttg gttatgtttc taattcttta 7560 actggcccat acaagccgct gaacaaaact ggccttgtgt taaaaatgga tcttgatcct 7620 aacgatgtaa cctttactta ctcacacttc gctgtacctc aagcgaaagg aaacaatgtc 7680 gtgattacaa gctatatgac aaacagagga ttctacgcag acaaacaatc aacgtttgcg 7740 ccgagcttcc tgctgaacat caaaggcaag aaaacatctg ttgtcaaaga cagcatcctt 7800 gaacaaggac aattaacagt taacaaataa aaacgcaaaa gaaaatgcca atatcctatt 7860 ggcattttct tttatttctt ccatttaaat ggatgcatgc gctagcggag tgtatactgg 7920 cttactatgt tggcactgat gagggtgtca gtgaagtgct tcagcctcgt gagcgggacg 7980 gtcgtaaggt cgttccgctc cacttcactg aacggcaatc cgagggtgtg gatccaatta 8040 aggccacgct gtcatttaaa ttccgttttt ccagttcaaa tgcaattgcc ttcaatgcac 8100 cttcgtagct gtggtgagcc agcggtgctg gctctccccc atttacggat aagaatgcat 8160 tttccgagtt aataccgtcg gcaatacctg acattaatac ttcacagtcg ctggcatcga 8220 gtacggaaaa cttaatcgaa gacgaaccac agttaataac caaaacaacc ggaaattcat 8280 tcatctcttt tctcatcctg agttacggat taaaacagtt tgtatacgat gttcaggatg 8340 gtcagcagac caatcacggt aacaaacacg ttatccagac gaccacggta tttcgccaga 8400 gacggcgctt tacggatggc atacatcggc aacaggcaca gcagggatgc gataatcggt 8460 gcgcccatgg cttcaatcag gtcgaggatg ttcgggttgg cgtaggcaac aacccaggtg 8520 gagcccatga tgaagatcat gctgagagta ttcagtttac ccagcgacac tttggttttg 8580 tcacctttat aaccgaactt cagaatcaga ccattcaagc cttccagcgt ccccagatag 8640 tgaccgaaga aagatttgaa gatagccacg agtgcgatga tggaagccgc atattccagt 8700 gtaatcgcga acgttgtttt ggtaccggtc atggacgcaa agtggttagc cagataagaa 8760 agcactggaa tattctgcgc tttggcttcc gccatgttgg ccggagacag agtaaacagg 8820 cagctaaagg caaagaacat caccactgca accatcagca tgctggcacg agaaatgatt 8880 tgggaacatt tacgttcggt gaagtcgcga ccgaagtctt tctcatactc ttcacgttta 8940 gaaaccacga aggaagagac gattggcgag aagttaaagg agaaaaccat gatggaaatc 9000 cccagccaga cagtgatcag gataccgtca tgaccggtta acgacagcga accgaggtca 9060 acctggtcga taactgcaga gttccagtaa gggatcagcg acaaagaaat cagcaccagg 9120 ctggcgataa acggccatac caggtagctc agggtaccga gctcgaattc actggccgtc 9180 gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca 9240 catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa 9300 cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct tacgcatctg 9360 tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga tgccgcatag 9420 ttaagccagc cccgacaccc gccaacaccc gctgacgaat tc 9462 <210> 16 <211> 9430 <212> DNA <213> Plasmid pAC19; <400> 16 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380 ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgcatgcctg 4440 caggtcgact ctagaggatc ccccccgccg ccgacagagt aataggtttt acttaatagc 4500 tcttcctgtc ccttccaggc agtgatccgc attccgttct catggcgagg caacatttcg 4560 ggatggaaga taatgttctt tgctacagga aaatcaacaa tatgcgcacc agatgccact 4620 ggcagccgcc cgctgcgcgt tactaactct ataaatgcag ggatctcatc aatgacaaca 4680 tcctgcggac tgtttcctgc cagtcccatg atgatggcga catccgtggc atggcctttg 4740 cccgtcagtg acaacgaccc gtacagatcg accacaatat ggctcgtcgc ggttaataag 4800 ccgctacttt ccagccgatc aataaaactt tttccggcat tcattggccc cacggtatgc 4860 gaactggagg gaccaatccc aattttgaaa atatcgaatg cactaatcat atccacaccc 4920 tcggattgcc gttcagtgaa gtggagcgga acgaccttac gaccgtcccg ctcacgaggc 4980 tttacgcact acgtactgcg atggcttcaa tttccagcgg gagggcggat ccactaatac 5040 aaaatatatc aaaagttaat aataatatta ttcttactta agactttttt gtcttcattt 5100 tttagtaaaa aatataaaaa aggccacctc ccgattttat cggaaggcag cctcttaaat 5160 tcagttcata atattaaaaa atattattca acttcagaat atttgttggc ataggcagct 5220 gccgcaccca acagtccagg ctgcggataa gtaatcaact taaccggaat cttggacatg 5280 acgcgttcaa agcgtccttt tgaaacaaag cgctgacgga aaccagattc tggcaaatgg 5340 gaagcgatac gaagaccgac accaccgcca ataacaacac tggttgcacc ctgtgccaaa 5400 gcaagatcac cagcgatagc gccaaggctc aagcagaagc gatccaaagc ggcttcagca 5460 aggttgtctt taccttccaa agccatctgc cataatttaa tatcatccag caagctgaac 5520 ggaacgcctt caatggcagc cagtgcttcg tagatattac caagacccgg gccagaaata 5580 atgcgttcga tagaaacgcg gcggaaacgt tcacgtaaac gtgccagaat tttgtcttca 5640 agtctgtcaa gcggagcaaa gtcgatatga ccgccttcag tttcgatgac gaaataacgg 5700 ccttcagtcc gcaacagatg ggcaacaccc aagcccgttc ccggaccaag aatagtgata 5760 acaccatcgc taggaagcgc ttcatcagga ccacaaatat gatccagata agaagaatcc 5820 atatgcgcaa ccgcgtgggc aaccgcgccg aagtcattga tcagaacatg cgtatcgatg 5880 tccagctttt cattcagagt agctggtctt aatacccaag ggttattggt aagttttaaa 5940 acttcaccat gaaccgggcc agcccatgca atagctgcgg cacgtggcag aggacgaccc 6000 agtttttcac cgaaacgttc ccaagctaac tgcaagctag catgttctgc cgttttaaaa 6060 gttgtttctt ctccaagaga aagaacccga ccattgctta cttccgcaat agagaaacgc 6120 gcatgcgttc caccgatgtc aatcgcaaca atttccataa taattccttt ctgaaatcag 6180 aaggctaccc aacaggtaaa ataagtccgc ccgctttata ccatcgttgt aaacaaaaag 6240 tataattggt taagacttat ctaaaaaaga caaaaggatt cagccaaagc aagtttaact 6300 acttctggga gcgccacatc tcctcgattt catccaggct ccgacctttg gtttccggca 6360 cgaagcgagc aacaatcaag ccacctaaga tacttaatgc tgcgaaaacg agataggaga 6420 aaccgtggtt gaaagtctga ttcaatgctg gagaaccatc ggcaacctta aacaggaagt 6480 taaccaagat attagctaac cattgtccgg taacagcgat aggcatagct gcgcccttga 6540 tggaactcgg gaacatttct gacagaacaa cccagcagac agggccccat gacataccaa 6600 agactgcaat ataaagaagc acagaagcca aaggcaaaac accaccgact ttgaaccaga 6660 aacagcagcc taaaacagcc atcattgcag ccataccgag agcaccccaa ataagcagag 6720 gtttacggcc gaagcggtca acaacacggg aagcaatcat ggtgaagatg aagttcacaa 6780 caccgataga gatggtctgc aataatgccg tatcagctcc aaaacctaaa ttctggaaca 6840 tctgcggtgc ataatacagc acggcgttaa taccgactaa ctgctggaag gcagcaacgg 6900 atacaccggc aaaaacaacg gtgataccaa aagcaaacaa acctgcgctg cttttgtcca 6960 tggctttatc aaagccagct ttaatctttt gaatcgtcag attaggatcg gcttgcggtt 7020 ccagacgagc aaggattttg ctagcctcgg aatgacgtcc cttcatcacc aaccaatgcg 7080 gcgtatccgg tgcggttaac agcagcaata agaaggcaat accgatcagg ccttctgaag 7140 ccggagacca gcaccaacca ctggcattaa cccaatcgat agaaccgaaa tgagccagta 7200 accaggtaaa gatataaccg gttaaagcac ccgtcacaat ggccatctgc tgaccagaaa 7260 ccatctgacc acgtttgtct ggcggagcaa tttcagcaat ataggttggg gtcaaggttg 7320 aaacgacacc gatacctaaa ccggcaagaa accggaaaaa gcaaaaaatt tgtaaagccg 7380 aaccaccggt tccaaataat ttttcggtta acgcagcacc aaaaccggcg gcgacgaaac 7440 aaatggaact catcaacaat ccgccgcgac gaccgaagcg aataccaatc cagccagaca 7500 gcaaagaacc ggtaacacaa ccgaccaaaa cagcaacaac gaccatccca gaaagggaag 7560 ccgcagccgt agcagacagg tgacgagggg caataaaatg gatatcaacc ggtgtaccga 7620 ttgcagcgat aaccgctgaa tcgtaaccga aaagcaagcc gcctatagca gcgattaggg 7680 ctagtcgcgt gactagaccc tgactacttt cagaactcat ggcgattcct ctccctctag 7740 agcgtcctgc tgttgttaag attattatac cacaccttgt agataaagtc aacaactttt 7800 tgcaaaattt ttcaggaatt ttagcagagg ttgttctgga tgtagaacaa aacatctttc 7860 cgctcttgtg ctgttaggat atctttcttg gaagctaggt aggcctcgag ttatggcagt 7920 tggttaaaag gaaacaaaaa gaccgttttc acacaaaacg gtctttttcg atttcttttt 7980 acagtcacag ccacttttgc accaattaag gccacgctgt catttaaact ccgtttttcc 8040 agttcaaatg caattgcctt caatgcacct tcgtagctgt ggtgagccag cggtgctggc 8100 tctcccccat ttacggataa gaatgcattt tccgagttaa taccgtcggc aatacctgac 8160 attaatactt cacagtcgct ggcatcgagt acggaaaact taatcgaaga cgaaccacag 8220 ttaataacca aaacaaccgg aaattcattc atctcttttc tcatcctgag ttacggatta 8280 aaacagtttg tatacgatgt tcaggatggt cagcagacca atcacggtaa caaacacgtt 8340 atccagacga ccacggtatt tcgccagaga cggcgcttta cggatggcat acatcggcaa 8400 caggcacagc agggatgcga taatcggtgc gcccatggct tcaatcaggt cgaggatgtt 8460 cgggttggcg taggcaacaa cccaggtgga gcccatgatg aagatcatgc tgagagtatt 8520 cagtttaccc agcgacactt tggttttgtc acctttataa ccgaacttca gaatcagacc 8580 attcaagcct tccagcgtcc ccagatagtg accgaagaaa gatttgaaga tagccacgag 8640 tgcgatgatg gaagccgcat attccagtgt aatcgcgaac gttgttttgg taccggtcat 8700 ggacgcaaag tggttagcca gataagaaag cactggaata ttctgcgctt tggcttccgc 8760 catgttggcc ggagacagag taaacaggca gctaaaggca aagaacatca ccactgcaac 8820 catcagcatg ctggcacgag aaatgatttg ggaacattta cgttcggtga agtcgcgacc 8880 gaagtctttc tcatactctt cacgtttaga aaccacgaag gaagagacga ttggcgagaa 8940 gttaaaggag aaaaccatga tggaaatccc cagccagaca gtgatcagga taccgtcatg 9000 accggttaac gacagcgaac cgaggtcaac ctggtcgata actgcagagt tccagtaagg 9060 gatcagcgac aaagaaatca gcaccaggct ggcgataaac ggccatacca ggtagctcag 9120 ggtaccgagc tcgaattcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 9180 cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 9240 agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct 9300 gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct 9360 cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc 9420 tgacgaattc 9430 <210> 17 <211> 5768 <212> DNA <213> Plasmid pMH17F; <400> 17 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagt 4380 tacctagaga gggtgagaat tgccgaacat gcgcataagt ttcccggaca gatttcaggt 4440 ggtcagcagc aacgcgttgc cattgcgcgt tcgctgtgta tgaagccgaa aattatgttg 4500 tttgatgagc caacgtcggc gctcgatcct gagatggtga aagaggtgct ggatacgatg 4560 attgggctgg cgcagtcggg tatgacaatg ttgtgtgtaa cacatgagat ggggtttgca 4620 cgaaccgtcg ctgaccgggt aatttttatg gatcgtgggg aaatagtgga gcaagctgca 4680 cctgatgaat tttttgcgca tcctaaatca gagcgtacga gggcattttt atcgcaggta 4740 atccattaat tgaatgttag ttcgaaaagc aaaaaggcca tcctttcgga tggcctttcg 4800 cttgatttga tgtctggcag tttatggcgg gcgtcctgcc cgccaccctc cgggccgttg 4860 cttcgcaacg ttcaaatccg ctcccggcgg atttgtccta ctcgggagag tgttcaccga 4920 caaacaacag ataaaacaaa aggcccagtc ttccgactga gccttttgtt ttatttgatg 4980 tctggcagtt ccctactctc gcatggggag accccacact accatcggcg ctacggcggt 5040 ttcacttctg agttcggcat ggggtcaggt gggaccaccg cgctactgcc gccagacaaa 5100 ttcttttcta atctgccgaa ctttaaccta aaaagtggtg ctgataccca gagtcgaact 5160 ggggacctca cccttaccaa gggtgcgctc taccaactga gccatatcag cacgctaaat 5220 ttgatgcctg gcagttccct actctcgcat ggggagaccc cacactacca tcggcgctac 5280 ggcgtttcac ttctgagttc ggcatggggt caggtgggac caccgcgcta cggccgccag 5340 gcaaattctg ttttatcaga ccgcttctgc gttctgattt aatctgtatc aggctgaaaa 5400 tcttctctca tccggataac aatttcacac aggaaacagc tatgaccatg attacgccaa 5460 gctcgagctc gaattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 5520 ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 5580 aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga 5640 tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca 5700 gtacaatctg ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg 5760 acgaattc 5768 <210> 18 <211> 1053 <212> DNA <213> Coding region of the wild type aroG gene; <400> 18 atgaattatc agaacgacga tttacgcatc aaagaaatca aagagttact tcctcctgtc 60 gcattgctgg aaaaattccc cgctactgaa aatgccgcga atacggttgc ccatgcccga 120 aaagcgatcc ataagatcct gaaaggtaat gatgatcgcc tgttggttgt gattggccca 180 tgctcaattc atgatcctgt cgcggcaaaa gagtatgcca ctcgcttgct ggcgctgcgt 240 gaagagctga aagatgagct ggaaatcgta atgcgcgtct attttgaaaa gccgcgtacc 300 acggtgggct ggaaagggct gattaacgat ccgcatatgg ataatagctt ccagatcaac 360 gacggtctgc gtatagcccg taaattgctg cttgatatta acgacagcgg tctgccagcg 420 gcaggtgagt ttctcgatat gatcacccca caatatctcg ctgacctgat gagctggggc 480 gcaattggcg cacgtaccac cgaatcgcag gtgcaccgcg aactggcatc agggctttct 540 tgtccggtcg gcttcaaaaa tggcaccgac ggtacgatta aagtggctat cgatgccatt 600 aatgccgccg gtgcgccgca ctgcttcctg tccgtaacga aatgggggca ttcggcgatt 660 gtgaatacca gcggtaacgg cgattgccat atcattctgc gcggcggtaa agagcctaac 720 tacagcgcga agcacgttgc tgaagtgaaa gaagggctga acaaagcagg cctgccagca 780 caggtgatga tcgatttcag ccatgctaac tcgtccaaac aattcaaaaa gcagatggat 840 gtttgtgctg acgtttgcca gcagattgcc ggtggcgaaa aggccattat tggcgtgatg 900 gtggaaagcc atctggtgga aggcaatcag agcctcgaga gcggggagcc gctggcctac 960 ggtaagagca tcaccgatgc ctgcatcggc tgggaagata ccgatgctct gttacgtcaa 1020 ctggcgaatg cagtaaaagc gcgtcgcggg taa 1053 <210> 19 <211> 8820 <212> DNA <213> Plasmid pMH28F; <220> <221> misc_feature <222> (5894)..(5894) <223> n is a, c, g, or t <400> 19 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagt 4380 tacctagaga gggtgagaat tgccgaacat gcgcataagt ttcccggaca gatttcaggt 4440 ggtcagcagc aacgcgttgc cattgcgcgt tcgctgtgta tgaagccgaa aattatgttg 4500 tttgatgagc caacgtcggc gctcgatcct gagatggtga aagaggtgct ggatacgatg 4560 attgggctgg cgcagtcggg tatgacaatg ttgtgtgtaa cacatgagat ggggtttgca 4620 cgaaccgtcg ctgaccgggt aatttttatg gatcgtgggg aaatagtgga gcaagctgca 4680 cctgatgaat tttttgcgca tcctaaatca gagcgtacga gggcattttt atcgcaggta 4740 atccattaat tgaatgttag ttcgaaaagc aaaaaggcca tcctttcgga tggcctttcg 4800 cttgatttga tgtctggcag tttatggcgg gcgtcctgcc cgccaccctc cgggccgttg 4860 cttcgcaacg ttcaaatccg gtgacggaag atcacttcgc agaataaata aatcctggtg 4920 tccctgttga taccgggaag ccctgggcca acttttggcg aaaatgagac gttgatcggc 4980 acgtaagagg ttccaacttt caccataatg aaataagatc actaccgggc gtattttttg 5040 agttatcgag attttcagga gctaaggaag ctaaaatgga gaaaaaaatc actggatata 5100 ccaccgttga tatatcccaa tggcatcgta aagaacattt tgaggcattt cagtcagttg 5160 ctcaatgtac ctataaccag accgttcagc tggatattac ggccttttta aagaccgtaa 5220 agaaaaataa gcacaagttt tatccggcct ttattcacat tcttgcccgc ctgatgaatg 5280 ctcatccgga attccgtatg gcaatgaaag acggtgagct ggtgatatgg gatagtgttc 5340 acccttgtta caccgttttc catgagcaaa ctgaaacgtt ttcatcgctc tggagtgaat 5400 accacgacga tttccggcag tttctacaca tatattcgca agatgtggcg tgttacggtg 5460 aaaacctggc ctatttccct aaagggttta ttgagaatat gtttttcgtc tcagccaatc 5520 cctgggtgag tttcaccagt tttgatttaa acgtggccaa tatggacaac ttcttcgccc 5580 ccgttttcac catgggcaaa tattatacgc aaggcgacaa ggtgctgatg ccgctggcga 5640 ttcaggttca tcatgccgtt tgtgatggct tccatgtcgg cagaatgctt aatgaattac 5700 aacagtactg cgatgagtgg cagggcgggg cgtaattttt ttaaggcagt tattggtgcc 5760 cttaaacgcc tggtgctacg cctgaataag tgataataag cggatgaatg gcagaaattc 5820 gaaagcaaat tcgacccggt cgtcggttca gggcagggtc gttaaatagc cgcttatgtc 5880 tattgctggt ttantcggta cccggggatc gcggccgcgg accggatccc atcacatata 5940 cctgccgttc actattattt agtgaaatga gatattatga tattttctga attgtgatta 6000 aaaaggcaac tttatgccca tgcaacagaa actataaaaa atacagagaa tgaaaagaaa 6060 cagatagatt ttttagttct ttaggcccgt agtctgcaaa tccttttatg attttctatc 6120 aaacaaaaga ggaaaataga ccagttgcaa tccaaacgag agtctaatag aatgaggtcg 6180 aaaagtaaat cgcgcgggtt tgttactgat aaagcaggca agacctaaaa tgtgtaaagg 6240 gcaaagtgta tactttggcg tcacccctta catattttag gtcttttttt attgtgcgta 6300 actaacttgc catcttcaaa caggagggct ggaagaagca gaccgctaac acagtacata 6360 aaaaaggaga catgaacgat gaacatcaaa aagtttgcaa aacaagcaac agtattaacc 6420 tttactaccg cactgctggc aggaggcgca actcaagcgt ttgcgaaaga aacgaaccaa 6480 aagccatata aggaaacata cggcatttcc catattacac gccatgatat gctgcaaatc 6540 cctgaacagc aaaaaaatga aaaatatcaa gttcctgaat tcgattcgtc cacaattaaa 6600 aatatctctt ctgcaaaagg cctggacgtt tgggacagct ggccattaca aaacgctgac 6660 ggcactgtcg caaactatca cggctaccac atcgtctttg cattagccgg agatcctaaa 6720 aatgcggatg acacatcgat ttacatgttc tatcaaaaag tcggcgaaac ttctattgac 6780 agctggaaaa acgctggccg cgtctttaaa gacagcgaca aattcgatgc aaatgattct 6840 atcctaaaag accaaacaca agaatggtca ggttcagcca catttacatc tgacggaaaa 6900 atccgtttat tctacactga tttctccggt aaacattacg gcaaacaaac actgacaact 6960 gcacaagtta acgtatcagc atcagacagc tctttgaaca tcaacggtgt agaggattat 7020 aaatcaatct ttgacggtga cggaaaaacg tatcaaaatg tacagcagtt catcgatgaa 7080 ggcaactaca gctcaggcga caaccatacg ctgagagatc ctcactacgt agaagataaa 7140 ggccacaaat acttagtatt tgaagcaaac actggaactg aagatggcta ccaaggcgaa 7200 gaatctttat ttaacaaagc atactatggc aaaagcacat cattcttccg tcaagaaagt 7260 caaaaacttc tgcaaagcga taaaaaacgc acggctgagt tagcaaacgg cgctctcggt 7320 atgattgagc taaacgatga ttacacactg aaaaaagtga tgaaaccgct gattgcatct 7380 aacacagtaa cagatgaaat tgaacgcgcg aacgtcttta aaatgaacgg caaatggtac 7440 ctgttcactg actcccgcgg atcaaaaatg acgattgacg gcattacgtc taacgatatt 7500 tacatgcttg gttatgtttc taattcttta actggcccat acaagccgct gaacaaaact 7560 ggccttgtgt taaaaatgga tcttgatcct aacgatgtaa cctttactta ctcacacttc 7620 gctgtacctc aagcgaaagg aaacaatgtc gtgattacaa gctatatgac aaacagagga 7680 ttctacgcag acaaacaatc aacgtttgcg ccgagcttcc tgctgaacat caaaggcaag 7740 aaaacatctg ttgtcaaaga cagcatcctt gaacaaggac aattaacagt taacaaataa 7800 aaacgcaaaa gaaaatgcca atatcctatt ggcattttct tttatttctt ccatttaaat 7860 ggatgcatgc gctagcggag tgtatactgg cttactatgt tggcactgat gagggtgtca 7920 gtgaagtgct tcctcccggc ggatttgtcc tactcgggag agtgttcacc gacaaacaac 7980 agataaaaca aaaggcccag tcttccgact gagccttttg ttttatttga tgtctggcag 8040 ttccctactc tcgcatgggg agaccccaca ctaccatcgg cgctacggcg gtttcacttc 8100 tgagttcggc atggggtcag gtgggaccac cgcgctactg ccgccagaca aattcttttc 8160 taatctgccg aactttaacc taaaaagtgg tgctgatacc cagagtcgaa ctggggacct 8220 cacccttacc aagggtgcgc tctaccaact gagccatatc agcacgctaa atttgatgcc 8280 tggcagttcc ctactctcgc atggggagac cccacactac catcggcgct acggcgtttc 8340 acttctgagt tcggcatggg gtcaggtggg accaccgcgc tacggccgcc aggcaaattc 8400 tgttttatca gaccgcttct gcgttctgat ttaatctgta tcaggctgaa aatcttctct 8460 catccggata acaatttcac acaggaaaca gctatgacca tgattacgcc aagctcgagc 8520 tcgaattcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa 8580 cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc 8640 accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct gatgcggtat 8700 tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc 8760 tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgaattc 8820 <210> 20 <211> 4774 <212> DNA <213> Plasmid pCL1921; <400> 20 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380 ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgcatgcctg 4440 caggtcgact ctagaggatc cccgggtacc gagctcgaat tcactggccg tcgttttaca 4500 acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 4560 tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg 4620 cagcctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 4680 ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 4740 gccccgacac ccgccaacac ccgctgacga attc 4774 <210> 21 <211> 6432 <212> DNA <213> Plasmid pMG27; <400> 21 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380 ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgcatgcctg 4440 caggtcgacc gttaaatcta tcaccgcaag ggataaatat ctaacaccgt gcgtgttgac 4500 tattttacct ctggcggtga taatggttgc atgtactaat ctagataagg aatatagcca 4560 tgaccgcacc gattcaggat ctgcgtgatg caattgccct gctgcaacag catgataatc 4620 agtatctgga aaccgatcat ccggttgatc cgaatgcaga actggcaggc gtttatcgtc 4680 atattggtgc cggtggcacc gttaaacgtc cgacccgtat tggtccggca atgatgttta 4740 ataacattaa aggttatccg cacagccgta ttctggttgg tatgcatgca agccgtcagc 4800 gtgcagcact gctgctgggt tgtgaagcaa gtcagctggc actggaagtt ggtaaagcag 4860 ttaaaaaacc ggttgcaccg gtggttgttc cggcaagcag cgcaccgtgt caagagcaga 4920 tttttctggc agatgatccg gattttgatc tgcgtaccct gctgcctgca cataccaata 4980 ccccgattga tgcaggtccg tttttttgtc tgggtctggc cctggcaagc gatccggtgg 5040 atgcaagcct gaccgatgtt accattcatc gtctgtgtgt tcagggtcgt gatgaactga 5100 gcatgttcct ggcagcaggt cgccatattg aagtttttcg tcagaaagca gaagcagcag 5160 gtaaaccgct gccgattacc attaatatgg gtctggaccc agcaatctat attggcgcat 5220 gttttgaagc accgaccacc ccgtttggtt ataatgaact gggtgttgcc ggtgcactgc 5280 gtcagcgtcc ggttgaactg gttcagggtg ttagcgttcc ggaaaaagca attgcacgtg 5340 ccgaaattgt tattgaaggt gaactgctgc ctggtgttcg tgttcgtgaa gatcagcata 5400 ccaattcagg tcatgcaatg ccggaatttc cgggttattg tggtggtgca aatccgagcc 5460 tgccggttat taaagttaaa gccgttacca tgcgcaataa cgcaattctg caaaccctgg 5520 ttggtccggg tgaagaacat accaccctgg caggtctgcc gaccgaagca agcatttgga 5580 atgcagttga agcagcaatt ccgggttttc tgcaaaatgt ttatgcccat accgcaggcg 5640 gtggtaaatt tctgggtatt ctgcaagtga aaaaacgtca gcctgccgat gaaggtcgtc 5700 agggtcaggc agccctgctg gcgctggcaa cctatagcga actgaaaaat atcattctgg 5760 tggatgagga tgtggacatt tttgatagtg atgatattct gtgggcaatg accacccgta 5820 tgcagggtga tgttagcatt accaccattc cgggtattcg cggtcatcag ctggacccga 5880 gccagacacc ggaatattca ccgagcattc gtggtaatgg tattagctgc aaaaccatct 5940 ttgattgtac cgttccgtgg gcactgaaaa gccattttga acgtgcaccg tttgcagatg 6000 ttgatccgcg tccgtttgca cctgaatatt ttgcacgtct ggaaaaaaat cagggcagcg 6060 caaaataagc taataacagg cctgctggta atcgcaggaa tttttatttg gatggatccc 6120 cgggtaccga gctcgaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct 6180 ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc 6240 gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc 6300 ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact 6360 ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc 6420 gctgacgaat tc 6432 <210> 22 <211> 7294 <212> DNA <213> Plasmid pMG31; <400> 22 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380 ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgctattgac 4440 gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 4500 cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 4560 aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 4620 cctgttctgc agaggaggaa tatagccatg gaagtgaaaa tcttcaacac ccaggatgtt 4680 caggattttc tgcgtgttgc aagcggtctg gaacaagagg gtggtaatcc gcgtgttaaa 4740 caaattattc atcgtgttct gagcgacctg tataaagcaa ttgaagatct gaatatcacc 4800 agcgacgaat attgggcagg cgttgcatat ctgaatcagc tgggtgcaaa tcaagaagca 4860 ggtctgctga gtccgggtct gggttttgat cattatctgg atatgcgtat ggatgcagaa 4920 gatgcagcac tgggtattga aaatgcaaca ccgcgtacca ttgaaggtcc gctgtatgtt 4980 gcgggtgcac cggaaagcgt tggttatgca cgcatggatg atggtagcga tccgaatggt 5040 cataccctga ttctgcatgg caccattttt gatgcagatg gtaaaccgct gccgaatgca 5100 aaagttgaaa tttggcatgc aaacaccaaa ggcttttata gccattttga tccgaccggt 5160 gaacagcagg cctttaatat gcgtcgtagc attattaccg atgagaatgg tcagtatcgt 5220 gttcgtacca ttctgcctgc cggttatggt tgtcctccgg aaggtccgac ccagcaactg 5280 ctgaaccaac tgggtcgtca tggtaatcgt ccggcacata ttcattattt tgttagcgca 5340 gatggtcacc gtaaactgac cacccagatt aatgttgccg gtgatccgta tacctatgat 5400 gattttgcat atgccacccg tgaaggtctg gttgttgatg cagttgaaca taccgatccg 5460 gaagcaatta aagccaatga tgtggaaggt ccttttgccg aaatggtgtt tgatctgaaa 5520 ctgacccgtc tggttgatgg tgttgataat caggttgtgg atcgtccgcg tctggcagtt 5580 taatacacca aaatggttca aaattatcag gcgagtgatc atgatcactg gcctgttttt 5640 atttcaggga agggtggaga caattacgtg gataatcaga tcatccaaga aaccgtggat 5700 aaaattctga gcgttctgcc gaatcaggca ggtcagctgg cacgtctggt gcgtctgatg 5760 caatttgcat gcgatccgac cattaccgtt attggcaaat ataaccatgg taaaagccgt 5820 ctgctgaatg aactgattgg caccgatatc tttagcgttg cagataaacg tgaaaccatt 5880 cagctggccg aacataaaca ggatcaggtt cgttggctgg atgcacctgg tctggatgcc 5940 gatgttgcag cagttgatga tcgtcatgca tttgaagcag tttggaccca ggcagatatt 6000 cgtctgtttg ttcatagcgt tcgtgaaggt gaactggatg caaccgaaca ccatctgctg 6060 caacagctga ttgaagatgc cgatcatagc cgtcgtcaga ccattctggt tctgacccag 6120 attgatcaga ttccggatca gaccatcctg acacagatta aaaccagcat tgcacagcag 6180 gttccgaaac tggatatttg ggcagttagc gcaacccgtc atcgtcaggg cattgaaaac 6240 ggtaaaaccc tgctgatcga aaaaagcggt attggtgcac tgcgccatac cctggaacag 6300 gcactggcac aggtgccgag cgcacgtacc tatgaaaaaa atcgtctgct gtcagatctg 6360 caccatcagc tgaaacaact gctgctggat cagaaacatg ttctgcaaca actgcaacag 6420 acacagcaac agcagctgca tgattttgat accggtctga ttaacattct ggacaaaatt 6480 cgtgttgatc tggaaccgat tgtgaatatt gatggtcagg atcaagcact gaatccggat 6540 agctttgcaa ccatgtttaa aaacaccgca gcaaaacagc agcgtgccaa agttcagatt 6600 gcatatagcc gtgcatgcat tgaaatcaac agccatctga ttcgccatgg tgttgttggt 6660 ctgcctgcgg aacagcagac caccattaaa agcattgata ccgtgattgt tgccgtgttt 6720 ggtatcagcg ttaaatttcg tgatcagctg cgtgccctgt tttataccga taccgaacgt 6780 cagcgtctgc aacgtgaatt tcgtttctat tttgaaaaaa gtgccggtcg catgattctg 6840 gcagcaaaaa ttgaacagac catgcgtcag cagggctgta ttcagaatgc catgatggca 6900 ctgcaacaaa tggaaagcgc agcataaaaa cacggacgcc gcaaacggcg tccgaatttc 6960 ttggtcgact ctagaggatc cccgggtacc gagctcgaat tcactggccg tcgttttaca 7020 acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 7080 tttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg 7140 cagcctgaat ggcgaatggc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat 7200 ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat agttaagcca 7260 gccccgacac ccgccaacac ccgctgacga attc 7294 <210> 23 <211> 8952 <212> DNA <213> Plasmid pMG33; <400> 23 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380 ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgctattgac 4440 gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 4500 cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 4560 aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 4620 cctgttctgc agaggaggaa tatagccatg gaagtgaaaa tcttcaacac ccaggatgtt 4680 caggattttc tgcgtgttgc aagcggtctg gaacaagagg gtggtaatcc gcgtgttaaa 4740 caaattattc atcgtgttct gagcgacctg tataaagcaa ttgaagatct gaatatcacc 4800 agcgacgaat attgggcagg cgttgcatat ctgaatcagc tgggtgcaaa tcaagaagca 4860 ggtctgctga gtccgggtct gggttttgat cattatctgg atatgcgtat ggatgcagaa 4920 gatgcagcac tgggtattga aaatgcaaca ccgcgtacca ttgaaggtcc gctgtatgtt 4980 gcgggtgcac cggaaagcgt tggttatgca cgcatggatg atggtagcga tccgaatggt 5040 cataccctga ttctgcatgg caccattttt gatgcagatg gtaaaccgct gccgaatgca 5100 aaagttgaaa tttggcatgc aaacaccaaa ggcttttata gccattttga tccgaccggt 5160 gaacagcagg cctttaatat gcgtcgtagc attattaccg atgagaatgg tcagtatcgt 5220 gttcgtacca ttctgcctgc cggttatggt tgtcctccgg aaggtccgac ccagcaactg 5280 ctgaaccaac tgggtcgtca tggtaatcgt ccggcacata ttcattattt tgttagcgca 5340 gatggtcacc gtaaactgac cacccagatt aatgttgccg gtgatccgta tacctatgat 5400 gattttgcat atgccacccg tgaaggtctg gttgttgatg cagttgaaca taccgatccg 5460 gaagcaatta aagccaatga tgtggaaggt ccttttgccg aaatggtgtt tgatctgaaa 5520 ctgacccgtc tggttgatgg tgttgataat caggttgtgg atcgtccgcg tctggcagtt 5580 taatacacca aaatggttca aaattatcag gcgagtgatc atgatcactg gcctgttttt 5640 atttcaggga agggtggaga caattacgtg gataatcaga tcatccaaga aaccgtggat 5700 aaaattctga gcgttctgcc gaatcaggca ggtcagctgg cacgtctggt gcgtctgatg 5760 caatttgcat gcgatccgac cattaccgtt attggcaaat ataaccatgg taaaagccgt 5820 ctgctgaatg aactgattgg caccgatatc tttagcgttg cagataaacg tgaaaccatt 5880 cagctggccg aacataaaca ggatcaggtt cgttggctgg atgcacctgg tctggatgcc 5940 gatgttgcag cagttgatga tcgtcatgca tttgaagcag tttggaccca ggcagatatt 6000 cgtctgtttg ttcatagcgt tcgtgaaggt gaactggatg caaccgaaca ccatctgctg 6060 caacagctga ttgaagatgc cgatcatagc cgtcgtcaga ccattctggt tctgacccag 6120 attgatcaga ttccggatca gaccatcctg acacagatta aaaccagcat tgcacagcag 6180 gttccgaaac tggatatttg ggcagttagc gcaacccgtc atcgtcaggg cattgaaaac 6240 ggtaaaaccc tgctgatcga aaaaagcggt attggtgcac tgcgccatac cctggaacag 6300 gcactggcac aggtgccgag cgcacgtacc tatgaaaaaa atcgtctgct gtcagatctg 6360 caccatcagc tgaaacaact gctgctggat cagaaacatg ttctgcaaca actgcaacag 6420 acacagcaac agcagctgca tgattttgat accggtctga ttaacattct ggacaaaatt 6480 cgtgttgatc tggaaccgat tgtgaatatt gatggtcagg atcaagcact gaatccggat 6540 agctttgcaa ccatgtttaa aaacaccgca gcaaaacagc agcgtgccaa agttcagatt 6600 gcatatagcc gtgcatgcat tgaaatcaac agccatctga ttcgccatgg tgttgttggt 6660 ctgcctgcgg aacagcagac caccattaaa agcattgata ccgtgattgt tgccgtgttt 6720 ggtatcagcg ttaaatttcg tgatcagctg cgtgccctgt tttataccga taccgaacgt 6780 cagcgtctgc aacgtgaatt tcgtttctat tttgaaaaaa gtgccggtcg catgattctg 6840 gcagcaaaaa ttgaacagac catgcgtcag cagggctgta ttcagaatgc catgatggca 6900 ctgcaacaaa tggaaagcgc agcataaaaa cacggacgcc gcaaacggcg tccgaatttc 6960 ttggtcgacc gttaaatcta tcaccgcaag ggataaatat ctaacaccgt gcgtgttgac 7020 tattttacct ctggcggtga taatggttgc atgtactaat ctagataagg aatatagcca 7080 tgaccgcacc gattcaggat ctgcgtgatg caattgccct gctgcaacag catgataatc 7140 agtatctgga aaccgatcat ccggttgatc cgaatgcaga actggcaggc gtttatcgtc 7200 atattggtgc cggtggcacc gttaaacgtc cgacccgtat tggtccggca atgatgttta 7260 ataacattaa aggttatccg cacagccgta ttctggttgg tatgcatgca agccgtcagc 7320 gtgcagcact gctgctgggt tgtgaagcaa gtcagctggc actggaagtt ggtaaagcag 7380 ttaaaaaacc ggttgcaccg gtggttgttc cggcaagcag cgcaccgtgt caagagcaga 7440 tttttctggc agatgatccg gattttgatc tgcgtaccct gctgcctgca cataccaata 7500 ccccgattga tgcaggtccg tttttttgtc tgggtctggc cctggcaagc gatccggtgg 7560 atgcaagcct gaccgatgtt accattcatc gtctgtgtgt tcagggtcgt gatgaactga 7620 gcatgttcct ggcagcaggt cgccatattg aagtttttcg tcagaaagca gaagcagcag 7680 gtaaaccgct gccgattacc attaatatgg gtctggaccc agcaatctat attggcgcat 7740 gttttgaagc accgaccacc ccgtttggtt ataatgaact gggtgttgcc ggtgcactgc 7800 gtcagcgtcc ggttgaactg gttcagggtg ttagcgttcc ggaaaaagca attgcacgtg 7860 ccgaaattgt tattgaaggt gaactgctgc ctggtgttcg tgttcgtgaa gatcagcata 7920 ccaattcagg tcatgcaatg ccggaatttc cgggttattg tggtggtgca aatccgagcc 7980 tgccggttat taaagttaaa gccgttacca tgcgcaataa cgcaattctg caaaccctgg 8040 ttggtccggg tgaagaacat accaccctgg caggtctgcc gaccgaagca agcatttgga 8100 atgcagttga agcagcaatt ccgggttttc tgcaaaatgt ttatgcccat accgcaggcg 8160 gtggtaaatt tctgggtatt ctgcaagtga aaaaacgtca gcctgccgat gaaggtcgtc 8220 agggtcaggc agccctgctg gcgctggcaa cctatagcga actgaaaaat atcattctgg 8280 tggatgagga tgtggacatt tttgatagtg atgatattct gtgggcaatg accacccgta 8340 tgcagggtga tgttagcatt accaccattc cgggtattcg cggtcatcag ctggacccga 8400 gccagacacc ggaatattca ccgagcattc gtggtaatgg tattagctgc aaaaccatct 8460 ttgattgtac cgttccgtgg gcactgaaaa gccattttga acgtgcaccg tttgcagatg 8520 ttgatccgcg tccgtttgca cctgaatatt ttgcacgtct ggaaaaaaat cagggcagcg 8580 caaaataagc taataacagg cctgctggta atcgcaggaa tttttatttg gatggatccc 8640 cgggtaccga gctcgaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct 8700 ggcgttaccc aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc 8760 gaagaggccc gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc 8820 ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact 8880 ctcagtacaa tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc 8940 gctgacgaat tc 8952 <210> 24 <211> 10630 <212> DNA <213> Plasmid pMG37; <400> 24 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380 ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgctattgac 4440 gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 4500 cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 4560 aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 4620 cctgttctgc agaggaggaa tatagccatg gaagtgaaaa tcttcaacac ccaggatgtt 4680 caggattttc tgcgtgttgc aagcggtctg gaacaagagg gtggtaatcc gcgtgttaaa 4740 caaattattc atcgtgttct gagcgacctg tataaagcaa ttgaagatct gaatatcacc 4800 agcgacgaat attgggcagg cgttgcatat ctgaatcagc tgggtgcaaa tcaagaagca 4860 ggtctgctga gtccgggtct gggttttgat cattatctgg atatgcgtat ggatgcagaa 4920 gatgcagcac tgggtattga aaatgcaaca ccgcgtacca ttgaaggtcc gctgtatgtt 4980 gcgggtgcac cggaaagcgt tggttatgca cgcatggatg atggtagcga tccgaatggt 5040 cataccctga ttctgcatgg caccattttt gatgcagatg gtaaaccgct gccgaatgca 5100 aaagttgaaa tttggcatgc aaacaccaaa ggcttttata gccattttga tccgaccggt 5160 gaacagcagg cctttaatat gcgtcgtagc attattaccg atgagaatgg tcagtatcgt 5220 gttcgtacca ttctgcctgc cggttatggt tgtcctccgg aaggtccgac ccagcaactg 5280 ctgaaccaac tgggtcgtca tggtaatcgt ccggcacata ttcattattt tgttagcgca 5340 gatggtcacc gtaaactgac cacccagatt aatgttgccg gtgatccgta tacctatgat 5400 gattttgcat atgccacccg tgaaggtctg gttgttgatg cagttgaaca taccgatccg 5460 gaagcaatta aagccaatga tgtggaaggt ccttttgccg aaatggtgtt tgatctgaaa 5520 ctgacccgtc tggttgatgg tgttgataat caggttgtgg atcgtccgcg tctggcagtt 5580 taatacacca aaatggttca aaattatcag gcgagtgatc atgatcactg gcctgttttt 5640 atttcaggga agggtggaga caattacgtg gataatcaga tcatccaaga aaccgtggat 5700 aaaattctga gcgttctgcc gaatcaggca ggtcagctgg cacgtctggt gcgtctgatg 5760 caatttgcat gcgatccgac cattaccgtt attggcaaat ataaccatgg taaaagccgt 5820 ctgctgaatg aactgattgg caccgatatc tttagcgttg cagataaacg tgaaaccatt 5880 cagctggccg aacataaaca ggatcaggtt cgttggctgg atgcacctgg tctggatgcc 5940 gatgttgcag cagttgatga tcgtcatgca tttgaagcag tttggaccca ggcagatatt 6000 cgtctgtttg ttcatagcgt tcgtgaaggt gaactggatg caaccgaaca ccatctgctg 6060 caacagctga ttgaagatgc cgatcatagc cgtcgtcaga ccattctggt tctgacccag 6120 attgatcaga ttccggatca gaccatcctg acacagatta aaaccagcat tgcacagcag 6180 gttccgaaac tggatatttg ggcagttagc gcaacccgtc atcgtcaggg cattgaaaac 6240 ggtaaaaccc tgctgatcga aaaaagcggt attggtgcac tgcgccatac cctggaacag 6300 gcactggcac aggtgccgag cgcacgtacc tatgaaaaaa atcgtctgct gtcagatctg 6360 caccatcagc tgaaacaact gctgctggat cagaaacatg ttctgcaaca actgcaacag 6420 acacagcaac agcagctgca tgattttgat accggtctga ttaacattct ggacaaaatt 6480 cgtgttgatc tggaaccgat tgtgaatatt gatggtcagg atcaagcact gaatccggat 6540 agctttgcaa ccatgtttaa aaacaccgca gcaaaacagc agcgtgccaa agttcagatt 6600 gcatatagcc gtgcatgcat tgaaatcaac agccatctga ttcgccatgg tgttgttggt 6660 ctgcctgcgg aacagcagac caccattaaa agcattgata ccgtgattgt tgccgtgttt 6720 ggtatcagcg ttaaatttcg tgatcagctg cgtgccctgt tttataccga taccgaacgt 6780 cagcgtctgc aacgtgaatt tcgtttctat tttgaaaaaa gtgccggtcg catgattctg 6840 gcagcaaaaa ttgaacagac catgcgtcag cagggctgta ttcagaatgc catgatggca 6900 ctgcaacaaa tggaaagcgc agcataaaaa cacggacgcc gcaaacggcg tccgaatttc 6960 ttggtcgacc gttaaatcta tcaccgcaag ggataaatat ctaacaccgt gcgtgttgac 7020 tattttacct ctggcggtga taatggttgc atgtactaat ctagataagg aatatagcca 7080 tgaccgcacc gattcaggat ctgcgtgatg caattgccct gctgcaacag catgataatc 7140 agtatctgga aaccgatcat ccggttgatc cgaatgcaga actggcaggc gtttatcgtc 7200 atattggtgc cggtggcacc gttaaacgtc cgacccgtat tggtccggca atgatgttta 7260 ataacattaa aggttatccg cacagccgta ttctggttgg tatgcatgca agccgtcagc 7320 gtgcagcact gctgctgggt tgtgaagcaa gtcagctggc actggaagtt ggtaaagcag 7380 ttaaaaaacc ggttgcaccg gtggttgttc cggcaagcag cgcaccgtgt caagagcaga 7440 tttttctggc agatgatccg gattttgatc tgcgtaccct gctgcctgca cataccaata 7500 ccccgattga tgcaggtccg tttttttgtc tgggtctggc cctggcaagc gatccggtgg 7560 atgcaagcct gaccgatgtt accattcatc gtctgtgtgt tcagggtcgt gatgaactga 7620 gcatgttcct ggcagcaggt cgccatattg aagtttttcg tcagaaagca gaagcagcag 7680 gtaaaccgct gccgattacc attaatatgg gtctggaccc agcaatctat attggcgcat 7740 gttttgaagc accgaccacc ccgtttggtt ataatgaact gggtgttgcc ggtgcactgc 7800 gtcagcgtcc ggttgaactg gttcagggtg ttagcgttcc ggaaaaagca attgcacgtg 7860 ccgaaattgt tattgaaggt gaactgctgc ctggtgttcg tgttcgtgaa gatcagcata 7920 ccaattcagg tcatgcaatg ccggaatttc cgggttattg tggtggtgca aatccgagcc 7980 tgccggttat taaagttaaa gccgttacca tgcgcaataa cgcaattctg caaaccctgg 8040 ttggtccggg tgaagaacat accaccctgg caggtctgcc gaccgaagca agcatttgga 8100 atgcagttga agcagcaatt ccgggttttc tgcaaaatgt ttatgcccat accgcaggcg 8160 gtggtaaatt tctgggtatt ctgcaagtga aaaaacgtca gcctgccgat gaaggtcgtc 8220 agggtcaggc agccctgctg gcgctggcaa cctatagcga actgaaaaat atcattctgg 8280 tggatgagga tgtggacatt tttgatagtg atgatattct gtgggcaatg accacccgta 8340 tgcagggtga tgttagcatt accaccattc cgggtattcg cggtcatcag ctggacccga 8400 gccagacacc ggaatattca ccgagcattc gtggtaatgg tattagctgc aaaaccatct 8460 ttgattgtac cgttccgtgg gcactgaaaa gccattttga acgtgcaccg tttgcagatg 8520 ttgatccgcg tccgtttgca cctgaatatt ttgcacgtct ggaaaaaaat cagggcagcg 8580 caaaataagc taataacagg cctgctggta atcgcaggaa tttttatttg gatggatccg 8640 cctacctagc ttccaagaaa gatatcctaa cagcacaaga gcggaaagat gttttgttct 8700 acatccagaa caacctctgc taaaattcct gaaaaatttt gcaaaaagtt gttgacttta 8760 tctacaaggt gtggtataat aatcttaaca acagcaggac gctcccgggt tgaggaaaac 8820 ctaatgaaac tgaccagcct gcgtgttagc ctgctggcac tgggtctggt taccagcggt 8880 tttgcagcag cagaaaccta taccgttgat cgttatcagg atgatagcga aaaaggtagc 8940 ctgcgttggg caattgaaca gagcaatgca aatagcgcac aagaaaacca gattctgatt 9000 caggcagttg gtaaagcacc gtatgttatc aaagttgata aaccgctgcc tccgattaaa 9060 agcagcgtta aaatcattgg caccgagtgg gataaaaccg gtgaatttat tgcaattgat 9120 ggcagcaact atatcaaagg cgaaggtgaa aaagcatgtc cgggtgcaaa tccgggtcag 9180 tatggcacca atgttcgtac catgaccctg cctggtctgg ttctgcaaga tgttaatggt 9240 gttaccctga aaggtctgga tgttcatcgt ttttgtattg gtgttctggt taatcgcagc 9300 agcaataacc tgattcagca taatcgtatc agcaacaatt atggtggtgc cggtgttatg 9360 attaccggtg atgatggtaa aggtaatccg accagcacca ccaccaataa taacaaagtt 9420 ctggataacg tgttcatcga taatggtgat ggtctggaac tgacccgtgg tgcagcattt 9480 aatctgattg caaataacct gtttaccagc acaaaagcca atccggaacc gagccagggt 9540 attgaaattc tgtggggtaa tgataatgcc gtggtgggta acaaattcga aaactattca 9600 gatggcctgc aaatcaattg gggtaaacgt aactatatcg cctataacga actgaccaat 9660 aacagcctgg gtttcaatct gacaggtgat ggtaacattt tcgacagcaa taaagtgcat 9720 ggtaaccgta ttggtattgc cattcgtagt gaaaaagatg ccaatgcacg tattaccctg 9780 accaaaaatc agatttggga taacggcaaa gatatcaaac gttgtgaagc cggtggtagc 9840 tgtgttccga atcagcgtct gggtgcaatt gtttttggtg ttccggcact ggaacatgaa 9900 ggttttgttg gtagccgtgg cggtggtgtt gttattgaac cggcaaaact gcaaaaaacc 9960 tgcacccagc cgaaccagca gaattgtaat gcaattccta atcagggtat tcaggcaccg 10020 aaactgacag ttagcaaaaa acagctgacc gttgaagtta aaggcacccc taatcagcgt 10080 tataatgtgg aattttttgg caatcgtaat gccagcagca gcgaagcaga acagtatctg 10140 ggtagcattg ttgttgttac cgatcatcag ggtctggcaa aagcaaattg ggctccgaaa 10200 gttagcatgc cgagcgttac cgcaaatgtg acagatcatc tgggtgcgac cagcgaactg 10260 agcagcgcag ttaaaatgcg ttaaatgcat gcgcgccgcg ttcgcgcggc gctttttttt 10320 ggtaccgagc tcgaattcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 10380 cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 10440 agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct 10500 gatgcggtat tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct 10560 cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc 10620 tgacgaattc 10630 <210> 25 <211> 6452 <212> DNA <213> Plasmid pMG39; <400> 25 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380 ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgcatgcctg 4440 caggtcgact ctagaggatc cgcctaccta gcttccaaga aagatatcct aacagcacaa 4500 gagcggaaag atgttttgtt ctacatccag aacaacctct gctaaaattc ctgaaaaatt 4560 ttgcaaaaag ttgttgactt tatctacaag gtgtggtata ataatcttaa caacagcagg 4620 acgctcccgg gttgaggaaa acctaatgaa actgaccagc ctgcgtgtta gcctgctggc 4680 actgggtctg gttaccagcg gttttgcagc agcagaaacc tataccgttg atcgttatca 4740 ggatgatagc gaaaaaggta gcctgcgttg ggcaattgaa cagagcaatg caaatagcgc 4800 acaagaaaac cagattctga ttcaggcagt tggtaaagca ccgtatgtta tcaaagttga 4860 taaaccgctg cctccgatta aaagcagcgt taaaatcatt ggcaccgagt gggataaaac 4920 cggtgaattt attgcaattg atggcagcaa ctatatcaaa ggcgaaggtg aaaaagcatg 4980 tccgggtgca aatccgggtc agtatggcac caatgttcgt accatgaccc tgcctggtct 5040 ggttctgcaa gatgttaatg gtgttaccct gaaaggtctg gatgttcatc gtttttgtat 5100 tggtgttctg gttaatcgca gcagcaataa cctgattcag cataatcgta tcagcaacaa 5160 ttatggtggt gccggtgtta tgattaccgg tgatgatggt aaaggtaatc cgaccagcac 5220 caccaccaat aataacaaag ttctggataa cgtgttcatc gataatggtg atggtctgga 5280 actgacccgt ggtgcagcat ttaatctgat tgcaaataac ctgtttacca gcacaaaagc 5340 caatccggaa ccgagccagg gtattgaaat tctgtggggt aatgataatg ccgtggtggg 5400 taacaaattc gaaaactatt cagatggcct gcaaatcaat tggggtaaac gtaactatat 5460 cgcctataac gaactgacca ataacagcct gggtttcaat ctgacaggtg atggtaacat 5520 tttcgacagc aataaagtgc atggtaaccg tattggtatt gccattcgta gtgaaaaaga 5580 tgccaatgca cgtattaccc tgaccaaaaa tcagatttgg gataacggca aagatatcaa 5640 acgttgtgaa gccggtggta gctgtgttcc gaatcagcgt ctgggtgcaa ttgtttttgg 5700 tgttccggca ctggaacatg aaggttttgt tggtagccgt ggcggtggtg ttgttattga 5760 accggcaaaa ctgcaaaaaa cctgcaccca gccgaaccag cagaattgta atgcaattcc 5820 taatcagggt attcaggcac cgaaactgac agttagcaaa aaacagctga ccgttgaagt 5880 taaaggcacc cctaatcagc gttataatgt ggaatttttt ggcaatcgta atgccagcag 5940 cagcgaagca gaacagtatc tgggtagcat tgttgttgtt accgatcatc agggtctggc 6000 aaaagcaaat tgggctccga aagttagcat gccgagcgtt accgcaaatg tgacagatca 6060 tctgggtgcg accagcgaac tgagcagcgc agttaaaatg cgttaaatgc atgcgcgccg 6120 cgttcgcgcg gcgctttttt ttggtaccga gctcgaattc actggccgtc gttttacaac 6180 gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca catccccctt 6240 tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa cagttgcgca 6300 gcctgaatgg cgaatggcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt 6360 cacaccgcat atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc 6420 cccgacaccc gccaacaccc gctgacgaat tc 6452 <210> 26 <211> 10012 <212> DNA <213> Plasmid pMG47F; <400> 26 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380 ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgctattgac 4440 gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 4500 cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 4560 aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 4620 cctgttctgc agaggaggaa tatagccatg gaagtgaaaa tcttcaacac ccaggatgtt 4680 caggattttc tgcgtgttgc aagcggtctg gaacaagagg gtggtaatcc gcgtgttaaa 4740 caaattattc atcgtgttct gagcgacctg tataaagcaa ttgaagatct gaatatcacc 4800 agcgacgaat attgggcagg cgttgcatat ctgaatcagc tgggtgcaaa tcaagaagca 4860 ggtctgctga gtccgggtct gggttttgat cattatctgg atatgcgtat ggatgcagaa 4920 gatgcagcac tgggtattga aaatgcaaca ccgcgtacca ttgaaggtcc gctgtatgtt 4980 gcgggtgcac cggaaagcgt tggttatgca cgcatggatg atggtagcga tccgaatggt 5040 cataccctga ttctgcatgg caccattttt gatgcagatg gtaaaccgct gccgaatgca 5100 aaagttgaaa tttggcatgc aaacaccaaa ggcttttata gccattttga tccgaccggt 5160 gaacagcagg cctttaatat gcgtcgtagc attattaccg atgagaatgg tcagtatcgt 5220 gttcgtacca ttctgcctgc cggttatggt tgtcctccgg aaggtccgac ccagcaactg 5280 ctgaaccaac tgggtcgtca tggtaatcgt ccggcacata ttcattattt tgttagcgca 5340 gatggtcacc gtaaactgac cacccagatt aatgttgccg gtgatccgta tacctatgat 5400 gattttgcat atgccacccg tgaaggtctg gttgttgatg cagttgaaca taccgatccg 5460 gaagcaatta aagccaatga tgtggaaggt ccttttgccg aaatggtgtt tgatctgaaa 5520 ctgacccgtc tggttgatgg tgttgataat caggttgtgg atcgtccgcg tctggcagtt 5580 taatacacca aaatggttca aaattatcag gcgagtgatc atgatcactg gcctgttttt 5640 atttcaggga agggtggaga caattacgtg gataatcaga tcatccaaga aaccgtggat 5700 aaaattctga gcgttctgcc gaatcaggca ggtcagctgg cacgtctggt gcgtctgatg 5760 caatttgcat gcgatccgac cattaccgtt attggcaaat ataaccatgg taaaagccgt 5820 ctgctgaatg aactgattgg caccgatatc tttagcgttg cagataaacg tgaaaccatt 5880 cagctggccg aacataaaca ggatcaggtt cgttggctgg atgcacctgg tctggatgcc 5940 gatgttgcag cagttgatga tcgtcatgca tttgaagcag tttggaccca ggcagatatt 6000 cgtctgtttg ttcatagcgt tcgtgaaggt gaactggatg caaccgaaca ccatctgctg 6060 caacagctga ttgaagatgc cgatcatagc cgtcgtcaga ccattctggt tctgacccag 6120 attgatcaga ttccggatca gaccatcctg acacagatta aaaccagcat tgcacagcag 6180 gttccgaaac tggatatttg ggcagttagc gcaacccgtc atcgtcaggg cattgaaaac 6240 ggtaaaaccc tgctgatcga aaaaagcggt attggtgcac tgcgccatac cctggaacag 6300 gcactggcac aggtgccgag cgcacgtacc tatgaaaaaa atcgtctgct gtcagatctg 6360 caccatcagc tgaaacaact gctgctggat cagaaacatg ttctgcaaca actgcaacag 6420 acacagcaac agcagctgca tgattttgat accggtctga ttaacattct ggacaaaatt 6480 cgtgttgatc tggaaccgat tgtgaatatt gatggtcagg atcaagcact gaatccggat 6540 agctttgcaa ccatgtttaa aaacaccgca gcaaaacagc agcgtgccaa agttcagatt 6600 gcatatagcc gtgcatgcat tgaaatcaac agccatctga ttcgccatgg tgttgttggt 6660 ctgcctgcgg aacagcagac caccattaaa agcattgata ccgtgattgt tgccgtgttt 6720 ggtatcagcg ttaaatttcg tgatcagctg cgtgccctgt tttataccga taccgaacgt 6780 cagcgtctgc aacgtgaatt tcgtttctat tttgaaaaaa gtgccggtcg catgattctg 6840 gcagcaaaaa ttgaacagac catgcgtcag cagggctgta ttcagaatgc catgatggca 6900 ctgcaacaaa tggaaagcgc agcataaaaa cacggacgcc gcaaacggcg tccgaatttc 6960 ttggtcgacc gttaaatcta tcaccgcaag ggataaatat ctaacaccgt gcgtgttgac 7020 tattttacct ctggcggtga taatggttgc atgtactaat ctagataagg aatatagcca 7080 tgaccgcacc gattcaggat ctgcgtgatg caattgccct gctgcaacag catgataatc 7140 agtatctgga aaccgatcat ccggttgatc cgaatgcaga actggcaggc gtttatcgtc 7200 atattggtgc cggtggcacc gttaaacgtc cgacccgtat tggtccggca atgatgttta 7260 ataacattaa aggttatccg cacagccgta ttctggttgg tatgcatgca agccgtcagc 7320 gtgcagcact gctgctgggt tgtgaagcaa gtcagctggc actggaagtt ggtaaagcag 7380 ttaaaaaacc ggttgcaccg gtggttgttc cggcaagcag cgcaccgtgt caagagcaga 7440 tttttctggc agatgatccg gattttgatc tgcgtaccct gctgcctgca cataccaata 7500 ccccgattga tgcaggtccg tttttttgtc tgggtctggc cctggcaagc gatccggtgg 7560 atgcaagcct gaccgatgtt accattcatc gtctgtgtgt tcagggtcgt gatgaactga 7620 gcatgttcct ggcagcaggt cgccatattg aagtttttcg tcagaaagca gaagcagcag 7680 gtaaaccgct gccgattacc attaatatgg gtctggaccc agcaatctat attggcgcat 7740 gttttgaagc accgaccacc ccgtttggtt ataatgaact gggtgttgcc ggtgcactgc 7800 gtcagcgtcc ggttgaactg gttcagggtg ttagcgttcc ggaaaaagca attgcacgtg 7860 ccgaaattgt tattgaaggt gaactgctgc ctggtgttcg tgttcgtgaa gatcagcata 7920 ccaattcagg tcatgcaatg ccggaatttc cgggttattg tggtggtgca aatccgagcc 7980 tgccggttat taaagttaaa gccgttacca tgcgcaataa cgcaattctg caaaccctgg 8040 ttggtccggg tgaagaacat accaccctgg caggtctgcc gaccgaagca agcatttgga 8100 atgcagttga agcagcaatt ccgggttttc tgcaaaatgt ttatgcccat accgcaggcg 8160 gtggtaaatt tctgggtatt ctgcaagtga aaaaacgtca gcctgccgat gaaggtcgtc 8220 agggtcaggc agccctgctg gcgctggcaa cctatagcga actgaaaaat atcattctgg 8280 tggatgagga tgtggacatt tttgatagtg atgatattct gtgggcaatg accacccgta 8340 tgcagggtga tgttagcatt accaccattc cgggtattcg cggtcatcag ctggacccga 8400 gccagacacc ggaatattca ccgagcattc gtggtaatgg tattagctgc aaaaccatct 8460 ttgattgtac cgttccgtgg gcactgaaaa gccattttga acgtgcaccg tttgcagatg 8520 ttgatccgcg tccgtttgca cctgaatatt ttgcacgtct ggaaaaaaat cagggcagcg 8580 caaaataagc taataacagg cctgctggta atcgcaggaa tttttatttg gatggatccg 8640 cctacctagc ttccaagaaa gatatcctaa cagcacaaga gcggaaagat gttttgttct 8700 acatccagaa caacctctgc taaaattcct gaaaaatttt gcaaaaagtt gttgacttta 8760 tctacaaggt gtggtataat aatcttaaca acagcaggac gctcccgggt tgaggaaaac 8820 ctaatgaaat atagcctgtg caccattagc tttcgtcacc agctgattag ctttaccgat 8880 attgttcagt ttgcctatga aaacggcttt gaaggtattg aactgtgggg cacccatgca 8940 cagaatctgt atatgcaaga atatgaaacc accgaacgtg aactgaattg cctgaaagat 9000 aaaaccctgg aaattaccat gatcagcgat tatctggata ttagcctgag cgcagatttt 9060 gaaaaaacca tcgaaaaatg tgaacagctg gcaattctgg ccaattggtt taaaacgaac 9120 aaaattcgta cctttgccgg tcagaaaggt agtgcagatt ttagccagca agaacgtcaa 9180 gagtatgtga atcgtattcg catgatttgt gaactgtttg cccagcataa tatgtatgtt 9240 ctgctggaaa cccatccgaa taccctgacc gataccctgc cgagcaccct ggaactgctg 9300 ggtgaagttg atcatccgaa tctgaaaatc aacctggatt ttctgcatat ctgggaaagc 9360 ggtgcagatc cggttgatag ctttcagcag ctgcgtccgt ggattcagca ttatcacttt 9420 aaaaacatta gcagcgcaga ctatctgcat gtgtttgaac cgaataatgt ttatgcagca 9480 gcaggtaatc gtaccggtat ggttccgctg tttgaaggca ttgttaacta tgatgaaatc 9540 atccaagaag tgcgcgatac cgatcatttt gcaagcctgg aatggtttgg tcataacgca 9600 aaagatattc tgaaagccga aatgaaagtg ctgaccaatc gtaatctgga agttgttacc 9660 agctaaatgc atgcgcgccg cgttcgcgcg gcgctttttt ttggtaccga gctcgaattc 9720 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 9780 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 9840 cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct 9900 tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 9960 tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgaat tc 10012 <210> 27 <211> 10249 <212> DNA <213> Plasmid pMG70; <400> 27 gttgacagta agacgggtaa gcctgttgat gataccgctg ccttactggg tgcattagcc 60 agtctgaatg acctgtcacg ggataatccg aagtggtcag actggaaaat cagagggcag 120 gaactgctga acagcaaaaa gtcagatagc accacatagc agacccgcca taaaacgccc 180 tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 240 aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 300 aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 360 gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 420 gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 480 gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 540 tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 600 cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 660 ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 720 gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 780 atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 840 gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 900 tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 960 tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 1020 aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 1080 tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 1140 atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 1200 taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 1260 ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 1320 ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 1380 agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 1440 tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 1500 ttacatcaga ttcctaccta cgtaacggac taagaaaaac actacacgat gctttaactg 1560 caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagcatg 1620 atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 1680 tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 1740 agactaacaa acaaaagtag aacaactgtt caccgttaga tatcaaaggg aaaactgtcc 1800 atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 1860 ggtgcattta aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 1920 acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 1980 ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 2040 cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 2100 tcatggcaat tctggaagaa atagcgcttt cagccggcaa acctgaagcc ggatctgcga 2160 ttctgataac aaactagcaa caccagaaca gcccgtttgc gggcagcaaa acccgttatg 2220 cttgtaaacc gttttgtgaa aaaattttta aaataaaaaa ggggacctct agggtcccca 2280 attaattagt aatataatct attaaaggtc attcaaaagg tcatccaccg gatcaattcc 2340 cctgctcgcg caggctgggt gccaagctct cgggtaacat caaggcccga tccttggagc 2400 ccttgccctc ccgcacgatg atcgtgccgt gatcgaaatc cagatccttg acccgcagtt 2460 gcaaaccctc actgatccgc atgcccgttc catacagaag ctgggcgaac aaacgatgct 2520 cgccttccag aaaaccgagg atgcgaacca cttcatccgg ggtcagcacc accggcaagc 2580 gccgcgacgg ccgaggtctt ccgatctcct gaagccaggg cagatccgtg cacagcacct 2640 tgccgtagaa gaacagcaag gccgccaatg cctgacgatg cgtggagacc gaaaccttgc 2700 gctcgttcgc cagccaggac agaaatgcct cgacttcgct gctgcccaag gttgccgggt 2760 gacgcacacc gtggaaacgg atgaaggcac gaacccagtg gacataagcc tgttcggttc 2820 gtaagctgta atgcaagtag cgtatgcgct cacgcaactg gtccagaacc ttgaccgaac 2880 gcagcggtgg taacggcgca gtggcggttt tcatggcttg ttatgactgt ttttttgggg 2940 tacagtctat gcctcgggca tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga 3000 tgttatggag cagcaacgat gttacgcagc agggcagtcg ccctaaaaca aagttaaaca 3060 tcatgaggga agcggtgatc gccgaagtat cgactcaact atcagaggta gttggcgtca 3120 tcgagcgcca tctcgaaccg acgttgctgg ccgtacattt gtacggctcc gcagtggatg 3180 gcggcctgaa gccacacagt gatattgatt tgctggttac ggtgaccgta aggcttgatg 3240 aaacaacgcg gcgagctttg atcaacgacc ttttggaaac ttcggcttcc cctggagaga 3300 gcgagattct ccgcgctgta gaagtcacca ttgttgtgca cgacgacatc attccgtggc 3360 gttatccagc taagcgcgaa ctgcaatttg gagaatggca gcgcaatgac attcttgcag 3420 gtatcttcga gccagccacg atcgacattg atctggctat cttgctgaca aaagcaagag 3480 aacatagcgt tgccttggta ggtccagcgg cggaggaact ctttgatccg gttcctgaac 3540 aggatctatt tgaggcgcta aatgaaacct taacgctatg gaactcgccg cccgactggg 3600 ctggcgatga gcgaaatgta gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg 3660 gcaaaatcgc gccgaaggat gtcgctgccg actgggcaat ggagcgcctg ccggcccagt 3720 atcagcccgt catacttgaa gctagacagg cttatcttgg acaagaagaa gatcgcttgg 3780 cctcgcgcgc agatcagttg gaagaatttg tccactacgt gaaaggcgag atcaccaagg 3840 tagtcggcaa ataatgtcta acaattcgtt caagccgacg ccgcttcgcg gcgcggctta 3900 actcaagcgt tagatgcact aagcacataa ttgctcacag ccaaactatc aggtcaagtc 3960 tgcttttatt atttttaagc gtgcataata agccctacac aaattgggag atatatcatg 4020 aaaggctggc tttttcttgt tatcgcaata gttggcgaag taatcgcaac atccgcatta 4080 aaatctagcg agggctttac taagctgatc cggtggatga ccttttgaat gacctttaat 4140 agattatatt actaattaat tggggaccct agaggtcccc ttttttattt taaaaatttt 4200 ttcacaaaac ggtttacaag catacgttgg ccgattcatt aatgcagctg gcacgacagg 4260 tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 4320 taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 4380 ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct tgctattgac 4440 gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 4500 cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 4560 aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 4620 cctgttctgc agaggaggaa tatagccatg gaagtgaaaa tcttcaacac ccaggatgtt 4680 caggattttc tgcgtgttgc aagcggtctg gaacaagagg gtggtaatcc gcgtgttaaa 4740 caaattattc atcgtgttct gagcgacctg tataaagcaa ttgaagatct gaatatcacc 4800 agcgacgaat attgggcagg cgttgcatat ctgaatcagc tgggtgcaaa tcaagaagca 4860 ggtctgctga gtccgggtct gggttttgat cattatctgg atatgcgtat ggatgcagaa 4920 gatgcagcac tgggtattga aaatgcaaca ccgcgtacca ttgaaggtcc gctgtatgtt 4980 gcgggtgcac cggaaagcgt tggttatgca cgcatggatg atggtagcga tccgaatggt 5040 cataccctga ttctgcatgg caccattttt gatgcagatg gtaaaccgct gccgaatgca 5100 aaagttgaaa tttggcatgc aaacaccaaa ggcttttata gccattttga tccgaccggt 5160 gaacagcagg cctttaatat gcgtcgtagc attattaccg atgagaatgg tcagtatcgt 5220 gttcgtacca ttctgcctgc cggttatggt tgtcctccgg aaggtccgac ccagcaactg 5280 ctgaaccaac tgggtcgtca tggtaatcgt ccggcacata ttcattattt tgttagcgca 5340 gatggtcacc gtaaactgac cacccagatt aatgttgccg gtgatccgta tacctatgat 5400 gattttgcat atgccacccg tgaaggtctg gttgttgatg cagttgaaca taccgatccg 5460 gaagcaatta aagccaatga tgtggaaggt ccttttgccg aaatggtgtt tgatctgaaa 5520 ctgacccgtc tggttgatgg tgttgataat caggttgtgg atcgtccgcg tctggcagtt 5580 taatacacca aaatggttca aaattatcag gcgagtgatc atgatcactg gcctgttttt 5640 atttcaggga agggtggaga caattacgtg gataatcaga tcatccaaga aaccgtggat 5700 aaaattctga gcgttctgcc gaatcaggca ggtcagctgg cacgtctggt gcgtctgatg 5760 caatttgcat gcgatccgac cattaccgtt attggcaaat ataaccatgg taaaagccgt 5820 ctgctgaatg aactgattgg caccgatatc tttagcgttg cagataaacg tgaaaccatt 5880 cagctggccg aacataaaca ggatcaggtt cgttggctgg atgcacctgg tctggatgcc 5940 gatgttgcag cagttgatga tcgtcatgca tttgaagcag tttggaccca ggcagatatt 6000 cgtctgtttg ttcatagcgt tcgtgaaggt gaactggatg caaccgaaca ccatctgctg 6060 caacagctga ttgaagatgc cgatcatagc cgtcgtcaga ccattctggt tctgacccag 6120 attgatcaga ttccggatca gaccatcctg acacagatta aaaccagcat tgcacagcag 6180 gttccgaaac tggatatttg ggcagttagc gcaacccgtc atcgtcaggg cattgaaaac 6240 ggtaaaaccc tgctgatcga aaaaagcggt attggtgcac tgcgccatac cctggaacag 6300 gcactggcac aggtgccgag cgcacgtacc tatgaaaaaa atcgtctgct gtcagatctg 6360 caccatcagc tgaaacaact gctgctggat cagaaacatg ttctgcaaca actgcaacag 6420 acacagcaac agcagctgca tgattttgat accggtctga ttaacattct ggacaaaatt 6480 cgtgttgatc tggaaccgat tgtgaatatt gatggtcagg atcaagcact gaatccggat 6540 agctttgcaa ccatgtttaa aaacaccgca gcaaaacagc agcgtgccaa agttcagatt 6600 gcatatagcc gtgcatgcat tgaaatcaac agccatctga ttcgccatgg tgttgttggt 6660 ctgcctgcgg aacagcagac caccattaaa agcattgata ccgtgattgt tgccgtgttt 6720 ggtatcagcg ttaaatttcg tgatcagctg cgtgccctgt tttataccga taccgaacgt 6780 cagcgtctgc aacgtgaatt tcgtttctat tttgaaaaaa gtgccggtcg catgattctg 6840 gcagcaaaaa ttgaacagac catgcgtcag cagggctgta ttcagaatgc catgatggca 6900 ctgcaacaaa tggaaagcgc agcataaaaa cacggacgcc gcaaacggcg tccgaatttc 6960 ttggtcgacc gttaaatcta tcaccgcaag ggataaatat ctaacaccgt gcgtgttgac 7020 tattttacct ctggcggtga taatggttgc atgtactaat ctagataagg aatatagcca 7080 tgaccgcacc gattcaggat ctgcgtgatg caattgccct gctgcaacag catgataatc 7140 agtatctgga aaccgatcat ccggttgatc cgaatgcaga actggcaggc gtttatcgtc 7200 atattggtgc cggtggcacc gttaaacgtc cgacccgtat tggtccggca atgatgttta 7260 ataacattaa aggttatccg cacagccgta ttctggttgg tatgcatgca agccgtcagc 7320 gtgcagcact gctgctgggt tgtgaagcaa gtcagctggc actggaagtt ggtaaagcag 7380 ttaaaaaacc ggttgcaccg gtggttgttc cggcaagcag cgcaccgtgt caagagcaga 7440 tttttctggc agatgatccg gattttgatc tgcgtaccct gctgcctgca cataccaata 7500 ccccgattga tgcaggtccg tttttttgtc tgggtctggc cctggcaagc gatccggtgg 7560 atgcaagcct gaccgatgtt accattcatc gtctgtgtgt tcagggtcgt gatgaactga 7620 gcatgttcct ggcagcaggt cgccatattg aagtttttcg tcagaaagca gaagcagcag 7680 gtaaaccgct gccgattacc attaatatgg gtctggaccc agcaatctat attggcgcat 7740 gttttgaagc accgaccacc ccgtttggtt ataatgaact gggtgttgcc ggtgcactgc 7800 gtcagcgtcc ggttgaactg gttcagggtg ttagcgttcc ggaaaaagca attgcacgtg 7860 ccgaaattgt tattgaaggt gaactgctgc ctggtgttcg tgttcgtgaa gatcagcata 7920 ccaattcagg tcatgcaatg ccggaatttc cgggttattg tggtggtgca aatccgagcc 7980 tgccggttat taaagttaaa gccgttacca tgcgcaataa cgcaattctg caaaccctgg 8040 ttggtccggg tgaagaacat accaccctgg caggtctgcc gaccgaagca agcatttgga 8100 atgcagttga agcagcaatt ccgggttttc tgcaaaatgt ttatgcccat accgcaggcg 8160 gtggtaaatt tctgggtatt ctgcaagtga aaaaacgtca gcctgccgat gaaggtcgtc 8220 agggtcaggc agccctgctg gcgctggcaa cctatagcga actgaaaaat atcattctgg 8280 tggatgagga tgtggacatt tttgatagtg atgatattct gtgggcaatg accacccgta 8340 tgcagggtga tgttagcatt accaccattc cgggtattcg cggtcatcag ctggacccga 8400 gccagacacc ggaatattca ccgagcattc gtggtaatgg tattagctgc aaaaccatct 8460 ttgattgtac cgttccgtgg gcactgaaaa gccattttga acgtgcaccg tttgcagatg 8520 ttgatccgcg tccgtttgca cctgaatatt ttgcacgtct ggaaaaaaat cagggcagcg 8580 caaaataagc taataacagg cctgctggta atcgcaggaa tttttatttg gatggatccg 8640 cctacctagc ttccaagaaa gatatcctaa cagcacaaga gcggaaagat gttttgttct 8700 acatccagaa caacctctgc taaaattcct gaaaaatttt gcaaaaagtt gttgacttta 8760 tctacaaggt gtggtataat aatcttaaca acagcaggac gctcccgggt tgaggaaaac 8820 ctaatgccga gcaaactggc aattagcagc atgagcctgg gtcgttgttt tgcaggtcat 8880 agcctggata gtaaactgga tgcagcacag cgttatggtt atctgggtat tgaactgttt 8940 tatgaggatc tggttgatgt tgcagaacat ctgagcaatg aacgtccgag tccggaaggt 9000 ccgtttgttg aagcacagat tgcagcagca cgtcatattc tgcaaatgtg tcaggcacgt 9060 ggtctggaag ttgtttgtct gcaaccgttt atgcattatg atggtctgaa tgatcgtgcc 9120 gaacatgaac gtcgtctgga aaaactggca ctgtggattg aactggcaca tgaactgcat 9180 accgatatta ttcagattcc ggcaaatttt ctgcctgcaa atcaggttag cgataatctg 9240 gatctgattg ttagcgatct gtgtaaagtt gcagatattg gtgcacaggc actgcctccg 9300 attcgttttg catatgaaag cctgtgttgg agcacccgtg ttgatctgtg ggaacgttgt 9360 tgggatattg ttcagcgtgt ggatcgtccg aattttggta tttgtctgga tacctttaac 9420 atcctgggtc gcatttatgc agatccgacc agcccgagcg gtcgtacccc gaatgcaaaa 9480 gaagcagttc gtaaaagcat tgccaatctg gttagccgtg tggatgttag caaagttttt 9540 tatgttcagg ttgtggatgc cgaacgtctg agtaaaccgc tgctgcctgg tcatccgtat 9600 tataacccgg aacagcctgc acgtatgagc tggtcacgta attgtcgtct gttctatggt 9660 gaaaccgaat atggtgcata tctgccggtt aaagaagttg cacgcgcact gtttcatggt 9720 attggttttg aaggttgggt tagcctggaa ctgtttaatc gtcgtatgag cgaagaaggt 9780 ccggaagttc ctgaagaact ggccatgcgt ggtgcaatta gctgggcaaa actggttcag 9840 gatctgcgta ttccggttga aggtccgctg gttaccatgc ctcgtgttag cgcaagcctg 9900 taaatgcatg cgcgccgcgt tcgcgcggcg cttttttttg gtaccgagct cgaattcact 9960 ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct 10020 tgcagcacat ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc 10080 ttcccaacag ttgcgcagcc tgaatggcga atggcgcctg atgcggtatt ttctccttac 10140 gcatctgtgc ggtatttcac accgcatatg gtgcactctc agtacaatct gctctgatgc 10200 cgcatagtta agccagcccc gacacccgcc aacacccgct gacgaattc 10249 <210> 28 <211> 7623 <212> DNA <213> Plasmid pCP32AMP; <400> 28 acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc 60 tgcaccatta tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct 120 acatctgtat taacgaagcg ctggcattga ccctgagtga tttttctctg gtcccgccgc 180 atccataccg ccagttgttt accctcacaa cgttccagta accgggcatg ttcatcatca 240 gtaacccgta tcgtgagcat cctctctcgt ttcatcggta tcattacccc catgaacaga 300 aattccccct tacacggagg catcaagtga ccaaacagga aaaaaccgcc cttaacatgg 360 cccgctttat cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg 420 atgaacaggc agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct 480 gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 540 tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 600 gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata 660 ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga 720 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 780 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 840 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 900 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 960 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 1020 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 1080 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 1140 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 1200 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 1260 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 1320 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 1380 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 1440 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 1500 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 1560 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 1620 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 1680 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 1740 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 1800 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 1860 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 1920 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 1980 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg 2040 ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 2100 atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 2160 taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 2220 catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 2280 atagtgtatg cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc 2340 acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 2400 aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 2460 ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 2520 cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 2580 atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 2640 ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 2700 ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 2760 tcgtcttcaa gaattctgaa ccagtcctaa aacgagtaaa taggaccggc aattcttcaa 2820 gcaataaaca ggaataccaa ttattaaaag ataacttagt cagatcgtac aataaagctt 2880 tgaagaaaaa tgcgccttat tcaatctttg ctataaaaaa tggcccaaaa tctcacattg 2940 gaagacattt gatgacctca tttctttcaa tgaagggcct aacggagttg actaatgttg 3000 tgggaaattg gagcgataag cgtgcttctg ccgtggccag gacaacgtat actcatcaga 3060 taacagcaat acctgatcac tacttcgcac tagtttctcg gtactatgca tatgatccaa 3120 tatcaaagga aatgatagca ttgaaggatg agactaatcc aattgaggag tggcagcata 3180 tagaacagct aaagggtagt gctgaaggaa gcatacgata ccccgcatgg aatgggataa 3240 tatcacagga ggtactagac tacctttcat cctacataaa tagacgcata taagtacgca 3300 tttaagcata aacacgcact atgccgttct tctcatgtat atatatatac aggcaacacg 3360 cagatatagg tgcgacgtga acagtgagct gtatgtgcgc agctcgcgtt gcattttcgg 3420 aagcgctcgt tttcggaaac gctttgaagt tcctattccg aagttcctat tctctagaaa 3480 gtataggaac ttcagagcgc ttttgaaaac caaaagcgct ctgaagacgc actttcaaaa 3540 aaccaaaaac gcaccggact gtaacgagct actaaaatat tgcgaatacc gcttccacaa 3600 acattgctca aaagtatctc tttgctatat atctctgtgc tatatcccta tataacctac 3660 ccatccacct ttcgctcctt gaacttgcat ctaaactcga cctctacatt ttttatgttt 3720 atctctagta ttactcttta gacaaaaaaa ttgtagtaag aactattcat agagtgaatc 3780 gaaaacaata cgaaaatgta aacatttcct atacgtagta tatagagaca aaatagaaga 3840 aaccgttcat aattttctga ccaatgaaga atcatcaacg ctatcacttt ctgttcacaa 3900 agtatgcgca atccacatcg gtatagaata taatcgggga tgcctttatc ttgaaaaaat 3960 gcacccgcag cttcgctagt aatcagtaaa cgcgggaagt ggagtcaggc tttttttatg 4020 gaagagaaaa tagacaccaa agtagccttc ttctaacctt aacggaccta cagtgcaaaa 4080 agttatcaag agactgcatt atagagcgca caaaggagaa aaaaagtaat ctaagatgct 4140 ttgttagaaa aatagcgctc tcgggatgca tttttgtaga acaaaaaaga agtatagatt 4200 ctttgttggt aaaatagcgc tctcgcgttg catttctgtt ctgtaaaaat gcagctcaga 4260 ttctttgttt gaaaaattag cgctctcgcg ttgcattttt gttttacaaa aatgaagcac 4320 agattcttcg ttggtaaaat agcgctttcg cgttgcattt ctgttctgta aaaatgcagc 4380 tcagattctt tgtttgaaaa attagcgctc tcgcgttgca tttttgttct acaaaatgaa 4440 gcacagatgc ttcgttaaca aagatatgct attgaagtgc aagatggaaa cgcagaaaat 4500 gaaccgggga tgcgacgtgc aagattacct atgcaataga tgcaatagtt tctccaggaa 4560 ccgaaataca tacattgtct tccgtaaagc gctagactat atattattat acaggttcaa 4620 atatactatc tgtttcaggg aaaactccca ggttcggatg ttcaaaattc aatgatgggt 4680 aacaagtacg atcgtaaatc tgtaaaacag tttgtcggat attaggctgt atctcctcaa 4740 agcgtattcg aatatcattg agaagctgca gcgtcacatc ggataataat gatggcagcc 4800 attgtagaag tgccttttgc atttctagtc tctttctcgg tctagctagt tttactacat 4860 cgcgaagata gaatcttaga tcacactgcc tttgctgagc tggatcaata gagtaacaaa 4920 agagtggtaa ggcctcgtta aaggacaagg acctgagcgg aagtgtatcg tacagtagac 4980 ggagtatact agtatagtct atagtccgtg gaattctcat gtttgacagc ttatcatcga 5040 taagcttttc aattcaattc atcatttttt ttttattctt ttttttgatt tcggtttctt 5100 tgaaattttt ttgattcggt aatctccgaa cagaaggaag aacgaaggaa ggagcacaga 5160 cttagattgg tatatatacg catatgtagt gttgaagaaa catgaaattg cccagtattc 5220 ttaacccaac tgcacagaac aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct 5280 acatataagg aacgtgctgc tactcatcct agtcctgttg ctgccaagct atttaatatc 5340 atgcacgaaa agcaaacaaa cttgtgtgct tcattggatg ttcgtaccac caaggaatta 5400 ctggagttag ttgaagcatt aggtcccaaa atttgtttac taaaaacaca tgtggatatc 5460 ttgactgatt tttccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac 5520 aattttttac tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag 5580 tactctgcgg gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg 5640 gtgggcccag gtattgttag cggtttgaag caggcggcag aagaagtaac aaaggaacct 5700 agaggccttt tgatgttagc agaattgtca tgcaagggct ccctatctac tggagaatat 5760 actaagggta ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct 5820 caaagagaca tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg 5880 ggtttagatg acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc 5940 tctacaggat ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct 6000 aaggtagagg gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc 6060 cagcaaaact aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga 6120 gcttcaattt aattatatca gttattaccc gggaatctcg gtcgtaatga cttgaaataa 6180 ttaacaaaca aaggagttac agttagaaat tgtaggagag atctcgtttt tcgcgacaat 6240 ctggcgtttt tcttgctaat tccaggatta atccgttcat agtgtaaaac cccgtttaca 6300 cattctgacg gaagatatag attggaagta ttgcattcac taagataagt atggcaacac 6360 tggaacagac atgaattatc agaacgacga tttacgcatc aaagaaatca aagagttact 6420 tcctcctgtc gcattgctgg aaaaattccc cgctactgaa aatgccgcga atacggttgc 6480 ccatgcccga aaagcgatcc ataagatcct gaaaggtaat gatgatcgcc tgttggttgt 6540 gattggccca tgctcaattc atgatcctgt cgcggcaaaa gagtatgcca ctcgcttgct 6600 ggcgctgcgt gaagagctga aagatgagct ggaaatcgta atgcgcgtct attttgaaaa 6660 gccgcgtacc acggtgggct ggaaagggct gattaacgat ccgcatatgg ataatagctt 6720 ccagatcaac gacggtctgc gtatagcccg taaattgctg cttgatatta acgacagcgg 6780 tctgccagcg gcaggtgagt ttctcgatat gatcacccca caatatctcg ctgacctgat 6840 gagctggggc gcaattggcg cacgtaccac cgaatcgcag gtgcaccgcg aactggcatc 6900 agggctttct tgtccggtcg gcttcaaaaa tggcaccgac ggtacgatta aagtggctat 6960 cgatgccatt aatgccgccg gtgcgccgca ctgcttcctg tccgtaacga aatgggggca 7020 ttcggcgatt gtgaatacca gcggtaacgg cgattgccat atcattctgc gcggcggtaa 7080 agagcctaac tacagcgcga agcacgttgc tgaagtgaaa gaagggctga acaaagcagg 7140 cctgccagca caggtgatga tcgatttcag ccatgctaac tcgtccaaac aattcaaaaa 7200 gcagatggat gtttgtgctg acgtttgcca gcagattgcc ggtggcgaaa aggccattat 7260 tggcgtgatg gtggaaagcc atctggtgga aggcaatcag agcctcgaga gcggggagcc 7320 gctggcctac ggtaagagca tcaccgatgc ctgcatcggc tgggaagata ccgatgctct 7380 gttacgtcaa ctggcgaatg cagtaaaagc gcgtcgcggg taaggtttaa ttgtcggatg 7440 cgccgtcaga gtggcgtatc cgatgaatca ccacaggcct gataagtcgc gcagcgtcgc 7500 atcaggcaat gtgctccatt gttagcaaca aaaaagccga ctcacttgca gtcggctttc 7560 tcattttaaa cgaatgacgt ttacttcgct ttaccctggt ttgcaaccgc cgctgctttc 7620 gct 7623 <210> 29 <211> 7630 <212> DNA <213> Plasmid pCP14; <400> 29 ctcgaggcta ttgacgacag ctatggttca ctgtccacca accaaaactg tgctcagtac 60 cgccaatatt tctcccttga ggggtacaaa gaggtgtccc tagaagagat ccacgctgtg 120 taaaaatttt acaaaaaggt attgactttc cctacagggt gtgtaataat ttaattacag 180 gcgggggcaa ccccgcctgt tctagaggag gaggaatcgc catggagagg attgtcgtta 240 ctctcgggga acgtagttac ccaattacca tcgcatctgg tttgtttaat gaaccagctt 300 cattcttacc gctgaaatcg ggcgagcagg tcatgttggt caccaacgaa accctggctc 360 ctctgtatct cgataaggtc cgcggcgtac ttgaacaggc gggtgttaac gtcgatagcg 420 ttatcctccc tgacggcgag cagtataaaa gcctggctgt actcgatacc gtctttacgg 480 cgttgttaca aaagccgcat ggtcgcgata ctacgctggt ggcgcttggc ggcggcgtag 540 tgggcgatct gaccggcttc gcggcggcga gttatcagcg cggtgttcgt ttcattcaag 600 tcccgacgac gttactgtcg caggtcgatt cctccgttgg cggcaaaact gcggtcaacc 660 atcccctcgg taaaaacatg attggcgcgt tctaccagcc tgcttcagtg gtggtggatc 720 tcgactgtct gaaaacgctt cccccgcgtg agttagcgtc ggggctggca gaagtcatca 780 aatacggcat tattcttgac ggtgcgtttt tcaactggct ggaagagaat ctggatgcgt 840 tgttgcgtct ggacggtccg gcaatggcgt actgtattcg ccgttgttgt gaactgaagg 900 cagaagttgt cgccgccgac gagcgcgaaa ccgggttacg tgctttactg aatctgggac 960 acacctttgg tcatgccatt gaagctgaaa tggggtatgg caattggtta catggtgaag 1020 cggtcgctgc gggtatggtg atggcggcgc ggacgtcgga acgtctcggg cagtttagtt 1080 ctgccgaaac gcagcgtatt ataaccctgc tcacgcgggc tgggttaccg gtcaatgggc 1140 cgcgcgaaat gtccgcgcag gcgtatttac cgcatatgct gcgtgacaag aaagtccttg 1200 cgggagagat gcgcttaatt cttccgttgg caattggtaa gagtgaagtt cgcagcggcg 1260 tttcgcacga gcttgttctt aacgccattg ccgattgtca atcagcgtaa tcatcgttca 1320 tgcctgatgc cgctatgtag gccggataag gcgttcacgc cgcatccggc aaccgatgcc 1380 tgatgcgacg cggtcgcgtc ttatcaggcc tacaggtcga tgccgatatg tacatcgtat 1440 tcggcaatta atacatagca acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg 1500 aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca ggatgctgct 1560 ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga ccctgagtga 1620 tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa cgttccagta 1680 accgggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt ttcatcggta 1740 tcattacccc catgaacaga aattccccct tacacggagg catcaagtga ccaaacagga 1800 aaaaaccgcc cttaacatgg cccgctttat cagaagccag acattaacgc ttctggagaa 1860 actcaacgag ctggacgcgg atgaacaggc agacatctgt gaatcgcttc acgaccacgc 1920 tgatgagctt taccgcagct gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca 1980 catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 2040 ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc gcagccatga cccagtcacg 2100 tagcgatagc ggagtgtata ctggcttaac tatgcggcat cagagcagat tgtactgaga 2160 gtgcaccata tgcggtgtga aataccgcac agatgcgtaa ggagaaaata ccgcatcagg 2220 cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg 2280 gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga 2340 aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg 2400 gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag 2460 aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc 2520 gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg 2580 ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt 2640 cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc 2700 ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc 2760 actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg 2820 tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca 2880 gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc 2940 ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat 3000 cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt 3060 ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt 3120 tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc 3180 agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc 3240 gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata 3300 ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg 3360 gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc 3420 cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct 3480 gcaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa 3540 cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt 3600 cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca 3660 ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac 3720 tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca 3780 acacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt 3840 tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc 3900 actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca 3960 aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata 4020 ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc 4080 ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 4140 cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac ctataaaaat 4200 aggcgtatca cgaggccctt tcgtcttcaa gaattctgaa ccagtcctaa aacgagtaaa 4260 taggaccggc aattcttcaa gcaataaaca ggaataccaa ttattaaaag ataacttagt 4320 cagatcgtac aataaagctt tgaagaaaaa tgcgccttat tcaatctttg ctataaaaaa 4380 tggcccaaaa tctcacattg gaagacattt gatgacctca tttctttcaa tgaagggcct 4440 aacggagttg actaatgttg tgggaaattg gagcgataag cgtgcttctg ccgtggccag 4500 gacaacgtat actcatcaga taacagcaat acctgatcac tacttcgcac tagtttctcg 4560 gtactatgca tatgatccaa tatcaaagga aatgatagca ttgaaggatg agactaatcc 4620 aattgaggag tggcagcata tagaacagct aaagggtagt gctgaaggaa gcatacgata 4680 ccccgcatgg aatgggataa tatcacagga ggtactagac tacctttcat cctacataaa 4740 tagacgcata taagtacgca tttaagcata aacacgcact atgccgttct tctcatgtat 4800 atatatatac aggcaacacg cagatatagg tgcgacgtga acagtgagct gtatgtgcgc 4860 agctcgcgtt gcattttcgg aagcgctcgt tttcggaaac gctttgaagt tcctattccg 4920 aagttcctat tctctagaaa gtataggaac ttcagagcgc ttttgaaaac caaaagcgct 4980 ctgaagacgc actttcaaaa aaccaaaaac gcaccggact gtaacgagct actaaaatat 5040 tgcgaatacc gcttccacaa acattgctca aaagtatctc tttgctatat atctctgtgc 5100 tatatcccta tataacctac ccatccacct ttcgctcctt gaacttgcat ctaaactcga 5160 cctctacatt ttttatgttt atctctagta ttactcttta gacaaaaaaa ttgtagtaag 5220 aactattcat agagtgaatc gaaaacaata cgaaaatgta aacatttcct atacgtagta 5280 tatagagaca aaatagaaga aaccgttcat aattttctga ccaatgaaga atcatcaacg 5340 ctatcacttt ctgttcacaa agtatgcgca atccacatcg gtatagaata taatcgggga 5400 tgcctttatc ttgaaaaaat gcacccgcag cttcgctagt aatcagtaaa cgcgggaagt 5460 ggagtcaggc tttttttatg gaagagaaaa tagacaccaa agtagccttc ttctaacctt 5520 aacggaccta cagtgcaaaa agttatcaag agactgcatt atagagcgca caaaggagaa 5580 aaaaagtaat ctaagatgct ttgttagaaa aatagcgctc tcgggatgca tttttgtaga 5640 acaaaaaaga agtatagatt ctttgttggt aaaatagcgc tctcgcgttg catttctgtt 5700 ctgtaaaaat gcagctcaga ttctttgttt gaaaaattag cgctctcgcg ttgcattttt 5760 gttttacaaa aatgaagcac agattcttcg ttggtaaaat agcgctttcg cgttgcattt 5820 ctgttctgta aaaatgcagc tcagattctt tgtttgaaaa attagcgctc tcgcgttgca 5880 tttttgttct acaaaatgaa gcacagatgc ttcgttaaca aagatatgct attgaagtgc 5940 aagatggaaa cgcagaaaat gaaccgggga tgcgacgtgc aagattacct atgcaataga 6000 tgcaatagtt tctccaggaa ccgaaataca tacattgtct tccgtaaagc gctagactat 6060 atattattat acaggttcaa atatactatc tgtttcaggg aaaactccca ggttcggatg 6120 ttcaaaattc aatgatgggt aacaagtacg atcgtaaatc tgtaaaacag tttgtcggat 6180 attaggctgt atctcctcaa agcgtattcg aatatcattg agaagctgca gcgtcacatc 6240 ggataataat gatggcagcc attgtagaag tgccttttgc atttctagtc tctttctcgg 6300 tctagctagt tttactacat cgcgaagata gaatcttaga tcacactgcc tttgctgagc 6360 tggatcaata gagtaacaaa agagtggtaa ggcctcgtta aaggacaagg acctgagcgg 6420 aagtgtatcg tacagtagac ggagtatact agtatagtct atagtccgtg gaattctcat 6480 gtttgacagc ttatcatcga taagcttttc aattcaattc atcatttttt ttttattctt 6540 ttttttgatt tcggtttctt tgaaattttt ttgattcggt aatctccgaa cagaaggaag 6600 aacgaaggaa ggagcacaga cttagattgg tatatatacg catatgtagt gttgaagaaa 6660 catgaaattg cccagtattc ttaacccaac tgcacagaac aaaaacctgc aggaaacgaa 6720 gataaatcat gtcgaaagct acatataagg aacgtgctgc tactcatcct agtcctgttg 6780 ctgccaagct atttaatatc atgcacgaaa agcaaacaaa cttgtgtgct tcattggatg 6840 ttcgtaccac caaggaatta ctggagttag ttgaagcatt aggtcccaaa atttgtttac 6900 taaaaacaca tgtggatatc ttgactgatt tttccatgga gggcacagtt aagccgctaa 6960 aggcattatc cgccaagtac aattttttac tcttcgaaga cagaaaattt gctgacattg 7020 gtaatacagt caaattgcag tactctgcgg gtgtatacag aatagcagaa tgggcagaca 7080 ttacgaatgc acacggtgtg gtgggcccag gtattgttag cggtttgaag caggcggcag 7140 aagaagtaac aaaggaacct agaggccttt tgatgttagc agaattgtca tgcaagggct 7200 ccctatctac tggagaatat actaagggta ctgttgacat tgcgaagagc gacaaagatt 7260 ttgttatcgg ctttattgct caaagagaca tgggtggaag agatgaaggt tacgattggt 7320 tgattatgac acccggtgtg ggtttagatg acaagggaga cgcattgggt caacagtata 7380 gaaccgtgga tgatgtggtc tctacaggat ctgacattat tattgttgga agaggactat 7440 ttgcaaaggg aagggatgct aaggtagagg gtgaacgtta cagaaaagca ggctgggaag 7500 catatttgag aagatgcggc cagcaaaact aaaaaactgt attataagta aatgcatgta 7560 tactaaactc acaaattaga gcttcaattt aattatatca gttattaccc gggaatctcg 7620 gtcgtaatga 7630 <210> 30 <211> 10015 <212> DNA <213> Plasmid pCP50; <400> 30 cttgaaataa ttaacaaaca aaggagttac agttagaaat tgtaggagag atctcgtttt 60 tcgcgacaat ctggcgtttt tcttgctaat tccaggatta atccgttcat agtgtaaaac 120 cccgtttaca cattctgacg gaagatatag attggaagta ttgcattcac taagataagt 180 atggcaacac tggaacagac atgaattatc agaacgacga tttacgcatc aaagaaatca 240 aagagttact tcctcctgtc gcattgctgg aaaaattccc cgctactgaa aatgccgcga 300 atacggttgc ccatgcccga aaagcgatcc ataagatcct gaaaggtaat gatgatcgcc 360 tgttggttgt gattggccca tgctcaattc atgatcctgt cgcggcaaaa gagtatgcca 420 ctcgcttgct ggcgctgcgt gaagagctga aagatgagct ggaaatcgta atgcgcgtct 480 attttgaaaa gccgcgtacc acggtgggct ggaaagggct gattaacgat ccgcatatgg 540 ataatagctt ccagatcaac gacggtctgc gtatagcccg taaattgctg cttgatatta 600 acgacagcgg tctgccagcg gcaggtgagt ttctcgatat gatcacccca caatatctcg 660 ctgacctgat gagctggggc gcaattggcg cacgtaccac cgaatcgcag gtgcaccgcg 720 aactggcatc agggctttct tgtccggtcg gcttcaaaaa tggcaccgac ggtacgatta 780 aagtggctat cgatgccatt aatgccgccg gtgcgccgca ctgcttcctg tccgtaacga 840 aatgggggca ttcggcgatt gtgaatacca gcggtaacgg cgattgccat atcattctgc 900 gcggcggtaa agagcctaac tacagcgcga agcacgttgc tgaagtgaaa gaagggctga 960 acaaagcagg cctgccagca caggtgatga tcgatttcag ccatgctaac tcgtccaaac 1020 aattcaaaaa gcagatggat gtttgtgctg acgtttgcca gcagattgcc ggtggcgaaa 1080 aggccattat tggcgtgatg gtggaaagcc atctggtgga aggcaatcag agcctcgaga 1140 gcggggagcc gctggcctac ggtaagagca tcaccgatgc ctgcatcggc tgggaagata 1200 ccgatgctct gttacgtcaa ctggcgaatg cagtaaaagc gcgtcgcggg taaggtttaa 1260 ttgtcggatg cgccgtcaga gtggcgtatc cgatgaatca ccacaggcct gataagtcgc 1320 gcagcgtcgc atcaggcaat gtgctccatt gttagcaaca aaaaagccga ctcacttgca 1380 gtcggctttc tcattttaaa cgaatgacgt ttacttcgct ttaccctggt ttgcaaccgc 1440 cgctgctttc gctacatgaa tggtcttcgg tttccgtgtt tcgtaaagtc tggaaacgcg 1500 gaagtcagcg ccctgcacca ttatgttccg gatctgcatc gcaggatgct gctggctacc 1560 ctgtggaaca cctacatctg tattaacgaa gcgctggcat tgaccctgag tgatttttct 1620 ctggtcccgc cgcatccata ccgccagttg tttaccctca caacgttcca gtaaccgggc 1680 atgttcatca tcagtaaccc gtatcgtgag catcctctct cgtttcatcg gtatcattac 1740 ccccatgaac agaaattccc ccttacacgg aggcatcaag tgaccaaaca ggaaaaaacc 1800 gcccttaaca tggcccgctt tatcagaagc cagacattaa cgcttctgga gaaactcaac 1860 gagctggacg cggatgaaca ggcagacatc tgtgaatcgc ttcacgacca cgctgatgag 1920 ctttaccgca gctgcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag 1980 ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag 2040 ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat 2100 agcggagtgt atactggctt aactatgcgg catcagagca gattgtactg agagtgcacc 2160 atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt 2220 ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag 2280 ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca 2340 tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 2400 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 2460 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 2520 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 2580 tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 2640 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 2700 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 2760 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 2820 actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct 2880 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 2940 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 3000 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 3060 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 3120 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 3180 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 3240 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 3300 acccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 3360 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 3420 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca 3480 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 3540 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 3600 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 3660 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 3720 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaacacggg 3780 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 3840 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 3900 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 3960 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 4020 tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 4080 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 4140 tgccacctga cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta 4200 tcacgaggcc ctttcgtctt caagaattct gaaccagtcc taaaacgagt aaataggacc 4260 ggcaattctt caagcaataa acaggaatac caattattaa aagataactt agtcagatcg 4320 tacaataaag ctttgaagaa aaatgcgcct tattcaatct ttgctataaa aaatggccca 4380 aaatctcaca ttggaagaca tttgatgacc tcatttcttt caatgaaggg cctaacggag 4440 ttgactaatg ttgtgggaaa ttggagcgat aagcgtgctt ctgccgtggc caggacaacg 4500 tatactcatc agataacagc aatacctgat cactacttcg cactagtttc tcggtactat 4560 gcatatgatc caatatcaaa ggaaatgata gcattgaagg atgagactaa tccaattgag 4620 gagtggcagc atatagaaca gctaaagggt agtgctgaag gaagcatacg ataccccgca 4680 tggaatggga taatatcaca ggaggtacta gactaccttt catcctacat aaatagacgc 4740 atataagtac gcatttaagc ataaacacgc actatgccgt tcttctcatg tatatatata 4800 tacaggcaac acgcagatat aggtgcgacg tgaacagtga gctgtatgtg cgcagctcgc 4860 gttgcatttt cggaagcgct cgttttcgga aacgctttga agttcctatt ccgaagttcc 4920 tattctctag aaagtatagg aacttcagag cgcttttgaa aaccaaaagc gctctgaaga 4980 cgcactttca aaaaaccaaa aacgcaccgg actgtaacga gctactaaaa tattgcgaat 5040 accgcttcca caaacattgc tcaaaagtat ctctttgcta tatatctctg tgctatatcc 5100 ctatataacc tacccatcca cctttcgctc cttgaacttg catctaaact cgacctctac 5160 attttttatg tttatctcta gtattactct ttagacaaaa aaattgtagt aagaactatt 5220 catagagtga atcgaaaaca atacgaaaat gtaaacattt cctatacgta gtatatagag 5280 acaaaataga agaaaccgtt cataattttc tgaccaatga agaatcatca acgctatcac 5340 tttctgttca caaagtatgc gcaatccaca tcggtataga atataatcgg ggatgccttt 5400 atcttgaaaa aatgcacccg cagcttcgct agtaatcagt aaacgcggga agtggagtca 5460 ggcttttttt atggaagaga aaatagacac caaagtagcc ttcttctaac cttaacggac 5520 ctacagtgca aaaagttatc aagagactgc attatagagc gcacaaagga gaaaaaaagt 5580 aatctaagat gctttgttag aaaaatagcg ctctcgggat gcatttttgt agaacaaaaa 5640 agaagtatag attctttgtt ggtaaaatag cgctctcgcg ttgcatttct gttctgtaaa 5700 aatgcagctc agattctttg tttgaaaaat tagcgctctc gcgttgcatt tttgttttac 5760 aaaaatgaag cacagattct tcgttggtaa aatagcgctt tcgcgttgca tttctgttct 5820 gtaaaaatgc agctcagatt ctttgtttga aaaattagcg ctctcgcgtt gcatttttgt 5880 tctacaaaat gaagcacaga tgcttcgtta acaaagatat gctattgaag tgcaagatgg 5940 aaacgcagaa aatgaaccgg ggatgcgacg tgcaagatta cctatgcaat agatgcaata 6000 gtttctccag gaaccgaaat acatacattg tcttccgtaa agcgctagac tatatattat 6060 tatacaggtt caaatatact atctgtttca gggaaaactc ccaggttcgg atgttcaaaa 6120 ttcaatgatg ggtaacaagt acgatcgtaa atctgtaaaa cagtttgtcg gatattaggc 6180 tgtatctcct caaagcgtat tcgaatatca ttgagaagct gcagcgtcac atcggataat 6240 aatgatggca gccattgtag aagtgccttt tgcatttcta gtctctttct cggtctagct 6300 agttttacta catcgcgaag atagaatctt agatcacact gcctttgctg agctggatca 6360 atagagtaac aaaagagtgg taaggcctcg ttaaaggaca aggacctgag cggaagtgta 6420 tcgtacagta gacggagtat actagtatag tctatagtcc gtggaattct catgtttgac 6480 agcttatcat cgataagctt ttcaattcaa ttcatcattt tttttttatt cttttttttg 6540 atttcggttt ctttgaaatt tttttgattc ggtaatctcc gaacagaagg aagaacgaag 6600 gaaggagcac agacttagat tggtatatat acgcatatgt agtgttgaag aaacatgaaa 6660 ttgcccagta ttcttaaccc aactgcacag aacaaaaacc tgcaggaaac gaagataaat 6720 catgtcgaaa gctacatata aggaacgtgc tgctactcat cctagtcctg ttgctgccaa 6780 gctatttaat atcatgcacg aaaagcaaac aaacttgtgt gcttcattgg atgttcgtac 6840 caccaaggaa ttactggagt tagttgaagc attaggtccc aaaatttgtt tactaaaaac 6900 acatgtggat atcttgactg atttttccat ggagggcaca gttaagccgc taaaggcatt 6960 atccgccaag tacaattttt tactcttcga agacagaaaa tttgctgaca ttggtaatac 7020 agtcaaattg cagtactctg cgggtgtata cagaatagca gaatgggcag acattacgaa 7080 tgcacacggt gtggtgggcc caggtattgt tagcggtttg aagcaggcgg cagaagaagt 7140 aacaaaggaa cctagaggcc ttttgatgtt agcagaattg tcatgcaagg gctccctatc 7200 tactggagaa tatactaagg gtactgttga cattgcgaag agcgacaaag attttgttat 7260 cggctttatt gctcaaagag acatgggtgg aagagatgaa ggttacgatt ggttgattat 7320 gacacccggt gtgggtttag atgacaaggg agacgcattg ggtcaacagt atagaaccgt 7380 ggatgatgtg gtctctacag gatctgacat tattattgtt ggaagaggac tatttgcaaa 7440 gggaagggat gctaaggtag agggtgaacg ttacagaaaa gcaggctggg aagcatattt 7500 gagaagatgc ggccagcaaa actaaaaaac tgtattataa gtaaatgcat gtatactaaa 7560 ctcacaaatt agagcttcaa tttaattata tcagttatta cccgggaatc tcggtcgtaa 7620 tgaaaggaaa agcgcaacgg acgggcgagt agattgcgca acatgcgagc atgatccaga 7680 gatttctgaa gcagcaaaag gatgttccat gtacatgacg cgcggcttgc ggtaaattgt 7740 tggcaaattt tccggcgtag cccaaaacgc gctgtcgtca agtcgttaag ggcgtgccct 7800 tcatcatccg atctggagtc aaaatgtcct cacgtaaaga gcttgccaat gctattcgtg 7860 cgctgagcat ggacgcagta cagaaagcca aatccggtca cccgggtgcc cctatgggta 7920 tggctgacat tgccgaagtc ctgtggcgtg atttcctgaa acacaacccg cagaatccgt 7980 cctgggctga ccgtgaccgc ttcgtgctgt ccaacggcca cggctccatg ctgatctaca 8040 gcctgctgca cctcaccggt tacgatctgc cgatggaaga actgaaaaac ttccgtcagc 8100 tgcactctaa aactccgggc cacccggaag taggttatac cgctggtgtg gaaaccacca 8160 ccggtccgct gggtcagggt attgccaacg cagtcggtat ggcgattgca gaaaaaacgc 8220 tggcggcgca gtttaaccgt ccaggtcacg acattgtcga ccactacacc tacgccttca 8280 tgggcgacgg ctgcatgatg gaaggcatct cccacgaagt ttgctctctg gcgggtacgc 8340 tgaagctggg taaactgatt gcgttctacg atgacaacgg tatctcaatc gatggtcacg 8400 ttgaaggctg gttcactgac gacaccgcaa tgcgtttcga agcttacggc tggcacgtta 8460 ttcgcgacat cgacggtcat gacgcggcat ccatcaaacg cgcagtagaa gaagcgcgcg 8520 cagtgactga caaaccgtcc ctgctgatgt gcaaaaccat catcggtttc ggttccccga 8580 acaaagccgg tacccacgac tcccacggtg cgccgctggg cgacgctgaa attgccctga 8640 cccgcgaaca gctgggctgg aaatacgcgc cgttcgaaat cccgtctgaa atctatgctc 8700 agtgggatgc gaaagaagca ggccaggcga aagaatctgc atggaatgag aagtttgcgg 8760 cttacgcgaa agcttatccg caggaagcgg ctgaatttac ccgccgtatg aaaggcgaaa 8820 tgccgtctga cttcgacgcc aaagcgaaag agtttatcgc taaactgcag gctaatccgg 8880 cgaaaatcgc cagccgtaaa gcgtcgcaga atgctatcga agcgttcggc ccgctgttgc 8940 ctgaattcct cggcggctct gctgacctgg caccgtctaa cctgaccctg tggtctggtt 9000 ctaaagcaat caacgaagat gctgcaggta actacatcca ctacggtgtt cgcgagttcg 9060 gtatgaccgc gattgctaac ggtatctccc tgcacggtgg tttcctgccg tacacctcca 9120 ccttcctgat gttcgtggaa tacgcacgta acgccgtacg tatggctgcg ctgatgaaac 9180 agcgtcaggt gatggtttac acccacgact ccatcggtct gggcgaagat ggcccgactc 9240 accagccggt tgagcaggtc gcttctctgc gcgtgacccc gaacatgtct acatggcgtc 9300 cgtgtgacca ggttgaatcc gcggtcgcgt ggaaatacgg cgttgagcgt caggacggcc 9360 cgactgcgct tatcctctcc cgtcagaacc tggcgcagca ggaacgaact gaagagcaac 9420 tggcaaacat cgcgcgcggt ggttatgtgc tgaaagactg cgccggtcag ccggaactga 9480 ttttcatcgc taccggttca gaagttgaac tggctgttgc tgcctacgaa aaactgactg 9540 ccgaaggcgt gaaagcgcgc gtggtgtcca tgccgtctac cgacgcattt gacaagcagg 9600 atgctgctta ccgtgaatcc gtactgccga aagcggttac tgcacgcgtt gctgtagaag 9660 cgggtattgc tgactactgg tacaagtatg ttggcctgaa cggtgctatc gtcggtatga 9720 ccaccttcgg tgaatctgct ccggcagagc tgctgtttga agagttcggc ttcactgttg 9780 ataacgttgt tgcgaaagca aaagaactgc tgtaattagc atttcgggta aaaaggtcgc 9840 ttcggcgacc ttttttatta ccttgatatg tccgtttgcg gacaagcaat agataaagcg 9900 tgttgtagat cacaaatatt tatatgcaat aaatatcaat tatgtaatat gcatcacgat 9960 atgcgtattg acatttgttg ttataactat aactcaatgt tatataagaa attaa 10015 <210> 31 <211> 9065 <212> DNA <213> Plasmid pCP54; <400> 31 acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc 60 tgcaccatta tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct 120 acatctgtat taacgaagcg ctggcattga ccctgagtga tttttctctg gtcccgccgc 180 atccataccg ccagttgttt accctcacaa cgttccagta accgggcatg ttcatcatca 240 gtaacccgta tcgtgagcat cctctctcgt ttcatcggta tcattacccc catgaacaga 300 aattccccct tacacggagg catcaagtga ccaaacagga aaaaaccgcc cttaacatgg 360 cccgctttat cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg 420 atgaacaggc agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct 480 gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 540 tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 600 gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata 660 ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga 720 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 780 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 840 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 900 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 960 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 1020 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 1080 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 1140 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 1200 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 1260 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 1320 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 1380 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 1440 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 1500 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 1560 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 1620 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 1680 atatgagtaa acttggtctg agtggcggtt ttcatggctt gttatgactg tttttttggg 1740 gtacagtcta tgcctcgggc atccaagcag caagcgcgtt acgccgtggg tcgatgtttg 1800 atgttatgga gcagcaacga tgttacgcag cagggcagtc gccctaaaac aaagttaaac 1860 atcatgaggg aagcggtgat cgccgaagta tcgactcaac tatcagaggt agttggcgtc 1920 atcgagcgcc atctcgaacc gacgttgctg gccgtacatt tgtacggctc cgcagtggat 1980 ggcggcctga agccacacag tgatattgat ttgctggtta cggtgaccgt aaggcttgat 2040 gaaacaacgc ggcgagcttt gatcaacgac cttttggaaa cttcggcttc ccctggagag 2100 agcgagattc tccgcgctgt agaagtcacc attgttgtgc acgacgacat cattccgtgg 2160 cgttatccag ctaagcgcga actgcaattt ggagaatggc agcgcaatga cattcttgca 2220 ggtatcttcg agccagccac gatcgacatt gatctggcta tcttgctgac aaaagcaaga 2280 gaacatagcg ttgccttggt aggtccagcg gcggaggaac tctttgatcc ggttcctgaa 2340 caggatctat ttgaggcgct aaatgaaacc ttaacgctat ggaactcgcc gcccgactgg 2400 gctggcgatg agcgaaatgt agtgcttacg ttgtcccgca tttggtacag cgcagtaacc 2460 ggcaaaatcg cgccgaagga tgtcgctgcc gactgggcaa tggagcgcct gccggcccag 2520 tatcagcccg tcatacttga agctagacag gcttatcttg gacaagaaga agatcgcttg 2580 gcctcgcgcg cagatcagtt ggaagaattt gtccactacg tgaaaggcga gatcaccaag 2640 gtagtcggca aataatgtct aacaattcgt tcaagccgac gccgcttcgc ggcgcggctt 2700 aactcaagcg ttagatgcac taagcacata attgctcaca gccaaactat cagaattctg 2760 aaccagtcct aaaacgagta aataggaccg gcaattcttc aagcaataaa caggaatacc 2820 aattattaaa agataactta gtcagatcgt acaataaagc tttgaagaaa aatgcgcctt 2880 attcaatctt tgctataaaa aatggcccaa aatctcacat tggaagacat ttgatgacct 2940 catttctttc aatgaagggc ctaacggagt tgactaatgt tgtgggaaat tggagcgata 3000 agcgtgcttc tgccgtggcc aggacaacgt atactcatca gataacagca atacctgatc 3060 actacttcgc actagtttct cggtactatg catatgatcc aatatcaaag gaaatgatag 3120 cattgaagga tgagactaat ccaattgagg agtggcagca tatagaacag ctaaagggta 3180 gtgctgaagg aagcatacga taccccgcat ggaatgggat aatatcacag gaggtactag 3240 actacctttc atcctacata aatagacgca tataagtacg catttaagca taaacacgca 3300 ctatgccgtt cttctcatgt atatatatat acaggcaaca cgcagatata ggtgcgacgt 3360 gaacagtgag ctgtatgtgc gcagctcgcg ttgcattttc ggaagcgctc gttttcggaa 3420 acgctttgaa gttcctattc cgaagttcct attctctaga aagtatagga acttcagagc 3480 gcttttgaaa accaaaagcg ctctgaagac gcactttcaa aaaaccaaaa acgcaccgga 3540 ctgtaacgag ctactaaaat attgcgaata ccgcttccac aaacattgct caaaagtatc 3600 tctttgctat atatctctgt gctatatccc tatataacct acccatccac ctttcgctcc 3660 ttgaacttgc atctaaactc gacctctaca ttttttatgt ttatctctag tattactctt 3720 tagacaaaaa aattgtagta agaactattc atagagtgaa tcgaaaacaa tacgaaaatg 3780 taaacatttc ctatacgtag tatatagaga caaaatagaa gaaaccgttc ataattttct 3840 gaccaatgaa gaatcatcaa cgctatcact ttctgttcac aaagtatgcg caatccacat 3900 cggtatagaa tataatcggg gatgccttta tcttgaaaaa atgcacccgc agcttcgcta 3960 gtaatcagta aacgcgggaa gtggagtcag gcttttttta tggaagagaa aatagacacc 4020 aaagtagcct tcttctaacc ttaacggacc tacagtgcaa aaagttatca agagactgca 4080 ttatagagcg cacaaaggag aaaaaaagta atctaagatg ctttgttaga aaaatagcgc 4140 tctcgggatg catttttgta gaacaaaaaa gaagtataga ttctttgttg gtaaaatagc 4200 gctctcgcgt tgcatttctg ttctgtaaaa atgcagctca gattctttgt ttgaaaaatt 4260 agcgctctcg cgttgcattt ttgttttaca aaaatgaagc acagattctt cgttggtaaa 4320 atagcgcttt cgcgttgcat ttctgttctg taaaaatgca gctcagattc tttgtttgaa 4380 aaattagcgc tctcgcgttg catttttgtt ctacaaaatg aagcacagat gcttcgttaa 4440 caaagatatg ctattgaagt gcaagatgga aacgcagaaa atgaaccggg gatgcgacgt 4500 gcaagattac ctatgcaata gatgcaatag tttctccagg aaccgaaata catacattgt 4560 cttccgtaaa gcgctagact atatattatt atacaggttc aaatatacta tctgtttcag 4620 ggaaaactcc caggttcgga tgttcaaaat tcaatgatgg gtaacaagta cgatcgtaaa 4680 tctgtaaaac agtttgtcgg atattaggct gtatctcctc aaagcgtatt cgaatatcat 4740 tgagaagctg cagcgtcaca tcggataata atgatggcag ccattgtaga agtgcctttt 4800 gcatttctag tctctttctc ggtctagcta gttttactac atcgcgaaga tagaatctta 4860 gatcacactg cctttgctga gctggatcaa tagagtaaca aaagagtggt aaggcctcgt 4920 taaaggacaa ggacctgagc ggaagtgtat cgtacagtag acggagtata ctagtatagt 4980 ctatagtccg tggaattctc atgtttgaca gcttatcatc gataagcttt tcaattcaat 5040 tcatcatttt ttttttattc ttttttttga tttcggtttc tttgaaattt ttttgattcg 5100 gtaatctccg aacagaagga agaacgaagg aaggagcaca gacttagatt ggtatatata 5160 cgcatatgta gtgttgaaga aacatgaaat tgcccagtat tcttaaccca actgcacaga 5220 acaaaaacct gcaggaaacg aagataaatc atgtcgaaag ctacatataa ggaacgtgct 5280 gctactcatc ctagtcctgt tgctgccaag ctatttaata tcatgcacga aaagcaaaca 5340 aacttgtgtg cttcattgga tgttcgtacc accaaggaat tactggagtt agttgaagca 5400 ttaggtccca aaatttgttt actaaaaaca catgtggata tcttgactga tttttccatg 5460 gagggcacag ttaagccgct aaaggcatta tccgccaagt acaatttttt actcttcgaa 5520 gacagaaaat ttgctgacat tggtaataca gtcaaattgc agtactctgc gggtgtatac 5580 agaatagcag aatgggcaga cattacgaat gcacacggtg tggtgggccc aggtattgtt 5640 agcggtttga agcaggcggc agaagaagta acaaaggaac ctagaggcct tttgatgtta 5700 gcagaattgt catgcaaggg ctccctatct actggagaat atactaaggg tactgttgac 5760 attgcgaaga gcgacaaaga ttttgttatc ggctttattg ctcaaagaga catgggtgga 5820 agagatgaag gttacgattg gttgattatg acacccggtg tgggtttaga tgacaaggga 5880 gacgcattgg gtcaacagta tagaaccgtg gatgatgtgg tctctacagg atctgacatt 5940 attattgttg gaagaggact atttgcaaag ggaagggatg ctaaggtaga gggtgaacgt 6000 tacagaaaag caggctggga agcatatttg agaagatgcg gccagcaaaa ctaaaaaact 6060 gtattataag taaatgcatg tatactaaac tcacaaatta gagcttcaat ttaattatat 6120 cagttattac ccgggaatct cggtcgtaat gacttgaaat aattaacaaa caaaggagtt 6180 acagttagaa attgtaggag agatctcgtt tttcgcgaca atctggcgtt tttcttgcta 6240 attccaggat taatccgttc atagtgtaaa accccgttta cacattctga cggaagatat 6300 agattggaag tattgcattc actaagataa gtatggcaac actggaacag acatgaatta 6360 tcagaacgac gatttacgca tcaaagaaat caaagagtta cttcctcctg tcgcattgct 6420 ggaaaaattc cccgctactg aaaatgccgc gaatacggtt gcccatgccc gaaaagcgat 6480 ccataagatc ctgaaaggta atgatgatcg cctgttggtt gtgattggcc catgctcaat 6540 tcatgatcct gtcgcggcaa aagagtatgc cactcgcttg ctggcgctgc gtgaagagct 6600 gaaagatgag ctggaaatcg taatgcgcgt ctattttgaa aagccgcgta ccacggtggg 6660 ctggaaaggg ctgattaacg atccgcatat ggataatagc ttccagatca acgacggtct 6720 gcgtatagcc cgtaaattgc tgcttgatat taacgacagc ggtctgccag cggcaggtga 6780 gtttctcgat atgatcaccc cacaatatct cgctgacctg atgagctggg gcgcaattgg 6840 cgcacgtacc accgaatcgc aggtgcaccg cgaactggca tcagggcttt cttgtccggt 6900 cggcttcaaa aatggcaccg acggtacgat taaagtggct atcgatgcca ttaatgccgc 6960 cggtgcgccg cactgcttcc tgtccgtaac gaaatggggg cattcggcga ttgtgaatac 7020 cagcggtaac ggcgattgcc atatcattct gcgcggcggt aaagagccta actacagcgc 7080 gaagcacgtt gctgaagtga aagaagggct gaacaaagca ggcctgccag cacaggtgat 7140 gatcgatttc agccatgcta actcgtccaa acaattcaaa aagcagatgg atgtttgtgc 7200 tgacgtttgc cagcagattg ccggtggcga aaaggccatt attggcgtga tggtggaaag 7260 ccatctggtg gaaggcaatc agagcctcga gagcggggag ccgctggcct acggtaagag 7320 catcaccgat gcctgcatcg gctgggaaga taccgatgct ctgttacgtc aactggcgaa 7380 tgcagtaaaa gcgcgtcgcg ggtaaggttt aattgtcgga tgcgccgtca gagtggcgta 7440 tccgatgaat caccacaggc ctgataagtc gcgcagcgtc gcatcaggca atgtgctcca 7500 ttgttagcaa caaaaaagcc gactcacttg cagtcggctt tctcatttta aacgaatgac 7560 gtttacttcg ctttaccctg gtttgcaacc gccgctgctt tcgctctcga ggctattgac 7620 gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca atatttctcc 7680 cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa attttacaaa 7740 aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg ggcaaccccg 7800 cctgttctag aggaggagga atcgccatgg agaggattgt cgttactctc ggggaacgta 7860 gttacccaat taccatcgca tctggtttgt ttaatgaacc agcttcattc ttaccgctga 7920 aatcgggcga gcaggtcatg ttggtcacca acgaaaccct ggctcctctg tatctcgata 7980 aggtccgcgg cgtacttgaa caggcgggtg ttaacgtcga tagcgttatc ctccctgacg 8040 gcgagcagta taaaagcctg gctgtactcg ataccgtctt tacggcgttg ttacaaaagc 8100 cgcatggtcg cgatactacg ctggtggcgc ttggcggcgg cgtagtgggc gatctgaccg 8160 gcttcgcggc ggcgagttat cagcgcggtg ttcgtttcat tcaagtcccg acgacgttac 8220 tgtcgcaggt cgattcctcc gttggcggca aaactgcggt caaccatccc ctcggtaaaa 8280 acatgattgg cgcgttctac cagcctgctt cagtggtggt ggatctcgac tgtctgaaaa 8340 cgcttccccc gcgtgagtta gcgtcggggc tggcagaagt catcaaatac ggcattattc 8400 ttgacggtgc gtttttcaac tggctggaag agaatctgga tgcgttgttg cgtctggacg 8460 gtccggcaat ggcgtactgt attcgccgtt gttgtgaact gaaggcagaa gttgtcgccg 8520 ccgacgagcg cgaaaccggg ttacgtgctt tactgaatct gggacacacc tttggtcatg 8580 ccattgaagc tgaaatgggg tatggcaatt ggttacatgg tgaagcggtc gctgcgggta 8640 tggtgatggc ggcgcggacg tcggaacgtc tcgggcagtt tagttctgcc gaaacgcagc 8700 gtattataac cctgctcacg cgggctgggt taccggtcaa tgggccgcgc gaaatgtccg 8760 cgcaggcgta tttaccgcat atgctgcgtg acaagaaagt ccttgcggga gagatgcgct 8820 taattcttcc gttggcaatt ggtaagagtg aagttcgcag cggcgtttcg cacgagcttg 8880 ttcttaacgc cattgccgat tgtcaatcag cgtaatcatc gttcatgcct gatgccgcta 8940 tgtaggccgg ataaggcgtt cacgccgcat ccggcaaccg atgcctgatg cgacgcggtc 9000 gcgtcttatc aggcctacag gtcgatgccg atatgtacat cgtattcggc aattaataca 9060 tagca 9065 <210> 32 <211> 11475 <212> DNA <213> Plasmid pCP55; <400> 32 acatgaatgg tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc 60 tgcaccatta tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct 120 acatctgtat taacgaagcg ctggcattga ccctgagtga tttttctctg gtcccgccgc 180 atccataccg ccagttgttt accctcacaa cgttccagta accgggcatg ttcatcatca 240 gtaacccgta tcgtgagcat cctctctcgt ttcatcggta tcattacccc catgaacaga 300 aattccccct tacacggagg catcaagtga ccaaacagga aaaaaccgcc cttaacatgg 360 cccgctttat cagaagccag acattaacgc ttctggagaa actcaacgag ctggacgcgg 420 atgaacaggc agacatctgt gaatcgcttc acgaccacgc tgatgagctt taccgcagct 480 gcctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 540 tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 600 gtgttggcgg gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata 660 ctggcttaac tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga 720 aataccgcac agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct 780 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 840 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 900 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 960 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 1020 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 1080 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 1140 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 1200 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 1260 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 1320 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 1380 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 1440 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 1500 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 1560 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 1620 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 1680 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 1740 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 1800 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 1860 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 1920 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 1980 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct gcaggcatcg tggtgtcacg 2040 ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 2100 atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 2160 taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 2220 catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 2280 atagtgtatg cggcgaccga gttgctcttg cccggcgtca acacgggata ataccgcgcc 2340 acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 2400 aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 2460 ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 2520 cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 2580 atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 2640 ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 2700 ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 2760 tcgtcttcaa gaattctgaa ccagtcctaa aacgagtaaa taggaccggc aattcttcaa 2820 gcaataaaca ggaataccaa ttattaaaag ataacttagt cagatcgtac aataaagctt 2880 tgaagaaaaa tgcgccttat tcaatctttg ctataaaaaa tggcccaaaa tctcacattg 2940 gaagacattt gatgacctca tttctttcaa tgaagggcct aacggagttg actaatgttg 3000 tgggaaattg gagcgataag cgtgcttctg ccgtggccag gacaacgtat actcatcaga 3060 taacagcaat acctgatcac tacttcgcac tagtttctcg gtactatgca tatgatccaa 3120 tatcaaagga aatgatagca ttgaaggatg agactaatcc aattgaggag tggcagcata 3180 tagaacagct aaagggtagt gctgaaggaa gcatacgata ccccgcatgg aatgggataa 3240 tatcacagga ggtactagac tacctttcat cctacataaa tagacgcata taagtacgca 3300 tttaagcata aacacgcact atgccgttct tctcatgtat atatatatac aggcaacacg 3360 cagatatagg tgcgacgtga acagtgagct gtatgtgcgc agctcgcgtt gcattttcgg 3420 aagcgctcgt tttcggaaac gctttgaagt tcctattccg aagttcctat tctctagaaa 3480 gtataggaac ttcagagcgc ttttgaaaac caaaagcgct ctgaagacgc actttcaaaa 3540 aaccaaaaac gcaccggact gtaacgagct actaaaatat tgcgaatacc gcttccacaa 3600 acattgctca aaagtatctc tttgctatat atctctgtgc tatatcccta tataacctac 3660 ccatccacct ttcgctcctt gaacttgcat ctaaactcga cctctacatt ttttatgttt 3720 atctctagta ttactcttta gacaaaaaaa ttgtagtaag aactattcat agagtgaatc 3780 gaaaacaata cgaaaatgta aacatttcct atacgtagta tatagagaca aaatagaaga 3840 aaccgttcat aattttctga ccaatgaaga atcatcaacg ctatcacttt ctgttcacaa 3900 agtatgcgca atccacatcg gtatagaata taatcgggga tgcctttatc ttgaaaaaat 3960 gcacccgcag cttcgctagt aatcagtaaa cgcgggaagt ggagtcaggc tttttttatg 4020 gaagagaaaa tagacaccaa agtagccttc ttctaacctt aacggaccta cagtgcaaaa 4080 agttatcaag agactgcatt atagagcgca caaaggagaa aaaaagtaat ctaagatgct 4140 ttgttagaaa aatagcgctc tcgggatgca tttttgtaga acaaaaaaga agtatagatt 4200 ctttgttggt aaaatagcgc tctcgcgttg catttctgtt ctgtaaaaat gcagctcaga 4260 ttctttgttt gaaaaattag cgctctcgcg ttgcattttt gttttacaaa aatgaagcac 4320 agattcttcg ttggtaaaat agcgctttcg cgttgcattt ctgttctgta aaaatgcagc 4380 tcagattctt tgtttgaaaa attagcgctc tcgcgttgca tttttgttct acaaaatgaa 4440 gcacagatgc ttcgttaaca aagatatgct attgaagtgc aagatggaaa cgcagaaaat 4500 gaaccgggga tgcgacgtgc aagattacct atgcaataga tgcaatagtt tctccaggaa 4560 ccgaaataca tacattgtct tccgtaaagc gctagactat atattattat acaggttcaa 4620 atatactatc tgtttcaggg aaaactccca ggttcggatg ttcaaaattc aatgatgggt 4680 aacaagtacg atcgtaaatc tgtaaaacag tttgtcggat attaggctgt atctcctcaa 4740 agcgtattcg aatatcattg agaagctgca gcgtcacatc ggataataat gatggcagcc 4800 attgtagaag tgccttttgc atttctagtc tctttctcgg tctagctagt tttactacat 4860 cgcgaagata gaatcttaga tcacactgcc tttgctgagc tggatcaata gagtaacaaa 4920 agagtggtaa ggcctcgtta aaggacaagg acctgagcgg aagtgtatcg tacagtagac 4980 ggagtatact agtatagtct atagtccgtg gaattctcat gtttgacagc ttatcatcga 5040 taagcttttc aattcaattc atcatttttt ttttattctt ttttttgatt tcggtttctt 5100 tgaaattttt ttgattcggt aatctccgaa cagaaggaag aacgaaggaa ggagcacaga 5160 cttagattgg tatatatacg catatgtagt gttgaagaaa catgaaattg cccagtattc 5220 ttaacccaac tgcacagaac aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct 5280 acatataagg aacgtgctgc tactcatcct agtcctgttg ctgccaagct atttaatatc 5340 atgcacgaaa agcaaacaaa cttgtgtgct tcattggatg ttcgtaccac caaggaatta 5400 ctggagttag ttgaagcatt aggtcccaaa atttgtttac taaaaacaca tgtggatatc 5460 ttgactgatt tttccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac 5520 aattttttac tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag 5580 tactctgcgg gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg 5640 gtgggcccag gtattgttag cggtttgaag caggcggcag aagaagtaac aaaggaacct 5700 agaggccttt tgatgttagc agaattgtca tgcaagggct ccctatctac tggagaatat 5760 actaagggta ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct 5820 caaagagaca tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg 5880 ggtttagatg acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc 5940 tctacaggat ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct 6000 aaggtagagg gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc 6060 cagcaaaact aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga 6120 gcttcaattt aattatatca gttattaccc gggaatctcg gtcgtaatga aaggaaaagc 6180 gcaacggacg ggcgagtaga ttgcgcaaca tgcgagcatg atccagagat ttctgaagca 6240 gcaaaaggat gttccatgta catgacgcgc ggcttgcggt aaattgttgg caaattttcc 6300 ggcgtagccc aaaacgcgct gtcgtcaagt cgttaagggc gtgcccttca tcatccgatc 6360 tggagtcaaa atgtcctcac gtaaagagct tgccaatgct attcgtgcgc tgagcatgga 6420 cgcagtacag aaagccaaat ccggtcaccc gggtgcccct atgggtatgg ctgacattgc 6480 cgaagtcctg tggcgtgatt tcctgaaaca caacccgcag aatccgtcct gggctgaccg 6540 tgaccgcttc gtgctgtcca acggccacgg ctccatgctg atctacagcc tgctgcacct 6600 caccggttac gatctgccga tggaagaact gaaaaacttc cgtcagctgc actctaaaac 6660 tccgggccac ccggaagtag gttataccgc tggtgtggaa accaccaccg gtccgctggg 6720 tcagggtatt gccaacgcag tcggtatggc gattgcagaa aaaacgctgg cggcgcagtt 6780 taaccgtcca ggtcacgaca ttgtcgacca ctacacctac gccttcatgg gcgacggctg 6840 catgatggaa ggcatctccc acgaagtttg ctctctggcg ggtacgctga agctgggtaa 6900 actgattgcg ttctacgatg acaacggtat ctcaatcgat ggtcacgttg aaggctggtt 6960 cactgacgac accgcaatgc gtttcgaagc ttacggctgg cacgttattc gcgacatcga 7020 cggtcatgac gcggcatcca tcaaacgcgc agtagaagaa gcgcgcgcag tgactgacaa 7080 accgtccctg ctgatgtgca aaaccatcat cggtttcggt tccccgaaca aagccggtac 7140 ccacgactcc cacggtgcgc cgctgggcga cgctgaaatt gccctgaccc gcgaacagct 7200 gggctggaaa tacgcgccgt tcgaaatccc gtctgaaatc tatgctcagt gggatgcgaa 7260 agaagcaggc caggcgaaag aatctgcatg gaatgagaag tttgcggctt acgcgaaagc 7320 ttatccgcag gaagcggctg aatttacccg ccgtatgaaa ggcgaaatgc cgtctgactt 7380 cgacgccaaa gcgaaagagt ttatcgctaa actgcaggct aatccggcga aaatcgccag 7440 ccgtaaagcg tcgcagaatg ctatcgaagc gttcggcccg ctgttgcctg aattcctcgg 7500 cggctctgct gacctggcac cgtctaacct gaccctgtgg tctggttcta aagcaatcaa 7560 cgaagatgct gcaggtaact acatccacta cggtgttcgc gagttcggta tgaccgcgat 7620 tgctaacggt atctccctgc acggtggttt cctgccgtac acctccacct tcctgatgtt 7680 cgtggaatac gcacgtaacg ccgtacgtat ggctgcgctg atgaaacagc gtcaggtgat 7740 ggtttacacc cacgactcca tcggtctggg cgaagatggc ccgactcacc agccggttga 7800 gcaggtcgct tctctgcgcg tgaccccgaa catgtctaca tggcgtccgt gtgaccaggt 7860 tgaatccgcg gtcgcgtgga aatacggcgt tgagcgtcag gacggcccga ctgcgcttat 7920 cctctcccgt cagaacctgg cgcagcagga acgaactgaa gagcaactgg caaacatcgc 7980 gcgcggtggt tatgtgctga aagactgcgc cggtcagccg gaactgattt tcatcgctac 8040 cggttcagaa gttgaactgg ctgttgctgc ctacgaaaaa ctgactgccg aaggcgtgaa 8100 agcgcgcgtg gtgtccatgc cgtctaccga cgcatttgac aagcaggatg ctgcttaccg 8160 tgaatccgta ctgccgaaag cggttactgc acgcgttgct gtagaagcgg gtattgctga 8220 ctactggtac aagtatgttg gcctgaacgg tgctatcgtc ggtatgacca ccttcggtga 8280 atctgctccg gcagagctgc tgtttgaaga gttcggcttc actgttgata acgttgttgc 8340 gaaagcaaaa gaactgctgt aattagcatt tcgggtaaaa aggtcgcttc ggcgaccttt 8400 tttattacct tgatatgtcc gtttgcggac aagcaataga taaagcgtgt tgtagatcac 8460 aaatatttat atgcaataaa tatcaattat gtaatatgca tcacgatatg cgtattgaca 8520 tttgttgtta taactataac tcaatgttat ataagaaatt aacttgaaat aattaacaaa 8580 caaaggagtt acagttagaa attgtaggag agatctcgtt tttcgcgaca atctggcgtt 8640 tttcttgcta attccaggat taatccgttc atagtgtaaa accccgttta cacattctga 8700 cggaagatat agattggaag tattgcattc actaagataa gtatggcaac actggaacag 8760 acatgaatta tcagaacgac gatttacgca tcaaagaaat caaagagtta cttcctcctg 8820 tcgcattgct ggaaaaattc cccgctactg aaaatgccgc gaatacggtt gcccatgccc 8880 gaaaagcgat ccataagatc ctgaaaggta atgatgatcg cctgttggtt gtgattggcc 8940 catgctcaat tcatgatcct gtcgcggcaa aagagtatgc cactcgcttg ctggcgctgc 9000 gtgaagagct gaaagatgag ctggaaatcg taatgcgcgt ctattttgaa aagccgcgta 9060 ccacggtggg ctggaaaggg ctgattaacg atccgcatat ggataatagc ttccagatca 9120 acgacggtct gcgtatagcc cgtaaattgc tgcttgatat taacgacagc ggtctgccag 9180 cggcaggtga gtttctcgat atgatcaccc cacaatatct cgctgacctg atgagctggg 9240 gcgcaattgg cgcacgtacc accgaatcgc aggtgcaccg cgaactggca tcagggcttt 9300 cttgtccggt cggcttcaaa aatggcaccg acggtacgat taaagtggct atcgatgcca 9360 ttaatgccgc cggtgcgccg cactgcttcc tgtccgtaac gaaatggggg cattcggcga 9420 ttgtgaatac cagcggtaac ggcgattgcc atatcattct gcgcggcggt aaagagccta 9480 actacagcgc gaagcacgtt gctgaagtga aagaagggct gaacaaagca ggcctgccag 9540 cacaggtgat gatcgatttc agccatgcta actcgtccaa acaattcaaa aagcagatgg 9600 atgtttgtgc tgacgtttgc cagcagattg ccggtggcga aaaggccatt attggcgtga 9660 tggtggaaag ccatctggtg gaaggcaatc agagcctcga gagcggggag ccgctggcct 9720 acggtaagag catcaccgat gcctgcatcg gctgggaaga taccgatgct ctgttacgtc 9780 aactggcgaa tgcagtaaaa gcgcgtcgcg ggtaaggttt aattgtcgga tgcgccgtca 9840 gagtggcgta tccgatgaat caccacaggc ctgataagtc gcgcagcgtc gcatcaggca 9900 atgtgctcca ttgttagcaa caaaaaagcc gactcacttg cagtcggctt tctcatttta 9960 aacgaatgac gtttacttcg ctttaccctg gtttgcaacc gccgctgctt tcgctctcga 10020 ggctattgac gacagctatg gttcactgtc caccaaccaa aactgtgctc agtaccgcca 10080 atatttctcc cttgaggggt acaaagaggt gtccctagaa gagatccacg ctgtgtaaaa 10140 attttacaaa aaggtattga ctttccctac agggtgtgta ataatttaat tacaggcggg 10200 ggcaaccccg cctgttctag aggaggagga atcgccatgg agaggattgt cgttactctc 10260 ggggaacgta gttacccaat taccatcgca tctggtttgt ttaatgaacc agcttcattc 10320 ttaccgctga aatcgggcga gcaggtcatg ttggtcacca acgaaaccct ggctcctctg 10380 tatctcgata aggtccgcgg cgtacttgaa caggcgggtg ttaacgtcga tagcgttatc 10440 ctccctgacg gcgagcagta taaaagcctg gctgtactcg ataccgtctt tacggcgttg 10500 ttacaaaagc cgcatggtcg cgatactacg ctggtggcgc ttggcggcgg cgtagtgggc 10560 gatctgaccg gcttcgcggc ggcgagttat cagcgcggtg ttcgtttcat tcaagtcccg 10620 acgacgttac tgtcgcaggt cgattcctcc gttggcggca aaactgcggt caaccatccc 10680 ctcggtaaaa acatgattgg cgcgttctac cagcctgctt cagtggtggt ggatctcgac 10740 tgtctgaaaa cgcttccccc gcgtgagtta gcgtcggggc tggcagaagt catcaaatac 10800 ggcattattc ttgacggtgc gtttttcaac tggctggaag agaatctgga tgcgttgttg 10860 cgtctggacg gtccggcaat ggcgtactgt attcgccgtt gttgtgaact gaaggcagaa 10920 gttgtcgccg ccgacgagcg cgaaaccggg ttacgtgctt tactgaatct gggacacacc 10980 tttggtcatg ccattgaagc tgaaatgggg tatggcaatt ggttacatgg tgaagcggtc 11040 gctgcgggta tggtgatggc ggcgcggacg tcggaacgtc tcgggcagtt tagttctgcc 11100 gaaacgcagc gtattataac cctgctcacg cgggctgggt taccggtcaa tgggccgcgc 11160 gaaatgtccg cgcaggcgta tttaccgcat atgctgcgtg acaagaaagt ccttgcggga 11220 gagatgcgct taattcttcc gttggcaatt ggtaagagtg aagttcgcag cggcgtttcg 11280 cacgagcttg ttcttaacgc cattgccgat tgtcaatcag cgtaatcatc gttcatgcct 11340 gatgccgcta tgtaggccgg ataaggcgtt cacgccgcat ccggcaaccg atgcctgatg 11400 cgacgcggtc gcgtcttatc aggcctacag gtcgatgccg atatgtacat cgtattcggc 11460 aattaataca tagca 11475 <210> 33 <211> 7769 <212> DNA <213> Plasmid pYEP24; <400> 33 gaattctgaa ccagtcctaa aacgagtaaa taggaccggc aattcttcaa gcaataaaca 60 ggaataccaa ttattaaaag ataacttagt cagatcgtac aataaagctt tgaagaaaaa 120 tgcgccttat tcaatctttg ctataaaaaa tggcccaaaa tctcacattg gaagacattt 180 gatgacctca tttctttcaa tgaagggcct aacggagttg actaatgttg tgggaaattg 240 gagcgataag cgtgcttctg ccgtggccag gacaacgtat actcatcaga taacagcaat 300 acctgatcac tacttcgcac tagtttctcg gtactatgca tatgatccaa tatcaaagga 360 aatgatagca ttgaaggatg agactaatcc aattgaggag tggcagcata tagaacagct 420 aaagggtagt gctgaaggaa gcatacgata ccccgcatgg aatgggataa tatcacagga 480 ggtactagac tacctttcat cctacataaa tagacgcata taagtacgca tttaagcata 540 aacacgcact atgccgttct tctcatgtat atatatatac aggcaacacg cagatatagg 600 tgcgacgtga acagtgagct gtatgtgcgc agctcgcgtt gcattttcgg aagcgctcgt 660 tttcggaaac gctttgaagt tcctattccg aagttcctat tctctagaaa gtataggaac 720 ttcagagcgc ttttgaaaac caaaagcgct ctgaagacgc actttcaaaa aaccaaaaac 780 gcaccggact gtaacgagct actaaaatat tgcgaatacc gcttccacaa acattgctca 840 aaagtatctc tttgctatat atctctgtgc tatatcccta tataacctac ccatccacct 900 ttcgctcctt gaacttgcat ctaaactcga cctctacatt ttttatgttt atctctagta 960 ttactcttta gacaaaaaaa ttgtagtaag aactattcat agagtgaatc gaaaacaata 1020 cgaaaatgta aacatttcct atacgtagta tatagagaca aaatagaaga aaccgttcat 1080 aattttctga ccaatgaaga atcatcaacg ctatcacttt ctgttcacaa agtatgcgca 1140 atccacatcg gtatagaata taatcgggga tgcctttatc ttgaaaaaat gcacccgcag 1200 cttcgctagt aatcagtaaa cgcgggaagt ggagtcaggc tttttttatg gaagagaaaa 1260 tagacaccaa agtagccttc ttctaacctt aacggaccta cagtgcaaaa agttatcaag 1320 agactgcatt atagagcgca caaaggagaa aaaaagtaat ctaagatgct ttgttagaaa 1380 aatagcgctc tcgggatgca tttttgtaga acaaaaaaga agtatagatt ctttgttggt 1440 aaaatagcgc tctcgcgttg catttctgtt ctgtaaaaat gcagctcaga ttctttgttt 1500 gaaaaattag cgctctcgcg ttgcattttt gttttacaaa aatgaagcac agattcttcg 1560 ttggtaaaat agcgctttcg cgttgcattt ctgttctgta aaaatgcagc tcagattctt 1620 tgtttgaaaa attagcgctc tcgcgttgca tttttgttct acaaaatgaa gcacagatgc 1680 ttcgttaaca aagatatgct attgaagtgc aagatggaaa cgcagaaaat gaaccgggga 1740 tgcgacgtgc aagattacct atgcaataga tgcaatagtt tctccaggaa ccgaaataca 1800 tacattgtct tccgtaaagc gctagactat atattattat acaggttcaa atatactatc 1860 tgtttcaggg aaaactccca ggttcggatg ttcaaaattc aatgatgggt aacaagtacg 1920 atcgtaaatc tgtaaaacag tttgtcggat attaggctgt atctcctcaa agcgtattcg 1980 aatatcattg agaagctgca gcgtcacatc ggataataat gatggcagcc attgtagaag 2040 tgccttttgc atttctagtc tctttctcgg tctagctagt tttactacat cgcgaagata 2100 gaatcttaga tcacactgcc tttgctgagc tggatcaata gagtaacaaa agagtggtaa 2160 ggcctcgtta aaggacaagg acctgagcgg aagtgtatcg tacagtagac ggagtatact 2220 agtatagtct atagtccgtg gaattctcat gtttgacagc ttatcatcga taagcttttc 2280 aattcaattc atcatttttt ttttattctt ttttttgatt tcggtttctt tgaaattttt 2340 ttgattcggt aatctccgaa cagaaggaag aacgaaggaa ggagcacaga cttagattgg 2400 tatatatacg catatgtagt gttgaagaaa catgaaattg cccagtattc ttaacccaac 2460 tgcacagaac aaaaacctgc aggaaacgaa gataaatcat gtcgaaagct acatataagg 2520 aacgtgctgc tactcatcct agtcctgttg ctgccaagct atttaatatc atgcacgaaa 2580 agcaaacaaa cttgtgtgct tcattggatg ttcgtaccac caaggaatta ctggagttag 2640 ttgaagcatt aggtcccaaa atttgtttac taaaaacaca tgtggatatc ttgactgatt 2700 tttccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac aattttttac 2760 tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag tactctgcgg 2820 gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg gtgggcccag 2880 gtattgttag cggtttgaag caggcggcag aagaagtaac aaaggaacct agaggccttt 2940 tgatgttagc agaattgtca tgcaagggct ccctatctac tggagaatat actaagggta 3000 ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct caaagagaca 3060 tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg ggtttagatg 3120 acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc tctacaggat 3180 ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct aaggtagagg 3240 gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc cagcaaaact 3300 aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga gcttcaattt 3360 aattatatca gttattaccc gggaatctcg gtcgtaatga tttttataat gacgaaaaaa 3420 aaaaaattgg aaagaaaaag ctttaatgcg gtagtttatc acagttaaat tgctaacgca 3480 gtcaggcacc gtgtatgaaa tctaacaatg cgctcatcgt catcctcggc accgtcaccc 3540 tggatgctgt aggcataggc ttggttatgc cggtactgcc gggcctcttg cgggatatcg 3600 tccattccga cagcatcgcc agtcactatg gcgtgctgct agcgctatat gcgttgatgc 3660 aatttctatg cgcacccgtt ctcggagcac tgtccgaccg ctttggccgc cgcccagtcc 3720 tgctcgcttc gctacttgga gccactatcg actacgcgat catggcgacc acacccgtcc 3780 tgtggatcct ctacgccgga cgcatcgtgg ccggcatcac cggcgccaca ggtgcggttg 3840 ctggcgccta tatcgccgac atcaccgatg gggaagatcg ggctcgccac ttcgggctca 3900 tgagcgcttg tttcggcgtg ggtatggtgg caggccccgt ggccggggga ctgttgggcg 3960 ccatctcctt gcatgcacca ttccttgcgg cggcggtgct caacggcctc aacctactac 4020 tgggctgctt cctaatgcag gagtcgcata agggagagcg tcgaccgatg cccttgagag 4080 ccttcaaccc agtcagctcc ttccggtggg cgcggggcat gactatcgtc gccgcactta 4140 tgactgtctt ctttatcatg caactcgtag gacaggtgcc ggcagcgctc tgggtcattt 4200 tcggcgagga ccgctttcgc tggagcgcga cgatgatcgg cctgtcgctt gcggtattcg 4260 gaatcttgca cgccctcgct caagccttcg tcactggtcc cgccaccaaa cgtttcggcg 4320 agaagcaggc cattatcgcc ggcatggcgg ccgacgcgct gggctacgtc ttgctggcgt 4380 tcgcgacgcg aggctggatg gccttcccca ttatgattct tctcgcttcc ggcggcatcg 4440 ggatgcccgc gttgcaggcc atgctgtcca ggcaggtaga tgacgaccat cagggacagc 4500 ttcaaggatc gctcgcggct cttaccagcc taacttcgat cactggaccg ctgatcgtca 4560 cggcgattta tgccgcctcg gcgagcacat ggaacgggtt ggcatggatt gtaggcgccg 4620 ccctatacct tgtctgcctc cccgcgttgc gtcgcggtgc atggagccgg gccacctcga 4680 cctgaatgga agccggcggc acctcgctaa cggattcacc actccaagaa ttggagccaa 4740 tcaattcttg cggagaactg tgaatgcgca aaccaaccct tggcagaaca tatccatcgc 4800 gtccgccatc tccagcagcc gcacgcggcg catctcgggc agcgttgggt cctggccacg 4860 ggtgcgcatg atcgtgctcc tgtcgttgag gacccggcta ggctggcggg gttgccttac 4920 tggttagcag aatgaatcac cgatacgcga gcgaacgtga agcgactgct gctgcaaaac 4980 gtctgcgacc tgagcaacaa catgaatggt cttcggtttc cgtgtttcgt aaagtctgga 5040 aacgcggaag tcagcgccct gcaccattat gttccggatc tgcatcgcag gatgctgctg 5100 gctaccctgt ggaacaccta catctgtatt aacgaagcgc tggcattgac cctgagtgat 5160 ttttctctgg tcccgccgca tccataccgc cagttgttta ccctcacaac gttccagtaa 5220 ccgggcatgt tcatcatcag taacccgtat cgtgagcatc ctctctcgtt tcatcggtat 5280 cattaccccc atgaacagaa attccccctt acacggaggc atcaagtgac caaacaggaa 5340 aaaaccgccc ttaacatggc ccgctttatc agaagccaga cattaacgct tctggagaaa 5400 ctcaacgagc tggacgcgga tgaacaggca gacatctgtg aatcgcttca cgaccacgct 5460 gatgagcttt accgcagctg cctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac 5520 atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc 5580 cgtcagggcg cgtcagcggg tgttggcggg tgtcggggcg cagccatgac ccagtcacgt 5640 agcgatagcg gagtgtatac tggcttaact atgcggcatc agagcagatt gtactgagag 5700 tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc 5760 gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg 5820 tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 5880 agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 5940 cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 6000 ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 6060 tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 6120 gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc 6180 gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 6240 gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 6300 ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 6360 ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag 6420 ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 6480 gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 6540 ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 6600 tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt 6660 ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca 6720 gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg 6780 tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac 6840 cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg 6900 ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc 6960 gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgctg 7020 caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac 7080 gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc 7140 ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac 7200 tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact 7260 caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa 7320 cacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt 7380 cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca 7440 ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa 7500 aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac 7560 tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg 7620 gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc 7680 gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc tataaaaata 7740 ggcgtatcac gaggcccttt cgtcttcaa 7769 <210> 34 <211> 2000 <212> DNA <213> Sequence of the deleted aroE region; <400> 34 actacgtccg tcctctgaaa tcttcagcgg atggacatat cgtcaaagtt ctggaggggc 60 aggtttgccc tgcatgtggc gcaaatctgg tattacgcca gggacgcttt ggtatgttta 120 ttggttgcat taactaccct gaatgcgaac ataccgaact tatcgataaa ccggacgaaa 180 cagcaattac atgcccccaa tgtcggacgg gccatctggt ccagcgccgc tcccgttatg 240 gcaaaacatt tcactcttgt gatcgctacc cggagtgtca atttgccatt aacttcaaac 300 ccatagctgg agaatgccct gagtgtcatt atccgctact catcgaaaag aaaaccgcgc 360 agggtgtaaa acacttttgt gccagtaaac aatgtggaaa gccggtttcg gcggaataat 420 aacgtgaata ataacctgca aagagacgct atcgcagctg cgatagatgt tctcaatgaa 480 gaacgtgtca tcgcctatcc aacggaagcc gttttcggtg ttgggtgcga tcctgatagc 540 gaaacagcag tgatgcgact gttggagtta aaacagcgtc cggttgataa ggggctgatt 600 ttaatcgcag caaattacga gcagcttaaa ccctatattg atgacaccat gttgactgac 660 gtgcagcgtg aaaccatttt ttcccgctgg ccaggtcctg tcacctttgt ctttcccgcg 720 cctgcgacaa caccgcgctg gttgacgggc cgctttgatt cgcttgctgt acgagtcacc 780 gaccatccgt tggtggttgc tttgtgccag gcttatggta aaccgctggt ttctaccagt 840 gccaacttga gtggattgcc accttgtcga acagtagacg aagttcgcgc acaatttggc 900 gcggcgttcc cggttgtgcc tggtgaaacg ggggggcgtt taaatccttc agaaatccgc 960 gatgccctga cgggtgaact gtttcgacag gggtaacata atcaggccat ccagtttccg 1020 gacagggaag agtgggacga gaataaaaaa tgtgtatgtt ttcccgctct cgtgaatggt 1080 atgcaactga catgcgcgat ctctggcgag agtctggcgt atcgctttac tggagatacg 1140 ccagaacagt ggttagcgag ttttcgtcag catcgctggg acctggaaga agaagcggaa 1200 aacttaattc aggaacaaag tgaagatgat caaggctggg tctggttacc ctgatccaga 1260 tattcgtcct tccatttcac gtaattattc gcggaatagc gtaacccagc cttctcttca 1320 tcacttaacg ggcggatctg tttgacgggg ctaccgagat acagatatcc gctctccagc 1380 cgtttatttt gtgggaccag actacccgca ccaatcatca catcatcttc tactattgcg 1440 ccatcaagta aaattgagcc catcccaacc aaaactcgat tgccaatggt gcagccgtgg 1500 agcatcacct tgtgaccaac agtgacatct tcgccaatgg ttaatgggtt gccatctggg 1560 ttgtacgagg atttatgagt gacatgcaac atactgccat cctggatatt ggtgcgtgct 1620 ccgatctgta cataatgtac atctccacga atcacaacga gcggccagat ccccacatca 1680 tcagccagac gaacgtcacc aatcacgaca ctgctatcgt cgatcattac gcgctgaccg 1740 atttgtggaa aaagatcgcg gtatgggcgt aaaacatcag acatacttac ctcagcaata 1800 aatgatttac taatgacttt gggggcatta ttggccttgt gcaagtcttt tagtatgcaa 1860 aaaagcaccg ttttgtgtgc gattgcagca aaaagggtga aaaaacaaca aacagaaaaa 1920 aagatcaaaa aaatacttgt gcaaaaaatt gggatcccta taatgcgcct ccgttgagac 1980 gacaacgtga aacacttcac 2000 <210> 35 <211> 2460 <212> DNA <213> Sequence of the P15aroB cassette integrated at deleted ack locus; <400> 35 gatcggcggc ataaaacgga tcgcataacg cgtcatcttg ataacgcgat tttcgacaaa 60 gaccggggca aggcgttttt ccagcggcca cgtctttgag taatgctgtc cccggcgaaa 120 caagctaaaa aaattaacag aacgattatc cggcgttgac atgcttcacc tcaacttcac 180 atataaagat tcaaaaattt gtgcaaattc acaactcagc gggacaacgt tcaaaacatt 240 ttgtcttcca tacccactat caggtatcct ttagcagcct gaaggcctaa gtagtacata 300 ttcattgagt cgtcaaattc atatacatta tgccattggc tgaaaattac gcaaaatggc 360 atagactcaa gatatttctt ccatcatgca aaaaaaaatt tgcagtgcat gatgttaatc 420 ataaatgtcg gtgtcatcat gcgctacgct ctatggctcc ctgacgtttt tttagccacg 480 tatcaattat aggtacttcc ctcgaggcta ttgacgacag ctatggttca ctgtccacca 540 accaaaactg tgctcagtac cgccaatatt tctcccttga ggggtacaaa gaggtgtccc 600 tagaagagat ccacgctgtg taaaaatttt acaaaaaggt attgactttc cctacagggt 660 gtgtaataat ttaattacag gcgggggcaa ccccgcctgt tctagaggag gaggaatcgc 720 catggagagg attgtcgtta ctctcgggga acgtagttac ccaattacca tcgcatctgg 780 tttgtttaat gaaccagctt cattcttacc gctgaaatcg ggcgagcagg tcatgttggt 840 caccaacgaa accctggctc ctctgtatct cgataaggtc cgcggcgtac ttgaacaggc 900 gggtgttaac gtcgatagcg ttatcctccc tgacggcgag cagtataaaa gcctggctgt 960 actcgatacc gtctttacgg cgttgttaca aaagccgcat ggtcgcgata ctacgctggt 1020 ggcgcttggc ggcggcgtag tgggcgatct gaccggcttc gcggcggcga gttatcagcg 1080 cggtgttcgt ttcattcaag tcccgacgac gttactgtcg caggtcgatt cctccgttgg 1140 cggcaaaact gcggtcaacc atcccctcgg taaaaacatg attggcgcgt tctaccagcc 1200 tgcttcagtg gtggtggatc tcgactgtct gaaaacgctt cccccgcgtg agttagcgtc 1260 ggggctggca gaagtcatca aatacggcat tattcttgac ggtgcgtttt tcaactggct 1320 ggaagagaat ctggatgcgt tgttgcgtct ggacggtccg gcaatggcgt actgtattcg 1380 ccgttgttgt gaactgaagg cagaagttgt cgccgccgac gagcgcgaaa ccgggttacg 1440 tgctttactg aatctgggac acacctttgg tcatgccatt gaagctgaaa tggggtatgg 1500 caattggtta catggtgaag cggtcgctgc gggtatggtg atggcggcgc ggacgtcgga 1560 acgtctcggg cagtttagtt ctgccgaaac gcagcgtatt ataaccctgc tcacgcgggc 1620 tgggttaccg gtcaatgggc cgcgcgaaat gtccgcgcag gcgtatttac cgcatatgct 1680 gcgtgacaag aaagtccttg cgggagagat gcgcttaatt cttccgttgg caattggtaa 1740 gagtgaagtt cgcagcggcg tttcgcacga gcttgttctt aacgccattg ccgattgtca 1800 atcagcgtaa tcatcgttca tgcctgatgc cgctatgtag gccggataag gcgttcacgc 1860 cgcatccggc aaccgatgcc tgatgcgacg cggtcgcgtc ttatcaggcc tacaggtcga 1920 tgccgatatg tacatcgtat tcggcaatta atacatagca tttcacaccg ccagctcagc 1980 tggcggtgct gttttgtaac ccgccaaatc ggcggtaacg aaagaggata aaccgtgtcc 2040 cgtattatta tgctgatccc taccggaacc agcgtcggtc tgaccagcgt cagccttggc 2100 gtgatccgtg caatggaacg caaaggcgtt cgtctgagcg ttttcaaacc tatcgctcag 2160 ccgcgtaccg gtggcgatgc gcccgatcag actacgacta tcgtgcgtgc gaactcttcc 2220 accacgacgg ccgctgaacc gctgaaaatg agctacgttg aaggtctgct ttccagcaat 2280 cagaaagatg tgctgatgga agagatcgtc gcaaactacc acgctaacac caaagacgct 2340 gaagtcgttc tggttgaagg tctggtcccg acacgtaagc accagtttgc ccagtctctg 2400 aactacgaaa tcgctaaaac gctgaatgcg gaaatcgtct tcgttatgtc tcagggcact 2460 <210> 36 <211> 1000 <212> DNA <213> Sequence of the ?deleted poxB region; <400> 36 gcggcccggc tccgtatatg gattgggtag agcaggaagt gaaagcgctc ggcgtgacgc 60 gtttctttaa agagaaattc ttcaccccag tagcggaagc agcgaccagc ggtctgaaat 120 tcaccaaact gcaaccggca cgagaatttt acgccccggt tggcaccacg ctactggagg 180 cgctggaaag caataacgtt ccggttgtcg ccgcctgccg tgcgggtgtt tgcggctgct 240 gtaagacaaa agtggtttcc ggtgaatata cggtgagcag cacaatgacg ctgaccgacg 300 ccgaaatcgc tgaaggttac gtactggcct gctcctgcca tccgcagggg gatttggttc 360 tcgcataatc gccttatgcc cgatgatatt cctttcatcg ggctatttaa ccgttagtgc 420 ctcctttctc tcccatccct tccccctccg tcagatgaac taaacttgtt accgttatca 480 cattcaggag atggagaacc aaagggtggc atttcccgtc ataataagga catgccatga 540 ttgatttacg cagtgatacc gttacccgac cgagccgcgc catgctcgaa gcaatgatgg 600 ccgccccggt tggggacgac gtttacggag acgaccctac cgttaatgct ctgcaggact 660 acgccgcaga gctttccggt aaagaagccg ccatttttct gccgaccggc actcaggcca 720 acctggtcgc tctgctcagt cactgcgaac gtggcgaaga gtatattgtc ggtcaggccg 780 cgcataacta tctgtttgaa gccggtggcg cagcggtgct gggcagtatt cagccgcaac 840 ccatcgacgc ggctgccgac ggcacgctac cgctggataa agtggcgatg aaaatcaaac 900 ccgacgatat ccatttcgcc cgcaccaaat tactcagtct ggaaaacacc cacaacggca 960 aagtgctgcc gcgtgaatac ctgaaagaag catgggaatt 1000 <210> 37 <211> 3392 <212> DNA <213> tktA cassette at the deleted poxB locus; <400> 37 gcggcccggc tccgtatatg gattgggtag agcaggaagt gaaagcgctc ggcgtgacgc 60 gtttctttaa agagaaattc ttcaccccag tagcggaagc agcgaccagc ggtctgaaat 120 tcaccaaact gcaaccggca cgagaatttt acgccccggt tggcaccacg ctactggagg 180 cgctggaaag caataacgtt ccggttgtcg ccgcctgccg tgcgggtgtt tgcggctgct 240 gtaagacaaa agtggtttcc ggtgaatata cggtgagcag cacaatgacg ctgaccgacg 300 ccgaaatcgc tgaaggttac gtactggcct gctcctgcca tccgcagggg gatttggttc 360 tcgcataatc gccttatgcc cgatgatatt cctttcatcg ggctatttaa ccgttagtgc 420 ctcctttctc tcccatccct tccccctccg tcagatgaac taaacttgtt accgttatca 480 cattcaggag atggagaacc aaggaaaagc gcaacggacg ggcgagtaga ttgcgcaaca 540 tgcgagcatg atccagagat ttctgaagca gcaaaaggat gttccatgta catgacgcgc 600 ggcttgcggt aaattgttgg caaattttcc ggcgtagccc aaaacgcgct gtcgtcaagt 660 cgttaagggc gtgcccttca tcatccgatc tggagtcaaa atgtcctcac gtaaagagct 720 tgccaatgct attcgtgcgc tgagcatgga cgcagtacag aaagccaaat ccggtcaccc 780 gggtgcccct atgggtatgg ctgacattgc cgaagtcctg tggcgtgatt tcctgaaaca 840 caacccgcag aatccgtcct gggctgaccg tgaccgcttc gtgctgtcca acggccacgg 900 ctccatgctg atctacagcc tgctgcacct caccggttac gatctgccga tggaagaact 960 gaaaaacttc cgtcagctgc actctaaaac tccgggccac ccggaagtag gttataccgc 1020 tggtgtggaa accaccaccg gtccgctggg tcagggtatt gccaacgcag tcggtatggc 1080 gattgcagaa aaaacgctgg cggcgcagtt taaccgtcca ggtcacgaca ttgtcgacca 1140 ctacacctac gccttcatgg gcgacggctg catgatggaa ggcatctccc acgaagtttg 1200 ctctctggcg ggtacgctga agctgggtaa actgattgcg ttctacgatg acaacggtat 1260 ctcaatcgat ggtcacgttg aaggctggtt cactgacgac accgcaatgc gtttcgaagc 1320 ttacggctgg cacgttattc gcgacatcga cggtcatgac gcggcatcca tcaaacgcgc 1380 agtagaagaa gcgcgcgcag tgactgacaa accgtccctg ctgatgtgca aaaccatcat 1440 cggtttcggt tccccgaaca aagccggtac ccacgactcc cacggtgcgc cgctgggcga 1500 cgctgaaatt gccctgaccc gcgaacagct gggctggaaa tacgcgccgt tcgaaatccc 1560 gtctgaaatc tatgctcagt gggatgcgaa agaagcaggc caggcgaaag aatctgcatg 1620 gaatgagaag tttgcggctt acgcgaaagc ttatccgcag gaagcggctg aatttacccg 1680 ccgtatgaaa ggcgaaatgc cgtctgactt cgacgccaaa gcgaaagagt ttatcgctaa 1740 actgcaggct aatccggcga aaatcgccag ccgtaaagcg tcgcagaatg ctatcgaagc 1800 gttcggcccg ctgttgcctg aattcctcgg cggctctgct gacctggcac cgtctaacct 1860 gaccctgtgg tctggttcta aagcaatcaa cgaagatgct gcaggtaact acatccacta 1920 cggtgttcgc gagttcggta tgaccgcgat tgctaacggt atctccctgc acggtggttt 1980 cctgccgtac acctccacct tcctgatgtt cgtggaatac gcacgtaacg ccgtacgtat 2040 ggctgcgctg atgaaacagc gtcaggtgat ggtttacacc cacgactcca tcggtctggg 2100 cgaagatggc ccgactcacc agccggttga gcaggtcgct tctctgcgcg tgaccccgaa 2160 catgtctaca tggcgtccgt gtgaccaggt tgaatccgcg gtcgcgtgga aatacggcgt 2220 tgagcgtcag gacggcccga ctgcgcttat cctctcccgt cagaacctgg cgcagcagga 2280 acgaactgaa gagcaactgg caaacatcgc gcgcggtggt tatgtgctga aagactgcgc 2340 cggtcagccg gaactgattt tcatcgctac cggttcagaa gttgaactgg ctgttgctgc 2400 ctacgaaaaa ctgactgccg aaggcgtgaa agcgcgcgtg gtgtccatgc cgtctaccga 2460 cgcatttgac aagcaggatg ctgcttaccg tgaatccgta ctgccgaaag cggttactgc 2520 acgcgttgct gtagaagcgg gtattgctga ctactggtac aagtatgttg gcctgaacgg 2580 tgctatcgtc ggtatgacca ccttcggtga atctgctccg gcagagctgc tgtttgaaga 2640 gttcggcttc actgttgata acgttgttgc gaaagcaaaa gaactgctgt aattagcatt 2700 tcgggtaaaa aggtcgcttc ggcgaccttt tttattacct tgatatgtcc gtttgcggac 2760 aagcaataga taaagcgtgt tgtagatcac aaatatttat atgcaataaa tatcaattat 2820 gtaatatgca tcacgatatg cgtattgaca tttgttgtta taactataac tcaatgttat 2880 ataagaaatt aaaaagggtg gcatttcccg tcataataag gacatgccat gattgattta 2940 cgcagtgata ccgttacccg accgagccgc gccatgctcg aagcaatgat ggccgccccg 3000 gttggggacg acgtttacgg agacgaccct accgttaatg ctctgcagga ctacgccgca 3060 gagctttccg gtaaagaagc cgccattttt ctgccgaccg gcactcaggc caacctggtc 3120 gctctgctca gtcactgcga acgtggcgaa gagtatattg tcggtcaggc cgcgcataac 3180 tatctgtttg aagccggtgg cgcagcggtg ctgggcagta ttcagccgca acccatcgac 3240 gcggctgccg acggcacgct accgctggat aaagtggcga tgaaaatcaa acccgacgat 3300 atccatttcg cccgcaccaa attactcagt ctggaaaaca cccacaacgg caaagtgctg 3360 ccgcgtgaat acctgaaaga agcatgggaa tt 3392 <210> 38 <211> 1045 <212> DNA <213> ptsHI deletion sequence; <400> 38 gaagatgaaa gctttaccaa caagaatatt gtggttattc taccatcatc gggtgagcgt 60 tatttaagca ccgcattgtt tgccgatctc ttcactgaga aagaattgca acagtaatgc 120 cagcttgtta aaaatgcgta aaaaagcacc tttttaggtg cttttttgtg gcctgcttca 180 aactttcgcc cctcctggca ttgattcagc ctgtcggaac tggtatttaa ccagactaat 240 tattttgatg cgcgaaatta atcgttacag gaaaagccaa agctgaatcg attttatgat 300 ttggttcaat tcttccttta gcggcataat gtttaatgac gtacgaaacg tcagcggtca 360 acacccgcca gcaatggact gtattgcgct cttcgtgcgt cgcgtctgtt aaaaactggc 420 gctaacaata caggctaaag tcgaaccgcc aggctagact ttagttccac aacactaaac 480 ctataagttg gggaaataca atgttccagc aagaagttac cattaccgct ccgacaatct 540 gctaatccac gagatgcggc ccaatttact gcttaggaga agatcatggg tttgttcgat 600 aaactgaaat ctctggtttc cgacgacaag aaggataccg gaactattga gatcattgct 660 ccgctctctg gcgagatcgt caatatcgaa gacgtgccgg atgtcgtttt tgcggaaaaa 720 atcgttggtg atggtattgc tatcaaacca acgggtaaca aaatggtcgc gccagtagac 780 ggcaccattg gtaaaatctt tgaaaccaac cacgcattct ctatcgaatc tgatagcggc 840 gttgaactgt tcgtccactt cggtatcgac accgttgaac tgaaaggcga aggcttcaag 900 cgtattgctg aagaaggtca gcgcgtgaaa gttggcgata ctgtcattga atttgatctg 960 ccgctgctgg aagagaaagc caagtctacc ctgactccgg ttgttatctc caacatggac 1020 gaaatcaaag aactgatcaa actgt 1045 <210> 39 <211> 4595 <212> DNA <213> glf-glk cassette integrated at the deleted tdc locus; <400> 39 ctgatttctt tgtcgctgat cccttactgg aactctgcag ttatcgacca ggttgacctc 60 ggttcgctgt cgttaaccgg tcatgacggt atcctgatca ctgtctggct ggggatttcc 120 atcatggttt tctcctttaa cttctcgcca atcgtctctt ccttcgtggt ttctaaacgt 180 gaagagtatg agaaagactt cggtcgcgac ttcaccgaac gtaaatgttc ccaaatcatt 240 tctcgtgcca gcatgctgat ggttgcagtg gtgatgttct ttgcctttag ctgcctgttt 300 actctgtctc cggccaacat ggcggaagcc aaagcgcaga atattccagt gctttcttat 360 ctggctaacc actttgcgtc catgaccggt accaaaacaa cgttcgcgat tacactggaa 420 tatgcggctt ccatcatcgc actcgtggct atcttcaaat ctttcttcgg tcactatctg 480 gggacgctgg aaggcttgaa tggtctgatt ctgaagttcg gttataaagg tgacaaaacc 540 aaagtgtcgc tgggtaaact gaatactctc agcatgatct tcatcatggg ctccacctgg 600 gttgttgcct acgccaaccc gaacatcctc gacctgattg aagccatggg cgcaccgatt 660 atcgcatccc tgctgtgcct gttgccgatg tatgccatcc gtaaagcgcc gtctctggcg 720 aaataccgtg gtcgtctgga taacgtgttt gttaccgtga ttggtctgct gaccatcctg 780 aacatcgtat acaaactgtt ttaatccgta actcaggatg agaaaagaga tgaatgaatt 840 tccggttgtt ttggttatta actgtggttc gtcttcgatt aagttttccg tactcgatgc 900 cagcgactgt gaagtattaa tgtcaggtat tgccgacggt attaactcgg aaaatgcatt 960 cttatccgta aatgggggag agccagcacc gctggctcac cacagctacg aaggtgcatt 1020 gaaggcaatt gcatttgaac tggaaaaacg gagtttaaat gacagcgtgg ccttaattgg 1080 tgcaaaagtg gctgtgactg taaaaagaaa tcgaaaaaga ccgttttgtg tgaaaacggt 1140 ctttttgttt ccttttaacc aactgccata actcgaggcc tacctagctt ccaagaaaga 1200 tatcctaaca gcacaagagc ggaaagatgt tttgttctac atccagaaca acctctgcta 1260 aaattcctga aaaattttgc aaaaagttgt tgactttatc tacaaggtgt ggtataataa 1320 tcttaacaac agcaggacgc tctagaggga gaggaatcgc catgagttct gaaagtagtc 1380 agggtctagt cacgcgacta gccctaatcg ctgctatagg cggcttgctt ttcggttacg 1440 attcagcggt tatcgctgca atcggtacac cggttgatat ccattttatt gcccctcgtc 1500 acctgtctgc tacggctgcg gcttcccttt ctgggatggt cgttgttgct gttttggtcg 1560 gttgtgttac cggttctttg ctgtctggct ggattggtat tcgcttcggt cgtcgcggcg 1620 gattgttgat gagttccatt tgtttcgtcg ccgccggttt tggtgctgcg ttaaccgaaa 1680 aattatttgg aaccggtggt tcggctttac aaattttttg ctttttccgg tttcttgccg 1740 gtttaggtat cggtgtcgtt tcaaccttga ccccaaccta tattgctgaa attgctccgc 1800 cagacaaacg tggtcagatg gtttctggtc agcagatggc cattgtgacg ggtgctttaa 1860 ccggttatat ctttacctgg ttactggctc atttcggttc tatcgattgg gttaatgcca 1920 gtggttggtg ctggtctccg gcttcagaag gcctgatcgg tattgccttc ttattgctgc 1980 tgttaaccgc accggatacg ccgcattggt tggtgatgaa gggacgtcat tccgaggcta 2040 gcaaaatcct tgctcgtctg gaaccgcaag ccgatcctaa tctgacgatt caaaagatta 2100 aagctggctt tgataaagcc atggacaaaa gcagcgcagg tttgtttgct tttggtatca 2160 ccgttgtttt tgccggtgta tccgttgctg ccttccagca gttagtcggt attaacgccg 2220 tgctgtatta tgcaccgcag atgttccaga atttaggttt tggagctgat acggcattat 2280 tgcagaccat ctctatcggt gttgtgaact tcatcttcac catgattgct tcccgtgttg 2340 ttgaccgctt cggccgtaaa cctctgctta tttggggtgc tctcggtatg gctgcaatga 2400 tggctgtttt aggctgctgt ttctggttca aagtcggtgg tgttttgcct ttggcttctg 2460 tgcttcttta tattgcagtc tttggtatgt catggggccc tgtctgctgg gttgttctgt 2520 cagaaatgtt cccgagttcc atcaagggcg cagctatgcc tatcgctgtt accggacaat 2580 ggttagctaa tatcttggtt aacttcctgt ttaaggttgc cgatggttct ccagcattga 2640 atcagacttt caaccacggt ttctcctatc tcgttttcgc agcattaagt atcttaggtg 2700 gcttgattgt tgctcgcttc gtgccggaaa ccaaaggtcg gagcctggat gaaatcgagg 2760 agatgtggcg ctcccagaag tagttaaact tgctttggct gaatcctttt gtctttttta 2820 gataagtctt aaccaattat actttttgtt tacaacgatg gtataaagcg ggcggactta 2880 ttttacctgt tgggtagcct tctgatttca gaaaggaatt attatggaaa ttgttgcgat 2940 tgacatcggt ggaacgcatg cgcgtttctc tattgcggaa gtaagcaatg gtcgggttct 3000 ttctcttgga gaagaaacaa cttttaaaac ggcagaacat gctagcttgc agttagcttg 3060 ggaacgtttc ggtgaaaaac tgggtcgtcc tctgccacgt gccgcagcta ttgcatgggc 3120 tggcccggtt catggtgaag ttttaaaact taccaataac ccttgggtat taagaccagc 3180 tactctgaat gaaaagctgg acatcgatac gcatgttctg atcaatgact tcggcgcggt 3240 tgcccacgcg gttgcgcata tggattcttc ttatctggat catatttgtg gtcctgatga 3300 agcgcttcct agcgatggtg ttatcactat tcttggtccg ggaacgggct tgggtgttgc 3360 ccatctgttg cggactgaag gccgttattt cgtcatcgaa actgaaggcg gtcatatcga 3420 ctttgctccg cttgacagac ttgaagacaa aattctggca cgtttacgtg aacgtttccg 3480 ccgcgtttct atcgaacgca ttatttctgg cccgggtctt ggtaatatct acgaagcact 3540 ggctgccatt gaaggcgttc cgttcagctt gctggatgat attaaattat ggcagatggc 3600 tttggaaggt aaagacaacc ttgctgaagc cgctttggat cgcttctgct tgagccttgg 3660 cgctatcgct ggtgatcttg ctttggcaca gggtcgaacc agtgttgtta ttggcggtgg 3720 tgtcggtctt cgtatcgctt cccatttgcc agaatctggt ttccgtcagc gctttgtttc 3780 aaaaggacgc tttgaacgcg tcatgtccaa gattccggtt aagttgatta cttatccgca 3840 gcctggactg ttgggtgcgc agctgcctat gccaacaaat attctgaagt tgaataatat 3900 tttttaatat tatgaactga atttaagagg ctgccttccg ataaaatcgg gaggtggcct 3960 tttttatatt ttttactaaa aaatgaagac aaaaaagtct taagtaagaa taatattatt 4020 attaactttt gatatatttt gtattagtgg atccgccctc ccgctggaaa ttgaagccat 4080 cgcagtacgt agtgcgtaaa gcctcgtgag cgggacggtc gtaaggtcgt tccgctccac 4140 ttcactgaac ggcaatccga gggtgtggat atgattagtg cattcgatat tttcaaaatt 4200 gggattggtc cctccagttc gcataccgtg gggccaatga atgccggaaa aagttttatt 4260 gatcggctgg aaagtagcgg cttattaacc gcgacgagcc atattgtggt cgatctgtac 4320 gggtcgttgt cactgacggg caaaggccat gccacggatg tcgccatcat catgggactg 4380 gcaggaaaca gtccgcagga tgttgtcatt gatgagatcc ctgcatttat agagttagta 4440 acgcgcagcg ggcggctgcc agtggcatct ggtgcgcata ttgttgattt tcctgtagca 4500 aagaacatta tcttccatcc cgaaatgttg cctcgccatg agaacggaat gcggatcact 4560 gcctggaagg gacaggaaga gctattaagt aaaac 4595 <210> 40 <211> 1069 <212> DNA <213> galP deletion region; <400> 40 actttggtcg tgaacatttc ccgtgggaaa aaaccgacaa agcgcagctg ctgcgcgatg 60 ctgccggtct gaagtaatct ttcttcacct gcgttcaaag gccagcctcg cgctggcctt 120 tttcttttgg ataggcgttc acgccgcatc cggcaaaaaa accgcccgca caataacatc 180 attcttcctg atcacgtttc accgcagatt atcatcacaa ctgaaaccga ttacaccaac 240 cacaacagac aaagatttgt aatattttca tattattatt cggttttcac agttgttaca 300 tttcttttca gtaaagtctt aattgcagat aacagcgttt aatctatgat gatataactc 360 aattattttc atgcacttaa atcataacta agataaatgt tagtgtaagc gattacactg 420 atgtgatttg cttcacatct ttttacgtcg tactcaccta tcttaattca caataaaaaa 480 taaccatatt ggagggcatc atgcctgacg ctaaaaaaca ggggcggtca aacaaggcaa 540 tgacgtttga aataggcgct cacgattaat ctccccaagc ttcctcccat cgcggaggaa 600 gccacctctt gcagtcatct tttcttcgct ctatcctctg ccgctatgaa aacatcccgt 660 ctccctatcg ccatccaaca ggccgttatg cgtcgcctgc gggaaaaact cgcccaggcc 720 aacctgaagc tagggcgtaa ctacccggag ccaaaactct cttacaccca gcgcggaacc 780 tccgccggaa cggcctggct ggaaagctat gaaattcgcc tcaatcccgt tttgctgttg 840 gaaaacagtg aagcttttat tgaagaagtg gtaccgcacg aactggcaca tttgctggta 900 tggaaacatt tcggccgcgt agcgccacat ggcaaagagt ggaagtggat gatggaaaac 960 gtgctgggtg ttcccgcccg tcgtacgcat cagttcgaac tgcaatccgt gcgtcgcaac 1020 accttcccct accgctgcaa gtgccaggag catcagctta ccgtacgcc 1069 <210> 41 <211> 6100 <212> DNA <213> P15-catAX +PR-aroY+P26-quiC cassette at adhE locus; <400> 41 ttgattttca taggttaagc aaatcatcac cgcactgact atactctcgt attcgagcag 60 atgatttact aaaaaagttt aacattatca ggagagcatt agcttgctat tgacgacagc 120 tatggttcac tgtccaccaa ccaaaactgt gctcagtacc gccaatattt ctcccttgag 180 gggtacaaag aggtgtccct agaagagatc cacgctgtgt aaaaatttta caaaaaggta 240 ttgactttcc ctacagggtg tgtaataatt taattacagg cgggggcaac cccgcctgtt 300 ctgcagagga ggaatatagc catggaagtg aaaatcttca acacccagga tgttcaggat 360 tttctgcgtg ttgcaagcgg tctggaacaa gagggtggta atccgcgtgt taaacaaatt 420 attcatcgtg ttctgagcga cctgtataaa gcaattgaag atctgaatat caccagcgac 480 gaatattggg caggcgttgc atatctgaat cagctgggtg caaatcaaga agcaggtctg 540 ctgagtccgg gtctgggttt tgatcattat ctggatatgc gtatggatgc agaagatgca 600 gcactgggta ttgaaaatgc aacaccgcgt accattgaag gtccgctgta tgttgcgggt 660 gcaccggaaa gcgttggtta tgcacgcatg gatgatggta gcgatccgaa tggtcatacc 720 ctgattctgc atggcaccat ttttgatgca gatggtaaac cgctgccgaa tgcaaaagtt 780 gaaatttggc atgcaaacac caaaggcttt tatagccatt ttgatccgac cggtgaacag 840 caggccttta atatgcgtcg tagcattatt accgatgaga atggtcagta tcgtgttcgt 900 accattctgc ctgccggtta tggttgtcct ccggaaggtc cgacccagca actgctgaac 960 caactgggtc gtcatggtaa tcgtccggca catattcatt attttgttag cgcagatggt 1020 caccgtaaac tgaccaccca gattaatgtt gccggtgatc cgtataccta tgatgatttt 1080 gcatatgcca cccgtgaagg tctggttgtt gatgcagttg aacataccga tccggaagca 1140 attaaagcca atgatgtgga aggtcctttt gccgaaatgg tgtttgatct gaaactgacc 1200 cgtctggttg atggtgttga taatcaggtt gtggatcgtc cgcgtctggc agtttaatac 1260 accaaaatgg ttcaaaatta tcaggcgagt gatcatgatc actggcctgt ttttatttca 1320 gggaagggtg gagacaatta cgtggataat cagatcatcc aagaaaccgt ggataaaatt 1380 ctgagcgttc tgccgaatca ggcaggtcag ctggcacgtc tggtgcgtct gatgcaattt 1440 gcatgcgatc cgaccattac cgttattggc aaatataacc atggtaaaag ccgtctgctg 1500 aatgaactga ttggcaccga tatctttagc gttgcagata aacgtgaaac cattcagctg 1560 gccgaacata aacaggatca ggttcgttgg ctggatgcac ctggtctgga tgccgatgtt 1620 gcagcagttg atgatcgtca tgcatttgaa gcagtttgga cccaggcaga tattcgtctg 1680 tttgttcata gcgttcgtga aggtgaactg gatgcaaccg aacaccatct gctgcaacag 1740 ctgattgaag atgccgatca tagccgtcgt cagaccattc tggttctgac ccagattgat 1800 cagattccgg atcagaccat cctgacacag attaaaacca gcattgcaca gcaggttccg 1860 aaactggata tttgggcagt tagcgcaacc cgtcatcgtc agggcattga aaacggtaaa 1920 accctgctga tcgaaaaaag cggtattggt gcactgcgcc ataccctgga acaggcactg 1980 gcacaggtgc cgagcgcacg tacctatgaa aaaaatcgtc tgctgtcaga tctgcaccat 2040 cagctgaaac aactgctgct ggatcagaaa catgttctgc aacaactgca acagacacag 2100 caacagcagc tgcatgattt tgataccggt ctgattaaca ttctggacaa aattcgtgtt 2160 gatctggaac cgattgtgaa tattgatggt caggatcaag cactgaatcc ggatagcttt 2220 gcaaccatgt ttaaaaacac cgcagcaaaa cagcagcgtg ccaaagttca gattgcatat 2280 agccgtgcat gcattgaaat caacagccat ctgattcgcc atggtgttgt tggtctgcct 2340 gcggaacagc agaccaccat taaaagcatt gataccgtga ttgttgccgt gtttggtatc 2400 agcgttaaat ttcgtgatca gctgcgtgcc ctgttttata ccgataccga acgtcagcgt 2460 ctgcaacgtg aatttcgttt ctattttgaa aaaagtgccg gtcgcatgat tctggcagca 2520 aaaattgaac agaccatgcg tcagcagggc tgtattcaga atgccatgat ggcactgcaa 2580 caaatggaaa gcgcagcata aaaacacgga cgccgcaaac ggcgtccgaa tttcttggtc 2640 gaccgttaaa tctatcaccg caagggataa atatctaaca ccgtgcgtgt tgactatttt 2700 acctctggcg gtgataatgg ttgcatgtac taatctagat aaggaatata gccatgaccg 2760 caccgattca ggatctgcgt gatgcaattg ccctgctgca acagcatgat aatcagtatc 2820 tggaaaccga tcatccggtt gatccgaatg cagaactggc aggcgtttat cgtcatattg 2880 gtgccggtgg caccgttaaa cgtccgaccc gtattggtcc ggcaatgatg tttaataaca 2940 ttaaaggtta tccgcacagc cgtattctgg ttggtatgca tgcaagccgt cagcgtgcag 3000 cactgctgct gggttgtgaa gcaagtcagc tggcactgga agttggtaaa gcagttaaaa 3060 aaccggttgc accggtggtt gttccggcaa gcagcgcacc gtgtcaagag cagatttttc 3120 tggcagatga tccggatttt gatctgcgta ccctgctgcc tgcacatacc aataccccga 3180 ttgatgcagg tccgtttttt tgtctgggtc tggccctggc aagcgatccg gtggatgcaa 3240 gcctgaccga tgttaccatt catcgtctgt gtgttcaggg tcgtgatgaa ctgagcatgt 3300 tcctggcagc aggtcgccat attgaagttt ttcgtcagaa agcagaagca gcaggtaaac 3360 cgctgccgat taccattaat atgggtctgg acccagcaat ctatattggc gcatgttttg 3420 aagcaccgac caccccgttt ggttataatg aactgggtgt tgccggtgca ctgcgtcagc 3480 gtccggttga actggttcag ggtgttagcg ttccggaaaa agcaattgca cgtgccgaaa 3540 ttgttattga aggtgaactg ctgcctggtg ttcgtgttcg tgaagatcag cataccaatt 3600 caggtcatgc aatgccggaa tttccgggtt attgtggtgg tgcaaatccg agcctgccgg 3660 ttattaaagt taaagccgtt accatgcgca ataacgcaat tctgcaaacc ctggttggtc 3720 cgggtgaaga acataccacc ctggcaggtc tgccgaccga agcaagcatt tggaatgcag 3780 ttgaagcagc aattccgggt tttctgcaaa atgtttatgc ccataccgca ggcggtggta 3840 aatttctggg tattctgcaa gtgaaaaaac gtcagcctgc cgatgaaggt cgtcagggtc 3900 aggcagccct gctggcgctg gcaacctata gcgaactgaa aaatatcatt ctggtggatg 3960 aggatgtgga catttttgat agtgatgata ttctgtgggc aatgaccacc cgtatgcagg 4020 gtgatgttag cattaccacc attccgggta ttcgcggtca tcagctggac ccgagccaga 4080 caccggaata ttcaccgagc attcgtggta atggtattag ctgcaaaacc atctttgatt 4140 gtaccgttcc gtgggcactg aaaagccatt ttgaacgtgc accgtttgca gatgttgatc 4200 cgcgtccgtt tgcacctgaa tattttgcac gtctggaaaa aaatcagggc agcgcaaaat 4260 aagctaataa caggcctgct ggtaatcgca ggaattttta tttggatgga tccgcctacc 4320 tagcttccaa gaaagatatc ctaacagcac aagagcggaa agatgttttg ttctacatcc 4380 agaacaacct ctgctaaaat tcctgaaaaa ttttgcaaaa agttgttgac tttatctaca 4440 aggtgtggta taataatctt aacaacagca ggacgctccc gggttgagga aaacctaatg 4500 aaactgacca gcctgcgtgt tagcctgctg gcactgggtc tggttaccag cggttttgca 4560 gcagcagaaa cctataccgt tgatcgttat caggatgata gcgaaaaagg tagcctgcgt 4620 tgggcaattg aacagagcaa tgcaaatagc gcacaagaaa accagattct gattcaggca 4680 gttggtaaag caccgtatgt tatcaaagtt gataaaccgc tgcctccgat taaaagcagc 4740 gttaaaatca ttggcaccga gtgggataaa accggtgaat ttattgcaat tgatggcagc 4800 aactatatca aaggcgaagg tgaaaaagca tgtccgggtg caaatccggg tcagtatggc 4860 accaatgttc gtaccatgac cctgcctggt ctggttctgc aagatgttaa tggtgttacc 4920 ctgaaaggtc tggatgttca tcgtttttgt attggtgttc tggttaatcg cagcagcaat 4980 aacctgattc agcataatcg tatcagcaac aattatggtg gtgccggtgt tatgattacc 5040 ggtgatgatg gtaaaggtaa tccgaccagc accaccacca ataataacaa agttctggat 5100 aacgtgttca tcgataatgg tgatggtctg gaactgaccc gtggtgcagc atttaatctg 5160 attgcaaata acctgtttac cagcacaaaa gccaatccgg aaccgagcca gggtattgaa 5220 attctgtggg gtaatgataa tgccgtggtg ggtaacaaat tcgaaaacta ttcagatggc 5280 ctgcaaatca attggggtaa acgtaactat atcgcctata acgaactgac caataacagc 5340 ctgggtttca atctgacagg tgatggtaac attttcgaca gcaataaagt gcatggtaac 5400 cgtattggta ttgccattcg tagtgaaaaa gatgccaatg cacgtattac cctgaccaaa 5460 aatcagattt gggataacgg caaagatatc aaacgttgtg aagccggtgg tagctgtgtt 5520 ccgaatcagc gtctgggtgc aattgttttt ggtgttccgg cactggaaca tgaaggtttt 5580 gttggtagcc gtggcggtgg tgttgttatt gaaccggcaa aactgcaaaa aacctgcacc 5640 cagccgaacc agcagaattg taatgcaatt cctaatcagg gtattcaggc accgaaactg 5700 acagttagca aaaaacagct gaccgttgaa gttaaaggca cccctaatca gcgttataat 5760 gtggaatttt ttggcaatcg taatgccagc agcagcgaag cagaacagta tctgggtagc 5820 attgttgttg ttaccgatca tcagggtctg gcaaaagcaa attgggctcc gaaagttagc 5880 atgccgagcg ttaccgcaaa tgtgacagat catctgggtg cgaccagcga actgagcagc 5940 gcagttaaaa tgcgttaaat gcatgcgcgc cgcgttcgcg cggcgctttt ttttggtact 6000 cagtagcgct gtctggcaac ataaacggcc ccttctgggc aatgccgatc agttaaggat 6060 tagttgaccg atccttaaac tgaggcacta taacggcttc 6100

Claims (34)

  1. 비-방향족 탄소원으로부터 시작하여 시스, 시스-뮤콘산을 생산하는 유전자 조작된 미생물에 있어서, 뮤콘산 경로에서 기능하는 단백질을 코딩하는 모든 유전자들은 상기 미생물의 염색체 DNA 안으로 통합되는 것을 특징으로 하는 유전자 조작된 미생물.
  2. 제 1 항에 있어서,
    상기 뮤콘산 경로에서 기능하는 단백질을 코딩하는 유전자들은 aorZ, qa-4, asbF, quiC, aroYcatAX로 구성된 군으로부터 선택되는 것을 특징으로 하는 유전자 조작된 미생물.
  3. 제 1 항에 있어서,
    아시네토박터 속(genus acinetobacter)의 박테리아의 QuiC 효소, 또는 상기 QuiC 효소의 동족체를 인코딩하는 유전자를 포함하는 것을 특징으로 하는 유전자 조작된 미생물.
  4. 제 1 항에 있어서,
    쉬킴산 경로(shikimic acid pathway)에서 기능하는 단백질을 코딩하는 하나 이상의 외인성 유전자를 포함하는 것을 특징으로 하는 유전자 조작된 미생물.
  5. 제 4 항에 있어서,
    상기 쉬킴산 경로에서 기능하는 단백질을 코딩하는 하나 이상의 외인성 유전자는 상기 유기체의 염색체 DNA 안으로 통합되는 것을 특징으로 하는 유전자 조작된 미생물.
  6. 제 4 항에 있어서,
    상기 쉬킴산 경로에서 기능하는 단백질을 코딩하는 외인성 유전자들은 aroB, aroD, aroF, aroG, aroH, tktA, talB, rperpi로 구성된 군으로부터 선택되는 것을 특징으로 하는 유전자 조작된 미생물.
  7. 제 4 항에 있어서,
    뮤콘산 경로 또는 쉬킴산 경로에서 기능하는 단백질들을 코딩하는 상기 유전자들 중 어느 것도, 유도를 위해 공급 화학물질(fed chemical)을 필요로 하는 프로모터로부터 발현되지 않는 것을 특징으로 하는 유전자 조작된 미생물.
  8. 제 1 항에 있어서,
    방향족 아미노산 생합성의 음성 조절 단백질의 활성은 실질적으로 감소되거나 제거된 것을 특징으로 하는 유전자 조작된 미생물.
  9. 제 8 항에 있어서,
    방향족 아미소나 생합성의 음성 조절 단백질은 TyrR 단백질 또는 TyrR 단백질의 동족체인 것을 특징으로 하는 유전자 조작된 미생물.
  10. 제 8 항에 있어서,
    방향족 아미노산 생합성의 음성 조절 단백질을 코딩하는 유전자는 돌연변이되는 것을 특징으로 하는 유전자 조작된 미생물.
  11. 제 1 항에 있어서,
    누출 AroE 효소(leaky AroE enzyme)을 인코딩하는 aroE 유전자를 포함하는 것을 특징으로 하는 유전자 조작된 미생물.
  12. 제 1 항에 있어서,
    쉬킴산 경로에서 활성인 적어도 하나의 효소는 상기 미생물의 대사에 의한 억제에 대해 실질적으로 내성을 갖는 것을 특징으로 하는 유전자 조작된 미생물.
  13. 제 12 항에 있어서,
    페닐알라닌에 의한 억제에 대해 실질적으로 내성을 갖는 DAHP 합성효소를 인코딩하는 aroG*를 포함하는 것을 특징으로 하는 유전자 조작된 미생물.
  14. 제 12 항에 있어서,
    aroG*20-893, aroG*20-897, aroG*20-899, aroG*20-901, aroG*111, aroG*211, aroG*212, aroG*311, aroG*312, aroG*411, aroG*412,aroG*511로 구성된 세트로부터 선택되는 DAHP 합성효소를 인코딩하는 aroG* 유전자를 포함하는 것을 특징으로 하는 유전자 조작된 미생물.
  15. 재 1 항에 있어서,
    상기 미생물은 박테리아인 것을 특징으로 하는 유전자 조작된 미생물.
  16. 제 1 항에 있어서,
    상기 미생물은 대장균 C로부터 유래되는 것을 특징으로 하는 유전자 조작된 미생물.
  17. PEP-의존성 포스포트랜스퍼라아제 시스템(PEP-dependent phosphotransferase system)이 결여되고, 글루코오스 이입(import)을 위한 GalP 단백질계 시스템(GalP protein based system)이 결여되고, 기능성 글루코오스-촉진 확산 단백질을 인코딩하는 외인성 유전자를 포함하는 것을 특징으로 하는 유전자 조작된 박테리아.
  18. 제 17 항에 있어서,
    기능성 글루코오스-촉진 확산 단백질은 glf 유전자에 의해 코딩된 Glf 단백질인 것을 특징으로 하는 유전자 조작된 박테리아.
  19. 제 17 항에 있어서,
    글루코키나아제를 인코딩하는 외인성 유전자를 더 포함하는 것을 특징으로 하는 유전자 조작된 박테리아.
  20. 제 17 항에 있어서,
    비-방향족 탄소원으로부터 시작하여 시스, 시스-뮤콘산을 생산하는 뮤콘산 경로에서 기능하는 단백질을 인코딩하는 하나 이상의 외인성 유전자들을 더 포함하는 것을 특징으로 하는 유전자 조작된 박테리아.
  21. 제 20 항에 있어서,
    상기 뮤콘산 경로에서 기능하는 단백질을 인코딩하는 유전자들은 aroZ, qa-4, asbF, quiC, aroY,catAX로 구성된 군으로부터 선택되는 것을 특징으로 하는 유전자 조작된 박테리아.
  22. 제 17 항에 있어서,
    쉬킴산 경로에서 기능하는 단백질들을 코딩하는 하나 이상의 염색체로 통합된(chromosomally integrated) 외인성 유전자들을 더 포함하는 것을 특징으로 하는 유전자 조작된 박테리아.
  23. 제 22 항에 있어서,
    상기 쉬킴산 경로에서 기능하는 단백질들을 코딩하는 외인성 유전자들은 aroB, aroD, aroF, aroG, aroH, tktA, talB, rpe,rpi로 구성된 군으로부터 선택되는 것을 특징으로 하는 유전자 조작된 박테리아.
  24. 제 17 항에 있어서,
    방향족 아미노산 생합성의 음성 조절 단백질의 활성은 실질적으로 감소되거나 제거되는 것을 특징으로 하는 유전자 조작된 박테리아.
  25. 제 17 항에 있어서,
    방향족 아미노산 생합성의 음성 조절 단백질은 TyrR 단백질 또는 TyrR 단백질의 동족체인 것을 특징으로 하는 유전자 조작된 박테리아.
  26. 제 17 항에 있어서,
    방향족 아미노산 생합성의 음성 조절 단백질을 코딩하는 유전자는 결실되거나 돌연변이되는 것을 특징으로 하는 유전자 조작된 박테리아.
  27. 제 17 항에 있어서,
    쉬킴산 경로에서 활성인 적어도 하나의 효소는 상기 미생물의 대사에 의한 억제에 대해 실질적으로 내성을 갖는 것을 특징으로 하는 유전자 조작된 박테리아.
  28. 제 17 항에 있어서,
    상기 미생물은 대장균 C로부터 유래되는 것을 특징으로 하는 유전자 조작된 박테리아.
  29. 비-방향족 탄소원으로부터 시작하여 시스, 시스-뮤콘산을 생산하는 유전자 조작된 미생물에 있어서, 뮤콘산 경로 및 쉬킴산 경로에서 기능하는 단백질을 코딩하는 외인성 유전자들은 유도를 위해 공급 화합물질을 필요로하는 프로모터로부터 발현되지 않는 것을 특징으로 하는 유전자 조작된 미생물.
  30. 제 29 항에 있어서,
    상기 미생물은 박테리아인 것을 특징으로 하는 유전자 조작된 미생물.
  31. 제 29 항에 있어서,
    상기 미생물은 대장균인 것을 특징으로 하는 유전자 조작된 미생물.
  32. 비-방향족 탄소원으로부터 시작하여 시스, 시스-뮤콘산을 생산하는 유전자 조작된 미생물로서, 상기 유전자 조작된 미생물은 누출 AroE 효소를 인코딩하는 aroE 유전자를 포함하는 것을 특징으로 하는 유전자 조작된 미생물.
  33. 제 32 항에 있어서,
    상기 미생물은 박테리아인 것을 특징으로 하는 유전자 조작된 미생물.
  34. 제 32 항에 있어서,
    상기 미생물은 대장균인 것을 특징으로 하는 유전자 조작된 미생물.
KR1020147024229A 2012-01-30 2013-01-29 유전자 조작된 미생물로부터 뮤콘산의 생산 KR102092422B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261632777P 2012-01-30 2012-01-30
US61/632,777 2012-01-30
PCT/US2013/023690 WO2013116244A1 (en) 2012-01-30 2013-01-29 Production of muconic acid from genetically engineered microorganisms

Publications (2)

Publication Number Publication Date
KR20140131939A true KR20140131939A (ko) 2014-11-14
KR102092422B1 KR102092422B1 (ko) 2020-03-24

Family

ID=48905760

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147024229A KR102092422B1 (ko) 2012-01-30 2013-01-29 유전자 조작된 미생물로부터 뮤콘산의 생산

Country Status (11)

Country Link
US (2) US20150044755A1 (ko)
EP (2) EP3312267B1 (ko)
JP (3) JP2015504688A (ko)
KR (1) KR102092422B1 (ko)
CN (2) CN104220587A (ko)
BR (1) BR112014017686A2 (ko)
CA (1) CA2862051A1 (ko)
ES (1) ES2663445T3 (ko)
HK (1) HK1243459A1 (ko)
MY (1) MY172307A (ko)
WO (1) WO2013116244A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8647642B2 (en) 2008-09-18 2014-02-11 Aviex Technologies, Llc Live bacterial vaccines resistant to carbon dioxide (CO2), acidic PH and/or osmolarity for viral infection prophylaxis or treatment
KR102064475B1 (ko) * 2014-04-17 2020-01-10 (주)에스티알바이오텍 뮤코닉산 생산용 미생물 및 그 제조방법
WO2016036748A1 (en) * 2014-09-03 2016-03-10 Coffa Gianguido Production of cis, cis-muconic acid from carbonaceous material
WO2016207403A1 (en) 2015-06-24 2016-12-29 Deinove Method of producing muconic acid
JP7437116B2 (ja) 2016-03-02 2024-02-22 ピーティーティー グローバル ケミカル パブリック カンパニー リミテッド 遺伝子操作された微生物からのムコン酸生成の改善
US11129906B1 (en) 2016-12-07 2021-09-28 David Gordon Bermudes Chimeric protein toxins for expression by therapeutic bacteria
US11180535B1 (en) 2016-12-07 2021-11-23 David Gordon Bermudes Saccharide binding, tumor penetration, and cytotoxic antitumor chimeric peptides from therapeutic bacteria
CN108314713A (zh) * 2017-01-16 2018-07-24 中国科学院微生物研究所 L-苏氨酸转运蛋白ThrG及其编码基因与应用
CN108314712A (zh) * 2017-01-16 2018-07-24 中国科学院微生物研究所 L-苏氨酸转运蛋白ThrF及其编码基因与应用
CA3052635A1 (en) 2017-02-06 2018-11-08 Zymergen Inc. Engineered biosynthetic pathways for production of tyramine by fermentation
CN106947727B (zh) * 2017-02-20 2019-08-16 波顿(上海)生物技术有限公司 一种基因工程菌及其构建方法与生产香兰素的方法
US11708590B2 (en) 2017-07-18 2023-07-25 Arizona Board Of Regents On Behalf Of Arizona State University Synthetic metabolic funneling for biochemical production
KR102003911B1 (ko) * 2018-02-23 2019-07-25 씨제이제일제당 주식회사 마이코스포린 유사 아미노산을 생산하는 미생물 및 이를 이용한 마이코스포린 유사 아미노산의 생산방법
WO2020230718A1 (ja) * 2019-05-10 2020-11-19 東レ株式会社 3-ヒドロキシアジピン酸、α-ヒドロムコン酸および/またはアジピン酸を生産するための遺伝子改変微生物および当該化学品の製造方法
EP3967763A4 (en) 2019-05-10 2024-01-03 Toray Industries, Inc. GENETICALLY MODIFIED MICROORGANISM FOR THE PRODUCTION OF 3-HYDROXYHEXANIC ACID, (E)-HEX-2-ENDIONIC ACID AND/OR HEXANEDIONIC ACID AND PRODUCTION PROCESS FOR THESE CHEMICALS
CN110184288A (zh) * 2019-05-28 2019-08-30 南京趣酶生物科技有限公司 没食子酸和原儿茶酸的制备方法及其反应催化剂的制备方法
CN111662892B (zh) * 2020-07-29 2022-07-01 上海市农业科学院 β-酮己二酸代谢相关三个基因的结构优化与应用
CN112266892B (zh) * 2020-10-21 2021-10-08 中国科学院天津工业生物技术研究所 AroG的突变体及其在产氨基酸基因工程菌中的应用
CN116406420A (zh) 2020-11-11 2023-07-07 东丽株式会社 用于生产3-羟基己二酸和/或α-氢化己二烯二酸的基因修饰微生物以及该化学品的制造方法
CN117004547B (zh) * 2023-09-27 2023-12-22 北京化工大学 一种以葡萄糖为底物从头合成顺,顺-粘康酸的基因工程菌及其应用

Citations (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4480034A (en) 1982-06-10 1984-10-30 Celanese Corporation Continuous fermentation process and bioconversion-product recovery
US4535059A (en) 1983-01-13 1985-08-13 Celanese Corporation Muconic acid productivity by a stabilized mutant microorganism population
US4588688A (en) 1981-07-27 1986-05-13 Celanese Corporation Process for the production of muconic acid
US4608338A (en) 1982-06-10 1986-08-26 Celanese Corporation Process for bioconversion-product recovery
US4681852A (en) 1980-07-18 1987-07-21 Austgen-Biojet International Pty, Ltd. Novel microorganism and method
US4753883A (en) 1986-05-07 1988-06-28 Biotechnica International, Inc. Enzyme deregulation
US4833078A (en) 1984-06-22 1989-05-23 Celgene Corporation Semi-continuous fermentation process for aromatic hydrocarbon bioconversion
US4968612A (en) 1984-07-27 1990-11-06 Celgene Corporation Continuous fermentation process for aromatic hydrocarbon bioconversion
US5168056A (en) 1991-02-08 1992-12-01 Purdue Research Foundation Enhanced production of common aromatic pathway compounds
US5272073A (en) 1992-06-30 1993-12-21 Purdue Research Foundation Biocatalytic synthesis of catechol from glucose
US5487987A (en) 1993-09-16 1996-01-30 Purdue Research Foundation Synthesis of adipic acid from biomass-derived carbon sources
US6180373B1 (en) 1992-09-28 2001-01-30 Consortium f{umlaut over (u)}r elektrochemische Industrie GmbH Microorganisms for the production of tryptophan and process for the preparation thereof
US6210937B1 (en) 1997-04-22 2001-04-03 Bechtel Bwxt Idaho, Llc Development of genetically engineered bacteria for production of selected aromatic compounds
US6472169B1 (en) 1999-01-29 2002-10-29 Board Of Trustees Operating Michigan State University Biocatalytic synthesis of shikimic acid
US6600077B1 (en) 1999-01-29 2003-07-29 Board Of Trustees Operating Michigan State University Biocatalytic synthesis of quinic acid and conversion to hydroquinone
US6962794B2 (en) 1995-05-05 2005-11-08 Genecor International, Inc. Application of glucose transport mutants for production of aromatic pathway compounds
US7244593B2 (en) 2001-01-19 2007-07-17 Basf Aktiengesellschaft Microorganisms and processes for enhanced production of pantothenate
US20090191610A1 (en) 2005-08-18 2009-07-30 Evonik Degussa Gmbh Microorganisms With Increased Efficiency for Methionine Synthesis
US7638312B2 (en) 2003-12-15 2009-12-29 Cj Cheiledang Corp. E.coli mutant containing mutant genes related with tryptophan biosynthesis and production method of tryptophan by using the same
US7790431B2 (en) 2003-09-24 2010-09-07 Board Of Trustees Operating Michigan State University Methods and materials for the production of shikimic acid
US20100314243A1 (en) 2009-06-16 2010-12-16 Draths Corporation Preparation of trans,trans muconic acid and trans,trans muconates
WO2011017560A1 (en) 2009-08-05 2011-02-10 Genomatica, Inc. Semi-synthetic terephthalic acid via microorganisms that produce muconic acid
WO2011085311A1 (en) 2010-01-08 2011-07-14 Draths Corporation Methods for producing isomers of muconic acid and muconate salts
WO2011123154A2 (en) 2009-11-18 2011-10-06 Myriant Technologies Llc Metabolic evolution of escherchia coli strains that produce organic acids

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0745671B1 (en) * 1990-11-30 2003-11-12 Ajinomoto Co., Inc. Recombinant DNA sequences encoding feedback inhibition released enzymes, plasmids comprising the recombinant DNA sequences, transformed microorganisms useful in the production of aromatic amino acids, and a process for preparing aromatic amino acids by fermentation
JP3225597B2 (ja) * 1992-06-15 2001-11-05 味の素株式会社 発酵法によるl−フェニルアラニンの製造法
DE19644566A1 (de) * 1996-10-26 1998-04-30 Forschungszentrum Juelich Gmbh Mikrobielle Herstellung von Substanzen aus dem aromatischen Stoffwechsel / I
JP2002105641A (ja) 2000-10-03 2002-04-10 Murakami Corp 複合材およびその製造方法
WO2004033471A2 (en) * 2002-10-04 2004-04-22 Genencor International, Inc. Glucose transport mutants for production of biomaterial
DE102008040352A1 (de) * 2008-07-11 2010-01-14 Evonik Degussa Gmbh Verfahren zur Herstellung von L-Tryptophan unter Verwendung von verbesserten Stämmen der Familie Enterobacteriaceae
WO2011063055A2 (en) * 2009-11-18 2011-05-26 Myriant Technologies Llc Engineering microbes for efficient production of chemicals
ES2648259T3 (es) * 2010-07-06 2017-12-29 Yeda Research And Development Co. Ltd. Plantas transgénicas que tienen alterada la actividad de la sintetasa DAHP

Patent Citations (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4681852A (en) 1980-07-18 1987-07-21 Austgen-Biojet International Pty, Ltd. Novel microorganism and method
US4588688A (en) 1981-07-27 1986-05-13 Celanese Corporation Process for the production of muconic acid
US4480034A (en) 1982-06-10 1984-10-30 Celanese Corporation Continuous fermentation process and bioconversion-product recovery
US4608338A (en) 1982-06-10 1986-08-26 Celanese Corporation Process for bioconversion-product recovery
US4535059A (en) 1983-01-13 1985-08-13 Celanese Corporation Muconic acid productivity by a stabilized mutant microorganism population
US4833078A (en) 1984-06-22 1989-05-23 Celgene Corporation Semi-continuous fermentation process for aromatic hydrocarbon bioconversion
US4968612A (en) 1984-07-27 1990-11-06 Celgene Corporation Continuous fermentation process for aromatic hydrocarbon bioconversion
US4753883A (en) 1986-05-07 1988-06-28 Biotechnica International, Inc. Enzyme deregulation
US5168056A (en) 1991-02-08 1992-12-01 Purdue Research Foundation Enhanced production of common aromatic pathway compounds
US5272073A (en) 1992-06-30 1993-12-21 Purdue Research Foundation Biocatalytic synthesis of catechol from glucose
US6180373B1 (en) 1992-09-28 2001-01-30 Consortium f{umlaut over (u)}r elektrochemische Industrie GmbH Microorganisms for the production of tryptophan and process for the preparation thereof
US5487987A (en) 1993-09-16 1996-01-30 Purdue Research Foundation Synthesis of adipic acid from biomass-derived carbon sources
US5616496A (en) 1993-09-16 1997-04-01 Purdue Research Foundation Bacterial cell tranformants for production of cis, cis-muconic acid and catechol
US6962794B2 (en) 1995-05-05 2005-11-08 Genecor International, Inc. Application of glucose transport mutants for production of aromatic pathway compounds
US6210937B1 (en) 1997-04-22 2001-04-03 Bechtel Bwxt Idaho, Llc Development of genetically engineered bacteria for production of selected aromatic compounds
US6472169B1 (en) 1999-01-29 2002-10-29 Board Of Trustees Operating Michigan State University Biocatalytic synthesis of shikimic acid
US6613552B1 (en) 1999-01-29 2003-09-02 Board Of Trustees Operating Michigan State University Biocatalytic synthesis of shikimic acid
US6600077B1 (en) 1999-01-29 2003-07-29 Board Of Trustees Operating Michigan State University Biocatalytic synthesis of quinic acid and conversion to hydroquinone
US7244593B2 (en) 2001-01-19 2007-07-17 Basf Aktiengesellschaft Microorganisms and processes for enhanced production of pantothenate
US7790431B2 (en) 2003-09-24 2010-09-07 Board Of Trustees Operating Michigan State University Methods and materials for the production of shikimic acid
US7638312B2 (en) 2003-12-15 2009-12-29 Cj Cheiledang Corp. E.coli mutant containing mutant genes related with tryptophan biosynthesis and production method of tryptophan by using the same
US20090191610A1 (en) 2005-08-18 2009-07-30 Evonik Degussa Gmbh Microorganisms With Increased Efficiency for Methionine Synthesis
US20100314243A1 (en) 2009-06-16 2010-12-16 Draths Corporation Preparation of trans,trans muconic acid and trans,trans muconates
WO2011017560A1 (en) 2009-08-05 2011-02-10 Genomatica, Inc. Semi-synthetic terephthalic acid via microorganisms that produce muconic acid
WO2011123154A2 (en) 2009-11-18 2011-10-06 Myriant Technologies Llc Metabolic evolution of escherchia coli strains that produce organic acids
WO2011085311A1 (en) 2010-01-08 2011-07-14 Draths Corporation Methods for producing isomers of muconic acid and muconate salts

Non-Patent Citations (69)

* Cited by examiner, † Cited by third party
Title
Altschul, S. F., Gish, W., Miller, W., Myers, E. W., and Lipman, D. J. (1990) Basic local alignment search tool, J Mol Biol 215, 403-410.
Altschul, S. F., Madden, T. L., Schaffer, A. A., Zhang, J., Zhang, Z., Miller, W., and Lipman, D. J. (1997) Gapped BLAST and PSI-BLAST: a new generation of protein database search programs, Nucleic Acids Res 25, 3389-3402.
Barbe, V., Vallenet, D., Fonknechten, N., Kreimeyer, A., Oztas, S., Labarre, L., Cruveiller, S., Robert, C., Duprat, S., Wincker, P., Ornston, L. N., Weissenbach, J., Marliere, P., Cohen, G. N., and Medigue, C. (2004) Unique features revealed by the genome sequence of Acinetobacter sp. ADP1, a versatile and naturally transformation competent bacterium, Nucleic Acids Res 32, 5766-5779.
Biotechnol. Prog., vol.18, pp.201~211( 2002)* *
Bird, J. A. and Cain, R. B. (1968) cis-cis-muconate, the product inducer of catechol 1,2-oxygenase in Pseudomonas aeruginosa. Biochem. J. 109, 479-481.
Bongaerts, J., Kramer, M., Muller, U., Raven, L. and Wubbolts, M. (2001) Metabollic engineering for microbial producitnof aromatic acids and derived compunds. Met. Eng. 3, 289-300.
Chandran, S. S., Yi, J., Draths, K. M., von Daeniken, R., Weber, W. and Frost, J. W. (2003) Phosphoenolpyruvate availability and the biosynthesis of shikimic acid. Biotechnol. Prog. 19, 808-814.
Chen, K., Dou, J., Tang, S., Yang, Y., Wang, H., Fang, H. and Zhou, C. (2012) Deletion of the aroK gene is essential for high shikimic acid accumulation through the shikimate in E. coli. Bioresource Technol, 119, 141-147.
Chen, R., Hatzimanikatis, V., Yap, W. M. G. J., Potma, P. W. and Bailey, J. E. (1997) Metabolic consequences of phosphotransferase (PTS) mutation in a phenylalanie-producing recombinant Escherichia coli. Biotechnol. Prog. 13, 768-775.
Choi, W. J., Lee, E. Y., Cho, M. H., and Choi, C. Y. (1997) Enhanced production of cis, cis-muconate in a cell-recycle bioreactor. J. Fermentation and Bioengineering. 84, 70-76.
Curran, K. A., Leavitt, J. M., Karim, A. S. and Alper, H. S. (2012) Metabolic engineering of muconic acid production in Saccharomyces cerevisiae. Metabol. Engineer. 15, 55-66.
de Berardinis, V., Vallenet, D., Castelli, V., Besnard, M., Pinet, A., Cruaud, C., Samair, S., Lechaplais, C., Gyapay, G., Richez, C., Durot, M., Kreimeyer, A., Le Fevre, F., Schachter, V., Pezo, V., Doring, V., Scarpelli, C., Medigue, C., Cohen, G. N., Marliere, P., Salanoubat, M., and Weissenbach, J. (2008) A complete collection of single-gene deletion mutants of Acinetobacter baylyi ADP1, Mol Syst Biol 4, 174.
Draths, K. M., and Frost, J. W. (1995) Environmentally Compatible Synthesis of Catechol from D-Glucose, Journal of the American Chemical Society 117, 2395-2400.
Draths, K. M., Pompliano, D. L., Conley, D. L., Frost, J. W., Berry, A., Disbrow, G. L., Staversky, R. J., and Lievense, J. C. (1992) Biocatalytic Synthesis of Aromatics from D-Glucose - the Role of Transketolase, Journal of the American Chemical Society 114, 3956-3962.
Elsemore, D. A., and Ornston, L. N. (1995) Unusual ancestry of dehydratases associated with quinate catabolism in Acinetobacter calcoaceticus, J Bacteriol 177, 5971-5978.
Escalante, A., Calderon, R., Valdiva, A., de Anda, R., Hernandez, G., Ramirez, O. T., Gosset, G. and Boliver, F. (2010) Metabolic engineering for the production of shikimic acid in an evolved Escherichia coli strain lacking the phosphoenolpyrvate: carbohydrate phosphotransferase system. Microbial Cell Factories 9, 21-33.
Flores, N., Xiao, J., Berry, A., Bolivar, F. and Valle, F. (1996) Pathway engineering for the production of aromatic compounds in Escherichia coli. Nature Biotechn. 14, 620-623.
Fox, D. T., Hotta, K., Kim, C. Y., and Koppisch, A. T. (2008) The missing link in petrobactin biosynthesis: asbF encodes a (-)-3-dehydroshikimate dehydratase, Biochemistry 47, 12251-12253.
Ger, Y., Chen, S., Chiang, H., and Shiuan, D. (1994) A Single Ser-180 Mutation Desensitizes Feedback Inhibition of the Phyenylalanine-Sensitive 3-Deoxy-D-Arabino-Hepulosonate 7-Phosphate (DAHP) Synthetase in Eschericia coli, J Biochem 116, 986-990.
Grant, D. J., and Patel, J. C. (1969) The non-oxidative decarboxylation of p-hydroxybenzoic acid, gentisic acid, protocatechuic acid and gallic acid by Klebsiella aerogenes (Aerobacter aerogenes), Antonie Van Leeuwenhoek 35, 325-343.
Hansen, E. H., Moller, B. L., Kock, G. R., Bunner, C. M., Kristensen, C., Jensen, O. R., Okkels, F. T., Olsen, C. E., Motawia, M. S., and Hansen, J. (2009) De novo biosynthesis of vanillin in fission yeast (Schizosaccharomyces pombe) and baker's yeast (Saccharomyces cerevisiae), Appl Environ Microbiol 75, 2765-2774.
Hu, C., Jiang, P., Xu, J., Wu, Y., and Huang, W. (2003) Mutation analysis of the feedback inhibition site of phenylalanine-sensitive 3-deoxy-D-arabino-heptulosonate 7-phosphate synthase of Escherichia coli, J Basic Microbiol 43, 399-406.
Iwagami, S. G., Yang, K., and Davies, J. (2000) Characterization of the protocatechuic acid catabolic gene cluster from Streptomyces sp. strain 2065, Appl Environ Microbiol 66, 1499-1508.
Jantama, K., Haupt, M. J., Svoronos, S. A., Zhang, X., Moore, J. C., Shanmugam, K. T., and Ingram, L. O. (2008a) Combining metabolic engineering and metabolic evolution to develop nonrecombinant strains of Escherichia coli C that produce succinate and malate, Biotechnol Bioeng 99, 1140-1153.
Jantama, K., Zhang, X., Moore, J. C., Shanmugam, K. T., Svoronos, S. A., and Ingram, L. O. (2008b) Eliminating side products and increasing succinate yields in engineered strains of Escherichia coli C, Biotechnol Bioeng 101, 881-893.
Kaneko, A., Ishii, Y., and Kirimura, K. (2011) High-yield production of cis, cis-muconic acid from catechol in aqueous solution by biocatalyst. Chem. Lett. 40, 381-383.
Kikuchi, Y., Tsujimoto, K., and Kurahashi, O. (1997) Mutational analysis of the feedback sites of phenylalanine-sensitive 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase of Escherichia coli, Appl Environ Microbiol 63, 761-762.
Kojima, Y., Fujisawa, H., Nakazawa, A., Nakazawa, T., Kanetsuna, F., Taniuchi, H., Nozaki, M., and Hayaishi, O. (1967) Studies on pyrocatechase. I. Purification and spectral properties, J Biol Chem 242, 3270-3278.
Kramer, M., Bongaerts, J., Bovenberg, R., Kremer, S., Muller, U., Orf, S., Wubbolts, M. and Raeven, L. (2003) Metabolic engineering for microbial production of shikimic acid. Metabol. Eng. 5, 277-283.
Lerner, C. G., and Inouye, M. (1990) Low copy number plasmids for regulated low-level expression of cloned genes in Escherichia coli with blue/white insert screening capability, Nucleic Acids Res 18, 4631.
Li, K. and Frost, J.W. (1999) Microbial synthesis of 3-dehydroshikimic acid: A comparative analysis of D-xylose, L-arabinose, and D-glucose carbon sources. Biotechnol. Prog. 15, 876-883.
Lu, J. L., and Liao, J. C. (1997) Metabolic engineering and control analysis for production of aromatics: Role of transaldolase, Biotechnol Bioeng 53, 132-138.
Lu, J., Tang, J., Liu, Y., Zhu, X. (2012) Combinatorial modulation of galP and glk gene expression for improves alternative glucose utilization. Appl. Microbiol. Biotechnol. 93, 2455-2462
Lutke-Eversloh, T., and Stephanopoulos, G. (2007) L-tyrosine production by deregulated strains of Escherichia coli, Appl Microbiol Biotechnol 75, 103-110.
Mizuno, S., Yoshikawa, N., Seki, M., Mikawa, T., and Imada, Y. (1988) Microbial production of cis, cis- muconic acid from benzoic acid. Appl Microbiol Biotechnol. 28, 20-25.
Nakazawa, A., Kojima, Y., and Taniuchi, H. (1967) Purification and properties of pyrocatechase from Pseudomonas fluorescens, Biochim Biophys Acta 147, 189-199.
Neidhardt, F. C., and Curtiss, R. (1996) Escherichia coli and Salmonella : cellular and molecular biology, 2nd ed., ASM Press, Washington, D.C.
Neidle, E. L., and Ornston, L. N. (1986) Cloning and expression of Acinetobacter calcoaceticus catechol 1,2-dioxygenase structural gene catA in Escherichia coli, J Bacteriol 168, 815-820.
Niu, W., Draths, K. M., and Frost, J. W. (2002) Benzene-free synthesis of adipic acid, Biotechnol Prog 18, 201-211.
Parker, C., Barnell, W. O., Snoep, J. L., Ingram, L. O., and Conway, T. (1995) Characterization of the Zymomonas mobilis glucose facilitator gene product (glf) in recombinant Escherichia coli: examination of transport mechanism, kinetics and the role of glucokinase in glucose transport, Mol Microbiol 15, 795-802.
Parsek, M. R., Shinabarger, D. .L., Rithmel, R. K. and Chakrabarty, A. M. (1992) Roles of CatR and cis, cis-Muconate in activation of the catBC operson, which is involved in benzoate degradationin Pseudomonas putida. J. Bacteriol. 174, 7798-7806.
Patnaik, R. and Liao, J. C. (1994) Engineering of Escherichia coli central metabolism for aromatic metabolite with near theoretical yiled. App. Env. Microbiol. 60, 3903-3908.
Perez-Pantoja, D., De la Iglesia, R., Pieper, D. H., and Gonzalez, B. (2008) Metabolic reconstruction of aromatic compounds degradation from the genome of the amazing pollutant-degrading bacterium Cupriavidus necator JMP134, FEMS Microbiol Rev 32, 736-794.
Perez-Pantoja, D., Donoso, R., Agullo, L., Cordova, M., Seeger, M., Pieper, D. H., and Gonzalez, B. (2011) Genomic analysis of the potential for aromatic compounds biodegradation in Burkholderiales, Environ Microbiol.
Pfleger, B. F., Kim, Y., Nusca, T. D., Maltseva, N., Lee, J. Y., Rath, C. M., Scaglione, J. B., Janes, B. K., Anderson, E. C., Bergman, N. H., Hanna, P. C., Joachimiak, A., and Sherman, D. H. (2008) Structural and functional analysis of AsbF: origin of the stealth 3,4-dihydroxybenzoic acid subunit for petrobactin biosynthesis, Proc Natl Acad Sci U S A 105, 17133-17138.
Pittard, J. and Wallace, B. J. (1966) Distribution and function of genes concerned with aromatic biosynthesis in Escherichia coli. J. Bacteriol. 91, 1494-1508.
Polen, T., Spelberg, M. and Bott, M. (2012) toward bitechnological produciton of adipic acid and precursors from biorenewables, J. Biotechnol, http://dx.doi.org/10.1016/j.biotec.2012-07.008.
Rutledge, B. J. (1984) Molecular characterization of the qa-4 gene of Neurospora crassa, Gene 32, 275-287.
Schirmer, F., and Hillen, W. (1998) The Acinetobacter calcoaceticus NCIB8250 mop operon mRNA is differentially degraded, resulting in a higher level of the 3' CatA-encoding segment than of the 5' phenolhydroxylase-encoding portion, Mol Gen Genet 257, 330-337.
Shumilin, I. A., Bauerle, R., Wu, J., Woodard, R. W., and Kretsinger, R. H. (2004) Crystal structure of the reaction complex of 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase from Thermotoga maritima refines the catalytic mechanism and indicates a new mechanism of allosteric regulation, J Mol Biol 341, 455-466.
Shumilin, I. A., Kretsinger, R. H., and Bauerle, R. H. (1999) Crystal structure of phenylalanine-regulated 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase from Escherichia coli, Structure 7, 865-875.
Shumilin, I. A., Zhao, C., Bauerle, R., and Kretsinger, R. H. (2002) Allosteric inhibition of 3-deoxy-D-arabino-heptulosonate-7-phosphate synthase alters the coordination of both substrates, J Mol Biol 320, 1147-1156.
Shumkova, E. S., Solyanikova, I. P., Plotnikova, E. G. and Golovleva, L. A. (2009) Phenol degrdation by Rhodococcus opacus Strain 1G. App. Biocehm. Microbiol. 45, 43-49.
Sietmann, R., Uebe, R., Boer, E., Bode, R., Kunze, G., and Schauer, F. (2010) Novel metabolic routes during the oxidation of hydroxylated aromatic acids by the yeast Arxula adeninivorans, J Appl Microbiol 108, 789-799.
Smith, M. R. and Ratledge, C. (1989) Quantitative biotransformation of catechol to cis, cis muconate. Biotech. Lett. 11, 105-110.
Snoep, J. L., Arfman, N., Yomano, L. P., Fliege, R. K., Conway, T., and Ingram, L. O. (1994) Reconstruction of glucose uptake and phosphorylation in a glucose-negative mutant of Escherichia coli by using Zymomonas mobilis genes encoding the glucose facilitator protein and glucokinase, J Bacteriol 176, 2133-2135.
Sprenger, G. A. (1995) Genetics of pentose-phosphate pathway enzymes of Escherichia coli K-12, Arch Microbiol 164, 324-330.
Sprenger, G. A., Schorken, U., Sprenger, G., and Sahm, H. (1995a) Transketolase A of Escherichia coli K12. Purification and properties of the enzyme from recombinant strains, Eur J Biochem 230, 525-532.
Sprenger, G. A., Schorken, U., Sprenger, G., and Sahm, H. (1995b) Transaldolase B of Escherichia coli K-12: cloning of its gene, talB, and characterization of the enzyme from recombinant strains, J Bacteriol 177, 5930-5936.
Stroman, P., Reinert, W. R., and Giles, N. H. (1978) Purification and characterization of 3-dehydroshikimate dehydratase, an enzyme in the inducible quinic acid catabolic pathway of Neurospora crassa, J Biol Chem 253, 4593-4598.
Tang, J., Zhu, X., Lu, J. and Liu, P. (2012) Recruiting alternative glucose utilization pathways for improving succinate production. App Microbiol Biotechnol DOI 10, 1007/s00253-012-434.1
Tateoka, T., and Yasuda, I. (1995) 3-Dehydroshikimate dehydratase in mung hean cultured cells, Plant Cell Reports 15, 212-217.
Weaver, L. M., and Herrmann, K. M. (1990) Cloning of an aroF allele encoding a tyrosine-insensitive 3-deoxy-D-arabino-heptulosonate 7-phosphate synthase, J Bacteriol 172, 6581-6584.
Weber, C., Bruckner, C., Weinreb, S., Lehr, C., Essl, C. and Bole, E. (2012) Biosynthesis of cis, cis-muconic acid and its aromatic precursors catechol and proteocatechuic acid, from renewable feedstocks by Saccharomyces cerevisiae, App Environ Microbiol. 78, 8421-8430.
Wheeler, K. A., Lamb, H. K., and Hawkins, A. R. (1996) Control of metabolic flux through the quinate pathway in Aspergillus nidulans, Biochem J 315 ( Pt 1), 195-205.
Wu, C-M., Wu, C-C., Su, C-C., Lee, S-N., Lee, Y-A. and Wu, J-Y. (2006) Microbial synthesis of cis,cis-muconic acid form benzoate by Sphingobacterium sp. Mutants. Biochem. Eng. J. 29, 35-40.
Xie, N., Tang, H., Feng, J., Tao, F., Ma, C. and Xu, P. (2009) Characterization of benzoate degradationby newly isolated bacterium Pseudomonas sp. XP-M2. Biochem. Eng. J. 46, 79-82.
Yi, J., Draths, K. M., Li, K. and Frost, J. W. (2003)Altered Glucose Transport and Shikimate Pathway Product Yields in E. coli. Biotechnol. Prog. 2003, 19, 1450-1459
Yoshikawa, N., Mizuno, S., Ohta, K., and Suzuki, M. (1990) Microbial production of cis, cis-muconic acid. J. Biotechnol. 14, 203-210

Also Published As

Publication number Publication date
CN104220587A (zh) 2014-12-17
EP2809771A1 (en) 2014-12-10
EP3312267A1 (en) 2018-04-25
MY172307A (en) 2019-11-21
JP2019195330A (ja) 2019-11-14
JP2015504688A (ja) 2015-02-16
US20150044755A1 (en) 2015-02-12
EP3312267B1 (en) 2020-03-11
CN107177540A (zh) 2017-09-19
EP2809771A4 (en) 2016-01-27
JP2017184746A (ja) 2017-10-12
EP2809771B1 (en) 2017-12-27
US20190345437A1 (en) 2019-11-14
WO2013116244A1 (en) 2013-08-08
KR102092422B1 (ko) 2020-03-24
BR112014017686A2 (pt) 2017-06-27
ES2663445T3 (es) 2018-04-12
HK1243459A1 (zh) 2018-07-13
CA2862051A1 (en) 2013-08-08

Similar Documents

Publication Publication Date Title
KR102092422B1 (ko) 유전자 조작된 미생물로부터 뮤콘산의 생산
KR20240005196A (ko) 유전자 조작된 미생물로부터 개선된 뮤콘산 생산
AU2019206054B2 (en) Production of heterologous polypeptides in microalgae, microalgal extracellular bodies, compositions, and methods of making and uses thereof
KR101823695B1 (ko) 신규 미생물 숙신산 생산자 및 숙신산의 정제
DK2664670T3 (da) Perhydrolase
AU2023270322A1 (en) Compositions and methods for modifying genomes
KR101659101B1 (ko) 박테리아 [2Fe-2S] 다이하이드록시산 탈수효소의 동정 및 용도
DK2087105T3 (da) Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer
CN109563505A (zh) 用于真核细胞的组装系统
JP2023018093A (ja) 標的核酸の改変のための改善された方法
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
KR102593668B1 (ko) 유도 기질 부재 하의 사상 진균 세포에서의 단백질 생산
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
BRPI0719748A2 (pt) Microrganismo modificados por engenharia para produzir n-butanol e métodos relacionados
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
WO2009056423A2 (de) Fermentative gewinnung von aceton aus erneuerbaren rohstoffen mittels neuen stoffwechselweges
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20100118973A (ko) 이소프렌을 생성하기 위한 조성물 및 방법
KR20110038087A (ko) 재생가능 자원으로부터의 이소프렌 중합체
KR20110063576A (ko) 효모에서 증가된 이종성 Fe-S 효소 활성
KR20130027063A (ko) Fe-s 클러스터 요구성 단백질의 활성 향상
KR20120034652A (ko) 유전적으로 변형된 미생물을 발생시키는 방법
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
CN108949825A (zh) 一种靶向her2的car-t细胞的制备方法及应用
CN115698297A (zh) 多模块生物合成酶基因组合文库的制备方法

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
N231 Notification of change of applicant
GRNT Written decision to grant